You are on page 1of 3

Chiến lược tái cấu hình cho các hệ thống nhúng phân tán thích ứng quan trọng

Abstract:

Bài báo mô tả kiến trúc và cơ chế được đề xuất trong bối cảnh của dự án Dynamic Fault Tolerance for
Flexible Time-Triggered Ethernet (DFT4FTT) để triển khai hệ thống nhúng phân tán thích ứng (ADES),
nghĩa là các hệ thống phân tán với các yêu cầu về thời gian thực, độ tin cậy và khả năng thích ứng. Trọng
tâm là các chiến lược tái cấu hình cho phép không chỉ thay đổi hành vi của hệ thống mà còn cải thiện khả
năng chịu đựng các lỗi phần cứng vĩnh viễn.

Introduction:

Hệ thống nhúng phân tán thích ứng (ADES) là một loại Hệ thống nhúng phân tán (DES) có khả năng tự
cấu hình lại một cách linh hoạt để đáp ứng với các yêu cầu và điều kiện vận hành thay đổi. Một số ví dụ
về các ứng dụng tiềm năng của các hệ thống này là: xe tự lái, xe thám hiểm, máy móc trong nhà máy
thông minh và các thiết bị tự sửa chữa.

Khả năng thích ứng mang lại những lợi ích thú vị từ quan điểm về chức năng, hiệu quả và độ tin cậy.

 Đầu tiên, ADES có thể tự động thay đổi hành vi của mình để đáp ứng các yêu cầu mới.
 Thứ hai, ADES có thể tự động dự trữ các tài nguyên cần thiết tại mỗi thời điểm, do đó tránh
được nhu cầu cung cấp quá mức tài nguyên theo các giả định trường hợp xấu nhất bi quan.
 Thứ ba, các ADES có thể tự phục hồi bằng cách phân bổ lại nhiệm vụ của nút bị lỗi cho nút không
bị lỗi.

Để triển khai đúng ADES, nó phải được cung cấp kiến trúc và cơ chế phù hợp, giúp nó có thể đáp ứng các
yêu cầu về thời gian thực, độ tin cậy và khả năng thích ứng. Về vấn đề này, dự án DFT4FTT đề xuất một
cơ sở hạ tầng hoàn chỉnh giải quyết tất cả các yêu cầu này ở cả cấp độ mạng và nút.

Ở cấp độ mạng, DFT4FTT dựa trên Flexible Real-Time Ethernet Network FTTRS, một triển khai Ethernet
chuyển mạch của mô hình truyền thông Flexible Time Triggered (FTT).

FTT cho phép trao đổi lưu lượng theo thời gian thực, đồng thời cung cấp khả năng linh hoạt cần
thiết để hỗ trợ hoạt động của một hệ thống có khả năng thích ứng. Để cung cấp độ tin cậy cao,
FTTRS mở rộng FTT với khả năng chịu lỗi. Cụ thể, mạng được sao chép để chịu đựng các lỗi phần
cứng v ĩnh viễn, trong khi các thông báo được chủ động truyền lại để chịu đựng các lỗi nhất thời.

Ở cấp độ nút, DFT4FTT đề xuất một cách tiếp cận tập trung gọi là Trình quản lý nút (NM) quản lý trực
tuyến việc phân bổ nhiệm vụ trong các nút của ADES.

Cụ thể, NM giám sát môi trường và bản thân hệ thống, xác định thời điểm và cách thức thay đổi
phân bổ nhiệm vụ (từ hiện tại về cấu hình) và bắt đầu/dừng/phân bổ lại nhiệm vụ trong các nút.

Để đạt được độ tin cậy cao, nhân rộng tích cực với biểu quyết đa số được sử dụng. Cụ thể, mỗi
tác vụ quan trọng được thực thi dư thừa trong một số nút và bản sao tác vụ bỏ phiếu định kỳ để đạt
được kết quả đồng thuận. Điều này cho phép chấp nhận các lỗi phần cứng tạm thời và vĩnh viễn ảnh
hưởng đến các nút và tác vụ.

Hơn nữa, DFT4FTT bao gồm các cơ chế chẩn đoán và tái tích hợp lỗi để ngăn chặn sự tiêu hao
dự phòng gây ra bởi các lỗi phần cứng tạm thời.
The task model:

DES hoạt động nhờ vào việc thực thi nhiều chức năng khác nhau, mỗi chức năng được thực hiện bởi một
ứng dụng.

Đổi lại, mỗi ứng dụng là một tập hợp các tác vụ được kết nối với nhau được thực hiện theo cách
tuần tự và/hoặc song song, ví dụ: các tác vụ cảm biến, điều khiển và tác động trong một vòng
điều khiển phản hồi phân tán. Ta cần lưu ý rằng các tác vụ phân tán giao tiếp giữa chúng nhờ
vào việc trao đổi thông báo qua mạng. Do đó, hoạt động của một ứng dụng được thực hiện như
một chuỗi các thực thi tác vụ và truyền thông báo.

Các chức năng có thể có các yêu cầu phi chức năng khác nhau. Theo nghĩa này, các tác vụ có thể có các
yêu cầu về độ tin cậy và thời gian thực khác nhau, kế thừa từ ứng dụng mà chúng thuộc về.

Để đáp ứng các yêu cầu thời gian thực, các tác giả dựa vào cách tiếp cận toàn diện hướng tới Flexible
Distributed Systems cho phép xác định đầy đủ thời điểm kích hoạt các tác vụ và thông báo một cách
toàn diện và trực tuyến.

The system architecture:

Kiến trúc DFT4FTT bao gồm một số thành phần. Phần tử trung tâm là mạng FTTRS kết nối tất cả các
thành phần khác với nhau. Các nút tính toán (CN) chịu trách nhiệm thực hiện các nhiệm vụ. Cảm biến và
Thiết bị truyền động (SA) cung cấp phương tiện để tương tác với môi trường. Cuối cùng, Trình quản lý
nút (NM) quản lý động việc phân bổ nhiệm vụ cho các CN.

Trong DFT4FTT, quá trình tái cấu hình được thực hiện theo ba giai đoạn: theo dõi, để có được trạng thái
hệ thống; quyết định, để xác định thời điểm và cách thức chuyển sang cấu hình mới; và thay đổi cấu
hình để thực hiện các sửa đổi hệ thống. Để giải thích quá trình hoàn chỉnh này được thực hiện như thế
nào, phần bên trong của NM và CN được hiển thị trong Hình 1.

Có nhiều cấp độ khác nhau trong kiến trúc phần mềm. tại mức thấp nhất mà Trình kích hoạt giao tiếp
communication Enable cho phép giao diện với mạng. Trên đó, ta tìm thấy các mô-đun hỗ trợ quá trình
tái cấu hình. Các dịch vụ được cung cấp bởi các mô-đun này có thể được truy cập bằng Giao diện Dịch vụ
Sơ đồ Phân bổ Nhiệm vụ (TAS). Ở cấp độ cao nhất, ta sẽ tìm thấy các ứng dụng có thể sử dụng các dịch
vụ này.

NM xác định system state nhờ Trình quản lý giám sát Monitor Management, nơi tập hợp và xử lý lưu
lượng mạng. Ví dụ, trạng thái hệ thống bao gồm danh sách các CN và liên kết bị lỗi, cũng như các tác vụ
được thực hiện trong mỗi CN.

Quá trình quyết định được thực hiện tự động và cộng tác trong NM bởi Knowledge Entity (KE), sử dụng
các quy tắc được xác định trước và Wisdom Entity (WE), sử dụng machine learning. Ngoài ra, các nhiệm
vụ trong CN cũng có thể yêu cầu thay đổi. Trong bài báo này, trọng tâm là Knowledge Entity, liên tục xác
minh rằng các yêu cầu hệ thống, tức là tập hợp các tác vụ phải được thực hiện cùng với các yêu cầu về
độ tin cậy và thời gian thực của chúng, được đáp ứng. Nếu chúng không được đáp ứng, do thay đổi
trạng thái hệ thống hoặc trong chính các yêu cầu, Knowledge Entity ra lệnh thay đổi cấu hình.
Khi cần thay đổi cấu hình, Trình quản lý Thay đổi Cấu hình Configuration Change Manager sẽ sắp xếp các
thay đổi phù hợp mà Main Communication Manager và Main Task Manager phải áp dụng cho các giao
tiếp và tác vụ tương ứng.

RECONFIGURATION STRATEGIES:

Như đã giới thiệu trước đây, KE liên tục so sánh trạng thái hệ thống với các yêu cầu hệ thống. Trong
trường hợp các yêu cầu không được đáp ứng, do thay đổi trạng thái hoặc bản thân các yêu cầu, một cấu
hình mới sẽ được thực thi.

Thời gian cấu hình lại có ảnh hưởng lớn đến thời gian đáp ứng của hệ thống trước những thay đổi. Đó là
lý do tại sao mà tác giả đề xuất quy trình hai bước giúp giảm thời gian cấu hình lại.

Đầu tiên, Knowledge Entity cung cấp, càng nhanh càng tốt, một cấu hình mới đáp ứng các yêu
cầu. Chính sách phân bổ các tác vụ là cân bằng tải, nghĩa là các tác vụ mới được phân bổ trong các CN
nơi tài nguyên mạng và tính toán không được sử dụng nhiều. Việc lựa chọn các CN diễn ra nhanh chóng
vì chúng tôi có thể theo dõi các tài nguyên có sẵn và cấu hình kết quả vẫn có thể được sửa đổi dễ dàng
trong trường hợp phải phân bổ nhiệm vụ mới.

Thứ hai, Knowledge Entity KE tìm kiếm cấu hình tốt nhất trong khi hệ thống đang chạy. Định
nghĩa về cấu hình tốt nhất phụ thuộc vào mục tiêu của hệ thống và được đưa ra bởi các thuộc tính cấu
hình khác nhau như hiệu suất hoặc mức tiêu thụ năng lượng.

Từ góc độ độ tin cậy, khả năng cấu hình lại của Node Manager NM cho phép tác giả phân bổ lại các
nhiệm vụ đang được thực thi trong nút tính toán CN này sang nút tính toán CN khác, khi nút CN đầu tiên
bị lỗi vĩnh viễn. Đối với các nhiệm vụ không quan trọng, điều này có nghĩa là tác giả có thể tiếp tục cung
cấp dịch vụ, sau một thời gian ngừng hoạt động tối thiểu. Đối với các tác vụ quan trọng (được sao chép),
điều này có nghĩa là tác giả có bảo toàn dự phòng, nghĩa là chúng ta có thể duy trì mức độ sao chép.
Điều này tương đương với sơ đồ N-Modular Redundancy với một số dự phòng, trong đó các dự phòng là
tài nguyên tính toán có sẵn trong nút tính toán CN.

(những công việc đang tiếp tục diễn ra) ON-GOING WORK:

Các tác giả hiện đang hoàn thiện thông số kỹ thuật của quy trình cấu hình lại. Họ sẽ giải quyết các vấn đề
như cách xác định cấu hình hợp lệ từ tất cả các cấu hình có thể.

Ngoài ra, tác giả đang đánh giá tính khả thi của việc thay đổi động sơ đồ sao chép và số lượng bản sao,
để đạt được mức độ tin cậy tốt nhất trong khi sử dụng các tài nguyên có sẵn một cách hiệu quả.

You might also like