Điều khiển tối ưụ - nf p g pup)()().

x nf p g pup)()().

2.2.9. Điều khiển tối ưụ

u(t) = upd(t) + [1-m(t) ].uad(t) + m(t).usl(t) ( 2.26) Trong đó: upd(t) là tín hiệu điều khiển hồi quy tuyến tính, usl là tín hiệu điều khiển theo mô hình trượt, uad là tín hiệu điều khiển thich nghi của mạng nơ ron, hàm m(t) cho phép san bằng quá trình quá độ giữa quá trình của bộ điều khiển trượt và quá trình của bộ điều khiển thich nghi dựa trên cơ sở định vị trạng thái hệ thống:

Trong đó miền Ad và Ac được xác định như hình 2.14: Bộ điều khiển trượt được sử dụng để

giữ ổn định cho hệ thống trong một miền mà mạng nơ ron có thể huấn luyện được để đạt độ chính xác của điều khiển tối ưụ

Bộ điều khiển trượt được mở (bộ điều khiển nơ ron được khoá ) bất cứ lúc nào hệ thống lệch ra ngoài miền. Sự tổ hợp các bộ điều khiển tạo ra một hệ thống ổn định theo tiêu chuẩn tối ưụ

Cần chú ý rằng bộ điều khiển nơ ron được ứng dụng trên cơ sở sự hoạt động của mạng nơ ron thần kinh. Đầu ra của mỗi nơ ron thần kinh là hàm tuyến tính cơ sở của hàm trọng. Điều đó cho phép mạng nhiều lớp phân tích quá trình huấn luyện đơn giản và nhanh hơn, nhưng cũng có một điều khó khăn ở đây là phải cần nhiều nơ ron nếu số đầu vào mạng lớn.

2.2.9. Điều khiển tối ưụ

Không gian trạng thái được chia thành các vùng đặc trưng tương ứng với các trạng thái điều khiển khác nhaụ Sự nhận biết về mặt điều khiển thực hiện qua

m(t) = 0 Khi x(t)  Ad 0< m(t) <1 Các trường hợp khác m(t) = 1 Khi x(t)  Ac x ẋ Ac Ad

các thủ tục học. Từ đó bề mặt tối ưu thời gian, nhìn chung là phi tuyến, nó cần được sử dụng vào khả năng tính gần đúng bề mặt phi tuyến. Một khả năng cơ bản là lượng hoá không gian trạng thái vào các phần tử cơ bản, ở đó hoạt động điều khiển được giả thiết không đổị Quá trình này có thể sử dụng mạng liên kết Leteral. Bề mặt thay đổi không được biết trước, nhưng chúng được định nghĩa hoàn toàn bởi quá trình học của các điểm trong không gian trạng thái với điều khiển thích nghi đã được cho trước. Trong quá trình học, các luật học điều chỉnh trọng số của mạng trên cơ sở đưa véc tơ điều khiển về trạng thái mong muốn. Quá trình học của véc tơ mẫu hiện có được điều khiển liên tục ở nhiều thời điểm cho đến khi các véc tơ mẫu hoàn toàn được phân loại chính xác, học cho đến khi các dạng sai lệch có giá trị không đổị