Hình 3.2: Sơ đồ khối điều khiển mạng Neural network + LQR
Một NN đã đƣợc tối ƣu hĩa trực tiếp để ổn định DIPC ở hao phí tối thiểu (3.2) ,(3.3). Để đạt đƣợc điều này, NN đƣợc huấn luyện để tạo ra các điều khiển tối ƣu trên hàng loạt các chuyển động con lắc. khả năng tính gần đúng của NN, bị giới hạn bởi số lƣợng các nơron và những thách thức số học của sự tối thiểu hĩa khơng lệch, đạt đƣợc sự ổn định chỉ trong phạm vi so sánh với LQR. Cĩ ngƣời sẽ hỏi liệu cĩ thể làm cho việc huấn luyện NN hiệu quả và nhanh hơn. Logic đơn giản cho rằng nếu DIPC ổn định và gần tới tối ƣu hơn, NN sẽ khơng cĩ nhiều điều để học hỏi vì đầu ra tối ƣu của nĩ sẽ gần với khơng hơn. Trong trƣờng hợp tầm thƣờng, nếu DIPC đƣợc ổn định một cách tối ƣu bằng một bộ điều khiển nội bộ, đầu ra NN tối ƣu sẽ là số khơng. Bấy giờ chúng ta hãy nhớ lại rằng LQR cung cấp điều khiển tối ƣu trong vùng lân cận của trạng thái cân bằng. Vì vậy, nếu chúng ta bao gồm LQR vào cơ chế điều khiển nhƣ thể hiện trong hình 3.2, đĩ là lý do thì rất hợp lý để kỳ vọng hiệu suất tổng thể tốt hơn: các NN sẽ đƣợc huấn luyện chỉ để tạo ra các hiệu chỉnh cho các điều khiển LQR để cung cấp sự tối ƣu hĩa trong phạm vi rộng của chuyển động con lắc. Mặc dù trong hình 3.2 một LQR đƣợc hiển thị,
nhƣng bộ điều khiển SDRE cũng cĩ thể đƣợc sử dụng ở vị trí của LQR. Điều khiển SDRE cung cấp hiệu suất cao hơn về việc giảm thiểu hao phí và phạm vi của sự ổn định trong LQR. Do đĩ, đƣơng nhiên cĩ thể kỳ vọng một hiệu suất tốt hơn của thiết kế điều khiển đƣợc thể hiện trong hình 3.2 khi SDRE đƣợc sử dụng ở vị trí của LQR. Vì cả hai LQR và SDRE cĩ rất nhiều điểm chung (thực sự, SDRE thƣờng đƣợc gọi là một phần mở rộng phi tuyến tính đến LQR), cả hai trƣờng hợp sẽ đƣợc thảo luận trong phần này, và sẽ cung cấp khi cĩ sự khác biệt giữa hai trƣờng hợp.
Vì điều khiển của xe goịng là tổng của đầu ra NN và LQR (SDRE),
( ; )
K K K
u NN W X KX
(3.17)
Nhận xét. Ý tƣởng sử dụng NNS để điều chỉnh đầu ra của một bộ điều khiển thơng thƣờng để giải thích cho sự khác biệt giữa các hệ thống thực tế và mơ hình của nĩ đã đƣợc sử dụng trong thiết kế điều khiển thơng thƣờng cũng đã đƣợc sử dụng. Calise, Rysdyk và John-son đã sử dụng một bộ điều khiển NN để bổ sung một điều khiển phản hồi tuyến tính hĩa gần đúng của một máy bay cánh cố định và trực thăng. NN đã cung cấp điều khiển bổ sung để làm cho phản ứng của xe phù hợp với mơ hình tham chiếu, bù đắp cho những phép tính gần đúng trong thiết kế máy lái tự động. Wan và Bogdanov đã thiết kế một mơ hình điều khiển nơron tiên đốn cho một trực thăng tự trị, ở đĩ một NN làm việc cặp với máy lái tự động SDRE và đã cung cấp tối thiểu hĩa hàm hao phí phƣơng tình bậc hai dài trong quá trình truyền ngang lùị
Điều khiển SDRE đƣợc thiết kế cho một mơ hình phi tuyến đơn giản, và NN giúp nĩ cĩ thể bù đắp nhiễu loạn giĩ và các điều kiện bậc cao khơng đƣợc tính đến trong thiết kế SDRẸ
CHƢƠNG 4
MƠ HÌNH HỆ THỐNG ĐƠI CON LẮC NGƢỢC
4.1 Mơ hình đơi con lắc ngƣợc
Xét hệ thống đơi con lắc ngƣợc đƣợc gắn vào xe nhƣ hình 4.1. Yêu cầu của bài tốn là điều khiển vị trí xe và giữ cho con lắc ngƣợc luơn cân bằng (con lắc luơn thẳng đứng).