Vấn đề đặt ra là cần thiết kế bộ điều khiển thảo mãn yêu cầu đề ra với điều kiện các hàm số (.) và (.) của (1.62) hoặc các ma trận A, B và C của (1.63) hoặc
i, j của (1.64) hoặc của các hàm phi tuyếnf(.), g(.) (từ 1.65 đến 1.69) đã được biết trước.
1.3.4.1 Bộ điều khiển ổn định
Hình 1.14. Bộ điều khiển ổn định
Sơ đồ cấu trúc bộ điều khiển ổn định như hình (1.14). Sai lệch giữa tín hiệu lệnh đầu vào và tín hiệu ở đầu ra đối tượng được đưa vào bộ điều khiển để tạo ra tín hiệu điều khiển phản hồi ở đầu ra bộ điều khiển. Lệnh đầu vào và tín hiệu điều khiển phản hồi được đưa vào đầu vào của mạng nơron mô phỏng mô hình ngược của đối tượng điều khiển để tạo ra tín hiệu điều khiển ngược. Tín hiệu điều khiển đưa vào đối tượng điều khiển được tổng hợp từ hai tín hiệu là: tín hiệu điều khiển phản hồi và tín hiệu điều khiển ngược. Mạng nơron thực hiện học theo tín hiệu điều khiển phản hồi với thuật toán thích nghị Ưu điểm của cấu trúc điều khiển loại này
Mạng nơron mô phỏng mô hình ngƣợc của đối tƣợng điều khiển
Thuật toán thích nghi
Bộ điều khiển Đối tƣợng điều khiển Tín hiệu
điều khiển ngƣợc
T/h điều khiển phản hồi
Tín hiệu đầu ra đối tƣợng Lệnh đầu vào + - + +
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnụedụvn
là dễ dàng thiết lập được một hệ thống ổn định với mạng nơron không cần huấn luyện quá phức tạp.
1.3.4.2 Điều khiển ngƣợc thích nghi
(Hình 1.15) là mô hình cấu trúc của mô hình mẫu điều khiển ngược thich nghị Thuật toán này có khả năng tiếp nhận sai lệch giữa đầu ra của đối tượng và đầu ra của mô hình mẫụ Thông số của bộ điều khiển được cập nhật liên tục để giảm sai lệch. Bộ điều khiển mô hình mẫu thích nghi cơ bản có thể ảnh hưởng bởi nhiễu từ sensor và nhiễu bên ngoài tác động vào đối tương điều khiển. Loại bỏ các loại nhiễu này bằng cách sử dụng mạng nơron mô tả đối tượng nối song song với đối tượng điều khiển. Mạng nơron được huấn luyện trên cơ sở giữ liệu vào - ra của đối tượng điều khiển. Sai lệch giữa đầu ra của đối tượng điều khiển và của mô hình mạng nơron được phân tích như hiệu ứng của nhiễu và nhiễu ở đầu ra đối tượng. Tín hiệu sai lệch này được đưa vào mạng nơron mô phỏng mô hình ngược của đối tượng điều khiển tạo ra tín hiệu lọc nhiều và dấu hiệu nhiễu được loại trừ từ đầu vào đối tượng. Đó chính là ý tưởng thực hiện loại bỏ được nhiễu bên ngoài và nhiễu bên trong của đối tượng.
L + + +
Hình 1.15. Hệ thống điều khiển ngược thích nghi
Nhiễu
Bộ điều khiển
nơron Đối tƣợng điều
khiển Mạng nơron mô phỏng đối tƣợng Mạng nơron mô phỏng mô hình ngƣợc đối tƣợng Mô hình mẫu Thuật toán thích nghi
-
+ -
Nhiễu và nhiễu loạn ở đầu ra đối tƣợng - Đầu ra đối tƣợng Nhiễu sensơ Lệnh đầu vào Sai lệch + - +
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnụedụvn
Đầu ra đối tƣợng
1.3.4.3 Mô hình điều khiển phi tuyến
Mô hình điều khiển phi tuyến được biểu diễn trên (hình 1.16). Nó gồm có bộ điều khiển sử dụng mạng nơron, mạng nơron mô phỏng đối tượng và bộ lọc với một thông số điều khiển. Bộ điều khiển sử dụng mạng nơron thường được huấn luyện để biểu diễn mô hình ngược của đối tượng (nếu mô hình ngược này tồn tại). Sai lệch giữa đầu ra của mạng nơron mô phỏng đối tượng và tín hiệu đầu ra của đối tượng được đưa về đầu vào bộ của bộ lọc, sau đó được đưa tới bộ điều khiển sử dụng mạng nơron. Mạng nơron mô phỏng đối tượng và mạng nơron đóng vai trò là bộ điều khiển đối tượng (nếu nó là mô hình ngược của đối tượng) có thể được huấn luyện theo kiểu off - line sử dụng dữ liệu tập hợp từ động học của đối tượng. Bộ lọc ở mô hình này là bộ lọc bậc nhất có hằng số thời gian được lựa chọn để đảm bảo mạch vòng kín ổn định.
Hình 1.16. Mô hình điều khiển phi tuyến
1.3.4.4 Mô hình điều khiển dự báo
Mô hình điều khiển dự báo (hình 1.17) sử dụng để tối ưu hóa đáp ứng đầu ra của đối tượng trong khoảng thời gian dự kiến. Đây là cấu trúc phụ thuộc nhiều vào mạng nơron mô tả đối tượng, bộ điều khiển sử dụng mạng nơron hàm biển diễn phản ứng đầu ra của hệ thống và thực hiện tối ưu hóa để lựa chọn tín hiệu điều khiển tốt nhất. + - Mạng nơron mô phỏng đốitƣợng Bộ lọc Bộ điều khiển nơron Đối tƣợng điều khiển Tín hiệu điều khiển Dự báo đầu ra đối tƣợng Lệnh đầu vào - +
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnụedụvn
Mạng nơron mô phỏng đối tượng được sử dụng để dự báo đầu ra của đối tượng. Bộ điều khiển sử dụng mạng nơron tiến hành học, lựa chon các đầu vào bằng quá trình tối ưụ Khi quá trình huấn luyện đã hoàn thành, quá trình tối ưu hóa được thay thế bởi quá trình điều khiển sử dung bộ điều khiển nơron.
Hình 1.17. Mô hình điều khiển dự báo
1.3.4.5 Điều khiển thích nghi theo mô hình mẫu hoặc điều khiển nơron thích nghi nghi
Điều khiển thích nghi theo mô hình mẫu sử dụng hai mạng nơron: mạng nơron thứ nhất thực hiện mô phỏng đối tường và mạng nơron thứ hai đóng vai trò là bộ điều khiển (hình 1.18). Mạng mô phỏng đối tượng được huấn luyện theo kiểu off - line sử dụng dữ liệu vào - ra của đối tượng điều khiển. Bộ điều khiển có nhiệm vụ tạo ra tín hiệu điều khiển cung cấp cho đối tượng điều khiển sao cho tín hiệu đầu ra đối tượng bám theo được tín hiệu đầu ra của mô hình mẫụ Mạng nơron mô phỏng đối tượng được sử dụng để dự báo ảnh hưởng của bộ điều khiển đến sự thay đổi tín hiệu đầu ra của đối tượng điều khiển và cho phép cập nhật thông số của bộ điều khiển.
Vòng tối ƣu hóa Mô hình
mẫu
Tối ƣu hóa Mạng nơron mô phỏng đối tƣợng Đối tƣợng điều khiển Bộ điều khiển nơron Dự báo đầu ra đối tƣợng Đầu ra đối tƣợng Tín hiệu điều khiển Lệnh đầu vào
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnụedụvn
Hình 1.18. Điều khiển thích nghi theo mô hình mẫu
1.3.4.6 Đánh giá thích nghi
(Hình 1.19) mô tả bộ điều khiển đánh giá thích nghi gồm có hai mạng nơron. Mạng nơron thứ nhất là bộ điều khiển ngược, được gọi là nơron mạng hoạt động. Mạng nơron thứ hai được gọi là mạng đánh giá, dự báo tương lai quá trình làm việc của hệ thống. Mạng đánh giá được huấn luyện tối ưu hóa cho quá trình làm việc trong tương laị Quá trình huấn luyện sử dụng phương pháp học củng cố, là chương trình xấp xỉ động học.
Hình 1.19. Mô hình đánh giá thích nghi
Tín hiệu điều khiển Sai lệch điều khiển + Mô hình mẫu Mạng nơron mô phỏng đối tƣợng Bộ điều khiển nơron Đối tƣợng điều khiển Lệnh đầu vào Đầu ra đối tƣợng + - Sai lệch - Mạng đánh giá (Tối ƣu hóa)
Đối tượng điều khiển
Mạng hoạt động
(Bộ điều khiển) Đối tƣợng
điều khiển
Tín hiệu điều khiển
Lệnh
đầu vào Đầu ra
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnụedụvn
1.3.4.7 Phản hồi tuyến tính hóa phản hồi thích nghi dùng mạng nơron
Phương pháp phản hồi tuyến tính hóa thích nghi dùng mạng nơron dựa vào nguyên tắc thiết kế bộ điều khiển phản hồi tuyến tính hóa (hình 1.20). Phương pháp phản hồi tuyến tính hóa có đặc điểm là tín hiệu điều khiển có hai thành phần
Hệ thống phi tuyến được mô tả bởi quan hệ:
xp(n) =f(xp)+ g(xp)u (1.81) với: xp(n) =[(xp, xp,..., xp(n-1)]T (1.82) trong đó có n biến trạng thái và u là tín hiệu điều khiển
Hình 1.20. Phương pháp phản hồi tuyến tính hoá thích nghi dùng mạng nơron Để tìm được hệ tuyến tính hóa từ hệ thống phi tuyến mô tả bởi công thức (1.81), sử dụng tín hiệu u ở dạng: u = [ ) ( 1 xp g f(xp) - kT xp+ r] (1.83) với k là hệ số phản hồi và r là tín hiệu đầu vàọ
Thay (1.83) vào (1.81) hệ tuyến tính có dạng:
xp(n) = - kT xp+ r (1.84) Hệ thống được điều chỉnh bởi mạc phản hồi tuyến tính
Có thể sử dụng mạng nơron để thực hiện chiến lược phản hồi tuyến tính. Thực hiện xấp xỉ các hàm f(.), g(.) bởi hai mạng nơron NNf và NNg, khi đó tín hiệu điều khiển có dạng:
xp Mô hình mẫu
Thích nghi cho NNf
Thích nghi cho NNg
Đối tƣợng điều khiển
NNf NNg k - + r - - + e xm
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnụedụvn u = [ ) ( 1 p x NNg NNf xp kTxp r] (1.85) Chọn mô hình mẫu ở dạng: n m x = - kT xm + r (1.86)
Thay công thức (1.85) vào công thức (1.81) ta được: n p x = f(xp) + ) ( ) ( p g p x NN x g [-NNf(xp) - kT xp+ r] (1.87) Sai lệch điều khiển được định nghĩa như sau:
e = xp -xm (1.88) Phương trình vi phân sai lệch có dạng:
e(n) = −kTe +f(xp) −NNf (xp) +g(xp) −NNg (xp)u (1.89) Với sự huấn luyện hợp lý, phương trình vi phân sai lệch sẽ dẫn đến trạng thái ổn định, sai lệch sẽ hội tụ tới điểm không.
1.3.4.8 Điều khiển thích nghi trực tiếp ổn định
Phương pháp này sử dụng định lý ổn định Lyapunov trong thiết kế của luật học của mạng nơron. Bộ điểu khiển gồm có 3 phần: Bộ điều khiển phản hồi tuyến tính, bộ điều khiển trượt phi tuyến và bộ điều khiển mạng nơron thích nghị
Hình 1.21. Điều khiển thích nghi trực tiếp ổn định Tín hiệu điều khiển được tính toán ở dạng:
u(t) = upd(t) + (1− m(t))uad(t) + m(t)usl(t) (1.90)
Tuyến tính Trƣợt Đối tƣợng Điều chế Nơron xd x Uad Upd Usl + + + u x
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnụedụvn
Trong đó: upd(t) là tín hiệu điều khiển phản hồi tuyến tính, usl(t) là tín hiệu điều khiển trượt phi tuyến và uad(t) là tín hiệu điều khiển nơron thích nghị Hàm m(t) cho phép một sự chuyển tiếp mịn giữa bộ điều khiển trượt và thích nghi, dựa vào chuẩn của các vùng trạng thái hệ thống sau đây:
m(t) = 0 x(t) Ad 0 < m(t)<1 trường hợp còn lại
m(t) =1 x(t) Ac
Các vùng điều khiển được định nghĩa như hình (1.22). Bộ điều khiển trượt được sử dụng để giữ trạng thái hệ thống trong vùng mạng nơron huấn luyện đạt trạng thái điều khiển tối ưụ Bộ điều khiển trượt được đưa vào hoạt động (và bộ điều khiển nơron được tắt) ở mọi thời điểm khi hệ thống ở bên ngoài vùng nàỵ Sự phối hợp giữa các bộ điều khiển sẽ làm cho hệ thống ổn định thích nghi đạt điều khiển tối ưụ
Hình 1.22. Các vùng điều khiển 1.3.4.9 Những hạn chế và chú ý
Trong mỗi cấu trúc của các bộ điều khiển nơron chúng ta đều đánh giá về những thuận lợi và không thuận lợi của các bộ điều khiển nàỵ Ví dụ với phương pháp phương pháp phản hồi tuyến tính hóa chỉ được áp dụng với những hệ thống được mô tả bởi phương trình (1.81). Phương pháp điều khiển thích nghi trực tiếp ổn định yêu cầu không có thành phấn phi tuyến trong phương trình mô tả cũng như tín hiệu điều khiển không gian trạng tháị Phương pháp điều khiển theo mô hình mẫu
Ad
x
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnụedụvn
không đảm bảo độ ổn định, phương pháp điều khiển ngược thích nghi yêu cầu sự tồn tại của mô hình ngược của đối tượng. Nói chung những phương pháp điều khiển trên đều đảm bảo sự ổn định nhưng chỉ được áp dụng trong một giới hạn nào đó của hệ thống. Lĩnh vực điều khiển nơron tiếp tục được nghiên cứu, cách thức ổn định hoá trong hệ thống sẽ được phát triển rộng khắp trong các hệ thống. Từ các vấn đề thực tế cho thấy, vấn đề mấu chốt cho những hệ thống điều khiển nơron là khả năng hoạt động tốt của một mạng trong các trạng thái mớị Ví dụ cấu trúc mô hình điều khiển dự báo cần đến một mô hình mạng nơron nhận dạng thiết bị, mô hình thiết bị là một ánh xạ từ các đầu vào và đầu ra của thiết bị trước tới đầu ra của thiết bị saụ Trong trình tự tính toán mô hình thiết bị, mạng cần được huấn luyện với dữ liệu bao gồm toàn bộ phạm vi đầu vào mạng có thể thực hiện được. Điều khó có thể thực hiện được ở đây là dữ liệu, bởi vì chúng ta không có điều khiển trực tiếp vượt trước đầu ra của thiết bị. Nhiều lúc chúng ta có thể có điều khiển độc lập trên đầu vào thiết bị, nhưng chỉ có điều khiển gián tiếp trên đầu ra của thiết bị (mà sau đó trở thành đầu vào mạng). Những hệ thống bậc cao sẽ khó khăn để đạt được dữ liệu cho phản ứng đầu ra của thiết bị thích hợp cho việc phân vùng không gian trạng tháị Trạng thái sẽ trở nên quan trọng để mạng có thể phát hiện ra trạng thái trong đó đầu vào rơi ra ngoài miền dữ liệu được cho là đúng mà mạng đã được huấn luyện.
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnụedụvn
KẾT LUẬN CHƢƠNG 1
Qua phân tích mô hình và ứng dụng của mạng nơron ta thấy chúng có: 1. Các tính chất:
- Là hệ phi tuyến
- Là hệ xử lý song song: mạng nơron có cấu trúc song song, do đó có tốc độ tính toán rất cao, rất phù hợp với lĩnh vực nhận dạng và điều khiển.
- Là hệ học và thích nghi: Mạng được luyện từ các số liệu quá khứ, có khả năng tự điều chỉnh khi số liệu đầu vào bị mất, có thể điều khiển on - line
- Là hệ nhiều biến, là hệ nhiều đầu vào, nhiều đầu ra (MIMO) rất tiện dùng khi điều khiển đối tượng khi có nhiều biến số.
2. Có nhiều phương pháp ứng dụng mạng nơron để nhận dạng đối tượng, trong đó nổi bật là hai phương pháp nhận dạng on - line và nhận dạng off - linẹ Trong hai phương pháp trên thì phương pháp nhận dạng off - line có nhiều ưu điểm: nó có thể sử dụng đồng thời tất cả các dữ liệụ Nhận dạng off - line sử dụng khi cần thiết phải xử lý rất nhiều tín hiệu cùng một lúc. Phương pháp sử dụng mạng nơron nhận dạng đối tượng theo đặc tính vào - ra, là điểm mạnh về ứng dụng của mạng nơron. Sử dụng mạng nơron để nhận dạng đối tượng có nhiều ưu điểm hơn so với phương pháp nhận dạng truyền thống vì:
- Mạng nơron là hệ học và thích nghi có khả năng học on - line hoặc off - line từ các số liệu quá khứ, do đó kết quả nhận dạng có thể đạt được độ chính xác rất caọ
- Mạng nơron là hệ xử lý song song do đó tốc độ tính toán cao, mà các phương pháp nhận dạng truyền thống khó có thể đạt được.
- Mạng nơron là hệ MIMO, do đó rất tiện dụng khi nhận dạng cho đối tượng nhiều biến.
- Với bản chất “HỌC” mạng nơron có một trong những ứng dụng rất đặc trưng đó là nhận dạng đối tượng căn cứ vào đặc tính vào - ra của nó. Mạng nơ ron truyền thẳng nhiều lớp có cấu tạo đơn giản, có luật học lan truyền ngược rất nổi
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnụedụvn
tiếng thực hiện dễ dàng và có hiệu quả cao phù hợp với thực hiện quá trình học cho các đối tượng là tuyến tính và phi tuyến tính.
3. Có nhiều phương pháp điều khiển nhưng mỗi phương pháp đều có các ưu điểm và nhược điểm đặc thù như phương pháp phản hồi tuyến tính hóa chỉ được áp dụng với những hệ thống được mô tả bởi phương trình (1.81), phương pháp điều khiển thích nghi trực tiếp ổn định yêu cầu không có thành phần phi tuyến trong phương trình mô tả cũng như tín hiệu điều khiển không gian trạng tháị Phương pháp điều khiển thích nghi theo mô hình mẫu không đảm bảo sự ổn định. Phương pháp điều khiển ngược thích nghi yêu cầu sự tồn tại của mô hình ngược của đối