Ứng dụng của mạng nơron trong điều khiển

1.3 Ứng dụng của mạng nơron trong nhận dạng và điều khiển

1.3.4 Ứng dụng của mạng nơron trong điều khiển

Vấn đề đặt ra là cần thiết kế bộ điều khiển thảo mãn yêu cầu đề ra với điều kiện các hàm số (.) và (.) của (1.62) hoặc các ma trận A, B và C của (1.63) hoặc

i, j của (1.64) hoặc của các hàm phi tuyếnf(.), g(.) (từ 1.65 đến 1.69) đã được biết trước.

1.3.4.1 Bộ điều khiển ổn định

Hình 1.14. Bộ điều khiển ổn định

Sơ đồ cấu trúc bộ điều khiển ổn định như hình (1.14). Sai lệch giữa tín hiệu lệnh đầu vào và tín hiệu ở đầu ra đối tượng được đưa vào bộ điều khiển để tạo ra tín hiệu điều khiển phản hồi ở đầu ra bộ điều khiển. Lệnh đầu vào và tín hiệu điều khiển phản hồi được đưa vào đầu vào của mạng nơron mơ phỏng mơ hình ngược của đối tượng điều khiển để tạo ra tín hiệu điều khiển ngược. Tín hiệu điều khiển đưa vào đối tượng điều khiển được tổng hợp từ hai tín hiệu là: tín hiệu điều khiển phản hồi và tín hiệu điều khiển ngược. Mạng nơron thực hiện học theo tín hiệu điều khiển phản hồi với thuật tốn thích nghị Ưu điểm của cấu trúc điều khiển loại này

Mạng nơron mơ phỏng mơ hình ngƣợc của đối tƣợng điều khiển

Thuật tốn thích nghi

Bộ điều khiển Đối tƣợng điều khiển Tín hiệu

điều khiển ngƣợc

T/h điều khiển phản hồi

Tín hiệu đầu ra đối tƣợng Lệnh đầu vào + - + +

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnụedụvn

là dễ dàng thiết lập được một hệ thống ổn định với mạng nơron không cần huấn luyện quá phức tạp.

1.3.4.2 Điều khiển ngƣợc thích nghi

(Hình 1.15) là mơ hình cấu trúc của mơ hình mẫu điều khiển ngược thich nghị Thuật tốn này có khả năng tiếp nhận sai lệch giữa đầu ra của đối tượng và đầu ra của mơ hình mẫụ Thơng số của bộ điều khiển được cập nhật liên tục để giảm sai lệch. Bộ điều khiển mơ hình mẫu thích nghi cơ bản có thể ảnh hưởng bởi nhiễu từ sensor và nhiễu bên ngoài tác động vào đối tương điều khiển. Loại bỏ các loại nhiễu này bằng cách sử dụng mạng nơron mô tả đối tượng nối song song với đối tượng điều khiển. Mạng nơron được huấn luyện trên cơ sở giữ liệu vào - ra của đối tượng điều khiển. Sai lệch giữa đầu ra của đối tượng điều khiển và của mơ hình mạng nơron được phân tích như hiệu ứng của nhiễu và nhiễu ở đầu ra đối tượng. Tín hiệu sai lệch này được đưa vào mạng nơron mơ phỏng mơ hình ngược của đối tượng điều khiển tạo ra tín hiệu lọc nhiều và dấu hiệu nhiễu được loại trừ từ đầu vào đối tượng. Đó chính là ý tưởng thực hiện loại bỏ được nhiễu bên ngoài và nhiễu bên trong của đối tượng.

L + + +

Hình 1.15. Hệ thống điều khiển ngược thích nghi

Nhiễu

Bộ điều khiển

nơron Đối tƣợng điều

khiển Mạng nơron mô phỏng đối tƣợng Mạng nơron mơ phỏng mơ hình ngƣợc đối tƣợng Mơ hình mẫu Thuật tốn thích nghi - + - Nhiễu và nhiễu loạn ở đầu ra đối tƣợng - Đầu ra đối tƣợng Nhiễu sensơ Lệnh đầu vào Sai lệch + - +

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnụedụvn

Đầu ra đối tƣợng

1.3.4.3 Mơ hình điều khiển phi tuyến

Mơ hình điều khiển phi tuyến được biểu diễn trên (hình 1.16). Nó gồm có bộ điều khiển sử dụng mạng nơron, mạng nơron mô phỏng đối tượng và bộ lọc với một thông số điều khiển. Bộ điều khiển sử dụng mạng nơron thường được huấn luyện để biểu diễn mơ hình ngược của đối tượng (nếu mơ hình ngược này tồn tại). Sai lệch giữa đầu ra của mạng nơron mơ phỏng đối tượng và tín hiệu đầu ra của đối tượng được đưa về đầu vào bộ của bộ lọc, sau đó được đưa tới bộ điều khiển sử dụng mạng nơron. Mạng nơron mô phỏng đối tượng và mạng nơron đóng vai trị là bộ điều khiển đối tượng (nếu nó là mơ hình ngược của đối tượng) có thể được huấn luyện theo kiểu off - line sử dụng dữ liệu tập hợp từ động học của đối tượng. Bộ lọc ở mơ hình này là bộ lọc bậc nhất có hằng số thời gian được lựa chọn để đảm bảo mạch vịng kín ổn định.

Hình 1.16. Mơ hình điều khiển phi tuyến

1.3.4.4 Mơ hình điều khiển dự báo

Mơ hình điều khiển dự báo (hình 1.17) sử dụng để tối ưu hóa đáp ứng đầu ra của đối tượng trong khoảng thời gian dự kiến. Đây là cấu trúc phụ thuộc nhiều vào mạng nơron mô tả đối tượng, bộ điều khiển sử dụng mạng nơron hàm biển diễn phản ứng đầu ra của hệ thống và thực hiện tối ưu hóa để lựa chọn tín hiệu điều khiển tốt nhất. + - Mạng nơron mô phỏng đối tƣợng Bộ lọc Bộ điều khiển nơron Đối tƣợng điều khiển Tín hiệu điều khiển Dự báo đầu ra đối tƣợng Lệnh đầu vào - +

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnụedụvn

Mạng nơron mô phỏng đối tượng được sử dụng để dự báo đầu ra của đối tượng. Bộ điều khiển sử dụng mạng nơron tiến hành học, lựa chon các đầu vào bằng quá trình tối ưụ Khi quá trình huấn luyện đã hồn thành, q trình tối ưu hóa được thay thế bởi quá trình điều khiển sử dung bộ điều khiển nơron.

Hình 1.17. Mơ hình điều khiển dự báo

1.3.4.5 Điều khiển thích nghi theo mơ hình mẫu hoặc điều khiển nơron thích nghi nghi

Điều khiển thích nghi theo mơ hình mẫu sử dụng hai mạng nơron: mạng nơron thứ nhất thực hiện mô phỏng đối tường và mạng nơron thứ hai đóng vai trị là bộ điều khiển (hình 1.18). Mạng mơ phỏng đối tượng được huấn luyện theo kiểu off - line sử dụng dữ liệu vào - ra của đối tượng điều khiển. Bộ điều khiển có nhiệm vụ tạo ra tín hiệu điều khiển cung cấp cho đối tượng điều khiển sao cho tín hiệu đầu ra đối tượng bám theo được tín hiệu đầu ra của mơ hình mẫụ Mạng nơron mơ phỏng đối tượng được sử dụng để dự báo ảnh hưởng của bộ điều khiển đến sự thay đổi tín hiệu đầu ra của đối tượng điều khiển và cho phép cập nhật thông số của bộ điều khiển.

Vịng tối ƣu hóa Mơ hình

mẫu Tối ƣu hóa Mạng nơron mơ phỏng đối tƣợng Đối tƣợng điều khiển Bộ điều khiển nơron Dự báo đầu ra đối tƣợng Đầu ra đối tƣợng Tín hiệu điều khiển Lệnh đầu vào

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnụedụvn

Hình 1.18. Điều khiển thích nghi theo mơ hình mẫu

1.3.4.6 Đánh giá thích nghi

(Hình 1.19) mơ tả bộ điều khiển đánh giá thích nghi gồm có hai mạng nơron. Mạng nơron thứ nhất là bộ điều khiển ngược, được gọi là nơron mạng hoạt động. Mạng nơron thứ hai được gọi là mạng đánh giá, dự báo tương lai quá trình làm việc của hệ thống. Mạng đánh giá được huấn luyện tối ưu hóa cho q trình làm việc trong tương laị Quá trình huấn luyện sử dụng phương pháp học củng cố, là chương trình xấp xỉ động học.

Hình 1.19. Mơ hình đánh giá thích nghi

Tín hiệu điều khiển Sai lệch điều khiển + Mơ hình mẫu Mạng nơron mơ phỏng đối tƣợng Bộ điều khiển nơron Đối tƣợng điều khiển Lệnh đầu vào Đầu ra đối tƣợng + - Sai lệch - Mạng đánh giá (Tối ƣu hóa)

Đối tượng điều khiển

Mạng hoạt động

(Bộ điều khiển) Đối tƣợng

điều khiển

Tín hiệu điều khiển

Lệnh

đầu vào Đầu ra

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnụedụvn

1.3.4.7 Phản hồi tuyến tính hóa phản hồi thích nghi dùng mạng nơron

Phương pháp phản hồi tuyến tính hóa thích nghi dùng mạng nơron dựa vào ngun tắc thiết kế bộ điều khiển phản hồi tuyến tính hóa (hình 1.20). Phương pháp phản hồi tuyến tính hóa có đặc điểm là tín hiệu điều khiển có hai thành phần

Hệ thống phi tuyến được mô tả bởi quan hệ:

xp(n) =f(xp)+ g(xp)u (1.81) với: xp(n) =[(xp,  xp,...,  xp(n-1)]T (1.82) trong đó có n biến trạng thái và u là tín hiệu điều khiển

Hình 1.20. Phương pháp phản hồi tuyến tính hố thích nghi dùng mạng nơron Để tìm được hệ tuyến tính hóa từ hệ thống phi tuyến mô tả bởi công thức (1.81), sử dụng tín hiệu u ở dạng: u = [ ) ( 1 xp g f(xp) - kT xp+ r] (1.83) với k là hệ số phản hồi và r là tín hiệu đầu vàọ

Thay (1.83) vào (1.81) hệ tuyến tính có dạng:

xp(n) = - kT xp+ r (1.84) Hệ thống được điều chỉnh bởi mạc phản hồi tuyến tính

Có thể sử dụng mạng nơron để thực hiện chiến lược phản hồi tuyến tính. Thực hiện xấp xỉ các hàm f(.), g(.) bởi hai mạng nơron NNf và NNg, khi đó tín hiệu điều khiển có dạng:

xp Mơ hình mẫu

Thích nghi cho NNf

Thích nghi cho NNg

Đối tƣợng điều khiển

NNf NNg k - + r - - + e xm

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnụedụvn u = [ ) ( 1 p x NNg NNf xp kTxp r] (1.85) Chọn mơ hình mẫu ở dạng:  n m x = - kT xm + r (1.86)

Thay công thức (1.85) vào công thức (1.81) ta được:  n p x = f(xp) + ) ( ) ( p g p x NN x g [-NNf(xp) - kT xp+ r] (1.87) Sai lệch điều khiển được định nghĩa như sau:

e = xp -xm (1.88) Phương trình vi phân sai lệch có dạng:

e(n) = −kTe +f(xp) −NNf (xp) +g(xp) −NNg (xp)u (1.89) Với sự huấn luyện hợp lý, phương trình vi phân sai lệch sẽ dẫn đến trạng thái ổn định, sai lệch sẽ hội tụ tới điểm không.

1.3.4.8 Điều khiển thích nghi trực tiếp ổn định

Phương pháp này sử dụng định lý ổn định Lyapunov trong thiết kế của luật học của mạng nơron. Bộ điểu khiển gồm có 3 phần: Bộ điều khiển phản hồi tuyến tính, bộ điều khiển trượt phi tuyến và bộ điều khiển mạng nơron thích nghị

Hình 1.21. Điều khiển thích nghi trực tiếp ổn định Tín hiệu điều khiển được tính tốn ở dạng:

u(t) = upd(t) + (1− m(t))uad(t) + m(t)usl(t) (1.90)

Tuyến tính Trƣợt Đối tƣợng Điều chế Nơron xd x Uad Upd Usl + + + u x

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnụedụvn

Trong đó: upd(t) là tín hiệu điều khiển phản hồi tuyến tính, usl(t) là tín hiệu điều khiển trượt phi tuyến và uad(t) là tín hiệu điều khiển nơron thích nghị Hàm m(t) cho phép một sự chuyển tiếp mịn giữa bộ điều khiển trượt và thích nghi, dựa vào chuẩn của các vùng trạng thái hệ thống sau đây:

m(t) = 0 x(t) Ad 0 < m(t)<1 trường hợp còn lại

m(t) =1 x(t) Ac

Các vùng điều khiển được định nghĩa như hình (1.22). Bộ điều khiển trượt được sử dụng để giữ trạng thái hệ thống trong vùng mạng nơron huấn luyện đạt trạng thái điều khiển tối ưụ Bộ điều khiển trượt được đưa vào hoạt động (và bộ điều khiển nơron được tắt) ở mọi thời điểm khi hệ thống ở bên ngoài vùng nàỵ Sự phối hợp giữa các bộ điều khiển sẽ làm cho hệ thống ổn định thích nghi đạt điều khiển tối ưụ

Hình 1.22. Các vùng điều khiển

1.3.4.9 Những hạn chế và chú ý

Trong mỗi cấu trúc của các bộ điều khiển nơron chúng ta đều đánh giá về những thuận lợi và không thuận lợi của các bộ điều khiển nàỵ Ví dụ với phương pháp phương pháp phản hồi tuyến tính hóa chỉ được áp dụng với những hệ thống được mơ tả bởi phương trình (1.81). Phương pháp điều khiển thích nghi trực tiếp ổn định u cầu khơng có thành phấn phi tuyến trong phương trình mơ tả cũng như tín hiệu điều khiển khơng gian trạng tháị Phương pháp điều khiển theo mơ hình mẫu

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnụedụvn

không đảm bảo độ ổn định, phương pháp điều khiển ngược thích nghi yêu cầu sự tồn tại của mơ hình ngược của đối tượng. Nói chung những phương pháp điều khiển trên đều đảm bảo sự ổn định nhưng chỉ được áp dụng trong một giới hạn nào đó của hệ thống. Lĩnh vực điều khiển nơron tiếp tục được nghiên cứu, cách thức ổn định hoá trong hệ thống sẽ được phát triển rộng khắp trong các hệ thống. Từ các vấn đề thực tế cho thấy, vấn đề mấu chốt cho những hệ thống điều khiển nơron là khả năng hoạt động tốt của một mạng trong các trạng thái mớị Ví dụ cấu trúc mơ hình điều khiển dự báo cần đến một mơ hình mạng nơron nhận dạng thiết bị, mơ hình thiết bị là một ánh xạ từ các đầu vào và đầu ra của thiết bị trước tới đầu ra của thiết bị saụ Trong trình tự tính tốn mơ hình thiết bị, mạng cần được huấn luyện với dữ liệu bao gồm tồn bộ phạm vi đầu vào mạng có thể thực hiện được. Điều khó có thể thực hiện được ở đây là dữ liệu, bởi vì chúng ta khơng có điều khiển trực tiếp vượt trước đầu ra của thiết bị. Nhiều lúc chúng ta có thể có điều khiển độc lập trên đầu vào thiết bị, nhưng chỉ có điều khiển gián tiếp trên đầu ra của thiết bị (mà sau đó trở thành đầu vào mạng). Những hệ thống bậc cao sẽ khó khăn để đạt được dữ liệu cho phản ứng đầu ra của thiết bị thích hợp cho việc phân vùng không gian trạng tháị Trạng thái sẽ trở nên quan trọng để mạng có thể phát hiện ra trạng thái trong đó đầu vào rơi ra ngồi miền dữ liệu được cho là đúng mà mạng đã được huấn luyện.

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnụedụvn

KẾT LUẬN CHƢƠNG 1

Qua phân tích mơ hình và ứng dụng của mạng nơron ta thấy chúng có: 1. Các tính chất:

- Là hệ phi tuyến

- Là hệ xử lý song song: mạng nơron có cấu trúc song song, do đó có tốc độ tính tốn rất cao, rất phù hợp với lĩnh vực nhận dạng và điều khiển.

- Là hệ học và thích nghi: Mạng được luyện từ các số liệu quá khứ, có khả năng tự điều chỉnh khi số liệu đầu vào bị mất, có thể điều khiển on - line

- Là hệ nhiều biến, là hệ nhiều đầu vào, nhiều đầu ra (MIMO) rất tiện dùng khi điều khiển đối tượng khi có nhiều biến số.

2. Có nhiều phương pháp ứng dụng mạng nơron để nhận dạng đối tượng, trong đó nổi bật là hai phương pháp nhận dạng on - line và nhận dạng off - linẹ Trong hai phương pháp trên thì phương pháp nhận dạng off - line có nhiều ưu điểm: nó có thể sử dụng đồng thời tất cả các dữ liệụ Nhận dạng off - line sử dụng khi cần thiết phải xử lý rất nhiều tín hiệu cùng một lúc. Phương pháp sử dụng mạng nơron nhận dạng đối tượng theo đặc tính vào - ra, là điểm mạnh về ứng dụng của mạng nơron. Sử dụng mạng nơron để nhận dạng đối tượng có nhiều ưu điểm hơn so với phương pháp nhận dạng truyền thống vì:

- Mạng nơron là hệ học và thích nghi có khả năng học on - line hoặc off - line từ các số liệu quá khứ, do đó kết quả nhận dạng có thể đạt được độ chính xác rất caọ

- Mạng nơron là hệ xử lý song song do đó tốc độ tính tốn cao, mà các phương pháp nhận dạng truyền thống khó có thể đạt được.

- Mạng nơron là hệ MIMO, do đó rất tiện dụng khi nhận dạng cho đối tượng nhiều biến.

- Với bản chất “HỌC” mạng nơron có một trong những ứng dụng rất đặc trưng đó là nhận dạng đối tượng căn cứ vào đặc tính vào - ra của nó. Mạng nơ ron truyền thẳng nhiều lớp có cấu tạo đơn giản, có luật học lan truyền ngược rất nổi

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnụedụvn

tiếng thực hiện dễ dàng và có hiệu quả cao phù hợp với thực hiện quá trình học cho các đối tượng là tuyến tính và phi tuyến tính.

3. Có nhiều phương pháp điều khiển nhưng mỗi phương pháp đều có các ưu điểm và nhược điểm đặc thù như phương pháp phản hồi tuyến tính hóa chỉ được áp dụng với những hệ thống được mơ tả bởi phương trình (1.81), phương pháp điều khiển thích nghi trực tiếp ổn định yêu cầu khơng có thành phần phi tuyến trong phương trình mơ tả cũng như tín hiệu điều khiển không gian trạng tháị Phương pháp điều khiển thích nghi theo mơ hình mẫu khơng đảm bảo sự ổn định. Phương pháp điều khiển ngược thích nghi yêu cầu sự tồn tại của mơ hình ngược của đối

Ứng dụng của mạng nơron trong điều khiển

Những hạn chế và chú ý

Nhập và xuất dữ liệu