Có một số biến thể của bộ điều khiển mạng nơron dự đoán được dựa trên mô hình dự đoán tuyến tính. Mạng lưới nơron điều khiển dự đoán sử dụng một mô hình mạng của một nhà máy phi tuyến để dự đoán hiệu suất nhà máy trong tương lai. Bộ điều khiển sau đó tính toán đầu vào điều khiển sẽ tối ưu hóa hiệu suất cây trồng trên một thời gian định trong tương lai. Bước đầu tiên trong mô hình điều khiển dự phòng là để xác định mô hình mạng nơron thực vật (hệ thống nhận dạng). Tiếp theo, các mô hình nhà máy được sử dụng bởi các bộ điều khiển để dự đoán hiệu suất trong tương lai. Phần tiếp theo mô tả các quá trình nhận dạng hệ thống. Tiếp theo là một mô tả về quá trình tối ưu và một ứng dụng của điều khiển dự đoán.
3.1.1 Hệ thống nhận dạng
Giai đoạn đầu tiên của mô hình điều khiển dự đoán là để huấn luyện một mạng nơron để đại diện cho sự phát triển về phía trước của nhà máy. Các lỗi dự báo giữa sản lượng cây trồng và nơron sản lượng mạng được sử dụng như là các tín hiệu huấn luyện về mạng nơron. Quá trình này được đại diện bởi hình 2.17.
Hình 3.1: Nhận dạng thực vật
Một mô hình tiêu chuẩn được sử dụng để nhận dạng phi tuyến là bình Nonlinear tự hồi-Di chuyển (NARMA) mô hình:
y( k+d) = h[ y(k), y(k-1 ),…, y(k-n+1 ) ,u(k),u(k-1),…,u(k-m+1)]
Đó là hệ thống đầu vào, đầu ra là các hệ thống và là sự chậm trễ hệ thống (sẽ sử dụng sự chậm trễ của 1 cho các dự đoán người điều khiển). Đối với giai đoạn xác định sẽ huấn luyện một mạng lưới nơron để xấp xỉ hàm phi tuyến. Cấu trúc của mô hình mạng nơron thực vật được đưa ra trong hình 2.18, nơi các khối có nhãn TDL đang khai thác đường chậm mà lưu trữ trước giá trị của tín hiệu đầu vào. Phương trình cho mô hình nhà máy được cho bởi
Các chức năng được thực hiện bởi các mạng nơron và là vector chứa tất cả các trọng mạng.
Hình 3.2: Mô hình mạng nơron thực vật
Mặc dù có sự chậm trễ trong mạng này, họ chỉ xảy ra ở các đầu vào mạng, và mạng không chứa các vòng lặp thông tin phản hồi. Đối với những lý do này, các mô hình mạng thần kinh nơron có thể được huấn luyện sử dụng các phương pháp lan truyền ngược cho các mạng phản hồi. Điều quan trọng là các dữ liệu huấn luyện bao gồm toàn bộ các nhà máy hoạt động, bởi vì chúng ta biết từ cuộc thảo luận trước mà mạng nơron phi tuyến không suy chính xác. Các đầu vào cho mạng lưới này là một vector chiều kết quả đầu ra của nhà máy trước và đầu vào. Nó là không gian này phải được bao quát đầy đủ của dữ liệu huấn luyện.
3.1.2 Mạng dự đoán
Các mô hình phương pháp điều khiển dự đoán dựa trên đường chân trời lùi. Mô hình mạng nơron dự đoán nhà máy phản ứng trên một đường thời gian quy định. Các dự đoán được sử dụng bởi một chương trình tối ưu hóa tính toán để xác định sự kiểm soát tín hiệu là giảm thiểu các tiêu chí chất lượng sau đây trên đường chân trời quy định.
Ở đây N1, N2, và Nu xác định các chân trời hơn mà lỗi theo dõi và kiểm soát các lỗi được đánh giá. Các biến là tín hiệu điều khiển dự đoán, được đáp ứng mong muốn và là phản ứng mô hình mạng. Các giá trị xác định những đóng góp của tổng các bình phương của các số gia điều khiển có trên các chỉ số hiệu suất. Sơ đồ khối sau đây minh họa quá trình điều khiển mô hình dự đoán
Bộ điều khiển bao gồm các nhà máy mô hình mạng nơron và các khối tối ưu hóa. Các khối tối ưu xác định các giá trị của để giảm tối thiểu, và sau đó là tối ưu là đầu vào cho nhà máy.
3.1.3 Ứng dụng mạng nơron dự đoán vào hệ thống Magnetic Levitation
Bây giờ chứng minh điều khiển dự đoán bằng cách áp dụng nó cho một vấn đề thử nghiệm đơn giản. Trong vấn đề kiểm tra này, mục tiêu là để kiểm soát vị trí của một nam châm treo trên một nam châm điện, nam châm mà là hạn chế để nó chỉ có thể di chuyển theo hướng thẳng đứng, như thể hiện trong hình 3.4.
Hình 3.4: Hệ thống Magnetic Levitation
Các phương trình chuyển động của nam châm là:
Với y(t) là khoảng cách của nam châm trên các nam châm điện, là dòng điện chạy trong các nam châm điện, i(t) là khối lượng của nam châm, và M là hằng số hấp dẫn. Các tham số là hệ số ma sát nhớt được xác định bằng vật liệu mà di chuyển nam châm, và g là một hằng số lĩnh vực thế mạnh đó được xác định bởi số vòng dây trên nam châm điện và sức mạnh của nam châm. Đối với mô phỏng, hiện nay được phép dao động trong khoảng 0-4 amps, và khoảng thời gian lấy mẫu cho các bộ điều khiển là 0.01 giây. Các giá trị tham số được thiết lập, và M =3.
Β = 12, α = 15, g = 9.9
Bước đầu tiên trong quá trình thiết kế điều khiển là sự phát triển của mô hình nhà máy. Các màn trình diễn của các bộ điều khiển mạng lưới nơron phụ thuộc rất
đầu với một cuộc thảo luận về một số các thủ tục có thể được sử dụng để dễ nhận nhà máy chính xác.
Như với hệ thống nhận dạng tuyến tính, chúng ta cần phải đảm bảo rằng các đầu vào nhà máy là đủ. Đối với hộp đen phi tuyến xác định, chúng ta cũng cần phải chắc chắn rằng các yếu tố đầu vào và đầu ra hệ thống bao gồm các phạm vi hoạt động cho các bộ điều khiển sẽ được được áp dụng. Đối với các ứng dụng này, cần thu thập dữ liệu huấn luyện trong khi áp đầu vào ngẫu nhiên mà bao gồm một loạt các xung biên độ và thời gian ngẫu nhiên. Thời gian và biên độ của xung phải được chọn lựa cẩn thận để sản xuất chính xác.
Nếu xác định là nghèo nàn, sau đó hệ thống kiểm soát kết quả có thể thất bại. Hiệu suất điều khiển có xu hướng thất bại trong cả hai trạng thái ổn định hoạt động, hoặc hoạt động thoáng qua, hoặc cả hai. Khi hiệu suất trạng thái ổn định là nghèo nàn, nó rất hữu ích để tăng thời gian của đầu vào xung. Thật không may, trong một tập dữ liệu huấn luyện, nếu chúng ta có quá nhiều dữ liệu trong điều kiện trạng thái ổn định, dữ liệu huấn luyện có thể không là đại diện của hành vi thực vật điển hình. Điều này là do thực tế các tín hiệu đầu vào và đầu ra không bao gồm đầy đủ các khu vực có nghĩa là sẽ được kiểm soát. Điều này sẽ dẫn đến hiệu suất kém. Chúng ta cần chọn các dữ liệu huấn luyện, do đó đã tiến hành sản xuất nhiều hơn và hiệu suất trạng thái ổn định. Ví dụ sau đây sẽ minh họa cho các buổi biểu diễn của các dự đoán bộ điều khiển khi chúng ta sử dụng các phạm vi khác nhau cho các độ rộng xung của tín hiệu đầu vào để tạo ra các dữ liệu huấn luyện.
Thấy rằng nó mất khoảng 4,5 giây cho các hệ thống bay lên từ để đạt được trạng thái ổn định trong điều kiện mở vòng. Vì thế, trước tiên chúng ta xác định một phạm vi rộng xung của 0.01 << 5. Các mô hình mạng thần kinh thực vật được sử dụng ba giá trị chậm trễ của hiện tại (m=3) Và ba bị trì hoãn các giá trị của vị trí nam châm (n=3) là đầu vào vào mạng, và 10 tế bào nơron được sử dụng trong các lớp ẩn. Sau khi huấn luyện mạng lưới với các bộ dữ liệu thể hiện trong hình 2.21, các kết quả mạng lưới hệ thống nơron điều khiển dự đoán không ổn định.
Hình 3.5: Dữ liệu huấn luyện có chiều rộng xung dài.
Dựa trên những phản ứng kém của bộ điều khiển ban đầu, xác định rằng các dữ liệu huấn luyện không cung cấp bảo hiểm đáng kể. Do đó cần thay đổi phạm vi của độ rộng xung đầu vào, như thể hiện trong hình 3.5. Từ con số này, chúng ta có thể nhìn thấy rằng các dữ liệu huấn luyện dày đặc hơn và cung cấp bảo hiểm rộng của không gian đầu vào mô hình nhà máy hơn so với tập dữ liệu đầu tiên. Sau huấn luyện các mạng sử dụng tập dữ liệu này, kết quả là hệ thống điều khiển dự đoán ổn định, mặc dù nó dẫn đến các lỗi lớn.
Hình 3.6: Huấn luyện dữ liệu có độ rộng xung ngắn
Trong thử nghiệm thứ ba, kết hợp độ rộng xung ngắn và chiều rộng xung dài (trạng thái ổn định) dữ liệu. Các xung dài được tập trung chỉ trong một số phạm vi của các kết quả đầu ra của nhà máy. Ví dụ chọn để có dữ liệu trạng thái ổn định trong phạm vi mà những lỗi theo dõi từ các trường hợp trước đây đã lớn. Các tín hiệu đầu vào và đầu ra được thể hiện trong hình 3.7. Bộ điều khiển kết quả thực
Hình 3.7: Dữ liệu huấn luyện với hỗn hợp độ rộng xung
Các biểu đồ trái cho thấy các tín hiệu tham chiếu và vị trí của nam châm cho bộ điều khiển dự báo (sử dụng các mạng nơron được huấn luyện với các số liệu thể hiện trong hình 3.7 và các thông số thiết lập để điều khiển
N2 = 15, NU = 3. = 0.01
Lỗi trạng thái ổn định là rất nhỏ, và việc thực hiện thoáng qua là đủ ở tất cả các vùng thử nghiệm. Chúng tôi tìm thấy sự ổn định đó là ảnh hưởng mạnh mẽ bởi việc lựa chọn . Như chúng ta giảm , tín hiệu điều khiển có xu hướng thay đổi đột ngột hơn, tạo ra một sản lượng nhà máy mạnh hơn. Như với tuyến tính điều khiển dự phòng, khi chúng ta tăng quá nhiều, các hành động kiểm soát là quá mịn và phản ứng chậm. Các hành động kiểm soát ví dụ này được thể hiện trong đồ thị dưới bên phải của 3.8.
Hình 3.8: Phản ứng Maglev và hành động kiểm soát bằng cách sử dụng điều khiển dự đoán
3.2 Ứng dụng mạng nơron vào điều khiển thích nghi [1]
Điều khiển thích nghi là tổng hợp các kỹ thuật điều khiển nhằm tự động chỉnh định các bộ điều chỉnh trong mạch điều khiển nhằm thực hiện hay duy trì ở một mức độ nhất định, chất lượng của hệ khi thông số của quá trình được điều khiển không biết trước hay thay đổi theo thời gian. Từ khoảng 40 năm trở lại đây, lý thuyết điều khiển thích nghi đã thành một môn khoa học, được áp dụng nhiều trong kỹ thuật làm cải thiện chất lượng, tăng năng suất, hạ giá thành sản phẩm, giảm chi phí năng lượng…
* Phân loại hệ thích nghi: Căn cứ vào các tiêu chuẩn
- Căn cứ vào đặc tính đối tượng mà phân ra các loại:
+ Hệ cực trị: bản thân đối tượng có đặc tính cực đại hay cực tiểu. + Hệ giải tích: cực trị được hình thành một cách gián tiếp.
- Tùy thuộc vào nguồn thông tin về đối tượng mà phân ra các loại:
+ Điều khiển trực tiếp: Điều khiển không thông qua nhận dạng. + Điều khiển gián tiếp: Điều khiển thông qua nhận dạng.
- Căn cứ vào có hay không có mô hình mẫu trong hệ thống mà phân ra các loại: Hệ học; Hệ tự học.
- Căn cứ vào dạng của mạch thích nghi mà phân ra các loại: Hệ có mạch thích nghi hở; Hệ có mạch thích nghi kín.
- Căn cứ vào độ phức tạp của mạch tự chỉnh mà phân ra các loại:
+ Hệ tự chỉnh: Mạch tự chỉnh chỉ thay đổi thông số.
+ Hệ tự tổ chức: Mạch tự chỉnh thay đổi cả thông số và cấu trúc. Ngoài ra còn có nhiều tiêu chuẩn phân loại khác.
Các mạng nơron điều khiển được mô tả trong phần này được gọi bằng hai tên khác nhau: điều khiển tuyến tính phản hồi và kiểm soát NARMA-L2. Nó được gọi là phản hồi tuyến tính khi model máy có một hình thức đặc biệt (hình thức đồng). Nó được gọi là kiểm soát NARMA-L2 khi các mô hình nhà máy có thể được xấp xỉ bởi các hình thức tương tự. Ý tưởng trung tâm của loại điều khiển này là để biến đổi
tuyến. Phần này bắt đầu bằng cách trình bày các mô hình hệ thống biểu mẫu đồng hành và cho thấy làm thế nào bạn có thể sử dụng một mạng lưới thần kinh để xác định mô hình này. Sau đó, nó mô tả cách các mô hình mạng thần kinh được xác định có thể được sử dụng để phát triển một bộ điều khiển. Tiếp theo là một ví dụ về cách sử dụng các khối điều khiển NARMA-L2.
3.2.1 Xác định các Model NARMA-L2 [2]
Như với mô hình điều khiển dự đoán, bước đầu tiên trong việc sử dụng tuyến tính hóa điều khiển phản hồi (hoặc NARMA-L2) là để xác định các hệ thống được kiểm soát. Cần đào tạo một mạng lưới nơron để đại diện cho sự phát triển về phía trước của hệ thống. Bước đầu tiên là chọn một cấu trúc mô hình để sử dụng. Một mô hình chuẩn được sử dụng để đại diện cho các hệ thống phi tuyến tổng quát thời gian rời rạc là (NARMA) mô hình tự hồi quy trung bình chuyển động phi tuyến:
y (k + d) = N [y (k), y (k - 1), ..., y (k - n + 1), u (k), u (k - 1), ..., u (k - n + 1)]
Điều kiện u (k) là hệ thống đầu vào, và y (k) là đầu ra của hệ thống. Đối với giai đoạn nhận dạng, bạn có thể đào tạo một mạng lưới nơron để xấp xỉ hàm phi tuyến N. Đây là thủ tục nhận dạng sử dụng cho mạng nơron dự đoán
Nếu bạn muốn đầu ra hệ thống làm theo một số quỹ đạo tham khảo y (k + d) = y r (k + d), bước tiếp theo là phát triển một bộ điều khiển phi tuyến có dạng:
u (k) = G [y (k), y (k - 1), ..., y (k - n + 1), yr (k + d), u (k - 1), ..., u (k - m + 1)]
Vấn đề với việc sử dụng bộ điều khiển này là nếu muốn huấn luyện một mạng lưới thần kinh để tạo ra các chức năng G để giảm thiểu lỗi bình phương trung bình, cần phải sử dụng lan truyền ngược động ([NaPa91] hoặc [HaJe99]). Điều này có thể khá chậm. Một giải pháp, bởi Narendra và Mukhopadhyay [đề xuất năm 1997], là sử dụng mô hình gần đúng để đại diện cho hệ thống. Bộ điều khiển được sử dụng trong phần này dựa trên mô hình gần đúng NARMA-L2:
Y(k + d) = f [y (k), y (k - 1), ..., y (k - n + 1), u (k - 1), ..., u (k - m + 1) ] +
Mô hình này là hình thức đồng hành, mà điều khiển đầu vào tiếp theo u (k) không được chứa bên trong các phi tuyến. Ưu điểm của hình thức này có thể giải quyết cho các đầu vào điều khiển là nguyên nhân gây ra hệ thống để thực hiện theo các tài liệu tham khảo y (k + d) = y r (k + d). Bộ điều khiển kết quả sẽ có các hình thức:
Sử dụng phương trình này có thể trực tiếp gây ra các vấn đề thực hiện, bởi vì phải xác định các đầu vào điều khiển u (k) dựa trên đầu ra tại cùng một thời gian, y (k). Vì vậy, thay vào đó, sử dụng các mô hình:
y (k + d) = f [y (k), y (k - 1), ..., y (k - n + 1), u (k), u (k - 1), ..., u (k - n +
1)]+ G [y (k), ..., y (k - n + 1), u (k), ..., u (k - n + 1)] ⋅ u (k + 1)
Điều kiện d ≥ 2. Hình dưới đây cho thấy cấu trúc của một đại diện mạng lưới thần kinh.
Hình 3.9: Cấu trúc một mạng nơron
Sử dụng mô hình NARMA-L2, bạn có thể có được bộ điều khiển
Đó là có thể thực hiện cho d ≥ 2. Hình dưới đây là một sơ đồ khối của bộ điều khiển NARMA-L2.
Hình 3.10: Sơ đồ khối của bộ điều khiển NARMA-L2
như trong hìnhsau.
Hình 3.11: Bộ điều khiển thực hiện với mô hình nhận dạng NARMA-L2
3.2.2 Sử dụng các khối điều khiển NARMA-L2 [2]
Phần này cho thấy cách điều khiển NARMA-L2 được huấn luyện. Bước đầu tiên là để sao chép các khối NARMA-L2 khiển từ thư viện khối mạng nơron cho Simulink ® Editor. Bước này được bỏ qua trong các ví dụ sau đây.
Một mô hình ví dụ được cung cấp với các phần mềm Neural Network Toolbox cho thấy việc sử dụng các bộ điều khiển NARMA-L2. Trong ví dụ này, mục tiêu là để kiểm soát vị trí của một nam châm treo trên một nam châm điện, nam châm mà là hạn chế để nó chỉ có thể di chuyển theo hướng thẳng đứng, như trong hình dưới đây
Hình 3.12: Sơ đồ điều khiển vị trí nam châm vĩnh cửu
Các phương trình của chuyển động cho hệ thống này:
Điều kiện y (t) là khoảng cách của nam châm trên các nam châm điện, i (t) là dòng chảy trong các nam châm điện, M là khối lượng của nam châm, và g là hằng số hấp dẫn. Các β tham số là hệ số ma sát nhớt được xác định bằng các vật liệu mà