J TT (3.21) với là m ột ngưỡng nhỏ nào đó Theo cách này sẽ đạt được K v ùng siêu hình
3.9.1. Ước lượng và điều khiển hệ thống bằng mạng nơron
Cấu trúc của một hệ thống điều khiển mạng nơron được thể hiện trong hình sau. Hệ thống điều khiển này có một bộ điều khiển mạng nơron và một bộ đánh giá mạng nơron.
Hình 3.6.Hệ thống điều khiển bằng mạng nơron
Bộ đánh giá được huấn luyện bằng cách nhận sai lệch ngõ ra thiết bị mong
muốn và ngõ ra bộ đánh giá. Mặc khác bộ điều khiển được huấn luyện bằng
cách nhận sai lệch ngõ ra bộ đánh giá và một điểm tham chiếu. Vì thế bộ điều
khiển giả sử rằng ngõ rằng ngõ ra bộ đánh giá phù hợp với ngõ ra thiết bị.
Véctơ ngõ vào cho bộ đánh giá là:
Và ngõ ra là yestimated(k+1)
Sau khi huấn luyện bộ đánh giá, bộ điều khiển bắt đầu và dữ liệu cho bộ đánh giá được cập nhật.
Và ngõ ra là u(k+1).
Cả hai bộ điều khiển và đánh giá đều dùng thuật toán lan truyền ngược để huấn
luyện.
3.9.2.Bộ điều khiển PI với Mạng nơron như một bộ đánh giá thông số
Vấn đề chính với bộ điều khiển loại PI là xác định các hằng số tích phân và tỉ
lệ(KP,KI) cho mỗi điểm công tác. Để giải quyết vấn đề này, một bộ đánh giá
thông số mạng nơron được tích hợp trong phương pháp điều khiển PI như hình 3.7.
Mạng nơron này được huấn luyện để đánh giá thông số. Mục đích của mạng nơron là thực hiện nội sưy giữa những điểm công tác của thiết bị và tạo ra
những hằng số tích phân và tỉ lệ tương ứng. Vì thế,cặp huấn luyện cho mạng nơron được hình thành theo dạng ([yinitial,yref],[KI,KP]). Sau khi huấn luyện,
mạng nơron có thể được dùng như một bộ đánh giá thông số trực tuyến cho bộ điều khiển loại PI. Theo một quan điểm khác,có thể xem những điểm công tác như giả thiết và những hằng số tích phân,tỉ lệ tương ứng là phần kết luận của
luật Nếu-Thì. Trong trường hợp này, mạng nơron thực hiện nội suy trong
không gian quy luật của hệ thống.
3.9.3.Bộ Điều khiển tối ưu nơron dựa trên quy luật
Một phương pháp mới được đề xuất cho điều khiển tối ưu những hệ thống
nhiều đầu vào nhiều đầu ra(MIMO). Phương pháp dựa trên tối ưu rút ra từ quy
luật,mà được nội suy bởi mạng nơron.
Việc thiết kế những bộ điều khiển cho hệ thống MIMO luôn là vấn đề khó khăn thậm chí đó chỉ là những hệ tuyến tính. Ý tưởng đang thịnh hành được dùng để điều khiển những hệ thống MIMO tuyến tính là tách riêng ra, nếu có
thể. Trong sưốt thập kỷ qua, có nhiều cách giải quan trọng cho vấn đề này bằng
những phương pháp được xây dựng chuyên dụng để điều khiển những thiết bị
tuyến tính,chẳng hạn những kỹ thuật điều khiển theo cách thức trượt(sliding mode) và điều khiển nơron. Hầu hết những kỹ thuật này là khá phức tạp và chỉ
có thể áp dụng cho một trường hợp cụ thể.
Những kỹ thuật điều khiển mờ được áp dụng một cách hạn chế trong điều
khiển những hệ thống MIMO chủ yếu vì việc nhận được những quy luật không
phải là dễ dàng(thường khó có được) và số lượng quy luật thường lớn, phụ
thuộc vào số ngõ ra và trạng thái.
Mục đích của chúng ta là cố gắng tìm một phương pháp mới cho vấn đề chưa được giải quyết này quy luật kết hợp với mạng nơron.
Hình 3.7. Cấu trúc bộ điều khiển PI với bộ đánh giá thông số mạng nơron
3.9.4Phân tích nồi hơi
Một hệ thống nồi hơi cấp nhiệt bằng hơi nước được ứng dụng rộng rãi trong công nghiệp. Nó đặc biệt hữu dụng trong các quá trình hoá học. Đáp ứng động và điều khiển nồi hơi này được thể hiện ở hình bên dưới. Hệ thống chứa một
một chậu nước qua đó nước lưu thông với tốc độ biến đổi wi(kg/min). Nước
vào,có tốc độ biến đổi theo thời gian,tại nhiệt độ Ti=50C. Nước trong chậu được
cấp nhiệt bởi hơi nước ngưng tụ trong vỏ chậu tại nhiệt độ TV. Đây là một hệ
thống ba đầu vào và hai đầu ra.
Tốc độ dòng nước vào, tốc độ dòng nước ra và tốc độ dòng hơi là những đầu vào điều khiển của hệ thống. Nhiệt độ và khối lượng nước trong chậu là những
ngõ ra.
Những giả định sau được áp dụng cho bình đun nước:
1. Bỏ qua tổn hao nhiệt cho khí quyển;
2. Độ tích nhiệt của thành bình (phân cách giữa hơi và nước) là không đáng
kể khi so với nhiệt của nước trong bình;
3. Độ tích nhiệt của thành bình bên ngoài,tiếp giáp với môi trường xung
quanh là hữu hạn và nhiệt độ của thành bình này là đồng nhất và bằng với
nhiệt độ hơi tại bất kỳ thời điểm nào;
4. Nước trong bình được khuấy đủ để tạo ra một nhiệt độ đồng nhất;
6. Lưu lượng nhiệt từ dòng hơi truyền vào nước trong chậu được mô tả bởi
biểu thức
q = U(Tv–To) với q = tốc độ lưu lượng nhiệt J/(min)(m2) U = hệ số truyền nhiệt chung J/(min)(m2)(0C) Tv = nhiệt độ hơi (0C)
To = nhiệt độ nước (0C)
Hình 3.8. Nồi hơi
Mô hình toán học của hệ thống có thể thu được bằng cách dựa vào cân bằng năng lượng trên phần nước và phần hơi. Những ký hiệu được dùng trong quá trình phân tích này được định nghĩa như sau:
TI = nhiệt độ nước chảy vào (0C) TO = nhiệt độ nước chảy ra (0C)
wI = tốc độ lưu lượng nước chảy vào, kg/min wO = tốc độ lưu lượng nước chảy ra, kg/min
wC = tốc độ lưu lượng ngưng tụ từ chậu, kg/min
wV = tốc độ lưu lượng hơi, kg/min
m = khối lượng nước trong chậu,kg
m1 = khối lượng thành chậu, kg
V = thể tích không gian hơi trong ống,m3
C = nhiệt dung của nước, J/(kg)(C)
C1 = nhiệt dung của kim loại trong thành ống, J/(kg)(C) A = diện tích mặt cắt ngang để trao đổi nhiệt,m2
t = thời gian, phút
Hv = entanpi của hơi nước đi vào,J/kg HC = entanpi của hơi nước đi ra,J/kg
Uv = nội năng của hơi nước trong ống, J/kg
Phương trình cân bằng năng lượng và cân bằng khối lượng cho phần hơi và nước được viết như sau:
Từ những phương trình trên,ta thấy rằng hệ thống thống này là phi tuyến.
Những véctơ trạng thái, đầu vào và đầu ra là:
3.9.4.Bộ Điều khiển tối ưu Neuro dựa trên quy luật cho những hệ thống MIMO phi tuyến
3.9.4.1.Những hệ thống MIMO
Giả sử một thiết bị MIMO được cho với một mô hình toán học như sau:
với x(t), f(x(t), u(t))Rn, u(t)Rm và y(t), g(x(t))Rp. Ngõ ra hệ thống y(t) cần
phải theo một tín hiệu tham khảo yd(t)Rp.
Bộ điều khiển được phát triển dựa trên quy luật trong đó những quy luật được
phát triển bằng cách sử dụng mô hình toán học của một thiết bị với một khả năng phán đoán tối ưu. Đó là, từ một mô hình có được, bằng cách phân chia
không gian trạng thái và không gian ngõ ra và xác định một đại diện cho mỗi
phần chia, từ đó xác định những tín hiệu điều khiển (quy luật) tối ưu, sử dụng
một hàm tính toán được chọn phù hợp.
Giả sử mỗi thành phần của véctơ trạng thái có Ni khoảng,i=1,2,…,n và véctơ
ngõ ra có Ok thành phần k=1,2,…,p. Thì sẽ có tổng cộng p k k n i Ni O 1 1 quy
luật. Nếu trạng thái hệ thống bắt đầu tại phần thứ i (đại diện là xi) và những ngõ ra bắt đầu và kết thúc của hệ thống là Ov và Ok (những đại diện của chúng lần lượt là yv và yk ), quy luật liên qua có thể được tìm thấy tối ưu bằng cách giải bài toán điều khiển tối ưu để tối thiểu hàm giá trị trong khoảng thời gian [0,tf].
với giả thiết là
Thường H,Q và R là những ma trận đường chéo với những thành phần được
chọn phù hợp. Hàm véctơ yd(t) có thể là bất kỳ hàm trơn nào với
Hơn nữa, những ràng buộc với u(t) là |ui (t)| Bi, i = 1, 2, …, m, có thể được
hợp nhất dễ dàng trong cách giải điều khiển tối ưu như giảm độ dốc. Những gì
làm được hoàn toàn là sự nội sưy trong không gian hàm điều khiển tối ưu. ở đây, người ta giả sử là ánh xạ giữa phần bắt đầu-kết thúc và những hàm điều
khiển tối ưu liên quan là liên tục. Vì thế, nếu số lượng phân chia là đủ lớn, lỗi
xấp xỉ trong xây dựng hàm điều khiển tối ưu bằng mạng nơron bán vô định là khá nhỏ.
3.9.4.3.Mạng nơron
Để có thể tạo những ngõ vào điều khiển để mà quỹ đạo ngõ ra hệ thống theo
một đường tối ưu giữa những trạng thái ngõ ra ban đầu và kết thúc bất kỳ,
chúng ta phải huấn luyện mạng nơron nhiều lớp. Mạng nơron này nhận ngõ ra hiện thời y(to) và ngõ ra mong muốn y(tf) như những ngõ vào của nó và tạo ra
tín hiệu điều khiển tối ưu u(t) để thực hiện công việc trên. Cấu trúc của bộ điều
khiển dùng mạng nơron được thể hiện ở hình sau:
Hình 3.9. Cấu trúc bộ điều khiển tối ưu neuro dựa trên quy luật
Để huấn luyện,những tín hiệu đầu vào được tạo bởi bộ điều khiển tối ưu và
những điểm đầu vào và đầu ra cần được dùng. Theo lý thuyết, có một điều thú
vị là một mạng nơron bán vô định,nghĩa là một ánh xạ giữa không gian đầu vào có chiều hữu hạn và không gian đầu ra có chiều vô hạn (ví dụ những hàm điều
khiển ).
Những nơron đầu ra tạo những giá trị rời rạc của hàm đầu vào trong khoảng
[to,tf]. Vì thế, mạng nơron có thể tạo ra việc lấy mẫu của tín hiệu điều khiển.
Ví dụ, nếu số ngõ ra là n với hệ thống một đầu vào, thì y(to),y(tf) là những véctơ
n chiều:
y(to)=[ y1(to) y2(to)... yn(to)]
Vì thế nếu khoảng [to,tf] được chia thành m phần với chu kỳ lấy mẫu là T, một
cặp huấn luyện điển hình có dạng:
( [ y1(to) y2(to)... yn(to)... y1(tf) y2(tf) … yn(tf) ], [ u(0) u(T)... u(mT)])
với [u(0) u(T) … u(mT)] là véctơ đầu vào rời rạc, mà chuyển hệ thống từ y(to)
đến y(tf) và được tạo bởi điều khiển tối ưu. Sau khi huấn luyện,mạng nơron đáp ứng ngay lập tức và thực hiện như một bộ điều khiển thời gian thực. Thực tế,
mạng nơron tạo ra véctơ điều khiển tối ưu cho khoảng điều khiển [tpresent, tfuture] tại tpresent. Khoảng điều khiển tfuture-tpresent lớn hơn chu kỳ lấy
mẫu. Như được đề cập ở trên, ánh xạ giữa không gian vào –ra và những hàm
điều khiển tối ưu được giả định là liên tục. Dữ liệu (ví dụ những hàm điều khiển
tối ưu thuđược bằng cách giải bài toán tối ưu) tượng trưng cho những tính toán
ánh xạ này tại những thời điểm cụ thể. Vì thế,vấn đề va chạm quy luật là không xảy ra.