Ước lượng và điều khiển hệ thống bằng mạng nơron

Một phần của tài liệu Luận văn thạc sĩ mạng điều khiển fuzzy và neural (Trang 88)

J TT (3.21) với là m ột ngưỡng nhỏ nào đó Theo cách này sẽ đạt được K v ùng siêu hình

3.9.1. Ước lượng và điều khiển hệ thống bằng mạng nơron

Cấu trúc của một hệ thống điều khiển mạng nơron được thể hiện trong hình sau. Hệ thống điều khiển này có một bộ điều khiển mạng nơron và một bộ đánh giá mạng nơron.

Hình 3.6.Hệ thống điều khiển bằng mạng nơron

Bộ đánh giá được huấn luyện bằng cách nhận sai lệch ngõ ra thiết bị mong

muốn và ngõ ra bộ đánh giá. Mặc khác bộ điều khiển được huấn luyện bằng

cách nhận sai lệch ngõ ra bộ đánh giá và một điểm tham chiếu. Vì thế bộ điều

khiển giả sử rằng ngõ rằng ngõ ra bộ đánh giá phù hợp với ngõ ra thiết bị.

Véctơ ngõ vào cho bộ đánh giá là:

Và ngõ ra là yestimated(k+1)

Sau khi huấn luyện bộ đánh giá, bộ điều khiển bắt đầu và dữ liệu cho bộ đánh giá được cập nhật.

Và ngõ ra là u(k+1).

Cả hai bộ điều khiển và đánh giá đều dùng thuật toán lan truyền ngược để huấn

luyện.

3.9.2.Bộ điều khiển PI với Mạng nơron như một bộ đánh giá thông số

Vấn đề chính với bộ điều khiển loại PI là xác định các hằng số tích phân và tỉ

lệ(KP,KI) cho mỗi điểm công tác. Để giải quyết vấn đề này, một bộ đánh giá

thông số mạng nơron được tích hợp trong phương pháp điều khiển PI như hình 3.7.

Mạng nơron này được huấn luyện để đánh giá thông số. Mục đích của mạng nơron là thực hiện nội sưy giữa những điểm công tác của thiết bị và tạo ra

những hằng số tích phân và tỉ lệ tương ứng. Vì thế,cặp huấn luyện cho mạng nơron được hình thành theo dạng ([yinitial,yref],[KI,KP]). Sau khi huấn luyện,

mạng nơron có thể được dùng như một bộ đánh giá thông số trực tuyến cho bộ điều khiển loại PI. Theo một quan điểm khác,có thể xem những điểm công tác như giả thiết và những hằng số tích phân,tỉ lệ tương ứng là phần kết luận của

luật Nếu-Thì. Trong trường hợp này, mạng nơron thực hiện nội suy trong

không gian quy luật của hệ thống.

3.9.3.Bộ Điều khiển tối ưu nơron dựa trên quy luật

Một phương pháp mới được đề xuất cho điều khiển tối ưu những hệ thống

nhiều đầu vào nhiều đầu ra(MIMO). Phương pháp dựa trên tối ưu rút ra từ quy

luật,mà được nội suy bởi mạng nơron.

Việc thiết kế những bộ điều khiển cho hệ thống MIMO luôn là vấn đề khó khăn thậm chí đó chỉ là những hệ tuyến tính. Ý tưởng đang thịnh hành được dùng để điều khiển những hệ thống MIMO tuyến tính là tách riêng ra, nếu có

thể. Trong sưốt thập kỷ qua, có nhiều cách giải quan trọng cho vấn đề này bằng

những phương pháp được xây dựng chuyên dụng để điều khiển những thiết bị

tuyến tính,chẳng hạn những kỹ thuật điều khiển theo cách thức trượt(sliding mode) và điều khiển nơron. Hầu hết những kỹ thuật này là khá phức tạp và chỉ

có thể áp dụng cho một trường hợp cụ thể.

Những kỹ thuật điều khiển mờ được áp dụng một cách hạn chế trong điều

khiển những hệ thống MIMO chủ yếu vì việc nhận được những quy luật không

phải là dễ dàng(thường khó có được) và số lượng quy luật thường lớn, phụ

thuộc vào số ngõ ra và trạng thái.

Mục đích của chúng ta là cố gắng tìm một phương pháp mới cho vấn đề chưa được giải quyết này quy luật kết hợp với mạng nơron.

Hình 3.7. Cấu trúc bộ điều khiển PI với bộ đánh giá thông số mạng nơron

3.9.4Phân tích nồi hơi

Một hệ thống nồi hơi cấp nhiệt bằng hơi nước được ứng dụng rộng rãi trong công nghiệp. Nó đặc biệt hữu dụng trong các quá trình hoá học. Đáp ứng động và điều khiển nồi hơi này được thể hiện ở hình bên dưới. Hệ thống chứa một

một chậu nước qua đó nước lưu thông với tốc độ biến đổi wi(kg/min). Nước

vào,có tốc độ biến đổi theo thời gian,tại nhiệt độ Ti=50C. Nước trong chậu được

cấp nhiệt bởi hơi nước ngưng tụ trong vỏ chậu tại nhiệt độ TV. Đây là một hệ

thống ba đầu vào và hai đầu ra.

Tốc độ dòng nước vào, tốc độ dòng nước ra và tốc độ dòng hơi là những đầu vào điều khiển của hệ thống. Nhiệt độ và khối lượng nước trong chậu là những

ngõ ra.

Những giả định sau được áp dụng cho bình đun nước:

1. Bỏ qua tổn hao nhiệt cho khí quyển;

2. Độ tích nhiệt của thành bình (phân cách giữa hơi và nước) là không đáng

kể khi so với nhiệt của nước trong bình;

3. Độ tích nhiệt của thành bình bên ngoài,tiếp giáp với môi trường xung

quanh là hữu hạn và nhiệt độ của thành bình này là đồng nhất và bằng với

nhiệt độ hơi tại bất kỳ thời điểm nào;

4. Nước trong bình được khuấy đủ để tạo ra một nhiệt độ đồng nhất;

6. Lưu lượng nhiệt từ dòng hơi truyền vào nước trong chậu được mô tả bởi

biểu thức

q = U(Tv–To) với q = tốc độ lưu lượng nhiệt J/(min)(m2) U = hệ số truyền nhiệt chung J/(min)(m2)(0C) Tv = nhiệt độ hơi (0C)

To = nhiệt độ nước (0C)

Hình 3.8. Nồi hơi

Mô hình toán học của hệ thống có thể thu được bằng cách dựa vào cân bằng năng lượng trên phần nước và phần hơi. Những ký hiệu được dùng trong quá trình phân tích này được định nghĩa như sau:

TI = nhiệt độ nước chảy vào (0C) TO = nhiệt độ nước chảy ra (0C)

wI = tốc độ lưu lượng nước chảy vào, kg/min wO = tốc độ lưu lượng nước chảy ra, kg/min

wC = tốc độ lưu lượng ngưng tụ từ chậu, kg/min

wV = tốc độ lưu lượng hơi, kg/min

m = khối lượng nước trong chậu,kg

m1 = khối lượng thành chậu, kg

V = thể tích không gian hơi trong ống,m3

C = nhiệt dung của nước, J/(kg)(C)

C1 = nhiệt dung của kim loại trong thành ống, J/(kg)(C) A = diện tích mặt cắt ngang để trao đổi nhiệt,m2

t = thời gian, phút

Hv = entanpi của hơi nước đi vào,J/kg HC = entanpi của hơi nước đi ra,J/kg

Uv = nội năng của hơi nước trong ống, J/kg

Phương trình cân bằng năng lượng và cân bằng khối lượng cho phần hơi và nước được viết như sau:

Từ những phương trình trên,ta thấy rằng hệ thống thống này là phi tuyến.

Những véctơ trạng thái, đầu vào và đầu ra là:

3.9.4.Bộ Điều khiển tối ưu Neuro dựa trên quy luật cho những hệ thống MIMO phi tuyến

3.9.4.1.Những hệ thống MIMO

Giả sử một thiết bị MIMO được cho với một mô hình toán học như sau:

với x(t), f(x(t), u(t))Rn, u(t)Rm và y(t), g(x(t))Rp. Ngõ ra hệ thống y(t) cần

phải theo một tín hiệu tham khảo yd(t)Rp.

Bộ điều khiển được phát triển dựa trên quy luật trong đó những quy luật được

phát triển bằng cách sử dụng mô hình toán học của một thiết bị với một khả năng phán đoán tối ưu. Đó là, từ một mô hình có được, bằng cách phân chia

không gian trạng thái và không gian ngõ ra và xác định một đại diện cho mỗi

phần chia, từ đó xác định những tín hiệu điều khiển (quy luật) tối ưu, sử dụng

một hàm tính toán được chọn phù hợp.

Giả sử mỗi thành phần của véctơ trạng thái có Ni khoảng,i=1,2,…,n và véctơ

ngõ ra có Ok thành phần k=1,2,…,p. Thì sẽ có tổng cộng    p k k n i Ni O 1 1 quy

luật. Nếu trạng thái hệ thống bắt đầu tại phần thứ i (đại diện là xi) và những ngõ ra bắt đầu và kết thúc của hệ thống là Ov và Ok (những đại diện của chúng lần lượt là yv và yk ), quy luật liên qua có thể được tìm thấy tối ưu bằng cách giải bài toán điều khiển tối ưu để tối thiểu hàm giá trị trong khoảng thời gian [0,tf].

với giả thiết là

Thường H,Q và R là những ma trận đường chéo với những thành phần được

chọn phù hợp. Hàm véctơ yd(t) có thể là bất kỳ hàm trơn nào với

Hơn nữa, những ràng buộc với u(t) là |ui (t)| Bi, i = 1, 2, …, m, có thể được

hợp nhất dễ dàng trong cách giải điều khiển tối ưu như giảm độ dốc. Những gì

làm được hoàn toàn là sự nội sưy trong không gian hàm điều khiển tối ưu. ở đây, người ta giả sử là ánh xạ giữa phần bắt đầu-kết thúc và những hàm điều

khiển tối ưu liên quan là liên tục. Vì thế, nếu số lượng phân chia là đủ lớn, lỗi

xấp xỉ trong xây dựng hàm điều khiển tối ưu bằng mạng nơron bán vô định là khá nhỏ.

3.9.4.3.Mạng nơron

Để có thể tạo những ngõ vào điều khiển để mà quỹ đạo ngõ ra hệ thống theo

một đường tối ưu giữa những trạng thái ngõ ra ban đầu và kết thúc bất kỳ,

chúng ta phải huấn luyện mạng nơron nhiều lớp. Mạng nơron này nhận ngõ ra hiện thời y(to) và ngõ ra mong muốn y(tf) như những ngõ vào của nó và tạo ra

tín hiệu điều khiển tối ưu u(t) để thực hiện công việc trên. Cấu trúc của bộ điều

khiển dùng mạng nơron được thể hiện ở hình sau:

Hình 3.9. Cấu trúc bộ điều khiển tối ưu neuro dựa trên quy luật

Để huấn luyện,những tín hiệu đầu vào được tạo bởi bộ điều khiển tối ưu và

những điểm đầu vào và đầu ra cần được dùng. Theo lý thuyết, có một điều thú

vị là một mạng nơron bán vô định,nghĩa là một ánh xạ giữa không gian đầu vào có chiều hữu hạn và không gian đầu ra có chiều vô hạn (ví dụ những hàm điều

khiển ).

Những nơron đầu ra tạo những giá trị rời rạc của hàm đầu vào trong khoảng

[to,tf]. Vì thế, mạng nơron có thể tạo ra việc lấy mẫu của tín hiệu điều khiển.

Ví dụ, nếu số ngõ ra là n với hệ thống một đầu vào, thì y(to),y(tf) là những véctơ

n chiều:

y(to)=[ y1(to) y2(to)... yn(to)]

Vì thế nếu khoảng [to,tf] được chia thành m phần với chu kỳ lấy mẫu là T, một

cặp huấn luyện điển hình có dạng:

( [ y1(to) y2(to)... yn(to)... y1(tf) y2(tf) … yn(tf) ], [ u(0) u(T)... u(mT)])

với [u(0) u(T) … u(mT)] là véctơ đầu vào rời rạc, mà chuyển hệ thống từ y(to)

đến y(tf) và được tạo bởi điều khiển tối ưu. Sau khi huấn luyện,mạng nơron đáp ứng ngay lập tức và thực hiện như một bộ điều khiển thời gian thực. Thực tế,

mạng nơron tạo ra véctơ điều khiển tối ưu cho khoảng điều khiển [tpresent, tfuture] tại tpresent. Khoảng điều khiển tfuture-tpresent lớn hơn chu kỳ lấy

mẫu. Như được đề cập ở trên, ánh xạ giữa không gian vào –ra và những hàm

điều khiển tối ưu được giả định là liên tục. Dữ liệu (ví dụ những hàm điều khiển

tối ưu thuđược bằng cách giải bài toán tối ưu) tượng trưng cho những tính toán

ánh xạ này tại những thời điểm cụ thể. Vì thế,vấn đề va chạm quy luật là không xảy ra.

Một phần của tài liệu Luận văn thạc sĩ mạng điều khiển fuzzy và neural (Trang 88)

Tải bản đầy đủ (PDF)

(150 trang)