Có thể chứng minh được rằng nếu hệ thống được xét là điều khiển được trạng thái hoàn toàn, thì các cực của hệ thống vòng kín có thể được đặt ở bất kỳ vị trí mong muốn nhờ phản hồi trạng
Trang 1CHƯƠNG 3
CƠ SỞ LÝ THUYẾT
3.1 Lý thuyết điều khiển phản hồi biến trạng thái dùng phương pháp gán cực
Trong phần này chúng ta sẽ xem xét một phương pháp thiết kế được gọi
là kỹ thuật gán cực Chúng ta giả định rằng tất cả các biến trạng thái là có thể
đo lường được và có thể lấy tín hiệu phản hồi Có thể chứng minh được rằng nếu hệ thống được xét là điều khiển được trạng thái hoàn toàn, thì các cực của
hệ thống vòng kín có thể được đặt ở bất kỳ vị trí mong muốn nhờ phản hồi
trạng thái thông qua ma trận hệ số phản hồi trạng thái thích hợp
Kỹ thuật thiết kế này bắt đầu với việc xác định các cực vòng kín mong muốn dựa trên đáp ứng quá độ và các yêu cầu về đáp ứng tần số, chẳng hạn như đáp ứng tốc độ, hệ số tắt dần, hoặc dải tần cũng như các yêu cầu trạng thái ổn định
Giả định rằng chúng ta quyết định các cực vòng kín mong muốn đặt tại s
ta sẽ nghiên cứu các phương pháp xác định ma trận hệ số phản hồi trạng thái yêu cầu
Trang 2Cần lưu ý rằng khi các tín hiệu điều khiển là một thông số vector, thì các khía cạnh toán học của sơ đồ vị trí cực sẽ trở nên phức tạp Do đó chúng ta sẽ không nghiên cứu trường hợp này Cũng cần lưu ý rằng khi tín hiệu điều khiển là một thông số vector, thì ma trận hệ số phản hồi trạng thái không phải
là duy nhất Có thể lựa chọn một cách tự do nhiều hơn n thông số, có nghĩa là ngoài việc có thể đặt n cực vòng kín phù hợp, chúng ta có thể đáp ứng được một số hoặc tất cả các yêu cầu khác (nếu có) của hệ thống vòng kín
3.1.1 Thiết kế hệ thống điều khiển bằng phương pháp gán cực
Khác với phương pháp thiết kế thông thường là chúng ta chỉ việc xác định các cực vòng kín trội, phương pháp gán cực ở đây xác định tất cả các cực vòng kín Yêu cầu hệ thống là điều khiển được trạng thái hoàn toàn Xét một
x( )t – là vector biến trạng thái bậc n
u t( )– là tín hiệu điều khiển (vô hướng)
Trang 3lường được và có thể lấy tín hiệu phản hồi và u t( ) không bị giới hạn Thay phương trình (3.2) vào phương trình (3.1) ta có:
Trong đó: x(0)– là trạng thái ban đầu gây ra bởi nhiễu
Tính ổn định và các đặc tính đáp ứng quá độ được xác định bởi các giá trị riêng của ma trận (A - bk) Nếu vector k được chọn phù hợp, thì ma trận
(A - bk)có thể là ma trận ổn định tiệm cận với tất cả các giá trị x(0)0 có thể làm cho x( )t tiến đến 0 khi t tiến đến ∞ Các giá trị riêng của ma trận
(A - bk)được gọi là các cực của bộ điều chỉnh Nếu các cực của bộ điều
chỉnh được đặt bên trái của mặt phẳng s thì x( )t tiến đến 0 khi t tiến đến ∞
Hình 3.1 (a) vẽ hệ thống ở phương trình (3.1) Đây là một hệ thống điều khiển vòng hở vì x( )t không được cấp đến tín hiệu điều khiển u (t) Hình 3.1
(b) vẽ hệ thống có phản hồi trạng thái vòng kín với u kx Đây được gọi là
hệ thống điều khiển vòng kín vì trạng thái x( )t được cấp đến tín hiệu điều khiển u (t)
Trang 4Hình 3.1 (a) Hệ thống điều khiển vòng hở
(b) Hệ thống điều khiển vòng kín
Sau đây chúng ta sẽ chứng minh rằng việc đặt tùy ý các cực với một hệ thống cho trước là có thể được nếu và chỉ nếu hệ thống là điều khiển được trạng thái hoàn toàn
3.1.2 Điều kiện cần và đủ để đặt cực tùy ý
Xét hệ thống điều khiển được xác định bởi phương trình (3.1) Chúng ta giả sử rằng biên độ của tín hiệu điều khiển u (t) là không bị giới hạn Nếu tín hiệu điều khiển u (t) được chọn là:
( ) ( )
u t kx t
Với kR 1 n là vector hồi tiếp trạng thái thì hệ thống sẽ trở thành hệ thống điều khiển vòng kín như được vẽ trên hình 3.1(b) và nghiệm của phương trình (3.1) sẽ như phương trình (3.4) hay:
Trang 5Nếu hệ thống là điều khiển được trạng thái hoàn toàn, có nghĩa là ma
trận điều khiển được M có nghịch đảo, thì khi đó tất cả các giá trị riêng của
ma trận A có thể đặt tùy ý
Đặt vector trạng thái mới là ˆ( )x t ta có:
ˆ( )t ( )t
Nếu hạng của ma trận điều khiển M là n (có nghĩa là hệ thống điều
khiển được trạng thái hoàn toàn), khi đó nghịch đảo của ma trận T là ma trận
Trang 6Phương trình (3.8) là dạng chuẩn tắc điều khiển được Vì vậy, cho trước một phương trình trạng thái (3.1), nó có thể được chuyển thành dạng chuẩn tắc điều khiển được nếu hệ thống là điều khiển được trạng thái hoàn toàn và nếu chúng ta chuyển vector trạng thái x( )t sang vector trạng thái ˆ ( )x t bằng
cách sử dụng ma trận chuyển T cho bởi phương trình (3.5)
Chọn tập hợp các giá trị riêng mong muốn là µ1 , µ 2 , , µ n Khi đó
phương trình đặc tính mong muốn sẽ là:
n n
n n
s s
1
1 1 2
Ta có: x( )t Ax( )t bu t( )(A bk x ) ( )t
Trang 7Cho nên phương trình đặc tính với hệ thống này là:
n n
a s a
s a
Phương trình (3.12) là phương trình đặc tính với hệ thống có phản hồi
Vì vậy nó phải bằng phương trình đặc tính mong muốn (3.9) ta có:
n n
n n
n n n
n n
n
s s
s a
s a
s a
1
1 1
(
Trang 8Cân bằng các hệ số cùng mũ của s ta có:
a a
k theo phương trình (3.13) ở trên
Trang 9Vector phản hồi k đưa đến các giá trị riêng của (A bk ) là các giá trị
mong muốn µ1 , µ 2 , , µ n Trong đó nếu i (i 1n)là một giá trị riêng phức, thì liên hợp của nó cũng phải là giá trị riêng của (A bk ) Vector k
được xác định bởi các bước sau đây:
Bước 1: Kiểm tra tính điều khiển được cho hệ thống Nếu hệ thống là điều khiển được trạng thái hoàn toàn thì sử dụng các bước tiếp theo
Bước 2: Từ đa thức đặc tính với ma trận A như sau:
Bước 3: Xác định ma trận chuyển T chuyển phương trình trạng thái hệ thống
thành dạng chuẩn tắc điều khiển được (trường hợp nếu hệ thống cho trước đã
là dạng chuẩn tắc điều khiển được thì T1 Không cần phải viết phương trình trạng thái ở dạng chuẩn tắc điều khiển được Tất cả chúng ta cần ở đây
là tìm ma trận chuyển T được cho bởi phương trình:
TMW
với M được cho bởi phương trình (3.6) và W được cho bởi phương trình
(3.7)
Bước 4: Sử dụng các giá trị riêng mong muốn (các cực vòng kín mong muốn),
ta viết đa thức đặc tính mong muốn:
n n
n n
s s
1
1 1 2
Trang 10Chú ý rằng nếu hệ thống có bậc thấp (bậc 3 trở xuống), thì việc thay thế
trực tiếp vector k vào đa thức đặc tính mong muốn có thể đơn giản hơn
Chẳng hạn, nếu n = 3 thì ta viết vector hồi tiếp trạng thái k là:
Trang 113.2 Lý thuyết điều khiển tối ưu các hệ tuyến tính với phiếm hàm dạng toàn phương (Linear Quadratic Regulator – LQR)
Trong phần này chúng ta sẽ xem xét phương pháp xây dựng bài toán tổng hợp các hệ tuyến tính với chỉ tiêu chất lượng dạng toàn phương Theo TLTK [1]
3.2.1 Ổn định Lyapunov đối với hệ thống tuyến tính
Tiêu chuẩn ổn định thứ hai của Lyapunov (điều kiện đủ)
Xét hệ thống được mô tả bởi phương trình trạng thái:
Nếu tìm được một hàm V(x) với mọi biến trạng thái x x1, 2, ,x n là một
hàm xác định dấu dương, sao cho đạo hàm của nó dV( )
T
Trang 12Với Q là ma trận vuông xác định dương
Chọn hàm năng lượng V(x) xác định dương:
Do V(x) xác định dương, nên để hệ thống ổn định thì V x( ) phải xác định
âm Ta chọn V( )x x QxT (do Q là ma trận xác định dương nên V x( ) sẽ là xác định âm)
Q A SSAS (3.17) Điều kiện cần và đủ để trạng thái cân bằng x0 ổn định tiệm cận: cho
trước bất kỳ một ma trận xác định dương Q và ma trận A ổn định, tồn tại một
ma trận xác định dương S thỏa mãn phương trình:
T
A S SA S Q
T
Phương trình (3.18) được gọi là phương trình Lyapunov
Khi S không thay đổi theo thời gian S0, ta có phương trình đại số Lyapunov:
Trang 13Chỉ tiêu chất lượng J được tính như sau:
0 0
1
( ) ( ) (0) (0)2
T
3.2.2 Điều khiển tối ưu hệ tuyến tính với chỉ tiêu chất lượng dạng toàn
phương – Phương trình Ricati đối với hệ liên tục
Trong đó Q là ma trận xác định dương (hoặc bán xác định dương), R là
ma trận xác định dương Chú ý: thành phần thứ hai ở phần bên phải phương trình (3.23) xác định lượng năng lượng tiêu tốn của tín hiệu điều khiển
Chúng ta sẽ chứng minh luật điều khiển tuyến tính cho bởi phương trình
(3.22) là luật điều khiển tối ưu Khi đó, nếu ma trận K được xác định để tối
thiểu hoá chỉ tiêu chất lượng J thì luật điều khiển u(t) sẽ tối ưu với mọi trạng
thái ban đầu x(0)
Trang 15Theo tiêu chuẩn ổn định thứ hai của Lyapunov, nếu ma trận (A-BK) ổn
định thì sẽ tồn tại một ma trận xác định dương S thoả mãn phương trình
1 1 1
Trang 16Phương trình (3.30) cho ta ma trận tối ưu K Như vậy, luật điều khiển tối
ưu cho bài toán điều khiển tối ưu dạng toàn phương với chỉ tiêu chất lượng cho bởi phương trình (3.30) là tuyến tính và có dạng:
Phương trình (3.32) được gọi là phương trình Riccati
Khi S không thay đổi theo thời gian S 0, ta có phương trình đại số
Riccati (ARE: Algebraic Riccati Equation ):
1
0
3.2.3 Các bước giải bài toán toàn phương tuyến tính
Bước 1: Thành lập hệ phương trình trạng thái:
Bước 2: Xác định ma trận trọng lượng Q, R từ chỉ tiêu chất lượng J cho
dưới dạng toàn phương tuyến tính
Trang 17Bước 4: Chỉ tiêu chất lượng tối ưu đối với hệ dừng:
Bước 5: Luật điều khiển tối ưu: u R B Sx 1 T
3.3 Lý thuyết điều khiển thích nghi thuật toán hàm Gauss sử dụng hàm Lyapunov
3.3.1 Đối tượng phi tuyến và khái niệm về điều khiển thích nghi
Các đối tượng trên thực tế đa phần là đối tượng phi tuyến tính Tùy theo điều kiện và chế độ làm việc của đối tượng mà đặc tính của chúng luôn thay đổi theo thời gian Khi nghiên cứu đối tượng phi tuyến người ta thường xấp xỉ hóa (hay tuyến tính hóa) chúng để từ đó thiết kế các hệ thống điều khiển cho đối tượng được mô tả bằng mô hình xấp xỉ đó Nhưng trong quá trình làm việc toàn bộ hệ thống bị tác động bởi nhiễu làm sai lệch các giá trị đo cũng như các giá trị điều khiển Khi đó một bộ điều khiển thông thường sẽ không duy trì được chất lượng điều khiển mong muốn mà cần phải có bộ điều khiển chất lượng cao hơn có khả năng điều chỉnh thông số điều khiển của chính nó
để đảm bảo được chất lượng điều khiển mong muốn trước những thay đổi bất định này Những bộ điều khiển như vậy được gọi là các bộ điều khiển thích nghi Theo TLTK [1]
Khái niệm chung về thích nghi được phát biểu như sau: “ Thích nghi là quá trình thay đổi thông số và cấu trúc hay tác động điều khiển trên cơ sở lượng thông tin có được trong quá trình làm việc với mục đích đạt được một trạng thái nhất định, thường là tối ưu khi thiếu lượng thông tin ban đầu cũng như khi điều kiện làm việc thay đổi ” Điều khiển thích nghi là tổng hợp các
kỹ thuật nhằm tự động chỉnh định các bộ điều chỉnh trong mạch điều khiển
Trang 18nhằm thực hiện hay duy trì ở mức độ nhất định chất lượng của hệ khi thông số của quá trình được điều khiển không biết trước hay thay đổi theo thời gian Trong thực tế hệ điều khiển thích nghi được sử dụng nhiều vì những ưu điểm của nó so với các bộ điều khiển thông thường Khả năng tự chỉnh lại các thông số của bộ điều khiển cho phù hợp với đối tượng bất định đã đưa hệ thích nghi trở thành một hệ điều khiển thông minh Hệ thống sẽ thích ứng tốt trước các yếu tố nhiễu và những biến động của đối tượng
Các hệ thống thích nghi như: hệ hoạch định độ lợi (Gain Scheduling), hệ
tự chỉnh định STR (hệ thích nghi gián tiếp), hệ MRAS (hệ thích nghi trực tiếp
có sử dụng mô hình tham chiếu)… Trong phần này chúng tôi giới thiệu về cơ
sở lý thuyết điều khiển thích nghi trực tiếp thuật toán hàm Gauss dùng cho đối tượng phi tuyến có các thông số được cập nhật theo luật thích nghi dựa trên lý thuyết ổn định của Lyapunov
Khi thiết kế các hệ điều khiển, thông thường phải dựa trên nguyên tắc đã xác định được mô hình toán học của đối tượng Từ mô hình toán học của đối tượng và các yêu cầu của quá trình điều khiển, hoàn toàn có thể lựa chọn và tính toán được bộ điều khiển phù hợp Điều đó chỉ đúng với các đối tượng có thông số, đặc tính không thay đổi trong suốt quá trình hoạt động Tuy nhiên, kinh nghiệm cho thấy trong thực tế thông số của đối tượng thường thay đổi không dự đoán trước được do ảnh hưởng của điều kiện làm việc Do đó nếu không liên tục thay đổi tham số của bộ điều khiển cho phù hợp với điều kiện làm việc thì hệ thống với bộ điều khiển thiết kế ban đầu khó có thể đáp ứng được yêu cầu chất lượng
Trang 19Hình 3.2 Sơ đồ khối hệ thống điều khiển thích nghi
Hệ thống điều khiển mà thông số và cấu trúc của bộ điều khiển thay đổi trong quá trình vận hành nhằm giữ vững chất lượng điều khiển của hệ thống khi có sự hiện diện của các yếu tố bất định gọi là hệ thống điều khiển thích nghi
Do các yếu tố bất định xuất hiện trong nhiều bài toán điều khiển thực tế, nên điều khiển thích nghi rất hữu ích trong nhiều lĩnh vực công nghiệp Hình 3.2 là sơ đồ khối tổng quát của hệ thống điều khiển thích nghi bao gồm: thiết
bị nhận dạng, khâu chỉnh định và bộ điều khiển trực tiếp điều khiển đối tượng
3.3.2 Hệ thống thích nghi sử dụng mô hình tham chiếu – MRAS
Hệ thống thích nghi sử dụng mô hình chuẩn MRAS (Model Reference Adaptive System) là một trong những phương pháp chính của điều khiển thích nghi Hệ thống MRAS là hệ thống điều khiển thích nghi trực tiếp Hình
vẽ 3.3 trình bày cấu trúc hệ thống MRAS
Thông số của bộ điều khiển được xác định dựa vào sai số ( )t m( )t ( )t
e x x Trong đó xm( )t là tín hiệu mong muốn thu được từ mô hình chuẩn (mô hình tham chiếu) và x( )t là tín hiệu thực Hệ thống có hai
Điều kiện
làm việc
Chỉnh định
u(t)e(t)
Nhận dạng
Trang 20vòng hồi tiếp: vòng hồi tiếp trong là vòng hồi tiếp thông thường và vòng hồi tiếp bên ngoài hiệu chỉnh tham số cho vòng hồi tiếp bên trong Vòng hồi tiếp bên trong được giả sử nhanh hơn vòng hồi tiếp bên ngoài Như vậy tham số của bộ điều khiển được chỉnh định bởi vòng ngoài sao cho sai số e( )t đạt giá trị cực tiểu
Hình 3.3 Sơ đồ khối hệ thống thích nghi MRAS
Có ba phương pháp cơ bản để phân tích và thiết kế hệ MRAS đó là phương pháp tiếp cận gradient, hàm Lyapunov và lý thuyết bị động
Phương pháp gradient được dùng bởi Whitaker đầu tiên cho hệ MRAS Phương pháp này dựa vào giả sử tham số của bộ hiệu chỉnh thay đổi chậm hơn các biến khác của hệ thống và thừa nhận có sự ổn định giả cần thiết cho việc tính toán độ nhạy và cho cơ cấu hiệu chỉnh thích nghi Phương pháp tiếp cận gradient không cho kết quả cần thiết cho hệ thống kín ổn định Phương pháp lý thuyết bị động được dùng để bổ sung cho cơ cấu thích nghi Phương pháp tiếp cận hàm Lyapunov tỏ ra hiệu quả để phân tích và thiết kế hệ MRAS đặc biệt là đối với hệ phi tuyến là hệ thống kín Hệ thống khi hoạt động sẽ bị ảnh hưởng bởi nhiễu Thuật toán hàm Gauss được đưa vào để giảm nhiễu và tăng chất lượng điều khiển cho cơ cấu hiệu chỉnh thích nghi Trong phần sau
Bộ điều khiển Đối tượng
Cơ cấu hiệu chỉnh
Trang 21chúng tôi sẽ trình bày phương pháp điều khiển thích nghi trực tiếp MRAS thuật toán hàm Gauss dùng phương pháp tiếp cận hàm Lyapunov để điều khiển đối tượng phi tuyến là hệ thống kín
3.3.3 Hệ thống điều khiển thích nghi trực tiếp thuật toán hàm Gauss sử
dụng hàm Lyapunov
Phương pháp tiếp cận hàm Lyapunov mà chúng ta áp dụng cho hệ thống điều khiển thích nghi trực tiếp MRAS là phương pháp thứ hai của Lyapunov được minh họa bằng đồ thị như hình 3.4 Trong đó hình 3.4 (a), 3.4 (b) và 3.4 (c) biểu diễn các trạng thái cân bằng và những đường cong tiêu biểu tương ứng đối với hệ thống ổn định, hệ thống ổn định tiệm cận và hệ thống không
ổn định Trong hình 3.4 vùng S() giới hạn cho trạng thái ban đầu x 0 và vùng S() tương ứng với giới hạn cho quỹ đạo xuất phát tại x 0
(a) (b) (c)
Hình 3.4 (a) Trạng thái cân bằng ổn định
(b) Trạng thái cân bằng tiệm cận
(c) Trạng thái cân bằng không ổn định
Chú ý là trong hình 3.4 (c), đường cong rời vùng S() và dẫn đến trạng
thái cân bằng không ổn định Tuy nhiên ta không thể nói rằng đường cong sẽ
S() S()
x 0
S() S()
x 0
S() S()
x 0