Trong bμi tốn điều khiển thích nghi vμ điều khiển bền vững, phơng
pháp điều khiển trợt vẫn thờng đợc biết đến nh một công cụ hữu hiệu vμ đơn giản để giải quyết bμi toán. Mục nμy ta sẽ lμm quen với phơng pháp điều
khiển thích nghi vμ bền vững đơn giản nμy.
IV.1 Xuất phát điểm của ph−ơng pháp điều khiển tr−ợt
Xét hệ cho trong hình 4.1a. Từ sơ đồ khối của hệ cũng nh hμm truyền đạt của các khâu tuyến tính, ta có ngay khi w = 0 :
x dx x2 với dx x2 với x = 1 và y = x = - e ⇒s = - kx – x = dt u x 1 1 2 Trong đó 2 1 u = − 1 khi khi s = −kx1 − x2 > 0 s = −kx1 − x2 < 0 Hình 4.1
1
Bây giờ ta sẽ khảo sát tính chất động học của hệ bằng phơng pháp mặt
phẳng pha (không gian trạng thái với hai biến trạng thái). Căn cứ vμo mơ hình
tốn học trên ta xác định đợc mặt phẳng pha sẽ phải lμ mặt phẳng với hai trục
tọa độ x1 vμ x2. Phân chia mặt phẳng pha nμy thμnh hai miền điểm bởi đờng
thẳng P (gọi lμ đờng chuyển đổi):
k x1+ x2= 0 (4.1)
(hình 4.1b) thì nửa mặt phẳng pha phía trên đờng thẳng sẽ lμ nửa mμ ở đó có
u = -1 vμ phía dới lμ nửa ứng với u = 1 . Khi u = - 1 thì
d x =x2 ⇒ dx1 =− ⇒ = − 2 + (4.2) dt − x2 dx2 x1 x2 c1
trong đó c1 lμ hằng số phụ thuộc vμo giá trị đầu, nên quỹ đạo pha (quỹ đạo
trạng thái tự do), tức lμ đồ thị của (4.2) cho những giá trị c1 khác nhau có dạng
parabol vμ đợc biểu diễn trong hình 4.1b bằng đờng nét liền. Chiều của các
parabol nμy đợc xác định từ điều hiển nhiên rằng khi x2> 0 thì x1 phải có xu
hớng tăng. Tơng tự, khi u = 1 thì:
d x =x2 ⇒ dx1 = ⇒ = 2 + (4.3) dt 1 x2 x1 dx x2 c1 2
với c2 cũng lμ hằng số phụ thuộc vμo giá trị đầu. Do đó quỹ đạo pha (quỹ đạo
trạng thái tự do) của hệ ở nửa trên đờng thẳng P ứng với những giá trị c2
khác nhau có dạng parabol (4.3) vμ đợc biểu diễn trong hình 4.1b bằng
đờng nét rời.
Bây giờ ta đã có thể xây dựng một quỹ đạo pha đi từ điểm đầu tuỳ ý
nhng cho trớc trong mặt phẳng pha. Chẳng hạn đó lμ điểm A nh ở hình
4.1c. Do điểm A nμy nằm ở phần mặt phẳng pha phía trên đờng chuyển đổi P
(có u = -1 ) nên quỹ đạo pha đi qua nó có dạng (4.2) phải đi theo đờng
parabol nét liền . Dọc theo đờng nét liền đó cho tới khi gặp đờng thẳng P phân chia hai miền điểm, tức lμ đến điểm B, thì quỹ đạo pha sẽ phải chuyển
pha có u = 1 .
Theo đờng parabol nét rời, quỹ đạo pha đi từ B tới điểm C lμ điểm gặp đờng chuyển đổi P thì lại chuyển sang đờng parabol nét liền (4.2)…. Cứ
theo nguyên lý chuyển từ đờng parabol nét liền sang đờng parabol nét rời vμ từ parabol nét rời lại trở về parabol nét liền … mỗi khi gặp đờng chuyển đổi P, ta xây dựng đợc hoμn chỉnh quỹ đạo pha của hệ đi từ điểm xuất phát A nh ở hình 4.1c mơ tả.
Từ dạng quỹ đạo pha dần có xu hớng tiến về gốc tọa độ vμ kết thúc tại
đó, ta rút ra đợc những kết luận sau về chất lợng của hệ thống:
- Hệ có một điểm cân bằng lμ gốc tọa độ trong mặt phẳng pha (x1, x2). - Hệ khơng có dao động điều hịa, khơng có hiện tợng hỗn loạn.
- Hệ ổn định tại gốc tọa độ.
- Hệ có miền ổn định O lμ toμn bộ mặt phẳng pha (ổn định toμn cục).
Ngoμi các kết luận trên, ở hệ đang xét cịn có một hiện tợng rất đặc trng có tên gọi lμ hiện tợng trợt (sliding) hay còn gọi lμ hiện tợng rung
(chattering). Hiện tợng nμy xuất hiện khi mμ quỹ đạo pha đi vμo phần đờng phân điểm P mμ ở đó đờng parabol nét rời sẽ khơng cịn nằm phía dới của P cũng nh parabol nét liền không cịn nằm phía trên P. Nó chính lμ đoạn
thẳng trên P nằm giữa điểm tiếp xúc E của P với parabol nét liền (4.2) vμ
điểm tiếp xúc F của P với parabol nét rời (4.3) - hình 4.2a.
n
Xét đoạn quỹ đạo pha ξ đang đi theo parabol nét liền (hình 4.2b) thì gặp
đờng chuyển đổi P nằm trong khoảng EF (đợc gọi lμ khoảng trợt). Khi đó nó sẽ chuyển sang đờng parabol nét rời. Song đoạn đờng parabol nét rời nμy lại
nằm trong phần mặt phẳng pha ứng với đờng parabol nét liền nên ngay sau khi chuyển sang đờng parabol nét rời, quỹ đạo pha lại phải chuyển sang
đờng parabol nét liền. Theo đờng parabol nét liền nó quay trở về đờng phân điểm P vμ gặp lại đờng P tại một điểm khác cũng trong khoảng trợt
EF nhng gần gốc tọa độ hơn. Từ đây nó lại phải chuyển sang đờng parabol nét rời …. Cứ nh vậy quỹ đạo pha chuyển động zick - zack xung quanh
đờng P để tiến về gốc tọa độ (hiện tợng rung).
Nếu nh khâu phi tuyến hai vị trí cho phép chuyển đổi từ 1 sang 1 vμ ngợc lại trong khoảng thời gian gần bằng 0 thì đoạn quỹ đạo pha zick zack trên
sẽ có dạng trợt trơn về gốc tọa độ dọc theo đoạn EF . Hiện tợng trợt
(sliding) sẽ trơn chỉ khi thời gian chuyển đổi bằng 0.
Độ dốc của đờng chuyển đổi P quy định độ dμi cho khoảng trợt EF . Thơng qua tham số k ta có thể thay đổi độ dốc của P. Đờng P có độ dốc
cμng lớn, khoảng trợt EF sẽ cμng dμi lμm cho hiện tợng trợt trong hệ xảy ra cμng lâu.
Hiện tợng trợt (sliding mode) trong hệ vừa xét lμ một gợi ý cho việc
thiết kế bộ điều khiển sử dụng khâu hai vị trí nhằm lμm ổn định tuyệt đối đối
tợng theo nguyên tắc trợt về gốc tọa độ.
IV.2 Thiết kế bộ điều khiển tr−ợt ổn định bền vững
Cho đối tợng điều khiển phi tuyến có mơ hình vμo (tín hiệu u) vμ ra
(tín hiệu ra y):
d y
= f y, ,....,dy dn−1y
+ u
dt n dt dt n−1
1 2 n
f ≤δ ≤∞ (4.4)
∞
Nhiệm vụ điều khiển đợc đặt ra ở đây lμ phải thiết kế một bộ điều khiển phản hồi tín hiệu ra y sao cho hệ kín thu đợc lμ GAS. Nếu so sánh với trờng hợp đã xét ở trên thì vị trí đối tợng tuyến tính S ( s) trong hình 4.1a
nay đợc thay bằng đối tợng phi tuyến có mơ hình vμo/ra cho ở trên vμ ta phải tìm bộ điều khiển tơng tự nh ở hình 4.1a:
u = sgn(s)= sgn ke + de
, e = − y
nhng cho đối tợng phi tuyến nμy
dy dt d n−1 y Đặt x1 = y, x2 = ,...., dt xn =
dt n−1 ta sẽ có từ mơ hình vào/ra của đối t•ợng đã cho ph•ơng trình trạng thái t•ơng đ•ơng nh• sau:
dxi dt = xi +1 voi 1 ≤ i ≤ n − 1 dx n = f (x )+ u (4.5) dt y = x1
trong đó x= ( x , x , … , x )T. Nhiệm vụ điều khiển bây giờ lμ phải tìm bộ
điều khiển phản hồi tín hiệu ra y để với nó vμ khi w= 0 hệ kín ở hình 4.3
ln có x( t) →0 .
Định lý 4.1 (Điều khiển ổn định bền vững nhờ bộ điều khiển trợt): Nếu đối
tợng phi tuyến mơ tả bởi mơ hình trạng thái (4.5) thỏa mãn điều kiện
bị chặn (4.4) thì ln tồn tại bộ điều khiển phản hồi tín hiệu ra (hình 4.3) khơng phụ thuộc hμm f của mơ hình đối tợng (nên nó một bộ
điều khiển bền vững): u = ( k + δ) sgn(s ) với k> 0 tùy chọn (4.6) trong đó s(e) = a0 e + a1de+ ... + a n−2 dt d n−2 e+ dt n−2 d n−1e dt n−1 n−1 = ∑ ai i =1 d i e , dt i an−1 = 1 (4.7)
0 1 n−2
có các hằng số a0, a1, ...., an-2 đ•ợc chọn để đa thức
p(λ )= a + a λ + ... + a λn−2
+λn−1 (4.8)
là Hurwitz sao cho sau một khoảng thời gian T hữu hạn ln có
lim x (t ) = 0 t →∞ khi ω = 0 va t > T (4.9) ω e Bộ điều khiển tr•ợt (4.6) _ Đối t•ợng y (4.5) Hình 4.3 Minh hoạ định lý 1 Chứng minh: Rõ ràng, do có e = x1 và bộ điều khiển t•ơng đ•ơng với:
d i
−1e xi =
i −1
dt
, 2 ≤ i ≤ n nên nhiệm vụ (4.9) trên của
lim
T ≤t →∞
d i e= 0
dt với 0≤ i≤ n -1 và ω = 0 (4.10)
Xét hμm s ( e) định nghĩa bởi (5.165). Khi đó, để nghiệm e ( t) của
phơng trình vi phân tuyến tính tham số hằng s( e ) = 0 thỏa mãn (4.10), thì
cần vμ đủ lμ đa thức đặc tính (4.8) của nó lμ đa thức Hurwitz (có tất cả các
nghiệm λ1, λ2, … , λn-1 nằm bên trái trục ảo). Do đó trong trờng hợp phơng trình vi phân s( e ) = 0 có đa thức đặc tính p(λ) lμ đa thức Hurwitz thì
nhiệm vụ (4.10) của bộ điều khiển ổn định sẽ đợc thay bằng nhiệm vụ đơn
giản hơn lμ:
s(e) → 0 ⇔ s(e) ds < 0
dt (4.11)
Mục tiêu (4.11) phải đạt đợc của bộ điều khiển đợc gọi lμ điều kiện trợt (sliling condition) vμ hμm s(e) định nghĩa bởi (4.7) có đa thức đặc tính
Bây giờ ta sẽ tiến hμnh thiết kế bộ điều khiển phản hồi tín hiệu ra y thỏa
mãn điều kiện trợt (4.11).
Với mặt trợt cho theo công thức (4.7) vμ mơ hình (4.5) của đối tợng
điều khiển ta suy ra đợc từ điều kiện trợt (4.11):
ds(e) dt n −1 = ∑ aid i +1e dt i +1 n −2 = −∑ ai xi + 2 − dxn dt i =0 n −2 i =0 = −∑ i =0ai xi + 2− f (x ) − u = > 0 < 0 neu neu s < 0 s > 0 n−2 < −∑ ai xi +2 − f (x ) neu s < 0 ⇔ u = n−2i =0 (4.12) >−∑ ai xi + 2 − f (x ) neu s > 0 i =0
Kết hợp thêm với giả thiết (4.4) thì đủ để có đợc (4.12) lμ:
n − 2 < −∑ ai xi + 2 − δ neu s < 0 u = n − 2i =0 (4.13) >−∑ ai xi + 2 + δ neu s > 0 i =0
Rõ rμng bộ điều khiển (4.13) hoμn toμn khơng phụ thuộc vμo mơ hình
(4.5) của đối tợng điều khiển, nên nó chính lμ bộ điều khiển bền vững.
Vấn đề còn lại lμ xác định một bộ điều khiển phản hồi đầu ra y thỏa mãn (4.13).
Xét bộ điều khiển phản hồi đầu ra y (5.164) ứng với w= 0 . Trớc tiên ta giả sử s > 0 . Khi đó sẽ có u=(k+ δ) vμ từ mơ hình (4.5) cũng nh giả thiết (4.4) ta đợc dxn > k . Điều này chỉ rằng phải tồn tại T
dt 1
dxn−1
hữu hạn để có xn > 0 khi t > T1. Tiếp tục, do có
dt = xn > 0 khi t > T1 nên cũng phải tồn tại T2 để
n−2 ∑ ai xi + 2 > 0 i =0 n−2 ⇒ k + δ > −∑ ai xi +2 + δ i =0
vμ do đó bộ điều khiển phản hồi đầu ra (4.6) thỏa mãn điều kiện (4.13), ít nhất lμ khi t > T . Lý luận tơng tự cho trờng hợp s < 0 ta cũng thấy (4.6) sẽ thỏa
mãn (4.13) khi t > T . Vậy trong cả hai trờng hợp s > 0 vμ s < 0 ln tồn tại
T hữu hạn sao cho khi có t > T bộ điều khiển phản hồi đầu ra (4.6) sẽ thỏa mãn điều kiện đủ (4.13) của điều kiện trợt vμ do đó nó lμm đối tợng (4.5) ổn định tiệm cận theo nghĩa (4.9).
Chú ý: Về nội dung định lý 4.1 ta có vμi điều bμn thêm nh sau:
- Bộ điều khiển trợt (4.6) chỉ có nhiệm vụ lμm cho cho s ( e) →0 , nói cách khác nó chỉ có nhiệm vụ đa quỹ đạo trạng thái tự do x( t ) của hệ
kín về tới mặt trợt s( e) = 0 . Khi đã về tới mặt trợt, quỹ đạo trạng thái tự
do x( t ) của hệ kín sẽ tự trợt về gốc tọa độ.
- Khi hằng số k của bộ điều khiển (4.6) đợc chọn cμng lớn, thời gian T
sẽ cμng nhỏ, vμ do đó tốc độ s ( e) →0 cμng cao, hay quỹ đạo trạng thái
tự do x( t) của hệ kín cμng tiến nhanh về mặt trợt s( e ) = 0 .
- Khi đa thức đặc tính p( λ) của phơng trình vi phân s( e ) = 0 có các nghiệm λ1, λ2, … , λn-1 nằm cμng xa trục ảo về phái trái, quỹ đạo
trạng thái tự do x( t ) của hệ kín cμng trợt nhanh trên mặt trợt về gốc
tọa độ. Ta có thể xác định các hệ số a0, a1, … , an-2 cho mặt trợt
(4.7) từ nghiệm λ1, λ2, … , λn-1 chọn trớc của phơng trình vi phân
s ( e ) = 0 nh sau:
(λ − λ1 )(λ − λ2)......(λ − λn−1) = a0+ a1λ + ... +
a
n−2λn−2 +λn−1
- Các bộ điều khiển trợt mang tính bền vững rất cao, song chúng lại có
chung một nhợc điểm chính lμ tạo ra hiện tợng rung (chattering) trong hệ. Các cơng trình nghiên cứu gần đây về điều khiển trợt thờng
2
- Với những bμi tốn mμ ở đó đối tợng điều khiển (4.5) khơng thỏa mãn điều kiện (4.4) thì để điều khiển GAS đối tợng, ta có thể thay vμo vị trí bộ điều khiển phản hồi tín hiệu ra (4.6) bất cứ một bộ điều khiển phản hồi trạng thái nμo khác thỏa mãn điều kiện (4.12). Tuy nhiên bộ điều khiển đó sẽ phụ thuộc vμo độ chính xác của mơ hình đối tợng (phụ thuộc vμo hμm f ) vμ do đó tính bền vững của nó cũng sẽ mất.
- Trong trờng hợp điều kiện rμng buộc (4.4) không đợc thỏa mãn, song ta lại tìm đợc một hμm à( x) nμo đó lμ hμm chặn trên của f ( x ) theo nghĩa:
f (x ) ≤ à (x ), ∀x
thì ta lại vẫn có đợc bộ điều khiển GAS bền vững phản hồi trạng thái, đó lμ những bộ điều khiển thỏa mãn điều kiện đủ, đợc suy ra từ (4.12) nh sau: n−2 < −∑ ai xi +2 − à (x ) neu s < 0 u = n−2i =0 >−∑ ai xi +2 + f (x ) neu s > 0 chẳng hạn nh: i =0 u = [k + à(x )]sgn(s) với k> 0 tuỳ chọn
Hơn nữa, nếu hμm à( x) chỉ phụ thuộcx1=y thì bộ điều khiển trên trở
thμnh bộ điều khiển bền vững phản hồi đầu ra.
Ví dụ: Minh họa điều khiển bền vững bằng bộ điều khiển trợt
Xét đối tợng mô tả bởi:
d 3 y dy dy d 2 y dt 3 = e − y + + 1 − dt − 1 + sin dt dt 2 + u (4.14) dy d 2 y f y , , dt dt
Đối tợng trên có mơ hình thỏa mãn (4.4) mμ cụ thể lμ f ≤ δ = 4
2
3
nên nó điều khiển ổn định đợc theo nghĩa (4.9) bằng bộ điều khiển phản hồi đầu ra (4.6). Chọn trớc các nghiệm λ1, λ2 nằm đủ xa về phía trái trục ảo (để
quỹ đạo trạng thái tự do khi đã về đến mặt trợt s( e ) = 0 sẽ trợt đủ nhanh về gốc tọa độ), chẳng hạn nh λ1= λ2= - 4 ta sẽ có a0= 16, a1= 8 . Suy ra:
u =[k + 4]sgn(s) vớis = 16e + 8 de +d evà k > 0 tuỳ chọn (4.15)
dt dt 2
Hằng số k trong bộ điều khiển (4.15) đợc chọn cμng lớn, tốc độ tiến về
mặt trợt s ( e) = 0 của quỹ đạo trạng thái tự do x ( t) sẽ cμng cao. Ngoμi ra, do bộ điều khiển (4.15) khơng phụ thuộc hμm f của mơ hình đối tợng (4.12) đã cho nên nó cũng điều khiển ổn định đợc theo nghĩa (4.9) cho tất cả các
đối tợng phi tuyến khác:
d y
= f y, ,dy d 2y
+ u
dt 3 dt dt 2
nếu nh những đối tợng nμy có hμm f thỏa mãn f ≤ 4.
∞
IV.3 Thiết kế bộ điều khiển tr−ợt bám bền
vững
Dựa theo nội dung định lý 4.1, đặc biệt lμ phần chứng minh của nó ta dễ
dμng suy ra đợc cơng thức của bộ điều khiển bám bền vững phản hồi tín hiệu ra, tức lμ bộ điều khiển lμm cho tín hiệu ra y( t ) của hệ bám theo đợc tín
hiệu mẫu w( t ) cho trớc theo nghĩa (tracking control):
lim ω(t ) − y(t ) =
0
t →∞
Định lý 4.2 (Điều khiển bám ổn định bền vững nhờ bộ điều khiển tr−ợt):
Xét đối tợng phi tuyến (4.5) thỏa mãn điều kiện (4.4). Gọi w ( t) lμ tín hiệu
mẫu, hμm s ( e) định nghĩa bởi (4.7) lμ mặt trợt vμ phơng trình vi phân s( e)
= 0 có đa thức đặc tính (4.8) lμ đa thức Hurwitz. Ký hiệu
q(t ) = a ω+ a dω + ... + a d n−2ω + dn−1ω 0 1 dt n−2 dt n−2 dt n−1
khiển bám bền vững bằng bộ điều khiển phản hồi đầu ra:
u = ( k+ δ + σ) sgn( s) với k> 0 tùy chọn. (4.16)
Chứng minh:
Tơng tự nh phần chứng minh của định lý 4.1, nhng thay vì e= - y, ở đây ta có e =w - y . Bởi vậy điều kiện đủ (4.13) cũng sẽ đợc thay bằng:
n−2 < −∑ ai xi + 2 − q(t ) − δ neu s < 0 u = n−2i =0 >−∑ ai xi + 2 − q(t ) +