Trong phương pháp điều khiển này, các giá trị x , x, q và q đều phải được
đo. Nếu thực hiện đo giá trị của x , và x là gián tiếp thì bộ điều khiển phải tính các hàm động học trực tiếp k q và J qA online. Sự hạn chế của của phương pháp điều khiển này cần sự tính tốn của ma trận thành phần quán tính, thành phần ly tâm, Coriolis thể hiện trong phương trình (1.4). Các thành phần này phải được tính online khi mà sự điều khiển dựa trên sự phản hồi phi tuyến của trạng thái hiện tại của hệ thống và khơng thể tính tốn trước offline các thành phần này. Một đặc điểm khác của việc thực hiện luật điều khiển động lực học đảo là yêu cầu các tham số của mơ hình động lực học hệ thống phải được biết một cách chính xác và các phương trình của chuyển động phải được tính trong thời gian thực. Tuy nhiên, các yêu cầu này rất khó thực hiện trong thực tế. Mặt khác, các mơ hình động lực học của tay máy Robot có thể khơng được xác định một cách chính xác do các tham số của tay máy Robot không được biết trước hoặc sự phụ thuộc của mơ hình động lực học vào tải trọng đặt lên điểm tác động cuối của tay máy Robot thay đổi. Từ các đặc điểm trên dẫn đến chất lượng của bộ điều khiển động lực đảo không đạt được kết quả tốt do không thể bù hiệu quả cho cả trường hợp khi không chắc chắn về
mơ hình động lực học và trường hợp thực hiện việc tính tốn xấp xỉ động lực học đảo. Có hai phương pháp điều khiển được đưa ra để khắc phục nhược điểm của sự bù không hiệu quả này là sử dụng phương pháp điều khiển bền vững và điều khiển thích nghi được mô tả chi tiết trong [35].
Qua phân tích các phương pháp điều khiển PD bù trọng trường, PID, động lực học đảo cho thấy, các phương pháp này chỉ điều khiển được quỹ đạo vị trí điểm tác động cuối của tay máy Robot bám theo một quỹ đạo mong muốn. Vì vậy, các phương pháp điều khiển này không thể thực hiện điều khiển được đồng thời quỹ đạo vị trí và lực cho tay máy Robot mà yêu cầu nghiên cứu của luận án đưa ra.
1.2.2. Điều khiển lực tay máy Robot
Nội dung chính trong điều khiển lực tay máy Robot là đưa ra các luật điều khiển để điều khiển vị trí điểm tác động cuối tay máy Robot vừa bám theo một quỹ đạo mong muốn vừa đảm bảo lực tương tác giữa điểm tác động cuối với môi trường bám theo một lực mong muốn. Các phương pháp điều khiển lực được chia ra làm ba phương pháp chính và được phân tích như sau.
1.2.2.1. Điều khiển độ cứng
Điều khiển độ cứng bao gồm hai phương pháp là thụ động và tích cực.
1 J q 1 J q x x + + - + d x T J q x Kp F K F KE , N q q - - v K - xE - x p Hình 1.7. Điều khiển độ cứng tích cực
tương ứng với một thiết bị máy gồm các lị xo. Điều khiển độ cứng tích cực [31, 36, 37] có thể được xem như một lị xo có thể thay đổi được với một lực phản hồi độ cứng của hệ thống vịng lập kín được thay đổi. Hình 1.7 mơ tả sơ đồ của một bộ điều khiển độ cứng tích cực. Trong sơ đồ điều khiển thể hiện trong hình 1.7, thành phần p là véc tơ của đầu vào điều khiển để các khớp được kết hợp với điều khiển độ cứng, N q, q là véc tơ bù tiền định phi tuyến
của thành phần lực trọng trường và Coriolis, là véc tơ của tổng các mô men hoặc lực đầu vào điều khiển, xE là véc tơ vị trí của mơi trường được tương tác, KE là độ cứng của môi trường, F là véc tơ của lực tương tác thu được trong không gian tổng thể. Kp và Kv là các hệ số của bộ điều khiển, thông thường được chọn là các ma trận đường chéo, KF là ma trận thuận để hiệu chỉnh điều khiển vị trí. Đối với một tay máy Robot đủ bậc xét trong không gian ba chiều thì chiều của các véc tơ này là 6 1 và ma trận là 6 6 . Sơ đồ điều khiển trong hình 1.7 được chia làm hai phần. Phần 1 là bộ điều khiển và phần 2 là hệ thống cơ bản của tay máy Robot. Phần 2 bao gồm động lực học của tay máy Robot và môi trường tương tác của nó, phản hồi vận tốc và bù phi tuyến cho tuyến tính hóa hệ thống động lực học Robot. Vòng lập điều khiển độ cứng bao gồm một vòng phản hồi tỷ lệ của lực và vị trí (phần 1) xác định momen khớp p của tổng momen khớp do lực tương tác gây ra. Giá trị p được xác định từ phương trình sau:
p Kp q
(1.60)
Trong đó, K thể hiện độ cứng của môi trường. Phương pháp điều khiển độ p cứng cho phép đưa ra một độ cứng bất kỳ bằng việc lựa chọn các giá trị khác nhau của ma trận K . Các chứng minh về tính ổn định của phương pháp điều p khiển độ cứng đã được nghiên cứu và phân tích chi tiết trong [38-40].
1.2.2.2. Điều khiển trở kháng
Nội dung của phương pháp điều khiển trở kháng là hệ thống điều khiển tay máy Robot được thiết kế không bám theo một quỹ đạo chuyển động mà là điều khiển trở kháng cơ học của tay máy Robot. Trong phương pháp này, mối quan hệ giữa vận tốc x và lực tác dụng được tính tốn thơng qua trở kháng cơ
học Zm như sau: m F t Z t X t (1.61)
Trong đó, X t , là vị trí điểm tác động cuối của tay máy Robot. Suy ra m
F s sX s Z s (1.62)
Trong trường hợp tuyến tính, một trở kháng mong muốn có thể được tính theo công thức như sau:
m
2
s s K
sZ s M D (1.63)
Trong đó, ma trận hệ số M, D và K thể hiện các giá trị mong muốn của quán tính, giảm chấn và độ cứng. Nhiệm vụ của phương pháp điều khiển trở kháng là đảm bảo các đáp ứng của hệ thống được điều khiển mô tả trong phương trình (1.61). v K x x + + - + d x x 2 F K F , N q q - E K - xE - p K 1 F K - d x + x + T J + T J pv - +
Hình 1.8. Sơ đồ phương pháp điều khiển trở kháng
sử dụng các tín hiệu đo lường khác nhau, cụ thể là vận tốc, vị trí hoặc lực. Hình1.8 mơ tả cấu trúc của vòng điều khiển trở kháng trên cơ sở thực hiện một giá trị thích hợp với Z sm . Trong phương pháp điều khiển này, từ một lực mong muốn, ta tính được giá trị vị trí và vận tốc mong muốn của điểm tác động cuối tay máy robot. Tương tự như vậy, giá trị lực phản hồi từ cảm biến cũng được quy đổi thành vị trí và vận tốc thơng qua hai hệ số KF1 và KF 2. Như vậy, thành phần sai lệch lực được biến đổi về sai lệch vị trí và sai lệch tốc độ và đưa vào bộ điều khiển.
Trong sơ đồ của phương pháp điều khiển trở kháng, một vòng phản hồi cho sự kết hợp của vận tốc và ảnh hưởng của lực tương tác được thêm vào. Trong trường hợp này, điều khiển trở kháng là một bộ điều khiển PD. Trong đó, lực phản hồi về bộ điều khiển tác động đến sự thay đổi của vị trí và vận tốc. Kết quả của của sự ảnh hưởng vị trí bắt nguồn từ thực hiện nhân lực phản hồi với ma trận KF1. Tương tự như vậy, kết quả của sự ảnh hưởng đến vận tốc bắt từ việc nhân các lực phản hồi với ma trận KF 2. Trong sơ đồ điều khiển, pv là một thành phần của momen điều khiển, monen này, bù lại sự sai lệch của vận tốc và vị trí do phản hồi của lực tương tác gây ra và được tính như sau:
T
pv J Kp x Kv x
(1.64)
Chứng minh tính ổn định của điều khiển trở kháng được phân tích trong [41].
1.2.2.3. Điều khiển lai vị trí/lực
Phương pháp điều khiển lai vị trí/lực là kết hợp thơng tin lực và momen với dữ liệu vị trí. Trong nghiên cứu [20], Không gian điều khiển được tách ra thành hai không gian làm việc trực giao với nhau. Trong điều khiển lai vị trí/lực, điều khiển vị trí và lực được xem như tách biệt được phân tích trong cơng trình [1]. Hình 1.9, thể hiện sơ đồ phương pháp điều khiển lai vị trí/lực. Trong sơ đồ trên, S là ma trận chọn, Sdiag s j với j1...n. Ma trận S
xác định không gian con cho khơng gian vị trí hoặc lực được điều khiển và s j được lựa chọn bằng 0 hoặc 1, khi sj0, thì khớp thứ j phải được điều khiển lực, nếu khơng thì phải được điều khiển vị trí.
x x + F xE + T J + E K x + d x + 1 J S T J IS + - - - d F + - p f
Hình 1.9. Sơ đồ phương pháp điều khiển lai vị trí/lực
Momen tổng điều khiển gồm hai thành phần như sau: p f
(1.65)
Trong đó, p và f là các momen thành phần tác động trong không gian con vị trí và lực. Như vậy, điều khiển vị trí và lực là đồng thời và các luật điều khiển là độc lập, vì vậy các yêu cầu thực hiện điều khiển khác nhau cho việc bám các quỹ đạo vị trí và lực được thực hiện đồng thời. Thơng thường, luật điều khiển lai lực/vị trí được mơ tả trong hình 1.9 gồm một luật điều khiển PD cho vị trí và một luật điều khiển PI cho lực. Như vậy, điều khiển vị trí sẽ đáp ứng nhanh hơn và điều khiển lực sẽ có sai lệch nhỏ hơn và tăng khả năng thực hiện. Các ứng dụng của tay máy Robot trong một số nhiệm vụ phức tạp gây ra một số khó khăn đối với điều khiển ví dụ như có các tham số động lực học không xác định, môi trường tương tác có cấu trúc khơng được mô tả bằng phương trình tốn học rõ ràng, các nhiễu tác động bên ngoài… Tuy nhiên, để thực hiện điều khiển trong các trường hợp động lực học khơng được mơ hình, nhiễu cảm biến và các nhiễu mở rộng cho tay máy Robot thì cần nghiên cứu
các thuật toán điều khiển lực nâng cao. Một trong những giải pháp đó là điều khiển bám chính xác lực mong muốn hoặc thực hiện điều khiển trong điều kiện các tham số không được biết và không chắc chắn của cả tay máy Robot và môi trường như điều khiển thích nghi sẽ được nghiên cứu trong nội dung chương 3 của luận án.
Qua phân tích các phương pháp điều khiển trong phần 1.2.2 cho thấy, tất cả các phương pháp điều khiển như điều khiển độ cứng, điều khiển trở kháng, điều khiển lai lực/vị trí đều thực hiện điều khiển được đồng thời quỹ đạo điểm tác động cuối và lực tương tác giữa điểm tác động cuối của tay máy Robot với môi trường. Tuy nhiên với yêu cầu điều khiển đưa ra trong nội dung nghiên cứu của luận án là điều khiển tay máy Robot làm việc trong điều kiện có sự bất định và thay đổi của các tham số động lực học thì các phương pháp điều khiển này không đáp ứng được. Mặc dù các phương pháp điều khiển thích nghi lực và điều khiển lực bền vững đáp ứng được yêu cầu điều khiển tay máy Robot trong điều kiện có sự thay đổi của các tham số động lực học. Tuy nhiên, hai bộ điều khiển này yêu cầu các đo lường về vị trí, tốc độ và lực. Trong khi đó, yêu cầu điều khiển trong nội dung nghiên cứu của luận án là giảm tối đa các đo lường và chỉ dùng duy nhất đo lường vị trí. Như vậy, phương pháp điều khiển thích nghi cho tay máy Robot cần được phát triển và bổ sung các bộ quan sát trạng thái.
1.3. Tổng quan về các bộ quan sát
Trong rất nhiều hệ thống thực tế, chúng ta không thể thực hiện được việc đo lường các véc tơ trạng thái. Đối với một số hệ thống vật lý việc đo lường các trạng thái của hệ thống yêu câu các thiết bị đo lường với giá thành cao và cũng có khi khơng thể đo được tất cả các biến trạng thái. Hơn nữa, trong một số hệ thống các thành phần xác định của véc tơ trạng thái tương ứng với các biến bên trong mà không thể truy cập được, vì vậy cũng khơng thể thực hiện
được việc đo lường. Trong tất cả các trường hợp như vậy đối với điều khiển hệ thống thì phương pháp điều khiển phải dựa vào các giá trị của của tập con của các biến trạng thái. Có hai giải pháp để giải quyết. Thứ nhất là xem xét trực tiếp các q trình cơng nghệ mới mà yêu cầu sự đo lường ít hơn và hạn chế việc lựa chọn các hàm phản hồi tĩnh hoặc giảm sự phức tạp của việc xử lý phản hồi động lực học hệ thống. Giải pháp thứ hai, đơn giản hơn là thực hiện việc xây dựng lại hoặc cấu trúc lại một cách xấp xỉ toàn bộ các véc tơ trạng thái dựa trên nền tảng của các đo lường mà có thể thực hiện được. Như vậy, bất kỳ một quá trình điều khiển tĩnh nào đã được thực hiện, thì sau đó có thể được thực hiện bằng sử dụng các trạng thái ước lượng này thay cho các trạng thái thực tế. Trong cách này, thì quá trình điều khiển sẽ đơn giản hơn và hiệu quả hơn. Một hệ thống có thể quan sát hồn tồn nếu với một sự quan sát của các đầu ra hệ thống, giá trị của trạng thái ban đầu có thể được xác định hoặc được tính tốn trong một khoảng thời gian hữu hạn. Như vậy, các trạng thái có thể được tính xấp xỉ bằng một bộ quan sát. Các giá trị đầu vào của bộ quan sát chính là các giá trị đo lường đầu ra từ hệ thống ban đầu và véc tơ trạng thái của bộ quan sát thu được chính là các véc tơ trạng thái của hệ thống ban đầu. Như vậy trong các bộ điều khiển, ta có thể sử dụng các véc tơ trạng thái của bộ quan sát này thay cho các véc tơ trạng thái của hệ thống để phản hồi về bộ điều khiển mà không cần đến việc đo lường các véc tơ trạng thái của hệ thống. Các bộ quan sát đã được nghiên cứa và ứng dụng rất nhiều như bộ quan sát Luenberger, quan sát bằng bộ lọc Kalman, bộ quan sát hệ số cao HGO và bộ quan sát GPI.
1.3.1. Bộ quan sát Luenberger
Phương pháp cơ bản nhất đối với việc ước lượng trang thái của một hệ thống xác định mà được mơ tả bởi phương trình sau:
Là cấu trúc lại phương trình trạng thái của hệ thống và được mô tả như sau:
ˆ ˆ
x t Ax t Bu t (1.67)
Véc tơ trạng thái của hệ thống x t trong phương trình (1.66) đưa ra một sự ước lượng trạng thái của véc tơ này là ˆx t trong phương trình (1.67). Nếu như trạng thái ban đầu của hệ cấu trúc lại mà bằng với trạng thái ban đầu của hệ, tức là ˆx 0 x 0 thì hệ cấu trúc lại sẽ đưa ra giá trị trạng thái giống như giá trị trạng thái của hệ ban đầu. Tuy nhiên, nếu như các trạng thái ban đầu của hệ cấu trúc lại không bằng với trạng thái ban đầu của hệ gốc thì sẽ tạo ra