1. Trang chủ
  2. » Luận Văn - Báo Cáo

Điều khiển hệ tay máy hai phía có ràng buộc holonomic chịu ảnh hưởng trễ thời gian

114 2 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 114
Dung lượng 1,26 MB

Cấu trúc

  • CHƯƠNG 1: TỔNG QUAN HỆBILATERALTELEOPERATION (12)
    • 1.1. Phầnmởđầu (12)
    • 1.2. Quá trình phát triểnhệteleoperation (17)
    • 1.3. CácphươngphápđiềukhiểnhệBilateralTeleoperation (19)
      • 1.3.1. Cácphươngphápdựatrênlýthuyếtthụđộng (19)
      • 1.3.2. Các phươngphápkhác (33)
    • 1.4. Ứng dụng củahệTeleoperation (42)
      • 1.4.1. Lĩnh vực khám phávũtrụ (42)
      • 1.4.2. Lĩnhvựchoạtđộngdướiđạidương (44)
      • 1.4.3. Lĩnh vực xử lý hóa chất độc hại,phóng xạ (44)
      • 1.4.4. Lĩnh vựcyhọc (46)
      • 1.4.5. Lĩnh vựcquânsự (47)
  • CHƯƠNG 2: MÔ HÌNH HÓAHỆTHỐNG (50)
    • 2.1. Mô hình động lực học tay máy córàngbuộc (50)
    • 2.2. Mô hình trên không gian trạng thái của MastervàSlave (54)
    • 2.3. Mô hình hóamôitrường (58)
      • 2.3.1. Mô hìnhKenvil-Voigt (0)
      • 2.3.2. Mô hình Khối lƣợng-Lòxo-Giảmchấn (0)
      • 2.3.3. MôhìnhHunt-Crossley (59)
      • 2.3.4. Mô hìnhMaxwell (59)
      • 2.3.5. Mô hình tiêu chu n tuyến tínhđc (0)
    • 2.4. Mô hình Slave có tính đến tác động củamôitrường (60)
  • CHƯƠNG 3: ĐIỀU KHIỂN CHO HỆBILATERALTELEOPERATION (62)
    • 3.1. Về điều khiểntối ƣu (62)
      • 3.1.1. Phương phápbiếnphân (63)
      • 3.1.2. Điều khiển bám tối ƣu cho hệtuyếntính (0)
      • 3.1.3. Tính ổn định của bộ điều khiển bámtốiưu (69)
    • 3.2. Phương phápbiến sóng (69)
      • 3.2.1. Mô hình độnglựchọc (70)
      • 3.2.2. Bộ điều khiển và bộ tínhtoán (75)
    • 3.3. Điều khiểnthíchnghi (81)
      • 3.3.1. Mô hình độnglực học (82)
      • 3.3.2. Phương pháp điều khiểnthíchnghi (83)
  • CHƯƠNG 4: CẤU TRÚC ĐIỀU KHIỂN VÀ MÔ PHỎNGHỆTHỐNG (89)
    • 4.1. Cấu trúcđiềukhiển (89)
      • 4.1.1. Các thông sốhệthống (89)
      • 4.1.2. Điều khiểnphíaMaster (90)
      • 4.1.3. Điều khiểnphíaSlave (90)
      • 4.1.4. Mô phỏng (94)
    • 4.2. Cấu trúc điều khiểnbiếnsóng (98)
      • 4.2.1. Các thông sốhệthống (98)
      • 4.2.2. Mô phỏng (99)
    • 4.3. Cấu trúc điều khiểnthíchnghi (102)
      • 4.3.1. Các thông sốhệthống (102)
      • 4.3.2. Mô phỏng (105)
      • 4.3.3. Nhậnxét (0)

Nội dung

TỔNG QUAN HỆBILATERALTELEOPERATION

Phầnmởđầu

Teleoperationlà một hệ thống thiết bị có sự tương tác ở khoảng cách khácnhautương tự như một hệ thống“điều khiển từ xa”thường g p trong học thuật vàmôitrường kỹ thuật Trong các thiết bị thuộc hệ thống này, Robot điều khiển từ xa(cốđịnh hoặc di động)đƣợc sử dụng trong nhiều lĩnh vực khoa học kỹ thuật vàcuộcsống hàng ngày Teleoperation bao gồm một hệ thống chủ động gọi là“Master”và một hệ thống phụ thuộc gọi là“Slave”hệ thống này tương tác với nhau quangườiđiều khiển và màn hình hiển thị.

Hình 1: Hệ thống Teleoperation song hành

Người điều khiển sử dụng một hệ thống Teleoperation để gửi các tín hiệuthôngtin và yêu cầu đến hệ“Slave”thông qua hệ“Master” Căn cứ vào kênh truyền thôngtin,hệthốngTeleoperationđượcgọilàđơnphươnghocsongphương.TrongTeleoperation đơn phương, không có phản hồi nào từ hệ“Slave”về hệ“Master”,v à hệ“Slave”đƣợcthúcđylàmviệcnhờnhữngtínhiệuđƣợcgửitừ“Master”.

Trong Teleoperation song phương, ngoài tín hiệu được gửi từ“Master”đến“Slave”thì còn có tín hiệu phản hồi ngƣợc từ hệ“Slave”gửi về hệ“Master”, những tín hiệu phản hồi có thể là về vị trí, vận tốc, gia tốc của robot, lực tương tác với môi trường làm việc và thậm chí là hình ảnh, âm thanh, nhiệt độ…

Teleoperationhệthốngđiềukhiểncósựthamgiacủaconngười,ởđóconngườisẽ tương tác với môi trường ở xa thông qua các hệ tay máy Hai hệ tay máylàmnhiệm vụ giao tiếp với con người và tương tác với môi trường trongTeleoperationlà hệ tay máy master và hệ tay máyslave.

Master ở dạng đơn giản có thể chỉ là một cần điều khiển (joystick), ho c cũng có thể ở dạng hệtaymáy (robot) có cấu trúc nhƣ hệ tay máy Slave Slave là thựcthểtác động trực tiếp lên môi trường, nhưng mọi hành vi của nó đều phải tuântheoMaster.Người điều khiển tác động lực lên Master, Master sẽ dịch chuyển,chuyểnđộngcủaMastersauđóđƣợctruyềnđếnchoSlavethôngquahệthốngtruyềnth ông

Master Commu- nication Slave Environment

Operator và Slave sẽ phải thực hiện theo chuyển động đó của Master Một hệ teleoperation bao gồm năm phần tử chính đƣợc cho nhƣ (Hình 2).

Hình 3 Sơ đồ khối hệ Teleoperation

Trong hệ teleoperation, người điều khiển(human operator)đóng một vaitròquantrọng.Ngườiđiềukhiểntiếpnhậnthôngtintừhiệntrường,phântích,xửlývàquyết định phản ứng phù hợp để toàn bộ hệ thống hoạt động nhịp nhàng, thông suốt. Đểhỗtrợchoviệcraquyếtđịnhcủangườiđiềukhiển,ngoàicáccơcấuchínhlàtaymáy Master, ở phía người điều khiển, người ta còn cài đ t các thiết bị hiển thịhìnhảnh và âm thanh, có nhiệm vụ hiển thị cho người điều khiển(operator)chuyểnđộng thực tế của Slave ở hiện trường, cung cấp thêm nhiều kênh thông tinchongười điều khiển Và ở phía hiện trường, người ta cũng phải lắp đ t các thiếtbịq u a y p h i m , g h i â m c ũ n g n h ƣ c á c cảmbiến cho Slave Tất cả các thông tinvềchuyển động của Master hay các thông tin về chuyển động của Slave đượctruyềncho phía bên kia thông qua kênh truyền thông Người ta có thể sử dụngđườngtruyền riêng biệt có dây(tín hiệu điện)hay không dây(sóng điện từ), hiện nay sự phát triển mạnh mẽ của internet khiến người ta cũng muốn tận dụng đườngtruyềninternet để giao tiếp giữa 2 hệ thống Tuy nhiên, đường truyền internet cónhữngkhó khăn nhất định trong việc ổn định hệthống.

Hệbilateral teleoperation (BT): Khi ở phía Slave có sử dụng các cảm biến lực thì thông tin của lực được truyền ngược trở lại phía người điều khiển, thôngquaMaster để tác động lên tay người điều khiển Khi đó trên kênh truyền thông sẽtồntại 2 luồng dữ liệu chạy song song và ngƣợc chiều nhau: dữ liệu về vị tríhayc h u y ể n đ ộ n g c ủ a M a s t e r t r u y ề n s a n g c h o S l a v e v à d ữ l i ệ u v ề l ự c c ủ a

Một số khái niệm tương tự Teleoperation:

Teleoperatorlà hệ thống máy giúp con người điều khiển và cảm nhận các vật thể ở xa.

Teleroboticslà một lĩnh vực thuộc robotics, liên quan đến việc điều khiển giám sát robot bán tự động ở xa Xét về góc độ kỹ thuật, điều khiển hệ teleoperation có 2 mục tiêu chính:

-Toàn hệ thống phải ổn định(stability).

-Hệ thống phải làm cho người điều khiển có cảm giác giống như mình đang ởhiệntrường, tiếp xúc trực tiếp với hiện trường (gọi làtelepresent), hay phải đảm bảođộminh bạch của hệ thống(transparency)

Hai mục tiêu này thường mâu thuẫn với nhau Tuy nhiên ta có thể thỏa thuận đểđạtđƣợc đồng thời cả 2 mục tiêu ở một mức độ nào đó.

Quá trình phát triểnhệteleoperation

Teleoperation xuất hiện đầu tiên vào giữa những năm 40 của thế kỷ trướctheoSheridan (1989), khi Goertz tạo nên hệ Master-Slave điều khiển bằng cơ khí Sau đó vào năm 1954, hệ thống đó đã đƣợc Goetz cải tiến, giữa Master và Slave khôngcòntương tác với nhau bằng cơ khí mà thay vào đó là bằng điện.

Trong khoảng thập niên 60, người ta bắt đầu chú trọng vào nghiên cứuảnhhưởng của trễ trong hệ teleoperation, khi mà lực phản hồi từ Slave về Master bịtácđộng của trễ truyền thông Khi thời gian trễ trên kênh truyền thông là không thể bỏ quađược,sựổnđịnhvàđộminhbạchcủahệthốngbịảnhhưởngnghiêmtrọng.Đểđiều khiển hệ teleoperation dưới tác động của trễ, chiến lược điều khiển giámsát(supervisory control) đã đƣợc sử dụng, và trong suốt một khoảng thời gian dàisauđó(đến khoảng cuối những năm 80), người ta tập trung vào việc tạo ra ngônngữlập trình định hướng choteleoperation.

Cho đến giữa và cuối những năm 80, các phương pháp điều khiển mới đãđượcnghiên cứu nhằm mục đích giải quyết vấn đề trễ truyền thông, một hướng tiếpcậnkhá thành công trong việc ổn định hệ thống đó là dựa trên lý thuyết thụ động.

Năm 1989, Anderson và Spong giới thiệu một phương pháp ổn định hệ thốngBTdựa trên lý thuyết mạng điện (network theory), lý thuyết thụ động (passivity) và phân tán (scattering) Hướng tiếp cận này đã áp dụng thành công và hiệu quả cho cảrobotmột bậc tự do vànbậc tự do với thời gian trễ nhỏ nhƣng lại không thật sự hiệuquảkhi áp dụng cho thời gian trễ dài Sau đó, Niemeyer và Slotine đã đƣa ra kháiniệmbiến sóng (wave variables), thực chất là cải tiến lý thuyết của Anderson và Spong sang một dạng mới, trực quan và tổng quát hơn Sự truyền biến sóng cũng cho những hiệu quả và đảm bảo ổn định hệ thống mà không cần quan tâm đến thời gian trễ.Đểcảithiệnhànhvicủahệbilateralteleoperation,kỹthuậtdựbáođƣợckếthợptrong phương pháp biến sóng Về transparency(độ minh bạch), Lawrence trongbàiviếtnăm1993đãđƣaravàlàmrõkháiniệmnày,cũngnhƣnêurasựcầnthiếtphảitruyề n thông cả 2 yếu tố là vận tốc và lực thì mới có thể đạt đƣợc độ minh bạchchohệ teleoperation Việc sử dụng lý thuyết bền vững H∞ trong ổn định hệ thống cũng cho những kết quả vào giữa thập niên 90, cùng thời gian với sự bắt đầu của Internet trong truyền thông Mạng chuyển mạch gói(packet switched network)tạo nên những khó khăn mới trong việc phân tích, xử lý kênh truyền thông do trễ biến đổi, dữ liệu trao đổi rời rạc theo thời gian và sự mất mát thông tin trong khi truyền Các phương pháp mới sau đó đã chú trọng trong việc xử lý với thời gian trễ biến đổi,vàmất mát dữ liệu Những năm gần đây, các phương pháp điều khiển mới tiếptụcđƣợcápdụngchoteleoperationkhixétđếnnhữngteleoperationphứctạpvàcóràngbuộ c Trong đó có thể kể đến điều khiển thích nghi, điều khiển bền vững, điều khiển trƣợt…Mạngneuralcũngđƣợcsửdụngtrongđiềukhiểnhệteleoperation.

CácphươngphápđiềukhiểnhệBilateralTeleoperation

1.3.1 Các phương pháp dựa trên lý thuyết thụđộng

Hệ BT bao gồm hai hệ robot con là Master và Slave có trao đổi tín hiệu(vị trí,vận tốc và lực)với nhau, trong đó Slave bắt chước những hành vi của Master và

Master có tác động của lực từ Slave Mô hình tuyến tính của hệ thống Master/Slave có thể viết dưới dạng:

Trong đó x * (* =mho cs) là tọa độ tổngquát, f * là lực đầu vàotổng quát,

M * là ma trận quán tính xác địnhdương, B * là ma trận nhớt và f h ,f e lần lượt là ngoại lực tác dụng bởi người điều khiển và môi trường Mô hình tuyến tính thường được sử dụng với những hệ có cơ cấu master và slave đơn giản, ho c sử dụng khi muốn đơn giản hóa mô hình Để thể hiện chi tiết đ c tính động lực học của một hệ thống thực tế, người ta sử dụng mô hình phi tuyến Một mô hình phi tuyến có thể suy ra từ phương trình Lagrange như sau:

Trong đó M * là ma trận quán tính, ma trận C(x * ,x * ) là ma trận Hướng tâm và Coriolis Phương trình động học phi tuyến có một số thuộc tính quan trọng cái mà chúng ta sẽ sử dụng dưới đây:

(PD): M * * là ma trận xác định dương

(SS): M * 2C * là ma trận đối xứng lệch

Lý thuyết thụ động là một thuộc tính vào-ra của các hệ thống động lực học, nó có nguồn gốc từ lý thuyết mạng và liên quan chính tới sự trao đổi năng lƣợnggiữacác hệthống. Định nghĩa 1:Một hệ thống động lực học đƣợc biểu diễn bởi hệ:

(1-3) được gọi là thụ động nếu tồn tại một hàm vô hướng khả vi liên tụcV(x) :

(hàm trữ năng) sao cho:

(1-4) và gọi là không tổn hao nếu:

Giả định 2:Cho trước 2 thuộc tính (PD) và (SS) và giả thiết rằng con người và môi trường là thụ động, tứclà t fT    x   fT    x  d   0, khi đó hệ thống

, x T sẽ thụ động với hàm trữ năng:

Từ đó, ta có thể xem hệ NL nhƣ là một hệ không tổn hao bằng cách cho đầuvàolàlực,đầuralàvậntốcvàtínhtoánsựtraođổinănglƣợngxảyra(a) trongbảnthânhệ teleoperator và (b) với thế giới bên ngoài, tức là con người và môi trường ởxa.Điều này thực sự hữu ích khi ta biết rằng ghép tầng các mạng 2 cửa thụ động sẽ đƣợc một mạng thụ động Hơn nữa, với một hệ thụ động, ta cũng có thể đichứngminh tính ổn định của hệ bằng cách chọn hàm Lyapunov là tổng của các hàm trữ năngcủacáckhốicótronghệ.Dođó,vớigiảthiếtrằngmôitrườngvàsựđiềukhiểncủaconngười làthụđộng,nếuchúngtacóthểchứngminhhệteleoperatorcũngthụđộng thì khi đó ta có thể bảo đảm tính thụ động của toàn bộ hệkín.

Trongnhữngnămcuốithậpniên80củathếkỉ20,ngườitaquansátthấyrằnghệteleoperator , bao gồm Master và Slave và các bộ điều khiển tương ứng(hệthốnggiữa con người và môi trường), có thể đƣợc mô hình bằng một mạng 2 cửa(Two- portnetwork).Xemxétmộtmạng2cửanhƣ(Hình4),vớicáctínhiệuvàoralàứnglực(effort)và dòng chảy(flow), tương ứng với điện áp và dòng điện trongmạchđiện hay lực và vân tốc trong các hệ cơhọc.

Hình 4 Mạng 2 cửa Để nghiên cứu hành vi của một mạng 2 cửa, người ta có thể sử dụng các matrậnkhác nhau để mô tả các quan hệ vào ra của nó, nhƣ ma trận trở khángZ(s), liênhệgiữa lực với vận tốc, ho c ma trận lai -H(s) liên hệ giữa các vector lực-vận tốc. Việc sử dụng ma trận nào sẽ phụ thuộc vào từng tình huống cụthể.

Giả sử rằng chúng ta có dòng(flow)là đầu vào ở cả 2 phía của mạng hai cửa, khi đó trở kháng của một bộ điều khiển PD cho hệ Master-Slave có thể đƣợcsửdụng để liên hệ vận tốc với lực thông qua một ma trận trởkháng:

Trong đóz * là trở kháng đ c trƣng cho Master và Slave Chú ý rằng bộ điều khiển (c ij ,i,j1.2)có m t trong tất cả các thành phần của ma trận trở khángZ cl (s) , từ đó chúng ta có thể chủ động thay đổi các thành phần của nó nhằm đạt đƣợc sự thụ động của mạng bằng điềukiện

Z cl (s) là một ma trận thực xác định dương.

M t khác, nếu cảm biến lực là có sẵn ở nơi Slave thì một biểu diễn lai thay thế đƣợc viết nhƣ sau(Hannaford, 1989a):

VớiH(s) là ma trận lai Hơn nữa, các thành phần của ma trận này mang bản chất vật lý

Do đó, nếu muốn có được một ma trậnH(s) lí tưởng biểu thị phản hồi độnghọcgiữamôitrườngvàngườivậnhành.Tứclàphảicóđầuvàotrởkhánglà0vàđầuratrở kháng là vô cùng, khi đó ma trậnH(s) sẽ có dạng:

(1-10) Ở phần sau chúng ta sẽ thấy biểu diễn lai đã trở thành cơ sở cho một số đóng góp lí thuyết nhƣ cách tiếp cận phân tán và mô hình 4kênh.

Trước năm 1988, các trễ thời gian gây ra sự không ổn định trong hệ BT làtrởngại chính ngăn cản những tiến bộ xa hơn Anderson và Spong(1989a, b,

1988)giới thiệu về các biến phân tán-được biết đến trong lí thuyết đường dây truyềntải.Trong phần này tôi tóm tắt phương pháp của Anderson và Spong(1989b)dùngchohệ BT Hệ BT sau đƣợc mô tả trong (Hình5).

Hình 5 Sơ đồ hệ Bilateral Teleoperation

Hệ thống đƣợc xem nhƣ một loạt mạng 1 cửa và 2 cửa với c p effort-flow(lực- vận tốc trong trường hợp của cơ hệ)được ghép nối với nhau Trong trường hợphệLTI như đã đề cập trước, bằng ma trận lai được sử dụng vào định nghĩacủascattering operator. Định nghĩa 3 : Scattering operator đƣợc định nghĩa theo liên hệ giữa sóng tới

 f  t  x  t   và sóng phảnxạ  f  t  x  t   nhƣ sau(S được gọi là ma trận phân tán – Scattering matrix): f  t  x  t  S  f  t  x  t  

Trong trường hợp của mạng hai cửa, ma trận phân tánStrong miền tần số có thể đƣợc biểu diễn theo ma trận lai bằng các phép biến đổi đơn giản :

 Để đảm bảo tính thụ động, sóng phân tán (scattered wave) không thể có năng lƣợng lớn hơn là sóng tới, do đó với scattering operator S : Định lí 4:(Anderson và Spong, 1989b) Một hệ thống n cửa là thụ động nếu và chỉ nếu S  j   1 của ma trận phân tán tươngứng. Định lí trên có thể đƣợc suy ra từ lập luận sau đây về năng lƣợng đầu vào và năng lượng đầu ra tới mạng hai cửa Chofvàxlà những vector lực và vận tốc tương ứng, và xác địnhlần lƣợt là năng lƣợng đầu vào và đầu ra, khi đó:

Ta xác định biến phântán 

 Khi đó, có thể đƣợc viết lại bởi biến phân tán nhƣ sau:

Vì năng lƣợng đầu ra không lớp hơn năng lƣợng đƣợc cung cấp nên sai lệchnănglƣợng (1-13) là không âm (với điều kiện năng lƣợng sóng tới không đƣợckhuếchđại và sóng phải hồi cũng vậy), tức là:

Ứng dụng củahệTeleoperation

Hệ Teleoperation có thể ứng dụng trong rất nhiều lĩnh vực:

1.4.1 Lĩnh vực khám phá vũtrụ Đây là ứng dụng đƣợc nghĩ đến đầu tiên khi nhắc đến hệteleoperation.T e l e o p e r a t i o n k h ô n g g i a n đ ƣ ợ c x e m l à m ộ t t r o n g n h ữ n g ứ n g d ụ n g c ô n g n g h ệ quantrọng trong việc thay thế và bổ sung cho các hoạt động trong không gian của con người Việc sử dụng robot để khám phá các hành tinh đã từng không đƣợc đồngýr ộ n g r ã i t r o n g g i ớ i khoa học hàng không vũtrụkhi có nhiều ý kiếnchorằng nhiệm vụ thámhiểmvũ trụ là của conngười.Nhưng thực tế mấythậpkỷ qua đã minhchứngrằng việc đƣa conngườilên hành tinh khác làrấtkhó khăn và tốnkém,và có lẽ cần có một phương Hình 11 Kịch bản khám phá vũ trụ trong tương lai thức mới phù hợp hơn để thực hiện điều đó Tại Cơ quan Hàng không và Vũ trụ Mỹ NASA, telerobotic được nghiên cứu để hỗ trợ con người trong việc tiếp cậncácthiên thể mới Điểm khác biệt cơ bản giữa telerobotic với robotic thám hiểm hiện naycủaNASAnhưCuriosityvàcácxetựhànhkhác,đólànóchongườiđiềukhiểncảm giác như đang tiếp xúc thực với hiện trường Trong tương lai, sự thámhiểmmột hành tinh khác có thể sẽ diễn ra theo một kịch bản mà con người khôngtrựct i ế p đ t c h â n l ê n h à n h t i n h đ ó T h a y v à o đ ó , c á c kỹsƣ, phi hành gia sẽ ở trongtàuvũ trụ, cách bề m t hành tinh một khoảng không quá lớn và điều khiển các telerobot đƣợc đƣa xuống hành tinhđó.

Như vậy có thể thấy tương lai ứng dụng của teleoperation trong thám hiểm,khám phá vũ trụ là rất rộng mở.

1.4.2 Lĩnh vực hoạt động dưới đạidương Đại dương cũng là một nơi mà con người khó có điều kiện tiếp xúc trực tiếpdoápsuấtlớncủađạidươngkhixuốngsâucũngnhưsựrộnglớncủanó.Bởivậy,thayvì cử thợ l n, người ta có thể dùng telerobot để thực hiện một số nhiệm vụ nhấtđịnhdưới biển Các nhiệm vụ mà hệ teleoperation có thể đảm nhiệm trong lòng biểnbaogồmthămdòdầu mỏở ngoàikhơi,kiểmtralỗivàbảodƣỡng đầukhoan,dànkhoanvà ống dẫn dầu, thí nghiệm sinh học đại dương, khảo sát địa chất, thăm dò khảocổhọc, và các hoạtđ ộ n g liên quan đến quân sự

Robot thường đƣợcsửdụng trong các ứngdụngdướiđạidươnglàx eđiềukhiển từ xa dướinước(remotely operated underwater vehicle,

80 với mục đích ban đầu là thu lƣợm vũ Hình 12 ROV Jason của Viện Hải Dương học Woods Hole khí rơi rụng dưới biển từ chiến tranh Sau đó người ta phát triển chúng nhằmmụcđích khai thác dầu khí dưới biển Dự án Argo-Jason của Viện Hải DươnghọcWoods Hole là một dự án nhằm mục đích nghiên cứu khoa học dưới đạidương.Cánh tay của ROV Jason được xây dựng để phá vỡ dung nham đã đông cứngdướiđáyđạidươngvàđểtựthoátchothiếtbị.Thiếtbịnàyđượccungcấpnănglượngvàđiều khiển thông qua sợi cáp dài đến 10km nối với tàu điều khiển trên m tbiển.

1.4.3 Lĩnh vực xử lý hóa chất độc hại, phóngxạ

Cácchấtđộchóahọc, cáchợpchấtphóngxạsẽrấtnguyhiểmnếuconngườitiếpxúctrựctiếp.VìvậyviệcsửdụnghệTe leoperationđểthaythếconngườitrong việcxửlýcácchấtđộchại,thulƣợmrácthảiphóngxạlàcựckỳhợplý.Bộnăng lƣợngMỹ(USDepartmentofEnergy-DOE),nhàsảnxuấtvũkhíhạtnhânchoMỹtrong nhiều thập kỷ, đã không bi ép buộc thực hiện theo những luật lưu trữ vàtiêuhủy chất độc hóa học và hợp chất phóng xạ như những nhà máy hạt nhânthươngmại khác Trong nhiều năm, DOE cất giữ rác thải high-level trong những bể chứa và những thùng chứa 50 ga lông ở sa mạc Sau nhiều thập kỷ, những bể chứa và thùng chứa này bị ăn mòn và rò rỉ chất độc vào nước ngầm Chính phủ Mỹ giờđâyđã cảm thấy bắt buộc thu hồi những rác thải này và chuyển chúng đi đến những bình chứa an toàn hơn Rõ ràng những công việc nguy hiểm này cần đến sự can thiệp của công nghệTeleoperation.

Robot cònđƣợcgửi đến nhà máy điệnhạtnhân

Fukushima,NhậtBản để xử lý chất thảihạtnhân với nồng độchấtphóng xạ cao Quátrìnhdọn dẹp nhà máyđiệnhạt nhânnàydiễn rarấtchậm chạp.N h ữ n g robot điều khiển từ Hình 13 Robot xử lý chất thải hạt nhân do Toshiba chế tạo xa đƣợc đƣa tới lò phản ứng để dọn các thanh nhiên liệu hạt nhân Các robotdocông ty Toshiba chế tạo đã di dời 1.535 thanh nhiên liệu chƣa phân rã từ lòphảnứng số 4, nơi có nồng độ phóng xạ khá thấp, cho phép công việc tiến hành dễ dàng Còn lò phản ứng số ba có nồng độ phóng xạ cao hơn nhiều, vƣợt quá khả năngchịuđựng của các thiết bị điện tử nhạy cảm và dây điện bên trong robot Mỗi con robot đảm nhiệm một chuyên môn riêng và phải mất hai năm để chế tạo chúng.

Teleoperation có thể được ứng dụng trong y học dưới dạng ch n đoán từ xa(telediagnosis)và phẫu thuật từ xa(telesurgery) Trong đó phẫu thuật từ xa là ứng dụng đang đƣợc chú trọng nghiên cứu và phát triển. Ý tưởng phẫu thuật từ xa bắt đầu phát triển từ những năm 1970 vớimụcđíchthay thế cho sự hiện diện thực tế của bác sĩ trong điều kiện thương vonglớnxảy ra trong chiến tranh hay các thảm họa tự nhiên Cha đẻ của khái niệm phẫu thuật từ xa chính là Cơ quan Hàng không và Vũ trụ Mỹ NASA, nhưng nhà tàitrợchính cho chương trình nghiên cứu phẫu thuật từ xa của NASA lại là cơ quancácdự án nghiên cứuq u ố c phòng tiên tiến củaMỹNARPA Hai hệ thống robot phẫu thuật từ xa đƣợc phát triểntừchương trình nghiêncứulà Hệ thống phẫu thuật da

CA)và hệ thống ZEUS

Hình 14 Hệ thống phẫu thuật từ xa da Vinci

CA) Intuitive Surgical và Computer Motion sau đó hợp nhất vào năm 2003 đã cùng nhau tạo nên mộthệ thống robot phẫu thuật từ xa duy nhất trên thị trường lấy tên là da Vinci.

Các nhà khoa họcMỹcho biết robot mớ i“vua tốc độ trên cạn”có khả năng hoạt động hỗ trợ các binh lính hoàn thành nhiệm vụ chiến đấu hiệu quả hơn Theo cơ quan nghiên cứu công nghệ cao(DARPA)của Bộ quốc phòng Mỹ, robot không đầu đƣợc gọi làCheetah.Nó có thể"phi nước đại"với vận tốc 29km/h trênmáychạy bộ trong phòng thí nghiệm - vượt kỷ lục về tốc độ của một robot có bốnchânlập trước đó là 21km/h DARPA đã tài trợ cho công ty BostonDynamics,Massachusetts trong việc chế tạo Cheetah Đây là dự án nằm trong nỗ lực phát triển các loại robot quân sự Chuyển động của Cheetah đƣợc mô phỏng theo độngvậthoang dã - những loài chạynhanh Nó đƣợc thiết kế linh hoạt, có thể uốn cong hay duỗi thẳng các chi nhằm tăng chiều dài sải chân và nâng cao tốc độ di chuyển. Phiên bản hiện tại đang hoạt động phụ thuộc vào máy bơm thủy lực và hệ thống ống bên ngoài Tuy nhiên các nhà nghiên cứu cho biết họ sẽ thiết kế mẫu robot chạy tự động mà không cần bất kì thiết bị hỗ trợ nào, việc chế tạo robot có thể chạy zíc zắc để truy đuổi, l n trốn hay dừng đột ngột, có thể xây dựng robot theo những mô hình khác nhau dựa trêncác động vật, baogồmBigDog - loại robot đƣợc sử dụng tạinhữngđịa hình đồi núihiểmtrở, đƣợc thiết kế cókhảnăng tái chế nănglượngtừ các bước chạy.

Vànósửd ụ n g m ó n g v u ố t n h ỏ của sáu chân để leo lên tường, cây, hàng Hình 15 Robot Cheetah có thể đạt tới với vận tốc 29km/h rào và dùng cái đuôi để giữ thăng bằng giống nhƣ con thằn lằn Hiện nay, điều khiến các chuyên gia lo ngại nhất là phiên bản này không có hệ thống trí tuệ nhân tạo để phân biệt giữa dân thường và quân địch Do đó, robot mới có thể g p rắc rối với luật chiến tranh nếu nó hoạt động.

MÔ HÌNH HÓAHỆTHỐNG

Mô hình động lực học tay máy córàngbuộc

Bilateral Teleoperationlà một hệ thống gồm các robot Master và Slave với ràng buộc Holonomic với ràng buộc môi trường và tập các chuỗi động học kínchồngchéo trên hệ thống động lực học Có hai loại ràng buộc có thể có đó là ràng buộc Honolomic và ràng buộc Nonhonolomic Trong đó ràng buộc Nonhonolomic là khó khăn hơn vì tính chất phức tạp của nó Vì vậy, ở đây người ta chỉ xét robot vớiràngbuộc Honolomic Ở đây ta sẽ xét sự giống và khác nhau giữa hai loại ràng buộc rất quan trọng này Trước hết ta cần nắm khái niệm về hai ràng buộc này- hay khi đótagọi hệ đó là hệ ràngbuộc.

Hệ Holonomic: là hệ có các ràng buộc chỉ thể hiện mối quan hệ giữa các tọa độ và thời gian Tức là nó có thể được mô tả bởi phương trình :

Trong đó q R n là vector biến khớp mô tả tọa độ của hệ thống Ngƣợc lại, nếu ràng buộc mà chỉ có thể biểu diễn dưới dạng phối hợp vận tốc mà không đượcbiểudiễn dưới dạng phối hợp tọa độ với thời gian.

Tức là các ràng buộc của nó chỉ được mô tả bởi phương trình :

Thì khi đó hệ sẽ có ràng buộc làNonholonomic.

Về mô hình, cả hai loại ràng buộc này đều có chung một cách biểu diễn:

Trong đó, A(q)q0 được gọi là phương trình ràng buộc Nhưng khác một điều đó là, đối với hệ holonomic thì có một dạng mô tả khác là :

Trong đó ma trậnA(q) chính là ma trận Jacobien của hệ, đƣợc xác định nhƣ sau:

Còn đối với hệ nonholonomic thì ta không có điều đó, mà cách biểu diễn

Là duy nhất, không thể biểu diễn đƣợc qua dạng :

Hệ holonomic có cơ cấu ràng buộc là ràng buộc khả tích và hệ Non-holonomic là hệ có ràng buộc không khả tích Ta đi đến một định lí quan trọng để tìm xem một hệ là nonholonomic hay là holonomic: Định lí Frobenius :Một phân bố đƣợc gọi là khả tích nếu và chỉ nếu nó là xoắn(involutive).Mộtphânphốiđƣợcgọilàxoắnkhivàchỉkhinóđóngtrongtậphợptấtcả các thao tác tích Lie

Xét hệ phương trình động lực học của hệ BT được mô tả bằng hệ phươngtrìnhEuler-Lagrange như sau:

Trongđó: qR n ,q R n là các vector biến khớp m s m m j j1 j2 qR n ,qR n là các vector vận tốc khớp. m s

R n ,R n là các vector momen vào.

M(q)R nn ,M(q)R nn là các ma trận quán tính đối xứng xác định dương. m m s s

C( q, q)R nn ,C(q,q)R nn là các ma trận của lực Coriolis. m m m s s s

G(q)R n ,G(q)R n là thế năng. m m s s f(q)R n ,f(q)R n là các vector lực ma sát. m m s s

F m ,F s là các lực của người vận hành tác động và lực hoạt động ở tay máy.

A T ,A T  R (nl)n là các ma trận Jacobian của hệ.

Với hệ ràng buộc Honolomic nên phương trình cólràng buộc có thể được viết dưới hai dạng.

Vì hệ thống có chứa các ràng buộc do đó vector biến khớp là không độc lập tuyến tính với nhau Do đó, ta sẽ chuyển hệ về hệ với các vector biến khớp là độc lập tuyến tính để thuận tiện cho việc thiết kế điều khiển Vì trong cả Master và Slave đều có cùng loại cơ cấu, do vậy, chúng cũng có cùng số ràng buộc với nhaulà l Nếugọi jm,s, khi đó ta sẽ có: q q T ,q T  T , q

R nl ,q R l Với q j1 là vector biến khớp với các khớp độc lập tuyến tính và q j2 là vector của các j1 j2 s biến khớp phụ thuộc tuyến tính.

Khi đó ta sẽ có biểu diễn q j2 (q j1 ) j j1

Thế q j ,q j ,q j vào phương trình động lực học của hệ, ta được:

MJ q j jj1  CJMJ j j  q j j j1 Gf j  j A T F j j j (2-6) Nhâncảhaivếphươngtrìnhtrênvới T và với chú ý (*) tađược:

Trong đóM j J T M J;C j J T  C JM J  ;G j J T G;F j J T f j jj j jj jj j j j j

Mô hình mới này vẫn thỏa mãn những thuộc tính cơ bản của phương trình Euler- Lagrange với các biến khớp quay:

Thuộc t nh 1:Các ma trận M j và M j là các ma trận đối xứng và xác định dương 1

Thuộc t nh 2:Ma trận M j 2C j đối xứng lệch.

Mô hình trên không gian trạng thái của MastervàSlave

Mô hình hóa hệ thống trên miền thời gian hay trên miền không gian trạng thái là một hướng tiếp cận trong lý thuyết điều khiển hiện đại Nó rất hữu ích trongviệcmô hình hóa các đối tƣợng bậc cao hay các hệ thống phức tạp Tuy nhiên, chƣacónhiều tài liệu đề cập đến việc sử dụng mô hình không gian trạng thái để mô hình hóa và điều khiển các hệ teleoperation Với mô hình hệ teleoperation thôngthường,ở dạng đơn giản hơn so với môhình:

Mm(qm)qmCm(qm,qm)qmGm(qm) mfh (2-8)

Trongđó m , s lầnlượtlàmomentvào, f h , f e lần lượt là ngoại lực của người điều khiển(human operator)và môi trường(environment). Đ t biến trạngtháil à cho cả master và slave, khi đó hệE r r o r ! R e f e r e n c e source not found.trên sẽ đƣợc đƣa về dạng: d  q m 

Nhưvậy,từ2phươngtrìnhđộnglựchọc,tađãđưavề2phươngtrìnhtrạngtháiphituyến Để đơn giản, ở đây ta chỉ xét mô hình tuyến tính của hệteleoperation:

Với mô hình này, khi đ t biến trạng tháixq m và xq s , ta đƣợc: m q s  q 

Viết lại các phương trình(2-11),(2-12)thành: dx m

Vàdx s A x B  Bf dt ss ss se

Xét với cơ cấu robot một bậc tự do.

Mô hình động lực học của cơ cấu một bậc tự do là:

Trong đó,Jlà thành phần quán tính,Mlà khối lƣợng của cánh tay robot,glà gia tốc trọng trường,llà chiều dài cánh tay robot,(t) là góc quay,blà hệ số ma sát nhớt vàu(t)là tín hiệu điều khiển Mô hình tuyến tính của hệ sau khi tuyến tính hóa là:

Có thể chuyển mô hình này sang không gian trạng thái bằng cách sử dụng các biến trạng thái là vị trí góc và vận tốc góc: x 1 (t)(t) x 2 (t)(t)

Thay các biến trạng thái vào mô hình ở trên ta thu đƣợc x 1 (t)x 2 (t)(t) x 1 (t)x 2 (t) (t) x(t)x(t)  (t) b x(t) 1 u(t)

(2-16) Đ t các ma trận trạng thái làA,B,C.Ta đƣợc: x(t)Ax(t)Bu(t) y(t)Cx(t)

Nhƣ vậy ta có đƣợc mô hình trên không gian trạng thái cho cơ cấu một bậctựdo.Đốivớicơcấunhiềubậctựdotacũngcóthểlàmtươngtựđểthuđượcmôhìnhtrên không gian trạngthái.

Mô hình hóamôitrường

Mục đích chính của hệ thống BT là sự minh bạch(transparency)và sự ổn định (stability) Một hệ thống được gọi là minh bạch nếu người điều khiển có cảm giác như đang trực tiếp có m t và thực thi các nhiệm vụ ở hiện trường Một hệ thống sẽ là minh bạch cho bất kì một môi trường nào nếu sự dịch chuyển của Master và Slave là giống hệt nhau và lực mà người điều khiển cảm nhận là lực phản hồi từ sự tương tác với môi trường, nghĩa là: x h x e và f h f e

Sự phản hồi lực từ phía Slave về cho Master(force reflection)có thể đƣợcthựchiện theo nhiều cách khác nhau Có thể dùng cảm biến lực đ t ở cơ cấu cổ tay của Slave để trực tiếp đo lực tương tác với môi trường Ho c dùng cảm biến đodòngđiện trong động cơ chấp hành của Slave để suy ra lực một cách gián tiếp. Hay có thể thông qua thông tin phản hồi về vị trí và vận tốc của Slave để tính toán ratươngtác với môi trường Cách cuối có vẻ đơn giản khi ta không cần dùng thêm cảmbiến,nhưng để thực hiện được nó, ta phải mô hình hóa môi trường phía Slave. Cónhiềucáchmôhìnhhóamôitrường.Việclựachọnmôhìnhmôitrườngnàotùythuộcvàomức độ chính xác mà ta cần cũng nhƣ độ phức tạp của bài toán khi ta lựa chọnmôhìnhđó.

Mô hình Kenvil-Voigt giả sử rằng vật liệu đàn hồi – nhớt lý tưởng có thể được thay thế bằng một cơ hệ gồm một lò xo mắc song song với một giảm chấn.

Phương trình lực tương tác như sau: f(t)  kx(t)bx(t),if x(t)0 

Trong đó x(t) là sự dịch chuyển của vật thể song môi trường, x(t) là vận tốc và f(t) là lực tương tác,kvàbtương ứng là độ cứng và độ nhớt của môi trường.

2.3.2 Mô hình Khối lượng-Lò xo-Giảmchấn

 f(t)kx(t)bx(t)mx(t),if x(t)00, else

Mô hình Hunt-Crossley là một mô hình môi trường phi tuyến Mô hình này có khả năng mô tả môi trường chính xác hơn so với mô hình Kenvil-Voigt ở trên. Công thức mô tả mô hình Hunt-Crossley:

Trong đó,kvàblần lƣợt là độ cứng và độ giảm chấn, vànlà thông số đạidiệncho thuộc tính hình học của sự tương tác, phụ thuộc vào chất liệu của môitrường.Dù mô tả bản chất vật lí của sự tương tác, nhưng vì công thức phi tuyến trênkháphức tạp nên nó không thật sự phù hợp cho các ứng dụng robotic thời gian thực Giải pháp cho vấn đề này là đƣa mô hình trên về dạng tuyến tính bằng cáchlấylogarit công thức trên, tađƣợc: ln f(t)  ln  k  nln  x(t)  ln  1

ln f(t)  ln  k  nln  x(t)   bx(t) k (2-20) Để có công thức gần đúng trên cần có điềukiện bx(t)

1, điều kiện này k thường được thỏa mãn do vận tốc trong các ứng dụng robot có tương tác vớimôitrường thường biến đổi nhỏ và độ cứng của môi trường cũng thường lớn hơnrấtnhiều so với độ nhớt của chúng.

Mô hình Maxwell mô tả môi trường bằng một giảm chấnbmắc nối tiếp vớimộtlò xo có độ cứngk Công thức của mô hình đƣợc viết nhƣ sau:

2.3.5 Mô hình ti u chu n tuyến t nh đc

Mô hình này là kết quả của sự kết hợp giữa mô hình Maxwell và mô hình lo xo của Húc Vật liệu nhớt đƣợc mô hình nhƣ một lò xo nối tiếp với một giảm chấn,cảhai đƣợc mắc song song với một lò xo khác Công thức của mô hình này đượcviếtdưới dạng:

Mô hình tiêu chu n tuyến tính đ c chính xác hơn mô hình Maxwell và Kenvil-Voigt về việc dự đoán các phản ứng của vật liệu, tuy nhiên về m t toán học nóđưaranhữngkếtquảkhôngchínhxácchocácbiếndạngdướinhữngđiềukiệntảicụthểvà khá khó khăn để tínhtoán.

Mô hình Slave có tính đến tác động củamôitrường

SửdụngmôhìnhKelvin-Voigtvềmôitrường,phảnlựctácdụnglênSlaveđượctính theo côngthức: f e (t)k e  s (t)b e  s (t)

Trong đó k e là độ cứng vàb e là hệ số ma sát nhớt, s và s lần lƣợt là tọa độ góc và vận tốc góc của Slave Viết lại biểu thức trên dưới dạng: f(t) k b    s   k b  xKx e e e  s  e e s es (2-23)

Thay biểu thức(2-23)vào phương trình ta được: dx s

A x B  B Kx dt ss ss s es

(2-24) Vậy ta có thể viết lại phương trình trạng thái của hệ Slave – môi trường dưới dạng: x s A se x s B s u s (2-25) với A se A s B s K e

ĐIỀU KHIỂN CHO HỆBILATERALTELEOPERATION

Về điều khiểntối ƣu

Xét hệ bậc n, tiền định và liên tục, mô tả bởi: dxf(x,u,t), trong đó vector hàmf(x,u,t) trơn theox,u dt (3-1) với

x 1  x  n là vector của n biến trạng thái của hệ,

u 1  u  m là vector của m tín hiệu điều khiển,

f1(x,u,t) f(x,u,t)  là vector của n phương trình mô tả hệ thống.

Kýhiệu U là tập các vector tín hiệu điềukhiển u(t) thíchh ợ p , x(0)x 0 là điểm trạng thái đầu, x(T)x T là điểm trạng thái cuối và T là khoảng thờigianđiềukhiển.Bàitoánđiềukhiểntốiưuhệliêntục(3-1)đượchiểulàxác định tín hiệu điều khiển tối ƣuu * (t)U,0tTđể đƣa hệ đitừ điểm trạng thái đầu x 0 tới điểm trạng thái cuốix T sao cho chi phí (cost function) cho quá trình chuyển đổi trạng thái đó tính theo:

(3-2) đạt giá trị nhỏ nhất Khi đó:

Nghiệm x * (t ) của phương trình(3-1)ứng với tín hiệu điều khiển tối ưu u * (t)tìm đƣợc và cùng điều kiệnbiên x 0 , x T đƣợc gọi là quỹ đạo tối ƣu.

T đƣợc gọi là khoảng thời gian xảy ra quá trình tối ƣu.

Cho hệ liên tục(3-1)bậc n với các điều kiện ràng buộc:

-U là một tập con hở trong không gian điềukhiển

-Khoảng thời gian T xảy ra quá trình tối ưu là cố định cho trước.

-Điểmcuối x(0)x 0 có thể là cố định cho trước, song cũng có thể là bất kỳ. x(T)x T cũng có thể là cố định cho trước, song cũng có thể là bất kỳ. Ý tưởng chính của phương pháp biến phân để giải bài toán trên như sau:

-Giả sửu* t là tín hiệu điều khiển tối ƣu Ứng với nó sẽ có quỹ đạo trạng thái tối ƣux* t 

-Thayu * (t)bởiu(t)u * (t)(t), điều này cần miền tín hiệu điểu khiểnUhở.

-Gọixlà quỹ đạo trạng thái tương ứng củau.Nếu x(t)x * (t)(t) f  x,u liên tục thì:

+Nếu x0là cho trước thìx  0  0 x0là bất kì thì 0  0 xTlà bất kỳ thì T  0

 0 g (x * ,u * )dtJ min nên phải có:

HiệuJ đƣợc tách thành 3 thành phần:

+ Hình thành nên điều kiện biên: c T (T)p T  T 0

0 + Hình thành nên hàm Hamilton:

+ Hình thành nên biến đồng trạng thái p: dp T f * g * dp T f * g * HT

- Điều kiện cần đểu * (t) tốiưu:

3.1.2 Điều khiển bám tối ưu cho hệ tuyếntính

Xét hệ thống tuyến tính đƣợc mô tả trên miền không gian trạng thái:

 f x(t)A(t)x(t)B(t)u(t) (3-6) và hàm chi phí cần tối thiếu hóa là: t f

Trong đór(t)là trạng thái mong muốn hay trạng thái đ t.

Thời gian cuốit f cố định, x(t f ) tự do.

H và Q là các ma trận thực đối xứng, bán xác định dương, và R là ma trận thực đối xứng và xác định dương.

Lại có quan hệ sau:

Thay thế vào phương trình trạng thái(3-6), kết hợp với phương trình đồng trạng thái(3-8)ta đƣợc:

       (3-8) phương trình vi phân trên có nghiệm:

Trong đólà ma trận chuyển tiếp của hệ(3-8) Nếucó thể tách đƣợc và f 

 2 f p*(t)  K(t)x*(t)  K(t)x*(t)  s(t) thành phần tích phân có thể thay thế đƣợc bằng vector2n1 f1(t) thì có thể đƣa hệ trên về dạng:

(3-9) Điều kiện biên: p * (t)Hx f * (t)Hr(t) f f (3-10)

Từ đó suy ra luật điều khiển sẽ là u * (t)R 1 (t)B T (t)K(t)x(t)R 1 (t)B T (t)s(t) (3-11)

Nếu áp dụng các phép tính trên để tìm tín hiệu điều khiển, ta sẽ phải xác định ma trậnchuyểntiếp,tuynhiên,cómộthướngdễdànghơn.Tabắtđầutừphươngtrình: p * (t)K(t)x * (t)s(t) Đạo hàm cả 2 vế theo thời gian ta đƣợc

Vì biểu thức trên phải thỏa mãn với mọix * (t)vàr(t) nên

Klà ma trận đối xứng vàslàvector Điều kiệnbiên: n1. p * (t)Hx * (t)Hr(t)K(t)x * (t)s(t) f f f f f f (3-13)

Phương trình này phải thỏa mãn vớimọilà: x * (t)và r(t f ) nên các điều kiện biên sẽ Để xác định K(t) và s(t),ta tích phân các phương trình và(3-12)từ t f đến t 0 sử dụng điều kiện biên(3-14).

3.1.3 Tính ổn định của bộ điều khiển bám tốiưu

Hàm chi phí khi ma trận H bằng 0:

khi đó tồn tại J min là hữu hạn nên tích phân vô hạn:

Là hữu hạn Do đó, theo bổ đề Babalat thì: lim  x(t)r(t)  T Q(t)  x(t)r(t)  u T (t)R(t)u(t) 0 lim x(t)r(t) 0x(t)r(t)vàlim u(t)  0 t t

Do đó, bộ điều kiển đã cho sẽ làm hệ ổn định.

Phương phápbiến sóng

Những lý thuyết đầu tiên M.Spong – Anderson – Niemeyer – Slotine [28][29]

[22] đã đề ra biến sóng scaterring, đó là những biến sẽ đƣợc truyền đi giữa hai phần của hệ thống với thời gian trễ là giống nhau và đều là hằng số và xem cả

K(t f )H s(t f )Hr(t f ) (3-14) i i i i hệ thống nhƣ một mạng hai cửa Đây là một quan điểm khá mới mẻ trong xử líbàitoán điều khiển, khi nhìn nhận hệ BT mang bản chất cơ học dưới góc nhìn 1mạchđiện trên cơ sở lý thuyết đường dây dài Ưu điểm của sử dụng biến sóng là sẽgiúphệ thống thỏa mãn điều kiện thụ động của M.Spong [25] mà không cần quan tâm đếnhệhai RobotMastervàSlavetừđóhệthốngsẽổnđịnh.Biếnsóngđƣợchiểulàcác biến năng lƣợng và đảm bảo đƣợc năng lƣợng của hệ thống là không đổinếuchọn hàm năng lượng thích hợp Tuy nhiên, biến sóng vẫn còn một số hạn chế,docần một bước tính toán thông số hệ thống để truyền đi nên nó sẽ ảnh hưởng đếnsailệchbámvàthờigianđápứngcủahệthống,theolýthuyếtđườngdâydài(đãđượcM.Spo ng – Anderson đề xuất [28][29] ) thì sẽ xuất hiện sóng phản xạ, do mạng truyền thống nên thời gian trễ của hai cơ cấu này sẽ không phải là hằng số mà có thể sẽthayđổitheothờigianvàkhôngbiếttrướcđược.Nhữngnghiêncứugầnđâynhấtcủa Chawda

[20] và D.Sun[21] dựa trên lý thuyết TDPA (Time Domain Passivity Approach) – đề cập bởi Hannaford [33] bao gồm bộ Observer và Controllerđểgiải quyết những vấn đề còn sót lại trướcđó.

Robot thực thi(slave robot)và robot điều khiển(master robot)đƣợc môhìnhhóa thành c p robot gồm n bậc tự do (n-DOF) với sự tương tác giữa robot vàmôitrường (cũng như giữa robot và con người) được cho bởi phương trình Euler–

Với m,s là master và slave, q,q,q Rn  im,s  tương ứng là gia tốc, vận tốc và vị trí của robot.

M  q  Rnn là ma trận quán tính, Ci  qi,qi

 là thành phần đ c trƣng cho tác động Coriolis, h &  e tương ứng là lực tác động của người điều khiển và môi trường làm việc nơi đ t robot slave, m &  s

3.2.2 Phương pháp biến đổi biếnsóng tương ứng là lực của bộ điều khiểnBiến sóng là biến đ c trƣng cho công suất hệ thống sẽ đƣợc truyền đi và đƣợc m x ' m x' & F ' ss x' & F ' ms coi nhƣ ngôn ngữ giao tiếp giữa hai phía master robot và slave robot Bên phía master robot sẽ truyền đi u m và nhận về v m còn phía slave robot nhận về u s và truyền đi v s bF ' Bx ' u  m m ;u m 2bB s bF ' Bx '

Bx ' bF ' Bx ' bF ' v  m m ;v   s s m 2bB s 2bB

Với các ý nghĩa thông số: b,B là trở kháng giả lập trên hai đướng dây truyền tải,

F ' & lầnlượtlàbiếnđưavàovàđưarabộmasterscattering,tươngtự bên phía slave Công suất của hệ thống đƣợc tính toán với thời gian trễ là hằng số theo biến sóng

Theo quan điểm nhìn nhận hệ thống hai robot và truyền thông nhƣ một thểthốngnhất, cùng với đó là quan điểm về lý thuyết mạch điện cụ thể hơn là mạng hai cửa và đường dây dài Theo quan điểm nhìn nhận tương tự đường dây dài thì thôngtinvề biến sóng truyền đi trên đường dây từ phía master sang slave sau đó vẫn cómộtphần thông tin của biến sóng đƣợc truyền ngƣợc về master, rõ ràng thông tin đólàkhông cần thiết với phía master, thêm vào đó là nó sẽ làm ảnh hưởng tới côngsuấtbên trong hệ thống, sóng truyền ngƣợc trở lại nơi truyền đi đƣợc gọi là sóngphảnxạ.Tacầntriệttiêusóngphảnxạ,phương thức bàibáođưaralàsẽlàm mấtđi thành phần phản xạ về bằng cách triệt tiêu nó từ thành phần scattering đƣa vào hai bộ x ' x  b

Thế(3-25)vào(3-23)ta sẽ có đƣợc phép biến đổi biến sóng mới có ƣu điểm là có khả năng triệt tiêu đƣợc sóng phản xạ m m t

Có thể thấy ƣu điểm của(3-26)khi hai biến truyền u m &v s chỉ còn phụ thuộc một biến và không còn thành phản xạ về

F ' & Sau khi qua truyền thông sẽ có trễ do ta xem xét hệ thống hai robot ở vị trí cách xa nhau và hai đường dây độc lập với nhau nên thời gian trễ là khác nhau và thay đổi theo thời gian us  t um  tT1(t) vm  t  vs  tT2(t)  (3-25)

Từ(3-26)ta rút ra các biến trung gian(3-28), với quan điểm mạng hai cửa những biến trung gian này đƣợc xem nhƣ điện áp và dòng điện của mạch điện x  2b u;F'  uv  m B m m m m (3-26)

Theo(3-28), do đƣợc xem nhƣ điện áp và dòng điện của mạch điện nên ta sẽ có đƣợc công thức tính công suất của hệ thống nhƣ sau:

Theo(3-2)thì ta sẽ chọn đƣợc công suất tiêu tán và đạo hàm bậc nhất của năng lƣợng nhƣ sau: dE  d d t d t t

P&P mm ss m mm m s s ss mm ss mm m ss s

Côngsuấttiêutántheo(3-31)đƣợctáchrathànhcácthànhphầnbênphíamastervàbên phía slave Mục đích tách ra công suất tiêu tán thành hai thành phần nhƣ vậysẽgiúp ta dễ dàng xử lý hơn do chỉ xử lý độc lập với nhau bằng bộ tínhtoán

3.2.2 Bộ điều khiển và bộ tính toán

Lý thuyết hệ thống thụ động [25, 34] và vấn đề ta mắc phải ở đây là thời gian trễ thay đổi theo thời gian nên cần phải có bộ tính toán và bộ điều khiển để giúp thụ động hóa hệ thống Ta có thể hiểu phương thức hoạt động được đề xuấtbởiHannaford là dựa trên việc xem xét hệ đã thỏa mãn yêu cầu đ t ra hay chưa,nếuchưasẽbùthêmđểhệđạtđượcyêucầuđềra.Ởnhữngnghiêncứutrướcđó,cáctác giả cần sử dụng đến giả thiết T 1,

1, còn trong nghiên cứu này sẽ chỉ cần hạn chế đƣợc đạo hàm của thời gian trễ đó

Bộ điều khiển và bộ tính toán với mục đích đƣa hệ về thụ động đƣợc thực hiệnnhƣsau:

Với hai hệ số bộ điều khiển K m &K s đƣợc điều chỉnh bởi hai bộ tính toán cal m cal s

Tiếp tục nhìn theo quan điểm mạng hai cửa tính lại công suất của hệ thống nhƣ sau:

  P m K x T x    P s K F T F   dE diss mm m diss ss s dt

Ta sẽ có các công suất tiêu tán mới ở hai phía master vàslave m' s' diss diss nhƣ sau:

 K x T x (3-35) diss diss m mm m m ca dis

P  x m m m ss ss ss 1 ss cal ss s

P s' P s  K F T F (3-36) diss diss ss s Áp dụng (3-32),(3-33) và (3-35) vào (3-37) và (3-38) ta sẽ đƣợc nhƣ sau:

P m' P m  K x T x u T u v T v     T(t)  v T v (3-37) diss cal m mm  2 mm 2 2 mm  2 mm

Nếu P m,s 0thì ta chọn K m,s 0suy ra P m',s' 0sẽ thỏa mãn(3-22)

Nếu m,s cal thì ta chọn hai hệ số

K m &K s nhƣ sau để có diss m',s' m T m cal m m  1 (3-39)

Công suất khi đó sẽ là:

PF T x F T  x ' KF    uv  T vKF T F ss s s ss s s s ss s d t (3-41)

1 ss ss ss ss s dE dt  d dt t

P   1T  t    u T u  u T v  v T v  K F T F diss 1 ss ss ss ss s (3-43)

Hình 17 Scattering kết hợp với TDPA s m ca mm mm mm 2 mm cal m mm t x  F  K xx  uu  mmm m '  T T  mmmmm m m v K x x T x x 

Nếu al sc 0thì chọn K s 0ta sẽ có P diss 0

Nếu sc al 0thì chọn K s nhƣ sau đểcó P diss 0

Công suất khi đó sẽ là:

2 mm mm mm m mm dE d t T 

 u T v  u T u  K x T x diss 2 mm mm mm m mm (3-47)

Nếu P m 0thì chọn K m 0ta sẽ có P diss 0

Nếu P m 0 thì chọn K nhƣ sau đểcó P 0

Sơ đồ(Hình 17)đƣợc đƣa ra bàn về phép biến đổi biến sóng – triệt tiêu sóng phản xạ và bộ TDPA cùng với hai hệ robot và truyền thông, là 1 phát triển của Chada [20] Tiếp đó, tín hiệu rm  t

 đƣợc truyền từ master robot mang thông tin về vị trí và vận tốc sang phía robot thực thi kết hợp với tín hiệu rs  t

 tạo thành bộ điều khiển PD – Controller giữa sai lệch giữa vị trí và sai lệch giữa vận tốc của hai robot.

Lực tác dụng bên phía slave gồm hai thành phần  s   sDISS   sPD , s DISS mang ý nghĩa tiêu tán và sPD

 sPD  t K s  r m  tT 1  t  r s  t  có cấu trúc giống bộ PD – controller nhƣ sau:

Lực tác dụng bên phía master gồm hai thành phần m   mDISS   mPD ,  mDISS mang ý nghĩa tiêu tán và mPD có cấu trúc giống bộ PD – controller nhƣ sau:

Bộđiềukhiểnđƣợcđƣara(3-53,3-54)làsựpháttriểntừ[26]dựavàobiếnsóngmới đƣợc đề xuất(3-25).

Điều khiểnthíchnghi

Ý tưởng sử dụng biến sóng đã góp phần làm đơn giản hóa rất nhiềutrongviệc tính toán và xử lí tính ổn định cho hệ thống Tuy nhiên bên cạnh nhữngưuđiểm mà phương pháp này mang lại, nó cũng tồn tại một số m t hạn chế.Trướctiên, do đ c thù của phương pháp, nên hệ thống không tự nó bù trọng trườngmàphải dùng một hệ thống tách biệt để thực hiện công việc này [55] Bên cạnh đó, khi truyền biến sóng thì khoảng thời gian trễ thường được coi là hằng số ho cnếukhông thì cũng có sự biến thiên chậm Để khắc phục những hạn chế trên, năm 2004, N Chopra và M. Spong đã đƣa rabộđiều khiển thích nghi chohệBT[62].Sau đó bốn năm, tức năm

2008, hai tác giả trên tiếp tục cải tiến hệ thống của mình với việc đƣa ra một biến truyền mới [57] và đến năm 2009, E Nuno và R.Ortegatiếp tục cải tiến hệ thống trên bằng việc sử dụng tín hiệu mới cho luật thích nghi[55].Tuyđãđƣợccảitiếnkhánhiềunhƣngvẫnchƣaxửlíđƣợcyếutốtrễthayđổitheo thờigian. i i i i i i i h i i i ii i ii i i c i

Phương pháp điều khiển thích nghi cốt lõi của phương pháp là bộ điều khiển thích nghi đƣợc xây dựng dựa trên nghiên cứu của E Nuno và R Ortega

[55] Hệ thống kế thừa những tính chất vốn có nhƣ tính ổn định, bám quĩ đạo. Đồng thời cũng khắc nhƣợc điểm của hệ thống cũ, đó là xử lí trễ thay đổi theo thời gian.

Robot thực thi(remote robot)và robot điều khiển(local robot)đƣợcmôhình hóa thành c p robot gồm n bậc tự do(n-DOF) với sự tương tác giữa robotvàmôitrường(cũngnhưgiữarobotvàconngười)đượcchobởi:

Ml  ql  qlCl  ql,ql  qlgl  ql    l   h

Mr  qr  qrCr  qr,qr  qrgr  qr    e  r

(3-55) với q,q,q R n lần lƣợtlà vị trí,vântốc,gia tốc, của cáckhớprobot; M  q  Rnn là các ma trận quántính; C  q,q  R n  n là hiệu ứng hướng tâm và Coriolis; g  q  Rn là trọng lực tác dụng lên tay máy;  Rn là tín hiệu điều khiển;  Rn và i i i e

 R n là tác động của môi trường(environment)và con người(human) Ở đây, kí hiệuiđể thay thế chol (local)ho cr (remote).

Mô hình hệ thống cũng có những tính chất động học quen thuộc nhƣ sau:

P1 Ma trận quán tính bị ch n trên và ch n dưới:

P2 Quan hệ giữa ma trận quán tính và ma trận Coriolis đƣợc biểu thị:

P3 Ma trận Coriolis bị ch n với q,qR n k i R 0 ví dụ Ci  qi,qi  q i k c i q 2

P4 Hệ động học là hệ có thể tham số hóa.Do đó

Mi  qi  qiCi  qi,qi  qigi  qi  Yi  qi,qi,qi   i i i i i

  ˆ ii i Y  T vớiY  q,q,q  Rnp là ma trận hàm đã biết và

 R n là véc tơ tham số chƣa xác định rõ

Bên cạnh đó, chúng ta cũng cần xét đến giả thiết sau:

A1 Thời gian trễ biến đổi theo thời gian, luôn dương và bị ch n trênbởi T ,có i nghĩa là 0Ti  t  TM

3.3.2 Phương pháp điều khiển th chnghi

Phương pháp điều khiển(3-56)vận dụng cho hệ BT được mô tả như(3-55):

 l M ˆ l  ql  elC ˆ l  ql,ql  elgˆ l  ql    l (3-56)

 r M ˆ r  qr  er C ˆ r  qr,qr  ergˆ r  qr    r vàvới Y  ˆ M ˆ q  eC ˆ q,q  egˆ q  ii i i i i ii i i i khiđótaviếtlại l Yl  ql,ql,el,el  ˆ  ;

 r Yr  qr,qr,er,er  ˆ  

Bây giờ ta sẽ định nghĩa tín hiệu đồng bộ i nhƣ sau:

Kết hợp(3-55)và(3-56)và sử dụng(3-57)ta có:

Ml  ql  l Cl  ql,ql  l Yl  l   l   h

Mr  qr  r Cr  qr,qr  r Yr  r   r   e ở đó, luật thích nghi đƣợc xác định nhƣ sau: i (3-59) với i làmatrậnthựcxácđịnhdương.Momen i là:

 i K  i  Bq i (3-60) i với K là ma trận thực xác định dương còn B là ma trận đường chéo xác định dương.

Mệnh đề 1:Với mô hình được nêu ra ở (3-55)ở trạng thái tự do – không có ràngbuộc(  h   e  0 )đượcđiềukhiểnbởi( 3-56) vớiluậtthíchnghi( 3-59) vàmomenliên kết (3-60) kết hợp với (3-57).Với mọi trễ truyền thông thỏa mãn giả thiết A1,mọi tín hiệu trong hệ thống đều bị chặn Hơn nữa, sai lệch vị trí và tốc độ còn tiến vềkhông. Để chứng minh mệnh đề trên, cần thiết phải sử dụng bổ đề 1 có vai trò đánh giá thành phần đạo hàm của hàm ứng viên Lyapunov(3-62):

Bổ đề 1:Với mọi véc tơ tín hiệu x, y và mọi biến thời gian thỏa mãn A1 và  0 bất kì ta luôn có: t 0

Chứng minh:Trước tiên ta đưa ra hàm ứng viên Lyapunov như sau:

Dễ thấy V xác định dương và thuộc lớp K với theo hệ (58):

 i ,  i ,e i Ta có đạo hàm của V dọc

V    T    B  q T qq T qq T qq T q  \ i  l,r  ii ll rl lr rr

Từ (63) và (64) ta suy ra

Sử dụng bổ đề 1, ta đƣợc:

Hình 18 Sơ đồ hệ thống điều khiển 2 phía cho hệ BT

2 Rõ ràng ta thấy với các hằng số i chọn trước, ta luôn tìm đƣợc  i thỏa mãn i 0 Từ đó, kết hợp với tính chất P1, chú ý rằng V  t  V  0 , ta đƣợc(3-62)bị ch n Vậy ql,qr,qlqr 

Tiếp theo, ta sẽ viết lại e l nhƣsau: e l q r  tT  t  q l q r  tT  t  q r q r q l với chú ý rằng qlq   và qq  tT  t   T r  t  q  t   d  *T2q 2 (sử dụng bất đẳng r r r r  r r r2

0 thức Schwartz) Điều này đồng nghĩa với

2 Bằng lí luận tươngtự e r  2 Do đó i và i bị ch n Phần chứng minh tiếp theo ta sẽ chỉ ra các tín hiệu trong hệ thống hội tụ về không Viết lại(3-55), với luật điều khiển(3-56)và e   h 0

d t t q  Mq [Mq 1 e l  lllll ˆ ˆ  Cq , qe   Cq , qq ]

 ll  ll lll   ll q r  Mq [M 1 q ˆ  e  Cˆ q , q rrrrrrrrrrrrrr e    C q , q  q ]

Vì ei,ei,  i ,qi  kết hợp với tính chất P1 và P3, ta đi đến kết luận rằng q i  

Từ đó, theo bổ đề Barbalat ta đi đến kết luận q i 0 khi t, vì q i  và q i 

2   Để chỉ ra khả năng bám của hệ thống ta chứng minh rằng w nếu q i 0 Lấy vi phân(3-65)ta đƣợc hai thành phần Thành phần thứ nhất gồm

M1 q nhân với một tín hiệu bị ch n Thành phần thứ hai gồm M1 q  nhân

  với vi phân của thành phần trong dấu ngo c vuông Với thanh phần đầu tiên ta có: d M 1 M 1 M M 1 M 1  CC T  M 1 , dt i i i i i i i i dễ thấy nó bị ch n do tính chất P1 và P3 Xét đến thành phần thứ hai, thành phần viphâncủabiểuthứctrongdấungoc vuôngở(3-64)bịchn , vìđólàtổngcủa các phần bị ch n Hệ quả tất yếu là d/dt  qi  do đó q i liên tục đều Sử dụng bổ đề Barbalat, ta đi đến kết luận biến khớp phía local và remote: q i 0 Từ đó dẫn đến kết quả về sự hội tụ của2 limq l q r  tT r  t  0

Cấu trúc điều khiển đƣợc thể hiện nhƣ trong Mệnh đề 1,(Hình 18)làsựphát triển của Nuno [55] với trễ truyền thông thay đổi nhờ sử dụng mômen liên kết(3-

CẤU TRÚC ĐIỀU KHIỂN VÀ MÔ PHỎNGHỆTHỐNG

Cấu trúcđiềukhiển

Sử dụng mô hình Master, Slave và mô hình môi trường cùng với phươngphápđiều khiển bám tối ưu ta có được cấu trúc điều khiển như sau:

Figure 1.Sơ đồ điều khiển tối ưu hệ Bilateral Teleoperation

Trong cấu trúc điều khiển này, thông tin đƣợc truyền đi từ Master đến Slavelàtín hiệu trạng thái của Master, và thông tin đƣợc truyền từ Slave về Master làtínhiệu trạng thái của Slave.

Ma trận phản hồi trạng thái phía Master

Ma trận K e  k e1 k e2 thể hiện sự tương tác giữa Slave với môi trường.

Ma trận tương tác giữa Slave vàMaster hệ số phản hồi lực.

Bộ điều khiển cho Master đƣợc sử dụng ở đây là bộ điều khiển phản hồi trạng thái.

Tín hiệu điều khiển cho Masteru m (t) sẽ là: u m (t)K m x m (t)R m x s (t)F m (t) (4-1)

Thay vào phương trình trạng thái của Master ta được: x m (t)(A m B m K m )x m (t)B m R m x s (t)B m F m (t) (4-2)

4.1.3 Điều khiển phíaSlave Ở Slave, ta sử dụng bộ điều khiển bám tối ƣu Khối Optimal Control có đầu vào là x md vàx s , trong đó

A  x md là tín hiệu đ t cho bộ điều khiển và nhiệm vụ đ t ra là x s phải bám theo tín hiệu đó Đầu ra của bộ điều khiển tốiưu u s (t) tác động lên hệ Slave – môi trường, do đó ta sẽ sử dụng mô hình trạng thái hệ Slave– môitrườngđểtínhtoánbộđiềukhiển.MôhìnhcủaSlave–môitrườngđượcchoở phươngtrình: với A se A s B s K e

Hàm chi phí đƣợc định nghĩa là:

(4-4) với r(t)x md x m (t) Tín hiệu điều khiển đƣợc tính theo công thức: u(t)R 1 B T K(t)x(t)R 1 B T s(t) s s s s s s (4-5)

Trong đó K s (t) và s s (t) được tính từ các phương trình:

K(t)K(t)AA T K(t)QK(t)B R 1 B T K(t) s s se se s s s s s s(t)[A T K(t)BR 1 B T ]s(t)Qx(t) s se s s s s m

Với các điều kiện biên:

Như vậy để tính ra tín hiệu điều khiển cho Slave, ta tích phân 2 phương trình vi phân(4-6)từt f đếnt 0 và sử dụng các điều kiện biên(4-7)

Tuy nhiên để tích phân ngược từt f đến t 0 , thì tín hiệu x m (t) phải biết trước trong khoảng[t 0 ;t f ], nhƣng điều này là không thể vì trạng thái của Master là đại x s A se x s B s u s (4-3) lƣợng tự do, phụ thuộc vào bản thân Master và đầu vào của nó Khác với các bài toán điều khiển bám khác, tín hiệu đ t thường biết trước trong một khoảng thời gian thì ở đây, tín hiệu đ t cũng là đại lƣợng chƣa biết Do vậy, trong bài toán này, ta có thể tính gần đúngK s vàs s khi cho t f  Khi t f , các đạo hàmK s vàs s có thể cho bằng 0, do đó, thay vì giải phương trình vi phân, ta chỉ cần giải các phương trình đại số:

0[A T se K(t)BR s 1 B s T ]s(t)Qx(t s s ) m (4-9) Phươngtrình (4-8)là phương trình đại số Riccati, giải phương trình này,t a cóthểtìmđược K s Còn phương trình(4-9)tương đương với: s(t)[A T K(t)BR 1 B T ] 1 Qx(t) s se s s s m (4-10)

Nhƣ vậy, ta có thể giải và tìm đƣợcK s vàs s , từ đó tìm đƣợc tín hiệu điều khiển cho Slave.

Ta sẽ tiến hành mô phỏng để kiểm nghiệm chất lƣợng của bộ điều khiển Các chất lượng mà ta hướng đến là sự ổn định hệ thống và khả năng bám của Slave theo Master.

Figure 2 Sơ đồ mô phỏng hệ thống bằng Simulink m s

Các thông số sử dụng trong quá trình mô phỏng:

- Thông số của Master vàSlave:

- Sự tương tác giữa Slave và môitrường: b e 2

- Giá trị của ma trận phản hồi trạngthái:

- Thông số các ma trậnQvàRđƣợc lựa chọnlà:

Kết quả mô phỏng khi thời gian trễ là 0.1s:(Master – nét liền, Slave – nét đứt) s

Figure 3 Vị trí của Master và Slave khi tín hiệu vào là hàm bước nhảy

Figure 4 Vị trí của Master và Slave khi tín hiệu vào là xung chữ nhật

Khi thời gian trễ là 0.5s, kết quả thu được:

Figure 5 Vị trí của Master và Slave khi tín hiệu vào là hàm bước nhảy

Figure 6 Vị trí của Master và Slave khi tín hiệu vào là xung chữ nhậtNhận xét:

- Tín hiệu của Slave bám theo tín hiệu của Master cả trong trường hợp thờigiantrễ là 0.1shay0.5s.

Cấu trúc điều khiểnbiếnsóng

Figure 7 Scattering kết hợp với TDPA

Master robot và salve robot có các thông số về khối lượng và chiều dài của taymáy lần lượt là:

Trạng thái ban đầu của các biến trạng thái lần lượt là: q   0 

   Để kiểm chứng lý thuyết ta tiến hành mô phỏng hệ hai robot với bậc tự do là hai khớp quay và bỏ qua tác dụng của trọngtrường.

Có thể thấy m c dù hệ thống chịu tác động của con người(Phía Master)cũngnhư môi trường(Phía Slave)(Figure 10), (Figure 11) nhưng với tác độngđiềukhiển đƣợc đề xuất(3-34…3-37)thì luôn đảm bảo khả năng bám giữa 2phía(Figure 8), (Figure 9)mc d ù c h ị u ả n h h ƣ ở n g c ủ a t r ễ t r u y ề n t h ô n g t h a y đổi.

Figure 8 Biến khớp thứ nhất của hai hệ robot

Figure 9 Biến khớp thứ hai của hai hệ robot

Figure 10 Lực thứ nhất của con người và môi trường

Figure 11 Lực thứ hai của con người và môi trường

Cấu trúc điều khiểnthíchnghi

Figure 12 Sơ đồ hệ thống điều khiển 2 phía cho hệ BT

Cặp robot có các thông số như sau.

0.6kg. Trạng thái đầu của các khớp nối là: l l r r q 0 q 0 0;q 0  0.8 0.7 T,q

Các số hạng thành phần của ma trận quán tính M i  q i  là:

Các số hạng thành phần ma trận Coriolis Ciqi,qilà:

Các số hạng của vector trọng lực gi  qi là: g 11

Trongđó, c 1 ,s 1 ,c 12 là viết tắt của cos q 1 i  ,sin  q 1 i  ,cos  q 1 i

Ma trận tham số hóa đƣợc sử dụng cho cả hai robot có dạng nhƣ sau:

 l 2 l 2  l lc    e l l q s  glc khi đó ta có vector tham số là:  m mT

  1 i 2 i  Ở đây ta chọn thông số bộ điều khiển nhƣ sau:

Chúng ta thực hiện mô phỏng với thời gian trễ dao động từ 0-0.5s Lúcnày,hệ thống sẽ chịu tác bởi lực con người phía Master(Figure 13)và khi đó bộđiềukhiển sẽ đƣa ra kết quả với tham số chỉnh định đƣợc thể hiện ở(Figure 14)và mcdù tham sốnàykhông hội tụ về tham số thực nhƣng điều quan trọng hơn là nhờvàocấutrúcđiềukhiểnđómàcósựhộitụgiữa2thànhphầnbiếnkhớpphíaMastervà

Slave(Figure 15)m c dù trễ truyền thông thay đổi cũng nhƣ bất định về tham số.

Figure 13 Lực tác động của con người ết quả mô phỏng thu được

Figure 14 Tham số ước lượng dựa theo bộ điều khiển đề nghị

Figure 15 Góc lệch của các khớp của robot điều khiển và thực thi sử dụng bộđiều khiển đề nghị 4.3.3 Nhận xét :

Cấu trúc điều khiển cho hệ BT đƣợc nêu trong mệnh đề 1 – Fig 1 đã đảm bảo yêu cầu hội tụ giữa biến khớp 2 phía (Master, Slave) m c dù chịu ảnh hưởng của trễ truyền thông thay đổi cũng nhƣ tham số bất định

KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN Đề tài đã nghiên cứu về hệBilateral Teleoperation, một hệ robotic khá mới đối với Việt Nam Một bộ điều khiển bám tối ưu theo phương pháp biến phânđãđược xây dựng để áp dụng cho hệBilateral Teleoperationdưới ảnh hưởng củatrễtruyền thông Đề tài đã cho ra những kết quả bước đầu minh chứng cho việc cóthểsử dụng điều khiển tối ƣu để ổn định một hệBilateral Teleoperationcó trễ. Bộđiềukhiển cũng có những chất lƣợng đáng chú ý nhƣ khả năng bám của SlavetheoMaster là khá tốt Ưu điểm của hệ thống này đó chính là người điều khiển cóthểtrực tiếp quan sát và điều khiển hoạt đông của robot từ xa, không chỉ có vậy phía robot thực thi cũng sẽ gửi về những thông tin cần thiết(lực cản môi trường, masát,…)giúp người điều khiển kịp thời xử lí tình huống(thay đổi quỹ đạo, thayđổilực tác dụng) Tuy nhiên bên cạnh những ƣu điểm đó, hệ BT cũngđt ra nhữngkhókhăn không nhỏ trong bài toán điều khiển Bên cạnh sự quan tâm đến tính ổn định của hệ thống, thì hệ BT còn tồn tại hai vấn đề lớn khác Thứ nhất là sự bám quỹ đạo và vận tốc giữa hai robot, giúp đảm bảo sự tương đồng trong hoạt động giữahaiphía robot cũng chính là yếu tố tạo nên sự ƣu việt cho hệ BT Ngoài ra, do hairobotđ t cách xa nhau nên sẽ có sự chậm trễ trong truyền đạt tín hiệu, dẫn đến khó khăn trong điều khiểnrobot.

Tuy nhiên, vẫn còn có một số hạn chế mà đồ án vẫn chƣa giải quyết đƣợc,nhƣmới chỉ cho bám chuyển động và bám một phía(vị trí và vận tốc Slave bám theo vịtrí và vận tốc Master), chưa xét cho hệ có ràng buộc và môi trường thay đổiliêntục.

Một số hướng phát triển sắp tới của đề tài sẽ là:

- Giải quyết bám 2 phía: Slave bám Master và ngƣợclại.

- Sử dụng cảm biến lực ở phía slave để cải thiện độ minh bạch của hệ thống. Việc sử dụng cảm biến để đo và tính toán lực tương tác với môi trườngsẽgiảiquyếtđượccảvấnđềmôitrườngliêntụcthayđổivàkhómôhìnhhóa.

- Thêm ràng buộc cho tay máy Slave: Slave sẽ phải thực hiện một hành động nhất định nhƣ đi theo một quỹ đạo, thực thi một tác vụ…

NXB Bách Khoa Hà Nội,2007.

[1] E Nuủo, R Ortega and L Basaủez, "An adaptive controller for nonlinear bilateral teleoperators", Automatica J IFAC, vol 46, no 1, pp 155-159, 2010

[2] E Nuủo, L Basaủez, R Ortega and M W Spong, "Position tracking for nonlinear teleoperators with variable time-delay", Int J Rob Res., vol 28, no 7, pp 895-910,2009

[3] Chopra, N., Spong, M W., & Lozano, R (2008) Synchronization of bilateral teleoperators with time delay Automatica, 44(8),2142-2148.

[4] Anderson, R and Spong, M (1989) Bilateral control of teleoperators with time delay IEEE Transactions on Automatic Control, 34(5):494–501.

[5] S.Ganjefara,S.Najibia,andH.Momenib,‖Anovelstructurefortheoptimalcontrol of bilateral teleoperation systems with variable time delay,‖Journalof the Franklin Institute, 7 (2011), pp 1537 –1555.

[6] Niemeyer, G., & Slotine, J J (1991) Stable adaptive teleoperation IEEE

[7] Ortega, R., & Spong, M W (1989) Adaptive motion control of rigid robots:

[8] Chopra, N., Spong, M., Hirche, S and Buss, M (2003) Bilateral teleoperation over the Internet: the time varying delay problem Proceedings of the 2003 American Control Conference, Vol 1 (Part 4), pp.155–160.

[9] Li, Zhijun, Yuanqing Xia, and Chun-Yi Su Intelligent Networked

[10] Kelly, R., Santibỏủez, V., & Loria, A (2005) Control of robot manipulators in joint space.Springer.

[11] Spong, M W., Hutchinson, S., & Vidyasagar, M (2005) Robot modeling and control.Wiley.

[12] Nuủo, E., Ortega, R., Barabanov, N and Basaủez, L (2008) A globally stable PD controller for bilateral teleoperators IEEE Transactions on Robotics, 24(3):753–758.

[13] Anderson, R J & Spong, M W.: Asymptotic stability for force reflecting teleoperators with time delay InProceedings of the IEEE international conference on robotics and automation(Vol 3, pp 1618–1625), 1989a.

[14] Anderson, R J & Spong, M W.: Bilateral control of teleoperators with timedelay.InProceedingsoftheIEEEconferenceondecisionandcontrol (Vol 1, pp 167–173), Austin, TX, 1988.

[ 15] Anderson, R J & Spong, M W.: Bilateral control of teleoperators with timedelay.IEEETransactionsonAutomaticControl,34(5),494–501, 1989b.

[ 16] Bemporad, A.: Predictive control of teleoperated constrained systems with unbounded communication delays InProceedings of the IEEE conference on decision and control(Vol 2, pp 2133–2138), 1998.

[17] Benedetti, C.; Franchini, M & Fiorini, P.: Stable tracking in variable time- delay teleoperation InProceedings of the IEEE/RSJ internationalconference on intelligent robots and systems(Vol 4, pp 2252–2257), Maui,

[18] Buttolo, P., Braathen, P., & Hannaford, B.: Sliding control of force reflecting teleoperation: Preliminary studies InPRESENCE(Vol 3,pp. 158–172), 1994.

[19] Cho, H C., Park, J H., Kim, K., & Park, J.-O.: Sliding-mode-based impedance controller for bilateral teleoperation under varying time-delay In

Proceedings of the IEEE international conference on robotics and automation(Vol 1, pp 1025–1030), Seoul, Korea, 2001.

[20] Chopra, N & Spong, M W.: Synchronization of networked passive systems with applications to bilateral teleoperation InSociety of instrumentationand control engineering of Japan annual conference, Okayama,J a p a n ,

[21] Chopra, N.; Spong, M W & Lozano, R.: Adaptive coordination control of bilateral teleoperators with time delay InProceedings of the IEEE conference on decision and control(pp 4540–4547), 2004.

[22] Ferre, M.; Buss, M.; Aracil, R.; Melchiorri, C & Balaguer C (Eds.):

Advances in Telerobotics.Springer-Verlag Berlin Heidelberg, 2007.

[23] Ganjefar, S.; Najibi, S & Momeni, H.: A novel structure for the optimal control of bilateral teleoperation systems with variable time delay.Journalof the Franklin Institute, 348 (2011), 1537– 1555,2010.

[24] Goldberg, K.; Mascha, M.; Gentner, S.; Rothenberg, N.; Sutter, C &

Wiegley, J.: Desktop teleoperation via the world wide web. InProceedingsof the IEEE international conference on robotics and automation(Vol 1, pp 654–659), 1995.

[25] Hashtrudi-Zaad, K., & Salcudean, S E.: Adaptive transparent impedance reflecting teleoperation In Proceedings of the IEEE internationalconference on robotics and automation(Vol 2, pp

[26] Hokayem, P.F & Spong, M.W.: Bilateral teleperation: An historical survey.

[27] Kirk D.: Optimal Control Theory:A n I n t r o d u c t i o n Courier

[28] Lawrence, D A.: Stability and transparency in bilateral teleoperation IEEE

Transactions on Robotics and Automation, 9(5), 625–637, 1992.

[29] Lee, D & Spong, M W.: Bilateral teleoperation of multiple cooperative robots over delayed communication networks: Theory.Proceedings of IEEE international conference on robotics and automation(pp 362–367), 2005a.

[30] Lee, D & Spong, M.W.: Passive bilateral control of teleoperators under constant time-delay InProceedings of the IFAC World congress, 2005b.

[31] Lee, D & Spong, M.W.: Passive bilateral control of teleoperators under constant time delay.IEEE Transactions on Robotics,22(2), 269–281,

[32] Lee, H.-K., & Chung, M J.: Adaptive controller of a master–slave system for transparent teleoperation.Journal of Robotic Systems,15(8), 465–475, 1998.

[33] Li, Z.; Cao, X.; Tang, Y.; Li, Rui & Ye, W.: Bilateral Teleoperation of

Holonomic Constrained Robotic Systems With Time-Varying Delays.IEEE

Transactions of Instrumentation and Measurement,2012.

[34] Mirfakhrai, T & Payandeh, S.: A delay prediction approach for teleo- peration over the internet InProceedings of the IEEE international conference on robotics and automation(Vol 3, pp 2178–2183), 2002.

[35] Niemeyer, G & Slotine, J.-J E.: Stable adaptive teleoperation.IEEE

[36] Niemeyer, G & Slotine, J.-J E.: Transient shaping in force-reflecting teleoperation InInternational conference on advanced robotics(Vol 1, pp. 261–266), 1991b.

[37] Oboe, R.: Web-interfaced, force-reflecting teleoperation systems.IEEE ransactions on Industrial Electronics,48(6), 1257–1265, 2001.

[38] Ruiz, F.S.: Environment on-line parameter estimation for teleoperation systems, 2012.

[39] Ryu, J.-H., & Kwon, D.-S.: A novel adaptive bilateral control scheme using similar closed-loop dynamic characteristics of master/slave manipulators.

[41] Sheridan, T.B.: Teleoperation, telerobotics and teleopresence: A progress report.Control Engineering Practice, vol.3, no 2, pp 205–214, 1995.

Ngày đăng: 09/06/2023, 06:17

Nguồn tham khảo

Tài liệu tham khảo Loại Chi tiết
[1] E. Nuủo, R. Ortega and L. Basaủez, "An adaptive controller for nonlinear bilateral teleoperators", Automatica J IFAC, vol. 46, no. 1, pp. 155-159, 2010 Sách, tạp chí
Tiêu đề: An adaptive controller for nonlinearbilateral teleoperators
[2] E. Nuủo, L. Basaủez, R. Ortega and M. W. Spong, "Position tracking for nonlinear teleoperators with variable time-delay", Int. J. Rob. Res., vol. 28, no. 7, pp. 895-910,2009 Sách, tạp chí
Tiêu đề: Position tracking fornonlinear teleoperators with variable time-delay
[13] Anderson, R. J. & Spong, M. W.: Asymptotic stability for force reflecting teleoperators with time delay. InProceedings of the IEEE international conference on robotics and automation(Vol. 3, pp. 1618–1625), 1989a Sách, tạp chí
Tiêu đề: Proceedings of the IEEE internationalconference on robotics and automation
[17] Benedetti, C.; Franchini, M. & Fiorini, P.: Stable tracking in variable time- delay teleoperation. InProceedings of the IEEE/RSJ internationalconference on intelligent robots and systems(Vol. 4, pp. 2252–2257), Maui,HI, USA, October–November 2001 Sách, tạp chí
Tiêu đề: Proceedings of the IEEE/RSJ internationalconferenceon intelligent robots and systems
[18] Buttolo, P., Braathen, P., & Hannaford, B.: Sliding control of force reflecting teleoperation: Preliminary studies. InPRESENCE(Vol. 3,pp.158–172), 1994 Sách, tạp chí
Tiêu đề: PRESENCE
[20] Chopra, N. & Spong, M. W.: Synchronization of networked passive systems with applications to bilateral teleoperation. InSociety of instrumentationand control engineering of Japan annual conference, Okayama,J a p a n ,August 8–10, 2005 Sách, tạp chí
Tiêu đề: Society of instrumentationandcontrol engineering of Japan annual conference
[21] Chopra, N.; Spong, M. W. & Lozano, R.: Adaptive coordination control of bilateral teleoperators with time delay. InProceedings of the IEEEconference on decision and control(pp. 4540–4547), 2004 Sách, tạp chí
Tiêu đề: Proceedings of the IEEE"conference on decision and control
[22] Ferre, M.; Buss, M.; Aracil, R.; Melchiorri, C. & Balaguer C. (Eds.):Advances in Telerobotics.Springer-Verlag Berlin Heidelberg, 2007 Sách, tạp chí
Tiêu đề: Springer-Verlag Berlin Heidelberg
[23] Ganjefar, S.; Najibi, S. & Momeni, H.: A novel structure for the optimal control of bilateral teleoperation systems with variable time delay.Journalof the Franklin Institute, 348 (2011), 1537– 1555,2010 Sách, tạp chí
Tiêu đề: Journalofthe Franklin Institute
Tác giả: Ganjefar, S.; Najibi, S. & Momeni, H.: A novel structure for the optimal control of bilateral teleoperation systems with variable time delay.Journalof the Franklin Institute, 348
Năm: 2011
[24] Goldberg, K.; Mascha, M.; Gentner, S.; Rothenberg, N.; Sutter, C. &Wiegley, J.: Desktop teleoperation via the world wide web.InProceedingsof the IEEE international conference on robotics and automation(Vol. 1,pp. 654–659), 1995 Sách, tạp chí
Tiêu đề: Proceedingsof the IEEE international conference on robotics andautomation
[25] Hashtrudi-Zaad, K., & Salcudean, S. E.: Adaptive transparent impedance reflecting teleoperation. In Proceedings of the IEEEinternationalconference on robotics and automation(Vol. 2, pp.1369–1374),1996 Sách, tạp chí
Tiêu đề: Proceedings of the IEEE"internationalconference on robotics and automation
[26] Hokayem, P.F. & Spong, M.W.: Bilateral teleperation: An historical survey.Automatica,vol. 42, no. 12, pp. 2035–2057, 2006 Sách, tạp chí
Tiêu đề: Automatica
[27] Kirk D.: Optimal Control Theory:A n I n t r o d u c t i o n . Courier DoverPublications, 1998 Sách, tạp chí
Tiêu đề: Courier Dover"Publications
[3] Chopra, N., Spong, M. W., & Lozano, R. (2008). Synchronization of bilateral teleoperators with time delay. Automatica, 44(8),2142-2148 Khác
[4] Anderson, R. and Spong, M. (1989). Bilateral control of teleoperators with time delay. IEEE Transactions on Automatic Control, 34(5):494–501 Khác
[5] S.Ganjefara,S.Najibia,andH.Momenib,‖Anovelstructurefortheoptimalcontrol of bilateral teleoperation systems with variable time delay,‖Journalof the Franklin Institute, 7 (2011), pp. 1537 –1555 Khác
[6] Niemeyer, G., & Slotine, J. J. (1991). Stable adaptive teleoperation. IEEE Journal of Oceanic Engineering, 16(1),152-162 Khác
[7] Ortega, R., & Spong, M. W. (1989). Adaptive motion control of rigid robots:A tutorial. Automatica, 25(6), 877-888 Khác
[8] Chopra, N., Spong, M., Hirche, S. and Buss, M. (2003). Bilateral teleoperation over the Internet: the time varying delay problem. Proceedings of the 2003 American Control Conference, Vol. 1 (Part 4), pp.155–160 Khác
[9] Li, Zhijun, Yuanqing Xia, and Chun-Yi Su. Intelligent Networked Teleoperation Control. Springer,2015 Khác

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w