LỜI NÓI ĐẦU
Ngày nay, điều khiển robot công nghiệp đã và đang được ứng dụng rộng rãitrong nhiều lĩnh vực sản xuất và đời sống Để điều khiển rôbốt đã có rất nhiều phươngpháp khác nhau như dùng bộ điều khiển truyền thống PID, LQR (Linear QuadraticRegulator), LQG (Linear Quadratic Gaussian), STR (Self Tuning Regulator) Cácbộ điều khiển trên được thiết kế trên cơ sở mô hình tuyến tính hoá với những thông sốbiết trước Tuy nhiên Robốt là hệ cấu trúc có tính phi tuyến mạnh, các tham số khôngrõ và thay đổi hoặc chứa các thành phần phi tuyến Ngoài ra trong quá trình làm việchệ còn chịu tác động của các nhiễu bên ngoài có tham số thay đổi Do vậy đối với cácrobot làm việc với yêu cầu đồng thời có độ ổn định và độ chính xác cao thì các bộ điềukhiển trên thể hiện các hạn chế.
Hệ thống điều khiển thích nghi là hệ thống mà cấu trúc và tham số của bộđiều khiển có thể thay đổi theo sự biến thiên thông số của hệ sao cho chất l ượng đảmbảo các chỉ tiêu đã định Đặc biệt hệ điều khiển Learning Feed Forward (LFFC) trêncơ sở mạng nơ ron, đã được nghiên cứu và thiết kế ứng dụng trong thực tế Bộ điềukhiển này có ưu điểm là có khả năng kháng nhiễu hệ thống (Systems Noise) có hiệuquả, nhờ đó độ chính xác và độ ổn định của hệ có thể đồng thời đạt được.
Việc ứng dụng Learning Feed Forward trên cơ sở mạng nơron để điều khiển vị trí cánh
tay rôbốt sẽ nâng cao chất lượng của hệ thống Vì vậy tôi lựa chọn đề tài: “Ứng dụng Learning FeedForward trên cơ sở mạng nơ ron điều khiển vị trí cánh tay robot ”
Luận văn này tác giả phân tích mô hình động học của đối tượng thông qua mô hình toán học đó đưa ra phương án điều khiển Kết quả điều khiển được mô phỏng kiểm chứng trên phần mềm matlab
Luận văn này tác giả trình bày trong 3 chương:
Chương 1: Tổng quan về điều khiển bobot công nghiệp
Chương 2:Learning FeedForward control trên cơ sở mạng nơ ronChương 3 Thiết kế ứng dụng
Trang 2
CHƯƠNG 1: TỔNG QUAN VỀ ĐIỀU KHIỂN ROBOT CÔNG NGHIỆP1.1.Tổng quan về Robot
- Về mặt cơ khí robot là một hệ thống cơ khí bao gồm các thanh nối cứng vàcác khớp Ngoài ra còn các bộ phận khác như thân máy, bệ máy
- Về nội dung kỹ thuật cơ khí, điều khiển và điện tử, robot có thể được địnhnghĩa như sau:
Robot là một cơ cấu cơ khí có một vài bậc tự do, có thể di chuyển như conngười và được điều khiển bằng máy tính;
Robot công nghiệp là một cơ cấu máy có thể lập trình được và làm việc mộtcách tự động không cần sự trợ giúp của con người;
Robot là cơ cấu máy có chức năng như con người và có sự hợp tác giữa cácRobot với nhau.
Sơ đồ Hình 1.1 là sơ đồ điển hình của hệ thống điều khiển vị trí, trên sơ đồ thểhiện các vị trí và tốc độ của khớp thường được đo bởi các sensor như chiết áp, máyphát tốc, các thiết bị mã hoá Các tín hiệu ra được đưa đến khối điều khiển tạo ra tínhiệu điều khiển, điều khiển các khớp các cơ cấu dẫn động làm cho tay máy chuyểnđộng theo quỹ đạo mong muốn
Tổ chức kỹ thuật của Robot được chia thành 4 khối chức năng chính được minhhoạ như sau:
Sơ đồ hệ thống điều khiển vị trí
Quỹ đạo đặt
BỘ ĐIỀU KHIỂN
HỆ THỐNG ĐO (CÁC SENSOR)
Tín hiệu điều
Trang 31.2 Phương trình động học của robot
Với robot công nghiệp có nhiều loại khác nhau và sử dụng nhiều luật điều khiểnkhác nhau Trong khuôn khổ luận văn này tác giả khảo sát robot 2 bậc tự do dùngFeedback kết hợp LFFC (Learning Feedforward Control) trên cơ sở mạng nơ ron đểđiều khiển.
C DS G uM ,sgn
Block A
Block B
Block DBlock C
Sơ đồ tổ chức kỹ thuật của Robot
Trang 4-S : hệ số ma trận đường chéo ma sát Coulomb-G : trọng lực
-u: mô men xoắn của khớp
Trong hình sau mô tả mô hình robot 2 bậc tự do:
Trong đó:
- m1,2: khối lượng của cánh tay 1,2
Trang 5
- l1,2: độ dài cánh tay 1,2
- r1,2: tỷ số truyền của động cơ 1,2- d1,2: ma sát nhớt của khớp nối 1,2-s1,2 là ma sát coulomb của khớp 1,2
Như vậy có thể kết luận rằng: Góc quay của cánh tay robot có thể được điều khiển bởi LFFC Tín hiệu điều khiển Feed – forward mong muốn là:
ud Cd,dd Dd G d Ssgn d M d d Từ đó cho thấy tín hiệu đầu vào điều khiển BSN sau khi đã đơn giản hóa bao gồm cácthành phần , ,, Với robot 2 bậc tự do, số lượng đầu vào là 6.
Kết luận Chương I:
Như vậy với robot 2 bậc tự do sử dụng hệ thống điều khiển Feedback kết hợpvới LFFC trên cơ sở mạng nơ ron, tác giả đã chỉ ra phương trình động học như phươngtrình trên Với tín hiệu vào điều khiển Feed – forward bao gồm , ,, tương ứnglà vị trí góc, vận tốc góc, gia tốc góc Lấy cơ sở từ phương trình này, để xây dựng hệthống điều khiển cho robot 2 bậc tự do
Trang 6
CHƯƠNG 2: LEARNING FEED – FORWARD CONTROL TRÊN CƠ SỞMẠNG NƠ RON
2.1 Giới thiệu.
Việc thiết kế một bộ điều khiển nói chung thường dựa trên một mô hình củamột đối tượng Mô hình đối tượng càng chính xác bao nhiêu thì việc thiết kế bộ điềukhiển càng hiệu quả bấy nhiêu Khi mô hình hóa đối tượng, các vấn đề sau có thể gặpphải:
- Hệ thống quá phức tạp để có thể hiểu được hoặc trình bày một cách đơn giản.- Mô hình quá khó hoặc quá đắt để đánh giá Một số đặc tính của một số tínhchất (phi tuyến) khó có thể đạt được, ví dụ như ma sát….
- Đối tượng có thể chịu ảnh hưởng lớn của nhiễu tác động từ môi trường, điềunày khó dự đoán trước được.
- Các thông số của đối tượng có thể biến đổi theo thời gian.
2.2 Điều khiển học (Learning Control - LC)
Một số định nghĩa về LC sau:
Định nghĩa 2.1: Một bộ LC là một hệ thống điều khiển bao gồm trong đó 1hàm xấp xỉ các ánh xạ đầu vào – đầu ra tương ứng trong suốt quá trình điều khiển màmột hoạt động mong muốn của hệ thống điều khiển đạt được.
Định nghĩa 2.2 (hàm xấp xỉ): Một hàm xấp xỉ là một ánh xạ vào/ra được xácđịnh bởi một hàm được lựa chọn F.,, với các véc tơ thông số được lựa chọn đểhàm F . được xấp xỉ tốt nhất.
Ưu điểm của các bộ điều khiển LC:
Hàm xấp xỉ có khả năng tự khái quát hoá tốt Sự mềm mại của giá trị xấp xỉ cần điều khiển được Đáp ứng ngắn hạn là học tốt.
Sự ổn định lâu dài cần phải được bảo đảm
Trang 7
2.3 Bộ điều khiển học sử dụng sai lệch phản hồi (Feedback Error Learning - FEL)
2.3.1 Cấu trúc điều khiển
Hệ thống LC bao gồm 2 phần:
Bộ điều khiển Feef-forward được biểu thị bằng F, nghĩa là 1 hàm/ánh xạ
rF
uF Khi bộ điều khiển feed-forward bằng với đối tượng nghịch đảo 1
thì đầu ra của đối tượng y sẽ bằng tín hiệu đặt r
Bộ điều khiển phản hồi sai lệch (FEL)
Hàm xấp xỉ phù hợp cho việc điều khiển Yêu cầu bộ nhớ nhỏ
Cơ chế học hội tụ chậm và trải qua vùng giá trị cực tiểu cục bộ Có khả năng tổng quát hoá tốt
Hàm xấp xỉ
Trang 8Học theo sai số phản hồi
Phương thức thứ 2 là sử dụng nhiều bộ điều khiển feed-forward, mỗi một bộđược huấn luyện để thực hiện một nhiệm vụ cụ thể Mỗi một mạng nơ ron giám sáthọc xem là bộ feed-forward nào được sử dụng cho nhiệm vụ nào Mạng giám sát đãhọc từ bộ điều khiển feed-forward nào được áp dụng cho đối tượng đó.
Tất cả điều này nhằm mục đích cải thiện những vấn đề sau:
- Độ hội tụ nhanh hơn Khi việc học diễn ra một cách cục bộ, chỉ có 1 số nhỏcác hàm trọng được thích nghi tạo ra độ hội tụ nhanh.
- Có thể học các dữ liệu tương quan Các vùng của hàm cơ sở đã được trộnlẫn, điều này có ích cho quá trình học các dữ liệu tương quan.
- Không có cực tiểu cục bộ Cơ cấu học không trải qua vùng cực tiểu cục bộ.
2.4 Learning Feedforward Control (LFFC)
0 1 2 3 4 51
0 1 2 3 4 5
0 1 2 3 4 51
B – Spline cơ bản:
a): B – Spline bậc 1b): B – Spline bậc 2 c): B – Spline bậc 3
Trang 9Lớp 1Lớp 2Lớp 3
f .
2.4.2 Mạng nơ ron nhân tạo nhiều lớp
1) Nơ ron
Hình sau chỉ ra cấu trúc của một nơ ron nhân tạo.
Nơ ron nhân tạo
xxxNTRN
x 2) Mạng nơ ron nhân tạo nhiều lớp (Multi layer Perceptron network - MLP)Trong hình sau chỉ ra cấu trúc một MLP
Cấu trúc MLP 3 lớp
Mỗi nơ ron ở lớp thứ n điều được kết nối với các nơ ron ở lớp thứ n1
2.5 Learning Feed – Forward trên cơ sở mạng nơ ron
2.5.1 Lựa chọn các thông số BSNs
Đối với các hệ thống chuyển động, các đầu vào của BSN bao gồm các vị tríđặt, r, và các đạo hàm của nó
Trang 10
2.5.1.1 Sự phân bố B-Spline trên đầu vào của mạng BSN
Đầu ra của BSN là tổng trọng số ước lượng của các B- spline Do đó, sốlượng của các B-Spline và các vị trí của chúng quyết định tính chính xác của giá trịxấp xỉ Các tín hiệu đích có dạng trơn có thể được xấp xỉ một cách chính xác với mộtsố lượng thấp các B-Spline “rộng” Các tín hiệu có độ dao động lớn yêu cầu một sốlượng lớn các B-Spline “hẹp”
Ánh xạ BSN2.5.1.2 Sự lựa chọn các cơ cấu học
Luật online learning như sau: i i(r)e(r)
Và luật offline learning như sau:
Trang 11o E ri : Sai số xấp xỉ được tạo ra bởi mạng, trong LFFC e(ri) là
đầu ra của bộ điều khiển phản hồi uc
o Ns: Số lượng các mẫu đầu vào
2.5.1.3 Sự lựa chọn tốc độ học
Tốc độ học càng lớn thì độ hội tụ của kỹ thuật học càng nhanh Tuy nhiên mộttốc độ học mà lớn thì sẽ làm cho giá trị xấp xỉ thêm nhạy cảm với nhiễu và có thể lànguyên nhân gây mất ổn định.
Bằng việc sử dụng BSN, ta đã có các ưu điểm sau:
Không có cực tiểu cục bộ Đầu ra của BSN là một hàm trọng số tuyến tính.Học cục bộ Khi B-Spline có một nền tảng chắc chắn, ánh xạ vào/ra của BSN
Với Nj là số lượng của B-Spline được định nghĩa ở đầu vào thứ j
Trong đó: yd là đầu ra mong muốn Luật học offline:
Trang 12
1 Tại thời điểm tín hiệu vào xj và tín hiệu học yd,j yjđưa vào BSN(j=1,2, ); Khi B –Spline thứ i cho tín hiệu vào xj xj 0, tính toán trọng số thíchnghi i
2 Tại thời điểm xj 0, iđã thích nghi, i i i
Xét một ví dụ như hình 2.11 sau:
Cơ chế học offline
2.6.2 Luyện mạng nơ ron
Luyện mạng MLP được thực hiện bằng cách thích nghi trọng số giữa các nốtmạng theo cơ chế lan truyền ngược Trọng số thích nghi trong hàm trị, J là nhỏ nhất.Một cách lựa chọn J phổ biến là tổng bình phương các sai lệch của các dữ liệu đãqua.
Trang 13
2.7 LFFC cho chuyển động lặp
2.7.1 Chuyển động lặp
2.7.1.1 Điều khiển học cho chuyển động lặp (Iterative Learning Control - ILC)
Trong luận văn của tác giả, sự ổn định chỉ ra như sau:
- Chỉ ra Learning control bền vững hoặc không bền vững- Dự báo đáp ứng tức thời
- Luật học:
tu te t
b Sơ đồ điều khiển mạch kín:
Trong tần số cho phép, tín hiệu học được cho bởi:
Trang 14
c Sơ đồ ILC đo lường chính xác:
Sơ đồ ILC có đo lường chính xác2.7.1.2 Chuyển động lặp (Repetitive Control - RC)
Trong luận văn này tác giả thảo luận RC nhằm chỉ ra cách xác định các tham sốlearning trong các chuyển động lặp
Sơ đồ điều khiển lặp
Trong hình trên, R là một bộ lọc learning Trong chế độ ổn định của RC, hệthống có thể chỉ ra theo một cách khác:
Sơ đồ tương đương điều khiển lặp
Trang 15
Hệ thống trên là ổn định nếu:
- Hệ thống không chuyển động lặp là ổn định, có nghĩa là CP1
Tiếp theo sẽ nghiên cứu chế độ của RC bằng biện pháp hàm nhạyS được chỉra bởi:
Tiếp theo tính toán tham số lọc học Rđã được thiết kế trước và hoạt động tốtở các dải tần số và chỉ ra như sau:
Từ đó suy ra tham số S như sau:
2.7.2 LFFC cho chuyển động lặp (LFFC for Repetitive Motions)
Khi chuyển động lặp lại, tín hiệu Feed – forward cho ILC và RC coi nhưlà duy nhất là uF r trở thành hàm thời gian trong khoảng t ,0 Tp với Tp làchu kỳ của chuyển động
Trang 16Sự phân bố B – spline này được biểu diễn như hình sau:
Chỉ số thời gian cho loại chuyển động lặp
2.8 Phân tích sự ổn định của LFFC chỉ số thời gian.
Lựa chọn độ rộng của B – spline
Trong một mô hình chính xác của hệ thống P và bộ điều khiển C là sẵn có, giátrị của an và n có thể được tính toán cho tất cả các tần số
Thuật toán 2.8.1:Tính toán giá trị ổn định nhỏ nhất của d dựa trên mô hình chi tiết của hệ thống điều khiển:
1 Chọn một khuôn dạng phân bố B-Spline bao gồm 3 B-Spline: N 32 Xác định an và n: điều này thực hiện được nhờ các bước sau:- Bước 2.1: Chọn n 1;
- Bước 2.2: Tính n
- Bước 2.3: Nếu an 0 chuyển sang bước 3, nếu không tăng n lên một đơn vị
và quay lại bước 2.2
3 kiểm tra xem an và n đã tìm được trong bước trước cỏa thỏa mãn không.Nếu thỏa mãn chuyển sang bước 4, nếu không chuyển sang bước 6
4 Tăng số lượng của B – spline lên một đơn vị: N N15 Chuyển sang bước 2
6 Giá trị d được tính:
Trang 17
Các mô hình hình động học tần thấp có thể sử dụng thuật toán sau:
Thuật toán 2.8.2 (Tính toán giá trị ổn định nhỏ nhất của d với các giả thiếttrên mô hình động học của hệ thống điều khiển)
1 Sử dụng mô hình tần số thấp của hệ thống để tính toán
2 Chọn một khuôn dạng phân bố B-Spline bao gồm 3 B-Spline: N=3 3 Tính toán 1 theo công thức : 2 (rad.s1)
7 Chuyển tới bước 3;
8 Giá trị nhỏ nhất d được cho bởi:
Trang 18
4 Giá trị nhỏ nhất của độ rộng mạng B – spline,dmin được cho bởi:
2.8.2 Phân tích ổn định của LFFC
Sự ổn định của LFFC chỉ số thời gian có thể đảm bảo khi:
1 Chiều rộng của B – spline trong chu kỳ chuyển động,d lớn hơn rất nhiềubề rộng tối thiều dmin s
Trong nghiên cứu này, tác giả sử dụng cách thứ 2 Ở đây sử dụng LFFC chỉ sốthời gian như một bộ lọc học.
LFFC với mạng quy chuẩn
Tín hiệu Feed – forward thích nghi của LFFC được thực hiện theo 2 bước sau:
Bước 1: Trọng số của BSN chỉ số thời gian theo uC, BSN được huấn luyệnoff-line sử dụng tốc độ học bằng 1 Điều này cho đầu ra uR
Trang 19
Huấn luyện BSN chỉ số thời gian
Bước 2: Sau đó trọng số của BSN chỉ số thời gian được thích nghi, LFFC
được huấn luyện sử dụng uR như một tín hiệu học
Thích nghi trọng số của LFFC
Trang 20
Kết luận chương 2:
Như vậy trong chương 2 đã trình phân tích được các bộ điều khiển học(learning control); Cơ sở mạng nơ ron; Các phương pháp luyện mạng nơ ron; phươngpháp quy chuẩn LFFC.
Ngoài ra trong chương còn trình bày tổng quát cách tính toán các tham số cơbản của hệ thống điều khiển LFFC trên cơ sở mạng nơ ron.
Từ những kiến thức cơ sở đã trình bày trong Chương 2 kết hợp với phương trình độnghọc trong Chương 1 có thể đi xây dựng mô hình điều khiển robot 2 bậc tự do dùng bộ
điều khiển Feedback kết hợp LFFC trên cơ sở mạng nơ ron.
Trang 21
CHƯƠNG 3 THIẾT KẾ ỨNG DỤNG3.1 Giới thiệu chung
Trong các chương trước, một số khía cạnh của LFFC trên cơ sở mạng nơ ronđã được đề cập, trong chương này, sẽ áp dụng những kiến thức đó để thiết kế ứng dụngLFFC trên cơ sở mạng nơ ron để điều khiển cánh tay robot 2 bậc tự do Để hoàn thànhnhiệm vụ này cần sơ lược các kết quả sau:
- Bộ điều khiển phản hồi (Feedback Control): Bộ điều khiển phản hồi để bùcác nhiễu ngẫu nhiên và tạo ra tín hiệu học cho bộ Feed – Forward Bộ điều khiểnphản hồi cũng giúp xác định độ rộng của B – Spline.
- Lựa chọn đầu vào của Feed – Forward: Tín hiệu vào của feed – forward đượclựa chọn là vị trí, vận tốc, gia tốc tham chiếu ,,
- Cấu trúc của phần feed – forward: Kết quả nghiên cứu trong chương 2 chothấy việc lựa chọn feed – forward thường là nhiều đầu vào.
- Phân bố B – Spline: Việc lựa chọn độ rộng của B – spline trong LFFC chỉ sốthời gian có thể xác định từ đáp ứng tần số trong vòng phản hồi kín.
- Tốc độ học: Giá trị lớn nhất của tốc độ học mà hội thu được xác định từ đápứng tần số của vòng lặp kín.
3.2 Xây dựng mô hình điều khiển robot 2 bậc tự do
3.2.1 LFFC tiết kiệm
Mô hình LFFC tiết kiệm được cho bởi sơ đồ sau:
Trang 22
a) cấu trúc LFFC đơn; b) Cấu trúc LFFC tiết kiệm
Trong cấu trúc LFFC tiết kiệm, mỗi BSN chỉ bao gồm một trong các tổ hợp
y ,, Việc lựa chọn đầu vào này sao cho mỗi BSN trong mạng BSNs tươngđương có số đầu vào là nhỏ nhất.
3.2.2 Mô hình LFFC tiết kiệm cho cánh tay robot 2 bậc tự do.
Robot 2 bậc tự do có 6 tín hiệu đầu vào Feed – forward đó là , , cho mỗikhớp
Trong robot 2 bậc tự do, Ccó thể bỏ qua khi tốc độ chuyển động thấp
Tín hiệu feed – forward đầu ra mong muốn có dạng sau:
LFFC tiết kiệm được cho bởi sơ đồ sau.