Nghiên cứu điều khiển tối ưu cho cánh tay robot bằng phương pháp quy hoạch phi tuyến
Trang 1Người HD Khoa học: PGS.TS Nguyễn Hữu Công
PGS.TS Nguyễn Hữu Công
HỌC VIÊN
Nguyễn Trung Thành
Trang 3LỜI CAM ĐOAN Tên tôi là: Nguyễn Trung Thành
Sinh ngày 13 tháng 11 năm 1980
Học viên lớp Cao học Khoá 10 Chuyên ngành Tự động hoá- Trường Đại Học Kỹ Thuật Công Nghiệp Thái Nguyên
Đơn vị công tác: Trường Đại học Kỹ thuật Công nghiệp Thái Nguyên
Xin cam đoan: Đề tài: “Nghiên cứu điều khiển tối ưu cho cánh tay Robot
bằng phương pháp Quy hoạch phi tuyến’’ do PGS.TS Nguyễn Hữu Công hướng
dẫn là công trình nghiên cứu của riêng tôi Tất cả các tài liệu tham khảo đều có nguồn gốc, xuất xứ rõ ràng
Nếu sai tôi hoàn toàn chịu trách nhiệm
Thái Nguyên, ngày 20 tháng 10 năm 2009 Tác giả
Trang 4Lời nói đầu ……… 9
CHƯƠNG I GIỚI THIỆU CHUNG VỀ ĐIỀU KHIỂN TỐI ƯU………… 11
1.1 Địnhnghĩa 11
1.2 Điều kiện hạn chế ……… 11
1.3 Bài toán điều khiển tối ưu……… ……… 12
1.3.1 Điều khiển tối ưu tĩnh……….…… 12
1.3.1.1 Mô tả toán học……… ……….……… 13
1.3.1.2 Biểu diễn hình học……….…… 13
1.3.1.3 Giả thiết cho lời giải ……….…… 14
1.3.1.4 Một số phương pháp tìm nghiệm……… 16
1.3.2 Điều khiển tối ưu động……… ………… 24
1.3.2.1 Phương pháp biến phân……… …… 24
1.3.2.2 Phương pháp quy hoạch động của Bellman……… …… 29
1.3.2.3 Nguyên lý cực đại……….……… 34
CHƯƠNG 2: ROBOT CÔNG NGHIỆP VÀ GIỚI THIỆU BÀI TOÁN ĐIỀU KHIỂN ĐỘNG HỌC NGƯỢC ROBOT 39
2.1 Tổng quan về robot công nghiệp 39
2.1.1 Tự động hóa và robot công nghiệp……….……… 43
2.1.2 Các đặc tính của robot công nghiệp……….……… 45
2.1.2.1 Tải trọng……….……… 45
2.1.2.2 Tầm với ……….……… 45
2.1.2.3 Độ phân giải không gian……… 45
2.1.2.4 Độ chính xác……… 46
Trang 52.1.2.5 Độ lặp lại ……….……… 47
2.1.2.6 Độ nhún ……… 47
2.2 Chất lượng quá trình làm việc và các thông số điều khiển ……… 48
2.2.1 Yêu cầu về chất lượng trong điều khiển Robot……….……… 48
2.2.2 Giới thiệu bài toán điều khiển động học ngược Robot ………… 49
2.2.3 Bài toán động học trên quan điểm điều khiển thời gian thực ……… 54
2.2.3.1 Yêu cầu về thời gian thực trong điều khiển động học robot ……… 54
2.2.3.2 Hiệu quả giải thuật trên quan điểm điều khiển thời gian thực…… 56
CHƯƠNG 3: GIẢI BÀI TOÁN ĐIỀU KHIỂN TỐI ƯU CHO CÁNH TAYROBOT 58
3.1 Thành lập bài toán điều khiển……… 58
3.1.1 Mô hình đối tượng……… ……….… 58
3.1.2 Phiếm hàm mục tiêu ……… 61
3.1.2.1 Bài toán tối ưu về độ chính xác về vị trí và hướng của khâu chấp
hành……… 61
3.1.2.2 Bài toán di chuyển tối thiểu……… … 62
3.1.3 Điều kiện giới hạn của các biến 63
3.2 Khả năng ứng dụng của giải thuật trên máy tính……….… 64
3.3 Thành lập bài toán cho một số dạng robot……… 65
3.3.1 Robot cơ cấu 3 khâu phẳng (3 khớp quay)……… 65
3.3.1.1 Phương trình động học (Mô hình toán học) 65
3.3.1.2 Hàm mục tiêu 66
3.3.1.3 Điều kiện hạn chế 67
3.3.2 Robot Elbow (Sáu bậc tự do toàn khớp quay)……….…….… 67
3.3.2.1 Phương trình động học (Mô hình toán học) 67
3.3.2.2 Hàm mục tiêu 68
3.3.2.3 Điều kiện hạn chế ……… ……… … … 69
3.3.3 Robot Puma (Sáu bậc tự do toàn khớp quay)……… 69
3.3.3.1 Phương trình động học (Mô hình toán học) ……….… 69
Trang 63.5.1 Khởi tạo một số ma trận thế ngẫu nhiên cho lời giải……… 74
3.5.2 Ứng dụng Optimization Toolbox trong Matlab để giải bài toán…… 74
3.5.2.1.Giới thiệu Optimization Toolbox trong Matlab……… 74
3.5.2.2 Sử dụng Optimization Toolbox trong Matlab để giải bài toán…… 77
3.5.3 Ứng dụng phương pháp giải thuật di truyền (GA) giải bài toán … … 79
3.5.3.1 Giới thiệu phương pháp giải thuật di truyền (GA)……….…… 79
3.5.3.2 Các kỹ thuật trong giải thuật di truyền GA……… 80
3.5.3.3 Giải bài toán bằng phương pháp di truyền (GA)………….…… … 84
3.5.4 Sử dụng phương pháp khai triển thành đa thức để giải bài toán……… 86
3.5.4.1 Đặt vấn đề……… … 86
3.5.4.2 Đa thức nội suy ……….… … 87
3.5.4.3 Đa thức nội suy Lagrange 88
3.5.4.4 Áp dụng cho bài toán cụ thể……… 88
CHƯƠNG 4 KẾT LUẬN VÀ KIẾN NGHỊ……… 92
4.1 Các kết quả nghiên cứu của Luận văn……… … … 92
4.2 Một số kiến nghị cho hướng nghiên cứu tiếp theo……… … 93
Tài liệu tham khảo……… … 94
Tóm tắt……….… 97
Trang 71 a(…) Approach (Vectơ hướng tiếp cận vật thể của bàn kẹp)
3 Ai Ma trận truyền giữa khâu (i-1) và khâu (i) 4 aij Hệ số thứ (i) của đa thức nội suy thứ (j) 5 AT Transpose (A)
7 D Miền thoả mãn của ràng buộc vậy lý của các khớp 8 DH Denavit-Hartenbeg
16 MRO Minimal Represent Orient
17 n(…) Normal (Vectơ pháp tuyến của mặt phẳng chứa s, a) 18 n Số bậc tự do của robot
19 NC Numerical Control 20 qi Biến khớp thứ (i)
21 s(…) Sliding (Vectơ hướng đóng mở bàn kẹp) 22 oTn Phương trình động học thuận
Trang 823 i-1Ti Biểu diễn của hệ quy chiếu (i) trong hệ quy chiếu (i-1) 24 ui Upper bound (i)
26 Vectơ gradien
Trang 9DANH MỤC CÁC BẢNG BIỂU KÝ
2.1 Số lượng Robot sản xuất ở một số nước công nghiệp phát triển 41
3.3 Kết quả bài toán ngược cơ cấu 3 khâu phẳng giải bằng hàm
3.4 Kết quả giải bài toán ngược cơ cấu 3 khâu phẳng bằng phương
Trang 10DANH MỤC CÁC HÌNH VẼ, ĐỒ THỊ
KÝ
1.4 Nguyên lý cực đại là trường hợp tổng quát của công thức biến
2.6 Sơ đồ điều khiển trong không gian công tác 50
3.1 Các vectơ định vị trí và định hướng của bàn tay máy 59 3.2 Sơ đồ động học cơ cấu 3 khâu phẳng (3 khớp quay) 65
3.5 Sơ đồ cấu trúc kỹ thuật trong giải thuật di truyền 80
Trang 11LỜI NÓI ĐẦU
Khoa học kỹ thuật và công nghệ ở các nước trong khu vực và trên thế giới đang trong thời kỳ phát triển như vũ bão đã đưa Việt Nam đứng trước rất nhiều thời cơ vận hội và thách thức mới trên con đường hội nhập với nền kinh tế thế giới
Để đáp ứng nhu cầu phát triển của xã hội, phục vụ công cuộc đổi mới của đất nước đòi hỏi đội ngũ các nhà khoa học, cán bộ kỹ thuật và công nhân lành nghề phải không ngừng nghiên cứu, học tập nâng cao trình độ để kịp thời tiếp cận làm chủ các kiến thức khoa học kỹ thuật hiện đại và công nghệ tiên tiến
Các khoá đào tạo thạc sỹ tại Trường Đại học Kỹ Thuật Công Nghiệp Thái Nguyên nhằm đào tạo những cán bộ khoa học có trình độ cao để tiếp thu và làm chủ kỹ thuật hiện đại để phục vụ cho công tác nghiên cứu, giảng dạy và sản xuất Là một giáo viên giảng dạy tại một trường kỹ thuật tôi rất vinh dự được học tập tại khoá đào tạo thạc sỹ khoá 10 của trường Để đánh giá kết quả học tập trong toàn
khoá học tôi được giao đề tài luận văn tốt nghiệp: “Nghiên cứu điều khiển tối ưu
cho cánh tay Robot bằng phương pháp Quy hoạch phi tuyến”
Trong quá trình công nghiệp hoá, hiện đại hoá đất nước, các ngành công nghiệp đang phát triển hết sức nhanh chóng, nhiều nhà máy xí nghiệp được xây dựng với quy mô và công nghệ hiện đại, tiên tiến đáp ứng được nhu cầu của tình hình sản xuất hiện nay Trong đó phải kể đến sự tiến bộ vượt bậc của khoa học kỹ thuật, nhất là sự ra đời của máy tính và công nghệ thông tin đã tạo tiền đề cho sự phát triển mạnh mẽ của nền sản xuất có tính chất tự động hoá cao, đã dần thay thế sức lao động của con người đồng thời hiệu quả của nó đem lại cho nền kinh tế là rất lớn
Hiện nay sự xuất hiện của các Robot trong các ngành công nghiệp, cũng như trong đời sống sinh hoạt đã trở nên phổ biến Chúng được ứng dụng rộng rãi trong nhiều lĩnh vục khác nhau, đặc biệt trong các ngành sản xuất có tính dây truyền và công nghệ cao Robot đóng vai trò quan trọng, chúng vừa đảm bảo độ chính xác vừa đảm bảo tính liên tục của dây truyền mà với con người hay những máy móc thông
Trang 12thường khó có thể đạt được Đồng thời nó có thể thay thế con người làm việc trong những môi trường độc hại, nơi con người khó có thể đặt chân tới như vũ trụ… Nói chung, ứng dụng của Robot là hết sức to lớn, vì vậy mà trong tương lai đây là nhân tố rất quan trọng trong sự phát triển của các ngành sản xuất của nền kinh tế hiện đại Do vậy việc nghiên cứu các vấn đề về Robot mang tính thời sự
Để Nghiên cứu điều khiển tối ưu cho cánh tay Robot bằng phương pháp Quy
hoạch phi tuyến, luận văn của tôi gồm bốn chương:
Chương 1: Giới thiệu chung về điều khiển tối ưu
Chương 2: Robot công nghiệp và giới thiệu bài toán điều khiển động học ngược robot
Chương 3 Giải bài toán điều khiển tối ưu cho cánh tay robot Chương 4: Kết luận và kiến nghị
Đề tài đã được hoàn thành đúng thời hạn dưới sự hướng dẫn tận tình của
PGS.TS Nguyễn Hữu Công - Trưởng Khoa Điện Tử - Trường Đại học Kỹ thuật
Công nghiệp Thái Nguyên và các bạn đồng nghiệp cùng sự nỗ lực của bản thân Tôi xin chân thành cảm ơn thầy giáo hướng dẫn, các thầy giáo, cô giáo thuộc trường Đại học kỹ thuật Công nghiệp Thái Nguyên đã giúp đỡ tôi trong quá trình học tập cũng như quá trình nghiên cứu thực hiện luận văn
Vì nhiều điều kiện khách quan và khả năng của bản thân, luận văn hoàn thành chắc chắn còn thiếu sót Rất mong sự góp ý của các thầy cô giáo và các bạn đồng nghiệp
Tôi xin chân thành cảm ơn!
Tác giả
Nguyễn Trung Thành
Trang 13CHƯƠNG 1 : GIỚI THIỆU CHUNG VỀ ĐIỀU KHIỂN TỐI ƯU 1.1 Định nghĩa
Điều khiển tối ưu là một chuyên ngành cơ bản trong điều khiển tự động, nó có vai trò xác định và tạo lập những luật điều khiển cho hệ thống để hệ thống đạt được
chỉ tiêu về tính hiệu quả đã được định trước dưới dạng ( phiếm) hàm mục tiêu Q
Trong thực tế tồn tại các bài toán điều khiển tối ưu như sau: - Bài toán tối ưu cực tiểu:
+ Xác định tham số của mô hình sao cho bình phương sai lệch trung bình giữa mô hình và đối tượng đạt giá trị nhỏ nhất, ví dụ như huấn luyện mạng nơ-ron, nhận dạng đối tượng,
+ Điều khiển một quá trình đạt chỉ tiêu chất lượng, kỹ thuật cho trước sao cho tổn hao năng lượng là nhỏ nhất
+ Tạo ra một sản phẩm đạt chỉ tiêu chất lượng cho trước nhưng chi phí là nhỏ nhất
+ Bài toán tìm đường đi ngắn nhất giữa hai điểm bất kỳ, ví dụ như xác định quĩ đạo chuyển động của cánh tay robot, đường đi thu rác, thu tiền điện, thu tiền nước, đi chào hàng
- Bài toán tối ưu cực đại
+ Tạo ra sản phẩm với chi phí cho trước, nhưng có chất lượng cao nhất + Bài toán tìm đường căng
- Bài toán tối ưu tác động nhanh: Thời gian xảy ra quá trình là ngắn nhất, ví dụ như điều khiển tên lửa
Trang 141.3 Bài toán điều khiển tối ƣu
Bài toán tối ưu được xây dựng dựa trên các giả thiết sau: + Có một mô hình toán học
+ Không có nhiễu tác động
+ Biết các điều kiện biên của mô hình như : điểm làm việc, thời gian làm việc của hệ thống
+ Biết miền giá trị cho phép của các đầu vào u
+ Biết hàm mục tiêu Q mô tả tính hiệu quả mà hệ thống cần đạt được Mục đích của điều khiển tối ưu là tìm tín hiệu tối ưu u*
để hàm mục tiêu Q đạt giá trị cực đại hoặc cực tiểu
Với những giả thiết này có rất nhiều phương pháp giải bài toán điều khiển tối ưu khác nhau Trong nội dung của Luận văn sẽ giới thiệu các phương pháp cơ bản nhất của lĩnh vực điều khiển tối ưu, được chia thành hai nhóm chính như sau:
+ Điều khiển tối ưu tĩnh + Điều khiển tối ưu động
1.3.1 Điều khiển tối ƣu tĩnh
Bài toán điều khiển tối ưu tĩnh là bài toán trong đó quan hệ vào, ra và biến trạng thái của mô hình không phụ thuộc vào thời gian Giá trị đầu ra tại một thời điểm chỉ phụ thuộc vào các đầu đầu vào và trạng thái tại thời điểm đó
Mô hình hệ thống được cho như sau:
yk = fk(u1, u2, ur), với k = 1, 2, , m, viết gọn lại thành y = f(u) Hàm mục tiêu như sau: Q = Q(u,y)
Trang 15Thay y = f(u) vào hàm mục tiêu được: Q = Q(u,y) = Q(u,f(u)) = Q(u), như vậy Q chỉ phụ thuộc vào các đầu vào và đầu ra
1.3.1.1 Mô tả toán học
Mô hình hệ thống có dạng như sau: y = f(u) với uU
u = (u1 u2 ur)T các đầu vào y= (y1 y2 ym)T các đầu ra
U là miền thích hợp của các biến đầu vào, được định nghĩa như sau: Uu(u1,u2 ,uñ)T ukmin uk ukmax;k1r
Hàm mục tiêu có dạng như sau: Q = Q(u,y) = Q(u,f(u)) = Q(u)
Không mất tính tổng quát nếu giả thiết tiêu chuẩn tối ưu là: Q(u) min
Bài toán điều khiển tối ưu tĩnh được phát biểu như sau: Tìm tín hiệu tối ưu u* U, sao cho Q(u*) đạt giá trị nhỏ nhất Khi đó, ta có
(u* QuuUQ
Nếu u* thoả mãn (1) với mọi u thuộc U, thì u*
được gọi là véc tơ tối ưu toàn cục
Nếu u* thoả mãn (1) với mọi u thuộc lân cận u*
, thì u* được gọi là véc tơ tối ưu cục bộ
là điểm thuộc mặt phẳng (u1,u2), tại đó mặt cong Q ở điểm thấp nhất
Điểm A là điểm tối ưu cục bộ, điểm B là điểm yên ngựa và điểm C là điểm tối ưu toàn cục
Trang 16Tập hợp các điểm nằm trong mặt phẳng (u1,u2), tại các điểm đó hàm mục tiêu Q có cùng giá trị được gọi là đường đồng mức
1.3.1.3 Giả thiết cho lời giải
a Bài toán tối ƣu không có giới hạn
- Nghiệm u* của bài toán tối ưu không có giới hạn là một điểm cực trị Các điểm cực trị thoả mãn hệ phương trình vi phân kr
hay
- Tại mỗi điểm u của mặt cong Q tồn tại véc tơ đạo hàm riêng
, ký hiệu là
, véc tơ đạo hàm riêng grad Q có các tính chất sau:
+ Có phương vuông góc với mặt cong Q
+ Có hướng chỉ chiều tăng giá trị của các đường đồng mức C
đường đồng mức
Hình 1.1: Đồ thị hàm mục tiêu
Trang 17+ Có độ lớn thể hiện tốc độ tăng hay giảm giá trị của Q Do đó tại điểm cực trị của mặt cong Q phải có grad Q = 0 (*) Hệ phương trình này chỉ là điều kiện cần để tìm nghiệm tối ưu u*
Để giải hệ phương trình (*) sẽ gặp những vấn đề sau:
+ Hệ phương trình (*) là hệ phi tuyến, dẫn đến việc giải trực tiếp khó thực hiện được
Xác định hướng tìm và khoảng cách bước tìm + Bước 3:
Tìm uk theo hướng tìm và khoảng cách bước tìm + Bước 4:
Kiểm tra điều kiện
Nếu || uk - uk-1 || chuyển sang bước 5 Nếu || uk - uk-1 || > quay về bước 2 + Bước 5:
Nghiệm tối ưu gần đúng là u*
= uk với độ chính xác là
b Bài toán tối ƣu có giới hạn
Bản chất là tìm nghiệm tối ưu u*
gần đúng cho bài toán mà u bị giới hạn bởi miền thích hợp U Thuật toán tìm nghiệm từng bước về cơ bản cũng giống như trên, nhưng cần phải chú ý các trường hợp sau:
Trang 18+ Nếu nghiệm tối ưu u*
không nằm trên biên của U thì grad Q = 0 vẫn là điều kiện cần để tìm u*
+ Nếu trong miền thích hợp U không tồn tại nghiệm u*
thoả mãn điều kiện gradQ = 0, khi đó nghiệm tối ưu u* nằm trên biên của U và tại điểm u* véc tơ đạo hàm riêng grad Q phải có hướng vào trong miền U
Thuật toán tìm nghiệm tối ưu u*
cho bài toán tối ưu có giới hạn: + Bước 1:
Cho 0 bé tuỳ ý, chọn u0 bất kỳ Thực hiện các bước sau với k = 1, 2 + Bước 2:
Xác định hướng tìm và khoảng cách bước tìm thích hợp để cho uk U
+ Bước 3:
Tìm uk theo hướng tìm và khoảng cách bước tìm + Bước 4:
Kiểm tra điều kiện
Nếu || uk - uk-1 || chuyển sang bước 5 Nếu || uk - uk-1 || > quay về bước 2 + Bước 5:
Nghiệm tối ưu gần đúng là u*
= uk với độ chính xác là
1.3.1.4 Một số phương pháp tìm nghiệm a Phương pháp không dùng đạo hàm riêng a.1 Đặt vấn đề
Trang 19Chính vì những lý do này, mà cần phải có các phương pháp tìm nghiệm tối ưu u*
mà không dùng véc tơ đạo hàm riêng (gradient)
a.2 Phương pháp Gauss/ Seidel
Cho mô hình hệ thống y = f(u)
Hàm mục tiêu được định nghĩa là Q = Q(u)
Tìm u* để cho Q đạt giá trị nhỏ nhất, tức là Qmin Giả sử u* nghiệm tối ưu thoả mãn Qmin, ký hiệu u*
= argminQ Nội dung của phương pháp Gauss/Seidel
+ Hướng tìm được chọn song song với các trục toạ độ ui với i = 1, 2, , r Kí hiệu hướng tìm ở bước thứ k là hk
+ Khoảng cách bước tìm ở bước thứ k được ký hiệu là sk, sk được xác định như sau: s*k argminQ(uk skhk)
Thuật toán tìm nghiệm của Gauss/Seidel + Bước 1:
Cho 0 bé tuỳ ý, chọn u0 bất kỳ Thực hiện các bước sau với k = 0, 1, 2 + Bước 2:
- Xác định hướng tìm hk:
h , hk là véc tơ có r hàng, chỉ có hàng thứ
k + 1 có giá trị bằng 1, các hàng khác đều bằng không
- Xác định khoảng cách bước tìm sk: sk được xác định sao cho hàm mục tiêu đạt giá trị nhỏ nhất trên hướng tìm hk sk* = argminQ(uk + skhk)
+ Bước 3: uk+1 = uk + sk*hk
+ Bước 4: Kiểm tra điều kiện
Trang 20Nếu || uk+1 - uk || chuyển sang bước 5 Nếu || uk+1 - uk || > quay về bước 2 + Bước 5:
Nghiệm tối ưu gần đúng là u*
k = 0
Bước 2: Chọn
Q(u1) = (1s0)2 23, ta có ()2(1 0)0
, suy ra s0 = -1 Vậy s0
= argminQ(u1) = -1 Bước 3:
Bước 4:
||u1 - u0|| = 1 > quay về bước 2 k =1
Bước 2: Chọn
Q(u2) = 02(1s1)2 3, ta có ( ) 4(1 1) 0
, suy ra s1 = -1
Trang 21Vậy s1*
= argminQ(u2) = -1 Bước 3:
h
Q(u3) = s22 2.03, ta có ( ) 2 2 0
, suy ra s2 = 0 Vậy s2
= argminQ(u3) = 0 Bước 3:
Bước 4:
||u3 - u2|| = 0 < chuyển sang bước 5 Bước 5:
u* = u3 =
Sau hai vòng tính ta đã tìm được nghiệm tối ưu u*
Trang 22b Phương pháp Newton-Raphson b.1 Nội dung của phương pháp
Phương pháp tìm nghiệm tối ưu sử dụng đạo hàm bậc nhất và bậc hai của hàm mục tiêu nên phải giả thiết hàm mục tiêu Q(u) khả vi hai lần Để giải hệ phương trình ()0
(**) bằng phương pháp giải tích, trước tiên hệ (**) được khai
triển thành chuỗi Taylor tại uk thuộc lân cận nghiệm tối ưu u* và là nghiệm của (**) như sau:
tiếp theo, bỏ qua các đạo hàm bậc cao Khi đó u*
sẽ không phải là nghiệm đúng nữa mà chỉ là nghiệm gần đúng Gọi nghiệm gần đúng này là là uk+1 u* , thay vào hệ phương trình trên ta có:
Đặt H(u) =
Qu
Trang 23Tính H(uk) Bước 3:
Tính uk+1 = uk - H-1(uk)gkBước 4: Kiểm tra điều kiện
Nếu || uk+1 - uk || chuyển sang bước 5 Nếu || uk+1 - uk || > quay về bước 2 Bước 5: Kết thúc
Nghiệm tối ưu gần đúng u*
= uk+1 Ưu điểm:
Nếu hàm mục tiêu có dạng QuTAubTu
, phương pháp này sẽ cho đúng giá trị u*
chỉ sau đúng một vòng tính
Ví dụ:
Cho hàm mục tiêu Q = 3u12
+ 4u22 + u1u2 với 103
Bước 1:
u
Trang 24Bước 2:
Bước 3:
Bước 3:
c Phương pháp sử dụng hàm phạt và hàm chặn c.1 Hàm phạt
Trong quá trình tìm từng bước nghiệm tối ưu, hàm phạt có được sử dụng để thông báo rằng tại thời điểm hiện tại, giá trị uk đã ra ngoài miền U
Việc thông báo của hàm phạt thường là bằng những giá trị rất lớn (một cách không bình thường) tại những điểm gần biên, bên trong hoặc bên ngoài
Trang 25Cho hàm mục tiêu Q(u) Tìm
argmin ( ) min
được tìm theo công thức sau:
)(lim *
c.2 Hàm chặn
Trong quá trình tìm từng bước nghiệm tối ưu, hàm chặn được sử dụng để ngăn cản việc giá trị uk hiện tại có thể sẽ vượt ra ngoài miền U Việc ngăn cản của hàm chặn thường là bằng những giá trị rất lớn (một cách không bình thường) tại những điểm gần biên, bên trong hoặc bên ngoài
Thay Q(u) = Q(u) + S(u), với điều kiện: S(u) = 0 nếu u cách xa biên
S(u) = nếu u ở gần biên
là một số dương đủ lớn
Áp dụng các phương pháp giải bài toán tối ưu không ràng buộc để tìm nghiệm min
được tìm theo công thức sau:
)(lim *
uu
Trang 261.3.2 Điều khiển tối ưu động
Bài toán điều khiển tối ưu động là bài toán trong đó mô hình toán học có ít nhất một phương trình vi phân
( uxfdtdx
ii
Cho mô hình hệ thống như sau: xi fi(x1,x2 ,xn,u1,u2 ,ur)với i1n, viết gọn lại thành: x f( ux, )
Các đầu ra của hệ thống là yg( ux,) với y(y1,y2, ,ym) Hàm mục tiêu được định nghĩa như sau: Qfxudt
0( , ) , trontg đó T là thời gian xảy ra quá trình tối ưu
Với bài toán điều khiển tối ưu tĩnh, đây chính là bài toán cực trị với những điều kiện ràng buộc Có nhiều phương pháp giải bài toán cực trị, ở đây chúng ta chỉ nghiên cứu các phương pháp phi tuyến:
+ Các phương pháp không dùng đạo hàm riêng + Các phương pháp đạo hàm riêng
+ Phương pháp hướng liên hợp + Phương pháp Newton-Raphson
Với bài toán điều khiển tối ưu động, chỉ nghiên cứu các phương pháp sau: + Phương pháp biến phân kinh điển
+ Phương pháp nguyên lý cực đại của Pontrjagin + Phương pháp qui hoạch động của Bellman
1.3.2.1 Phương pháp biến phân
Biến phân là một phương pháp được xây dựng từ điều kiện cần phải có của nghiệm tối ưu u(t) của bài toán tối ưu động, liên tục, có khoảng thời gian T xác định, cho trước và không bị ràng buộc bởi điều kiện U, hoặc nếu có bị ràng buộc thì tập U của các (vector) tín hiệu điều khiển thích hợp phải là một tập hở
Trang 27Ý tưởng chính của biến phân có thể được tóm tắt như sau:
- Từ giả thiết u(t) là tín hiệu điều khiển tối ưu, x(t) là quỹ đạo trạng thái tối ưu, người ta xây dựng một tín hiệu điều khiển khác có một sai lệch nhỏ so với nó là:
tut t
u~ u , trong đó u t là rất nhỏ (1.1)
Và xem u t
chưa phải là tín hiệu tối ưu
- Tiếp theo, người ta giả thiết quỹ đạo trạng thái x t
do u t
tạo ra cho hệ thống cũng chỉ có một sai lệch rất nhỏ so với quỹ đạo trạng thái tối ưu x(t), tức là:
txt t
x~ x cũng có x t rất nhỏ (1.2) - Cuối cùng, từ điều kiện phải có của tín hiệu điều khiển tối ưu:
Q (1.3)
Người ta xác định tính chất của điều khiển tối ưu u(t), gọi là tính chất biến phân
Xét bài toán tối ưu động, liên tục, có điểm đầu x0 và thời gian T cố định, cho trước:
, min,
(1.4)
Giả sử u(t) là nghiệm tối ưu của bài toán liên tục và x(t) là quỹ đạo trạng thái tối ưu tương ứng Ký hiệu tiếp u t
là vector tín hiệu điều khiển được biến phân từ
u(t) theo công thức (1.1) và x t
là quỹ đạo trạng thái tương ứng của nó thỏa mãn điều kiện biến phân (1.2) Hiển nhiên khi đó ta có bất đẳng thức (1.3) Hình 1.2 minh họa trực quan hai quỹ đạo trạng thái x(t) và x t
Từ hình minh họa đó ta rút ra ngay được quan hệ giữa lượng biến phân trạng thái x t và điểm trạng thái cuối x như sau:
Trang 28- Nếu xT là cố định và cho trước thì phải có x T 0
- nếu xT không cố định, chẳng hạn bị ràng buộc, thì có thể sẽ có x T0
Bởi vậy, từ bất đẳng thức (1.3) và bằng phân tích chuỗi Taylor ta sẽ xấp xỉ được thành:
Trong đó:
và
là các ký hiệu Jacobi của hàm nhiều biến g(x,u)
Hoàn toàn tương tự, từ mô hình trạng thái (1.4) của hệ ta cũng có:
xufdt
ST
Điểm đầu cố định và điểm cuối cố định
Điểm đầu cố định, điểm cuối ràng buộc
Hình 1.2: Minh họa công thức biến phân
Trang 29
Trong đó p n là một vector n chiều tùy ý, và
,
là các ma trận Jacobi của véc tơ hàm f(x,u)
Kết hợp chung (1.5) và (1.6) lại với nhau ta đi đến:
với điều kiện biên pT Tx T0
Khi đó p(t) được gọi là vector đồng trạng thái (costate), đồng thời bất đẳng thức (1.7a) trở thành:
0 (1.7b)
(1.6)
(1.7a)
Trang 30Cuối cùng, sử dụng ký hiệu hàm Hamilton: xuppf xugxu
H,, T ,, (1.8) Ta sẽ được phương trình Euler-Lagrange như sau:
,
với pT T x T0 (1.9) Đồng thời, công thức biến phân bậc nhất hàm mục tiêu (1.7b) trở thành:
0 (1.10)
Điều kiện cần: nếu u(t) là nghiệm của bài toán tối ưu động liên tục (1.4) có điểm
đầu x0 và khoảng thời gian T cho trước thì nghiệm đó phải thỏa mãn:
Như vậy, đây là bài toán tối ưu động, liên tục, không ràng buộc, có điểm đầu, cuối cố định và khoảng thời gian T = 4 là cho trước
Để giải bài toán ta áp dụng phương pháp biến phân với các bước như sau:
Trang 31- xác định quan hệ u(x,p) từ 0
được up
- thay quan hệ tìm được vào (1.9) ta thu được hệ phương trình:
- giải hệ phương trình vi phân trên được:
Trong đó s1 , s2 là những giá trị riêng của ma trận A, tức là nghiệm của: det(sI-A) = 0
- thay nghiệm x(t) tìm được vào mô hình (1.12) của hệ sẽ được u(t) tối ưu:
0,034 2 1,663 2
1.3.2.2 Phương pháp quy hoạch động của Bellman
Phương pháp quy hoạch động được dựa trên nguyên lý tối ưu sơ khai của Bellman:
Một chiến lược tối ưu có tính chất không phụ thuộc vào những quyết định trước đó (ví dụ như những luật điều khiển) song các quyết định còn lại phải cấu thành nên chiến lược tối ưu có liên quan với kết quả của những quyết định trước đó
Trang 32Nguyên lý tối ưu của Bellman có nội dung như sau: “ Mỗi đoạn cuối của quỹ đạo trạng thái tối ưu cũng sẽ là một quỹ đạo trạng thái tối ưu”
Có thể kiểm chứng tính đúng đắn của nguyên lý Bellman nhờ hình minh họa Hình1.3 Giả sử quỹ đạo liền nét đi từ điểm x0 qua xk đến xN là tối ưu (gồm hai đoạn
γα) trong đó phần quỹ đạo α từ xk đến xN lại không phải tối ưu Vậy thì phải tồn tại đoạn tối ưu từ xk đến xN (đoạn β) Như vậy hàm mục tiêu Q từ xk đến xN theo đoạn
β phải có giá trị nhỏ hơn là theo đoạn α và do đó dọc theo hai đoạn γβ hàm Q có giá trị nhỏ hơn là theo đoạn γα Điều này trái với giả thiết rằng đoạn là tối ưu
Dựa vào nguyên lý tối ưu, ta xác định được quan hệ uk(xk), k = 0, 1, 2, …, N-1 cần phải có giữa tín hiệu điều khiển tối ưu uk và trạng thái tối ưu xk bằng cách lập công thức biểu diễn giá trị hàm mục tiêu cho từng đoạn cuối như sau ( gọi là hàm
B , k = 0, 1, …, N (1.13)
Các hàm Bellman Bk , k = N, N-1, …, 1, 0 phải có giá trị nhỏ nhất dọc theo quỹ đạo trạng thái tối ưu Bởi vậy, khi đã có giá trị hàm Bk+1 của đoạn cuối tối ưu tính từ điểm trạng thái xk+1 ta cũng sẽ xác định được quan hệ uk(xk) phải có của tín hiệu điều khiển tối ưu ứng với điểm trạng thái xk theo quy tắc:
Hình 1.3: Mô tả nguyên lý tối ưu Bellman
Trang 33
(1.14b)
Trong đó các giá trị biên B0, BN được xác định từ (1.13) như sau:
BN = 0 và B0 = Qmin (1.15)
Hai vòng tính của phương pháp: Vòng ngược (kỹ thuật nhúng) và vòng xuôi
Công thức (1.14) với điểm xuất phát (1.15) là công cụ giúp ta xây dựng được các bước xác định quan hệ uk(xk) phải có giữa tín hiệu điều khiển và trạng thái tối ưu Ta sẽ gọi các bước tính này là vòng ngược vì nó có thứ tự thực hiện đi ngược từ k = N ( ứng với điểm trạng thái cuối xN ) đến k = 0 ( ứng với điểm trạng thái đầu x0 ) Vòng tính ngược này còn được Bellman gọi là kỹ thuật nhúng (imbedding technique)
Nội dung của vòng ngược như sau: - Bắt đầu từ k = N ta có BN = 0 - Với k = N-1 thì từ:
xN = f(xN-1,uN-1)
và do xN là đã cho trước nên ta có được ngay quan hệ tối ưu:
uN-1(xN-1) (1.16a) Thay quan hệ ( 1.16a ) tìm được vào:
BN-1 = g(xN-1,uN-1) = BN-1(xN-1) (1.16b) Sẽ được hàm BN-1 tối ưu chỉ còn phụ thuộc theo xN-1
- Với N-2 ≥ k ≥ 0 thì do hàm Bk+1 chỉ phụ thuộc theo xk+1, tức là Bk+1(xk+1), nên:
Bk = g(xk,uk) + Bk+1(xk+1)
= g(xk,uk) + Bk+1(f(xk,uk))
u min (1.17a) Giải bài toán tối ưu (tĩnh) trên ta có quan hệ tối ưu:
uk(xk) (1.17b) Thay quan hệ (1.17b) vừa tìm được vào (1.17a) để được hàm Bellman tối ưu: B = B (x ) (1.17c)
Trang 34Bằng N bước tính ngược từ k = N-1 đến k = 0 như trên ta có được N công thức mô tả quan hệ uk = uk(xk) phải có giữa tín hiệu điều khiển và trạng thái tối ưu Sau khi đã có các quan hệ này thì từng giá trị cụ thể của uk sẽ được tính nhờ mô hình (1.15) mô tả đối tượng Ta gọi các bước tính này là vòng xuôi vì nó được thực hiện lần lượt từ k = 0 tới k = N-1
Nội dung của vòng xuôi như sau: - Với k = 0 có:
u0 = u0(x0) vì đã có x0 → x1 = f(x0,u0)
- Với 1 ≤ k ≤ N-1 cũng có: uk = uk(xk)
Đối tượng cần điều khiển qua 4 bước ( N = 4 ) từ x0 = 4 đến x4 = 0 sao cho
Suy ra hàm Bellman tối ưu B3 x32 u32 2x32
k = 2: Ta phải tìm quan hệ u x2( 2) tối ưu để được:
Trang 35521
Trang 36trong đó U là một tập con đóng của m, có điểm trạng thái đầu x0 x(0)
và khoảng thời gian T cho trước, còn điểm trạng thái cuối xT là tuỳ ý ( hoặc bị ràng buộc bởi ST)
Cũng giống như ở phương pháp biến phân, ta định nghĩa: – Hàm Hamilton: H x u p , , pTAx h u ( )a x r uT ( )
Do tập U là tập đóng, nghiệm tối ưu có thể nằm trên biên của U, nên ta
không thể xác định u t( ) tối ưu bằng điều kiện H 0T
g(x.u)
Trang 37hai tín hiệu điều khiển nào đó thuộc U , cũng như x t( )
và x t( ) là hai quỹ đạo trạng thái tương ứng cùng đi từ x0 do chúng mang lại cho đối tượng nửa tuyến tính có mô hình cho trong (1.18) Trước hết, với công thức tích phân toàn phần, ta có ngay được:
ph uh uA pxxdtpTx Tx Tdt
d p
A p axxdtpTx Tx Tdt
Trang 38Tiếp tục, sử dụng các quan hệ (1.19) và (1.20) với:
Tính chất (1.24) được gọi là nguyên lý cực đại, phát biểu cho lớp bài toán
(1.18) Ta cũng có thể thấy, do bị ràng buộc bởi tập U , công thức biến phân
đã được thay thế bằng nguyên lý cực đại (1.24) Hơn nữa, nguyên lý cực
đại (1.24) còn tổng quát hơn công thức biến phân, vì nếu nghiệm tối ưu u t( ) là
điểm trong của U thì từ nguyên lý cực đại (1.24) ta cũng suy ra được công thức biến
phân, nhưng điều ngược lại thì không, chẳng hạn như trường hợp minh hoạ ở hình 1.4 với nghiệm nằm trên biên
Trang 39Nguyên lý cực đại (1.24) gợi ý cho ta có thể tìm tín hiệu điều khiển tối ưu
4) Thay x t( ), ( )p t đã tìm được ở bước 3 vào quan hệ u x p( , ) đã có từ bước 2, hoặc vào mô hình của đối tượng trong (1.18) để có nghiệm tối ưu
H(x, p, u)
Hình 1.4 : Nguyên lý cực đại là trường hợp tổng quát của công thức biến phân
Trang 40d p
với điều kiện biên
p