1 NHỮNG HẠN CHẾ VỀ NGUYÊN TẮC CỦA CÁC LÝ THUYẾT ĐIỀU KHIỂNTỐIƯU HIỆN NAY VÀ NHỮNG HIỂU SAI THƯỜNG GẶP KHI VẬN DỤNG TS . Lê Văn Ngự Viện NC Điện tử, Tin học, Tự động hóa Tóm tắt Cho đến nay việc giải các bài toán điềukhiểntốiưu chủ yếu dựa trên cơ sở của các nguyên lý Bellmal, nguyên lý cực đại Pontriagin hoặc các lý thuyết khác. Những lý thuyết này còn có chung hạn chế về nguyên tắc là ở chỗ nó chỉ là những điều kiện cần mà không đủ. Khi vận dụng còn có yếu tố kinh nghiệm trực quan và có thể dẫn đến hiểu sai. Từ những kết quả nghiên cứu theo hướng tiếp cận khác bài báo đã chỉ rõ một số trường hợp hiểu sai ngay ở các bài toán được coi là kinh điển trong các sách giáo khoa bậc Đại học và các tàiliệu khác của các tác giả trong và ngoài nước. 1. Thiết lập bài toán Đến nay ở hầu hết các tàiliệu bài toán được đặt ra như sau. Cho đối tượng điềukhiển có mô hình động lực học dạng ( ) ( ) u,xftx = & (1) Trong đó : x( x n x i x x ,,,, 2 , 1 LL ) là biến (vec tơ ) trạng thái () u r u i uu u ,,,, 2 , 1 KK là vec tơ điềukhiển với điều kiện hạn chế uu u maxmax ≤≤− (2) Hàm mục tiêu có dạng : () () dttuxGtuxQ T ∫ = 0 ,,,, (3) Trong đó G(x,u,t) là hàm đối với x,u và thời gian t . Vec tơ điềukhiển )( * tu cần phải xác định để chuyển đối tượng từ trạng thái ban đầu x(t o ) đến trạng thái cuối x(T) để hàm mục tiêu Q đạt giá trị nhỏ nhất gọi là điềukhiểntối ưu.Quỹ đạo trạng thái tương ứng từ x(t o ) đến x(T) gọi là quĩ đạo tối ưu. Khi G=1 thì được gọi là bài toán tốiưu tác động nhanh. Đây là bài toán rất khó , đến nay vẫn chưa có cách giải hoàn chỉnh.Là bài toán được thiết lập cho hệ thống nhiều biến có liên quan đến những khái niệm trừu tượng và phải được hiểu chính xác.Những khó khăn này tồn tại ở ngay bước thiết lập bài toán. Thứ nhất là điều kiện hạn chế của u trong trường hợp tổng quát là đại lượng biến đổi phụ thuộc vào trạng thái của đối tượng mà không phải luôn luôn ở dạng uu u maxmax ≤≤− (mặc dù các thành phần có thể hạn chế ở dạng maxmax iii uuu ≤≤− ) Thứ hai là hàm mục tiêu được thiết lập ở dạng tích phân của biến thời gian. Điều này gặp phải khó khăn là ngay ở những trường hợp đơn giản cũng không tìm được hàm tường minh của các đại lượng theo thời gian.Trường hợp tác động nhanh khi G=1 thì hàm mục tiêu ∫ = T dtQ 0 .1 không biểu hiện rõ quan hệ của nó với các đại lượng khác của bài toán ,ngay cả khoảng thời gian xảy ra quá trình cũng chưa biết và thực tế thời gian không được tính theo biểu thức này.Các lí thuyết áp dụng cho trường hợp này phải qua các bước tính toán rất phức tạp nhưng kết quả vẫn bị hạn chế do bản thân các lí thuyết chưa hoàn chỉnh .Dưới đây xin trình bày hướng tiếp cận mới. 2. Hướng tiếp cận mới Mục tiêu cơ bản của bài toán không thay đổi nhưng hướng tiếp cận mới được thể hiện ở các nội dung sau 2 2.1 Quan niệm sự biến thiên trạng thái động học như là một thuộc tính của đối tượng. Do đó việc khảo sát sự biến thiên trạng thái được thực hiện độc lập với tác động điềukhiển (là nguyên nhân gây ra biến đổi trạng thái ,thường có liên quan trực tiếp hay gián tiếp đến quá trình biến đổi năng lượng) 2.2. Xác lập hàm mục tiêu là hàm của các biến trạng thái ( ) XXQ & , mà không theo biến thời gian.Thời gian được coi như một tham số ,khi cần nó có thể được xác định theo các biến trạng thái. 2.3 Xác định quĩ đạo tốiưu đồng thời với điềukhiểntốiưu dựa trên các quan hệ của các biến trạng thái đối với ( ) XXQ & , và ( ) XU & X, 3 Các bước thực hiện 3.1. Sự biến thiên trạng thái động học Ở đây khảo sát sự biến thiên trạng thái mà không quan tâm đến tác động điềukhiển là nguyên nhân gây ra nó nên gọi là biến thiên trạng thái động học.Không gian trạng thái được biểu diễn bởi trục hoành là X và trục tung là X & (hình 1) Mục tiêu là phải điềukhiển đối tượng từ trạng thái ban đầu đến trạng thái cuối để Q min ,tức là phải xác định quĩ đạo tối ưu. Trước khi xác định quĩ đạo tốiưu ta hãy xét quĩ đạo trạng thái nói chung,tức là quan hệ giữa ⋅ X và X. Tại mỗi điểm ta có dt dX dt Xd dX Xd ⋅ ⋅ = X X dX Xd &&&& = (4) Đây là phương trình vi phân của quĩ đạo trạng thái của đối tượng bất kì. Ý nghĩa hình học của (4) là độ dốc của quĩ đạo tại điểm (X, X & ).Nó phụ thuộc vào các biến trạng thái và có quan hệ với u từ mô hình động lực học. Tại một điểm đã cho có X & đã biết, độ dốc chỉ phụ thuộc X && và bị hạn chế trong giới hạn XX X &&&& && maxmin ≤≤ do u bị hạn chế .Các giá trị giới hạn này hoàn toàn xác định được từ mô hình động lực học . Nếu tại một điểm ta dựng các vecto tiếp tuyến với các quỹ đạo ứng với XX &&&& minmax , và góc giữa chúng là α thì các quĩ đạo đi qua điểm đó phải nằm trong góc α .Vì thế góc α biểu thị phạm vi điềukhiểntại một điểm .Góc α biến thiên theo XX && , tăng thì α giảm α = π khi X & = 0 (trên trục hoành ) α = 0 khi XX &&&& minmax = và tại đó chỉ tồn tại duy nhất một quĩ đạo điềukhiển .Tốc độ mà tại đó XX &&&& minmax = gọi là tốc độ giới hạn X gh & và luôn luôn xác định được .Tập hợp các điểm có tốc độ giới hạn tạo thành quĩ đạo giới hạn .Việc điềukhiển không thực hiện được ở tốc độ cao hơn tốc độ giới hạn . 3 Nếu trên quỹ đạo giới hạn có X && là dương thì tồn tại điểm K tại đó 0 X min = && và đổi dấu từ âm sang dương,vì thế quĩ đạo ứng với X min && là cực tiểu.Trên khoảng từ K đến quĩ đạo giới hạn luôn có X && >0 ,vì thế quĩ đạo luôn luôn tăng .Tương tự nếu trên quĩ đạo giới hạn có X && là âm thì tồn tại điểm H tại đó X && max =0 và đổi dấu từ dương sang âm vì thế quĩ đạo ứng với X && max là cực tiểu .Trên khoảng từ H đến quĩ đạo giới hạn luôn có X && <0 ,quĩ đạo luôn luôn giảm .Tập hợp các điểm K và H tạo thành quĩ đạo gọi là quĩ đạo không (đường nét đứt hình 1)Quĩ đạo này chia không gian trạng thái thành ba miền có các tính chất khác nhau là : 1.Miền có thể tăng hoặc giảm (ở dưới điểm K và H) 2.Miền chỉ có thể tăng (ở trên điểm K).Là miền điềukhiển không bền vững 3.Miền chỉ có thể giảm (ở trên điểm H) 3.2. Điềukhiển từ trạng thái đầu đến trạng thái cuối Việc điềukhiển từ trạng thái đầu ( ) xxA & , đến trạng thái cuối ( ) xxB & , cũng chỉ có thể thực hiện được trong phạm vi nhất định.Ta dựng các nhánh quĩ đạo ứng với X && max và X min && đi ra khỏi A và đi tới B ,nếu chúng cắt nhau trong miền tốc độ giới hạn thì các quĩ đạo điềukhiển từ A đến B nằm trong miền giới hạn của các đường này (Hình 2.a) nếu chúng cắt nhau ở ngoài miền tốc độ cho phép thì phải xét cụ thể điều kiện có thể thiết lập được đoạn quĩ đạo nối các nhánh với nhau H.2,b hay không, nhất là ở miền gần quĩ đạo giới hạn. 3.3. Áp dụng cho bài toán tốiưu tác động nhanh Ví dụ khảo sát bài toán tốiưu tác động nhanh cho đối tượng có mô hình động lực học UX = && , 1≤U . Ta thấy ngay quĩ đạo tốiưu với thời gian ngắn nhất là quĩ đạo ứng với tốc độ cao nhất , khi X && max =1 và X min && = − 1 X & A B X X & A B X a b H.2. Mi ền điềukhiển từ A đến B α O x K H H .1 .Các miền biến thiên trạng thái X & 4 Từ phương trình (4) khi X && max =1 ta có dXXdX = && . Tích phân biểu thức này được: 0CX2X 2 =+− & Tương tự khi X min && = − 1 có: 0CX2X 2 =++ & Đó là các nhánh Parabol , đúng như cách tính theo nguyên lí Pontriagin.Khi đã xác định được quĩ đạo tốiưu ta dễ dàng tính được thời gian theo biểu thức Xd/dXdT & = 4. Đối chiếu với một số tác giả khác Phần này nhằm làm rõ hơn một số nội dung đã được đề cập ở một số tàiliệu khác 4.1 Nguyên lý cực đại Pontriagin Về nguyên tắc không thể áp dụng nguyên lý cực đại Pontriagin vì nó chỉ là điều kiện cần. Nếu không thỏa mãn nguyên lý này thì kết luận là không tối ưu, còn khi thỏa mãn thì chưa thể kết luận được là tối ưu. 4.2 Sự biến thiên của quỹ đạo tốiưu Lời chú thích không đúng với sự biến thiên của quỹ đạo điềukhiển ở một số khoảng (quĩ đạo là tăng tốc thì chú thích là giảm, quĩ đạo là giảm tốc thì chú thích là tăng tốc) của các tác giả [6] vì quĩ đạo điềukhiển ở những miền chỉ tăng tốc hoặc chỉ giảm tốc. Những miền này không tồn tại ở những trường hợp đơn giản thường gặp mà ở đó gia tốc lớn nhất và nhỏ nhất luôn trái dấu nhau. Sự nhầm lẫn của các tác giả này là ở chỗ cho rằng gia tốc lơn nhất luôn là dương, nhỏ nhất là âm. Quỹ đạo tốiưu ở trường hợp tổng quát không tiếp tuyến với quỹ đạo tốc độ giới hạn. Khi nói về cách dựng quỹ đạo tốiưu ở trường hợp các nhánh qua điểm đầu và điểm cuối của quỹ đạo không cắt nhau trong miền tốc độ cho phép thì dựng các đoạn tốiưu ứng với max λ && hoặc min λ && tiếp tuyến với quỹ đạo tốc độ giới hạn để nối chúng với nhau. Vì ở tốc độ giới hạn chỉ tồn tại một quỹ đạo điềukhiển duy nhất qua đó và nó hoàn toàn đã được xác định và nói chung không là tiếp tuyến với quỹ đạo tốc độ giới hạn (khác với các tác giả [1], [6]). 4.3 Không thể thay thế tương đương đường cong tốiưu bằng đường gẫy khúc Khi áp dụng vào thực tế người ta thường thay thế quỹ đạo tốiưu lý thuyết bằng quỹ đạo gần đúng. Việc thay thế này về nguyên tắc phải thực hiện điềukhiển được trên thực tế. Trong tính toán để tính gần đùng người ta thường thay thế đường cong bằng đường gãy khúc gồm ngững đoạn thẳng có điểm giao nhau với đường cong. Tuy nhiên đối với đường cong điều khiểntốiưu thì việc thay thế như trên nói chung là không đúng. Lý do vì tại mỗi điển các quỹ đạo điều khiểntốiưu là biên của phạm vi điều khiển, nếu thay bằng đoạn thẳng giao nhau với đường cong thì sẽ có phần vượt ra khỏi phạm vi điều khiển. λ D C B A λ & 0 Accelerate Decelerate Accelerate Decelerate H.3. Lời chú thích sai 5 Ví dụ tại điểm P có hai nhánh quỹ đạo cong tốiưu đi qua (Hình 4). Nếu ta thay các cung cong bằng các đoạn thẳng PN và PM thì toàn bộ đoạn thẳng PN và phần cuối của đoạn thăng PM nằm ngoài phạm vi điềukhiển (vì tại M hướng của quỹ đạo thảng nằm ngoài phạm vi điều khiển). Ta có thể xác định được đoạn nào trên PM nằm ngoài phạm vi điều khiển. Dưới đây sẽ xét trường hợp không đúng khi thay thế đường cong chuyển đổi tốiưu bằng một đường gẫy khúc để điềukhiểntối tượng về gốc tọa độ của [2] hình 5.a, b Trường hợp ở hình 5a là thay thế việc điềukhiển theo đường cong tốiưu là Parabol bằng đường thẳng (theo chế độ trượt) về gốc tọa độ khi điềukhiển đối tượng được mô tả bởi phương trình d 2 y/dt 2 = U với | U | ≤ 1. Trường hợp này đã được đề cập ở [5] Trường hợp ở hình 5b là thay thế quỹ đạo chuyển đổi tốiưu lý thuyết là Parabol bằng đượng gẫy khúc ANOPB để tại đó đổi chiều tác động nhằm điềukhiển đối tượng theo các quỹ đạo tốiưu dầnhội tụ về gốc tạo độ. Theo tàiliệu đã dẫn thì quá trình được thực hiện như sau. P M N H.4. Không thể điềukhiển theo đoạn thẳng y 1 y 2 B Q P M 2 M C N L A y 2 B P M 2 M 1 N A y 1 a) b) H.5. Không điềukhiển được về 0 c) O O 6 Từ trạng thái ban đầu M 1 chuyển động theo quỹ đạo tốiưu rồi cắt đường chuyển đổi AN và sau đó lại chuyển động theo quỹ đạo tốiưu thứ hai và cắt đượng chuyển đổi PO rồi tiếp tục theo quỹ đạo tốiưu thứ ba và cắt đường chuyển đổi ANO v.v . Quỹ đạo pha đó cứ xoắn dần vào gốc tọa độ. Vì thế trượng hợp này quá trình quá độ là một dao động tắt dần (vì quỹ đạo pha ứng với quá trình đó hội tụ vào tiêu điểm cân bằng 0). Trường hợp hình 5c cũng hiểu sai tương tự. Thực ra quá trình trên không phải là quá trình tắt dần và hội tụ về 0, mà như H.6. Theo lý thuyết thì mọi quỹ đạo pha tại trục hoành đều có tiếp tuyến thẳng đứng, tại gốc tọa độ là trục tung. Vì thế đoạn NOP ở lân cận 0 luôn ở phía trước đường cong chuyển đổi lý thuyết, nghĩa là các quỹ đạo tốiưu gặp đoạn thẳng trước khi gặp đường cong chuyển đổi mà không phải ở phía sau như hình 5b Nếu chuyển đổi điềukhiển ở đoạn thẳng lân cận bên trái điểm 0 thì quỹ đạo tốiưu cắt trục hoành ở bên trái điêmr 0 rồi ra xa khỏi điển 0. Cũng tương tự khi chuyển đổi điềukhiển ở đoạn thẳng lân cận bên phải 0. H.6,a Nếu cho đường gẫy khúc ở phía sau đường cong thì đoạn thẳng qua 0 chính là trục tung. Các quỹ đạo tốiưu cắt nhau trên trục tung thì đối xứng với nhau qua 0 . Nếu đổi chiều điềukhiển trên trục tung thì quá trình hoặc là đi xa khỏi 0 hoặc là chuyển động quanh 0 tùy theo chiều và vị trí chuyển đổi. Nếu ở điển phía trên 0 chuyển điềukhiển từ âm sang dương thì đi xa khỏi 0, chuyển từ dương sang âm thì quỹ đạo tiếp theo sẽ cắt trục tung ở điểm dưới và đối sứng qua 0 và tại đó lại chuyển sang dương thì quỹ đạo lại cắt trục tung ở điểm chuyển đổi lần trước và nếu chuyển đổi tiếp thì quá trình chuyển động quanh 0 lặp lại mà không tiến tới 0. Cũng tương tự với đối với điểm chuyển đổi ở phía dưới 0. Tóm lại là về nguyên tắc không thể thay thế tương đương quỹ đạo cong tốiưu bằng đường gấp khúc. O y 1 b) H.6. Quỹ đạo tốiưu lân cận 0 a) O y 1 y 2 7 4.4. Điềukhiển ở chế độ gần tốiưu Trong thực tế thường phải thỏa mãn đồng thời các yêu cầu khác nhau vì vậy phải thực hiện điềukhiển các chế độ gần tốiưu . Quá trình điềukhiển thường có ba giai đoạn: giai đoạn quá độ ban đầu đưa đến chế độ ổn định, giai đoạn ổn định để thực hiện nhiệm vụ nào đó và cuối cùng là giai đoạn quá độ về trạng thái ngừng hoạt động. Trong ba giai đoạn thì giai đoạn ổn định thường là quan trọng nhất cần có yêu cầu cao về chất lượng điềukhiển ta thực hiện theo chế độ trượt. Giai đoạn đầu và cuối điềukhiển theo chế độ tốiưu hoặc gần tối ưu. Giả sử theo phương án trên thì có thể thực hiện điềukhiển gần tốiưu từ điểm P về O (H.7) như sau: - Thay quỹ đạo chuyển đổi tốiưu về 0 bằng miền lân cận nó. - Xác định miền điềukhiển được về 0 theo đường thẳng ở chế độ trượt (giới hạn bởi trục hoành và đường X 1 = - X 2 2 ) (xem [5]) - Từ P điềukhiển theo quỹ đạo tốiưu thì PM là đoạn điềukhiển được về 0 theo đường thẳng nhưng ở tốc độ thấp. Muốn được tốc độ cao hơn thì tới N. - Từ N có thể theo các đường thẳng có độ nghiêng khác nhau tới miền lân cận đường chuyển đổi tốiưu - Theo quỹ đạo tốiưu về miền điềukhiển được theo đường thẳng lân cận O. - Về O theo đường thẳng. Bằng cách này có thể dễ dàng chọn được chế độ điềukhiển thích hợp. Việc chuyển đổi được thực hiện ở một miền mà không phải ở điểm nên dễ thực hiện. 5. Kết luận Các lí thuyết hiện nay còn hạn chế về nguyên tắc .Khi áp dụng còn các yếu tố trực quan và dễ dẫn đến hiểu sai. Là vấn đề khó và phong phú vì vậy những nội dung đề cập ở đây chỉ là bước đầu, tuy nhiên cũng góp phần làm sáng tỏ hơn bản chất của bài toán. Vấn đề cần được nghiên cứu tiếp. H.7. Điềukhiển gần tốiưu P X 2 X 1 = - 2 2 X X 1 = - 2 2 2 1 X O M N X 1 8 Tàiliệu tham khảo : [1] .KIM B.K, SHIN K.G., (1983) Suboptimal control of indiustrial manipulator with a weighted minimum time - fuel criterion. Proc. 22 nd IEEE Conf. Decis and Cont. San Anlonio. Vol.3. New York.N.Y [2]. PHẠM CÔNG NGÔ., (1996) Lý thuyết điềukhiển tự động . NXB KHKT [3]. NGUYỄN THƯƠNG NGÔ., (1999) Lý thuyết điềukhiển tự động hiện đại . NXB KHKT [4]. LE VAN NGU., (1999) The change of the minimum time controllable trajectory and the enduring controllable zones of industrial robot with geometric path constrains. 30 th International Symposium on robotics, Proc. pp177- 180, Tokyo, Japan [5]. LÊ VĂN NGỰ ., (2000) Bổ sung cơ sở lý thuyết cho phương pháp điều khiểntối ưu. Tuyển tập báo cáo khoa học. Hội nghị toàn quốc lầm thứ 4 về Tự động hóa. pp. 317- 322 [6]. SHIN K.G.,MCKAY ND., (1985)Minimum time control robotic manipulation with geometric path constraints. IEEE trans. Auto.cont. Vol30, N o 6, pp 531 - 541. [7]. NGUYỄN DOÃN PHƯỚC, PHAN XUÂN MINH., (1999) Điều khiểntốiưu và bền vững . NXB Khoa học Kỹ thuật người nhận : Phạm anh tuấn Viện cơ học ĐT 7627205 264 Đội cấn. mechatronics@hn.vnn.vn . cong điều khiển tối ưu thì việc thay thế như trên nói chung là không đúng. Lý do vì tại mỗi điển các quỹ đạo điều khiển tối ưu là biên của phạm vi điều khiển, . nhất gọi là điều khiển tối ưu. Quỹ đạo trạng thái tương ứng từ x(t o ) đến x(T) gọi là quĩ đạo tối ưu. Khi G=1 thì được gọi là bài toán tối ưu tác động