Learning Control (LC) là gỡ

Cỏc bộ LC thường được hỡnh dung gần giống như là hệ thống điều khiển của con người và do đú nú cú cỏc thuộc tớnh giống với con người. Trong luận văn này khụng nghiờn cứu cỏc bộ LC theo quan điểm sinh học, nhưng đồng ý với một số định nghĩa sau:

Định nghĩa 1.1 (LC) Một bộ LC là một hệ thống điều khiển bao gồm trong đú 1 hàm xấp xỉ cỏc ỏnh xạ đầu vào - đầu ra tương ứng trong suốt quỏ trỡnh điều khiển mà một hoạt động mong muốn của hệ thống điều khiển đạt được.

Định nghĩa 1.2 (Hàm xấp xỉ): Một hàm xấp xỉ là một ỏnh xạ vào/ra được xỏc định bởi một hàm đươc lựa chọn F ., , với cỏc vộc tơ thụng số được lựa chọn để hàm

.

F được xấp xỉ “tốt nhất”.

Lưu ý 1.1 (Điều khiển tự học và điều khiển thớch nghi): Theo hướng này, điều khiển thớch nghi cú thể được xem xột giống như là một dạng của LC trong đú một hàm xấp xỉ được sử dụng cú thể chỉ xấp xỉ một lớp giới hạn của cỏc hàm mục tiờu. Núi chung, một bộ LC sẽ bao gồm một hàm xấp xỉ cho một lớp đối tượng cú nhiều hàm mục tiờu hơn.

Số húa bởi Trung tõm Học liệu – Đại học Thỏi Nguyờn http://www.lrc-tnu.edu.vn 3 mờ-nơron (cũng được biết đến với tờn cỏc bộ điều khiển logic mờ thớch nghi)..v..v.. Núi một cỏch sơ bộ, cỏc bộ hàm xấp xỉ cú thể được sử dụng theo 2 cỏch:

Trước hết, hàm xấp xỉ cú thể được sử dụng để tạo (một phần) tớn hiệu điều khiển. Việc học được thay thế bởi việc thớch nghi vectơ thụng số của hàm xấp xỉ theo cỏch mà một số cỏc hàm giỏ trị chứa đựng sai lệch điều khiển là cực tiểu. Bộ điều khiển này được gọi là LC trực tiếp.

Thứ hai, Hàm xấp xỉ cú thể được sử dụng để học một mụ hỡnh đối tượng tương ứng được kiểm soỏt vớ dụ như là để làm giảm hàm giỏ trị của sai số dự bỏo. Dựa trờn cơ sở của mụ hỡnh đó được học một bộ điều khiển được xõy dựng, Bộ điều khiển này được gọi là LC giỏn tiếp.

Từ khi bộ LC đầu tiờn được phỏt triển vào năm (1963) cho tới nay, lĩnh vực LC đó và đang phỏt triển rất rộng rói. Rất nhiều cỏc cấu trỳc của bộ điều khiển khỏc nhau đó được đề xuất và cỏc thuộc tớnh của chỳng (như tớnh ổn định và tốc độ hội tụ đó được phõn tớch cả trong thực tế và lý thuyết. Tuy nhiờn, mặc dự tất cả chỳng đều được nghiờn cứu nhưng chỉ cú một số bộ LC được ứng dụng trong cỏc sản phẩm mang tớnh thương mại. Cú thể vỡ những lớ do sau đõy:

Việc chứng minh sự ổn định được đỏnh giỏ cao. Phần lớn cỏc nghiờn cứu lý thuyết của cỏc bộ LC được tập trung vào tớnh ổn định. Tuy nhiờn, một bộ LC ổn định cũng khụng cần thiết mang lại một đỏp ứng ngắn hạn học tốt …….Hoạt động của bộ LC đối với một con robot đó được quan sỏt bằng cỏch mụ phỏng. Sau khi thực hiện với chuyển động 6 bậc tự do, sai số hiệu chỉnh giảm xuống hệ số 2.8. Khi tiếp tục tự học, sai số hiệu chỉnh đó tăng lờn đến hệ số 1051

tại bước lặp thứ 62.000 và cuối cựng giảm xuống hệ số 10-18

tại bước lặp thứ 250.000. Như vậy, mặc dự thực tế cuối cựng sai số hiệu chỉnh nhỏ đó đạt được nhưng bộ LC khụng cú giỏ trị thực nghiệm vỡ nú cú dải sai số hiệu chỉnh rất rộng ở giữa.

Số húa bởi Trung tõm Học liệu – Đại học Thỏi Nguyờn http://www.lrc-tnu.edu.vn 4 được sai số hiệu chỉnh điểm 0. Tuy nhiờn, điều này yờu cầu cú những tớn hiệu điều khiển lớn ở những tần số trờn băng thụng hệ thống, cỏc tần số này cú thể gõy nguy hiểm cho cỏc cơ cấu chấp hành và núi chung là khụng đạt được như mong muốn.

Loại sai số của hàm xấp xỉ. Trong đại đa số cỏc bộ LC, hàm xấp xỉ được thực hiện với vai trũ như một mạng nơron (Multi Layer Perceptron MLP). Như chỳng tụi sẽ bàn tới ở dưới đõy, loại mạng nơron này khụng tương thớch một cỏch đặc biệt cho việc điều khiển.

Trờn cơ sở những suy xột này, chỳng ta cú thể đưa ra một số cỏc thuộc tớnh sau mà một bộ LC nờn cú để để trở thành một mặt hàng được ưa chuộng về mặt thương mại:

Dễ dàng sử dụng trong một hệ thống điều khiển cú sẵn. Điều này cú nghĩa là khi cú một đỏp ứng ngắn hạn học tốt, thỡ hiệu suất cực tiểu được bảo đảm. Vớ dụ như là trong một bộ điều khiển hiện nay. Thậm chớ trong suốt quỏ trỡnh huấn luyện đối tượng vẫn cú thể được duy trỡ trong quỏ trỡnh vận hành, mà khụng gõy ra những tổn thất của quỏ trỡnh sản suất.

Cú khả năng sử dụng những kiến thức dự đoỏn của đối tượng. Núi chung cỏc nhà thiết kế và/hoặc người vận hành cú một số kiến thức về đối tượng vớ dụ như trong cấu trỳc của mụ hỡnh toỏn học (đơn giản) dưới dạng cỏc hàm, một giản đồ Bode của đối tượng hoặc một mụ tả dưới dạng biến ngụn ngữ của hành vi đối tượng. Bộ LC nờn cho phộp loại kiến thức này được kết hợp vào trong thiết kế bộ điều khiển, để chọn cỏc thụng số của bộ điều khiển hợp lý và để tăng tốc độ học.

Hàm xấp xỉ nờn phự hợp cho việc điều khiển. Điều này cú nghĩa rằng:

Khụng gian nhớ cần thiết cho việc thực hiờn nờn nhỏ. Trong thực tế, bộ điều khiển được thực hiờn bằng phần mềm được gắn vào mỏy tớnh. Dung lượng bộ nhớ là cú hạn. Do đú, số lượng cỏc thụng số của hàm xấp xỉ mà yờu cầu phải xấp xỉ tớn hiệu điều khiển khụng thể quỏ rộng.

Số húa bởi Trung tõm Học liệu – Đại học Thỏi Nguyờn http://www.lrc-tnu.edu.vn 5 Việc tớnh toỏn đầu ra của hàm xấp xỉ và sự tương thớch của quan hệ vào / ra phải được thực hiện một cỏch nhanh chúng. Trong mụi trường thời gian thực, trong một khoảng thời gian mẫu, cỏc thụng số của hàm xấp xỉ phải tương ứng và đầu ra được tớnh. Rất nhiều hệ thống chuyển động cơ điện tử yờu cầu thời gian mẫu nhỏ và cho phộp thời gian tớnh toỏn là rất ớt. Cỏc hàm xấp xỉ mà bao gồm một lượng lớn cỏc tớnh toỏn phức tạp do đú chỳng khụng phự hợp cho việc điều khiển.

Cơ chế học nờn hội tụ nhanh. Để giữ được lượng thời gian trong đú quỏ trỡnh vận hành của hệ thống được điều khiển là cận tối ưu tới mức tối thiểu, cơ chế học nờn hội tụ nhanh.

Cơ chế học khụng nờn bị tối thiểu cục bộ, khi bị lưu giữ trong mức tối thiểu cục bộ, Thỡ cơ chế học cho rằng cỏc giỏ trị đạt được của cỏc thụng số của hàm xấp xỉ, được biểu thị bởi loc, sinh ra sai số xấp xỉ cực tiểu, được biểu thị bởi E(loc). Mặc dự glob loc tồn tại, làm cho E(glob)E(loc). Trong ảnh 1.1 một vớ dụ một chiều của hiện tường như vậy được giới thiệu. Ở mức tối thiểu cục bộ,  loc, độ dốc của sai số xấp xỉ bằng 0. Cơ cấu học mà sử chỉ sử dụng độ dốc của sai số xấp xỉ thỡ khụng thể thoỏt khỏi mức tối thiểu cục bộ.

Hỡnh 1.1 Cực tiểu cục bộ trong kỹ thuật học

Khi cơ chế học dễ dàng lưu lại ở mức tối thiểu cục bộ, rất khú để huấn luyện LC để thu được hiệu quả cao.

E(ω)

Cực tiểu cục bộ

Cực tiểu toàn bộ

ωloc ωglob w

Số húa bởi Trung tõm Học liệu – Đại học Thỏi Nguyờn http://www.lrc-tnu.edu.vn 6 Quan hệ vào/ ra phải tương thớch một cỏch cục bộ. Trong một số hàm xấp xỉ, quan hệ vào/ ra này là tương thớch toàn cục. Điều này cú nghĩa là nếu giỏ trị của một trong cỏc thụng số của hàm xấp xỉ được tương thớch, thỡ quan hệ vào /ra trờn toàn bộ phạm vi đầu vào bị thay đổi. Xột một bộ LC được huấn luyện để thực hiện một số chuyển động. Khi bộ LC được huấn luyện để thực hiện một chuyển động mới, điều này liờn quan tới việc tương ứng cỏc thụng số của hàm xấp xỉ. Bởi vỡ mối quan hệ vào ra được tương thớch toàn cục nờn cỏc tớn hiệu điều khiển học trước đú bị thay đổi cú thể gõy ra nhưng tổn thất trong quỏ trỡnh làm việc. Do đú điều mong đợi ở đõy là mối quan hệ vào ra của hàm xấp xỉ được tương thớch một cỏch cục bộ. Trong trường hợp này, việc học 1 chuyển động mới sẽ khụng làm thay đổi cỏc tớn hiệu đó được học trước đú.

Hàm xấp xỉ cú khả năng tự khỏi quỏt hoỏ tốt. Khả năng tự khỏi quỏt hoỏ là khả năng tạo ra một đầu ra nhạy cho một đầu vào khụng được thể hiện trong quỏ trỡnh huấn luyện nhưng nú tương tự như cỏc huấn luyện mẫu. Khi hàm xấp xỉ cú khả năng khỏi quỏt hoỏ tốt, bộ LC cũng sẽ thu được một hiệu quả bỏm cao cho cỏc chuyển động tương tự cỏc chuyển động được huấn luyện. Vỡ vậy nú đủ để huấn luyện LC với một lượng nhỏ cỏc đặc tớnh chuyển động huấn luyện. Khi bộ xấp xỉ khụng cú khả năng tự khỏi quỏt hoỏ tốt, bộ LC phải được huấn luyện cho mỗi chuyển động quan trọng, nú tạo ra một quỏ trỡnh huấn luyện mở rộng .

Sự mềm mại của giỏ trị xấp xỉ nờn dễ dàng điều khiển. Như núi ở phần trước đõy, bộ LC khụng chỉ thu được sai số bằng khụng đối với một vài tần số, khi tớn hiệu điều khiển cú tần số cao sẽ khụng mong muốn. Người sử dụng phải cú khả năng quyết định tần số lớn nhất của đầu ra của hàm xấp xỉ.

Đỏp ứng ngắn hạn là học tốt. Đỏp ứng ngắn hạn của bộ LC nờn là loại đỏp ứng mà cú sai số bỏm dần hội tụ về giỏ trị mong muốn. Việc tăng sai số bỏm trong pha trung gian của quỏ trỡnh học cú thể làm hỏng đối tượng, hơn thế nữa, đõy là trường

Số húa bởi Trung tõm Học liệu – Đại học Thỏi Nguyờn http://www.lrc-tnu.edu.vn 7 hợp quỏ trỡnh làm việc tối thiểu cú thể khụng cũn được bảo đảm khi bộ điều khiển được sử dụng như một thiết bị ghộp thờm cho một bộ điều khiển đó cú sẵn.

Sự ổn định lõu dài cần phải được bảo đảm. Việc tự học cú thể được thực hiện một cỏch liờn tục hoặc được thực hiện trước khi vận hành. Việc học liờn tục được yờu cầu khi cỏc thụng số của đối tượng thay đổi trong suốt quỏ trỡnh vận hành. Vớ dụ, do hao mũn hay chịu ảnh hưởng của mụi trường. Trong trường hợp này, một bộ điều khiển phải cú khả năng đảm bảo việc học ổn định bất chấp cỏc điều kiện vận hành thay đổi như thế nào.

1.3. Bộ điều khiển học sai số phản hồi

Một bộ LC thỳ vị cho cỏc cỏnh tay robot mà phải bỏm một cỏch ngẫu nhiờn theo cỏc đường dẫn. Núi chung bộ điều khiển này được biết đến với cỏi tờn là bộ điều khiển học sai số phản hồi: Bộ điều khiển (Feedback Error Learning FEL).

Hệ thống LC bao gồm 2 phần:

Bộ điều khiển Feef-forward được biểu thị bằng F, nghĩa là 1 hàm/ỏnh xạ

uF = F(r). Một bộ điều khiển Feed-forward thụng thường cú thể được sử dụng để bự thờm cho cỏc hệ thống động học và theo cỏch này sẽ thu được độ bỏm chớnh xỏc cao. Khi bộ điều khiển feed-forward bằng với đối tượng nghịch đảo F = P-1, thỡ đầu ra của đối tượng, y, sẽ bằng tớn hiệu đặt , r.

Hỡnh 1.2 Bộ điều khiển FEL r - Hàm xấp xỉ C + + + UF P y r (n) r . . . . .

Số húa bởi Trung tõm Học liệu – Đại học Thỏi Nguyờn http://www.lrc-tnu.edu.vn 8 Đối tượng P, luụn chịu sự tỏc động của nhiễu. Cỏc loại nhiễu ở bao gồm cả nhiễu ngẫu nhiờn và nhiễu cú bản chất tỏi sinh. Những nhiễu tỏi sinh tỏi diễn giống nhau khi một chuyển động cụ thể được lặp lại. Điều này cú nghĩa rằng chỳng cú thể được xem xột như một hàm trạng thỏi của đối tượng, x, xem hỡnh 1.3.

Hỡnh 1.3 đối tượng và nhiễu phỏt sinh

1.3.1. Một vớ dụ về vị trớ ma sỏt độc lập.

Giống như đối tượng động học, cỏc nhiễu tỏi sinh cú thể được bự bởi một bộ điều khiển feed-forward.

Để bự chớnh xỏc cho hệ thống động học và nhiễu tỏi sinh, yờu cầu cần phải cú một mụ hỡnh chi tiết. Sự khụng chớnh xỏc về mụ hỡnh cú thể làm cho bộ điều khiển feed-forward vận hành kộm. Khi một mụ hỡnh chớnh xỏc khú cú thể xỏc định được, thỡ một phương phỏp thay thế cú thể được thực hiện.

Thay vỡ đi thiết kế một bộ điều khiển feed-forward dựa trờn những đặc điểm cơ bản của mụ hỡnh thực hiện bộ điều khiển feed-forward giống như là một hàm xấp xỉ, vớ dụ như là UF F r, . Trong suốt quỏ trỡnh điều khiển, quan hệ vào/ra của hàm xấp xỉ được tự thớch ứng để học cỏc đối tượng nghịch đảo và để bự cỏc nhiễu phỏt sinh. Khú khăn chớnh ở đõy là lựa chọn tớn hiệu học mà chỉ ra được mối quan hệ vào/ra của hàm xấp xỉ phải được tương thớch như thế nào. Tớn hiệu học cú thể thu được theo rất nhiều cỏch. Theo lý thuyết đó chứng minh chỉ ra rằng khi đầu ra của

u + +

y x

Số húa bởi Trung tõm Học liệu – Đại học Thỏi Nguyờn http://www.lrc-tnu.edu.vn 9

bộ điều khiển phản hồi được sử dụng làm tớn hiệu học (hỡnh 1.2) thỡ quan hệ vào/ra của hàm xấp xỉ hội tụ tới đối tượng nghịch đảo và giỏ trị bự của nhiễu tỏi sinh.

Loại hàm xấp xỉ mà chỳng ta sử dụng ở đõy là mạng nơron MLP.

  9 3 , 3 , 3 , 2 , 2 , 2 , 1 , 1 , 1 , R r  d d d d d d d d d T (1.1)

Trong trường hợp cỏnh tay 3 bậc tự do (Degrees Of Freedom DOF) sử dụng kinh nghiệm, đầu vào của MLP bao gồm gúc khớp đặt θd và đạo hàm bậc 1 bậc 2 của chỳng:

Trong khi đầu ra uF được xột dưới dạng lực xoắn động cơ; (cụng thức 1.2)

  3

3 2

1 R

uF    T  (1.2)

Bộ điều khiển phản phản hồi. Như đó được núi tới, bộ điều khiển phản hồi trạng thỏi, đem lại cỏc tớn hiệu học cho bộ điều khiển feed-forward. Hơn thế, nú xỏc định quỏ trỡnh bỏm cực tiểu tại thời điểm bắt đầu học. Cuối cựng, bộ điều khiển phản hồi bự cỏc nhiễu ngẫu nhiờn.

Bộ điều khiển FEL đó được thực hiện trong nhiều ứng dụng của nhiều tỏc giả; vớ dụ như là:

- Hệ thống phanh tự động cho ụtụ. - Điều khiển hệ thống camera. - Điều khiển cỏnh tay robot. - Mỏy hàn.

Cỏc ứng dụng chỉ ra rằng bộ điều khiển FEL đó cải thiện một cỏch rừ ràng dựa trờn quỏ trỡnh vận hành của bộ điều khiển phản hồi và cỏc ứng dụng này cũng chỉ ra cú thể thu được chất lượng bỏm cao mà khụng cần mụ hỡnh mở rộng. Cỏch hoạt động của một bộ FEL được so sỏnh với cỏch hoạt động của hệ thống điều khiển thớch nghi. Kết luận rằng, trong trường hợp mụ hỡnh đối tượng chớnh xỏc được sử dụng trong cỏc hệ thống điều khiển thớch nghi, quỏ trỡnh bỏm của bộ điều khiển thớch nghi và của bộ điều khiển FEL là tương tự như nhau. Khi FEL hội tụ chậm hơn

Số húa bởi Trung tõm Học liệu – Đại học Thỏi Nguyờn http://www.lrc-tnu.edu.vn 10 bộ điều khiển thớch nghi, trong tỡnh huống này bộ điều khiển thớch nghi được ưa chuộng hơn. Tuy nhiờn khi chưa cú một mụ hỡnh đối tượng chớnh xỏc, thỡ bộ điều khiển thớch nghi sẽ khụng thể thu được hiệu suất bỏm như mong muốn. Bộ điều khiển FEL khụng phải trải qua điều này và nú vẫn đem lại hệ số bỏm chớnh xỏc. Khả

Kết quả mụ phỏng bằng phần mềm 20-sim

Sự lựa chọn tốc độ học