Luận Văn Thạc Sĩ Kỹ Thuật Điều Khiển Ứng Dụng Mạng Nơron Trong Nhận Dạng Và Điều Khiển.docx

TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI LUẬN VĂN THẠC SĨ Ứng dụng mạng nơ ron trong nhận dạng và điều khiển TẠ THỊ CHINH Ngành Kỹ thuật Điều khiển và Tự động hóa Giảng viên hướng dẫn TS Nguyễn Hoài Nam Viện Đ[.]

MẠNG NƠ-RON VÀ ỨNG DỤNG

Lịch sử phát triển mạng nơ-ron

Từ những năm 1890, nghiên cứu của nhà tâm lý học William đã phát hiện ra hệ nơ-ron thần kinh của con người Đến năm 1943, nhà thần kinh học Warren Mcculloch và nhà toán học Walter Piits đã có công trình nghiên cứu về mạng nơ- ron nhân tạo tính bằng một hàm đại số hoặc logic, họ xây dựng một mạng nơ-ron đơn giản bằng mạch điện Đây có thể coi là nguồn gốc của lĩnh vực mạng nơ-ron. Đầu những năm 1950, Nathanial Rochester đã có những mô phỏng đầu tiên của một mạng nơ-ron tại phòng thí nghiệm nghiên cứu của IBM Năm 1956, dự án Dartmouth nghiên cứu về trí tuệ nhân tạo (Artificial Intelligence) mở ra thời kỳ phát triển mới cả trong lĩnh vực trí tuệ nhân tạo lẫn nơ-ron Sau đó, John von Neumann đã sử dụng role điện áp hoặc đèn chân không mô phỏng các nơ-ron đơn giản.

Năm 1958, nhà sinh học Frank Rosenblatt nghiên cứu về perception và luật học Mạng perception chỉ có khả năng nhận dạng mẫu, tuy nhiên chỉ có thể giải quyết được một số bài toán mà thôi, nó không dùng cho các hàm logic phức. Năm 1959, Bernard Windrow và Ted Hoff thuộc trường đại học Stanford đã đưa ra luật học mới và dùng nó để huấn luyện mạng nơ-ron tuyến thích nghi đầu tiên là MADALINE, mạng này có cấu trúc và khả năng tương tự như mạng mạng perceptron của Rosenblatt Luật học của Windrow và Hoff hiện nay vẫn được sử dụng Tuy nhiên sự nghiên cứu này đã bị dừng lại trong nhiều thập kỷ sau đó.

Một mạng nơ-ron đã được phát triển độc lập, có thể thực hiện như các bộ nhớ được Kohonen và Anderson nghiên cứu vào năm 1972 Năm 1973 Von Der Marlsburg đưa ra quá trình học cạnh tranh và mạng tự tổ chức Self-organization. Năm 1974 Paul Werbos đã phát triển và ứng dụng phương pháp Back- propagation (lan truyền ngược) Các mạng này được biết đến nhiều nhất và áp dụng rộng rãi cho đến ngày nay. Đầu những năm 80, John Hopfield đã đưa ra mạng nơ-ron hồi quy DavidRumelhart và James Mcclelland là những tác giả đầu tiên đã đưa ra thuật toán lan truyền ngược để huấn luyện mạng Perceptron nhiều lớp.

Lu n văn Th c sĩ Kỹ thu t Đi u khi n ng d ng m ng n ron trong nh n d ng và đi u khi n ậ ạ ậ ề ể Ứ ụ ạ ơ ậ ạ ề ể

Vào đầu những năm 1990, thuật toán Leven-berg Marquart đã được Martin Hagan đề xuất để huấn luyện mạng Bên cạnh còn có phương pháp Bayes cũng được sử dụng rất nhiều trong việc huấn luyện mạng nhiều lớp.

Cũng trong thời gian này, Lecun và đồng tác giả đã nghiên cứu và ứng dụng mạng nơ-ron nhiều lớp để xử lý ảnh, mạng nơ-ron này được gọi là mạng tích chập (Convolutional Networks) và được ứng dụng rất nhiều trong lĩnh vực xử lý ảnh, giọng nói và tín hiệu.

Từ sau năm 1987 đến nay, mạng nơ-ron trở thành một vấn đề được quan tâm của các nước, các cuộc hội thảo quốc tế liên tục được diễn ra để phát triển nơ-ron một cách triệt để nhất: viện vật lý Hoa Kỳ tổ chức cuộc họp hàng năm về mạng nơ-ron ứng dụng trong tin học năm 1985, hội thảo quốc tế đầu tiên về mạng nơ- ron của Viện các kỹ sư điện và điện tử IEEE (Institute of Electrical andElectronic Engineer) Hàng năm thế giới đều mở hội nghị toàn cầu chuyên vềNeural IJCNN (International Joint Conference on Neural Networks).

Mạng nơ-ron nhân tạo

Mạng nơ-ron nhân tạo (anns) hay hệ thống kết nối là hệ thống tính toán được lấy cảm hứng từ mạng thần kinh sinh học cấu thành bộ não Một ANN dựa trên một tập hợp các đơn vị được kết nối được gọi là tế bào thần kinh nhân tạo (artificial Nơ-rons) tương tự như tế bào thần kinh sinh học trong não Mỗi khớp (synapse) giữa các nơ-ron có thể truyền tín hiệu đến một nơ-ron khác Tế bào thần kinh nhân tạo (post - synaptic) có thể xử lý các tín hiệu và sau đó truyền xuống tín hiếu tới các nơ-ron được kết nối với nó Các nơ-ron có thể có trạng thái, thường được biểu thị bằng số thực, thường nằm trong khoảng từ 0 đến 1. Các nơ-ron và khớp thần kinh cũng có thể có trọng số thay đổi khi tiến hành học tập, có thể tăng hoặc giảm cường độ tín hiệu mà nó truyền xuống.

Thông thường, nơ-ron được tổ chức theo lớp Các lớp khác nhau có thể thực hiện các loại biến đổi khác nhau trên đầu vào của chúng Tín hiệu truyền từ lớp đầu tiên (đầu vào), đến lớp (đầu ra) cuối cùng, có thể sau khi đi qua các lớp nhiều lần.

Mục tiêu ban đầu của mạng nơ-ron là giải quyết các vấn đề theo cách tương tự như bộ não của con người Theo thời gian, sự chú ý tập trung vào việc phù hợp

Lu n văn Th c sĩ Kỹ thu t Đi u khi n ng d ng m ng n ron trong nh n d ng và đi u khi n ậ ạ ậ ề ể Ứ ụ ạ ơ ậ ạ ề ể với khả năng cụ thể, dẫn đến những sai lệch so với sinh học như truyền ngược, hoặc truyền thông tin theo hướng ngược lại và điều chỉnh mạng để phản ánh thông tin đó.

Hình 1.1 Mạng nơ-ron sinh học [8].

Neural Networks đã được sử dụng trên nhiều nhiệm vụ, bao gồm thị giác máy tính, nhận dạng giọng nói, dịch máy, lọc mạng xã hội và chẩn đoán y tế. Tính đến năm 2017, các Neural Networks thường có vài nghìn đến vài triệu đơn vị và hàng triệu kết nối Mặc dù con số này nhỏ hơn số lượng tế bào thần kinh trên não người, nhưng các mạng này có thể thực hiện nhiều nhiệm vụ ở cấp độ vượt xa con người (ví dụ: nhận diện khuôn mặt, chơi “Go” …).

Ứng dụng của mạng nơ-ron

Mạng nơ-ron được ứng dụng rất nhiều để giải quyết các bài toán trong thực tế như phân loại (ảnh, giọng nói, tín hiệu), xấp xỉ, dự báo, nhận dạng hệ thống và thiết kế bộ điều khiển Sau đây là một số ứng dụng của mạng nơ-ron :

• Điện tử: sự bố trí chíp IC, điều khiển quá trình, phân tích lỗi chip, thị lực máy, tổng hợp tiếng nói, mô hình hóa phi tuyến.

• Robot: điều khiển quỹ đạo, xe nâng hàng, các bộ điều khiển tay máy, các hệ thống thị giác, xe tự hành.

• Ô tô: các hệ thống dẫn hướng tự động, điều khiển bơm nhiên liệu, các hệ thống phanh tự động, dò động cơ không nổ, các cảm biến dò sự phát khí ảo.

• Sản xuất: điều khiển quá trình sản xuất, phân tích và thiết kế sản phẩm, chuẩn đoán máy và quá trình, nhận dạng hạt thời gian thực, các hệ thống kiểm tra chất lượng, thử bia, phân tích chất lượng hàn, dự đoán chất lượng giấy, phân tích chất lượng chip máy tính, phân tích các hoạt động nghiền, phân tích thiết kế sản phẩm hóa học, phân tích bảo dưỡng máy, đấu thầu dự án, quản lí và kế hoạch hóa, mô hình động của các quá trình hóa học.

• Vũ trụ, ngân hàng, quốc phòng, giải trí, tài chính, bảo hiểm, y tế, dầu khí, an ninh, giao thông và truyền thông [3].

Mô hình nơ-ron nhân tạo

1.4.1 Mô hình nơ-ron a) Mô hình nơ-ron một đầu vào

Hình 1.2 Sơ đồ mô hình nơ-ron một đầu vào

Hình 1.2 biểu thị sơ đồ cấu trúc của một nơ-ron nhân tạo có một đầu vào Quan hệ vào ra của nơ-ron như sau:

Trong đó: n = wp + b n = wp + b p : đầu vào của nơ-ron w : trọng số đầu vào b : ngưỡng

Lu n văn Th c sĩ Kỹ thu t Đi u khi n ng d ng m ng n ron trong nh n d ng và đi u khi n ậ ạ ậ ề ể Ứ ụ ạ ơ ậ ạ ề ể n: là đầu vào net f : là hàm truyền a : đầu ra của nơ-ron Một số hàm truyền cơ bản: [3].

Hàm giới hạn cứng Hardlim: a = hardlim(n)

Hàm tuyến tính dương: a = n a = logsig(n)

Hàm khuếch đại bão hòa:

Vì bài toán này chỉ sử dụng đến hàm tansig nên chỉ nghiên cứu về hàm tansig

Lu n văn Th c sĩ Kỹ thu t Đi u khi n ng d ng m ng n ron trong nh n d ng và đi u khi n ậ ạ ậ ề ể Ứ ụ ạ ơ ậ ạ ề ể Đồ thị hàm tansig(n) được biểu diễn như sau:

Hình 1.3 Đồ thị hàm a=tansig(n) [7].

Hàm này có giá trị biến dương trong khoảng -1 tới 1, có đạo hàm liên tục với mọi n và thường được sử dụng trong các lớp ẩn. b) Mô hình nơ-ron với nhiều đầu vào:[3].

Hình 1.4 Mô hình nơ-ron với R đầu vào

Hình 1.5 Sơ đồ rút gọn nơ-ron với R đầu vàoNơ-ron có nhiều đầu vào được mô tả như hình 1.4, trong đó đầu vào là một véc-tơ p có R thành phần:

Lu n văn Th c sĩ Kỹ thu t Đi u khi n ng d ng m ng n ron trong nh n d ng và đi u khi n ậ ạ ậ ề ể Ứ ụ ạ ơ ậ ạ ề ể i p =[ p , p , , p ] T (1.9)

1 2 R và véc-tơ trọng số như sau: w =[w 1,1 , w 1,2

Mỗi đầu vào p i sẽ được đưa vào bộ tổng thông qua một trọng số w 1,i Đầu vào net được tính theo công thức sau: Đầu ra của nơ-ron là: n =w 1,1 p 1 +w 1,2 p 2

Với f là hàm truyền nơ-ron Công thức (1.11) có thể được viết gọn như n = ∑ R w 1,i p 1,i + b i=1 (1.13)

Khi nhiều nơ-ron có cùng chung đầu vào thì được gọi là một lớp nơ-ron (gọi tắt là lớp) Một lớp có số đầu ra bằng số nơ-ron có chung đầu vào Trong một lớp các hàm truyền thường được chọn là giống nhau, chẳng hạn cùng là hàm tuyến tính Sơ đồ cấu trúc một lớp nơ-ron như hình 1.6, trong đó có m nơ-ron, đầu ra của nơ-ron thứ i là a i = f i (n i ) với : n i = b i + ∑ R w i , j p j j =1

] [ ] W =[ w; w; ; w ] của lớp sẽ là và a = f (n) , trong đó: f n = Wp + b =[ f f f ] T (1.15)

Hình 1.6 Sơ đồ cấu trúc của một lớp nơ-ron [3].

• Cấu trúc mạng một lớp

Hình 1.7 Cấu trúc mạng nơ-ron 1 lớp

Một cấu trúc toán học mạng 1 lớp với R đầu vào và S trên hình 1.7 Trong mạng này mỗi phần tử của véc-tơ vào p nơ-ron được chỉ ra liên hệ với đầu vào mỗi nơ-ron thông qua ma trận trọng số W Bộ cộng của nơ-ron thứ i thu thập các trọng liên kết đầu vào và độ dốc để tạo thành một đầu ra vô hướng n i Các n i tập

Lu n văn Th c sĩ Kỹ thu t Đi u khi n ng d ng m ng n ron trong nh n d ng và đi u khi n ậ ạ ậ ề ể Ứ ụ ạ ơ ậ ạ ề ể i hợp với nhau tạo thành s phần tử của véc-tơ vào n Cuối cùng ở lớp nơ-ron thu được véc-tơ a gồm s phần tử.

Có thể thiết lập lớp đơn của các nơ-ron có các hàm truyền khác nhau một cách dễ dàng bởi lẽ hai mạng được đặt song song Tất cả các mạng có thể có chung đầu vào và mỗi mạng có thể thiết lập một vài đầu ra.

Các phần tử của véc-tơ đầu vào được đưa vào mạng thông qua ma trận trọng số W , với: w 11

Trong đó chỉ số hàng trong các phần tử của ma trận W cho biết nơ-ron nơi đến, còn chỉ số cột cho biết nơi xuất phát của trọng liên kết. Để đơn giản kí hiệu một mạng gồm S nơ-ron, R đầu vào như hình 1.8.

Hình 1.8 Sơ đồ rút gọn mạng một lớp R đầu vào và S nơ-ron

Trong hình 1.8 có véc-tơ vào P có kích thước R, ma trận trọng liên kết W có kích thước SxR, còn a và b là các véc-tơ có kích thước S, b là bias.

Một mạng nơ-ron có thể có một vài lớp Mỗi lớp có ma trận trọng số W , bias b và đầu ra a

Hình 1.9 là sơ đồ cấu trúc mạng nơ-ron 3 lớp Trong đó có R đầu vào, và S i là nơ-ron ở lớp i, i là đầu ra lớp i , với

S i = 1, 2, 3. Để đơn giản kí hiệu sơ đồ rút gọn mạng nơ-ron 3 lớp như hình 1.10. a

Hình 1.9 Cấu trúc mạng nơ-ron 3 lớp

Hình 1.10 Sơ đồ rút gọn mạng nơ-ron 3 lớp

Mạng hồi quy (mạng phản hồi) là loại mạng tự liên kết thành các vòng và liên kết hồi quy giữa các nơ-ron [2].

Khi các hàm liên thuộc có dạng Gaussmf, độ thỏa mãn được tính sử dụng công thức PROD α i =α i ,1 α i

,2 α i ,m , và các hàm g i là các hằng số, có thể biểu diễn mô hình mờ Sugeno dưới dạng như sau: y′ =θ T Φ( x) (1.16)

Lu n văn Th c sĩ Kỹ thu t Đi u khi n ng d ng m ng n ron trong nh n d ng và đi u khi n ậ ạ ậ ề ể Ứ ụ ạ ơ ậ ạ ề ể i i i i i i i trong đó θ = [ y , y , , y ] T , Φ( x)

1 2 n 1 2 n 1 2 m m và α i (x) = ∑ à A j, i ( x j ) Cụng thức (1.16) cú quan hệ vào ra của mạng xuyờn tõm j=1

(RBF) Như vậy hàm α i (x) còn được gọi là các hàm cơ sở hay hàm truyền trong mạng nơ-ron và θ còn được gọi là véc-tơ các trọng số của mạng.

Mạng RBF gồm hai lớp Lớp thứ nhất gồm các nơ-ron với hàm truyền như sau: a 1 = e −( n 1 ) 2 (1.17) trong đó: i n 1 =|| p − (w 1 ) T || b 1 (1.18)

1 là véc-tơ trọng số của nơ-ron i hay là tâm, b 1 là ngưỡng của nơ-ron i , ||*|| là khoảng cách giữa vec-tơ đầu vào với véc-tơ trọng số, p là véc-tơ đầu vào Khi b 1 = 1 /

( σ 2 ) trong đó σ là độ lệch chuẩn, thì hàm truyền (1.17) có dạng Gaussmf Lớp thứ hai có hàm truyền là tuyến tính: a 2 = W 2 a 1 + b 2 (1.19)

Mạng này thường được sử dụng để xấp xỉ các thành phần bất định của tượng trong quá trình thiết kế bộ điều khiển.

Hình 1.11 Sơ đồ mạng hồi quy w

Ứng dụng trong điều khiển

Xét một bài toán điểu khiển theo nguyên tắc phản hồi đầu ra như ở hình 1.12, muốn tổng hợp được bộ điều khiển cho đối tượng để hệ kín có được chất lượng như mong muốn thì trước tiên cần phải hiểu biết về đối tượng, tức là cần phải có một mô hình toán học mô tả đối tượng Không thể điều khiển đối tượng khi không hiểu biết về nó Kết quả tổng hợp bộ điều khiển phụ thuộc rất nhiều vào mô hình mô tả đối tượng Mô hình càng chính xác, hiệu suất công việc càng cao.

Hình 1.12 điều khiển theo nguyên tắc phản hồi đầu ra [2].

Việc xây dựng mô hình cho đối tượng gọi là mô hình hóa Thường phân chia các mô hình hóa làm hai loại:

Một số bài toán trong nhận dạng:

- Nhận dạng trực tuyến mô hình không tham số hệ tuyến tính

- Nhận dạng chủ động tham số mô hình AR

- Nhận dạng tham số mô hình ARMA.

1.5.2 Thiết kế bộ điều khiển Để thiết kế bộ điều khiển có các cách sau:

- Bộ điều khiển theo mô hình mẫu

- Điều khiển thích nghi trực tiếp

- Điều khiển thích nghi gián tiếp

- Điều khiển sử dụng ADP

Lu n văn Th c sĩ Kỹ thu t Đi u khi n ng d ng m ng n ron trong nh n d ng và đi u khi n ậ ạ ậ ề ể Ứ ụ ạ ơ ậ ạ ề ể d p a) Thiết kế bộ điều khiển theo mô hình mẫu Để thiết kế bộ điều khiển nơ-ron cần phải có tín hiệu vào ra mẫu Ở đây dùng một mô hình mẫu thể hiện đáp ứng đầu ra mong muốn của đối tượng. Thường mong muốn đáp ứng quá độ của hệ kín phải đáp ứng được thời gian xác lập và độ quá điều chỉnh theo yêu cầu, do đó có thể chọn mô hình mẫu là một khâu ổn định có thể là quán tính hoặc dao động.

Bộ điều khiển nơ-ron có cấu trúc là mạng hồi quy, thường có hai lớp. Mạng vòng điều khiển phản hồi: giá trị đặt sẽ được đưa vào đầu vào của mạng NNc, đầu ra của mạng NNc sẽ được đưa vào đầu vào của mạng NNp Như vậy mạng NN sẽ có đầu vào là giá trị đặt và đầu ra là đầu ra của mạng NNp. Để thiết kế bộ điều khiển NNc sẽ huấn luyện mạng NN sử dụng bộ tín hiệu vào ra mẫu Trong quá trình huấn luyện mạng NN, chỉ chỉnh định các tham số của mạng NNc, còn các tham số của mạng NNp giữ nguyên các giá trị đã được xác định từ quá trình nhận dạng.

Mạng NN thường là mạng sâu (deep network) bởi vì mỗi mạng NNc và NNp đều có ít nhất là hai lớp, do đó mạng NN có ít nhất 4 lớp Đây là một mạng hồi quy, trong đó có ít nhất 3 vòng phản hồi, cho nên phải dùng thuật toán lan truyền ngược để tính gradient.

Như vậy bài toán thiết kế bộ điều khiển mạng nơ-ron ở đây trở thành bài toán nhận dạng hệ thống, nhưng cấu trúc phức tạp hơn nhiều [3]. b) Thiết kế bộ điều khiển dự báo Để thiết kế bộ điều khiển dự báo dùng mạng nơ-ron, trước tiên phải xây dựng một mô hình toán cho đối tượng bằng mạng nơ-ron.

Khi có mô hình mạng nơ-ron đối tượng sẽ dùng mạng này để dự báo đầu ra của đối tượng trong tương lai Sau đó sử dụng thuật toán tối ưu để tìm tín hiệu điều khiển tối ưu dựa trên hàm mục tiêu như sau:

N 2 − N 1 là tầm dự báo, N u là tầm điều khiển, u là tín hiệu điều khiển, y d là đầu ra mong muốn và y p là đầu ra của mô hình nơ-ron của đối tượng NNp.

Lu n văn Th c sĩ Kỹ thu t Đi u khi n ng d ng m ng n ron trong nh n d ng và đi u khi n ậ ạ ậ ề ể Ứ ụ ạ ơ ậ ạ ề ể m D

Hàm mục tiêu (1.20) sẽ được giải online Kết quả tìm được là các giá trị tối ưucủa tín hiệu trong điều khiển trong tầm điều khiển u* =[u *(t ) u *(t +1) u *(t +

−1)], với t là thời điểm hiện tại Ở thời điểm tiếp theo t +1 , giá trị u*(t) sẽ được đưa ra để điều khiển đối tượng tiếp theo t +1 , giá trị u*(t) sẽ được đưa ra để điều khiển đối tượng và hàm mục tiêu (1.20) lại được giải online để tìm giá trị tối ưu cho chu kỳ tiếp theo Để giải bài toán tối ưu (1.20) thường dùng phương pháp hạ sâu nhất, hoặc phương pháp bình phương cực tiểu sau khi tuyến tính hóa mô hình mạng nơ-ron của đối tượng [3]. c) Điều khiển thích nghi trực tiếp

Xét đối tượng phi tuyến có dạng như sau: [3]. d i x x ( n) f (x, x, , x ( n−1) ) + bu (1.21) trong đó x ( i) = , ulà tín hiệu đầu vào, f và b > 0 dt i là các hàm số và hằng số chưa biết, y = x là đầu ra của đối tượng Đặt x = [ x, x, , x ( n−1) ] T

Bài toán đặt ra là thiết kế bộ điều khiển mờ trực tiếp u D = u D ( x| θ

) sao cho y → y m , trong đó y m là đầu ra mong muốn hay giá trị đặt.

Bộ điều khiển mờ trực tiếp có dạng như sau: u = θ T ζ ( x) (1.22) trong đó ζ (x) là véc-tơ các hàm cơ sở.

Tín hiệu điều khiển lý tưởng trong các trường hợp hệ xác định là : u* = 1

Thay (1.22) vào (1.23), sau khi biến đổi được: với k =[k , k , , k ] T e( n) = −k e + b(u* −u T D ) (1.24)

1 2 Định nghĩa n e = [e, e, , e (n−1) ] T Có thể viết lại (1.24) dưới dạng phương trình trạng thái như sau: e = Λe +b[u * −u D ( x,θ

Lu n văn Th c sĩ Kỹ thu t Đi u khi n ng d ng m ng n ron trong nh n d ng và đi u khi n ậ ạ ậ ề ể Ứ ụ ạ ơ ậ ạ ề ể n trong đó: Λ nxn = (1.26) k 1 k 2 k 3 k 4 k n−1 k n và b nx1 =[0, 0, 0, , 0, b] T

Gọi sai số xấp xỉ là: w= u D ( x,θ *) − u* (1.27)

Với θ * là véc-tơ tham số tối ưu của hệ mờ Viết lại phương trình (1.25) thu được:

Với γ > 0 Đạo hàm V thu được:

2 γ n n trong đó p n là véc-tơ cột cuối cùng của ma trận P

Chọn luật thích nghi: có: θ = γ e T p ζ (x)

(1.32) trong đó λ min là giá trị riêng nhỏ nhất của ma trận Q Khi sai lệch nằm ngoài miền Γ ={e|e|< 2 | p n w | λ min } thì V < 0 Điều đó có nghĩa là sai lệch điều khiển sẽ tiến về vùng Γ có chứa gốc 0.

Lu n văn Th c sĩ Kỹ thu t Đi u khi n ng d ng m ng n ron trong nh n d ng và đi u khi n ậ ạ ậ ề ể Ứ ụ ạ ơ ậ ạ ề ể m n −n 1 1 d) Điều khiển thích nghi gián tiếp x ( n) d i f ( x, x, , x ( n−1) )

(1.33) trong đó x ( i) dt i là đạo hàm bậc i của x, u là tín hiệu đầu vào, f và g là các hàm số chưa biết, y = x là đầu ra của đối tượng.

Bài toán đặt ra là thiết kế bộ điều khiển sao cho ra mong muốn hay giá trị đặt.

Mô hình xác định y → y m , trong đó y m là đầu Đầu tiên xét trường hợp các hàm số f và g là xác định. Đặt x = [x, x, , x ( n−1) ] T

Khi đó phương trình (1.14) có dạng: x ( n) = f (n) + g( x)u (1.34) Đặt e = y m − y và e = [e, e, , e (n−1) ] T

Thiết kế bộ điều khiển cho hệ cho mô hình xác định (1.34) như sau: u* = 1 g(x)[ − f ( x) + y ( n) + k T e] (1.35) với k =[ k , k , , k ] T Thay bộ điều khiển (1.35) vào (1.34) được:

Như vậy đa thức trên sẽ ổn định nếu như đa thức sau là Hurwitz (điểm cực nằm bên trái trục ảo): n n−1 n − 2

Tóm lại, khi đối tượng (1.33) xác định thì với bộ điều khiển (1.35) thỏa mãn điều kiện (1.36) là đa thức Hurwitz sẽ làm cho hệ thống ổn định.

Khi mô hình của đối tượng (1.33) là bất định, các hàm bất định sẽ được xấp xỉ bởi các mạng nơ-ron như sau: f ( x ) và

Lu n văn Th c sĩ Kỹ thu t Đi u khi n ng d ng m ng n ron trong nh n d ng và đi u khi n ậ ạ ậ ề ể Ứ ụ ạ ơ ậ ạ ề ể f f g g

(1.37) trong đó ζ (x) và η(x) là véc-tơ các hàm cơ sở (hàm cơ sở thường là hàm gaussmf), θ f và θ g là các véc- tơ tham số ở đầu ra của mạng xuyên tâm.

Khi đó bộ điều khiển mờ thích nghi gián tiếp được thiết kế như sau sẽ làm cho hệ ổn định. u = 1

I gˆ(x,θ ) f m với luật chỉnh định thích nghi là : θ = −γ e T Pbζ (x)

(1.39) θ g = −γ 2 e Pb T η (x)u trong đó P là ma trận đối xứng xác định dương thỏa mãn phương trình Lyapunov và k được chọn như ở trên.

Thay (1.38) vào (1.33) và biến đổi được: e ( n) = −k T e +[ ˆf( x,θ ) − f( x)] +[ ˆg( x,θ ) − g( x)] u (1.40)

Viết lại dưới dạng ma trận có: f g I trong đó: e = Λe +b{[ ˆf ( x,θ )

* là các tham số tối ưu của hệ mờ (mạng nơ-ron) Khi đó có thể viết lại phương trình (1.41) dưới dạng sau: e = Λe +b{[ fˆ( x,θ ) − f( x,θ * )] +[ ˆg( x,θ ) − g( x,θ * )] u+w} (1.43) f f g g I

Lu n văn Th c sĩ Kỹ thu t Đi u khi n ng d ng m ng n ron trong nh n d ng và đi u khi n ậ ạ ậ ề ể Ứ ụ ạ ơ ậ ạ ề ể θ g g g I với w = [ fˆ (x, θ * )

1 2 với P thỏa mãn phương trình Lyapunov: Λ T P + PΛ = −Q trong đó Q là ma trận đối xứng xác định dương Đạo hàm (1.44) có:

Với luật thích nghi (1.38) và bộ điều khiển (1.38) thì V < 0 khi véc-tơ sai lệch e nằm bên ngoài miền hấp dẫn e∉Γ = e || e |

Pbw λ min với λ min là giá trị riêng nhỏ nhất của ma trận Q , do đó hệ thống sẽ ổn định.[3].

1.5.3 Ứng dụng trong cánh tay Robot một bậc tự do Định nghĩa theo tiêu chuẩn AFNOR (Pháp): Robot công nghiệp là một cơ cấu chuyển động tự động có thể lập trình, lặp lại các chương trình, tổng hợp các chương trình đặt ra trên các trục toạ độ; có khả năng định vị , định hướng , di chuyển các đối tượng vật chất: chi tiết, đạo cụ, giá lắp theo những hành trình thay đổi đã chương trình hoá nhằm thực hiện các nhiệm vụ công nghệ khác nhau

- Định nghĩa theo RCA (Robot institute of America): Robot là một tay máy vạn năng có thể lặp lại các chương trình được thiết kế để di chuyển vật liệu, chi tiết,dụng cụ hoặc các thiết bị chuyên dùng thông qua các chương trình chuyển động có thể thay đổi để hoàn thành các nhiệm vụ khác nhau Định nghĩa theo GHOCT 25686-85 (Nga): Robot công nghiệp là một máy tự động, được đặt cố định hoặc di động được, liên kết giữa một tay máy và một hệ thống điều khiển theo chương trình, có thể lập trình lại để hoàn thành các chức năng vận động và điều khiển trong quá trình sản xuất

Có thể nói Robot công nghiệp là một máy tự động linh hoạt thay thế từng phân đoạn hoặc toàn bộ các hoạt động cơ bắp và hoạt động trí tuệ của con người trong nhiều khả năng thích nghi khác nhau.

Kết luận chương 1

Như vậy, tổng kết lại, chương 1 đã giới về lịch sử hình thành và phát triển của mạng nơ-ron từ năm 1980 đến nay, cũng như tìm hiểu về khái niệm, mô hình, cấu tạo của mạng nơ-ron nhân tạo Mạng nơ-ron đang phát triển rất mạnh mẽ trong thực tế nên nó được ứng dụng rất nhiều cả trong nghiên cứu điều khiển lẫn trong công nghiệp.

Trên cơ sở tính năng của mạng nơ-ron trong điều khiển, từ đó có thể nhận dạng được hệ thống, hay thiết kế bộ điều khiển.

Các chương sau sẽ đi vào phân tích cụ thể ứng dụng của mạng nơ-ron vào phương pháp điều khiển dự báo Và sẽ đi vào bài toán cụ thể là thiết kế bộ điều khiển dự báo cho cánh tay máy một bậc tự do.

PHƯƠNG PHÁP ĐIỀU KHIỂN DỰ BÁO DỰA TRÊN MẠNG NƠ- RON

Phương pháp điều khiển dự báo

- Điều khiển hệ thống được hiểu là bài toán can thiệp vào đối tượng điều khiển để hiệu chỉnh, để biến đổi sao cho nó được chất lượng mong muốn.

- Định nghĩa tối ưu hóa: Trong điều khiển hệ thống, thường gặp bài toán chọn các tham số điều khiển trong số những tham số thích hợp sao cho hệ thống đạt được chất lượng một cách tốt nhất Bài toán đó được gọi là điều khiển tối ưu tĩnh, hay còn gọi là tối ưu hóa [3].

Hình 2.1 Cấu trúc hệ điều khiển dự báo Điều khiển dự báo ra đời cách đây khoảng vài thập kỷ (từ những năm 1960 và đã có nhiều ứng dụng thành công trong công nghiệp) (Richalet, 1993) Hiện nay điều khiển dự báo là chiến lược điều khiển được sử dụng phổ biến nhất trong việc điều khiển quá trình Bộ điều khiển dự báo dùng một mô hình để đoán trước đáp ứng tương lai của đối tượng điều khiển tại các thời điểm rời rạc trong một phạm vi dự báo (Prediction horizon) nhất định Dựa vào đáp ứng dự báo này, một thuật toán tối ưu hoá được sử dụng để tính toán chuỗi tín hiệu điều khiển tương lai trong phạm vi điều khiển (Control horizon) sao cho sai lệch giữa đáp ứng dự báo bởi mô hình và tín hiệu chuẩn cho trước là tối thiểu Phương pháp điều khiển dự báo là phương pháp tổng quát thiết kế bộ điều khiển trong miền thời gian có thể áp dụng cho hệ tuyến tính cũng như hệ phi tuyến.

Lu n văn Th c sĩ Kỹ thu t Đi u khi n ng d ng m ng n ron trong nh n d ng và đi u khi n ậ ạ ậ ề ể Ứ ụ ạ ơ ậ ạ ề ể i = 0,1, 2,…, M −1 giữa tín hiệu ra tương lai yˆ k+ i trong toàn bộ cửa sổ dự báo

[ k, k +M ) , kể từ thời điểm k hiện tại, và tín hiệu đặt w k+i , đạt giá trị nhỏ nhất.

- Mô hình dự báo được sử dụng để xác định xấp xỉ các tín hiệu đầu ra yˆ k+ i từ giá trị đầu vào quá khứ tương ứng tính tại thời điểm k + i, tức là xác định: yˆ= k+ii ϕ (u k , , u k+i−1 ) Điều khiển dự báo là phương pháp điều khiển được áp dụng chủ yếu cho các quá trình Chất lượng hệ thống điều khiển dự báo được xác định hoàn toàn trên cơ sở bài toán tối ưu hóa và thuật toán tìm nghiệm tối ưu cho bài toán đó. Hình 2.1 mô tả cấu trúc cơ bản của một hệ thống điều khiển dự báo Nó gồm ba phần chính như sau:

- Hàm mục tiêu Q (p ) Hàm mục tiêu này được xây dựng theo nguyên tắc là nghiệm tối ưu của nó phải làm cho tổng bình phương các sai lệch e k+i ,

- Thuật toán tìm nghiệm bài toán tối ưu Cho cùng một bài toán tối ưu có nhiều thuật toán tìm khác nhau Tuy nhiên phù hợp với điều khiển dự báo hơn cả là những thuật toán giải tích hoặc các thuật toán lặp mang tính trực tuyến, có tốc độ hội tụ nhanh [2].

Các phương pháp trong điều khiển dự báo: a) Điều khiển dự báo theo hệ tuyến tính

Bộ điều khiển dự báo sẽ được gọi là tuyến tính nếu mô hình dự báo là tuyến tính Hệ LTI (tuyến tính tham số hằng) có bốn mô hình toán tương đương nhau là:

Tương ứng cũng sẽ có bốn mô hình dự báo và từ đó là bốn phương pháp điều khiển dự báo tuyến tính khác nhau, bao gồm:

• Điều khiển dự báo theo mô hình MAC (Model Algorithmic Control)

• Ma trận động học điều khiển DMC (Dynamic Matrix Control)

• Điều khiển dự báo tổng quát GPC (Generalized Predictive Control)

• Bộ điều khiển dự báo phản hồi trạng thái [2]. b) Điều khiển dự báo phản hồi trạng thái hệ song tuyến Điều khiển dự báo phản hồi trạng thái hệ song tuyến được áp dụng cho từng bài toán riêng biệt, cụ thể là:

• Điều khiển ổn định hệ

• Điều khiển bám tín hiệu mẫu ở đầu ra

Phương pháp điều khiển dự báo dựa trên mạng nơ-ron

2.2.1 Nhận dạng dùng mạng nơ-ron Định nghĩa nhận dạng: Nhận dạng là phương pháp thực nghiệm để xác định một mô hình cụ thể trong lớp các mô hình thích hợp, sao cho sai lệch giữa mô hình đó với hệ thống là nhỏ nhất.[3]

Bài toán nhận dạng có ba đặc điểm để nhận biết đó là:

+ Thực nghiệm, nhận biết qua việc đo các tín hiệu vào và ra.

+ Lớp các mô hình thích hợp, có được từ những thông tin ban đầu về thống (gọi chung lại là thông tin A-priori ).

+ Sai lệch giữa mô hình có được và hệ thống là nhỏ nhất, được nhận biết từ hàm mục tiêu mô tả sai lệch và được thực hiện bằng phương pháp tối ưu.[7].

Dựa trên các định luật cơ bản như: định luật bảo toàn năng lượng, định luật bảo toàn vật chất, định luật Newton, định luật Kirch Hoff, định luật Ohm,… có thể xây dựng được mô hình toán đối tượng Thông qua dữ liệu đầu vào và đầu ra hoặc tính toán ước lượng trực tiếp các tham số của mô hình toán được xác định. Tuy nhiên, trong công nghiệp như các hệ thống truyền nhiệt, động học chất lỏng việc xây dựng mô hình toán là vô cùng phức tạp, vì vậy sẽ sử dụng mạng nơ-ron nhân tạo.

Mạng nơ-ron nhiều lớp có thể xấp xỉ gần đúng một hàm bất kì, tiếp đó là thủ tục tính chọn các thông số của các mạng cho một đối tượng cụ thể được gọi là quá trình huấn luyện.

Hiện nay có rất nhiều phương pháp huấn luyện mạng Chúng có thể huấn luyện mạng bằng các phương pháp như:

• Dùng thuật toán lan truyền ngược

• Sử dụng công cụ Matlab huấn luyện nơ-ron như:

- Tạo mạng nơ-ron mô phỏng trong Matlab

- Các hàm huấn luyện mạng nơ-ron trong Matlab

Trong bài toán này sẽ sử dụng Matlab để huấn luyện mạng, mà phương pháp dùng sẽ là Thuật toán lan truyền ngược. a) Thuật toán lan truyền ngược

Xét một mạng truyền thẳng có M lớp, R đầu vào và S M đầu ra Cho tập dữ liệu mẫu

Ω = {p i ;t i }, i = 1, 2, , Q , trong đó p là đầu vào mẫu thứ i và t là đầu ra mẫu thứ i (đích) Định nghĩa hàm mục tiêu:

Trong đó J = e T e , e t − a M với a M là đầu ra của mạng tương ứng với đầu vào p q

. q q q q q q q Để tìm các trọng số tối ưu của mạng sử dụng phương pháp gradient ngẫu nhiên cho mẫu thứ q như sau: w m (k +1) = w m ( k) −α ∂J q (2.2) i, j i, j m i , j i

∂ w i trong đó w m i, j( k) là trọng số của nơ-ron thứ i thuộc lớp m liên kết với đầu ra của nơ-ron thứ j thuộc lớp m −1 , k thể hiện giá trị hiện tại, k

+1 thể hiện giá trị mới, α > 0 là tốc độ học.

Lu n văn Th c sĩ Kỹ thu t Đi u khi n ng d ng m ng n ron trong nh n d ng và đi u khi n ậ ạ ậ ề ể Ứ ụ ạ ơ ậ ạ ề ể i i

∂n v i j Đối với ngưỡng có: bm (k + 1) = bm(k) − α

∂J q (2.3) trong đó b m i i ngưỡng nơ-ron thứ i thuộc lớp m.

Việc tính ∂J q i, j m rất phức tạp khi mạng có nhiều lớp Do đó dùng quy tắc đạo hàm hợp như sau:

∂w ∂n ∂w và n = wp + b Áp dụng quy tắc trên cho (2.2), có:

∂w m ∂n m ∂w m Nhưng i, j i i, j m là đầu vào net của nơ-ron thứ i thuộc lớp m , do đó nó là một hàm tuyến tính của các trọng số và ngưỡng, có:

S m− 1 n m = b m + ∑ w m a m−1 (2.6) i i i ,v v v =1 trong đó a m−1 là đầu ra của nơ-ron thứ v thuộc lớp trước đó m −1 Vì vậy, được:

=1 i, j (2.8) Định nghĩa độ nhạy của nơ-ron thứ i của lớp là: s m = ∂J q

Lu n văn Th c sĩ Kỹ thu t Đi u khi n ng d ng m ng n ron trong nh n d ng và đi u khi n ậ ạ ậ ề ể Ứ ụ ạ ơ ậ ạ ề ể i i i i

Biểu diễn dưới dạng ma trận có:

= ∂n m (2.14) là véc-tơ độ nhạy của lớp m Lại có:

Lu n văn Th c sĩ Kỹ thu t Đi u khi n ng d ng m ng n ron trong nh n d ng và đi u khi n ậ ạ ậ ề ể Ứ ụ ạ ơ ậ ạ ề ể j

Sử dụng công thức (2.15) và quy tắc chuỗi có: s m = ∂J q

Từ công thức này có thể tính được độ nhạy của các lớp lần lượt từ lớp đầu ra ngược trở về lớp đầu vào như sau: s M → s M −1 → → s 2 → s 1 (2.17) Đây chính là cơ sở của thuật toán lan truyền ngược Đầu tiên tính độ nhạy của lớp đầu ra Ứng với mẫu thứ q có: i

Lu n văn Th c sĩ Kỹ thu t Đi u khi n ng d ng m ng n ron trong nh n d ng và đi u khi n ậ ạ ậ ề ể Ứ ụ ạ ơ ậ ạ ề ể i q q

Do đó véc-tơ độ nhạy của lớp đầu ra là: s M = −2F M (n M )(t − a ) Tổng kết lại có thuật toán lan truyền ngược:

• Quá trình khởi tạo mạng: Chọn giá trị ban đầu cho tất cả các trọng số và ngưỡng trong mạng.

• Quá trình lan truyền thuận a 0 = p (2.20) a m+ 1 = f m+1 (W m+1 a m +b m+1 )

• Quá trình lan truyền ngược độ nhạy. s M = − 2F M (n M )(t − a

• Quá trình cập nhật các tham số của mạng.

Công thức tính từ (2.20) đến công thức (2.26) được gọi là huấn luyện ngẫu nhiên, bởi vì các tham số của mạng sẽ được cập nhật một lần mỗi khi một bộ tín hiệu vào ra mẫu thứ q được sử dụng.

Lu n văn Th c sĩ Kỹ thu t Đi u khi n ng d ng m ng n ron trong nh n d ng và đi u khi n ậ ạ ậ ề ể Ứ ụ ạ ơ ậ ạ ề ể m

Nếu sử dụng đồng thời tất cả các mẫu để cập nhật tham số của mạng một lần thì gọi là quá trình huấn luyện theo mẻ Khi đó công thức cập nhật các tham số cho mạng như sau: m( +1) = m ( ) − α

(2.28) trong đó chỉ số q tương ứng với mẫu thứ q

Với mỗi mẫu q , phải tính đầu ra và độ nhạy của các lớp trong mạng, sau đó tính giá trị gradient trung bình trước khi cập nhật tham số của mạng [3]. b) Phương pháp tối ưu hóa hàm mục tiêu

Khi phải tìm các tham số của mạng nơ-ron để sao cho mạng nơ-ron có thể thực hiện tốt một số chức năng như phân loại hay học, sẽ sử dụng phương pháp tối ưu hóa hàm mục tiêu Nó được sử dụng bằng cách bình phương sai lệch giữa đầu ra của mạng với đầu ra mẫu, phụ thuộc vào các tham số của mạng nơ-ron.

Cho một hàm mục tiêu F ( x ) với véc-tơ biến số (các trọng số, bias của mạng) là x =[ x 1 x 2

x ] T F là tổng bình phương sai lệch giữa đầu ra của mạng với đầu ra mẫu, là một hàm phi tuyến không âm Tìm x* sao cho hàm F đạt giá trị nhỏ nhất Dùng phương pháp lặp để tìm nghiệm: x k +1 = x k + α k p k

Với α k > 0 là tốc độ học ở lần hiện tại k. p k là hướng tìm.[3].

- Phương pháp hạ sâu nhất (Steepest descent)

Lu n văn Th c sĩ Kỹ thu t Đi u khi n ng d ng m ng n ron trong nh n d ng và đi u khi n ậ ạ ậ ề ể Ứ ụ ạ ơ ậ ạ ề ể k k k k k

∂F∂x x= x k a) Phương pháp hạ sâu nhất (Steepest descent)

Theo phương pháp lặp, sau mỗi vòng lặp mong muốn:

Khai triển Taylor hàm F xung quanh x và xấp xỉ bậc nhất, có:

(2.31) là véc-tơ gradient của hàm F theo vec-tơ x là: Điều kiện (2.29) thỏa mãn khi: x k = x k+1 − x k

(2.32) g T ∆x = α g T p < 0 (2.33) Suy ra vì tốc độ học α k > 0 k k k k k g T p < 0 (2.34)

Giả sử độ lớn của véc-tơ hướng tìm pk không đổi, khi đó g T p đạt giá trị nhỏ nhất khi hai véc-tơ này ngược chiều nhau: p k = −g k (2.35)

Thay (2.35) vào (2.30) có: x k +1 = x k − α k g k (2.36) Đây được gọi là phương pháp hạ sâu (steepest descent), vì hướng tìm k ngược hướng với hướng của véc-tơ gradient làm cho giá trị hàm mục tiêu giảm nhiều nhất.[3].

Lu n văn Th c sĩ Kỹ thu t Đi u khi n ng d ng m ng n ron trong nh n d ng và đi u khi n ậ ạ ậ ề ể Ứ ụ ạ ơ ậ ạ ề ể b) Phương pháp Newton

Phương pháp này có nguồn gốc từ thuật toán lặp của Newton để tìm nghiệm đa thức, sau được Raphson mở rộng để tìm nghiệm hệ phương trình phi tuyến khả vi: f ( p) = 0 với f ∈

Trước tiên gọi p * là nghiệm của

Phân tích (2.38) thành chuỗi Taylor tại điểm phần bậc cao trong chuỗi, sẽ được: pk rồi bỏ qua tất cả các thành

H k là ma trận Jacobi của vector hàm f ( p) tại điểm p= p k p k

⇒ pk +1 p k − H − k f ( p k ) (2.40) Áp dụng thuật toán Newton-Raphson trên bài toán tối ưu không ràng buộc tìm được nghiệm p * cho hệ phương trình (2.37): p*

Khi Q( p) là khả vi hai lần sẽ có từ kết luận:

Lu n văn Th c sĩ Kỹ thu t Đi u khi n ng d ng m ng n ron trong nh n d ng và đi u khi n ậ ạ ậ ề ể Ứ ụ ạ ơ ậ ạ ề ể k k k k k k gradQ (p*) = 0 ⇔ f (p*) = (0) với f ( p) = gradQ(p)

∂p n ∂p n p = p k được gọi là ma trận Hesse của hàm vô hướng Q( p) tại điểm pk

Do Q( p) được giả thiết là khả vi hai lần nên H k là ma trận đối xứng vì:

= ∂p j ∂p i Kết luận: Từ đây dễ dàng kiểm chứng được tính đúng đắn của một số kết luận sau về phương pháp Newton-Raphson:

- Nếu H k xác định dương thì Q( pk+1) < Q( pk ) Thật vậy, từ (2.42), tức là từ: hay: p k +1 − p = −H −1 gradQ (p ) gradQ (p ) T (p − p ) = −gradQ (p ) T H −1 gradQ (p ) < 0 k k+1 k k k k thấy góc ϕ tạo bởi hai vector pk +1 − pk và gradQ (p k ) phải lớn hơn 90 o , nên cũng phải có Q( p k+1 ) < Q( p k )

- Phương pháp Newton-Raphson cũng được áp dụng cho cả bài toán tối ưu tìm được giá trị cực đại: p* = argmaxQ(p)

Tuy nhiên khi đó phải luôn là ma trận xác định âm ở mỗi bước lặp.

- Phương pháp Newton-Raphson (2.42) cũng là một dạng phương pháp line search với hướng tìm:

Lu n văn Th c sĩ Kỹ thu t Đi u khi n ng d ng m ng n ron trong nh n d ng và đi u khi n ậ ạ ậ ề ể Ứ ụ ạ ơ ậ ạ ề ể k k k k k k h = −H −1 gradQ (p ) và khoảng cách bước tìm s k =1

- Để tăng hiệu quả tìm kiếm nghiệm tối ưu p * theo nghĩa tăng tốc độ hội tụ cho thuật toán, có thể bổ sung khoảng cách bước tìm tối ưu s k

(2.42) để nó trở thành: vào công thức tính lặp p k +1 = p k + s k h k với h = −H −1 gradQ (p

- Với bài toán tối ưu dạng toàn phương Q( p) = 1 p T Ap + b T p có2

>0 thì phương pháp Newton-Raphson sẽ cho ra nghiệm tối ưu tính Thật vậy, từ: p * chỉ sau đúng một bước gradQ (p k ) = Ap k + b và H k = ∂ 2 Q

∂ p 2 = A p =p k thì khi sử dụng công dụng thức tính lặp (2.42), có ngay từ bước đầu tiên với điểm xuất phát tùy chọn: p = p − H −1 gradQ (p ) = p −A −1 (

Do giá trị p không phụ thuộc

1 p , nên nó phải là nghiệm tối ưu0 p* = p 1

Thuật toán chi tiết của phương pháp Newton-Raphson sẽ gồm các bước sau: Thuật toán : Tìm nghiệm tối ưu theo phương pháp Newton-Raphson:

1) Chọn điểm khởi phát p thích hợp và một giá trị ε > 0 đủ nhỏ.

2) Thực hiện lần lượt các bước sau với k=0,1,…

- Xác định hướng tìm h k theo công thức (2.43) và từ đó là p , trong đó khoảng k +1 cách bước tìm s k có thể được chọn s k =1 hay là một giá trị tùy ý thỏa mãn điều kiện Wolf hoặc theo phương pháp thu nhỏ khoảng nghiệm hoặc theo k

( s = arg min Q( p s>0 k + sh k ) ) với có hướng ngược hướng với véc-tơ gradient của hàm mục tiêu

Q( p) tại thời điểm hiện tại.

Lu n văn Th c sĩ Kỹ thu t Đi u khi n ng d ng m ng n ron trong nh n d ng và đi u khi n ậ ạ ậ ề ể Ứ ụ ạ ơ ậ ạ ề ể k

- Kiểm tra: Nếu | Q( pk+ 1) −Q( pk) |< ε thì dừng và cho ra đáp số p* ≈ pk+1 Ngược lại thì gán k := k +1 rồi quay lại bước a) [2].

Phương pháp tựa Newton (Quasi Newton)

Phương pháp Newton Raphson có một hạn chế cơ bản khi đưa vào ứng dụng, đó là việc phải xác định được ma trận Hesse nghịch đảo −1 tại từng bước lặp. Để khắc phục nhược điểm này, đã thay thế công thức (2.39) thành:

Khi đó: d k = p k+1 − p k , f ( p k ) gradQ( p k ) d = −H −1 gradQ (p ) = −B gradQ (p

) (2.45) k k k k k trong đó B là giá trị xấp xỉ của H −1 Ma trận B

= H −1 cũng sẽ được tính lặp theo k k k k

B k−1 tại từng bước lặp k với nhiều phiên bản tính xấp xỉ khác nhau (bảng 2.1). Chúng chủ yếu được rút ra từ quan hệ gần đúng:

Thuật toán: Tìm nghiệm tối ưu theo phương pháp Quasi Newton

1) Chọn điểm khởi phát Hesse nghịch đảo p 0 thích hợp và một giá trị ε > 0 đủ nhỏ Tính ma trận

2) Thực hiện lần lượt các bước sau với

H k = 0,1,… a) Tính b) Tính d k = −s k B k gradQ( p k ) pk+1 = p k +d k. với s k >

0 được thỏa mãn điều kiện Wolf. c) Kiểm tra, nếu | Q( p k+ 1 ) − Q( p k ) |< ε thì dừng và cho ra đáp số p* ≈ pk +1

Lu n văn Th c sĩ Kỹ thu t Đi u khi n ng d ng m ng n ron trong nh n d ng và đi u khi n ậ ạ ậ ề ể Ứ ụ ạ ơ ậ ạ ề ể y d y B y y d y d d d d B y k k k k k

A d) Tính gradQ (p k+1 ) và y k = gradQ( p k+1 ) − gradQ (p k ) Từ đó xác định

B k+1 theo công thức ở bảng (2.1) rồi gán k := k +1 và quay về bước a).

Bảng 2.1: Bảng công thức tính ma trận Hesse

Xét một bài toán có hàm mục tiêu dạng toàn phương:

Với hàm Q( p) dạng toàn phương:

Cho ma trận A là ma trận đối xứng Khi đó Q( p) là hàm lồi khi và chỉ khi bán xác định dương (được kí hiệu là T

) Sử dụng tính chất nêu trên về nghiệm tối ưu p

Do đó nếu A còn là ma trận không suy biến, tức là khi ma trận A còn là ma trận xác dịnh dương (được kí hiệu là

= A ≥0 ), thì bài toán sẽ có nghiệm tối ưu

Lu n văn Th c sĩ Kỹ thu t Đi u khi n ng d ng m ng n ron trong nh n d ng và đi u khi n ậ ạ ậ ề ể Ứ ụ ạ ơ ậ ạ ề ể i p* = − A −1 b (2.48)

Gauss đã giới hạn bài toán tối ưu không ràng buộc tổng quát p* = argminQ(p) cho trường hợp Q( p) là tổng bình phương của m hàm vô hướng, khả vi q i ( p)

, i =1, 2,3, … , m (được gọi là bài toán LS- Least Squares): m

(p), ,q m ( p)) T với p là giá trị tìm được tại bước lặp thứ k , k d k là lượng hiệu chỉnh cho nó để được p k +1 ở bước lặp tiếp theo, tức là: p k+1 = p k + d k

Từ công thức xấp xỉ:

Do đó bài toán xác định lượng hiệu chỉnh d k

Q( p k+1 ) → min là tương đương với: ở bước lặp thứ k sao cho

Thấy đây lại chính là bài toán tối ưu toàn phương (2.47) đã xét ở bài toán dạng toàn phương trên, nên từ kết quả (2.48) tương ứng, thu được: d = −( J T J ) − 1 J T q (p ) Vậy: k k k k k p = p − (J T J ) −1 J T (q (p

Dựa vào thuật toán của phương pháp line search ở hình 2.3, đi đến các bước cụ thể của thuật toán Gauss-Newton để tìm nghiệm tối ưu p *.

Thuật toán: Tìm nghiệm p * tối ưu theo phương pháp Gauss-Newton:

1) Chọn điểm khởi phát p 0 thích hợp và một giá trị ε >

2) Thực hiện lần lượt các bước sau với k = 0,1, 2,… a) Tính p k+1 theo (2.39). b) Kiểm tra, nếu thì dừng và cho ra đáp số Ngược lại thì gán k := k +1 quay về bước 0. rồi

Hình 2.2 Đường đồng mức, véc-tơ gradient và quỹ đạo tìm nghiệm tối ưu [2].

Về thuật toán Gauss-Newton trên, còn có một số kết luận bổ sung sau:

- Do tại điểm tối ưu p * có gradQ (p*) 0 nên điều kiện dừng thuật toán ở đây bằng | q( p k+1 | < ε , vì có k+ 1 gradQ (p k+1 ) = 2(J T q

Ở chương 2, đã tìm hiểu về phương pháp dự báo và các phương pháp điều khiển dự báo dựa trên mạng nơ-ron Trên cơ sở đó có thể thiết kế một bộ điều khiển dự báo cho một đối tượng cụ thể. Ở chương sau sẽ tìm hiểu và thiết kế bộ điều dự báo cho cánh tay máy một bậc tự do.

THIẾT KẾ BỘ ĐIỀU KHIỂN DỰ BÁO CHO CÁNH TAY MÁY MỘT BẬC TỰ DO

Mô hình toán của cánh tay máy một bậc tự do

Robot công nghiệp là loại thiết bị tự động nhiều công dụng Cơ cấu tay máy của chúng phải được cấu tạo sao cho bàn kẹp giữ vật kẹp theo một hướng nhất định nào đó và di chuyển dễ dàng trong vùng làm việc Muốn vậy cơ cấu tay máy phải đạt được một số bậc tự do chuyển động.

Bậc tự do là số khả năng chuyển động của một cơ cấu (chuyển động quay hoặc tịnh tiến) Để dịch chuyển được một vật thể trong không gian, cơ cấu chấp hành của robot phải đạt được một số bậc tự do Nói chung cơ cấu hệ của robot là một cơ cấu hở Số bậc tự do của cánh tay được tính theo công thức:

5 w = 6n − ∑ i=1 ip i (3.1) với n là số khâu động, p i chế. là số khớp loại i, i = 1, 2,3 ,5 là số bậc tự do bị hạn

Cánh tay robot (tay máy) là kết cấu cơ khí gồm các khâu liên kết với nhau bằng khớp động để có thể tạo nên những chuyển động cơ bản của robot [6].

Với l là chiều cài của cánh tay, m là khối lượng và ϕ là góc quay của khớp cánh tay, τ moment làm quay khớp nối.

Tọa độ của cánh tay máy trong hệ tọa độ OXY là:

Mô hình toán của cánh tay máy một bậc tự do: với a, b θ + aθ là các hằng số chưa biết.

Hình 3.1 Cánh tay máy một bậc tự do

Nhận dạng dùng mạng nơ-ron

Trong phần này ta dùng một mô hình toán của tay máy để tạo ra tín hiệu mẫu, mô hình toán của cánh tay máy để phát ra bộ tín hiệu vào ra mẫu như sau: θ + 2θ +10sin(θ ) =τ (3.3) trong đó, τ là mô men hoặc lực tác động lên khớp và θ là góc quay của khớp. Thực tế ta sẽ đo mô men τ tác động lên khớp quay của cánh tay và góc quay của cánh tay máy θ [3].

Vì mô hình toán có dạng phương trình vi phân, và có hàm sin nên đối tượng ở đây là động học và phi tuyến, ta không thể dùng hàm một bước nhảy nhận dạng mà phải dùng nhiều hàm bước nhảy với biên độ khác nhau Cho nên tín hiệu đầu vào mẫu p sẽ được lựa chọn có dạng như trong hình 3.2a.

Hình a: Tín hiệu mẫu đầ u vào Hình b: Tín hiệu đầu vào mẫu cho nhận dạng Hình 3.2: Tín hiệu đầu vào mẫu

Hình 3.3 Tạo đầu ra mẫu từ mô hình trong Simulink

Các hàm bước nhảy này có độ rộng ngẫu nhiên trong đoạn [0.1;1] và biên độ nằm trong đoạn [-10;10] Tín hiệu đầu vào mẫu p sẽ được sử dụng để tác động vào đối tượng, và đo đầu ra của đối tượng tương ứng để có tín hiệu đầu ra mẫu.

Tín hiệu đầu ra mẫu thu được từ mô hình trong Simulink như hình 3.3. Trong đó, tín hiệu đầu vão mẫu được đưa vào khối From Workspace và tín hiệu đầu ra mẫu được lưu vào khối To Workspace.

Với đầu vào mẫu p, đầu ra của đối tượng thu thập được tương ứng là t như hình 3.4.

Hình 3.4 Tín hiệu đầu ra mẫu

Bộ tín hiệu p t sẽ dược dùng để huấn luyện mạng nơ-ron Mạng nơ-ron được tạo ra trong Matlab có sơ đồ cấu trúc như hình 3.6 Mạng gồm 2 lớp, lớp thứ nhất có hàm truyền tansig và lớp thứ hai có hàm truyền tuyến tính, khối DB của đầu vào thứ nhất có trễ 1:2 và khối DB của đầu vào thứ 2 có trễ tương tự 1:2, lớp thứ nhất có 6 nơ-ron.

Tín hiệu vào ra được lấy mẫu với chu kì Ts = 0.01 giây, do đó số mẫu là 50001.

Bộ mẫu {p k ;t k } sẽ dược dùng để huấn luyện mạng, phương pháp LM được sử dụng để huấn luyện mạng, các tham số cho quá trình huấn luyện được cài đặt như sau: số kỉ nguyên là 1000, giới hạn dưới của gradient 10 −7 , giới hạn dưới của hàm mục tiêu là ε = 10 −7 Ta thấy sau 10 kỉ nguyên giá trị hàm mục tiêu nhỏ hơn nên quá trình huấn luyện mạng kết thúc, ngoài ra ta thấy gradient còn lớn hơn 0.0224 Sau khi huấn luyện mạng, đáp ứng đầu ra của mạng nơ-ron và sai số được vẽ trong hình 3.7. Đồ thị hàm mục tiêu theo số kỉ nguyên huấn luyện như trong hình 3.8.Sau khi huấn luyện mạng nơ-ron của đối tượng NNp, mạng này sẽ có cấu trúc và tham số xác định Bước tiếp theo là dùng phương pháp điều khiển dự báoMPC để thiết kế bộ điều khiển dự báo.

Hình 3.5 Cấu trúc mạng nơ-ron của đối tượng nnp

Hình 3.6 Sơ đồ cấu trúc mạng nơ-ron

Hình 3.7 Đáp ứng đầu ra của mạng nơ-ron và sai số

Hình 3.8 Đồ thị hàm mục tiêu

- Giá trị hàm mục tiêu: Giá trị hàm mục tiêu giảm nhanh và tiến tới về không.

- Đáp ứng đầu ra: Đáp ứng đầu ra dao động trong đoạn [-2;2], đáp ứng được tín hiệu điều khiển mong muốn.

- Giá trị sai số: Giá trị sai số rất nhỏ nằm trong khoảng [-0.05;0.05]

Tuyến tính hóa mạng nơ-ron

Đầu ra của mô hình mạng nơ-ron: a 2 (t ) = LW 1,2 a 1 + b 2 với b là bias, a là véc-tơ đầu ra, LW i, j là ma trận trọng số liên kết giữa véc-tơ đầu ra lớp j với đầu vào lớp i. Đầu ra của lớp nơ-ron thứ nhất là: a 1 = f 1 (n 1 ) trong đó :

Ta có hàm phi tuyến đầu vào phụ thuộc vào v 1 , v 3 , v 3 , v 4 a 2 (t ) = g (v , v , v , v ) Xét tại thời điểm t bất kì , ta có hàm phi tuyến tại thời điểm đó là: a 2 (t ) =g (v , v , v , v ) 1 2 3 4 Coi giá trị hiện tại tại thời điểm t là: Áp dụng khai triển Taylor ta có: v

Lu n văn Th c sĩ Kỹ thu t Đi u khi n ng d ng m ng n ron trong nh n d ng và đi u khi n ậ ạ ậ ề ể Ứ ụ ạ ơ ậ ạ ề ể v

∂v v=v ( v i v i ,0 ) i=1 i với g (v0 ) là đầu ra của mạng đầu vào tại thời điểm v = v 0

Vì việc tính a 1 hàm hợp. rất phức tạp khi mạng ở đây có 2 lớp Do đó ta dùng quy tắc đạo

Tín hiệu đầu ra thực tế: y = yˆ − g(u0 )

Thiết kế bộ điều khiển dự báo dùng mạng nơ-ron Đáp ứng xấp xỉ đầu ra của hệ thống là: yˆ(t) = a 1 v 1 + a 2 v 2 +a 3 v 3 + a 4 v 4 + e(t) (3.4)

Với y ( t) là đáp ứng đầu ra tại thời điểm t , a 1 , a 2 ,a 3 ,a

−a 4 v 4,0 Áp dụng định luật điều khiển ở (2.69) cho bài toán ta được mô hình dự báo:

Trong thời điểm dự báo ta có giá trị đặt là , là giá trị sai lệch của u tại thời điểm

Lu n văn Th c sĩ Kỹ thu t Đi u khi n ng d ng m ng n ron trong nh n d ng và đi u khi n ậ ạ ậ ề ể Ứ ụ ạ ơ ậ ạ ề ể d d d d d d với u là: u(t) u = u(t + 1) u(t + 2)

Từ phương trình hàm J (u ) ở (3.5) ta có phương trình ở bài toán như sau:

→min (3.7) trong đó A là ma trận có kích thước 3x3 , là ma trận đối xứng A T = A, B là ma trận 3x1 và

C là hằng số. Đạo hàm hàm J theo u ta được:

Từ (3.5) ta có đáp ứng đầu ra tại thời điểm t +1, t + 2, t + 3 lần lượt là: yˆ (t+ 1) = a1 y(t) + a2 y(t −1) + a3u(t) + a4u(t −1) +e(t) yˆ(t + 2) = a1 y(t + 1) + a2 y(t) + a3u(t +1) + a4u(t ) +e(t) yˆ (t+ 3) = a1 y(t + 2) + a2 y(t + 1) + a u(t + 2) + a4 u(t +1)

+e(t) Biến đổi công thức (3.6) ta được:

Kết hợp (3.9) và (3.15) ta được: b 2 + b 2 + 2ρ 2b b − 2ρ 0

Qua quá trình tính toán ta tìm được : u ∗ (t) u ∗ (t) = u ∗ (t +

= −A −1 B (3.17) Ở chu kì tiếp theo, ta đưa u ∗

(t) bước như trên để tìm u ∗ (t +1) ra điều khiển đối tượng và thực hiện lại các

Dùng mô hình (3.3) để mô phỏng tay máy và công thức (3.17) để tính toán tín hiệu điều khiển tối ưu của bộ MPC.

Chọn ρ = 0.05 và chu kì lấy mẫu là 5000.

Kết quả mô phỏng thực hiện trên hình (3.9) và (3.10).

Hình 3.9 Tín hiệu điều khiển tối ưu Trong hình 3.9, u là tín hiệu điều khiển tối ưu.

Hình 3.10 Đáp ứng đầu ra và giá trị đặt

Trong hình 3.10, y là đầu ra của đối tượng và r là giá trị đặt.

Nhận xét: Bộ điều khiển MPC làm cho đầu ra cơ bản là bám sát với tín hiệu mẫu.

Trong phần này, phương pháp LM dựa trên thuật toán lan truyển ngược được sử dụng để huấn luyện mạng nơ-ron cho đối tượng Sau khi huấn luyện y u mạng nơ- ron, thu được bộ tham số tối ưu của mạng Quan hệ vào ra của mạng là phi tuyến,

Lu n văn Th c sĩ Kỹ thu t Đi u khi n ng d ng m ng n ron trong nh n d ng và đi u khi n ậ ạ ậ ề ể Ứ ụ ạ ơ ậ ạ ề ể do đó nếu dùng mô hình mạng này để thiết kế bộ điều khiển dự báo sẽ gặp khó khăn Cho nên, mạng nơ-ron đã được tuyến tính hóa xung quanh điểm làm việc hiện tại, hàm mục tiêu có dạng bậc hai, một công thức tổng quát tìm nghiệm tối ưu đã được xây dựng Để kiểm chứng, chương trình mô phỏng và tính toán tín hiệu điều khiển tối ưu đã được viết Kết quả thu được thể hiện tính đúng đắn của thuật toán và khả thi trong thực tế.

Luận văn “Ứng dụng mạng nơ-ron trong nhận dạng và điều khiển” đã ra những kết luận và kiến nghị như sau:

+ Đã nghiên cứu các phương pháp điều khiển dựa trên cơ sở mạng nơ-ron. + Đã tìm hiểu và nghiên cứu phương pháp điều khiển dự báo MPC dựa trên mạng nơ-ron.

+ Đã tiến hành mô phỏng và kiểm chứng cho cánh tay máy trong Matlab.

+ Đã viết chương trình, nhận dạng dùng mạng nơ-ron, tuyến tính hóa mạng nơ- ron và tìm tín hiệu điều khiển tối ưu cho MPC.

+ Tiếp tục nghiên cứu bài toán MPC sử dụng mạng nơ-ron có đầu vào ràng buộc và sử dụng mô hình phi tuyến.

+ Luận văn còn một số hạn chế: mới dừng lại ở mô phỏng cho hệ thống một vào một ra.

Kết quả mô phỏng