Nghiên cứu thuật toán tìm nghiệm tối ưu toàn cục trong quá trình luyện mạng nơ - ron - ứng dụng để nhận dạng, điều khiển đối tượng động học phi tuyến

Số hóa bởi Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/ĐẠI HỌC THÁI NGUYÊN ĐẠI HỌC KỸ THUẬT CÔNG NGHIỆP BÁO CÁO ĐỀ TÀI NGHIÊN CỨU CẤP BỘ Nghiên cứu thuật toán tìm nghiệm tối ƣu

Trang 1

Số hóa bởi Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/

ĐẠI HỌC THÁI NGUYÊN ĐẠI HỌC KỸ THUẬT CÔNG NGHIỆP

BÁO CÁO ĐỀ TÀI NGHIÊN CỨU CẤP BỘ

Nghiên cứu thuật toán tìm nghiệm tối ƣu toàn cục trong quá trình luyện mạng nơ-ron - ứng dụng để

nhận dạng, điều khiển đối tƣợng động học phi tuyến

Mã số: B2009 – TN 02 - 13

Chủ nhiệm đề tài:

ThS Nguyễn Thị Thanh Nga

Thái Nguyên, 2011

Trang 2

NHỮNG NGƯỜI THAM GIA THỰC HIỆN ĐỀ TÀI

1 NCS Nguyễn Thị Thanh Nga, Khoa Điện -Trường ĐHKTCN, Thạc sỹ Chuyên

ngành: Tự động hóa

2 PGS.TS Nguyễn Hữu Công, Khoa Điện tử - Trường ĐHKTCN, Tiến sỹ

Chuyên ngành: Điều khiển tự động

3 TS Đỗ Trung Hải, Khoa Điện – Trường ĐHKTCN, Tiến sĩ Chuyên ngành: Tự

động hóa

4 ThS Chu Minh Hà, Khoa Điện – Trường ĐHKTCN, ThS Chuyên ngành: Tự

động hóa

5 KS Đỗ Duy Cốp, Khoa Điện tử - Trường ĐHKTCN

6 ThS Ngô Minh Đức, Khoa Điện – Trường ĐHKTCN, ThS Chuyên ngành: Tự

động hóa

7 CN Ng Thị Kim Chung, Phòng QLKH& QHQT - Trường ĐHKTCN

ĐƠN VỊ PHỐI HỢP CHÍNH

1 Trung tâm thí nghiệm - Trường Đại học Kỹ thuật Công nghiệp – ĐHTN

2 Khoa điện – Trường ĐH Kỹ thuật Công nghiệp - ĐHTN

3 Khoa điện tử – Trường ĐH Kỹ thuật Công nghiệp - ĐHTN

4 Công ty TNHH một thành viên Phát triển Công nghệ Điện tử Tự động hoá, Viện NC Điện tử, Tin học, Tự động hoá

Trang 3

MỤC LỤC

NHỮNG NGƯỜI THAM GIA THỰC HIỆN ĐỀ TÀI 1

ĐƠN VỊ PHỐI HỢP CHÍNH 1

MỤC LỤC 3

DANH MỤC BẢNG BIỂU 4

DANH MỤC CÁC CHỮ VIẾT TẮT 6

THÔNG TIN KẾT QUẢ NGHIÊN CỨU 7

MỞ ĐẦU 11

CHƯƠNG 1 : GIỚI THIỆU VỀ VIỆC ỨNG DỤNG MẠNG NƠ-RON TRONG NHẬN DẠNG VÀ ĐIỀU KHIỂN ĐỐI TƯỢNG ĐỘNG HỌC PHI TUYẾN 13

1.1 Giới thiệu tóm tắt về mạng nơ-ron 13

1.1.1 Mạng nơ-ron sinh học 13

1.1.2 Mạng nơ-ron nhân tạo (Artificial Neural network - ANN) 14

1.1.3 Cấu trúc mạng nơ-ron 15

1.1.4 Huấn luyện mạng nơ-ron 17

1.2 Nhận dạng đối tượng động học phi tuyến sử dụng mạng nơ-ron 19

1.2.1 Giới thiệu hệ động học phi tuyến 19

1.2.2 Nhận dạng hệ động học phi tuyến 20

1.2.3 Nhận dạng hệ thống sử dụng mạng nơ-ron 22

1.2.3.1 Khả năng sử dụng mạng nơ-ron trong nhận dạng 22

1.2.3.2 Mô hình nhận dạng hệ thống sử dụng mạng nơ-ron 23

1.2.3.3 Nhận dạng hệ thống sử dụng mạng nơ-ron 26

1.3 Thiết kế bộ điều khiển nơ-ron theo mô hình mẫu 29

1.3.1 Hệ thống điều khiển theo mô hình mẫu 29

1.3.2 Hệ thống điều khiển theo mô hình mẫu trên cơ sở mạng nơ-ron 29

1.4 Kết luận chương 1 30

CHƯƠNG 2: NGHIÊN CỨU THUẬT TOÁN TÌM NGHIỆM TỐI ƯU TOÀN CỤC TRONG QUÁ TRÌNH LUYỆN MẠNG NƠ-RON 31

2.1 Lan truyền ngược 31

2.1.1 Mặt chất lượng 33

2.1.2 Tính hội tụ và điều kiện tối ưu 34

2.1.2.1 Tính hội tụ 34

2.1.2.2 Điều kiện tối ưu 35

2.2 Thuật toán vượt khe 38

Trang 4

2.2.1 Giới thiệu 40

2.2.2 Nguyên lý vượt khe 41

2.2.3 Xác định bước vượt khe 44

2.3 Giải thuật di truyền GA 48

2.4 Luyện mạng nơ-ron kết hợp thuật toán vượt khe và giải thuật di truyền 50

CHƯƠNG 3: ỨNG DỤNG THUẬT TOÁN VƯỢT KHE TRONG QUÁ TRÌNH LUYỆN MẠNG NƠ-RON 52

3.1 Công tác chuẩn bị 52

3.1.1 Điều chỉnh trọng số lớp ra 52

3.1.2 Điều chỉnh trọng số lớp ẩn 53

3.2 Ví dụ 1 55

3.2.1 Cấu trúc mạng 55

3.2.2 Các thư viện và hàm mạng 73

3.2.2.1 Thư viện 57

3.2.2.2 Hàm khởi tạo trọng số 58

3.2.2.3 Thủ tục tính bước học vượt khe 59

3.2.2.4 Thủ tục huấn luyện mạng, HUANLUYENVUOTKHE() 61

3.2.3 Kết quả chạy chương trình và so sánh 61

3.2.3.1 Chạy chương trình 61

3.2.3.2 So sánh các phương án 64

3.3 Ví dụ 2 66

3.3.1 Nhận dạng hệ thống động học phi tuyến 66

3.3.2 Mô hình toán học của hệ thống xử lý nước thải 66

3.3.3 Ứng dụng mạng nơ-ron để nhận dạng đối tượng 68

3.4 Ví dụ 3 70

3.4.1 Thiết kế bộ điều khiển nơ-ron theo mô hình mẫu 70

3.4.2 Mô hình mạng nơ-ron của bộ điều khiển 71

3.5 Ví dụ 4 73

3.6 Kết luận chương 3 76

3.7 Hướng phát triển tiếp theo 76

PHỤ LỤC 1 77

PHỤ LỤC 2 92

PHỤ LỤC 3 96

TÀI LIỆU THAM KHẢO 98

Trang 5

DANH MỤC BẢNG BIỂU, HÌNH VẼ

Bảng 1.1: Các hàm cơ bản 1

Bảng 3.1 Các hàm kích hoạt (transfer function) tiêu biểu 73

Bảng 3.2: Tập hồ sơ mẫu đầu vào {0 1 2 3 4 5 6 7 8 9} 81

Hình 1.1: Mạng nơ-ron đơn giản gồm 2 nơ-ron 13

Hình 1.2: Mô hình nơ-ron nhiều đầu vào 14

Hình 1.3: Mạng nơ-ron có đặc tính động học và tuyến tính 16

Hình 1.4: Sơ đồ dùng để huấn luyện mạng 18

Hình 1.5: Điều khiển theo nguyên tắc phản hồi đầu ra 20

Hình 1.6: Mô hình nhận dạng cơ bản 24

Hình 1.7: Bổ sung thông tin đầu vào cho mạng 24

Hình 1.8: Mô hình mạng nơ-ron nhiều lớp 25

Hình 1.9: Mô hình nhận dạng song song 27

Hình 1.10: Mô hình nhận dạng nối tiếp - song song 28

Hình 1.11 Nhận dạng hệ phi tuyến dùng mạng nơ-ron 28

Hình 1.12: Sơ đồ hệ thống điều khiển mô hình mẫu 29

Hình 1.13: Sơ đồ hệ thống điều khiển mô hình mẫu sử dụng mạng nơ-ron 29

Hình 1.14: Sơ đồ hệ thống huấn luyện NN controller 30

Hình 2.1: Mặt sai số dạng lòng khe 33

Hình 2.2: Quỹ đạo dao động với sai số dạng lòng khe 35

Hình 2.3: Hàm khe 42

Hình 2.4: Xác định bước vượt khe v 44

Hình 2.5: Lưu đồ thuật toán tính bước vượt khe 47

Hình 2.6: Bước lặp k = 1 48

Hình 2.7: Chu kỳ hoạt động của giải thuật di truyền 49

Hình 2.8: Sơ đồ thuật toán kết hợp giải thuật vượt khe và di truyền cho luyện mạng MLP 50

Hình 3.1: Cấu trúc mạng nơ-ron 56

Hình 3.2: Sơ đồ nhận dạng hệ thống xử lý nước thải bằng mạng nơ-ron 66

Hình 3.3: Sơ đồ hệ thống xử lý nước thải 67

Hình 3.4 Tập mẫu vào ra của bể xử lý nước thải 68

Hình 3.5: Đồ thì sai lệch giữa mô hình nơ-ron và mô hình đối tượng 69

Hình 3.6 Sơ đồ huấn luyện bộ điều khiển nơ-ron NN controller 70

Hình 3.7: Sơ đồ hệ thống điều khiển 71

Trang 6

Hình 3.8: Hàm trọng lượng của mô hình mẫu 71

Hình 3.9: Mô hình mẫu trong Simulink 72

Hình 3.10: Đồ thì sai lệch giữa tín hiệu ra của đối tượng và mô hình mẫu 73

Hình 3.10: Hoạt động của mạng MLP thuần túy và MLP cải tiến 76

Trang 7

CÁC TỪ VIẾT TẮT

ADLINE ADAptive Linear Neural, mạng tuyến tính thích nghi đơn lớp

ANN Artificial Neural Network, mạng nơ-ron nhân tạo

BPTT BackPropagation-Through-Time, lan truyền ngược xuyên tâm

LDDN Layered Digital Dynamic Network, mạng nơ-ron động

LMS Least Mean Square, trung bình bình phương nhỏ nhất

NNs Neural NetworkS, mạng nơ-ron

RTRL Real-Time Recurrent Learning, thuật học hồi qui thời gian thực

SDBP Steepest Descent BackProbagation, thuật toán lan truyền ngược giảm

dốc nhất OBP Optical BackProbagation, thuật toán lan truyền ngược “tốc độ ánh sáng” VLBP Variable Learning rate BackProbagation algorithm, thuật toán lan truyền

ngược với tốc độ học thay đổi

Trang 8

TÓM TẮT KẾT QUẢ NGHIÊN CỨU

ĐỀ TÀI KHOA HỌC VÀ CÔNG NGHỆ CẤP BỘ

Tên đề tài: Nghiên cứu thuật toán tìm nghiệm tối ưu toàn cục trong quá trình luyện mạng nơ-ron - ứng dụng để nhận dạng, điều khiển đối tượng động học phi

tuyến

Mã số: B2009 – TN 02 - 13

Chủ nhiệm đề tài: ThS Nguyễn Thị Thanh Nga

E mail: nguyenthithanhnga-tdh@tnut.edu.vn ;

Cơ quan chủ trì đề tài: Đại học Thái Nguyên;

Đơn vị phối hợp chính: Khoa Điện, Khoa Điện tử, Trường Đại học Kỹ thuật Công nghiệp – Đại học Thái Nguyên;

Thời gian thực hiện: 24 tháng (Từ tháng 04/2009 đến tháng 04/2011)

- Viết và cài đặt chương trình huấn luyện mạng nơ-ron trên Matlab để nhận dạng

và điều khiển đối tượng động học phi tuyến

Trang 9

– Ho Chi Minh city, Vietnam; Session 5 - Renewable Energy and Energy Conservation, page 235 - 238

2 Cong Nguyen Huu, Nga Nguyen Thi Thanh, Huy Nguyen Phương; Research

on the application of genetic algorithm combined with the “cleft-overstep” algorithm for improving learning process of MLP neural network with special error surface.;

The 7th International Conference on Natural Computation (ICNC'11) and the 8th International Conference on Fuzzy Systems and Knowledge Discovery (FSKD'11),

1 Luận văn cao học (2):

- “Nghiên cứu ứng dụng mạng nơ-ron trong nhận dạng và điều khiển đối tượng động học phi tuyến”, 2010 Học viên: Phạm Văn Hưng GVHD: PGS.TS: Nguyễn Hữu Công

- Luận văn cao học: “Ứng dụng mạng nơ-ron chẩn đoán sự cố trong máy biến áp lực”, 2010 Học viên: Bùi Đức Cường GVHD: PGS.TS: Nguyễn Hữu Công

2 01 đề tài nghiên cứu khoa học cấp trường:

“Nghiên cứu một phương pháp mới giải bài toán tối ưu tĩnh với hàm mục tiêu

có dạng đặc biệt”, 2011 Chủ nhiệm đề tài: KS Đỗ Duy Cốp

3 Hướng dẫn 01 đề tài Nghiên cứu khoa học sinh viên

“Ứng dụng thuật toán vượt khe để nhận dạng đối tượng điều khiển trong bài toán điều khiển quá trình” Sinh viên: Nguyễn Tiến Mạnh GVHD: Nguyễn Thị Thanh Nga

Trang 10

SUMMARY RESEARCH RESULT OF SCIENTIFIC AND TECHNOLOGICAL THEME IN MINISTRY LEVEL

Topic: Research the algorithm to find global optimal solution in process of training neural network – Applying to identify, control kinematics nonlinear object

Code: B2009 – TN02 - 13

Promotor: Master of science Nguyen Thi Thanh Nga

E mail: nguyenthithanhnga-tdh@tnut.edu.vn;

Administrative agency: Thai Nguyen University

Co-ordinate agency: The Faculty of Electrical Engineering + The Faculty of Electronics Engineering, Thai Nguyen University of Technology

Time: 24 months (From 04/2009 to 04/2011)

2 Cong Nguyen Huu, Nga Nguyen Thi Thanh, Huy Nguyen Phương; Research

on the application of genetic algorithm combined with the “cleft-overstep” algorithm

Trang 11

for improving learning process of MLP neural network with special error surface.;

The 7th International Conference on Natural Computation (ICNC'11) and the 8th International Conference on Fuzzy Systems and Knowledge Discovery (FSKD'11),

- Master thesis: “Applying neural network to diagnose faults in instrument transformer”, 2010: Student: Bui Duc Cuong Supervisor Ass.Professor Doctor Nguyen Huu Cong

2 01 scientific researching topic in university level

“Research the new method to solve static optimal problem with special objective function”, 2011 Promotor: Do Duy Cop

3 Supervising 01 scientific researching topic in student level “Applying cleft – overstep algorithm to identify object in process control problem” Student: Nguyen Tien Manh Supervisor: Nguyen Thi Thanh Nga

Trang 12

MỞ ĐẦU

- Mạng nơ-ron có khả năng xử lý song song với tốc độ xử lý nhanh, có khả năng học thích nghi, nó thích ứng trong quá trình tự chỉnh trong điều chỉnh tự động Nó có khả năng tổng quát hóa do đó có thể áp dụng để dự báo lỗi hệ thống tránh được những

sự cố đáng tiếc mà các hệ thống khác có thể gây ra Tuy nhiên, một nhược điểm khi dùng mạng nơ-ron là chưa có phương pháp luận chung khi thiết kế cấu trúc mạng cho các bài toán nhận dạng và điều khiển mà phải cần tới kiến thức của chuyên gia Mặt khác khi xấp xỉ mạng nơ-ron với một hệ phi tuyến sẽ khó khăn khi luyện mạng vì có thể không tìm được điểm tối ưu toàn cục Vậy, tồn tại lớn nhất gặp phải là tìm nghiệm tối ưu toàn cục, đặc biệt áp dụng cho các bài toán lớn, các hệ thống điều khiển quá trình

- Hiện nay, việc nghiên cứu kết hợp các thuật toán tìm nghiệm tối ưu toàn cục và mạng nơ-ron đã được một số tác giả nghiên cứu áp dụng cho bài toán tối ưu tĩnh; tuy nhiên trong lĩnh vực nhận dạng và điều khiển các đối tượng phi tuyến còn rất hạn chế

- Nội dung đề tài sẽ đi nghiên cứu một thuật toán tìm điểm tối ưu toàn cục trong quá trình luyện mạng nơ-ron thuật toán vượt khe có xét đến sự kết hợp với giải thuật di truyền để ứng dụng trong nhận dạng và điều khiển, mở ra khả năng ứng dụng trong thực tế

Bản thuyết minh bao gồm 3 chương, mỗi chương nghiên cứu và giải quyết một số vấn đề cơ bản sau:

Chương 1: Giới thiệu về mạng nơ-ron trong nhận dạng và điều khiển đối tượng động học phi tuyến

Giới thiệu tổng quan về mạng nơ-ron: mạng sinh học, mạng nhân tạo, cấu trúc mạng, huấn luyện mạng Phương pháp nhận dạng và điều khiển đối tượng động học phi tuyến sử dụng mạng nơ-ron

Chương 2: Nghiên cứu thuật toán tìm nghiệm tối ưu toàn cục trong quá trình luyện mạng nơ-ron

Giới thiệu một thuật toán, thuật toán vượt khe, để tính toán bước học vượt khe nhằm cải tiến tốc độ hội tụ trong quá trình giải các bài toán tối ưu có mặt chất lượng dạng lòng khe Đồng thời đặt ra vấn đề kết hợp giữa giải thuật di truyền và thuật toán vượt khe trong quá trình luyện mạng nơ-ron

Trang 13

Chương 3: Ứng dụng của thuật toán vượt khe trong quá trình luyện mạng nơ-ron

Chương 3 sẽ đưa ra ví dụ được lập trình trong C++, trong Matlab để chứng minh sự vượt trội của bước học vượt khe so với các bước học khác thường được sử dụng trong Toolbox của Matlab; cũng như các ví dụ về nhận dạng và điều khiển đối tượng động học phi tuyến sử dụng mạng nơ-ron

Trang 14

CHƯƠNG 1 GIỚI THIỆU VỀ MẠNG NƠ-RON TRONG NHẬN DẠNG VÀ ĐIỀU KHIỂN ĐỐI

TƯỢNG ĐỘNG HỌC PHI TUYẾN 1.1 Giới thiệu tóm tắt về mạng nơ-ron

Mạng nơ-ron bao gồm vô số các nơ-ron được liên kết truyền thông với nhau

trong mạng Hình 1.1 là một phần của mạng nơ-ron bao gồm hai nơ-ron

Thân nơ-ron được giới hạn trong một màng membrane và trong cùng là nhân

Từ thân nơ-ron còn có rất nhiều đường rẽ nhánh gọi là rễ

Đường liên lạc liên kết nơ-ron này với nơ-ron khác được gọi là axon, trên axon

có các đường rẽ nhánh Nơ-ron có thể liên kết với các nơ-ron khác qua các rễ Chính vì

sự liên kết đa dạng như vậy nên mạng nơ-ron có độ liên kết cao

Các rễ của nơ-ron được chia thành 2 loại: loại nhận thông tin từ các nơ-ron qua các axon là loại rễ đầu vào, loại đưa thông tin từ nơ-ron đến axon khác là rễ đầu ra

Đặc điểm quan trọng của một nơ-ron là có thể có nhiều rễ đầu vào nhưng chỉ có một rễ đầu ra Đặc điểm này giống khâu điều khiển có nhiều đầu vào và một đầu ra

Quá trình hoạt động của một nơ-ron là một quá trình tự nhiên Ở trạng thái cân bằng (trạng thái tĩnh) điện áp của màng membran khoảng -75mV Khi có tác động bên ngoài vào nơ-ron với mức điện áp khoảng 35mV thì trong tế bào xảy ra hàng loạt các phản ứng hoá học tạo thành các lực làm nơ-ron bị kích hoạt Thế năng sinh ra khi nơ-

Hình 1.1: Mạng nơron đơn giản gồm 2 nơron

Trang 15

ron ở trạng thái bị kích thích hoàn toàn chỉ tồn tại trong vài ms, sau đó nơ-ron lại trở lại trạng thái cân bằng cũ Thế năng này được truyền vào mạng qua các axon và có khả năng kích thích hoặc kìm hãm tự nhiên các nơ-ron khác trong mạng Một nơ-ron sẽ ở trạng thái kích thích khi tại đầu vào xuất hiện một tín hiệu tác động vượt qua ngưỡng cân bằng của nơ-ron

Một tính chất quan trọng của nơ-ron sinh học là các đáp ứng theo kích thích có khả năng thay đổi theo thời gian Các đáp ứng có thể tăng lên, giảm đi hoặc hoàn toàn biến mất Qua các nhánh axon liên kết tế bào nơ-ron này với tế bào nơ-ron khác Sự thay đổi trạng thái của một nơ-ron cũng kéo theo sự thay đổi trạng thái của những nơ-ron khác và do đó là sự thay đổi của toàn bộ mạng nơ-ron Việc thay đổi trạng thái của mạng nơ-ron có thể thực hiện qua một quá trình dạy hoặc do khả năng học tự nhiên

1.1.2 Mạng nơ-ron nhân tạo (Artificial Neural network - ANN)

Từ những nghiên cứu tính chất cơ bản của mạng nơ-ron sinh học Người ta thay thế những tính chất này bằng một mô hình toán học tương đương được gọi là mạng nơ-ron nhân tạo Mạng nơ-ron nhân tạo có thể được chế tạo bằng nhiều cách khác nhau vì vậy trong thực tế tồn tại rất nhiều kiểu mạng nơ-ron nhân tạo

Cấu trúc một nơ-ron bao gồm:

p1, p2, … pn : n đầu vào

w1, w2… wn : n trọng số

a = f(n) : hàm truyền Đứng về mặt hệ thống, một nơ-ron là một hệ thống MISO quen thuộc với nhiều đầu vào và một đầu ra

w1

p1

+

f

wnp

n

Trang 16

Quan hệ giữa các đầu vào và ra của một nơ-ron được biểu diễn bằng phương trình toán học như sau:

1 2

1 2 1

w w

w

Trang 17

 Mạng nơ-ron động học tuyến tính: Quan hệ vào và ra của mạng nơ-ron có tính chất động học tuyến tính

 Mạng nơ-ron phi tuyến tĩnh: Quan hệ vào và ra của mạng có tính chất phi tuyến tĩnh

 Mạng nơ-ron động học phi tuyến: Quan hệ vào và ra của mạng có tính chất động học và phi tuyến

 Mạng nơ-ron động học phi tuyến

Là một mạng nơ-ron gồm nhiều lớp có các hàm truyền phi tuyến và các khâu trễ Đây là một loại mạng nơ-ron mà quan hệ vào và ra của nó không những thể hiện tính phi tuyến mà còn thể hiện cả tính động học, do đó cấu trúc mạng sẽ phức tạp hơn

so với hai loại mạng ở trên và việc huấn luyện mạng cũng khó khăn hơn

Trong phần này chỉ trình bày một mạng nơ-ron có đặc tính động học phi tuyến

đơn giản Hình 1.3 dưới đây là sơ đồ cấu trúc một mạng nơ-ron có đặc tính động học

phi tuyến

Các khâu TDL - 1 và TDL - 2 là các khâu trễ đầu vào và trễ đầu ra hay khâu phản hồi Trong khi chọn cấu trúc mạng nơ-ron ta phải chú ý đến việc chọn số nhịp trễ thích hợp tại vì khi tăng nhịp trễ sẽ làm tăng số lượng các trọng số của mạng nơ-ron

Ta phải cố gắng giảm số nhịp trễ đến mức ít nhất có thể, có nghĩa là khi chưa biết cấu trúc thì chọn nhịp trễ nhỏ nhất, sau đó tăng dần số nhịp trễ nếu như sai lệch còn lớn

Khối IW11 là một ma trận các trọng số liên kết giữa đầu vào thứ nhất với lớp vào có kích thước q hàng và m+1 cột Khối LW21 là ma trận các trọng số liên kết giữa

Hình 1.3: Mạng nơron có đặc tính động học phi tuyến

Trang 18

các đầu ra của lớp vào với các nơ-ron lớp ẩn có kích thước r hàng và q cột Khối LW32

là ma trận các trọng số liên kết giữa các đầu ra của lớp ẩn với các nơ-ron của lớp ra có kích thước 1 hàng và r cột Khối LW13 là ma trận các trọng số liên kết giữa đầu ra của lớp ra với các nơ-ron của lớp vào có kích thước q hàng và n cột

Hàm f ở trong cùng một lớp được chọn giống nhau Lớp vào và lớp ẩn cùng sử dụng các hàm tansig, lớp ra sử dụng hàm purelin

Các khối b1, b2 và b3 là các véctơ tham số bù, có số hàng bằng số nơ-ron có trong lớp tương ứng và có một cột

Một cách tổng quát, cấu trúc mạng nơ-ron động học phi tuyến là giống như trên, nhưng số lớp của mạng có thể lớn hơn hoặc ít hơn và phải có khâu trễ, có thể là trễ đầu vào hoặc trễ đầu ra hoặc là cả hai loại trễ Vậy cấu trúc của mạng nơ-ron động học phi tuyến đơn giản sẽ có cấu trúc hai lớp với trễ đầu vào hoặc trễ đầu ra

Nhìn vào cấu trúc của mạng nơ-ron này ta thấy nó là một hệ động học phi tuyến Tính động học của mạng được thể hiện ở các khâu trễ đầu vào và trễ phản hồi Tính phi tuyến thể hiện ở các hàm truyền phi tuyến tansig Như vậy mô hình mạng nơ-ron này có thể được sử dụng để thay thế mô hình toán học của đối tượng có đặc tính động học phi tuyến

Khi nhận dạng đối tượng động học phi tuyến sử dụng mô hình mạng nơ-ron trên thì cần phải chọn cấu trúc hợp lý Để đơn giản đầu tiên nên chọn cấu trúc mạng đơn giản nhất, tức là có hai lớp không có lớp ẩn Mặt khác vì đối tượng xét ở đây có quan hệ một vào và một ra, cho nên số nơ-ron của lớp ra luôn là một và để đơn giản hơn nữa có thể chọn hàm f của lớp ra là hàm purelin Vấn đề còn lại là chọn số nơ-ron lớp vào và số nhịp trễ của hai khâu trễ đầu vào và trễ phản hồi

Như đã trình bày ở trên, số nơ-ron một lớp sẽ quyết định số hàng và số nhịp trễ

sẽ quyết định số cột của ma trận trọng số, như thế sẽ quyết định số lượng tham số của mạng Cho nên, cấu trúc ban đầu của mạng phải chọn đơn giản nhất có thể, sau đó sẽ thay đổi tăng hoặc giảm dần số nơ-ron và số nhịp trễ nếu như sai lệch lớn

Dựa trên cơ sở mô tả toán học của đối tượng ta có thể xác định được bậc tương đối của nó, trên cơ sở đó sẽ xác định số nhịp trễ tối thiểu của mạng nơ-ron

1.1.4 Huấn luyện mạng nơ-ron

Trong hai bài toán nhận dạng và thiết kế bộ điều khiển nơ-ron ta phải xác định cấu trúc và tham số của mạng nơ-ron Đầu tiên là phải xác định cấu trúc của mạng, sau

Trang 19

đó là xác định tham số của mạng Việc xác định tham số của mạng được thực hiện bằng phương pháp huấn luyện mạng

Với các bài toán động học tuyến tính và mạng nơ-ron phi tuyến ta có thể huấn luyện mạng bằng thuật toán lan truyền ngược, nhưng với mạng nơ-ron động học phi tuyến có khâu trễ phản hồi thì việc huấn luyện mạng sẽ khó khăn hơn nhiều vì cấu trúc mạng có đường hồi tiếp từ đầu ra của mạng qua khâu trễ trở về lớp vào, cho nên khi huấn luyện sai lệch rất lớn

Nguyên nhân là do các trọng số ban đầu chưa phải là giá trị tối ưu, dẫn đến đầu

ra của mạng có sai lệch lớn, mà đầu ra này lại được phản hồi trở về lớp vào làm cho sai lệch càng lớn hơn Do đó phải có phương pháp huấn luyện mạng thích hợp để giải quyết vấn đề này

 Phương pháp huấn luyện mạng nơ-ron động học phi tuyến

Có hai loại mạng nơ-ron động học phi tuyến:

 Loại không có khâu trễ phản hồi, ta hoàn toàn có thể sử dụng các phương pháp huấn luyện mạng một cách bình thường

 Loại có khâu trễ phản hồi, Muốn huấn luyện mạng thì ta phải thay đổi cấu trúc mạng nơ-ron mà vẫn đảm bảo yêu cầu là xác định được tham số của nó Phương pháp áp dụng như sau: Thay tín hiệu ra qua khâu trễ phản hồi trở lại đầu vào của mạng bằng tín hiệu đầu ra mẫu Khi đó sẽ không còn đường phản hồi ra có trễ và tín hiệu ra mẫu được coi là đầu vào có trễ thứ hai của mạng nơ-ron Sơ đồ

Trang 20

Nhận xét:

Mạng sẽ có 2 đầu vào và 1 đầu ra Cấu trúc này hoàn toàn có thể huấn luyện mạng với thuật toán lan truyền ngược trên cơ sở thuật toán Levenberg – Marquardt Tập tín hiệu để luyện mạng là những tín hiệu mẫu được đo từ đầu vào và đầu ra của đối tượng như sau: Tác động dãy tín hiệu P bậc thang ngẫu nhiên bị hạn chế về biên độ vào đối tượng và đo được tín hiệu ra mẫu T

Kết quả nhận dạng đối tượng phụ thuộc rất nhiều vào tập mẫu đã chọn, thể hiện qua các yếu tố sau đây: Tập mẫu có phản ánh được đặc tính động học phi tuyến của đối tượng hay không Chu kỳ trích mẫu phải được lựa chọn thích hợp Chu kỳ càng nhỏ thì lượng thông tin càng đầy đủ nhưng số mẫu sẽ tăng lên và việc nhận dạng càng chính xác nhưng thời gian luyện mạng càng lớn và ngược lại

1.2 Nhận dạng đối tượng động học phi tuyến sử dụng mạng nơ-ron

1.2.1 Giới thiệu hệ động học phi tuyến

Hệ động học phi tuyến bao gồm hai đặc tính là tính động học và tính phi tuyến Tính phi tuyến được thể hiện ở hệ thống không thỏa mãn nguyên tắc xếp chồng Tính động học thể hiện ở các quan hệ vào ra, đầu ra không những phụ thuộc vào đầu vào

mà còn phụ thuộc vào sự biến thiên của đầu vào Thông thường hệ được biểu diễn bởi quan hệ vi phân và tích phân

Hệ tuyến tính được mô tả bằng một hệ phương trình vi phân tuyến tính Hệ tuyến tính thỏa biểu diễn như sau:

và ánh xạ F thỏa mãn nguyên tắc xếp chồng:

F(a1(u1(t))+a2(u2(t)) = a1F(u1(t) + a2F(u2(t)) (1.1) Trong đó: a1, a2: là các hằng số

u(t): là véc tơ đầu vào với n tín tiệu

y(t): là véc tơ đầu ra với m tín hiệu

Ngoài ra ta còn có thể dễ dàng tách các thành phần đặc trưng riêng cho từng chế

độ làm việc để nghiên cứu với những công cụ toán học chặt chẽ, chính xác mà lại đơn giản Sử dụng mô hình tuyến tính để mô tả hệ thống có nhiều ưu điểm như:

Trang 21

- Mô hình càng đơn giản, càng tốn ít chi phí Các tham số mô hình tuyến tính dễ dàng xác định được bằng các phương pháp thực nghiệm (nhận dạng) mà không cần đi

từ phương trình hóa lí phức tạp mô tả hệ

- Tập các phương pháp tổng hợp bộ điều khiển rất phong phú và không tốn nhiều thời gian để thực hiện

- Cấu trúc đơn giản của mô hình cho phép dễ dàng theo dõi được kết quả điều khiển và chỉnh định lại mô hình cho phù hợp

Chính vì những ưu điểm của mô hình tuyến tính mà lý thuyết điều khiển tuyến tính đã có ứng dụng rộng lớn Ngay cả trong các trường hợp đối tượng hay hệ thống là phi tuyến cũng được tìm cách chuyển thể gần đúng sang một mô hình tuyến tính để thực hiện các bài toán tổng hợp điều khiển Ngược lại với hệ tuyến tính là hệ phi tuyến Hệ này không thỏa mãn nguyên lý xếp chồng

Tuy nhiên, phần lớn các đối tượng điều khiển trong công nghiệp lại mang tính động học (quan hệ vào – ra) và phi tuyến, hoặc một hệ điều khiển mà trong đó có một khâu phi tuyến (không áp dụng được nguyên lý xếp chồng) Bởi khâu phi tuyến có trong hệ tạo ra những dải hoặc ngưỡng để đưa hệ hoạt động theo dải hoặc ngưỡng, do

đó điều này sẽ làm giảm trạng thái không cần thiết khi hệ hoạt động Với cùng một đối tượng khi xét quan hệ vào – ra hoặc các quan hệ giữa các thông số liên quan thì quan

hệ này là tuyến tính nhưng quan hệ khác lại không tuyến tính Vì vậy không phải lúc nào những giả thiết cho phép xấp xỉ hệ bằng bằng mô hình tuyến tính được thỏa mãn

Do đó tùy theo bài toán mà coi đối tượng là tuyến tính hay phi tuyến

1.2.2 Nhận dạng hệ động học phi tuyến

 Tại sao phải nhận dạng

Xét một bài toán điều khiển theo nguyên tắc phản hồi như trên hình 1.5:

Muốn tổng hợp được bộ điều khiển cho đối tượng hệ kín có được chất lượng như mong muốn thì trước tiên phải hiểu biết về đối tượng, tức là cần phải có một mô hình

Bộ điều khiển điều khiển Đối tượng

-

Hình 1.5: Điều khiển theo nguyên tắc phản hồi đầu ra

Trang 22

toán học mô tả đối tượng Không thể điều khiển đối tượng khi không hiểu biết hoặc hiểu sai lệch về nó Kết quả tổng hợp bộ điều khiển phụ thuộc rất nhiều vào mô hình

mô tả đối tượng Mô hình càng chính xác, hiệu suất công việc càng cao

Việc xây dựng mô hình cho đối tượng được gọi là mô hình hóa Người ta thường phân chia các phương pháp mô hình hóa ra làm hai loại:

- Phương pháp lý thuyết

- Phương pháp thực nghiệm

Phương pháp lý thuyết là phương pháp thiết lập mô hình dựa trên các định luật

có sẵn về quan hệ vật lý bên trong và quan hệ giao tiếp với môi trường bên ngoài của đối tượng Các quan hệ này được mô tả theo quy luật lý – hóa, quy luật cân bằng, dưới dạng những phương trình toán học

Trong các trường hợp mà sự hiểu biết về những quy luật giao tiếp bên trong đối tượng với môi trường bên ngoài không được đầy đủ để có thể xây dựng được một mô hình hoàn chỉnh, nhưng ít nhất từ đó có thể cho biết các thông tin ban đầu về dạng mô hình thì tiếp theo người ta phải áp dụng phương pháp thực nghiệm để hoàn thiện nốt việc xây dựng mô hình đối tượng trên cơ sở quan sát tín hiệu vào u(t) và ra y(t) của đối tượng sao cho mô hình thu được bằng phương pháp thực nghiệm thỏa mãn các yêu cầu của phương pháp lý thuyết đề ra Phương pháp thực nghiệm đó được gọi là nhận dạng

hệ thống điều khiển

Như vậy khái niệm nhận dạng hệ thống điều khiển được hiểu là sự bổ xung cho việc mô hình hóa đối tượng mà ở đó lượng thông tin ban đầu về đối tượng điều khiển không đầy đủ

 Định nghĩa

Nhận dạng hệ thống là xây dựng mô hình toán học của hệ (cấu trúc – tham số) dựa trên các dữ liệu thực nghiệm đo được Quá trình nhận dạng là quá trình hiệu chỉnh các tham số của mô hình sao cho tín hiệu ra của mô hình tiến tới tín hiệu đo được của

Trang 23

Theo định nhĩa này thì những bài toán nhận dạng sẽ phải được phân biệt với nhau

ở ba điểm chính, đó là:

- Lớp mô hình thích hợp Chẳng hạn lớp các mô hình tuyến tính không có cấu trúc (không biết bậc của mô hình) hoặc có cấu trúc, lớp các loại mô hình lưỡng tuyến tính

- Loại tín hiệu quan sát được (tiền định/ngẫu nhiên)

- Phương thức mô tả sai lệch giữa mô hình thực và đối tượng

 Các bước cơ bản để nhận dạng hệ thống

Nhận dạng hệ thống là ước lượng mô hình của hệ thống dựa trên các dữ liệu vào

ra quan sát được

Để xác định được mô hình của hệ thống từ các dữ liệu quan sát này ta phải có:

- Số liệu vào – ra

- Tập các đầu vào tham gia vào mô hình

- Tiêu chí lựa chọn mô hình

 Quy trình nhận dạng gồm các bước

1) Thu thập số liệu vào – ra từ hệ thống

2) Khảo sát số liệu Lựa chọn phần có ích trong số liệu thu được, có thể sử dụng

bộ lọc nếu cần

3) Lựa chọn và xác định cấu trúc mô hình

4) Tính toán mô hình tốt nhất trong các dạng cấu trúc tìm được theo số liệu vào

ra và tiêu chí lựa chọn

5) Khảo sát tính năng của mô hình tìm được

Nếu mô hình đủ tốt thì dùng, ngược lại thì quay về bước 3 để tìm mô hình khác

Có thể phải tìm phương pháp ước lượng khác (bước 4) hoặc thu thập thêm số liệu vào – ra (bước 1 và 2)

1.2.3 Nhận dạng hệ thống sử dụng mạng nơ-ron

1.2.3.1 Khả năng sử dụng mạng nơ-ron trong nhận dạng

Có hai loại bài toán quan trọng trong lý thuyết điều khiển là các thuật toán điều khiển và các phương pháp nhận dạng mô hình Các mô hình đối tượng thường là phi tuyến và động học phi tuyến có độ phức tạp cao và độ bất ổn định lớn Sự hiểu biết về

Trang 24

mô hình đối tượng có thể nghèo nàn do hạn chế về tri thức Vì vậy mối liên hệ ngược

là đặc điểm điển hình được sử dụng trong hệ điều khiển nhằm làm giảm độ bất ổn định của đối tượng và môi trường, đạt đến độ ổn định bền vừng Tuy nhiên khi độ bất định quá lớn, bộ điều khiển không còn phù hợp Khi đó cần đến điều khiển thích nghi Ở đây các thông số của đối tượng được nhận dạng online và thông tin này được sử dụng

để thay đổi tham số của bộ điều khiển Tất cả thực hiện được nhờ mạng nơ-ron

Vì tính phi tuyến của các mạng nơ-ron (hàm kích hoạt phi tuyến), chúng được dùng để mô tả các hệ thống phi tuyến phức tạp Cybenko đã chứng minh rằng một hàm liên tục có thể xấp xỉ tuỳ ý bằng một mạng truyền thẳng với chỉ một lớp ẩn

Mạng nơ-ron là một trong những công cụ nhận dạng tốt nhất vì các đặc trưng sau: Khả năng học từ kinh nghiệm (khả năng được huấn luyện), khả năng khái quát hoá cho các đầu vào không được huấn luyện, ví dụ dựa vào cách học mạng có thể sẽ tiên đoán đầu ra từ đầu vào không biết trước

Mạng nơ-ron có khả năng xấp xỉ các hàm phi tuyến một cách đầy đủ và chính xác, nó được sử dụng tốt cho các mô hình động học phi tuyến Điều quan trọng được

sử dụng là thuật truyền ngược tĩnh và động của mạng nơ-ron, nó được sử dụng để hiệu chỉnh các tham số trong quá trình nhận dạng và điều khiển

Nền tảng cho tính xấp xỉ hàm của mạng nơ-ron nhiều lớp là định lý Kolmgorov

và định lý Stone – Weierstrass Các mạng nơ-ron nhân tạo đưa ra những lợi thế qua việc học sử dụng phân loại và xử lý song song, điều này rất phù hợp với việc dụng trong nhận dạng và điều khiển

1.2.3.2 Mô hình nhận dạng hệ thống sử dụng mạng nơ-ron

Khi xét một bài toán điều khiển, trước tiên ta cần phải có những hiểu biết về đối tượng: số đầu vào, số đầu ra, các đại lượng vật lý vào ra, dải giá trị của chúng, quy luật thay đổi của các đại lượng trong hệ hay mô hình toán học cơ bản của nó,… Tuy nhiên không phải đối tượng nào hay hệ nào cũng cung cấp được đầy đủ các thông tin như trên cũng như xây dựng được mô hình thực từ những thông tin ấy Việc nhận dạng là việc đầu tiên và quan trọng để việc điều khiển đạt chất lượng mong muốn Khi thông

số của đối tượng là cần thiết để việc điều khiển đạt chất lượng mong muốn Khi thông

số của đối tượng tự thay đổi trong quá trình làm việc (đối tượng phi tuyến) và có tính động học thì việc nhận dạng theo chúng sẽ phức tạp hơn nhiều so với đối tượng có thông số bất biến Trong phần này sẽ trình bày rõ ứng dụng hiệu quả của mạng nơ-ron trong nhận dạng hệ thống động học phi tuyến

Trang 25

a) Nhận dạng tham số sử dụng mạng nơ-ron

Nhận dạng thông số chính là huấn luyện mạng Mô hình cơ bản của mạng ron được luyện để mô phỏng hành vi của đối tượng điều khiển giống như mô hình

nơ-truyền thống được biểu diễn trên Hình 1.6

Tín hiệu sai số e  y  yˆ là cơ sở cho quá trình luyện mạng Mạng nơ-ron ở đây có thể là mạng nhiều lớp hoặc các dạng khác và có thể sử dụng nhiều thuật luyện mạng khác nhau

Khi dạng thông tin vào mạng có thể bổ xung, ví dụ như trên Hình 1.7

Trong đó: : là thời gian trễ

Nhận dạng tham số là phương pháp nhận dạng chủ động Người ta đưa vào hệ thống tín hiệu vào xác định u(t), sau đó đo tín hiệu ra y(t) Người ta mô tả hệ thống bằng một mô hình tham số và dùng phương pháp bình phương cực tiểu để hiệu chỉnh sao cho đánh giá của véc tơ tham số trùng với véc tơ tín hiệu ra của hệ thống Ngày nay nhận dạng tham số được ứng dụng rất rộng rãi nhất là trong điều khiển số Nhận

Đối tượng điều khiển

Mạng nơron

Mạng nơron u(k)

y(k)

) k ( yˆ

e(k)

-

Hình 1.7: Bổ sung thông tin đầu vào cho mạng

Trang 26

dạng tham số thường được dùng để nhận dạng các hệ thống phức tạp, trong trường hợp này hệ thống được coi là “hộp đen”, vì vậy phương pháp nhận dạng tham số còn có tên

là nhận dạng hộp đen

b Nhận dạng mô hình đối tượng sử dụng mạng nơ-ron

Nhận dạng mô hình là quá trình xác định mô hình của đối tượng điều khiển và thông số trên cơ sở đầu vào và đầu ra của đối tượng điều khiển Thông thường mô hình hồi quy được sử dụng Ở đây động học đối tượng điều khiển được xét dưới dạng hệ rời rạc với véc tơ đầu vào bao gồm:

x = (yt-1, yt-2, , ut-1, ut-2, ) (1.2) Trong đó: yt-1, ut-1 là các giá trị đầu ra và đầu vào tương ứng ở chu kỳ trước Lưu ý rằng véc tơ đầu vào mạng nơ-ron sẽ hoàn toàn bao gồm các giá trị đầu ra

và đầu vào đối tượng điều khiển Tuy nhiên có thể tồn tại một số khả năng khác như sử dụng véc tơ đầu vào mạng dưới dạng:

x = (vt-1, vt-2, , ut-1, ut-2, ) (1.3)

Ở đây vt-1 là giá trị đầu ra của mạng ở chu kỳ trước

Mô hình thu được sau khi nhận dạng gọi là tốt nếu nó thể hiện được đúng đối tượng điều khiển Như vậy có thể sử dụng mô hình thay cho đối tượng điều khiển để

dự báo, kiểm tra và điều khiển Mạng nơ-ron được luyện để mô hình hóa quan hệ vào

ra của đối tượng điều khiển Như vậy quy trình nhận dạng mô hình có bản chất là thuật toán luyện mạng

Để nhận dạng mô hình hệ phi tuyến người ta có thể sử dụng mạng nơ-ron nhiều lớp theo hai quan điểm sau:

Mạng nơ-ron nhiều lớp

Hình 1.8a: mô hình song song Hình 1.8b:Mô hình nối tiếp – song song

Đối tượng điều khiển

Mạng nơron

Trang 27

Quan điểm 1: Sử dụng mạng nhiều lớp như mô hình song song với đối tượng

điều khiển Mạng được luyện sử dụng sai số giữa đầu ra mô hình và đầu ra của đối

tượng điều khiển, phản hồi được lấy từ đầu ra của mạng Hình 1.8a

Quan điểm 2: Sử dụng mạng nhiều lớp như mô hình nối tiếp – song song Mạng

cũng được luyện sử dụng sai số giữa đầu ra của mạng và đầu ra của đối tượng điều

khiển, nhưng phản hồi được lấy từ đầu ra của đối tượng điều khiển Hình 1.8b Mô hình

nối tiếp – song song có ưu thế hơn mô hình song song vì thuật lan truyền ngược sai số

có thể sử dụng bình thường do không có mạch vòng phản hồi trong mạng nơ-ron Cấu trúc mạng nơ-ron giải bài toán nhận dạng mô hình rất đa dạng, tùy thuộc vào từng bài toán cụ thể

1.2.3.3 Nhận dạng hệ thống sử dụng mạng nơ-ron

Như vậy nhận dạng hệ thống cần hai giai đoạn đó là lựa chọn mô hình và tối ưu tham số Đối với mạng nơ-ron dựa vào nhận dạng lựa chọn số nút ẩn, số lớp ẩn (cấu trúc của mạng) tương đương với mô hình lựa chọn Mạng có thể được huấn luyện theo kiểu giám sát với thuật toán lan truyền ngược, dựa vào luật học sai số hiệu chỉnh Tín hiệu sai số được lan truyền ngược qua mạng Thuật toán lan truyền ngược sử dụng phương pháp giảm gradient để xác định các trọng của mạng vì vậy tương đương với tối ưu tham số Mạng nơ-ron được huấn luyện để xấp xỉ mối quan hệ giữa các biến Mạng nơ-ron được huấn luyện để tối thiểu hàm năng lượng sai số Mạng được huấn luyện để tối thiểu sai số bình phương giữa đầu ra của mạng và đầu vào hệ thống, xác định một hàm truyền ngược Trong kiểu nhận dạng này đầu ra của mạng hội tụ về đầu vào hệ sau khi huần luyện, và vì vậy mạng đặc trưng cho hàm truyền ngược của

hệ Phương pháp nhận dạng khác cần phải hướng đầu ra hệ thống tới đầu ra của mạng Trong kiểu này mạng đặc trưng cho hàm truyền thẳng của hệ thống

Giả sử các hàm phi tuyến để mô tả hệ thuộc lớp hàm đã biết trong phạm vi quan tâm thì cấu trúc của mô hình nhận dạng phải phù hợp với hệ thống Với giả thiết các

ma trận trọng của mạng nơ-ron trong mô hình nhận dạng tồn tại, cùng các điều kiện ban đầu thì cả hệ thống và mô hình có cùng lượng ra với bất kỳ lượng vào xác định

Do đó quá trình nhận dạng thực chất là điều chỉnh tham số của mạng nơ-ron dựa vào sai lệch giữa các giá trị đầu ra của hệ thống và của mô hình Sau đây ta đưa ra một số

mô hình mà nó đảm bảo tính hội tụ của các tham số cần nhận dạng tới các giá trị mong muốn

Trang 28

a) Mô hình nhận dạng song song

Hình 1.9 là một hệ nhận dạng ứng với mô hình I mà n=2 và m=1 Để nhận dạng

một hệ có thể dùng mô hình nhận dạng này và được mô tả bằng phương trình:

yˆpk 1 ˆ0yˆp k ˆ1yˆpk 1 N u k (1.5)

Mô hình nhận dạng đặt song song với mẫu Việc nhận dạng là ước lượng các tham số  ˆi cũng như các trọng của mạng nơ ron sử dụng thuật toán lan truyền ngược động dựa vào sai lệch e(k) giữa lượng ra của mô hình yˆp  k và lượng ra thực yp(k)

Từ giả thiết hệ ổn định BIBO (đầu vào giới hạn - đầu ra giới hạn) nên các tín hiệu trong hệ thống đều là giới hạn Trong cấu trúc này, vấn đề ổn định của hệ nhận dạng sử dụng mạng nơ-ron như đã nói chưa đảm bảo chắc chắn và chưa được chứng minh Vì vậy khi sử dụng mô hình song song sẽ không đảm bảo chắc chắn rằng các tham số sẽ hội tụ hoặc là sai lệch đầu ra sẽ tiến tới không Nhiều công trình nghiên cứu về điều kiện hội tụ của các mô hình song song tuyến tính nhưng chưa đạt kết quả mong muốn Do đó các mô hình nhận dạng thường sử dụng mô hình nối tiếp – song song đưa ra sau đây

b) Mô hình nhận dạng nối tiếp - song song

Trong mô hình nối tiếp – song song đầu ra của hệ được hồi tiếp về mô hình nhận

Trang 29

Mô hình nhận dạng nối tiếp - song song có thể mô tả bằng mô hình tổng quát như

Hình 1.11 Khối TDL (Tapped Delay Line): là đường rẽ nhánh trễ của đầu ra, nó có tác

dụng làm trễ tín hiệu vào Vì vậy các giá trị vào ra quá khứ của hệ từ tập véc tơ đầu vào tới mạng nơ-ron, đầu ra mạng nơ-ron là yˆp  k tương đương với giá trị ước lượng đầu ra của hệ tại thời điểm k bất kỳ

 Ứng dụng mô hình nối tiếp – song song để nhận dạng hệ động học phi tuyến

Mô hình nối tiếp – song song có nhiều ưu điểm hơn mô hình song song Từ giả thiết hệ ổn định BIBO nên tất cả các tín hiệu của quá trình nhận dạng (như các tín hiệu vào của mạng nơ-ron) cũng bị giới hạn Trong mô hình không tồn tại mạch vòng phản hồi, nhưng có thể dùng thuật toán lan truyền ngược để điều chỉnh các tham số của hệ

Hình 1.10: Mô hình nhận dạng nối tiếp - song song

Hệ động học phi tuyến

Trang 30

để làm giảm các phép tính toán Kết thúc quá trình sẽ dẫn tới sai số đầu ra tiến tới giá trị rất nhỏ, vì vậy yp k  yˆp k Mô hình nhận dạng nối tiếp – song song có thể thay thế bằng mô hình song song mà không ảnh hưởng lớn Nhưng mô hình nối tiếp – song song được chú trọng hơn trong nghiên cứu

1.3 Thiết kế bộ điều khiển nơ-ron theo mô hình mẫu

1.3.1 Hệ thống điều khiển theo mô hình mẫu

Bài toán đặt ra như sau: Cho một đối tượng và chọn trước một mô hình mẫu, ta phải thiết kế bộ điều khiển sao cho đầu ra của đối tượng bám theo đầu ra của mô hình mẫu với sai lệch mse là nhỏ nhất

Sơ đồ hệ thống điều khiển theo mô hình mẫu như hình 1.12

Như vậy nhiệm vụ quan trọng là phải thiết kế được bộ điều khiển sao cho sai lệch mse giữa đầu ra của đối tượng và đầu ra của mô hình mẫu là nhỏ nhất Để thiết kế được bộ điều khiển này ta có thể dùng phương pháp điều khiển thích nghi trực tiếp

1.3.2 Hệ thống điều khiển theo mô hình mẫu trên cơ sở mạng nơ-ron

Sơ đồ khối hệ thống điều khiển theo mô hình mẫu sử dụng mạng nơ-ron có

Trang 31

Trước tiên phải nhận dạng được đối tượng, tức là tìm được một mạng nơ-ron

NN model với cấu trúc phù hợp sao cho sai lệch mse giữa đầu ra của nó so với đầu ra của đối tượng là nhỏ nhất

Khi có được mô hình thay thế đối tượng là NN model ta sẽ kết hợp nó với mạng

NN controller thành một mạng duy nhất gọi tên là NN system, sau đó huấn luyện mạng nơ-ron NN system này với tập tín hiệu vào và ra mẫu, tập mẫu này được lấy từ đầu vào và đầu ra của mô hình mẫu, trong quá trình huấn luyện các tham số của NN model được giữ cố định, chỉ có các tham số của NN controller là được chỉnh định sao cho sai lệch mse giữa đầu ra của NN system và mô hình mẫu là nhỏ nhất Sơ đồ hệ thống dùng để huấn luyện bộ điều khiển NN controller như hình 1.26

Như vậy việc thiết kế bộ điều khiển nơ-ron về bản chất là một bài toán nhận dạng và đối tượng cần nhận dạng ở đây là mô hình mẫu

1.4 Kết luận chương 1

Chương 1 đã giới thiệu tóm tắt về kiến thức cơ bản của mạng nơ-ron Đồng thời giới thiệu các dạng mô hình của mạng nơ-ron, các thuật toán huấn luyện mạng và các bài toán với mạng nơ-ron

Trang 32

CHƯƠNG 2: NGHIÊN CỨU THUẬT TOÁN TÌM NGHIỆM TỐI ƯU TOÀN

CỤC TRONG QUÁ TRÌNH LUYỆN MẠNG NƠ-RON

Tóm tắt: Thuật toán lan truyền ngược là một phát minh chính trong nghiên cứu

về mạng nơ-ron Tuy nhiên, thuật toán nguyên thủy thì quá chậm chạp đối với hầu hết các ứng dụng thực tế; đặc biệt với các bài toán có mặt sai số dạng khe thì ngay cả với các biến thể như gradient liên hợp hay qui tắc mô-men cũng tỏ ra yếu Trong chương này sẽ trình bày một thuật toán để tính bước học theo nguyên lý vượt khe, thuật toán vượt khe, nhằm cải tiến tốc độ hội tụ của quá trình tìm kiếm nghiệm tối ưu và vấn đề cài đặt thuật toán này kết hợp với kỹ thuật lan truyền ngược trong bài toán luyện mạng nơ-ron Đồng thời các tác giả cũng đề xuất việc sử dụng giải thuật di truyền kết hợp với thuật toán vượt khe để cải tiến quá trình luyện mạng

2.1 Một vài điều về thuật toán lan truyền ngược

2.2 Thuật toán vượt khe

2.3 Giải thuật di truyền GA

2.4 Luyện mạng nơ-ron kết hợp thuật toán vượt khe và giải thuật di truyền

2.5 Kết luận chương 2

2.1 Lan truyền ngược

Có một vài lớp khác nhau của các luật huấn luyện mạng bao gồm: huấn luyện kết hợp, huấn luyện cạnh tranh,… Huấn luyện chất lượng mạng, performance learning,

là một lớp quan trọng khác của luật huấn luyện, trong phương pháp này thì các thông

số mạng được điều chỉnh để tối ưu hóa chất lượng của mạng Thuật toán lan truyền ngược là một phát minh chính trong nghiên cứu về mạng nơ-ron, thuộc loại thuật học chất lượng mạng Ngược dòng thời gian, chúng ta thấy rằng sau khoảng mười năm kể

từ khi lan truyền ngược bắt đầu được thai nghén, năm 1974, thì thuật học lan truyền ngược được chính thức nghiên cứu lại và mở rộng ra một cách độc lập bởi David Rumelhart, Geoffey Hinton và Ronald Williams; David Parker và Yann Le Cun Thuật toán đã được phổ biến hóa bởi cuốn sách Parallel Distributed Processing của nhóm tác giả David Rumelhart và James Mc Clelland Tuy nhiên, thuật toán nguyên thủy thì quá chậm chạp đối với hầu hết các ứng dụng thực tế [1], có nhiều lý do cho việc hội tụ chậm trong đó có sự ảnh hưởng của bước học Trong mục 2.2 của chương này chúng

ta trình bày một thuật toán để xác định bước học tính theo nguyên lý vượt khe, trong một số bài toán với mặt sai số dạng lòng khe thuật toán này tỏ ra rất lợi hại Đồng thời

Trang 33

trong mục 2.3 và 2.4 sẽ trình bày nguyên lý thuật di truyền nhằm thiết kế mạng nơ-ron

có độ chính xác cao

Nhắc lại rằng lan truyền ngược, tiền thân của nó là thuật học Widow-Hoff (thuật toán LMS, Least Mean Square), là một thuật toán xấp xỉ giảm dốc nhất Giống với luật học LMS, hàm mục tiêu là trung bình bình phương sai số Điểm khác giữa thuật toán LMS và lan truyền ngược chỉ là cách mà các đạo hàm được tính Đối với mạng tuyến tính một lớp đơn giản, sai số là hàm tuyến tính tường minh của các trọng

số, và các đạo hàm của nó liên quan tới các trọng số có thể được tính toán một cách dễ dàng Trong các mạng nhiều lớp với các hàm phi tuyến, mối quan hệ giữa các trọng số mạng và sai số là cực kỳ phức tạp Để tính các đạo hàm, chúng ta cần sử dụng luật chuỗi

Chúng ta đã thấy rằng giảm dốc nhất là một thuật toán đơn giản, và thông thường chậm nhất Thuật toán gradient liên hợp và phương pháp Newton‟s nói chung mang đến sự hội tụ nhanh hơn [6] Trong chương này sẽ phát triển một thuật toán, thuật toán vượt khe để sự dụng nhằm cải tiến tốc độ hội tụ của lan truyền ngược nguyên thủy, đặc biệt thuật toán này tỏ ra lợi hại trong một số trường hợp ví dụ mặt chất lượng của mạng có dạng khe

Khi nghiên cứu về các thuật toán nhanh hơn thì thường rơi vào hai trường phái Trường phái thứ nhất phát triển về các kỹ thuật tìm kiếm Các kỹ thuật tìm kiếm bao gồm các ý tưởng như việc thay đổi tốc độ học, sử dụng qui tắc mô-men, bước học thích nghi Trường phái khác của nghiên cứu nhằm vào các kỹ thuật tối ưu hóa số chuẩn, điển hình là phương pháp gradient liên hợp, hay thuật toán Levengerg-Marquardt (một biến thể của phương pháp Newton) Tối ưu hóa số đã là một chủ đề nghiên cứu quan trọng với 30, 40 năm, nó dường như là nguyên nhân để tìm kiếm các thuật toán huấn luyện nhanh

Trong chương này và chương 3 chúng ta sẽ trình bày một kỹ thuật vượt khe [2]

để áp dụng cho việc tìm bộ trọng số tối ưu của mạng Trong chương 3 chúng ta sẽ sử dụng một ví dụ đơn giản để nói rằng thuật toán lan truyền ngược giảm dốc nhất (SDBP) có vấn đề với sự hội tụ và chúng ta sẽ trình bày sự kết hợp giữa thuật toán vượt khe với kỹ thuật lan truyền ngược để nhằm cải tiến tính hội tụ của lời giải

Ta biết rằng, thuật toán LMS được đảm bảo để hội tụ tới một lời giải cực tiểu hóa trung bình bình phương sai số, miễn là tốc độ học không quá lớn Điều này là đúng bởi vì trung bình bình phương sai số cho một mạng tuyến tính một lớp là một hàm toàn phương Hàm toàn phương chỉ có một điểm tĩnh Hơn nữa, ma trận Hessian

Trang 34

của hàm toàn phương là hằng số, cho nên độ dốc của hàm theo hướng là không thay đổi, và các hàm đồng mức có dạng hình e-lip

Lan truyền ngược giảm dốc nhất (SDBP) cũng như LMS, nó cũng là một thuật toán xấp xỉ giảm dốc nhất cho việc cực tiểu trung bình bình phương sai số Thật vậy, lan truyền ngược giảm dốc nhất là tương đương thuật toán LMS khi sử dụng trên mạng tuyến tính một lớp Khi áp dụng với các mạng nhiều lớp thì trung bình bình phương sai

số liên quan đến mạng tuyến tính một lớp và các mạng phi tuyến nhiều lớp Trong khi mặt sai số với mạng tuyến tính một lớp có một cực tiểu đơn và độ dốc không đổi, mặt sai số với mạng nhiều lớp có thể có nhiều điểm cực tiểu cục bộ, có thể bị kéo dài, uốn cong tạo thành khe, trục khe và độ dốc có thể thay đổi ở một dải rộng trong các vùng khác nhau của không gian tham số Khi mà mặt sai số phức tạp như vậy thì các thuật toán kể trên sẽ mất rất nhiều thời gian để tìm ra nghiệm tối ưu của bài toán, đôi khi còn

đi đến mất ổn định và thất bại

2.1.1 Mặt chất lượng

Trong quá trình nỗ lực thoát ra khỏi các cực tiểu yếu, cực tiểu cục bộ và những mong muốn giảm chi phí thời gian thực hiện của máy tính trong quá trình tìm kiếm nghiệm tối ưu thì vấn đề nghiên cứu đặc điểm của các mặt sai số hay được người ta chọn làm xuất phát điểm cho việc cải tiến hay đề xuất các thuật học mới Khi nói về mạng nơ-ron thì huấn luyện chất lượng mạng được nhắc đến nhiều hơn cả (loại học có giám sát) Điều này liên quan đến hàm chất lượng của mạng và dẫn đến khái niệm mặt chất lượng mạng Đôi khi chúng ta còn gọi mặt chất lượng bằng những thuật ngữ khác: mặt sai số, mặt thực thi

Hình 2.1: Mặt sai số dạng lòng khe

Trang 35

Hình 2.1 mô tả một mặt sai số, có một vài điều đặc biệt cần chú ý đối với mặt

sai số này Độ dốc biến đổi một cách mạnh mẽ trên không gian tham số Vì lý do này,

nó sẽ khó để mà lựa chọn một tốc độ học phù hợp cho thuật toán giảm dốc nhất Trong một vài vùng của mặt sai số thì rất phẳng, cho phép tốc độ học lớn, trong khi các vùng khác độ dốc lớn, yêu cầu một tốc độ học nhỏ Có thể ghi nhận rằng có thể sẽ không đáng ngạc nhiên lắm đối với các vùng phẳng của mặt sai số bởi một lý do chúng ta dùng hàm truyền sigmoid cho mạng Hàm sigmoid rất hay được sử dụng trong mạng nơ-ron bởi đặc điểm của nó (bị chặn, đơn điệu tăng, khả vi) thích nghi với các kỹ thuật tối ưu kinh điển, hàm này có đặc điểm là rất phẳng đối với các đầu vào lớn

2.1.2 Tính hội tụ và điều kiện tối ưu

2.1.2.1 Tính hội tụ

Chúng ta biết rằng tốc độ học cực đại mà có thể ổn định đối với thuật toán giảm dốc nhất thì được chia hai bởi giá trị riêng cực đại của ma trận Hessian, đối với hàm mục tiêu dạng toàn phương Tuy nhiên, mặt sai số cho mạng nhiều lớp thì không là hàm toàn phương Hình dạng của mặt sai số có thể là rất khác nhau trong các vùng khác nhau của không gian tham số Với các hàm khe thì độ cong sẽ rất khác nhau theo các hướng khác nhau, do đó việc xác định bước học là không thuận lợi

Chúng ta vừa nghiên cứu về mặt chất lượng, cụ thể là nghiên cứu về mặt chất lượng có dạng lòng khe Nguyên nhân của việc hội tụ chậm là việc thay đổi độ dốc của mặt trên đường đi của quỹ đạo Hai bên khe rãnh rất dốc tuy nhiên đáy của nó thì lại hầu như bằng phẳng, quĩ đạo sẽ vượt qua mặt lỗi rất nhanh cho đến khi nó rơi vào thung lũng có độ nghiêng thoai thoải và mất rất nhiều thời gian bên khe rãnh để rồi

tiến chậm chạp đến điểm cực tiểu đôi khi đến mất ổn định khi rơi vào thung lũng, hình

vẽ 2.2 mô tả một quỹ đạo dao động với mặt sai số dạng lòng khe Một phương pháp có

thể giúp ta vấn đề này là dùng qui tắc mô-men Tức là khi quĩ đạo nhảy qua nhảy lại trên khe rãnh, biến thiên trọng số sẽ đổi dấu liên tục và như vậy sẽ cho ta số trung bình cho một thay đổi nhỏ chính xác, như vậy mạng có thể ổn định ở đáy khe rãnh ở đó nó bắt đầu di chuyển chậm dần theo quán tính Tuy nhiên, đối với những bài toán mà trọng số tối ưu nằm ở đáy bề lõm, thì mô-men cũng chẳng giúp được gì mà đôi khi còn gây ra nguy hiểm nếu mô-men lại đẩy quĩ đạo lên cùng một khoảng cách ở phía bên kia của khe rồi cứ xoay vòng tạo thành dao động Đó cũng chính là cái lợi và hại của việc dùng mô-men cho dạng bài toán với mặt lỗi lòng khe Một phương pháp khác là

sử dụng tốc độ học thích nghi VLBP (Variable Learning rate Back Propagation algorithm) Chúng ta có thể nâng cao sự hội tụ nếu chúng ta tăng tốc độ học trên vùng phẳng của mặt lỗi và rồi thì giảm tốc độ học khi mà độ cong của mặt lỗi tăng Nghĩa

Trang 36

là, chúng ta có thể nâng cao sự hội tụ bằng việc điều chỉnh tốc độ học trong quá trình huấn luyện, vấn đề của chúng ta sẽ là, xác định khi nào thay đổi tốc độ học và bằng bao nhiêu, hay nói cách khác, chúng ta cần biết chúng ta đang ở đâu trên mặt sai số

Có nhiều giải pháp khác nhau cho việc thay đổi tốc độ học

Tuy nhiên điều trở ngại chính với các phương pháp VLBP là các điều chỉnh có thể cần 5 hoặc 6 tham số được lựa chọn trước Thông thường thì vấn đề thực hiện của thuật toán là nhạy cảm với sự thay đổi trong các tham số đó Sự lựa chọn của các tham

số thì cũng phụ thuộc bài toán

Tính bước học theo nguyên lý vượt khe là một phương pháp tỏ ra rất mạnh mẽ

để giải quyết bài toán tối ưu đặc biệt là các bài toán với mặt chất lượng dạng lòng khe, trục khe

Hình 2.2: Quỹ đạo dao động với sai số dạng lòng khe

Tuy nhiên, trước khi đến với thuật toán vượt khe thì chúng ta hãy tìm hiểu về vấn đề điều kiện tối ưu, bởi vì nó ảnh hưởng đễn những suy nghĩ của chúng ta trong những xuất phát điểm của bất kỳ một thuật toán tối ưu nào

2.1.2.2 Điều kiện tối ưu

Việc huấn luyện chất lượng mạng sẽ là tối ưu hoá hàm mục tiêu, hay còn gọi là hàm chất lượng của mạng Ta sẽ đi định nghĩa một số khái niệm về điểm tối ưu Chúng

ta giả định rằng điểm tối ưu là điểm cực tiểu của hàm mục tiêu Ta xét các khái niệm sau trước khi đi đến các điều kiện tối ưu

a Cực tiểu mạnh

Trang 37

Điểm u* là cực tiểu mạnh của J(u) nếu một số vô hướng  >0 tồn tại, để J(u*) < J(u + u) với mọi u mà   u  0 Nói cách khác, nếu chúng ta dịch chuyển theo mọi cách từ điểm cực tiểu mạnh một khoảng nhỏ theo bất kỳ hướng nào hàm sẽ tăng

b Cực tiểu toàn cục

Điểm u* là một cực tiểu toàn cục duy nhất của J(u) nếu J(u*) < J(u + u) với mọi u ≠ 0 Đối với cực tiểu mạnh, u*, hàm có thể nhỏ hơn J(u*) tại các điểm lân cận nhỏ của u* Cho nên đôi khi cực tiểu mạnh còn gọi là cực tiểu cục bộ Đối với cực tiểu toàn cục thì hàm sẽ là nhỏ nhất so với mọi điểm khác trong không gian tham số

c Cực tiểu yếu

Điểm u* là một cực tiểu yếu của J(u) nếu nó không phải là cực tiểu mạnh, và một số vô hướng  >0 tồn tại, để J(u*) ≤ J(u + u) với mọi u mà   u  0

Chúng ta đã định nghĩa về điểm cực tiểu Tiếp theo ta đến với một số điều kiện

mà cần phải thoả mãn để có điểm tối ưu Sử dụng khai triển Taylor để tiếp cận các điều kiện đó

J u u J u

J

u u

T u

u T

J u u J u

J

u u

T u

u T

sẽ là không đáng kể và ta có thể xấp xỉ hàm là:

 u Ju u  J u J u u

J

u u

Điểm u* là một điểm cực tiểu thí điểm, và điều này nói lên rằng có thể tăng nếu

u ≠ 0 Để điều này xảy ra thì    *  0

 u u

J

u u T

Tuy nhiên, nếu số hạng này mà dương    *  0

 u u

J

u u

J

u u

Trang 38

Nhưng điều này là một sự mâu thuẫn, khi mà u* là một điểm cực tiểu yếu Cho nên, một lựa chọn duy nhất phải là    *  0

 u u

J

u u T

Khi điều này phải đúng cho bất

kỳ u, chúng ta có J u uu*  0

Cho nên gradient phải bằng 0 tại điểm cực tiểu Đây là điều kiện cần (nhưng không đủ) để u* là một điểm cực tiểu cục bộ (hay còn gọi là cực tiểu mạnh) Bất kỳ các điểm thoả mãn phương trình J u uu*  0 được gọi là các điểm tĩnh

Điều kiện thứ hai

Giả sử rằng ta có điểm tĩnh u* Khi gradient của J(u) bằng 0 tại tất cả các điểm tĩnh, khai triển chuỗi Taylor sẽ là:

J u u

J

u u T

Như trước, chúng ta sẽ chỉ xét các điểm đó trong lân cận nhỏ của u*, vì u là nhỏ và J(u) có thể được xấp xỉ bởi hai số hạng đầu trong phương trình Cho nên điểm cực tiểu khoẻ (cực tiểu cục bộ) sẽ tồn tại, u*, nếu u 2J u  *u  0

u u T

Để cho điều này là đúng với mọi u ≠ 0 thì yêu cầu ma trận Hessian phải là ma trận xác định dương Theo định nghĩa, một ma trận A xác định dương nếu z T Az 0đối với bất kỳ vectơ z ≠ 0 A là bán xác định dương nếu z T Az0

Đối với véctơ z bất kỳ Chúng ta có thể kiểm tra các điều kiện đó bởi việc kiểm tra các giá trị riêng của ma trận Nếu tất cả các giá trị riêng mà dương, thì ma trận là xác định dương Nếu tất cả các giá trị riêng không âm thì ma trận là xác định bán dương

Ma trận Hessian xác định dương là một điều kiện thứ hai, điều kiện đủ cho việc tồn tại cực tiểu khoẻ (điều kiện đủ để tồn tại cực tiểu cục bộ) Một cực tiểu có thể vẫn

là cực tiểu khoẻ nếu số hạng thứ hai của chuỗi Taylor là 0, nhưng số hạng thứ ba là dương Cho nên điều kiện thứ hai là điều kiện cần cho cực tiểu khoẻ nếu ma trận Hessian xác định bán dương

Để minh họa các điều kiện đó, xét một hàm hai biến sau   4 2

J u u u Trước hết, chúng ta muốn xác định các điểm tĩnh bất kỳ, nên chúng ta cần tính

  14

2

4

02

u gradient J u

u

Trang 39

Điểm tĩnh duy nhất là điểm u*

= 0 Bây giờ chúng ta cần kiểm tra điều kiện thứ hai, xét ma trận Hessian 2   12

Để tổng kết điều kiện tối ưu ta đi đến các điều sau:

- Các điều kiện cần cho u* là một cực tiểu, khoẻ hoặc yếu, của J(u) là

  *  0

J u uu và   *

2

u u u J



 xác định dương

2.2 Thuật toán vượt khe

Chúng ta nhận thấy rằng các điều kiện tối ưu nói chung chỉ là những điều kiện cần mà không đủ đối với cực tiểu toàn cục Mà các thuật toán đã có thì đều không đảm bảo chắc chắn rằng sẽ tìm được điểm cực tiểu toàn cục mà chỉ có khả năng nâng cao

cơ hội tìm đến điểm cực tiểu toàn cục mà thôi

Như vậy, với những mặt chất lượng phức tạp thì càng khó khăn hơn trong quá trình tìm bộ trọng số tối ưu với thuật toán lan truyền ngược nguyên thủy, ngay cả khi chúng ta thực hiện với bước học cực tiểu hóa theo đường, k1  arg m inJu ks k,

α ≥ 0, thì vẫn có thể bị tắc tại trục của khe trước khi đạt được điểm cực tiểu, nếu mặt chất lượng có dạng khe Có thể có một chiến lược tiếp theo để giải quyết tiếp vấn đề khi mà gặp bài toán khe núi này là sau khi đạt tới gần trục khe bằng phương pháp gradient với bước học được tính bằng cực tiểu hoá theo đường (hoặc với bước học cố định) chúng ta sẽ dịch chuyển dọc theo đáy khe hẹp nhờ sự tiệm cận dần theo dạng hình học của đáy khe hẹp và lúc này thì người ta có thể giả thiết dạng hình học đó là đường thẳng hoặc xấp xỉ cong bậc hai Chiến lược lai ghép này (tức là tìm nghiệm bài toán tối ưu theo hai giai đoạn như trên) khác với phương pháp được nghiên cứu và phát trển trong báo cáo này

Mục tiêu của đề tài là nghiên cứu và áp dụng thuật toán vượt khe để tính bước học cho việc tìm bộ trọng số tối ưu của mạng nơ-ron nhằm giải quyết bài toán điều khiển Việc sử dụng kết hợp bước vượt khe cùng với hướng đối gradient sẽ chế ngự quỹ đạo tìm kiếm nhằm tránh rơi vào trục khe trước khi tìm ra điểm cực tiểu Chúng ta

Trang 40

sẽ bắt đầu bằng việc tìm hiểu thuật toán vượt khe, tiếp theo, trong chương 3 của nghiên cứu sẽ áp dụng nó kết hợp với thuật toán lan truyền ngược để cài đặt thành một gói phần mềm luyện mạng

*Tìm hiểu thuật toán vượt khe:

Từ “tối ưu” có ý nghĩa là tìm giá trị của u để cực tiểu hoá hàm J(u) Tất cả các thuật toán tối ưu lặp đã biết thì đều bắt đầu từ một việc là khởi tạo một ước lượng, u0

, và sau

đó thì cập nhật ước lượng của u trong các vòng lặp tuân theo phương trình có dạng

uk+1 = uk+ksk hoặc Δuk = uk+1 – uk = +ksk Trong đó vecto sk

thể hiện hướng tìm kiếm, và số dương vô hướng klà tốc độ học, cái này xác định độ dài của bước tiến Các thuật toán phân biệt bởi sự lựa chọn của hướng tìm kiếm sk Cũng có một vài biến thể khác nhau để lựa chọn tốc độ học k

* Thuật toán tính bước học vượt khek :

Ta đã biết các thuật toán tối ưu hoá lặp được xây dựng trên hai khái niệm cơ bản là hướng thay đổi hàm mục tiêu (hướng tìm kiếm) và độ dài bước Quá trình đó được mô tả như sau:

uk+1 = uk+ksk, k = 0,1,…

Trong đó: uk

, uk+1 là điểm đầu và điểm cuối của bước lặp thứ k; sk là vectơ chỉ hướng thay đổi các biến số trong không gian n chiều; k được gọi là độ dài bước Các thuật toán tối ưu thông thường thì khác nhau về hướng chuyển động, hoặc (và) quy tắc điều chỉnh độ dài bước, có thể tóm tắt như sau:

- Quy tắc điều chỉnh bước đơn giản nhất là cách điều chỉnh bước căn cứ vào điều kiện đơn điệu giảm hàm cực tiểu hoá: J(uk+1) = J(uk+ksk) < J(uk) Đây là điều kiện quá yếu, không đủ đảm bảo hội tụ và không thể tăng tốc độ hội tụ của các thuật toán tối ưu

- Quy tắc thứ hai là chọn cố định một đại lượng xác định theo điều kiện

Lipschitz:

L k

10

,

 trong đó L là hằng số Lipschitz của hàm mục

tiêu Điều kiện Lipschitz đủ đảm bảo tính đơn điệu và hội tụ của quá trình tối

ưu hoá, tuy nhiên vẫn có khó khăn là hằng số Lipschitz thì không thể biết được, không thể xác định được, và hơn nữa các thuật toán sử dụng phương pháp này hội tụ chậm

Định dạng
Số trang	99
Dung lượng	1,16 MB

Nghiên cứu thuật toán tìm nghiệm tối ưu toàn cục trong quá trình luyện mạng nơ - ron - ứng dụng để nhận dạng, điều khiển đối tượng động học phi tuyến

Thuật toán vƣợt khe

Mô hình mạng nơ-ron của bộ điều khiển