a) Các bước huấn luyện bộ điều khiển noron
Bước 1: Chọn hằng số học , sai số dừng thuật toán max, gán biến khởi tạo
0, k 1
= = .
Bước 2: Thay các giá trị đầu vào của tập học và tính toán đầu ra dựa trên cấu trúc mạng noron.
Bước 3: Tính hàm hao tán J và các đạo hàm theo các ma trận trọng số.
Bước 4: Sử dụng thuật toán lan truyền ngược và phương pháp GD để cập nhật trọng số.
Bước 5 : Kiểm tra k<N, với N là số lượng tập học, nếu chưa thì tiếp tục quay lại bước 1, ngược lại thực hiện tiếp bước 6.
Bước 6 : Kiểm tra xem maxchưa, nếu đúng thì xuất ra bộ trọng số còn nếu sai
thì gán =0, k =1 và quay lại bước 1.
b) Những yếu tố ảnh hưởng đến chất lượng học của thuật toán
Trọng số khởi tạo: bộ trọng số khởi tạo ảnh hưởng rất lớn đến sự hội tụ của quá trình học của mạng noron. Các nghiên cứu chỉ ra rằng nên chọn trọng số khởi tạo wij
trong khoảng 3 , 3 i i k k −
, trong đó kilà tổng số liên kết từ noron j tới noron i của
mạng.
Hằng số học: Thông thường thì sẽ không có hằng số học tổng quát cho các bài toán nói chung, mà thường được lựa chọn theo từng bài toán. Nếu hằng số học quá lớn thì sẽ dẫn đến dao động và mất ổn định và có khả năng rơi vào cực trị địa phương, còn nếu hằng số học quá nhỏ dẫn đến tốc độ hội tụ chậm. Để có thể giải quyết vấn đề này thì xem xét các trọng số mới có làm giảm hàm hao tán hay không, nếu không thì có thể các trọng số đã vượt quá xa vùng cực tiểu và như vậy cần phải giảm hằng số
. Ngược lại, nếu sau một số vòng lặp hàm hao tán liên tục giảm thì có thể thử tăng hằng số để đẩy nhanh tốc độ hội tụ đến giá trị cực tiểu.
Hằng số quán tính: Tốc độ học của thuật toán lan truyền ngược có thể rất chậm nếu hằng số học nhỏ, nhưng nếu hằng số học quá lớn có thể gây ra sự dao động lớn trong quá trình tìm cực tiểu theo phương pháp GD. Để giải quyết vấn đề này ta sử dụng phương pháp GD cải tiến. Nhờ phương pháp này, quá trình học có thể vượt qua cực trị địa phương để tiến đến cực trị toàn cục, đồng thời thành phần quán tính cũng ngăn cản sự thay đổi đột ngột của các trọng số theo hướng khác với hướng mà lời giải đang di chuyển đến.
c) Huấn luyện mạng noron bằng bộ điều khiển đại số gia tử
Bước 1: Từ bảng FAM (hệ luật mờ) ta quy đổi ra bảng SAM (bảng ngữ nghĩa vào
100
Bước 2: Từ bảng SAM làm tập học cho mạng noron. Sử dụng thuật toán lan truyền
ngược và phương pháp GD. Chọn mạng làm việc có 5 lớp. Hàm hoạt động được chọn là hàm sigmod ( ) 1
1
f
e
= −
+ vì tập học là các giá trị nằm trong đoạn [0,1] rất phù
hợp với hàm sigmod.
Hình 4.19 Sơ đồ mạng noron 5 lớp
Các thông số khởi tạo được chọn theo các yếu tố gây ảnh hưởng đến thuật giải như phân tích bên trên bao gồm:
Trọng số khởi tạo:
Bảng 4.4 Bộ trọng số khởi tạo của mạng noron
W1 w11 = -0.9 w12 = -0.8 w21 = -0.7 w22 = -0.5 w31 = 0.4 w32 = 0.5 w41 = 0.6 w42 = 0.7 w51 = 0.9 w52 = 0.8 W2 w61 = -0.75 w62 = 0.3 w63 = 0.5 w64 = 0.55 w65 = 0.55 w71 = -0.6 w72 = 0.65 w73 = 0.4 w74 = 0.45 w75 = 0.7 w81 = -0.6 w82 = -0.3 w83 = 0.3 w84 = 0.5 w85 = 0.65 W3 w96 = 0.9 w97 = 0.6 w98 = -0.8 w106 = -0.5 w107 = 0.3 w108 = 0.6 w116 = -0.6 w117 = -0.9 w118 = 0.7 Wo wo9 = 1.5 wo10 = -1.6 wo11 = -0.7
Hằng số học: η=0.6 và thay đổi 0.005 nếu sau 99 vòng lặp hàm hao tán giảm hoặc tăng liên tục.
Hằng số quán tính:
anpha1=0.005; anpha2=0.01; anpha3=0.006; anpha4=0.007; Sai số dừng quá trình học: =0.0002.
Thực hiện thuật toán huấn luyện mạng noron trên Matlab được thực hiện thông qua hàm Train_Neural đề tìm ra bộ trọng số với sai số =0.0002.
101
Bước 3: Từ bộ trọng số thu được xây dựng bộ điều khiển noron đưa vào Simulink
để mô phỏng.
Việc áp dụng bộ điều khiển noron cho robot di động hai chân được trình bày trong Chương 5 với các bài toán tương tự như với điều khiển mờ và điều khiển đại số gia tử trong các trường hợp thiếu các đại lượng động lực, trường hợp không quan tâm đến mô hình động lực và trường hợp sử dụng điều khiển noron thuần túy.