Các luật học

Một phần của tài liệu Tài liệu học tập điều khiển mờ và mạng nơron (Trang 76 - 80)

Mạng nơron nhân tạo phải được huấn luyện trước khi sử dụng. Có hai nhóm luật học:

77 - Học thông số (Parameter Learning): có nhiệm vụ tính toán cập nhật giá trị của trọng số liên kết các nơron trong mạng.

- Học cấu trúc (Structure Learning): có nhiệm vụ đưa ra cấu trúc hợp lý của mạng nơron như thay đổi số lượng nơron hoặc thay đổi số lượng liên kết của các nơron có trong mạng

Hai nhóm luật học trên có thể sử dụng đồng thời học cả cấu trúc và thông số (khi đó gọi là các luật học lai) hoặc được áp dụng riêng lẻ.

Sau đây trình bày các luật học thông số với các giả thiết:

- Cấu trúc mạng nơron gồm có số lượng lớp nơron, số lượng nơron và cách thức liên kết của các trọng số có trong mạng đã hợp lý.

- Ma trận trọng số đã bao gồm tất cả các phần tử thích ứng.

Nhiệm vụ của học thông số là đưa ra phương pháp nào đó để tìm ma trận trọng số điều chỉnh từ ma trận trọng số tùy chọn ban đầu với cấu trúc của mạng nơron đã được xác định từ trước, thỏa mãn điều kiện sai lệch trong phạm vi cho phép.

Để làm được điều đó, mạng nơron sử dụng các phương pháp học thích ứng để

tính toán được các ma trận trọng số điều chỉnh w đặc trưng cho mạng. Có ba kiểu học là: học có giám sát, học củng cố và học không có giám sát.

ạ Học có giám sát (Supervised Learning)

Trong phương pháp học có giám sát, dữ liệu huấn luyện mạng nơron là tập các mẫu (dữ liệu vào – dữ liệu ra) mong muốn. Giả sử có K mẫu dữ liệu huấn luyện mạng:

{( (1), (1));( (2), (2));...;( ( ), ( ))}x d x d x K d K

Ban đầu các trọng số của mạng được khởi động giá trị bất kỳ. Lần lượt từng dữ liệu vào x(k) được đưa vào các ngõ vào của mạng, mạng nơron tính được dữ liệu ở ngõ ra là y(k). Dữ liệu y(k) được so sánh với dữ liệu ra mong muốn d(k). Sai số e(k) = d(k) – y(k) được sử dụng để cập nhật trọng số của mạng (H.3.7).

78

b. Học củng cố (Reinforcement Learning)

Trong phương pháp học có giám sát vừa đề cập ở trên, chúng ta cần biết dữ liệu

ở ngõ ra của mạng tương ứng với mỗi mẫu tín hiệu vàọ Tuy nhiên trong thực tế,

không phải lúc nào chúng ta cũng có được thông tin đầy đủ như vậỵ Ví dụ, trong một số trường hợp chúng ta chỉ biết ngõ ra thực của mạng là ‘đúng’ hay ‘sai’ so với ngõ ra mong muốn. Phương pháp học dựa trên thông tin đánh giá như trên gọi là học củng cố. Thông tin đánh giá chỉ cho biết mức độ ‘đúng’ hay ‘sai’của ma trận trọng số mà không chỉ dẫn được phải thay đổi ma trận trọng số như thế nào để đi đến kết quả đúng (H.3.8).

Hình 3.8. Học củng cố

c. Học không có giám sát (Unsupervised Learning)

Trong phương pháp học không có giám sát, không có thông tin phản hồi cho biết ngõ ra của mạng là đúng hay saị Mạng nơron phải tự phát hiện các đặc điểm, các mối tương quan, hay các nhóm của tập mẫu dữ liệu vào và mã hóa chúng thành dữ liệu ra của mạng. Trong khi phát hiện ra các đặc điểm này, mạng thần kinh thay đổi thông số của nó, quá trình này gọi là tự tổ chức (H.3.9).

Hình 3.9 . Học không có giám sát

Có thể so sánh ba phương pháp học của mạng nơron với ba cách học của bộ não con người (bảng 3.1).

79

Bảng 3.1 So sánh các phương pháp học của mạng nơron nhân tạo

Bộ não con người Mạng nơron nhân tạo

Học có s hướng dn của giáo viên Học có giám sát Học có sđánh giá của giáo viên Học củng cố

Tự học Học không có giám sát

Chúng ta vừa xét ba phương pháp huấn luyện mạng nơron nhân tạọ Dù huấn luyện mạng nơron nhân tạo theo phương pháp nào thì sơ đồ tổng quát để huấn luyện

mt tế bào nơron cũng có dạng như hình 3.10.

Trong hình 3.10, tín hiệu vào xj (j = 1, 2, … , m) có thể là tín hiệu ra của một tế

bào nơron khác hoặc có thể là tín hiệu vào từ bên ngoàị Chú ý rằng mức ngưỡng của tế bào nơron cũng bao gồm trong quá trình học như là một trọng số của ngõ vào xm có giá trị cố định bằng -1. Tín hiệu ra mong muốn di chỉ tồn tại trong phương pháp học có giám sát, hoặc trong phương pháp học củng cố, dilà tín hiệu đánh giá. Tổng quát vector trọng số của tế bào nơron thay đổi theo quy luật sau:

w (i k+ =1) w ( )i k + w ( )i k (3.11) trong đó w ( )i k là biến thiên của vector trọng số tại bước lặp thứ k.

w ( )i k =η.r. ( )x k (3.12)

ηlà một số dương quyết định tốc độ học, gọi là hằng số học; r là tín hiệu học, tổng quát là hàm của wj, x và tín hiệu mong muốn di (nếu tồn tại).

(w ( ), ( ), ) r i i r= f k x k d (3.13) Kết hợp (3.11) và (3.12) ta được: w (i k+ =1) w ( )i k +η.r. ( )x k (3.14) η ' ∆

80 Trong các mục sau chúng ta sẽ xét thuật toán học cụ thể cho từng mạng nơron nhân tạo như thuật toán học perceptron, thuật toán học Widrow – Hoff, thuật toán học delta, thuật toán lan truyền ngược…

Một phần của tài liệu Tài liệu học tập điều khiển mờ và mạng nơron (Trang 76 - 80)

Tải bản đầy đủ (PDF)

(134 trang)