I. Các khái niệm cơ bản về mạng nơron
5. Huấn luyện mạng
Mạng nơron như một hệ thống thích nghi có khả năng học (huấn luyện) để tinh chỉnh các trọng số liên kết cũng như cấu trúc của nó sao cho phù hợp với các mẫu học (sample). Có hai cách học trong các mạng nơron nhân tạo đó là học cấu trúc và học thông số:
Học cấu trúc là quá trình học thay đổi cấu trúc bên trong của mạng. Việc học cấu trúc của mạng truyền thẳng gắn với yêu cầu tìm ra số lớp của mạng và số nơron trên mỗi lớp. Tuy nhiên, với các mạng hồi qui còn phải xác định thêm các tham số ngưỡng θ của các nơron trong mạng. Về thực chất, việc điều chỉnh cấu trúc mạng đều qui về bài toán tìm kiếm tối ưu trong không gian tham số. Vì vậy, có thể áp dụng các giải thuật tìm kiếm tối ưu (gradient, giải thuật di truyền…).
Học tham số là quá trình học cập nhật các trọng số kết nối giữa các đơn vị xử lý trong mạng sao cho xấp xỉ với bộ trọng số mong muốn để có được ánh xạ vào ra như mong muốn.
Cho wij là trọng số kết nối giữa đơn vị thứ i với đơn vị thứ j, luật học cập nhật trọng số được thiết lập: ij ij w w wij = +∆ Trong đó: ij w ∆ : số gia trọng số Có 3 kỹ thuật học:
a) Học có thầy (Supervised Learning)
Trong học có thầy, mạng được cung cấp một tập mẫu học {(Xs,Ys)} theo nghĩa Xs là các tín hiệu vào, thì kết quả ra đúng của hệ phải là Ys. Ở mỗi lần học, vectơ tín hiệu vào Xs được đưa vào mạng, sau đó so sánh sự sai khác giữa các kết quả ra đúng Ys với kết quả tính toán thực tế. Sai số này sẽ được dùng để hiệu chỉnh lại các trọng số liên kết trong mạng. Quá trình cứ tiếp tục đến khi thỏa mãn một tiêu chuẩn nào đó.
b) Học không có thầy (Unsupervised Learning)
Với cách học không có thầy, không có tập mẫu dữ liệu đẩu ra mong muốn, quá trình học với tập dữ liệu vào mong muốn, mạng tự cập nhật các trọng số kết nối dựa trên cơ sở tập dữ liệu vào mong muốn sao cho dữ liệu ra thực sự của mạng thích nghi với tập dữ liệu vào mong muốn.
Thể loại học này thường sử dụng dữ liệu không phân lớp và quá trình học tự khám phá để phân lớp dữ liệu. Xs Ds zs Mạng Neuron Sai số Hiệu chỉnh W
c) Học tăng cường (Reinforcement Learning)
Cũng như học có thầy, tuy nhiên, tín hiệu ra mong muốn của mạng là tín hiệu tăng cường là tín hiệu thưởng và phạt. Quá trình học, cập nhật câc trọng số kết nối giữa các đơn vị xử lý sao cho dữ liệu ra thực sự của mạng xấp xỉ với dữ liệu ra mong muốn thường với độ tin cậy càng cao càng tốt.