Mô hình học

PHƯƠNG PHÁP HỌC CHO MẠNG TIẾN (FEEDFORWARD) ĐA MỨC

2.1.2 Mô hình học

Một khía cạnh khác cũng được được quan tâm là cách thức một mạng neuron (được xem như một máy học) quan hệ với môi trường trong quá trình học. Trong khía cạnh này, chúng ta nói tới một mô hình học để ám chỉ một mô hình của môi trường trong đó mạng neuron hoạt động. Có hai mô hình học chính. Mô hình

học không có người dạy liên quan đến quá trình tự tích luỹ từ các ví dụ không được gán nhãn của mạng neuron. Tuy nhiên ở đây chúng ta sẽ chỉ đề cập tới mô hình học cơ bản hơn: Học với một người dạy.

Học với một người dạy

Hình 2.2 cho ta một sơ đồ khối minh hoạ mô hình học thường được gọi là

học có giám sát này. Trong số các thuật ngữ mang tính khái niệm, chúng ta có thể nghĩ về “một người dạy“ như là một người có kiến thức về môi trường, mà kiến thức đó được biểu diễn bởi một tập hợp các ví dụ đầu vào-đầu ra. Tuy nhiên, mạng neuron không biết gì về môi trường. Bây giờ giả sử rằng cả người dạy và mạng neuron đều tiếp nhận một vector tích luỹ (một ví dụ) thu được từ môi trường. Bằng kiến thức vốn có, người dạy có khả năng đưa ra cho mạng neuron một đáp ứng mong muốn cho vector tích luỹ đó. Thực tế,đáp ứng mong muốn sẽ quyết định hành động tối ưu cần thực hiện cho mạng neuron. Các tham số của mạng được điều chỉnh dưới ảnh hưởng tổ hợp của vector tích luỹ và tín hiệu lỗi.

Tín hiệu lỗi được xác định như là sự khác biệt giữa đáp ứng mong muốn và đáp ứng thực sự. Sự điều chỉnh này được thực hiện dần dần lặp đi lặp lại với mục đích làm cho mạng neuron sánh được với người dạy. Theo cách này, kiến thức về môi trường sẵn dùng của người dạy được chuyển sang mạng neuron thông qua tích luỹ một cách đầy đủ nhất có thể được. Khi đạt được điều kiện này, chúng ta có thể

không cần tới người dạy nữa và để cho mạng neuron tự nó quan hệ với môi trường.

Hình 2.2 Sơ đồ khối của mô hình học với một người dạy

Dạng học có giám sát mà chúng ta vừa mô tả ở trên là phương pháp học hiệu chỉnh lỗi mà chúng ta đã đề cập đến trong phần 2.1.1. Đối với một thước đo tính năng hệ thống, chúng ta có thể nghĩ tới dạng lỗi bình phương trung bình hay tổng các lỗi bình phương trên toàn bộ các ví dụ tích luỹ, được xác định như là một hàm của các tham số tự do của mạng neuron (các trọng số synapse và các hệ số hiệu chỉnh). Hàm này có thể được hình dung như một bề mặt lỗi tính năng, với các trục toạ độ là các tham số tự do. Bề mặt lỗi được tính trung bình trên tất cả các ví dụ đầu vào-đầu ra có thể. Bất kỳ một trạng thái nào của hệ thống đặt dưới sự điều khiển của người dạy đều được biểu diễn như là một điểm trên bề mặt lỗi. Để hệ thống có thể nâng cao được tính năng theo thời gian, trong quá trình học từ người

dạy, điểm biểu diễn trạng thái phải di chuyển dần về phía một điểm cực tiểu của bề mặt lỗi (có thể là cực tiểu cục bộ hoặc toàn cục). Một hệ thống học có giám sát

thực hiện điều này bằng cách sử dụng thông tin mà nó có về gradient của bề mặt lỗi tương ứng với trạng thái hiện thời của hệ thống. Gradient của bề mặt lỗi tại bất kỳ điểm nào là một vector theo hướng dốc xuống nhất. Thực tế, hệ thống có thể sử dụng một đánh giá tức thời cho các vector gradient nếu coi các chỉ số ví dụ tích luỹ như chỉ số về thời gian. Việc sử dụng một đánh giá như vậy dẫn đến kết quả là một sự dịch chuyển của điểm biểu thị trạng thái trên bề mặt lỗi có tính chất như một “di chuyển ngẫu nhiên”. Như vậy, nếu cho trước một thuật toán được thiết kế nhằm cực tiểu hoá hàm giá, một tập hợp đầy đủ các ví dụ đầu vào-đầu ra, và một thời gian cho phép đủ để tích luỹ, thì một hệ thống học có giám sát luôn có khả năng thực hiện những công việc như phân loại mẫu v.v...

Quy tắc học hiệu chỉnh lỗ

Hội tụ nhanh cho quá trình học Back-propagation