Các phươngpháp học

Một phần của tài liệu mạng nơ-ron nhân tạo trong kiểm soát nội dung hình ảnh (Trang 40 - 41)

Khái niệm: Học là quá trình thay đổi hành vi của các vật theo một cách nào đó làm cho chúng có thể thực hiện tốt hơn trong tương lai.

Một mạng nơ-ron được huyấn luyện sao cho với một tập các vector đầu vào X,

mạng có khả năng tạo ra tập các vector đầu ra mong muốn Y của nó. Tập X được sử dụng cho huấn luyện mạng được gọi là tập huấn luyện (training set). Các phần tử x thuộc X được gọi là các mẫu huấn luyện (training pattern). Quá trình huấn luyện bản chất là sự thay đổi các trọng số liên kết của mạng. Trong quá trình này, các trọng số của mạng sẽ hội tụ dần tới các giá trị sao cho với mỗi vector đầu vào x từ tập huấn luyện, mạng sẽ cho ra vector đầu ra y như mong muốn.

Có ba phương pháp học phổ biến là học có thầy (học có giám sát - supervised

learning), học không có thầy (học không giám sát - unsupervised learning) và học

củng cố (học tăng cường - reinforcement learning):

a. Học có thầy

Là quá trình học có sự tham gia giám sát của một “thầy giáo”. Cũng giống như việc ta dạy một em nhỏ các chữ cái. Ta đưa ra một chữ “a” và bảo với em đó rằng đây là chữ “a”. Việc này được thực hiện trên tất cả các mẫu chữ cái. Sau đó khi kiểm tra ta sẽ đưa ra một chữ cái bất kì (có thể viết hơi khác đi) và hỏi em đó đây là chữ gì?

Có thể cụ thể hóa như sau:

Mạng được cung cấp một tập các mẫu (x(1),d(1)), (x(2),d(2)),… (x(n),d(n)) là các cặp

đầu vào–đầu ra mong muốn. Khi một đầu vào mạng x(k) được đưa vào, đầu ra mong muốn d(k) cũng đượcđưa vào mạng. Sai khác giữa giá trịđầu ra thực sự y(k) và đầu ra mong muốn d(k) sẽ là cơ sở tạo tínhiệu lỗi để mạng sửa lỗi trọng sao cho đầu ra thực sự gần với đầu ra mong muốn hơn.

Như vậy với phương pháp học có thầy, số lớp cần phân loại đã được biết trước. Nhiệm vụ của thuật toán là phải xác định được một cách thức phân lớp sao cho với mỗi vector đầu vào sẽ được phân loại chính xác vào lớp của nó.

b. Học không có thầy

Với kiểu học này,không có bất kì một thông tin phản hồi từ môi trường nào. Mạng phải tự tìm ra các mẫu, đặc tính,tính quy tắc, sự tương quan trong dữ liệu đầu vào và tập hợp lại để tạo đầu ra. Khi tự tìm ra cácđặc điểm này, mạng đã trải qua các thay đổi về tham số của nó. Quá trình này được gọi là tự tổchức.

Các luật học có thểđược khái quát thành dạng chung với lượng điều chỉnh trọng nhưsau:

Trong đó:

i là nơron thứi

j là nơron thứj

 α - là hằng số học (dương) xác định tốc độ học

r là tín hiệu học. Tín hiệu học tổng quát là một hàm của w, x và d tức là r=f(w,x,d).

Đối với các trọng biến đổi liên tục ta có thể sử dụng dạng sau:

Như vậy với học không có thầy, số lớp phân loại chưa được biết trước, và tùy theo tiêu chuẩn đánh giá độ tương tự giữa các mẫu mà ta có thể có các lớp phân loại khác nhau.

c. Học củng cố

Đôi khi trong một số trường hợp, ta không biếthết được các giá trị đầu ra chính xác để có thể học giám sát mà chỉ biết được một số thông tinđánh giá. Khi đó luật học dựa trên những thông tin đánh giá này gọi là luật học củng cố và thôngtin phản hồi được gọi là thông tin củng cố. Luật học này chỉ khác luật học giám sát ở chỗ, thôngtin phản hồi từ môi trường chỉ mang tính chất đánh giá chứ không mang tính chất dạy, có nghĩa làchỉ đánh giá đầu ra thực sự là tốt hay xấu mà không đưa ra được đầu ra mong muốn là gì. Tín hiệucủng cố được mạng sử dụng với hi vọng là đầu ra thực sự có đánh giá phản hồi tốt hơn trong lầnhọc tiếp theo.

Một phần của tài liệu mạng nơ-ron nhân tạo trong kiểm soát nội dung hình ảnh (Trang 40 - 41)

Tải bản đầy đủ (DOC)

(83 trang)
w