Quá trình học của mạng nơron

Một phần của tài liệu Phương pháp nhận dạng khuôn mặt dựa trên phương pháp học chuyển giao của mạng nowrron tích chập và ứng dụng vào bài toán điểm danh học sinh tại trường thpt chuyên vĩnh phúc (Trang 32 - 35)

1.3. Mạng nơron nhân tạo

1.3.3. Quá trình học của mạng nơron

Quá trình học của mạng neural là quá trình lan truyền thơng tin để làm thay đổi các trọng số tốt nhất cĩ thể. Mạng neural được huấn luyện hay được học theo ba phương pháp học cĩ giám sát, học khơng giám sát và học tăng cường [5]

Học cĩ giám sát

Học cĩ giám sát (supervised learning) là phương pháp học từ một tập dữ liệu

huấn luyện ta đã biết trước nhãn của dữ liệu cần học và số lớp cần phân loại của bộ dữ liệu được đem đi huấn luyện. Đây là phương pháp học phổ biến nhất trong các phương pháp học của mạng neural. Mục đích của phương pháp này là từ tập dữ liệu đã gán nhãn qua quá trình học tạo ra một hàm số thật tốt để khi cĩ dữ liệu mới ta cĩ thể tính hay dự đốn được nhãn tương ứng của dữ liệu đĩ.

Ví dụ như nhận dạng chữ số viết tay. Tập dữ liệu huấn luyện gồm hàng nghìn chữ số viết tay của hàng nghìn người khác nhau. Ta đưa các bức ảnh chữ số viết tay này vào thuật tốn học và chỉ cho nĩ biết mỗi bức ảnh tương ứng với chữ số nào. Sau quá trình học một mơ hình hay một hàm số được tạo ra, khi nhận được bức ảnh mà mơ hình chưa nhìn thấy bao giờ hay khơng nằm trong tập huấn luyện thì nĩ sẽ đưa ra dự đốn chữ số trong bức ảnh đĩ.

24

Hình 1.11. Mơ hình huấn luyện mạng cĩ giám sát [11] Phương pháp học giám sát chia ra thành hai loại chính là:

- Phân loại (classification): Nếu nhãn của các dữ liệu đầu vào được chia thành một số hữu hạn nhĩm. Như các bài tốn nhận dạng chữ số viết tay, dị tìm khuơn mặt người, …

- Hồi quy (regression): Nếu nhãn của các dữ liệu đầu vào khơng được chia thành các nhĩm mà là một giá trị thực cụ thể. Ví dụ như bài tốn dự đốn giá của một căn nhà, giá trị dinh dưỡng của một mĩn ăn, …

Học khơng giám sát

Học khơng giám sát (Unsupervised Learning) là phương pháp học từ một tập

dữ liệu cần học ta khơng biết trước nhãn của dữ liệu, cũng như số lớp đầu ra. Thuật tốn sẽ dựa vào cấu trúc của dữ liệu để phân nhĩm hay giảm chiều của dữ liệu, … Học khơng giám sát cĩ liên quan chặt chẽ đến việc ước lượng mật độ trong thống kê. Cách học này khơng sử dụng tri thức từ bên ngồi trong quá trình học nên cịn được gọi là tự tổ chức.

25

Hình 1.12. Mơ hình huấn luyện mạng khơng giám sát [11]

Mạng neural điển hình cho cách học này là Seft – Organizing Map (SOM). Một số thuật tốn học khơng giám sát khác như k-means, Hieararchical Agglomerative Clustering (HAC), Fuzzy Cognitive Map (FCM), …. Các hướng tiếp cận bài tốn học khơng giám sát là (1) và (2):

(1). Phân cụm (cluster): Chia dữ liệu thành các cụm nhỏ dựa trên sự liên quan của các dữ liệu trong mỗi cụm.

(2). Liên kết (association): Bài tốn khám phá ra quy luật của bộ dữ liệu cho trước.

Phần lớn ứng dụng học khơng giám sát vào các bài tốn ước lượng như mơ hình hĩa thống kê, nén, lọc, phân nhĩm, …

Học tăng cường

Học tăng cường (Reinforcement Learning) là phương pháp học giúp cho một

hệ thống tự động xác định hành động dựa trên hồn cảnh để đạt lợi ích cao nhất. Học tăng cường bằng cách thử nghiệm dữ liệu để khám phá ra hành động nào là tốt nhất.

26

Hình 1.13. Mơ hình huấn luyện mạng tăng cường [11]

Hành động đĩ khơng chỉ cĩ lợi ích tốt cho bước hiện tại mà cịn cho các bước tiếp theo. Hai đặc điểm quan trọng để phân biệt học tăng cường là tìm kiếm thử - sai (trialand-error search) và bồi dưỡng chậm (delayed reward).

Mơi trường học thường được biểu diễn dưới dạng Quy trình quyết định markov (Markov Decision Process - MDP) trạng thái hữu hạn. Và các thuật tốn học tăng cường liên quan đến các kỹ thuật quy hoạch động.

Một cách hình thức, mơ hình học tăng cường bao gồm: Tập các trạng thái của mơi trường, tập các hành động và tập các điểm số. Học tăng cường khai thác những gì nĩ đã biết và khám phá mơi trường mới, những hành động mới.

Hiện tại, học tăng cường chủ yếu được áp dụng vào Lý thuyết trị chơi, thuật tốn cần xác định hành động tiếp theo để đạt số điểm tốt nhất. Ví dụ, AlphaGo của Google đánh cờ vây thắng con người, trong khi cờ vây cĩ độ phức tạp cao xấp xĩ

.

Một phần của tài liệu Phương pháp nhận dạng khuôn mặt dựa trên phương pháp học chuyển giao của mạng nowrron tích chập và ứng dụng vào bài toán điểm danh học sinh tại trường thpt chuyên vĩnh phúc (Trang 32 - 35)

Tải bản đầy đủ (PDF)

(100 trang)