Thuật toán học bán giám sát Bootstrapping

Một phần của tài liệu xây dựng hệ thống tìm kiếm ảnh theo nội dung (Trang 29)

Thuật toán học máy có giám sát để xác định khuôn mặt ở trên cần một số lượng rất lớn các dữ liệu là tập ảnh các khuôn mặt và tập ảnh không phải khuôn mặt được lọc và xử lý trước thủ công. Việc chuẩn bị bộ dữ liệu đó rất tốn công sức và thời gian. Chính vì vậy, luận văn để xuất một phương pháp cho phép chỉ cẩn chuẩn bị một tập nhỏ các dữ liệu huấn luyện được lọc và xử lý trước mà vẫn có thể huấn luyện được một bộ phân lớp xác định vị trí khuôn mặt khá chính xác. Phương pháp này đã từng được Yakowsky mô tả dùng để xác định nghĩa của các từ trong một văn bản. Ở đây, tôi có biến đổi một chút để áp dụng vào bài toán xác định vị trí khuôn mặt. Sau đây là sơ đồ các bước huấn luyện theo thuật toán Bootstrapping.

Hình 2.6: Thuật toán huấn luyện bán giám sát bootstrapping

Ta chỉ cần chuẩn bị, xử lý và bóc tách khuôn mặt trước cho bộ ảnh A có số lượng không quá lớn. Sau đó tách bộ ảnh A đó làm 2 bộ ảnh A1, A2. Bộ ảnh A1 sẽ làm nhiệm vụ mồi. Ta sẽ huấn luyện bộ phân lớp để ra được mô hình phân lớp M. Bộ ảnh B sẽ làm nhiệm vụ mở rộng dữ liệu huấn luyện đã gán nhãn bằng cách sử dụng chính mô hình phân lớp M để tự động xử lý và bóc tách khuôn mặt trong bộ ảnh B và đổ các ảnh đã bóc tách sang bộ ảnh C. Tiến hành huấn luyện lặp đi lặp lại M bằng A1 và C cho đến khi kết quả phân lớp bộ ảnh A2 không cải thiện hoặc bị thụt lùi thì dừng lại.

Như vậy M sẽ được mở rộng dần dần qua mỗi vòng lặp. Tới vòng cuối cùng, độ chính xác của M sẽ gần bằng một bộ phân lớp được huấn luyện bằng một bộ dữ liệu huấn luyện được xử lý và bóc tách thủ công có số lượng bằng số lượng ảnh của A1 và C.

Một phần của tài liệu xây dựng hệ thống tìm kiếm ảnh theo nội dung (Trang 29)