Thuật toán học bán giám sát Bootstrapping

Một phần của tài liệu Xây dựng hệ thống tìm kiếm ảnh theo nội dung 9 (Trang 26 - 29)

Thuật toán học máy có giám sát để xác định khuôn mặt ở trên cần một số lƣợng rất lớn các dữ liệu là tập ảnh các khuôn mặt và tập ảnh không phải khuôn mặt đƣợc lọc và xử lý trƣớc thủ công. Việc chuẩn bị bộ dữ liệu đó rất tốn công sức và thời gian. Chính vì vậy, luận văn để xuất một phƣơng pháp cho phép chỉ cẩn chuẩn bị một tập nhỏ các dữ liệu huấn luyện đƣợc lọc và xử lý trƣớc mà vẫn có thể huấn luyện đƣợc một bộ phân lớp xác định vị trí khuôn mặt khá chính xác. Phƣơng pháp này đã từng đƣợc Yakowsky mô tả dùng để xác định nghĩa của các từ trong một văn bản. Ở đây, tôi có biến đổi một chút để áp dụng vào bài toán xác định vị trí khuôn mặt. Sau đây là sơ đồ các bƣớc huấn luyện theo thuật toán Bootstrapping.

15 Tách bộ ảnh thành 2 phần không đều nhau A, B nhưng không chồng lấp Gán nhãn dữ liệu cho bộ ảnh A Chia bộ ảnh A thành 2 bộ ảnh A1, A2 không đều nhau

Huấn luyện Bộ phân lớp xác định vị trí khuôn mặt dựa vào bộ ảnh A1 và bộ ảnh

C

Kiểm tra độ chính xác của mô hình phân lớp với bộ ảnh test A2 đã hội

tụ chưa Kết thúc Đã hội tụ Sử dụng mô hình phân lớp M để xác định vị trí khuôn mặt trên bộ ảnh B Chuyển các ảnh đã gán nhãn của bộ ảnh B sang bộ ảnh C Bắt đầu Chưa hội tụ

16

Bộ ảnh huấn luyện chưa xử lý

Bộ ảnh B sử dụng làm dữ liệu huấn luyện không gán nhãn Bộ ảnh A2 sử dụng làm dữ liệu test thử trong mỗi vòng huấn luyện Bộ ảnh A1 làm dữ liệu huấn luyện có gán nhãn Mô hình phân lớp M Bộ ảnh C (ban đầu rỗng) Bộ ảnh A

Hình 2.6: Thuật toán huấn luyện bán giám sát bootstrapping

Ta chỉ cần chuẩn bị, xử lý và bóc tách khuôn mặt trƣớc cho bộ ảnh A có số lƣợng không quá lớn. Sau đó tách bộ ảnh A đó làm 2 bộ ảnh A1, A2. Bộ ảnh A1 sẽ làm nhiệm vụ mồi. Ta sẽ huấn luyện bộ phân lớp để ra đƣợc mô hình phân lớp M. Bộ ảnh B sẽ làm nhiệm vụ mở rộng dữ liệu huấn luyện đã gán nhãn bằng cách sử dụng chính mô hình phân lớp M để tự động xử lý và bóc tách khuôn mặt trong bộ ảnh B và đổ các ảnh đã bóc tách sang bộ ảnh C. Tiến hành huấn luyện lặp đi lặp lại M bằng A1 và C cho đến khi kết quả phân lớp bộ ảnh A2 không cải thiện hoặc bị thụt lùi thì dừng lại.

17

Nhƣ vậy M sẽ đƣợc mở rộng dần dần qua mỗi vòng lặp. Tới vòng cuối cùng, độ chính xác của M sẽ gần bằng một bộ phân lớp đƣợc huấn luyện bằng một bộ dữ liệu huấn luyện đƣợc xử lý và bóc tách thủ công có số lƣợng bằng số lƣợng ảnh của A1 và C.

Một phần của tài liệu Xây dựng hệ thống tìm kiếm ảnh theo nội dung 9 (Trang 26 - 29)