3. Mạng neural phát hiện khuơn mặt
3.2.2 Chiến thuật huấn luyện mạng học ảnh khơng khuơn mặt
Chiến thuật luyện mạng học ảnh khơng khuơn mặt được xây dựng dựa trên những nhận xét sau đây:
Nếu ta gán cho mỗi ảnh khơng khuơn mặt là một trọng số gọi là giá trị
tương ứng với xác suất một mạng cĩ thể nhận biết nhầm nĩ là ảnh khuơn mặt. Dễ nhận thấy, giá trị của các cửa sổ khơng khuơn mặt là khơng giống nhau. Vì khi tiến hành nhận biết, sẽ cĩ những của sổ bị nhận nhầm là khuơn măt, một số cửa sổ khác sẽ khơng bị nhận nhầm. Rõ ràng trong huấn luyện mạng khơng khuơn mặt, những của sổ ảnh bị nhận nhầm cĩ giá trị cao hơn nhiều so với những của sổ khơng bị nhận nhầm. Và chúng ta sẽ chú ý nhiềuđến những cửa sổ này.
Phương pháp của chúng ta đồng thời được kết hợp với phương pháp phân vùng màu da để giảm khơng gian tìm kiếm. Việc làm này đã làm cho một số củă sổ sẽ khơng bao giờ bị nhận nhầm nếu nĩ khơng phải thuộc vùng màu da. Và giá trị của những của sổ khơng khuơn mặt thuộc vùng màu da là rất cao. Đặc biệt là những cửa sổ chứa một bộ phận nào đĩ của khuơn mặt. Và chúng ta cũng chú ý đến những cửa sổ này.
Hai nhận xét trên khơng phải là đã làm mất hết giá trị của các cửa sổ khơng bị nhận nhầm là cửa sổ khuơn mặt, bởi đây chính là những cửa sổ cĩ nhiệm vụ khởi tạo cho mạng học, những cửa sổ này sẽ giúp cho mạng phân biệt ranh giới giữa ảnh khơng khuơn mặt và ảnh khuơn mặt được rõ ràng hơn. Chính vì vậy chúng ta cũng sẽ lưu tâm đến tập của sổ cĩ tính chất tổng quát này.
Với ba nhận xét trên chúng ta sẽ thực hiện huấn luyện mạng theo phương pháp huấn luyện mạng chủ động cĩ học sau đây:
Bước một: Tạo 100 của sổ là của sổ ngẫu nhiên được lấy từ một số ảnh phong cảnh cây cối nhà của và khơng chứa khuơn măt. Đồng thời tạo thêm 100 ảnh là tập ảnh thuộc vùng màu da như bộ phân trên cơ thể, và các bộ phân trên khuơn mặt.
Bước hai: Tiến hành luyện mạng với bộ dữ liệu này. Lúc này bộ dữ liệu được huấn luyện sẽ bao gồm 200 ảnh khơng khuơn mặt và hai trăm ảnh khuơn mặt. Sau quá trình huấn luyện với một ngưỡng thành cơng nào đĩ (trong đồ án lấy ngưỡng 99% nghĩa là 99% ảnh đầu vào được nhận biết với tính chất của nĩ). Sẽ tiến hành sang bước ba.
Bước ba: Tiến hành nhận biết tập các ảnh được sử dụng để luyện mạng, đây là tập 50 ảnh kích thước 480 * 360 bao gồm ảnh thiên nhiên, ảnh tập thể gia đình, khơng cĩ, cĩ một hay nhiều khuơn mặt. Sau mỗi lần nhận biết, tiến hành cập nhật tất cả các cửa sổ khơng phải khuơn mặt nhưng bị nhận nhầm là khuơn mặt vào cơ sở dữ liệu ảnh khơng khuơn mặt. Sau đĩ chuyển sang bước hai để tiếp tục luyện mạng. Trong quá trình luyện mạng luơn đảm bảo số lượng ảnh khuơn mặt và khơng khuơn mặt là luơn luơn bằng nhau. Quá trình này sẽ lặp đi lặp lại cho đến khi chúng ta đạt được tỉ lệ 1000 ảnh khơng khuơn mặt trong cở sở dữ liệu. Và tỉ lệ thành cơng đạt mức cao nhất. Đến đây chúng ta kết thúc quá trình luyện mạng. Và trong cơ sở dữ liệu sẽ cĩ bộ tham sơ các thơng số mạng. Bộ tham số này sẽ được dùng để tiên hành phân lớp, nhận biết khuơn mặt cho một ảnh màu bất kì.
Chiến thuật trên đã được sủ dụng để luyện mạng trong đồ án, thời gian luyện mạng là khá lâu. Đồng thời đã được tiến hành với số lượng nút ẩn khác nhau với mong muơn tìm ra một con số phù hợp nhất. Cuối cùng, số lượng nút ẩn đựoc chọn là 16 nút ẩn.
Ảnh minh họa dưới đây cĩ thể cho chúng ta thấy quá trình huấn luyện chủ động ảnh khơng khuơn mặt: