SSDBSCAN.
Thuật toán được dùng để thử nghiệm cho việc phân cụm ảnh mặt người cho hai bộ dữ liệu CK+ và ITI là MCSSDBS và thuật toán phân cụm bán giám sát SSDBSCAN.
và các giá trị nhãn được sinh ngẫu nhiên từ tập dữ liệu theo các thông tin có được từ các nhãn tương ứng. Kết quả của thực nghiệm được minh họa trên hình 3.3 và 3.4.
Chúng ta có thể thấy rằng kết quả phân cụm tốt nhất cho tệp CK+ đạt được là 97%, khi sử dụng 25 nhãn lớp và 400 ràng buộc. Kết quả tốt nhất cho tập dữ liệu ITI là 87%. Các kết quả này cho thấy là tương đối tốt nhất là tập dữ liệu CK+.
Các kết quả trên cũng cho thấy thuật toán MCSSDBS cho kết quả tốt nhất đặc biệt là trong trường hợp chỉ sử dụng một loại must-link.
Với kết quả này chúng ta hoàn toàn có thể áp dụng vào các bài toán thực tế như phân loại cảm xúc online, tương tác người-máy tính. Chúng ta cũng thấy rằng kết quả phân cụm còn phụ thuộc vào các yếu tố khác như tiền xử lý dữ liệu, xây dựng tập ảnh, trích chọn đặc trưng,…
Hình 3.4. Kết quả thực nghiệm cho tập dữ liệu ITI 3.2.3 Kết quả thực nghiệm với thuật toán K-Means và Seed K-Means
Với thuật toán K-Means, chỉ có một kết quả duy nhất là kết quả phân cụm. Do thuật toán K-Means thường phụ thuộc vào quá trình chọn các trọng tâm ở bước đầu tiên. Chúng tôi thực hiện 20 lần chạy K-Means và tính giá trị kết quả trung bình. K-Means đạt được 67.6% giá trị RI sau 50 lần chạy.
Hình 3.5 và hình 3.6 trình bày kết quả thực hiện phân cụm ảnh với thuật toán Seed K-Means cho hai tập dữ liệu CK+ và tập dữ liệu ITI. Kết quả phân cụm cho thấy với một lượng dữ liệu gán nhãn đã cung cấp, chất lượng phân cụm không cải thiện được nhiều. Điều này có thể lý giải về việc phân bố các điểm trong tập dữ liệu là có hình dạng không phải hình cầu vì chất lượng phân cụm khi sử dụng thuật toán SSDBSCAN và MCSSDBS là cao hơn hẳn.
Hình 3.5 Kết quả phân loại trạng thái cảm xúc khuôn mặt bằng phương pháp Seed K-Means
3.3. Kết luận
Nội dung chương 3 nhằm tiến hành thực nghiệm xây dựng chương trình và đánh giá kết quả. Với các kết quả thử nghiệm trên, mặc dù chưa nhiều nhưng đã đạt được những nghiên cứu ban đầu về việc phân loại ảnh trạng thái cảm xúc khuôn mặt. Với tập dữ liệu ảnh trạng thái cảm xúc khuôn mặt, chúng tôi sử dụng hai tập dữ liệu là CK2 và ITI, các thuật toán phân cụm bán giám sát sử dụng là SSDBSCAN, MCSSDBS, Seed K-Means và K-Means. Kết quả thực nghiệm cho thấy chất lượng của quá trình phân lớp là tốt điều đó khẳng định quy trình sử dụng thuật toán Gabor trong trích chọn đặc trưng là đúng đắn và phù hợp. Với các thuật toán phân cụm bán giám sát, chất lượng phân cụm là tốt hơn hẳn vì đã có thêm các thông tin bổ trợ trong quá trình phân cụm. Để tiến tới hoàn thiện hơn nữa chúng ta cần thêm nhiều thực nghiệm với các tập dữ liệu khác, các thuật toán khác (chẳng hạn thuật toán học có giám sát), để tiếp tục hoàn thiện nghiên cứu của mình.
KẾT LUẬN
Những kết quả đã đạt được
Sau khi thực hiện luận văn với chủ đề nghiên cứu về lĩnh vực trích chọn đặc trưng và ứng dụng cho bài toán phân loại trạng thái cảm xúc khuôn mặt tôi đã thu được các kết quả sau đây:
- Hiểu tổng quan về lĩnh vực xử lý ảnh và các bài toán ứng dụng trong xử lý ảnh. Đây là một hướng nghiên cứu có nhiều ứng dụng trong thực tế nhất là trong thời đại công nghiệp 4.0, hàng ngày có hàng tỷ bức ảnh và video được đưa lên mạng và vấn đề là sử dụng (khai phá) những dữ liệu này như thế nào trong thực tế là một vấn đề quan trọng.
- Đã nghiên cứu và hiểu được phương pháp trích chọn đặc trưng trên ảnh, cụ thể là ba phương pháp cơ bản gồm Gabor, HoG và LBP. Mỗi phương pháp có ưu điểm và nhược điểm riêng nhưng bản chất của chúng là tìm ra các đặc trưng nhất trong bề mặt ảnh giúp cho các công đoạn nhận dạng, phân loại ở các pha sau được chính xác hơn.
- Nghiên cứu ứng dụng kết quả của bài toán trích chọn đặc trưng cho việc sử dụng các thuật toán học máy. Tác giả cũng đã nắm bắt và tìm hiểu các mô hình học máy như học không giám sát, học bán giám sát và học có giám sát.
- Đã thực hiện thử nghiệm một số kết quả sử dụng phương pháp học bán giám sát (SSDBSCAN, MCSSGC, Seed K-Means) và phương pháp học không giám sát (K-Means). Các kết quả đạt được cho thấy có thể áp dụng các thuật toán này vào các ứng dụng thực tế triển khai.
Hướng phát triển tiếp theo của đề tài
Do thời gian và kiến thức còn hạn chế, trong khuôn khổ của luận văn tôi không thể nghiên cứu kỹ và toàn diện bài toán trích chọn đặc trưng trên ảnh.
Trong tương lai, một số hướng nghiên cứu mà tôi dự kiến tiếp tục như sau: - Tiếp tục nghiên cứu và tìm hiểu về lĩnh vực xử lý ảnh, các phương pháp trích chọn đặc trưng khác, phân tích ưu nhược điểm của chúng.
- Nghiên cứu ứng dụng cho bài toán nhận dạng, phân loại trạng thái cảm xúc khuôn mặt. Các tập dữ liệu lớn hơn, các thuật toán khác của học máy cần được tiếp tục thử nghiệm và đánh giá để có cái nhìn toàn diện hơn về các kết quả đạt được.
TÀI LIỆU THAM KHẢO
Tiếng Việt:
[1]. Trịnh Tấn Đạt, Phạm Thế Bảo (2013), "Đặc trưng Gabor kết hợp với AdaBoost và K-Means trong bài toán nhận dạng mặt người", Tạp chí Khoa học Đại học Sư phạm Thành phố Hồ Chí Minh.
[2]. Hồ Đức Lĩnh, Huỳnh Hữu Hưng (2015), "Nhận dạng trái bưởi bằng sóng Gabor, ma trận đồng hiện mức xám Co-occurrence và thuật toán k-NN", Tạp chí khoa học, Đại học Đông Á.
[3]. Trương Quốc Bảo, Trương Hùng Chen, Trương Quốc Định (2015), "Phát hiện và nhận dạng biển báo giao thông đường bộ sử dụng đặc trưng HoG và mạng Nơ ron nhân tạo", Tạp chí khoa học Trường Đại học Cần Thơ.
Tiếng Anh:
[4]. Ali Mollahosseini, Behzad Hassani, Michelle J. Salvador, Hojjat Abdollahi, David Chan, Mohammad H. Mahoor, “Facial Expression Recognition from World Wild Web”. In Computer Vision and Pattern Recognition Workshops, pp. 1509-1516, 2016.
[5]. Mark S. Nixon, Alberto S. Aguado, "Feature extraction and Image processing", Academic Press, 2008.
[6]. Bo Yang, Songcan Chen, A comparative study on local binary pattern (LBP) based face recognition: LBP histogram versus LBP image. Neurocomputing 120: 365-379 (2013).
[7]. Chengjun Liu, Harry Wechsler: Gabor feature based classification using the enhanced fisher linear discriminant model for face recognition. IEEE Trans. Image Processing 11(4): 467-476, 2002.
[8]. Mohammad Haghighat, Saman A. Zonouz, Mohamed Abdel-Mottaleb, CloudID: Trustworthy cloud-based and cross-enterprise biometric identification. Expert Syst. Appl. 42(21): 7905-7916 (2015).
[9]. Vũ Việt Vũ, Đỗ Hồng Quân, 2017, Density-based clustering with side information and active learning. In proceeding of International Conference on Knowledge and Systems Engineering, pp. 174-179. [10]. Vũ Việt Vũ, 2018, An efficient Semi-supervised Graph-based clustering,
Intelligent Data Analysis, Volume 22(2), ISSN: 1571-4128, pp. 297- 307.
[11]. Levi Lelis, Jörg Sander: Semi-supervised Density-Based Clustering. ICDM : 842-847, 2009.
[12]. Martin Ester, Hans-Peter Kriegel, Jörg Sander, Xiaowei Xu: A Density- Based Algorithm for Discovering Clusters in Large Spatial Databases with Noise. KDD, 1996.
[13]. S. Basu, I. Davidson, and K. L. Wagstaff, Constrained Clustering: Advances in Algorithms, Theory, and Applications, Chapman and Hall/CRC Data Mining and Knowledge Discovery Series, 1st edn., 2008. [14] Anil K. Jain: Data clustering: 50 years beyond K-means. Pattern
Recognition Letters (PRL) 31(8):651-666 (2010).
[15]. Sugato Basu, Arindam Banerjee, Raymond J. Mooney, Semi-supervised Clustering by Seeding. In proceeding of International Conference on Machine Learning, 2002.
[16]. Yann LeCun, Yoshua Bengio, Geoffrey E. Hinton: Deep learning. Nature 521(7553): 436-444 (2015).
[17]. Taher Khadhraoui, Faouzi Benzarti, Hamid Amiri: Gabor-feature-based local generic representation for face recognition with single sample per
[18]. Atreyee Sinha, Sugata Banerji, Chengjun Liu: New color GPHOG descriptors for object and scene image classification. Mach. Vis. Appl. 25(2): 361-375 (2014)
[19]. Nabila Mansouri, Yousra Ben Jemaa, Eric Watelain: Optimized HOG Descriptor for on Road Cars Detection. ICDSC 2016: 166-171
[20]. Li Liu, Paul W. Fieguth, Yulan Guo, Xiaogang Wang, Matti Pietikäinen: Local binary features for texture classification: Taxonomy and experimental study. Pattern Recognition 62: 135-160 (2017).
[21]. Ze Lu, Xudong Jiang, Alex C. Kot: A novel LBP-based Color descriptor for face recognition. ICASSP 2017: 1857-1861.
[22]. T. Ojala, M. Pietikäinen, and D. Harwood (1996), "A Comparative Study of Texture Measures with Classification Based on Feature Distributions", Pattern Recognition, vol. 29, pp. 51-59
[23]. https://www.quora.com/How-does-features-extraction-on-images-work
[24]. http://www.pitt.edu/~emotion/ck-spread.htm