Tham số Giá trị
Tập dữ liệu Các ảnh mặt kích thước 30x27 điểm ảnh Phương pháp chuẩn hóa đầu vào Phương pháp 2
Phương pháp khởi tạo trọng số Khởi tạo lớp ẩn=0, lớp ra là ngẫu nhiên
Thuật toán huấn luyện Gdm
Hàm kích hoạt Cả 2 lớp đều dùng hàm log-sigmoid
Số nơron dùng trong lớp ẩn 21
Hệ số học 1.5
Hệ số quán tính 0.6
Cần thấy rằng số lượng mẫu trong tập cơ sở dữ liệu huấn luyện không nhiều, việc lấy các mẫu là ngẫu nhiên nên các cảm xúc có cường độ thấp là nguyên nhân khách quan gây nên những khó khăn cho quá trình nhận dạng cảm xúc trên mặt. Với các giá trị trong bảng trên, hệ thống đạt được độ chính xác xấp xỉ 63% (tốt nhất là 65.476%) với độ thiên vị <1 có thể coi là một kết quả chấp nhận được, cho thấy khả năng ứng dụng mạng nơron khi sử dụng để xây dựng hệ thống nhận dạng cảm xúc.
Kết luận
Luận văn tập trung nghiên cứu về mạng nơron và thuật toán lan truyền ngược cùng những cải tiến của nó. Bài toán đặt ra là nhận dạng những cảm xúc trên khuôn mặt người. Hệ thống này có khả năng nhận dạng được 7 dạng cảm xúc như tức giận, kinh tởm, sợ hãi, hạnh phúc, buồn, ngạc nhiên và trạng thái trung lập.
Luận văn đã giới thiệu các cải tiến của thuật toán lan truyền ngược và đồng thời đánh giá các ưu, nhược điểm của từng phương pháp. Trên những cơ sở đó, tôi tiến hành cài đặt chương trình trên Matlab bởi khả năng hỗ trợ xây dựng tốt cho các chương trình được xây dựng bằng mạng nơron, với bộ công cụ Neuron Network đã có sẵn trong chương trình.
Bài toán áp dụng nhằm minh họa những kiến thức nghiên cứu đã trình bày trong 2 chương đầu. Tuy nhiên, để có thể triển khai thực tế cần phải bổ sung thêm những yêu cầu sau:
Hệ thống cần kết hợp được tách mặt và nhận dạng cảm xúc.
Hệ thống hỗ trợ được nhiều định dạng ảnh hơn.
Hệ thống thực hiện phân tích được những chuỗi ảnh, hoặc những đoạn video mô
tả quá trình diễn ra cảm xúc của đối tượng hoặc hướng tới nhận dạng biểu cảm của các đối tượng 3D.
Hệ thống mới chỉ nhận dạng 7 dạng cảm xúc cơ bản, đồng thời chưa có chế độ
nhận dạng một số dạng cảm xúc hỗn hợp (ví dụ: ngạc nhiên + hạnh phúc hay tức giận + buồn,....)
Tài liệu tham khảo
Tài liệu tiếng Việt
[1] Ngô Quốc Tạo, Lê Thanh Hà, Nguyễn Thị Ngọc Hân (2004), Xác định mặt
người dựa trên mạng nơron, Kỷ yếu hội thảo ““Một số vấn đề chọn lọc của Công
nghệ thông tin và truyền thông”.
Tài liệu tiếng Anh
[2] A. Mehrabian(1968), Communication without Words, Psychology Today, Vol.
2, No. 4, pp. 53-56.
[3] B. Fasel and J. Luettin (2003), Automatic Facial Expression Analysis: A Survey, Pattern Recognition, Vol. 36(1), pp. 259-275.
[4] Dilip Sarkar (1995), Method to Speed Up Error Back-Propagation Learning
Algorithm, ACM Computing Surveys, Vol.27, No.4.
[5] J. McClelland, D. Rumelhart, and G. Hinton (1987), The Appeal of Parallel
Distributed Processing, Vol.1: Foundations, MIT Press, Cambridge, pp. 3-44.
[6] Jun Wang, Lijun Yin, Xiaozhou Wei, Yi Sun (2006) , 3D Facial Expression
Recognition Based on Primitive Surface Feature Distribution, IEEE Computer
Society Conference on Computer Vision and Pattern Recognition – Vol. 2
(CVPR'06), pp. 1399-1406.
[7] H. A. Rowley, S. Baluja, and T. Kanade (1998), Noron network-based face
detection, IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol.
20, No. 1, pp. 23-38.
[8] H.A. Rowley, S. Baluja, and T. Kanade (1998), Rotation invariant neural
network-based face detection, Proceedings of IEEE Conference on Computer
Vision and Pattern Recognition, pp. 38-44.
[9] Karin Sobottka, Ioannis Pitas (1996), Extraction of Facial Regions and Feature
using Color and Shape Information, In Int. Conf. on Pattern Recognition
(ICIP),Vienna, Austria.
[10] Lihui Chen and Christos Grecos (2003), A Fast Skin Colour Detector for Face Extraction, Electronic systems and control division research 2003.
[11] M. Hagan, H. Demuth, and M. Beale (1996), Neural Network Design, PWS Publishing Company, Boston, MA 02116.
[12] Ming-Hsuan Yang, David J. Kriegman, Narendra Ahuja (2002), Detecting
Faces in Images: A Survey, IEEE Transactions on Pattern analysis and machine
intelligence, Vol. 24, No. 1.
[13] M. Pantic, L. Rothkrantz (2000), Automatic Analysis of Facial Expressions:
The State of the Art, IEEE Transactions on Pattern analysis and machine
intelligence, Vol. 22, No. 12.
[14] M.Yeasin, B.Bullot, R.Sharma (2004), From Facial Expression to Level of
Interest: A Spatio-Temporal Approach, IEEE Computer Society Conference on
Computer Vision and Pattern Recognition (CVPR’04)
[15] Oliver Jesorsky, Klaus J. Kirchberg, and Robert W. Frischholz - Robust Face Detection Using the Hausdorff Distance - In Proc. Third International Conference
on Audio- and Video-based Biometric Person Authentication, Springer, Lecture
Notes in Computer Science, LNCS-2091, pp. 90–95, Halmstad, Sweden, 6–8 June
2001.
[16] Rogério Schmidt Feris, Teófilo Emídio de Campos and Roberto Marcondes Cesar Junior – Detection and Tracking of Facial Features in Video Sequences –
Lecture Notes in Artificial Intelligence, vol. 1793, pp. 197-206, April 2000, Springer-Verlag press.
[17] Y. Dai, Y. Shibata, T. Ishii, K. Hashimoto, K. Katamachi, K. Noguchi, N. Kakizaki, D. Cai (2001), An associate memory model of Facial Expressions and its application in Facial expression recognition of patients on bed, IEEE
International Conference on Multimedia and Expo (ICME'01), pp. 151.
Website
Phụ lục
Cơ sở dữ liệu mặt người dùng trong pha nhận dạng biểu cảm: Giận dữ:
Hạnh phúc:
Buồn bã: