Hệ thống tốt nhất

Một phần của tài liệu Mạng nơron và ứng dụng mạng nơron trong nhận dạng cảm xúc trên khuôn mặt người (Trang 76)

Tham số Giá trị

Tập dữ liệu Các ảnh mặt kích thước 30x27 điểm ảnh Phương pháp chuẩn hóa đầu vào Phương pháp 2

Phương pháp khởi tạo trọng số Khởi tạo lớp ẩn=0, lớp ra là ngẫu nhiên

Thuật toán huấn luyện Gdm

Hàm kích hoạt Cả 2 lớp đều dùng hàm log-sigmoid

Số nơron dùng trong lớp ẩn 21

Hệ số học 1.5

Hệ số quán tính 0.6

Cần thấy rằng số lượng mẫu trong tập cơ sở dữ liệu huấn luyện không nhiều, việc lấy các mẫu là ngẫu nhiên nên các cảm xúc có cường độ thấp là nguyên nhân khách quan gây nên những khó khăn cho quá trình nhận dạng cảm xúc trên mặt. Với các giá trị trong bảng trên, hệ thống đạt được độ chính xác xấp xỉ 63% (tốt nhất là 65.476%) với độ thiên vị <1 có thể coi là một kết quả chấp nhận được, cho thấy khả năng ứng dụng mạng nơron khi sử dụng để xây dựng hệ thống nhận dạng cảm xúc.

Kết luận

Luận văn tập trung nghiên cứu về mạng nơron và thuật toán lan truyền ngược cùng những cải tiến của nó. Bài toán đặt ra là nhận dạng những cảm xúc trên khuôn mặt người. Hệ thống này có khả năng nhận dạng được 7 dạng cảm xúc như tức giận, kinh tởm, sợ hãi, hạnh phúc, buồn, ngạc nhiên và trạng thái trung lập.

Luận văn đã giới thiệu các cải tiến của thuật toán lan truyền ngược và đồng thời đánh giá các ưu, nhược điểm của từng phương pháp. Trên những cơ sở đó, tôi tiến hành cài đặt chương trình trên Matlab bởi khả năng hỗ trợ xây dựng tốt cho các chương trình được xây dựng bằng mạng nơron, với bộ công cụ Neuron Network đã có sẵn trong chương trình.

Bài toán áp dụng nhằm minh họa những kiến thức nghiên cứu đã trình bày trong 2 chương đầu. Tuy nhiên, để có thể triển khai thực tế cần phải bổ sung thêm những yêu cầu sau:

 Hệ thống cần kết hợp được tách mặt và nhận dạng cảm xúc.

 Hệ thống hỗ trợ được nhiều định dạng ảnh hơn.

 Hệ thống thực hiện phân tích được những chuỗi ảnh, hoặc những đoạn video mô

tả quá trình diễn ra cảm xúc của đối tượng hoặc hướng tới nhận dạng biểu cảm của các đối tượng 3D.

 Hệ thống mới chỉ nhận dạng 7 dạng cảm xúc cơ bản, đồng thời chưa có chế độ

nhận dạng một số dạng cảm xúc hỗn hợp (ví dụ: ngạc nhiên + hạnh phúc hay tức giận + buồn,....)

Tài liệu tham khảo

Tài liệu tiếng Việt

[1] Ngô Quốc Tạo, Lê Thanh Hà, Nguyễn Thị Ngọc Hân (2004), Xác định mặt

người dựa trên mạng nơron, Kỷ yếu hội thảo ““Một số vấn đề chọn lọc của Công

nghệ thông tin và truyền thông”.

Tài liệu tiếng Anh

[2] A. Mehrabian(1968), Communication without Words, Psychology Today, Vol.

2, No. 4, pp. 53-56.

[3] B. Fasel and J. Luettin (2003), Automatic Facial Expression Analysis: A Survey, Pattern Recognition, Vol. 36(1), pp. 259-275.

[4] Dilip Sarkar (1995), Method to Speed Up Error Back-Propagation Learning

Algorithm, ACM Computing Surveys, Vol.27, No.4.

[5] J. McClelland, D. Rumelhart, and G. Hinton (1987), The Appeal of Parallel

Distributed Processing, Vol.1: Foundations, MIT Press, Cambridge, pp. 3-44.

[6] Jun Wang, Lijun Yin, Xiaozhou Wei, Yi Sun (2006) , 3D Facial Expression

Recognition Based on Primitive Surface Feature Distribution, IEEE Computer

Society Conference on Computer Vision and Pattern Recognition – Vol. 2

(CVPR'06), pp. 1399-1406.

[7] H. A. Rowley, S. Baluja, and T. Kanade (1998), Noron network-based face

detection, IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol.

20, No. 1, pp. 23-38.

[8] H.A. Rowley, S. Baluja, and T. Kanade (1998), Rotation invariant neural

network-based face detection, Proceedings of IEEE Conference on Computer

Vision and Pattern Recognition, pp. 38-44.

[9] Karin Sobottka, Ioannis Pitas (1996), Extraction of Facial Regions and Feature

using Color and Shape Information, In Int. Conf. on Pattern Recognition

(ICIP),Vienna, Austria.

[10] Lihui Chen and Christos Grecos (2003), A Fast Skin Colour Detector for Face Extraction, Electronic systems and control division research 2003.

[11] M. Hagan, H. Demuth, and M. Beale (1996), Neural Network Design, PWS Publishing Company, Boston, MA 02116.

[12] Ming-Hsuan Yang, David J. Kriegman, Narendra Ahuja (2002), Detecting

Faces in Images: A Survey, IEEE Transactions on Pattern analysis and machine

intelligence, Vol. 24, No. 1.

[13] M. Pantic, L. Rothkrantz (2000), Automatic Analysis of Facial Expressions:

The State of the Art, IEEE Transactions on Pattern analysis and machine

intelligence, Vol. 22, No. 12.

[14] M.Yeasin, B.Bullot, R.Sharma (2004), From Facial Expression to Level of

Interest: A Spatio-Temporal Approach, IEEE Computer Society Conference on

Computer Vision and Pattern Recognition (CVPR’04)

[15] Oliver Jesorsky, Klaus J. Kirchberg, and Robert W. Frischholz - Robust Face Detection Using the Hausdorff Distance - In Proc. Third International Conference

on Audio- and Video-based Biometric Person Authentication, Springer, Lecture

Notes in Computer Science, LNCS-2091, pp. 90–95, Halmstad, Sweden, 6–8 June

2001.

[16] Rogério Schmidt Feris, Teófilo Emídio de Campos and Roberto Marcondes Cesar Junior – Detection and Tracking of Facial Features in Video Sequences –

Lecture Notes in Artificial Intelligence, vol. 1793, pp. 197-206, April 2000, Springer-Verlag press.

[17] Y. Dai, Y. Shibata, T. Ishii, K. Hashimoto, K. Katamachi, K. Noguchi, N. Kakizaki, D. Cai (2001), An associate memory model of Facial Expressions and its application in Facial expression recognition of patients on bed, IEEE

International Conference on Multimedia and Expo (ICME'01), pp. 151.

Website

Phụ lục

Cơ sở dữ liệu mặt người dùng trong pha nhận dạng biểu cảm: Giận dữ:

Hạnh phúc:

Buồn bã:

Một phần của tài liệu Mạng nơron và ứng dụng mạng nơron trong nhận dạng cảm xúc trên khuôn mặt người (Trang 76)

Tải bản đầy đủ (PDF)

(85 trang)