Môi trƣờng cài đặt và kết quả cài đặt thử nghiệm

Một phần của tài liệu (LUẬN văn THẠC sĩ) nghiên cứu nhận dạng khuôn mặt và ứng dụng trong giám sát tự động (Trang 62 - 70)

5. Ý nghĩa khoa học và thực tiễn của đề tài

3.3. Môi trƣờng cài đặt và kết quả cài đặt thử nghiệm

Môi trƣờng cài đặt:

Luận văn cài đặt thuật toán nhận diện khuôn mặt với môi trƣờng cài đặt nhƣ sau: CPU: i7. 2.2GHz RAM: 8GB Ổ cứng: HDD 500GB Hệ điều hành: Windows 10 Ngôn ngƣ lập trình: C/C++

Môi trƣờng phát triển: Microsoft visual studio Thƣ viện hỗ trợ: OpenCV 3.0, Tensorflow

Một số kết quả chƣơng trình thực nghiệm:

Hình 3.2 mô tả giao diện chính bắt đầu của chƣơng trình, hình 3.3 minh họa phát hiện và nhận dạng khuôn mặt, hình 3.4 thể hiện trích xuất và nhận

55

dạng khuôn mặt, điều kiện thu nhận có thay đối nhỏ, khuôn mặt chính diện.

56

Hình 3. 3. Phát hiện khuôn mặt và định danh.

Trong hình 3.3 chƣơng trình thử nghiệm phát hiện và nhận dạng trên đăc trƣng HOG và mô hình mạng DCNN, thuật toán nhận dạng tốt cho dữ liệu khuôn mặt chính diện, nền thay đổi ít, có thể bị che khuất ít do dùng đặc trƣng cục bộ HOG trƣớc khi đƣa vào huấn luyện mạng DCNN.

Hình 3.4 minh họa nhận dạng khuôn mặt trên ảnh gồm 2 khuôn mặt, khuôn mặt sau không đƣợc nhận dạng vì không có định danh trong cơ sở dữ liệu đƣợc xác định ban đầu. Do chƣơng trình thực nghiệm nhằm mục đích điểm danh tự động giám sát tự động, nên dữ liệu cũng mục tiêu cho điểm danh tự động.

57

Hình 3.4 Định danh khuôn mặt trong trong hai khuôn mặt

Qua quá trình thử nghiệm trên dữ liệu khuôn mặt ngƣời Lào, kết quả nhận dạng chính xác hơn, do đặc trƣng của ngƣời Lào là khuôn mặt góc cạnh hơn ngƣời Việt Nam, đặc trƣng hƣớng gradient thể hiện rõ nét hơn. Thời gian thực hiện thuật toán nhanh (thời gian thực).

3.4. Đánh giá thực nghiệm

Kết quả xác định và nhận dạng khuôn mặt ứng dụng mô hình CNN đạt đƣợc kết quả chính xác cao. Chƣơng trình thực nghiệm phát hiện nhanh chóng và chính xác hầu hết tất cả các khuôn mặt ngƣời Lào trong cơ sở dữ liệu thu thập. Độ chính xác xấp xỉ 97% với khuôn mặt chính diện, nền thay đổi ít. Một số trƣờng hợp không nhận dạng đƣợc khi khuôn mặt cuối đầu bị

58 che khuất quá 2/3.

Tuy nhiên khi ứng dụng với đối tƣợng live video từ webcam, vẫn xảy ra độ trễ khi đối tƣợng xoay và di chuyển cũng nhƣ không để khuôn mặt ở chính giữa khung hình làm ảnh hƣởng độ chính xác của kết quả nhận dạng.

Hoặc trong trƣờng hợp khi khuôn mặt bị che khuất bởi các đối tƣợng khác khoảng 2/3 phần khuôn mặt thì chƣơng trình thực nghiệm không thể phát hiện ra khuôn mặt và không thể định danh.

3.5. Kết luận chƣơng 3

Trong chƣơng này, luận văn đã tiến hành cài đặt thử nghiệm sử dụng HOG và mô hình học sâu dựa trên CNN đƣợc trình bày trong chƣơng hai nhằm giải quyết bài toán phát hiện và nhận dạng mặt ngƣời trong ảnh đầu vào. Kết quả đánh giá đạt đƣợc là sự thành công từ ý tƣởng và áp dụng các mô hình, kỹ thuật đã đề ra. Độ chính xác nằm ở mức tƣơng đối cao đối với tập dữ liệu không quá lớn. Cần phải nghiên cứu và phát triển hơn về độ chính xác trong thời gian thực khi gặp những trƣờng hợp ngoại cảnh không mong muốn.

59

KẾT LUẬN

1. Nội dung nghiên cứu và kết quả đạt đƣợc của luận văn

Bài toán phát hiện và nhận dạng khuôn mặt ngƣời đã đƣợc đặt ra từ lâu và đi cùng nó là hàng loạt các nghiên cứu và đề tài đƣợc xác lập, các ứng dụng đƣợc triển khai. Bài toán luôn đặt ra nhiều thách thức vì những khó khăn của nó. Các khó khăn chứng tỏ rằng bất cứ phƣơng pháp nào giải quyết bài toán sẽ không thể tránh khỏi một số khiếm khuyết nhất định. Mỗi hƣớng tiếp cận đƣợc đƣa ra đều đã đạt đƣợc những thành quả nhất định, hƣớng nào cũng có những thành công, những hạn chế. Vì bài toán này là bài toán không có lời giải tối ƣu cho mọi trƣờng hợp. Tuy nhiên, do tính cấp thiết từ yêu cầu của thực tế mà đây luôn là một đề tài hấp dẫn các nhà khoa học, các chuyên gia nghiên cứu và ứng dụng.

Trong nội dung nghiên cứu đề tài “Nghiên cứu nhận dạng mặt và ứng dụng trong giám sát tự động” bản thân đã tìm hiểu các thuật toán, mô hình xử

lý và dự báo chuỗi thời gian, cũng nhƣ áp dụng các mô hình này để giải quyết bài toán đặt ra. Qua nghiên cứu, những kết quả chính mà luận văn đã đạt đƣợc nhƣ sau:

- Khái quát về ảnh số và các kỹ thuật xử lý ảnh số cũng nhƣ video. - Trình bày một số kỹ thuật và mô hình đƣợc sử dụng để giải quyết bài toán là mô tả đặc trƣng mạng nơ ron tích chập sâu CNN.

- Cài đặt thử nghiệm thuật toán trích chọn đặc trƣng khuôn mặt HOG và mô hình DCNN để phát hiện và nhận dạng mặt ngƣời với dữ liệu đầu vào là tập ảnh huấn luyện 100 ngƣời cùng đầu vào cần xác định khuôn mặt là ảnh/ video/ live video từ webcam. Kết quả thực nghiệm cho thấy kỹ thuật phát hiện và nhận dạng khuôn mặt khá hiệu quả trong trƣờng hợp khuôn mặt chính diện, nền thay đổi, sự che khuất ít, đặc biệt chính xác gần trên 97% cho khuôn mặt ngƣời Lào.

60

2. Kiến nghị và hƣớng nghiên cứu tiếp theo

Phát hiện và nhận dạng mặt ngƣời, đặc biệt là xử lý trong thời gian thực đã và tiếp tục là một bài toán đƣợc nhiều nhà nghiên cứu và cộng đồng quan tâm với nhiều ứng dụng to lớn, có tầm quan trọng không chỉ trong khoa học mà còn trong thực tiễn.

Tiếp tục phát triển để tăng tốc độ phát hiện và định danh khuôn mặt, cũng nhƣ theo dõi và phát hiện đƣợc khuôn mặt khi khuôn mặt di chuyển hoặc bị che khuất bởi các đối tƣợng khác

Với những hạn chế khó khăn còn gặp trong quá trình phát triển, giải quyết bài toán, hƣớng nghiên cứu tiếp theo của luận văn sẽ là tiếp tục đào sâu hơn vào các mô hình học máy, học sâu, song song với phiên tiền xử lý dữ liệu để nâng cao hiệu suất và đầu ra của bài toán.

61

DANH MỤC TÀI LIỆU THAM KHẢO

[1] N.Q. Anh, N.H. Dũng / Tạp chí Khoa học ĐHQGHN: Khoa học Tự nhiên và Công nghệ, Tập 33, Số 1 (2017)

[2] Linda G. Shapiro and George C. Stockman (2001), Computer Vision. Prentice Hall.

[3] Tim Morris (2004), Computer Vision and Image Processing. Palgrave Macmillan.

[4] Bernd Jähne and Horst Haußecker (2000). Computer Vision and Applications, A Guide for Students and Practitioners. Academic Press.

[5] Milan Sonka, Vaclav Hlavac and Roger Boyle (2008). Image Processing, Analysis, and Machine Vision. Thomson.

[6] David A. Forsyth and Jean Ponce (2003). Computer Vision, A Modern Approach. Prentice Hall.

[7] Dana H. Ballard and Christopher M. Brown (1982). Computer Vision. Prentice Hall.

[8] Barghout, Lauren, and Jacob Sheynin (2013). Real-world scene perception and perceptual organization: Lessons from Computer Vision. Journal of Vision 13.9.

[9]http://www.psych.utoronto.ca/users/reingold/courses/ai/cache/neural4.html, (2019)

[10] Md Zahangir Alom, Tarek M. Taha, Christopher Yakopcic, Stefan Westberg, Paheding Sidike, Mst Shamima Nasrin, Brian C Van Esesn, Abdul A S. Awwal, Vijayan K. Asari. The History Began from AlexNet (2018), A Comprehensive Survey on Deep Learning Approaches.

62

[12] D. H. Hubel and T. N. Wiesel. Receptive fields of single neurones in the cat's

striate cortex. URL:

https://www.ncbi.nlm.nih.gov/pmc/articles/PMC1363130/ (1959)

[13] Y. Lecun, L. Bottou, Y. Bengio, P. Haffner (1998). Gradient-based learning applied to document recognition.

[14] Reinhard Klette (2014). Concise Computer Vision. Springer.

[15] URL: http://disp.ee.ntu.edu.tw/tutorial/NeuralNetwork.docx, (2019) [16] URL: https://trantheanh.github.io/2016/10/18/ML-07/, (2019)

[17] URL: https://towardsdatascience.com/activation-functions-neural- networks1cbd9f8d91d6, (2019)

[18] Chen, Jun-Cheng & Ranjan, Rajeev & Sankar, Swami & Kumar, Amit & Chen, Ching-Hui & Patel, Vishal & D. Castillo, Carlos & Chellappa, Rama (2016). An End-toEnd System for Unconstrained Face Verifcation with Deep Convolutional Neural Networks.

[19] AbdAlmageed, W., Wu, Y., Rawls, S., Harel, S., Hassne, T., Masi, I., Choi, J., Lekust, J., Kim, J., Natarajana, P., Nevatia, R., Medioni, G (2016), Face recognition using deep multi-pose representations. In: IEEE Winter Conference on Applications of Computer Vision (WACV).

[20] URL: https://ereka.vn/post/chia-se-ve-mang-noron-tich-chap- convolutionalneural-networks-or-convnets-52790224348847566, (2019) [21] Krizhevsky, A., Sutskever, I., & Hinton, G. E (2012). Imagenet classification

with deep convolutional neural networks. In Advances in neural information processing systems.

Một phần của tài liệu (LUẬN văn THẠC sĩ) nghiên cứu nhận dạng khuôn mặt và ứng dụng trong giám sát tự động (Trang 62 - 70)

Tải bản đầy đủ (PDF)

(70 trang)