.Sử dụng HaarCascade để nhận diện khuôn mặt

Một phần của tài liệu (TIỂU LUẬN) bài tập lớn THỊ GIÁC máy TÍNH ỨNG DỤNG THỊ GIÁC máy TÍNH TRONG NHẬN DIỆN nụ cười (Trang 25)

Trước khi nhận diện được nụ cười thì cần nhận diện khn mặt. Nhóm chọn thuật tốn Haar Cascade vì đây là thuật tốn được đề xuất rất nhiều trong những bài tốn nhận diện khn mặt và có mã nguồn mở được hỗ trở bởi OpenCV [12].

Thuật toán sử dụng đặc trưng Haar là loại đặc trưng của ảnh nhưng khơng chiếm tồn bộ mà chỉ chiếm một phần trong bức ảnh. Vì có thể có rất nhiều bộ lọc Haar trên cùng một bức ảnh nên có thể kết hợp nhiều bộ lọc với nhau tạo thành nhiều lượt Cascade chồng lên nhau để có thể nhận diện được nhiều đặc trưng cùng một lúc.

Chi tiết hơn về Haar Cascade sẽ khơng được trình bày trong bài báo cáo này, nhưng hiểu đơn giản là các bộ lọc Haar sẽ quét khung ảnh vài lần để tìm xem có đặc trưng nào trong 6000+ đặc trưng đã được xác định sẵn để nhận diện khn mặt [13]. Vùng nào có chứa khn mặt sẽ được khoanh vùng, những vùng khác sẽ được lướt qua và quên đi.

Thị giác máy tính 20211 2. Chạy thử với mạng Le-Net

Hình 24: Kết quả demo LeNet

3. Chạy thử với mạng BK-Net

Hình 25: Kết quả demo BKNet

VII. Kết luận

Mơ hình Le-Net khá phù hợp với bài tốn nhóm đặt ra. Kết quả chạy thử khá chính xác, khoảng 90%. Mạng Le-Net là một mạng đơn giản cùng với lượng dữ liệu khơng lớn (13000 ảnh) rất khó cho kết quả tốt hơn 90%.

Mơ hình BK-Net đã có những kết quả tốt hơn…

Kết quả đạt được của Bài tập lớn lần này có sự tham gia rất tích cực của tất cả thành viên trong nhóm, mỗi người đều có ý thức chủ động hồn thành cơng việc và hỗ trợ những thành viên khác.

Tuy nhiên, có một số khó khăn nhóm gặp phải trong q trình thực hiện Bài tập lớn:

nhất.

Do tình hình dịch bệnh Covid19 nên nhóm gặp khó khăn trong việc trao đổi giữa các thành viên dẫn đến tiến độ có chậm hơn mong muốn những vẫn kịp hoàn thành.

VIII. Tài liệu tham khảo

[1] Link open source Le-Net: https://github.com/meng1994412/Smile_Detection [2] Link tải data: https://data.vision.ee.ethz.ch/cvl/rrothe/imdb-wiki/?

fbclid=IwAR0mjNhPRvA5yXii1HFmetECzrjbeqHEWLQWkg3RsTiquLnI GF39d xnPeLE

[3] Y. Le Cun, B. Boser, J. S. Denker, D. Henderson, R. E. Howard, W. Hubbard, and L. D. Jackel. Backpropagation Applied to Handwritten Zip Code Recognition. AT&T Bell Laboratories, Holmdel, NJ 07733 USA, NIPS ,1989.

[4] Lịch sử mạng CNN: https://dlapplications.github.io/2018-07-06-CNN/ [5] 3 mạng Lenet: https://sh-tsang.medium.com/paper-brief-review-of-lenet-1- lenet-4-lenet-5-boosted-lenet-4-image-classification-1f5f809dbf17 [6] Random-state: https://stackoverflow.com/questions/28064634/random-state- pseudo-random-number-in-scikit-learn [7] Keras-Tensorlow: https://viblo.asia/p/lam-quen-voi-keras-gGJ59mxJ5X2 [8] Các hàm kích hoạt: https://aicurious.io/posts/2019-09-23-cac-ham-kich- hoat- activation-function-trong-neural-networks/ [9] Softmax: https://machinelearningcoban.com/2017/02/17/softmax [10] Adam: https://viblo.asia/p/thuat-toan-toi-uu-adam-aWj53k8Q56m [11] Validation: https://machinelearningcoban.com/2017/08/31/evaluation/#- truefalse-positivenegative

[12] Opensource Haar Cascade:

https://github.com/opencv/opencv/tree/master/data/haarcascades

[13] Chi tiết Haar Cascade:

Một phần của tài liệu (TIỂU LUẬN) bài tập lớn THỊ GIÁC máy TÍNH ỨNG DỤNG THỊ GIÁC máy TÍNH TRONG NHẬN DIỆN nụ cười (Trang 25)

Tải bản đầy đủ (DOCX)

(27 trang)
w