ỨNG DỤNG COMPUTER VISION TRONG NHẬN điện NGƯỜI ĐEO KHẨU TRANG nơi CÔNG CỘNG

lOMoARcPSD|11598335 HỌC VIỆN NGÂN HÀNG KHOA HỆ QUẢN TRỊ KINH DOANH BÀI TẬP NHĨM HỌC PHẦN: TRÍ TUỆ NHÂN TẠO TRONG KINH DOANH ĐỀ TÀI: ỨNG DỤNG COMPUTER VISION TRONG NHẬN ĐIỆN NGƯỜI ĐEO KHẨU TRANG NƠI CƠNG CỘNG Nhóm tín : 211IS42A05 Giảng viên hướng dẫn : Ths Triệu Thu Hương lOMoARcPSD|11598335 Hà Nội, ngày 15 tháng năm 2022 Danh sách thành viên nhóm: Họ tên Mã sinh viên Lương Bích Nguyệt 23A40304 07 Nguyễn Anh Tuấn 23A40303 74 Đàm Thị Hồng Ánh 23A40300 44 Phụ trách % lOMoARcPSD|11598335 MỤC LỤC I Đặt vấn đề 1.1 Lí chọn chủ đề 1.2 Nội dung thuật toán Ⅱ Mô tả liệu .5 Ⅲ Giới thiệu tổng quan thuật toán sử dụng IV Chương trình AI nhận diện người đeo trang 4.1.Upload data lên My Drive 4.2 Xây dựng model đánh giá kết chạy 4.3 Model : CNN, Dense 11 4.4 Model 3: sử dụng thuật toán Adam 13 V Sử dụng mơ hình .15 Ⅵ NHẬN XÉT 18 6.1 Nhận xét độ xác thuật tốn 18 6.2 Ưu, nhược điểm toán nhận diện 18 lOMoARcPSD|11598335 VII KẾT LUẬN CHUNG 19 I Đặt vấn đề 1.1 Lí chọn chủ đề Dịch bệnh Covid-19 xuất gần năm qua gây tổn thất cho đất nước, cho xã hội Kinh tế bị thiệt hại nặng nề, thu ngân sách giảm, nạn thất nghiệp tăng; dịch vụ, kinh doanh khác thu nhập,…dịch bệnh ảnh hưởng tiêu cực đến sức khỏe, tính mạng Nhân dân an ninh, trật tự xã hội Trong thời gian qua, MTTQ Việt Nam, ban, ngành, địa phương, đồng lòng Nhân dân thực liệt, đồng bộ, có hiệu biện pháp phòng, chống dịch Covid-19 theo đạo Ban đạo cấp Việc đeo trang hay tiếp xúc với người khác biện pháp hữu dụng y tế đề nhằm giảm khả lây lan dịch bệnh phần kiểm soát ca mắc ngày Trong thời đại công nghệ thông tin phát triển cách mạnh mẽ nhanh chóng, việc áp dụng cơng nghệ thông tin vào lĩnh vực sống điều cần thiết giúp người tiết kiệm thời gian, xử lí cơng việc cách nhanh chóng hiệu quả, nhóm chúng em xây dựng mơ hình có khả nhận diện khuôn mặt người đeo trang Hi vọng phần mềm nhận diện đeo trang giúp ích cho ngành y tế, hỗ trợ người phần sức lực lOMoARcPSD|11598335 việc kiểm soát người dân thực việc đeo trang, đẩy lùi dịch COVID-19 Ⅱ Mơ tả liệu Dữ liệu nhóm tổng hợp hình ảnh trang kagge phân loại ảnh thành thư mục Train, Test Validation Sau upload lên drive Mỗi tập ảnh gồm mục đeo trang (with mask) không đeo trang (without mask) Ⅲ Giới thiệu tổng quan thuật toán sử dụng 3.1 Nội dung toán - Bài tốn: Nhận diện người đeo trang nơi cơng cộng - Input: Hình ảnh khn mặt người thuộc hai lớp (loại): đeo trang không đeo trang Thuộc loại ảnh RGB (3 kênh màu Red, Green, Blue) - Output: Kết dự đoán ảnh input thuộc lớp hai lớp Nhóm lựa chọn thực xây dựng mơ hình CNN (Convolutional Neural Network) để phân lớp theo nhãn tương ứng: không đeo trang (no mask), đeo trang (mask) Các tầng mạng là: CNN, MaxPooling2D, Fully Connected (hay Dense) Đây tốn học có giám sát lOMoARcPSD|11598335 (supervised learning), cụ thể dạng phân lớp (classi昀椀cation) thơng dụng IV Chương trình AI nhận diện người đeo trang 4.1.Upload data lên My Drive - Đăng nhập vào gmail - Chọn Drive->My Drive->Tải thư mục data khau trang lên 4.1.2 Tiến hành viết code chương trình Tiến hành mở google Colaboratory để bắt đầu chạy code 4.1.3 Đọc liệu, tiền xử lí liệu Khai báo thư viện lOMoARcPSD|11598335 Kết nối Drive Khai báo đường dẫn đến thư mục chứa ảnh: Dán nhãn liệu Trong học máy, việc gán nhãn để phân lớp bước để máy xác định thuộc tính liệu từ nhận dạng, phân biệt đâu ảnh đeo trang, đâu ảnh không đeo trang Ảnh gán nhãn dựa theo tên thư mục chứa mà ta đặt tạo thư mục lúc ban đầu Lưu ý rằng, việc gán nhãn viết code phải tương ứng với tên thứ tự thư mục setdata để huấn luyện kiểm định mơ hình Trong này, cần gán nhãn lớp liệu “with_mask” “without_mask” lOMoARcPSD|11598335 Xử lí liệu ảnh Dùng tensorflow.keras, kĩ thuật load ảnh keras Tham số rescale =1/255 chuẩn hoá liệu ảnh giá trị nằm khoảng [0,1] Đọc liệu ảnh Đọc liệu biến đổi ảnh huấn luyện kích thước 120x120 tương ứng phân loại với lớp liệu 4.2 Xây dựng model đánh giá kết chạy 4.2.1 Mơ tả xây dựng mơ hình Trong mơ hình đầu tiên, nhóm xây dựng mơ hình sử dụng lớp CNN với Conv2D(32) lớp Dense(256), learning rate=0.01, thuật toán tối ưu SGD lOMoARcPSD|11598335 Mơ hình gồm lớp : Input image -> CNN1 -> Fully connected layer -> Output Hình minh họa Lớp có kích thước đầu vào 120x120 kích thước ảnh Lớp cuối có kích thước đầu 2, thuộc tính “with-mask” “without-mask” tập liệu Mạng nơron hoạt động lọc, nhận ảnh 120x120 đầu vào cho kết giá trị khác Sau cho ảnh qua lọc đặc trưng ảnh trở nên bật dễ nhận biết, kích thước ảnh bị biên để lại phần dựa vào để nhận diện hình ảnh Ở lớp tích chập đầu tiên: Tầng CNN1 Có 32 lọc, với kích thước lọc 3x3 lọc áp dụng lên liệu đầu vào ảnh có kích thước 120x120 Tầng CNN kết nối với đầu vào nên phải mô tả thông tin đầu vào (input_shape) lOMoARcPSD|11598335 Sau chuyển liệu đầu mạng CNN từ mảng chiều chiều cách làm phẳng liệu lớp Flatten Tiếp theo lớp Dense Lớp Dense thứ có 256 hàm số, tính chất kết nối tồn thơng số giá trị đầu vào nên gọi lớp kết nói đầy đủ cơng việc đưa kết đầu Hàm relu hàm kích hoạt trả giá trị đầu vào giá trị lớn trả với giá trị đầu vào khác Hàm số đóng vai trị lọc bỏ giá trị nhỏ Cuối lớp Output Hàm softmax có tính chất trả xác suất ln nằm khoảng (0:1] lớp đầu mạng nơron có nơron tương ứng với nhãn “with_mask” “without_mask” nên trả giá hay tương ứng với hình ảnh đầu vào yêu cầu câu lệnh 4.2.2 Thiết lập tham số huấn luyện Tiếp theo ta sử dụng thuật toán tối ưu SGD learning rate=0.01 10 lOMoARcPSD|11598335 4.2.3 Huấn luyện đánh giá Sử dụng 100 epochs để chạy Ta thu kết sau: Sau kết thúc 100 vịng lặp ta có kết độ xác vịng lặp thứ 100 99,12% Và mơ hình tốt đạt 99,625% vịng lặp thứ 64 Ta có biểu đồ hàm accuracy hàm loss sau: 11 lOMoARcPSD|11598335 4.3 Model : CNN, Dense Ở mơ hình 2, nhóm thêm hai lớp CNN tích chập gồm Conv2D(64) Conv2D(128) nối tiếp để tạo mơ hình trích xuất đặc trưng trừu tượng từ ảnh Tiếp theo ta thêm lớp Dense(512), learning rate=0.01 thuật toán tối ưu SGD ta giữ nguyên Thêm lớp Dense thứ hai với 512 hàm số Model ta làm cho mạng CNN sâu có tổng cộng tầng Conv2D lớp Dense Ta cho mô hình chạy 100 epochs ta quan sát xem kết Sau chạy 100 vòng ta thu kết : 12 lOMoARcPSD|11598335 Tương tự sau kết thúc 100 vịng lặp ta có kết độ xác vịng thứ 100 99,62% Và mơ hình tốt đạt 99,875% vịng lặp thứ 36 Ta có biểu đồ hàm accuracy hàm loss sau: Kết luận: so với kết model model sau thêm lớp Conv2D Dense kết mơ hình tốt Ngồi độ xác cao từ 99,625% lên 99,875% 4.4 Model 3: sử dụng thuật toán Adam Trong model ta thử thay đổi thuật toán tối ưu Đây thuật tốn mà tự điều chỉnh tốc độ học mơ hình tự tính tốn tỷ lệ học tập riêng lẻ cho tham số Hàm Adam tối ưu hàm SGD mà ta sử dụng hai mơ hình trước đó, thuật tốn tối ưu hóa tốc độ học tập thích ứng thiết kế đặc biệt để đào tạo mạng thần kinh sâu 13 lOMoARcPSD|11598335 Ta cho model chạy 100 epochs giống mơ hình ta quan sát kết Ta có biểu đồ hàm accuracy hàm loss: 14 Downloaded by Út Bé (beut656@gmail.com) lOMoARcPSD|11598335 Nhìn vào biểu đồ ta thấy rõ giao động lớn khơng cịn, từ vòng lặp đầu cho kết tốt lên đến xác xuất 99% khơng ngừng tăng lên đến vòng lặp cuối Vậy model model với việc sử dụng hàm tối ưu Adam mang lại độ xác cao tất mơ hình cịn lại V Sử dụng mơ hình Ta sử dụng Data Test để đánh giá độ xác nhận diện mơ hình Ngồi ta sử dụng ảnh thu thập bên hay internet để đánh giá độ xác tốt Ta có vài thử nghiệm trả kết sau: 15 Downloaded by Út Bé (beut656@gmail.com) lOMoARcPSD|11598335 16 Downloaded by Út Bé (beut656@gmail.com) lOMoARcPSD|11598335 =>Với ảnh chụp mặt người rõ nét mơ hình trả lại kết xác Vậy ta thử ảnh bị cố gây khó khăn nhận dạng cho mơ hình xem mơ hình xử lí TH1: ảnh chụp bình thường TH2: chụp ảnh lúc người chuyển động 17 Downloaded by Út Bé (beut656@gmail.com) lOMoARcPSD|11598335 TH3: chụp ảnh bị che phần Vậy ta rút kết luận cho mơ hình Với hình chụp mặt người rõ nét máy nhận diện nhanh xác cao Khi gặp hình mặt người bị che phần lớn mơ hình cịn nhận diện sai lệch Vậy trình huấn luyện thay đổi tham số, thuật tốn thích hợp với mơ hình giúp mơ hình chạy thu kết đạt thành công định , có số trường hợp mơ hình gặp khó khăn để nhận diện dẫn đến kết sai, nhìn chung lại mơ hình có kết nhận diện xác cao, bước đầu thành cơng giúp trí tuệ nhân tạo tiếp cận vấn đề sống người, đặt móng phát triển cho thị trường trí tuệ nhân tạo phát triển tương lai Ⅵ NHẬN XÉT 18 Downloaded by Út Bé (beut656@gmail.com) lOMoARcPSD|11598335 6.1 Nhận xét độ xác thuật tốn Sau chạy thử nghiệm thuật tốn cho kết cách tương đối xác, nhiên số trường hợp tỷ lệ nhận diện mask error mask cịn thấp Nó hữu dụng tiện lợi để giám sát hay kiểm tra việc đeo trang nơi công cộng hay nơi đông người như: siêu thị, trường học, xe bus, rạp chiếu phim,…Nhằm nhắc nhở người nên có ý thức phịng chống dịch bệnh để đem lại an tồn sức khỏe cho thân cộng đồng nơi đông người Mọi người chung tay đẩy lùi dịch bệnh để sống trở lại bình thường, hạnh phúc ấm no, sức khỏe dồi 6.2 Ưu, nhược điểm tốn nhận diện 6.2.1 Ưu điểm + Nhanh chóng, tiết kiệm thời gian, đưa kết xác + Khi ứng dụng vào computer vison khơng cần phải trực tiếp tiếp xúc với thiết bị để xác thực Yêu cầu xử lý so với kỹ thuật xác thực sinh trắc học khác + Mức độ bảo mật cao, dễ triển khai tích hợp với tính bảo mật có mặt thị trường + Có thể sử dụng để giúp tự động hóa việc xác thực 6.2.2 Nhược điểm Trong điều kiện không thuận lợi không đủ ánh sáng, trời mưa to, người bị chụp đeo kính mắt hay bị che phần lớn mặt việc nhận diện gặp nhiều khó khăn , có cịn đưa kết sai lệch VII KẾT LUẬN CHUNG 19 Downloaded by Út Bé (beut656@gmail.com) lOMoARcPSD|11598335 Qua báo cáo này, nhóm em hi vọng đem đến cho người nhìn tổng thể chương trình AI nhận diện hình ảnh người đeo trang Bài toán ‘’Nhận diện người đeo trang nơi cơng cộng’’ chương trình ứng dụng Computer Vision, giúp xử lý vấn đề an toàn thời buổi dịch COVID-19 hoành hành giới Các bước trình phân loại ảnh làm chủ từ việc thu thập liệu, thiết kế mơ hình trình huấn luyện kiểm tra đánh giá chất lượng mơ hình Mơ hình huấn luyện đạt độ xác phân loại khoảng 70,3% Nhóm hi vọng kết nghiên cứu tiền để cơng ty cơng nghệ có ý tưởng nhiều ứng dụng công nghệ AI 4.0 lĩnh vực tương lai., giúp sống người trở nên thông minh dễ dàng 20 Downloaded by Út Bé (beut656@gmail.com) lOMoARcPSD|11598335 21 Downloaded by Út Bé (beut656@gmail.com) ... hi vọng đem đến cho người nhìn tổng thể chương trình AI nhận diện hình ảnh người đeo trang Bài tốn ‘? ?Nhận diện người đeo trang nơi công cộng? ??’ chương trình ứng dụng Computer Vision, giúp xử lý... tập ảnh gồm mục đeo trang (with mask) không đeo trang (without mask) Ⅲ Giới thiệu tổng quan thuật toán sử dụng 3.1 Nội dung toán - Bài toán: Nhận diện người đeo trang nơi cơng cộng - Input: Hình... mask cịn thấp Nó hữu dụng tiện lợi để giám sát hay kiểm tra việc đeo trang nơi công cộng hay nơi đông người như: siêu thị, trường học, xe bus, rạp chiếu phim,…Nhằm nhắc nhở người nên có ý thức

Định dạng
Số trang	21
Dung lượng	2,99 MB