Mạng nơ-ron tích chập là một mô hình Deep Learning có thể lấy hình ảnh đầu vào, gán các trọng số cho các đặc trƣng khác nhau trong hình ảnh và có thể phân biệt đƣợc từng đặc trƣng này vớ
BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƢỜNG ĐẠI HỌC QUY NHƠN NGUYỄN MINH PHÚC ỨNG DỤNG MÔ HÌNH CNN XÂY DỰNG HỆ THỐNG PHÁT HIỆN BUỒN NGỦ KHI LÁI XE Ô TÔ Ngành : Khoa học dữ liệu ứng dụng Mã số: 8904648 Ngƣời hƣớng dẫn: TS Lê Xuân Vinh LỜI CAM ĐOAN Tôi xin cam đoan đây là công trình nghiên cứu của riêng tôi và đƣợc sự hƣớng dẫn khoa học của TS Lê Xuân Vinh; Các nội dung nghiên cứu, kết quả trong đề tài này là trung thực và chƣa công bố dƣới bất kỳ hình thức nào trƣớc đây Những số liệu, hình ảnh trong các bảng biểu phục vụ cho việc phân tích, nhận xét, đánh giá đƣợc chính tác giả thu thập từ các nguồn khác nhau có ghi rõ trong phần tài liệu tham khảo Ngoài ra, trong luận văn còn sử dụng một số nhận xét, đánh giá cũng nhƣ số liệu của các tác giả khác, cơ quan tổ chức khác đều có trích dẫn và chú thích nguồn gốc Nếu phát hiện có bất kỳ sự gian lận nào tôi xin hoàn toàn chịu trách nhiệm về nội dung luận văn của mình Trƣờng Đại học Quy Nhơn không liên quan đến những vi phạm tác quyền, bản quyền do tôi gây ra trong quá trình thực hiện (nếu có) Bình Định, ngày tháng năm 2023 Tác giả LỜI CẢM ƠN Em xin chân thành cảm ơn các Thầy, các Cô Khoa Công nghệ Thông tin Trƣờng Đại học Quy Nhơn đã tận tình dạy dỗ, truyền đạt cho em nhiều kiến thức quý báu Em xin tỏ lòng biết ơn sâu sắc đến thầy TS Lê Xuân Vinh, ngƣời đã tận tình giúp đỡ và truyền đạt nhiều kinh nghiệm để đề tài có thể đƣợc thực hiện và hoàn thành Xin chân thành cảm ơn các bạn trong lớp Cao học Khoa học dữ liệu ứng dụng K24B, các bạn Khoa Công Nghệ Thông Tin, Trƣờng Đại học Quy Nhơn đã giúp đỡ, động viên tôi rất nhiều trong quá trình thực hiện đề tài Em xin chân thành cảm ơn! Bình Định, ngày tháng năm 2023 Tác giả MỤC LỤC LỜI CAM ĐOAN LỜI CẢM ƠN DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ VIẾT TẮT DANH MỤC CÁC BẢNG DANH MỤC CÁC HÌNH MỞ ĐẦU 1 1.Lý do chọn đề tài 1 2 Yêu cầu của đề tài 3 3 Đối tƣợng nghiên cứu 3 4 Phạm vi nghiên cứu 4 5 Phƣơng pháp nghiên cứu 4 CHƢƠNG 1: CƠ SỞ LÝ THUYẾT VÀ KỸ THUẬT CHO DEEP LEARNING 5 1.1 Tổng quan về học máy 5 1.1.1 Một số khái niệm chung 5 1.1.2 Các thuật toán học máy 6 1.2 Mạng nơ-ron (Neural Network) 7 1.2.1 Tổng quan về mạng nơ-ron 7 1.2.2 Các thành phần cơ bản của mạng nơ-ron nhân tạo 8 1.2.3 Kiến trúc ANN 13 1.2.4 Hoạt động của ANN 14 1.3 Mạng nơ-ron tích chập (CNN) 15 1.4 Kết luận 17 CHƢƠNG 2: MÔ HÌNH CONVOLUTIONAL NEURAL NETWORKS 18 2.1 Cấu trúc của CNN 18 2.1.1 Lớp tích chập (Convolution layer) 18 2.1.2 Lớp gộp (Pooling Layer) 20 2.1.3 Lớp hiệu chỉnh 21 2.1.4 Lớp chuẩn hóa 22 2.1.5 Lớp kết nối đầy đủ (Fully connected - FC) 23 2.1.6 Lớp đầu ra 23 2.2 Một số mô hình mạng CNN tiêu biểu 23 2.3.1 LeNet 24 2.3.2 AlexNet 25 2.4 Kết luận 26 CHƢƠNG 3: ỨNG DỤNG MẠNG CNN TRONG VIỆC PHÁT HIỆN BUỒN NGỦ KHI LÁI XE Ô TÔ 27 3.1 Giới thiệu và phân tích bài toán 27 3.2 Xây dựng mạng cho mô hình 29 3.3 Huấn luyện mô hình 31 3.4 Đánh giá mô hình 38 KẾT LUẬN 41 TÀI LIỆU THAM KHẢO 42 QUYẾT ĐỊNH GIAO TÊN ĐỀ TÀI (BẢN SAO) DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ VIẾT TẮT STT Từ viết tắt Từ Tiếng Anh Giải thích 1 CNN Convolutional Neural Mạng Nơ ron tích-chập Network Deep Convolutional Mạng tích-chập đối kháng 2 DCGANs Generative Adversarial sinh mẫu đa lớp Networks 3 DNN Deep Neural Network Mạng Nơ-ron đa lớp 4 FCNN Fully-connected Neural Mạng Nơ-ron kết nối hoàn Network chỉnh Modified National Institute 5 MNIST of Standards and Tập chữ viết tay MNIST Technology 6 NN Neural Networks Mạng Nơ-ron 7 RNN Recurrent Neural Network Mạng Nơ-ron hồi quy 8 DL Deep Learning Học sâu DANH MỤC CÁC BẢNG Bảng 3.1: Hiệu suất của Accuracy và Loss qua 100 lần lặp 39 DANH MỤC CÁC HÌNH Hình 1.1: Mô hình mạng nơ-ron [2] 7 Hình 1.2 Đơn vị xử lý (Processing Unit) 8 Hình 1.3 Hàm đồng nhất (Identity function) 10 Hình 1.4 Hàm bƣớc nhị phân (Binary step function) 11 Hình 1.5 Hàm Sigmoid 12 Hình 1.6 Hàm sigmoid lƣỡng cực 12 Hình 1.7 Đồ thị hàm ReLU 13 Hình 1.8 Kiến trúc 3 phần của mạng ANN 13 Hình 1.9 Mạng nơ-ron nhiều lớp 14 Hình 1.10 Tế bào mạng nơ-ron nhân tạo [3] 14 Hình 1.11 Cấu trúc cơ bản của mạng Nơ-ron Tích chập (Lecun, 1989) 16 Hình 1.12 Kiến trúc mạng tích chập tiêu biểu [4] 17 Hình 2.1 Minh họa việc áp dụng phép tính Conv 19 Hình 2.2 Minh họa hoạt động của lớp pooling [5] 21 Hình 2.3 Minh hoạ hoạt động của hàm hiệu chỉnh 22 Hình 2.4 LeNet 24 Hình 2.5 AlexNet 25 Hình 3.1 Sơ đồ thuật toán phát hiện lái xe buồn ngủ 27 Hình 3.2 Sơ đồ quá trình tiền xử lý dữ liệu 29 Hình 3.3 Sơ đồ xây dựng mô hình phát hiện lái xe buồn ngủ 30 Hình 3.4 Sơ đồ huấn luyện mô hình phát hiện lái xe buồn ngủ 31 Hình 3.5 Sử dụng mô hình phát hiện lái xe buồn ngủ 35 Hình 3.6 Đồ thị độ chính xác và giá trị lỗi 39 1 MỞ ĐẦU 1.Lý do chọn đề tài Theo Hiệp hội các nhà sản xuất ô tô Việt Nam (VAMA), tổng lƣợng bán ôtô mới trong tháng 8/2023 là 22.540 xe, bao gồm xe 17.335 du lịch; 5.036 xe thƣơng mại và 169 xe chuyên dụng, tăng 8% so với tháng 7 Tính chung doanh số của VAMA và TC Group trong tháng 8 vừa qua toàn thị trƣờng ô tô Việt Nam tiêu thụ 25.685 xe, nâng tổng doanh số 8 tháng năm 2023 lên 219.745 xe các loại đƣợc bàn giao cho khách hàng trong cả nƣớc Trƣớc tình hình tăng nhanh của thị trƣờng xe ô tô ở Việt Nam thì cũng đi kèm theo đó nhiều bất cập trong xã hội Theo nghiên cứu của Trung tâm Nationnal Jewish Health, Mỹ, cho biết: “Thiếu ngủ là một trong những nguyên nhân chính gây tai nạn giao thông trên thế giới Ƣớc tính khoảng 10-15% tai nạn xe có liên quan đến thiếu ngủ Nghiên cứu về giấc ngủ của các ngƣời lái xe 19 quốc gia châu Âu cho thấy tỷ lệ buồn ngủ khi lái xe cao, trung bình 17% Trong đó 10,8% ngƣời buồn ngủ khi lái xe ít nhất một lần trong tháng, 7% từng gây tai nạn giao thông do buồn ngủ, 18% suýt xảy ra tai nạn do buồn ngủ” Thực tế tại Việt Nam, theo thống kê về tai nạn giao thông của cục cảnh sát giao thông cho biết trong năm 2022, tai nạn giao thông đƣờng bộ xảy ra 11.323 vụ, làm chết 6.265 ngƣời, bị thƣơng 7.777 ngƣời Trong đó, tai nạn giao thông do phƣơng tiện xe ô tô kinh doanh vận tải gây ra 3.904 vụ (34,48%), làm chết 2.497 ngƣời (39,86%), bị thƣơng 1.820 ngƣời (23,40%).Từ năm 2022 đến hết 6 tháng đầu năm 2023, cả nƣớc xảy ra 16.229 vụ tai nạn giao thông đƣờng bộ, làm chết 9.086 ngƣời, làm bị thƣơng 11.235 2 ngƣời Trong đó, tai nạn giao thông do phƣơng tiện kinh doanh vận tải xảy ra 5.778 vụ (35,60%), làm chết 3.724 ngƣời (40,99%), bị thƣơng 2.767 ngƣời (24,63%).thƣơng nhẹ Vì vậy, việc phát triển các hệ thống phát hiện buồn ngủ khi lái xe trở nên quan trọng và rất cấp thiết Từ năm 2006, Deep Learning (học sâu) nổi lên nhƣ một lĩnh vực mới của học máy Ngày nay, sự thay đổi lớn nhất trong học sâu là độ sâu của mạng lƣới thần kinh đã phát triển từ một vài lớp đến hàng trăm lớp, khả năng nhận dạng các mẫu lớn hơn, với nguồn thông tin lớn hơn giúp tăng khả năng tiếp nhận các đối tƣợng trở nên rộng hơn, chi tiết hơn Sự phát triển nhanh chóng của học sâu, đặc biệt là sự phát triển của mạng nơ-ron tích chập (CNN), tạo nên sự chủ động trong các ứng dụng liên quan đến thị giác máy Mạng nơ-ron tích chập có thể đƣợc ứng dụng để phát hiện tài xế buồn ngủ khi lái xe Mạng nơ-ron tích chập là một mô hình Deep Learning có thể lấy hình ảnh đầu vào, gán các trọng số cho các đặc trƣng khác nhau trong hình ảnh và có thể phân biệt đƣợc từng đặc trƣng này với nhau Mạng nơ-ron tích chập có khả năng tự học để chọn ra các đặc trƣng tốt nhất Từ năm 1998, kiến trúc LeNet là mạng đầu tiên áp dụng tích chập 2 chiều; Năm 2012, kiến trúc AlexNet là mạng áp dụng CNN đầu tiên chiến thắng trong cuộc thi ImageNet; Năm 2014, kiến trúc VGG-16 hình thành một xu hƣớng cải thiện độ chính xác của các mạng học sâu nhờ việc tăng độ sâu của chúng; Năm 2014, kiến trúc GoogleNet - InceptionV1 kết hợp nhiều bộ lọc có kích thƣớc khác biệt vào cùng một khối Định hình kiến trúc khối cho các kiến trúc mạng CNN chuẩn sau này; Năm 2015, kiến trúc ResNet-50 sử