TẠP cui CÔNG THtfdHG NGHIÊN CỨU ỨNG DỤNG HỌC SÂU VÀO PHÂN LOẠI RÁC THẢI • ĐẶNG VŨ KIM KÝ - NGUYEN HUỲNH THÔNG - Âu THÙ Y ÂN - PHẠM TẤN HƯNG TÓM TẮT: Bài báo đưa thí nghiệm mơ hình mạng nơ ron tích chập hiệu chỉnh (Convolution Neural Network, CNN) giúp phân loại rác thành nhóm khác chai nhựa, lon, thủy tinh việc sử dụng lên tới 900 hình ảnh thu thập tay, chia thành 500 hình ảnh dùng cho việc phân tích 400 hình ảnh dùng cho việc đánh giá kết Mơ hình cho kết tuyến tính số lượng liệu huấn luyện với độ xác trung bình (mean Average Precision, mAP) kiểm tra mơ hình xuất Từ đây, nghiên cứu thực thí nghiệm khác để đảm bảo hiệu mơ hình hn luyện đạt yêu cầu đề ra, AI401 với 80% độ xác tổng quan Từ khóa: rác thải, mạng nơ ron tích chập hiệu chỉnh, mơ hình học sâu, mã nguồn mở, Tensorflow Object Detection API Đặt vân đề Vào thời điểm tại, nhận thức người dân phân loại rác vân đề đáng quan tâm, bên cạnh vân đề tốc độ tăng lượng rác thải ngày cao Theo Bộ Tài nguyên Môi trường, Thành phô' Hồ Chí Minh, vào nãm 2004, khoảng 5.500 rác thải rắn loại thải ngày [1] Vào năm 2014, lượng rác thải tăng lên thành 7.000 tân ngày với lượng rác thải trung bình 1,02 kg/người/ngày [2], Trong đời sống đại, Trí tuệ Nhân tạo (Artificial Intelligent, AI) đóng vai trò quan trọng nhiều lĩnh vực đời sống, ứng dụng tồn nhiều ngành lĩnh vực y tế, sức khỏe, nông nghiệp, nhận diện vật thể, Bài báo chủ yếu tập trung vào việc huấn luyện mơ hình phân loại rác tùy chỉnh đánh giá độ xác mơ hình, tham khảo 218 SỐ - Tháng 2/2022 ta ứng dụng mơ hình học sâu huấn luyện trước (pre-trained Deep Learning model) tương lai Cơ sở liệu Tensorflow Object Detection API gói mã nguồn mở dùng để nhận dạng vật thể thay xây dựng từ đầu Bên cạnh có tiêu chuẩn việc lựa chọn mơ hình AI phù hợp tùy theo mục đích khác nhằm tối ưu độ xác đạt được, có mơ hình phục vụ cho việc xử lí ảnh, mơ hình cho nhận diện giọng nói, mơ hình cho xử lí văn liệu, Bên cạnh đó, kiến trúc mạng học sâu MobileNets V2 cơng bố nhóm tác giả Sandler vào năm 2019, mơ hình thể nhảy vọt hiệu so với phiên trước mơ hình Với việc tích hợp Linear Bottleneck Inverted Residuals [3] liên kết lớp tích chập, Linear Bottleneck giúp tính KHOA HỌC-KỸ THUẬT tốn đầu vào đầu ra, Inverted Residual giúp gói lại đặc trưng trích xuất chuyển giao lớp Bộ liệu thực với mục đích nhắm tới ứng dụng trước mắt môi trường học đường, cụ thể Trường Đại học Bách khoa sở Lý Thường Kiệt, quận 10, bao gồm nhóm chai nhựa, lon nước kim loại, chai thủy tinh, với phương thức lấy ảnh nhằm đảm bảo đa dạng liệu (Hình 1) Phương thức lấy ảnh bao gồm việc xoay hướng ngẫu nhiên, góc cường độ chiếu sáng, độ phóng to thu nhỏ vật thể để đạt số lượng tơi đa hình ảnh cho vật thể Mỗi nhóm có xấp xỉ 15 vật thể chụp với góc hướng quay khác Tổng cộng 500 ảnh dùng cho việc huấn luyện mô hình Bỏng ỉ Số lượng vật thể số lượng ảnh cho nhóm STT Nhóm Loại Sốhình Độ phân ảnh giải Chai nhựa 14 166 Lon nưóc kim loại 15 166 Chai thủy tinh 17 168 48 500 Tổng 640x640 pixels Hình 2: Vật thể (thuộc nhóm Lon) dán nhãn công cụ “Labelling” (ỉ); File XML chứa tên nhãn tọa độ Grounding box vật thể bên hình (2) Bảng Dán nhãn liệu cần dán nhãn trước tiến hành q trình huấn luyện, cơng cụ có tên Labelling [4] công cụ giúp thêm vào phụ đồ họa cho ảnh (Hình 2) Cơng cụ viết ngơn ngữ lập trình Python, sử dụng công cụ PythonQt cho giao diện đồ họa Hình 1: Một số ví dụ liệu hình ảnh với loại mẫu vật chọn mang ý nghĩa tượng trúhg cho nhóm chai nhựa, lon, chai thủy tinh Thí nghiệm kết Nghiên cứu với mục đích phân tích đánh giá khả nhận diện mơ hình huấn luyện trích xuất Các mơ hình hn luyện với liệu khác với SỐ3-Tháng 2/2022 219 TẠP CHÍ CƠNG TilídNI trọng số (hyperparameters) Bảng Bảng Các giá trị trọng số đầu vào Bảng Nhóm nghiên cứu giữ nguyên giá trị dùng cho việc huấn luyện chúng hồn tồn phù hợp ứng dụng vào mơ hình mà nhóm muốn phân tích đánh giá (Hình 3) Nhóm nghiên cứu tính tốn đường Thông số Giátri Tỷ lệ học ban đầu (Initial Learning Rate) 0.08 Quán tính (Momentum) 0.9 hồi quy tuyến tính thể mơi tương quan Decay mAP sơ' lượng ảnh dùng để huấn luyện mơ hình Kích thước (Mini Batch Size) 0.997 theo thời gian (time) số bước (steps) Sô' chu kỳ (Number of Epochs) Kết từ việc tính tốn giá trị tối ưu Với giá trị đo đạc được, nhóm nghiên cứu phác thảo biểu đồ Hình với trục hoành (x) thể giá trị số lượng ảnh dùng để huấn luyện mơ hình trục tung (y) biểu thị cho 833 Số bước đa (Maximum Steps) 50000 Trọng số (Weight) 4e-05 Ngưỡng loU (Matched loll Threshold) 0.6 Bảng Huấn luyện mơ hình với Điều kiện biên (Marginal Condition) Mơ hình học sâu (SSD MobileNets V2) Mơ hình Tập liệu huấn luyện Điểu kiện biên 100 hình A1100 200 hình AI200 300 hình «0.1+3% AI300 400 hình AI400 500 hình AI500 Hình 3: Hàm Mất mát chuẩn hóa q trình huấn luyện cho mơ hình AI200, AI300, AI4Ũ0, AI500 220 Số - Tháng 2/2022 Đầu (tên gọi) KHOA HỌC-KỸ THUẬT Bảng Các mơ hình đành giá liệu đánh giá với Thời gian (Time) Số bước (Steps) cần cho trình huấn luyện lẽn gọi (x) mAP với tập 150 hình (y1) mAP với tập 100 hình (y2) Thồigian (phút) (t) Tống số bước (z) A1100 50.2% 58.3% giò 14000 AI200 65.1% 65.6% 22 phút 21000 AI300 75.2% 75.5% 51 phút 25880 AI400 81.4% 81.0% 36 phút 28300 AI500 81.6% 84.1% 31 phút 37400 Hình 4: Biểu đồ tương quan mAP (%, (y)) số lượng ảnh dùng cho việc huấn luyện (số ảnh, (X)) • mAP150 • mAPlOO Linear (mAP150) —- Linear (mAPlOO) giá trị mAP (%), Thời gian (phút), Sô' giá trị trung bình kết để nhận bước (bước), Thời gian (Time) (phút), số bước đường hồi quy tuyến tính gần tương đồng (Steps) (bước) Với giá trị trên, nhóm nghiên hồn tồn, nên độ chênh lệch bỏ cứu phác thảo biểu đồ xác định tuyến qua, với = 401 ảnh Tương tự, ta phân tích tính tất điểm phác thảo có từ thí giá trị tối ưu cho thời gian t: t ~ 282 phút cho số nghiệm tính tốn Hồi quy tuyến tính bước cần cho việc huấn luyện k: k ~ 30,780 bước Việc tính tốn để tìm điểm tối ưu với u cầu Nhóm nghiên cứu kết luận mơ hình đạt giá trị đặt để đạt giá trị xác mAP 80% cần tối ưu đề 80% mAP cần phải huấn thực việc huấn luyện mơ hình luyện lần với 401 hình ảnh nhóm vật thể liệu ảnh xác định, thời gian cần để huấn khác với tổng số thời gian huân luyện tính luyện, số bước cần thực trình huấn tốn 282 phút (4 48 phút), với tổng số luyện Ta có: • Cho liệu đánh giá 100 ảnh: y = 0.0007x bước cần 30.780 bước + 0.528 and R2 = 0.9669 => xl ~ 389 ảnh diện vật thể Trong phần này, sau huấn luyện mơ hình với giá trị tính tốn tơi ưu bên trên, nhóm nghiên cứu trích xuất mơ hình nhận nhận • Cho liệu đánh giá 150 ảnh: y = 0.0008x + 0.4697 and R2 = 0.8873 => x2 ~ 413 ảnh Và từ giá trị xl x2 đạt được, ta lấy Đánh giá khả nhận diện mơ hình nhận SỐ - Tháng 2/2022 221 TẠP CHÍ CƠNG THƯƠNG điểm khác biệt giá trị ước tính giá trị giá trị thực tế, nghiên cứu mong đợi kết đo thức tế tiến hành thí nghiệm biến Thời đánh giá độ xác đạt xung quanh gian Số’ bước (Bảng 5) Ta thấy khác 80% mAP Từ đó, nhóm tác giả tách giá trị đo biệt rõ ràng giá trị giả thiết thực tế đạc chia biểu đồ thành vùng: vùng mong biến Thời gian, ngược lại độ chênh lệch muốn (không màu) vùng khơng mong muốn (màu hồng) (Hình 5) nhỏ giả thiết thực tế biến số bước cần cho việc huân luyện (Bảng 6) Điều cho thấy, với số lượng hình ảnh dùng cho việc huấn luyện, trình lần huấn luyện khác nhau, khơng có lần huấn luyện cho giá trị thời gian sô bước dù điều kiện biên điều kiện đầu vào Sự khác biệt liệu đôi với mắt người khơng nhiều, đơi với cách máy tính thuật tốn AI giải nghĩa hình ảnh hình ảnh hồn tồn khác lấy hình từ mẫu vật thể Vì vậy, thí nghiệm cho thấy đánh giá độ xác mơ hình trích xuất liệu hồn tồn, từ đó, ta dựa vào để đánh giá độ hiệu mơ hình tơi ưu đề với kết đo đạc theo Bảng Bảng Nhóm nghiên cứu so sánh giá trị ước tính Kết luận Nghiên cứu đóng góp vào thư viện liệu hình ảnh cho việc nhận dạng rác thải bao gồm 48 vật thể, với 900 ảnh thu thập bên khu vực Trường Đại học Bách khoa Thành phố Hồ Chí Minh, Việt Nam Tiếp đó, nhóm nghiên cứu huấn luyện thành cơng mơ hình học sâu SSD MobileNets V2 với điều kiện xác định kiểm tra tập liệu nhằm chứng minh tuyến tính mối quan hệ số lượng hình ảnh đưa vào huấn luyện kết độ xác đưa ra, với độc lập độ xác mà mơ hình đưa so với liệu dùng để đánh giá độ hiệu Cuối cùng, với mơ hình AI401, tất tập liệu đánh giá đạt nhât 80% mAP cho nhóm - chai nhựa, lon kim loại, chai thủy tinh với 48 vật thể đánh giá độ xác mơ hình đề ■ Bảng Huấn luyện mơ hình với Điều kiện biên (Marginal Condition) với giá trị tính tốn tối ưu số lượng ảnh cần cho việc huấn luyện Model Deep Learning (SSD MobileNets V2) Tập liệu huấn luyện Điểu kiện biên Mơ hình 401 hình »0.1 ±3% Kết Số bước = 34300 AI401 Thời gian = 445 phút Bảng Sự khác biệt giá trị giả thiết tính tồn giá trị nhận thực tế biến Thời gian số bước thực tái thử nghiệm Giá tụ dự đoán Giá tri thật Sai sô' (%) Thời gian 282 phút 445 phút 57.8% Sô' bưốc 30780 bước 34300 bước 11.4% Bảng mAP đo (theo %) theo liệu đánh giá khác Tập hlnh kiểm tra 60 hình 100 hình 200 hình 300 hình 401 hình mAP 90.2% 85.3% 86.2% 84.3% 81.1% 222 Số - Tháng 2/2022 ị KHOA HỌC-KỸ THUẬT Hình 5: Giá trị mAP đo dơ liệu đánh giá với việc phân chia vùng mong muốn (không màu) vùng không mong muôh (màu hồng) điểm đo đạc được vẽ biểu đồ 50 100 150 200 250 300 350 400 450 Image Test Set Lời cảm ơn: Nghiên cứu tài trợbởi Trường Đại học Bách khoa Thành phốHồ Chí Minh (Việt Nam) với sơ hiệu To-ĐCDK-2020-16 Nhóm nghiên cứu cảm ơn hỗ trợ sở vật chất cung cấp Trường Đại học Bách khoa Thành phốHồ Chí Minh, Đại học Quốc gia Thành phốHồ Chí Minh cho nghiên cứu TÀI LIỆU THAM KHẢO: VMENR (Vietnam Ministry of Environment and Natural Resources) (2014) Canadian International Development Agency, Vietnam Environment Monitor: Solid Waste, Vietnam DONRE (Department of Natural Resource and Management)-Ho Chi Minh City (2014) The report on overview ofthe SWM system ofHCMC, Vietnam Jiahui Yu, Yuning Jiang, Zhangyang Wang, Zhimin Cao, and Thomas Huang Unitbox, (2016) An advanced object detection network, In Proceedings of the 24th ACM international conference on Multimedia, ACM, pp 516-520 Shi Lin; Zhong, Hao; Xie, Tao; Li, Mingshu (2011) An Empirical Study on Evolution of API Documentation, International Conference on Fundamental Approaches to Software Engineering, Lecture Notes in Computer Science, ISBN 978-3-642-19810-6 Retrieved 22 July Ngày nhận bài: 3/1/2022 Ngày phản biện đánh giá sửa chữa: 20/1/2022 Ngày chấp nhận đăng bài: 12/2/2022 SỐ - Tháng 2/2022 223 TẠP CHÍ CƠNG THƯƠNG Thơng tin tác giả: ĐẶNG VŨ KIM KÝ14 NGUYỄN HUỲNH THÔNG-4* 3.ÂUTHÙYÂN24 PHẠM TẤN HƯNG34 'Khoa Điện - Điện tử, Trường Đại học Bách khoa 2Khoa Kỹ thuật Địa chát Dầu khí, Trường Đại học Bách khoa 3Khoa Môi trường Tài nguyên, Trường Đại học Bách khoa 4Đại học Quốc gia Thành phố Hồ Chí Minh A STUDY ON THE USE OF DEEP LEARNING FOR TRASH CLASSIFICATION • DANG VU KIMKY14 • NGUYEN HUYNH THONG2 • AU THUY AN24 • PHAM TAN HUNG34 'Faculty of Electrical and Electronic Engineering Ho Chi Minh City University of Technology 2Faculty of Geotechnical Engineering and Petroleum Ho Chi Minh City University of Technology faculty of Environment and Natural Resources Ho Chi Minh City University of Technology 4Vietnam National University - Ho Chi Minh City ABSTRACT: This paper presents an experiment on the use of a convolutional neural network (CNN) model to classify garbage into three different groups, namely plastic bottles, cans, and glass by using 900 manually collected images In which, 500 images were used for analysis and 400 images were used for evaluation of results This model gave a linear result which is between the amount of training data and the average accuracy (mean Average Precision, mAP) Based on these results, an other experiment was done to ensure that the trained model meets set requirements including AI401 with 80% overall accuracy Keywords: garbage, convolutional neural network, deep learning model, open source, Tensorflow Object Detection API 224 SỐ3-Tháng 2/2022 ... trọng số đầu vào Bảng Nhóm nghiên cứu giữ nguyên giá trị dùng cho việc huấn luyện chúng hoàn toàn phù hợp ứng dụng vào mơ hình mà nhóm muốn phân tích đánh giá (Hình 3) Nhóm nghiên cứu tính tốn... dựa vào để đánh giá độ hiệu mơ hình tơi ưu đề với kết đo đạc theo Bảng Bảng Nhóm nghiên cứu so sánh giá trị ước tính Kết luận Nghiên cứu đóng góp vào thư viện liệu hình ảnh cho việc nhận dạng rác. .. dạng rác thải bao gồm 48 vật thể, với 900 ảnh thu thập bên khu vực Trường Đại học Bách khoa Thành phố Hồ Chí Minh, Việt Nam Tiếp đó, nhóm nghiên cứu huấn luyện thành cơng mơ hình học sâu SSD MobileNets