Trang 1 1HỘI NGHỊ TỔNG KẾT HOẠT ĐỘNG SINH VIÊN NGHIÊN CỨU KHOA HỌC VÀ NHÓM SRT NĂM HỌC 2019-2020XÂY DỰNG MƠ HÌNH TRÍ TUỆ NHÂN TẠOVÀO PHÂN LOẠI RÁC THẢI TRÊN THIẾT BỊ NHÚNGBUILDING AI MOD
1 HỘI NGHỊ TỔNG KẾT HOẠT ĐỘNG SINH VIÊN NGHIÊN CỨU KHOA HỌC VÀ NHÓM SRT NĂM HỌC 2019-2020 XÂY DỰNG MƠ HÌNH TRÍ TUỆ NHÂN TẠOVÀO PHÂN LOẠI RÁC THẢI TRÊN THIẾT BỊ NHÚNG BUILDING AI MODEL TO CLASSIFY WASTES ON EMBEDDED DEVICE SVTH: Phạm Duy Thanh Lớp 18T2, Khoa Điện – Điện Tử, Trường Đại học Sư phạm Kỹ thuật - Đại học Đà Nẵng GVHD: TS Phạm Tuấn Khoa Điện – Điện Tử, Trường Đại học Sư phạm Kỹ thuật - Đại học Đà Nẵng Tóm tắt - Mức sống cao dẫn đến nhiều vấn đề môi Abstract - Higher standard of living leads to numerous trường, vấn đề đáng báo động rác thải Rác thải ngày environmental issues, and the most alarming issue is waste thu gom phân loại phương pháp thủ Waste today is still collected and classified by manual methods công sử dụng nhiều lao động ảnh hưởng đến sức khỏe that are labor-intensive and affect the health of workers Realizing người lao động Nhận thấy bất cập quy trình phân loại the inadequacies in the waste classification process, this project chất thải, dự án phát triển mơ hình Trí tuệ nhân tạo để developed an Artificial Intelligence model for classifying wastes phân loại chất thải lon, chai nhựa túi nhựa thiết bị such as cans, plastic bottles and plastic bags on embedded nhúng Mơ hình sử dụng kiến trúc mạng SSD (Phát devices This model uses the SSD network architecture (Single lần chụp) để giúp mơ hình trả kết nhanh chóng Shot Detector) to help the model return results quickly and xác Thành công dự án tạo hội cho dự án accurately The success of this project can produce a chance for lớn giúp ích nhiều cho vấn đề liên quan đến larger projects that can help a lot in waste-related issues such as: chất thải như: chế tạo phương tiện tự lái nhằm thu gom phân building self-driving vehicles aims to collect and classify wastes loại chất thải tự động máy tự động để phân loại chất thải automatically and automatic machine for classifying waste Từ khóa - phân loại rác trí tuệ nhân tạo; ứng dụng trí Key words - Waste classification by AI, Application of tuệ nhân tạo; ứng dụng deep learning; phân loại rác thiết bị artificial intelligence, Deep learning application, Waste nhúng classification, Waste separation on embedded equipment Cơ sở lý thuyết Hình 1: Mơ hình chung cho tốn học sâu 1.1 Khái niệm học sâu – Deep learning sát, ta có đầu vào mà 1.2.1 Giai đoạn huấn luyện Deep learning nhánh máy học với đặc điểm Giai đoạn huấn luyện bước quan trọng để xây dựng sử dụng mơ hình phi tuyến tính có chiều sâu để dự mơ hình Trí tuệ nhân tạo Ở giai đoạn huấn luyện cần đoán Mạng nơ-ron nhân tạo tảng deep learning, liệu vào tập liệu nhãn mong muốn dạng mơ hình lấy ý tưởng từ não Dữ liệu vào tất thơng tin ta biết liệu Ví người với nhiều lớp chồng lên nhằm học dụ: với ảnh giá trị pixel, với văn khái niệm từ đơn giản đến phức tạp Hiện tại, mạng nơ- từ, câu; với file âm đoạn tín ron nhân tạo nắm giữ hầu hết kỉ lục hiệu; với sở liệu Iris độ dài cánh hoa tốn máy học phổ thông đường phát triển máy học tương lai Một số đặc điểm Python Deep Learning là: Nó sử dụng loạt lớp đơn vị xử lý phi tuyến để trích xuất tính thực chuyển đổi; đầu lớp đầu vào Nó học theo cách giám sát không giám sát (ví dụ bao gồm phân loại phân tích mẫu tương ứng) Nó học nhiều cấp độ biểu diễn cho mức độ trừu tượng khác 1.2 Mơ hình chung cho tốn học sâu Huấn luyện mơ hình trí tuệ nhân tạo cần có hai giai đoạn giai đoạn huấn luyện giai đoạn kiểm thử Với toán học có giám sát ta có cặp liệu (đầu vào, đầu ra), cịn với tốn học khơng có giám Phạm Duy Thanh đài hoa, … Dữ liệu thô thường không dạng sản phẩm vector, khơng có số chiều Thậm chí có Tensorflow hỗ trợ huấn luyện nhiều GPU số chiều số chiều lớn, phân rã ảnh màu 1000 pixel x 1000 pixel số phần tử x 1.5 Giới thiệu tập liệu rác thải 106 (3 ảnh màu thường có kênh: đỏ, lục, xanh) Đây TACO liệu hình ảnh mở chất thải số q lớn, khơng lợi cho lưu trữ tính tốn tự nhiên Nó chứa hình ảnh rác chụp môi trường đa dạng, từ bãi biển nhiệt đới đến đường Đầu mong muốn mơ hình xác định phố London Những hình ảnh dán nhãn thủ trước dựa vào tập nhãn liệu Q trình huấn cơng phân đoạn theo phân loại phân cấp để đào tạo liệu ép buộc mơ hình học theo tập liệu nhãn Sau đánh giá thuật toán phát đối tượng học trích xuất đặc trưng ta thu Hiện máy chủ có 1500 hình ảnh với 4784 đặc trưng trích xuất cho liệu thơ đầu vào data thích Những thích dán nhãn 60 Những đặc trưng trích xuất dùng để huấn danh mục thuộc 28 mục lớn luyện thuật toán phân loại, phân cụm, quy hồi…ở phía sau Hình 3: Một vài hình ảnh TACO 1.2.2 Giai đoạn kiểm thử Xây dựng mơ hình 2.1 Mô tả vấn đề Bước đơn giản nhiều Với liệu thô đầu vào mới, ta sử dụng mơ hình huấn luyện để tạo Xã hội ngày đông đúc phát triển, đồng nghĩa vector đặc trưng Vector đặc trưng đưa vào thuật với vấn đề giải vệ sinh rác thải dần trở tốn học giai đoạn huấn luyện để dự thành tốn khó quyền đốn đầu nhiều tỉnh thành phố, việc sử dụng nhân công vệ 1.3 Kỹ thuật Single Shot Multibox Detector sinh để thu gom rác phương án phổ biến Chiếc xe thu gom rác xuất Single Shot Multibox Detector (SSD) thuật nẻo đường trở thành hình ảnh quen thuộc với người tốn phổ biến phát đối tượng Nó thường dân lẫn khách du lịch đến nơi Nhưng sử dụng lao nhanh Faster Region-based Convolutional Network động tay chân tiếp xúc với rác thải hay điều kiện thời (Faster RCNN) thiết kế để phát đối tượng tiết khơng thuận lợi gây nhiều vấn đề tính thời gian thực hiệu sức khoẻ người Việc thuê nhân công, áp dụng biện pháp bảo hộ, sản xuất loại xe Tên mơ hình có ý nghĩa: công ty môi trường làm tốn lượng chi phí to Single Shot: Có nghĩa việc định vị phân loại lớn, chưa kể đến chất lượng sống thấp sức khoẻ đối tượng thực phase từ phận người công nhân lao động đầu đến cuối MultiBox: Tên kĩ thuật khung vị trí Nhận thấy vấn đề nảy sinh biện pháp thu Detector: Mạng có khả nhận biết phân gom rác truyền thống vốn chiếm vị trí độc tơn loại đối tượng biện pháp thu gom rác thải nước ta, kèm phát triển vượt bậc công nghệ năm gần Hình 2: Rác thải đinh vị SSD đây, ứng dụng thực tiễn máy móc 1.4 Ứng dụng thư viện Tensorflow Python để xây sống cải thiện chất lượng sống dựng mơ hình nhận dạng rác người, đặc biệt khả tiềm tàng trí tuệ nhân tạo dần giải phóng khỏi công việc đặt Tensorflow khung xương mã nguồn mở cho nặng sức khoẻ tính mạng người deep learning viết Python Với API bậc cao, dễ sử dụng, dễ mở rộng, Tensorflow giúp người dùng Tác giả đề xuất nghiên cứu đề tài “Xây Dựng Mô xây dựng deep learning mơ hình cách đơn giản Hình Trí Tuệ Nhân Tạo Vào Phân Loại Rác Thải Trên Những lý nên chọn Tensorflow để bắt đầu: Tensorflow ưu tiên trải nghiệm người lập trình Tensorflow sử dụng rộng rãi doanh nghiệp cộng đồng nghiên cứu Tensorflow giúp dễ dàng biến thiết kế thành HỘI NGHỊ TỔNG KẾT HOẠT ĐỘNG SINH VIÊN NGHIÊN CỨU KHOA HỌC VÀ NHÓM SRT NĂM HỌC 2019-2020 Thiết Bị Nhúng”, thành công tạo tiền đề để ứng Số nhãn gồm backround, nhãn phân loại dụng, mở rộng mơ hình cho việc phát triển hồn thiện (can, bottle, plastic bag, other) Batch size=32, biện pháp thu gom rác thay hoàn toàn learning rate=0.005 giải vấn đề biện pháp cũ mang lại 2.4 Tối ưu hố mơ hình máy tính nhúng Việc sử dụng biện pháp với máy móc thay nhân cơng hiệu hơn, chất lượng sống tốt đặc biệt Để giảm số lượng tính tốn cần thiết mơ hình mang đến môi trường thấy rõ bước tiến sử dụng cho việc kiểm thử, loại bỏ cơng nghệ đại đời sống số phần mơ hình cần cho huấn luyện Ví dụ: 2.2 Xây dựng liệu Loại bỏ tính tốn sử dụng cho huấn TACO cung cấp cho nghiên cứu 1500 hình luyện Những hình chia thành hai tập hợp: Loại bỏ phần mơ hình khơng sử dụng trình kiểm thử Bộ liệu để huấn luyện: 1200 hình ngẫu Chuyển đổi Float32 sang int8 nhiên Triển khai đánh giá Bộ liệu để kiểm thử: 300 hình cịn lại 3.1 Kết đánh giá tập liệu kiểm thử Mơ hình trí tuệ nhân tạo cần có số lượng lớn liệu để trích xuất đặc trưng Tuy TACO Hình 5: Bottle phát cung cấp 1500 ảnh đa dạng phong phú rác Trong tốn phát đơi tượng cần có thải thật không đủ so với nhu cầu mô nhiều thông số, khái niệm Intersection hình, phải làm giàu liệu để đáp ứng nhu cầu over Union (IoU), độ xác, mát… để đánh giá mơ hình cách xoay trái, phải lật hình, kéo hình, từ mơ hình làm tăng thêm số ảnh đầu vào IoU đơn giản số đánh giá Mọi thuật 2.3 Thiết lập thơng số cho Tensorflow tốn có khả dự đốn khung vị trí làm đầu Mơ hình lõi SSD mobilenet V2 có tên gọi đánh giá thông qua IoU Để áp dụng Bottleneck Residual block, block có nhóm: IoU để đánh giá object detector ta cần: Nhóm 1x1 convolution với ReLU6 Những khung định vị đối tượng Nhóm thứ depthwise convolution Lớp thứ tổ hợp 1×1 convolution khác khoanh vùng đánh nhãn tay sử dụng khơng có phi tuyến tính tập test Những khung định vị dự đoán mơ hình sinh Hình 4: Mơ hình mobilenet V2 với lớp Mơ hình lõi khởi tạo từ mơ hình huấn luyện IoU tính cách lấy diện tính phần chồng lên Google thay khởi tạo ngẫu nhiên khung định vị dự đoán khung định vị đối tượng chia cho diện tích phần hợp - hay đơn giản diện tích mà hai khung định vị chiếm Ở mơ hình này, IoU phải lớn 50% trả khung định vị dự đoán Độ xác mát hai thông số quan trọng việc đánh giá tính hiệu mơ hình Độ xác tính số nhãn dự đoán chia cho tổng số nhãn mơ hình Mất mát tính số nhãn dự đốn thiếu chia cho tổng số nhãn mơ hình Bên cạnh dự đốn sai thơng số dùng để đánh giá mơ hình Dự đốn sai tính số nhãn dự đoán sai chia cho tổng số nhãn dự đoán Dưới thơng số mơ hình Độ xác trung bình: 0.440 Mất mát trung bình: 0.560 Dự đoán sai: 0.414 Phạm Duy Thanh 3.2 Xây dựng giao diện kiểm thử phải lớn 0.5) 3.3 Đánh giá kết Kết mơ hình trả độ xác khả quan, cho thấy hiệu mơ hình, từ đem mô hình áp dụng hệ thống hay thiết bị lớn nhằm đem lại lợi ích to lớn Hình 6: Giao diện kiểm thử mô hinh Tài liệu tham khảo Tại giao diện này, thấy khung định vị, nhãn số IoU vật thể (chỉ số [1] Các báo định vị vật thể trí tuệ nhân tạo [2] Cái báo phân loại vật thể trí tuệ nhân tạo [3] Các tài liệu tensorflow [4] Các tài liệu tối ưu hóa mơ hình [5] https://www.pyimagesearch.com/2016/11/07/intersection-over- union-iou-for-object-detection/ [6] https://towardsdatascience.com/review-mobilenetv2-light-weight- model-image-classification-8febb490e61c [7] http://tacodataset.org/ [8] https://machinelearningcoban.com/general/2017/02/06/ featureengineering/