1. Trang chủ
  2. » Luận Văn - Báo Cáo

Nghiên cứu ứng dụng các kĩ thuật thị giác máy hỗ trợ phân loại tự động phản hồi công dân

77 2 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 77
Dung lượng 3,16 MB

Nội dung

i LỜI CAM ĐOAN Tôi xin cam đoan cơng trình nghiên cứu khoa học độc lập riêng hướng dẫn khoa học TS Nguyễn Thế Cường Các nội dung nghiên cứu, kết đề tài trung thực chưa công bố hình thức trước Các số liệu sử dụng phân tích luận văn có nguồn gốc rõ ràng, công bố theo quy định Những kết nghiên cứu luận văn tơi tự tìm hiểu, phân tích cách trung thực, khách quan phù hợp với thực tiễn Thanh Hố Các kết chưa cơng bố nghiên cứu khác Tôi xin cam đoan./ Ngƣời cam đoan Trƣơng Viết Ngọc ii LỜI CẢM ƠN Để hồn thành đề tài luận văn thạc sĩ cách hoàn chỉnh, bên cạnh nỗ lực cố gắng thân cịn có hướng dẫn nhiệt tình q Thầy Cơ, động viên ủng hộ gia đình bạn bè suốt thời gian học tập nghiên cứu thực luận văn thạc sĩ Xin chân thành bày tỏ lòng biết ơn đến Thầy TS Nguyễn Thế Cường người hết lòng giúp đỡ tạo điều kiện tốt cho tơi hồn thành luận văn Xin chân thành bày tỏ lịng biết ơn đến tồn thể quý thầy cô khoa Công nghệ thông tin Truyền thơng, Trường Hồng Đức Thanh Hố tận tình truyền đạt kiến thức quý báu tạo điều kiện thuận lợi cho suốt trình học tập nghiên cứu thực đề tài luận văn Xin chân thành bày tỏ lịng biết ơn đến Phịng kỹ thuật hình sự, Phịng Cảnh sát PCCC CNCH Cơng an tỉnh Thanh Hố, Phịng Hậu cần, đội ngũ kỹ sư thuộc cơng ty Cổ phần ThinkLABs không ngừng hỗ trợ tạo điều kiện tốt cho suốt thời gian nghiên cứu thực luận văn Cuối cùng, tơi xin chân thành cảm ơn đến gia đình, anh chị bạn đồng nghiệp hỗ trợ cho tơi nhiều suốt q trình học tập, nghiên cứu thực đề tài luận văn thạc sĩ cách hồn chỉnh Thanh hố, tháng 11 năm 2019 Học viên thực Trƣơng Viết Ngọc iii MỤC LỤC LỜI CAM ĐOAN i LỜI CẢM ƠN ii MỤC LỤC iii DANH MỤC HÌNH ẢNH v MỞ ĐẦU 1 Tính cấp thiết đề tài Mục đích đề tài Phương pháp nghiên cứu Kết đạt Nội dung nghiên cứu CHƢƠNG 1: GIỚI THIỆU BÀI TOÁN 1.1 Hệ thống tiếp nhận trả lời phản hồi công dân 1.2 Bài tốn phân loại phản hồi cơng dân dựa hình ảnh phản hồi 1.3 Những vấn đề cần lưu ý phân lớp ảnh 1.4 Kết luận chương 10 CHƢƠNG 2: TỔNG QUAN VỀ PHÂN LỚP ẢNH 11 2.1 Bài toán phân lớp ảnh 11 2.1.1 Khái niệm 11 2.1.2 Quá trình phân lớp ảnh 12 2.1.3 Ứng dụng toán phân lớp ảnh thực tế 13 2.2 Các phương pháp biểu diễn ảnh mơ hình phân lớp 14 2.2.1 Tổng quan biểu diễn ảnh 14 2.2.2 Mơ hình “Bag of Words” 15 2.3 Đặc trưng ảnh 16 2.3.1 Đặc trưng hình ảnh tìm kiếm ảnh theo nội dung 17 2.3.2 Đặc trưng màu sắc 18 2.3.3 Đặc trưng kết cấu 20 2.3.4 Đặc trưng hình dạng 20 2.3.5 Đặc trưng cục bất biến 21 2.4 Lựa chọn đặc trưng 27 2.5 Các phương pháp tìm kiếm ảnh theo nội dung 28 iv 2.5.1 Phương pháp PageRank cho tìm kiếm ảnh sản phẩm 28 2.5.2 CueFlik: Một phương pháp xếp hạng lại ảnh dựa luật người dùng 30 2.5.3 Phương pháp tìm kiếm ảnh dựa màu sắc, hình dạng, kết cấu ảnh 32 2.5.4 Phương pháp tìm kiếm ảnh dựa vào nội dung sử dụng phân vùng ảnh mẫu truy vấn 34 2.6 Các phương pháp phân lớp ảnh 35 2.6.1 Phương pháp phân lớp K-means 39 2.6.2 Phương pháp dựa định lý Bayes (Naïve Bayes) 44 2.6.3 Phương pháp Support Vector Machine (SVM) 46 2.6.4 Phương pháp K láng giềng gần (K-Nearest Neighbor – KNN) 47 2.6.5 Phương pháp Linear Least Square Fit (LLSF) 48 2.6.6 Phương pháp centroid-based vector 49 2.7 Kết luận chương 50 CHƢƠNG 3: PHÂN LỚP DỰA TRÊN ĐA ĐẶC TRƢNG VÀ ỨNG DỤNG PHÂN LOẠI PHẢN HỒI CÔNG DÂN 52 3.1 Phân lớp dựa đa đặc trưng 52 3.1.2 Tổng quan 52 3.1.2 Mơ hình phần lớp dựa tổ hợp đa đặc trưng 56 3.2 IBM Watson Studio 59 3.2.1 Cấu trúc liệu huấn luyện 60 3.2.2 Cập nhật liệu huấn luyện 61 3.3.3 Quy định kích thước liệu 62 3.3 Xây dựng liệu huấn luyện 62 3.4 Chức gợi ý phân loại phản hồi công dân 65 3.5 Kết luận chương 67 KẾT LUẬN & HƢỚNG PHÁT TRIỂN 69 TÀI LIỆU THAM KHẢO 70 v DANH MỤC HÌNH ẢNH Hình 1: Mơ hình tổng quan hệ thống tiếp nhận trả lời công dân Hình 2: Hình ảnh ô nhiễm môi trường (nguồn: Internet) Hình 3: Phân lớp đối tượng dựa nhận diễn đối tượng ảnh [8] 11 Hình 4: Mơ hình tổng qt hệ thống phân lớp đối tượng ảnh [8] 12 Hình 5: Biểu đồ mơ việc tính tốn DoG ảnh từ ảnh kề mờ [5] 24 Hình 6: Mỗi điểm ảnh so sánh với 26 láng giềng điểm ảnh 24 Hình 7: Quá trình lựa chọn điểm hấp dẫn a Ảnh gốc, b Các điểm hấp dẫn phát hiện, c Ảnh sau loại bỏ điểm hấp dẫn có độ tương phản thấp, d Ảnh sau loại bỏ điểm hấp dẫn dọc theo cạnh 25 Hình 8: Biểu diễn vector đặc trưng 26 Hình 9: Tổng quan mơ hình hệ thống tìm kiếm ảnh theo màu sắc, kết cấu hình dạng [1] 32 Hình 10: Biểu diễn đối tượng hệ toạ độ X, Y 41 Hình 11: Biểu diễn đối tượng tâm nhóm hệ toạ độ 42 Hình 12: Biểu diễn lại đối tượng tâm nhóm đối tượng 43 Hình 13: Ví dụ mơ hình SVM (nguồn Internet) 46 Hình 14: Các giai đoạn biểu diễn đặc trưng ảnh [2] 52 Hình 15: Biểu diễn đa đặc trưng ảnh [2] 53 Hình 16: Phân lớp ảnh với m vector đặc trưng ảnh [2] 54 Hình 17: So sánh cách tiếp cận: đơn đặc trưng đa đặc trưng [3] 54 Hình 18: Phân lớp ảnh biểu diễn m vector vào L lớp cho trước [3] 56 Hình 19: Kiến trúc mơ hình phân lớp ảnh đa đặc trưng 57 Hình 20: Các tiến trình hoạt động việc phân lớp có sử dụng chức nhận dạng hình ảnh Watson Studio (ibm.com) 60 Hình 21: Ví dụ việc xây dựng lớp phủ định 61 Hình 22: Cập nhật liệu huấn luyện 61 Hình 23: Danh sách lớp liệu huấn luyện Watson Studio 63 Hình 24: Danh sách ảnh thuộc tập liệu huấn luyện mơi trường 63 Hình 25: Danh sách ảnh thuộc tập liệu huấn luyện giao thơng 64 Hình 26: Danh sách ảnh thuộc tập liệu huấn luyện an ninh trật tự 64 Hình 27: Danh sách ảnh thuộc tập liệu huấn luyện du lịch 65 Hình 28: Danh sách ảnh thuộc tập liệu huấn luyện du lịch 65 vi Hình 29: Giao diện cho phép tải lên ảnh 66 Hình 30: Chức thể mức độ phù hợp ảnh tải lên với lĩnh vực môi trường 66 Hình 31: Chức thể mức độ phù hợp ảnh tải lên với lĩnh vực giao thông 67 Hình 32: Chức thể mức độ phù hợp ảnh tải lên với lĩnh vực mơi trường có liên quan đến du lịch an ninh trật tự 67 MỞ ĐẦU Tính cấp thiết đề tài Thanh Hoá tỉnh mạnh việc áp dụng công nghệ thông tin vào công tác quản lý, giảm thủ tục hành chính, tăng tính kết nối cho người dân quyền Hiện UBND Tỉnh ban hành nhiều định nhằm tạo nên khung pháp lý tạo sở pháp lý để tổ chức, cá nhân tham gia vào q trình xây dựng quyền điện tử dịch vụ thành phố thông minh - Quyết định 2538/QĐ-UBND phê duyệt đề án xây dựng Chính quyền điện tử phát triển dịch vụ thành phố thơng minh tỉnh Thanh Hóa, giai đoạn 2017 – 2020 - Quyết định 3089/QĐ-UBND ngày 22/8/2017 phê duyệt Kiến trúc Chính quyền điện tử tỉnh Thanh Hóa - Quyết định 1025/QĐ-UBND ngày 04/4/2017, ban hành Kế hoạch hành động đẩy mạnh cải cách hành chính, cải thiện mạnh mẽ môi trường đầu tư kinh doanh, hỗ trợ phát triển doanh nghiệp nâng cao lực cạnh tranh tỉnh Thanh Hóa giai đoạn 2016 – 2020 Gần Chính Phủ có Nghị số 17/NQ-CP ngày 07/3/2019 Chính phủ, số nhiệm vụ, giải pháp trọng tâm phát triển Chính phủ điện tử giai đoạn 2019 - 2020, định hướng đến 2025; Về phía tỉnh Thanh Hố tỉnh có Quyết định số 1118/QĐ-UBND ngày 29/03/2019 Chủ tịch UBND việc ban hành kế hoạch hành động thực Nghị số 17/NQ-CP Tuy nhiên, việc tiếp nhận phản ánh để kịp thời giải quyết, tháo gỡ khó khăn, vướng mắc, kiến nghị, đề xuất doanh nghiệp, người dân thực theo kênh truyền thống như: - Chủ tịch UBND tỉnh trì lịch tiếp doanh nghiệp lịch tiếp công dân định kỳ hàng tháng - Thông qua kênh tiếp nhận giải văn truyền thống - Thông qua báo đài phương tiện thông tin đại chúng, hay đầu mối tiếp dân địa phương Các kênh kết nối nhiều hạn chế, thủ tục phức tạp, trình tiếp nhận xử lý tốn nhiều thời gian, cơng sức nên thu hút chủ động tham gia đóng góp ý kiến người dân doanh nghiệp Vì vậy, u cầu thực tế địi hỏi hệ thống với mục đích tăng cường tính kết nối người dân, doanh nghiệp quyền, giảm thủ tục hành chính, tiết kiệm thời gian chi phí cho việc kết nối người dân quyền Một vấn đề cần phải giải xây dựng hệ thống kết nối người dân việc phân loại tự động phản hồi người dân Việc phân loại tự động hỗ trợ hệ thống giảm thời gian xử lý phản hồi, từ tăng hiệu xử lý cơng việc Từ yêu cầu đặt thực tế, chọn thực đề tài “Nghiên cứu ứng dụng kĩ thuật thị giác máy hỗ trợ phân loại tự động phản hồi cơng dân” nhằm tìm kiếm xây dựng giải pháp phân loại tự động phản hồi công dân dựa ảnh chụp làm liệu đầu vào cho hệ thống tiếp nhận xử lý phản hồi cơng dân Tỉnh Thanh Hố Mục đích đề tài - Nghiên cứu tốn phân loại ảnh nói chung tốn phân loại phản hồi công dân dựa ảnh chụp hoạt động phủ điện tử nói riêng - Nghiên cứu thuật tốn học máy có giám sát sử dụng phân loại ảnh số - Đề xuất giải thuật phân loại phản hồi công dân dựa ảnh chụp áp dụng hoạt động tiếp nhận xử lý phản hồi công dân - Xây dựng demo hệ thống kiểm thử đánh giá 3 Phƣơng pháp nghiên cứu Đề tài sử dụng hai phương pháp nghiên cứu chính: phương pháp nghiên cứu lý thuyết phương pháp nghiên cứu thực nghiệm - Phương pháp nghiên cứu lý thuyết: nghiên cứu tài liệu quy trình cơng nghệ liên quan; phân tích, tổng hợp tài liệu kỹ thuật học máy, phương pháp, kỹ thuật phân loại ảnh số - Phương pháp nghiên cứu thực nghiệm: phân tích yêu cầu thực tế toán cách thức thu nhận thông tin phản hồi từ cá nhân, doanh nghiệp; phương pháp, kỹ thuật phân loại văn bản; thiết kế, xây dựng, đánh giá kiểm tra kết hoạt động thuật toán Kết đạt đƣợc - Áp dụng thuật toán học máy có giám sát vào phân loại phản hồi cơng dân dựa ảnh chụp hoạt động hệ thống tiếp nhận trả lời phản hồi công dân Tỉnh Thanh Hố - Giải thuật hoạt động có độ xác cao, hiệu việc hỗ trợ phân loại văn tự động, có thời gian xử lý đáp ứng yêu cầu Nội dung nghiên cứu Nội dung luận văn gồm chương sau: Chƣơng 1: Giới thiệu tốn Luận văn trình bày tổng quan tốn phân loại phản hồi cơng dân dựa liệu đầu vào ảnh cung cấp người dân doanh nghiệp Luận văn vấn đề cần xử lí tốn phân lớp ảnh Chƣơng 2: Tổng quan phân lớp ảnh Luận văn trình bày tổng quan tốn phân lớp ảnh nói chung q trình phân lớp ảnh thường dựa vào đặc trưng ảnh Luận văn trình bày đặc trưng ảnh, cách lựa chọn đặt trưng phương pháp tìm kiếm ảnh, phân lớp ảnh dựa đặc trưng Chƣơng 3: Phân lớp ảnh dựa đa đặc trƣng ứng dụng phân loại phản hồi công dân Luận văn trình bày tổng quan phân lớp dựa đa đặc trưng Luận văn giới thiệu dịch vụ phân lớp dựa đa đặc trưng IBM Watson Studio, dịch vụ cho phép tạo phân lớp liệu ảnh xây dựng người dùng Luận văn trình bày cách tiếp cận việc sử dụng phân lớp việc phân loại phản hồi cơng dân, qua hỗ trợ công tác tiếp nhận phản hồi công dân cổng thông tin tiếp nhận phản ánh kiến nghị thuộc dịch vụ thành phố thông minh Kết luận hƣớng phát triển 57 Hình 19: Kiến trúc mơ hình phân lớp ảnh đa đặc trưng Khi đó, thuật tốn phân lớp có sử dụng đa đặc trưng thể sau: 3.1.2.2 Tầng phân lớp đơn Tầng phân lớp đơn gồm m phân lớp đơn CLi, i=1m Mỗi phân lớp đơn cho kết luận độ thuộc vào L lớp ảnh đầu vào dựa theo vector 58 đặc trưng tương ứng rút trích Tầng phân lớp đơn gồm m phân lớp = m vector đặc trưng ảnh đầu vào Các đặc trưng ảnh đầu vào kết chiếu ảnh đầu vào xuống không gian khác Các phân lớp tầng phân lớp đơn ánh xạ m vector đặc trưng không gian độ thuộc L chiều 3.1.2.3 Module chuyển đổi Module chuyển đổi: Tìm mối tương quan đầu m phân lớp đơn Đầu phân lớp đơn vector độ thuộc vào L lớp định nghĩa trước Vì vậy, đầu phân lớp đơn vector độ thuộc L chiều Như vậy, module chuyển đổi biến đổi ma trận m x L gồm m dòng L cột (tất đầu tầng phân lớp đơn) thành ma trận m x L dựa theo mối tương quan đầu thay chuyển thẳng đầu tầng phân lớp đơn vào tầng tích hợp để hợp kết phân lớp Chuẩn hóa vector độ thuộc đầu thành vector xác suất tương ứng nhằm xác định tầm quan trọng đầu phân lớp đơn Vì có m vector độ thuộc đầu nên ta có ma trận độ thuộc gồm m dòng L cột ứng với m phân lớp đơn m vector đặc trưng ảnh đầu vào, L lớp cần phân loại Như vậy, trình xử lí module chuyển đổi gồm bước: i Chuẩn hóa vector đầu nhằm phản ảnh tầm quan trọng đầu phân lớp đơn ii Biến đổi ma trận đầu dùng hệ số tương quan Dữ liệu đầu sau chuẩn hóa theo phân bố tập trung dạng vector xác suất thuộc [0,1] nên hệ số tương quan theo dạng Gauss phù hợp Bộ hệ số phản ánh tầm ảnh hưởng tất đầu tất phân lớp đến vị trí đầu cụ thể Năng lượng ảnh hưởng = tương quan vị trí * giá trị, sau dùng hàm lấy max để giữ giá trị lớn triệt tiêu giá trị bé 59 3.1.2.4 Tầng tích hợp Tầng tích hợp phân lớp với đầu vào kết luận phân lớp tầng trước sau qua module chuyển đổi (để phản ánh mối tương quan đặc trưng) Đầu tầng tích hợp kết phân lớp cuối (hợp m kết luận phân lớp đơn) Như vậy, đầu tầng tích hợp vector độ thuộc L chiều Sau đó, dựa giá trị lớn độ thuộc để kết luận ảnh đầu vào thuộc vào L lớp cho trước Mơ hình đa tầng hợp mức định (các kết phân lớp đơn) thay hợp mức đặc trưng Tầng tích hợp hợp kết m phân lớp đơn kết luận phân lớp cuối theo cách tiếp cận kết hợp trễ Tầng tích hợp đóng vai trị xác định tầm quan trọng kết luận phân lớp đơn thay hợp theo dạng trung bình (đánh đồng tầm quan trọng phân lớp đơn) hay hợp theo dạng đa số (kết luận cuối tuân theo số đông) 3.2 IBM Watson Studio IBM Watson Studio mắt năm 2018, chức sử dụng để tăng tính trải nghiệm Khoa Học Dữ Liệu IBM (IBM Data Science) với nhiều tính thú vị Các nhà nghiên cứu liệu, kỹ sư liệu lập trình viên sử dụng Watson Studio để tạo workflow AI theo dạng end-to-end từ bước truy cập chuẩn bị liệu, xây mơ hình triển khai mơ hình để xây dựng ứng dụng 60 Hình 20: Các tiến trình hoạt động việc phân lớp có sử dụng chức nhận dạng hình ảnh Watson Studio (ibm.com) 3.2.1 Cấu trúc liệu huấn luyện Một phân lớp xây dựng gồm nhóm lớp đào tạo với Các phân lớp hỗ trợ kiểu phân loại cho nhiều lớp xác định đối tượng chun mơn hố cung cấp bảng đánh giá lớp khác Có nghĩa ảnh thuộc vào nhiều lớp khác độ phù hợp khác Trong trình huấn luyện lớp tạo tải lên tệp nén (.zip) riêng ví dụ tích cực cho lớp Ví dụ: để tạo trình phân loại gọi "trái cây", bạn tải lên tệp zip hình ảnh lê, tệp zip hình ảnh táo tệp zip hình ảnh chuối Chúng ta cung cấp tệp zip ví dụ tiêu cực lệnh gọi đào tạo để tiếp tục trau dồi trình phân loại bạn Các tệp ví dụ phủ định khơng sử dụng để tạo lớp Đối với phân lớp "trái cây", bạn cung cấp tệp zip với hình ảnh loại rau khác 61 Hình 21: Ví dụ việc xây dựng lớp phủ định 3.2.2 Cập nhật liệu huấn luyện Chúng ta cập nhật trình phân loại có cách thêm lớp cách thêm hình ảnh vào lớp có Để cập nhật trình phân loại có, sử dụng số tệp nén (.zip), bao gồm tệp chứa hình ảnh dương âm (.jpg png) Chúng ta phải cung cấp tệp nén có chứa ví dụ tích cực tiêu cực bổ sung Hình 22: Cập nhật liệu huấn luyện 62 3.3.3 Quy định kích thước liệu Có giới hạn kích thước cho gọi đào tạo liệu - Dịch vụ chấp nhận tối đa 10.000 hình ảnh 100 MB cho tệp zip - Dịch vụ yêu cầu tối thiểu 10 hình ảnh cho tệp zip - Dịch vụ chấp nhận tối đa 256 MB cho gọi đào tạo - Kích thước tối thiểu đề xuất hình ảnh 32X32 pixel Cũng có giới hạn kích thước bạn phân loại hình ảnh Hạn chế cho phương pháp phân loại hình ảnh: - Kích thước hình ảnh tối đa 10 MB - Kích thước tệp zip tối đa 100 MB với tối đa 20 hình ảnh 3.3 Xây dựng liệu huấn luyện Dữ liệu huấn luyện xây dựng cho lớp lĩnh vực quan tâm: - Môi trường - Giao thông - An ninh trật tự - Du lịch - Hành cơng Các liệu sau thu thập đểu xử lý cho phù hợp với u cầu mơ hình phân lớp Dữ liệu tải lên điện toán đám mây IBM nên yêu cầu tối thiểu kích thước 63 Hình 23: Danh sách lớp liệu huấn luyện Watson Studio (nguồn: ThinkLABS JSC) Cụ thể tập liệu mô tả sau: a Về lĩnh vực môi trường Số ảnh mẫu thu thập 291 ảnh, gồm ảnh thuộc nhiều lĩnh vực môi trường như: ô nhiễm không khí, nhiễm nguồn nước, rác thải, Hình 24: Danh sách ảnh thuộc tập liệu huấn luyện môi trường (nguồn: ThinkLABs JSC) b Lĩnh vực giao thông: Cơ sở liệu huấn luyện gồm 524 ảnh, liên quan đến nhiều chủ đề 64 giao thông tai nạn giao thông, đua xe, va chạm ô tô/xe máy, cơng trình giao thơng, Hình 25: Danh sách ảnh thuộc tập liệu huấn luyện giao thông (nguồn: ThinkLABs JSC) c Lĩnh vực an ninh trật tự Cơ sở liệu ảnh bao gồm 453 ảnh thuộc vấn đề liên quan đến an ninh trật tự như: trộm cắp tài sản, đánh nhau, đánh ghen, tụ tập đơng người, bạo lực trẻ em, … Hình 26: Danh sách ảnh thuộc tập liệu huấn luyện an ninh trật tự (nguồn: ThinkLABs JSC) d Lĩnh vực du lịch 65 Cơ sở liệu ảnh bao gồm 182 ảnh Hình 27: Danh sách ảnh thuộc tập liệu huấn luyện du lịch (nguồn: ThinkLABs JSC) e Lĩnh vực hành cơng Số lượng ảnh sở liệu huấn luyện 54 ảnh Hình 28: Danh sách ảnh thuộc tập liệu huấn luyện du lịch (nguồn: ThinkLABs JSC) 3.4 Chức gợi ý phân loại phản hồi công dân Căn vào mơ hình phân loại xây dựng, tác giả xây dựng demo chức phân loại phản hồi ảnh từ công dân Chức cho phép nhận ảnh liệu đầu vào xác định lĩnh vực liên quan phản hồi 66 lĩnh vực số lĩnh vực huấn luyện Một ảnh liên quan đến nhiều chủ đề Khi đó, tuỳ thuộc vào độ phù hợp ảnh lĩnh vực mà lựa chọn lĩnh vực phù hợp với ảnh lựa chọn Hình 29: Giao diện cho phép tải lên ảnh Hình 30: Chức thể mức độ phù hợp ảnh tải lên với lĩnh vực mơi trường 67 Hình 31: Chức thể mức độ phù hợp ảnh tải lên với lĩnh vực giao thơng Hình 32: Chức thể mức độ phù hợp ảnh tải lên với lĩnh vực mơi trường có liên quan đến du lịch an ninh trật tự 3.5 Kết luận chƣơng Trong chương luận văn trình bày tổng quan phân lớp dựa đa đặc trưng Luận văn giới thiệu dịch vụ phân lớp dựa đa 68 đặc trưng IBM Watson Studio, dịch vụ cho phép tạo phân lớp liệu ảnh xây dựng người dùng Luận văn trình bày cách tiếp cận việc sử dụng phân lớp việc phân loại phản hồi cơng dân, qua hỗ trợ công tác tiếp nhận phản hồi công dân cổng thông tin tiếp nhận phản ánh kiến nghị thuộc dịch vụ thành phố thông minh 69 KẾT LUẬN & HƢỚNG PHÁT TRIỂN  Những kết đạt đƣợc Sau thực luận văn với chủ đề việc ứng dụng kỹ thuật xử lý ảnh để hỗ trợ trình phân loại phản hồi công dân thu kết sau đây: - Hiểu vai trò việc phân lớp ảnh toán thực tế liên quan đến lĩnh vực nhận dạng phân lớp ảnh - Hiểu tổng quan việc phân lớp ảnh, phương pháp biểu diễn ảnh, phương pháp trích chọn đặc trưng ảnh Ngồi cịn hiểu phương pháp phân lớp ảnh, ưu nhược điểm phương pháp - Biết cách xây dựng mô hình phân lớp ảnh, xây dựng liệu huấn luyện biết sử dụng công cụ để xây dựng mơ hình cho phép phân lớp ảnh với nhiều lớp cho trước - Thử nghiệm chức phân lớp ảnh demo chức phân lớp ảnh với đầu vào liệu người dùng cung cấp  Hƣớng pháp triển Hướng phát triển luận văn tập trung vào việc hoàn thiện liệu ảnh huấn luyện Từ đó, triển khai sử dụng giao diện lập trình (API) cung cấp IBM Watson Studio để triển khai ứng dụng thực tế Từ tăng khả tiếp nhận phản hồi hệ thống tiếp nhận phản ảnh kiến nghị công dân, thuộc dịch vụ thành phố thông minh 70 TÀI LIỆU THAM KHẢO * Tiếng Việt Dương Văn Cường, “Nghiên cứu số phương pháp trích chọn đặc trưng cho ảnh ứng dụng toán phân loại cảm xúc khuôn mặt,” Đại học CNTT TT, Đại học Thái Nguyên, 2018 Trần Sơn Hải (2012), “Tổng quan Bài toán phân lớp ảnh đa đặc trưng,” vol 1, pp 36–44 Trần Sơn Hải, Lê Hoàng Thái Nguyễn Thanh Thuỷ (2018), “Phân lớp ảnh dựa tổ hợp đa đặc trưng,” Tạp chí khoa học Trường ĐH Sư phạm TP Hồ Chí Minh, pp 67–81 Trịnh Lê Hùng, Mai Đình Sinh (2014), “Phát phân loại vết dầu biển từ tư liệu ảnh ENVISAT sử dụng phương pháp lọc thích nghi Fuzzy logic”, Tạp chí Dầu khí, số 05, tr.49-55 Nguyễn Hồng Phúc (2013), “Nghiên cứu phương pháp truy vấn ảnh dựa đặc trưng hình dạng”, Luận văn Thạc sĩ Công nghệ thông tin, Trường Đại học Đồng Nai Nguyễn Đức Năng (2013), “Nghiên cứu xây dựng lọc ảnh thông qua phân loại ảnh kết hợp với gom cụm”, Luận văn thạc sĩ Công nghệ thông tin, Đại học Đồng Nai Hà Minh Hải (2014), “Một số kỹ thuật gán nhãn đối tượng ảnh ứng dụng”, Luận văn thạc sĩ Công nghệ thông tin, Trường Đại học Công nghệ thông tin Truyền thông, Đại học Thái nguyên Bùi Lê Thuận (2016), Nghiên cứu phương pháp phân lớp đối tượng ảnh dựa multiple instance learning, Luận văn thạc sĩ, Đại học Công nghệ Thông tin – Đại học Quốc gia TP Hồ Chí Minh *Tiếng nƣớc ngồi D G Lowe (2004), “Distinctive image features from scale-invariant keypoints,” International Journal Computer Vision 10 D N F Awang Iskandar, J A Thom, and S M M Tahaghoghi (2008), “Content-based image retrieval using image regions as query examples,” Conf Res Pract Inf Technol Ser., vol 75, no January, pp 39–47 11 J Fogarty, D Tan, A Kapoor, and S Winder (2008), “CueFlik: Interactive concept learning in image search,” in Conference on Human Factors in Computing Systems – Proceedings 12 K P White, B Kundu, and C M Mastrangelo (2008), “Classification of defect clusters on semiconductor wafers via the hough transformation,” in IEEE Transactions on Semiconductor Manufacturing 13 L Shen, L Bai, and P Picton (2004), “Facial recognition/verification using 71 Gabor wavelets and kernel methods,” in 2004 International Conference on Image Processing, ICIP ’04., 2004, vol 3, pp 1433–1436 14 M Saad (2008), “Low-Level Color and Texture Feature Extraction for Content-Based Image Retrieval,” Final Proj Report, EE 381K MultiDimensional Digit Signal Process 15 Tee Cheng Siew (2008), “Feature selection for content-based image retrieval using statistical discriminant analysis” 16 Y Jing and S Baluja (2008), “Page rank for product image search,” in Proceeding of the 17th International Conference on World Wide Web 2008, WWW’08 17 Z Lihong and G Zikui (2011), “Face Recognition Method Based on Adaptively Weighted Block-Two Dimensional Principal Component Analysis,” in 2011 Third International Conference on Computational Intelligence, Communication Systems and Networks, pp 22–25

Ngày đăng: 17/07/2023, 23:45

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN