Luận văn thạc sĩ Chuyên ngành Khoa học máy tính

75 14 0
Luận văn thạc sĩ Chuyên ngành Khoa học máy tính

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Luận văn Thạc sĩ Khoa học máy tính. NGHIÊN CỨU CÁC PHƯƠNG PHÁP TÍNH KHOẢNG CÁCH, KẾT HỢP VỚI MÔ HÌNH MÁY HỌC ĐỂ CẢI THIỆN N NG CAO ĐỘ CHÍNH XÁC TRONG VIỆC PH N LOẠI HÌNH ẢNH. Mục tiêu của đề tài này là thu thập số lớn dữ liệu hình ảnh của 05 chủ đề Văn hóa Phi vật thể của Việt Nam từ Web và công cụ Google Image Search. Sau đó, nghiên cứu các phương pháp học số đo khoảng cách kết hợp với mô hình máy học (SVM) để cải thiện nâng cao độ chính xác trong việc phân loại hình ảnh. Hình ảnh của từng lớp chủ đề sau khi được lấy về, sẽ được xếp thứ hạng từ cao xuống thấp dựa vào chú thích, nội dung văn bản đi kèm, bằng bộ phân loại Bayes thơ ngây. Những hình ảnh có thứ hạng cao sẽ được lấy làm dữ liệu đào tạo. Trong luận văn này sẽ so sánh các phương pháp học số đo khoảng cách, kết hợp với bộ phân loại kNN để đào tạo, phân loại hình ảnh. Từ đó, lấy ra ma trận học phép đo khoảng cách của thuật toán tốt nhất làm hàm nhân (kernel) cho mô hình máy học SVM để phân loại và xếp hạng lại hình ảnh cho từng lớp chủ đề. Kết quả việc thực nghiệm chỉ ra rằng, dùng phương pháp học số đo khoảng cách kết hợp với bộ phân loại kNN để đào tạo và phân loại hình ảnh cho độ chính xác bằng hoặc cao hơn so với mô hình máy học vectơ hỗ trợ SVM.

BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC CẦN THƠ LÊ ANH TRUNG NGHIÊN CỨU CÁC PHƯƠNG PHÁP TÍNH KHOẢNG CÁCH, KẾT HỢP VỚI MƠ HÌNH MÁY HỌC ĐỂ CẢI THIỆN NÂNG CAO ĐỘ CHÍNH XÁC TRONG VIỆC PHÂN LOẠI HÌNH ẢNH LUẬN VĂN THẠC SĨ NGÀNH KHOA HỌC MÁY TÍNH MÃ SỐ 848 01 01 NĂM 2022 BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC CẦN THƠ LÊ ANH TRUNG MÃ SỐ HV: M3718020 NGHIÊN CỨU CÁC PHƯƠNG PHÁP TÍNH KHOẢNG CÁCH, KẾT HỢP VỚI MƠ HÌNH MÁY HỌC ĐỂ CẢI THIỆN NÂNG CAO ĐỘ CHÍNH XÁC TRONG VIỆC PHÂN LOẠI HÌNH ẢNH LUẬN VĂN THẠC SĨ NGÀNH: KHOA HỌC MÁY TÍNH Mã số: 848 01 01 NGƯỜI HƯỚNG DẪN TS PHẠM THẾ PHI NĂM 2022 CHẤP THUẬN CỦA HỘI ĐỒNG Luận văn này, với đề tựa "Nghiên cứu phương pháp tính khoảng cách, kết hợp với mơ hình máy học để cải thiện nâng cao độ xác việc phân loại hình ảnh", học viên Lê Anh Trung thực theo hướng dẫn TS Phạm Thế Phi Luận văn báo cáo Hội đồng chấm luận văn thông qua ngày: / / Luận văn chỉnh sửa theo góp ý Hội đồng chấm luận văn xem lại Thư ký Ủy viên (ký tên) (ký tên) Phản biện Phản biện (ký tên) (ký tên) Người hướng dẫn Chủ tịch Hội đồng (ký tên) (ký tên) LỜI CÁM ƠN Đầu tiên, xin trân trọng cảm ơn TS Phạm Thế Phi tận tình tiếp nhận, hướng dẫn cung cấp dẫn quý báu cho tơi suốt q trình thực luận văn tốt nghiệp Bên cạnh tơi xin gửi lời cảm ơn đến quý Thầy, Cô Khoa Công nghệ Thông tin Truyền thông Trường Đại học Cần Thơ tận tình giảng dạy, truyền đạt kiến thức bổ ích suốt khóa học cao học vừa qua Xin gửi lời cảm ơn đến quan, đơn vị Trường Cao đẳng nghề Đồng Tháp Trường THPT TP Sa Đéc tạo điều kiện cho tơi tham gia khóa học cao học, giúp tơi nâng cao trình độ chun môn, nghiệp vụ tiếp thu nhiều kiến thức bổ ích Cuối cùng, tơi xin gửi lời cảm ơn đến gia đình, người thân, đồng nghiệp bạn bè lớp Khoa học máy tính - K25 thường xuyên quan tâm, truyền động lực, động viên, chia sẻ kinh nghiệm cung cấp tài liệu hữu ích thời gian học tập, suốt trình thực luận văn tốt nghiệp Xin chân thành cảm ơn! Cần Thơ, ngày tháng Ký tên năm 2022 TÓM TẮT TIẾNG VIỆT Mục tiêu đề tài thu thập số lớn liệu hình ảnh 05 chủ đề "Văn hóa Phi vật thể Việt Nam" từ Web công cụ Google Image Search Sau đó, nghiên cứu phương pháp học số đo khoảng cách kết hợp với mơ hình máy học (SVM) để cải thiện nâng cao độ xác việc phân loại hình ảnh Hình ảnh lớp chủ đề sau lấy về, xếp thứ hạng từ cao xuống thấp dựa vào thích, nội dung văn kèm, phân loại Bayes thơ ngây Những hình ảnh có thứ hạng cao lấy làm liệu đào tạo Trong luận văn so sánh phương pháp học số đo khoảng cách, kết hợp với phân loại kNN để đào tạo, phân loại hình ảnh Từ đó, lấy ma trận học phép đo khoảng cách thuật tốn tốt làm hàm nhân (kernel) cho mơ hình máy học SVM để phân loại xếp hạng lại hình ảnh cho lớp chủ đề Kết việc thực nghiệm rằng, dùng phương pháp học số đo khoảng cách kết hợp với phân loại kNN để đào tạo phân loại hình ảnh cho độ xác cao so với mơ hình máy học vectơ hỗ trợ SVM ABSTRACT The objective of this study is to collect a large amount of image data of 05 topics “Intangible Culture of Vietnam” from the Web and Google Image Search Then, studying distance measurement methods combined with machine learning model (SVM) aims to improve accuracy in image classification Based on captions and accompanying text content, the images of each topic class, after being retrieved, were ranked from high to low by Naive BayesClassifiers The images with high ranking were taken as training data In this thesis, distance data learning methods, combined with kNN classifiers to train and classify images were compared From there, the distance data learning matrix of the best algorithm as a kernel function for the SVM machine learning model were taken out to classify and rerank the images for each topic class The experimental results show that using the distance data learning method combined with the kNN classifier to train and classify the images, the accuracy is equal to or higher than that of the support vector machine learning model (SVM) LỜI CAM ĐOAN Tôi xin cam đoan luận văn “Nghiên cứu phương pháp tính khoảng cách, kết hợp với mơ hình máy học để cải thiện nâng cao độ xác việc phân loại hình ảnh” hồn thành tơi nghiên cứu, tìm hiểu thực hướng dẫn TS Phạm Thế Phi Các thông tin sử dụng tham khảo đề tài luận văn thu thập từ nguồn tin cậy, kiểm chứng, công bố rỗng rãi tơi trích dẫn nguồn gốc rõ ràng phần Danh mục Tài liệu tham khảo Các kết nghiên cứu trình bày luận văn tơi thực cách nghiêm túc, trung thực không trùng lắp với đề tài khác công bố Tôi xin chịu trách nhiệm lời cam đoan Người hướng dẫn (ký tên) Cần Thơ, ngày tháng năm 2022 Tác giả thực (ký tên) Phạm Thế Phi Lê Anh Trung MỤC LỤC LỜI CÁM ƠN TÓM TẮT TIẾNG VIỆT ABSTRACT .6 LỜI CAM ĐOAN .7 MỤC LỤC DANH MỤC BẢNG 10 CHƯƠNG GIỚI THIỆU .14 1.1 Lý chọn đề tài 14 1.2 Mục tiêu nghiên cứu 15 1.2.1 Mục tiêu nghiên cứu tổng quát 15 1.2.2 Mục tiêu nghiên cứu cụ thể 15 1.3 Đối tượng nghiên cứu 15 1.4 Phương pháp nghiên cứu .15 1.5 Phạm vi nghiên cứu .16 1.6 Bố cục luận văn 16 CHƯƠNG CƠ SỞ LÝ THUYẾT 17 2.1 Nghiên cứu liên quan 17 2.1.1 Thu hoạch ảnh từ Web .17 2.1.2 Khảo sát nghiên cứu thực nghiệm phương pháp học phép đo khoảng cách .18 2.2 Các hàm tính khoảng cách 23 2.2.1 Các định nghĩa chung 23 2.2.2 Các phép đo Khoảng cách 23 2.3 Các thuật toán học số phép đo LMNN, KLMNN, NCA 26 2.3.1 Kỹ thuật LMNN (Large Margin Nearest Neighbor) 26 2.3.2 Kỹ thuật KLMNN (Kernel Large Margin Nearest Neighbor) 28 2.3.3 Kỹ thuật NCA (Neighborhood Components Analysis) 28 2.4 Mơ hình máy học Vector hỗ trợ (Support Vector Machines - SVM) 29 CHƯƠNG PHƯƠNG PHÁP NGHIÊN CỨU 31 3.1 Thu thập liệu 31 3.3 Phương pháp bố trí thực nghiệm 34 3.3.1 Môi trường thực nghiệm 34 3.3.2 Phương pháp thực nghiệm .34 3.4 Đánh giá mơ hình 38 3.4.1 Nghi thức kiểm tra 38 3.4.2 Các tiêu chí đo tính hiệu giải thuật phân lớp .39 CHƯƠNG KẾT QUẢ VÀ THẢO LUẬN 40 4.1 Kết Precision Score thuật toán 40 4.2 Kết Accuracy Score thuật toán .46 4.3 Bảng thống kê: Precsion, Recall, F1-Score, Accuracy thuật toán cho lớp chủ đề 52 4.4 So sánh thời gian giải thuật học phép đo khoảng cách 55 4.5 Kết hợp ma trận phép đo học khoảng cách với mơ hình máy học SVM để huấn luyện phân lớp lại hình ảnh 56 4.5.1 Đối với Ma trận học phép đo khoảng cách thuật toán NCA (k=5) 56 4.5.2 Đối với Ma trận học phép đo khoảng cách thuật toán KLMNN (k=5) 56 CHƯƠNG KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN .63 5.1 Kết luận .63 5.1.1 Về mặt lý thuyết 63 5.1.2 Về mặt thực tiễn .64 5.1.3 Hạn chế 64 5.2 Hướng nghiên cứu, phát triển 64 TÀI LIỆU THAM KHẢO .65 DANH MỤC BẢNG Bảng 3.1 Mô tả tập liệu 31 Bảng 3.2 Mô tả việc gán nhãn tay cho hình thuộc lớp chủ đề 33 Bảng 4.1 Tổng hợp so sánh Precision Score thuật toán lớp chủ đề 44 Bảng 4.2 Tổng hợp so sánh Accuracy Score thuật toán lớp chủ đề 50 Bảng 4.3 Bảng thống kê: Precsion, Recall, F1-Score, Accuracy thuật toán cho lớp chủ đề .54 Bảng 4.4 Kết việc kết hợp Ma trận học khoảng cách thuật toán KLMNN với mơ hình máy học SVM để huấn luyện phân lớp lại tập liệu luận văn 61 10

Ngày đăng: 06/12/2023, 20:16

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan