Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 61 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
61
Dung lượng
1,69 MB
Nội dung
i ĐẠI HỌC THÁI NGUYÊN TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG NGUYỄN THỊ THANH THỦY NGHIÊNCỨUPHƯƠNGPHÁPTRACỨUẢNHNHANHSỬDỤNGPHÂNCỤMPHỔ Chuyên ngành: Khoa học máy tính Mã số: 60 48 01 01 LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH Người hướng dẫn khoa học: PGS.TS NGUYỄN HỮU QUỲNH THÁI NGUYÊN, 2018 ii LỜI CAM ĐOAN Tôi Nguyễn Thị Thanh Thủy cam đoan nội dung trình bày luận văn kết tìm hiểu, nghiêncứu thân hướng dẫn PGS.TS Nguyễn Hữu Quỳnh nhà nghiêncứu trước Nội dung tham khảo, kế thừa, phát triển từ cơng trình cơng bố trích dẫn, ghi rõ nguồn gốc Kết mơ phỏng, thí nghiệm lấy từ chương trình thân Nếu có sai phạm tơi xin hồn tồn chịu trách nhiệm Người cam đoan Nguyễn Thị Thanh Thủy LỜI CẢM ƠN iii Trong trình thực luận văn gặp nhiều khó khăn, tơi ln nhận quan tâm, giúp đỡ từ thầy cô, bạn bè, đồng nghiệp người thân Đây nguồn động lực giúp tơi hồn thành luận văn Tơi xin gửi lời cảm ơn sâu sắc đến PGS.TS Nguyễn Hữu Quỳnh, tận tình giúp đỡ, hướng dẫn bảo trình thực luận văn Tơi xin chân thành cảm ơn đến quý thầy, cô trường Đại học CNTT&TT – Đại học Thái Nguyên tận tình bảo, truyền đạt kiến thức q báu giúp thơi hồn thành q trình học tập trường Q thầy giúp tơi có kiến thức quan trọng lĩnh vực Công nghệ thông tin, tảng vững cho nghiêncứu khoa học thân thời gian qua sau Tôi xin chân thành cảm ơn anh chị em đồng nghiệp giúp đỡ, ủng hộ thời gian qua Tôi xin chân thành cảm ơn! Thái Nguyên ngày 15 tháng 04 năm 2018 Học viên thực Nguyễn Thị Thanh Thủy iv MỤC LỤC LỜI CAM ĐOAN i LỜI CẢM ƠN ii MỤC LỤC iv DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ VIẾT TẮT vi DANH MỤC BẢNG BIỂU vii DANH MỤC CÁC HÌNH viii MỞ ĐẦU 1 Đối tượng phạm vi nghiêncứu Những nội dungnghiêncứu CHƯƠNG TỔNG QUAN VỀ TRACỨUẢNH DỰA VÀO NỘI DUNG 1.1 Giới thiệu 1.2 Không gian màu 1.3 Các ví dụ tìm kiếm tương tự 10 1.4 Đo độ tương tự lược đồ đánh số 14 1.4.1 Các độ đo tương tự 14 1.4.2 Lược đồ đánh số .15 1.5 Các hệ thống tracứuảnh dựa vào nội dung 16 1.5.1 WALRUS 19 1.5.2 Blobworld 20 1.6 Tiểu kết chương 21 CHƯƠNG 2: PHƯƠNGPHÁPTRACỨUẢNHNHANHSỬDỤNGPHÂNCỤMPHỔ 23 2.1 Giới thiệu 23 v 2.2 Một số thuật toán phâncụm 23 2.2.1 Thuật toán phâncụm k-means: 23 2.2.2 Thuật toán k-medoids 28 2.2.3 Thuật toán phâncụmphổ .29 2.3 Phươngpháptracứunhanhsửdụngphâncụmphổ 30 2.3.1 Giới thiệu phươngpháp 30 2.3.2 Thuật toán phâncụm sở liệu ảnh 31 2.3.3 Thuật toán tracứuảnhnhanhsửdụngphâncụmphổ .40 2.4 Tiểu kết chương 41 CHƯƠNG CHƯƠNG TRÌNH THỬ NGHIỆM 42 3.1 Phân tích xây dựng tốn 42 3.2 Môi trường thực nghiệm 43 3.2.1 Cơ sở liệu ảnh .44 3.2.2 Vector đặc trưng 45 3.2.3 Tập tin cậy (ground truth): 46 3.2.4 Cấu hình đề xuất thiết bị chạy thực nghiệm 46 3.2.5 Kết đánh giá 46 3.3 Giao diện hệ thống 48 3.4 Tiểu kết chương 50 KẾT LUẬN 51 TÀI LIỆU THAM KHẢO 51 vi DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ VIẾT TẮT Từ viết tắt Diễn giải CBIR Tracứuảnh dựa vào nội dung FRM Phươngpháp bán kính cố định (Fixed-radius method) NNM Phươngpháp lân cận gần (Nearest-neighbors method ) SOM Bản đồ tự tổ chức (Self-Organization Map) KL Biến đổi Karhunen-Loeve PCA Phân tích thành phần (Principal Component Analysis) KMCC IR K-Means với ràng buộc liên thông Inner Rectangle EHD Mô tả lược đồ cạnh EM Thuật toán cực đại kỳ vọng (Expectation-Maximization) vii DANH MỤC BẢNG BIỂU Bảng 3.1 Bảng phân bố tập ảnh Corel 44 Bảng 3.2 Các loại đặc trưng 45 Bảng 3.3 Bảng cấu hình đề xuất thiết bị chạy thực nghiệm 46 Bảng 3.4 Bảng kết phươngpháp 47 viii DANH MỤC CÁC HÌNH Hình 1.1: Khối màu RGB Hình 1.2: Trụ màu HSV Hình 1.3: Trích rút lược đồ màu sửdụng ba màu 11 Hình 2.1: Sơ đồ mơ tả thuật tốn K-Means 24 Hình 2.2: Cấu trúc phươngpháp đề xuất 31 Hình 2.3: Thuật toán phâncụm tập ảnh S={s1,s2,…,sn} thành k cụm SCIS 35 Hình 2.4: Đồ thị biểu diễn sở liệu ảnh 35 Hình 2.5: Thuật tốn tracứuảnhnhanhsửdụngphâncụmphổ 41 Hình 3.1 Mơ hình tổng qt hệ thống 43 Hình 3.2: So sánh độ xác thời gian tracứu 47 Hình 3.3: Giao diện pha huấn luyện 48 Hình 3.4: Giao diện pha tracứu 48 Hình 3.5: Chọn tập liệu ảnh / đặc trưng 49 Hình 3.6: Chọn ảnh truy vấn khởi tạo 49 Hình 3.7: Kết tracứu với truy vấn khởi tạo 84090 thuộc lớp 840 50 MỞ ĐẦU Xử lý ảnh lĩnh vực nghiêncứu phát triển khơng ngừng tính trực quan sinh động khả áp dụng vào thực tế lớn Hiện xử lý ảnh giành nhiều quan tâm nhà nghiêncứu ngồi nước Trong xử lý ảnh, tracứuảnh nói lĩnh vực đòi hỏi nghiêncứu tổng hợp: nghiêncứu xử lý ảnh để rút trích đặc trưng, áp dụng tính tốn tốn học cao cấp để xác định mức độ tương đồng hai ảnh Hơn nữa, với phát triển phần mềm phần cứng, khối lượng ảnh phát triển không ngừng ngày lớn Một số lượng lớn ảnhsửdụng thư viện ảnh số web Vì nhu cầu tìm kiếm ảnh nhu cầu tất yếu Hiện tại, tracứuảnh ứng dụng nhiều lĩnh vực như: quản lý biểu trưng (logo), truy tìm tội phạm, ứng dụng y khoa, quân sự… Tracứuảnh dựa nội dung (CBIR-Content-Based Image Retrieval) kỹ thuật cho phép trích chọn đặc điểm dựa vào nội dung trực quan ảnh màu sắc, kết cấu, hình dạng bố cục khơng gian ảnh để làm sở cho việc tra cứu, xếp, tổ chức CSDL ảnh Nhiều phương pháp, hệ thống tracứuảnh dựa vào nội phát triển, nhiên, sở liệu ảnh tăng lên ngày dẫn đến phải tracứu sở liệu cực lớn Đó lý mà luận văn chọn đề tài: “Nghiên cứuphươngpháptracứuảnhnhanhsửdụngphâncụm phổ” Trong học có giám sát, người học cung cấp tập liệu gắn nhãn D = {(x,y)}, y nhãn x, nhãn người giám sát (người thầy) cung cấp, giá trị hàm mục tiêu mà người ta quan sát Trong học khơng có giám sát, người học cung cấp tập liệu khơng có nhãn: aj D={xi/i=1, ,N} Trong đó, điểm liệu xi lấy mẫu từ không gian đối tượng X Các thuật tốn thuộc phươngpháp học khơng giám sát dựa vào cấu trúc liệu để thực cơng việc đó, ví dụ phâncụm giảm số chiều liệu để thuận tiện cho việc lưu trữ tính tốn Có nhiều phươngphápphâncụm khác K-Means, K-medoids, HAC… Mỗi phươngpháp có ưu điểm, mạnh riêng có yêu cầu riêng cách biểu diễn liệu, độ đo Đề tài này, tập trung nghiêncứu thuật toán phâncụm phổ, thuật toán phâncụm rút gọn chiều liệu hiệu Phươngphápphâncụmphổphâncụm điểm sửdụng véc tơ riêng ma trận sinh liệu Phâncụmphổ thực hiệu liệu có kết nối liệu khơng thiết phải có quan hệ chặt chẽ tập trung đường viền hình lồi Tập trung biểu diễn liệu không gian thấp chiều để phâncụm dễ dàng Trong năm gần đây, phâncụmphổ trở thành thuật toàn phâncụm đại phổ biến Thuật tốn thực đơn giản, giải hiệu nhờ phần mềm đại số tuyến tính, hoạt động tốt thuật toán phâncụm truyền thống Kmeans Đề tài áp dụng thuật tốn phâncụmphổ để phâncụm tồn sở liệu ảnh trước đưa vào tracứu Nhiệm vụ luận văn nắm vững kiến thức tổng quan lĩnh vực xử lý ảnh, sâu nghiêncứu lĩnh vực tracứuảnh dựa vào nội dung, tìm hiểu số thuật tốn học khơng giám sát, nghiêncứu thuật tốn phâncụmphổ đưa vào hệ thống tracứuảnh dựa vào nội dung Cài đặt chương trình thử nghiệm đánh giá, so sánh hiệu hệ thống tracứuảnh dựa vào nội dungsửdụngphâncụmphổ với số hệ thống tracứuảnh điển hình khác Đối tượng phạm vi nghiêncứu Luận văn nhằm mục đích tìm hiểu tổng quan xử lý ảnh, tracứuảnh dựa vào nội dung, tìm hiểu số thuật tốn học khơng giám sát sâu nghiêncứu thuật toán phâncụmphổ Trên sở cài đặt chương trình thử nghiệm 39 Mỗi dòng Y tương ứng với điểm pi không gian véc tơ p 0,062 0,998 1 p 0,038 1,638 p 1.8 1.6 1.4 1.2 0,085 0,9963 0.8 0.6 p - 0,999 0,0429 p 0.2 -0.2 - 0,994 0.2 0.4 0.6 0.8 1.2 chiều 0,1053 p 0.4 -0,12 0,992 Phâncụm K-Means được: cụm A gồm : p1,p2,p3 ; cụm B gồm : p4,p5,p6 Gán si vào cụm: 0 8 8 0 40 Tìm ảnh đại diện cho cụm Để thực việc tracứuảnh hiệu quả, ảnh đại diện thích hợp phải thu cho cụm Ở đây, ảnh chọn đại diện cho cụm phải ảnh mà tương tự với tất ảnhcụm Phát biểu minh họa toán học sau : Với biểu diễn đồ thị ảnh cho G=(V,E) với ma trận affinity A, cho tập cụmảnh {C1,C2,…,Cm} (tập cụm này phân hoạch V, tức Ci i ) ảnh đại diện Cj = , (2) Như vậy, với cụm, ảnh đại diện ảnh mà có tổng độ tương tự phạm vi cụm cực đại 2.3.3 Thuật toán tracứuảnhnhanhsửdụngphâncụmphổPhần mô tả Thuật toán tracứuảnh hiệu sửdụngphâncụmphổphản hồi Phươngpháp thực phâncụm tập ảnh DI thành k cụm thông qua thuật tốn CRIES tìm đại diện cho k cụm thơng qua hàm Compute_Representative() gán cho tập đại diện M Khi người dùng thực truy vấn, phươngphápsửdụng thuật toán QMRBR [7] để tracứu tập ảnh đại diện M cho kết danh sách ảnhcụm mà có khoảng cách từ ảnh đại diện cụm tới ảnh truy vấn nhỏ 41 Thuật toán tracứuảnhnhanhsửdụngphâncụmphổ Input: Tập N ảnh sở liệu DI Ảnh truy vấn Q Ouput: Tập ảnh kết S // phân tập ảnh CSDL thành k cụm RI Retrieval(M, Q, S) // Thực tập đại diện cụm với truy vấn Q tập kết S tập ảnhcụm Return S // danh sách cụmảnh có khoảng cách từ dại diện cụm tới truy vấn nhỏ Hình 2.5: Thuật tốn tracứuảnhnhanhsửdụngphâncụmphổ 2.4 Tiểu kết chương Trong chương này, luận văn tập trung vào trình bày số phươngphápphâncụm K-means, K-medoid phâncụmphổ Trình bày số phươngpháptracứuảnhphươngpháptracứuảnhnhanhsửdụngphâncụmphổ mà khai thác đầy đủ thông tin độ tương tự ảnh sở liệu 42 CHƯƠNG CHƯƠNG TRÌNH THỬ NGHIỆM 3.1 Phân tích xây dựng tốn Dữ liệu đa phương tiện tập liệu phức tạp chứa đựng nhiều thông tin cần thiết cho người dùng so với văn truyền thống, nhiên công cụ hỗ trợ khai thác loại thơng tin hạn chế, phụ thuộc nhiều vào thủ công Mặt khác, thời đại công nghệ 4.0, gia tăng nhanh chóng số lượng chất lượng nhóm liệu thể rõ hạn chế công cụ khai thác Vì vậy, để khai thác cách có hiệu hơn, cơng cụ tracứuảnh dựa vào nội dungnghiêncứu Các mơ hình nghiêncứu phức tạp dần hoàn thiện chưa đủ so với tốc độ tăng nhanh ngày tập liệu Dữ liệu lớn, không gian lớn đồng nghĩa với thời gian xử lý lâu chi phí cao Các nghiêncứu nhằm giảm chiều, giảm khơng gian tính tốn để làm tăng tốc độ xử lý có ý nghĩa quan trọng Nổi bật Phâncụmphổ xem cách giảm chiều hiệu mà không làm thông tin ảnh Vì vậy, chiến lược chúng tơi đề xuất luận văn sửdụngphâncụmphổtracứuảnh dựa vào nội dung với mục đích làm tăng hiệu tracứu Hình 3.1 cho thấy mơ hình hoạt động hệ thống 43 Hình 3.1 Mơ hình tổng qt hệ thống Trong đó, mơ hình hệ thống chia thành 02 pha pha huấn luyện pha tracứu - Pha huấn luyện thực lần, từ tập liệu đầu vào thông qua phâncụmphổ CRIES, phâncụm tập ảnh thành n tập con, tính tốn trọng tâm cụm ta tập gồm n vec-tơ trọng số cụm - Pha tracứu thực có liệu huấn luyện tập n vec-tơ tâm cụm Một ảnh truy vấn đầu vào cung cấp cho hệ thống, hệ thống trích rút đặc trưng sửdụngphươngpháp trích rút tập ảnh sở liệu Vec-tơ đặc trưng ảnh truy vấn thơng qua máy tìm kiếm, phân hạng vec-tơ trọng tâm cụm, từ phân hạng ảnhcụm sở liệu Pha huấn luyện thực độc lập so với pha tra cứu, vậy, nhận thấy việc phân hạng M ảnh sở liệu phươngpháp truyền thống rút xuống n vec-tơ trọng tâm cụmphươngpháp luận văn đề xuất (trong n nhỏ nhiều so với M), sở tăng tốc độ tracứuảnh dựa vào nội dung 3.2 Môi trường thực nghiệm Trong khuôn khổ luận văn, luận văn không đề cập đến hiệu phươngpháp trích rút đặc trưng, vậy, tập đặc trưng ảnh xem sẵn có cho pha tracứu 44 3.2.1 Cơ sở liệu ảnh Cơ sở liệu ảnh sưu tầm tập tập Corel sửdụng rộng rãi cộng đồng nghiêncứu lĩnh vực tracứuảnh dựa vào nội dung Tập ảnhphân lớp ảnh theo ngữ nghĩa từ phía người dùng Tập gồm 34 loại, loại có 100 ảnh, cụ thể cung cấp bảng 3.1 Tất ảnh tập ảnh có tính chất chứa đối tượng tiền cảnh bật Cỡ ảnh có max(chiều rộng, chiều cao) = 384 min(chiều rộng, chiều cao) = 256 Bảng phân bố tập ảnh Corel STT LỚP ẢNH SỐ LƯỢNG 290 100 700 100 750 100 770 100 840 100 1040 100 1050 100 1070 100 1080 100 10 1090 100 11 1100 100 12 1120 100 13 1340 100 14 1350 100 15 1680 100 16 2680 100 17 2890 100 18 3260 100 19 3510 100 GHI CHÚ 45 20 3540 100 21 3910 100 22 4150 100 23 4470 100 24 4580 100 25 4990 100 26 5210 100 27 5350 100 28 5530 100 29 5810 100 30 5910 100 31 6440 100 32 6550 100 33 6610 100 34 6840 100 3.2.2 Vector đặc trưng Các đặc trưng chia làm hai loại là: đặc trưng màu đặc trưng kết cấu (xem Bảng 3.2 dưới) Bảng 3.1 Các loại đặc trưng Các loại đặc trưng Loại đặc trưng màu Tên đặc trưng Độ dài Lược đồ màu ColorHsvHistogram64 64 Mô men màu ColorLuvMoment123 Gắn kết màu ColorHsvCoherence64 128 CoarsnessVector 10 Directionality Loại đặc Kết cấu Tamura trưng kết cấu Kết cấu Wavelet WaveletTwtTexture 104 Kết cấu MASAR MRSAR 15 46 3.2.3 Tập tin cậy (ground truth): Tập tin cậy Corel sửdụng rộng rãi đánh giá CBIR, luận văn sửdụngphân loại Corel làm tin cậy nền, tức luận văn xem tất ảnh loại Corel liên quan Tập tin cậy gồm cột (có tiêu đề: ID ảnh truy vấn, Truy vấn khởi tạo Q0, ID ảnhSự liên quan) gồm 340 nghìn dòng (mỗi dòng véc tơ đặc trưng) 3.2.4 Cấu hình đề xuất thiết bị chạy thực nghiệm Để đảm bảo hệ thống vận hành thơng suốt, luận văn đề xuất cấu hình tối thiểu thiết bị chạy thực nghiệm Bảng 3.3 cung cấp chi tiết thơng tin cấu hình tối thiểu thiết bị chạy thực nghiệm Bảng 3.2 Bảng cấu hình đề xuất thiết bị chạy thực nghiệm STT Loại TB Chủng loại Số lượng CHIP Intel Core i3 RAM 4Gb DDRIII HDD 500Gb HDD VGA Intel HD Graphic SCREEN OS Matlab Windows x64 Matlab 2016a x64 3.2.5 Kết đánh giá Chiến lược đánh giá luận văn sửdụng 3400 ảnh tập ảnh sở liệu truy vấn để thực đánh giá hệ thống Bỏ qua thời gian hiển thị kết quả, luận văn xem xét độ xác thời gian tracứu tồn tập ảnh, từ tính thời gian trung bình ảnh Độ xác tỉ số số ảnh liên quan với ảnh truy vấn tập kết trả tổng số ảnhtrả Độ xác phươngpháp trung bình độ xác 3400 ảnh truy vấn 47 Bảng 3.3 Bảng kết phươngpháp Truyền Tracứuảnhnhanhsửdụng thống phâncụmphổ Độ xác 20.33 20.61 Thời gian trung bình 1.012 0.324 Hình 3.2: So sánh độ xác thời gian tracứu Luận văn đưa kết luận từ Hình 3.2 Độ xác hệ thống tracứuảnh dựa vào nội dungsửdụngphươngpháp “tra cứuảnhnhanhsửdụngphâncụm phổ” đạt 21.11% cao phươngpháptracứu truyền thống đạt 20.33% nhiên chênh lệch độ xác hai phươngpháp không nhiều Nhưng, so sánh thời gian tracứu trung bình ảnh, tốc độ tracứuphươngpháp “tra cứuảnhnhanhsửdụngphâncụm phổ” giảm lần so với phươngpháp truyền thống từ 1.012 giây xuống 0.324 giây Điều chứng tỏ rằng, với phươngpháptracứuảnhnhanhsửdụngphâncụmphổsửdụng giảm chiều không gian để tăng tốc độ tracứu giữ thông tin ảnh 48 3.3 Giao diện hệ thống Hình 3.3: Giao diện pha huấn luyện Hình 3.3 cung cấp giao diện pha huấn luyện nhằm phâncụm tập ảnh sở liệu cho bước tracứu tiếp theo: Bước 1: Chọn tập liệu ảnh / đặc trưng Bước 2: Chọn số lượng cụm huấn luyện Bước 3: Chọn phâncụm huấn luyện Hình 3.4: Giao diện pha tracứu Hình 3.4 cung cấp giao diện pha tra cứu, pha phải có kết pha huấn luyên trước đó: 49 Bước 1: Chọn tập liệu huấn luyện Bước 2: Chọn ảnh truy vấn Bước 3: Chọn tracứu Thanh trạng thái để cung cấp trạng thái hệ thống Hình 3.5: Chọn tập liệu ảnh / đặc trưng Tập liệu đặc trưng trích rút tương ứng với hệ thống mô tả thực nghiệm, lưu file dataset1.mat Khi liệu đọc thành công, cơng cụ kích hoạt, cho phép người dùngsửdụng Hình 3.6: Chọn ảnh truy vấn khởi tạo Người dùng lựa chọn ảnh truy vấn khởi tạo từ tập đặc trưng Hình 3.6 ảnhsửdụng làm ảnh truy vấn khởi tạo ảnh 84090 thuộc lớp 840 50 Hình 3.7: Kết tracứu với truy vấn khởi tạo 84090 thuộc lớp 840 3.4 Tiểu kết chương Trong chương 3, luận văn phân tích thiết kế hệ thống xây dựng theo mơ hình tracứu đề xuất chương 2, đồng thời xây dựng tập ảnh thử nghiệm cho hệ thống Một phươngpháp đánh giá kết hệ thống so sánh với số hệ thống tracứu khác tương tự trình bày chương Theo đó, hiệu tracứu hệ thống theo mơ hình đề xuất cho hiệu tracứu tốt tập liệu thử nghiệm Đáp ứng mục tiêu đặt ban đầu nâng cao chất lượng tracứuảnh 51 KẾT LUẬN Ở giai đoạn đầu CBIR, nghiêncứu tập trung vào khai thác biểu diễn đặc trưng khác nhau, hy vọng tìm biểu diễn tốt cho đặc trưng Tuy nhiên, hệ thống tracứuảnh dựa vào nội dung tiêu biểu có, ảnh sở liệu xếp theo độ tương tự đặc trưng truy vấn Các độ tương tự ảnh sở liệu bị bỏ qua Bởi thế, ảnhtrả hệ thống thường liên quan ngữ nghĩa Để khắc phục hạn chế trên, tracứuảnhsửdụngcụm khai thác đầy đủ thông tin độ tương tự đề xuất Ý tưởng phâncụmảnh truy vấn ảnh sở liệu lân cận lựa chọn theo độ đo tương tự, trả cho người dùng Trong phương pháp, quan hệ ảnhtracứu đưa vào xem xét qua q trình phâncụm cung cấp cho người dùng dấu hiệu liên quan ngữ nghĩa Luận văn thực cơng việc sau: - Tìm hiểu tổng quan tracứuảnh dựa vào nội dung - Tìm hiểu phươngpháptracứuảnhsửdụngcụm khai thác đầy đủ thông tin độ tương tự - Xây dựng hệ thống tracứuảnh thử nghiệm sửdụngcụm Một số vấn đề cần nghiêncứu tiếp tương lai: - Tích hợp q trình phản hồi vào q trình tracứu để nâng cao độ xác tracứu 52 TÀI LIỆU THAM KHẢO Tiếng Việt: [1] Đỗ Năng Tồn, Phạm Việt Bình, Giáo trình xử lý ảnh, NXB ĐH Thái Nguyên 2] Đinh Mạnh Tường (2016), Giáo trình Học máy, NXB Khoa học kỹ thuật, Tiếng Anh: [3] Andrew Y Ng, Michael I Jordan, Yair Weiss (2002), On spectral clustering: analysis and an algorithm, In:Advances in Neural Information Processing Systems, Dietterich T., S Becker, and Z.Ghahramani (Eds.), MIT Press, 14: 849 - 856 [4] Jin, X., & French, J.C, (2005) "Improving Image Retrieval Effectiveness via Multiple Queries," Multimedia Tools and Applications, vol 26, pp 221-245 [5] J Fournier, M Cord, (2002), Long-term similarity learning in content-based image retrieval., in: Int Conf Image Processing (ICIP), 441444 [6] Quynh Dao Thi Thuy, Quynh Nguyen Huu, Canh Phuong Van, Tao Ngo Quoc (2017), “An efficient semantic–Related image retrieval method”, Expert Systems With Applications, 72, 30-41 [7] Quynh Dao Thi Thuy, Quynh Nguyen Huu, Canh Phuong Van, Tao Ngo Quoc (2016), “Một phươngpháptracứuảnh hiệu sửdụngphâncụmphổphản hồi liên quan”, Kỷ yếu hội nghị quốc gia lần thứ 10 nghiêncứu ứng dụng Công nghệ thông tin (FAIR) [8] J Shi and J Malik,“Normalized cuts and image segmentation,”IEEE Trans Pattern Anal Mach Intell., vol 22, no 8, pp 888–905, Aug 2000 53 [9] T Kanungo, D M Mount, N Netanyahu, C Piatko, R Silverman, & A Y.Wu (2002), An efficient k-means clustering algorithm: Analysis and implementation Proc IEEE Conf Computer Vision and Pattern Recognition, pp.881-892 [10] Yixin Chen, James Wang (2005), CLUE: Cluster-Based Retrieval of Images by Unsupervised Learning, IEEE Transactions on Image Processing, vol 14, No 8, pp 1187-1201 ... thống tra cứu ảnh dựa vào nội dung 23 CHƯƠNG 2: PHƯƠNG PHÁP TRA CỨU ẢNH NHANH SỬ DỤNG PHÂN CỤM PHỔ 2.1 Giới thiệu Phân cụm liệu xử lý tập đối tượng vào lớp đối tượng khác gọi phân cụm Một cụm. .. thử nghiệm Những nội dung nghiên cứu Luận văn chia làm chương: Chương 1: Tổng quan tra cứu ảnh dựa vào nội dung Chương 2: Phương pháp tra cứu ảnh nhanh sử dụng phân cụm Phổ Chương 3: Chương trình... toán phân cụm 23 2.2.1 Thuật toán phân cụm k-means: 23 2.2.2 Thuật toán k-medoids 28 2.2.3 Thuật toán phân cụm phổ .29 2.3 Phương pháp tra cứu nhanh sử dụng phân cụm