1. Trang chủ
  2. » Luận Văn - Báo Cáo

Đề tài nghiên cứu thuật toán phân cụm, ứng dụng tìm ảnh giống ảnh ban đầu

37 3 0
Tài liệu được quét OCR, nội dung có thể không chính xác
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 37
Dung lượng 5,86 MB

Nội dung

1 BỘ CÔNG THƯƠNG TRƯỜNG ĐẠI HỌC KINH TẾ KỸ THUẬT CÔNG NGHIỆP KHOA CÔNG NGHỆ THÔNG TIN BÁO CÁO TỔNG KẾT KHÓA LUẬN TỐT NGHIỆP Tên đề tài: NGHIÊN CỨU THUẬT TỐN PHÂN CỤM, ỨNG DỤNG TÌM ẢNH GIỐNG ẢNH BAN ĐẦU Giảng Viên Hướng Dẫn: Nhóm Sinh Viên: Nguyễn Thùy Dung Trần Thị Lành DHTI13A3HN Phạm Quốc Trình DHTI13A3HN HÀ NỘI 2023 LỜI NÓI ĐẦU Lý chọn đề tài Lĩnh vực công nghệ thông tin có đổi đáng kể từ vài thập kỷ Với xuất mạng phát triển truyền tải web, số lượng hình ảnh có sẵn cho người dùng tiếp tục tăng lên Kết việc sản xuất hình ảnh kỹ thuật số lâu dài đáng kể nhiều lĩnh vực kiến trúc, hình ảnh vệ tinh, video giám sát, người máy, y học sức khỏe, minh họa, nghe nhìn, thực vật học, v.v điều xuất thiết bị thu nhận hình ảnh tạo ngày số lượng lớn hình ảnh Do đó, khối lượng liệu khơng có đáng quan tâm dễ dàng tìm thấy thơng tin liên quan đến mối quan tâm đặc biệt Điều làm nảy sinh nhu cầu phát triển kỹ thuật tìm kiếm thơng tin đa phương tiện, đặc biệt tìm kiếm hình ảnh Danh sách ứng dụng có tìm kiếm hình ảnh theo nội dung lớn Mặc dù điều quan trọng lập mơ hình hình ảnh, nén, lưu trữ truyền tải chúng, điều quan trọng phải phát triển hệ thống hiệu để xử lý, phân loại lập mục hình ảnh truy cập chúng nhanh chóng sở liệu hình ảnh Với xuất nhiều thiết bị sử dụng để thu nhận hình ảnh, số lượng lớn hình ảnh xuất ngày Việc truy cập nhanh vào sưu tập hình ảnh khổng lồ truy xuất hình ảnh tương tự (Truy vấn) từ sưu tập hình ảnh khổng lồ đặt thách thức lớn yêu cầu thuật toán hiệu Mục tiêu hệ thống đề xuất cung cấp kết xác với thời gian tính tốn thấp hơn(với thời gian nhanh có thể) Do đó, chúng em định chọn đề tài “Nghiên cứu thuật tốn phân cụm ứng dụng tìm ảnh giống ảnh ban đầu” làm đề tài để nghiên cứu Mục tiêu đề tài Nghiên cứu xử lý ảnh phân loại ảnh, thuật tốn phân cụm nói chung, thuật tốn K – Means nói riêng Từ đó, áp dụng kiến thức vào thực tiễn để giải tốn “ xây dựng ứng dụng tìm ảnh giống ảnh ban đầu” Thử nghiệm ứng dụng Weka để thử nghiệm liệu xây dựng ứng dụng tìm ảnh giống ảnh ban đầu Phương pháp nghiên cứu a Các phương pháp nghiên cứu lý thuyết - Phương pháp nghiên cứu tổng hợp lý thuyết - Phương pháp sơ đồ b Các phương pháp nghiên cứu thực tiễn - Phương pháp quan sát - Phương pháp điều tra - Phương pháp phân tích tổng kết kinh nghiệm Đối tượng phạm vi nghiên cứu - Tìm hiểu phương pháp xử lý ảnh - Tìm hiểu thuật tốn phân cụm - Tìm hiểu thuật tốn K – Means - Xây dựng ứng dụng tìm ảnh giống ảnh ban đầu Kết cấu đề tài(Nội dung đề tài) Chương 1: Đi từ tổng quan xử lý ảnh tới phân loại ảnh Chương cung cấp nhìn tổng quan lĩnh vực xử lý ảnh với tảng tư tưởng, tình hình nghiên cứu phương hướng phát triển nay.Nên đổi câu từ chỗ Chương 2: Đi từ tổng quan thuật toán phân cụm tới tập trung vào thuật toán tiêu biểu cho đề tài thuật toán K – Means Thuật tốn thuật tốn bật dễ tìm hiểu phân cụm liệu.( Đi từ tổng quan thuật tốn phân cụm đến thuật tốn cần tìm hiểu cho đề tài thuật toán K-Means.Đây thuật toán tiêu biểu phổ biến phân cụm liệu.) Chương 3: Trình bày trình thực nghiệm với ứng dụng Weka tập liệu thực từ liệu thu thập Từ ứng dụng vào việc xây dựng ứng dụng tìm ảnh giống ảnh ban đầu.( Demo tập liệu thu thập ứng dụng Weka Thực nghiệm xây dựng ứng dụng tìm ảnh giống ảnh ban đầu) CHƯƠNG 1: TỔNG QUAN XỬ LÝ ẢNH VÀ PHÂN LOẠI ẢNH 1.1 Tổng quan hệ thống xử lý ảnh số Con người thu nhận thơng tin qua giác quan,trong thị giác đóng vai trị quan trọng Những năm trở lại với phát triển phần cứng máy tính,xử lý ảnh đồ họa phát triển cách mạnh mẽ có nhiều ứng dụng sống.Xử lý ảnh đóng vai trị quan trọng tương tác người máy Qúa trình xử lý ảnh xem trình thao tác ảnh đầu vào nhằm cho kết mong muốn.Kết đầu q trình xử lý ảnh ảnh “tốt hơn” kết luận -Khối thu nhận ảnh : Có nhiệm vụ tiếp nhận ảnh đầu vào -Khối tiền xử lý : có nhiệm vụ xử lý nâng cao chất lượng ảnh giảm nhiễu ,phân vùng,tìm biên -Khối trích chọn đặc điểm : có nhiệm vụ trích chọn đặc trưng quan trọng ảnh tiền xử lý để sử dụng hệ định -Khối hậu xử lý:có nhiệm vụ xử lý đặc điểm trích chọn,có thể lược bỏ biến đổi đặc điểm để phù hợp với kỹ thuật cụ thể sử dụng hệ định -Khối hệ định lưu trữ : có nhiệm vụ đưa định(phân loại) dựa liệu học lưu khối lưu trữ -Khối kết luận : đưa kết luận dựa vào định khối định 1.2 Những vấn đề xử lý ảnh 1.2.1 Một số khái niệm *Ảnh điểm ảnh - Ảnh số tập hợp hữu hạn điểm ảnh với mức xám phù hợp dùng để mô tả ảnh gần với ảnh thật Số điểm ảnh xác định độ phân giải ảnh Ảnh có độ phân giải cao thể rõ nét đặt điểm hình, làm cho ảnh trở lên chân thực sắc nét - Điểm ảnh phần tử ảnh số toạ độ (x, y) với độ xám màu định Kích thước khoảng cách điểm ảnh chọn thích hợp cho mắt người cảm nhận liên tục không gian mức xám (hoặc màu) ảnh số gần ảnh thật Mỗi phần tử ma trận gọi phần tử ảnh *Mức xám,màu -Là số giá trị có điểm ảnh ảnh.Kết biến đổi tương ứng giá trị độ sáng điểm ảnh với giá trị ngun dương Thơng thường, xác định khoảng [0, 255] tuỳ thuộc vào giá trị mà điểm ảnh biểu diễn Các thang giá trị mức xám thông thường bao gồm: 16, 32, 64, 128, 256 (trong mức 256 mức phổ dụng, kỹ thuật máy tính dùng byte (8 bit) để biểu diễn mức xám, tương đương: 28 = 256 mức, tức từ đến 255) *Độ phân giải ảnh Độ phân giải(Resolution) ảnh mật độ điểm ảnh ấn định ảnh hiển thị Theo định nghĩa, khoảng cách điểm ảnh phải chọn cho mắt người thấy liên tục ảnh Việc lựa chọn khoảng cách thích hợp tạo nên mật độ phân bổ, độ phân giải phân bố theo trục x y không gian hai chiều Ví dụ: Độ phân giải ảnh hình CGA (Color Graphic Adaptor) lưới điểm theo chiều ngang hình: 320 điểm chiều dọc * 200 điểm ảnh (320*200) Rõ ràng, hình CGA, loại 12 inch ta nhận thấy mịn hình CGA 17 inch độ phân giải 320*200 Bởi vì, mật độ diện tích hình rộng độ mịn Trên phương diện tốn học, ảnh số xem ma trận nguyên dương gồm m hàng n cột, phần tử ma trận đại diện cho điểm ảnh Dựa theo màu sắc ta chia ảnh số thành ba loại ảnh nhị phân, ảnh đa cấp xám ảnh màu (true color) Ảnh nhị phân Ảnh nhị phân ảnh có hai màu, màu đại diện cho màu màu lại đại diện cho đối tượng ảnh Nếu hai màu đen trắng gọi ảnh đen trắng Như vậy, ảnh nhị phân xem ma trận nhị phân Ảnh đa mức xám Ảnh đa cấp xám ảnh nhận tối đa 256 mức sáng khác khoảng màu đen - màu trắng Như vậy, ảnh đa mức xám xem ma trận khơng âm có giá trị tối đa 255 Mỗi điểm ảnh ảnh đa cấp xám biểu diễn cường độ sáng ảnh điểm Ảnh màu Ảnh màu ảnh điểm ảnh biểu diễn số byte (thường byte) đại diện cho ba thành phần màu xem ảnh màu ba ma trận nguyên ứng với ba thành phần màu điểm ảnh Hệ màu RGB bao gồm ba ma trận màu tương ứng với giá trị Red, Green Blue Đây hệ màu sử dụng phổ biến Ngồi ra, ảnh cũng phân thành hai loại: Ảnh có tần số cao ảnh có tần số thấp Hình 1.1.1.2 mơ tả ảnh màu Hình 1.1.1 Ảnh màu 1.2.2.Khử nhiễu -Có loại nhiễu trình thu nhận ảnh mà cần loại bỏ: +Nhiễu hệ thống: nhiễu có quy luật khử phép biến đổi +Nhiễu ngẫu nhiên : vết bẩn khơng rõ ngun nhân khắc phục phép lọc 1.2.3 Chỉnh số mức xám -Chỉnh số mức xám nhằm khắc phục tính khơng đồng hệ thống xử lý ảnh thông thường có hướng tiếp cận: +Giảm số mức xám: Thực cách nhóm mức xám gần thành bó.Trường hợp giảm xuống mức xám ảnh đen trắng +Tăng số mức xám : Thực nội suy mức xám trung gian kỹ thuật nội suy.Kỹ thuật nhằm tăng cường độ mịn cho ảnh 1.2.4 Xử lý ảnh số Xử lý ảnh trình chuyển đổi hình ảnh sang dạng kỹ thuật số thực thao tác định để nhận số thông tin hữu ích từ hình ảnh Hệ thống xử lý hình ảnh thường coi tất hình ảnh tín hiệu 2D áp dụng số phương pháp xử lý tín hiệu xác định trước Các loại xử lý hình ảnh chính: Nhận diện – Phân biệt phát đối tượng hình ảnh Làm sắc nét phục hồi – Tạo hình ảnh nâng cao từ hình ảnh gốc Nhận dạng mẫu – Đo mẫu khác xung quanh đối tượng hình ảnh Truy xuất – Duyệt tìm kiếm hình ảnh từ sở liệu lớn gồm hình ảnh kỹ thuật số tương tự hình ảnh gốc Xử lí ảnh đối tượng nghiên cứu lĩnh vực thị giác máy, trình biến đổi từ ảnh ban đầu sang ảnh với đặc tính tuân theo ý muốn người sử dụng Xử lí ảnh gồm q trình phân tích, phân lớp đối tượng, làm tăng chất lượng, phân đoạn tách cạnh, gán nhãn cho vùng hay trình biên dịch thơng tin hình ảnh ảnh Cũng xử lí liệu đồ họa, xử lí ảnh số lĩnh vực tin học ứng dụng Xử lí liệu đồ họa đề cập đến ảnh nhân tạo, ảnh xem xét cấu trúc liệu tạo chương trình Xử lí ảnh số bao gồm phương pháp kĩ thuật biến đổi, để truyền tải mã hóa ảnh tự nhiên Mục đích xử lí ảnh gồm: - Biến đổi ảnh làm tăng chất lượng ảnh - Tự động nhận dạng ảnh, đoán nhận ảnh, đánh giá nội dung ảnh Các trình xử lí ảnh: - Thu nhận ảnh 10 - Tiền xử lí - Phân đoạn - Tách đặc tính - Nhận dạng giải thích 1.2.5 Phương pháp nghiên cứu Các phương pháp xử lý ảnh ứng dụng chính: nâng cao chất lượng ảnh phân tích ảnh Ứng dụng biết đến nâng cao chất lượng ảnh báo truyền qua cáp từ Luân đôn đến New York từ năm 1920 Vấn đề nâng cao chất lượng ảnh có liên quan tới phân bố mức sáng độ phân giải ảnh Việc nâng cao chất lượng ảnh phát triển vào khoảng năm 1955 Điều giải thích sau chiến thứ hai, máy tính phát triển nhanh tạo điều kiện cho q trình xử lý ảnh sơ thuận lợi Năm 1964, máy tính có khả xử lý nâng cao chất lượng ảnh từ mặt trăng vệ tinh Ranger Mỹ bao gồm: làm đường biên, lưu ảnh Từ năm 1964 đến nay, phương tiện xử lý, nâng cao chất lượng, nhận dạng ảnh phát triển không ngừng Các phương pháp tri thức nhân tạo mạng nơ ron nhân tạo, thuật toán xử lý đại cải tiến, công cụ nén ảnh ngày áp dụng rộng rãi thu nhiều kết khả quan Để dễ tưởng tượng, xét bước cần thiết xử lý ảnh Đầu tiên, ảnh tự nhiên từ giới thu nhận qua thiết bị thu (như Camera, máy chụp ảnh) Trước đây, ảnh thu qua Camera ảnh tương tự (loại Camera ống kiểu CCIR) Gần đây, với phát triển công nghệ, ảnh màu đen trắng lấy từ Camera, sau chuyển trực tiếp thành ảnh số tạo thuận lợi cho xử lý (Máy ảnh số thí dụ gần gũi) Mặt khác, ảnh tiếp nhận từ vệ tinh; quét từ ảnh chụp máy quét ảnh 23 tin nhỏ làm sai lệch tính ảnh hưởng xấu đến hiệu suất truy xuất Để xử lý việc phân đoạn ảnh sở liệu, hệ thống K - MEANS cần thuật toán tiền xử lý phân đoạn thường xuyên hiệu Việc lựa chọn mô tả cho nội dung hệ thống tìm kiếm hình ảnh quan trọng nhất, theo nghĩa lựa chọn ảnh hưởng đến kết mong đợi Knghĩa phân cụm phương pháp hiệu để trích xuất mơ tả véc-tơ Hình 2.1.2.1 Ví dụ phân cụm theo phương pháp K - Means Trong thuật toán K-Means, ba tham số cần khởi tạo ban đầu gồm: số lượng cụm k, tâm cụm độ đo tương tự; Ngoài ra, bổ sung phần tử vào cụm phải xác định lại tâm cụm Tuy nhiên, với liệu cho trước, số lượng cụm khó xác định việc tăng trưởng liệu làm gia tăng số lượng cụm, điều gây tốn nhiều chi phí thời gian q trình thực thi tái tạo lại số cụm Để thực điều này, sử dụng giá trị ngưỡng đo độ tương tự đối tượng liệu, ngưỡng kí hiệu � Trên sở ngưỡng �, thuật tốn K-Means cải tiến cách khơng xác định trước số tâm cụm, số cụm liệu tăng trưởng theo gia tăng số lượng hình ảnh 24 Hình 2.1.2.2 Mơ hình phương pháp phân cụm Trong Hình 2.1.2.2, phương pháp phân cụm dựa K-Means mơ tả, đó: �� , � � ,�� tâm, bán kính, hệ số dãn nở bán kính cụm � � Gọi � = {�1, �2,… , �� } tập véc-tơ ảnh ban đầu - Bước 1: Tạo cụm �1 đầu tiên: �1 =  �1 = �1 - Bước 2: Xét �� ∈ � với �= 2, , � Tìm cụm �� thỏa (�� ,�� ) − �� = � �� {(�� ,�� ) − �� } với � = 1, , � (trong � số lượng cụm tạo) � = (�� ,�� ) − �� Nếu (� ≤ ) �� = �� ∪ {�� }; //Thêm �� vào cụm �� Nếu (�� ,�� ) > �� �� = (�� ,�� ); // Cập nhật bán kính cụm �� 25 Ngược lại //Tạo cụm �� có tâm �� �� = �� ; �� = �;  =  ∪ C k; 2.2 Thuật toán phân cụm K – Means Theo phương pháp đề xuất trên, thuật tốn gom cụm ảnh K-Means mơ tả sau: Thuật toán K – Means Đầu vào: Ngưỡng tương tự � � (tập véc-tơ ảnh ban đầu) Đầu ra: Tập cụm  Function Clustering_theta(, �) Begin Khởi tạo  = ; Foreach 〈�� 〉 ∈ � If ( = ) then //Tạo cụm �1 �1 = �1 ; �1 =  ;  = {�1 }; Else Tìm cụm Ct ∈  thỏa (�� ,�� ) − �� = ���{(�� ,��) − �� } với � = 1, , � (trong � số lượng cụm tạo) � = (�� ,�� ) − �� 26 If (� ≤  ) then �� = �� ∪ {�� }; //Thêm �� vào cụm �� If (�� ,�� ) > �� then �� = (�� ,�� ); // Cập nhật bán kính cụm �� EndIf; Else //Tạo cụm �� có tâm �� �� = �� ; �� = �;  =  ∪ C k; EndIf; EndIf; EndFor; Return ; End Mệnh đề Thuật tốn có độ phức tạp � (� ∗ �), với �, � liệu số cụm tạo Chứng minh: Giả sử có � phần tử liệu phân thành � cụm Thuật toán cần phải duyệt qua � phần tử liệu, với phần tử cần phải duyệt qua � cụm để phân bố liệu Trong trường hợp xấu nhất, thuật tốn có số lần duyệt � ∗ � để phân bố phần tử vào cụm Khi số phần tử liệu lớn, giá trị � � lớn độ phức tạp thuật toán CTIR �(� ∗ �) 2.3 Thuật tốn tìm kiếm ảnh 27 Trên sở tập cụm  phân hoạch theo thuật tốn K - Means, q trình tìm kiếm ảnh thực cách chọn cụm Cm có tâm gần với ảnh tra cứu Khi bước thuật tốn tìm kiếm ảnh sau: - Bước 1: Tìm cụm Cm có tâm gần với véc-tơ ảnh tra cứu Bước 2: Tìm h cụm láng giềng với cụm Cm Tập ¥ chứa h cụm láng giềng cụm Cm - Bước 3: Tìm tập £ chứa tất véc-tơ ¥ - Bước 4: Sắp xếp £ tăng dần theo độ đo Thuật toán : - Đầu vào: véc-tơ đặc trưng p (ảnh tìm kiếm), tập cụm  ngưỡng tìm kiếm � - Đầu ra: tập  chứa id (định danh) ảnh tương tự với ảnh tìm kiếm Function ClusterRetrieval( p ,  , � ) Begin Khởi tạo  = ; Tìm cụm Ck  :  (p ,vk ) = min{  (p,vi ), i= 1, , m}; (với m số lượng cụm, vi véc-tơ tâm cụm Ci ) //Tìm h cụm láng giềng với Ck Sắp xếp  tăng dần theo  ( vt,vk ) - (Ct.R+Ck.R) (với Ct, vt cụm tâm cụm thứ t, t=1, , m) Khởi tạo £=∅; If ( (vi,vk) - (Ci.R + Ck.R) then £= £ ∪Ci với i=0, m-1 EndIf Sắp xếp tập £ theo  (l ,p ) với ∀l ∈ £ 28 Tạo tập định danh hình ảnh  theo thứ tự xếp tập £ Return  ; End Mệnh đề Thuật tốn có độ phức tạp �(�^2), với � số cụm tạo Chứng minh: Giả sử tập cụm đầu vào cho thuật tốn có � cụm, thuật tốn thực việc tìm cụm gần ảnh đầu vào Quá trình tìm kiếm cần duyệt qua cụm, nghĩa số lần so sánh � tương ứng với � cụm Sau thực tìm cụm gần với ảnh láng giềng, thuật tốn tìm cụm lân cận cách xếp lại tập cụm theo độ tương tự cụm tìm được, số phép tốn tối đa việc xếp �(�^2) Sau thực tìm kiếm cụm láng giềng, thuật tốn thực việc xếp hình ảnh theo độ đo tương tự với ảnh đầu vào (tuy nhiên việc xếp xử lý bên ngồi thuật tốn nên độ phức tạp thuật tốn khơng bao gồm việc xếp hình ảnh theo độ đo tương tự) Vì vậy, độ phức tạp thuật tốn �(�^2) 2.4 Mơ hình tìm kiếm ảnh Theo số kỹ thuật phát triển năm gần đây, kỹ thuật có nhiều nhược điểm Bộ mơ tả phù hợp độ xác mạnh mẽ phép biến đổi hình học (tịnh tiến xoay) Do đó, để giảm thiểu thời gian phản hồi, giới thiệu bước phân loại hệ thống mình, bước phân loại hình ảnh thành cụm, việc khởi chạy truy vấn tìm kiếm thực lớp gần hình ảnh với cụm khơng phải toàn sở liệu Kỹ thuật làm cho hệ thống nhanh phù hợp Ngoài ra, bước quan trọng xác minh tự động kết giúp sửa tìm kiếm cụm khơng phù hợp với hình ảnh truy vấn Nhìn chung, trình bày hình ảnh theo ba đặc điểm: màu sắc, hình dạng kết cấu Để có hiệu suất trích xuất hình ảnh nhanh cải thiện, chúng 29 tơi sử dụng trích xuất đặc tính màu vốn tính hình ảnh thiết yếu thường sử dụng hệ thống Truy xuất hình ảnh dựa nội dung Hình ảnh lưu trữ sở liệu gọi sở liệu hình ảnh Hình Mơ hình tìm kiếm ảnh Trong Hình 2.4 mơ tả giai đoạn xử lý bao gồm: tiền xử lý để tạo liệu cụm tìm kiếm tập ảnh tương tự 2.4.1 Tiền xử lý  Bước 1: tạo véc-tơ đặc trưng thị giác cho hình ảnh tập liệu ảnh  Bước 2: gom cụm véc-tơ theo độ đo tương tự dựa thuật toán đề xuất Sau tiền xử lý, hình ảnh phân đoạn phương pháp phân đoạn hình ảnh kmean Chúng tơi sử dụng không gian màu RGB Kết phân đoạn vùng NR Đối với vùng i thành phần, giá trị trung bình độ lệch chuẩn cho bởi: Với: ) Với: Chú thích: RP : số pixel vùng chọn ri phần màu đỏ 30 Sau đó, vectơ đặc trưng xây dựng lưu tệp liệu đặc trưng sau bước phân loại ảnh Vectơ mô tả sau: Tiếp theo, phân đoạn ảnh thành vùng NR (k-mean): Xây dựng vectơ mô tả V cách sử dụng phương trình: Truy xuất lớp gần Thêm hình ảnh vào lớp gần Cập nhật vectơ mô tả cụm theo cơng thức: đó: vecto mơ tả ảnh thứ i N số ảnh cụm 2.4.2 Tìm kiếm ảnh tương tự  Bước 1: từ ảnh truy vấn, tạo véc-tơ đặc trưng cho ảnh Giờ đây, người dung thực gửi ảnh cần truy vấn, quy trình tìm Véc - tơ đặc trưng áp dụng giải thích  Bước 2: thực tìm kiếm cụm gần với ảnh truy vấn  Đến bước này, thực hiện:  Tính mơ tả véc-tơ ảnh cần truy vấn VQ  Xác định cụm phù hợp cách so sánh VQ với tập {VC} công thức sau: d(VQ,VC) =  Sắp xếp lớp theo mức độ gần đến xa  Xác định lớp cho ảnh truy xuất  Lấy hình ảnh tương tự lớp thích hợp  Tính khoảng cách đặc trưng mơ tả theo cơng thức: 31 D(VQ,VM) = Trong đó:Q hình ảnh truy vấn, NR số vùng, M hình ảnh lớp gần nhất, mơ tả VQ Q, mô tả VM M D(VQ,VM) khoảng cách hình Q M  Bước 3: xuất ảnh kết xếp theo độ đo tương tự với ảnh truy vấn 2.4.3 Ví dụ minh họa Giả sử, liệu ảnh ban đầu gồm 17 ảnh biểu diễn tập L gồm 17 véc-tơ đặc trưng Chúng tiến hành phân cụm thuật toán cải tiến từ K-Means với ngưỡng � = 0,2 Kết sau phân cụm: số cụm thu cụm Hình Hình 1.3 Ví dụ 2.5 Đánh giá hiệu suất thuật toán Các biện pháp phổ biến để đánh giá hệ thống thời gian phản hồi dung lượng nhớ sử dụng Một hệ thống tốt thời gian phản hồi không gian nhớ nhỏ hơn, trường hợp hệ thống chúng tơi chúng tơi truy xuất hình ảnh truy vấn lớp thích hợp khơng phải tồn sở liệu 32 hình ảnh Nhưng với hệ thống K - MEANS, ngồi hai biện pháp này, chúng tơi quan tâm đến biện pháp khác Thông thường hệ thống K - MEANS, người dùng quan tâm đến phản hồi có liên quan hệ thống Vì vậy, hệ thống truy xuất thông tin yêu cầu đánh giá độ xác phản hồi Loại đánh giá liên quan đến hiệu suất nghiên cứu hệ thống Hệ thống mục tìm kiếm hình ảnh hệ thống truy xuất thông tin Trong phần này, hai biện pháp quan trọng nhất: thu hồi độ xác Các biện pháp có mối quan hệ với Do đó, mối quan hệ thường mơ tả đường cong thu hồi độ xác Sau đó, chúng tơi trình bày biện pháp khác sử dụng để đánh giá hệ thống truy xuất thông tin Thu hồi định nghĩa tỷ lệ số lượng hình ảnh có liên quan truy xuất tổng số hình ảnh có liên quan sở liệu: Trong đó: Ra hình ảnh truy xuất có liên quan, R tổng số hình ảnh có liên quan sở liệu Độ xác tỷ lệ số lượng hình ảnh có liên quan truy xuất tổng số hình ảnh truy xuất: Trong đó: Nq số lượng ảnh truy vấn ; độ xác để gọi lại R với truy vấn i 33 Hình 2.5.1 Hình ảnh ví dụ sở liệu Wang Cơ sở liệu Wang sử dụng rộng rãi cho lĩnh vực tìm kiếm ảnh tương tự Đây lý thực thử nghiệm nghiên cứu Cơ sở liệu chứa 1.000 ảnh chia thành 10 lớp lớp có 100 ảnh Hình ảnh sở liệu công cụ thân thiện để đánh giá hệ thống tìm kiếm ảnh tương tự (xem Hình 2.5.1) Trong phần đánh giá, so sánh thời gian phản hồi hình ảnh truy vấn vấn đề nói Do đó, thử nghiệm thực máy tính có xử lý: Intel(R) Core(TM) i5-10400F CPU @ 2.90GHz 2.90 GHz, RAM 16 GB chạy hệ điều hành Microsoft Windows 10 Professional (64-bit) Để mô phỏng, MATLAB 2009a sử dụng Các kết thu được đưa Bảng Sự khác biệt thời gian phản hồi so với hệ thống khác đáng ý nói đến sở liệu lớn Phư ơng pháp Thời gian đáp ứng SIFTBoW (Romain 2013) 28 (Elasn aoui 2014) 15 (Elasn aoui 2016) 8,75 Table 2.5 Thời gian phản hồi tính giây Phươn g án đề xuất 5,65 34 Kết nghiên cứu so sánh với phương pháp khác (Jhanwar cộng sự, 2004), (Rao cộng sự, 2011), (Vimina cộng sự, 2013), (El Asnaoui cộng sự, 2016) (Zeyad cộng sự, 2015) (Hình 9) cho thấy hiệu suất mức độ ngữ nghĩa hệ thống đề xuất tốt hệ thống khác tất phương pháp Hình 2.5.2 So sánh hiệu xuất đường cong Precision - recall phương pháp 2.6 Kết luận chương K-means thuật toán gom cụm phát phát triển Dù cịn nhiều hạn chế khả tìm kết cuối xác K- means thuật tốn gom cụm Có nhiều thuật tốn gom cụm tìm hiểu thực khắc phục nhiều nhược điểm K-means thay độ phức tạp cách tiếp cận đơn giản mà K-means đa sở hữu Vậy nên khẳng định, K-means sở thuật tốn gom cụm có Vì xu hướng phát triển thuật tốn gom cụm, thay tìm thuật tốn hiệu quả, tập trung cải thiện yếu điểm mà K-means gặp phải để đạt cải thiện tốc độ khả tìm lời giải tối ưu ưu tiên Và thực tế, có nhiều thuật tốn đời với mục đích cải thián tốc độ tìm lời giải tối ưu Tuy chưa đạt 35 mục đích cuối khẳng định hướng phát triển việc phát triển thuật toán gom cụm Với ưu điểm tốc độ xử lý, K-means ứng dụng nhiều lĩnh vực sống Và hai mảng mà K-means đóng vai trị chủ đạo phân đoạn ảnh khai phá liệu Chương sau tập trung vào xây dựng ứng dụng tìm ảnh giống ảnh ban đầu sử dụng weka để phân đoạn ảnh dựa liệu tổng hợp 36 CHƯƠNG 3: THỰC NGHIỆM XÂY DỰNG ỨNG DỤNG TÌM ẢNH GIỐNG ẢNH BAN ĐẦU 3.1 - Quy trình giải Tiền xử lý: Thực nâng cao chất lượng ảnh phương pháp: Cân Histogram, Biến đổi Fast Fourier - D, tiếp ảnh nhị nhân hóa để chuyển từ ành xám thành ảnh đen trắng (chỉ bit 1) Tiếp đó, sử dụng ứng dụng Weka để kiểm thử liệu thu thập tạo vector đặc trưng thị giác cho hình ảnh danh sách hình ảnh ban đầu  Cân Histogram q trình ánh xạ độ chói ảnh vào vùng giá trị cho Histogram có dạng phân bố đồng  Ảnh sau tăng cường chất lượng ảnh Cân Histogram bước thực tăng cường ảnh thuật tốn biến đổi Fourier Cơng thức tính tốn cho thuật toán cho thuật toán tăng cường ảnh biến đổi Fourier có dạng sau: Trong đó: k hệ số mũ phổ Fourier, phổ Fourier  Chúng ta tiến hành chia ảnh thành block nhỏ có kích thước 32x32 pixel sau thực biến đổi Fourier cho block Theo cách này, thành phần ảnh có tần số trội giữ lại, vùng ảnh thể đường vân Ảnh sau biến đổi Fourier có đường vân “nổi” hơn, phân tách đường vân thể rõ ràng Đồng thời vùng ảnh nhiễu bị loại bớt - Gom cụm véc-tơ theo độ đo tương tự dựa thuật toán đề xuất : bước này, vector ảnh khởi tạo bước tiền xử lý nhóm lại thành cụm khác tuỳ thuộc vào độ đo tương tự (khoảng cách từ ảnh đến 37 tâm cụm) Do đó, nghiên cứu sử dụng điểm để phân loại ảnh tìm kiếm ảnh giống ảnh ban đầu - Tìm kiếm hình ảnh: từ ảnh cần truy vấn, tạo vector đặc trưng cho ảnh Tiếp theo, thực tìm kiếm cụm gần với ảnh cần truy vấn cách tính khoảng cách từ ảnh truy vấn đến tâm cụm khởi tạo Cuối cùng, xuất ảnh kết xếp theo độ đo tương tự với ảnh cần truy vấn - So sánh: sử dụng phương pháp so sánh để kiểm tra xem ảnh kết có đặc điểm đặc trưng giống với ảnh cần truy vấn hay khơng kết thúc chương trình

Ngày đăng: 20/09/2023, 15:40

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w