Thuật tốn K– Mean trong phân cụm ảnh

Một phần của tài liệu Nghiên cứu một số kỹ thuật phân cụm trong tra cứu logo (Trang 51 - 67)

*) Mơ tả bài tốn:

- Input: Ảnh cĩ kích thƣớc m*n. Số cụm (k) muốn phân cụm.

- Output: Ảnh đƣợc phân thành k cụm cĩ màu sắc tƣơng đồng nhau. *) Các bƣớc thực hiện chính trong thuật tốn:

- Thuận tốn sẽ dựa vào số lượng cụm mong muốn, trọng tâm các cụm mà tính tốn khoảng cách giữa các điểm với các trọng tâm cụm. Sau đĩ gán các điểm tới cụm mà nĩ cĩ khoảng cách tới trọng tâm cụm đĩ là nhỏ nhất, cập nhật lại trọng tâm cụm. Kết quả thu được sau khi tâm các cụm là khơng đổi. Lưu đồ tổng quát của thuật tốn nhƣ sau:

Hình 3.2: Sơ đồ thuật tốn K – Mean trong phân cụm ảnh.

45

 Tìm kiếm Top X color Đầu tiên ta so sánh số màu thực tế cĩ trong ảnh và số cụm màu, nếu số màu thực tế nhỏ hơn số cụm màu thì ta nhận số cụm màu chính là số màu thực tế. Tạo danh sách chứa các loại màu, sau đĩ sắp xếp chúng theo thứ tự giảm dần. Lấy X phần tử đầu tiên của danh sách.

 Tính khoảng cách và phân cụm Sử dụng thuật tốn Euclide tính khoảng cách màu của các điểm với các tâm cụm. Dựa vào khoảng cách đĩ đƣa các điểm vào cụm mà khoảng cách của nĩ tới tâm cụm là nhỏ nhất.

Hình 3.3. Phân cụm ảnh

46

 Tính lại trọng tâm cụm.

 Kiểm tra hội tụ Để kiểm tra tính hội tụ của dữ liệu chúng ta kiểm tra trọng tâm hiện tại vừa tính đƣợc với trọng tâm trƣớc đĩ của cụm.

3.2.2 Một số thuật tốn sử dụng trong chương trình - Thuật tốn dị tìm biên Canny

Hình 3.4- Sơ đồ thuật tốn dị biên Canny

Thuật tốn dị biên Canny nhƣ sơ đồ Hình 3.4 gồm 4 bƣớc nhƣ sau:

Bước 1: Làm mịn (smoothing)

Sử dụng bộ lọc Gaussian để làm mịn ảnh. Tính tốn lựa chọn một mặt lạ (cửa sổ W) thích hợp, sau đĩ sử dụng phép nhân chập chuẩn ảnh I với cửa sổ W này. Kết quả là khi cửa sổ W trƣợt hết qua ảnh I tạo ra các vùng vuơng xung quanh điểm ảnh (nhiễu). Kích thƣớc cửa sổ W càng lớn thì cảm nhận nhiễu càng thấp.

Hình 3.5- Hàm xấp xỉ Gaussian rời rạc với  1.4 (cửa sổ W kích cỡ 5x5)

47

Bước 2 : Tính tốn Gradient

Sau khi ảnh I đã đƣợc làm mịn và ƣớc lƣợng nhiễu, bƣớc tiếp theo là tìm ra các điểm nhiễu mạnh bằng cách thực hiện Gradient. Lựa chọn cặp mặt lạ (cửa sổ Gx và Gy) kích cỡ 3x3, một để tính tốn gradient theo phƣơng trục x, một để tính cho phƣơng trục y.

Hình 3.6 - Cặp mặt lạ tính tốn gradient

Tổng hợp kết quả của đơi phép tính này thu đƣợc ảnh cĩ đƣờng biên là nơi cĩ nhiễu mạnh. Gradient kết hợp tính nhƣ sau:

Gy Gx G  

Một khi đã biết hƣớng theo các đƣờng trục x và y thì việc xác định hƣớng cho đƣờng biên trở nên thực sự đơn giản. Gĩc xác định hƣớng đƣờng biên tính theo lƣợng giác:        Gx Gy arctan 

Bước 3 : Loại trừ khơng cực đại

Sau khi cĩ đƣợc hƣớng đƣờng biên tạo từ các nhiễu mạnh, phép loại trừ khơng cực đại đƣợc áp dụng để bỏ đi các điểm nhiễu khơng đủ mạnh (khơng đƣợc xem nhƣ là đƣờng biên). Kết quả là nĩ tạo ra ảnh cĩ các đƣờng đậm nét mảnh.

Bước 4 : Dùng ngưỡng loại trừ các đường trễ

Cuối cùng sử dụng cách loại trừ các đƣờng trễ (giống nhƣ làm sạch ba via). Hiện tƣợng này cĩ nguyên nhân là do các tính tốn dao động trên ngƣỡng hoặc dƣới

48

ngƣỡng ở bƣớc 3. Để tránh điều này, sử dụng 2 ngƣỡng T1 và T2 (cao và thấp). Bất cứ giá trị điểm ảnh nào mà lớn hơn T1 thì đƣợc coi là điểm biên, nĩ đƣợc đánh dấu ngay. Sau đĩ tất cả các điểm nào kế cận điểm đánh dấu đĩ cĩ giá trị lớn hơn T2 cũng sẽ đƣợc đánh dấu là điểm đƣờng biên. (adsbygoogle = window.adsbygoogle || []).push({});

3.3 Chƣơng trình

3.3.1 Hướng dẫn sử dụng chương trình . - Lựa chọn các tham số

Vào menu Image Retrieval -> Method’s Option Các tham số lựa chọn bao gồm:

+ Similarity Method : Lựa chọn phƣơng pháp đo độ tƣơng tự cho màu sắc và hình dạng.

+ Các lựa chọn cho tra cứu theo : By Color (màu sắc), By Shape (hình dạng), By Both (màu sắc và hình dạng)

+ Top N Result : N số kết quả hiển thị (cĩ độ tƣơng tự lớn nhất) + Kích cỡ ảnh chuẩn : Widht (rộng), Height (cao)

+ Threshold : giá trị ngƣỡng cho phép biến đổi ảnh xám

+ Canny : Các tham số cho việc thực hiện dị biên theo thuật tốn Canny (xem phần thuật tốn Canny).

3.3.2 Chương trình và một số kết quả đạt được

Thứ tự trình bày các màn hình dƣới đây chỉ rõ các bƣớc sử dụng chƣơng trình và một số màn hình kết quả.

Vào menu Image Retrieval -> Method’s Option

49

Hình 3.7 - Màn hình lựa chọn các tham số cho chương trình

Hình 3.8- Màn hình lựa chọn menu mở file ảnh lơgơ đưa vào tra cứu

50

Hình 3.9- Màn hình hiển thị ảnh lơgơ đưa vào cùng histogram màu và hình dạng

Hình 3.10- Lựa chọn menu Image Retrieval -> By Color (tra cứu theo màu sắc)

51

Hình 3.11- Màn hình hiển thị kết quả 10 ảnh lơgơ gần giống nhất theo màu sắc

Hình 3.12- Lựa chọn menu Image Retrieval -> By Shape để tra cứu theo hình dạng

52

Hình 3.13- Màn hình hiển thị kết quả 10 ảnh lơgơ gần giống nhất theo hình dạng

53

KẾT LUẬN

Các vấn đề được tìm hiểu trong luận văn:

Việc tìm kiếm đƣợc một bức ảnh mong muốn trong hàng triệu bức ảnh thuộc đủ loại chủ đề khác nhau là rất khĩ khăn. Vấn đề đặt ra là phải cĩ những phƣơng pháp tổ chức cơ sở dữ liệu ảnh tốt cùng với những kỹ thuật tìm kiếm, tra cứu ảnh hiệu quả, cĩ độ chính xác cao và cĩ hiệu năng tốt. Do đĩ, nghiên cứu về tra cứu ảnh dựa vào nội dung là cần thiết.

Tổng hợp, nghiên cứu những nét cơ bản lý thuyết và ứng dụng thực tiễn của Phân cụm dữ liệu. Với sự phát triển ngày càng lớn nhƣ vũ bão của Cơng nghệ thơng tin và sự to ra về Cơ sở dữ liệu thơng tin. Do đĩ yêu cầu về nghiên cứu hồn thiện, áp dụng phƣơng pháp, kỹ thuật Phân cụm dữ liệu là rất cần thiết và cĩ ý nghĩa to lớn.

Chƣơng 1: Luận văn trình bày tổng quan, lý thuyết về phân cụm dữ liệu, logo, ảnh logo và các đặc trƣng của logo.

Chƣơng 2: Giới thiệu tổng quát các thuật tốn phân cụm dữ liệu, thuật tốn phân cụm dữ liệu là rất nhiều, Luận văn chỉ đề cập một số thuật tốn phổ biến, thơng dụng. (adsbygoogle = window.adsbygoogle || []).push({});

Chƣơng 3: Xây dựng chƣơng trình thử nghiệm và áp dụng một số kỹ thuật tra cứu ảnh vào cho bài tốn.

HƯỚNG PHÁT TRIỂN CỦA ĐỀ TÀI

Phân cụm dữ liệu và ứng dụng của Phân cụm dữ liệu là hƣớng nghiên cứu cần thiết, quan trọng, Tuy nhiên đây cũng là mảng rất rộng, bao hàm nhiều phƣơng pháp, kỹ thuật, và hình thành nhiều nhĩm khác nhau.

Trong quá trình nghiên cứu, thực hiện luận văn mặc dù đã cố gắng tập trung nghiên cứu và tham khảo nhiều tài liệu, bài báo, tạp chí khoa học trong và ngồi nƣớc, nhƣng do trình độ cịn cĩ nhiều giới hạn khơng thể tránh khỏi thiếu sĩt và hạn

54

chế. Em rất mong đƣợc sự chỉ bảo đĩng gĩp nhiều hơn nữa của các thày, cơ giáo, các nhà khoa học...

HƯỚNG NGHIÊN CỨU PHÁT TRIỂN

- Tiếp tục nghiên cứu thêm về lý thuyết về phân cụm dữ liệu.

- Xây dựng, phát triển thêm các kỹ thuật, ứng dụng của Phân cụm dữ liệu.

55

TÀI LIỆU THAM KHẢO

[1]. Đỗ Năng Tồn, Phạm Việt Bình, Giáo trình Xử lý ảnh, Nhà xuất bản Khoa học và Kỹ thuật, Hà Nội 2008.

[2]. Lƣơng Mạnh Bá, Nguyễn Thanh Thủy, Nhập mơn Xử lý ảnh số. Nhà xuất bản Khoa học và Kỹ thuật, Hà Nội 1999.

[3]. http://tailieu.vn/tag/tai-

lieu/X%E1%BB%AD%20l%C3%BD%20%E1%BA%A3nh. [4]. Effective Logo Retrieval with Adaptive Local Feature

Selection, Jianlong Fu, Jinqiao Wang, and Hanqing Lu,

http://nlpr-web.ia.ac.cn/2010papers/gjhy/gh91.pdf.

[5]. Efficient Logo Retrieval Through Hashing Shape Context Descriptors,

Marçal Rusiđol & Josep Lladĩs, http://www.cvc.uab.es/~marcal/pdfs/DAS10a.pdf.

[6]. Automatically Finding Good Clusters with Seed K-Means, Miyoung Shin,Eun Mi Kang and Seon Hee Park

http://www.jsbi.org/pdfs/journal1/GIW03/GIW03P077.pdf

[7]. Data clustering: 50 years beyond K-means, Anil K. Jain, http://biometrics.cse.msu.edu/Publications/GeneralPRIP/JainDataClustering_P RL09.pdf

[8]. Mari Partio, “Content-based Image Retrieval using Shape and Texture Attributes”, Master of Science Thesis,Tampere University of Technology, April 2002.

[9]. Q. Tian, N. Sebe, M.S. Lew, E. Loupias, T. S. Huang, “Content-Based Image Retrieval Using Wavelet-based Salient Points”, August 2001.

56

[10]. Norio Katayama and Shin’ichi Satoh, “Similarity Image Retrieval with Significane-Sensitive Nearest-Neighbor Search”, National Institute of Informatics, 2004.

[11].Pengyu Hong, Qi Tian, Thomas S. Huang, “Incorporate Support Vector Machine to Content-Based Image Retrieval With Relevant Feedback”, IFP Group, Beckman Institute - University of Illinois at Urbana-Champaign, Urbana, USA, 2000.

[12].Kerry Rodden, Wojciech Basalaj,David Sinclair, Kenneth Wood, “A comparison of measures for visualising image similarity”, University of Cambridge Computer Laboratory.

[13].Thomas Deselaers, “Features for Image Retrieval”, Master of Science Thesis, Technische Hochschule Aachen, December 2003.

[14]. Pinar Duygulu, “Interest Points”, Computer Vision, Bilkent University, Spring 2006. (adsbygoogle = window.adsbygoogle || []).push({});

[15].Simone Santani and Ramesh Jain, “Similarity Measures”, University of California, San Diego.

[16].V. Gouet N. Boujemaa, “Object-based queries using color points of interest”, Valerie.Gouet@inria.fr, Nozha.Boujemaa@inria.fr, April 2001.

57

PHỤ LỤC - ẢNH LƠGƠ TRONG CƠ SỞ DỮ LIỆU

58

59

60

Một phần của tài liệu Nghiên cứu một số kỹ thuật phân cụm trong tra cứu logo (Trang 51 - 67)