2. Ứng dụng trong quản lý đăng ký lôgô thƣơng mại
2.2.2. Phân tích về lôgô
Theo nhìn nhận trực quan về ảnh của lôgô nói chung thì 2 yếu tố thuộc tính là màu sắc và hình dạng mang nhiều thông tin hơn so với các thuộc tính khác như cấu trúc bề mặt, tương quan không gian... Cả 2 thuộc tính này đề mang các thông tin dàn trải trên toàn bộ lôgô (tính tổng thể). Do đó việc trích chọn vector đặc trưng sẽ được ấn
định là dùng bộ mô tả vector đặc trưng tổng thể (descriptor of global feature) dựa trên màu sắc và hình dạng.
Nội dung phong phú và đa dạng của lôgô đòi hỏi chương trình phải ổn định trước những biến đổi về góc xoay, tỉ lệ co giãn (các bất biến về hình dạng). Để đảm bảo cho các bất biến này thì phương pháp chung trong việc trích chọn màu sắc và hình dạng là dùng histogram. Ngoài ra kích cỡ của lôgô cũng cần được qui chuẩn trước, chẳng hạn sử dụng kích thước chuẩn chung là 256x256 điểm ảnh. Hệ màu sử dụng lựa chọn hệ RGB.
2.2.3. Đánh giá độ tƣơng tự về lôgô 2.2.3.1. Trích chọn các đặc trƣng cho lôgô
a ) Trích chọn màu sắc theo histogram
Với kích thước của ảnh là 256x256 và bộ màu RGB (3 kênh màu) thì có thể lựa chọn số bin mỗi kênh màu là 16, tức là ta sẽ chia giải giá trị từ 0 – 255 thành 16 phân đoạn tương ứng với 16 bin, giá trị kênh màu thuộc phân đoạn nào thì sẽ thuộc bin đó. Sơ đồ histogram của một lôgô sẽ có dạng như Hình 27.
b ) Trích chọn hình dạng theo histogram
Để tính được histogram hình dạng của lôgô, trước tiên phải xác định biên cho các đối tượng trên ảnh lôgô. Hiện nay có rất nhiều các thuật toán dò biên mà mỗi thuật toán dựa trên các phương pháp riêng. Trước khi ảnh đưa vào dò biên người ta đều biến đổi ảnh về ảnh mức xám. Ở đây ta lựa chọn thuật toán Canny edge. Mô tả của thuật toán sẽ được trình bày trong phần sau (phần “một số thuật toán sử dụng trong chương trình”).
2.2.3.2. So sánh độ đo tƣơng tự giữa các cặp lôgô
Có thể dùng một trong các phương pháp tính toán khoảng cách như Euclidean, Mahalanobis, đặc biệt là ở bước xây dựng vector đặc trưng chúng ta đã sử dụng phương pháp histogram trên các thuộc tính màu sắc và hình dạng thì cách tính toán độ tương tự theo histogram Euclidean đã giới thiệu trong chương trước sẽ là sự lựa chọn đầu tiên.
a ) Lựa chọn 1- độ đo tương tự qua histogram intersection
Như đã giới thiệu trong chương trước, giả sử ta đã có các thành phần IR,IG,IB là các histogram màu chuẩn hoá của một ảnh ảnh lôgô có trong cơ sở dữ liệu và tương ứng ta phải tính các thành phần QR,QG,QB là các histogram màu chuẩn hoá của ảnh lôgô đưa vào kiểm tra. Độ tương tự giữa 2 ảnh lôgô là SHIC(I,Q) được tính theo công thức sau : 3 * |) | |, min(| )) ( ), ( min( )) ( ), ( min( )) ( ), ( min( ) , ( Q I b Q b I g Q g I r Q r I Q I SHIC r R R g G G b B B
Các giá trị đo độ tương tự nằm trong khoảng [0,1].
b ) Lựa chọn 2 - độ đo tương tự qua khoảng cách Euclidean
Tương tự theo phương pháp Euclidean độ tương tự giữa 2 ảnh lôgô là SEDC(I,Q)
được tính theo công thức sau :
3 * 2 )) ( ) ( ( )) ( ) ( ( )) ( ) ( ( 0 . 1 ) , ( 2 2 2 r R R g G G b B B C b Q b I g Q g I r Q r I Q I SED
Và giá trị đo độ tương tự SEDC(I,Q) cũng nằm trong khoảng [0,1]
2.2.4. Một số thuật toán sử dụng trong chƣơng trình 2.2.4.1. Thuật toán dò tìm biên Canny
Hình 28 - Sơ đồ thuật toán dò biên Canny
Thuật toán dò biên Canny như sơ đồ Hình 28 gồm 4 bước như sau: Bước 1: Làm mịn (smoothing)
Sử dụng bộ lọc Gaussian để làm mịn ảnh. Tính toán lựa chọn một mặt lạ (cửa sổ W) thích hợp (ví dụ Hình 29), sau đó sử dụng phép nhân chập chuẩn ảnh I với cửa sổ
W này. Kết quả là khi cửa sổ W trượt hết qua ảnh I tạo ra các vùng vuông xung quanh điểm ảnh (nhiễu). Kích thước cửa sổ W càng lớn thì cảm nhận nhiễu càng thấp.
Hình 29 - Hàm xấp xỉ Gaussian rời rạc với 1.4 (cửa sổ W kích cỡ 5x5)
Bước 2 : Tính toán Gradient
Sau khi ảnh I đã được làm mịn và ước lượng nhiễu, bước tiếp theo là tìm ra các điểm nhiễu mạnh bằng cách thực hiện gradient. Lựa chọn cặp mặt lạ (cửa sổ Gx và Gy) kích cỡ 3x3 như Hình 30, một để tính toán gradient theo phương trục x, một để tính cho phương trục y.
Hình 30 - Cặp mặt lạ tính toán gradient
Tổng hợp kết quả của đôi phép tính này thu được ảnh có đường biên là nơi có nhiễu mạnh. Gradient kết hợp tính như sau:
Gy Gx
G
Một khi đã biết hướng theo các đường trục x và y thì việc xác định hướng cho đường biên trở nên thực sự đơn giản. Góc xác định hướng đường biên tính theo lượng giác: Gx Gy arctan
Bước 3 : Loại trừ không cực đại
Sau khi có được hướng đường biên tạo từ các nhiễu mạnh, phép loại trừ không cực đại được áp dụng để bỏ đi các điểm nhiễu không đủ mạnh (không được xem như là đường biên). Kết quả là nó tạo ra ảnh có các đường đậm nét mảnh.
Bước 4 : Dùng ngưỡng loại trừ các đường trễ
Cuối cùng sử dụng cách loại trừ các đường trễ (giống như làm sạch ba via). Hiện tượng này có nguyên nhân là do các tính toán dao động trên ngưỡng hoặc dưới ngưỡng ở bước 3. Để tránh điều này, sử dụng 2 ngưỡng T1 và T2 (cao và thấp). Bất cứ giá trị điểm ảnh nào mà lớn hơn T1 thì được coi là điểm biên, nó được đánh dấu ngay. Sau đó tất cả các điểm nào kế cận điểm đánh dấu đó có giá trị lớn hơn T2 cũng sẽ được đánh dấu là điểm đường biên.
2.2.4.2. Thuật toán dò tìm điểm góc quan trọng Harris
Thuật toán này có một số ý tưởng gần giống với thuật toán Canny, các bước thực hiện như sau [7]:
Bước 1 : Tính toán đạo hàm theo các phương x và y cho ảnh xám. Sử dụng toán tử Prewitt.
Bước 2 : Làm mịn trên ảnh gradient Gọi x I và y I
là 2 ảnh gradient có được từ bước trước. Tính toán 3 giá trị sau đây :
x I A y I B y I x I C .
Bước 3 : Với mỗi điểm ảnh, xây dựng ma trận 2x2
Tính giá trị tương ứng với vị trí điểm x,y :
trong đó k = 0,04.
Bước 4 : Loại trừ không cực đại
Sử dụng một cửa sổ 3x3 để loại trừ các điểm không cực đại. Nếu như giá trị R của điểm ảnh là cực đại trong phạm vi cửa sổ 3x3 thì sẽ được đánh dấu là điểm góc.
Bước 5 : Xác định điểm góc thực sự quan trọng
Ấn định số điểm góc thực sự quan trọng có trong bức ảnh bằng một số tỉ lệ phần trăm so với tổng số điểm ảnh. (từ thực nghiệm, tỉ lệ này là 1:15).
2.2.5. Hƣớng dẫn sử dụng chƣơng trình và kết quả 2.2.5.1. Lựa chọn các tham số
Vào menu Image Retrieval -> Method’s Option (Hình 31) Các tham số lựa chọn bao gồm:
+ Similarity Method : Lựa chọn phương pháp đo độ tương tự cho màu sắc và hình dạng.
+ Các lựa chọn cho tra cứu theo : By Color (màu sắc), By Shape (hình dạng), By Both (màu sắc và hình dạng)
+ Top N Result : N số kết quả hiển thị (có độ tương tự lớn nhất) + Kích cỡ ảnh chuẩn : Widht (rộng), Height (cao)
+ Threshold : giá trị ngưỡng cho phép biến đổi ảnh xám
+ Canny : các tham số cho việc thực hiện dò biên theo thuật toán Canny (xem phần thuật toán Canny)
2.2.5.2. Cách sử dụng chƣơng trình và một số kết quả
Thứ tự trình bày các màn hình dưới đây chỉ rõ các bước sử dụng chương trình và một số màn hình kết quả.
Vào menu Image Retrieval -> Method’s Option
Hình 32 - Màn hình lựa chọn menu mở file ảnh lôgô đƣa vào tra cứu
Hình 34 - Lựa chọn menu Image Retrieval -> By Color (tra cứu theo màu sắc)
Hình 36 - Lựa chọn menu Image Retrieval -> By Shape để tra cứu theo hình dạng
Hình 38 - Màn hình hiển thị 2 ảnh chụp cùng một cảnh nhƣng khác khung nhìn
KẾT LUẬN
Mô tả nội dung của ảnh đúng như trực quan cảm nhận của con người thông qua tri giác thực sự là mong muốn của ngành khoa học máy tính hiện nay. Đây là một chủ đề lớn và tương đối rộng, tất cả các khía cạnh của nó đều đã được quan tâm nghiên cứu trong các dự án, các công trình khoa học. Với cùng mối quan tâm như trên, nội dung bản luận văn đã nhấn mạnh đến 2 vấn đề chính như sau:
Một là: tìm hiểu về các phương pháp trích chọn đặc tính dựa trên các thuộc tính của ảnh bao gồm màu sắc, hình dạng, cấu trúc… làm cơ sở để mô tả nội dung của ảnh. Tiêu chí chung trong cách trích chọn các đặc tính là bám sát vào thực tế nhận thức tri gác của con người đối với đối tượng ảnh. Kết quả của phép trích chọn này được mô tả dưới dạng các vector đặc trưng ngắn gọn phù hợp với việc lưu trữ - khai thác thông tin đứng trên góc độ quản trị một cơ sở dữ liệu về hình ảnh.
Hai là: tìm hiểu và giới thiệu một số mô hình đánh giá độ tương tự hiện đã và đang được giới khoa học nghiên cứu ứng dụng. Nhìn chung về bản chất các kỹ thuật đánh giá - so sánh độ tương tự hay độ khác biệt đều dựa trên các hàm đánh giá ước lượng về “khoảng cách” giữa 2 vector đặc trưng mô tả nội dung của 2 bức ảnh. Tuy nhiên, cũng như nhiều vấn đề khác, để đưa vào ứng dụng thực tế thì không có phương pháp nào là tuyệt đối.
Để tiếp cận vấn đề, ở phần đầu trong chương 1, trước khi bàn luận đến đối tượng ảnh, luận văn giới thiệu sơ qua về giải phẫu học mắt người, tất nhiên chỉ đứng trên góc độ tìm hiểu chức năng phân tích trực quan. Qua đó cùng với các nghiên cứu về tâm lý của trực giác sẽ là định hướng cho các kỹ thuật nghiên cứu về việc phân tích nội dung ảnh về sau. Sẽ rất khó để đi sâu vào nghiên cứu phân tích các chi tiết của ảnh nếu như không có các lý thuyết cơ bản liên quan đến màu sắc - một trong những thuộc tính cơ bản nhất của bức ảnh, nó là cơ sở của mọi tính toán xử lý ảnh. Trong lưu trữ ảnh, có nhiều hệ không gian màu đã được định nghĩa. Mỗi công thức toán học sử dụng giá trị màu sắc định nghĩa trên không gian màu nhất định. Việc nắm rõ mỗi hệ màu cho phép áp dụng tốt các công cụ thao tác xử lý ảnh. Tri giác không chỉ nhận biết riêng thuộc tính màu sắc, nó còn cảm nhận các thuộc tính về hình dạng, thuộc tính về cấu trúc bề mặt, các bố cục về không gian... Phân tích nội dung trực quan chính là việc đưa ra các phương pháp xây dựng vector đặc trưng dựa theo các thuộc tính trên. Trong khi
histogram là cách cơ bản để khai thác thuộc tính màu sắc, thì phép dò biên lại là cơ sở để phân tích thuộc tính hình dạng, cũng như các biến đổi tần số có ưu thế đối với việc xử lý cấu trúc. Ngoài ra, việc giới thiệu phương pháp trích chọn các điểm ảnh quan trọng đã đưa ra một cách tiếp cận khá mới mẻ trong việc phân tích nội dung của ảnh. Vì số lượng các điểm này trên ảnh là không nhiều nên phương pháp nói trên cải thiện khá tốt về mặt lưu trữ cũng như khai thác tìm kiếm sau này, tuy nhiên việc phân tích ban đầu lại có độ phức tạp lớn. Các phương pháp dựa trên các thuộc tính màu sắc, hình dạng, cấu trúc có ưu thế trong các bộ mô tả nội dung tổng thể thì phương pháp dựa trên phân tích các điểm quan trọng lại thể hiện tính cục bộ của ảnh rất cao. Tất cả những điều đó được thể hiện tại chương 1- “Nội dung trực quan của ảnh”.
Nội dung chính của luận văn là chương 2 - vấn đề về ước lượng tính toán độ tương tự. Trước hết là một số cơ sở lý thuyết liên quan đến khái niệm về tính tương tự, độ đo độ tương. Sau đó sẽ là các kỹ thuật xác định độ đo độ tương tự giữa các bức ảnh. Có rất nhiều kỹ thuật đã được đưa ra, để tổng hợp, luận văn đưa ra cách phân loại theo một số mô hình tương tự. Mô hình phổ biến nhất là mô hình không gian vector, theo mô hình này, việc xác định độ đo tương tự dẫn đến việc tính giá trị “khoảng cách” giữa cặp các vector đặc trưng cho nội dung trực quan của ảnh.
Không dừng lại ở mặt lý thuyết, chương 3 của luận văn giới thiệu một số ứng dụng thành công trong thực tế. Đặc biệt việc tự phát triển một chương trình ứng dụng để tra cứu quản lý ảnh lôgô thương mại, tuy rằng hiện mới chỉ dừng lại ở góc độ trình diễn cho các nghiên cứu đã tiến hành, song cũng mong muốn nếu có điều kiện phát triển, có thể trở thành sản phẩm thực sự mang tính thương mại.
TÀI LIỆU THAM KHẢO
1 Q. Tian, N. Sebe, M.S. Lew, E. Loupias, T. S. Huang, “Content-Based
Image Retrieval Using Wavelet-based Salient Points”, August 2001.
2 Mari Partio, “Content-based Image Retrieval using Shape and Texture
Attributes”, Master of Science Thesis,Tampere University of Technology,
April 2002.
3 M. Trimeche, “Shape Representations for Image Indexing and Retrieval”, Master of Science Thesis, Tampere University of Technology, May 2000. 4 S. M. Lee, J. H. Xin, S. Westland, “Evaluation of Image Similarity by
Histogram Intersection”, Hong Kong Polytechnic University, January
2005.
5 Luong Chi Mai, “Introduction to computer vision and image processing”, United. Nations Educational, Scientific and Cultural Organisation (UNESCO), 2000.
6 Dr. Fuhui Long, Dr. Hongjiang Zhang and Prof. David Dagan Feng,
“Fundamental of Content Base Image Retrieval”,
7 Konstantinos G. Derpanis, “The Harris Corner Detector”,
kosta@cs.yorku.ca, October 2004.
8 Daniel Heesch, Alexei and Stefan Ruger, “Performance comparision of
different similarity models for CBIR with relevance feedback”, Department
of Computing, South Kensington Campus, Imperial College London
9 Anil K. Jain, Aditaya Vailaya, “Image retrieval using color and shape”, Department of Computer Science Michigan State University East Lansing, May 1995.
10 V. Gouet N. Boujemaa, “Object-based queries using color points of
interest”, Valerie.Gouet@inria.fr, Nozha.Boujemaa@inria.fr, April 2001.
11 Nicu Sebe, Michael S. Lew, “Salient Points for Content-based Retrieval”, Leiden Institute of Advanced Computer Science, Netherlands, 2001.
12 Chaur-Chin Chen, Hsueh-Ting Chu, “Similarity Measurement Between
Images”, Department of Computer Science National, Tsing Hua
University, Taiwan, 2003.
14 Norio Katayama and Shin’ichi Satoh, “Similarity Image Retrieval with
Significane-Sensitive Nearest-Neighbor Search”, National Institute of
Informatics, 2004.
15 Pengyu Hong, Qi Tian, Thomas S. Huang, “Incorporate Support Vector
Machine to Content-Based Image Retrieval With Relevant Feedback”, IFP
Group, Beckman Institute - University of Illinois at Urbana-Champaign, Urbana, USA, 2000.
16 Kerry Rodden, Wojciech Basalaj,David Sinclair, Kenneth Wood, “A comparison of measures for visualising image similarity”, University of Cambridge Computer Laboratory.
17 Thomas Deselaers, “Features for Image Retrieval”, Master of Science Thesis, Technische Hochschule Aachen, December 2003.
18 Pinar Duygulu, “Interest Points”, Computer Vision, Bilkent University, Spring 2006.
19 Simone Santani and Ramesh Jain, “Similarity Measures”, University of California, San Diego.