Mục tiêu của luận án
Mục tiêu của luận án là nghiên cứu và đề xuất các phương pháp tra cứu ảnh dựa trên đặc trưng màu và thông tin không gian Những phương pháp này nhằm giải quyết vấn đề giảm không gian lưu trữ cho các lược đồ màu biểu diễn ảnh, đồng thời cải thiện độ nhạy cảm với quay và dịch chuyển, giảm độ phức tạp tính toán và tăng độ chính xác trong quá trình tra cứu.
Các đóng góp của luận án
In this thesis, the author explores various image retrieval techniques based on image region features, including the Histogram Graph (HG) method, the Improved Histogram Graph (IHG) method, the Color and Spatial Information (CSI) method, and the Cluster of Colors and Space (CCS) method.
Phương pháp tra cứu ảnh HG dựa vào đặc trưng màu, nổi bật với việc sử dụng ít không gian lưu trữ cho các lược đồ màu biểu diễn ảnh Phương pháp này cũng ít nhạy cảm với các biến đổi như quay và dịch chuyển.
- Để tăng cường phương pháp HG, chúng tôi đã đề xuất phương pháp IHG
Phương pháp HG được cải tiến nhằm giảm thời gian và nâng cao độ chính xác trong việc tra cứu, đồng thời sử dụng ít không gian lưu trữ cho các lược đồ màu biểu diễn ảnh Phương pháp này cũng ít nhạy cảm với sự quay và dịch chuyển của hình ảnh.
Phương pháp CSI [45] được sử dụng để trích rút đặc trưng màu sắc và thông tin không gian từ các vùng ảnh, nhằm cải thiện hiệu suất trong quá trình tra cứu.
Phương pháp CCS phân chia ảnh thành các cụm màu đồng nhất với kích thước khác nhau, giúp trích xuất thông tin màu sắc và không gian của từng khu vực, hỗ trợ hiệu quả cho quá trình tra cứu.
Hệ thống tra cứu ảnh LVFIR (Local Visual Feature-based Image Retrieval) được xây dựng dựa trên các đặc trưng thị giác, bao gồm hai module chính: module tiền xử lý và module tra cứu Các kỹ thuật đề xuất của tác giả là nền tảng cho việc phát triển hệ thống này.
Bố cục của luận án
Luận án này được bố cục thành bốn chương, gồm 125 trang
Chương 1 cung cấp cái nhìn tổng quan về việc trích rút đặc trưng và tra cứu ảnh dựa trên đặc trưng thị giác Bài viết cũng đưa ra một số kết luận quan trọng và định hướng cho các nghiên cứu tiếp theo trong lĩnh vực này.
Chương 2 trình bày kỹ thuật tra cứu ảnh dựa vào lược đồ màu khối, có tên là
HG [42] và cải tiến của nó, có tên là IHG [43]
Chương 3 trình bày kỹ thuật trích rút đặc trưng của vùng ảnh sử dụng trong quá trình tra cứu ảnh, có tên là CSI [45] và CCS [46]
Chương 4 giới thiệu thiết kế và thực hiện hệ thống tra cứu ảnh dựa trên đặc trưng thị giác, ứng dụng các kỹ thuật đã được đề xuất trong Chương 2 và Chương 3 của tài liệu Bên cạnh đó, chương này cũng trình bày một số kết quả đạt được từ hệ thống LVFIR.
Cuối cùng, chúng tôi đƣa ra một số kết luận và đề xuất các nghiên cứu trong tương lai.
TỔNG QUAN VỀ TRÍCH RÚT ĐẶC TRƯNG VÀ TRA CỨU ẢNH DỰA VÀO ĐẶC TRƢNG
Các đặc trƣng
Dữ liệu ảnh thô không được sử dụng trực tiếp trong hầu hết các hệ thống thị giác máy do hai lý do chính: tốn nhiều không gian lưu trữ và độ phức tạp tính toán cao Ngoài ra, nhiều thông tin trong ảnh là dư thừa hoặc không hữu ích Thay vì sử dụng toàn bộ ảnh, chúng ta chỉ cần một biểu diễn quan trọng nhất, được gọi là trích rút đặc trưng, với kết quả là véc tơ đặc trưng Quá trình trích rút đặc trưng có thể được xem như là ánh xạ ảnh từ không gian ảnh sang không gian đặc trưng.
Các đặc trƣng ảnh được phân thành hai loại chính: đặc trƣng thị giác và đặc trƣng ngữ nghĩa Đặc trƣng thị giác lại được chia thành đặc trƣng chung và đặc trƣng theo lĩnh vực Các đặc trƣng thị giác chung bao gồm màu sắc, kết cấu, hình dạng và quan hệ không gian, trong khi các đặc trƣng theo lĩnh vực liên quan đến tri thức cụ thể như mặt người hay vân tay Đặc trƣng ngữ nghĩa thường khó trích rút và thường phải được suy diễn từ các đặc trƣng mức thấp hoặc thông qua văn bản mô tả ảnh.
1.1.1 Các đặc trƣng toàn cục và cục bộ
Các đặc trƣng ảnh có thể được phân loại thành hai loại: toàn cục và cục bộ Đặc trƣng toàn cục thể hiện nội dung thị giác của toàn bộ ảnh, trong khi đặc trƣng cục bộ chỉ biểu diễn nội dung thị giác của một phần cụ thể trong ảnh.
1.1.2 Các đặc trƣng thị giác trong tra cứu ảnh Đặc trƣng màu: Màu có vai trò quan trọng trong tra cứu ảnh dựa vào đặc trƣng thị giác Các màu có thể đƣợc biểu diễn trong các không gian màu khác nhau nhƣ RGB, HSV, Đặc trƣng kết cấu: Kết cấu là tập các điểm trong một vùng thỏa mãn ràng buộc hay qui luật nào đó Đặc trƣng này khá quan trọng cho tra cứu ảnh
Các phương pháp biểu diễn kết cấu được chia thành hai loại chính: phương pháp cấu trúc và phương pháp thống kê Các toán tử phát hiện cấu trúc, bao gồm toán tử hình thái và đồ thị liền kề, giúp xác định các kết cấu cơ sở và luật phân bố của chúng Trong khi đó, phương pháp thống kê như phổ năng lượng Fourier, Tamura, trường ngẫu nhiên Markov, mô hình fractal, và các bộ lọc đa phân giải như biến đổi Gabor và biến đổi dạng sóng, thể hiện kết cấu thông qua phân bố thống kê của độ sáng các điểm ảnh Đặc trưng hình dạng có mối quan hệ chặt chẽ với mô tả vùng hoặc đối tượng được phân đoạn, và được trích xuất từ đường bao của đối tượng hoặc vùng chứa đối tượng.
Kiến trúc của một hệ thống tra cứu ảnh dựa vào đặc trƣng thị giác
Quá trình thực hiện của hệ thống tra cứu ảnh dựa vào đặc trƣng thị giác đƣợc chia thành hai giai đoạn:
Giai đoạn 1: Tạo lập CSDL ảnh cùng với thông tin đặc trƣng (ngoại tuyến)
Quá trình trích rút đặc trưng của ảnh trong cơ sở dữ liệu bao gồm các bước lọc, chuẩn hóa, phân đoạn và nhận dạng đối tượng Kết quả của quá trình này là một tập hợp các mô tả nội dung của các ảnh trong cơ sở dữ liệu.
Giai đoạn 2: Tra cứu ảnh (trực tuyến)
1 Tạo lập truy vấn: trích rút đặc trƣng thị giác của ảnh truy vấn
2 So sánh: các đặc trƣng thị giác của ảnh truy vấn đƣợc so sánh với các đặc trƣng thị giác của các ảnh trong CSDL ảnh Các kỹ thuật đánh chỉ số có thể đƣợc sử dụng nhằm tăng tốc quá trình tra cứu
Dưới đây là kiến trúc hệ thống tra cứu ảnh dựa vào đặc trưng thị giác
Hình 1.1 Kiến trúc hệ thống tra cứu ảnh dựa vào đặc trƣng thị giác
Hệ thống tra cứu ảnh dựa vào đặc trưng thị giác cho phép người dùng tìm kiếm hình ảnh trong cơ sở dữ liệu (CSDL) bằng cách sử dụng các véc tơ đặc trưng nhiều chiều Các đặc trưng này được trích xuất từ ảnh và tạo thành CSDL đặc trưng Khi người dùng cung cấp ảnh truy vấn, hệ thống sẽ trích xuất véc tơ đặc trưng của ảnh đó và xác định độ tương tự với các véc tơ trong CSDL đặc trưng, từ đó hỗ trợ quá trình tra cứu hiệu quả.
Cơ sở dữ liệu ảnh
Cơ sở dữ liệu đặc trƣng
Xác định độ tương tự đặc trƣng Ảnh truy vấn
Các ảnh đƣợc tra cứu hệ thống cho ra kết quả tra cứu gồm một danh sách các ảnh có độ tương tự với ảnh truy vấn nhất.
Trích rút đặc trƣng
Đặc trưng màu là một yếu tố thị giác quan trọng, đóng vai trò thiết yếu trong việc tra cứu ảnh Trong phần này, chúng tôi sẽ tập trung vào việc phân tích và ứng dụng của đặc trưng màu trong lĩnh vực này.
Trước khi thảo luận về đặc trưng màu sắc, chúng tôi sẽ giới thiệu khái niệm dải của lược đồ màu và khối ảnh Định nghĩa 1.1 về dải của lược đồ màu sẽ được trình bày rõ ràng.
Một dải của lƣợc đồ màu là số điểm ảnh trong một diện tích ảnh đƣợc chỉ ra mà có chung màu Định nghĩa 1.2 [Khối ảnh]:
Một khối ảnh là một vùng ảnh hình chữ nhật trong ảnh
1.3.1 Đặc trƣng màu Đặc trƣng màu đƣợc sử dụng rất hiệu quả cho tra cứu các ảnh màu trong CSDL ảnh [66, 69, 80] Các mô tả màu được trích rút và so sánh tương đối thuận lợi và do đó nó thích hợp cho tra cứu dựa vào đặc trƣng thị giác Ảnh được thu thập từ camera số, hoặc được tải xuống từ Internet thường có ba kênh màu (các ảnh đa cấp xám chỉ có một kênh, các ảnh đa phổ có thể có nhiều hơn ba kênh)
Tín hiệu màu một hoặc hai chiều được sử dụng phổ biến trong việc tra cứu ảnh dựa vào đặc trưng thị giác (VFBIR), đặc biệt trong các ứng dụng yêu cầu điều kiện thu nhận ảnh tương phản quan trọng Nghiên cứu đã chỉ ra rằng màu sắc là yếu tố bất biến trước ánh sáng, bóng đổ, cũng như sự thay đổi hình học của người quan sát và các góc chiếu sáng.
Lƣợc đồ màu được sử dụng để mô tả đặc trƣng màu sắc của ảnh và đếm số lần xuất hiện của mỗi màu, từ đó suy ra phân bố xác suất màu trong ảnh Phân bố này không bị ảnh hưởng bởi các biến đổi như quay, dịch chuyển và tỷ lệ, nên lƣợc đồ màu rất hữu ích cho việc tra cứu ảnh dựa trên đặc trƣng thị giác Tuy nhiên, nhƣợc điểm lớn của lƣợc đồ màu là không khai thác được thông tin không gian của các vùng ảnh, dẫn đến sai sót trong tra cứu, ví dụ như không thể phân biệt giữa quả bóng màu xanh và bụi cỏ màu xanh.
Hình 1.2 Hai ảnh khác nhau nhƣng có cùng lƣợc đồ màu
Nhiều phương pháp tra cứu theo màu đã được đề xuất, bao gồm mô men màu, các dấu hiệu màu, lược đồ màu cải tiến, véc tơ gắn kết màu, tra cứu ảnh dựa vào phân cụm, tương quan màu, vùng màu cục bộ, phương pháp Harbin và các đốm màu Các kỹ thuật này tập trung vào việc sử dụng thông tin không gian trong lược đồ màu Cách tiếp cận đầu tiên cố gắng liên kết thông tin không gian vào lược đồ màu toàn cục, nhưng gặp khó khăn trong việc thu nhận thông tin không gian của các vùng trong ảnh do bản chất của lược đồ màu toàn cục Cách tiếp cận thứ hai, mặc dù cải thiện khả năng thu nhận thông tin không gian, vẫn gặp hạn chế khi cần chia ảnh thành nhiều khối đều, dẫn đến tăng không gian lưu trữ lược đồ màu và độ phức tạp tính toán Thực tế, việc ép các đối tượng vào các khối đều cũng gặp khó khăn, do đó các kỹ thuật hiện tại chưa mang lại kết quả tối ưu.
1.3.2 Lƣợng hóa màu Để sinh ra các lƣợc đồ màu, lƣợng hoá màu phải đƣợc áp dụng Lƣợng hoá màu là quá trình giảm số các màu đƣợc sử dụng để biểu diễn một ảnh Một lƣợc đồ lƣợng hoá đƣợc xác định bởi không gian màu và phân đoạn của không gian màu đƣợc sử dụng Một không gian màu là biểu diễn của màu trong không gian ba chiều Áp dụng một lƣợc đồ lƣợng hoá chuẩn trên một không gian màu, mỗi trục đƣợc chia ra thành một số phần Khi các trục đƣợc chia ra thành k,l, và m phần, số các màu đƣợc sử dụng để biểu diễn một ảnh sẽ là nk.l.m Lƣợng hoá không gian màu thành n màu thường được xem như một lược đồ lượng hoá n dải Hình 1.3 minh hoạ sự ảnh hưởng của lượng hoá các ảnh màu
Hình 1.3 Từ trái sang: ảnh gốc sử dụng 256 màu, đƣợc lƣợng hoá trong 8 dải, và đƣợc lƣợng hoá trong 64 dải sử dụng không gian màu RGB
1.3.3 Biểu diễn màu 1.3.3.1 Lƣợc đồ màu
Lƣợc đồ màu thể hiện sự phân bố số lượng điểm ảnh cho mỗi dải được lượng hóa, giúp mô tả phân bố màu tổng thể và cục bộ trong ảnh một cách dễ dàng và hiệu quả Ngoài ra, lƣợc đồ màu còn có ưu điểm là không nhạy cảm với việc quay và dịch chuyển trục quan sát, đồng thời thay đổi chậm với tỷ lệ và vị trí quan sát.
Mỗi điểm ảnh trong ảnh có thể được mô tả bằng ba thành phần màu trong không gian màu như RGB hoặc HSV Một lược đồ màu cho từng thành phần có thể được định nghĩa, với lược đồ chứa nhiều dải màu sẽ cải thiện khả năng phân biệt ảnh Tuy nhiên, việc này cũng làm tăng độ phức tạp tính toán và gây khó khăn cho việc đánh chỉ số trong cơ sở dữ liệu ảnh.
Số lượng dải màu không tăng cường hiệu năng tra cứu trong các ứng dụng, và một phương pháp để xác định số dải là sử dụng phân cụm để tìm K màu tốt nhất trong không gian ảnh đã cho Quá trình phân cụm này giúp giảm thiểu khả năng các dải lược đồ không có hoặc có rất ít điểm ảnh Một lựa chọn khác là sử dụng các dải có số điểm ảnh lớn nhất, bởi vì phần lớn điểm ảnh của ảnh thường thuộc về một số ít dải Việc giảm số dải sẽ không chỉ không làm giảm hiệu năng so sánh mà còn có thể cải thiện hiệu suất, vì các dải nhỏ thường được coi là nhiễu Trong các CSDL ảnh lớn, so sánh theo lược đồ có thể dẫn đến nhiều kết quả sai do lược đồ màu không xem xét thông tin không gian Để giảm thiểu sai sót, các cải tiến đã được đề xuất để kết hợp thông tin không gian vào lược đồ, như kỹ thuật lược đồ liên kết Các cách tiếp cận khác bao gồm chia ảnh thành các vùng con và tính lược đồ cho mỗi vùng, với các phương pháp chia đơn giản như phân hoạch hình chữ nhật và phân hoạch hình quạt, hay phức tạp hơn như phân đoạn vùng hoặc phân hoạch đối tượng Tuy nhiên, việc tăng số vùng con sẽ làm tăng thông tin không gian, nhưng cũng đồng thời tăng không gian lưu trữ và thời gian tính toán.
1.3.3.2 Lƣợc đồ màu toàn cục GCH
Lược đồ màu toàn cục (GCH) cho phép mã hóa một ảnh bằng lược đồ màu của nó, từ đó xác định khoảng cách giữa hai ảnh dựa trên khoảng cách giữa các lược đồ màu Việc sử dụng GCH giúp chúng ta áp dụng các độ đo khác nhau để tính toán khoảng cách giữa các lược đồ màu, như sẽ được trình bày trong mục 1.4 Hình 1.4 minh họa cách tính khoảng cách giữa hai ảnh sử dụng GCH, bao gồm Ảnh I 1, Ảnh I 2 và Ảnh I 3.
Hình 1.4 Ba ảnh I 1 , I 2 và I 3 và các lược đồ màu tương ứng của chúng
Trong bài viết này, chúng ta phân tích ba dải màu: đen, xám và trắng Lược đồ màu của ảnh I1 là {25%, 37.5%, 37.5%}, trong khi lược đồ màu của ảnh I2 là {18.75%, 37.5%, 43.75%} Ảnh I3 có lược đồ màu tương tự như ảnh I2 Khi áp dụng khoảng cách Euclid để tính toán, khoảng cách lược đồ giữa ảnh I1 và I2 theo GCH được xác định.
Khoảng cách giữa các ảnh I 1 và I 3 bằng khoảng cách giữa các ảnh I 1 và I 2 và khoảng cách giữa các ảnh I 2 và I 3 là 0
GCH là phương pháp tra cứu ảnh truyền thống dựa vào màu sắc, nhưng không cung cấp thông tin về phân bố màu của các vùng trong ảnh Điều này dẫn đến việc khoảng cách giữa các ảnh có thể không phản ánh đúng sự khác biệt giữa chúng Ví dụ, khoảng cách giữa hai ảnh I1 và I3 có thể nhỏ hơn khoảng cách giữa I1 và I2, nhưng với GCH, chúng ta lại nhận được khoảng cách tương tự Đây là nhược điểm chính của phương pháp GCH.
1.3.3.3 Lƣợc đồ màu cục bộ LCH
Cách tiếp cận LCH liên quan đến việc phân tích phân bố màu của các vùng trong ảnh Đầu tiên, ảnh được phân đoạn thành các khối, và mỗi khối sẽ có một lược đồ màu riêng Sau đó, ảnh được biểu diễn thông qua các lược đồ này Khi so sánh hai ảnh, khoảng cách lược đồ giữa các khối tương ứng sẽ được tính toán Tổng hợp tất cả các khoảng cách này sẽ xác định khoảng cách giữa hai ảnh Nếu áp dụng căn bậc hai của khoảng cách Euclid làm tiêu chí so sánh, khoảng cách giữa hai ảnh Q và I theo LCH sẽ được tính toán cụ thể.
LCH (Q,I) (H i H [i]) d (1-1) Ở đây M là số các khối trong ảnh, N là số các dải trong lƣợc đồ màu, và
H Q k I k là giá trị của dải i trong lƣợc đồ màu H Q k (H I k ), H Q k (H I k ) biểu diễn khối k trong ảnh Q(I)
Các ví dụ ở dưới sử dụng các ảnh I , 1 I và 2 I 3 trong Hình 1.4 để chỉ ra cách tính khoảng cách giữa các ảnh sử dụng LCH
Khoảng cách giữa I 1 và I 2 (xem Hình 1.5) đƣợc tính nhƣ sau:
Hình 1.5 Tính khoảng cách giữa ảnh I 1 và I 2 sử dụng LCH, d LCH (I 1 ,I 2 )1.319,
Hình 1.6 chỉ ra việc sử dụng LCH để tính khoảng cách giữa các ảnh I 1 và I 3
(0.707), trong khi Hình 1.7 chỉ ra sự sử dụng của nó để tính khoảng cách giữa các ảnh I 2 và I 3 (1.768)
Hình 1.6 Tính khoảng cách giữa các ảnh I 1 và I 3 sử dụng LCH, d LCH (I 1 ,I 3 )0.707,
Hình 1.7 Tính khoảng cách giữa các ảnh I 2 và I 3 sử dụng LCH d LCH (I 2 ,I 3 )0.707,
Trong một số trường hợp, việc sử dụng LCH có thể mang lại độ chính xác tra cứu cao hơn so với GCH Bên cạnh đó, các khoảng cách giữa các ảnh được xác định bằng LCH thường hợp lý hơn so với các khoảng cách thu được từ GCH.
Kết luận và định hướng nghiên cứu
Trong chương này, chúng tôi đã trình bày các khái niệm và kỹ thuật cơ bản về trích rút đặc trưng và tra cứu ảnh dựa vào đặc trưng thị giác Chúng tôi chú trọng vào trích rút và biểu diễn đặc trưng thị giác, trong đó màu sắc là đặc trưng phổ biến nhất Màu sắc giúp cảm nhận và phân biệt ảnh một cách hiệu quả, đồng thời cũng ổn định trước các biến dạng nhỏ và không phụ thuộc vào hướng hay kích thước của ảnh.
Thông tin màu thường được biểu diễn qua lược đồ màu trong một không gian màu nhất định, mang lại ưu điểm tính toán nhanh và không nhạy cảm với thay đổi nhỏ trong vị trí thu nhận ảnh Tuy nhiên, lược đồ màu chỉ là mô tả thô của ảnh, dẫn đến khả năng hai ảnh khác nhau có thể có lược đồ màu tương tự Hai ảnh chỉ được coi là tương tự khi chúng có các vùng màu giống nhau tại những vị trí tương đồng Do đó, việc kết hợp đặc trưng màu với thông tin không gian là cần thiết để cải thiện hiệu suất tra cứu.
Trong luận án này, chúng tôi tập trung vào việc nâng cao hiệu năng của hệ thống tra cứu ảnh bằng cách sử dụng các đặc trưng thị giác, đặc biệt là đặc trưng của vùng ảnh.
Chúng tôi đề xuất một phương pháp tiết kiệm chi phí không gian lưu trữ cho các lược đồ màu biểu diễn ảnh, đồng thời giảm độ nhạy cảm với quay và dịch chuyển Bên cạnh đó, chúng tôi cũng sẽ giới thiệu một phương pháp kết hợp thông tin màu và không gian trong quá trình tra cứu, nhằm nâng cao hiệu suất tra cứu.
PHƯƠNG PHÁP TRA CỨU DỰA VÀO LƯỢC ĐỒ MÀU KHỐI
Lƣợc đồ màu khối
Trong mục này, chúng tôi sẽ giới thiệu sơ lƣợc cách tiếp cận lƣợc đồ màu khối (CCH) sử dụng trong tra cứu ảnh [54]
Dưới đây là mô tả cách tiếp cận lược đồ màu khối:
Ảnh được lƣợng hoá thành C màu trong không gian RGB và chia thành mm khối ảnh có kích thước bằng nhau Lược đồ màu khối theo màu c (0 < c ≤ C) được định nghĩa là một tập mm dải, trong đó dải của lƣợc đồ màu khối đại diện cho số điểm ảnh trong mỗi khối ảnh có chung màu Giá trị dải được mô tả bởi hàm p(b k) = n k / n, với b k là khối ảnh thứ k (0 < k ≤ mm), n k là số điểm ảnh có màu c trong khối b k và n là tổng số điểm ảnh trong ảnh.
Trong phương pháp biểu diễn này, mỗi bức ảnh được tạo thành từ các màu sẽ được mô tả bằng các lược đồ màu khối, trong đó mỗi lược đồ thể hiện sự phân bố không gian của một màu trong ảnh Nếu một màu không xuất hiện trong ảnh, sẽ không có lược đồ màu khối nào được lưu trữ Hình 2.1 minh họa một bức ảnh ba màu với 9 khối (3×3), trong đó các khối được đánh thứ tự từ trái sang phải và từ trên xuống dưới, kèm theo lược đồ màu khối tương ứng cho mỗi màu.
Hình 2.1 Một ảnh đƣợc chia thành 9 khối ảnh và ba lƣợc đồ màu khối của nó
Xác định khoảng cách giữa hai ảnh
Khoảng cách giữa ảnh truy vấn
I 2 h đƣợc xác định dựa trên độ đo khoảng cách L 1 (công thức 2-1)
2 i j h I biểu diễn dải thứ j của lƣợc đồ màu khối thứ i đƣợc sử dụng để biểu diễn ảnh truy vấn
Để chuẩn hóa kết quả thu được với khoảng cách L1, chúng ta cần chia kết quả này cho tổng diện tích của các vùng được mô tả bởi mỗi lược đồ.
1 i a i a I I Các diện tích này cũng đƣợc chuẩn hoá với các cỡ của ảnh Khoảng cách đƣợc chuẩn hoá D n đƣợc chỉ ra trong công thức 2-2
Việc sử dụng CCH mang lại độ chính xác cao hơn so với GCH trong việc tra cứu Ngoài ra, CCH cũng giúp biểu diễn ảnh một cách cô đọng hơn thông qua cách tiếp cận LCH.
Phương pháp tra cứu dựa vào lược đồ màu khối
Lược đồ màu toàn cục GCH là một kỹ thuật hiệu quả trong việc áp dụng các đặc trưng màu đơn giản, nhưng chỉ cung cấp sự phân bố màu mà không xem xét mối quan hệ và vị trí không gian của chúng Để khắc phục nhược điểm này, lược đồ màu cục bộ LCH đã được đề xuất, chia ảnh thành các khối có kích thước bằng nhau và tính toán khoảng cách giữa các khối tương ứng Tuy nhiên, LCH tiêu tốn nhiều không gian lưu trữ và không xử lý tốt các biến đổi hình học như quay và dịch chuyển Phương pháp CCH được phát triển nhằm giảm chi phí lưu trữ của LCH, nhưng cũng gặp phải vấn đề tương tự khi không thể xử lý các biến đổi hình học, dẫn đến kết quả không khả quan khi ảnh bị quay hoặc dịch chuyển.
Ví dụ 2.1 Xét ảnh I và ảnh I’ đƣợc cho trong Hình 2.2, ảnh I’ là kết quả của việc điều chỉnh ảnh I quay một góc 90 0 a/ Ảnh I b/ Ảnh I’
Phương pháp CCH tính khoảng cách giữa hai ảnh I và I’ bằng cách lược đồ màu khối theo màu đen và trắng Quá trình này được minh họa trong Hình 2.3 và Hình 2.4.
Hình 2.3 Lƣợc đồ màu khối theo màu black và white biểu diễn ảnh I
Hình 2.4 Lƣợc đồ màu khối theo màu black và white biểu diễn ảnh I’
Tiếp theo, khoảng cách giữa ảnh I và I’ theo màu black và white đƣợc thực hiện nhƣ chỉ ra trong Hình 2.5 và Hình 2.6
Hình 2.5 Tính khoảng cách của ảnh I và I’ theo màu black
Tính khoảng cách của ảnh I và I’ theo màu black Khoảng cách này có giá trị:
Hình 2.6 Tính khoảng cách của ảnh I và I’ theo màu white
Tính khoảng cách của ảnh I và I’ theo màu white Khoảng cách này có giá trị:
Khoảng cách giữa ảnh I và I’: D n (I, I' ) D n (I, I" ) black D n (I, I" ) white 1
Hai ảnh I và I’ trong Ví dụ 2.1 lẽ ra phải tương đồng, nhưng do cách tính của CCH, chúng lại khác biệt rõ rệt Để khắc phục nhược điểm này của CCH, chúng tôi đề xuất áp dụng phương pháp HG [42].
2.2.2 Phương pháp tra cứu đề xuất HG 2.2.2.1 Khái niệm về đồ thị hai phía
Mục này sẽ giới thiệu một số khái niệm cơ bản về đồ thị hai phía [50]: Định nghĩa 2.1 [Đồ thị]:
Đồ thị vô hướng G(N, E) được định nghĩa với N là tập đỉnh và E là tập cạnh, trong đó E là tập con của tích Đề các N×N Một đồ thị vô hướng có trọng số là đồ thị mà các cạnh được gán trọng số, thể hiện độ dài hoặc chi phí giữa các đỉnh.
Đồ thị G(N, E) là một đồ thị vô hướng với trọng số không âm cho mỗi cạnh Đồ thị hai phía là loại đồ thị vô hướng G(N, E) có khả năng phân chia tập hợp đỉnh N thành hai tập X và Y, đáp ứng các điều kiện nhất định.
Trong đồ thị hai phía G(X, Y, E), với điều kiện X×X ∩ E = ∅ và Y×Y ∩ E = ∅, đồ thị này được định nghĩa là có trọng số khi mỗi cạnh được gán một giá trị không âm Đối sánh M của đồ thị G(X, Y, E) là tập hợp các cạnh mà không có hai cạnh nào chia sẻ đỉnh chung Giá trị của một đối sánh được xác định dựa trên các cạnh trong tập M.
Giá trị của một đối sánh trong đồ thị hai phía G(X,Y,E) có trọng số được xác định bằng tổng các trọng số của các cạnh trong đối sánh Định nghĩa 2.7 nêu rõ khái niệm về giá trị đối sánh cực tiểu.
Giá trị đối sánh cực tiểu là giá trị nhỏ nhất trong tất cả các đối sánh khả thi của đồ thị hai phía có trọng số G(X,Y,E).
Trong phần này chúng tôi trình bày phương pháp HG Phương pháp này đã đƣợc chúng tôi công bố trong [42] Ý tưởng của phương pháp HG:
Phương pháp tính lược đồ màu khối bắt đầu bằng việc xác định màu sắc của ảnh truy vấn và ảnh CSDL Tiếp theo, khoảng cách giữa hai ảnh được tính toán dựa trên đồ thị hai phía có trọng số, trong đó các đỉnh bên trái đại diện cho các dải màu của ảnh truy vấn và các đỉnh bên phải tương ứng với dải màu của ảnh CSDL Cuối cùng, tổng khoảng cách giữa ảnh truy vấn và ảnh CSDL theo tất cả các màu được tính, và giá trị này được coi là khoảng cách tổng thể giữa hai ảnh.
Nội dung thuật toán HG:
Tiếp theo, chúng tôi mô tả chi tiết thuật toán HG [42] trả lại khoảng cách của hai ảnh I 1 và I 2
Vào: ảnh I 1 và I 2 với cỡ n×n khối ảnh
Ra: D - khoảng cách giữa hai ảnh I 1 và I 2
1 For mỗi c 1 in C 1 do 1.1 Tính H(I 1 , c 1 , n)
2 For mỗi c 2 in C 2 do 2.1 Tính H(I 2 , c 2 , n)
3.1 Xây dựng đồ thị G(X, Y, E, c) gồm 2n 2 đỉnh 3.2 D D + MCM (G(X, Y, E, c), n)
Trong thuật toán HG, tham số C1 đại diện cho số màu của ảnh I1, C2 cho số màu của ảnh I2, và C là tổng số màu của cả hai ảnh H(I1, c1, n) là lược đồ màu khối của ảnh I1 theo màu c1 với kích thước n×n, trong khi H(I2, c2, n) là lược đồ màu khối tương ứng của ảnh I2 Đồ thị G(X, Y, E, c) bao gồm 2n² đỉnh, với n² đỉnh bên trái tương ứng với lược đồ màu khối H(I1, c, n) và n² đỉnh bên phải tương ứng với H(I2, c, n) Hàm MCM( , ) được sử dụng để tính khoảng cách giữa hai ảnh dựa trên màu c đã cho.
Thuật toán HG bắt đầu bằng việc lượng hóa các màu của ảnh truy vấn và ảnh CSDL, tạo ra tập màu ký hiệu là C Sau đó, ảnh được chia thành các khối có kích thước bằng nhau, xây dựng lược đồ màu khối cho mỗi màu c (0