Để tra cứu trước tiên ta phải tạo chỉ mục ảnh dựa trên các vùng màu trội. Các vùng ảnh này được tạo ra sau khi phân vùng và lập chỉ mục để làm đầu vào cho mô- đun hình dạng. Đại diện hình dạng dựa trên phân vùng được điều chỉnh để tính được các đặc trưng hình dạng cần cho độ đo tương tự và kĩ thuật lập chỉ mục hình dạng mẫu nhằm hỗ trợ lập chỉ mục và độ đo tương tự.
3.3.1.1 Phương pháp lập chỉ mục màu sắc
Để lập được chỉ mục dựa vào màu sắc chúng ta sẽ tìm ra các vùng màu trội có trong ảnh. Việc tìm vùng màu trội trong ảnh được mô tả chi tiết dưới đây.
Không gian phân loại màu
Toàn bộ không gian màu RGB được mô tả bằng cách sử dụng một tập con các màu như mô tả trong bảng tra cứu màu sắc trong hình 3.5 sau. Tập con được đưa ra sử dụng trong bảng gồm 25 màu được lựa chọn trong 256 màu sắc
Việc sử dụng một tập con màu sẽ hữu ích vì nó cung cấp một mô tả thô của màu sắc trong một vùng, do đó, cho phép duy trì sự giống nhau cho một vài biến thể trong các trạng thái hình ảnh.
Hình 3.5: Bảng tra cứu màu Kết hợp màu sắc và vùng lựa chọn
Phương pháp này dựa vào sự xuất hiện các thay đổi màu sắc một cách cảm quan trên các đường biên. Sự thay đổi đó phải được tìm thấy trước một cụm bất kì trong không gian màu được cho là tương thích với một vùng trong không gian ảnh. Không gian màu RGB được phân chia trong các không gian con gọi là các mẫu màu. Các màu cảm nhận được tại một điểm ảnh có thể được mô tả bởi một mẫu màu tương ứng.
Thủ tục dưới đây sẽ phân đoạn ảnh thành các vùng tương ứng với màu cảm nhận được. Nó bao gồm gắn kết tất cả các điểm ảnh với các mẫu màu của chúng trong không gian màu và gộp nhóm các điểm ảnh thuộc về cùng một mẫu. Một màu sẽ được chọn từ 25 màu được định nghĩa trước sao cho rất gần so với màu của điểm ảnh trong hình ảnh và nó sẽ được lưu trữ như điểm ảnh màu mới trong hình ảnh đó. Sử dụng giá trị màu tại điểm ảnh p và giá trị trong bảng màu tương ứng C, khoảng cách màu Cd
được tính toán bằng cách sử dụng công thức tính khoảng cách Euclidean: 2 2 2 25 1 ( r iR) ( g iG) ( b iB) i d MIN p C p C p C C (3.1)
Việc đánh dấu vùng được thực hiện trên ảnh cập nhật. Một đường bao hình chữ nhật được vẽ trên mỗi vùng màu trội được chọn. Diện tích hình chữ nhật bao phủ được sử dụng trong việc xác định khu vực tiêu chuẩn. Sau đó, vị trí của vùng được xác định. Đường dẫn ảnh, số lượng các vùng được tìm thấy, thông tin trong mỗi vùng như màu sắc, khu vực tiêu chuẩn (nomalized area) và vị trí mỗi vùng được lưu vào một siêu tệp (meta-file) cho các mục đích xử lí sau đó. Thông tin của tệp này được dùng để xây dựng cây chỉ mục ảnh. Khi hệ thống tra cứu bắt đầu thực hiện, cây chỉ mục được xây dựng. Với một truy vấn đưa ra, cây sẽ tìm kiếm các ảnh tương tự dựa vào màu sắc, diện tích vùng và vị trí của vùng hiện tại trong ảnh.
1. Đọc ảnh và tạo một ma trận ảnh chứa các thành phần RGB của mỗi điểm ảnh có trong ảnh.
2. For mỗi điểm ảnh trong ảnh do
- Tìm kiếm trong bảng tra cứu màu một giá trị màu gần nhất với màu tại điểm ảnh bằng cách tính khoảng cách giữa màu điểm ảnh (I) với màu trong bảng tra cứu màu (C), sử dụng công thức:
22 2 2 ( ) ( ) ) ((Ir Cr Ig Cg Ib Cb D (3.2) Trong đó:
Ir là giá trị màu của điểm ảnh I trên thành phần R. Ig là giá trị màu của điểm ảnh I trên thành phần G. Ib là giá trị màu của điểm ảnh I trên thành phần B.
Cr là giá trị màu của thành phần R trong bảng tra cứu màu. Cg là giá trị màu của thành phần G trong bảng tra cứu màu. Cb là giá trị màu của thành phần B trong bảng tra cứu màu.
- Gán các thành phần RGB trong bảng tra cứu màu cho một điểm ảnh có khoảng cách D nhỏ nhất. Xác định màu tương ứng của mỗi màu trong ảnh đã thay đổi và lưu lại chúng trong bảng tần suất. Sắp xếp bảng tần suất theo chiều giảm dần.
3. Xác định sự xuất hiện đầu tiên của một điểm ảnh có giá trị RGB tương tự như bảng tần suất đã được sắp xếp.
4. Gán vị trí điểm ảnh theo chiều ngang và chiều dọc (iseed, jseed)
5. Dựa vào iseed, jseed để đánh dấu toàn bộ vùng sử dụng thuật toán phát hiện biên gián tiếp (8 lân cận).
6. Kết hợp các (x,y) tạo thành biên của vùng được đánh dấu. 7. Xác định kích thước chuẩn r(R) của hình chữ nhật bao quanh:
size age y y x x R r _ Im * ) ( 1 2 1 2 (3.3)
Với x1, x2, y1, y2 là các tọa độ trên trục x và y của hình chữ nhật bao quanh. Nếu r(R) > T thì vùng được coi như là vùng màu trội, với T là ngưỡng.
8. Lặp lại từ bước 3 đến bước 7 cho đến khi tìm được 3 vùng màu trội. Minh họa phân vùng và dò biên được chỉ ra ở hình 3.6 và hình 3.7
Hình 3.6: Minh họa phân vùng màu.
Hình 3.7: Ảnh đã tìm được biên. Tìm vị trí vùng màu trội
Không gian ảnh được chia thành 9 khu vực nhỏ. Vị trí tương đối của vùng được xác định. Người dùng có thể chỉ rõ khu vực của vùng trong ảnh truy vấn của mình để tìm được ảnh từ cơ sở dữ liệu. Phân lớp theo bản đồ khu vực như trong hình 3.8 và một ví dụ minh họa về vùng tra cứu được đưa ra như trong hình 3.9.
Hình 3.9: Minh họa tìm khu vực. Các bước xác định khu vực của các vùng trong ảnh:
1. Xác định vị trí 4 góc theo bản đồ vị trí. Ký hiệu w là độ rộng ảnh, h là chiều cao ảnh. Ta lần lượt tính được x1, x2, y1, y2, x3, x4, y3, y4 như sau:
3 * 2 3 3 * 2 3 4 3 2 1 w x w x w x w x 3 * 2 3 * 2 3 3 4 3 2 1 w y w y w y w y (3.4)
2. Xác định vị trí tương đối của vùng bằng cách so sánh sự tương ứng của hình chữ nhật bao quanh với các giá trị trên.
Trong thủ tục trên, việc chỉ định màu của mỗi điểm ảnh (đối với các điểm ảnh tương ứng với bảng tra cứu màu) tốn thời gian O(L), với L là số lượng màu trong bảng tra cứu màu. Thuật toán dò biên tốn thời gian O(m2) cho mỗi vùng do nó tìm kiếm toàn bộ ảnh kích thước m*m cho điểm ảnh màu tương tự. Các đặc trưng vùng màu trội được trích chọn như màu sắc, diện tích và vị trí được lưu trong một tệp tuần tự. Cơ sở dữ liệu được xây dựng bằng cách xử lí tất cả các ảnh khi không trực tuyến (offline) vì điều này tiết kiệm thời gian xử lí truy vấn. Khi một truy vấn được tạo ra dựa trên một ảnh mẫu, chỉ có ảnh mẫu được xử lí để trích chọn các đặc trưng vùng.
Như vậy, phân đoạn ảnh dựa trên các màu trội, một màu được lượng tử hóa trong không gian màu RGB sử dụng 25 màu được định nghĩa trước. Từ đó ta tìm được hình chữ nhật nhỏ nhất bao quanh vùng, vị trí, đường dẫn đến ảnh, số lượng vùng trong ảnh, … và tất cả được lưu trữ vào một tệp để xây dựng một cây chỉ mục ảnh. Một cây chỉ mục cho toàn bộ cơ sở dữ liệu được xây dựng khi truy vấn được thực hiện. Tại thời điểm truy vấn, các ảnh tương tự được nối với nhau trên cơ sở màu và vị trí không gian nhận được. Từ chỉ mục màu sắc ở trên, chúng ta có được chỉ mục hình dạng tương ứng với sự bất biến khi quay, dịch chuyển và co dãn.
3.3.1.2 Biểu diễn hình dạng
Sau khi có được các vùng màu trội, ta có thể coi đó như là các vùng hình dạng cần tìm kiếm. Khi này chúng ta sử dụng chỉ mục lưới đối với vùng hình dạng để tìm được đặc trưng tương ứng. Cách làm tương tự đã được trình bày trong mục 3.2 của luận văn này.