2.3.1. Hệ màu chuẩn RGB
Ba màu RGB( RED-GREEN-BLUE) là ba màu cơ bản được dùng để mã hóa hệ thống đồ hoạ phân biệt được khoảng 16 triệu màu. Tuy nhiên, việc mã hoá này sẽ không thể hiện được tất cả các sự khác biệt về màu sắc trong thế giới thực.RGB sử dụng 3 byte để biểu diễn, mỗi điểm ảnh RGB gồm 1 byte cho màu R, 1 byte cho màu G, 1 byte cho màu B. Việc mã hoá một màu tuý ý trong dãy hiển thị được thực hiện bằng cách tổ hợp ba màu chính. Ví dụ RED(255,0,0), Green(0,255,0), Blue(0,0,255), Black(0,0,0). Hệ thống màu RGB là hệ thống màu cộng vì một màu bất kỳ được tạo nên bằng cách cộng thêm các phẩn tử vào màu Black(0,0,0). Khuôn dạng của không gian màu RGB là định dạng phổ biến nhất của ảnh số, lý do chính là tính tương thích với màn hình hiển thị chính là màn hình vi tính. Tuy nhiên không gian màu này có hạn chế là không thể hiện được cách cảm nhận màu sắc của con người. Do vậy không phù hợp với việc tìm kiếm ảnh.
2.3.2. Hệ màu CMY
Không gian màu CMY được dùng trong in ấn. Màu lục lam, màu đỏ tươi và màu vàng là phần bù của màu đỏ, màu xanh lá cây và màu xanh dương được gọi là các thành phần cơ sở trừ vì chúng được tạo ra bằng cách trừ đi độ sáng từ màu trắng
Ví dụ: Màu lục lam là phần bù của màu đỏ, được tạo ra bằng cách xoá thành phần đỏ từ màu trắng. Có thể chuyển không gian màu RGB sang không gian màu CMY bằng công thức chuyển đổi đơn giản nhưng kém chính xác: C=1-R, M=1-G, Y=1-B. Hệ thống màu này đường như là một sự đảo ngược của hệ thống màu GRB. Đặc tính khá đơn giản và được ứng dụng nhiều trong thực tế. Tuy nhiên, cũng như RGB, CMY cúng có hạn chế đó là màu sắc được mã hoá trong hệ màu này khác với màu sắc được con người cảm nhận. Do vậy không phù hợp với việc tìm kiếm ảnh
2.3.3. Hệ màu YIQ
Là sự biến thể của hệ RGB bằng cách chuyển đổi hiệu quả và duy trì sự tương thích với các màu chuẩn
Công thức chuyển đổi từ RGB sang YIQ
Để lấy được các giá trị RGB từ tập YIQ, chúng ta chỉ cần thực hiện toán tử đảo ma trận. hệ màu YIQ được thiết kế giúp cho sự cảm nhậncủa con người về sự thay đổi độ sáng chói tốt hơn sự thay đổi đặc trưng màu sắc và độ thuần khiết. Lợi thế của YIQ trong việc xử lý ảnh là độ sáng chói(Y) và thông tin màu (I, Q) được tách riêng. Chính việc tách này giúp cho quá trình xử lý thành phần Y của ảnh không ảnh hưởng đến nội dung màu.
Không gian màu này gây khó khăn cho người sử dụng vì nó không phản ánh trực tiếp khái niệm giác quan của màu sắc: màu, sắc thái và độ sáng.
2.3.4. Hệ màu L*a*b
Mô hình màu L*a*b được đề xuất bởi CIE cho việc lượng hoá sự khác biệt của màu sắc chống vật chiếu sáng của ánh sáng ban ngày. Tuy nhiên, nó có một sự chuyển đổi được ghi vào để tính toán cho việc thích nghi với những nguồn sáng. Một màu được xác định bằng hai toạ độ x, y. Độ sáng L* dựa trên độ đo giác quan của thành phần sáng u* và toạ độ màu v*. Các màu khác nhau theo cùng một xu hướng duy nhất là xấp xỉ bằng nhau theo không gian màu này. Do đó, khoảng cách Euclid được dùng để quyết định khoảng cách tương đối giữa hai màu. Tuy nhiên, việc chuyển sang không gian màu RGB là không tuyến tính. Đây là hệ thống màu có sự tách biệt giữa ánh sáng và màu sắc.
2.3.5. Hệ màu HSI
Hệ thống màu HSI mã hoá thông tin màu sắc bằng cách chia giá trị intensity I từ hai giá trị được mã hoá thuộc về độ hội tụ của màu- Hue H và Saturation S. Không gian màu HSI được chia thành 3 thành phần: Hue H mang thông tin về màu sắc có giá trị 0-2pi Saturation S là độ thuần khiết của thành phần Hue H có giá trị 0-1, intensity I mang thông tin về độ sáng của diểm ảnh. Ta có thể hình dung không gian màu HSI như một vật thể hình nón. Với trục chính biểu thị cường độ sáng intensity I. Khoảng cách đến trục biểu thị độ tập trung Saturation S. Góc xung quanh trục biểu thị cho màu sắc Hue H. Hệ màu này thích hợp với một số thiết kế đồ hoạ vì nó cung cấp sự điểu khiển trực tiếp đến ánh sáng và Hue H, nó cũng hỗ trợ tốt cho các thuật toán xử lý ảnhvì những tiêu chuẩn về ánh sáng và tập trung vào hai tham số về độ hội tụ màu và cường độ màu. Do đó nó có khả năng đáp ứng được việc so sánh sự giống nhau về màu sắc giữa hai ảnh và do vậy thích hợp với việc truy tìm ảnh dựa vào màu sắc.
Hình 2.3.5.1: màu sắc trong HSI
Hình 2.3.5.2. Hệ màu HSI
Màu trong không gian màu HSI
Thuật toán chuyển đổi từ RGB sang HSI
R,G,B, H,S, I: là các số thực
Gọi RBG là các giá trị nhập của RGB với giá trị trong khoảng từ [0,1] đến [0,255] I: là giá trị xuất của cường độ Intensity[0,1]
S: là giá trị xuất của độ bão hoà Saturation[0,1] H: Giá trị xuất của màu sắc Hue[0,2Π]
Procedure RGB-HSI(in: R,G,B;out:H,S,I) { I:= Max(R,G,B)
Min:=Min(R,G,B) If(I>=0) then S:=(I-min)/I;
Else S:=0; If S<=0 then { H:=-1; return } diff:=I-Min;
if (R=I) then H:=(Π/3)*(G-R)/diff;
else if( G=I) then H:=(2*Π/3)+Π/3*(B-R)/diff; else if( B=I) then H:=(4*Π/3)+Π/3*(R-G)/diff; if (H<=0) then H:=H+Π/2
}
Hình 2.3.5.3.Sự thay đổi cường độ sáng trong hệ màu HSI
Dễ cảm nhận, phù hợp với mắt người
Dễ định lượng, tách bạch thành phần màu và độ sáng .
2.4. Các đặc trưng về màu sắc 2.4.1. Lược đồ màu(Histogram)
Là đại lượng đặc trưng cho phân bố màu cục bộ của ảnh, nó như là 1 bảng tóm tắt thong tin về màu sắc của một ảnh bất kì
Việc tính lược đồ màu này được tiến hành 1 cách nhanh chóng trong ảnh mà chỉ qua 1 lần duyệt qua toàn bộ ảnh. Do đó ứng dụng vào việc tìm kiếm ảnh sẽ có lợi rất lớn về mặt tốc độ
Một số tính chất cần quan tâm của lược đồ màu đối với vấn đề truy vấn ảnh :
- Việc tính lược đồ màu của ảnh diễn ra nhanh chóng trong ảnh chỉ qua 1 lần duyệt qua toàn bộ ảnh
- Lược đồ màu tương đối bất biến đối với phép tịnh tiến, xoay ảnh, và nhất là sự kéo nhỏ,kéo giãn,thay đổi kích thước của ảnh
- Lược đồ màu của một ảnh có thể là một cách miêu tả rất có ý nghĩa cho việc truy tìm ảnh hay nhận dạng đối tượng trong ảnh
Được định lượng:
H(ID, Ci)=(m(ID, Ci))/n(ID) Ci : là màu của điểm ảnh
n(ID): Tổng số điểm ảnh có trong ảnh m(ID, Ci): Số điểm ảnh có giá trị màu Ci
Số lượng màu cần tính của lược đồ màu là rất nhiều khoảng 224 màu, tuy nhiên do mức độ cảm nhận của mắt người có hạn chế nên sự thật chúng ta không phân biệt được số lượng lớn các màu như vậy. Ta sử dụng hệ màu HSI (12H, 3S,3I) và thêm 5 mức xám như vậy ta sẽ có 113 màu đại diện cho 224 màu trong việc tìm kiếm
Lược đồ màu bất biến đối với phép quay và tịnh tiến ảnh, và nếu chuẩn hoá lược đồ màu sẽ bất biến đối với phép co giãn.
Độ đo tính tương tự về màu sắc giữa lược đồ màu của ảnh truy vấn H(IQ) và lược đồ màu của ảnh trong cơ sở dữ liệu ảnhH(ID)
Công thức trên cho ta thấy, tính tương tự về màu sắc được tính bằng phần giao của hai lược đồ màu ảnh truy vấn H(IQ) và ảnh trong cơ sở dữ liệu ảnhH(ID). Kết quả sẽ là một lược đồ màu thể hiện độ giống nhau giữa hai ảnh trên.
Vì lược đồ màu chỉ thể hiện sự phân bố màu toàn cục của ảnh mà không xét đến tính phân bố cục bộ của điểm ảnh nên có thể có hai ảnh trông rất khác nhau nhưng lại có cùng lược đồ màu. Để khắc phục tình trạng này, ta tiến hành phân hoạch lưới ô vuông trên ảnh. Lược đồ màu của ảnh là không duy nhất.
Ảnh Trong hệ màu HSI
Lược đồ màu của ảnh sau khi lượng hoá 2.4.1.2. Lược đồ màu thông thường RGB
Đối với ảnh 256 màu, lược đồ màu của ảnh tương đương với lược đồ màu của ảnh xám
Đối với ảnh 24 bít màu, lược đồ mầu miêu tả khả năng kết nối về cường độ của ba kênh màu R,G,B. Lược đồ màu này được định nghĩa như sau :
Trong đó, N là số lượng điểm ảnh
Lược đồ màu ở dạng này được tính bằng cách rời rạc hóa từng màu trong ảnh, sau đó là đếm số điểm ảnh ảnh của mỗi màu.
Khi mà số lượng màu là có hạn, để thuận tiện hơn, người ta thường chuyển đổi ba kênh màu thành một giá trị màu duy nhất. cho một ảnh RGB, một kiểu chuyển đổi thường được sử dụng là :
m= r + Nrg + NrNgb
trong đó Nr, Ng là số lượng bin của màu đỏ và màu xanh lục Điều này mang lại một lược đồ đơn giản duy nhất như sau : H[m] = N *Prob{M=m}
Một cách khác để tính lược đồ màu của ảnh RGB là ta phân ra thành 3 lược đồ riêng biệt hR[], hG[], hB[]. Khi đó mỗi lược đồ được tính bằng cách đếm kênh màu tương ứng trong mỗi điểm ảnh.
2.4.1.2. Lược đồ màu HSI
Mô hình mùa SHI có những ưu điểm lớn cho việc tìm kiếm ảnh dựa vào nội dung và nhất là công việc tìm kiếm dựa vào màu sắc. Nhưng những ảnh màu thông thường được lưu trữ ở dạng kỹ thuật số trong máy tính thường theo chuẩn RGB, đo đó để có được ảnh màu HIS ta phải qua công đoạn chuyển đổi. Chuyển từ hệ màu RGB sang hệ màu HIS là một thuật giải có nhiều trong hầu hết các sách về xử lý ảnh
Theo các phương pháp truyền thống, việc tạo lược đồ màu chỉ đơn giản bằng cách chia không gian màu thành những ngăn riêng biệt, sau đó đếm những pixel có màu sắc phù hợp trong những ngăn này. Cách làm này rất đơn giản, nhưng không phù hợp với những việc so sánh và tìm kiếm ảnh. Vì những thay đổi nhỏ về điều kiện chiếu sáng , tự thay đổi về cường độ có thể gây nên những thay đổi lớn trong lược đồ màu. Do đó, hai ảnh giống nhau về màu sắc có thể có lược đồ màu hoàn toàn khác nhau Ví dụ : không gian màu HIS, thành phần Hue trong nhiều trường hợp manh giá trị nhưng không thể hiện màu sắc khi hiển thị : Khi giá trị Intensity nằm trong khoảng 0- 0,2 . Hue mang giá trị bất kỳ nào thì màu mà mắt người nhìn thấy đều là màu đen. Vì vậy đối với cách tính lược đồ thông thường, điểm ảnh A có Hue bằng 2π , Intensity bằng 0.1 và điểm ảnh B có Hue bằng π, Intensity bằng 0.1 sẽ nằm trong những bin khác nhau. Nhưng thật ra, điểm ảnh A và điểm anh B đều có giá trị hiển thị là màu đen
2.4.2. Véc tơ liên kết màu
Là lược đồ được hoàn thiện dựa vào lược đồ màu, nó chia mỗi ô màu thành 2 bin( hai nhóm điểm ảnh): Nhóm liên kết màu, và nhóm không liên kết màu
Một pixel trong ô màu được gọi là điểm liên kết màu nếu nó thuộc vùng gồm các màu tương tự với kích thước lớn
Với mỗi ô màu giả sử, số điểm liên kết màu là α số điểm không liên kết màu là β thì vectơ liên kết màu được xác định:
Vc=[( α1, β1), α2, β2)…, αn, βn)], n là số ô màu (bin)
Độ đo tính tương tự giữa hai ảnh dựa trên đặc trưng vec tơ liên kết màu:
Ảnh trong hệ màu RGB
Ảnh trong hệ màu HSI
2.4.3. Độ đo
2.4.3.1. Khái niệm
Bước tiếp theo của quá trình tìm kiếm ảnh theo nội dung dựa vào đặc trưng màu sắc là xác đinh độ trùng khớp của các lược đồ màu đã tính toán được. Do đó phát sinh ra một giá trị để biểu thị cho sự trùng khớp này. Ta gọi những giá trị được tính ở đây là những độ đo màu
Một cách đơn giản, độ đo màu được coi là giá trị để biểu thị cho sự so khớp sự trùng khớp của hai lược đồ màu. Tùy theo từng trường hợp, từng loại độ đo màu giá trị này có thể âm, hoặc dương, lớn hoặc nhỏ tương ứng với mức độ giống nhau như thế nào của các loại lược đồ màu
Mỗi loại độ đo màu đều có ưu khuyết điểm riêng trong từng trường hợp cụ thể
Có một thuyết rất nổi tiếng nói rằng: Độ đo tương tự về nhận thức của con người dựa trên một khoảng cách thích hợp trong một không gian metric thuộc tâm lý học. Thuyết này cho rằng một tập các mô hình đặc trưng bao gồm các thuộc tính sao cho nó có thể được trình bày như là một điểm trong không gian đặc trưng phù hợp. Nếu D là khoảng cách, k,m,l là các đối tượng thì D cần đáp ứng các tiền đề sau:
D(k,1)=0 ↔k≡1
D(k,1)≥0 khoảng cách là số dương
D(k,1)=D(1,k) khoảng cách có tính đối xứng
D(k,m)≤D(k,1) +D(l,m) bất đẳng thức tam giác
Độ đo có ý nghĩa quyết định đối với kết quả của phép tìm kiếm
2.4.3.2. Một số độ đo thông dụng
Độ đo khoảng cách Min – Max
Được thực hiện dựa trên ý tưởng lấy phần giao của hai lược đồ màu cần so sánh ta sẽ được một lược đồ màu, tính tổng các giá trị có được từ lược đồ này cho ta được độ đo Min-Max
Đối với độ đo Min : Ta tính dựa vào giá trị Min tại mỗi K bin
Đối với độ đo Max : Ta tính dựa vào giá trị Max tại mỗi K bin
Độ đo khoảng cách Euclid
Đây là cách tính khoảng cách Euclid thông thường giữa các k bin
2.4.4. Một số phương pháp tìm kiếm ảnh theo màu sắc
2.4.4.1. Tìm kiếm theo lược đồ màu toàn cục dựa trên ảnh mẫu
- Người dùng chọn một ảnh, những ảnh tìm được là những ảnh có màu sắc gần giống với ảnh cần tìm nhất theo một ngưỡng tự chọn trước
- Cách tiến hành : Ý tưởng cách làm là so sánh lược đồ màu toàn cục của ảnh với những ảnh khác trong CSDL. Nếu ảnh trong cơ sở dữ liệu có lược đồ màu phù hợp với độ đo theo một ngưỡng nhất định sẽ được chọn
+. Tính lược đồ màu của ảnh gốc
+. Trong quá trình tìm kiếm, tính lược đồ màu của từng ảnh. Sau đó so sánh những lược đồ màu này với nhau theo các loại độ đo được chọn
Intersection ( h(I) , h (M) ) = Intersection ( h(I) , h (M) ) = Matching ( h (I), h (M) = Intersection ( h (I) , h (M)) = Hoặc có thể là Intersection ( h ( I , h( M) ) =
+. Những ảnh thỏa mãn nhu cầu tìm kiếm là những ảnh có sự giao nhau của 2 lược đồ đạt giá trị thỏa mãn ngưỡng
Độ đo được dùng : Min-Max, Euclid
2.4.4.2. Tìm kiếm theo tỉ lệ phần trăm về màu sắc
- Người dùng xác định tỉ lệ phần trăm một số màu cần tìm kiếm, nhưng không quan tâm đến vị trí xuất hiện của những màu này. Chúng có thể xuất hiện khắp nơi trong ảnh hoặc tập trung tại một khu vực nào đó
Ví dụ : tìm kiếm những bức ảnh có chứa khoảng 20-30% màu đỏ, 30-50% màu trắng, 10-40% màu đen
- Cách tiến hành : không cần phải tính lược đồ màu mà chỉ cần đếm số lượng những màu được chọn để tìm kiếm
+. Màu được tìm kiếm được xếp vào một trong 167 bin
+. Trong quá trình tìm kiếm nếu điểm ảnh nào nằm trong bin có màu được chọn thì số lượng trong bin đó tăng thêm 1
+. Nếu tỉ lệ số điểm ảnh trong từng bin được chọn trên tổng số lượng điểm ảnh của ảnh nằm trong khoảng được đặt ra thì ảnh đó thỏa mãn yêu cầu tìm kiếm
2.4.4.3. Tìm kiếm theo màu chỉ định dạng lưới
- Người dùng xác định vị trí những khoảng màu sẽ xuất hiện trong tấm ảnh. Những