L ời mở đầu
1.7.2.3 Tìm kiếm theo vùng,đối tượng
Đây là bứơc tiến nhảy vọt trong việc truy tìm ảnh dựa vào nội dung. Vùng là đặc trưng cấp cao của ảnh. Với đặc trưng về vùng, chúng ta có thể thực hiện được các ý tưởng sau:
Với vùng, sẽ làm cho dữ liệu đầu vào được mô phỏng gần gũi với chúng ta hơn.
Với vùng, sẽ giúp cho chúng ta có thể tiến thêm một bước trong vấn đề tìm kiếm ảnh dựa vào nội dung là “Tìm kiếm theo ngữ nghĩa” bằng việc áp dụng mô hình học vào vùng.
Ở đây việc tìm kiếm theo vùng đối tượng có thể chia ra làm hai chiến lược:
Tìm kiếm theo vùng, đối tựơng từảnh có sẵn: Từảnh truy vấn có sẵn ban đầu qua bước phân đọan ảnh, ta có thể chia ảnh
Chương 1: Tổng quan
thành các vùng gọi là vần của ảnh. Từ các vần này ta có thể chọn ra vài vần cần truy tìm. Và hệ thống có thể tìm ra được những ảnh phù hợp theo ý muốn của người dùng. Ví dụ minh họa chia vùng ảnh có sẵn để tìm kiếm: Hình 15: Ảnh minh họa tìm kiếm theo vùng Tìm kiếm khi người dùng chưa có ý niệm rõ lắm về tấm ảnh cần tìm, mà chỉ có một số yêu cầu nào đó về các “vần” cấu thành nên nó hoặc họ chỉ cần tìm các ảnh tương tự với các vần chính của ảnh truy vấn chứ không cần sự tương tự toàn cục. Ví dụ minh họa:
Khi người dùng có ý niệm tìm kiếm những tấm ảnh như sau: “Cỏ non xanh tận chân trời, cành lê trắng điểm một vài bông hoa”. Người dùng có thể ghép các vùng lại với nhau từ tập dữ liệu có sẵn như sau:
Hình 16: Minh họa tìm kiếm theo vùng khi người dùng có một vài ý niệm vềảnh truy vấn
Chương 1: Tổng quan
1.7.2.4 Tìm kiếm theo ngữ nghĩa
Với việc áp dụng mô hình học vào bài tóan phân vùng ảnh, khi đó mỗi vùng (vần) trong ảnh có thể mang một ngữ nghĩa nào đó. Điều này dẫn đến một khả năng truy tìm mới là dựa vào câu truy vấn dạng ngôn ngữ, liên kết với các vùng đại diện theo một luận lý để truy tìm ảnh. Điều này giúp cho người dùng có thể thực hiện câu truy vấn dễ dàng.
Ví dụ minh họa tìm kiếm theo ngữ nghĩa:
Hình 17: Minh họa việc áp dụng mô hình học vào các vùng của
ảnh để tìm kiếm theo ngữ nghĩa
Với các nhãn ngữ nghĩa trên, khi người dùng muốn tìm kiếm hoa mai vàng, người dùng chỉ việc đánh từ khóa “hoa mai vàng” để tìm kiếm.
Chương 2: Các khái niệm cơ bản
Chương 2: Các khái niệm cơ bản
2.1. Màu sắc
2.1.1 Khái niệm về màu sắc
Sự nhận thức về màu sắc là rất quan trọng trong đời sống của con người. Sự nhận thức về màu sắc phụ thuộc vào cả tính chất vật lý của ánh sáng và quá trình xử lý của thị giác với sự góp phần rất quan trọng của kinh nghiệm. Con người có thể dùng thông tin màu sắc để phân biệt đối tượng, vật liệu, đồ ăn, vị trí, và ngay cả thời gian của ngày, ...
2.1.2 Một số đặc tính vật lý đặc biệt về màu sắc
Con người chỉ có khả năng nhận thức được ánh sáng có bức xạđiện từ với bước sóng trong khoảng 400 – 700 nanomet. Cơ quan thị giác cảm nhận được ánh sáng là do bề mặt đối tượng phát ra ánh sáng, là kết quả của sự tương tác giữa năng lượng chiếu sáng và những phân tử của bề mặt đối tượng. Một đối tượng màu xanh dương sẽ có bề mặt màu xanh dương khi chiếu ánh sáng trắng vào. Nhưng đối tượng đó sẽ có màu tím khi chiếu ánh sáng đỏ vào.Với sự phát triển mạnh mẽ của các thiết bị kinh tế, máy móc xử lý màu sắc trở nên thông dụng: Chúng ta có các thiết bị như máy quay phim màu, thiết bị chiếu màu và những phần mềm xử lý ảnh màu. Máy móc có thể dùng màu sắc cho những mục đích như là con người. Đặc biệt, màu sắc thuận tiện bởi vì nó cung cấp phép đo lường đa dạng tại mỗi điểm ảnh đơn, có thể phân lớp, phân loại mà không cần đến những sự xử lý không gian phức tạp để đưa đến quyết định. Do đó, việc lựa chọn mô hình màu thích hợp và sử dụng lược đồ lượng hoá màu thích hợp sẽ giảm bớt độ phân giải màu. Đây là các vấn đề quan trọng trong việc tìm kiếm ảnh dựa trên màu sắc. Màu sắc thường được biểu diễn như là các điểm trong không gian màu 3 chiều. Hiện tại có rất nhiều mô hình màu hình học hỗ trợ việc thể hiện màu sắc một cách rõ ràng, dễ lượng hoá .Mô hình
Chương 2: Các khái niệm cơ bản
Mô hình dựa trên thiết bị đo màu: Kết quả từ độ đo vật lý hệ số phản xạ quang phổ sử dụng thiết bị đo màu. Các không gian màu chuẩn theo CIE (Comission International d’Eclairage) thuộc loại này.
Mô hình màu dựa trên cảm nhận sinh lí: Kết quả từ các nghiên cứu về thần kinh. Tồn tại 3 kiểu hình nón phân biệt trong võng mạc của con người đóng vai trò vào việc sắp xếp màu sắc trong không gian màu. Các mô hình màu CIE XYZ, RGB và các biến thể thuộc nhóm này.
Mô hình màu dựa trên tâm lý học: dựa trên cách mà màu sắc hình thành trong đầu của người quan sát. Các mô hình đối lập dựa trên các phân tích thực nghiệm phản ứng của con người đối với các thành phần đối lập cơ sở. Họ các không gian màu HSB (Hue- Saturation-Brightness) thuộc lớp này.
Mô hình màu có thể phân biệt
o Mô hình hướng thiết bị: Định nghĩa theo thuộc tính của thiết bị dùng để hiển thì màu như màn hình TiVi, màn hình máy tính và máy in. Các mô hình màu hướng thiết bị là RGB, CMY, YIQ. Người dùng rất khó xử lý trên các mô hình này vì nó không phản ánh trực tiếp các khái niệm trực giác màu sắc, sắc thái (còn gọi là sắc độ, là độ đậm nhạt của màu sắc) và cường độ sáng.
o Mô hình hướng ngừơi dùng: Dựa trên khả năng cảm nhận màu sắc của con người. Con người cảm nhận màu sắc thông qua các đối tượng trực giác màu sắc, sắc thái và cường độ sáng. Các mô hình màu hướng ngừơi dùng là HSL, HSV, HCV, HSB, MTM, L*u*v, L*a*b* và L*C*h .
Chương 2: Các khái niệm cơ bản
Không gian màu là một cách biểu diễn toán học một tập các màu. Các không gian màu có thểđược phân vào 2 loại không gian màu: phụ thuộc thiết bị hay độc lập thiết bị.
o Không gian màu độc lập thiết bị được chia thành nhiều không gian màu được định theo chuẩn CIE như: XYZ, L*a*b và L*u*v, ứng dụng chính cho mục đích đo màu .
o Không gian màu phụ thuộc thiết bị được chia vào 3 lớp rộng: không gian màu in, không gian màu video, và không gian màu màn hình. Các không gian màu in CMY, CMYK dựa trên màu mực được dùng trong ngành in và nhiếp ảnh. Các không gian màu màn hình là các biến thể của không gian màu RGB, các không gian màu video - tất cả đều tương tự như không gian màu YUV được phân thành các không gian màu riêng tuỳ vào ứng dụng.
2.1.3 Các hệ màu thông dụng
2.1.3.1 Hệ màu chuẩn RGB:
Mắt người có thể phân biệt hàng ngàn màu sắc khác nhau, những con số chính xác hơn vẫn còn đang được bàn cãi nhiều. Ba màu RGB (Red-Green- Blue) mã hóa hệ thống đồ họa sử dụng ba byte 224 hay khoảng chừng 16 triệu màu phân biệt. Máy tính có thể phân biệt bất kỳ màu gì sau khi được mã hóa, nhưng việc mã hóa có thể không trình bày được những sự khác biệt trong thế giới thực. Mỗi điểm ảnh RGB bao gồm một byte cho màu R, một byte cho màu G và một byte cho màu B. Việc mã hóa một màu tùy ý trong dãy hiển thị được làm bằng cách tổ hợp ba màu chính. Ví dụ: Red(255,0,0), Green(0,255,0), Blue(0,0,255), Black(0,0,0) Hệ thống màu RGB là một hệ thống màu cộng vào bởi vì mỗi màu được tạo nên bằng cách cộng thêm các phần tử vào màu đen(0,0,0) Khuôn dạng của không gian màu RGB là định dạng phổ biến
Chương 2: Các khái niệm cơ bản
nhất của ảnh số, lý do chính là tính tương thích với màn hình hiển thị chính là màn hình vi tính. Tuy nhiên không gian màu RGB có hạn chế lớn nhất là không phù hợp với cách con người cảm nhận về màu sắc. Do đó không phù hợp cho việc ứng dụng vào tìm kiếm ảnh.
Hình 18: Hệ màu RGB
2.1.3.2 Hệ màu CMY
Không gian màu CMY được dùng trong in ấn. Màu lục lam, màu đỏ tươi và màu vàng là phần bù của màu đỏ, màu xanh lá cây và màu xanh dương được gọi là các thành phần cơ sở trừ vì chúng được tạo ra bằng cách trừ đi độ sáng từ màu trắng. Ví dụ màu lục lam là phần bù của màu đỏ, tạo ra bằng cách xoá thành phần đỏ từ màu trắng. Có thể chuyển từ không gian màu RGB sang không gian màu CMY bằng công thức chuyển đổi đơn giản nhưng không chính xác: C=1-R, M=1-G, Y=1-B. Hệ thống màu CMY dường như là một sựđảo ngược của hệ thống màu RGB. Đặc
Chương 2: Các khái niệm cơ bản
tính của nó là sự đơn giản, ứng dụng nhiều trong thực tế. Tuy nhiên khuyết điểm của nó cũng tương tự như không gian màu RGB, tức là cách mã hóa khác với cách mà con người cảm nhận về màu sắc. Không thích hợp cho bài toán tìm kiếm ảnh dựa vào nội dung.
Hình 19: Hệ màu CMY
2.1.3.3 Hệ màu YIQ
Về cơ bản mô hình màu YIQ là sự biến thể hệ màu RGB bằng cách chuyển đổi hiệu quả và duy trì sự tương thích với TV đơn sắc chuẩn. Thật sự, thành phần Y của mô hình màu YIQ cung cấp tất cả các thông tin video yêu cầu bởi một tập các TV đơn sắc. Công thức chuyển đổi từ RGB sang YIQ: ⎥ ⎥ ⎥ ⎦ ⎤ ⎢ ⎢ ⎢ ⎣ ⎡ = ⎥ ⎥ ⎥ ⎦ ⎤ ⎢ ⎢ ⎢ ⎣ ⎡ − − − − = ⎥ ⎥ ⎥ ⎦ ⎤ ⎢ ⎢ ⎢ ⎣ ⎡ B G R Q I Y 311 . 0 532 . 0 212 . 0 321 . 0 275 . 0 596 . 0 114 . 0 587 . 0 299 . 0
Để lấy được các giá trị RGB từ tập YIQ, chúng ta chỉ cần thực hiện toán tửđảo ma trận .Hệ màu YIQ được thiết kế giúp cho sự cảm nhận của con người về sự thay đổi độ sáng chói tốt hơn sự thay đổi đặc trưng màu sắc (Hue) và độ thuần khiết (Sataration). Lợi thế của YIQ trong việc xử lý
Chương 2: Các khái niệm cơ bản
ảnh là độ sáng chói (Y) và thông tin màu (I và Q) được tách riêng ra. Sự quan trọng của việc tách riêng này giúp cho việc xử lý thành phần Y của ảnh có thể không có ảnh hưởng đến nội dung màu.
Không gian màu này đều gây khó khăn cho người sử dụng vì nó không phản ánh trực tiếp khái niệm giác quan của màu sắc: màu, sắc thái và độ sáng.