Trích rút đặc trưng

Một phần của tài liệu QUẢN Lý d6cntt epu dai (Trang 29 - 33)

CHƯƠNG 2: KỸ THUẬT TRA CỨU ẢNH DỰA VÀO NỘI DUNG VÀ SỬ DỤNG PHƯƠNG PHÁP TRUY VẤN ĐA ĐIỂM.

2.2 Trích rút đặc trưng

2.2.1 Không gian màu

Màu sắc thường được định nghĩa trong không gian màu 3 chiều. Các không gian màu sắc có thể được phân biệt như phần cứng theo định hướng và hướng người dùng. Các không gian màu sắc hướng phần cứng bao gồm: RGB, CMY và YIQ được dựa trên 3 màu lý thuyết. Các không gian màu sắc hướng người sử dụng bao gồm: HLS, HCV, HSV, HSB, MTM, CIE-LAB và CIE-LUV, được dựa trên 3 tác nhân của màu sắc, ví dụ màu sắc, độ bão hòa và độ sáng. Các mô hình không gian màu sắc được phân biệt như đồng nhất và không đồng đều tùy thuộc vào sự khác biệt trong không gian màu sắc như cảm nhận của con người (trong thực tế, không có không gian màu sắc thật sự thống nhất). Các không gian màu sắc đồng đều gần nhất bao gồm MTM, CIE-LAB, và CIE-LUV.

Định dạng ảnh thông dụng như JPEG, GIF, BMP và luôn lưu trữ và hiển thị màu sắc trong không gian màu RGB. Hình ảnh tra cứu dựa trên không gian màu RGB sẽ không cần chuyển đổi không gian màu sắc. Tuy nhiên vì không gian màu RGB có sự thiếu hụt về mặt nhận thức sự đồng nhất nên màu sắc dựa trên hình ảnh tra cứu không gian màu RGB có thể được chuyển đổi thành các không gian khác để cải thiện tính đồng nhất. Trong thực tế, một loạt các không gian màu sắc đã được sử dụng: không gian màu Munsell trong QBIC hệ thống [NBE93], CIE-LUV không gian màu của Gray [Gra95], không gian màu HSV bởi Smith [Smi97], và không gian màu RGB bởi passetal [PZM96]. Trong đồ án này e sẽ tìm hiểu một số kỹ thuật sử dụng không gian màu RGB.

Các không gian màu RGB (xem Hình 2.3 (a).) Được định nghĩa là một khối lập phương đơn vị với trục màu đỏ, xanh lá cây, và màu xanh; do đó, một màu sắc trong một không gian màu RGB được biểu diễn bởi một vector với ba tọa độ. Khi cả ba giá trị này được thiết lập là 0, các màu tương ứng là màu đen. Khi cả ba giá trị này được thiết lập để 1, các màu tương ứng là màu trắng.

Trong lượng tử không gian màu sắc, sẽ giảm không gian màu sắc của tất cả các màu, có thể để một tập hợp các màu sắc riêng biệt. Trong thực tế, quá trình lượng tử hóa giống như quá trình giảm màu sắc. Chúng tôi chia các khối lớn thành các sub- cube và mỗi phân khối được đại diện bởi 1 màu duy nhất. Ví dụ (xem Hình 2.3. (b)), chúng ra chia khổi lập phương thành 64 sub-cube. Bằng cách tách các trục màu đỏ, xanh lá cây, và màu dương thành 4 tiểu đơn vị, tất cả màu sắc có thể nàm trong 1 sub-cube sẽ được đại diện bởi 1 màu duy nhất

(a) (b) Hình 2.3: Không gian màu RGB

Đối với hệ thống máy tính hiện tại, không gian màu RGB thường được đại diện bởi một hệ thống màu sắc 24-bit. Trong một hệ thống màu 24-bit, một màu được xác định bởi ba số nguyên: {đỏ, xanh lá cây, xanh dương} và 3 số nguyên từ 0 -> nằm trong tổng cộng 16,777,216() màu. Trong quá trình lượng tử hóa các không gian màu sắc RGB giống như quá trình giảm màu sắc, chúng ta chỉ đơn giản là giảm số lượng màu từ 16,777216 xuống còn 255 màu.

2.2.2 Đặc trưng màu sắc

Sử dụng không gian RGB vào chương trình, do khuôn dạng của không gian màu RGB là định dạng phổ biến nhất của ảnh số. Với việc lượng hóa 3 kênh màu RGB giảm từ 256

giá trị xuống còn 3 giá trị kênh màu đó sẽ làm giảm không gian lưu trữ trong cơ sở dữ liệu và tăng tốc độ tra cứu của hệ thống.

2.2.2.1 Biểu đồ màu

Trong đồ án này, chúng ta xác định biểu đồ màu như một tập hợp các thùng, nơi mà biểu thị xác suất của điểm ảnh (màu sắc đặc biệt của ảnh đầu vào). Một biểu đồ màu H cho một hình ảnh nhất định được định nghĩa là một vector.

H={H[0],H[1],…H[i],…H[N]},

I đại diện cho một màu sắc trong biểu đồ màu và tương ứng với một sub-cube trong không gian màu RGB. H[i] số lượng điểm ảnh trong màu sắc của hình ảnh và N là số các thùng trong biểu đồ màu.

Thông thường, mỗi điểm ảnh trong một hình ảnh sẽ được giao cho một thùng của một biểu đồ màu sắc của hình ảnh đó, như vậy giá trị của mỗi thùng là số lượng điểm ảnh có màu sắc tương ứng như nhau.

Để so sánh hình ảnh của các kích cỡ khác nhau, cần thêm một biểu đồ H 'được định nghĩa là:

H’={H’[0],H’[1],…H’[i],…H’[N]}

H’[i]=H[i]/P, P là tổng số điểm ảnh trong hình ảnh (các biến còn lại được xác định như cho trước). Một ý tưởng không gian màu được đưa ra: giả sử rằng các màu sắc riêng biệt không nên đặt trong cùng một sub-cube và màu sắc tương tự nên đặt vào cùng 1 sub- cube. Sử dụng vài màu sắc sẽ làm giảm khả năng màu sắc tương tự được gắn cho các thùng khác nhau nhưng nó làm tăng khả năng các màu sắc khác nhau được gán cho cùng một thùng, và nội dung thông tin của hình ảnh sẽ giảm đi một mức độ lớn hơn. Mặt khác, biểu đồ màu sắc với một số lượng lớn các thùng chứa thêm thông tin về các nội dung của hình ảnh, do đó làm giảm khả năng của các màu sắc khác nhau sẽ được giao cho các thùng cùng. Tuy nhiên, chúng làm tăng khả năng rằng màu sắc tương tự sẽ được giao cho các thùng khác nhau không gian lưu trữ siêu dữ liệu, và thời gian để tính toán khoảng cách giữa các biểu đồ màu.Vì vậy có một quá trình xử lý để xác định có bao nhiêu thùng được sử dụng trong biểu đồ màu

2.2.2.2 The Global Color Histogram

Như chúng ta đã thảo luận, biểu đồ màu sắc mô tả phân bố màu sắc bằng cách sử dụng một tập hợp các ngăn. Global Color Histogram (viết tắt là GCH trong đồ án này), một hình ảnh sẽ được mã hóa với biểu đồ màu sắc của nó, và khoảng cách giữa hai hình ảnh sẽ được xác định bởi khoảng cách giữa các biểu đồ màu sắc của nó.

Đối với GCHs, chúng ta có thể sử dụng số liệu khác nhau, sẽ được thảo luận phần dưới (mục 2.4), để tính toán khoảng cách giữa màu sắc biểu đồ. Ví dụ sau đây (xem Hình 2.4) cho thấy cách một GCH hoạt động.

Hình 2.4: Ba hình ảnh và biểu đồ màu của nó.

Trong biểu đồ màu sắc mẫu có ba thùng: đen, trắng, và màu xám. Chúng tôi lưu ý các biểu đồ màu hình ảnh

A: biểu đồ màu sắc của hình ảnh B

và hình ảnh C có cùng một biểu đồ màu sắc như hình ảnh B.

Nếu chúng ta sử dụng số liệu khoảng cách Euclide để tính toán khoảng cách biểu đồ, khoảng cách giữa các hình ảnh A và B cho GCH là:

Khoảng cách giữa các hình ảnh A và C bằng khoảng cách giữa các hình ảnh A và B, và khoảng cách giữa các hình ảnh B và C bằng 0.

GCH là phương pháp truyền thống để thu hồi ảnh màu. Tuy nhiên, nó không bao gồm thông tin liên quan đến sự phân bố màu sắc của các vùng miền, vì vậy khoảng cách giữa các hình ảnh đôi khi không thể hiển thị sự khác biệt thực sự giữa hình ảnh. Ví dụ, khoảng cách giữa các hình ảnh A và C nên được nhỏ hơn khoảng cách giữa các hình ảnh A và B, nhưng sử dụng GCH chúng lại có cùng một khoảng cách. Hơn nữa, trong trường hợp của một GCH, nó có thể cho hai hình ảnh khác nhau bởi một khoảng cách rất ngắn giữa các biểu đồ màu sắc của họ (chẳng hạn như trong ví dụ trên, hình ảnh B và C đang được coi là như nhau). Đây là bất lợi chính của GCHs.

Một phần của tài liệu QUẢN Lý d6cntt epu dai (Trang 29 - 33)

Tải bản đầy đủ (DOCX)

(62 trang)
w