Trích chọn đặc trưng trong khai phá ảnh

Một phần của tài liệu (LUẬN VĂN THẠC SĨ) Khai phá Luật kết hợp trong cơ sở dữ liệu đa phương tiện (Trang 48 - 53)

Trích chọn đặc trưng ảnh là bước tiền xử lý trong khai phá ảnh. Đây là bước quyết định trong toàn bộ quá trình khai phá ảnh. Phương pháp trích chọn xuất phát từ hình ảnh - rút ra mẫu và nhận được tri thức từ các hình ảnh sưu tập, giải quyết phần lớn với việc nhận dạng và trích chọn những đặc trưng duy nhất của phạm vi cụ thể.

Có nhiều giá trị dặc trưng khác nhau, mục đich chính là nhận ra những đặc trưng tốt nhất và từ đó rút ra những thông tin có liên quan từ ảnh. Trích chọn đặc trưng ảnh rất có giá trị trong kiểm tra ảnh. [10]

Bài viết có sử dụng kết quả của dự án nghiên cứu – Egeria Mining (Egeria densa là một loại cỏ nước mọc ngoài tầm kiểm soát, sống trong nước sâu 4m ở vùng Sacramento San Joaquin Delta, gây ra các vấn đề về hồ chứa và điều hướng. Để giám sát được phạm vi phân bố của Egeria, các bức ảnh phân bố được sưu tập, số hóa bằng máy scan và phân tích tưởng tượng. Gần đây, người ta nhận thấy rằng cách xử lý bằng tay như vậy tốn nhiều thời gian và công sức. Thêm vào đó, những bức ảnh thu được trong điều kiện môi trường bất lợi – gió, ánh sáng mặt trời, sự phản xạ của mặt nước, dòng nước cao/thấp … tất cả những yếu tố trên làm cho công việc trở nên khó khăn. Nhiệm vụ của chúng ta là đưa ra một phương pháp luận hiệu quả để nhận dạng tự động những vùng này bằng các đặc trưng ảnh và do đó sử dụng một kỹ thuật chung để xử lý tất cả các ảnh. Có thể xử lý với từng Pixel hoặc theo từng khối. Ta khai thác một ảnh (training image) và sau đó sử dụng kỹ thuật này cho các ảnh khác theo cách tương tự. Tất nhiên, những đặc trưng được định nghĩa từ trước, kỹ thuật này sử dụng để trích chọn những đặc trưng này – hỗ trợ chúng ta trong quá trình phát hiện tri thức. Thông tin ra là một thứ tự có hệ thống các trích chọn đặc trưng và một hệ thống giao diện hỗ trợ người dùng định nghĩa đặc trưng để sử dụng trong các ứng dụng khai phá ảnh.

Thông thường, hình ảnh có các đặc trưng sau: Màu sắc, kết cấu, hình dạng, biên,…Trong đó, những đặc trưng mang lại nhiều hứa hẹn là: màu sắc, kết cấu và biên.

 Màu sắc (Color): Yếu tố hình ảnh này có thể được so sánh với các phổ.

 Kết cấu (Texture): Được định nghĩa như là một tập các đặc trưng lân cận, một

vùng hay một khối. Với mỗi pixel đều có liên quan đến những pixel bên cạnh. Trong trường hợp này, Egeria xuất hiện trên mặt nước hoặc dưới dòng nước. Do đó các kết cấu cụ thể của các vùng tương tự nhau có thể so sánh với một kết cấu khuôn mẫu.

 Biên (Edge): Biên- là một sự thay đổi lớn một cách tuần tự. Đây là một đặc

trưng đặc biệt quan trọng, giống như là sự khác biệt giữa Egeria tối và Egeria sáng. Trong trường hợp này, phân biệt giữa Egeria tối và mặt nước sáng, có thể được xem như là một biên.

Sau khi các đặc trưng được trích chọn, và kết hợp chúng sử dụng các luật phát hiện ra mức độ bao phủ lớn nhất của Egeria trong ảnh. [10]

Có một số kỹ thuật trích chọn đặc trưng về màu sắc – trung bình màu trong tỷ lệ màu xám, trung bình màu trong định dạng RBG, và Trung bình màu trong YCBCR (Y là độ sáng và CB, CR là các thành phần màu . Việc đánh giá các phương pháp khác nhau sử dụng Độ chính xác (Precision) và Nhớ lại (Recall), và nhận thấy rằng YCBCR thực hiện tốt hơn hai phương pháp còn lại. Do đó ta sử dụng YCBCR làm cơ sở trính chọn đặc trưng màu sắc được chỉ ra trong hình dưới đây.

Hình 4.1: Sử dụng YCBCR làm cơ sở trích chọn đặc trưng màu sắc

Trung bình màu = Σ(Cường độ ảnh các Pixel trong khối hiện tại)/ Σ(Pixel trong khối) (4.1)

Kết quả của phương pháp này là một ma trận, kích thước 30x30 (cho khối 10x10 hoặc 37X37 cho 8x8), với “1” trong các miền tương ứng có sự hiện diện của phù hợp với màu sắc và "0" trong các lĩnh vực mà không có màu sắc phù hợp.[10]

4.2.2. Trích chọn đặc trưng Texture

Texture cho phép định nghĩa các đặc trưng lân cận – như là một vùng hoặc một khối. Sự thay đổi của mỗi Pixel liên quan tới các pixcel lân cận cho ta định nghĩa texture. Texture là đặc trưng quan trọng của ảnh nhưng khó mô tả và cảm nhận. Có nhiều phương pháp được đề xuất, trong đó đặc tả texture tốt nhất là đề xuất của Tamura et al. Mục tiêu của nghiên cứu đặc tả texture là mô tả càng phù hợp với cảm nhận con người càng tốt. Trong đặc tả của họ, texture được mô tả bởi 6 đặc trưng: tính thô (coarseness), tính tương phản (contrast), tính theo hướng (directionality), tính tương tự đoạn thẳng (line likeness), tính đều đặn (regularity) và tính gồ ghề (roughness). Mô tả về tính toán định lượng các đặc trưng là khó khăn, không được nghiên cứu tại đây. Sau đây là mô tả định tính của sáu đặc trưng này:[9]

càng thô. Ảnh phóng to sẽ thô hơn ảnh gốc.

 Tương phản: Tương phản được đo bởi bốn tham số: dải động các mức xám ảnh,

phân cực của phân bổ đen/trắng trên biểu đồ màu xám hay tỷ lệ vùng đen/trắng; độ nét của cạnh; chu kỳ lặp các mẫu.

 Tính theo hướng: là đặc tính trên vùng cho trước. Được đo bởi hình dạng thành

phần và xếp đặt. Hướng của mẫu texture là không quan trọng. Hai mẫu mà chỉ khác hướng thì sẽ có cùng cấp độ theo hướng.

 Tương tự đoạn thẳng: Tham số này liên quan đến hình dạng phần tử texture.

 Đều đặn: Đo biến đổi của qui tắc xếp đặt phần tử. Liên quan đến texture là đều

hay không đều. Hình dạng phần tử khác nhau làm giảm tính đều. Texture mịn được cảm nhận như đều.

 Gồ ghề: Đo texture trơn tru hay gồ ghề. Nó liên quan đến tính thô và tương phản.

4.2.3. Trích chọn đặc trưng Edge

Đặc trưng Edge đặc biệt quan trọng đối với những hình ảnh tối. May mắn, những hình ảnh mẫu có chất lượng trung bình và do vậy không cần sử dụng đặc trưng Edge. Tuy nhiên, chúng tối vẫn sử dụng đặc trưng này với những hình ảnh tối với mục đích kiểm thử. Phương pháp phát hiện cạnh Candy với ngưỡng 0 được sử dụng. Chỉ riêng đặc trưng Edge ít có hiệu quả, do vậy cần phải kết hợp nó với các đặc trưng mạnh mẽ hơn, như màu sắc. Đặc trưng Edge cùng với đặc trưng về màu sắc mô tả ranh giới và vùng bên trong của Egeria.

Những hình sau đây là kết quả thu được khi kiểm thử một tập các ảnh có màu tối [10]

Hình 4.2. Trích chọn đặc trưng Edge

4.2.4. Kết hợp các đặc trưng

Tất cả các đặc trưng được kết hợp thành hình ảnh chiết xuất cuối cùng như hình bên.

Hình 4.3. Kết hợp các đặc trưng

Tất cả các khối có các đại lượng tương tự nhau cho mỗi đặc trưng. Do đó sau khi xử lý các đặc trưng được trích chọn, mỗi khối cụ thể là một chuỗi 1 (Yes) và 0 (No), chiều dài tương ứng với số đặc trưng được trích chọn. Việc kết hợp các đặc trưng được trích chọn đồng nghĩa với việc hình thành các công thức. Một luật (rule) kết hợp ba đặc trưng là color&edge|textures, có nghĩa là color AND edge OR textures.[10]

Tùy thuộc vào các đặc trưng được sử dụng và lĩnh vực ứng dụng mà các luật cũng khác nhau. Nếu một đặc trưng là chính xác đối với một miền, thì luật sẽ gán nhãn 1 vào bảng (như dưới đây). Trường hợp không chắc chắn ghi nhãn là 2. Các luật tương tự cũng được sử dụng trong khi kiểm thử. Nếu ba đặc trưng, như ví dụ, bảng sau đây chỉ ra một phần của tập các luật được sử dụng.

Luật thứ nhất và luật thứ ba chỉ ra rằng màu sắc kết hợp với texture hoặc edge đưa đến kết luận rằng Egeria là trong khối hiện tại. Luật thứ hai chỉ ra rằng khi không có đặc trưng nào là 1 thì Egeria chắc chắn vắng mặt. Luật thứ 4 chỉ ra rằng màu sắc không đủ chắc chắn để chứng minh sự hiện diện của Egeria. [10]

Bảng 4.1. Ví dụ minh họa sự kết hợp các đặc trưng

Color Textures Edge Class

1 0 1 1

0 0 0 0

1 1 0 1

1 0 0 2

Một phần của tài liệu (LUẬN VĂN THẠC SĨ) Khai phá Luật kết hợp trong cơ sở dữ liệu đa phương tiện (Trang 48 - 53)

Tải bản đầy đủ (PDF)

(60 trang)