Trích chọn đặc trưng trong khai phá ảnh

Một phần của tài liệu Khai phá Luật kết hợp trong cơ sở dữ liệu đa phương tiện (Trang 48 - 49)

Trích chọn đặc trưng ảnh là bước tiền xử lý trong khai phá ảnh. Đây là bước quyết định trong toàn bộ quá trình khai phá ảnh. Phương pháp trích chọn xuất phát từ hình ảnh - rút ra mẫu và nhận được tri thức từ các hình ảnh sưu tập, giải quyết phần lớn với việc nhận dạng và trích chọn những đặc trưng duy nhất của phạm vi cụ thể.

Có nhiều giá trị dặc trưng khác nhau, mục đich chính là nhận ra những đặc trưng tốt nhất và từ đó rút ra những thông tin có liên quan từ ảnh. Trích chọn đặc trưng ảnh rất có giá trị trong kiểm tra ảnh. [10]

Bài viết có sử dụng kết quả của dự án nghiên cứu – Egeria Mining (Egeria densa là một loại cỏ nước mọc ngoài tầm kiểm soát, sống trong nước sâu 4m ở vùng Sacramento San Joaquin Delta, gây ra các vấn đề về hồ chứa và điều hướng. Để giám sát được phạm vi phân bố của Egeria, các bức ảnh phân bố được sưu tập, số hóa bằng máy scan và phân tích tưởng tượng. Gần đây, người ta nhận thấy rằng cách xử lý bằng tay như vậy tốn nhiều thời gian và công sức. Thêm vào đó, những bức ảnh thu được trong điều kiện môi trường bất lợi – gió, ánh sáng mặt trời, sự phản xạ của mặt nước, dòng nước cao/thấp … tất cả những yếu tố trên làm cho công việc trở nên khó khăn. Nhiệm vụ của chúng ta là đưa ra một phương pháp luận hiệu quả để nhận dạng tự động những vùng này bằng các đặc trưng ảnh và do đó sử dụng một kỹ thuật chung để xử lý tất cả các ảnh. Có thể xử lý với từng Pixel hoặc theo từng khối. Ta khai thác một ảnh (training image) và sau đó sử dụng kỹ thuật này cho các ảnh khác theo cách tương tự. Tất nhiên, những đặc trưng được định nghĩa từ trước, kỹ thuật này sử dụng để trích chọn những đặc trưng này – hỗ trợ chúng ta trong quá trình phát hiện tri thức. Thông tin ra là một thứ tự có hệ thống các trích chọn đặc trưng và một hệ thống giao diện hỗ trợ người dùng định nghĩa đặc trưng để sử dụng trong các ứng dụng khai phá ảnh.

Thông thường, hình ảnh có các đặc trưng sau: Màu sắc, kết cấu, hình dạng, biên,…Trong đó, những đặc trưng mang lại nhiều hứa hẹn là: màu sắc, kết cấu và biên.

 Màu sắc (Color): Yếu tố hình ảnh này có thể được so sánh với các phổ.

 Kết cấu (Texture): Được định nghĩa như là một tập các đặc trưng lân cận, một

vùng hay một khối. Với mỗi pixel đều có liên quan đến những pixel bên cạnh. Trong trường hợp này, Egeria xuất hiện trên mặt nước hoặc dưới dòng nước. Do đó các kết cấu cụ thể của các vùng tương tự nhau có thể so sánh với một kết cấu khuôn mẫu.

 Biên (Edge): Biên- là một sự thay đổi lớn một cách tuần tự. Đây là một đặc

trưng đặc biệt quan trọng, giống như là sự khác biệt giữa Egeria tối và Egeria sáng. Trong trường hợp này, phân biệt giữa Egeria tối và mặt nước sáng, có thể được xem như là một biên.

Sau khi các đặc trưng được trích chọn, và kết hợp chúng sử dụng các luật phát hiện ra mức độ bao phủ lớn nhất của Egeria trong ảnh. [10]

Một phần của tài liệu Khai phá Luật kết hợp trong cơ sở dữ liệu đa phương tiện (Trang 48 - 49)