ỨNG DỤNG GOM CỤM ẢNH BẰNG K MEANS

Một phần của tài liệu GOM CỤM DỮ LIỆU BẰNG THUẬT TOÁN K-MEANS & ỨNG DỤNG GOM CỤM ẢNH (Trang 25)

Giới thiệu về phân đoạn ảnh bằng gom cụm

Phân đoạn ảnh là một bộ phận cấu thành cơ bản trong nhiều lĩnh vực có ứng dụng máy tính và có thể được coi như là một lĩnh vực nghiên cứu cơ bản của gom cụm dữ liệu. Việc phân đoạn các ảnh dựa vào việc hiển thị một hệ thống phân tích hình ảnh phụ thuộc vào cảnh hiện thị, Hình dạng ảnh, cấu hình, và bộ chuyển đổi dùng để chuyển đổi ra ảnh kỹ thuật số, và cuối cùng là đầu ra của hệ thống.

Các ứng dụng của phương pháp gom cụm dữ liệu đối với vấn đề phân đoạn ảnh ảnh đã được công nhân hơn ba thập kỷ trước, và những nỗ lực tiên phong vẫn là nền tảng được sử dụng ngày nay. Nền tảng lặp lại là xác định các véc-tơ đặc tính ở mỗi một điểm ảnh mà ảnh đó chứa cả hàm số mật độ của ảnh và hàm số bản thân vị trí điểm ảnh. Ý tưởng này được mô tả hình bên dưới. Ý tưởng này rất thành công khi sử dung đối với các ảnh có mật độ(có hay không chứa kết cấu ảnh), dải(biên độ) ảnh, và ảnh đa phổ.

Hình 11: Tính năng đại diện cho clustering. Hình ảnh và vị trí các phép đo được chuyển đến các tính năng. Cụm trong không gian tính năng tương ứng với các phân đoạn hình ảnh.

Phân đoạn ảnh được hiểu thông thường là việc phân tách ảnh đầu vào thành các miền (các lớp đối tượng riêng rẽ) mỗi đối tượng được gọi là một ảnh con. Để

phân biệt đối tượng này với đối tượng khác và tiện lợi cho các bước phân tích tiếp theo, mỗi đối tượng được gán một nhãn. Thực chất của phân đoạn ảnh là phép đối sánh mẫu. Mỗi ảnh con được phân tách chứa các thuộc tính (mật độ, mầu, chứa vân).

Một thuật toán gom cụm kết tụ đã được áp dụng bởi Silverman và Cooper vào năm 1988 cho vấn đề của học không giám sát của cụm vectơ hệ số cho hai mô hình ảnh tương ứng với các phân đoạn hình ảnh. Các mô hình đầu tiên là đa thức cho các số đo hình ảnh quan sát; giả định ở đây là hình ảnh là một bộ sưu tập của đồ thị liền kề nhiều bề mặt, mỗi một hàm đa thức của các mặt phẳng tọa độ hình ảnh, được lấy mẫu trên lưới đường quét để tạo ra các hình ảnh quan sát . Thuật toán tiền xử lý bằng cách lấy vectơ của hệ số của hình vuông ít nhất phù hợp với các dữ liệu trong cửa sổ hình ảnh M phân chia. Một thuật toán gom cụm kết tụ hòa trộn (ở mỗi bước) hai cụm có một cụm toàn cầu tối thiểu giữa-khoảng cách Mahalanobis . Cùng một khuôn khổ đã được áp dụng đối với phân khúc của hình ảnh kết cấu, nhưng có hình ảnh như mô hình đa thức là không thích hợp, và một tham số ngẫu nhiên Markov mô hình trường đã được giả định để thay thế.

Kỹ thuật Clustering cũng đã được thành công được sử dụng cho các phân đoạn của nhiều hình ảnh , đó là một nguồn phổ biến của các dữ liệu đầu vào cho ba chiều đối tượng hệ thống công nhận.

Các tính năng của cơ bản của khái niệm gom cụm dữ đặc biệt hấp dẫn cho các phân khúc hình ảnh từ nhiều (không giống như đo cường độ) các phép đo tại mỗi điểm ảnh có cùng một đơn vị (chiều dài); này sẽ làm cho quảng cáo hoc biến đổi hoặc chuẩn hóa hình ảnh tính năng không cần thiết nếu mục tiêu của họ là để áp đặt bằng rộng trên các tính năng đó. Tuy nhiên, phạm vi ảnh phân đoạn thường gắn thêm để đo không gian chức năng, loại bỏ lợi thế này.

Hình 12. Phân đoạn ảnh y tế đa quang phổ. (a) Kênh duy nhất của ảnh đầu vào. (b) 9 cụm phân đoạn ảnh

Cài đặt thử nghiệm

Giới thiệu

Quá trình cài đặt của thuật toán K-Means được mô phỏng thông qua chương trình có các thông số như dưới đây:

• Ngôn ngữ sử dụng là C#

• Editor sử dụng là Visual Studio 2010

• Tham số ban đầu: Số cụm mặc định là 4, màu mặc định là RGB.

• Dữ liệu đầu vào là các hình ảnh khác nhau

Cách gom cụm ảnh bằng K-Means trong chương trình

Bằng cách phân vùng ảnh, ta có thể tìm thấy các cụm màu sắc khác nhau. Các dữ liệu trong hình ảnh là những pixel màu. Ta cần cung cấp số lượng cụm cho thuật toán. Điều này là tương đối dễ dàng vì chúng ta có thể đoán số lượng màu sắc riêng biệt bằng cách nhìn vào hình ảnh mà mình chọn. Dù việc dự đoán số cụm không phải là chính xác hoàn toàn, nhưng tùy thuộc vào số lượng của các cụm, ta có thể hoặc không thể có được kết quả phân đoạn hình ảnh tốt. Trong hình ảnh trên, bạn có thể thấy rằng tôi đã sử dụng 3 cụm có nghĩa là hình ảnh được phân đoạn có 3 màu khác nhau. Lúc này, dựa trên số lượng các cụm, thuật toán nhóm màu sắc tương tự với nhau cho đến khi nó không thể tìm thấy bất kỳ màu sắc nào xung quanh các cụm.

Giải thuật KMeans trong chương trình

Đây là mô tả về giải thuật KMeans trong chương trình:

1. Thiết lập số cụm (lấy từ thông số người dùng nhập vào). 2. Ngẫu nhiên đặt trọng tâm của các cụm trong ảnh.

3. Duyệt qua tất cả các dữ liệu trong ảnh (các điểm ảnh):

a. Tính khoảng cách từ trọng tâm của các cụm đến điểm ảnh này. b. Nhóm điểm ảnh này vào nhóm gần nhất.

4. Xác định lại tâm mới cho cụm.

5. Nếu trong tâm mới khác với trọng tâm cũ thì trở lại bước 3, không thì dừng giải thuật.

Cách sử dụng chương trình

Chương trình nói chung rất dễ sử dụng:

Bước 1: Click vào nút “Chọn hình ảnh” và chọn 1 hình ảnh bất kỳ trong máy tính.

Bước 2: Nhập vào số cụm màu sắc.

Bước 3: Chọn dạng màu ở mục “Chọn mã màu”

Bước 4: Click vào nút “thực hiện” để thực thi giải thuật.

Một phần của tài liệu GOM CỤM DỮ LIỆU BẰNG THUẬT TOÁN K-MEANS & ỨNG DỤNG GOM CỤM ẢNH (Trang 25)

Tải bản đầy đủ (DOC)

(30 trang)
w