SOM –Bài toán phân cụm màu

Một phần của tài liệu mạng nơron kohonen - som ứng dụng trọng phân nhóm sinh viên dựa trên kết quả học tập (Trang 41 - 45)

- – SOM

2.5.1. SOM –Bài toán phân cụm màu

Màu sắc là một loại dữ liệu tự nhiên và tập hợp của chúng tạo lên thế giới mà ta quan sát đƣợc bằng mắt. Trong quá trình phát triển công nghệ con ngƣời đã liên tục mã hóa và sử dụng màu sắc trong máy tính ngày một nhiều hơn. Khi dữ liệu đa phƣơng tiện bùng nổ thì màu sắc cũng theo đó trở thành một loại dữ liệu phổ biến và thông dụng bậc nhất trong kho dữ liệu của con ngƣời. Trong bài toán này chỉ lấy ví dụ minh họa về phân cụm màu sắc cho khả năng của mạng SOM cho sự phân loại dữ liệu tự nhiên. Đối tƣợng mang cụ thể cho loại dữ liệu này là ảnh số. Một loại dữ liệu phổ biến từ khi máy tính phát triển và đồng hành cùng con ngƣời.

Ảnh số là một ma trận các điểm ảnh và nhƣ vậy các đối tƣợng trong ảnh số cũng sẽ đƣợc mô tả bởi một tập các điểm ảnh. Vậy màu sắc là một cơ sở đơn giản giúp chúng ta có thể phân cụm đƣợc những điểm ảnh thuộc cùng một đối tƣợng có

42

Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/

trên ảnh số. Xét chi tiết trên mỗi điểm ảnh (Pixcel) là những kiểu dữ liệu đặc trƣng cho màu sắc. Trong ảnh nhị phân chỉ có 2 màu đen và trắng, trong ảnh đa cấp xám có 256 cấp xám tƣơng ứng với 256 màu, trong ảnh định dạng thông thƣờng đƣợc sử dụng rộng rãi hiện nay mỗi điểm ảnh là sự kết hợp của 3 màu Red, Green, Blue (định dạng RGB) nhƣ vậy có 256*256*256=16777216 màu sắc khác nhau. Nhiệm vụ đặt ra là phân biệt khối lƣợng màu sắc đã đề ra trên ảnh số. Khi đó mạng SOM có khả năng phân biệt các tập điểm ảnh cùng màu và chỉ ra sự tƣơng đồng về màu sắc giữa chúng. Đây là cơ sở cho quá trình nhận dạng các phân vùng đối tƣợng ảnh dựa theo màu sắc và việc phát triển này hƣớng tới khả năng phân cụm đối tƣợng và tách chúng ra khỏi ảnh để thực hiện quá trình tiếp theo là nhận dạng đối tƣợng trên một mạng nơron khác. Tuy nhiên trong khuôn khổ luận văn không nghiên cứu và đề cập tới mạng nơron dùng để nhận dạng.

43

Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/ Hình 2.5: Ảnh màu - Ảnh đa cấp xám- Ảnh nhị phân

Qua ví dụ trên có thể thấy tầm quan trọng của màu sắc trong quá trình hiểu và phân loại hình ảnh. Với bức hình bên trái có thể dễ dàng nhận ra vùng hoa và cùng đồi núi phía sau có sự khác biệt lớn trong ảnh màu, sự khác biệt này là rất nhỏ trong ảnh đa cấp xám, và khi convert sang ảnh nhị phân thì không còn sự khác biệt nào nữa. Nhƣ vậy dữ liệu màu sắc ở dạng đầy đủ phức tạp hơn nhƣng mang nhiều ý nghĩa hơn. Màu đen trắng và đa cấp xám dễ phân cụm nhƣng không còn nhiều ý nghĩa.

Trong ảnh màu thông tin về các đối tƣợng là đầy đủ nhất và màu sắc là cơ sở chủ yếu để phân định giữa các đối tƣợng. Vì lý do đó mà việc phân loại các đối tƣợng trên ảnh số sẽ dựa trên sự biến thiên về màu của các vùng đối tƣợng. Từ đó đòi hỏi một giải thuật xử lý đƣợc những dữ liệu màu sắc và phân loại chúng một cách chính xác. Tuy nhiên việc kết hợp của 3 màu cơ bản là Red, Green, Blue lại tạo ra vô số màu sắc khác nhau. Đây là nguyên nhân cho việc ứng dụng mạng SOM vào việc phân cụm dữ liệu trên ảnh số, mạng này có khả năng xác định những mối liên quan giữa những điểm ảnh và phân chúng vào những nhóm hợp lý.

44

Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/

Nhƣ đã trình bày một mạng SOM gồm 2 lớp nơron một lớp đầu vào và một lớp Kohonen. Mỗi một nơron đƣợc thiết kế với mục đích phân cụm dữ liệu trên ảnh số và đơn vị cho các vector đầu vào là các điểm ảnh ở định dạng RGB. Vì vậy mỗi nơron sẽ đƣợc thiết kế một trọng số mô tả giá trị màu của điểm ảnh truyền vào gồm 3 trọng số kiểu byte mô tả 3 màu Red, Green, Blue.

Việc khởi tạo mạng SOM đƣợc thực hiện khởi tạo ngẫu nhiên cho mỗi Nơron, khi đƣợc khởi tạo mạng sẽ là một tập hợp của rất nhiều màu sắc và chúng chƣa đƣợc phân thành các nhóm. Giải thuật huấn luyện mạng có thể đƣợc chia thành 2 phƣơng pháp.

- Huấn luyện ngẫu nhiên: Tạo một tập dữ liệu ngẫu nhiên và cho mạng tự học. Phƣơng pháp này tạo ra một mạng có khả năng phân biệt hầu hết tất cả các màu sắc, tập các nhóm màu sắc này sẽ biến thiên trong khoảng màu nhìn thấy đƣợc của con ngƣời. Tuy nhiên khi ứng dụng mạng huấn luyện kiểu này vào một bức ảnh cụ thể chƣa thu đƣợc kết quả nhƣ mong đợi.

- Huấn luyện có chủ đích: Khi sử dụng mạng để phân loại dữ liệu trên một bức ảnh định sẵn để đặt hiệu quả cao hơn trong quá trình phân cụm ta sử dụng chính những điểm ảnh có sẵn trong bức ảnh đầu vào làm tập huấn luyện. Khi đó mạng đƣợc huấn luyện sẽ chuyên phân cụm những điểm ảnh trên ảnh đầu vào hoặc những bức ảnh có cấu hình tƣơng tự.

Vì mạng là tự học lên ta không cần giám sát trong quá trình hoc của mạng và thuật toán huấn luyện đƣợc định sẵn cho mục đích sử dụng của mạng.

45

Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/

Một phần của tài liệu mạng nơron kohonen - som ứng dụng trọng phân nhóm sinh viên dựa trên kết quả học tập (Trang 41 - 45)

Tải bản đầy đủ (PDF)

(73 trang)