Bài toán phâ nc 1 G

Một phần của tài liệu Sử dụng mạng Noron cho phân cụm dữ liệu và ứng dụng (Trang 102)

3.1.1 Gi

2.1.482. Màu sắc là một loại dữ liệu tự nhiên và tập họp của chúng tạo nên thế giới mà ta quan sát được bằng mắt. Trong quá trình phát triển công nghệ, con người đã liên tục mã hóa và sử dụng màu sắc trong máy tính ngày một nhiều hon. Khi dữ liệu đa phương tiện bùng nổ thì màu sắc cũng theo đó trở thành một loại dữ liệu phổ biến và thông dụng bậc nhất trong kho dữ liệu của con người. Trong bài toán này chỉ lấy ví dụ minh họa về phân cụm màu sắc cho khả năng của mạng SOM cho sự phân loại dữ liệu tụ’ nhiên. Đối tượng mang cụ thể cho loại dữ liệu này là ảnh số. Một loại dữ liệu phổ biến từ khi máy tính phát triển và đồng hành cùng con người.

2.1.483. Ảnh số là một ma trận các điểm ảnh và như vậy các đối tượng trong ảnh số cũng sẽ được mô tả bởi một tập các điểm ảnh. Vậy màu sắc là một cơ sở đơn giản giúp chúng ta có thể phân cụm được những điểm ảnh của cùng một đối tượng có trên ảnh số. Xét chi tiết trên mỗi điểm ảnh (Pixel) là nhũng kiểu dữ liệu đặc trưng cho màu sắc. Trong ảnh nhị phân chỉ có 2 màu đen trắng, trong ảnh đa cấp xám có 256 cấp xám tương ứng với 256 màu, trong ảnh định dạng thông thường được sử dụng rộng rãi hiện nay mỗi điểm ảnh là sự kết hợp của 3 màu Red, Green, Blue (định dạng RGB), như vậy có 256*256*256=16777216 màu sắc khác nhau. Nhiệm vụ đặt ra là phân biệt các tập điểm ảnh cùng màu và chỉ ra sự tương đồng về màu sắc giữa chúng. Đây là cơ sở cho quá trình nhận dạng các phân vùng đối tượng ảnh dựa theo màu sắc và việc phát triển này hướng tới khả năng phân cụm đối tượng và tách chúng ra khỏi ảnh để thực hiện quá trình tiếp theo là nhận dạng đối tượng trên một mạng nơron khác. [1], [3], [4].

2.1.484. Trong ảnh màu thông tin về các đối tượng là đầy đủ và màu sắc là cơ sở chủ yếu để phân định giữa các đối tượng. Vì lý do đó mà việc phân loại

các đối tượng trên ảnh sẽ dựa trên sự biến thiên về màu của các vùng đối tượng. Từ đó đòi hỏi một giải thuật xử lý được nhũng dữ liệu màu sắc và phân loại chúng một các chính xác. Tuy nhiên việc kết hợp của 3 màu cơ bản là Red, Green, Blue lại tạo vô số màu sắc khác nhau. Đây là nguyên nhân cho việc ứng dụng mạng SOM vào việc phân cụm dữ liệu trên ảnh số, mạng này có khả năng xác định những mối quan hệ giữa nhũng điểm ảnh và phân chúng vào những nhóm hợp lý.

Một phần của tài liệu Sử dụng mạng Noron cho phân cụm dữ liệu và ứng dụng (Trang 102)

w