Mạng Nơron SOM cho phân cụm ảnh

Một phần của tài liệu Phân cụm dữ liệu cho nhận dạng ảnh sử dụng mạng nơron (Trang 68 - 70)

Thiết kế mạng

Mạng SOM gồm 2 lớp nơron: một lớp đầu vào và một lớp Kohonen. Mỗi một nơron đƣợc thiết kế với mục đích phân cụm dữ liệu trên ảnh số và đơn vị cho các đầu vào là các điểm ảnh ở định dạng RGB. Vì vậy mỗi nơron sẽ đƣợc thiết kế một trọng số mô tả giá trị màu điểm ảnh truyền vào gồm 3 trọng số kiểu byte mô tả Red, Green, Blue.

Việc khởi tạo mạng SOM đƣợc thực hiện khởi tạo ngẫu nhiên cho mỗi nơron. Khi đƣợc khởi tạo mạng sẽ là một tập hợp của rất nhiều màu sắc và chúng chƣa đƣợc phân thành các nhóm. Giải thuật huấn luyện mạng có thể đƣợc chia thành 2 phƣơng pháp:

- Huấn luyện ngẫu nhiên: Tạo một tập dữ liệu ngẫu nhiên và cho mạng tự học. Phƣơng pháp này tạo ra một mạng có khả năng phân biệt hầu hết các màu sắc, tập các nhóm màu sắc này sẽ biến thiên trong khoảng màu nhìn thấy đƣợc của cong ngƣời. Tuy nhiên khi ứng dụng mạng huấn luyện kiểu này vào một bức ảnh cụ thể chƣa thu đƣợc kết quả nhƣ mong đợi.

- Huấn luyện có chủ đích: Khi sử dụng mạng để phân loại dữ liệu trên một bức ảnh định sẵn để đạt hiệu quả cao hơn trong quá trình phân cụm ta sử dụng chính những điểm ảnh có sẵn trong bức ảnh đầu vào làm tập huấn luyện. Khi đó mạng đƣợc huấn luyện sẽ chuyên phân cụm những điểm ảnh trên ảnh đầu vào hoặc những bức ảnh có cấu hình tƣơng tự.

Vì mạng là tự học nên ta không cần giám sát trong quá trình học của mạng và thuật toán huấn luyện đƣợc định sẵn cho mục đích sử dụng mạng.

Thuật toán học mạng

Thuật toán học SOM đƣợc chia làm 5 bƣớc cơ bản nhƣ sau: Bƣớc 1: Xác định cấu hình mạng, và các tham số.

Bƣớc 2: Khởi tạo ngẫu nhiên trọng số của các nơron lớp Kohonen

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

Bƣớc 3: Đọc mẫu học v, đƣa vào lớp vào. Bƣớc 4: Tìm nơron chiến thắng (BMU) trong lớp Kohonen (gần với mẫu học v nhất) Bƣớc 5: Cập nhật trọng số các nơron nằm trong bán kính lân cận với BMU.

Cho đến khi thỏa mãn điều kiện dừng.

Các điểm cần lưu ý trong thuật toán học:

a) Khởi tạo các tham số: SOM bị ảnh hƣởng rất nhiều bởi quá trình lƣ̣a chọn các tham

số của mạng . Các tham số này bao gồm : kích thƣớc của bản đồ (Width/Height), số lần

lặp (N), bán kính khởi tạo (σ0), giá trị khởi tạo cho tốc độ học (L0). Thực tế không có

một hƣớng dẫn cụ thể cho việc lựa chọn các tham số này ứng với các bài toán áp dụng SOM, do vậy, việc “thƣ̉ sai” (trial and error) là cần thiết nhằm xác định tập các giá trị thích hợp ứng với tập dữ liệu đầu vào.

b) Xác định BMU: Để chọn BMU sử dụng một trong ba hàm khoảng cách là Euclidian

(thƣờng dùng), Manhattan, và Vector Dot Product.

Duyệt tất cả các nút và tính khoảng cách Euclide (Dist) giữa vector trọng số (w) của

mỗi nút và vector nhập hiện hành (v). Nút có vector trọng số gần nhất với giá trị của

vector nhập sẽ đƣợc chọn là BMU.  2 0 is w n i i i D t v     (4.1)

c) Xác định bán kính lân cận và cập nhật trọng số các nơron lân cận của BMU:

Trọng số của phần tử lân cận đƣợc xác định ở bƣớc trên bao gồm cả BMU sẽ đƣợc điều chỉnh để chúng có giá trị gần giống với giá trị của vector nhập hơn. Phần tử càng gần BMU thì trọng số của nó sẽ càng dễ bị thay đổi nhiều hơn. Các vector trọng số sẽ đƣợc tính theo công thức:

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

Θ(t): Hàm nội suy theo thời gian học, nó thể hiện sự tác động của khoảng cách đối với quá trình học và đƣợc tính theo công thức sau:

(4.3)

dist: Khoảng cách từ một nơron đến nơron chiến thắng t: Bƣớc lặp hiện tại

L: Tốc độ học (sẽ giảm dần theo số lần lặp)

- Biểu thức trên cho thấy trọng số của mỗi nút sau khi hiệu chỉnh chính là giá trị trọng số cũ W của nó cộng thêm phần giá trị khác biệt giữa trọng số W và vector nhập V theo hệ số tốc độ học

- Hàm nội suy tốc độ học L (t) cho mỗi bƣớc lặp đƣợc tính theo công thức sau:

(4.4)

L0: giá trị khởi tạo ban đầu của tốc độ học.

- Càng tiến gần về điểm giữa thì tốc độ học càng giống với hàm mũ nội suy của phép co. Tốc độ học sẽ đƣợc nội suy dần theo tốc độ học và giá trị của hàm sẽ tiến dần về không khi số lần lặp đạt tới những bƣớc cuối cùng.

d) Điều kiện dừng: Có thể dựa trên số lần lặp hay số mẫu học hay độ cân bằng của

mạng (các trọng số thay đổi dƣới một ngƣỡng nhất định).

Một phần của tài liệu Phân cụm dữ liệu cho nhận dạng ảnh sử dụng mạng nơron (Trang 68 - 70)

Tải bản đầy đủ (PDF)

(79 trang)