ứng dụng mạng norron Kohonen trong yỉệc phân tích,- 123docz.net

1.3.3H oc khong co

2.3. ứng dụng mạng norron Kohonen trong yỉệc phân tích, đánh

• giá.

2.3.1. cấu trác mô hình mạng nơron Kohonen.

•SOM được tạo thành từ các nơron được đặt trên một lưới một chiều hoặc hãi chiềụ Trọng số n chiều hoặc vector tham chiếu đại diện cho nơron thứ

i trong SOM Mi trong đó n bằng kích thức của các vector đầu

• vàọ Cấu trúc liên kết của SOM có thể là hình chữ nhật hoặc hình ỉục giác.

•

• Hình 2.1

• Hình 2.1 Cấu trức cửa mạng SOM

• Các nơron trong bản đồ được kết nối với các nơron lân cận thông qua các lệnh mối quan hệ liền kề trong cấu trúc của bản đồ. Các nơron liền kề thuộc lân cận thứ nhất nil của nơron thứ ị Trong không gian hai chiều các nơron có thể được bố trí TRONG hình chữ nhật hoặc hình lục giác. Các kích cỡ khác nhau của lân cận được minh họa như hình, số ỉượng các nơron xác định kết quả chi tiết của bản đồ và nó ảnh hưởng đến tính chính xác và khả năng khái quát của SOM.

• VUlfịcn ,

• S __ X •

nhất với kích thước lân cận điều chinh độ mịn và tính khái quát của bản đồ. Bản đồ không bị ảnh hưởng nhiều khi số lượng nơron vượt quá số lượng vector đầu vào nếu kích thước lân cận được lựa chọn thích hợp. Khi kích thước của bản đồ tăng số lượng nơron các giai đoạn huấn luyện trở nên nặng nề và khó khăn. Trước khi huấn luyện phải khởi tạo giá trị ban đàu cho vector trọng số. Có ba phương pháp khởi tạo được sử dụng:

• Khởi tạo ngẫu nhiên, khởi tạo sử dụng hàm mẫu ban đầu, khởi tạo tuyến tính.

• Khởi tạo ngẫu nhiên: Các giá trị ngẫu nhiên được gán cho vector bảng mã đây là trường họp được sử dụng khi dữ liệu đầu vào tại thời gian khởi tạo không có gì hoặc ít được biết đến.

• Khởi tạo sử dụng mẫu ban đàu: Sử dụng các mẫu ban đàu được thực hiện bởi các mẫu ban đầu của bộ dữ liệu đầu vào và có thể được sử dụng cho khởi tạo vector bảng mã. Điều này có lợi thế mà các điểm tự động đặt ừong cùng một phần tử không gian đàu vào với dữ liệụ

• Khởi tạo tuyến tính: Phương pháp khởi tạo sử dụng phân tích các thành phần chính của dữ liệu đầu vàọ Vector bảng mã được khởi tạo nằm ừong cùng một không gian đầu vào được kéo dài bởi 2 vector đặc trưng tương ứng với những giá trị riêng lớn nhất của dữ liệu đàu vàọ Điều này có tác dụng kéo SOM cùng hướng dữ liệu có năng lượng quan trọng nhất. Phương pháp khởi tạo tuyến tính được sử dụng thành công. Tuyến tính là phương pháp tốt cho khởi tạo bản đồ đa chiềụ

2.3.1.2 Huấn luyện SOM

• Bước 1: Lựa chọn ngẫu nhiên vector mẫu X từ tập dữ liệu đầu vào và sử dụng các biện pháp đo khoảng cách giữa vector mẫu và các vector trọng số của bản đồ. Thông thường sử dụng biện pháp đo khoảng cách Euclidẹ Chọn phàn tử trùng khớp nhất BMƯ kí hiệu c là đơn vị của vector trọng số có sự tương đồng lớn nhất với mẫu đầu vào X. BMU được xác định bằng công thức:

đàu vào trong không gian đầu vàọ Thủ tục thích nghi kéo dài BMƯ và các topo lân cận của nó hướng về vector mẫụ

•

• Hình 2.2 Cập nhật BMU và lân cận của nó với mẫu đầu

vào X

• Thông thường quá trình huấn luyện được thực hiện qua hai giai đoạn.

• Giai đoan 1: So sánh giá trị ban đầu và bán kính vùng lân cận. • Giai đoan 2: Giá trị ban đầu và bán kính vùng lân cận phải nhỏ hơn giai đoạn 1. Giai đoạn này điều chỉnh khoảng cách lần đàu tiên của dữ liệu đầu vào với vector trọng số sau đó tỉnh chỉnh lại bản đồ.

2.3.1.3 Tỉ lệ học

• Tỉ lệ học a luôn luôn nhỏ hơn 1 thông thường là 0.4 hoặc thấp hơn. Tỉ lệ học lớn sẽ làm cho quá trình học nhanh hơn. Tuy nhiên tỉ lệ học quá cao thì hội tụ sẽ không bao giờ xảy rạ

• Một số thuộc tính của hàm - 1> ăt) >0

- Giảm dần đều theo thời gian

huấn luyện lặp + Đệ quy di(t+l)= ai(t)/(l+hCiai(t))

• Tỉ lệ học là hàm giảm chức năng theo thời gian. Có 2 dạng hàm thường sử dụng là hàm tuyến tính theo thời gian và hàm tỉ lệ nghịch với thời gian. Minh họa ở hình 2.3 hàm ăt) tuyến tính a giảm dần tới 0 trong quá trình học từ giá trị ban đầu trong khi hàm ngược a giảm nhanh chóng từ giá trị ban đầụ Giá trị ban đầu của ăt) phải được xác định. Thường khi sử dụng hàm ăt) tỉ lệ giảm nhanh chóng, giá trị ban đầu có thể lớn hơn giá trị tuyến tính được chọn.

• Tỉ lệ học a có thể chấp nhận một số hàm khác nhau: ăt)=l- ao(ƯT) Với kết quả phân cụm tốt nhưng hội tụ chậm hơn. ăt)=aota Hội tụ nhanh hơn và kết quả tốt hơn ăt)=aol'at Hội tụ nhanh nhất nhưng kết quả không đúng

• Hàm thứ 2 là chấp nhận được với ăt) trong khoảng [0.05-0.9] và luôn chọn giá trị nhỏ hơn gần đến 1.

•

• Hình 2.3 Hàm tỉ lệ học theo thời gian

2.3.1.4 Hàm lân cận

• Hàm lận cận bao gồm hàm tỉ lệ học ăt) là hàm giảm theo thời gian và là hàm mẫu ra lệnh cho các hàm lần cận, các dạng hàm sau cùng cũng

nút chiến thắng và trọng số có sự thay đổị

• Thông thường hàm lân cận được sử dụng để cập nhật cho các nút liền kề. Một loạt các hàm lân cận có thể được sử dụng. Chúng ta có thể hạn chế các hàm chức năng để không gia tăng xung quanh đơn vị chiến thắng mc. Các hàm lân cận có thể cố định xung quanh đơn vị chiến thắng. Một lựa chọn cho hàm lân cận là sử dụng hạt nhân Gaussian xung quanh nơron chiến thắng. Điều này đòi hỏi tính toán theo cấp số nhân nhưng cũng có thể lấy xấp xỉ bởi hàm lân cận bubblẹ Hàm lân cận Gaussian

• hd=o(t).exp(-^-ị)

• 25 (2.12)

• d2ci: Khoảng cách trung gian của nơron bị kích i và nơron chiến

thắng c. dci: Trong mạng tinh thể một chiều |i-ll dci: Trong mạng tinh thể 2 chiều llri-rcll khi ĩi là vị trí của nơron i trong mạng.

• ô: Phương pháp đo mức độ bị kích thích của nơron lân cận của nơron chiến thắng hợp tác ừong quá trình học.

• Trong các thuật toán học 8 được cập nhật mỗi lần lặp trong giai đoạn ra lệnh bằng cách sử dụng các quy tắc cập nhật phân rã theo hàm mũ với các tham số.

• Tính năng khác của SOM là kích thước của một lân cận thu nhỏ với thời gian

• ỗ(t)= ỗoexp(-ƯTl)

(2.13) • Trong đó: t: rời rạc theo thời gian t=0,1,2,3...

• x: Độ nghiêng của đồ thị 5(t) đối với t tạo lênx(l) lớn hơn chiều rộng ô(t) giảm chậm hơn

bubblẹ Hàm lân cận bubble là một hằng số được xác

định lân cận của nơron chiến thắng, mọi nơron ở khu vực

lân cận sẽ được cập nhật đối xứng với tỉ lệ khác biệt giữa các nơron và vector mẫụ Hàm lân cận bubble là một hàm trung gian giữa tổn thất tính toán và xấp xỉ Gaussian. Một tính toán cho hàm này cũng tốn nhiều thời gian. Công thức tính cho hàm bubble

•

• (2.15)

• Một hình thức đơn giản của hàm lân cận biểu thị một tập hợp các nút xung quanh các nút phù hợp nhất. Bằng cách chọn tỉ lệ học ban đầu phù hợp và hình thức học với hàm lân cận ảnh hưởng đáng kể đến kết quả.

•• • • • • • • • • (b)

• Hình 2.4 Giá trị của hàm lân cận Gausian(a) và

Ứng dụng mạng norron Kohonen trong yỉệc phân tích, đánh

Giới thiệu về mạng потоп Kohonen