CHƢƠNG 2 THUẬT TOÁN SOM VỚI BÀI TOÁN PHÂN CỤM
3.3 Cấu trỳc chƣơng trỡnh
3.3.4 Mụ phỏng (trực quan hoỏ)
SOM cú thể đƣợc dựng nhƣ một nền tảng thớch hợp cho việc thể hiện cỏc đặc điểm khỏc nhau của SOM (hay của dữ liệu). Trong cụng cụ SOM Toolbox, cú một số hàm mụ phỏng SOM, đƣợc chia làm 3 loại theo trực quan ban đầu:
ạ Mụ phỏng ụ (cell) dựa vào cỏch trỡnh bầy ma trận lưới trong khụng gian đầu rạ
Mụ phỏng ụ thể hiện SOM trong khụng gian đầu ra: một lƣới hỡnh chữ nhật của cỏc ụ thuộc tớnh thể hiện cỏc giỏ trị liờn quan. Chỳ ý rằng, mụ phỏng chỉ làm việc với cỏc ma trận 1-2 chiều và cỏc hỡnh „cell‟ và „toroid‟ và mặc định là „sheet‟.
Cụng cụ cơ bản là hàm som_show: som_show(sM); mặc định thể hiện ban đầu là ma trận hợp nhất khoảng cỏch đƣợc tớnh toỏn dựa trờn tất cả cỏc giỏ trị và sau đú thể hiện cỏc mặt phẳng thành phần
- Ma trận hợp nhất khoảng cỏch mụ phỏng khoảng cỏch giữa cỏc đơn vị trong ma trận lõn cận và hỗ trợ thể hiện cấu trỳc cụm của ma trận: cỏc giỏ trị lớn của ma trận hợp nhất khoảng cỏch cho biết ranh giới cỏc cụm, cỏc vựng giống nhau cú giỏ trị thấp xỏc định cụm.
- Mỗi mặt phẳng thành phần thể hiện cỏc giỏ trị của mỗi đơn vị trong ma trận.
Cỏc giỏ trị thể hiện dựng chỉ số bảng màụ Với cỏc màu khỏc nhau, SOM Toolbox sử dụng cõu lệnh colormap, jet, hot, graỵ Ngoài ra, cỏc kiểu khỏc của mặt phẳng cú thể là:
- Một lƣới rỗng chỉ thể hiện một phần (edges) của cỏc đơn vị. Điều này cú thể đƣợc dựng nhƣ một cơ sở cho việc gắn nhón hoặc cỏc mụ phỏng khỏc với màu nền cú thể làm nhạt hơn.
- Trong plane màu của mỗi đơn vị đều là cố định màụ Điều này cú thể đƣợc dựng để thể hiện cho vớ dụ phõn cụm hoặc thụng tin nhận dạng khỏc cho việc liờn kết cỏc trực quan khỏc nhaụ Cú cỏc cụng cụ đặc biệt nhƣ som_colorcode và som_clustercolor là cỏc cụng cụ về màu sắc.
Trong hàm som_show cú nhiều tham biến đầu vào mà cú thể đƣợc dựng để điều khiển cỏc loại plane để thể hiện và sắp xếp chỳng. Cỏc giỏ trị cõn bằng cú thể đƣợc chuẩn hoỏ lại thành dữ liệu ban đầu (nếu cú thể) và cú nhiều tham số thay đổi cỏch nhỡn của sự mụ phỏng núi chung, giống nhƣ sự định hƣớng của bảng màụ
Một hàm liờn quan trong som_show_ađ thiết lập cỏc thụng tin thờm vào một con số đƣợc tạo ra bởi som_show nhƣ là: nhón, biểu đồ (hit histogram), quỹ đạo (trajeactories).
- Gắn nhón, đƣợc thực hiện bởi hàm som_autolabel, đƣợc dựng cho cỏc loại đơn vị (hoặc một vài đơn vị), bằng cỏch ghi tờn của chỳng.
- Biểu đồ đƣợc đỏnh dấu thể hiện phõn bố của cỏc đơn vị phự hợp nhất cho một tập dữ liệu đƣa rạ Nhiều biểu đồ cú thể đƣợc vẽ và chỳng đƣợc nhận dạng bởi cỏc màu khỏc nhau và/hoặc cỏc dấu khỏc nhaụ Nhƣ vậy cú thể so sỏnh cỏc tập dữ liệu bằng phõn bố „hits‟ của chỳng trờn một ma trận. Cỏc biểu đồ cú thể đƣợc tớnh toỏn dựng hàm som_hits.
- Quỹ đạo thể hiện cỏc đơn vị phự hợp nhất đối với một tập dữ liệu thể hiện là chuỗi thời gian (time series) (hoặc bất kỳ chuỗi đƣợc sắp). Nú cú thể là một đƣờng kết nối liờn tục cỏc đơn vị phự hợp nhất hoặc một “vệt” quỹ đạo giữa đơn vị phự hợp nhất hiện tại (dữ liệu vớ dụ đầu tiờn) cú dấu lớn nhất và đơn vị phự hợp nhất cuối cựng (dữ liệu vớ dụ cuối cựng) cú dấu nhỏ nhất. Hàm som_trajectory đƣợc dựng để tỏc động quỹ đạo để phõn tớch và thậm
trớ cho phần điều khiển ma trận và chuỗi thời gian trong suốt quỏ trỡnh nghiờn cứu quỹ đạọ
Som-show dựng thủ tục som_cplane làm cơ sở. Thủ tục này cú thể đƣợc dựng để xõy dựng tuỳ biến cỏc kiểu mụ phỏng ụ. Cỏc tham số tuỳ chọn gồm:
- Màu của cỏc đơn vị,
- Kớch thƣớc cõn bằng cỏc đơn vị, - Vị trớ cỏc đơn vị,
- Hỡnh mẫu của đơn vị (đa giỏc tuỳ ý),
- Mẫu của cỏc đơn vị (bằng cỏch cõn bằng vị trớ của cỏc đỉnh).
b. Mụ phỏng hỡnh ảnh thể hiện một hỡnh ảnh đơn giản trong mỗi đơn vị của ma trận.
Mụ phỏng hỡnh ảnh phần lớn là vẽ codebook của SOM, là một tập cỏc hỡnh ảnh thụng thƣờng. í tƣởng là mỗi đơn vị của codebook đƣợc thể hiện bằng biểu đồ hỡnh trũn, và cỏc biểu đồ đƣợc bố trớ cựng một cỏch nhƣ là cỏc đơn vị trong cỏc mụ phỏng ụ.
- Biểu đồ hỡnh trũn (som_pieplane) là ý tƣởng thể hiện cỏc giỏ trị tỷ lệ. Màu sắc và kớch thƣớc cỏc phần chia cú thể đƣợc thay đổi bằng cỏch dựng cỏc tham số khỏc nhaụ
- Biểu đồ khối (som_barplane) phự hợp với việc thể hiện cỏc giỏ trị cỏc loại khỏc nhaụ Màu sắc của mỗi khối và khoảng trống cú thể đƣợc xỏc định trƣớc.
- Hỡnh dấu (som_plotplane) thể hiện cỏc vectơ codebook nhƣ cỏc hỡnh học đơn giản. Màu sắc của nột vẽ cú thể đƣợc xỏc định đối với mỗi đƣờng riờng biệt.
c. Mụ phỏng lưới thể hiện ma trận như một lưới hay đồ thị phõn tỏn (scatter plot)
Hàm som_grid cú thể đƣợc dựng để vẽ lại kiểu lƣớị Hàm này xuất phỏt từ ý tƣởng mụ phỏng lại tập dữ liệu chỉ đơn giản gồm một tập cỏc đối tƣợng, với mỗi một vớ trớ, màu sắc và hỡnh ảnh. Hơn nữa, cỏc liờn kết giữa cỏc đối tƣợng, vớ dụ quan hệ lõn cận, cú thể đƣợc thể hiện dựng cỏc đƣờng thẳng. Với som_grid ngƣời sử dụng cú thể ấn định tuỳ ý cỏc giỏ trị cho mỗi thuộc tớnh của chỳng. Vớ dụ cỏc toạ độ x, y, z, kớch thƣớc đối tƣợng và màu sắc cú thể mỗi trạng thỏi cho một biến, vỡ thế cú thể mụ phỏng đồng thời năm biến. Cỏc lựa chọn khỏc nhau là:
- Vị trớ của đối tƣợng cú thể cú kớch thƣớc là 2-3.
- Màu sắc của cỏc đối tƣợng cú thể lựa chọn tuỳ ý từ vectơ RGB, sử dụng chỉ số màu đặc thự.
- Hỡnh ảnh của đối tƣợng cú thể là bất kỳ dấu của matlab („.‟,‟+‟).
- Hơn nữa để cỏc đối tƣợng kết hợp với cỏc nhón là cú thể đƣợc thể hiện. - Bề mặt giữa cỏc đơn vị trong ma trận cú thể đƣợc vẽ thờm vào lƣớị