Trong giai đoạn chuẩn bị dữ liệu có 2 việc cần thực hiện đó là : Thu thập dữ liệu và xử lý dữ liệu
- Thu thập dữ liệu
Chuẩn bị dữ liệu - Thu thập dữ liệu; - Tiền xử lý dữ liệu.
Huấn luyện mạng Sai
Xác định các thông số của mạng - Số nơ ron đầu vào
- Số nơ ron đầu ra - Độ lớn của vào / ra - Hệ số học ban đầu
- Độ lớn ban đầu của các nơ ron lân cận - Số liên kết. Phát triển mạng Kohonen - Lớp vào; - Lớp ra 2 chiều hình chữ nhật. Kiểm tra mạng Đánh giá kết quả Bắt đầu Kết thúc download by : skknchat@gmail.com
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www. lrc.tnu.edu.vn
Việc thu thập dữ liệu của 1 đối tượng cũng như các thuộc tính của nó cho phân loại sản phẩm có thể thực hiện theo nhiều cách khác nhau.
Dữ liệu có thể được biết như là các bản ghi , các ví du , các thực thể hay 1 cá biệt nào đó. Thuộc tính , các đặc trưng của 1 đối tượng cũng là các dữ liệu cần phải thu thập cho việc phân loại thuộc tính. Có thể coi như là các biểu tượng , đặc trưng hay tính chất nó được gán các giá trị thuộc tính trong không gian nhiều chiều.
Tập các dữ liệu ta có thể thấy như các tế bào ung thư, ris, rượu vang … Tập các dữ liệu có thể được coi như các mẫu của đầu vào cho huấn luyện mạng Kohonen.
Ví dụ :
- Tiền xử lý dữ liệu
Các dữ liệu mới thu nhận chưa thể sử dụng được ngay vì còn rất thô, do vậy cần phải xử lý trước 1 bước và được gọi là Tiền xử lý dữ liệu. Các công đoạn cho tiền xử lý dữ liệu như sau :
- Làm sạch dữ liệu gồm: Thêm các dữ liệu thiếu, loại bỏ dư thừa. - Tách hợp dữ liệu
- Chuyển đi dữ liệu qua chuẩn hóa - Giảm bớt kích cỡ dữ liệu.
- Rời rạc hóa dữ liệu
Ví dụ : Việc chuẩn hóa có thể thực hiện theo : Xnor =𝑋𝑖𝑛 − 𝑋𝑚𝑖𝑛
𝑋𝑚𝑎𝑥−𝑋𝑚𝑖𝑛 Trong đó :
Xnor : Giá trị mới của dữ liệu Xin : Giá trị hiện hành của dữ liệu Xmin: Giá trị thấp nhất khi thu thập Xmax: Giá trị cao nhất khi thu thập
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www. lrc.tnu.edu.vn