Chơng 8 Khảo nghiệm khai phá dữ liệu trong Oracle
8.3.1.1 Cơ sở về mạng nơron
Darwin triển khai một cấu trúc mạng nơron, trong đó các đơn vị đợc cấu trúc theo từng lớp nh sau:
- Lớp đầu tiên là lớp đầu vào. Nó bao gồm một nút (hoặc một đơn vị) cho mỗi trờng độc lập trong bản ghi.
- Lớp cuối cùng là lớp đầu ra, có thể bao gồm nhiều nút ra. Trong bài toán hồi qui, điều này nghĩa là một nút đầu ra đơn dự báo giá trị của một trờng đích.
Bài toán phân lớp nhị phân sử dụng một nút ra để phân biệt giữa hai giá trị (0 và1 hay dơng và âm) của một trờng đích đợc phân tách. Các trờng đợc phân tách với nhiều giá trị đòi hỏi một nút cho giá trị cần đợc dự báo và mạng nơron Darwin tách các trờng đa giá trị thành các trờng nhị phân, mỗi trờng ứng với một giá trị cần đợc dự báo.
- Các lớp nằm giữa lớp vào và lớp ra gọi là lớp ẩn. Đây là nơi các công việc nhận dạng, phân lớp và dự báo diễn ra.
Các hàm kích hoạt liên kết với từng đơn vị xử lý bên trong các lớp ẩn và lớp đầu ra. Các lớp đợc kết nối đầy đủ với nhau, nghĩa là, mỗi một nút trong lớp 1 nối tới mọi nút trong lớp 2, mỗi nút trong lớp 2 nối tới mọi nút trong lớp 3 và vv.
Xây dựng một mô hình mạng nơron liên quan đến việc tạo ra một cấu trúc mạng ban đầu, cho mạng học dựa trên tập dữ liệu học và kiểm tra/đánh giá hiệu năng dựa trên một tập dữ liệu khác.
Xây dựng mạng là một quá trình lặp từng bớc. Khi đã xây dựng đợc mô hình, Darwin đặt các bản ghi mới vào lớp đầu vào và làm dự báo cho lớp dữ liệu mới thông qua các tính toán bên trong của mạng.