Tuỳ chọn dạy mô hình mạng học

Một phần của tài liệu KHAI PHÁ DỮ LIỆU VÀ PHÁT HIỆN LUẬT KẾT HỢP TRONG CƠ SỞ DỮ LIỆU LỚN (Trang 78 - 79)

Chơng 8 Khảo nghiệm khai phá dữ liệu trong Oracle

8.3.3 Tuỳ chọn dạy mô hình mạng học

Các tham số ảnh hởng đến mạng học là cách học, thuật toán học, hàm chi phí và số lần lặp. Trên giao diện ngời dùng của Darwin, các tham số này đợc đặt trên hộp thoại Advanced Options, Net Train.

8.3.3.1 Cách học

Ta có thể dạy cho mô hình mạng nơron học sử dụng một trong ba cách sau: Học và Kiểm tra (Train and Test), xác nhận chéo (Cross-Validation) và Học đơn giản (Simple Training):

- Train and Test là ngầm định và đợc thực hiện đồng thời sử dụng hai tập dữ liệu hoặc hai phần của một tập dữ liệu. Cách này rất thuận tiện tránh đợc việc học không đầy đủ khi tập dữ liệu lịch sử tơng đối nhỏ.

Nếu ta có hai tập dữ liệu hoặc hai phần của một tập dữ liệu thì cũng cần đợc chỉ rõ phần nào để học và phần nào để kiểm tra.

Train and Test sản sinh ra một bảng hiển thị các sai sót học và sai sót kiểm tra. Giá trị hiển thị là sai số độ lệch bình phơng. ở đây có thể có một chút phân biệt với bài toán phân lớp nhị phân do việc sai số độ lệch quân phơng là căn bậc hai của sai số phân lớp. Cross-Validation sử dụng việc triển khai hiệu quả xác nhận chéo hai đoạn để hỗ trợ quá trình học. Trong việc xác nhận chéo, Darwin sử dụng các tập dữ liệu (hoặc một phần tập dữ liệu) cho học và kiểm tra. Nghĩa là, đầu tiên nó dạy với A và kiểm tra với B, sau đó dạy với B và kiểm tra với A. Sau đó nó lấy trung bình của hai kết quả để xác định tần suất sai sót.

Khi làm việc với số lợng dữ liệu quá nhỏ để tách chúng thành ba phần, thì thông thờng một chiến lợc tốt là sử dụng xác nhận chéo trớc để kiểm tra các cấu trúc mạng khác nhau và sau đó sử dụng Train and Test để dạy thêm nữa nhằm tạo ra mô hình nhiều hứa hẹn nhất.

- Simple Training dạy cho mạng một cách đơn giản với một số lần lặp cụ thể. Trong quá trình học, Darwin hiển thị số vòng lặp đã hoàn thành và tần suất sai số hiện thời. Nếu ta sử dụng Simple Training, ta cần phải kiểm tra mạng một cách riêng rẽ.

Một phần của tài liệu KHAI PHÁ DỮ LIỆU VÀ PHÁT HIỆN LUẬT KẾT HỢP TRONG CƠ SỞ DỮ LIỆU LỚN (Trang 78 - 79)

Tải bản đầy đủ (DOCX)

(89 trang)
w