Phân chia tập huấn luyện

Một phần của tài liệu nghiên cứu ứng dụng công cụ khai phá dữ liệu trong bài toán về giao dịch tỷ giá (Trang 27 - 29)

Tập huấn luyện sẽ sử dụng trong quá trình lựa chọn tham số cho mơ hình bằng các phƣơng pháp và . Sau đĩ x x' x' x O 0.5 1 1

29

tồn bộ tập sẽ đƣợc dùng để huấn luyện mơ hình và đánh giá, so sánh giữa các mơ hình bằng tập để chọn mơ hình tốt nhất.

Việc chia mỗi tập mẫu thành nhiều tập thƣờng phải đảm bảo:

 Các tập khơng giao nhau.

 Tỉ lệ các mẫu dƣơng và các mẫu âm trong mỗi tập sau khi chia đƣợc đảm bảo tƣơng đối (tức tƣơng đƣơng tỉ lệ này trong tập ban đầu).

Đối phƣơng pháp : cần chia tập thành hai tập và khơng giao nhau theo tỉ lệ . Để làm việc này đảm bảo tính ngẫu nhiên và đảm bảo tỉ lệ mẫu dƣơng với mẫu âm ta cĩ thể thực hiện theo các bƣớc:

 Tách thành hai tập gồm các mẫu dƣơng và gồm các mẫu âm.

 Chọn ngẫu nhiên

| | mẫu từ chuyển sang và chọn ngẫu nhiên | | mẫu từ chuyển sang .

 Trộn và (theo thứ tự ngẫu nhiên) ta đƣợc , trộn và (theo thứ tự ngẫu nhiên) ta đƣợc .

Hai tập vừa chia nhƣ trên đảm bảo các yêu cầu của phƣơng pháp huấn luyện và đánh giá .

Đối với phƣơng pháp ta cần chia tập thành tập con khơng giao nhau, số lƣợng tƣơng đƣơng và đảm bảo tỉ lệ mẫu dƣơng và mẫu âm. Để làm việc này đảm bảo tính ngẫu nhiên và đảm bảo tỉ lệ mẫu dƣơng với mẫu âm ta cĩ thể thực hiện theo các bƣớc:

 Tách thành 2 tập gồm các mẫu dƣơng và gồm các mẫu âm.

 Chia thành các tập con với số lƣợng tƣơng đƣơng (mỗi tập cĩ xấp xỉ | | mẫu) và chia thành các tập con với số lƣợng tƣơng đƣơng (mỗi tập cĩ xấp xỉ | | mẫu).

30

k tập vừa chia nhƣ trên đảm bảo các yêu cầu của phƣơng pháp huấn luyện và đánh giá . Trong quá trình huần luyện ta lần lƣợt chọn mỗi tập trong tập đĩ làm và trộn tập cịn lại thành .

Một phần của tài liệu nghiên cứu ứng dụng công cụ khai phá dữ liệu trong bài toán về giao dịch tỷ giá (Trang 27 - 29)

Tải bản đầy đủ (PDF)

(44 trang)