DỮ LIỆU CỦA BÀI TOÁN

Một phần của tài liệu ỨNG DỤNG KỸ THUẬT HỌC MÁY TRONG XÂY DỰNG MÔ HÌNH DỰ BÁO TÀI CHÍNH (Trang 74 - 77)

CHƯƠNG 3: DỰ BÁO CHO DỮ LIỆU CHUỖI THỜI GIAN

3.2. DỮ LIỆU CỦA BÀI TOÁN

Dữ liệu là giá đóng cửa của VN-Index từ ngày 26/11/2009 đến ngày 21/02/2020 với 2550 điểm dữ liệu được lấy từ trang web: https://www.cophieu68.vn/

Hình 3.0. Dữ liệu VN-Index từ 2010 đến 2019

Dữ liệu sẽ được chia thành tập huấn luyện và tập kiểm tra hoàn toàn độc lập phù hợp với yêu cầu về dữ liệu của mô hình.

Học viên sử dụng 6 mô hình dự báo cho VN-Index:

✓ Mô hình 1 (mô hình 200 ngày): sử dụng giá quá khứ 200 ngày trước để dự báo cho giá trị của VN-Index cần dự báo. Trong mô hình này tổng dữ liệu của cả tập huấn luyện và tập kiểm tra là 2350 điểm dữ liệu do điểm dữ liệu đầu tiên cần 200 dữ liệu trước đó để dự báo.

Tập huấn luyện là 2100 điểm dữ liệu đầu và tập kiểm tra gồm 250 điểm dữ liệu còn lại.

Mô hình sử dụng mạng nơ-ron 6 lớp với lớp đầu vào là một véc tơ 200 chiều, lớp ẩn thứ nhất có 100 nốt, lớp ẩn thứ hai có 50 nốt, lớp ẩn thứ ba có 25 nốt, lớp ẩn thứ tư có 12 nốt, và nốt đầu ra có 1 nốt.

✓ Mô hình 2 (mô hình 150 ngày): sử dụng giá quá khứ 150 ngày trước để dự báo cho giá trị của VN-Index cần dự báo. Trong mô hình này tổng dữ liệu của cả tập huấn luyện và tập kiểm tra là 2400 điểm dữ liệu do điểm dữ liệu đầu tiên

cần 150 dữ liệu trước đó để dự báo. Tập huấn luyện là 2150 điểm dữ liệu đầu và tập kiểm tra gồm 250 điểm dữ liệu còn lại.

Mô hình sử dụng mạng nơ-ron 6 lớp với lớp đầu vào là một véc tơ 150 chiều, lớp ẩn thứ nhất có 89 nốt, lớp ẩn thứ hai có 50 nốt, lớp ẩn thứ ba có 25 nốt, lớp ẩn thứ tư có 12 nốt, và nốt đầu ra có 1 nốt.

✓ Mô hình 3 (mô hình 100 ngày): sử dụng giá quá khứ 100 ngày trước để dự báo cho giá trị của VN-Index cần dự báo. Trong mô hình này tổng dữ liệu của cả tập huấn luyện và tập kiểm tra là 2450 điểm dữ liệu do điểm dữ liệu đầu tiên cần 100 dữ liệu trước đó để dự báo. Tập huấn luyện là 2200 điểm dữ liệu đầu và tập kiểm tra gồm 250 điểm dữ liệu còn lại.

Mô hình sử dụng mạng nơ-ron 5 lớp với lớp đầu vào là một véc tơ 100 chiều, lớp ẩn thứ nhất có 50 nốt, lớp ẩn thứ hai có 25 nốt, lớp ẩn thứ tư có 12 nốt, và nốt đầu ra có 1 nốt.

✓ Mô hình 4 (mô hình 50 ngày): sử dụng giá quá khứ 50 ngày trước để dự báo cho giá trị của VN-Index cần dự báo. Trong mô hình này tổng dữ liệu của cả tập huấn luyện và tập kiểm tra là 2500 điểm dữ liệu do điểm dữ liệu đầu tiên cần 50 dữ liệu trước đó để dự báo. Tập huấn luyện là 2250 điểm dữ liệu đầu và tập kiểm tra gồm 250 điểm dữ liệu còn lại.

Mô hình sử dụng mạng nơ-ron 5 lớp với lớp đầu vào là một véc tơ 50 chiều, lớp ẩn thứ nhất có 25 nốt, lớp ẩn thứ hai có 12 nốt, lớp ẩn thứ ba có 6 nốt và nốt đầu ra có 1 nốt.

✓ Mô hình 5 (mô hình 30 ngày): sử dụng giá quá khứ 30 ngày trước để dự báo cho giá trị của VN-Index cần dự báo. Trong mô hình này tổng dữ liệu của cả tập huấn luyện và tập kiểm tra là 2520 điểm dữ liệu do điểm dữ liệu đầu tiên cần 30 dữ liệu trước đó để dự báo. Tập huấn luyện là 2250 điểm dữ liệu đầu và tập kiểm tra gồm 270 điểm dữ liệu còn lại.

Mô hình sử dụng mạng nơ-ron 5 lớp với lớp đầu vào là một véc tơ 30 chiều, lớp ẩn thứ nhất có 20 nốt, lớp ẩn thứ hai có 12 nốt, lớp ẩn thứ ba có 6 nốt và nốt đầu ra có 1 nốt.

✓ Mô hình 6 (mô hình 20 ngày): sử dụng giá quá khứ 20 ngày trước để dự báo cho giá trị của VN-Index cần dự báo. Trong mô hình này tổng dữ liệu của cả tập huấn luyện và tập kiểm tra là 2530 điểm dữ liệu do điểm dữ liệu đầu tiên cần 30 dữ liệu trước đó để dự báo. Tập huấn luyện là 2250 điểm dữ liệu đầu và tập kiểm tra gồm 280 điểm dữ liệu còn lại.

Mô hình sử dụng mạng nơ-ron 4 lớp với lớp đầu vào là một véc tơ 20 chiều, lớp ẩn thứ nhất có 12 nốt, lớp ẩn thứ hai có 6 nốt, và nốt đầu ra có 1 nốt.

Một phần của tài liệu ỨNG DỤNG KỸ THUẬT HỌC MÁY TRONG XÂY DỰNG MÔ HÌNH DỰ BÁO TÀI CHÍNH (Trang 74 - 77)

Tải bản đầy đủ (PDF)

(93 trang)