Phƣơng pháp hay đƣợc sử dụng là sử dụng hàm Lagrange để tìm ra giải pháp làm giảm thiểu hồi quy của phƣơng trình
2.4.4 Hồi quy vector hỗ trợ với hàm nhân
a. Hàm nhân
Cho X – không gian vector tuyến tính, H – không gian Hilbert có tích vô hƣớng. Một hàm đối xứngliên tục K: X x X → R đƣợc gọi là nhân trên X nếu tồn tại một ánh xạ Φ: X → H với: 𝐾 𝑥, 𝑧 =< Φ x , Φ z >; ∀𝑥, 𝑧 ∈ 𝑋 Một số hàm nhân thƣờng sử dụng: 1. Hàm tuyến tính 𝐾 𝑥, 𝑧 = 𝑥𝑇𝑧 2. Hàm polynomial 𝐾 𝑥, 𝑧 = 𝛾𝑥𝑇𝑧 + 𝑟 𝑑 3. Hàm radial 𝐾 𝑥, 𝑧 = exp(−𝛾 𝑥 − 𝑧 2) 4. Hàm sigmoid 𝐾 𝑥, 𝑧 = tanh(𝛾𝑥𝑇𝑧 + 𝑟)
b. Mô hình hồi quy vector hỗ trợ với hàm nhân
Vấn đề tối ƣu hóa biểu thức 2.36 điều kiện 2.37 có thể chuyển đổi thành tìm phƣơng trình sau: 𝑓 𝑥 = 𝛼𝑖 − 𝛼𝑖∗ 𝑁 𝑖=1 K 𝑥𝑖, x + 𝑏 ((2.39) Trong đó: - N là số vector hỗ trợ - K xi, x là hàm nhân
CHƢƠNG 3: THỰC NGHIỆM VÀ ĐÁNH GIÁ
Chƣơng này tiến hành thử nghiệm các mô hình dự báo đã trình bầy ở phần trên để dự báo biến động của thị trƣờng chứng khoán Việt Nam. Do thị trƣờng chứng khoán Việt Nam đƣợc chia làm hai sở giao dịch chứng khoán là sở giao dịch chứng khoán Thành Phố Hồ Chí Minh và sở giao dịch chứng khoán Hà Nội, tƣơng ứng với hai chỉ số VNINDEX và HNXINDEX. Do đó thử nghiệm của chúng tôi tiến hành đối với hai chỉ số chứng khoán quan trọng này.
3.1Cài đặt môi trƣờng
3.1.1 Chuẩn bị dữ liệu
- Dữ liệucác chỉ số VNINDEX, HNXINDEX đƣợc lấy từ trang web của công ty chứng khoán Bảo Việt.
- Dữ liệu đƣợc lấy từ ngày 2/1/2007 đến ngày 30/6/2013 thu đƣợc:
o VNINDEX gồm1610 dữ liệu quan sát hàng ngày. Do các mô hình học máy cần có 2 tập dữ liệu là tập dữ liệu huấn luyện và tập dữ liệu kiểm tra nên ta chia dữ liệu thu thập đƣợc thành 2 tập nhƣ sau:
Tập dữ liệu huấn luyện – 1/2007 đến 6/2012 gồm 1362 quan sát
Tập dữ liệu thử nghiệm – 7/2012 đến 6/2013 gồm 248 quan sát
o HNXINDEX gồm1601dữ liệu quan sát hàng ngày, đƣợc chia làm 2 tập nhƣ sau:
Tập dữ liệu huấn luyện – 1/2007 đến 6/2012 gồm 1359quan sát
Tập dữ liệu thử nghiệm – 7/2012 đến 6/2013 gồm 242 quan sát
- Độ biến động của thị trƣờng đƣợc xác địnhlàđộ lệch chuẩn trên tập dữ liệu hàng ngày.Sử dụng cách tính dựa trên giá đóng cửa của chỉ số (hoặc cổ phiếu) nhƣ đã trình bầy trong phần 1.1.3 ở trên.
- Theo phƣơng pháp phân tích kỹ thuật[23] thì các nhà đầu tƣ hay sử dụng dữ liệu của 5,10, 15, 20 ngày trƣớc để phân tích và dự báo ngắn hạn thị trƣờng các ngày tiếp theo. Do đó trong phạm vi của thử nghiệp
này chúng tôi sử dụng dữ liệu 10 ngày trƣớc làm tham số đầu vào cho các mô hình học máy để dự báo biến động 1 ngày tiếp theo, cụ thể dự báo biến động thị trƣờng ngày 01/07/2013 (sử dụng dữ liệu 10 ngày từ ngày 17/06/2013 đến 28/06/2013)
Các hình dƣới đây hiển thị độ biến động của các chỉ số VNINDEX và HNXINDEX trên các tập dữ liệu: