T ng hợp các kết quả dự đốn của nhiều mơ hình thực nghi m

Một phần của tài liệu (LUẬN văn THẠC sĩ) nghiên cứu khai phá dữ liệu và ứng dụng phân tích xu thế thị trường chứng khoán (Trang 50 - 53)

Qua thống kê ở bảng 3.13, tơi thu được t l chính xác của các m hình: mạng Neural truyền thống, mạng Neural cải tiến 1 và mạng neural sử dụng phương pháp ensemble lần lượt là 31.25%, 18.75% và 50%. Nhận thấy, khi sử dụng kỹ thuật

bagging thì độ chính xác của mạng neural tăng lên đáng kể. Đồ thị giá đĩng cửa thực tế và giá dự đốn b ng phương pháp ensemble (hình 3.20).

Hình 3.20: Đồ thị giá đĩng cửa thực tế và giá dự đốn.

3.4. P n t c .

Dự đốn xu thế của thị trường chứng khốn là một cơng vi c kh ng đơn giản, sự bất n của thị trường kèm theo đĩ là tác động của nhiều yếu tố bên ngồi cũng làm ảnh hưởng tới giá cả của thị trường chứng khốn. Bởi vậy để xây dựng một mơ hình dự báo xu thế thị trường chứng khốn đem lại hi u quả cao cho các nhà đầu tư là một cơng vi c cần thiết.

Trong chương 3 của luận văn này, t i đã sử dụng những lý thuyết đã tìm hiểu được ở chương 1, chương 2 áp dụng vào bài tốn, hồn thành thực nghi m với bộ dữ li u thực tế thu thập từ trang finance.yahoo.com cho mã c phiếu MSFT niêm yết trên NASDAQ. Các kết quả thực nghi m đều cĩ độ chính xác cao trên 80%. Luận văn thực hi n kết hợp kiến thức của khoa học máy tính với các kiến thức tài chính hỗ trợ đắc lực cho các nhà đầu tư, kinh doanh cĩ quyết định chính xác đúng thời điểm nh m gia tăng lợi nhuận tối đa.

Luận văn này tập trung vào vi c tìm hiểu mơ hình khai phá dữ li u và kỹ thuật chuyên dụng của các chuyên gia kinh tế dùng trong lĩnh vực chứng khốn theo cả hai khía cạnh định tính và định lượng.

Đầu tiên, tơi thử nghi m bộ dữ li u này với mơ hình phân tích hồi quy ARIMA chuyên dụng của ngành tài chính và mơ hình khai phá dữ li u mạng Neural. Tơi tiến hành so sánh kết quả thực nghi m của tơi với nghiên cứu của Kuo-Cheng Tseng và cộng sự [24] với cùng mơ hình sử dụng ARIMA(1,1,2) và mạng neural cho dữ li u c phiếu MSFT thì nhận thấy kết quả thực nghi m của tơi tốt hơn. Sở dĩ t i đạt được kết quả này là vì tơi sử dụng với nhiều dữ li u đầu vào hơn so với bài báo [24 nên cho độ chính xác tốt hơn. Từ đây t i thấy r ng: muốn tăng độ chính xác dự báo thì cần cung cấp nhiều thơng tin hữu ích cho quá trình huấn luy n mơ hình.

44.5 45.3 46.2 47.0 47.8 48.7 49.5

Đồng thời kết quả dự đốn ngày T+1 của mơ hình mạng Neural cho kết quả chính xác hơn m hình rima với cùng bộ dữ li u MSFT. Tuy nhiên, kết quả dự đốn ngày thứ T+4 của mơ hình mạng neural lại k m hơn so với dự đốn T+1. Nguyên nhân cĩ thể do vi c dự đốn càng xa khiến cho khả năng dự đốn càng kém chính xác. Kết quả chi tiết trong bảng 3.6. Nhưng để phù hợp chu k thanh tốn hi n tại của thị trường chứng khốn, tơi tiến hành cải tiến nh m gia tăng độ chính xác cho mạng neural với chu k thanh khoản T+4.

Tơi thực cải tiến lần 1 cho mơ hình mạng neural b ng cách thực hi n b sung dữ li u đầu vào với một vài chỉ báo phân tích cơ bản. Kết quả nhận được cho thấy, khi được b sung cách tiếp cận kinh tế, mơ hình mạng neural cho độ chính xác cao hơn, kết quả phân lớp tăng từ 82.9005(%) ± 0.2025(%) lên 82.9595(%) ± 0.2855(%). B ng cách cung cấp thêm th ng tin đầu vào cho quá trình huấn luy n mạng neural, tơi cĩ kết quả như trong bảng 3.9 và 3.10. Từ đây t i càng khẳng định r ng: muốn tăng độ chính xác dự báo thì cần cung cấp nhiều thơng tin hữu ích cho quá trình huấn luy n mơ hình.

Tơi tiếp tục sử dụng bộ dữ li u này và tiến hành cải tiến lần 2 với phương pháp ensemble cho mạng neural cụ thể là kỹ thuật bagging và kết quả tăng lên đáng kể với độ chính xác đạt mức 87.87%. Kết quả chi tiết được thể hi n trong bảng 3.12 và 3.13 cho thấy vi c kết hợp những kiến thức của khoa học máy tính với các kiến thức tài chính cĩ thể hỗ trợ cho các nhà đầu tư, kinh doanh trong vi c đưa ra những chiến lược đầu tư phù hợp nhất.

Kỹ thuật boosting chú trọng đến bộ dữ li u bị phân lớp sai, thể hi n trong vi c tăng trọng số cho bộ dữ li u học sai này để ưu tiên nĩ hơn trong quá trình học, do đĩ dẫn dễ đến tình trạng overfitting của m hình t ng hợp với dữ li u ban đầu. Tình trạng overfitting sẽ làm cho m hình kh ng cĩ khả năng khái quát hĩa, chỉ trả lời được với những gì m hình đã được huấn luy n, cịn khi đưa dữ li u mới vào thì m hình kh ng trả lời được. ậy nên, m hình boosting tạo ra cĩ thể k m chính xác. Trong khi đĩ bagging ít khi gặp overfitting hơn. ì vậy đây chính là ưu điểm mà tơi lựa chọn sử dụng thuật tốn bagging để giải quyết bài tốn này.

Cĩ thể chia tập dữ li u thành nhiều tập con khác nhau để huấn luy n m hình. Ở đây tơi chọn ph p chia thành 10 m hình con vì những lý do sau đây:

-) chia thành càng nhiều tập dữ li u con thì càng cĩ nhiều mơ hình neural thành phần. Do đĩ thời gian tính tốn cũng tăng nên theo số lượng mơ hình neural thành phần ,

-) Số lượng tập dữ li u con càng ít thì số mơ hình neural thành phần càng ít làm cho độ chính xác càng giảm và ngược lại số lượng tập dữ li u tăng thì độ chính xác tăng

-) chia thành càng nhiều tập dữ li u con thì số lượng dữ li u huấn luy n trong một m hình càng ít. Khi cĩ nhiều tập dữ li u con thì số lượng mơ hình neural thành phần là nhiều sẽ dẫn đến dữ li u đầu vào kh ng đảm bảo đầy đủ th ng tin để huấn luy n mơ hình dự báo chính xác.

Dựa vào các kết quả thu nhận được tơi cĩ vài lời khuyên cho các nhà đầu tư, các nhà kinh doanh chứng khốn như trong bảng 3.14.

N y u ƣớn dự ốn ời uyên

4-Dec-14 -1 Nên giữ nguyên hoặc cĩ thể bán

5-Dec-14 -1 Nên bán

8-Dec-14 1 Nên giữ nguyên hoặc mua

9-Dec-14 -1 Nên giữ nguyên hoặc cĩ thể bán

10-Dec-14 -1 Nên giữ nguyên hoặc cĩ thể bán

11-Dec-14 -1 Khơng nên giữ nguyên mà nên bán

12-Dec-14 1 Nên giữ nguyên hoặc cĩ thể mua

15-Dec-14 1 Nên mua.

16-Dec-14 1 Nên mua.

17-Dec-14 1 Nên mua.

18-Dec-14 1 Nên bán.

19-Dec-14 -1 Nên giữ nguyên hoặc cĩ thể bán

22-Dec-14 -1 Khơng nên giữ nguyên mà nên bán

23-Dec-14 -1 Nên bán

24-Dec-14 -1 Nên bán

26-Dec-14 -1 Nên bán

Một phần của tài liệu (LUẬN văn THẠC sĩ) nghiên cứu khai phá dữ liệu và ứng dụng phân tích xu thế thị trường chứng khoán (Trang 50 - 53)

Tải bản đầy đủ (PDF)

(56 trang)