Kich bản thực nghiệm và so sánh giữa các phương pháp

Một phần của tài liệu PHÂN TÍCH, DỰ BÁO XU THẾ GIÁ BLOCKCHAIN ỨNG DỤNG TRÍ TUỆ NHÂN TẠO (Trang 37)

4.3.1. Phương pháp so sánh.

Để cĩ được sự khách quan về độ hiệu quả báo cáo thực hiện so sánh thực nghiệm kết quả giữa mơ hình ARIMA và mơ hình đề xuất qua các quá trình sau:

• Chạy mơ hình ARIMA với bộ dữ liệu defaul.

• Chạy mơ hình Random Forest với bộ dữ liệu tối ưu bằng phương pháp cửa sổ. • Tối ưu các tham số của mơ hình Random Forest.

Để so sánh thuật tốn ARIMA và thuật tốn Random Forest kết hợp cửa sổ trượt báo cáo sử dụng tham số:

- MAPE phần trăm trung bình lỗi tuyệt đối. Đây một chỉ báo rất thơng dụng cho các dữ liệu cần dự báo chính xác giá.

- Accuracy là phần trăm độ chính xác tuyệt đối của mơ hình. Với: Accuracy = 100 - MAPE

4.3.2. Mơ hình ARIMA

Dữ liệu sử dụng là cột thứ sáu trong bộ dữ liệu được định nghĩa trong mục. Như đã trình bày lý thuyết ở mục 2.4, tơi sử dụng bộ tham số (p,d,q) =(1,2,0) để thực nghiệm mơ hình ARIMA và cho kết quả dự đốn theo chu kỳ T+1. Kết quả thu được là: MAPE = 3.69% và Accuracy= 96.31%

Kết quả dự đốn thể hiện trong bảng 3.3, cột chênh lệch thể hiện độ sai khác giữa giá dự đốn so với giá thực tế

Ngày i Giá ngày i

Giá thực tế ngày i+1

Giá dự đốn

ngày i+1 Chênh lệch 9/1/2020 8055.98 7886.92 4289.86 3597,06 8/1/2020 8145 8055.98 8071.09 15,11 7/1/2020 7758 8145.28 8065.70 79,58 6/1/2020 7358.75 7758 8151.17 393,17 5/1/2020 7354.11 7358.75 7739.24 380,49 4/1/2020 7344.96 7354.11 7337.93 16,18 3/1/2020 6965.71 7344.96 7353.56 8,6 2/1/2020 7200.85 6965.71 7344.62 378,91 1/1/2020 7195.23 7200.85 6945.95 254,9 31/12/2019 7246 7195.23 7212.27 17,04 30/12/2019 7388.24 7246 7195.22 50,78 29/12/2019 7316.14 7388.24 7248.59 139,65 28/12/2019 7254.74 7316.14 7395.69 79,55 27/12/2019 7202 7254.74 7312.79 58,05 26/12/2019 7204.63 7202 7251.57 49,57 25/12/2019 7255.77 7204.63 7199.24 5,39 24/12/2019 7317.09 7255.77 7204.67 51,1 23/12/2019 7501.44 7317.09 7258.40 58,69 22/12/2019 7132.75 7501.44 7320.36 181,08 21/12/2019 7187.83 7132.75 7511.21 378,46

20/12/2019 7150.3 7187.83 7114.33 73,5 19/12/2019 7277.83 7150.3 7190.07 37,53 18/12/2019 6623.82 7277.83 7148.42 129,41 17/12/2019 6891.72 6623.82 7284.22 660,4 16/12/2019 7118.59 6891.72 6590.98 300,74 15/12/2019 7064.05 7118.59 6902.98 215,61 14/12/2019 7258.48 7064.05 7129.79 128,69 13/12/2019 7198.08 7258.48 7061.44 197,04 12/12/2019 7210 7198.08 7267.88 57,88

Hình 4.2: Thống kê kết quả chạy bằng mơ hình ARIMA

4.3.3. Mơ hình Random Forest

4.3.3.1. Bộ dữ liệu Bitcoin trong phân tích định lượng

Sau khi xác định được số lượng nhãn lớp ở phương pháp cửa sổ, giả sử tìm được nhãn lớp Wt phù hợp tơi tiến hành tạo bộ dữ liệu phân tích bộ dữ liệu như sau:

• Bộ dữ liệu gồm (863-t+1) x (6*t) bản ghi. Trong đĩ các cột tương ứng với số liệu là:

Open, High, Low, Close, Volume BTC, Volume USDT

Open_1, High_1, Low_1, Close_1, Volume BTC_1, Volume USDT_1 Open_2, High_2, Low_2, Close_2, Volume BTC_2, Volume USDT_2 …….

Open_(t-1), High_(t-1), Low_(t-1), Close_(t-1), Volume BTC_(t-1), Volume USDT_(t- 1)

• Nhãn của hàng i: close(i) là giá đĩng cửa của ngày i, close i+s là giá đĩng cửa của ngày (i+s), với  I  t.

• Tập huấn luyện cĩ 833 mẫu, tập kiểm chứng cĩ 30 mẫu.

4.3.3.2. Xây dựng bộ dữ liệu chiều dài cửa sổ (W) và độ phủ (Oz)

Ở phần này, báo cáo sẽ kiểm thử với các tham số W và Oz. Kết quả thực nghiệm được cho ở bảng dưới đây.

Bảng 4.3 Kết quả thực nghiệm kiểm thử W và Oz

Oz W 25% 50% 75% 100% 1 97.48% 2 97.75% 97.45% 3 97.73% 97.71% 97.53% 4 96.94% 97.23% 97.28% 97.71% 5 97.72% 97.68% 97.56% 97.35% 6 97.71% 97.62% 96.56% 96.86% 7 97.52% 97.67% 97.72% 97.71% 8 97.72% 97.74% 97.70% 97.63% 9 97.45% 97.53% 97.64% 97.7%

Qua quá trình thực nghiệm ta thấy với W = 2, Oz = 50% cho kết quả Accuracy tốt nhất là 97.75%.

4.3.3.3. Tối ưu hĩa tham số mơ hình Random Forest

Ở bước 4.4.3.2 chúng ta đã tìm được bộ tham số W và Oz, xây dựng bộ dữ liệu để đưa vào mơ hình Random Forest. Bước này chúng ta tiến hành tối ưu hĩa tham số của mơ hình Random Forest. Các tham số bao gồm:

• n_estimators: Số lượng lá trong rừng cây, n_estimators chạy từ 5 đến 50 với bước nhảy 2

• max_depth: Độ sâu tối đa của cây quyết định, max_depth chạy từ 3 đến 10 với bước nhảy bằng 1.

Sau khi chạy ta thu được kết quả n_estimators = 15, max_depth = 7 cĩ kết quả Accuracy = 97.93% là lớn nhất.

Ta cĩ bảng tổng hợp kết quả dự đốn của mơ hình ARIMA và mơ hình Random Forest sau khi đã tối ưu hĩa tham số như sau:

Ngày i

Giá dự đốn ngày i bằng Random Forest cải tiến

Giá thực tế ngày i Giá dự đốn ngày i bằng ARIMA 9/1/2020 8058.51 7886.92 4289.86 8/1/2020 8033.27 8055.98 8071.09 7/1/2020 7971.23 8145.28 8065.70 6/1/2020 7518.05 7758 8151.17 5/1/2020 7414.91 7358.75 7739.24 4/1/2020 7224.82 7354.11 7337.93 3/1/2020 7261.26 7344.96 7353.56 2/1/2020 7173.85 6965.71 7344.62 1/1/2020 7224.55 7200.85 6945.95 31/12/2019 7178.01 7195.23 7212.27 30/12/2019 7347.04 7246 7195.22 29/12/2019 7198.06 7388.24 7248.59 28/12/2019 7224.55 7316.14 7395.69 27/12/2019 7270.45 7254.74 7312.79 26/12/2019 7224.55 7202 7251.57 25/12/2019 7474.18 7204.63 7199.24 24/12/2019 7295.58 7255.77 7204.67 23/12/2019 7435.54 7317.09 7258.40 22/12/2019 7132.75 7501.44 7320.36 21/12/2019 7173.85 7132.75 7511.21 20/12/2019 7224.55 7187.83 7114.33 19/12/2019 7468.91 7150.3 7190.07 18/12/2019 7282.48 7277.83 7148.42 17/12/2019 6534.25 6623.82 7284.22 16/12/2019 6942.83 6891.72 6590.98 15/12/2019 7224.55 7118.59 6902.98 14/12/2019 7033.01 7064.05 7129.79 13/12/2019 7198.06 7258.48 7061.44 12/12/2019 7224.55 7198.08 7267.88

Đồ thị giá đĩng cửa thực tế và giá dự đốn bằng phương pháp Random Forest kết hợp với cửa sổ trượt. Kết quả dự đốn là trong vịng 30 ngày từ ngày 11/12/2019 đến ngày 9/1/2020:

Hình 4.4: Đồ thị giá đĩng cửa thực tế và giá dự đốn.

4.4. Đánh giá

Trong chương này đã trình bày các thực nghiệm và kết quả thực nghiệm được sử dụng trong báo cáo này với giá của Bitcoin. Mơ tình Random Forest Regrresion đã thể hiện được sức mạnh của mình trong việc dự đốn chuỗi thời gian phức tạp như là chuỗi giá đĩng cửa của thị trường tiền điện tử.

Dự đốn xu thế của thị trường tiền ảo là một cơng việc khơng đơn giản, sự bất ổn của thị trường kèm theo đĩ là tác động của nhiều yếu tố bên ngồi cũng làm ảnh hưởng tới giá cả của thị trường tiền ảo. Bởi vậy để xây dựng một mơ hình dự báo xu thế của thị trường tiền điện tử đem lại hiệu quả cao cho các nhà đầu tư là một cơng việc cần thiết.

Trong chương 3 của báo cáo này, tơi đã sử dụng những lý thuyết đã tìm hiểu được ở chương 1, chương 2 áp dụng vào bài tốn, hồn thành thực nghiệm với bộ dữ liệu thức tế thu thập được được niêm yết tại sàn Binance cho mã Bitcoin. Các kết quả thực nghiệm trên đều cho kết quả khá tốt so với mong đợi của tơi. Báo cáo thực hiện kết hợp kiến thức của khoa học máy tính với các kiến thức về tài chính hỗ trợ đắc lực cho các nhà đầu tư, kinh doanh cĩ quyết định chính xác đúng thời điểm nhằm gia tăng lợi nhuận tối đa. Báo cáo này tập trung vào việc tìm hiểu mơ hình khai phá dữ liệu và kỹ thuật chuyên dụng của các chuyên gia trong lĩnh vực tiền ảo.

KẾT LUẬN

Kết quả đạt được:

Từ việc nghiên cứu yêu cầu bài tốn và thực nghiệm trên dữ liệu lịch sử giao dịch tiền ảo Bitcoin, luận văn của tơi đã thực hiện được một số nội dung sau:

• Tìm hiểu về thị trường tiền ảo và các kỹ thuật trong việc dự báo thị trường chứng khốn.

• Tìm hiểu mơ hình khai phá dữ liệu – mơ hình Random Forest • Tiến hành thực nghiệm và so sánh đánh giá các kết quả đạt được.

• Hỗ trợ người dùng trong việc đưa ra lời khuyên cho người dùng nên mua hay bán trong những ngày giao dịch tiếp theo.

Hướng phát triển của báo cáo:

Trong thời gian tới, tơi sẽ tiếp tục xây dựng, hồn thiện hệ thống dự báo tiền ảo Bitcoin nhằm hỗ trợ người dùng trong việc đưa ra lời khuyên chính xác. Thêm vào đĩ tơi sẽ tiếp tục nghiên cứu các phương pháp học máy dùng trong khai phá dữ liệu và kết hợp với khai phá dữ liệu trên mạng xã hội như Facebook, các diễn đàn chuyên về giao dịch tiền ảo nhằm nâng cao kết quả dự báo xu thế thị trường chứng khốn.

TÀI LIỆU THAM KHẢO

Tiếng Việt

[1] Phan Xuân Hiếu (2013). Bài giảng mơn học KPDL và kho dữ liệu, Trường Đại học Cơng nghệ, Đại học Quốc gia Hà Nội.

[2] Hà Quang Thụy (2010). Bài giảng mơn học Kho dữ liệu và KPDL, Trường Đại học Cơng nghệ, Đại học Quốc gia Hà Nội.

Tiếng Anh

[3] Palma, Wilfredo. Time series analysis. John Wiley & Sons, 2016.

[4] Satoshi Nakamoto. 2008. Bitcoin: A peer-to-peer electronic cash system. (2008). http://bitcoin.org/bitcoin.pdf

[5] Amjad, M. J. & Shah, D. (2017). "Trading Bitcoin and Online Time Series Prediction”. Proceedings of the Time Series Workshop at NIPS 2016, (pp. PMLR 55:1- 15)

[6] Lo, A. W. & MacKinlay, A. C. (1988). Stock market prices do not follow random walks: Evidence from a simple specification test. The Review of Financial Studies, Volume 1, 41–66.

[7] Thomas G. Dietterich. Ensemble methods in machine learning. In Proceedings of the First International Workshop on Multiple Classifier Systems, MCS ’00, pages 1–15, London, UK, UK, 2000. Springer-Verlag.

[8] H. Wang, B. Liu, S. Wang, N. Ma, Y. Yang. Forward and Backward Knowledge Transfer for Sentiment Classification. arXiv preprintarXiv:1906.03506, 2019.

[9] David Hand, Heikki Mannila, Padhraic Smyth, (2001), Principles of Data Mining, MIT Press, Massachusetts.

Một phần của tài liệu PHÂN TÍCH, DỰ BÁO XU THẾ GIÁ BLOCKCHAIN ỨNG DỤNG TRÍ TUỆ NHÂN TẠO (Trang 37)

Tải bản đầy đủ (PDF)

(45 trang)