Trong đề tài này được áp dụng các mô hình trong dự báo là LSTM, chuỗi thời gianARIMA, SARIMA, CNN và sự kết hợp của Grid Search đối với từng mô hình đề đánh giá, lựa chọn xem mô hình nào
Trang 1TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN
BÙI DƯƠNG THỦY TIÊN
DU BAO GIA DONG TIEN MÃ HÓA BITCOIN BANG CÁCH KET HỢP PHƯƠNG PHAP TÌM KIEM LƯỚI, MÔ HINH CHUOI THỜI GIAN,
Trang 2TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN
BUI DUONG THUY TIEN
DU BAO GIA DONG TIEN MA HOA BITCOIN BANG CÁCH KET HỢP PHƯƠNG PHÁP TÌM
KIEM LƯỚI, MÔ HÌNH CHUOI THỜI GIAN,
Trang 3Lời nói đầu tiên em xin cảm ơn các thầy cô trong trường Đại Học Công NghệThông Tin đã chỉ dẫn em nhiều bài học hay, những kiến thức vô cùng quý báu mà
điều đó em không bao giờ quên ơn
Thay cô đã dạy em rat nhiệt tinh với những nội dung mới, định hướng cho em
con đường đi tương lai phía trước Đối với em, thay cô là những người đưa đò thầm
lặng đề cho em đến bến bờ tri thức mới và đưa những học viên sau này cập bến theo
con đường mà mình đã chọn.
Thay cô đã cống hiến cả nhiệt huyết của mình dé cho em bổ sung nhiều điểm
thiếu sót, kiến thức còn hạn hẹp của mình, định hướng con đường mình cần phải đi,
phấn đấu Đồng thời cho em xin được nhắc đến là người thầy đáng kính PGS.TS
Nguyễn Đình Thuân, thầy là người hướng dẫn, chỉ dẫn tận tâm nhất để cho em làmxong dé tài luận văn này, đối với em thầy như là một người thầy, cũng là một người
cha thứ hai của em đã định hướng cho em đường đi rõ ràng nhất để em hoàn thành
luận văn này.
Trong suốt hành trình làm luận văn, em gặp rất nhiều khó khăn trong việc hoàn
thành để tài của mình, nhưng em vẫn luôn có gắng hết sức mình để không phụ lòng
thầy cô và đặc biệt là thầy Thuân đã dành cho học viên như em
Em cũng xin cám ơn nhà trường, thầy cô trong trường nói chung đã dạy cho
em bao điều hay, thêm nhiều kiến thức mới và người thầy hướng dẫn em là PGS.TSNguyễn Đình Thuân nói riêng đã nhiệt tình, bằng sự chỉ dẫn tận tâm của một ngườithầy mà em đã hoàn thành xong đề tài, tuy còn nhiều điểm sai sót, mong thầy cô và
Ban Giám Hiệu nhà trường tha thứ cho những thiếu sót của mình Em xin chan thành
cám ơn quý thầy cô trong trường Đại Học Công Nghệ Thông Tin
Tp Hô Chí Minh, ngày tháng năm 2023
Sinh viên thực hiện
Bùi Dương Thủy Tiên
Trang 4Tôi xin cam đoan:
1 Những nội dung trong luận văn nay là do tôi tự tìm hiểu ở các bài báo và thôngtin trên Internet thực hiện đưới sự hướng dẫn của thầy PGS.TS Nguyễn Dinh
Thuân.
2 Mọi tham khảo trong luận văn đều được trích dẫn rõ ràng tên công trình, tên
tác giả, thời gian công bố
Moi sao chép không hợp lệ, vi phạm quy chế dao tạo, tôi xin chịu hoàn toàn trách
Trang 51⁄2 Mục tiêu và phạm vi của luận văn
1.3 Nội dung và phương pháp nghiên cứu
1.4 Lý do chọn đề tài
1.5 - Môi trường và công cụ phát triển
1.6 Kiến trúc dé tài
1.7 Bố cục của luận văn
Chương 2: CƠ SỞ LÝ THUYÉT
2.1 Khái niệm về dự bao.
24.1 Khái niệm.
2.1.2 Tính chất, đặc điểm của dự báo.
2.13 Các phương pháp dự báo
2.2 Lý thuyết chuỗi thời gi
2.2.1 Định nghĩa chuỗi thời gian (Time series) [5]
2.2.2 Các thành phan của chuỗi thời gian
2.3 Mô hình ARIMA (Autoregressive Intergrated Moving Average) [1]
2.3.1 Chuỗi dừng (Stationary Time series) [1]
2.3.2 Mô hình tự hồi quy
2.3.3 Mô hình trung bình trượt[1]
2.3.4 Sai phan [11]
2.3.5 Phuong pháp Box-Jenkins [10][16]:.
2.3.6 Chi số AIC (Akaike Information Crite
Criterion)
2.4 Mạng nơ-ron (Neural Network) và Mang LSTM (Long Short Term Memory)
) và chi số BIC (Bayesian Information
2.4.1 Cơ sở lý thuyết mang nơ-ron [2]
Trang 62.6 Mô hình CNN (Convolutional Neural Network) [3] 129
2.7 Các phương pháp, mô hình được sử dụng để dự báo giá BTC hiện nay 31 2.7.1 Phương pháp thống kê 231
2.7.2 Machine learning, Deep learning 31
2.8 Đánh giá mô hình MAPE, RMSE |26| 32
2.8.1 | MAPE (Mean absolute percentage error) 32
2.8.2 RMSE (Root-mean-square error) 132
2.9 Giới thiệu Grid search [11] 32 2.10 Két chong 34 Chương 3: KET HỢP GRID SEARCH VỚI MÔ HÌNH LSTM, ARIMA, SARIMA, CNN 35
3.1 Giớithiệu 35
3.2 Các nghiên cứu 35
3.3 Cách tiến hành 137 3.3.1 Sơ đồ sử dung Grid Search với các mô hình 137 3.3.2 Các bước thực hiện 39
3.4 Mô hình chung của Grid Search với các mô hình LSTM, ARIMA, SARIMA, CNN
35:
3.5 Két chuong 41
Chương 4: CÀI ĐẶT THƯ VIỆN, THỰC NGHIỆM MÔ HÌNH, ĐÁNH GIÁ KÉT QUÁ
THUC NGHIỆM CAC MÔ HÌNH LSTM, ARIMA, SARIMA, CNN VÀ SỰ KET HỢP CUA
GRID SEARCH VỚI CÁC MÔ HÌNH -°-48
4.1 Giới thiệu Bitcoin 43
4.2 Cài đặt các thư viện cho các mô hình [5] 48
43 Tập dữ liệu giá mớ cửa của Bitcoin 44
4.4 Thực nghiệm dự báo giá Bitcoin 46
4.4.1 Xirly và biến đối dữ liệu [26] 46
4.4.2 _ 47
4.4.3 Kết quả thực nghiệm trong chuỗi thời gian ARIMA (p, d, q) .52
4.4.4 Thực nghiệm mô hình SARIMA
4.4.5 Kết qua thực nghiệm trong chuỗi thời gian SARIMA (p, d, q)(P, D, Q)m 56 4.4.6 Thực nghiệm mô hình LSTM
4.4.7 Thực nghiệm mô hình CNN
4.4.8 Đánh giá các mô hình LSTM, ARIMA và SARIMA và CNN
4.4.9 Kết qua biểu đồ của các mô hình thực nghiệm.
Trang 74.5.3 Thực hiện phương pháp kết hợp giữa Grid Search và SARIMA
4.5.4 Thực hiện phương pháp kết hợp giữa Grid Search và CNN [11].
4.5.5 Đánh gid các phương pháp Grid Search với LSTM, Grid Search với ARIMA, Grid Search với SARIMA và Grid Search với CNN 68
4.5.6 So sánh kết quả thực nghiệm 69 4.6 Kết chương, 71
Chuong 5: KET LUAN VA PHUONG HUONG PHAT TRIEN 2 72
5.1 Cac kết qua dat được .72 5.2 Một số hướng phát triển -.72
TÀI LIEU THAM KHẢO wa 74
Trang 8LSTM Long Short Term Memory Bộ nhớ ngắn hạn dài hạnARIMA "” a | Tự hồi Lông trung
RNN Recurrent Neural Network Mang thần kinh hồi quy
MAPE Mean absolute percentage error Phan tram sai s6 trung
bình tuyệt
Căn bậc hai của s:
RMSE Ry Meas red Error _ bình phương trung bình
DL Deep Learning Học sâu
Gs Grid Search \ i” Tim kiếm lưới
AIC Akaike Information Criterion Tiêu chí thông tin Akaike
ANN | Seen F::: Mạng nơ-ron nhân tạo
AR Autoregressive Tự hồi quy
MA Moving Average Trung bình trượt
Chức năng tự tương quan
PACF Partial Autocorrelation Function `
một phân
CNN Convolutional Neural Network Mang no-ron tich chap
ML Machine learning May hoc
BIC Bayesian Information Criterion Tiéu chi thong tin Bayes
Trang 9Bảng 4.1 Bảng kiểm định tiêu chuẩn của một sé mô hình ARIMA 51
Bang 4.2 Kết quả thực nghiệm của mô hình ARIMA với MAPE và RMSE .52 Bảng 4.3 Bảng kiêm định tiêu chuẩn của một số mô hình SARIMA theo m=12 JS
Bang 4.4 Kết quả thực nghiệm của mô hình SARIMA với m=12 56
Bang 4.5 Kết quả thực nghiệm của các mô hình a |
Bang 4.6 Kết qua thực nghiệm phương pháp giữa các mô hình với Grid Search „.68 Bảng 4.7 So sánh độ lỗi dự báo của các mô hình và phương pháp dự báo giá Bitcoin 69
Trang 10Hình 1.1 Mô hình tông quát của dự báo đồng Bitcoin
Hình 1.2 Mô hình tông quát của dự báo đồng Bitcoin
Hình 1.3 Kiến trúc của đề tài
Hình 2.1 Biểu đồ thé hiện giá Bitcoin theo thời gian
Hình 2.2 Cấu trúc mô hình ARIMA
Hình 2.3 Sai phân bậc l
Hình 2.4 Sơ đồ mô hình LSTM
Hình 2.5 Mô hình tính chập của CNN [3].
Hình 2.6 Sơ đồ của Grid Search được thé hiện trên 110 dong dữ liệu
Hình 3.1 Sơ dé sử dụng Grid Search với các mô hình
Hình 3.2 Kỹ thuật kết hợp Grid Search với các mô hình
Hình 3.3 Mô hình kết hợp với Grid Search
Hình 3.4 Sơ đồ kỹ thuật kết hợp Grid Search v: mô hình trên tập dữ liệu
Hình 4.1 Trang web thị trường đồng tiền Bitcoin
Hình 4.2 Dữ liệu file DataBitcoin.csv được lay từ trang web
Hình 4.3 Nơi download file dữ liệu
Hình 4.4 Biểu đồ hiển thị sai phân bậc 0 của đồng Bitcoin trên mô hình ARIMA.
Hình 4.5 Sơ đồ hiền thi sai phân bậc 1 của bảng dựa vào giá đóng cửa “Adj Close” 48
Hình 4.6 Biểu đồ ACF
Hình 4.7 Biểu đồ PACE
Hình 4.8 Kết quả khi chạy mô hình ARIMA
Hình 4.9 Mô hình dự đoán của ARIMA
Hình 4.10 Kiểm tra thông tin dữ liệu của mô hình SARIMA
Hình 4.1 1 Phạm vi dữ liệu của mô hình SARIMA
Hình 4.12 Kết quả khi chạy mô hình của mô hình SARIMA
Hình 4.13 Sơ đồ hiền thị thông tin dữ liệu của mô hình SARIMA
Hình 4.14 Kết quả mô hình dự đoán SARIMA
Hình 4.15 Dữ liệu được lấy từ Google Drive đưa vào Colab
Hình 4.16 Biểu đồ dự báo giá mở của Bitcoin từ 10-01-2022 đến 10-01-2023
Hình 4.17 Biểu đồ đầu ra của mô hình LSTM
Hình 4.18 Kết quả chạy chương trình của mô hình.
Hình 4.19 Kết quả dự báo của đồng Bitcoin với mô hình LSTM
Trang 11Hình 4.22 Kết quả dự báo giá Bitcoin bằng CNN 61 Hình 4.23 Kết quả dự báo giá Bitcoin băng SARIMA 62 Hình 4.24 Kết qua dự báo giá Bitcoin bằng mô hình LSTM .63 Hình 4.25 Kết qua dự báo giá Bitcoin bằng mô hình ARIMA 263) Hình 4.26 Kết quả dự báo giá Bitcoin bằng mô hình CNN „63 Hình 4.27 Kết quả thực nghiệm đánh giá bằng RMSE sử dụng phương pháp Grid Search
với mô hình LSTM +65
Hình 4.28 Kết quả thực nghiệm đánh giá bằng MAPE sử dụng phương pháp Grid Search
với mô hình LSTM 65
Hình 4.29 Kết quả thực nghiệm đánh giá bằng RMSE sử dung phương pháp Grid Search
với mô hình ARIMA 66
Hình 4.30 Kết quả thực nghiệm đánh giá bing RMSE sử dung phương pháp Grid Search
với mô hình SARIMA 67
Hình 4.31 Kết quả thực nghiệm đánh giá bằng MAPE sử dung phương pháp Grid Search
với mô hình SARIMA 67
Hình 4.32 Kết qua đánh giá khi thực nghiệm mô hình với phương pháp Grid Search với
CNN bằng RMSE 68 Hình 4.33 Kết quả đánh giá khi thực nghiệm mô hình vi
CNN bằng MAPE
phương pháp Grid Search với
68
Trang 12Đồng tiền Bitcoin được ra đời vào năm 2009 do Satoshi Nakamoto! là người sáng lập
ra, để sử dụng đồng tiền mã hóa trên Internet Đồng tiền Bitcoin (BTC) là loại tiềnđiện tử rất được quan tâm và sử dụng trong một số lĩnh vực như tài chính, chứngkhoán Năm 2021 là năm của những đợt biến động bat ôn đối với đồng BTC, thi
trường đồng tiền này luôn dao động không ngừng, Việt Nam cũng nằm trong số đó
Trong các bài toán về dự báo, con người càng quan tâm nhiều đến dự báo về dữ liệuchuỗi thời gian như dự báo về giá vàng, tiền điện tử vì chúng mang nhiều lợi íchcho con người, trong số đó thì đồng tiền mã hóa Bitcoin luôn là sự quan tâm nhiềucủa các nhà đầu tư
Dự báo chuỗi thời gian là việc sử dụng các mô hình để dự đoán sự kiện theo thời giandựa vào dữ liệu đã biết trong quá khứ để dự đoán sự kiện trong tương lai
Trong đề tài này được áp dụng các mô hình trong dự báo là LSTM, chuỗi thời gianARIMA, SARIMA, CNN và sự kết hợp của Grid Search đối với từng mô hình đề
đánh giá, lựa chọn xem mô hình nào dự báo có độ chính xác hơn dựa vào dữ liệu lịch
sử của Bitcoin, kết quả mang lại nhiều triển vọng và khả quan hơn
Dữ liệu thực nghiệm: Dữ liệu lịch sử giá Bitcoin được tính từ ngày 10-01-2022 đến
ngày 10-01-2023 bao gồm các thông tin: ngày giao dịch, giá mở bán, giá cao nhất,giá thấp nhát, khối lượng, vốn thị trường được lấy từ trang https://finance.yahoo.com/
Trang 13Chương 1: TONG QUAN1.1 Đặt vấn đề
Dự báo trên thị trường hiện nay, ngày càng được quan tâm và được thực hiện ở khá
nhiều lĩnh vực, liên quan đến tài chính, tiền tệ mà chú trọng nhiều hơn trong đó cótiền điện tử, đồng tiền mã hóa này luôn thay đổi theo thời gian, việc đưa ra mộtphương pháp dự báo hiệu quả sẽ mang lại nhiều lợi ích như giúp tiết kiệm được chỉphí, hạn chế rủi ro, tối ưu hóa lợi nhuận, dẫn đến việc dự báo đồng tiền này đang là
hoảng tài chính có thé ảnh hưởng đến giá Bitcoin
¢ Sw liên kết giữa đồng Bitcoin và các thị trường tài chính khác, chăng hạn như
thị trường chứng khoán cũng ảnh hưởng dén giá Bitcoin
e _ Thời gian mô hình học: là một yếu tố quan trọng, nếu thời gian học không đủ
hoặc quá dài, có thê dẫn đến mô hình không chính xác
¢ Dir liệu đầu vào: nếu không chính xác hoặc đầy đủ, mô hình dự báo có thé
không chính xác.
e Phạm vi dữ liệu: Số lượng và chất lượng dữ liệu sẽ ảnh hưởng đến mô hình dự
báo giá Bitcoin.
¢ Phuong pháp dự báo: phổ biến như hiện nay bao gồm dữ báo chuỗi thời gian
Trang 14e _ Dự đoán đồng Bitcoin trong tương lai diễn ra như thé nào dựa vào dữ
liệu lịch sử từ dữ liệu được thu thập trên trang web?
Sử dụng các phương pháp nao trong việc dự đoán đồng Bitcoin để cải
thiện hiệu quả cao hơn?
e _ Đánh giá các mô hình trong việc dự đoán đồng Bitcoin như thế nào để
tìm phương pháp nào có độ chính xác hơn?
° Tối ưu hóa các siêu tham số bằng Grid Search kết hợp với các mô hình
trên dé đánh giá xem phương pháp nào mang lại kết quả khả quan hơn chuẩnthấp nhất ra sao?
Những câu hỏi được đặt ra trong đề tài này tìm ra mục tiêu và hướng giải quyết, đưa
ra các phương pháp dự báo đề tìm phương pháp nào có kết quả khả quan hơn mang
lại hiệu quả hơn.
1.2 Mục tiêu và phạm vi của luận văn
Mục tiêu trong đề tài này là nghiên cứu, thực nghiệm các mô hình liên quan chuỗithời gian cho các bài toán dự báo, mục đích nâng cao độ chính xác dự báo Luận văn
đưa ra mục tiêu và phạm vi thực hiện như sau:
° Nghiên cứu và thực hiện các mô hình về dự báo chuỗi thời gian ARIMA
và mô hình SARIMA đề thực hiện các dự báo ngắn hạn
e _ Nghiên cứu và thực hiện mô hình LSTM xử lý vấn đề phụ thuộc dài
hạn.
« _ Nghiên cứu và thực hiện mô hình CNN giúp xây dựng những thuật toán
với độ chính xác cao hơn.
e Thực hiện và đánh giá các mô hình LSTM, ARIMA, SARIMA, CNN
với sự phân chia 2 tập huấn luyện và tập thử nghiệm
e Nghiên cứu sự tối ưu hóa các siêu tham số bằng Grid Search kết hợp
với các mô hình trên để dự báo độ chính xác hơn về sự thay đổi của đồng
Bitcoin.
Đề xuất được phương pháp dự báo phù hợp dé dự báo giá Bitcoin
Trang 151.3 Nội dung và phương pháp nghiên cứu
Thực hiện các mô hình LSTM, ARIMA, SARIMA, CNN về dự báo đồng Bitcoin dựa
vào tập dữ liệu lịch sử.
Tiếp theo là đánh giá các mô hình trên, sau đó tìm kiếm tham số tối ưu của Grid
Search khi kết hợp với các mô hình đề đưa ra độ chính xác hơn giữa các phương pháp
đó.
Phương pháp nghiên cứu:
Mô tả tổng quát bài toán:
Kết hợp
các mô u hóa Grid Search
hình: LSTM các siêu với các mô Dự báo
Thu thập ARIMA,~ tham số hình: LSTM, giá
Hình 1.1 Mô hình tổng quát của dự báo đồng Bitcoin
e _ Bước 1: Thu thập và xử lý dữ liệu, phân chia làm 2 tập là tập huấn luyện
và tập thử nghiệm.
Bước 2: Thực hiện và xây dựng về các mô hình LSTM, ARIMA,SARIMA, CNN.
© _ Bước 3: Tìm hiểu về Grid Search
e _ Bước 4: Tối ưu hóa các siêu tham số bằng Grid Search khi kết hợp với
các mô hình trên để đánh giá chung
¢ — Bước 5: Tiến hành chạy các phương pháp dự báo trên tập thử nghiệm,
so sánh các mô hình thông qua MAPE, RMSE, tìm ra các thông số để so sánh
độ chính xác giữa các mô hình, chọn ra phương pháp nào chính xác hơn cho.
dự đoán giá Bitcoin.
1.4 Lý do chọn đề tài
Với thị trường đồng Bitcoin luôn biến động trong những thời gian gần đây, trong đó
Trang 16có giá trị kinh tế, tối ưu hóa lợi nhuận Việc áp dụng các mô hình được đánh giá khi
sử dụng có kết hợp Grid Search cho thấy kết quả có độ lỗi ít hơn so với các mô hình
kết hợp hay mô hình riêng lẻ khác trong dự báo đồng Bitcoin, trong dé tài sử dungphương pháp này đề thực hiện, muốn nâng cao độ chính xác hơn và cho thấy kết qua
dự báo khả quan hơn dựa vào đánh giá RMSE, MAPE.
Vì trong Grid Search tìm kiếm độ tôi ưu của các siêu tham số khi kết hợp với bốn mô
hình cho ra các phương pháp mới là Grid Search-ARIMA, Grid Search-SARIMA,
Grid Search-LSTM, Grid Search-CNN có kết quả khả quan hơn, với độ lỗi ít hơn sovới các phương pháp khác Đây cũng là điểm mau chốt trong dé tài này, dé so sánhđánh giá từng mô hình với sự kết hợp này, tìm ra độ chính xác hơn cho dự báo đồng
Bitcoin.
Đề tài của học viên sử dụng mô hình LSTM, ARIMA, SARIMA, CNN và sự kết hợpcủa Grid Search với các mô hình trên dé dự đoán những ngày tiếp theo của đồngBitcoin dựa vào dữ liệu lịch sử từ ngày 10-01-2022 đến ngày 10-01-2023
1.5 Môi trường và công cụ phát triển
Các thử nghiệm trong luận văn được thực hiện trên máy tính có cấu hình như sau:
© — CPU: Intel(R) Core (TM) i3-8100 CPU @ 3.60GHz 3.60 GHz
Trang 17Grid LSTM
Grid
Search-ARIMA
RMSE
Grid SARIMA
Search-Hình 1.6 Kiến trúc của dé tài
Trang 18Để nghiên cứu dự báo về đồng Bitcoin đều được quan tâm là dữ liệu được thu thập
trên trang https://finance.yahoo.com/ với chuỗi thời gian hiện hành.
Tìm kiếm các siêu tham số để tối ưu hóa bằng Grid Search kết hợp với các mô hìnhLSTM, ARIMA, SARIMA, CNN đề đánh giá chuẩn và tối ưu hơn, dat được kết quảkhả quan hơn Trong đề tài này đã sử dụng các phương pháp trên dé tìm ra độ hiệuquả cao, mang lại nhiều triển vọng hơn cho bài toán về dự báo đồng Bitcoin
1.7 Bố cục của luận văn
Bô cục của luận văn gôm các chương sau:
e _ Chương 1 Tổng quan: giới thiệu dé tài, mục tiêu, phạm vi của luận
văn, nội dung, phương pháp nghiên cứu, lý do chọn dé tài, môi trường pháttriển đề tài
° Chương 2 Cơ sở lý thuyết: khái niệm về dự báo, lý thuyết về chuỗi
thời gian ARIMA, SARIMA, LSTM và mô hình CNN, các phương pháp sử
dụng dự báo giá BTC hiện nay, đánh giá mô hình bằng MAPE, RMSE, giới
thiệu Grid Search.
° Chương 3 Kết hợp Grid Search với các mô hình LSTM, ARIMA,SARIMA, CNN: ý tưởng, các bước tiền hành, sơ đồ chung của mô hình có
sử dụng Grid Search.
Chương 4 Cài đặt thư viện và thực nghiệm các mô hình: giới thiệu
Bitcoin, thực nghiệm dự báo giá Bitcoin với các mô hình Thực nghiệm
phương pháp sử dụng Grid Search với các mô hình.
° Chương 5: Đánh giá thực nghiệm các mô hình và phương pháp sử
dụng Grid Search với các mô hình trên: kết quả thực nghiệm mô hìnhchuỗi thời gian ARIMA, SARIMA, đánh giá các mô hình và kết quả đánh
giá của các mô hình có sử dụng Grid Search.
Chương 6 Kết luận và hướng phát triển
Tài liệu tham khảo
Trang 19Chương 2: CƠ SỞ LÝ THUYET2.1 Khai niệm về dự báo
2.1.1 Khái niệm
Dự báo là quá trình nghiên cứu dựa vào dữ liệu lịch sử để dự báo sự kiện trước khixảy ra trong tương lai được sử dụng dự báo trong nhiều lĩnh vực nói chung và đồngtiền mã hóa nói riêng
2.1.2 Tính chất, đặc điểm của dự báo
Trong phần dự báo luôn tổn tại ở hai mặt: tính chính xác và tính không chính xác(tính tương đối) Do trong phần dự báo luôn có các điểm không rõ hay gọi là điểm
mù tức là cái không chính xác hoàn toàn xảy ra trong tương lai.
2.1.3 Các phương pháp dự báo.
Trong nhiều lĩnh vực nói chung như hiện nay việc dự báo cũng là một phần quan
trọng để biết được dự báo thời gian tiếp theo Trong đề tài này nói về đồng tiền mãhóa Bitcoin nói riêng, việc dự báo trước một sự việc xảy ra trong tương lai đó là một thách thức Dự báo là nghệ thuật tiên đoán sự việc sẽ xảy ra trong tương lai, dự báođược diễn ra dựa trên dữ liệu lịch sử mà thu thập được, đê dự đoán những diễn biến
của đồng Bitcoin thay đôi trong thời gian sắp tới
Căn cứ vào dự báo có những phương pháp sau [5]:
© Dự báo ngắn hạn: là dự báo thường trong thời gian ngắn
© — Dự báo trung hạn: là dự báo thường từ 3 tháng đến 3 năm
° Dự báo dài hạn: là dự báo từ 3 năm trở lên.
Dựa vào phương pháp dự báo còn có các phương pháp dự báo [5]:
© Phương pháp dự báo định tính: dự báo dựa vào thông kê số liệu, kinh
nghiệm, suy luận, suy đoán trong việc sử dụng đồng tiền mã hóa này Đây là
phương pháp dễ thực hiện, chỉ phí thấp, ước tính xác suất một cách chủ quan
của các chuyên gia trong lĩnh vực nghiên cứu.
Phuong pháp dự báo định lượng: dựa trên cơ sở toán học, thống kê, dé
dự báo thời gian tiếp theo theo dãy số thời gian
Trang 20Trong đề tài này, việc dự báo được sử dụng bằng phương pháp định lượng tức là dùng
mô hình, thực nghiệm, tính toán dé đưa ra kết qua dự báo hay nói khác đi là dùng mô
hình hóa để thực hiện việc dự báo đồng BTC
2.2 Lý thuyết chuỗi thời gian
2.2.1 Định nghĩa chuỗi thời gian (Time series) [5]
Chuỗi thời gian được sử dụng trong thống kê, xử lý tín hiệu Trong toán học, dữ liệuchuỗi thời gian là những điểm dữ liệu được đánh giá theo thời gian, được định nghĩa
là một vector x(t), t= 0, 1, 2, với t đại diện cho các điểm thời gian, biến x(t) đượcxem như một biên ngẫu nhiên
Mỗi chuỗi thời gian được gọi là đơn biến nếu tại mỗi điểm dữ liệu chỉ bao gồm mộtbiến duy nhất, nếu tại mỗi điểm gồm nhiều hơn một biến thì gọi là đa biến
Hình 2.1 Biểu đồ thé hiện giá Bitcoin theo thời gian
Nguồn: Dữ liệu giá Bitcoin thu thập trên https://finance.yahoo.com/ được lấy từ
10-01-2022 đền 10-01-2023
Theo biểu đồ chuỗi thời gian được biéu diễn giá trị ở trục tung và biéu diễn thời gian
là ở trục hoành Quan sát biểu đồ thể hiện liền mạch nhau, theo quá trình tăng - giảm
do ảnh hưởng theo thời gian được thay đổi liên tục
Trong dự báo chuỗi thời gian có hai loại chính:
e _ Chuỗi thời gian thông thường: gọi là số liệu
Ù Chuỗi thời gian bất thường: là những sự kiện
Trang 21Trong dự báo đê xây dựng một mô hình có 2 kiêu dữ liệu chính sau:
° Dữ liệu có cấu trúc: là dữ liệu được tô chức thành dạng bảng, ở mỗi
trường được định dạng số, chuỗi ký tự hoặc thời gian
° Dữ liệu phi cấu trúc: được thê hiện dưới đạng dữ liệu thô chưa qua xử
lý, các dữ liệu dạng key: value Dữ liệu này có thé lưu trữ nhiều loại trường
dữ liệu hơn, tốc độ truy vấn và xử lý nhanh hơn so với đữ liệu có cấu trúc.Mội số ví dụ về chuỗi thời gian:
© _ Chuỗi thời gian về sự thay đổi của giá vàng, giá Bitcoin.
e _ Chuỗi thời gian về chất lượng không khí trong các Thành phố lớn qua
từng ngày.
Chuỗi thời gian về chuyên biến của mật nước ngập mặn ở các tỉnh miền
Tây.
Chuỗi thời gian về diễn biến số người bệnh của dịch COVID
2.2.2 Các thành phần của chuỗi thời gian
Do dữ liệu có tính chất thời gian nên thông thường một chuỗi thời gian gồm 3 quyluật đặc trưng [8]:
Tinh xu hướng (trend); xảy ra khi có một sự gia tăng dài hạn của dữ
liệu.
© — Tính thời vụ (seasonal): xảy ra sự biên động lặp lại tuần hoàn khi tồntại ảnh hưởng bởi yếu tố mùa vụ
° Tính chu ki (cyclic): xảy ra trong một khoảng thời gian có định và mang
tính chất tuần hoàn, tồn tại khi có sự tăng — giảm lặp lại trong một giai đoạnnhưng không cố định Nhưng nhìn chung sự thay đồi của tính chu kì mạnhhơn so với tính thời vụ, vì tính chu kì thường lặp ít nhất sau khoảng thời gian
2 năm.
Ngoài 3 thành phần chính trên còn có thành phần mang tính ngẫu nhiên: những điềuxảy ra một cách ngẫu nhiên không biết trước được trong quá trình thu thập dữ liệuhay do động đất, thiên tai
Trang 222.3 Mô hình ARIMA (Autoregressive Intergrated Moving Average) [1]
Mô hình ARIMA là mô hình biểu diễn phương trình hồi qui tuyến tinh đa biến của
các biến đầu vào (còn gọi là biến phụ thuộc trong thống kê)
Mô hình ARIMA được nghiên cứu và phát hiện bởi hai nhà nghiên cứu [6] là George
Box? va Gwilym Jenkins3 Vì thế, loại mô hình này còn được biết đến với tên gọi là
Hình 2.2 Cấu trúc mô hình ARIMA
? https://en.wikipedia.org/wiki/George_E._P._Box
Trang 232.3.1 Chuỗi dừng (Stationary Time series) [1]
Chuỗi dừng là chuỗi thời gian không bao hàm các yếu tố xu thé ma có các giá trị détính giá trị trung bình của chuỗi, đảm bảo tính dừng của chuỗi dữ liệu
Trong mô hình ARIMA có thành phan d khác 0, tức là ARIMA có biến đồi sai phân.Quá trình biến đổi này là quá trình đưa một chuỗi không dừng thành chuỗi thời gian
dừng.
2.3.2 Mô hình tự hồi quy
Trong mô hình chuỗi thời gian ARIMA (p, d, q) gồm có những chỉ tiết mà cần tìmhiểu thêm [1]:
© —— Auto regression (AR): là thành phần tự hồi qui bao gồm độ trễ của biến
hiện tại Độ trễ bậc p chính là giá trị lài về quá khứ p bước thời gian của
chuỗi, tức là sử dụng các giá trị chuỗi thời gian tĩnh tùy thuộc vào các giá trị
trước đó Độ trễ dài hoặc ngắn trong quá trình AR phụ thuộc vào tham số
trễ p Cụ thê, quá trình AR(p) của chuỗi x: được biéu diễn như bên dưới [11]:
Xe =c+ Lor ÕiX¿~p + 6i (2.1)
2.3.3 Mô hình trung bình trượt [1]
Moving average (MA): được viết dưới dạng kết hợp tuyến tính, được hiểu là quá trìnhdịch chuyển hoặc thay đổi giá trị trung bình của chuỗi thời gian (tức là viết dưới dạngtuyến tính của các sai số về mặt thời gian), q là số lần quan sát trước đó Mối quan hệ
giữa các giá trị chuỗi thời gian trong mô hình này được xây dựng [11]:
Trang 24giảm theo thời gian Khi biến đổi sang chuỗi dừng, các nhân tố ảnh hưởng thời gian
được loại bỏ và chuỗi sẽ dễ dự báo hơn Đề tạo thành chuỗi dừng, một phương pháp
đơn giản nhất là sẽ lấy sai phân Bậc của sai phân tạo thành chuỗi dừng còn gọi là bậccủa quá trình đồng tích hợp (order of intergration) hay nói cách khác là lấy chuỗi thời
gian có giá trị trung bình không đổi, phương sai và tự tương quan Qúa trình sai phânbậc d của chuỗi được thực hiện như sau [1]:
Sai phân bậc 1: 1(1) = Ă%¿) = Xt —X¿;~¡ (2.3)
Sai phân bậc d: 1(d) = A¢(x,) = ĂẶ Ăx;))) (2.4)
d times
Thông thường chuỗi sé dừng sau quá trình đồng tích hợp I(0) hoặc I(1), rất ít chuỗi
chúng ta phải lấy tới sai phân bậc 2 Một số trường hợp chúng ta sẽ cần biến đồilogarit hoặc căn bậc 2 dé tạo thành chuỗi dừng Phương trình hồi qui ARIMA (p, d,q) có thể được biéu diễn dưới dạng:
Ax, = Ú1Ax,-¡ + 02Ax,_; + + DyAXpp + A Ec-1 + Øy€ TS; H+ OgEr—q
Hinh 2.3 Sai phan bac 1
Như vay, phương pháp sử dụng ARIMA là 2 quá trình tự hôi qui va trung bình trượt,dựa vào dữ liệu lich sử dé dự báo dữ liệu trong thời gian tiếp theọ Bởi vay, dùng tap
Trang 25huấn luyện mô hình thì cần chuyển hóa chuỗi sang chuỗi dừng bằng cách lấy sai phân
bậc 1 hay logarit, lựa chon mô hình có sai số dự báo là nhỏ hơn
2.3.5 Phương pháp Box-Jenkins [10][16]:
Phương pháp Box-Jenkins bao gồm 4 bước chung như sau: nhận dạng, ước lượng,
kiêm định và dự báo mô hình.
(1) Nhận dang (identification) và lựa chọn mô hình
© _ Tìm các giá trị thích hợp của p, d và q bằng biểu đồ, lay sai phân bậc 1hoặc sai phân bậc 2, qua phân tích chiều hướng biến đổi của hàm tự tương
quan ACF hoặc ham tự tương quan riêng PACF.
° Hàm tự tương quan (ACF — AutoCorrelation Function): Chỉ số đo
lường hệ số tương quan như ACF, tìm ra độ trễ của trung bình trượt
e _ Hàm tự tương quan riêng phần (PACF - Partitformial AutoCorrelation
Function): có sự khác biệt đó là hệ số tương quan này loại bỏ ảnh hưởng của
các chuỗi độ trễ trung gian.
(2) Ước lượng mô hình:
° Sau khi nhận dạng các giá trị thích hợp của p và q, ước lượng tham sốcủa các só hạng tự hồi quy và trung bình trượt trong mô hình Việc ước lượngnày có thể là tuyến tính hoặc phi tuyến tính
(3) Kiểm định mô hình
e _ Xem xét mô hình đã xây dựng có phủ hợp với tập dữ liệu hay không,
nếu phù hợp thì mô hình có thể chấp nhận, nếu không thì phải quay lại bước
nhận đạng mô hình, ước lượng mô hình đến khi nào mô hình chấp nhận được,
vì phương pháp Box-Jenkins là một phương pháp lặp.
€,= X, — Ấy (2.6)Với & là phan dư, X, là giá tri thực tế, X; là giá tri dự báo
(4) Dự báo (forecasting)
e _ Khi mô hình được kiểm chứng phù hợp với đữ liệu chuẩn đoán, tiếp
theo là thực hiện dự báo điểm và dự báo khoảng tin cậy Một trong số các lý
Trang 26do về tính phổ biến của phương pháp lặp mô hình ARIMA thành công trong
cụ ước tính lỗi dự báo và do đó đánh giá chất lượng tương đối của các mô hình thống
ập hợp dữ liệu nhất định, AIC và BIC được hình thành dựa trên lý thuyết
thông tin, mô hình mắt càng ít thông tin thì chất lượng của mô hình đó càng cao AIC,
BIC được định nghĩa như sau [1]:
AIC = —2log(L) + 2(p+q+k+1) (2.7)
Tom lại rằng giá trị của AIC, BIC càng nhỏ thì mô hình của chúng ta càng phù hợp
BIC = AIC + [log(T) — 2](p +q +k+1) (2.8)
2.4, Mạng no-ron (Neural Network) và Mang LSTM (Long Short Term
nút Trong thực tế, nhiều mạng nơ-ron là các công cụ mô hình hóa dữ liệu thống kê
phi tuyến, có thé được dùng dé mô hình hóa các mối quan hệ phức tạp giữa dữ liệu
vào và kết quả để tìm kiếm trong dữ liệu Mạng nơ-ron là một mô hình kết hợp với
mạng nơ-ron thần kinh và kĩ thuật học sâu, nó trở thành công cụ mạnh mẽ được sử
dụng trong những bài toán như nhận dạng ảnh, giọng nói và xử lý ngôn ngữ tự nhiên.
2.4.1.2 Mang no-ron [15]
Mang nơ-ron chủ yếu được sử dụng trong các ứng dụng dit liệu tuần tự
Mạng nơ-ron có ba loại lớp cơ bản:
Trang 27e _ Lớp đầu vào (Input Layer): số lượng tế bào thần kinh tương đương với
số lượng kết hợp các tính năng trong dữ liệu
Lớp ân (Hidden Layer): là lớp được che giấu dựa trên mô hình và kích
thước dữ liệu, mỗi lớp ấn có thé có nhiều tế bào thần kinh
e _ Lớp dau ra (Output Layer): kết quả đầu ra của mô hình, nhưng giữa lớp
dau vào và dau ra của mạng nơ-ron là độc lập với nhau.
2.4.2 Mạng LSTM
2.4.2.1 Mạng LSTM [14]
LSTM cung cấp các kết nối phản hồi bên cạnh việc truyền tải trực tiếp, được xây
dựng như thuật toán học tập tự giám sát, có thé học từ các input đầu vào tuần tự trước
đó LSTM có thẻ giữ lại và lưu trữ thông tin trên các chuỗi dữ liệu lớn, có khả năngghi nhớ các mẫu trong quá khứ nên hiệu quả tốt trong việc dự báo
LSTM là một loại mạng thần kinh hồi quy (RNN) [17], dùng để xử lý vấn đề phụ
thuộc dài hạn của RNN, trong khi đó RNN không thê đoán trước từ được lưu trữ trong.
đài hạn Tuy nhiên, bộ nhớ có thể dự đoán chính xác hơn từ dữ liệu mới
LSTM có thé lưu trữ dữ liệu trong một khoảng thời gian dài, nó cung cap các kết nồiphản hồi từ các input đầu vào tuần tự trước đó
LSTM được sử dụng để phân loại và dự đoán dựa trên thông tin chuỗi thời gian.LSTM có cấu trúc chứa bốn mạng nơ-ron và các bộ nhớ được gọi là ô Ô chịu tráchnhiệm lưu trữ thông tin, trong khi đó cổng chịu trách nhiệm về các thao tác của bộ
nhớ Trong đó, cổng quên đảm bảo thông tin không còn hữu ích đã xóa đi, cổng đầu
vào bồ sung thông tin hữu ích vào 6 Công đầu ra được sử dụng dé trích xuất thong
tin hữu ích từ ô.
Trang 28Hình 2.4 Sơ đồ mô hình LSTM
Nguồn: Sơ đô được thu thập từ trang https:/nttuan8.com
LSTM có thể xử lý dữ liệu một cách tuần tự và giữ trạng thái ẩn theo thời gian
Như trong phan giới thiệu theo sơ đồ của mô hình:
Phan dau ra là cr, ht gọi c là trạng thái 6 và h gọi là trạng thái an
Phan đầu vào: cv, het, x75 trong đó x: gọi là đầu vào ở trạng thái thứ t của môhình; c.1, he gọi là dau ra của lớp trước, h đóng vai trò khá giống như s ở RNN, trong
khi e là điêm mới của LSTM.
Va bên cạnh đó f, tương ứng với cổng quên, i: tương ứng với công nhập, o, tương ứngvới công xuất
Cổng quên: có nhiệm vụ loại bỏ những thông tin không cần thiết
f= ø (Ur * xt + We * her + bự) (2.7)
Céng đầu vào: có nhiệm vụ chọn lọc những thông tin cần thiết nào được thêm
vào trạng thái ô.
ip = 0 (Ui * xí + Wi * be + bị ) (2.8)
Trang 29Cổng đầu ra: có nhiệm vụ xác định những thông tin nào từ trang thái ô được
sử dụng như đầu ra
oi = (Uo #* x + Wo * het + bọ ) (2.9)
Thông qua biểu thức có nhận xét như sau:
bị, bị, bọ là các hệ số bias
Hệ số W, U giống như trong mạng RNN
t = tanh (Uz * x + We * hei + be) giống như tính s trong RNN (2.10)
Cổng quên quyết định cần lấy bao nhiêu từ trang thái 6 trước và công nhập sẽ
quyết định lấy bao nhiêu từ đầu vào của trạng thái và lớp ẩn của lớp trước Với biểu
thức sau:
œ=f*ceái+ii* ết (2.11)
Cổng đầu ra quyết định xem cần lấy bao nhiêu từ trang thái 6 dé trở thành đầu
ra của trạng thái ân, với biểu thức sau:
hy = O; * tanh (c) (2.12)
Nhận xét: qua mô hình LSTM thông tin nào can quan trọng và dùng đến sau sẽ đượclưu vào và dùng khi cần, do đó có thể mang thông tin đi từ xa được gọi là ghi nhớ dàihạn Bên cạnh đó thì h khá giống với mô hình RNN, có ghi nhớ ngắn hạn Do vậy,LSTM có cả ghi nhớ dài hạn và ghi nhớ ngắn hạn
Nhu vậy, các mô hình mạng nơ-ron sâu mới nhất được áp dụng dé phát triển các mô
hình cho nhiều đầu vào và nhiều đầu ra dựa trên LSTM Tuy nhiên, các dự đoán thị
trường thời gian thực chính xác vẫn chưa đạt được do tính chất biến động của thị
trường tài chính, các công cụ xác định khác nhau ảnh hưởng đến giá Bitcoin
Những điểm khác biệt giữa RNN và LSTM [15][12]
RNN
Độ dài khoảng trông mở rộng RNN LSTM có thể giữ lại dữ liệu trong mộtkhông cung cấp hiệu suất hiệu quả khoảng thời gian dài
Trang 30Ứng dụng sử dụng dữ liệu tuần tự Cung cấp các kết nỗi phan hồi, học từ
các input đầu vào tuần tự trước đó
2.5 Mô hình SARIMA (Seasonal Autoregressive Intergrated Moving
Average) [1]
SARIMA đó là mô hình ARIMA mở rộng Nói về SARIMA cũng giống như ARIMAnhưng được điều chỉnh đặc biệt để áp dụng cho những chuỗi thời gian đơn biến cóyếu tố mùa vụ Trong mô hình ARIMA thì không giải thích tốt chuỗi thời gian trongtrường hợp chuỗi xuất hiện yếu tố mùa vụ
Mô hình SARIMA trong ứng dụng dự báo đồng Bitcoin tính theo thời gian dựa vào
dữ liệu lịch sử để dự đoán thời gian tiếp theo xem đồng Bitcoin tăng hay giảm, từ đó
phân tích chuỗi thời gian một cách chính xác, mang lại hiệu quả khả quan hơn.
Để dự báo chuỗi thời gian [5] với đữ liệu đơn biến có chứa các xu hướng và tính thời
q: Thứ tự đường trung bình xu hướng.
Ngoài ra, có bồn yếu tô theo mùa không phải là một phan của ARIMA phải được địnhcấu hình:
P: Lệnh tự phục hồi theo mùa
D: Thứ tự chênh lệch thời gian.
Q: Thứ tự đường trung bình trượt theo mùa.
m: Số bước thời gian trong một khoáng thời gian theo mùa
Với các mô hình LSTM, ARIMA, SARIMA, CNN về việc dự báo chuỗi thời giantrong hệ thống đồng tiền mã hóa BTC, nhận xét chung việc đánh giá bằng MAPE,
RMSE cho từng mô hình sẽ thu được độ khả quan hơn của từng mô hình và đánh giá
để so sánh các mô hình lại với nhau Ta dùng thêm Grid Search kết hợp với các mô
Trang 31ch chuẩn (RMSE)của từng mô hình, kết quả đạt được nhiều triển vọng hơn so với từng mô hình riênghình trên dé đưa ra mức độ chính xác hơn thông qua đánh giá độ
lẻ.
Tir việc phân chia thành hai bộ dữ liệu như ở phần thử nghiệm từng mô hình đơn, dựavào những dữ liệu huấn luyện đề dự đoán dựa trên bộ dữ liệu thử nghiệm, định ra môhình nào có độ chính xác hơn, định hướng được xem trong thời gian gần đồng BTCbiến động ra sao
2.6 Mô hình CNN (Convolutional Neural Network) [3]
CNN gọi là mạng kết nối day đủ hay gọi là mạng toàn ven, mô hình này được xử lý
tín hiệu số nhằm biến đồi thông tin đầu vào thông qua một phép tích chập với bộ lọc
để trả về đầu ra là một tín hiệu mới Tín hiệu này sẽ làm giảm những đặc trưng mà
bộ lọc không quan tâm và chỉ giữ những đặc trưng chính.
Tích chập thông dụng hiện hay là tích chập 2 chiều áp dụng trên ma trận đầu vào và
Trang 32ore (2.16)
W2=
Tương tự như chiều cao H như sau:
H2= —— +1 (2.17)
Trong mô hình CNN có hai yếu tố là tính bắt biến và tính kết hợp
e _ Tính bat biến: là thông tin không thay đổi.
© Tính kết hợp: các cấp độ biều diễn thông tin từ mức độ thấp đến mức
độ cao và trừu tượng hơn thông qua tích chập từ các bộ lọc.
Trong cấu trúc mô hình CNN thường có ba thành phan chính:
° Trường cục bộ: lớp nay tách lọc dit liệu lựa chọn giá trị sử dụng cao
nhất
° Trọng số chia sẻ: lớp này làm giảm tối đa lượng tham số.
e Lớp tổng hợp: tác dụng làm đơn giản các thông tin dau ra, bớt các thôngtin không cần thiết để cho kết quả như mong muốn
Trang 332.7 Các phương pháp, mô hình được sử dụng dé dự báo giá BTC hiện nay
Theo nghiên cứu [9] tác giả Marzieh Rostami được sử dụng trong việc dự đoán đồng
Bitcoin, được sử dụng phương pháp máy học, trong bài báo này sử dụng phương pháp
Box-Jenkins, tự phục hồi (AR), trung bình trượt (MA), ARIMA, chức năng tự tươngquan (ACF), chức năng tự tương quan một phần (PACF) và dùng thuật toán tìm kiếmlưới để dự đoán giá Bitcoin và thực hiện việc đánh giá về các mô hình, lỗi dự báo(FE), lỗi dự báo trung bình (MFE), lỗi tuyệt đối trung bình (MAE), lỗi bình phương(MSE), lỗi bình phương trung bình góc (RMSE) và cho thay rằng kết quả nghiên cứucho thấy rằng độ chính xác trong bài báo này đạt 66% và 65.3%
Nhóm tác giả [8] K.E AruKumar, Dinesh V Kalaga, Ch Mohan Sai Kumar, Govinda Chilkoor, Masahiro Kawaji, Timothy M Brenza áp dung các mô hình chuỗi thời gian
ARIMA va SARIMA được sử dung, tiêu chí thông tin Akaike (AIC) và tiêu chí thong
tin Bayes (BIC) được sử dung dé đánh giá độ tin cậy của các mô hình, các chỉ số đánh
giá sai số tuyệt đối trung bình (MAE), MSE, độ lệch chuẩn theo phần dư (RMSE) và
lỗi phần trăm trung bình tuyệt đối (MAPE) được sử dụng làm tiêu chí để lựa chọn môhình có kết quả khả quan hơn
Trong [11] của nhóm tác giả Prof Rohini Hanchate, Abhinek Kumar Agarwal, Tushar Kumar, Shivam Raj, Soham Morajkar (2022) dùng mô hình máy học
(machine learning_ML) để dự đoán giá đồng Bitcoin, mô hình LSTM, ARIMA,RNNđược sử dụng, đánh giá mô hình phổ biến là lỗi bình phương (MSE), lỗi bình phươngtrung bình gốc (RMSE), kết qua cũng đạt được khả quan nhất định
2.7.2 Machine learning, Deep learning
Các phương pháp Machine learning được sử dụng trong dự báo hiện nay cũng khá
hiệu quả, được sử dụng trong nhiều lĩnh vực khác nhau Nhóm tác giả [12] Ishaani
Priyadarshini - Chase Cotton áp dụng mô hình LSTM, CNN, mạng nơ-ron sâu, nghiên
Trang 34cứu các thuật toán cơ sở như mạng nơ-ron tích tụ, KNN (K-Nearest Neighbor), mạng
nơ-ron, LSTM-CNN va CNN-LSTM đã được đánh giá bằng cách sử dụng độ chính
xác trên nhiều bộ dữ liệu, kết quả mô hình được dé xuất dựa trên tối ưu hóa siêu thong
số tốt hơn các mô hình cơ sở khác với độ chính xác cao Kết quả cho thấy việc sử
dụng các phương pháp máy học có triển vọng trong việc dự báo ngắn hạn
2.8 Đánh giá mô hình MAPE, RMSE [26]
2.8.1 MAPE (Mean absolute percentage error)
MAPE là phan trăm sai số trung bình tuyệt đối, MAPE là thước do thống kê mức độchính xác của m hông dự báo, đo độ chính xác này theo phần trăm và có thểđược tính là sai số phần trăm tuyệt đối trung bình cho mỗi khoảng thời gian trừ đi các
giá trị thực chia cho các giá trị thực.
MAPE là biện pháp phô biến được sử dụng dé dự báo lỗi và hoạt động tốt hơn nếukhông có cực trị đối với dữ liệu (và không có số không)
MAPE =2 X>¡|( — 8)/0¡| (2.18)
2.8.2 RMSE (Root-mean-square error)
RMSE là lỗi trung bình bình phương, như thước đo độ chính xác, dùng dé so sánhcác lỗi trong việc dự báo của các mô hình khác nhau của tập dữ liệu (như tập huấn
luyện và tập thử nghiệm).
Có độ lệch chuẩn theo phần dư (lỗi dự đoán), đo sự khác biệt giữa các giá trị dự đoán
và giá trị thực tế Nếu RMSE càng nhỏ thì độ sai số càng bé, độ tin cậy của mô hình
ngày càng cao.
RMSE = (2.19)
2.9 Giới thiệu Grid search
Grid Search (GS) [11] là một cách tiép cận tiện lợi, khám phá toàn bộ không gian dữ
liệu bằng cách sử dụng tap con siêu tham số của không gian tìm kiếm cho một thuật
toán đã chọn trong khi tim kiếm ngẫu nhiên chọn giá trị cho tất cả các siêu tham sốmột cách độc lập dựa trên phân bố xác suất của chúng Trên mỗi dong dit liệu có các
Trang 35điểm lựa chọn, mỗi điểm đại diện cho một cấu hình mô hình, và là một vec-tơ có giá
ụ thể cho từng giá trị siêu tham số, được tạo thành một mạng lưới với các bước
nhảy sai số, sau đó tối ưu hóa tìm một vec-tơ mang lại hiệu quả tốt nhất cho mô hình
với độ chính xác tối đa và sai số tối thiểu
Điều chỉnh chính xác có nghĩa là tim thông số tốt nhất cho các thuật toán máy học đểcải thiện kết quả
Lập kế hoạch được tối ưu hóa là một cách thực tế hiệu quả bước có thẻ dẫn đến những.cải tiến đáng chú ý ở đầu ra Các tham số tối ưu có thể được tự động tìm thấy trên
Grid Search.
Trong để tài này dùng Grid Search đê kết hợp với các mô hình LSTM, ARIMA,SARIMA, CNN dự đoán đồng tiền mã hóa Bitcoin bằng cách tìm ra các siêu tham số
trong tìm kiếm ngẫu nhiên, tìm ra những thông số tốt hơn đề đánh giá kết quả một
cách kha quan hơn trên tập thử nghiệm của 110 dòng dữ liệu.
Bước nhảy sai số là 1 |
<7
"`
=
Na, Na
Line 1 Line 2 Line 109 Line 110
Hình 2.6 Sơ đồ của Grid Search được thé hiện trên 110 dòng dữ liệu
Trên tập thử nghiệm với 110 dòng dữ liệu là các điểm, trên mỗi điểm đó là một
vec-tơ có giá trị cụ thê thông qua các bước nhảy sai số trên từng mỗi điểm, các điểm củatừng dòng được liên kết với các điểm của dong kia tạo thành một mô hình lưới chođến dòng cuối cùng trong tập dữ liệu, khi tạo xong chúng sẽ tìm kiếm một cách ngẫunhiên thông qua thuật toán, từ đó sẽ lựa chọn tham số nào có độ sai số thấp hơn dựa
trên Grid Search.
Trang 362.10 Kết chương
Chương này đã trình nay chỉ tiết về khái niệm chung của dự báo, chuỗi thời gian, các
mô hình LSTM, ARIMA, SARIMA, CNN, đánh giá thông qua MAPE, RMSE, giới
thiệu chung về Grid Search, trình bày các phương pháp được áp dụng trong dự báogiá BTC, các mô hình này có những thành công nhất định trong việc dự báo nhưng
cần cải thiện hơn nữa về độ chính xác dự báo Trong chương tiếp theo là sử dụng
phương pháp giữa Grid Search với các mô hình trên giúp nâng cao khả năng dự báo.
Trang 37Chương 3: KET HỢP GRID SEARCH VỚI MÔ HÌNH LSTM, ARIMA,
SARIMA,CNN
Trong dự báo, mỗi mô hình đều có những ưu điểm và nhược điểm riêng Hy vọnggiúp làm tăng độ chính xác của các thuật toán trong dự báo đồng Bitcoin, trong đề tàinày đề xuất sử dụng kết hợp Grid Search với LSTM, ARIMA, SARIMA, CNN giúpđạt được nhiều khả quan hơn, trong chương này việc đề xuất mô hình kết hợp GridSearch với các mô hình riêng lẻ để tìm kiếm tham số tối ưu hơn, chứng minh mô hìnhkết hợp này mang lại kết quả tốt hơn
3.1 Giới thiệu
Do nhu cầu về dự báo giá Bitcoin ngày càng được chú trọng, thực nghiệm các phương
pháp đề lựa chọn mô hình nào cho kết quả khả quan hơn cũng là thách thức Dữ liệu
trong dự báo đồng Bitcoin là dữ liệu chuỗi thời gian thì thường có 2 yếu tổ là cầu trúc
dữ liệu tuyến tính và cấu trúc dữ liệu phi tuyến tính Trong dự báo đồng tiền mã hóanày dữ liệu được dự báo phan tuyến tính của chuỗi thời gian
Sự kết hợp Grid Search với các mô hình chuỗi thời gian, LSTM, CNN Kết quả thực
nghiệm cho thấy các mô hình có sự kết hợp Grid Search có độ lỗi dự báo ít hơn so
với từng mô hình riêng lẻ, mang lại kết quả tốt hơn trong dự báo đồng Bitcoin
3.2 Các nghiên cứu liên quan
Hiện nay có rất nhiều công trình nghiên cứu được áp dụng với nhiều phương phápkhác nhau dé thực hiện việc dự báo giá đồng Bitcoin dựa vào lịch sử dữ liệu như giábán, ngày giao dịch, giá cao nhất, giá tháp nhất Theo tác giả Hari Krishnan Andi
[22] (2021) dùng mô hình LSTM trong việc dự báo giá Bitcoin, tác giả nghiên cứu
dùng những phương pháp máy học khác nhau, nhận thấy mang lại kết quả chuẩn xáchơn khi dùng máy học LSTM, dự đoán mô hình kết quả của năm 2021 đạt 47.780 và
độ chính xác là 98.32% Nhóm tác giả Siddhi Velankar, Sakshi Valecha, Shreya Maji
[23] (2018) dùng phương pháp hồi quy Bayesian bằng cách chia một phan thành ba
bộ dit liệu với các khoảng liên tiếp có kích thước 180s, 360s, 720s, áp dụng phân cụmk-means để truy xuất 100 cụm cho mỗi kích thước, sau đó sử dụng mẫu Entropy dé
thu hẹp những thứ này xuống còn 20 thứ tốt nhất Sử dụng bộ giá thứ hai dé tính trong
số tương ứng được tìm thấy bằng phương pháp hồi huy Bayesian Bộ giá thứ ba được
Trang 38sử dụng dé đánh giá thuật toán, bằng cách chạy cùng một hồi quy Bayesian dé đánh
giá các tính năng và kết hợp các giá đó với trọng số Dùng phương pháp GLM/
Random Forest là xây dựng bộ dữ liệu chuỗi ba lần cho 30, 60 và 120 phút (180, 360,
720 điểm dữ liệu tương ứng), chạy GLM/ Random Forest trên từng chuỗi trong hai
bộ dữ liệu chuỗi thời gian riêng biệt, ta được hai mô hình tuyến tính riêng biệt tương,
ứng cho từng tập dữ liệu nhận thấy kết quả đánh giá khả quan hơn
Theo nghiên cứu [10] tác giả Marzieh Rostami được sử dung trong việc dự đoán đồng
Bitcoin, được sử dụng phương pháp máy học, trong bài báo này sử dụng phương pháp
Box-Jenkins, tự phục hồi (AR), trung bình trượt (MA), ARIMA, chức năng tự tươngquan (ACF), chức năng tự tương quan một phần (PACF) và dùng thuật toán tìm kiếmlưới để dự đoán giá Bitcoin và thực hiện việc đánh giá về các mô hình, lỗi dự báo(FE), lỗi dự báo trung bình (MFE), lỗi tuyệt đôi trung bình (MAE), lỗi bình phương(MSE), lỗi bình phương trung bình gốc (RMSE) và cho thấy rằng kết quả nghiên cứu
có độ chính xác trong bài báo này đạt 66% và 65.3%.
Trong [12] của nhóm tác giả Prof Rohini Hanchate, Abhinek Kumar Agarwal,
Tushar Kumar, Shivam Raj, Soham Morajkar (2022) dùng mô hình máy học để dựđoán giá đồng Bitcoin, mô hình LSTM, ARIMA, RNN được sử dụng, đánh giá môhình phổ biến là lỗi bình phương (MSE), lỗi bình phương trung bình gốc (RMSE)
Nhóm tác giả Ning Xue, Isaac Triguero, Grazziela P Figueredo và Dario Landa-Silva
[24] (2019) đã áp dụng mô hình CNN, LSTM, mô hình kết hợp CNN-LSTM, triển
khai và so sánh hai phương pháp meta heuristics: Particle Swarm Optimization (PSO)
và Differential, DE đề phát triển kiến trúc mạng nơ-ron, nhưng ứng dụng của việc sửdung chúng dé phát triển CNN-LSTM có phan hạn chế, nhưng đây là công trình đầutiên sử dụng các thuật toán tiến hóa (DE) dé tự động phát triển kiến trúc của CNN-LSTM cho dự đoán chuỗi thời gian
Nhóm tác giả Emmanuel Dave, Albert Leonardoa, Marethia Jeanicea, Novita
Hanafiah [25] (2020) áp dụng mô hình ARIMA, LSTM su két hợp mô hình LSTM, đánh giá độ chính xác bằng MAPE, RMSE, kết quả thành công mô hình kết
ARIMA-hợp vượt trội hơn các mô hình độc lập khác, đạt được giá tri MAPE là 7,38%.
Trang 39Nhóm tác giả Behnam Farsi, Manar Amayri, Nizar Bouguila, (Senior Member, leee),
va Ursula Eicker [26] (2021) áp dụng mạng LSTM-CNN song song hoặc PLCNet,
éu suất, RMSE, MAPE và R-binh phương.đánh giá các mô hình đã thử nghiệm với
Kết quả cho thấy các mô hình mạng nơ-ron sâu, đặc biệt là PLCNet, đã cải thiện độ
chính xác từ 83,17% lên 91,18%.
Theo nghiên cứu của nhóm tác giả Kaijian He, Lei Ji, Chi Wai Don Wu, Kwok Fai
Geoffrey Tso [27] (2021) đã áp dụng phương pháp SARIMA, LSTM, CNN, sự kéthợp của mô hình CNN-LSTM, ARIMA-LSTM-CNN được đánh giá bằng MSE,RMSE, kết quả cho thấy hiệu suất của LSTM, CNN kém hơn so với phương pháptruyền thống, CNN được sử dụng để nắm bắt cau trúc dữ liệu phân cấp, trong khiLSTM được sử dụng dé nắm bắt phụ thuộc lâu dài vào dữ liệu, kết quả cung cấp bằng
chứng trong tương lai cho việc sử dụng học sâu và các mô hình khác mà dự báo còn
hạn chế, một phương pháp kết hợp mới lạ SARIMA-LSTM-CNN kết hợp các môhình tuyến tính và phi tuyến khác nhau cung cap kết quả dự báo tốt hơn
3.3 Cách tiến hành
3.3.1 Sơ đồ sử dụng Grid Search với các mô hình
Dữ liệu đầu vào là các giá trị chuỗi thời gian cần được dự báo đã được tiền xử lý thíchhợp cho các mô hình, tức là phải đảm bảo tính dừng trong chuỗi thời gian, tiếp đến là
xử lý dữ liệu bằng sử dụng các mô hình LSTM, ARIMA, SARIMA, CNN thông qua
các giá trị dự báo giá Bitcoin, phần Predicted values phần giá trị được dự báo từ các
mô hình trên, dựa vào các dữ liệu dự đoán để đánh giá độ sai lệch của dự báo, tìm ranhững thông số tốt hơn giữa giá trị dự báo và giá trị được thu thập từ trang web Dữliệu được sử dụng dựa vào tập dữ liệu thử nghiệm để làm nền tảng đánh giá chuẩn
xác khi kết hợp với Grid Search, để dự báo độ sai lệch của mô hình, cho ra các phương
pháp kết hợp Grid Search-ARIMA, Grid Search-SARIMA, Grid Search-LSTM, GridSearch-CNN, tìm ra những giá trị dự đoán lỗi có mức thông số thấp hơn, dựa vàonhững dự báo kết hợp và không kết hợp đề thực thi phần dự báo chung, đánh giá phần
thực nghiệm giữa các mô hình Tìm ra giá trị dự báo tức là đi tìm giá trị dự báo của
các mô hình trừ với giá trị của Grid Search.
Trang 40Time series data
Grid Search + ARIMA
Grid Search + SARIMA
Grid Search + CNN
Predicted error values
Predicted values Predicted values
Intergrated Prediction
Performance Estimation
Hinh 3.1 So dé sir dung Grid Search với các mô hình