1. Trang chủ
  2. » Luận Văn - Báo Cáo

Luận văn thạc sĩ Khoa học máy tính: Dự báo giá đồng tiền mã hóa Bitcoin bằng cách kết hợp phương pháp tìm kiếm lưới, mô hình chuỗi thời gian, LSTM

93 0 0
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 93
Dung lượng 46,07 MB

Nội dung

Trong đề tài này được áp dụng các mô hình trong dự báo là LSTM, chuỗi thời gianARIMA, SARIMA, CNN và sự kết hợp của Grid Search đối với từng mô hình đề đánh giá, lựa chọn xem mô hình nào

Trang 1

TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN

BÙI DƯƠNG THỦY TIÊN

DU BAO GIA DONG TIEN MÃ HÓA BITCOIN BANG CÁCH KET HỢP PHƯƠNG PHAP TÌM KIEM LƯỚI, MÔ HINH CHUOI THỜI GIAN,

Trang 2

TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN

BUI DUONG THUY TIEN

DU BAO GIA DONG TIEN MA HOA BITCOIN BANG CÁCH KET HỢP PHƯƠNG PHÁP TÌM

KIEM LƯỚI, MÔ HÌNH CHUOI THỜI GIAN,

Trang 3

Lời nói đầu tiên em xin cảm ơn các thầy cô trong trường Đại Học Công NghệThông Tin đã chỉ dẫn em nhiều bài học hay, những kiến thức vô cùng quý báu mà

điều đó em không bao giờ quên ơn

Thay cô đã dạy em rat nhiệt tinh với những nội dung mới, định hướng cho em

con đường đi tương lai phía trước Đối với em, thay cô là những người đưa đò thầm

lặng đề cho em đến bến bờ tri thức mới và đưa những học viên sau này cập bến theo

con đường mà mình đã chọn.

Thay cô đã cống hiến cả nhiệt huyết của mình dé cho em bổ sung nhiều điểm

thiếu sót, kiến thức còn hạn hẹp của mình, định hướng con đường mình cần phải đi,

phấn đấu Đồng thời cho em xin được nhắc đến là người thầy đáng kính PGS.TS

Nguyễn Đình Thuân, thầy là người hướng dẫn, chỉ dẫn tận tâm nhất để cho em làmxong dé tài luận văn này, đối với em thầy như là một người thầy, cũng là một người

cha thứ hai của em đã định hướng cho em đường đi rõ ràng nhất để em hoàn thành

luận văn này.

Trong suốt hành trình làm luận văn, em gặp rất nhiều khó khăn trong việc hoàn

thành để tài của mình, nhưng em vẫn luôn có gắng hết sức mình để không phụ lòng

thầy cô và đặc biệt là thầy Thuân đã dành cho học viên như em

Em cũng xin cám ơn nhà trường, thầy cô trong trường nói chung đã dạy cho

em bao điều hay, thêm nhiều kiến thức mới và người thầy hướng dẫn em là PGS.TSNguyễn Đình Thuân nói riêng đã nhiệt tình, bằng sự chỉ dẫn tận tâm của một ngườithầy mà em đã hoàn thành xong đề tài, tuy còn nhiều điểm sai sót, mong thầy cô và

Ban Giám Hiệu nhà trường tha thứ cho những thiếu sót của mình Em xin chan thành

cám ơn quý thầy cô trong trường Đại Học Công Nghệ Thông Tin

Tp Hô Chí Minh, ngày tháng năm 2023

Sinh viên thực hiện

Bùi Dương Thủy Tiên

Trang 4

Tôi xin cam đoan:

1 Những nội dung trong luận văn nay là do tôi tự tìm hiểu ở các bài báo và thôngtin trên Internet thực hiện đưới sự hướng dẫn của thầy PGS.TS Nguyễn Dinh

Thuân.

2 Mọi tham khảo trong luận văn đều được trích dẫn rõ ràng tên công trình, tên

tác giả, thời gian công bố

Moi sao chép không hợp lệ, vi phạm quy chế dao tạo, tôi xin chịu hoàn toàn trách

Trang 5

1⁄2 Mục tiêu và phạm vi của luận văn

1.3 Nội dung và phương pháp nghiên cứu

1.4 Lý do chọn đề tài

1.5 - Môi trường và công cụ phát triển

1.6 Kiến trúc dé tài

1.7 Bố cục của luận văn

Chương 2: CƠ SỞ LÝ THUYÉT

2.1 Khái niệm về dự bao.

24.1 Khái niệm.

2.1.2 Tính chất, đặc điểm của dự báo.

2.13 Các phương pháp dự báo

2.2 Lý thuyết chuỗi thời gi

2.2.1 Định nghĩa chuỗi thời gian (Time series) [5]

2.2.2 Các thành phan của chuỗi thời gian

2.3 Mô hình ARIMA (Autoregressive Intergrated Moving Average) [1]

2.3.1 Chuỗi dừng (Stationary Time series) [1]

2.3.2 Mô hình tự hồi quy

2.3.3 Mô hình trung bình trượt[1]

2.3.4 Sai phan [11]

2.3.5 Phuong pháp Box-Jenkins [10][16]:.

2.3.6 Chi số AIC (Akaike Information Crite

Criterion)

2.4 Mạng nơ-ron (Neural Network) và Mang LSTM (Long Short Term Memory)

) và chi số BIC (Bayesian Information

2.4.1 Cơ sở lý thuyết mang nơ-ron [2]

Trang 6

2.6 Mô hình CNN (Convolutional Neural Network) [3] 129

2.7 Các phương pháp, mô hình được sử dụng để dự báo giá BTC hiện nay 31 2.7.1 Phương pháp thống kê 231

2.7.2 Machine learning, Deep learning 31

2.8 Đánh giá mô hình MAPE, RMSE |26| 32

2.8.1 | MAPE (Mean absolute percentage error) 32

2.8.2 RMSE (Root-mean-square error) 132

2.9 Giới thiệu Grid search [11] 32 2.10 Két chong 34 Chương 3: KET HỢP GRID SEARCH VỚI MÔ HÌNH LSTM, ARIMA, SARIMA, CNN 35

3.1 Giớithiệu 35

3.2 Các nghiên cứu 35

3.3 Cách tiến hành 137 3.3.1 Sơ đồ sử dung Grid Search với các mô hình 137 3.3.2 Các bước thực hiện 39

3.4 Mô hình chung của Grid Search với các mô hình LSTM, ARIMA, SARIMA, CNN

35:

3.5 Két chuong 41

Chương 4: CÀI ĐẶT THƯ VIỆN, THỰC NGHIỆM MÔ HÌNH, ĐÁNH GIÁ KÉT QUÁ

THUC NGHIỆM CAC MÔ HÌNH LSTM, ARIMA, SARIMA, CNN VÀ SỰ KET HỢP CUA

GRID SEARCH VỚI CÁC MÔ HÌNH -°-48

4.1 Giới thiệu Bitcoin 43

4.2 Cài đặt các thư viện cho các mô hình [5] 48

43 Tập dữ liệu giá mớ cửa của Bitcoin 44

4.4 Thực nghiệm dự báo giá Bitcoin 46

4.4.1 Xirly và biến đối dữ liệu [26] 46

4.4.2 _ 47

4.4.3 Kết quả thực nghiệm trong chuỗi thời gian ARIMA (p, d, q) .52

4.4.4 Thực nghiệm mô hình SARIMA

4.4.5 Kết qua thực nghiệm trong chuỗi thời gian SARIMA (p, d, q)(P, D, Q)m 56 4.4.6 Thực nghiệm mô hình LSTM

4.4.7 Thực nghiệm mô hình CNN

4.4.8 Đánh giá các mô hình LSTM, ARIMA và SARIMA và CNN

4.4.9 Kết qua biểu đồ của các mô hình thực nghiệm.

Trang 7

4.5.3 Thực hiện phương pháp kết hợp giữa Grid Search và SARIMA

4.5.4 Thực hiện phương pháp kết hợp giữa Grid Search và CNN [11].

4.5.5 Đánh gid các phương pháp Grid Search với LSTM, Grid Search với ARIMA, Grid Search với SARIMA và Grid Search với CNN 68

4.5.6 So sánh kết quả thực nghiệm 69 4.6 Kết chương, 71

Chuong 5: KET LUAN VA PHUONG HUONG PHAT TRIEN 2 72

5.1 Cac kết qua dat được .72 5.2 Một số hướng phát triển -.72

TÀI LIEU THAM KHẢO wa 74

Trang 8

LSTM Long Short Term Memory Bộ nhớ ngắn hạn dài hạnARIMA "” a | Tự hồi Lông trung

RNN Recurrent Neural Network Mang thần kinh hồi quy

MAPE Mean absolute percentage error Phan tram sai s6 trung

bình tuyệt

Căn bậc hai của s:

RMSE Ry Meas red Error _ bình phương trung bình

DL Deep Learning Học sâu

Gs Grid Search \ i” Tim kiếm lưới

AIC Akaike Information Criterion Tiêu chí thông tin Akaike

ANN | Seen F::: Mạng nơ-ron nhân tạo

AR Autoregressive Tự hồi quy

MA Moving Average Trung bình trượt

Chức năng tự tương quan

PACF Partial Autocorrelation Function `

một phân

CNN Convolutional Neural Network Mang no-ron tich chap

ML Machine learning May hoc

BIC Bayesian Information Criterion Tiéu chi thong tin Bayes

Trang 9

Bảng 4.1 Bảng kiểm định tiêu chuẩn của một sé mô hình ARIMA 51

Bang 4.2 Kết quả thực nghiệm của mô hình ARIMA với MAPE và RMSE .52 Bảng 4.3 Bảng kiêm định tiêu chuẩn của một số mô hình SARIMA theo m=12 JS

Bang 4.4 Kết quả thực nghiệm của mô hình SARIMA với m=12 56

Bang 4.5 Kết quả thực nghiệm của các mô hình a |

Bang 4.6 Kết qua thực nghiệm phương pháp giữa các mô hình với Grid Search „.68 Bảng 4.7 So sánh độ lỗi dự báo của các mô hình và phương pháp dự báo giá Bitcoin 69

Trang 10

Hình 1.1 Mô hình tông quát của dự báo đồng Bitcoin

Hình 1.2 Mô hình tông quát của dự báo đồng Bitcoin

Hình 1.3 Kiến trúc của đề tài

Hình 2.1 Biểu đồ thé hiện giá Bitcoin theo thời gian

Hình 2.2 Cấu trúc mô hình ARIMA

Hình 2.3 Sai phân bậc l

Hình 2.4 Sơ đồ mô hình LSTM

Hình 2.5 Mô hình tính chập của CNN [3].

Hình 2.6 Sơ đồ của Grid Search được thé hiện trên 110 dong dữ liệu

Hình 3.1 Sơ dé sử dụng Grid Search với các mô hình

Hình 3.2 Kỹ thuật kết hợp Grid Search với các mô hình

Hình 3.3 Mô hình kết hợp với Grid Search

Hình 3.4 Sơ đồ kỹ thuật kết hợp Grid Search v: mô hình trên tập dữ liệu

Hình 4.1 Trang web thị trường đồng tiền Bitcoin

Hình 4.2 Dữ liệu file DataBitcoin.csv được lay từ trang web

Hình 4.3 Nơi download file dữ liệu

Hình 4.4 Biểu đồ hiển thị sai phân bậc 0 của đồng Bitcoin trên mô hình ARIMA.

Hình 4.5 Sơ đồ hiền thi sai phân bậc 1 của bảng dựa vào giá đóng cửa “Adj Close” 48

Hình 4.6 Biểu đồ ACF

Hình 4.7 Biểu đồ PACE

Hình 4.8 Kết quả khi chạy mô hình ARIMA

Hình 4.9 Mô hình dự đoán của ARIMA

Hình 4.10 Kiểm tra thông tin dữ liệu của mô hình SARIMA

Hình 4.1 1 Phạm vi dữ liệu của mô hình SARIMA

Hình 4.12 Kết quả khi chạy mô hình của mô hình SARIMA

Hình 4.13 Sơ đồ hiền thị thông tin dữ liệu của mô hình SARIMA

Hình 4.14 Kết quả mô hình dự đoán SARIMA

Hình 4.15 Dữ liệu được lấy từ Google Drive đưa vào Colab

Hình 4.16 Biểu đồ dự báo giá mở của Bitcoin từ 10-01-2022 đến 10-01-2023

Hình 4.17 Biểu đồ đầu ra của mô hình LSTM

Hình 4.18 Kết quả chạy chương trình của mô hình.

Hình 4.19 Kết quả dự báo của đồng Bitcoin với mô hình LSTM

Trang 11

Hình 4.22 Kết quả dự báo giá Bitcoin bằng CNN 61 Hình 4.23 Kết quả dự báo giá Bitcoin băng SARIMA 62 Hình 4.24 Kết qua dự báo giá Bitcoin bằng mô hình LSTM .63 Hình 4.25 Kết qua dự báo giá Bitcoin bằng mô hình ARIMA 263) Hình 4.26 Kết quả dự báo giá Bitcoin bằng mô hình CNN „63 Hình 4.27 Kết quả thực nghiệm đánh giá bằng RMSE sử dụng phương pháp Grid Search

với mô hình LSTM +65

Hình 4.28 Kết quả thực nghiệm đánh giá bằng MAPE sử dụng phương pháp Grid Search

với mô hình LSTM 65

Hình 4.29 Kết quả thực nghiệm đánh giá bằng RMSE sử dung phương pháp Grid Search

với mô hình ARIMA 66

Hình 4.30 Kết quả thực nghiệm đánh giá bing RMSE sử dung phương pháp Grid Search

với mô hình SARIMA 67

Hình 4.31 Kết quả thực nghiệm đánh giá bằng MAPE sử dung phương pháp Grid Search

với mô hình SARIMA 67

Hình 4.32 Kết qua đánh giá khi thực nghiệm mô hình với phương pháp Grid Search với

CNN bằng RMSE 68 Hình 4.33 Kết quả đánh giá khi thực nghiệm mô hình vi

CNN bằng MAPE

phương pháp Grid Search với

68

Trang 12

Đồng tiền Bitcoin được ra đời vào năm 2009 do Satoshi Nakamoto! là người sáng lập

ra, để sử dụng đồng tiền mã hóa trên Internet Đồng tiền Bitcoin (BTC) là loại tiềnđiện tử rất được quan tâm và sử dụng trong một số lĩnh vực như tài chính, chứngkhoán Năm 2021 là năm của những đợt biến động bat ôn đối với đồng BTC, thi

trường đồng tiền này luôn dao động không ngừng, Việt Nam cũng nằm trong số đó

Trong các bài toán về dự báo, con người càng quan tâm nhiều đến dự báo về dữ liệuchuỗi thời gian như dự báo về giá vàng, tiền điện tử vì chúng mang nhiều lợi íchcho con người, trong số đó thì đồng tiền mã hóa Bitcoin luôn là sự quan tâm nhiềucủa các nhà đầu tư

Dự báo chuỗi thời gian là việc sử dụng các mô hình để dự đoán sự kiện theo thời giandựa vào dữ liệu đã biết trong quá khứ để dự đoán sự kiện trong tương lai

Trong đề tài này được áp dụng các mô hình trong dự báo là LSTM, chuỗi thời gianARIMA, SARIMA, CNN và sự kết hợp của Grid Search đối với từng mô hình đề

đánh giá, lựa chọn xem mô hình nào dự báo có độ chính xác hơn dựa vào dữ liệu lịch

sử của Bitcoin, kết quả mang lại nhiều triển vọng và khả quan hơn

Dữ liệu thực nghiệm: Dữ liệu lịch sử giá Bitcoin được tính từ ngày 10-01-2022 đến

ngày 10-01-2023 bao gồm các thông tin: ngày giao dịch, giá mở bán, giá cao nhất,giá thấp nhát, khối lượng, vốn thị trường được lấy từ trang https://finance.yahoo.com/

Trang 13

Chương 1: TONG QUAN1.1 Đặt vấn đề

Dự báo trên thị trường hiện nay, ngày càng được quan tâm và được thực hiện ở khá

nhiều lĩnh vực, liên quan đến tài chính, tiền tệ mà chú trọng nhiều hơn trong đó cótiền điện tử, đồng tiền mã hóa này luôn thay đổi theo thời gian, việc đưa ra mộtphương pháp dự báo hiệu quả sẽ mang lại nhiều lợi ích như giúp tiết kiệm được chỉphí, hạn chế rủi ro, tối ưu hóa lợi nhuận, dẫn đến việc dự báo đồng tiền này đang là

hoảng tài chính có thé ảnh hưởng đến giá Bitcoin

¢ Sw liên kết giữa đồng Bitcoin và các thị trường tài chính khác, chăng hạn như

thị trường chứng khoán cũng ảnh hưởng dén giá Bitcoin

e _ Thời gian mô hình học: là một yếu tố quan trọng, nếu thời gian học không đủ

hoặc quá dài, có thê dẫn đến mô hình không chính xác

¢ Dir liệu đầu vào: nếu không chính xác hoặc đầy đủ, mô hình dự báo có thé

không chính xác.

e Phạm vi dữ liệu: Số lượng và chất lượng dữ liệu sẽ ảnh hưởng đến mô hình dự

báo giá Bitcoin.

¢ Phuong pháp dự báo: phổ biến như hiện nay bao gồm dữ báo chuỗi thời gian

Trang 14

e _ Dự đoán đồng Bitcoin trong tương lai diễn ra như thé nào dựa vào dữ

liệu lịch sử từ dữ liệu được thu thập trên trang web?

Sử dụng các phương pháp nao trong việc dự đoán đồng Bitcoin để cải

thiện hiệu quả cao hơn?

e _ Đánh giá các mô hình trong việc dự đoán đồng Bitcoin như thế nào để

tìm phương pháp nào có độ chính xác hơn?

° Tối ưu hóa các siêu tham số bằng Grid Search kết hợp với các mô hình

trên dé đánh giá xem phương pháp nào mang lại kết quả khả quan hơn chuẩnthấp nhất ra sao?

Những câu hỏi được đặt ra trong đề tài này tìm ra mục tiêu và hướng giải quyết, đưa

ra các phương pháp dự báo đề tìm phương pháp nào có kết quả khả quan hơn mang

lại hiệu quả hơn.

1.2 Mục tiêu và phạm vi của luận văn

Mục tiêu trong đề tài này là nghiên cứu, thực nghiệm các mô hình liên quan chuỗithời gian cho các bài toán dự báo, mục đích nâng cao độ chính xác dự báo Luận văn

đưa ra mục tiêu và phạm vi thực hiện như sau:

° Nghiên cứu và thực hiện các mô hình về dự báo chuỗi thời gian ARIMA

và mô hình SARIMA đề thực hiện các dự báo ngắn hạn

e _ Nghiên cứu và thực hiện mô hình LSTM xử lý vấn đề phụ thuộc dài

hạn.

« _ Nghiên cứu và thực hiện mô hình CNN giúp xây dựng những thuật toán

với độ chính xác cao hơn.

e Thực hiện và đánh giá các mô hình LSTM, ARIMA, SARIMA, CNN

với sự phân chia 2 tập huấn luyện và tập thử nghiệm

e Nghiên cứu sự tối ưu hóa các siêu tham số bằng Grid Search kết hợp

với các mô hình trên để dự báo độ chính xác hơn về sự thay đổi của đồng

Bitcoin.

Đề xuất được phương pháp dự báo phù hợp dé dự báo giá Bitcoin

Trang 15

1.3 Nội dung và phương pháp nghiên cứu

Thực hiện các mô hình LSTM, ARIMA, SARIMA, CNN về dự báo đồng Bitcoin dựa

vào tập dữ liệu lịch sử.

Tiếp theo là đánh giá các mô hình trên, sau đó tìm kiếm tham số tối ưu của Grid

Search khi kết hợp với các mô hình đề đưa ra độ chính xác hơn giữa các phương pháp

đó.

Phương pháp nghiên cứu:

Mô tả tổng quát bài toán:

Kết hợp

các mô u hóa Grid Search

hình: LSTM các siêu với các mô Dự báo

Thu thập ARIMA,~ tham số hình: LSTM, giá

Hình 1.1 Mô hình tổng quát của dự báo đồng Bitcoin

e _ Bước 1: Thu thập và xử lý dữ liệu, phân chia làm 2 tập là tập huấn luyện

và tập thử nghiệm.

Bước 2: Thực hiện và xây dựng về các mô hình LSTM, ARIMA,SARIMA, CNN.

© _ Bước 3: Tìm hiểu về Grid Search

e _ Bước 4: Tối ưu hóa các siêu tham số bằng Grid Search khi kết hợp với

các mô hình trên để đánh giá chung

¢ — Bước 5: Tiến hành chạy các phương pháp dự báo trên tập thử nghiệm,

so sánh các mô hình thông qua MAPE, RMSE, tìm ra các thông số để so sánh

độ chính xác giữa các mô hình, chọn ra phương pháp nào chính xác hơn cho.

dự đoán giá Bitcoin.

1.4 Lý do chọn đề tài

Với thị trường đồng Bitcoin luôn biến động trong những thời gian gần đây, trong đó

Trang 16

có giá trị kinh tế, tối ưu hóa lợi nhuận Việc áp dụng các mô hình được đánh giá khi

sử dụng có kết hợp Grid Search cho thấy kết quả có độ lỗi ít hơn so với các mô hình

kết hợp hay mô hình riêng lẻ khác trong dự báo đồng Bitcoin, trong dé tài sử dungphương pháp này đề thực hiện, muốn nâng cao độ chính xác hơn và cho thấy kết qua

dự báo khả quan hơn dựa vào đánh giá RMSE, MAPE.

Vì trong Grid Search tìm kiếm độ tôi ưu của các siêu tham số khi kết hợp với bốn mô

hình cho ra các phương pháp mới là Grid Search-ARIMA, Grid Search-SARIMA,

Grid Search-LSTM, Grid Search-CNN có kết quả khả quan hơn, với độ lỗi ít hơn sovới các phương pháp khác Đây cũng là điểm mau chốt trong dé tài này, dé so sánhđánh giá từng mô hình với sự kết hợp này, tìm ra độ chính xác hơn cho dự báo đồng

Bitcoin.

Đề tài của học viên sử dụng mô hình LSTM, ARIMA, SARIMA, CNN và sự kết hợpcủa Grid Search với các mô hình trên dé dự đoán những ngày tiếp theo của đồngBitcoin dựa vào dữ liệu lịch sử từ ngày 10-01-2022 đến ngày 10-01-2023

1.5 Môi trường và công cụ phát triển

Các thử nghiệm trong luận văn được thực hiện trên máy tính có cấu hình như sau:

© — CPU: Intel(R) Core (TM) i3-8100 CPU @ 3.60GHz 3.60 GHz

Trang 17

Grid LSTM

Grid

Search-ARIMA

RMSE

Grid SARIMA

Search-Hình 1.6 Kiến trúc của dé tài

Trang 18

Để nghiên cứu dự báo về đồng Bitcoin đều được quan tâm là dữ liệu được thu thập

trên trang https://finance.yahoo.com/ với chuỗi thời gian hiện hành.

Tìm kiếm các siêu tham số để tối ưu hóa bằng Grid Search kết hợp với các mô hìnhLSTM, ARIMA, SARIMA, CNN đề đánh giá chuẩn và tối ưu hơn, dat được kết quảkhả quan hơn Trong đề tài này đã sử dụng các phương pháp trên dé tìm ra độ hiệuquả cao, mang lại nhiều triển vọng hơn cho bài toán về dự báo đồng Bitcoin

1.7 Bố cục của luận văn

Bô cục của luận văn gôm các chương sau:

e _ Chương 1 Tổng quan: giới thiệu dé tài, mục tiêu, phạm vi của luận

văn, nội dung, phương pháp nghiên cứu, lý do chọn dé tài, môi trường pháttriển đề tài

° Chương 2 Cơ sở lý thuyết: khái niệm về dự báo, lý thuyết về chuỗi

thời gian ARIMA, SARIMA, LSTM và mô hình CNN, các phương pháp sử

dụng dự báo giá BTC hiện nay, đánh giá mô hình bằng MAPE, RMSE, giới

thiệu Grid Search.

° Chương 3 Kết hợp Grid Search với các mô hình LSTM, ARIMA,SARIMA, CNN: ý tưởng, các bước tiền hành, sơ đồ chung của mô hình có

sử dụng Grid Search.

Chương 4 Cài đặt thư viện và thực nghiệm các mô hình: giới thiệu

Bitcoin, thực nghiệm dự báo giá Bitcoin với các mô hình Thực nghiệm

phương pháp sử dụng Grid Search với các mô hình.

° Chương 5: Đánh giá thực nghiệm các mô hình và phương pháp sử

dụng Grid Search với các mô hình trên: kết quả thực nghiệm mô hìnhchuỗi thời gian ARIMA, SARIMA, đánh giá các mô hình và kết quả đánh

giá của các mô hình có sử dụng Grid Search.

Chương 6 Kết luận và hướng phát triển

Tài liệu tham khảo

Trang 19

Chương 2: CƠ SỞ LÝ THUYET2.1 Khai niệm về dự báo

2.1.1 Khái niệm

Dự báo là quá trình nghiên cứu dựa vào dữ liệu lịch sử để dự báo sự kiện trước khixảy ra trong tương lai được sử dụng dự báo trong nhiều lĩnh vực nói chung và đồngtiền mã hóa nói riêng

2.1.2 Tính chất, đặc điểm của dự báo

Trong phần dự báo luôn tổn tại ở hai mặt: tính chính xác và tính không chính xác(tính tương đối) Do trong phần dự báo luôn có các điểm không rõ hay gọi là điểm

mù tức là cái không chính xác hoàn toàn xảy ra trong tương lai.

2.1.3 Các phương pháp dự báo.

Trong nhiều lĩnh vực nói chung như hiện nay việc dự báo cũng là một phần quan

trọng để biết được dự báo thời gian tiếp theo Trong đề tài này nói về đồng tiền mãhóa Bitcoin nói riêng, việc dự báo trước một sự việc xảy ra trong tương lai đó là một thách thức Dự báo là nghệ thuật tiên đoán sự việc sẽ xảy ra trong tương lai, dự báođược diễn ra dựa trên dữ liệu lịch sử mà thu thập được, đê dự đoán những diễn biến

của đồng Bitcoin thay đôi trong thời gian sắp tới

Căn cứ vào dự báo có những phương pháp sau [5]:

© Dự báo ngắn hạn: là dự báo thường trong thời gian ngắn

© — Dự báo trung hạn: là dự báo thường từ 3 tháng đến 3 năm

° Dự báo dài hạn: là dự báo từ 3 năm trở lên.

Dựa vào phương pháp dự báo còn có các phương pháp dự báo [5]:

© Phương pháp dự báo định tính: dự báo dựa vào thông kê số liệu, kinh

nghiệm, suy luận, suy đoán trong việc sử dụng đồng tiền mã hóa này Đây là

phương pháp dễ thực hiện, chỉ phí thấp, ước tính xác suất một cách chủ quan

của các chuyên gia trong lĩnh vực nghiên cứu.

Phuong pháp dự báo định lượng: dựa trên cơ sở toán học, thống kê, dé

dự báo thời gian tiếp theo theo dãy số thời gian

Trang 20

Trong đề tài này, việc dự báo được sử dụng bằng phương pháp định lượng tức là dùng

mô hình, thực nghiệm, tính toán dé đưa ra kết qua dự báo hay nói khác đi là dùng mô

hình hóa để thực hiện việc dự báo đồng BTC

2.2 Lý thuyết chuỗi thời gian

2.2.1 Định nghĩa chuỗi thời gian (Time series) [5]

Chuỗi thời gian được sử dụng trong thống kê, xử lý tín hiệu Trong toán học, dữ liệuchuỗi thời gian là những điểm dữ liệu được đánh giá theo thời gian, được định nghĩa

là một vector x(t), t= 0, 1, 2, với t đại diện cho các điểm thời gian, biến x(t) đượcxem như một biên ngẫu nhiên

Mỗi chuỗi thời gian được gọi là đơn biến nếu tại mỗi điểm dữ liệu chỉ bao gồm mộtbiến duy nhất, nếu tại mỗi điểm gồm nhiều hơn một biến thì gọi là đa biến

Hình 2.1 Biểu đồ thé hiện giá Bitcoin theo thời gian

Nguồn: Dữ liệu giá Bitcoin thu thập trên https://finance.yahoo.com/ được lấy từ

10-01-2022 đền 10-01-2023

Theo biểu đồ chuỗi thời gian được biéu diễn giá trị ở trục tung và biéu diễn thời gian

là ở trục hoành Quan sát biểu đồ thể hiện liền mạch nhau, theo quá trình tăng - giảm

do ảnh hưởng theo thời gian được thay đổi liên tục

Trong dự báo chuỗi thời gian có hai loại chính:

e _ Chuỗi thời gian thông thường: gọi là số liệu

Ù Chuỗi thời gian bất thường: là những sự kiện

Trang 21

Trong dự báo đê xây dựng một mô hình có 2 kiêu dữ liệu chính sau:

° Dữ liệu có cấu trúc: là dữ liệu được tô chức thành dạng bảng, ở mỗi

trường được định dạng số, chuỗi ký tự hoặc thời gian

° Dữ liệu phi cấu trúc: được thê hiện dưới đạng dữ liệu thô chưa qua xử

lý, các dữ liệu dạng key: value Dữ liệu này có thé lưu trữ nhiều loại trường

dữ liệu hơn, tốc độ truy vấn và xử lý nhanh hơn so với đữ liệu có cấu trúc.Mội số ví dụ về chuỗi thời gian:

© _ Chuỗi thời gian về sự thay đổi của giá vàng, giá Bitcoin.

e _ Chuỗi thời gian về chất lượng không khí trong các Thành phố lớn qua

từng ngày.

Chuỗi thời gian về chuyên biến của mật nước ngập mặn ở các tỉnh miền

Tây.

Chuỗi thời gian về diễn biến số người bệnh của dịch COVID

2.2.2 Các thành phần của chuỗi thời gian

Do dữ liệu có tính chất thời gian nên thông thường một chuỗi thời gian gồm 3 quyluật đặc trưng [8]:

Tinh xu hướng (trend); xảy ra khi có một sự gia tăng dài hạn của dữ

liệu.

© — Tính thời vụ (seasonal): xảy ra sự biên động lặp lại tuần hoàn khi tồntại ảnh hưởng bởi yếu tố mùa vụ

° Tính chu ki (cyclic): xảy ra trong một khoảng thời gian có định và mang

tính chất tuần hoàn, tồn tại khi có sự tăng — giảm lặp lại trong một giai đoạnnhưng không cố định Nhưng nhìn chung sự thay đồi của tính chu kì mạnhhơn so với tính thời vụ, vì tính chu kì thường lặp ít nhất sau khoảng thời gian

2 năm.

Ngoài 3 thành phần chính trên còn có thành phần mang tính ngẫu nhiên: những điềuxảy ra một cách ngẫu nhiên không biết trước được trong quá trình thu thập dữ liệuhay do động đất, thiên tai

Trang 22

2.3 Mô hình ARIMA (Autoregressive Intergrated Moving Average) [1]

Mô hình ARIMA là mô hình biểu diễn phương trình hồi qui tuyến tinh đa biến của

các biến đầu vào (còn gọi là biến phụ thuộc trong thống kê)

Mô hình ARIMA được nghiên cứu và phát hiện bởi hai nhà nghiên cứu [6] là George

Box? va Gwilym Jenkins3 Vì thế, loại mô hình này còn được biết đến với tên gọi là

Hình 2.2 Cấu trúc mô hình ARIMA

? https://en.wikipedia.org/wiki/George_E._P._Box

Trang 23

2.3.1 Chuỗi dừng (Stationary Time series) [1]

Chuỗi dừng là chuỗi thời gian không bao hàm các yếu tố xu thé ma có các giá trị détính giá trị trung bình của chuỗi, đảm bảo tính dừng của chuỗi dữ liệu

Trong mô hình ARIMA có thành phan d khác 0, tức là ARIMA có biến đồi sai phân.Quá trình biến đổi này là quá trình đưa một chuỗi không dừng thành chuỗi thời gian

dừng.

2.3.2 Mô hình tự hồi quy

Trong mô hình chuỗi thời gian ARIMA (p, d, q) gồm có những chỉ tiết mà cần tìmhiểu thêm [1]:

© —— Auto regression (AR): là thành phần tự hồi qui bao gồm độ trễ của biến

hiện tại Độ trễ bậc p chính là giá trị lài về quá khứ p bước thời gian của

chuỗi, tức là sử dụng các giá trị chuỗi thời gian tĩnh tùy thuộc vào các giá trị

trước đó Độ trễ dài hoặc ngắn trong quá trình AR phụ thuộc vào tham số

trễ p Cụ thê, quá trình AR(p) của chuỗi x: được biéu diễn như bên dưới [11]:

Xe =c+ Lor ÕiX¿~p + 6i (2.1)

2.3.3 Mô hình trung bình trượt [1]

Moving average (MA): được viết dưới dạng kết hợp tuyến tính, được hiểu là quá trìnhdịch chuyển hoặc thay đổi giá trị trung bình của chuỗi thời gian (tức là viết dưới dạngtuyến tính của các sai số về mặt thời gian), q là số lần quan sát trước đó Mối quan hệ

giữa các giá trị chuỗi thời gian trong mô hình này được xây dựng [11]:

Trang 24

giảm theo thời gian Khi biến đổi sang chuỗi dừng, các nhân tố ảnh hưởng thời gian

được loại bỏ và chuỗi sẽ dễ dự báo hơn Đề tạo thành chuỗi dừng, một phương pháp

đơn giản nhất là sẽ lấy sai phân Bậc của sai phân tạo thành chuỗi dừng còn gọi là bậccủa quá trình đồng tích hợp (order of intergration) hay nói cách khác là lấy chuỗi thời

gian có giá trị trung bình không đổi, phương sai và tự tương quan Qúa trình sai phânbậc d của chuỗi được thực hiện như sau [1]:

Sai phân bậc 1: 1(1) = Ă%¿) = Xt —X¿;~¡ (2.3)

Sai phân bậc d: 1(d) = A¢(x,) = ĂẶ Ăx;))) (2.4)

d times

Thông thường chuỗi sé dừng sau quá trình đồng tích hợp I(0) hoặc I(1), rất ít chuỗi

chúng ta phải lấy tới sai phân bậc 2 Một số trường hợp chúng ta sẽ cần biến đồilogarit hoặc căn bậc 2 dé tạo thành chuỗi dừng Phương trình hồi qui ARIMA (p, d,q) có thể được biéu diễn dưới dạng:

Ax, = Ú1Ax,-¡ + 02Ax,_; + + DyAXpp + A Ec-1 + Øy€ TS; H+ OgEr—q

Hinh 2.3 Sai phan bac 1

Như vay, phương pháp sử dụng ARIMA là 2 quá trình tự hôi qui va trung bình trượt,dựa vào dữ liệu lich sử dé dự báo dữ liệu trong thời gian tiếp theọ Bởi vay, dùng tap

Trang 25

huấn luyện mô hình thì cần chuyển hóa chuỗi sang chuỗi dừng bằng cách lấy sai phân

bậc 1 hay logarit, lựa chon mô hình có sai số dự báo là nhỏ hơn

2.3.5 Phương pháp Box-Jenkins [10][16]:

Phương pháp Box-Jenkins bao gồm 4 bước chung như sau: nhận dạng, ước lượng,

kiêm định và dự báo mô hình.

(1) Nhận dang (identification) và lựa chọn mô hình

© _ Tìm các giá trị thích hợp của p, d và q bằng biểu đồ, lay sai phân bậc 1hoặc sai phân bậc 2, qua phân tích chiều hướng biến đổi của hàm tự tương

quan ACF hoặc ham tự tương quan riêng PACF.

° Hàm tự tương quan (ACF — AutoCorrelation Function): Chỉ số đo

lường hệ số tương quan như ACF, tìm ra độ trễ của trung bình trượt

e _ Hàm tự tương quan riêng phần (PACF - Partitformial AutoCorrelation

Function): có sự khác biệt đó là hệ số tương quan này loại bỏ ảnh hưởng của

các chuỗi độ trễ trung gian.

(2) Ước lượng mô hình:

° Sau khi nhận dạng các giá trị thích hợp của p và q, ước lượng tham sốcủa các só hạng tự hồi quy và trung bình trượt trong mô hình Việc ước lượngnày có thể là tuyến tính hoặc phi tuyến tính

(3) Kiểm định mô hình

e _ Xem xét mô hình đã xây dựng có phủ hợp với tập dữ liệu hay không,

nếu phù hợp thì mô hình có thể chấp nhận, nếu không thì phải quay lại bước

nhận đạng mô hình, ước lượng mô hình đến khi nào mô hình chấp nhận được,

vì phương pháp Box-Jenkins là một phương pháp lặp.

€,= X, — Ấy (2.6)Với & là phan dư, X, là giá tri thực tế, X; là giá tri dự báo

(4) Dự báo (forecasting)

e _ Khi mô hình được kiểm chứng phù hợp với đữ liệu chuẩn đoán, tiếp

theo là thực hiện dự báo điểm và dự báo khoảng tin cậy Một trong số các lý

Trang 26

do về tính phổ biến của phương pháp lặp mô hình ARIMA thành công trong

cụ ước tính lỗi dự báo và do đó đánh giá chất lượng tương đối của các mô hình thống

ập hợp dữ liệu nhất định, AIC và BIC được hình thành dựa trên lý thuyết

thông tin, mô hình mắt càng ít thông tin thì chất lượng của mô hình đó càng cao AIC,

BIC được định nghĩa như sau [1]:

AIC = —2log(L) + 2(p+q+k+1) (2.7)

Tom lại rằng giá trị của AIC, BIC càng nhỏ thì mô hình của chúng ta càng phù hợp

BIC = AIC + [log(T) — 2](p +q +k+1) (2.8)

2.4, Mạng no-ron (Neural Network) và Mang LSTM (Long Short Term

nút Trong thực tế, nhiều mạng nơ-ron là các công cụ mô hình hóa dữ liệu thống kê

phi tuyến, có thé được dùng dé mô hình hóa các mối quan hệ phức tạp giữa dữ liệu

vào và kết quả để tìm kiếm trong dữ liệu Mạng nơ-ron là một mô hình kết hợp với

mạng nơ-ron thần kinh và kĩ thuật học sâu, nó trở thành công cụ mạnh mẽ được sử

dụng trong những bài toán như nhận dạng ảnh, giọng nói và xử lý ngôn ngữ tự nhiên.

2.4.1.2 Mang no-ron [15]

Mang nơ-ron chủ yếu được sử dụng trong các ứng dụng dit liệu tuần tự

Mạng nơ-ron có ba loại lớp cơ bản:

Trang 27

e _ Lớp đầu vào (Input Layer): số lượng tế bào thần kinh tương đương với

số lượng kết hợp các tính năng trong dữ liệu

Lớp ân (Hidden Layer): là lớp được che giấu dựa trên mô hình và kích

thước dữ liệu, mỗi lớp ấn có thé có nhiều tế bào thần kinh

e _ Lớp dau ra (Output Layer): kết quả đầu ra của mô hình, nhưng giữa lớp

dau vào và dau ra của mạng nơ-ron là độc lập với nhau.

2.4.2 Mạng LSTM

2.4.2.1 Mạng LSTM [14]

LSTM cung cấp các kết nối phản hồi bên cạnh việc truyền tải trực tiếp, được xây

dựng như thuật toán học tập tự giám sát, có thé học từ các input đầu vào tuần tự trước

đó LSTM có thẻ giữ lại và lưu trữ thông tin trên các chuỗi dữ liệu lớn, có khả năngghi nhớ các mẫu trong quá khứ nên hiệu quả tốt trong việc dự báo

LSTM là một loại mạng thần kinh hồi quy (RNN) [17], dùng để xử lý vấn đề phụ

thuộc dài hạn của RNN, trong khi đó RNN không thê đoán trước từ được lưu trữ trong.

đài hạn Tuy nhiên, bộ nhớ có thể dự đoán chính xác hơn từ dữ liệu mới

LSTM có thé lưu trữ dữ liệu trong một khoảng thời gian dài, nó cung cap các kết nồiphản hồi từ các input đầu vào tuần tự trước đó

LSTM được sử dụng để phân loại và dự đoán dựa trên thông tin chuỗi thời gian.LSTM có cấu trúc chứa bốn mạng nơ-ron và các bộ nhớ được gọi là ô Ô chịu tráchnhiệm lưu trữ thông tin, trong khi đó cổng chịu trách nhiệm về các thao tác của bộ

nhớ Trong đó, cổng quên đảm bảo thông tin không còn hữu ích đã xóa đi, cổng đầu

vào bồ sung thông tin hữu ích vào 6 Công đầu ra được sử dụng dé trích xuất thong

tin hữu ích từ ô.

Trang 28

Hình 2.4 Sơ đồ mô hình LSTM

Nguồn: Sơ đô được thu thập từ trang https:/nttuan8.com

LSTM có thể xử lý dữ liệu một cách tuần tự và giữ trạng thái ẩn theo thời gian

Như trong phan giới thiệu theo sơ đồ của mô hình:

Phan dau ra là cr, ht gọi c là trạng thái 6 và h gọi là trạng thái an

Phan đầu vào: cv, het, x75 trong đó x: gọi là đầu vào ở trạng thái thứ t của môhình; c.1, he gọi là dau ra của lớp trước, h đóng vai trò khá giống như s ở RNN, trong

khi e là điêm mới của LSTM.

Va bên cạnh đó f, tương ứng với cổng quên, i: tương ứng với công nhập, o, tương ứngvới công xuất

Cổng quên: có nhiệm vụ loại bỏ những thông tin không cần thiết

f= ø (Ur * xt + We * her + bự) (2.7)

Céng đầu vào: có nhiệm vụ chọn lọc những thông tin cần thiết nào được thêm

vào trạng thái ô.

ip = 0 (Ui * xí + Wi * be + bị ) (2.8)

Trang 29

Cổng đầu ra: có nhiệm vụ xác định những thông tin nào từ trang thái ô được

sử dụng như đầu ra

oi = (Uo #* x + Wo * het + bọ ) (2.9)

Thông qua biểu thức có nhận xét như sau:

bị, bị, bọ là các hệ số bias

Hệ số W, U giống như trong mạng RNN

t = tanh (Uz * x + We * hei + be) giống như tính s trong RNN (2.10)

Cổng quên quyết định cần lấy bao nhiêu từ trang thái 6 trước và công nhập sẽ

quyết định lấy bao nhiêu từ đầu vào của trạng thái và lớp ẩn của lớp trước Với biểu

thức sau:

œ=f*ceái+ii* ết (2.11)

Cổng đầu ra quyết định xem cần lấy bao nhiêu từ trang thái 6 dé trở thành đầu

ra của trạng thái ân, với biểu thức sau:

hy = O; * tanh (c) (2.12)

Nhận xét: qua mô hình LSTM thông tin nào can quan trọng và dùng đến sau sẽ đượclưu vào và dùng khi cần, do đó có thể mang thông tin đi từ xa được gọi là ghi nhớ dàihạn Bên cạnh đó thì h khá giống với mô hình RNN, có ghi nhớ ngắn hạn Do vậy,LSTM có cả ghi nhớ dài hạn và ghi nhớ ngắn hạn

Nhu vậy, các mô hình mạng nơ-ron sâu mới nhất được áp dụng dé phát triển các mô

hình cho nhiều đầu vào và nhiều đầu ra dựa trên LSTM Tuy nhiên, các dự đoán thị

trường thời gian thực chính xác vẫn chưa đạt được do tính chất biến động của thị

trường tài chính, các công cụ xác định khác nhau ảnh hưởng đến giá Bitcoin

Những điểm khác biệt giữa RNN và LSTM [15][12]

RNN

Độ dài khoảng trông mở rộng RNN LSTM có thể giữ lại dữ liệu trong mộtkhông cung cấp hiệu suất hiệu quả khoảng thời gian dài

Trang 30

Ứng dụng sử dụng dữ liệu tuần tự Cung cấp các kết nỗi phan hồi, học từ

các input đầu vào tuần tự trước đó

2.5 Mô hình SARIMA (Seasonal Autoregressive Intergrated Moving

Average) [1]

SARIMA đó là mô hình ARIMA mở rộng Nói về SARIMA cũng giống như ARIMAnhưng được điều chỉnh đặc biệt để áp dụng cho những chuỗi thời gian đơn biến cóyếu tố mùa vụ Trong mô hình ARIMA thì không giải thích tốt chuỗi thời gian trongtrường hợp chuỗi xuất hiện yếu tố mùa vụ

Mô hình SARIMA trong ứng dụng dự báo đồng Bitcoin tính theo thời gian dựa vào

dữ liệu lịch sử để dự đoán thời gian tiếp theo xem đồng Bitcoin tăng hay giảm, từ đó

phân tích chuỗi thời gian một cách chính xác, mang lại hiệu quả khả quan hơn.

Để dự báo chuỗi thời gian [5] với đữ liệu đơn biến có chứa các xu hướng và tính thời

q: Thứ tự đường trung bình xu hướng.

Ngoài ra, có bồn yếu tô theo mùa không phải là một phan của ARIMA phải được địnhcấu hình:

P: Lệnh tự phục hồi theo mùa

D: Thứ tự chênh lệch thời gian.

Q: Thứ tự đường trung bình trượt theo mùa.

m: Số bước thời gian trong một khoáng thời gian theo mùa

Với các mô hình LSTM, ARIMA, SARIMA, CNN về việc dự báo chuỗi thời giantrong hệ thống đồng tiền mã hóa BTC, nhận xét chung việc đánh giá bằng MAPE,

RMSE cho từng mô hình sẽ thu được độ khả quan hơn của từng mô hình và đánh giá

để so sánh các mô hình lại với nhau Ta dùng thêm Grid Search kết hợp với các mô

Trang 31

ch chuẩn (RMSE)của từng mô hình, kết quả đạt được nhiều triển vọng hơn so với từng mô hình riênghình trên dé đưa ra mức độ chính xác hơn thông qua đánh giá độ

lẻ.

Tir việc phân chia thành hai bộ dữ liệu như ở phần thử nghiệm từng mô hình đơn, dựavào những dữ liệu huấn luyện đề dự đoán dựa trên bộ dữ liệu thử nghiệm, định ra môhình nào có độ chính xác hơn, định hướng được xem trong thời gian gần đồng BTCbiến động ra sao

2.6 Mô hình CNN (Convolutional Neural Network) [3]

CNN gọi là mạng kết nối day đủ hay gọi là mạng toàn ven, mô hình này được xử lý

tín hiệu số nhằm biến đồi thông tin đầu vào thông qua một phép tích chập với bộ lọc

để trả về đầu ra là một tín hiệu mới Tín hiệu này sẽ làm giảm những đặc trưng mà

bộ lọc không quan tâm và chỉ giữ những đặc trưng chính.

Tích chập thông dụng hiện hay là tích chập 2 chiều áp dụng trên ma trận đầu vào và

Trang 32

ore (2.16)

W2=

Tương tự như chiều cao H như sau:

H2= —— +1 (2.17)

Trong mô hình CNN có hai yếu tố là tính bắt biến và tính kết hợp

e _ Tính bat biến: là thông tin không thay đổi.

© Tính kết hợp: các cấp độ biều diễn thông tin từ mức độ thấp đến mức

độ cao và trừu tượng hơn thông qua tích chập từ các bộ lọc.

Trong cấu trúc mô hình CNN thường có ba thành phan chính:

° Trường cục bộ: lớp nay tách lọc dit liệu lựa chọn giá trị sử dụng cao

nhất

° Trọng số chia sẻ: lớp này làm giảm tối đa lượng tham số.

e Lớp tổng hợp: tác dụng làm đơn giản các thông tin dau ra, bớt các thôngtin không cần thiết để cho kết quả như mong muốn

Trang 33

2.7 Các phương pháp, mô hình được sử dụng dé dự báo giá BTC hiện nay

Theo nghiên cứu [9] tác giả Marzieh Rostami được sử dụng trong việc dự đoán đồng

Bitcoin, được sử dụng phương pháp máy học, trong bài báo này sử dụng phương pháp

Box-Jenkins, tự phục hồi (AR), trung bình trượt (MA), ARIMA, chức năng tự tươngquan (ACF), chức năng tự tương quan một phần (PACF) và dùng thuật toán tìm kiếmlưới để dự đoán giá Bitcoin và thực hiện việc đánh giá về các mô hình, lỗi dự báo(FE), lỗi dự báo trung bình (MFE), lỗi tuyệt đối trung bình (MAE), lỗi bình phương(MSE), lỗi bình phương trung bình góc (RMSE) và cho thay rằng kết quả nghiên cứucho thấy rằng độ chính xác trong bài báo này đạt 66% và 65.3%

Nhóm tác giả [8] K.E AruKumar, Dinesh V Kalaga, Ch Mohan Sai Kumar, Govinda Chilkoor, Masahiro Kawaji, Timothy M Brenza áp dung các mô hình chuỗi thời gian

ARIMA va SARIMA được sử dung, tiêu chí thông tin Akaike (AIC) và tiêu chí thong

tin Bayes (BIC) được sử dung dé đánh giá độ tin cậy của các mô hình, các chỉ số đánh

giá sai số tuyệt đối trung bình (MAE), MSE, độ lệch chuẩn theo phần dư (RMSE) và

lỗi phần trăm trung bình tuyệt đối (MAPE) được sử dụng làm tiêu chí để lựa chọn môhình có kết quả khả quan hơn

Trong [11] của nhóm tác giả Prof Rohini Hanchate, Abhinek Kumar Agarwal, Tushar Kumar, Shivam Raj, Soham Morajkar (2022) dùng mô hình máy học

(machine learning_ML) để dự đoán giá đồng Bitcoin, mô hình LSTM, ARIMA,RNNđược sử dụng, đánh giá mô hình phổ biến là lỗi bình phương (MSE), lỗi bình phươngtrung bình gốc (RMSE), kết qua cũng đạt được khả quan nhất định

2.7.2 Machine learning, Deep learning

Các phương pháp Machine learning được sử dụng trong dự báo hiện nay cũng khá

hiệu quả, được sử dụng trong nhiều lĩnh vực khác nhau Nhóm tác giả [12] Ishaani

Priyadarshini - Chase Cotton áp dụng mô hình LSTM, CNN, mạng nơ-ron sâu, nghiên

Trang 34

cứu các thuật toán cơ sở như mạng nơ-ron tích tụ, KNN (K-Nearest Neighbor), mạng

nơ-ron, LSTM-CNN va CNN-LSTM đã được đánh giá bằng cách sử dụng độ chính

xác trên nhiều bộ dữ liệu, kết quả mô hình được dé xuất dựa trên tối ưu hóa siêu thong

số tốt hơn các mô hình cơ sở khác với độ chính xác cao Kết quả cho thấy việc sử

dụng các phương pháp máy học có triển vọng trong việc dự báo ngắn hạn

2.8 Đánh giá mô hình MAPE, RMSE [26]

2.8.1 MAPE (Mean absolute percentage error)

MAPE là phan trăm sai số trung bình tuyệt đối, MAPE là thước do thống kê mức độchính xác của m hông dự báo, đo độ chính xác này theo phần trăm và có thểđược tính là sai số phần trăm tuyệt đối trung bình cho mỗi khoảng thời gian trừ đi các

giá trị thực chia cho các giá trị thực.

MAPE là biện pháp phô biến được sử dụng dé dự báo lỗi và hoạt động tốt hơn nếukhông có cực trị đối với dữ liệu (và không có số không)

MAPE =2 X>¡|( — 8)/0¡| (2.18)

2.8.2 RMSE (Root-mean-square error)

RMSE là lỗi trung bình bình phương, như thước đo độ chính xác, dùng dé so sánhcác lỗi trong việc dự báo của các mô hình khác nhau của tập dữ liệu (như tập huấn

luyện và tập thử nghiệm).

Có độ lệch chuẩn theo phần dư (lỗi dự đoán), đo sự khác biệt giữa các giá trị dự đoán

và giá trị thực tế Nếu RMSE càng nhỏ thì độ sai số càng bé, độ tin cậy của mô hình

ngày càng cao.

RMSE = (2.19)

2.9 Giới thiệu Grid search

Grid Search (GS) [11] là một cách tiép cận tiện lợi, khám phá toàn bộ không gian dữ

liệu bằng cách sử dụng tap con siêu tham số của không gian tìm kiếm cho một thuật

toán đã chọn trong khi tim kiếm ngẫu nhiên chọn giá trị cho tất cả các siêu tham sốmột cách độc lập dựa trên phân bố xác suất của chúng Trên mỗi dong dit liệu có các

Trang 35

điểm lựa chọn, mỗi điểm đại diện cho một cấu hình mô hình, và là một vec-tơ có giá

ụ thể cho từng giá trị siêu tham số, được tạo thành một mạng lưới với các bước

nhảy sai số, sau đó tối ưu hóa tìm một vec-tơ mang lại hiệu quả tốt nhất cho mô hình

với độ chính xác tối đa và sai số tối thiểu

Điều chỉnh chính xác có nghĩa là tim thông số tốt nhất cho các thuật toán máy học đểcải thiện kết quả

Lập kế hoạch được tối ưu hóa là một cách thực tế hiệu quả bước có thẻ dẫn đến những.cải tiến đáng chú ý ở đầu ra Các tham số tối ưu có thể được tự động tìm thấy trên

Grid Search.

Trong để tài này dùng Grid Search đê kết hợp với các mô hình LSTM, ARIMA,SARIMA, CNN dự đoán đồng tiền mã hóa Bitcoin bằng cách tìm ra các siêu tham số

trong tìm kiếm ngẫu nhiên, tìm ra những thông số tốt hơn đề đánh giá kết quả một

cách kha quan hơn trên tập thử nghiệm của 110 dòng dữ liệu.

Bước nhảy sai số là 1 |

<7

"`

=

Na, Na

Line 1 Line 2 Line 109 Line 110

Hình 2.6 Sơ đồ của Grid Search được thé hiện trên 110 dòng dữ liệu

Trên tập thử nghiệm với 110 dòng dữ liệu là các điểm, trên mỗi điểm đó là một

vec-tơ có giá trị cụ thê thông qua các bước nhảy sai số trên từng mỗi điểm, các điểm củatừng dòng được liên kết với các điểm của dong kia tạo thành một mô hình lưới chođến dòng cuối cùng trong tập dữ liệu, khi tạo xong chúng sẽ tìm kiếm một cách ngẫunhiên thông qua thuật toán, từ đó sẽ lựa chọn tham số nào có độ sai số thấp hơn dựa

trên Grid Search.

Trang 36

2.10 Kết chương

Chương này đã trình nay chỉ tiết về khái niệm chung của dự báo, chuỗi thời gian, các

mô hình LSTM, ARIMA, SARIMA, CNN, đánh giá thông qua MAPE, RMSE, giới

thiệu chung về Grid Search, trình bày các phương pháp được áp dụng trong dự báogiá BTC, các mô hình này có những thành công nhất định trong việc dự báo nhưng

cần cải thiện hơn nữa về độ chính xác dự báo Trong chương tiếp theo là sử dụng

phương pháp giữa Grid Search với các mô hình trên giúp nâng cao khả năng dự báo.

Trang 37

Chương 3: KET HỢP GRID SEARCH VỚI MÔ HÌNH LSTM, ARIMA,

SARIMA,CNN

Trong dự báo, mỗi mô hình đều có những ưu điểm và nhược điểm riêng Hy vọnggiúp làm tăng độ chính xác của các thuật toán trong dự báo đồng Bitcoin, trong đề tàinày đề xuất sử dụng kết hợp Grid Search với LSTM, ARIMA, SARIMA, CNN giúpđạt được nhiều khả quan hơn, trong chương này việc đề xuất mô hình kết hợp GridSearch với các mô hình riêng lẻ để tìm kiếm tham số tối ưu hơn, chứng minh mô hìnhkết hợp này mang lại kết quả tốt hơn

3.1 Giới thiệu

Do nhu cầu về dự báo giá Bitcoin ngày càng được chú trọng, thực nghiệm các phương

pháp đề lựa chọn mô hình nào cho kết quả khả quan hơn cũng là thách thức Dữ liệu

trong dự báo đồng Bitcoin là dữ liệu chuỗi thời gian thì thường có 2 yếu tổ là cầu trúc

dữ liệu tuyến tính và cấu trúc dữ liệu phi tuyến tính Trong dự báo đồng tiền mã hóanày dữ liệu được dự báo phan tuyến tính của chuỗi thời gian

Sự kết hợp Grid Search với các mô hình chuỗi thời gian, LSTM, CNN Kết quả thực

nghiệm cho thấy các mô hình có sự kết hợp Grid Search có độ lỗi dự báo ít hơn so

với từng mô hình riêng lẻ, mang lại kết quả tốt hơn trong dự báo đồng Bitcoin

3.2 Các nghiên cứu liên quan

Hiện nay có rất nhiều công trình nghiên cứu được áp dụng với nhiều phương phápkhác nhau dé thực hiện việc dự báo giá đồng Bitcoin dựa vào lịch sử dữ liệu như giábán, ngày giao dịch, giá cao nhất, giá tháp nhất Theo tác giả Hari Krishnan Andi

[22] (2021) dùng mô hình LSTM trong việc dự báo giá Bitcoin, tác giả nghiên cứu

dùng những phương pháp máy học khác nhau, nhận thấy mang lại kết quả chuẩn xáchơn khi dùng máy học LSTM, dự đoán mô hình kết quả của năm 2021 đạt 47.780 và

độ chính xác là 98.32% Nhóm tác giả Siddhi Velankar, Sakshi Valecha, Shreya Maji

[23] (2018) dùng phương pháp hồi quy Bayesian bằng cách chia một phan thành ba

bộ dit liệu với các khoảng liên tiếp có kích thước 180s, 360s, 720s, áp dụng phân cụmk-means để truy xuất 100 cụm cho mỗi kích thước, sau đó sử dụng mẫu Entropy dé

thu hẹp những thứ này xuống còn 20 thứ tốt nhất Sử dụng bộ giá thứ hai dé tính trong

số tương ứng được tìm thấy bằng phương pháp hồi huy Bayesian Bộ giá thứ ba được

Trang 38

sử dụng dé đánh giá thuật toán, bằng cách chạy cùng một hồi quy Bayesian dé đánh

giá các tính năng và kết hợp các giá đó với trọng số Dùng phương pháp GLM/

Random Forest là xây dựng bộ dữ liệu chuỗi ba lần cho 30, 60 và 120 phút (180, 360,

720 điểm dữ liệu tương ứng), chạy GLM/ Random Forest trên từng chuỗi trong hai

bộ dữ liệu chuỗi thời gian riêng biệt, ta được hai mô hình tuyến tính riêng biệt tương,

ứng cho từng tập dữ liệu nhận thấy kết quả đánh giá khả quan hơn

Theo nghiên cứu [10] tác giả Marzieh Rostami được sử dung trong việc dự đoán đồng

Bitcoin, được sử dụng phương pháp máy học, trong bài báo này sử dụng phương pháp

Box-Jenkins, tự phục hồi (AR), trung bình trượt (MA), ARIMA, chức năng tự tươngquan (ACF), chức năng tự tương quan một phần (PACF) và dùng thuật toán tìm kiếmlưới để dự đoán giá Bitcoin và thực hiện việc đánh giá về các mô hình, lỗi dự báo(FE), lỗi dự báo trung bình (MFE), lỗi tuyệt đôi trung bình (MAE), lỗi bình phương(MSE), lỗi bình phương trung bình gốc (RMSE) và cho thấy rằng kết quả nghiên cứu

có độ chính xác trong bài báo này đạt 66% và 65.3%.

Trong [12] của nhóm tác giả Prof Rohini Hanchate, Abhinek Kumar Agarwal,

Tushar Kumar, Shivam Raj, Soham Morajkar (2022) dùng mô hình máy học để dựđoán giá đồng Bitcoin, mô hình LSTM, ARIMA, RNN được sử dụng, đánh giá môhình phổ biến là lỗi bình phương (MSE), lỗi bình phương trung bình gốc (RMSE)

Nhóm tác giả Ning Xue, Isaac Triguero, Grazziela P Figueredo và Dario Landa-Silva

[24] (2019) đã áp dụng mô hình CNN, LSTM, mô hình kết hợp CNN-LSTM, triển

khai và so sánh hai phương pháp meta heuristics: Particle Swarm Optimization (PSO)

và Differential, DE đề phát triển kiến trúc mạng nơ-ron, nhưng ứng dụng của việc sửdung chúng dé phát triển CNN-LSTM có phan hạn chế, nhưng đây là công trình đầutiên sử dụng các thuật toán tiến hóa (DE) dé tự động phát triển kiến trúc của CNN-LSTM cho dự đoán chuỗi thời gian

Nhóm tác giả Emmanuel Dave, Albert Leonardoa, Marethia Jeanicea, Novita

Hanafiah [25] (2020) áp dụng mô hình ARIMA, LSTM su két hợp mô hình LSTM, đánh giá độ chính xác bằng MAPE, RMSE, kết quả thành công mô hình kết

ARIMA-hợp vượt trội hơn các mô hình độc lập khác, đạt được giá tri MAPE là 7,38%.

Trang 39

Nhóm tác giả Behnam Farsi, Manar Amayri, Nizar Bouguila, (Senior Member, leee),

va Ursula Eicker [26] (2021) áp dụng mạng LSTM-CNN song song hoặc PLCNet,

éu suất, RMSE, MAPE và R-binh phương.đánh giá các mô hình đã thử nghiệm với

Kết quả cho thấy các mô hình mạng nơ-ron sâu, đặc biệt là PLCNet, đã cải thiện độ

chính xác từ 83,17% lên 91,18%.

Theo nghiên cứu của nhóm tác giả Kaijian He, Lei Ji, Chi Wai Don Wu, Kwok Fai

Geoffrey Tso [27] (2021) đã áp dụng phương pháp SARIMA, LSTM, CNN, sự kéthợp của mô hình CNN-LSTM, ARIMA-LSTM-CNN được đánh giá bằng MSE,RMSE, kết quả cho thấy hiệu suất của LSTM, CNN kém hơn so với phương pháptruyền thống, CNN được sử dụng để nắm bắt cau trúc dữ liệu phân cấp, trong khiLSTM được sử dụng dé nắm bắt phụ thuộc lâu dài vào dữ liệu, kết quả cung cấp bằng

chứng trong tương lai cho việc sử dụng học sâu và các mô hình khác mà dự báo còn

hạn chế, một phương pháp kết hợp mới lạ SARIMA-LSTM-CNN kết hợp các môhình tuyến tính và phi tuyến khác nhau cung cap kết quả dự báo tốt hơn

3.3 Cách tiến hành

3.3.1 Sơ đồ sử dụng Grid Search với các mô hình

Dữ liệu đầu vào là các giá trị chuỗi thời gian cần được dự báo đã được tiền xử lý thíchhợp cho các mô hình, tức là phải đảm bảo tính dừng trong chuỗi thời gian, tiếp đến là

xử lý dữ liệu bằng sử dụng các mô hình LSTM, ARIMA, SARIMA, CNN thông qua

các giá trị dự báo giá Bitcoin, phần Predicted values phần giá trị được dự báo từ các

mô hình trên, dựa vào các dữ liệu dự đoán để đánh giá độ sai lệch của dự báo, tìm ranhững thông số tốt hơn giữa giá trị dự báo và giá trị được thu thập từ trang web Dữliệu được sử dụng dựa vào tập dữ liệu thử nghiệm để làm nền tảng đánh giá chuẩn

xác khi kết hợp với Grid Search, để dự báo độ sai lệch của mô hình, cho ra các phương

pháp kết hợp Grid Search-ARIMA, Grid Search-SARIMA, Grid Search-LSTM, GridSearch-CNN, tìm ra những giá trị dự đoán lỗi có mức thông số thấp hơn, dựa vàonhững dự báo kết hợp và không kết hợp đề thực thi phần dự báo chung, đánh giá phần

thực nghiệm giữa các mô hình Tìm ra giá trị dự báo tức là đi tìm giá trị dự báo của

các mô hình trừ với giá trị của Grid Search.

Trang 40

Time series data

Grid Search + ARIMA

Grid Search + SARIMA

Grid Search + CNN

Predicted error values

Predicted values Predicted values

Intergrated Prediction

Performance Estimation

Hinh 3.1 So dé sir dung Grid Search với các mô hình

Ngày đăng: 08/11/2024, 17:34