1. Trang chủ
  2. » Luận Văn - Báo Cáo

Luận văn thạc sĩ Công nghệ thông tin: Kết hợp kỹ thuật khai phá dữ liệu và mô hình chuỗi thời gian có chu kỳ dự báo giá Bitcoin

94 0 0
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Kết hợp kỹ thuật khai phá dữ liệu và mô hình chuỗi thời gian có chu kỳ dự báo giá Bitcoin
Tác giả Ngụ Hiền Đạt
Người hướng dẫn PGS.TS Nguyễn Đình Thuận
Trường học Đại học Quốc gia TP HCM
Chuyên ngành Công nghệ thông tin
Thể loại luận văn thạc sĩ
Năm xuất bản 2022
Thành phố TP. Hồ Chí Minh
Định dạng
Số trang 94
Dung lượng 38,47 MB

Nội dung

Việc kết hợp các mô hình nhằm phát huy các thế mạnh của từng môhình phù hợp với tính chất của từng chuỗi thời gian được dự báo đã đem đến nhiềukết quả đầy hứa hẹn.. Việc áp dụng kết hợp

Trang 1

TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN

ID *® CR

NGO HIEN DAT

KET HOP KY THUẬT KHAI PHA DU LIEU VÀ MÔ.

HINH CHUOI THỜI GIAN CO CHU KỲ DỰ BAO GIÁ

BITCOIN

LUAN VAN THAC Si, KHOA LUAN CAO HOC

NGANH CONG NGHE THONG TIN

Mã số: 8.48.02.01

NGƯỜI HƯỚNG DẪN KHOA HỌC PGS.TS NGUYEN ĐÌNH THUAN

TP HÒ CHÍ MINH - 2022

Trang 2

Lời đầu tiên, em xin gởi lời cảm ơn chân thành đến quý thay cô trường Daihọc Công Nghệ Thông Tin đã tận tình dạy bảo cho em nhiều kiến thức bồ ích trongsuốt thời gian học tập tại trường, cũng như tạo điều kiện cho em thực hiện đề tài này.Kính chúc quý thầy cô luôn dồi dào sức khoẻ và thành công trong cuộc sống.

Đặc biệt, em xin bày tỏ lòng biết ơn chân thành, sâu sắc đến thầy Nguyễn ĐìnhThuan Thay đã tận tâm, nhiệt tình hướng dẫn và chi bảo cho em trong suốt quá trìnhthực hiện dé tài Luận văn này sẽ rất khó hoàn thành néu không có sự truyền đạt kiếnthức quý báu và sự hướng dẫn nhiệt tình của thầy

Xin cảm ơn tắt cả bạn bè đã động viên, giúp đỡ và đóng góp nhiều ý kiến quýbáu, qua đó, giúp em hoàn thiện hơn đề tài này

Em xin gửi lời cám ơn đến gia đình đã tạo mọi điều kiện thuận lợi về vật chất

và tỉnh thần, giúp em hoàn thành luận văn một cách tốt nhất

Va cuối cùng, em cũng không quên gửi lời cảm ơn đến tác giả của các báo cáonghiên cứu khoa học mà em đã tham khảo cho để tài

Luận văn đã hoàn thành với một số kết quả nhất định, tuy nhiên vẫn khôngtránh khỏi thiếu sót Kính mong sự đóng góp ý kiến từ quý thầy cô và các bạn

Một lần nữa, em xin chân thành cảm ơn!

TP Hồ Chí Minh, ngày 05 tháng 01 năm 2022

Học viên

Ngô Hiền Dat

Trang 3

Tôi xin cam đoan:

1 Những nội dung trong luận văn nay là do tôi thực hiện dưới sự hướng dẫn của

thầy PGS.TS Nguyễn Đình Thuân

2 Mọi tham khảo trong luận văn đều được trích dẫn rõ ràng tên công trình, têntác giả, thời gian công bó

Mọi sao chép không hợp lệ, vi phạm quy chế đào tạo, tôi xin chịu hoàn toàn trách

nhiệm.

TP Hồ Chí Minh, ngày 05 tháng 01 năm 2022

Học viên

Ngô Hiền Đạt

Trang 4

LOI CAM DOAN

MUC LUC

DANH MỤC CAC KÝ HIỆU, THUAT NGỮ VA CHU VIET TAT

DANH MỤC CAC BANG

DANH MUC CAC HINH VE, DO THI

MG DAU

CHUONG 1 TỎNG QUAN.

Ll Đặt van đề.

1.2 Mục tiêu và phạm vi của luận văn

13 Nội dung và phương pháp nghiên cứu

14 Bồ cục của luận văn

CHƯƠNG 2 CAC PHƯƠNG PHAP, MÔ HÌNH DỰ BAO CHUOI THỜI GIAN

21 Các phương pháp dự báo

22 Dự báo chuỗi thời gian

2.2.1 Khái niệm chuỗi thời gian.

2.2.2 Các tính chất của chuỗi thời gian

2.2.3 Dự báo chuỗi thời gian

2.3 Các phương pháp dự báo chu

243.1 Mô hình tự hồi quy

2.3.2 Mô hình trung bình trượt

Mô hình ARMA

Mô hình ARIMA

Mô hình SARIMA

Phương pháp MLP Phương pháp SVM

Phương pháp kNN-TSPI Phương pháp Box-Jenki 35 Các phương pháp, mô hình được sử dụng để dự 37

24.1 Sử dụng phương pháp thống kê

2.4.2 Sử dụng Machine learning, Deep learning

2.4.3 Sử dụng kết hợp các phương pháp thống kê va Machine learning, Deep

learning +039 2.5 Đánh giá các mô hình dự báo chuỗi thời gian 39

26 Kết chương 4I

Trang 5

BAO CHUOI THỜI GIAN 1.42

34 Kết chương 48 CHƯƠNG 4 ÁP DỤNG CÁC MÔ HÌNH DỰ BAO CHUOI THỜI GIAN CHO DỰ BAO

BITCOIN „49

41 Giới thiệu Bitcoin „40

42 Các nghiên cứu trong dự báo giá Bitcoin 50

43 Tập dữ liệu giá mở cửa của Bitcoin 53

44 Môi trường và công cụ thực nghiém 54

45 Thực nghiệm dự báo giá Bitcoin "3i

4.5.1 Xử lý và biến đôi dữ liệu 55

4.5.2 Chia tập dữ liệu thực nghiệm 55

4.5.3 “Thực nghiệm mô hình ARIMA 56 4.5.4 “Thực nghiệm mô hình SARIMA 59

45.5 Thực nghiệm mô hình MLP „61 4.5.6 “Thực nghiệm mô hình SVM 62

4.5.7 “Thực nghiệm mô hình KNN-TSP’ 63

4.5.8 Thực nghiệm kết hợp mô hình ARIMA với MLP 64

45.9 “Thực nghiệm kết hợp mô hình ARIMA với SVM .ÓÓ 4.5.10 “Thực nghiệm kết hợp mô hình ARIMA với kNN-TSPI 67

45.11 “Thực nghiệm kết hợp mô hình SARIMA với MLP 68

4.5.12 hợp mô hình SARIMA với SVM 70

4.5.13 Két hợp mô hình SARIMA và mô hình kNN-TSPI S71

4.5.14 So sánh kết quả thực nghiệm 72

4.5.15 Thực nghiệm các mô hình cho dự báo dài hạn T1

4.5.16 So sánh thời gian thực thi các mô hin 81

4.6 So sánh kết quả với các công trình liên quan 82

47 Kết chương 85 CHƯƠNG 5 KET LUẬN VÀ HƯỚNG PHÁT TRIEN 86 5.1 Các kết quả đạt được 86

52 Một số hướng phát t Ñ7

Trang 6

TAI LIEU THAM KHAO

Trang 7

: Autoregressive Intergrated Moving Average : Autoregressive Move Average

: Bayesian Information Criterion : Phương pháp Box — Jenkins : Convolutional Neural Network : Deep Neural Decision Trees :Deep Recurrent Convolution Neural Network

:Deep Learning Linear Support Vector Machines

: Feedforward Neural Network :Generalized AutoRegressive Conditional Heteroskedasticity

: General regression neural network : Gated Recurrent Unit

: K-Nearest Neighbors Time Series Prediction with Invariances

: Hồi quy tuyến tính

: Long Short-Term Memory :Moving Average

Trang 8

: Support Vector Regression

: Chuỗi thời gian

: Vector autoregression : Vapnik-Chervonenkis

Trang 9

Bang 4.1 Các tiêu chuẩn kiểm định của một số mô hình ARIMA

Bảng 4.6 Độ lỗi dự báo của một số mô hình MLP

Bảng 4.7 Kết qua dự báo mô hình MLP

Bảng 4.8 Kết quả dự báo mô hình SVM

Bảng 4.9 Kết quả dự báo mô hình kNN-TSPI

Bang 4.10 Kết quả dự báo kết hợp mô hình ARIMA với MLP

Bảng 4.11 Kết quả dự báo kết hợp mô hình MLP với ARIMA

Bảng 4.12 Kết quả dự báo kết hợp mô hình ARIMA và SVM

Bang 4.13 Kết quả dự báo kết hợp mô hình SVM và ARIMA

Bảng 4.14 Kết quả dự báo kết hợp mô hình ARIMA và kNN-TSPI

Bang 4.15 Kết quả dự báo kết hợp mô hình kNN-TSPI và ARIMA

Bảng 4.16 Kết quả dự báo kết hợp mô hình SARIMA và MLP

Bang 4.17 Kết quả dự báo kết hợp mô hình MLP và SARIMA

Bang 4.18 Kết quả dự báo kết hợp mô hình SARIMA va SVM

Bảng 4.19 Kết quả dự báo kết hợp mô hình SVM và SARIMA

Bang 4.20 Kết quả dự báo kết hợp mô hình SARIMA và kNN-TSPI

Bảng 4.21 Kết quả dự báo kết hợp mô hình kNN-TSPI và SARIMA

Bang 4.22 So sánh độ lỗi dự báo của các mô hình dự báo giá Bitcoin trong 359 ngày từ

ngày 08/11/2019 tới ngày 31/10/2020

Bảng 4.23 So sánh độ lỗi dự báo của các mô hình dự báo giá Bitcoin trong 359 ngày

01/11/2020 tới ngày 25/10/2021 TS

Bảng 4.24 So sánh độ lỗi dự báo của các mô hình dự báo giá Bitcoin trong 718 ngày trên

toàn tập dữ liệu thử nghiệm 76

Bảng 4.25 So sánh độ lỗi dự báo của các mô hình dự báo giá Bitcoin trong dài hạn

Trang 10

Hình 2.1 Chuỗi thời gian doanh số dược phẩm bán được hàng tháng

Hình 2.2 Chuỗi thời gian giá mở cửa của Bitcoin

Hình 2.3 Chuỗi thời gian không dừng

Hình 2.4 Chuỗi thời gian dừng

Hình 2.5 Kiến trúc mạng nơron nhân tạo

Hình 2.6 Mô hình mạng nơron nhiều tầng truyện thang

Hình 2.7 Khoảng cách phân lớp SVM

Hình 2.8 Các giá trị nhiễu trong tập dữ liệu phân lớp

Hình 2.9 Các đôi tượng phân bố đan xen nhau

Hình 3.1 Mô hình kết hợp ARIMA và mạng noron

Hình 3.2 Sơ đồ luồng xử lý kết hợp mô hình ARIMA, SARIMA với các phương pháp MLP,

25/10/2021 bằng mô hình ARIMA(5,0,4) 59

Hình 4.5 Biểu dé dự báo giá mở cửa Bitcoin trong 718 ngày từ ngày 08/11/2019 đên ngày

25/10/2021 bằng mô hình SARIMA (0,0,1)(0,0,0)0, ‘n’ 60 Hình 4.6 Biểu đồ dự báo giá mở cửa Bitcoin trong trong 718 ngày từ ngày 08/11/2019 đến

Trang 11

25/10/2021 bằng kết hop mô hình kNN-TSPI và ARIMA 68 Hình 4.12 Biểu đồ dự báo giá mở cửa Bitcoin trong 718 ngày từ ngày 08/11/2019 đên ngày

25/10/2021 bằng kết hợp mô hình SARIMA và MLP 69 Hình 4.13 Biéu đồ dự báo giá mở cửa Bitcoin trong 718 ngày từ ngày 08/11/2019 đên ngày

25/10/2021 bằng kết hợp mô hình ARIMA và SVM 7 Hình 4.14 Biéu đồ dự báo giá mở cửa Bitcoin trong 718 ngày từ ngày 08/11/2019 đên ngày

25/10/2021 bằng kết hợp mô hình SARIMA và kNN-TSPI 72

Hình 4.15 Biểu dé dự báo giá mở cửa Bitcoin trong 6 năm (2190 ngày) ngày từ ngày

19/01/2016 đến ngày 16/01/2022 bằng mô hình kNN-TSPI 81

Hình 4.16 Biểu đồ dự báo giá mở cửa Bitcoin trong 6 năm (2190 ngày) ngày từ ngày

19/01/2016 đến ngày 16/01/2022 bằng mô hình kết hợp SVM-SARIMA 81 Hình 4.17 Biểu đồ so sánh thời gian thực thi của các mô hình dự báo trong 718 ngày tiếp

theo 82

Trang 12

Ngày nay, cùng với sự phát triển của các thuật toán khai phá dữ liệu giúp cho việc dựbáo trở thành một cơ sở đáng tin cậy giúp con người có thêm cơ sở đề đưa ra quyếtđịnh, lựa chọn những giải pháp phù hợp trong quản lý, trong kinh tế, xã hội, Và dựbáo đang trở thành một trong những vấn đề được ưu tiên hàng đầu ở hầu hết các lĩnhvực Trong các bài toán dự báo, mọi người ngày càng quan tâm đến các dự báo liênquan đến chuỗi thời gian như dự báo giá vàng, chứng khoán, tiền điện tử, nhu cầunăng lượng, vì những lợi ích lớn về kinh tế mà chúng mang lai.

Bài toán dự báo chuỗi thời gian (time-series forecasting) ra đời đề giải quyết vấn

đề trên Dự báo chuỗi thời gian là việc sử dụng mô hình đề dự đoán sự kiện theo thờigian dựa vào các sự kiện đã biết trong quá khứ, để từ đó dự đoán các sự kiện trước

khi nó xảy ra trong tương lai.

Với tầm quan trọng của dự báo chuỗi thời gian, các nhà nghiên cứu đã đưa ranhiều phương pháp đề giải quyết bài toán này Từ các mô hình dự báo thống kê nhưARIMA, AR, MA và GARCH đến các mô hình máy học như SVM, MLP, RNN,CNN Và trong những năm gan đây, việc kết hợp các mô hình dự báo lại với nhaunhằm tăng độ chính xác dự báo ngày càng được quan tâm và được nhiều nhóm tácgiả thực hiện Việc kết hợp các mô hình nhằm phát huy các thế mạnh của từng môhình phù hợp với tính chất của từng chuỗi thời gian được dự báo đã đem đến nhiềukết quả đầy hứa hẹn

Việc áp dụng kết hợp các thuật toán thống kê, mô hình chuỗi thời gian có tính

chu kỳ và các thuật toán máy học cho bài toán dự báo chuỗi thời gian được kỳ vọng

sé giải quyết một số thách thức của bài toán này, đặc biệt là nâng cao độ chính xác

dự báo Luận văn sẽ trình bày các mô hình thống kê ARIMA, mô hình chuỗi thời gian

có tính chu kỳ SARIMA và một số mô hình Machine Learning như MLP, SVM vàkNN-TSPI Sau đó, các phương pháp kết hợp mô hình thống kê ARIMA, mô hình

SARIMA và các mô hình Machine Learning được mô tả ở trên với kỳ vọng nâng cao

độ chính xác dự báo chuỗi thời gian Các mô hình dự báo sẽ được thử nghiệm để dựbáo giá mở cửa của Bitcoin trong các ngày kế tiếp trên tập dữ liệu thử nghiệm dé

đánh giá độ chính xác dự báo của các mô hình.

Trang 13

CHƯƠNG1 TONG QUAN

1.1 Dat vấn đề

Ngày nay, việc dự báo ngày càng có vai trò quan trong và được áp dụng rộng khắp ởhầu hết các lĩnh lực kinh tế, tài chính, môi trường, y hoc Một phương pháp dự báohiệu quả sẽ đem lại rất nhiều giá trị về mặt kinh tế, giúp tiết kiệm được chỉ phí, rútngắn thời gian đầu tư và tối đa hóa lợi nhuận Trong những năm gan đây, trong lĩnhvực kinh tế, tài chính ngày càng có nhiều công trình dự báo về chứng khoán, tiền điện

tử và đặc biệt việc dự báo về tiền mã hóa đang nhận được nhiều sự quan tâm hơn cả.Bitcoin là một loại tiền điện tử đang tạo nên cơn sốt cho các nhà đầu tư trên toàn cầu

và ngay tại Việt Nam Trong một báo cáo mới đây, Chainalysis đã công bó danh sách

25 quốc gia kiếm được nhiều lợi nhuận nhất từ sự tăng trưởng của Bitcoin trong năm

2020 Xét trên bình diện toàn cầu, Việt Nam đứng thứ 13 thế giới về mức độ kiếm lờiliên quan đến Bitcoin Việt Nam cũng là quốc gia đứng thứ 4 về lợi nhuận thu được

từ tiền mã hóa, chỉ sau Trung Quốc, Nhật Bản và Hàn Quốc [1] Qua đó ta thấy đượcBitcoin ngày càng thu hút được sự quan tâm của các nhà đầu tư và đang dần trở thànhmột kênh đầu tư hấp dẫn Một trong những vấn dé chính của việc đầu tư tiền điện tử

là sự biến động rat lớn về giá nên rất cần có mô hình có thé dự đoán trước giá củaBitcoin từ đó làm cơ sở giúp các nhà đầu tư có thé tối đa hóa lợi nhuận

1.2 Mục tiêu và phạm vi của luận văn

Mục tiêu của luận văn là nghiên cứu, áp dụng các mô hình chuỗi thời gian, các

kỹ thuật khai phá dữ liệu cho bài toán dự báo chuỗi thời gian với kỳ vọng nâng cao

độ chính xác dự báo Luận văn đề ra những mục tiêu, phạm vị cụ thể như sau:

e Tim hiểu các mô hình dự báo chuỗi thời gian đơn biến ARIMA , mô hìnhSARIMA với mục tiêu thực hiện các dự báo ngắn hạn

® Tim hiéu các kỹ thuật khai phá dữ liệu MLP, SVM, và kNN-TSPI áp dụng

cho dự báo chuỗi thời gian đơn biến với mục tiêu thực hiện các dự báongắn hạn

Trang 14

© Nghiên cứu kết hợp mô hình ARIMA, SARIMA và các kỹ thuật MLP,

SVM và kNN-TSPI đê xây dựng mô hình dự báo dựa trên chuỗi thời gian

để nâng cao độ chính xác dự báo

Thử nghiệm các mô hình dự báo trên tập dữ liệu chuỗi thời gian đơn biến

để đánh giá độ chính xác dự báo của các mô hình

Qua đó đề xuất được mô hình dự báo phủ hợp dé dự báo giá Bitcoin trongngắn hạn

1.3 Nội dung và phương pháp nghiên cứu

Để đạt được các mục tiêu đặt ra, luận văn tiến hành thực hiện các nội dung sau:

°

°

Khảo sát, tổng quan các phương pháp, kỹ thuật trong bài toán dự báo chuỗithời gian bao gồm các mô hình ARIMA, SARIMA

Khảo sát, nghiên cứu các thuật toán khai phá dữ liệu MLP, SVM,

kNN-TSPI dé giải quyết bài toán dự báo chuỗi thời gian

Nghiên cứu các phương pháp kết hợp ARIMA, SARIMA và các kỹ thuậtkhai phá dữ liệu MLP, SVM và kNN-TSPI đề nâng cao độ chính xác dự

báo.

Thực nghiệm các mô hình dự báo trên tập dữ liệu giá Bitcoin để dự báo giá

mở cửa của Bitcoin trong các ngày tiếp theo

Ngôn ngữ lập trình Python, thư viện Anaconda.

1.4 Bố cục của luận văn

BO cục của luận văn gôm các chương sau:

© Chương 1 Tổng quan: Giới thiệu dé tài, lý do chọn dé tài, mục tiêu,

phạm vi và nội dung thực hiện của dé tài

© Chương 2 Các phương pháp, mô hình dự báo chuỗi thời gian: Trìnhbày cơ sở lý thuyết, cách áp dụng các phương pháp, mô hình dự báochuỗi thời gian được áp dụng trong đề tài

© _ Chương 3 Kết hợp mô hình ARIMA, SARIMA với một số mô hình

để nâng cao độ chính xác dự báo: Giới thiệu phương pháp kết hợp mô

Trang 15

hình ARIMA, SARIMA và các phương pháp MLP, SVM và kNN-TSPI

để tìm ra mô hình có độ dự báo tốt hơn

© Chương 4 Tiến hành thực nghiệm và kết quả dự báo cho các mô

hình chuỗi thời gian cho dự báo giá Bitcoin: Tiến hành thực nghiệmcác mô hình dự báo chuỗi thời gian trên dit liệu giá Bitcoin đê dự báo giá

mở cửa của Bitcoin trong các ngày kế tiếp

© _ Chương 5 Kết luận và hướng phát triển

© Danh mục công bố khoa học của tác giả

e Tài liệu tham khảo

Trang 16

CHƯƠNG2_ CÁC PHƯƠNG PHÁP, MÔ HÌNH DỰ BAO

CHUOI THỜI GIAN

Dự báo chuỗi thời gian được áp dụng rộng rãi trong rất nhiều lĩnh vực Các mô hình

dự báo chuỗi thời gian đang được tập trung nghiên cứu và phát triển dé đáp ứng cácyêu cầu dự báo Chương này sẽ trình bày chỉ tiết một số mô hình dự báo chuỗi thờigian như mô hình thống kê gồm AR, MA, ARIMA hay mô hình máy học gồm MLP,SVM, kNN-TSPI đồng thời các phương pháp, mô hình đã được áp dụng vào dự đoán

giá Bitcoin cũng sẽ được trình bày.

2.1 Các phương pháp dự báo

Căn cứ vào độ dài thời gian dự báo có thể phân làm 3 loại:

Dự báo dài hạn: Là những dự báo có thời gian dự báo từ 5 năm trở lên Thường được

dùng dé dự báo những mục tiêu, chiến lược về kinh tế chính trị, khoa học kỹ thuậttrong thời gian đài ở tầm vĩ mô

Dự báo trung hạn: Là những dự báo có thời gian dự báo từ 3 đến 5 năm Thườngphục vụ cho việc xây dựng những kế hoạch trung hạn về kinh tế văn hoá xã hội ởtầm vi mô và vĩ mô

Dự báo ngắn hạn: Là những dự báo có thời gian dự báo dưới 3 năm, loại dự báo nàythường dùng dé dự báo hoặc lập các kế hoạch kinh tế, văn hoá, xã hội chủ yếu ở tam

vi mô và vĩ mô trong khoảng thời gian ngắn nhằm phục vụ cho công tác chỉ đạo kịp

thời.

Dựa vào phương pháp dự báo chia làm 2 nhóm chính:

Các phương pháp dự báo định tính: Là các phương pháp dự báo dự báo bằng cách

phân tích định tính dựa vào suy đoán, cảm nhận Các phương pháp này phụ thuộc

nhiều vào trực giác, kinh nghiệm của các nhà dự báo, chỉ mang tính phỏng đoán,không định lượng Là phương pháp đơn giản, dé thực hiện, chỉ phí thấp Một trongnhững phương pháp tiêu biểu cho phương pháp định tinh là dự báo bằng phương phápchuyên gia Phương pháp chuyên gia là phương pháp dự báo dựa trên cơ sở tổng hợp

Trang 17

các ý kiến, kinh nghiệm và ước tính xác suất chủ quan của các chuyên gia trong lĩnhvực được nghiên cứu Phương pháp này được sử dụng trong trường hợp thiếu dữ liệulịch sử, không có cơ sở nào để dự báo [3].

Các phương pháp dự báo định lượng: Là các phương pháp dựa vào số liệu thống

kê và thông qua các công thức toán học được thiết lập dé dự báo Một trong nhữngphương pháp tiêu biéu cho phương pháp định lượng là phương pháp dự báo chuỗi

thời gian.

2.2 Dự báo chuỗi thời gian

2.2.1 Khái niệm chuỗi thời gian

Chuỗi thời gian (time series) là một chuỗi các quan sát được định hướng theo thời

gian hay sắp xếp theo trình tự thời gian về một biến số quan tâm Trong toán học,chuỗi thời gian được định nghĩa là một vector x(t), t = 0, 1, 2, với t đại điện cho cácđiểm thời gian Biến x(t) được xem như một biến ngẫu nhiên [4]

Hình 2.1 Chuỗi thời gian doanh số dược phẩm ban được hang tháng

Nguồn: Một số ví dụ về chuỗi thời gian [5]

Một chuỗi thời gian được gọi là đơn biến nếu tại mỗi điểm dữ liệu chỉ bao gồmmột biến duy nhất Ngược lại, nếu tại mỗi điểm dữ liệu gồm nhiều hơn một biến thì

Trang 18

chuỗi thời gian đó được gọi là đa biến Ví dụ, chuỗi thời gian là giá mở cửa củaBitcoin theo từng ngày là chuỗi thời gian đơn biến, còn chuỗi thời gian là giá mở cửa,giá đóng cửa, giá cao nhất, giá thấp nhất theo từng ngày là chuỗi thời gian đa biến.

Bitcoin pice from 2012 to 2021

— Open

10000

xe xo xả: mis ie xu mie zie Ey xa Ea

Hình 2.2 Chuỗi thời gian giá mở cửa của Bitcoin

Nguồn: Dữ liệu giá Bitcoin thu thập trên Investing.com

2.2.2 Các tính chất cúa chuỗi thời gian

Do dữ liệu chịu ảnh hưởng bởi tính chất thời gian nên một chuỗi thời gian thườngxuất hiện những quy luật đặc trưng như: xu hướng (trend), chu kỳ (cyclical), mùa(seasonal), biên đồi ngẫu nhiên (irregular) [4]:

© Sw tăng, giảm hoặc không thay đổi của một chuỗi thời gian trong một thời

gian đài được gọi là xu hướng Tính xu hướng là chỉ ra sự vận động lâu

dai của một chuỗi thời gian

e _ Chu kỳ là sự thay đôi của chuỗi thời gian trong một khoảng thời gian dàitrung bình và sự thay đồi này được lặp lại sau khoảng thời gian đó Thong

thường, khoảng thời gian của một chu kỳ lớn hơn 2 năm.

© Mùa là sự thay đổi của chuỗi thời gian theo một khoảng thời gian ngắn,

thường là trong một năm.

¢ _ Biến đổi ngẫu nhiên được gây ra bởi những tác động không thé đoán trước,

không thường xuyên và cũng không theo một quy luật nào.

Trang 19

2.2.3 Dự báo chuỗi thời gian

Dự báo chuỗi thời gian là việc mô hình hóa dữ liệu, ước lượng các tham số của

mô hình dựa trên những dữ liệu chuỗi thời gian trong quá khứ, từ đó đưa ra dự báo

về các giá trị của chuỗi thời gian trong tương lai Do đó, dit liệu thời gian trong quákhứ ảnh hưởng rat lớn đến quá trình xây dựng mô hình Trong dự báo chuỗi thời gian,vẫn còn nhiều thách thức đang chờ các nhà khoa học tiếp tục nghiên cứu, giải quyết:

© Dau tiên phải kể đến tính chất của dữ liệu chuỗi thời gian với 4 tính chấttiêu biểu là là tính xu thế, chu kỳ, theo mùa và biến đổi ngẫu nhiên làmcho việc xử lý dữ liệu và dự báo gặp nhiều khó khăn Đề dự báo trên dữliệu chuỗi thời gian, các phương pháp dự báo phải phân tích tốt các tínhchất này Tuy nhiên, hiện nay chưa có phương pháp nào thực sự tốt cho

việc phân tích này.

© Một trong những thách thức khó giải quyết nhất của đữ liệu chuỗi thờigian là tính biến đổi ngẫu nhiên Có nghĩa là các dữ liệu mang tính thờigian dễ chịu tác động bởi các yếu té bên trong lẫn bên ngoài, biến đổi mộtcách ngẫu nhiên, không theo quy luật Đề xác định dữ liệu chuỗi thời gian

có bị biến đổi ngẫu nhiên hay không là một thách thức lớn cho các nhà

nghiên cứu.

© Các phương pháp, kỹ thuật dự báo chuỗi thời gian được dé xuất thườngchỉ phù hợp một số đạng dữ liệu nhất định như tuyến tính hoặc phi tuyến[6] Những phương pháp kết hợp các mô hình riêng lẻ để nâng cao độchính xác dự báo là hết sức cần thiết Tuy nhiên, kết hợp như thế nào vàkhi nào là vấn dé cần được xem xét kỹ để đem đến kết quả dự bao tốt nhất

2.3 Các phương pháp dự báo chuỗi thời gian

2.3.1 Mô hình tự hồi quy

Mô hình tự hồi quy (Autoregressive - AR) là một mô hình được sử dụng phỏ biếntrong thống kê, kinh tế lượng và xử lý tín hiệu Mô hình này dự báo giá trị tương laicủa chuỗi thời gian dựa vào một hoặc nhiều giá trị trong quá khứ của chuỗi thời gian

Trang 20

cộng với giá trị ngẫu nhiên, được gọi là nhiễu trắng (white noise) Mô hình tự hồi quy

AR bậc p— AR(p) là một quá trình tuyến tính được xác định bởi phương trình [7]:

NCH LP Oia + &e = C+ Dryrit ỦạYc2 + + ÕpYcp + & (2.1)

với y: là giá trị tại thời điểm t, c là hằng sé, Ø, là hệ số tự tương quan tại các thời điểmt-1, t-2, , tp trước đó và e; là một số hạng sai số ngẫu nhiên không tương quan, cógiá trị trung bình bằng 0 và phương sai không đổi ø Giá trị của y ở thời điểm t phụthuộc vào chính giá trị của y ở thời điểm trước đó cộng với một sai số ngẫu nhiên nào

đó tại thời điểm t (£,)

2.3.2 Mô hình trung bình trượt

Thay vì sử dụng các giá trị trong quá khứ của chuỗi thời gian để dự báo như mô hình

AR, mô hình trung bình trượt (Moving Average - MA) sử dụng các lỗi dự báo trước

đó (số hạng sai số ngẫu nhiên) và giá trị trung bình của chuỗi thời gian dé dự bao

Một mô hình trung bình trượt MA bậc q — MA(q) được xác định bởi phương trinh[7]:

yi=c+ Xi o O Epp = C + Gr + OyEr-1 + Öybc2+ c + Ổp—aEca (2.2)

với c là hằng số và là giá tri trung bình của chuỗi, 0; là trọng số của các số hạng sai

số ngẫu nhiên tại các thời điểm t, t-1, , t-q, & là một số hạng sai số ngẫu nhiênkhông tương quan, có giá trị trung bình bằng 0 và phương sai không đổi ø

2.3.3 Mô hình ARMA

Giả sử một chuỗi thời gian tuân theo cả quá trình tự hồi quy và trung bình trượt, chúng

ta có thé kết hop hai mô hình lại với nhau, gọi là mô hình ARMA (AutoregressiveMoving Average) đề biểu diễn chuỗi thời gian như sau [8]:

y= Ot DP iyi + y + Dig Ôi Eri (2.3)

với 0; # 0, Ø; #0 vaa? > 0.

2.3.4 Mô hình ARIMA

Mô hình Autoregressive Intergrated Moving Average (ARIMA) là một mô hình

thống kê được sử dụng phổ biến trong dự báo chuỗi thời gian Có một số khái niệm

ta cần hiểu trước khi tìm hiểu về mô hình ARIMA là chuỗi có tinh dừng và chuỗikhông có tính dừng Chuỗi thời gian có định hay còn gọi là chuỗi thời gian có tính

Trang 21

dừng là chuỗi mà các thuộc tính của chuỗi không phụ thuộc vào thời gian của chuỗi

đang xét [7] Ngược lại nếu chuỗi thời gian có tính xu hướng hoặc tính thời vụ thì làchuỗi không dừng vì xu hướng và tính thời vụ sẽ ảnh hưởng đến giá trị của chuỗi thờigian ở các thời điểm thời gian khác

Tom lại, một chuỗi thời gian dừng sẽ có giá trị trung bình và hiệp phương sai không

đổi Một chuỗi thời gian {Y:} có tính dừng nếu thỏa mãn hai tính chất [5]:

(I) EM) = wy()

(2) CovŒ,, Y,.) = Ve(t)

Hình 2.3 Chuỗi thời gian không dừng Hình 2.4 Chuỗi thời gian dừng

Nguồn: Mô hình ARIMA [7] Nguồn: Mô hình ARIMA [7]

Để xác định một chuỗi thời gian có tính dừng hay không ngoài việc dựa vào đồthị của chuỗi thời gian ta có thể dựa vào đồ thị hàm tự tương quan mẫu hoặc kiểm

định Dickey — Fuller:

© = Dựa vào dé thi của chuối thời gian: Một cách trực quan, chuỗi thời gian

có tính dừng nếu như đồ thị của chuỗi thời gian cho thấy giá trị trung bình

và phương sai của chuỗi thời gian không thay đổi theo thời gian

® Dua vào hàm tự twong quan mẫu (Sample Auto Correlation — SAC): Néu

đồ thị của ham tự tương quan mẫu của một chuỗi thời gian giảm nhanh vàtắt dần về 0 thì chuỗi có tính dừng

e Dựa vào kiểm định Dickey — Fuller: xác định xem chuỗi thời gian có phải

là Bước ngẫu nhiên (Random walk, tức là Ÿ, = Y,_; + e,) hay không Nếuchuỗi thời gian là một Random walk thì không có tính dừng

Trang 22

Các mô hình dự báo chuỗi thời gian như AR, MA, ARMA là những mô hình tuyếntính Vì thế, khi áp dụng các mô hình này thì chuỗi thời gian phải là chuỗi dừng để

y= Ve —c~1 (2.4)với y" là chuỗi thời gian sau khi lay sai phân bậc 1, y, va ye là gid tri chuỗi thời giantại thời điểm t và t-I

Trong trường hợp cần lấy sai phân bậc 2 đề cho chuỗi thời gian dừng thì sai phân

bậc 2 được tính bởi công thức:

yee Wea (2.5)

Sau khi chuỗi thời gian đã dừng, mô hình ARIMA (AutoRegressive Integrated

Moving Average) được sử dụng đề dự báo cho chuỗi thời gian dừng sau khi lấy saiphân Một mô hình ARIMA được biểu diễn bởi phương trình [7]:

yr=e + Dyy'eite + Opy'ep + Oyer1 ++ + Ogg + & (2.6)

Mô hình ARIMA (p, d, q) gồm 3 thành phan:

e AR (Autoregressive) là mô hình tự hồi quy biểu diễn sự phụ thuộc của

điểm thời gian đang xét vào một số điểm thời gian trước đó (p)

¢ I (integrated) là số lần lấy sai phân đề chuỗi thời gian có tính dừng (d).

® MA (Moving Average) là mô hình trung bình trượt biểu diễn sự phụ thuộc

của điểm thời gian đang xét vào một vài số hạng sai số ngẫu nhiên và giátrị trung bình của các điểm thời gian trước đó (q)

Trang 23

Mô hình SARIMA (Seasonal Autoregressive Moving Average) tổng quát có dạng

SARIMA@.d.q)(P.D.Q)s [9].Trong đó:

(p, d, q) : là các yếu tố xu hướng tương tự như mô hình ARIMA

e =p: Thứ tự tự động phục hoi xu hướng.

ed: Thứ tự chênh lệch xu hướng.

© _q: Thứ tự đường trung bình xu hướng

Mô hình đã bồ sung thêm 4 tham số mới hay còn gọi là các yếu tố theo mùa bao gồm:

e P: thành phan hỏi quy theo mùa (AR),

© D: bậc sai phân theo mùa (1),

e Q:làthành phần trung bình trượt theo mùa (MA),

© _ s là số kỳ trong 1 vòng chu kỳ, ví dụ s = 12 khi chuỗi dữ liệu có chu ky theo

tháng.

'Việc khảo sát các biểu đồ tự tương quan Auto Correlation Function (ACF) và biểu

đồ tự tương quan riêng từng phần Partial Autocorrelation Function (PACF) là bội sốcủa độ dài mùa s sẽ giúp tìm được các giá trị P, Q phù hợp với mô hình Đối với cácthành phần mùa MA, biểu đồ ACF cho thấy một đỉnh nhọn ở các trễ mùa, còn đối với

thành phần mùa AR thì biểu đồ PACF thé hiện đỉnh nhọn này Dạng mô hình nhân

tinh (multiplicative model) trên cho phép đưa số hạng bổ sung (extra term) vào môhình mà không phải tăng thêm tham só

Giá trị d, D lần lượt được xác định dựa vào số lần lấy sai phân bình thường và saiphân có tính mùa để tiền xử lý dữ liệu (làm cho chuỗi dừng)

Trang 24

2.3.6 Phương pháp MLP

Là một lớp của feedforward artificial neural network (ANN) Một Multilayer

Perceptron (MLP) bao gồm ít nhất 3 lớp: input layer, hidden layer và output layer

[10] MLP sử dụng một kỹ thuật học tập có giám sát được gọi là backpropagation đê dao tạo [11].

Một mang Neural được cấu thành bởi các Neural đơn lẻ được gọi là các perceptron.Một perceptron sẽ nhận một hoặc nhiều giá trix đầu vào dạng nhị phân và cho ra mộtkết quả dạng nhị phân duy nhất Các đầu vào được điều phối bởi các tham số trọnglượng tương ứng w của nó, còn kết quả đầu ra được quyết định dựa vào một ngưỡngquyết định b nào đó

Kiến trúc mang Neural nhân tạo

Mạng Neural là sự kết hợp của của các tầng perceptron hay còn được gọi là perceptron

đa tầng (multilayer perceptron) như hình vẽ bên dưới

Trang 25

Nguồn: Deep Feed Forward Neural Network!

Một mang Neural sẽ có 3 loại tầng:

Tầng vào (input layer): Là tang bên trái cùng của mạng thé hiện cho các đầu vào của

mạng.

Tầng ra (output layer): Là tầng bên phải cùng của mạng thể hiện cho các đầu ra của

mạng.

Tang ân (hidden layer): Là tang nằm giữa tang vào và tang ra thé hiện cho việc suy

luận logic của mạng.

Một Neural chỉ có 1 tầng vào và 1 tầng ra nhưng có thể có nhiều tầng ẩn

Trong mạng Neural, mỗi nút mạng là một sigmoid Neural nhưng hàm kích hoạt của

chúng có thé khác nhau Tuy nhiên trong thực tế người ta thường dé chúng cùng dangvới nhau đề tính toán cho thuận lợi

6 mễ tầng, số lượng các nút mạng (Neural) có thể khác nhau tuỳ thuộc vào từng bài

toán và cách giải quyết Nhưng thông thường số lượng Neural được dé bằng nhau ởcác tầng an Ngoài ra, các Neural ở các tang thường được liên kết đôi một với nhautạo thành mạng kết nối đầy đủ (full- connected network)

Kiến trúc mang Neural MLP

Mô hình mạng noron được sử dung rộng rãi nhất là mô hình mạng nhiều tầng truyềnthăng (MLP: Multi Layer Perceptron) Một mạng MLP tổng quát là mạng có n (n>2)tầng (thông thường tầng đầu vào không được tính đến): trong đó gồm một tầng đầu

ra (tầng thứ n) và (n-1) tầng an

' hutps:/Awww.researchgate.net/

Trang 26

Tang vào

Hình 2.6 Mô hình mạng nơron nhiều tang truyền thing

Kiến trúc của một mạng MLP tổng quát có thê mô tả như sau:

e Đầu vào là các vector (x1, x2, , xp) trong không gian p chiều, đầu ra là các

vector (yl, y2, , yq) trong không gian q chiều Đối với các bài toán phânloại, p chính là kích thước của mẫu đầu vào, q chính là số lớp cần phân loại

¢ = Mỗi neural thuộc tang sau liên kết với tất cả các noron thuộc tầng liền trước

nó.

¢ Đầu ra của neural tầng trước là đầu vào của noron thuộc tang liền sau nó.

Hoạt động của mạng MLP như sau: tại tầng đầu vào các neural nhận tín hiệu vào xử

lý rồi cho ra kết quả; kết quả này sẽ được truyền tới các neural thuộc tang ẩn thứ nhất;các nơron tại đây tiếp nhận các kết quả trên như là tín hiệu đầu vào, xử lý và gửi kếtquả đến tang ẩn thứ 2 Quá trình tiếp tục cho đến khi nhận được kết quả ở tang output.Huấn luyện mạng MLP:

Học là quá trình thay đổi hành vi của các vật theo một cách nào đó làm cho chúng cóthể thực hiện tốt hơn trong tương lai

Một mang neural được huyần luyện sao cho với một tập các vector đầu vào X, mang

có khả năng tạo ra tập các vector đầu ra mong muốn Y Tập X được sử dụng cho huấnluyện mạng được gọi là tập huấn luyện (training set) Các phần tử x thuộc X được gọi

là các mẫu huấn luyện (training example) Quá trình huấn luyện bản chất là sự thay

Trang 27

đổi các trọng số liên kết của mạng Trong quá trình này, các trọng số của mạng sẽ hội

tụ dan tới các giá trị sao cho với mỗi vector đầu vào x từ tập huấn luyện, mạng sẽ cho

ra vector đầu ra y như mong muốn

Các phương pháp huấn luyện:

Có bốn phương pháp học phổ biến là học có giám sát (supervised learning), học không

giám sát (unsupervised learning), học bán giám sát (Semi-Supervised Learning) và học tăng cường (Reinforcement learning).

Học có giám sát: là thuật toán dự đoán đầu ra của một tập dữ liệu dựa trên các cặp(input, outcome) đã biết từ trước Như vậy với học có giám sát, số lớp cần phân loại

đã được biết trước Nhiệm vụ của thuật toán là phải xác định được một cách thứcphân lớp sao cho với mỗi vector đầu vào sẽ được phân loại theo từng lớp cụ thé tương,

ứng.

Học có giám sát được chia thành 2 loại chính:

¢ Phan loại (Classification) : dữ liệu đầu vào được chia thành một số hữu han

«+, XN)}, với (x1, x2, , XN) là vector đặc trưng của mẫu huấn luyện Nhiệm vụ của

thuật toán là phải phân chia tập dữ liệu D thành các nhóm con, mỗi nhóm chứa các

vector đầu vào có đặc trưng giống nhau Như vậy với học không giám sát, số lớp phânloại chưa được biết trước thuật toán sẽ dựa vào cấu trúc của dữ liệu dé thực hiện mộtcông việc nao đó ví dụ như phân nhóm hoặc giảm số chiều của dữ liệu đề thuận tiện

trong việc lưu trữ và tính toán.

Trang 28

Học không giám sát lại được chia thành 2 loại chính:

e Phan nhóm(Clustering): phân nhóm toàn bộ dữ liệu thành các nhóm nhỏ dựa

trên sự liên quan giữa các dữ liệu trong mỗi nhóm

«Ổ Kết hợp (Association): Thuật toán kết hợp khi ta muốn khám phá ra một quy

luật dựa trên nhiều dữ liệu cho trước

Học bán giám sát: được áp dụng đối với bài toán khi có một lượng lớn dữ liệu nhưng.chỉ một phần dữ liệu là được gán nhãn, ví dụ chỉ một phần ảnh được gán nhãn convat trong số rất nhiều ảnh được thu thập từ internet Trên thực tế có rất nhiều bài toánMachine learning thuộc vào nhóm này vì việc thu thập dữ liệu có nhãn sẽ tốn rẤtnhiều thời gian cùng chỉ phí cao và có những loại dữ liệu phải cần đến chuyên giamới có thể gán nhãn được (ví dụ ảnh trong y khoa)

Học tăng cường: là các bài toán giúp cho một hệ thống tự động xác định hành vi dựatrên hoàn cảnh cụ thể đề đạt được lợi ích cao nhất Phương pháp này cụ thể như sau:với vector đầu vào, quan sát vector đầu ra do mạng tính được Nếu kết quả được xem

là “tốt” thì mạng sẽ được thưởng theo nghĩa tăng các trọng số kết nói lên; ngược lạimạng sẽ bị phạt, các trọng số kết nói không thích hợp sẽ được giảm xuống Do đó

học tăng cường là học theo nhà phê bình (critic), ngược với học có giám sát là học

theo thay gido (teacher)

Thuật toán backpropagation: là thuật toán phô biến nhất được áp dung cho học có

giám sát (supervised learning), thuật toán này không chỉ được áp dụng cho các mạng

no ron truyén thang như MLP mà còn được điều chỉnh cho phù hợp với RNN Thuậttoán sử dụng kỹ thuật tìm kiếm theo độ dốc đề giảm thiéu giá tri MSE giữa giá trị đầu

Ta mong muốn so với giá trị thực tế Do thuật toán có thể được mở rộng đến nhiềulớp Thuật toán backpropagation truyền ngược lỗi giữa tín hiệu mong muốn và dau ramạng thông qua mạng Sau khi cung cấp một mẫu đầu vào, đầu ra của mạng sau đóđược so sánh với một mẫu mục tiêu đã cho và được tính toán sai số của mỗi đơn viđầu ra Tín hiệu lỗi này được lan truyền ngược lại va do đó thiết lập nên một hệ thongđiều khiển vòng kín Các trọng số có thể được điều chỉnh bằng thuật toán dựa trên

gradient-descent [11].

Trang 29

2.3.7 Phương pháp SVM

Thuật toán Support Vector Machine (SVM) là một trong những thuật toán phân loại

phi tham số phổ biển nhất Mục tiêu của SVM là giảm kích thước Chervonenkis (VC) bằng cách tìm ra một siêu phẳng (hyperlane) tối ưu dé phân lớp

Vapnik-dữ liệu sao cho khoảng cách (margin) của điểm gần nhất trong mỗi lớp tới siêu phẳng

wx =0 (2.9)

với w, x là hai vector bat kỳ

Khoảng cách (margin) là khoảng cách giữa 2 siêu phẳng đến hai điểm dữ liệu gầnnhất tương ứng với các phân lớp Ví dụ ta có các quả táo và quả lê cùng đặt lên mặtbàn, nếu các quả táo và lê này phân bố không quá đan xen vào nhau và ta có thé dingmột que dai dé phân chia các quả táo và lê này thành hai tập táo lê Trong ví dụ nàythì margin chính là khoảng cách giữa cây que với 2 quả táo và lê gần nó nhất Đểgiảm thiểu việc phân lớp sai, thuật toán SVM luôn lấy margin cực đại để tìm đượcsiêu phẳng tối ưu

Trang 30

kiếm một siêu phẳng tối ưu dé phân lớp nhị phân tương đương với vié fim kiếm mộtsiêu phẳng với khoảng cách lớn nhát dé phân chia các nhóm là tách biệt nhất Người

ta chứng minh rằng một siêu phẳng tối ưu có margin lớn nhất thì siêu phẳng sẽ có Wvới độ lớn bé nhất Van dé tìm siêu phẳng tối ưu được biéu diễn đưới dang bài toántối ưu như sau:

+.

Maximize —

IIizll

subject to y,(W.x, + b) > 1 (2.10)

(Wi 1 <i <n) với n là số điểm dữ liệu cần phân lớp

Bài toán tối ưu trên cũng tương đương bài toán tối ưu sau:

Minimize ee

subject to y¡(W.x; + b) > 1 (2.11) (Vi1<¡<n)

Việc chọn hàm y = : thay thế cho hàm y = = trong bài toán tối ưu vì hàm y =

x thì việc tim minimize của ham này dé dang hơn.

Phương pháp Lagrange multipliers giúp giải quyết các bài toán tối ưu có rangbuộc như bai toán tối ưu margin của SVM Áp dụng phương pháp Lagrangemultipliers cho bài toán tối ưu trên, ta có bài toán tối ưu hàm Lagrange sau:

Trang 31

Class 1 s

wx +b=-1

Hình 2.8 Các giá trị nhiễu trong tập dữ liệu phân lớp

Một cải tiến của thuật toán SVM để giải quyết van đề trên thêm một hằng số C

và margin trong trường hợp này gọi là Soft Margin:

(wl?

Minimize >- + Cys

subject to y(W.x, + b) > 1 — š¡ and&; > 0 (2.13)

(Wil <i<n)

Đường biên phan chia của thuật toán SVM sẽ chịu anh hưởng bởi những diém

thuộc tập hỗ trợ (tập hợp những điểm nằm gần đường biên) Trong trường hợp đường.biên phân chia đúng mọi điêm điểm dữ liệu thì được gọi là bài toán phân loại theo

đường biên cứng (hard margin classification) Tuy nhiên đường biên cứng tỏ ra hạn

chế vì trên thực tế các đối tượng được phân lớp có thể không được phân bó thành cáccụm riêng biệt ma đan xen nhau Do đó, những trường hợp này không thé phân lớp

Trang 32

tuyến tính mà phải phân lớp phi tuyến bằng cách sử dụng một khái niệm gọi là Kernel

KG).

Hình 2.9 Các đối tượng phân bố dan xen nhau

Các tham số trong mô hình SVM: Kernel, Regularization, Gamma và Margin.Một số loại Kernel thường dùng như linear, polynomial hoặc Radial Basic

Function (RBE) Với K(x, rah bài toán tim một siêu phẳng của thuật toán SVM được

biểu diễn lại như sau:

Tham số gamma xác định việc sử dụng bao nhiêu diém dữ liệu cho việc xây dựngsiêu phẳng phân cách Với giá trị gamma nhỏ, các điểm dữ liệu nằm xa đường phân

Trang 33

cách sẽ được sử dụng trong việc tính toán đường phân cách Ngược lại, với giá trị

gamma lớn, chỉ những điểm nằm gần đường phân cách mới được sử dụng đề tính

toán.

Khoảng cách margin đối với các điểm dữ liệu gần nhất của cả 2 lớp càng lớn thì

mô hình càng phân loại chính xác.

SVM có margin tốt : khoảng cách lớn và cân bằng giữa siêu phẳng và các điểm

dit liệu của 2 lớp.

Trong dự báo chuỗi thời gian, một phiên bản của SVM được sử dụng để dự báocác giá trị trong chuỗi thời gian, được gọi là Support Vector Regression (SVR) SVRđược xem như là một ứng dụng của SVM trong bài toán ước lượng hồi quy Chochuỗi thời gian x(£),£ = 1,2 ,n Vector x, = (x), x(t —T), ,x(f — (d— 1)z))với T là thời gian trễ (time delay) và d là số chiều của vector Vector x, được xemnhư một vector mô tả trạng thái của chuỗi thời gian tại thời điểm t Nếu tìm được một

hàm f để mô hình hóa cho chuỗi thời gian này thì giá trị của chuỗi thời gian tại điểm

t+ 1 sẽ được xác định bằng công thức x(t + 1) =

f(x;)-Chuyển đổi chuỗi dữ liệu thời gia thành tập dữ liệu gồm các cặp giá trị(21, V1), (X;, y;), , (Xn Yn) với x; € RTM, y; € R là ngẫu nhiên và độc lập Khi đó,SVR mô tả chuỗi thời gian bằng một hàm có dạng như sau:

ƒŒ)=wW.3+b (2.15)Mục tiêu của mô hình SVR là tìm kiếm một ham f có dạng như trên sao cho độlệch giữa giá trị của hàm f và giá trị thực tế tại các điểm thời gian không vượt một

ngưỡng cho phép e Nói cách khác, SVR không quan tâm những độ lệch bé hơn và

cũng không chấp nhận những độ lệch lớn hơn e Giá trị của W và b được xác địnhbằng cách minimize hàm rủi ro sau:

minimize; \Wi\|? + € Dts Levin ƒŒ)) 2.16)

với Le(y„ƒŒ)) - TT LO a

Trang 34

Sử dụng support vectors, Kernel và Lagrange multipliers của thuật toán SVM đê

tìm giá trị của W và b cho hàm f(x) Hàm số này dùng đê dự báo giá trị tại các điểm

thời gian trong chuỗi thời gian.

Các nghiên cứu [13] (2005) [14] (2012) đã áp dụng SVM trong dự báo chuỗi

chứng khoán Những nghiên cứu này còn kết hợp SVM và mô hình ARIMA để nângcao độ chính xác dự báo Trong một nghiên cứu gần đây, Ferdiansyah [12] (2019) áp

dụng SVM trong dự báo xu hướng tăng giảm của giá Bitcoin trong ngày hiện tại.

Nghiên cứu cho thấy độ chính xác dự báo tốt của SVM, điều đó thể hiện SVM đãnắm bắt được xu hướng thay đôi giá của Bitcoin

2.3.8 Phương pháp KNN-TSPI

Nhóm tác giả [16] (2015) gần đây đã đề xuất một sửa đôi của thuật toán KNN cho dựđoán chuỗi thời gian và đặt tên là KNN- TSPI (K-Nearest Neighbors Time SeriesPrediction with Invariances) Bang cách kết hợp các kỹ thuật về biên độ và sự bấtbiến bù trừ, bất biến phức tap Theo các tác giả , ba bat biến này khi được kết hợp chophép đối sánh có ý nghĩa hơn giữa các truy van tham chiếu va các chuỗi con dữ liệu

tạm thời.

Phương pháp này dựa trên sự tương tự xác định một quan sát dựa trên cơ sở một

quan sát trước đó, do đó sẽ phụ thuộc vào giới hạn của các quan sát trước đó vì

thường một giá trị nhất định không bị ảnh hưởng bởi các giá trị quan sát đã xảy ratrước đó rất lâu Thuat toán được mô tả cụ thể như sau [16]

/* 2 represents a TS with m observations*/

/* 1 is the query length in number of observations*/

/* k indicates the number of similar subsequences */

Trang 35

//sŒÏ is the z-normalization of subsequence sử

1.1.8.3 s' -z scores(S);

// Obtaining the normalized query Q

`

// DJ) contains the complexity-invariant distance

// between Q and sỨ”, for 1 < j < m-l+l

1.1.8.5.D — CID(Q, s');

// Choosing of the k most similar subsequences

1.1.8.6 P - search nearest neighbors (s’,D,k) ;

// Obtaining the next value of each of the k most

sứ”Hi indicates

// similar subsequences € P, where

// the next z-normalized value

trọng cần lưu ýlà chuẩn hóa z được thực hiện độc lập cho mỗi day con và cũng độc

lập cho truy vấn Do đó, tìm kiếm tương tự được thực hiện v‹ ự bat biến đối vớibiên độ và độ lệch Trong dòng thứ 5, tính khoảng cách với độ phức tạp bắt biến giữatruy vấn chuẩn hóa Qvà tất cả các day con có độ dài | đã được chuẩn hóa z Từ đó,trong dòng thứ 6 thực hiện việc tìm kiếm k dãy con giống nhau nhất

Trang 36

Sau đó, ở dòng thứ 7, thu được các giá trị chuẩn hóa z của mỗi k dãy con giống nhaunhất Ở dòng thứ 8, các giá trị này được ánh xạ tới không gian giá trị truy vấn theophương trình (2.18) và được sử dụng bởi hàm dự đoán f (Phương trình 2.17) để tính

giá trị trong tương lai.

Bước 1 Nhận dạng mô hình ARIMA (p, d, q) hoặc SARIMA(p, d, q)(P, D, Q)m:

Xác định các giá trị thích hợp của p và q thông qua hàm tự tương quan riêng phần(PACE) và hàm tự tương quan (ACF) Gia trị d là số lần lấy sai phân để chuỗi thời

gian có tính dừng.

Ham tự tương quan (Autocorrelation Function - ACF) 7, của chuỗi thời gian dừng

Y, thể hiện sự phụ thuộc tuyến tính giữa các cặp quan sát Y(t) và Y(t + k), ứng với

từng độ trễ & = /,2, Với mỗi độ trễ k, hàm tự tương quan tại độ trễ k được xác định

thông qua độ lệch giữa các biến ngẫu nhiên Y(t) và Y(t + k) so với giá trị trung bìnhcủa chuỗi thời gian và được chuẩn hóa qua phương sai của chuỗi thời gian đó Hàm

tự tương quan tại các độ trễ k khác nhau sẽ có giá trị khác nhau Hàm tự tương quan

được định nghĩa như sau [7]:

Trang 37

tự tương quan từng phần tại các độ trễ k khác nhau sẽ có giá trị khác nhau và được

định nghĩa như sau [7]:

đo = 1 và ay = Paw k >1 (2.20)

với jz là thành phần cuối cùng của vector Ó¿

Chọn các giá trị của p tại các độ trễ mà tại đó giá trị của hàm PACF khác không

về mặt thống kê Tương tự, chọn các giá trị của q tại các độ trễ mà tại đó giá trị củaham ACF khác không về mặt thống kê Trong thống kê, các giá trị PACF và ACFkhác không về mặt thống kê thì phải vượt qua khỏi giới hạn +1.96/VT

Bước 2 Ước lượng mô hình: Dựa vào dữ liệu chuỗi thời gian đê tìm các tham sốcủa mô hình tự hồi quy và trung bình trượt Những phương pháp được sử dụng phổbiến đề ước lượng tham số như moments, bình phương tối thiểu (linear least squares),

ước lượng hợp lý cực đại (maximum likelihood) Hiện nay việc ước lượng các tham

số này có thể được thực hiện dễ dàng thông qua các phần mềm thống kê như R,

& =Xy TẤt (2.21)

với e, là phần dư, Y, là giá trị thực tế, Y; là giá trị dự báo

Trong trường hợp có nhiều hơn một mô hình ARIMA phù hợp với dữ liệu chuỗithời gian Khi đó, cần chọn một mô hình ARIMA phù hợp nhất với dữ liệu chuỗi thờigian để dự báo Các tiêu chuẩn AIC (Akaike’s Information Criterion), BIC (BayesianInformation Criterion) giúp hỗ trợ việc kiểm định này Mô hình ARIMA nào có cácgiá trị này bé nhất thì mô hình ARIMA đó sẽ được chọn để dự báo

AIC = —2log(L) + 2 +q+k+1) (2.22)

với L giá trị của ham likelihood trong thống kê, k =1 nếu c #0 và k = 0 nếu c =0

Trang 38

BIC = AI€ + [log(T)— 2](p +q+k+1) (2.23)

Bước 4 Dự báo chuỗi thời gian: Sử dụng mô hình ARIMA hoặc SARIMA phù hợpnhất với tập dữ liệu để dự báo tại các thời điểm t trong tương lai của chuỗi thời gian.Đối với chuỗi thời gian Y, có tính đừng, giá trị dự báo Y, tai thời điểm t cũng chính

là giá trị dự báo của chuỗi thời gian tại thời điểm t Trong trường hợp chuỗi thời gian

Y, không có tính dừng và giả sử để chudi có tính dừng ta lấy sai phân sai phân 1 lầnthi =f,_¡ +"

2.4 Các phương pháp, mô hình được sử dung dé dự báo giá Bitcoin hiện

nay

2.4.1 Sử dụng phương pháp thống kê.

Phương pháp thống kê là một phương pháp được dùng phỏ biến trong các bài toán

dự báo và đối với bài toán dự báo giá Bitcoin cũng đã có nhiều nhóm tác giả áp dụngcác phương pháp thống kê và đạt được kết quả đáng kể Các phương pháp thống kêđược sử dụng phô bién trong dự báo giá Bitcoin là ARIMA, AR, MA và Generalized

AutoRegressive Conditional Heteroskedasticity (GARCH).

Nhóm tác giả Shaily Roy, Samiha Nanjiba, Amitabha Chakrabarty [17] (2018) đã sử

dung các mô hình ARIMA, AR va MA để dự báo giá đóng cửa Bitcoin trong 10 ngàytiếp theo dựa trên dữ liệu chuỗi thời gian từ tháng 06/2013 tới tháng 08/2017, kết quảtốt nhất đạt được khi sử dụng mô hình ARIMA để dự báo với độ chính xác đạt

90.31% Ngoài ra phương pháp ARIMA cũng được các nhóm tác tả [18] (2020) [19]

(2019) sử dung đề thực hiện dự báo giá Bitcoin Nhóm tác giả [19] (2019) đạt được

tỉ lệ lỗi MAPE là 0.87 cho dự báo Bitcoin trong ngày tiếp theo và 5.98 cho 7 ngàytiếp theo

Một số phương pháp thống kê khác cũng được sử dụng trong dự báo giá Bitcoin nhưtác giả [20] (2017) đã sử dụng một số loại mô hình GARCH để dự báo giá đóng cửamỗi ngày của Bitcoin, kết quả cho thay mô hình AR-CGARCH là mô hình tốt nhất

Nhóm tác giả Nashirah Abu Bakar, Sofian Rosbi [21] (2018) đã sử dụng phương pháp

Trung bình trượt có trọng số (Weighted Moving Average) để thực hiện việc dự báo

Trang 39

giá hối đoái (exchange rate) của Bitcoin theo giờ từ ngày 14/12 — 18/12 năm 2017 vàđạt được sai số phan trăm tuyệt đối trung bình (MAPE) là 0.72%.

2.4.2 Sử dụng Machine learning, Deep learning

Các phương pháp Machine learning là các phương pháp hiệu quả để dự báo và đượcđược sử dụng trong nhiều lĩnh vực khác nhau [22] (2019) Đối với dự báo giá Bitcoin

đã có nhiều nhóm tác giả áp dụng các phương pháp Machine learning dé thực hiện

dự báo, các phương pháp Machine learning thường được sử dụng trong dự báo giá Bitcoin là SVM, MLP, LR, RNN, Convolutional Neural Network (CNN), Gated Recurrent Unit (GRU) [23] (2018) [24] (2018) Nhóm tác gia ZheshiChen, ChunhongLi, và WenjunSun [25] (2020) da sử dung các kỹ thuật machine learning

đề dự đoán giá Bitcoin ở các tần số khác nhau, các mô hình Machine learning đã được

sử dụng là Random Forest, XGBoost, Quadratic Discriminant Analysis, Support

Vector Machine and Long Short-term Memory dé dự báo giá Bitcoin trong khoảngthời gian 5 phút, kết qua đạt được vượt trội hơn so với các phương pháp thống kê với

độ chính xác đạt 67.2 % Nhóm tác giả [26] (2020) đã sử dụng các phương pháp

Machine learning dé dé dự đoán giá của 12 loại tiền điện tử có thanh khoản tốt nhấtbao gồm cả Bitcoin Các phương pháp machine learning được sử dụng bao gồm các

phương pháp phân lớp : Logistic regression, SVM, Random forest, và phương pháp

mạng nơ ron nhân tạo ANN Kết quả nghiên cứu chỉ ra rằng việc sử dụng các phươngpháp máy học có triển vọng về dự báo ngắn hạn các xu hướng trên thị trường của tiền

điện tử.

Hiện nay các phương pháp Deep learning khác nhau đã được áp dụng để phát triển

các mô hình dự báo giá Bitcoin, nhóm tác giả [27] (2020) đã sử dụng các phương pháp Deep Recurrent Convolution Neural Network (DRCNN), Deep Neural Decision

Trees (DNDT) va Deep Learning Linear Support Vector Machines (DSVR) để thực

hiện việc dự báo giá Bitcoin và đạt độ chính xác cao từ 92,61-95,27% cho các mô

hình, trong đó mô hình DRCNN đạt kết quả tốt nhất

Trang 40

2.4.3 Sử dụng kết hợp các phương pháp thống kê và Machine learning,

Deep learning

Ngoài áp dụng riêng lẻ các phương pháp thông kê va Machine leaning hoặc Deeplearning thì việc kết hợp 2 phương pháp thống kê và Machine learning và Deeplearning cũng là một phương pháp được áp dụng để tạo ra các mô hình dự báo, nhómtác giả [28] (2006) đã kết hợp các mô hình ARIMA, Vector autoregression (VAR),ANN và SVR đề dự báo tỉ giá hồi đoái, nhóm tác giả [13] (2005), [14] (2012) đã kếthợp mô hình ARIMA và SVM dé dự báo giá cô phiếu và dự báo trong ngắn hạn.Việc áp dụng các mô hình thống kê và Machine learning hoặc Deep learning cũng đã

được áp dụng vào dự báo giá Bitcoin, đã có các nhóm tác giả [29] (2017), [30] (2019),

[31] (2019) cũng đáp áp dụng phương pháp kết hợp các mô hình dé dự báo giáBitcoin Nhóm tác giả [30] (2019) đã đề xuất một mô hình kết hợp Hidden Markov

và LSTM tối ưu hóa thuật toán di truyền dé dự đoán giá Bitcoin Nhóm tác giả [31](2019) đã sử dụng kết hợp các mô hình ARIMA và các mô hình Machine learning

như Feedforward Neural Network (FFNN), CNN, SVR và Long Short-Term Memory

(LSTM) dé thực hiện dự báo gid Bitcoin Kết quả cho thấy hầu hết các mô hình kếthợp đều cho kết quả tốt so với từng mô hình riêng lẻ

2.5 Đánh giá các mô hình dự báo chuỗi thời gian

Để đánh giá, đo lường độ chính xác của các mô hình dự báo chúng ta thường dùngcác độ đo lỗi làm cơ sở đề đánh giá và là thước đo phản ánh giá trị dự báo gần với giátrị thực tế là bao nhiêu Mẫu dự báo có t = 1, 2, , n Ký hiệu giá trị thực tế và giátrị dự báo tương ứng là Y; và %; Các chỉ tiêu được dùng dé đánh giá sự chính xác của

các mô hình được sử dụng là:

Ngày đăng: 24/11/2024, 14:48

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w