Chuyên đề thực tập tốt nghiệp: Ứng dụng mô hình arima và mạng rnn dự báo chuỗi giá đóng cửa của cổ phiếu ngân hàng tmcp ngoại thương việt nam – vcb

Chuyên dé thực tập chuyên ngành Toán Kinh TẾLỜI MỞ ĐẦU Trong thời đại mà xã hội phát triển ngày cảng mạnh mẽ, nên kinh tế xã hộidang dan chuyên lên một tam cao mới thì vai trò quan trọng

Trang 1

TRUONG ĐẠI HỌC KINH TE QUOC DÂN

KHOA TOAN KINH TE

Dé tai:

UNG DUNG MÔ HÌNH ARIMA VÀ MẠNG RNN DỰ BAO CHUOI GIÁ

DONG CUA CUA CO PHIEU NGAN HANG TMCP NGOAI THUONG

VIET NAM - VCB

Giảng viên hướng dẫn : TS Hoàng Đức Mạnh

Sinh viên thực hiện : Nguyễn Thị Quỳnh Anh

Mã sinh viên : 11190401.

Lép : Toán kinh tế 61.

Hà Nội - 2022

Trang 2

Chuyên dé thực tập chuyên ngành Toán Kinh TẾ

LOI CAM KET

Tac gia xin cam két rang dé tai “Ung dung m6 hinh ARIMA va mang no-ronhồi quy — Recurrent Network dé dự báo chuỗi giá đóng cửa cô phiếu VCB” là mộtsản phầm từ quá trình tự nghiên cứu và tìm tòi của tác giả Tác giả đã tự tìm hiểu,phân tích, thực hiện xây dựng mô hình một cách trung thực dựa vào số liệu chính xácđược lay từ các nguồn thông tin dang tin cậy

11190401 - Nguyễn Thị Quỳnh Anh i

Trang 3

MỤC LỤC

00099650 676 5 iDANH MỤC CAC Ki HIEU VÀ CHU CALI VIET TẮTT s- << VDANH MỤC CÁC BANG BIỀÊU ° 22s s se se Essessesserserserssrssess viDANH MỤC CÁC HÌNH VE BIEU ĐÒ - 5-5 se csecssessessessersers viiLOT MỞ DAU wissssssssssssssssssssssssssssssssssssssessssssssssssesssssnesssssssessssssssssssssessssssssssssssesssssnes 1CHUONG 1 DU BAO CHUOI THỜI GIAN VA TONG QUAN NGHIÊN CUU

— 5

1.1 Kiến thức cơ sở về chuỗi thời gian - -s- s-s°sscsscssessessessersrssssssss 5

1.1.1 Khái niệm chuỗi thời gian - ¿2 2+ £+E£E££E£E£E£E£EeErkererkrrs 5 1.1.2 Các đặc trưng của chuỗi thời gian ¿- 2-52 ©s5++s+2x+2xezxerxervsrs 5

1.2 Dự báo chuỗi thời gian << se sssEssEseEseEsessEseeseEserseserssrserseree 6

1.2.1 Ứng dung dự báo chuỗi thời gian 2-2-2 s+E22E2Ez£zrxerxeres 71.2.2 Đề tài phân tích chuỗi thời gian -¿ 2¿©2¿25225++cx2zxczxesrxez 6KET LUẬN CHƯNG - 2-2 s°s°s£SsESs£EsEEsEsEssEssExserserserssrssrssee 10

CHƯƠNG 2 MÔ HÌNH ARIMA VÀ MẠNG RNN -s-scccsccsses 11

2.1 Mô hình tự hồi quy tích hợp trung bình trượt — ARIMA 11

2.1.1 Hàm tự tương QUa1 - 2G 5 11191119930 19111991 19 vn ng kp 11

2.1.2 Kiểm định tính dtng cececececccssessessesseessessessessecssssessessessessessesseeseees 112.1.3 Mô hình tự hồi quy AR(p) cescsscscssessesessescssessessessesessessessesesteseeseesees 12

2.1.4 Mô hình trung bình trượt MA (Q) - - - 5 se ssssrsirsrrrree 13

2.1.5 Mô hình tự hồi quy và trung bình trượt ARMA (p, q) -. 142.1.6 Mô hình trung bình trượt tích hợp tự hồi quy ARIMA (p, đ, q) 14

2.1.7 Phương pháp Box — J€nKIn - 5 + 3+ 3 + re 16 2.2 Các bước xây dựng mô hình AIRIMA 7055555555555 55995556 17

2.2.1 Nhan dang m6 hinh 0n dẢ 17

2.2.2 Ước lượng các tham số mô hình ARIMA(, d, q) -5- 172.2.3 Kiểm định mô hình -c¿222+vttttEEktrrttrktrrrrtrtrrrrrrtrrrrrrrrie 18

2.2.4 Dự báoO -G HT ng ng ng KT 18

2.3 Mạng nơ-ron hồi quy nhân tạo - Mang Long short-term memory 18

2.3.1 Mạng nơ-ron hồi quy nhân tạo (Recurrent Neural Network -RNN) 182.3.2 Mạng bộ nhớ Ngan hạn dài (Long short — term memory) 21

11190401 - Nguyén Thi Quynh Anh H

Trang 4

2.3.3 Ý tưởng cốt lõi của LSTÌM -¿- 2 2+S<+Ek‡EESEE2EEEEEEEEEEEerkrrkerree 23

2.4 Các bước xây dựng mạng Long short — term "€ITOFY s- 555555 5<< 26

2.4.1 Chia tap dit Qu oo 27

2.4.2 Chuẩn hoá dữ LGU e.seeccssescssssessssessneeesssseessnnecesnneeesnnecesneessnneeesnees 27

2.4.3 Xác định mạng LSTM trong K €faS s6 scs«ssssrsreerrke 29

2.4.3 Biên dich mạng - - c 2c S111 19111 111 1 111g HH ng nh rưy 29

2.4.5 Lắp mạng + 2529 E19 12E121571711121121111111111 117111111 re 30

2.4.6 Các chỉ tiêu đánh giá mạng LS TM -.- 5 cĂcSxsssskrsreerrke 31

3.2 Phân tich dữ lỆU <5 << < 4 HH 00 3000008508 80 37

3.3 Kết qua dự báo mô hình ARIIMA 5-5 scs©sscsecsessessesseseesess 38

3.3.1 Kiểm định nghiệm đơn vi ADF của chuỗi gốc - . 38

3.3.2 Chia tap nìi0 01 40

3.3.3 Xác định mô hình ARIMA (p, d, q) -cccSccsexsersersrrrrerres 40

3.3.4 Kiểm định phan dư của mô hình 2 2 2 s2 s+zx+zz£+z++ze+zxd 423.3.5 Kiểm định với hai tập Train và T€Sf - - cà sSsssiresrrsrrrrs 44

3.3.6 DU 44

3.4 Kết quả mang Long short — term memory (LSTM]) - 5-5-5 < 45

3.4.1 0i án 45

3.4.2 Chuẩn hoá dữ liệu - +: 2c S£+S£+SE+EE£EEEEEEEEEEEEEEEEEEEEEErkerkrrrrres 46

3.4.3 Lớp mạng Long short-term memory (LSTM) - -<-+- 46

3.4.4 Kiểm định với tap § 008110111177 47

KET LUẬN CHƯNG 3 - 2-2 se se ssEssEEsEEseEseEssEsstrserserssrssrssrssee 49KET 0000010117757 L Ô 50TÀI LIEU THAM KHAO

PHỤ LỤC

11190401 - Nguyễn Thị Quỳnh Anh iii

Trang 5

Trang 6

DANH MỤC CÁC KI HIỆU VA CHỮ CAI VIET TAT

ARIMA Tự hồi quy tích hợp trung bình trượt.

ARMA Tự hồi quy trung bình trượt.

AR Tự hồi quy

MA Trung bình trượt.

ACF Ham tự tương quan.

PACF Ham tự tương quan riêng.

LSTM Mạng nơ-ron bộ nhớ dài ngắn hạn

VIETCOMBANK Ngân hàng TMCP Ngoại thương Việt Nam.

VCB Mã cô phiếu của Ngân hàng Vietcombank

11190401 - Nguyễn Thị Quỳnh Anh

Trang 7

DANH MỤC CAC BANG BIEU

Bang 2.1: Kết quả kết hop mô hình ARMA cecescescesessessessesessessessesseeseesessessees 17Bang 3.1: Bang thống kê mô tả chuỗi gid VOB .o.ceececceccescescssessessesesessesseseseeseeseeee 38Bang 3.2: Bảng kết qua kiểm định ADF chuỗi gốc 2-5-5525 22522222: 39

Bảng 3.3: Các mô hình ARIMA (p, d, Q) 5 S132 Street 41

Bảng 3.4: Bang hệ số ước lượng mô hình ARIMA(1,0,1) với tập Train 39Bảng 3.5: Bảng hệ số ước lượng mô hình ARIMA(1,0,1) với cả chuỗi 39

Bang 3.6: Các chỉ tiêu đánh giá mô hình ARIMA(1,0,1) .-< <+<ss+ 44

Bảng 3.7: Dự báo kết quả 15 quan sát tiếp theo của chuỗi giá VCB theo mô hình

Trang 8

DANH MỤC CÁC HÌNH VE BIEU DO

Hình 2.1: Cấu trúc mạng nơ-ron hồi quy (RÌNN) ¿- ¿5c 5s+cs+czecrxerssree 21Hình 2.2: Mô hình mang Long short — term memory (LSTM) chuan 22Hình 2.3: Các kí hiệu được sử dung trong cấu trúc mạng LSTM - 23Hình 2.4: Kí hiệu công trong LSTM ¿2 2+S2+E£+E£EE£EEEEEEEEEEEEEeEEerkrrerrered 24Hình 2.5: Tầng cổng quên (Forgot Gate) trong LSTM 2- 2-2 z+x+csscs2 25Hình 3.1: Tổng tai sản của Vietcombank giai đoạn 2017 — 2021 35Hình 3.2: Lợi nhuận trước thuế của Vietcombank 6 tháng đầu năm 2017 — 2022 .36Hình 3.3: Giá đóng cửa của mã cổ phiếu VCB -2-©2¿©2+2s+2cxvzrxerxesrxeee 37Hình 3.4: Các thành phan trong chuỗi thời gian .-. : 2 5552552 39Hình 3.5: Biểu đồ trung bình trượt của chuỗi 2 ¿5 252 £+E££Ee£xz£szzzEred 40Hình 3.6: Biéu đồ thé hiện hai tap đữ liệu Train va Test - ¿525s 40Hình 3.7:Biéu đồ thể hiện phan dư của mô hình ARIMA -: -: - 43Hình 3.8: Kết quả dự báo dựa trên hai tập Train và Tesf -‹ 5-5 <++<<++s 44Hình 3.9: Kết quả dự báo 15 quan sát tiếp theo của chuỗi giá VCB theo mô hình

30,0 00000177 45

Hình 3.10: Tập dữ liệu sau khi chia thành tap Train và Test . 44

Hình 3.11: Kết quả kiểm định mạng LSTM với tập Train và Test - 47Hình 3.12: Kết quả dự báo 15 quan sát tiếp theo của chuỗi theo mô hình LSTM 48

11190401 - Nguyễn Thị Quỳnh Anh vii

Trang 9

LỜI MỞ ĐẦU

Trong thời đại mà xã hội phát triển ngày cảng mạnh mẽ, nên kinh tế xã hộidang dan chuyên lên một tam cao mới thì vai trò quan trọng và không thể thiếu củacông tác dự báo, cảnh báo sớm trong các lĩnh vực của đời sống ngày càng tăng lên.Phương pháp nào có thé dự đoán chính xác hướng chuyển động của đối tượngnghiên cứu là một thách thức không dễ dàng đối với các nhà định lượng kinh tế.Vào những năm 1970, các phương pháp khai thác chuỗi thời gian ra đời, đặt nền

móng cho một kỷ nguyên mới của dự báo Các chuyên gia đã nghiên cứu và dự báo

nhiều biến số kinh tế để thử nghiệm phương pháp này, và kết luận chung được hầuhết mọi người đưa ra là phương pháp chuỗi thời gian không quá nặng nhọc và rất

hiệu quả trong dự báo.

Việc dự báo chuỗi thời gian được ứng dụng trong rất nhiều ngành nghề vàlĩnh vực khác nhau của đời sống, ví dụ như được ứng dụng trong lĩnh vực như kinh

tế, tài chính, khoa học kĩ thuật, Với từng lĩnh vực cụ thé khác nhau, ta sẽ nhiều môhình khác nhau dé có thé dự báo Tiêu biểu nhất trong các mô hình được dùng đề dự

báo là mô hình ARIMA (Auto Regressive Intergrated Moving Average — Mô hình tự

hồi quy tích hợp trung bình trượt) Chuỗi thời gian được dùng dé ước lượng mô hìnhARIMA sẽ được giả sử là một chuỗi tuyến tính và chuỗi đó sẽ mang hình hài mộtphân phối mà chúng ta đã biết như phân phối chuẩn Vì có tinh chất biến đôi linh hoạtvới các chuỗi thời gian khác mà nó dan trở nên phô biến hơn và sự kết hợp mô hìnhARIMA và phương pháp Box-Jenkins đã cải tiến mô hình một cách vượt bậc, làmcho nó tối ưu hơn so với trước đây Bên cạnh sự đóng góp to lớn của mô hình

ARIMA, nó vẫn còn tổn tại những khuyết điểm chưa thé hoàn thiện được như: giả

định chuỗi thời gian là tuyến tính Điều này khó kiểm soát trong một số lĩnh vựcnhư kinh tế, bởi chúng sẽ bị tác động bởi nhiều yếu tố như chính sách, xã hội Tuy

nhiên, sự xuất hiện của mạng nơ-ron hồi quy (Recurrent Neural Network) giúp các

nhà dự báo vượt qua cực điểm yêu của mô hình tuyến tính Ngày nay, sự phát triểnnhanh chóng của mạng nơ-ron nhân tạo đã thu hút rất nhiều sự chú ý trong các bàitoán dự báo và phân loại, và tất nhiên dự báo chuỗi thời gian cũng không ngoại lệ

Dự báo chuỗi thời gian thường đi kèm với mạng hồi quy nơ — ron nhân tao(Recurrent neural network) và nồi bật là biến thể mang tên LSTM - trí nhớ ngắn hạn

dai (Long short-term memory).

11190401 - Nguyén Thi Quynh Anh 1

Trang 10

Chuyên đề này sẽ nêu tong quát về cả phương pháp và cách xây dựng mô hìnhARIMA và LSTM để dự báo chuỗi giá cổ phiếu và ứng dụng dé dự báo 15 giá trị tiếptheo (từ quan sát số 1250 đến 1264 của chuỗi quan sát) của mã cổ phiếu VCB

(Ngân hàng TMCP Ngoại thương Việt Nam)

11190401 - Nguyễn Thị Quỳnh Anh 2

Trang 11

MỞ ĐẦU

1 Vấn đề nghiên cứu

Mục đích của dự báo giá cổ phiếu là dự đoán giá trị thực trong tương lai của

một cô phiếu Các nhà đầu tư có xu hướng đầu tư một lượng tiền dang kế hoặc cực

kỳ lớn vào thị trường chứng khoán vì chứng khoán có khả năng sinh lời khá cao và

có tính thanh khoản cao hơn nhiều loại tài sản khác như bắt động sản, xe cộ Do

đó, giá cổ phiếu tương lai rat được các nhà dau tư trên thị trường chứng khoán quantâm Một chỉ số quan tâm Nếu dự báo giá gần đúng sẽ mang lại lợi nhuận đáng kể,nhưng nếu kết quả dự báo có sai số lớn thì thua lỗ, thậm chí phá sản là điều khótránh khỏi Vì vậy chúng ta cần xây dựng một mô hình dự đoán với sai số nhỏ nhất

Và hai phương pháp ARIMA và LSTM sẽ giúp chúng ta chọn được mô hình

phù hợp nhất

2 Đối tượng và phạm vi nghiên cứu

Ngân hàng Thương mại Cô phần Ngoại Thương Việt Nam (tên tiếng Anh quốctế: Joint Stock Commercial Bank for Foreign Trade of Vietnam), gọi tắt là

“Vietcombank”’, hiện là công ty lớn nhất trên thị trường chứng khoán Việt Nam Hiệntại, đây cũng là một định chế hàng đầu về vốn hóa trong ngành tài chính tại Việt Nam.Đến năm 2021, tổng tài sản của ngân hàng đạt 1300 nghìn tỷ đồng, đứng đầu trongdanh sách các ngân hàng có tổng tài sản lớn nhất Việt Nam Do sức mạnh của nó, mãchứng khoán Vietcombank (VCB) đã thu hút rất nhiều đầu tư trên thị trường, baogồm ca thị trường chứng khoán Sự lên xuống của giá cô phiếu có tác động lớn đếncác nhà đầu tư trên thị trường Vì vậy, việc dự báo chỉ số giá cô phiếu Vietcombank

sẽ giúp họ đưa ra chiến lược đầu tư phù hợp hơn

Chuyên đề này sẽ mang đến những cái nhìn tổng quát nhất về việc sử dụng môhình ARIMA và mạng nơ-ron nhân tạo hồi quy (LSTM) dé dự đoán được chuỗi giá

cô phiếu của Vietcombank (VCB) Từ đó có thé đưa ra những nhận định về độ hiệuquả của từng mô hình với đề tài này, từ đó có thé nhận ra được ưu điểm và nhượcđiểm của mô hình ARIMA và LSTM

3 Phương pháp nghiên cứu

Việc dự báo giá cổ phiếu dựa vào dit liệu lịch sử có khá nhiều phương pháp được

sử dụng Tuy nhiên trong khuôn khổ chuyên dé nay, ta sẽ dùng 2 hướng tiếp cận đó làphương pháp học máy (Mạng nơ-ron hôi quy - Recurrent neural network) và phương

Trang 12

pháp thống kê (ARIMA) dé dự báo chuỗi giá của cô phiếu VCB trong ngắn hạn

Với mô hình ARIMA, hướng được dùng để tiếp cận được dựa trên nguyên lýBox — Jenkins gom 4 bước chính quan trong: Nhận dang mô hình, ước lượng môhình, kiểm định mô hình và dự báo

4 Bố cục chuyên đề

Chuyên đề gồm 5 chương:

e Chương 1: Dự báo chuỗi thời gian và tổng quan nghiên cứu

e Chương 2: Mô hình ARIMA và mạng RNN.

e Chương 3: Ứng dụng mô hình ARIMA và RNN trong dự báo cô phiếu VCB

Trang 13

CHƯƠNG 1

DU BAO CHUOI THỜI GIAN VÀ TONG QUAN NGHIÊN CỨU

Các ngành công nghiệp từ năng lượng và bán lẻ đến giao thông vận tải vàtài chính ngày nay đều dựa vào dự báo chuỗi thời gian dé dự đoán nhu cau sản

phẩm, phân bồ nguồn lực, hiệu suất tài chính, bảo trì dự đoán và vô số ứng dụng

khác Vậy trước tiên, chúng ta can hiểu khái niệm chuỗi thời gian là gi? Chuong 1

sẽ cung cap cho chúng ta khải niệm và các đặc trưng của chudi thời gian.

1.1 Kiến thức cơ sở về chuỗi thời gian

1.1.1 Khái niệm chuỗi thời gian

Chuỗi thời gian là một quá trình ngẫu nhiên {X,} phụ thuộc vào biến thời gian

t được biểu diễn qua dãy các các phép đo hay còn được gọi là các quan sát Chuỗithời gian có thể chuỗi liên tục hoặc chuỗi dời rạc tuỳ vào kiểu dé liệu chúng ta quansát Chuỗi thời gian sẽ được coi là rời rạc nếu các quan sát được thu thập trên tập thờigian rời rạc, nếu không chúng sẽ được coi là chuỗi liên tục Thông thường, chuỗi thờigian mà chúng ta nghiên cứu là chuỗi thời gian rời rạc, với khoảng thời gian cách đề,

có chu kì như: phút, giờ, ngày, tuần, tháng, quý, năm

1.1.2 Các đặc trưng của chuỗi thời gian

Những chuỗi thời gian có các đặc tính đi kèm vô cùng quan trọng, chúng bị

ảnh hưởng bởi các yếu tố và đặc điểm của thời gian Một số dấu hiệu của chuỗi thờigian này là sự xuất hiện của một số quy luật như yếu tổ mùa vụ, chu kỳ và yếu tố

xu hướng.

Tính xu hướng: Tính xu hướng là yếu tố thê hiện xu hướng thay đổi của dữliệu theo thời gian Day là đặc trưng thường thấy của rất nhiều dit liệu chuỗi thờigian Đặc biệt là các chuỗi trong kinh tế lượng như: giá cả thị trường chị ảnh hưởngcủa lạm phát, dân số thế giới tăng qua các năm, nhiệt độ trung bình trái đất tăng theo

thời gian do hiệu ứng nhà kính Tính xu hướng cũng ảnh hưởng không nhỏ tới

việc đưa ra nhận định về mối quan hệ tương quan giữa các chuỗi số Tức là vềbản chất các chuỗi không tương quan nhưng do chúng cùng có chung xu hướng theothời gian nên chúng ta nhận định chúng là tương quan Ví dụ: Số lượng người bị đuốinước hàng năm và sản lượng kem tiêu thụ có mối quan hệ cùng chiều (hay còn gọi

là tương quan tuyến tính dương) Không khó dé chúng ta nhận định được bản chất

của sự tương quan nảy là do chúng có cùng sự tương quan với nhiệt độ Khi nhiệt độ

Trang 14

tăng lên chúng ta đi tắm biến nhiều hơn và dẫn tới số lượng người bị đuối nước cao

hơn và đồng thời khi nhiệt độ cao cũng là lúc người ta ăn kem dé giải khát nhiều hon

Tuy nhiên việc ăn kem không phải là nguyên nhân trực tiếp dẫn tới đuối nước Do đó

khi xây dựng các mô hình chuỗi thời gian chúng ta cần loại bỏ yếu tổ xu hướng ởnhững biến input đề tìm ra những chuỗi có sự tương quan thực sự

Tinh chu ky: Là qui luật có tính chất lặp lại của dữ liệu theo thời gian Sự thay

đổi thời tiết, sự phát triển của các loài động vật cho tới hành vi mua sắm, tiêu dùngcủa con người đều bị ảnh hưởng của chu kỳ và lặp lại theo thời gian Chính vì thếtìm ra được yếu tố chu kỳ sẽ giúp ích cho việc dự báo chính xác hơn Một ví dụ vềtầm quan trọng của chu kỳ đó là các doanh nghiệp sản xuất một mặt hàng cụ thê sẽbiết sản lượng tăng vào thời điểm nào trong năm? Cần phải tuyển thêm bao nhiêu laođộng? Mua thêm bao nhiêu nguyên vật liệu dé đáp ứng được nhu cầu thị trường Nếu

không hiểu được tính chu kỳ của chuỗi thời gian, doanh nghiệp có thê dự báo sai

nhu cầu thị trường và dẫn tới thua lỗ

Yếu to ngẫu nhiên là chỉ những sự việc xảy ra không theo một sự tính toán

định sẵn nào, chúng xảy ra theo cách mà chúng ta không ngờ tới, chúng không tuân

theo một quy luật cụ thé nào Điều này gây ra những biến động bat thường trongchuỗi quan sát của mà ta nghiên cứu: tăng hoặc giảm đột ngột Ví dụ như chiến tranh,Sóng thần, nhất là giai đoạn 2019-2021 chúng ta hứng chịu dai dịch Covid-19 Chínhđại dịch này đã ảnh hưởng lớn đến các chỉ tiêu kinh tế của tất cả các nước trên thếgiới, phần lớn là tiêu cực: điển hình là tốc độ tăng trưởng của các nước giảm, mứctăng trưởng tiêu cực còn xảy ra với không ít quốc gia trên toàn thế giới Không ai cóthé nghĩ rằng một trận đại dịch lại có thé gây ra nhiều hậu quả xấu như vậy

1.2 Dự báo chuỗi thời gian

Dự báo chuỗi thời gian là một trong những kỹ thuật khoa học đữ liệu được áp

dụng nhiều nhất trong kinh doanh, tài chính, quản lý chuỗi cung ứng, lập kế hoạchsản xuất và hàng tồn kho Nhiều vấn đề dự đoán liên quan đến một thành phần thờigian và do đó yêu cầu phép ngoại suy đữ liệu chuỗi thời gian hoặc dự báo chuỗi thời

gian Dự báo chuỗi thời gian cũng là một lĩnh vực quan trọng của học máy (ML) và

có thể được coi là một vấn đề học tập có giám sát Các phương pháp ML như

Regression, Neural Networks, Support Vector Machines, Random Forests và

XGBoost - có thé được áp dung cho nó Dự báo liên quan đến việc lấy các môhình phù hợp với dữ liệu lich sử và sử dụng chúng dé dự đoán các quan sát trong

Trang 15

tương lai.

Dự báo chuỗi thời gian có nghĩa là dự báo hoặc dự đoán giá trị tương lai trong

một khoảng thời gian Nó đòi hỏi phải phát triển các mô hình dựa trên dữ liệu trước

đó và áp dụng chúng dé thực hiện các quan sát và hướng dẫn các quyết định chiến

lược trong tương lai.

Tương lai được dự báo hoặc ước tính dựa trên những gì đã xảy ra Chuỗi thời

gian bổ sung sự phụ thuộc thứ tự thời gian giữa các quan sát Sự phụ thuộc này vừa

là một ràng buộc vừa là một cau trúc cung cấp nguồn thông tin bé sung Trước khithảo luận về các phương pháp dự báo chuỗi thời gian, hãy xác định kỹ hơn về dự báo

chuỗi thời gian.

Dự báo chuỗi thời gian là một kỹ thuật dự đoán các sự kiện thông qua một

chuỗi thời gian Nó dự đoán các sự kiện trong tương lai băng cách phân tích các xuhướng trong quá khứ, với giả định rang các xu hướng trong tương lai sẽ tương tự như

các xu hướng lịch sử.

1.2.1 Ứng dụng dự báo chuỗi thời gian

Việc dự báo chuỗi thời gian được sử dụng trên nhiều lĩnh vực nghiên cứutrong các ứng dụng khác nhau bao gồm:

= Thiên văn hoc.

" Kế hoạch kinh doanh

= Ky thuật điều khiến

= Dự báo thời tiết

Dự báo chuỗi thời gian bắt đầu với chuỗi thời gian lịch sử Các nhà phân tíchkiểm tra dữ liệu lịch sử và kiểm tra các mẫu phân tích thời gian, chăng hạn như xuhướng, mẫu theo mùa, mẫu theo chu kỳ và tính đều đặn Nhiều lĩnh vực trong các tôchức bao gồm tiếp thị, tài chính và bán hàng sử dụng một số dạng dự báochuỗi thời gian dé đánh giá chi phí kỹ thuật có thé xảy ra và nhu cầu của người tiêu

Trang 16

dùng Các mô hình cho đữ liệu chuỗi thời gian có thể có nhiều dạng và biểu thị các

quy trìnhngẫu nhiên khác nhau.

1.2.2 Tổng quan nghiên cứu

Việc phân tích và dự báo xu hướng dựa vào đữ liệu dạng chuỗi thời gian đực

ứng dụng rộng rãi trong nhiều lĩnh vực đời sống xã hội Đã có rất nhiều bài nghiêncứu về chuỗi thời gian Chúng ta có một vài đề nôi bật cho việc sử dụng chuỗi thờigian đề phân tích và đưa ra dự báo cho tương lai như sau:

Đâu tiên là đề tài nghiên cứu: “Phương pháp phân tích chuỗi thời gian cho dựđoán xu hướng ca nhiễm COVID-19” (2021) của tác giả Chenhui Xu được trình bày

trong Dự án Khoa học và Kỹ thuật máy tính (Vòng 2 của Dự án) Trong nghiên cứu

so sánh này, bốn mô hình phân tích chuỗi thời gian khác nhau, cụ thể là mô hìnhARIMA, mô hình Nhà tiên tri (Prophet), mô hình Trí nhớ ngắn hạn dài (LSTM) và

mô hình Transformer, được nghiên cứu dé xác định mô hình nào có hiệu suất tốt nhấtkhi dự đoán xu hướng trường hợp trong tương lai của COVID-19 ở sáu quốc gia Sau

khi có được dữ liệu trường hợp COVID-19 có san công khai từ cơ sở đữ liệu của

Trung tâm Khoa học và Kỹ thuật Hệ thống Đại hoc Johns Hopkins, nghiên cứu tiễnhành các thử nghiệm lặp đi lặp lại nhằm khai thác dữ liệu dé dự đoán xu hướng trongtương lai cho tất cả các mô hình Sau đó, hiệu quả của mô hình được đánh giá bằngchỉ số sai số bình phương trung bình (MSE) và sai số tuyệt đối trung bình (MAE).Kết qua cho thay về tổng thé, mô hình LSTM có hiệu suất tốt nhất đối với tat cảcác quốc gia mà nó có thể đạt được MSE và MAE cực kỳ thấp Mẫu Transformer cóhiệu suất tốt thứ hai với kết quả rất hài lòng ở một số quốc gia và các mẫu khác cóhiệu suất kém hơn Bài nghiên cứu này đã nêu bật tính chính xác cao của mô hìnhLSTM, có thể được sử dụng dé dự đoán sự lây lan của COVID-19 dé các quốc gia cóthê chuẩn bị và nhận thức tốt hơn khi kiểm soát sự lây lan

Tiếp theo, chúng ta có bài báo khoa học: “Ứng dụng mạng Long short-termmemory (LSTM) dé dự báo mực nuớc tại trạm Quang Phục và Cửa Cẩm, Hải Phong,Viet Nam” của hai tác giả Lê Xuân Hùng và Hồ Việt Hùng Trong bài báo này, mồhình Bó nhớ dài ngắn hạn (Long Short-Term Memory - LSTM) được sử dụng dé dựbáo mực nước sóng ma không cần các số liệu địa hình và dự báo mưa Dữ liệu cầnthiết cho mô phỏng là mực nước theo giờ tại các trạm thủy văn ở thành phố HảiPhòng Kết quả này cho thay rang, mó hình LSTM mà các tác giả đề xuất dự báochính xác mực nước theo thời gian thực, có thể áp dụng mô hình này để cảnh báo

Trang 17

lũ trên các sông của Việt Nam.

Và còn rất nhiều đề tài ứng dụng mô hình chuỗi thời gian để nghiên cứu và

phân tích Trên đây là hai đê tài mà tác giả tìm kiêm và ứng dụng nó đê làm bài

chuyên đề này

Trang 18

KET LUẬN CHUONG 1

Chương | đã cho chúng ta một cái nhìn tổng quát nhất về khái niệm chuỗi thờigian, các thành phan chính tồn tại trong một chuỗi thời gian bao gồm: tính xu thé,tính mùa vu, và các yêu tô ngẫu nhiên Chúng ta cũng thấy rõ được cơ sở của dự báochuỗi thời gian và tính ứng dụng của nó trong đời sống phô biến ra sao trong các lĩnh

vực khoa học và đời sông.

Trang 19

CHƯƠNG 2

MÔ HÌNH ARIMA VÀ MẠNG RNN

Trong khuôn khổ dé tài này, tác giả sẽ sử dụng hai phương pháp dự báo chuỗithời gian đó là mô hình Tự hoi quy tích hợp trung bình trượt ( Auto RegressionIntergrated Moving Average - ARIMA) và Mạng nơ — ron hồi quy nhận tao(Recurrent Neural Network — RNN) Từ đó chúng ta có thể ứng dụng vào vấn đề màchuyên dé đưa ra

2.1 Mô hình tự hồi quy tích hợp trung bình trượt - ARIMA

2.1.1 Hàm tự tương quan

2.1.1.1 Tự tương quan (ACF — AutoCorrelation Function)

Tự tương quan là một khái niệm quan trọng trong chuỗi thời gian Hau hếtcác chuỗi thời gian sẽ có sự tương quan với giá trị trễ của nó và các giá trị càng gần

nhau thì tương quan càng mạnh hoặc các giá tri cùng thuộc 1 chu kì của chuỗi thì sẽ

có tương quan cao (chăng hạn như cùng tháng trong chu kì năm hay cùng quý trongchu kì năm) Chính vì vậy hệ số này mới có tên là tự tương quan Hệ số tự tương

quan được viết tắt là ACF và thường dùng dé tìm ra độ trễ của quá trình trung bìnhtrượt MA(q) dé xây dung các mô hình như ARIMA, GARCH, và kiểm tra yếu tốmùa vụ Hệ số tự tương quan bậc k được xác định như sau:

ACF() = pcx) = CoTT,,Y,_y) = ¬ ,UỚi k = 1,2,3 (2.1.1)

2.1.1.2 Tự tương quan riêng (PACF — Partitial AutoCorrelation Function)

Về cơ bản tương quan riêng phần cũng là chỉ số đo lường hệ số tương quannhư ACF Tuy nhiên vẫn có sự khác biệt đó là hệ số tương quan này loại bỏ ảnhhưởng của các chuỗi độ trễ trung gian (là các chuỗi trễ x¿-¡, ,, x:-x+¡ nằm giữa xX

và x¿_+) Một phương trình hồi quy tuyến tính giữa chuỗi hiện tại với các chuỗi độ trễtrung gian được xây dựng nhăm đánh giá ảnh hưởng của các chuỗi độ trễ lên chuỗihiện tại Sau đó, để tính hệ số tương quan riêng phần chúng ta sẽ loại bỏ ảnh hưởngcủa các độ trễ trung gian khỏi chuỗi hiện tại bằng cách trừ đi giá trị ước lượng từphương trình hồi quy

Pre = COTT(t,Y_—w | Ye-a Ye-2 ee Me-ka a kk = 1,2, (2.1.2)PACE sẽ có tác dung tim ra hệ số bậc tự do của quá trình tự hồi quy (AR) Tương tựnhư ACF, thông qua một biéu đồ PACF về giá trị các hệ số tương quan riêng phần

tương ứng với các độ trễ khác nhau, chúng ta sẽ tìm ra được các bậc tự do p phù hợp.

Trang 20

Đó chính là vị trí mà giá trị của hệ số tương quan riêng phần nằm ngoài ngưỡng tincậy 95% của giả thuyết hệ số tương quan riêng phần bằng 0

2.1.2 Kiểm định tính dừng

Khi tạo mô hình cho mục đích dự báo trong phân tích chuỗi thời gian, chúng

ta giả định rằng chuỗi thời gian là một chuỗi dừng dé các dự đoán đưa ra sẽ cho kếtquả tốt Vì vậy, bước đầu tiên khi làm việc trên một mô hình là dừng chuỗi thời gian.Kiểm định tính dừng là một quy định thường được sử dụng trong mô hình tự hồi quy.Chúng ta có thé thực hiện nhiều thử nghiệm khác nhau như KPSS, Phillips-Perron vàAugmented Dickey-Fuller Chủ đề này tập trung nhiều hơn vào kiểm định Dickey-

Fuller.

Kiểm định Augmented Dickey-Fuller (ADF) là một kiểm định có ý nghĩathống kê, có nghĩa là thử nghiệm cho kết quả trong các thử nghiệm giả thuyết với giảthuyết không và giả thuyết thay thế Kết quả là một giá trị p mà từ đó chúng ta phảikết luận từ chuỗi thời gian liệu nó có dừng hay không Dựa vào chuỗi cơ sở lý thuyết

áp dụng cho quá trình AR(1) với chuỗi Y được xác định như sau:

Nếu giá trị |t = ca) > |r„| thì chúng ta có đầy đủ thông tin để có thể bác

bỏ Hạ Từ đó, kết luận rằng chuỗi thời gian của chúng ta là chuỗi dừng

2.1.3 Mô hình tự hồi quy AR(p)

Các mô hình tự hồi quy (AR) dự đoán hành vi trong tương lai dựa trên hành vitrong quá khứ Nó được sử dụng dé dự báo khi có một số tương quan giữa các giá trịcủa chuỗi thời gian và các giá trị trước và sau chúng Bạn chỉ cần sử dụng dữ liệutrong quá khứ đề lập mô hình hành vi, do đó có tên là tự hồi qu) Quá trình này thực chất

là hồi quy tuyến tính của dữ liệu trong chuỗi hiện tại so với một hoặc nhiều giá tri trước

Trang 21

đó trong cùng một chuỗi.

Trong mô hình AR, giá trị của biến kết quả (Y) tại một số thời điểm t - giốngnhư hồi quy tuyến tính "bình thường" - có liên quan trực tiếp đến biến dự đoán (X).Van dé về hồi quy tuyến tính đơn giản và các mô hình AR khác nhau là Y phụ thuộc

vào X và các giá tri trước đó của Y.

Một quy trình AR là một ví dụ về quá trình ngẫu nhiên có một số tính khôngchắc chắn hoặc tính ngẫu nhiên tích hợp Tính ngẫu nhiên có nghĩa là bạn có thể dựđoán khá tốt các xu hướng trong tương lai dựa trên đữ liệu trong quá khứ, nhưng cómột điều chắc chan là kết quả dự báo sẽ không bao giờ chính xác 100% Nói chung,quy trình này "đủ gần" để hữu ích trong hầu hết các tình huống

Mô hình AR còn được gọi là mô hình có điêu kiện, mô hình Markov hoặc mô

hình chuyên tiếp

f, = hot địÈ,_¡ Ð†Ó¿Ÿ,_¿ te + hpYi-p + Ue (2.1.4)Trong dé: =o hệ số chặn của mô hình

$\,Ở¿, , Pp các hệ số được ước lượng của mô hình

tụ nhiều trắng

'Ta có:

Po ` say CA, LẺ xã

l)E,„ =m=—————— wl.

(1) Fy, =u trội -Đ;—=ứp còn được gọi là cân băng dài hạn (2.1.5)

Trong cân bang dai hạn, mô hình còn có thể được viết theo cách sau:

(2)Y,—u= $:Œ,yT—H) t+ @p(W-pT—) + ty (2.1.6)

Điểm mau chốt ở đây là mô hình AR(p) sử dụng dữ liệu trong quá khứ để giải

thích chính nó cho hiện tại, tức là dự đoán các giá tri trong tương lai dựa trên các giá

trị trong quá khứ gắn với một yêu tố ngẫu nhiên, mà không xem xét các biến bé sungtrong mô hình hồi quy Tuy nhiên, không phải không có nhược điểm, một nhược điểmđiển hình của mô hình này là chỉ phù hợp để dự báo theo chuỗi thời gian ngành

tài chính không có sự tăng giảm đột ngột theo thời gian.

2.1.4 Mô hình trung bình trượt MA(q)

Trong một quá trình trung bình trượt bậc q, số liệu tại thời điểm hiện tại Y;được tính bởi tổng trung bình có trọng số giá trị của các sai số ngẫu nhiên cho đến sai

số thứ q.: Như vậy, mô hình MA(q) có dạng như sau:

¥, = M+ My + Øyuy_¡ + + OgUe_g (2.1.7)

11190401 - Nguyén Thi Quynh Anh 13

Trang 22

Trong dé: yu hệ số chặn của mô hình

Ø+,Ø;, , dạ các tham số được ước lượng của mô hình

Ut sai số ngẫu nhiên

Vì +, là chuỗi nhiễu trắng (White Noise) với Ey, =O vaVan, = o?,

ta CÓ các gia tri sau:

(1) EŒ,) =H (2.1.8)

(2) Var(Œ,) =yạ = (1 + O12 + O92 + - + 6„;)ơ?

(2.1.9) (3) Covariance

Mô hình MA(q) với ưu điểm xác định được những tác động của các cú sốctrong quá khứ và cả hiện tại Bên cạnh ưu điểm, mô hình MA(q) có nhược điểm đó

là mô hình chỉ thích hợp cho việc dự báo trong ngắn hạn

2.1.5 Mô hình tự hồi quy và trung bình trượt ARMA (p, q)

Chúng ta có thé thay được những ưu, nhược điểm của hai mô hình AR(p) vàMA(q) Vậy nên, sự kết hợp đồng thời của quá trình trung bình trượt và tự hồiquy với bậc bat kì chính là sự lựa chọn trong nhiều bài toán dự báo liên quan đến cáctham số tài chính ARMA chính là cái tên được đặt cho mô hình kết hợp trung bìnhtrượt — tự hồi quy có dạng phương trình sau:

Ÿ,=u + 1Ÿ, Hoe + QyŸ, g + Ura + + Ogg + tự (2.1.11)

Các mô hình ARMA chỉ có thé được thực hiện khi chuỗi Y; là chuỗi dừng.Một mô hình ARMA (p, q), sẽ có p số hạng tự hồi quy và q số hạng trung bình trượt

Nhận dạng mô hình ARMA (p, q) là tìm các giá trị thích hợp của p, q Việc xác định

p.q sẽ phụ thuộc vào đồ thị hàm tự tương quan Với ACF là hệ số tu tương quan vàPACF là hệ số tự tương quan riêng Lưu ý rằng PACF đặc biệt hữu ich trong bối cảnhnày Chỉ riêng ACF có thé phân biệt giữa quá trình tự hồi quy thuần túy va quá trìnhtrung bình động thuần túy Tuy nhiên, quy trình ARMA sẽ có ACF giảm dan về mặt

Trang 23

hình học, như ý muốn một quy trình tự hồi quy thuần túy Vì vậy, PACF rất hữu ích

dé phân biệt giữa một mô hình AR(p) và mô hình ARMA (p, q)

Mô hình ARMA (p, q) được sử dụng phô biến dé dự báo chuỗi thời gian tài chínhvới những ưu điểm như:

Thứ nhất, mô hình giải thích được sự biến động của chuỗi thời gian tài chínhbằng cách quan hệ với các giá trị quá khứ và tổng có trọng số các nhiễu ngẫu nhiênhiện hành và các nhiễu ngẫu nhiên có độ trễ nghĩa là mô hình hóa được gần như tất

cả các dao động cuả chuỗi thời gian tài chính ban đầu.

Thứ hai, dự báo từ mô hình ARMA (p, q) có kết quả tương đối chính xác phù hợpvới dự đoán trong ngắn hạn với sai số nhỏ Bên cạnh những ưu điểm ké trên, mô hình

có những nhược điểm như sau: mô hình ARMA có thể dự báo được kỳ vọng nhưngthất bại khi dự báo phương sai của chuỗi thời gian tài chính, mô hình ARMA khônggiải thích được sự thay đôi của sự biến động trong chuỗi thời gian, mô hình ARMAchỉ thích hợp với các chuỗi thời gian tài chính đừng với nhiều nhiễu trắng, mô hìnhđược thực hiện với giả định phương sai không đồi theo thời gian

2.1.6 Mô hình trung bình trượt tích hợp tự hồi quy ARIMA (p, d, q)

Mô hình ARIMA - Autoregressive Intergrated Moving Average dựa trên gia

thuyết chuỗi dừng và phương sai sai số không đôi Mô hình sử dung dau vào chính lànhững tín hiệu quá khứ của chuỗi được dự báo dé dự báo nó Các tín hiệu đó baogồm: Chuỗi tự hồi quy AR (Auto regression) và chuỗi trung bình trượt MA (Moving

average).

Chuỗi thời gian có thê dừng hoặc không dừng Một chuỗi thời gian được gọi

là dừng có giá trị trung bình và phương sai là hằng số và hiệp phương sai không đôitheo thời gian Hau hết các chuỗi thời gian sẽ có xu hướng tăng hoặc giảm theo thờigian, do đó yếu tô chuỗi dừng thường không đạt được Trong trường hợp chuỗi khôngdừng thì ta sẽ cần biến đổi sang chuỗi dừng bằng sai phân Khi đó tham số đặc trưngcủa mô hình sẽ có thêm thành phần bậc của sai phân d và mô hình được đặc tả bởi 3tham số ARIMA (p, d, q)

Chữ cai “I” được thêm vào trong mô hình ARIMA là Intergrated Day là qua

trình đồng tích hợp hoặc lây sai phân Yêu cầu chung của các thuật toán trong timeseries là chuỗi phải đảm bảo tính dừng Hầu hết các chuỗi đều tăng hoặc giảm theothời gian Do đó yếu tổ tương quan giữa chúng chưa chắc là thực sự mà là do chúngcùng tương quan theo thời gian Khi biến đôi sang chuỗi dừng, các nhân tổ ảnh hưởngthời gian được loại bỏ và chuỗi sẽ dễ dự báo hơn Để tạo thành chuỗi dừng, một

Trang 24

phương pháp đơn giản nhất là chúng ta sẽ lấy sai phân Một số chuỗi tài chính cònquy đổi sang logarit hoặc lợi suất Bậc của sai phân để tạo thành chuỗi dừng còn gọi

là bậc của quá trình đồng tích hợp Quá trình sai phân bậc d của chuỗi được thực hiện

như sau:

*_ Sai phân bac 1: 11) = AYt = Yt — Yt-1

* Sai phân bậc d: I(d) = AdYt

Chuỗi quan sát thông thường sẽ dừng sau quá trình lay sai phân bậc 0 hoặcbậc 1 Rất hiểm khi chúng ta phải lấy chuỗi giá trị tới sai phân bậc 2 Một sốtrường hợp đặc biệt chúng ta sẽ cần quy đổi sang chuỗi logarit, chuỗi lợi suất (nêu làchuỗi tài chính) hoặc căn bậc 2 để tạo thành chuỗi dừng Phương trình hồi quyARIMA (0, d,q) có thê được biéu diễn bằng công thức sau đây:

AY, = UW + Ó\¡AF,_¡ Ho + $@U,AY,_g + Øyu¿_¡ Ho + ØguySa + tự (2.1.12)

Trong đó AY, là giá trị sai phân tại bac đ, cụ thé trong trường hop này chúng

ra đang lay d = 1 và u, là nhiễu trắng

Như vậy nếu biết được giá trị của các tham số p.d,q, khi đó có thể mô hình hóađược chuỗi và ước lượng được các giá tri của mô hình đó Việc xác định các hệ sỐ p

và q tương tự với các xác định bậc của hai quá trình Tự hồi quy (AR) va Trung bìnhtrượt (MA) qua hệ sỐ tự tương quan ACF và hệ số tự tương quan riêng PACF Trongkhi đó, giá trị hệ số d sẽ được xác định bằng phương pháp lấy sai phân của chuỗi và

xét tính dừng của chuỗi sai phân đó.

Mô hình ARIMA được được dùng khá phổ biến trong dự báo ngắn hạn Lý

do là mô hình này chỉ dùng các giá trị trong quá khứ của chính biến số cần dự báo

Mô hình ARIMA không phù hợp để phân tích chính sách Đôi khi còn bị coi là môhình phi lý thuyết vì nó không dựa trên một lý thuyết kinh tế nào

2.1.7 Phương pháp Box — Jenkin

Phương pháp Box-Jenkins (1970) là phương pháp được sử dụng rộng rãi

trong các lĩnh vực kinh tế, y tế, kỹ thuật, v.v Nó là một chuỗi các bước tuần tự, cácthủ tục kiểm tra đánh giá chuỗi thời gian Điều này giúp chúng ta xác định xem môhình kết quả là mô hình chuỗi thời gian phụ thuộc vào những yếu tố nào trong quá

khứ Hai quy trình tạo thành một quy trình ARMA hoặc mô hình ARIMA liên quan

đến một chuỗi biến ngẫu nhiên mà chúng ta cần biết các giá trị của p, đ và q

Phương pháp Box - Jenkins bao gồm 3 bước chính đó là: nhận diện mô hình,

ước lượng các tham sô của mô hình, kiêm định các tham sô và đánh giá hiệu quả của

Trang 25

mô hình băng cách sử dụng các chỉ số đánh giá mô hình Các bước trên đượcthực hiện tuần tự và lặp đi lặp lại cho đến khi thu được mô hình được đánh giá là tốtnhất Từ đó, chúng ta có thê tiếp tục sử dụng mô hình kết quả để phân tích và dự báo

2.2 Các bước xây dựng mô hình ARIMA và dự báo

2.2.1 Nhận dạng mô hình

Việc xác định được các giá tri thích hợp của d, p và q chính là bước quan trọng

nhất trong việc nhận dang mô hình ARIMA(p, d, q)

Bước dau, chúng tôi sử dụng phương pháp kiểm định nghiệm đơn vị ADF(Augmented Dickey - Fuller) dé xác định tính dừng của chuỗi giá đóng cửa cô phiếuVCB, từ đó thu được giá trị của tham số d Nếu chuỗi thời gian gốc là chuỗikhông dừng, ta tiếp tục lẫy sai phân của chuỗi để kiểm tra tính dừng, hoặc trongmột số trường hợp, ta có thể dùng logarit của chuỗi gốc Từ đó có thê xác định một giá

trị hiệu d thích hợp cho phù hợp với bài toán.

Dé xác định thứ tự của p và q của chuỗi dừng thu được (có thé là chuỗi gốchoặc chuỗi sai phân), chúng tôi sử dụng lược đồ tự tương quan - ACF và tự tươngquan riêng - PACF Sơ đồ biéu diễn các giá trị ACF va PACF trong thời gian trễ.Đồng thời vẽ một đường phân chia thể hiện khoảng tin cậy 95% cho các giá trịbang 0 của hệ số tự tương quan và hệ số tự tương quan riêng Đôi khi rất khó khăn

và tốn thời gian dé tìm đúng các giá tri của p và q cho một mô hình ARMA bằng cáchphân tích các đồ thị ACF và PACF như đã đề cập ở trên Do đó, có một số cách dễ dànghon dé tùy chỉnh mẫu này Hầu hết các công cu thống kê ngày nay đều có một tinh năngtích hợp thường được gọi là "ARIMA tự động" - một tính năng bạn có thê thấy trongPython Ở đây có thé tìm thấy giá trị p và q của các quá trình AR(p) mà MA(q)

Mô hình Đồ thị ACF Đồ thị PACF

các biên tré

MA sở x

cac bién tré

ARMA(p, q) Giam dan theo | Giảm dan theo

cac bién tré các biên tré

Bảng 2.1: Kết quả kết hợp mô hình ARMA

2.2.2 Ước lượng các tham số mô hình ARIMA(p, d, q)

Ước lượng các hệ số ở và Ø của mé hình ARIMA theo phương pháp Ước lượngbình phương nhỏ nhất OLS hoặc Ước lượng hợp lý cực đại Maximum Likelihood Cụ

Trang 26

thê ở đây, ta sử dụng cổng cụ ước lượng tự động của phần mềm Python bằng phương

pháp Ưóc lượng hop lý cực dai Maximum Likelihood.

2.2.3 Kiểm định mô hình

Sau khi có kết quả ước lượng các hệ số của mô hình, chúng ta tiến hành kiêmđịnh xem chúng có ý nghĩa thống kê hay không Các hệ số ước lượng của mô hìnhphải có ý nghĩa thống kê để đánh giá và giải thích tác động của các biến độc lập đếnbiến phụ thuộc Mức ý nghĩa thống kê thường được sử dụng ở độ tin cậy 95% nên cóthể kết luận P-value của các hệ số của từng biến được so sánh với 0,05, từ đó có thểxếp biến nào là có ý nghĩa thống kê và biến nào có ý nghĩa thống kê không có ýnghĩa từ quan điểm của mô hình Nếu P-value của biến nhỏ hơn 0,05 thì có thể coi95% hệ số ước lượng ảnh hưởng đến biến phụ thuộc, hay nói cách khác, ở đây hệ SỐ

ước lượng khác 0 và có ý nghĩa.

Nếu kết quả thu được cho nhiều hơn một mô hình đúng, chúng ta xem xét tiêuchí AIC (Akaike Information Criterion) để lựa chọn mô hình Tiêu chí thông tinAkaike (AIC) là một phương pháp toán học dé đánh giá mức độ phù hợp của một môhình với dt liệu mà nó được tao ra Trong thống kê, AIC được sử dụng để so sánhcác mô hình khả thi khác nhau và xác định mô hình nào phù hợp nhất với dữ liệu Do

đó, mô hình có giá trị chỉ số AIC thấp nhất là phù hợp nhất

Công thức tính chỉ số AIC như sau:

AIC = 2k — 2lnÏ (2.2.1)

Trong đó: k sé lượng biến độc lập được sử dụng dé xây dung mô hình

L giá tri đo lường mức độ phù hợp của mô hình thống kê

Cuối cùng sau khi nhận dạng được dạng phương trình cho mồ hình ARMA,điều chúng ta cần phải làm tiếp theo là tiến hành kiểm định xem phan dư uz của mồhình có là một nhiễu trắng hay khóng bằng cách sử dụng kiểm định Ljung-Box

2.2.4 Dự báo

Sử dụng mô hình thu được dé dự báo ngắn han cho chuỗi giá cô phiếu VCB taithời điểm ngày 1/10/2022 đến 30/10/2022 với độ tin cậy 95% bằng phần mềm Python

2.3 Mang nơ-ron hồi quy nhân tạo — Mạng Long short-term memory

2.3.1 Mạng nơ-ron hồi quy nhân tạo (Recurrent Neural Network -RNN)

Bài toán dự đoán chuỗi thời gian đã được tiếp cận trong khuôn khô xấp xi hàm,bằng cách dựa vào quy trình nhúng do Takens đề xuất Định lý Takens chuyền bài

toán dự đoán từ phép ngoại suy thời gian thành phép nội suy không gian pha Đặc

Trang 27

biệt, bằng cách lay mẫu đúng một đại lượng phụ thuộc thời gian s¿, có thé dự đoángiá trị của mẫu thứ k từ các mẫu trước đó, đưa ra lựa chọn thích hợp về tần suất laymẫu + và số lượng mẫu m:

Do có bộ nhớ trong, RNN có thé nhớ những điều quan trọng về đầu vào machúng nhận được, điều này cho phép chúng dự đoán rất chính xác điều gì sẽ xảy ratiếp theo Day là lý do tại sao chúng là thuật toán ưa thích cho dt liệu tuần tự

như chuỗi thời gian, lời nói, văn bản, dữ liệu tài chính, âm thanh, video, thời tiết,

v.v Các mạng thần kinh tái phát có thé hình thành sự hiểu biết sâu sắc hơn nhiều vềmột chuỗi và bối cảnh của nó so với các thuật toán khác

RNN là một loại mạng nơ — ron đặc biệt được đặc trưng bởi các kết nối bêntrong của nó, về cơ bản có thê là bất kỳ hệ thống động học phi tuyến tính nào với độchính xác nhất định RNN và các biến thé của chúng đã được sử dụng trong nhiều bốicảnh trong đó sự phụ thuộc vào thời gian của dữ liệu là một tinh năng quan trọng tiềmtang của thiết kế mô hình Các ứng dụng nổi bật của RNN bao gồm truyền trình tự,

mô hình hóa ngôn ngữ, nhận dạng giọng nói, mô hình hóa giọng nói, nhận dạng

chữ viết tay và tạo hình ảnh Một biến thể đặc trưng của mạng RNN chính là mạngLong short — term memory (Mạng bộ nhớ dài ngắn hạn) Nó gần đây đã thu hút rấtnhiều sự chú ý vì khả năng học và lưu giữ thông tin trong thời gian rất dài Chúng taxem xét đầu ra của mạng, tại mỗi bước thời gian, dữ liệu đầu ra và các tính toán trước

đó là điểm bắt đầu cho dự đoán dau ra Điều nay cho phép mang phát trién bộ nhớ dé

lưu trữ các sự kiện trong quá khứ Các quan sát trong quá khứ được mã hóa hoàn toàn

trong các biến trạng thái ẩn của mạng Day là điểm khác biệt chính giữa mang no ronhồi quy nhân tạo và mạng no ron truyền thang truyền thống, trong đó tất cả cácđầu vào (và đầu ra) được giả định là không phụ thuộc vào nhau Về mặt lý thuyết,

Trang 28

RNN có thé nhớ các chuỗi có độ dài tùy ý Tuy nhiên, trên thực tế, khả năng lưu trữthông tin của chúng có kích thước khá nhỏ và quan trọng hơn là bởi các thông số đàotạo dưới mức tối ưu của chúng Đề khắc phục những hạn chế về bộ nhớ, nghiên cứugần đây đã dẫn đến sự phát triển của biến thể RNN mới được trang bị bộ nhớ ngoàivĩnh viễn có thé lưu trữ dữ liệu vô thời hạn

Trái ngược với các mô hình tuyến tính khác được sử dụng dé dự đoán, RNN

có thé học các hàm tính toán có độ phức tạp tùy ý và chúng có thé xử lý dữ liệu chuỗi

thời gian sở hữu các thuộc tính như độ bão hòa hoặc hàm số mũ và tương tác tuyến

tính giữa các biến tiềm ân Trong các bài toán dự báo phức tạp, chuỗi thời gian được

dự đoán có đặc điểm là phụ thuộc vào khoảng thời gian dài, mà mức độ có thé thayđổi theo thời gian hoặc không được biết trước thì việc sử dụng RNN có thé là giảipháp tốt nhất

Cốt lõi của RNN (Recurrent Neural Network) là sử dụng các thông tin ở dướidạng chuỗi Ưu điểm của RNN là chúng có thé thực hiện cùng một tác vụ cho tất cảcác phần tử của một chuỗi với kết quả đầu ra phụ thuộc vào cả những kết quả ở phéptính trước, chứ không như với các mạng nơ-ron truyền thống khác là tất cả các đầuvào và đâu ra là độc lập với nhau Trong bối cảnh dự đoán, RNN được đào tạo trên

dữ liệu thời gian đầu vào x(t) dé tái tạo đầu ra theo thời gian mong muốn y(t) Đầu

ra y(t) có thé là nhiều chuỗi thời gian liên quan đến đầu vào và thậm chí là sự dịchchuyền theo thời gian của chính x(t) Các quy trình dao tao phô biến nhất dựa trêngradient, nhưng các kỹ thuật khác đã được đề xuất, dựa trên phương pháp tiếp cậnkhông đạo hàm hoặc tối ưu hóa lồi Hàm mục tiêu được tối thiêu hóa là hàm tốn that,hàm này phụ thuộc vào sai số giữa đầu ra ước tinh y(t) và đầu ra thực tế của mạngy(t) Một khía cạnh thú vi của RNN là, khi được dao tạo phù hợp, chúng cũng có thểđược thực hiện ở chế độ tự sinh ra những thông tin mới vì chúng không có khả năng

tái tạo các mô hình thời gian tương tự như các mô hình mà chúng đã được đào tạo

Trang 29

x(t) là dữ liệu đầu vào tại bước £

sự là trạng thái ân tại bước t Đây chính là bộ lưu trữ của mạng, s¿ đượctính toán nhờ vào các trạng thái ấn trong quá khứ va cả giá trị của dữ liệu đầu

vào tại bước t Ta có công thức: s, = f(Ux, + Ws,_,) Hàm ƒ ở đây thường

không phải là một hàm tuyến tính như hàm tanh (tang hyperbolic) hay hàmReLu Để thực hiện được phép toán cho trạng thái ấn thứ nhất ta cần khởitạo thêm s_,, và thông thường giá trị này sẽ được gan định bang giá trị 0

o, là đầu ra tại bước £

2.3.2 Mạng bộ nhớ Ngắn han dài (Long short — term memory)

Mạng bộ nhớ ngắn han dài han (LSTM) được thiết kế đặc biệt dé giải quyếtvan dé phụ thuộc dài hạn mà mạng nơ - ron hồi quy RNNs gặp phải (do độ khó, matcác gradiant) LSTM có các kết nối phản hồi giúp phân biệt chúng với các mạng thankinh truyền thống hơn Tinh năng này cho phép LSTM xử lý toàn bộ tập dit liệu(chang hạn như chuỗi thời gian) mà không xử lý từng điểm trong chuỗi riêng lẻ màthay vào đó giữ lai thông tin hữu ích về dữ liệu trước đó trong chuỗi dé tạo điều kiện

xử lý các điểm dit liệu mới LSTM, giống như tất cả các kiến trúc mạng thần kinh,được lấy cảm hứng từ sinh học Điều này có nghĩa là chúng hoạt động giống như một

số quá trình sinh học Mạng bộ nhớ dài ngắn hạn được lay cảm hứng từ cách thức

hoạt động của vỏ não thị giác trong não người Mặt khác, LSTM bắt nguồn từ cách

thức hoạt động của bộ nhớ Vì vậy, người ta chia trí nhớ thành hai loại: trí nhớ

ngắn hạn và trí nhớ dài hạn

Trí nhớ ngắn hạn: hoạt động khi thông tin được tiếp thu Trong bộ nhớngắn hạn, thông tin chỉ được lưu giữ trong vài giây, sau đó nó sẽ được lưu giữ trong

thời gian dải hơn hoặc bị loại bỏ.

Trang 30

Trí nhớ dai hạn: lưu giữ thông tin, cho phép truy xuất hoặc gọi lại sau này.Tất cả kiến thức chúng ta có đều được "lưu trữ" trong bộ nhớ dài hạn

Do đó, LSTM đặc biệt tốt trong việc xử lý các chuỗi dữ liệu như văn bản, lờinói và chuỗi thời gian nói chung Tuy nhiên, không phải thông tin tại bất kì thời điểmnào LSTM cũng ghi nhớ Ghi nhớ thông tin trong thời gian dài thực tế là hành vi mặcđịnh của nó, không phải là thứ mà nó phải vật lộn dé hoc Tất ca các mạng nơrontuần hoàn đều có dạng một chuỗi các môđun lặp lại của mạng noron Mạng LSTM có

cơ chế chọn lọc và ghi nhớ thông tin, và loại bỏ những thông tin không cần thiết Việcnày sẽ dam bảo thông tin trong quá khứ được mang day đủ chính xác Đầu tiên, chúng

ta sẽ quy ước thông tin được lưu giữ tại thời điểm thứ £ là trạng thái của tế bào được

&) @) & |

Hình 2.2: Mô hình mạng Long short — term memory (LSTM) chuẩn

Mạng nơ-ron hồi quy và LSTM đều có các thành phan cấu tạo, kiến trúc giốngnhư chuỗi này, nhưng mô-đun quay vòng lại có cấu trúc khác Thay vì có mộtlớp mạng nơ-ron duy nhất, có bốn lớp được kết nối với nhau, tác động qua lại

lẫn nhau như sau theo một cách rất đặc biệt 4 lớp chính bao gồm:

Các lớp cau tạo nên một mạng và trong đó được bồ sung các no-ron, hay chúng

ta gọi đó là kiến trúc mạng

Dữ liệu đầu vào đáp ứng được giá trị mong muốn của mạng

Hàm mat mát (Loss junction): chúng ta sẽ lựa chọn ham mat mát phù hợp với

bài toán được đặt ra.

Trong lý thuyết quyết định và tối ưu hóa toán học , hàm mat mát hoặc hàm chi

phí (đôi khi còn được gọi là hàm lỗi) là một hàm ánh xạ một sự kiện hoặc giá trị của

một hoặc nhiều biến vào một số thực biểu thị một cách trực quan một số "chỉ phí"liên quan đến sự kiện Một van đề tối ưu hóa tìm cách giảm thiểu hàm mấtmát Hàm mục tiêu hoặc là hàm mat mát hoặc ngược lại (trong các lĩnh vực cụ thể,được gọi bằng nhiều cách khác nhau là hàm phần thưởng , hàm lợi nhuận , hàm tiện

Trang 31

ich , hàm thích nghị, v.v.), trong trường hợp đó nó sẽ được tối da hóa Ham mat mát

có thé bao gồm các thuật ngữ từ một số cấp độ của hệ thống phân cap

Trong thống kê, thông thường, một hàm mat mát được sử dụng để ước tínhtham số và sự kiện được đề cập là một số hàm của sự khác biệt giữa giá trị ước tính

và giá trị thực đối với một phiên bản dữ liệu Khái niệm cũ như Laplace , đã đượcgiới thiệu lại trong thống kê boi Abraham Wald vào giữa thé ky 20 Ví dụ, trong bốicảnh kinh tế học , đây thường là chi phí kinh tế hoặc sự hồi tiếc Trong phân loại,

đó là hình phạt cho việc phân loại sai một ví dụ Trong khoa học chuyên gia tính toán

, nó được sử dụng trong bối cảnh bảo hiểm dé mô hình hóa các lợi ich được trả trênphí bảo hiểm, đặc biệt kể từ khi các tác phẩm củaHarald Cramér vào những năm

1920 Trong điều khiến tối wu , ton thất là hình phạt nếu không dat được giá tri mong

muốn Trong quản lý rủi ro tài chính , chức năng này được ánh xạ tới tốn thất tiền tệ.

Thuật toán dùng để huấn luyện mạng (dùng đề tối ưu hoá bộ thông số của

mô hình).

LL] © —> >> —

Neural Network Pointwise Vector

Layer Operation Transfer Cenestenate Copy

Hình 2.3: Các kí hiệu được sử dung trong cấu trúc mạng LSTM

Theo sơ đồ trên, đầu tiên chúng ta có một hộp màu vàng hình chữ nhật đạidiện cho thông tin đã học và được lưu trữ Tiếp theo, các vòng tròn màu hồng théhiện các thao tác đo điểm chang hạn như phép cộng vecto Ở trung tâm là một biéutượng mũi tên biểu thị hướng mà đầu ra của một nút đang hoạt động đi đến đầu vàocủa các nút khác Kí tự số hai mũi tên rẽ nhánh ở đuôi đại diện cho sự kết nối thôngtin, trong khi các mũi tên chỉ vào hai nhánh cho biết nội dung của nó được sao chép

và các bản sao được gửi đến những nơi khác nhau

2.3.3 Ý tưởng cốt lõi của LSTM

Chia khóa của mô hình LSTM nằm trong một 6 nhớ được gọi là "trạng thái 6"duy trì trạng thái của nó theo thời gian Trạng thái 6 là đường nam ngang chạy quađầu sơ đồ bên dưới Nó có thé được hình dung như một băng chuyền mà qua đó thôngtin được truyền đi một cách đơn giản không thay đôi Như đã đề cập ở trên, LSTM cómột loại cơ chế lọc dữ liệu, vì vậy LSTM không lưu trữ dữ liệu bat cứ lúc nào Thôngtin có thé được thêm hoặc bớt từ trạng thái tế bào trong LSTM và các công điều khiển.Các công này tùy chọn cho phép dữ liệu chảy vào và ra khỏi ô Nó chứa một lớp

Trang 32

mạng thần kinh sigmoid hỗ trợ cơ chế va hoạt động nhân dấu cham LSTM có khanăng loại bỏ hoặc thêm thông tin vào trạng thái của một 6, được kiểm soát cần thậnbởi các cau trúc gọi là công Một công là một cách tùy ý dé truyền thông tin Chúngbao gồm lớp mang thần kinh sigmoid và phép toán nhân theo điểm

—‹`—

Hình 2.4: Ki hiệu cong trong LSTM

Sigmoid thuộc họ hàm kích hoạt phi tuyến tính [1] Nó được chứa bởi công.Không giống như tanh, sigmoid duy trì các giá trị từ 0 đến 1 Nó giúp mang cập nhậtthêm quan sát hoặc loại trừ đi những dữ liệu không đáp ứng nhu cầu Nếu phép nhâncho kết quả bằng 0, thông tin được coi là thông tin không đủ điều kiện giữ lại và sẽ

bị loại bỏ Tương tự, thông tin sẽ được giữ lại nếu giá trị là 1 Điều này sẽ giúp mạng

biệt được dữ liệu nào có thê bỏ qua và dữ liệu nào quan trọng cân giữ lại.

[1] Trong mang neural nhân tạo, hàm kích hoạt của một nút định nghĩa đầu ra của nút

đó được cho bởi một đầu vào hay tập đầu vào Hiểu theo cách khác, với một đầu vaohay tập đầu vào, hàm kích hoạt sẽ cho ra đầu ra của một nút bất ky nao đó Một vimach tiêu chuẩn có thé xem là một mạch chip máy tính của các hàm kích hoạt có haitrạng thái "ON" hoặc "OFF", tùy theo đầu vào Điều này tương tự như hành vicủa perceptron trong mạng than kinh Tuy nhiên, chỉ có những hàm kích hoạt khôngtuyến tính mới cho phép các mạng thần kinh tính toán các bài toán khó (không tầmthường) với việc dùng một số lượng nhỏ các nút Trong mạng thần kinh nhân tạo,hàm này được gọi là hàm truyền

2.3.4.1 Tang cong quên ( Forget Gate)

Công quên quyết định thông tin nào cần chú ý và thông tin nào có thé bỏ qua.Thông tin từ đầu vào hiện tại X, và trạng thái ân h,_; được truyền qua ham sigmoid.Sigmoid tạo ra các giá tri từ 0 đến 1 Nó kết luận liệu một phần của đầu ra cũ có cầnthiết hay không (bằng cách cho dau ra gần với 1 hơn) Giá trị này của f(t) sau đó sẽđược 6 sử dụng dé nhân từng điểm Kết quả bằng 1 biểu thị cho việc thông tin đượcgiữ lại, số 0 cho biết thông tin này không đủ điều kiện dé giữ lại

Tiêu đề	Ứng dụng mô hình ARIMA và mạng RNN dự báo chuỗi giá đóng cửa của cổ phiếu ngân hàng TMCP Ngoại thương Việt Nam - VCB
Tác giả	Nguyễn Thị Quỳnh Anh
Người hướng dẫn	TS. Hoàng Đức Mạnh
Trường học	Trường Đại Học Kinh Tế Quốc Dân
Chuyên ngành	Toán Kinh Tế
Thể loại	Chuyên đề thực tập tốt nghiệp
Năm xuất bản	2022
Thành phố	Hà Nội

Định dạng
Số trang	65
Dung lượng	15,79 MB