1. Trang chủ
  2. » Luận Văn - Báo Cáo

Dự báo mã chứng khoán “vcb” bằng phương pháp arima

28 0 0
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 28
Dung lượng 2,11 MB

Nội dung

Chuỗi dừng: Một chuỗi dữ liệu thời gian được xem là dừng nếu như trung bình vàphương sai của phương trình không thay đổi theo thời gian và giá trị của đồng phươngsai giữa hai đoạn chỉ ph

Trang 1

TRƯỜNG ĐẠI HỌC NGÂN HÀNG TP HỒ CHÍ MINH

BÀI NHÓM Môn: Kinh tế lượng ứng dụng trong tài chính

THÔNG TIN BÀI THI

Bài thi có: (bằng số): 29 trang

(bằng chữ): hai mươi chín trang

NHÓM 6 ST

Trang 2

DỰ BÁO MÃ CHỨNG KHOÁN “VCB” BẰNG PHƯƠNG PHÁP ARIMA Bước 1: Xác định chuỗi chứng khoán VCB có phải chuỗi dừng hay không? Chuỗi dừng: Một chuỗi dữ liệu thời gian được xem là dừng nếu như trung bình và

phương sai của phương trình không thay đổi theo thời gian và giá trị của đồng phươngsai giữa hai đoạn chỉ phụ thuộc vào khoảng cách hay độ trễ về thời gian giữa hai thờiđoạn này chứ không phụ thuộc vào thời điểm thực tế mà đồng phương sai được tính(Ramanathan, 2002)

Cách 1: Căn cứ vào biểu đồ Graph

Điều kiện để chuỗi chứng khoán VCB là chuỗi dừng:

Trang 3

Lý thuyết: Xu thế (Trend) là thành phần thể hiện sự tăng (hoặc giảm) ẩn bên trong của

một chuỗi thời gian Thường được ký hiệu là T

Ứng dụng:

Nhìn tổng quan các giai đoạn tại đồ thị hình 1.1, ta thấy chuỗi chứng khoán VCBkhông có trend, cụ thể chuỗi chứng khoán VCB không có trend tại giai đoạn từ 9 – 13nhưng lại có trend tăng vào giai đoạn 18 - 21

Chu kỳ

Lý thuyết: Chu kỳ (Cyclical) là thành phần thể hiện sự tăng (hoặc giảm) ẩn bên trong

của thời kỳ Thông thường là trên 1 năm Người ta thường ký hiệu thành phần chu kỳ làC

Ứng dụng:

Muốn một chu kỳ xảy ra bình quân phải mất 10 năm, vậy để chu kỳ lặp lại bìnhquân cần khoảng 20 năm trở lên Trong hình 1.1, nhóm nhận thấy rằng chuỗi này kéo dàitrong khoảng 11 năm (từ 30/06/2009 đến 29/11/2021), do vậy có thể kết luận rằng chuỗichứng khoán VCB không có tính chu kỳ

Mùa

Lý thuyết:

Mùa (Seasonal) là những dao động mùa vụ rất thường được tìm thấy với dữ liệutheo quý, theo tháng, hoặc thậm chí theo tuần Nếu chỉ có dữ liệu theo năm thì không cóbiến động mùa Sự dao động mùa vụ liên quan đến kiểu thay đổi khá ổn định xuất hiệnhàng năm và kiểu thay đổi đó được lặp lại ở năm sau và các năm sau nữa Thường được

ký hiệu là S

Ứng dụng:

Trang 4

Có thể nhận thấy rằng trong giai đoạn 2013 – 2017, không có sự tương đồng giữa cácquý theo từng năm Vì vậy có thể kết luận rằng chuỗi chứng khoán VCB không có tínhmùa.

Irregular Fluctuations

Lý thuyết:

Irregular Fluctuations: Gồm những thay đổi ngẫu nhiên hay không dự đoán trước

Trang 5

được Những sự thay đổi bất thường là kết quả của vô số những sự kiện mà nếu xét riêng

lẻ thì không quan trọng gì, còn nếu kết hợp các sự kiện riêng lẻ đó lại thì có thể tạo ramột ảnh hưởng lớn Thành phần này được ký hiệu là u hay I

Ứng dụng: Nhìn vào hình 1.1, có thể nhận thấy rằng chuỗi chứng khoán VCB có tính Irregular Fluctuations

Trung bình:

Lý thuyết:

Giá trị trung bình hay còn được gọi là giá trị kỳ vọng (expected value) là bình quân toán học đơn giản của một tập hợp gồm hai hoặc nhiều số Giá trị trung bình của một tập hợp số đã cho có thể được tính theo nhiều cách, gồm có phương pháp trung bình

số học sử dụng tổng các số trong chuỗi và phương pháp trung bình hình học Tuy nhiên, tất cả các phương pháp chính để tính trung bình đơn giản của một chuỗi số bình thường đều tạo ra kết quả xấp xỉ bằng nhau

Điều kiện:

Ứng dụng:

Bảng thống kê trung bình qua từng giai đoạn

Tại giai đoạn từ 9 – 13, thấy được trung bình của chuỗi chứng khoán VCB là xấp xỉ 18;tuy nhiên vào giai đoạn từ 13 – 18, trung bình của nó lại rơi vào khoảng 41; tại giai đoạn

từ 18 – 21, trung bình của nó là xấp xỉ 82

Từ đó ta có thể thấy được trung bình của từng giai đoạn chênh nhau một khoảng rất lớn,

cụ thể trung bình ở giai đoạn 9 – 13 với giai đoạn 13 – 18 chênh lệch nhau 23; ở giaiđoạn 13 – 18 với giai đoạn 18 – 21 chênh lệch nhau 41; ở giai đoạn 9-13 với 18 - 12chênh lệch nhau 64 Vì thế dễ dàng thấy được trung bình không phải là một hằng số Ta

có thể kết luận trung bình của chuỗi chứng khoán VCB thay đổi

Phương sai:

Trang 6

Lý thuyết:

Phương sai (Variance) là phép đo mức chênh lệch giữa các số liê ru trong một tập

dữ liệu trong thống kê Nó đo khoảng cách giữa mỗi số liê ru với nhau và đến giá trị trungbình của tâ rp dữ liê ru

Điều kiện:

Ứng dụng:

Bảng thống kê biên độ dao động của chuỗi VCB qua từng giai đoạn

Xét giai đoạn 9 – 13, ta thấy biên độ giao động của chuỗi chứng khoán VCB là khoảng

từ 10 – 20, nhưng biên độ dao động của chuỗi chứng khoán VCB ở giai đoạn 13 – 18 là

từ 16 – 70 và biên độ dao động của nó trong giai đoạn 18 – 21 rơi vào khoảng 50 – 118

Từ đó ta thấy khoảng dao động của từng giai đoạn chênh lệch nhau rất nhiều, cụ thể ởgiai đoạn 9 – 13 biên độ dao động chênh lệch nhau trong khoảng 10; ở giai đoạn 13 – 18biên độ dao động chênh lệch nhau trong khoảng 54; ở giai đoạn 9 – 13 biên độ dao độngchênh lệch nhau trong khoảng 68 Ta thấy biên độ dao động tại từng khoảng có sự thayđổi Nên có thể kết luận phương sai của chuỗi chứng khoán VCB thay đổi

Hiệp phương sai:

Lý thuyết: Hiệp phương sai (Covariance) là đại lượng phản ánh mức độ tương quan

tuyến tính của hai biến số

Điều kiện:

Ứng dụng:

Ta có: phương sai thay đổi, trung bình thay đổi, vì thế kết luận rằng hiệp phương saithay đổi

Trang 7

Kết luận:

Do chuỗi chứng khoán VCB không thỏa mãn đủ cả 3 điều kiện để là chuỗi dừng,

cụ thể là phương sai, trung bình và hiệp phương sai của chuỗi chứng khoán VCB đềuthay đổi nên chuỗi chứng khoán VCB không phải chuỗi dừng

Cách 2: Căn cứ kiểm định nghiệm Dickey and Fuller

Lý thuyết:

Kiểm định nghiệm đơn vị (Unit Root Test) là một kiểm định được sử dụng kháphổ biến để kiểm định một chuỗi thời gian dừng hay không dừng Giả sử ta có phươngtrình tự hồi quy như sau:

Auto regressive function:

AR(1): Y t  Y t 1 u t với u t~iid N0;2

t

u là nhiễu trắng.

Nếu 1:chuỗi dừng

Nếu 1: chuỗi có nghiệm đơn vị (chuỗi không dừng).

Nếu 1: chuỗi bị bùng nổ (explosive series)

Augmented Dickey-Fuller test statistic 0.314102 0.9791

Test critical values: 1% level -3.432269

Trang 8

*MacKinnon (1996) one-sided p-values.

Vậy với giá trị Prob > (0.9791 > 0.01)  Chưa đủ cơ sở bác bỏ H0

Chuỗi VCB không phải là chuỗi dừng

Bước 2: Xử lí chuỗi VCB không dừng thành chuỗi DVCB là chuỗi dừng.

Hình 1.2

Bước 3: Xác định chuỗi DVCB có phải là chuỗi dừng hay không

Trang 9

Chuỗi dừng: Một chuỗi dữ liệu thời gian được xem là dừng nếu như trung bình và

phương sai của phương trình không thay đổi theo thời gian và giá trị của đồng phươngsai giữa hai đoạn chỉ phụ thuộc vào khoảng cách hay độ trễ về thời gian giữa hai thờiđoạn này chứ không phụ thuộc vào thời điểm thực tế mà đồng phương sai được tính(Ramanathan, 2002)

Cách 1: Căn cứ vào biểu đồ Graph

Điều kiện để chuỗi DVCB là chuỗi dừng:

Lý thuyết: Xu thế (Trend) là thành phần thể hiện sự tăng (hoặc giảm) ẩn bên trong của

một chuỗi thời gian Thường được ký hiệu là T

Trang 10

Ứng dụng: Nhìn vào đồ thị hình 1.3, chuỗi DVCB có hướng nằm ngang vậy nên chuỗiDVCB không có trend.

Chu kỳ:

Lý thuyết: Chu kỳ (Cyclical) là thành phần thể hiện sự tăng (hoặc giảm) ẩn bên trong

của thời kỳ Thông thường là trên 1 năm Người ta thường ký hiệu thành phần chu kỳ làC

Ứng dụng:

Muốn một chu kỳ xảy ra bình quân phải mất 10 năm, vậy để chu kỳ lặp lại bìnhquân cần khoảng 20 năm trở lên Trong hình 1.3, nhóm nhận thấy rằng chuỗi DVCB kéodài trong khoảng 11 năm (từ 30/06/2009 đến 29/11/2021), do vậy có thể kết luận rằngchuỗi DVCB không có tính chu kỳ

Mùa:

Lý thuyết:

Mùa (Seasonal) là những dao động mùa vụ rất thường được tìm thấy với dữ liệutheo quý, theo tháng, hoặc thậm chí theo tuần Nếu chỉ có dữ liệu theo năm thì không cóbiến động mùa Sự dao động mùa vụ liên quan đến kiểu thay đổi khá ổn định xuất hiệnhàng năm và kiểu thay đổi đó được lặp lại ở năm sau và các năm sau nữa Thường được

ký hiệu là S

Ứng dụng:

Ta thấy rằng chuỗi DVCB trong giai đoạn 2009 – 2021, tất cả các quý theo các năm đều có sự thay đổi “đi ngang” nên có thể đưa ra kết luận rằng chuỗi DVCB có tính mùa

Irregular Fluctuations:

Lý thuyết:

Trang 11

Irregular Fluctuations: Gồm những thay đổi ngẫu nhiên hay không dự đoán trướcđược Những sự thay đổi bất thường là kết quả của vô số những sự kiện mà nếu xét riêng

lẻ thì không quan trọng gì, còn nếu kết hợp các sự kiện riêng lẻ đó lại thì có thể tạo ramột ảnh hưởng lớn Thành phần này được ký hiệu là u hay I

Ứng dụng: Nhìn vào hình 1.3, có thể nhận thấy rằng chuỗi DVCB có tính IrregularFluctuations

Trung bình:

Lý thuyết:

Giá trị trung bình hay còn được gọi là giá trị kỳ vọng (expected value) là bình quân toán học đơn giản của một tập hợp gồm hai hoặc nhiều số Giá trị trung bình của một tập hợp số đã cho có thể được tính theo nhiều cách, gồm có phương pháp trung bình

số học sử dụng tổng các số trong chuỗi và phương pháp trung bình hình học Tuy nhiên, tất cả các phương pháp chính để tính trung bình đơn giản của một chuỗi số bình thường đều tạo ra kết quả xấp xỉ bằng nhau

Điều kiện:

Ứng dụng:

Ta thấy dữ liệu của chuỗi DVCB có xu hướng xoay quanh giá trị 0, cụ thể xéttrung bình ở các giai đoạn: 9 - 13, 13 - 18, 18 – 21, ta có thể nhận thấy rằng trung bìnhcủa các giai đoạn đều gần như bằng 0 Từ đó kết luận trung bình của chuỗi DVCBkhông thay đổi, là một hằng số

Phương sai:

Lý thuyết:

Phương sai (Variance) là phép đo mức chênh lệch giữa các số liê ru trong một tập

dữ liệu trong thống kê Nó đo khoảng cách giữa mỗi số liê ru với nhau và đến giá trị trungbình của tâ rp dữ liê ru

Điều kiện:

Trang 12

Ứng dụng:

Chọn khoảng biên độ dao động cho phép là từ -3 tới 3, ta thấy biên độ dao độngqua từng giai đoạn khá đều nhau và vẫn trong khoảng biên độ dao động đã chọn, mặtkhác có một số giai đoạn tồn tại dao động với biên độ vượt quá khoảng biên độ daođộng đã chọn Cụ thể là tại giai đoạn 17 – 21, có những dao động với biên độ từ -4 tới 4,

từ -5 tới 5, Tuy nhiên với những dao động đó, số quan sát vượt qua biên độ (khoảng

200 quan sát) so với tổng số quan sát trong dữ liệu chạy (3103 quan sát) là không đáng

kể, tỷ lệ sai sót chỉ ở mức xấp xỉ 6,5%, vẫn trong mức sai sót chấp nhận được (mức ýnghĩa α = 10%) Vì thế, biên độ dao động chênh lệch không nhiều, ta kết luận phươngsai không thay đổi

Hiệp phương sai:

Lý thuyết: Hiệp phương sai (Covariance) là đại lượng phản ánh mức độ tương quan

tuyến tính của hai biến số

Cách 2: Căn cứ kiểm định nghiệm Dickey and fuller

Lý thuyết:

Kiểm định nghiệm đơn vị (Unit Root Test) là một kiểm định được sử dụng kháphổ biến để kiểm định một chuỗi thời gian dừng hay không dừng Giả sử ta có phương

Trang 13

trình tự hồi quy như sau:

Auto regressive function:

AR(1): Y t  Y t 1 u t với u t~iid N0;2

t

u là nhiễu trắng.

Nếu 1:chuỗi dừng

Nếu 1: chuỗi có nghiệm đơn vị (chuỗi không dừng)

Nếu 1: chuỗi bị bùng nổ (explosive series)

Augmented Dickey-Fuller test statistic -55.34086 0.0001

Test critical values: 1% level -3.432269

5% level -2.862274 10% level -2.567205

*MacKinnon (1996) one-sided p-values.

Vậy với giá trị Prob < (0.0001 < 0.01)  Bác bỏ H0

Trang 14

Mô hình ARIMA là một mô hình phân tích thống kê sử dụng dữ liệu chuỗi thời gian

để hiểu rõ hơn về tập dữ liệu hoặc để dự đoán các xu hướng trong tương lai

Tham số ARIMA: Mô hình ARIMA được biểu diễn dưới dạng ARIMA (p, d, q) trong

đó mỗi chữ cái tương ứng với một trong ba phần được mô tả ở trên Ba chữ cái này đạidiện cho các tham số mà bạn sẽ phải cung cấp và được mô tả như sau:

p xác định số thuật ngữ tự động hồi quy (AR)

d xác định thứ tự của sự khác biệt (I)

q xác định số điều kiện của đường trung bình động (MA)

Mô Hình Tự Hồi Quy Bậc p-AR(p)

Trong mô hình tự hồi qui quá trình phụ thuộc vào tổng có trọng số của các giá trị quákhứ và số hạng nhiễu ngẫu nhiên

Trong đó là nhiễu trắng

Mô Hình Trung Bình Trượt Bậc q – MA(q)

Trong Mô hình trung bình trượt, quá trình được mô tả hoàn toàn bằng tổng có trọng

số của các ngẫu nhiên hiện hành có độ trễ

, t = 1,2, ,n

Trong đó ut là nhiễu trắng

Hàm tự tương quan (autocorrelation function, ACF)

Hàm tự tương quan đo lường phụ thuộc tuyến tính giữa các cặp quan sát y(t) vày(t+k), ứng với thời đoạn k = 1, 2, …(k còn gọi là độ trễ) Với mỗi độ trễ k, hàm tựtương quan tại độ trễ k được xác định qua độ lệch giữa các biến ngẫu nhiên so với cácgiá trị trung bình, và được chuẩn hóa qua phương sai

Xác định SACF:

Trang 15

SACF có xu hướng giảm dần và tắt nhanh về 0 => chuỗi dừng

Hàm tự tương quan từng phần (Partial autocorrelation, PACF)

Hàm tự tương quan từng phần PACF đo mức độ phụ thuộc tuyến tính từng phần.Hàm tự tương quan từng phần tại độ trễ k được ước lượng bằng hệ số liên hệ y(t) trongmối kết hợp tuyến tính bên dưới Sự kết hợp được tính dựa trên tầm ảnh hưởng của y(t)

và các giá trị trung gian của:

y(t+k) y(t+k) = y(t+k-1) + y(t+k-2) + y(t + 1) + y(t) + e(t)

Trang 16

Do nhóm chỉ lấy sai phân bậc 1 (ở bước 2) vì thế dựa trên bảng kết quả chạy trên EVIEW, nhóm đã thống kê được:

p= 2, 3, 4, 6, 9, 12, 19, 29

d= 1

q= 2, 3, 4, 6, 9, 29

Trang 17

Từ đó, nhóm chọn ra 10 mô hình ARIMA sau: + Mô hình 1: ARIMA (2, 1, 2)

Included observations: 3100 after adjustments

Convergence achieved after 17 iterations

MA Backcast: 7/01/2009 7/02/2009

Variable Coefficient Std Error t-Statistic Prob

C 0.025859 0.016782 1.540901 0.1234 AR(2) -0.696389 0.106367 -6.547024 0.0000 MA(2) 0.752896 0.097640 7.710959 0.0000 R-squared 0.006211 Mean dependent var 0.026072 Adjusted R-squared 0.005569 S.D dependent var 0.906851 S.E of regression 0.904322 Akaike info criterion 2.637706 Sum squared resid 2532.724 Schwarz criterion 2.643550 Log likelihood -4085.444 Hannan-Quinn criter 2.639804 F-statistic 9.677768 Durbin-Watson stat 1.986567 Prob(F-statistic) 0.000065

2 ARIMA (2, 1, 2) (2, 1, 3)

Trang 18

Câu lệnh: LS DVCB C AR(2) MA(2) MA(3)

Dependent Variable: DVCB

Method: Least Squares

Date: 12/12/21 Time: 18:30

Sample (adjusted): 7/03/2009 11/29/2021

Included observations: 3100 after adjustments

Convergence achieved after 14 iterations

MA Backcast: 6/30/2009 7/02/2009

Variable Coefficient Std Error t-Statistic Prob

C 0.025951 0.016454 1.577166 0.1149 AR(2) -0.372654 0.187998 -1.982226 0.0475 MA(2) 0.431097 0.182679 2.359867 0.0183 MA(3) -0.040453 0.016634 -2.431913 0.0151 R-squared 0.006413 Mean dependent var 0.026072 Adjusted R-squared 0.005451 S.D dependent var 0.906851 S.E of regression 0.904376 Akaike info criterion 2.638147 Sum squared resid 2532.208 Schwarz criterion 2.645940 Log likelihood -4085.128 Hannan-Quinn criter 2.640945 F-statistic 6.661308 Durbin-Watson stat 1.986698 Prob(F-statistic) 0.000176

Inverted MA Roots .09 -.05+.66i -.05-.66i

Included observations: 3100 after adjustments

Convergence achieved after 8 iterations

MA Backcast: 6/29/2009 7/02/2009

Variable Coefficient Std Error t-Statistic Prob

C 0.025886 0.016479 1.570858 0.1163 AR(2) -0.614706 0.154830 -3.970215 0.0001 MA(2) 0.661470 0.155479 4.254391 0.0000 MA(4) -0.023079 0.024451 -0.943887 0.3453 R-squared 0.006513 Mean dependent var 0.026072 Adjusted R-squared 0.005550 S.D dependent var 0.906851 S.E of regression 0.904331 Akaike info criterion 2.638047 Sum squared resid 2531.955 Schwarz criterion 2.645840 Log likelihood -4084.973 Hannan-Quinn criter 2.640845 F-statistic 6.765188 Durbin-Watson stat 1.988839 Prob(F-statistic) 0.000152

Inverted MA Roots .18

Trang 19

Included observations: 3100 after adjustments

Convergence achieved after 16 iterations

MA Backcast: 6/25/2009 7/02/2009

Variable Coefficient Std Error t-Statistic Prob

C 0.025866 0.016850 1.535049 0.1249 AR(2) -0.664534 0.182455 -3.642172 0.0003 MA(2) 0.720204 0.178089 4.044072 0.0001 MA(6) 0.006587 0.024431 0.269599 0.7875 R-squared 0.006235 Mean dependent var 0.026072 Adjusted R-squared 0.005272 S.D dependent var 0.906851 S.E of regression 0.904458 Akaike info criterion 2.638327 Sum squared resid 2532.663 Schwarz criterion 2.646119 Log likelihood -4085.407 Hannan-Quinn criter 2.641125 F-statistic 6.474566 Durbin-Watson stat 1.987066 Prob(F-statistic) 0.000230

Inverted MA Roots 22+.21i 22-.21i

Included observations: 3100 after adjustments

Convergence achieved after 8 iterations

MA Backcast: 6/22/2009 7/02/2009

Variable Coefficient Std Error t-Statistic Prob

C 0.025854 0.016125 1.603322 0.1090 AR(2) -0.636372 0.077299 -8.232575 0.0000 MA(2) 0.700427 0.070870 9.883229 0.0000 MA(9) -0.069545 0.014427 -4.820646 0.0000 R-squared 0.014185 Mean dependent var 0.026072 Adjusted R-squared 0.013230 S.D dependent var 0.906851 S.E of regression 0.900832 Akaike info criterion 2.630295 Sum squared resid 2512.401 Schwarz criterion 2.638087 Log likelihood -4072.957 Hannan-Quinn criter 2.633093 F-statistic 14.84967 Durbin-Watson stat 1.981732 Prob(F-statistic) 0.000000

Ngày đăng: 06/12/2024, 21:14

TÀI LIỆU CÙNG NGƯỜI DÙNG

  • Đang cập nhật ...

TÀI LIỆU LIÊN QUAN