Chạy mơ hình ARIMA với mã chứng khốn SAB
Bước 1: Chuỗi thời gian dự báo phải là một chuỗi dừng (stationarity)
Lý thuyết chuỗi thời gian: Chuỗi các quan sát được thu thập trên cùng một đối tượng tại các mốc thời gian khác nhau được gọi là chuỗi thời gian.
Lý thuyết về chuỗi dừng:
Trong phân tích hồi quy, các biến trong chuỗi dữ liệ thời gian phải dừng thì các kiểm định thống kê mới đáng tin cậy. Một chuỗi dữ liệu thời gian được coi là dừng (tĩnh) khi chuỗi đó hội tụ các đặc tính sau:
+ Giá trị trung bình khơng đổi hay bằng một hằng số theo thời gian khi chuỗi dữ liệu đó tạo ra các đoạn trung bình bằng nhau từ đó hình thành một đường trung bình thẳng (chuỗi dữ liệu khơng bị trend).
E(Yt)=µ=const
+ Phương sai khơng đổi hay bằng một hằng số theo thời gian khi mức độ biến động của chuỗi dữ liệu quanh đường trung bình ổn định một trong biên độ nhất định.
Var(Yt)=σ2=const
+ Hiệp phương sai chỉ mối tương quan giữa các dữ liệu với nhau khơng thay đổi khi cả giá trị trung bình và phương sai đều khơng đổi. Nói cách khác, nếu ta ngắt dữ liệu thành các giai đoạn khác nhau, thì giản đồ tự tương quan của các giai đoạn đó là như nhau.
Cách 1: Dựa vào biểu đồ graph Dựa vào biểu đồ graph:
80 120 160 200 240 280 320
IV I II III IV I II III IV I II III IV I II III IV I II
2017 2018 2019 2020 2021
SAB
Nhìn vào biểu đồ ta thấy:
+ Ở giai đoạn đầu tiên từ tháng 12/2016 đến tháng 6/2018 giá chứng khốn có xu hướng tăng, đạt đỉnh vào tháng 12/2017 và sau đó có xu hướng giảm, đường trung bình ở khoảng mức 240. Ở giai đoạn thứ hai, bắt đầu từ tháng 7/2018 cho đến khoảng tháng 1/2020 giá chứng khốn có xu hướng tăng. Tuy nhiên so với giai đoạn đầu, đường trung bình thấp hơn chỉ ở mức 220. Ở giai đoạn thứ ba, từ tháng 2/2020 trở về sau, giá chứng khoán trong những quý đầu năm 2020 giảm sâu so với từ trước đến nay và dao động quanh đường trung bình mức 160. Chuỗi dữ liệu này có các đoạn trung bình khơng bằng nhau dẫn đến việc hình thành một đường trung bình dốc xuống (Chuỗi bị trend xuống) dẫn đến trung bình thay đổi.
+ Mức độ biến động của chuỗi dữ liệu quanh đường trung bình là khơng ổn định. Ở đoạn trung bình đầu tiên từ tháng 12/2016 đến tháng 6/2018, chuỗi dữ liệu biến động với biên độ dao động từ 180 đến 280. Ở đoạn trung bình thứ hai từ tháng 7/2018 cho đến khoảng tháng 1/2020, chuỗi dữ liệu biến động với biên độ dao động từ 200 đến 270. Ở đoạn trung bình thứ ba từ tháng 2/2020 trở về sau, chuỗi dữ liệu với biên độ dao động từ 120 đến 200. Cả ba đoạn trung bình này đều có rất nhiều quan sát biến động vượt ra ngoài biên độ (chiếm hơn 5% tổng số lượng quan sát) dẫn đến phương sai thay đổi.
+ Do trung bình thay đổi và phương sai thay đổi dẫn đến hiệp phương sai thay đổi.
Kết luận: Chuỗi dữ liệu SAB không dừng.
Cách 2: Dựa trên kiểm định nghiệm đơn vị (unit root test) của Dickey Fuller
Kiểm định nghiệm đơn vị là một kiểm định được sử dụng khá phổ biến để kiểm định một chuỗi thời gian dừng hay khơng dừng. Giả sử ta có phương trình tự hồi quy như sau:
Auto regressive function:
AR(1): Yt = ρYt-1 + ut với ut ~iid N(0; σ²) ut là nhiễu trắng Nếu ρ < 1: chuỗi dừng
Nếu ρ = 1: chuỗi có nghiệm đơn vị (chuỗi khơng dừng) Nếu ρ > 1: chuỗi bị bùng nổ (explosive series)
AR (1): Yt = ρYt-1 + ut với ut ~iid N(0; σ²) ut là nhiễu trắng Giả thiết:
H0 : 1 Yt (là chuỗi không dừng) H1 : 1 Yt (là chuỗi dừng)
Phương trình: Yt = Yt-1 + ut
Tương đương với: Yt - Yt-1 =Yt-1 + ut -Yt-1 = ( - 1) Yt-1 + ut
Như vậy, các giả thiết ở trên có thể được viết lại như sau:
H0 : = 0 Yt là chuỗi có nghiệm đơn vị, chuỗi khơng dừng
H0 : < 0 Yt là chuỗi dừng
Dickey and Fuller cho rằng giá trị t ước lượng của hệ số Yt-1 sẽ theo phân phối xác suất (= giá trị ước lượng / sai số của hệ số). Kiểm định thống kê còn gọi kiểm định Dickey – Fuler (DF)
Khi là một bước ngẫu nhiên không hằng số (Without Constant and trend)
Yt = Yt-1 + ut
Khi là một bước ngẫu nhiên có hằng số (Without Constant)
Yt =1 + Yt-1 + ut
Khi Yt là một bước ngẫu nhiên có hằng số xoay quanh một đường xu thế ngẫu nhiên
Yt = t + 2 trend + Yt-1 + ut
Để kiểm định H0 , so sánh giá trị thống kê tính tốn với giá trị thống kê tra bảng DF Nếu số hạng sai số ut là tự tương quan, ta sẽ biến đổi phương trình trên thành: m
Yt = t + 2 trend + Yt-1 +αi Yt-i + t (*) i=1
Giả thuyết không vẫn là H0 : = 0 hoặc H0 : = 1có nghĩa là Y có nghiệm đơn vị, (Y là khơng dừng). Khi kiểm định DF được áp dụng cho các mơ hình như (*) nó được gọi là kiểm định Dickey - Fuller mở rộng (Augmented Dickey-Fuller (ADF) test). Trị thống kê của kiểm định ADF có cùng một phân bổ tiệm cận giống như của trị thống kê DF, do vậy có thể sử dụng cùng các giá trị tới hạn giống nhau (Cao Hào Thi,2011)
Khi đó :
Nếu |a| tính tốn ||giá trị ADF (ADF test statistic) suy ra bác bỏ giả thiết H0
Nếu |a| tính tốn < || giá trị ADF (ADF test statistic) suy ra khơng có cơ sở bác bỏ giả thiết H0 , hay không tồn tại nghiệm đơn vị => chuỗi dữ liệu là chuỗi dừng
Null Hypothesis: SAB has a unit root Exogenous: Constant, Linear Trend
Lag Length: 1 (Automatic - based on SIC, maxlag=21)
t-Statistic Prob.*
Augmented Dickey-Fuller test statistic -3.255824 0.0743
Test critical values: 1% level -3.966299
5% level -3.413848
10% level -3.129002
*MacKinnon (1996) one-sided p-values.
H0: SABt có 1 nghiệm đơn vị (SABt khơng dừng) H1: SABt khơng có nghiệm đơn vị (SABt dừng)
p-value < α: bác bỏ giả thuyết H0 với mức ý nghĩa α = 1% hay α = 5% hay α = 10% p-value = 0.0743 > α = 5% =0.05: Chấp nhận giả thuyết H0
Vậy SABt có 1 nghiệm đơn vị SABt khơng dừng với mức ý nghĩa α = 5%