2.3.1. Thống kê mô tả
Trung bình là giá trị trung bình của chuỗi số liệu, có được bằng cách cộng tất cả
các giá trị của chuỗi số liệu chia cho số quan sát.
Trung vị là giá trị ở giữa (hoặc trung bình của hai giá trị ở giữa) của chuỗi số liệu khi các giá trịđược sắp xếp từ nhỏ nhất đến lớn nhất.
Max và Min là giá trị lớn nhất và giá trị nhỏ nhất của chuỗi số liệu trong mẫu hiện tại.
Độ lệch chuẩn là một đại lượng dùng để đo mức độ phân tán của một tập dữ liệu đã
được lập thành bảng tần số. Có thể tính ra độ lệch chuẩn bằng cách lấy căn bậc hai của phương sai.
= ∑
(2.4)
Trong đó N là số quan sát mẫu hiện tại và là trung bình của chuỗi dữ liệu.
Skewness (Hệ số bất đối xứng) là một đại lượng đo lường mức độ bất đối xứng của phân phối xác suất của chuỗi số liệu quanh giá trị trung bình của nó.
Nếu Skewness bằng 0 thì phân phối là cân xứng. Các số trung bình, trung vị và mode bằng nhau.
Nếu Skewness dương thì phân phối lệch phải. Số mode nhỏ hơn số trung vị và số
Nếu Skewness âm thì phân phối lệch trái. Số trung bình nhỏ hơn số trung vị và số
trung vị nhỏ hơn số mode.
Để tính ra giá trị Skewness, có thể sử dụng công thức:
=∑
=
(2.5)
Trong đó ̂ là ước lượng cho moment trung tâm bậc ba và là ước lượng cho độ
lệch chuẩn của chuỗi số liệu.
Kurtosis (Hệ số nhọn) là một đại lượng đo mức độ “nhọn” hay “bẹt” của phân phối của chuỗi số liệu.
Một phân phối chuẩn có Kurtosis bằng 3.
Nếu Kurtosis lớn hơn 3 (Phân phối như vậy gọi là phân phối leptokurtic – nhọn vượt chuẩn) thì có nghĩa là nó “nhọn” hơn phân phối chuẩn.
Nếu Kurtosis nhỏ hơn 3 (Phân phối như vậy gọi là phân phối platykurtic) thì có
nghĩa là nó “bẹt” hơn phân phối chuẩn.
Để tính ra giá trị Kurtosis, có thể sử dụng công thức:
=∑
!
= "
" (2.6)
Trong đó ̂! là ước lượng cho moment trung tâm bậc bốn và là ước lượng cho độ
lệch chuẩn của chuỗi số liệu.
Jarque-Bera
Kiểm định Jarque-Bera là một loại kiểm định xem thử dữ liệu có Skewness (hệ số
bất đối xứng) và Kurtosis (hệ số nhọn) đáp ứng yêu cầu của phân phối chuẩn. Thống kê kiểm định JB được xác định bởi công thức:
Trong đó:
n là số các quan sát.
S là Skewness của chuỗi dữ liệu. K là Kurtosis của chuỗi dữ liệu.
Giả thuyết H0 là chuỗi dữ liệu theo phân phối chuẩn (Hay giả thuyết rằng Skewness bằng 0 và Kurtosis bằng 3).
Giá trị thống kê JB tuân theo phân phối +' với 2 bậc tự do.
Nếu giá trị thống kê JB tính toán là lớn hơn giá trị +'' hoặc p
value nhỏ hơn α, thì ta bác bỏ giả thuyết H0, tức chuỗi dữ liệu không theo phân phối chuẩn. Ngược lại ta chấp nhận giả thuyết H0, tức chuỗi dữ liệu theo phân phối chuẩn.
2.3.2. Tính dừng và kiểm định nghiệm đơn vị
2.3.2.1. Tính dừng
Luận văn này thực hiện dựa trên dữ liệu các chuỗi thời gian. Theo Gujarati (2003), nếu một chuỗi thời gian không dừng, chúng ta chỉ có thể nghiên cứu trong một khoảng thời gian được xem xét, do đó, chúng ta không thể khái quát các giai đoạn khác. Trong phân tích hồi quy, điều này dẫn đến sự vô hiệu của các kết quả dự báo mà thường gọi là hiện tượng hồi quy giả. Từ lý do này, kiểm tra tính dừng của chuỗi thời gian là việc làm đầu tiên của bất kỳ phân tích nào.
Một chuỗi thời gian là dừng khi giá trị trung bình, phương sai, hiệp phương sai (tại các độ trễ khác nhau) giữ nguyên không đổi cho dù chuỗi được xác định vào thời
điểm nào đi nữa. Chuỗi dừng có xu hướng trở về giá trị trung bình và những dao
động quanh giá trị trung bình sẽ là như nhau. Nói cách khác, một chuỗi thời gian không dừng sẽ có giá trị trung bình thay đổi theo thời gian, hoặc giá trị phương sai thay đổi theo thời gian hoặc cả hai.
2.3.2.2. Kiểm định nghiệm đơn vị
Hầu hết các nghiên cứu học thuật áp dụng các phương pháp kiểm định nghiệm đơn vị đã được chấp nhận rộng rãi như kiểm định Dickey-Fuller mở rộng (ADF) của Dickey and Fuller (1981) và kiểm định Phillips-Perron (PP) của Phillips and Perron (1988). Trong ngôn ngữ thống kê, nếu một chuỗi thời gian có một nghiệm đơn vị, nó được gọi là không dừng. Trong luận văn này, tôi tập trung vào các kiểm định Dickey-Fuller mở rộng (ADF) và kiểm định Phillips-Perron (PP) với chặn và không có xu hướng thời gian.
a. Kiểm định Dickey-Fuller mở rộng (ADF):
Theo Dickey and Fuller (1981) mô hình kiểm định Dickey-Fuller mở rộng (ADF) có dạng: ∆- = ./+ 0- + ∑ = k j 1 ∅2∆-2+ 3- (2.8) Trong đó: ∆yt = yt – yt-1
yt : Chuỗi dữ liệu theo thời gian đang xem xét k: Chiều dài độ trễ
εt: Nhiễu trắng
Kết quả của kiểm định ADF thường rất nhạy cảm với sự lựa chọn chiều dài độ trễ k nên tiêu chuẩn thông tin Schwarz (Schwarz Info Criterion - SIC) của Schwarz (1978) được sử dụng để chọn lựa k tối ưu cho mô hình ADF. Cụ thể, giá trị k được lựa chọn sao cho SIC nhỏ nhất. Giá trị này sẽđược tìm một cách tự động khi dùng phần mềm Eviews để thực hiện kiểm định nghiệm đơn vị.
Giả thuyết kiểm định:
H0: β = 0 (yt là chuỗi dữ liệu không dừng) H1: β < 0 (yt là chuỗi dữ liệu dừng)
Trong kiểm định ADF, giá trị kiểm định ADF không theo phân phối chuẩn. Theo Dickey và Fuller (1981) giá trị t ước lượng của các hệ số trong các mô hình (2.6) và (2.7) sẽ theo phân phối xác suất τ (tau statistic, τ = giá trị hệ sốước lượng/sai số của hệ sốước lượng). Giá trị tới hạn τ được xác định dựa trên bảng giá trị tính sẵn của Mackinnon (1996). Giá trị tới hạn này cũng được tính sẵn khi kiểm định ADF bằng phần mềm Eviews. Để kiểm định giả thuyết H0 ta so sánh giá trị kiểm định τ tính toán với giá trị τ tới hạn của Mackinnon và kết luận về tính dừng của các chuỗi quan sát. Cụ thể, nếu trị tuyệt đối của giá trịτ tính toán lớn hơn trị tuyệt đối giá trịτ
tới hạn thì giả thuyết H0 sẽ bị bác bỏ, tức chuỗi dữ liệu có tính dừng và ngược lại chấp nhận giả thuyết H0, tức dữ liệu không có tính dừng.
b. Kiểm định Phillips-Perron (PP):
Để bù đắp cho những thiếu sót của kiểm định ADF luận văn sử dụng kiểm định Phillips-Perron (PP), cái mà cho phép các sai số nhiễu phụ thuộc yếu và phân bố
không đồng nhất.
Theo Phillips and Perron (1988) mô hình kiểm định Phillips-Perron (PP) có dạng:
yt = α0 + αyt-1 + εt (2.9)
Trong đó:
yt là chuỗi số liệu thời gian đang xem xét.
ε t là phần sai số (nhiễu trắng).
Luận văn sử dụng phương pháp ước lượng quang phổ “Bartlett Kernel” và sử dụng “Newey-West Bandwidth” của Newey-West (1994) để chọn lựa Bandwidth (t) tối
ưu cho mô hình kiểm định PP. Giá trị này sẽ được tìm một cách tự động khi dùng phần mềm Eviews để thực hiện kiểm định nghiệm đơn vị.
Tương tự kiểm định ADF, trong kiểm định PP nếu trị tuyệt đối của giá trị τ tính toán lớn hơn trị tuyệt đối giá trịτ tới hạn thì giả thuyết H0 sẽ bị bác bỏ, tức chuỗi dữ
liệu có tính dừng và ngược lại chấp nhận giả thuyết H0, tức dữ liệu không có tính dừng.
2.3.3. Kiểm định nhân quả Granger
Một kiểm định đơn giản phát triển bởi Granger (1969) để kiểm tra quan hệ nhân quả
giữa hai biến sốđã được áp dụng rộng rãi trong phân tích chính sách kinh tế. Theo mô hình VAR, kiểm định quan hệ nhân quả Granger quan tâm về khả năng của một biến để dựđoán một biến khác. Nếu một biến Xt có thểđược dựđoán với độ chính xác lớn hơn bằng cách sử dụng các giá trị quá khứ của biến Yt hơn là không sử dụng các giá trị quá khứ như vậy, tất cả các yếu tố khác còn lại không thay đổi, ta gọi Yt tác động nhân quả Granger lên Xt.
Trong kiểm định quan hệ nhân quả Granger, họ phát hiện bốn trường hợp về mối quan hệ giữa hai biến. 4- = ./+ ∑ = k i 1 04- + ∑ = k i 1 56- + 3- (2.10) 6- = .+ ∑ = k i 1 ∅6- +∑ = k i 1 74- + 8- (2.11) Trong đó εt, υt là nhiễu trắng không có tương quan.
Trường hợp 1: Nếu các hệ số ước lượng δi của các biến trễ của X trong phương trình (2.10) khác 0 một cách có ý nghĩa thống kê, và các hệ sốước lượng ρi của các biến trễ của Y trong phương trình (2.11) bằng 0 một cách có ý nghĩa thống kê. Ta có thể kết luận rằng Xt tác động nhân quả Granger lên Yt (Mối quan hệ nhân quả
một chiều từ Xtđến Yt).
Trường hợp 2: Nếu các hệ số ước lượng ρi của các biến trễ của Y trong phương trình (2.10) khác 0 một cách có ý nghĩa thống kê, và các hệ sốước lượng δi của các
biến trễ của X trong phương trình (2.11) bằng 0 một cách có ý nghĩa thống kê. Ta có thể kết luận rằng Yt tác động nhân quả Granger lên Xt (Mối quan hệ nhân quả
một chiều từ Ytđến Xt).
Trường hợp 3: Nếu các hệ sốước lượng δi củacác biến trễ của X trong phương trình (2.10) khác 0 một cách có ý nghĩa thống kê và các hệ số ước lượng ρi củacác biến trễ của Y trong phương trình (2.11) khác 0 một cách có ý nghĩa thống kê. Ta có thể
kết luận rằng có mối quan hệ nhân quả hai chiều giữa Xt và Yt.
Trường hợp 4: Nếu các hệ sốước lượng δi củacác biến trễ của X trong phương trình (2.10) bằng 0 một cách có ý nghĩa thống kê và các hệ số ước lượng ρi củacác biến trễ của Y trong phương trình (2.11) bằng 0 một cách có ý nghĩa thống kê. Ta có thể
kết luận rằng Xt và Ytđộc lập nhau (Không tồn tại mối quan hệ nhân quả giữa Xt và Yt).
Thực hiện kiểm định nhân quả Granger, cần có các điều kiện sau đây:
(1) Các biến biến Xt, Yt phải là các chuỗi dừng và/hoặc đồng liên kết (không có hiện tượng tương quan giả).
(2) Chiều hướng của mối quan hệ nhân quả có thể phụ thuộc vào số biến trong mô hình. Nói cách khác, kết quả của kiểm định Granger rất nhạy cảm với việc lựa chọn
độ trễ của các biến. Nếu độ trễđược chọn bé hơn độ trễ thực sự, thì việc bỏ sót biến trễ thích hợp có thể làm lệch kết quả. Ngược lại, nếu lớn hơn, thì số biến trễ không thích hợp trong mô hình sẽ làm cho các ước lượng không hiệu quả.
(3) Các phần dư không có hiện tượng tương quan. Nếu có hiện tượng tương quan cần phải thực hiện việc chuyển sang một dạng mô hình thích hợp hơn.
Các bước tiến hành kiểm định Granger:
4- =9 + ∑ = r i 1 .4- +3- (2.12) Và ta có được RSSR.
Bước 2: Hồi quy Yt theo các biến trễ của Y cộng với các biến trễ của X như trong mô hình sau đây:
4- =9 + ∑ = r i 1 .4- + ∑ = s i 1 06-2+3- (2.13) Và ta có RSSU.
Bước 3: Đặt giả thuyết H0 và giả thuyết đối như sau:
H;: ∑ =
s
i 1
0 = 0 hay Xt không tác động nhân quả Granger lên Yt
H: ∑ =
s
i 1
0 ≠ 0 hay Xt tác động nhân quả Granger lên Yt
Bước 4: Kiểm định giả thuyết bằng cách áp dụng thống kê F, như sau:
F = (RSSR-RSSU)/m (2.14) RSSU/(n-k)
Trong đó:
n: Số quan sát.
m: Số biến trễ của biến Y trong mô hình (2.12) (Số ràng buộc) k: Số biến giải thích trong mô hình không ràng buộc (2.13)
Nếu mô hình hồi quy có hệ số cắt thì bậc tự do của mẫu số là n-k-1
Bước 5: Nếu giá trị thống kê Ftính toán lớn hơn giá trị thống kê Ftra bảng(α,m,n-k), ta bác bỏ giả thuyết H0 và kết luận rằng Xt tác động nhân quả Granger lên Yt. Tương tự
như vậy, ta tiến hành các bước tương tự để kiểm định nếu Yt tác động nhân quả Granger lên Xt…
2.3.4. Mô hình ARCH
Mô hình phương sai sai số thay đổi có điều kiện tự hồi qui (ARCH) được phát triển bởi Engle (1982). Mô hình này giả định rằng phương sai của phần dư
(phần không thể dựđoán của tỷ suất sinh lợi) tại thời điểm t phụ thuộc vào các phần dư bình phương ở các giai đoạn trước đó. Engle cho rằng nên mô hình hoá đồng thời giá trị trung bình và phương sai của chuỗi dữ liệu khi nghi ngờ rằng giá trị
phương sai thay đổi theo thời gian. Mô hình ARCH(1) được xác định như sau:
4- =0+0'6- +?- (2.15)
?- ~ N0, ℎ-
ℎ- =D/ + D?-' (2.16)
Trong đó:
utđược giảđịnh theo phân phối chuẩn
ht là ký hiệu thay cho phương sai không đổi σ ²t
Phương trình (2.12) là phương trình ước lượng giá trị trung bình, và phương trình (2.13) được gọi là phương trình ước lượng giá trị phương sai. Mô hình ARCH(1) cho rằng khi có một cú sốc lớn xảy ra ở giai đoạn t-1, thì giá trị ut cũng sẽ lớn hơn. Nó có nghĩa là khi u²t-1 lớn (nhỏ), thì phương sai của ut cũng lớn (nhỏ). Hệ số ước lượng γ1 phải dương vì phương sai luôn luôn dương. Trong thực tế, phương sai có
điều kiện có thể phụ thuộc vào nhiều độ trễ trước đó. Mô hình ARCH(q) được đưa ra như sau: 4- =0+0'6- +?- (2.17) ?- ~ N0, ℎ- ℎ- =D/ + ∑ = q j 1 D2?-2' (2.18)
Trong đó: Các hệ sốước lượng γj không âm vì phương sai luôn dương.
Giảđịnh phương sai không đổi khá hạn chế trong thực tế vì sự biến động nhóm. Ưu
điểm của mô hình ARCH so với các mô hình khác là nó cho phép các phương sai thay đổi có điều kiện trong phân tích tỷ suất sinh lợi. Vì vậy, để kiểm định xem có
tồn tại phương sai thay đổi đối với trường hợp Việt Nam hay không và giúp kiểm
định mối quan hệ giữa sự thay đổi giá và khối lượng luận văn sử dụng kiểm định ARCH thay vì phương pháp bình phương bé nhất thông thường (OLS).
Kiểm định ảnh hưởng ARCH
Để xem xét sự tồn tại của phương sai thay đổi có điều kiện (cái mà được gọi là ảnh hưởng ARCH (Tsay, 2005)), chuỗi phần dư bình phương ε²tđược tiến hành.
Bước đầu tiên của kiểm định là ước lượng phương trình trung bình:
E- = F + 3- (2.19)
bằng phương pháp bình phương bé nhất thông thường (OLS) để có được ước lượng chuỗi phần dư3̂-'. Sau đó chúng ta ước lượng phương trình hồi quy phụ theo các độ
trễ bình phương và một hằng số như sau:
3̂-' = D/ + D3̂-' + ⋯ DH3̂-H' + F (2.20)
Xác định hệsố xác định của mô hình hồi quy phụ, ký hiệu là R2aux
Ta tính Obs*R2aux, với Obs là số quan sát của chuỗi dữ liệu được xem xét. Giả thuyết H0 là: γ0 = γ1 = ... = γq = 0.
Thống kê này sẽ theo phân phối chi +' với q bậc tự do. Thủ tục này đã được đề xuất
bởi Engle (1982). Nếu giá trị thống kê tính toán (Obs*R2aux) là lớn hơn giá trị +' tới
hạn hoặc pvalue nhỏ hơn α, thì ta bác bỏ giả thuyết H0. Việc bác bỏ giả thuyết H0 cho thấy bằng chứng của ảnh hưởng ARCH(q).
2.3.5. Mô hình GARCH
Mô hình phương sai sai số thay đổi tự hồi quy tổng quát (GARCH), được giới thiệu bởi Bollerslev (1986) đưa thêm các biến trễ của phương sai có điều kiện vào phương trình phương sai theo dạng tự hồi quy, cho phép một số lượng vô tận các sai số bình phương ảnh hưởng đến phương sai có điều kiện hiện tại. Nếu các ảnh hưởng ARCH có quá nhiều độ trễ sẽ có thể ảnh hưởng đến kết quả ước lượng do giảm
dụng rộng rãi trong thực tế. Cũng giống như mô hình ARCH, phương sai có điều kiện được xác định trong GARCH là bình quân gia quyền của các phần dư bình phương quá khứ. Tuy nhiên, trọng số lần lượt giảm dần nhưng chúng không bao giờ đạt đến 0. Trong ngắn hạn, mô hình GARCH cho phép phương sai có điều kiện phụ