4.2 Xem xét sự ảnh hưởng của Covid-19 đến tỷ số RR, OR đối với chỉ số VN30-INDE
4.2.2 Kết quả kiểm định sự khác biệt chênh lệch(%) của chỉ số VN30 trong 2 giai đoạn
đoạn
Sử dụng phần mềm Rstudio ta thực hiện lệnh sau: setwd("F:/dhkt/nguyen ly thong ke/ket thuc/data") > library(xlsx)
> gd1 = read.xlsx("data.xlsx", sheetName = "gd1", header = TRUE) > gd2 = read.xlsx("data.xlsx", sheetName = "gd2", header = TRUE) > ChenhLechGD1 = gd1[,c(3)]
> ChenhLechGD2 = gd2[,c(3)] > View(ChenhLechGD1) > View(ChenhLechGD2) > hist(ChenhLechGD1)
Biểu đồ 4-10: Đồ thị Histogram chênh lệch (%) của chỉ số VN30-INDEX giai đoạn 1
> plot(density(ChenhLechGD1), add=TRUE)
Biểu đồ 4-11: Đồ thị Phân phối chênh lệch (%) của chỉ số VN30-INDEX giai đoạn 1
> qqnorm(ChenhLechGD1) > qqline(ChenhLechGD1, col=2)
Biểu đồ 4-12: Đồ thị Normal Q-Q Plot Chênh lệch (%) của chỉ số VN30-INDEX giai đoạn 1
Qua 2 đồ thị cho ta thấy dữ liệu Chênh lệch (%) của chỉ số VN30-INDEX giai đoạn 1 (trước Covid) thuộc dạng phân phối chuẩn.
Biểu đồ 4-13: Đồ thị Histogram Chênh lệch (%) của chỉ số VN30-INDEX giai đoạn 2
> plot(density(ChenhLechGD2), add=TRUE)
Biểu đồ 4-14: Đồ thị Phân phối Chênh lệch (%) của chỉ số VN30-INDEX giai đoạn 2
> qqnorm(ChenhLechGD2) > qqline(ChenhLechGD2, col=2)
Biểu đồ 4-15: Đồ thị Normal Q-Q Plot Chênh lệch (%) của chỉ số VN30-INDEX giai đoạn 2
Qua 2 đồ thị cho ta thấy dữ liệu Chênh lệch (%) của chỉ số VN30-INDEX giai đoạn 2 (trong Covid) thuộc dạng phân phối chuẩn
Kết hợp hàm mô tả 2 biến này trong Rstudio, ta thấy phương sai của 2 nhóm đều bằng 1
Vì vậy, ta sẽ sử dụng kiểm định T-test của William Gossett để kiểm định sự khác biệt giữa Chênh lệch (%) giai đoạn 1 và Chênh lệch (%) giai đoạn 2
Giả thuyết H0 : khơng có sự khác biệt
H1 : có sự khác biệt > t.test(ChenhLechGD1, ChenhLechGD2)
Từ kết quả trên, ta có:
-df (bậc tự do) = 453.76 nên xác suất 95% tỉ số tα sẽ dao động trong khoảng -1.96 đến 1.96. -t = -2,7247 <- tα = -1.96 nên ta bác bỏ H0.
-p-value = 0.006686 < α ( 0.05) nên độ khác biệt giữa 2 nhóm là rất có ý nghĩa về mặt thống kê.
-Trung bình giữa 2 nhóm = -0.017-0.278 = -0.295 và nếu nghiên cứu được lặp lại 100 lần thì 95 lần trung bình giữa 2 nhóm sẽ dao động từ -0.508 đến -0.082.
Để có được biểu đồ Boxplot ta sử dụng các lệnh sau trong Rstudio: > setwd("F:/dhkt/nguyen ly thong ke/ket thuc/data")
> library(xlsx) > library(ggplot2)
> gop = read.xlsx("data.xlsx", sheetName = "gop", header = TRUE) > b = ggplot(gop, aes(x=group, y=chenhlech))
> b + geom_boxplot(notch=T, aes(fill=group), outlier.colour="red")+ theme_bw() +theme_classic()
Biểu đồ 4-16: Đồ thị Boxplot Chênh lệch (%) của chỉ số VN30-INDEX trong 2 giai đoạn
Kết hợp với kết quả mô tả từ Rstudio:
Ta có:
- Trung vị của giai đoạn 1(GD1) là -0.01% và trung vị của giai đoạn 2 (GD2) là 0.31% -Trong GD1: có 25% chênh lệch (%) có giá trị dưới -0.6% nghĩa là số ngày giảm điểm trên
0.6% sẽ chiếm 25% số ngày giao dịch; số ngày giảm điểm từ 0 đến 0,6% và số ngày tăng điểm trên 0,0% sẽ chiếm 75% số ngày giao dịch.
-Trong GD2: có 25% chênh lệch(%) có giá trị dưới -0,4% nghĩa là số ngày giảm điểm trên 0,4% sẽ chiếm 25% số ngày giao dịch; số ngày giảm điểm từ 0 đến 0,4% và số ngày tăng điểm trên 0% sẽ chiếm 75% số ngày giao dịch.
Nhận xét: Vậy với độ tin cậy 95%, Chênh lệch (%) VN30 của giai đoạn 1 (trước covid) và
Chênh lệch (%)VN30 của giai đoạn 2 (trong Covid) là có sự khác biệt. Tức là đại dịch Covid-19 đã làm giảm đáng kể giá trị của những ngày giảm điểm chỉ số VN30-INDEX trong giai đoạn thị trường không bị ảnh hưởng bởi tâm lý quá tiêu cực hoặc quá lạc quan của các nhà đầu tư.
4.2.3 Kết quả xem xét tỷ số nguy cơ (RR) và tỷ số Odds (OR) đối với chỉ số VN30 trong 2 giai đoạn
Về mặt lý thuyết, ta thường thấy tỷ số nguy cơ (risk ratio) hay còn được gọi là nguy cơ tương đối (relative risk, RR) được sử dụng trong nghiên cứu y khoa để nói về tỷ lệ của xác suất khả năng mắc bệnh trong nhóm phơi nhiễm so với xác suất khả năng mắc bệnh trong nhóm khơng phơi nhiễm (nguồn: https://vi.wikipedia.org/wiki/T%E1%BB%B7_s%E1%BB%91_nguy_c%C6%A1) Nhưng về mặt bản chất, tỷ số nguy cơ có thể được dùng trong phân tích chứng khốn để nói lên nguy cơ rủi ro giảm điểm của thị trường chứng khoán. Điều mà bất kỳ nhà đầu tư nào cũng không mong muốn nên ta xét nó như một mối nguy cơ, nhưng thị trường luôn vận hành theo cách riêng biệt của nó và sự tăng hay giảm điểm trong thị trường chứng khốn phụ thuộc vào rất nhiều yếu tố, trong đó có cả yếu tố dịch bệnh mà ta đang xem xét trong bài nghiên cứu này. Chính vì vậy, ta sẽ sử dụng tỷ số nguy cơ (RR) trong thị trường chứng khoán, cụ thể là chỉ số VN30-INDEX trong giai đoạn trước dịch (từ tháng 7-2018 đến tháng 7-2019) và trong dịch (từ tháng 7-2020 đến tháng 7-2021) để loại bỏ bớt các giai đoạn thị trường chứng khoán tăng quá
mạnh hoặc giảm quá sâu do tâm lý quá tiêu cực hoặc quá lạc quan của các nhà đầu tư. Để xem xét liệu đại dịch Covid-19 có làm thị trường chứng khốn cụ thể là chỉ số VN30-INDEX trở nên rủi ro hơn cho các nhà đầu tư hay không?
Bảng 4-9: Kết quả tính tốn tỷ số rủi ro trong 2 giai đoạn
Giai đoạn 1 Giai đoạn 2
Số ngày giao dịch 252 252
Số ngày giảm điểm 128 90
Tỷ số rủi ro 0.508 0.357
Ký hiệu P1 P2
- Nếu RR = 1 : hai giai đoạn của thị trường có rủi ro như nhau.
- Nếu RR > 1 : Covid làm giảm rủi ro cho các nhà đầu tư khi đầu tư vào nhóm mã cổ phiếu VN30.
- Nếu RR < 1 : Covid làm tăng rủi ro cho các nhà đầu tư khi đầu tư vào nhóm mã cổ phiếu VN30.
Tương tự tỷ số nguy cơ (RR), tỷ số Odds (OR) được định nghĩa là tỉ số của hai xác xuất, thường được sử dụng trong y khoa để đo lường khả năng mắc bệnh
(nguồn: http://bomonnoiydhue.edu.vn/upload/file/lstk14_oddratio.pdf)
Nhưng về bản chất, tỷ số Odds (OR) hồn tồn có thể được sử dụng trong phân tích thị trường chứng khốn để nói lên khả năng giảm điểm của thị trường chứng khoán. Và để xem xét liệu đại dịch Covid-19 có làm thị trường chứng khốn (cụ thể là chỉ số VN30-INDEX) tăng khả năng giảm điểm hay khơng? Ta sẽ tính tốn như sau:
Bảng 4-10: : Kết quả tính tốn tỷ số Odds (OR) trong 2 giai đoạn
Giai đoạn 1 Giai đoạn 2
Số ngày giao dịch 252 252
Số ngày giảm điểm 128 90
Tỷ số rủi ro 0.508 0.357
Odds giảm điểm 1.032 0.556
Ký hiệu O1 O2
Nếu OR = 1 : hai giai đoạn của thị trường có khả năng giảm điểm như nhau. Nếu OR > 1 : Covid làm giảm khả năng giảm điểm của chỉ số VN30-INDEX. Nếu OR < 1 : Covid làm tăng khả năng giảm điểm của chỉ số VN30-INDEX. Nhưng để ước tính RR và OR với độ tin cậy 95% thì ta gõ lệnh sau trong R: > dat = as.table(matrix(c(128, 124, 90, 162), nrow=2, byrow=TRUE)) > library(epiR)
> epi.2by2(dat, method = "cohort.count", conf.level = 0.95)
Ta có kết quả :
- RR (Inc risk ratio) = 1.42 và với độ tin cậy 95% thì RR dao động trong khoảng từ 1.16 đến 1.75, tức là nếu nghiên cứu lặp lại 100 lần thì 95 lần RR sẽ dao động trong khoảng 1.16 đến 1.75.
- OR (Odds ratio) = 1.86 và với độ tin cậy 95% thì OR dao động trong khoảng từ 1.30 đến 2.66, tức là nếu nghiên cứu lặp lại 100 lần thì 95 lần OR sẽ dao động trong khoảng từ 1.30 đến 2.66.
Nhận xét: Vậy Covid đã làm giảm nguy cơ của các nhà đầu tư khi mua các mã cổ phiếu trong
VN30 nếu chỉ xét tỷ số nguy cơ (RR) và làm giảm khả năng giảm điểm của chỉ số VN30-INDEX trong thị trường chứng khoán nếu chỉ xét tỷ số Odds (lưu ý: không xét trong giai đoạn thị trường chứng khoán bị ảnh hưởng tâm lý quá tiêu cực của các nhà đầu tư).
4.2.4 Mơ hình dự báo tính Trend
4.2.4.1 Mơ hình hồi qui dạng lm-lm
> setwd("F:/dhkt/nguyen ly thong ke/ket thuc/data") > library(xlsx)
> dubao = read.xlsx("data.xlsx", sheetName = "gd2", header = TRUE) > m1 = lm(VN30..C. ~ time, data=dubao)
> summary(m1)
Kiểm định hệ số hồi quy của biến time
Giả thuyết : H0 :Btime = 0
Ha : Btime # 0
Ta có : pvalue = 2x10-16< α (0.05) . Với độ tin cậy 95%, ta bác bỏ H0 Vậy hệ số hồi quy của biến time có ý nghĩa trong mơ hình.
Kiểm định phương sai:
Ta sử dụng lệnh sau trong Rstudio: > library(quantmod)
> library(lmtest) > bptest(m1)
Giả thuyết : H0 :Phương sai khơng đổi
Ha :Phương sai có thay đổi
Ta có : pvalue = 0.9839 > α (0.05) . Với độ tin cậy 95% , không thể bác bỏ H0 Vậy phương sai của mơ hình khơng thay đổi.
Kiểm định sự tương quan:
Ta thực hiện lệnh sau trong Rstudio: > dwtest(m1)
Giả thuyết H0 : Mơ hình khơng có sự tương quan
Ha : Mơ hình có sự tương quan
Ta có : Pvalue<2.2x10-16 < α ( 0.05) .Với độ tin cậy 95%, ta bác bỏ giả thuyết H0
Vậy mơ hình có sự tương quan .
Kiểm định định dạng mơ hình:
Ta thực hiện các lệnh sau trong Rstudio: > resettest(m1)
Giả thuyết : H0 : Mơ hình bị định dạng sai Ha : Mơ hình được định dạng đúng
Ta có : Pvalue<2.2x10-16 < α (0.05) .Với độ tin cậy 95% , ta bác bỏ giả thuyết H0 Vậy mơ hình trên được định dạng đúng .
Các hệ số AIC.BIC.LOGLIK:
4.2.4.2 Mơ hình hồi qui dạng lm-log
Thực hiện các lệnh sau trong Rstudio:
> m2 = lm(VN30..C. ~ log(time), data=dubao) > summary(m2)
Kiểm định hệ số hồi quy của biến log(time)
Giả thuyết : H0 :Btime = 0
Ha : Btime # 0
Ta có : pvalue = 2x10-16< α (0.05) . Với độ tin cậy 95%, ta bác bỏ giả thuyết H0 Vậy hệ số hồi quy của biến log(time) có ý nghĩa trong mơ hình.
Kiểm định phương sai:
Ta sử dụng lệnh sau trong Rstudio: > bptest(m2)
Giả thuyết H0 :Phương sai không đổi
Ha :Phương sai có thay đổi
Ta có: Pvalue = 1.171x10-8 < α ( 0.05) .Với độ tin cậy 95% ,bác bỏ H0 Vậy mơ hình có phương sai thay đổi .
Kiểm định sự tương quan:
Ta thực hiện lệnh sau trong Rstudio: > dwtest(m2)
Giả thuyết H0 : Khơng có sự tương quan
Ha : Có sự tương quan
Ta có : Pvalue < 2.2x10-16 < α (0.05) .Với độ tin cậy 95%, ta bác bỏ giả thuyết H0 Vậy mơ hình có sự tương quan .
Kiểm định định dạng mơ hình:
Ta thực hiện các lệnh sau trong Rstudio: > resettest(m2)
Giả thuyết H0 : Mơ hình bị định dạng sai
Ha : Mơ hình được định dạng đúng
Ta có : Pvalue < 2.2x10-16 < α (0.05) .Với độ tin cậy 95%, ta bác bỏ giả thuyết H0 Vậy mơ hình được định dạng đúng .
Các hệ số AIC.BIC.LOGLIK:
4.2.4.3 Mơ hình hồi qui dạng log-lm
Thực hiện các lệnh sau trong Rstudio:
> m3= lm(log(VN30..C. )~ time, data=dubao) > summary(m3)
Kiểm định hệ số hồi quy của biến time
Giả thuyết : H0 :Btime = 0
Ha : Btime # 0
Ta có : pvalue = 2x10-16< α (0.05) . Với độ tin cậy 95%, ta bác bỏ giả thuyết H0 Vậy hệ số hồi quy của biến time có ý nghĩa trong mơ hình.
Kiểm định phương sai:
Ta sử dụng lệnh sau trong Rstudio: > bptest(m3)
Giả thuyết H0 :Phương sai không đổi
Ha :Phương sai có thay đổi
Ta có Pvalue = 0.0002< α (0.05) .Với độ tin cậy 95%, ta bác bỏ giả thuyết H0 Vậy mơ hình có phương sai thay đổi.
Kiểm định sự tương quan:
Ta thực hiện lệnh sau trong Rstudio: > dwtest(m3)
Giả thuyết H0 : Khơng có sự tương quan
Ha : Có sự tương quan
Ta có Pvalue < 2.2x10-16 < α (0.05) .Với độ tin cậy 95%, ta bác bỏ giả thuyết H0 Vậy mơ hình có sự tương quan .
Kiểm định định dạng mơ hình:
Ta thực hiện lệnh sau trong Rstudio: > resettest(m3)
Giả thuyết H0 :Mơ hình bị định dạng sai
Ha : Mơ hình được định dạng đúng
Ta có Pvalue = 4.551x10-16 < α (0.05). Với độ tin cậy 95%, ta bác bỏ giả thuyết H0 Vậy mơ hình được định dạng đúng .
Các hệ số AIC.BIC.LOGLIK:
4.2.4.4 Mơ hình hồi qui dạng bậc 2
Thực hiện các lệnh sau trong Rstudio:
> m4= lm(log(VN30..C. )~ time + I(time^2), data=dubao) > summary(m4)
Kiểm định hệ số hồi quy của biến time
Giả thuyết : H0 : Btime = 0
Ha : Btime # 0
Ta có : pvalue = 2x10-16< α (0.05) . Với độ tin cậy 95%, ta bác bỏ giả thuyết H0 Vậy hệ số hồi quy của biến time có ý nghĩa trong mơ hình.
Kiểm định hệ số hồi quy của biến time2 Giả thuyết : H0 : Btime = 0
Ha : Btime # 0
Ta có : pvalue = 6.48x10-13< α (0.05) . Với độ tin cậy 95%, ta bác bỏ giả thuyết H0 56
Vậy hệ số hồi quy của biến time2 có ý nghĩa trong mơ hình.
Kiểm định phương sai:
Ta sử dụng lệnh sau trong Rstudio: > bptest(m4)
Giả thuyết H0 : Phương sai không đổi
Ha : Phương sai thay đổi
Ta có : Pvalue =0.09111 > α (0.05) .Với độ tin cậy 95%, ta khơng thể bác bỏ giả thuyết H0 Vậy mơ hình có phương sai khơng thay đổi .
Kiểm định sự tương quan:
Ta thực hiện lệnh sau trong Rstudio: > dwtest(m4)
Giả thuyết H0 : Khơng có sự tương quan
Ha : Có sự tương quan
Ta có : Pvalue = 2.2x10-16 < α (0.05).Với độ tin cậy 95%, ta bác bỏ giả thuyết H0 Vậy mơ hình có sự tương quan .
Kiểm định định dạng mơ hình:
Ta thực hiện lệnh sau trong Rstudio: > resettest(m4)
Giả thuyết H0 : Mơ hình bị định dạng sai
Ha : Mơ hình định dạng đúng
Ta có : Pvalue = 1.161x10-14 < α (0.05) .Với độ tin cậy 95%, ta bác bỏ giả thuyết H0 Vậy mơ hình được định dạng đúng .
Các hệ số AIC.BIC.LOGLIK:
Bảng 4-11: So sánh các hệ số AIC.BIC.LOGLIK của 4 mơ hình
AIC BIC LOGLIK
Lm-Lm 2669.721 2680.309 -1331.861
Lm-Log 3207.217 3217.805 -1600.609
Log-Lm -976.8261 -966.2378 491.413
Bậc 2 -1027.248 -1013.13 517.624
Ta có hệ số AIC và BIC của mơ hình bậc 2 là bé nhất, hệ số LOGLIK của mô hình bậc 2 là lớn nhất
Vậy mơ hình lựa chọn phù hợp nhất là mơ hình bậc 2
4.2.5 Phương trình dự đốn VN30
Từ kết quả trên ta chuyển đổi giá trị: (giá trị VN30 được lấy từ tháng 7-2020 đến 7-2021) - VN30 = log(VN30) = y
- time (t) =
Ta được bảng kết quả sau:
Bảng 4-12: Bảng kết quả chuyển đổi chỉ số VN30-INDEX
X Y X Y X Y X Y X Y 6.624 2.896 6.739 2.917 6.870 2.982 7.018 3.048 7.182 3.114 6.626 2.895 6.741 2.920 6.873 2.982 7.021 3.048 7.185 3.106 6.628 2.898 6.744 2.921 6.876 2.983 7.024 3.055 7.188 3.109 6.630 2.905 6.746 2.921 6.878 2.984 7.027 3.038 7.192 3.112 6.632 2.906 6.749 2.920 6.881 2.987 7.030 3.053 7.195 3.118 6.635 2.906 6.751 2.925 6.884 2.985 7.033 3.070 7.199 3.123 6.637 2.912 6.753 2.930 6.887 2.990 7.036 3.075 7.202 3.129 6.639 2.908 6.756 2.931 6.889 2.991 7.039 3.072 7.205 3.129 6.641 2.906 6.758 2.934 6.892 2.994 7.042 3.072 7.209 3.127 6.643 2.906 6.761 2.931 6.895 2.993 7.045 3.073 7.212 3.137 6.645 2.909 6.763 2.932 6.898 2.997 7.049 3.067 7.216 3.133 6.647 2.914 6.766 2.936 6.901 2.997 7.052 3.068 7.219 3.140 6.650 2.911 6.768 2.933 6.903 3.002 7.055 3.070 7.223 3.137 6.652 2.905 6.771 2.934 6.906 2.998 7.058 3.076 7.226 3.140 6.654 2.906 6.773 2.938 6.909 3.004 7.061 3.077 7.230 3.137 6.656 2.902 6.776 2.935 6.912 3.010 7.064 3.078 7.233 3.139 6.658 2.903 6.778 2.938 6.915 3.006 7.067 3.070 7.237 3.147 6.661 2.888 6.781 2.940 6.917 3.013 7.071 3.070 7.240 3.154 6.663 2.863 6.783 2.940 6.920 3.007 7.074 3.068 7.243 3.154 6.665 2.879 6.786 2.939 6.923 3.016 7.077 3.066 7.247 3.155 6.667 2.866 6.788 2.942 6.926 3.021 7.080 3.069 7.250 3.160 6.669 2.873 6.791 2.942 6.929 3.022 7.083 3.075 7.254 3.163 6.672 2.870 6.793 2.944 6.932 3.019 7.086 3.075 7.257 3.158 6.674 2.880 6.796 2.950 6.935 3.014 7.090 3.076 7.261 3.164 6.676 2.885 6.799 2.954 6.938 3.022 7.093 3.075 7.265 3.169 6.678 2.892 6.801 2.955 6.940 3.023 7.096 3.077 7.268 3.171 6.681 2.893 6.804 2.956 6.943 3.025 7.099 3.083 7.272 3.170 6.683 2.893 6.806 2.959 6.946 3.025 7.102 3.080 7.275 3.177 6.685 2.894 6.809 2.957 6.949 3.030 7.106 3.079 7.279 3.179 6.687 2.895 6.811 2.963 6.952 3.038 7.109 3.074 7.282 3.171 6.690 2.897 6.814 2.969 6.955 3.043 7.112 3.067 7.286 3.158 6.692 2.900 6.817 2.964 6.958 3.047 7.115 3.066 7.289 3.164 6.694 2.899 6.819 2.962 6.961 3.053 7.119 3.067 7.293 3.162
X Y X Y X Y X Y X Y 6.696 2.898 6.822 2.949 6.964 3.060 7.122 3.072 7.297 3.172 6.699 2.896 6.825 2.948 6.967 3.066 7.125 3.076 7.300 3.175 6.701 2.897 6.827 2.951 6.970 3.068 7.128 3.078 7.304 3.172 6.703 2.895 6.830 2.954 6.973 3.066 7.132 3.089 7.307 3.166 6.706 2.900 6.832 2.955 6.976 3.068 7.135 3.093 7.311 3.165 6.708 2.908 6.835 2.957 6.979 3.073 7.138 3.097 7.315 3.171 6.710 2.911 6.838 2.956 6.981 3.069 7.142 3.099 7.318 3.170 6.713 2.910 6.840 2.956 6.984 3.044 7.145 3.100 7.322 3.173 6.715 2.911 6.843 2.963 6.987 3.048 7.148 3.098 7.325 3.173 6.717 2.915 6.846 2.962 6.990 3.061 7.152 3.098 7.329 3.172 6.720 2.916 6.848 2.962 6.993 3.063 7.155 3.107 7.333 3.176 6.722 2.920 6.851 2.965 6.996 3.062 7.158 3.106 7.336 3.182