Được dựa vào vốn hóa thị trường của công ty đó Các câu hỏi nghiên cứu, giả thuyết cần kiểm định: - Tỷ suất lợi nhuận trên vốn chủ sở hữu của công ty, doanh nghiệp tăng thì giá trị cổ phi
Trang 1ĐẠI HỌC UEH TRƯỜNG KINH DOANH UEH KHOA TÀI CHÍNH -
TIỂU LUẬN CUỐI KỲ MÔN HỌC: KINH TẾ LƯỢNG TÀI CHÍNH CHỦ ĐỀ: CÁC YẾU TỐ ẢNH HƯỞNG ĐẾN GIÁ CỔ PHIẾU CỦA CÔNG TY VÀ ỨNG DỤNG
Giảng viên hướng dẫn:
Sinh viên thực hiện: Phạm Trung Tiến Lớp: FNC09 MSSV: 31211022600
Trang 2Mục lục
Trang 3Danh mục bảng biểu
Trang 5Phần 1 Ứng dụng STATA
1.1Giới thiệu chung
Thị trường chứng khoán của Việt Nam trong những năm gần đây đã có sự phát triển đáng kể, tuy nhiên cũng đối mặt với nhiều thách thức và rủi ro Dưới đây là một số nhận xét và dấu hiệu chính về thị trường chứng khoán củaViệt Nam trong những năm gần đây:
- Tăng trưởng: Thị trường chứng khoán của Việt Nam đã trải qua giai đoạn tăng trưởng tích cực trong những năm gần đây, đặc biệt là từ năm 2017 đến năm 2019, với sự phát triển của nhiều công ty và ngành kinh tế
- Sự tăng trưởng của các chỉ số chứng khoán: Chỉ số VN-Index đã tăng đáng kể trong giai đoạn 2016-2021, đạt đỉnh điểm vào tháng 4 năm 2021 Chỉ số Vn30, đo lường 30 cổ phiếu có giá trị vốn hóa lớn nhất của thị trường chứng khoán Việt Nam, cũng đã tăng trưởng mạnh mẽ trong thời gian này
- Sự phát triển của các ngành kinh tế: Nhiều ngành kinh tế của Việt Nam đã phát triển mạnh mẽ trong những năm gần đây, đặc biệt là ngành tài chính, bất động sản, dầu khí và sản xuất
- Sự hỗ trợ từ chính sách của chính phủ: Chính phủ đã có những chính sách
và biện pháp hỗ trợ phát triển thị trường chứng khoán, bao gồm việc cho phép các công ty niêm yết tại sàn chứng khoán, tăng cường quản lý và giám sát thị trường, và cải cách hệ thống pháp luật để thu hút đầu tư.Tuy nhiên, thị trường chứng khoán Việt Nam cũng đối mặt với nhiều thách thức và rủi ro, bao gồm:
- Rủi ro về sự bất ổn của kinh tế toàn cầu: Thị trường chứng khoán Việt Nam còn phụ thuộc vào sự ổn định của kinh tế toàn cầu và có thể bị ảnh hưởng bởi các biến động trong nền kinh tế thế giới
- Rủi ro về sự không ổn định của chính trị và an ninh: Sự bất ổn chính trị và
an ninh có thể
Trên cương vị của các nhà đầu tư tài chính việc hiểu biết về thị trường và những yếu tố ảnh hưởng đến thị trường chứng khoán có những tác động nhất định lên quyết định đầu tư của các nhà đầu tư, cho phép các nhà đầu
tư có thể tìm kiếm được những khoản lợi nhuận hấp dẫn Vì thế, việc tìm hiểu những thông tin liên quan đến thị trường chứng khoán là một yếu tố quan trọng để đưa ra những quyết định đầu tư đúng đắn, một trong những yếu tố quan cơ bản và quan trọng nhất khi bắt đầu gia nhập thị trường chứng khoán là các chỉ số tài chính có sự ảnh hưởng thế nào đến giá cổ
Trang 6phiếu Do đó, em đã thực hiện nghiên cứu mô hình “Các chỉ số tài chính
cơ bản ảnh hưởng đến giá cổ phiếu của một doanh nghiệp như thế nào?”, các biến của mô hình đã được lựa chọn và tham khảo trong các nghiên cứucủa nhiều tác giả
Mô hình nghiên cứu:
P it = β 0 + β 1 ROE it + β 2 P/E it + β 3 LEV it + β SIZE + β 4 5 SIZE*ROE it + ε it
Giải thích biến và cách thu thập dữ liệu:
- Pit: Gía thị trường mỗi cổ phiểu của công ty, doanh nghiệp i tại thời điểm cuối năm (đơn vị: nghìn đồng), nguồn Vietstock
- ROEit: Tỷ suất lợi nhuận trên vốn chủ sở hữu của công ty, doanh nghiệp i tại thời điểm cuối năm t (đơn vị: %), ROE đo lường khả năng sinh lời của công ty từ vốn chủ sở hữu và được tính bằng cách chia lợi nhuận sau thuế cho vốn chủ sở hữu của công ty Số liệu được lấy từ báo cáo tài chính của công ty
- P/Eit: Tỷ số giá trị thị trường trên lợi nhuận của công ty, doanh nghiệp i tại thời điểm cuối năm t, P/E ratio đo lường giá trị thị trường của một công ty
so với lợi nhuận mà công ty đó tạo ra P/E ratio được tính bằng cách chia giá cổ phiếu của công ty cho lợi nhuận trên cổ phiếu của công ty đó Số liệu được lấy từ báo cáo tài chính của công ty
- LEVit: Hệ số Nợ trên Tổng tài sản của công ty i tại thời điểm cuối năm t, được tính bằng cách lấy số dư Nợ chia cho Tổng tài của của công ty, số liệu được lấy từ báo cáo tài chính của công ty
- SIZEit: Biến giả (nhận 2 giá trị 0 và 1), thể hiện quy mô thị trường của công ty 0 là những công ty có quy mô thị trường nhỏ, 1 là những công ty
có quy mô thị trường lớn Được dựa vào vốn hóa thị trường của công ty đó
Các câu hỏi nghiên cứu, giả thuyết cần kiểm định:
- Tỷ suất lợi nhuận trên vốn chủ sở hữu của công ty, doanh nghiệp tăng thì giá trị cổ phiếu của công ty có tăng hay không?
Trang 7- Tỷ suất giá thị trường trên lợi nhuận của công ty, doanh nghiệp tăng thì giátrị cổ phiếu của công ty có tăng hay không?
- Hệ số nợ trên tài sản ảnh hưởng tích cực hay tiêu cực lên giá thị thị trườngcủa cổ phiếu?
- Quy mô của doanh nghiệp ảnh hưởng thế nào đến giá trị cổ phiếu của công ty,doanh nghiệp?
- Tỷ suất lợi nhuận trên vốn chủ sở hữu của những công ty có quy mô lớn
có giống ở công ty nhỏ hay không, từ đó phản ánh lên giá cổ phiếu thị trường ra sao?
1 Thực hiện Kiểm định tính dừng, Ma trận tương quan, Kiểm định hiện tượng đa cộng tuyến và Báo cáo thống kê mô tả
1.1Kiểm định tính dừng cho dữ liệu bảng
- Sử dụng phần mềm Stata kiểm định tính dừng theo Levin-Lin-Chu đối vớicác biến P, ROE, P/E, LEV
Giả thuyết của kiểm định Levin-Lin-Chu:
H0: Biến kiểm định không có tính dừng
H1: Biến kiểm định không có tính dừng
Biến Giá trị điều chỉnh
t/giá trị thống kê z Giá trị p-value Kết luận
0: Bác bỏ giả thuyết H ở cả 3 ý nghĩa 1% 5% 10%0
1: Chấp nhận giả thuyết H ở mức ý nghĩa 1%0
Trang 82: Chấp nhận giả thuyết ở mức ý nghĩa 5%
3: Chấp nhận giả thuyết ở mức ý nghĩa 10%
Nhận xét
Theo kết quả tổng hợp từ Stata, 4 biến cho thấy có tính dừng ở ccar 3 mức ý nghĩa 1%, 5% và 10% là P, ROE, P/E, LEV Bên cạnh đó, 2 biến không cho thấy dấu hiệu có tính dừng ở cả 3 mức ý nghĩa !%, 5%, 10% là SIZE và ROE*SIZE
1.2 Trình bày ma trận tương quan
*: Hệ số tương quan Pearson có ý nghĩa thống kê ở mức ý nghĩa 5%
Nhận xét:
Với kết quả Stata, ta có:
- Biến P có tương quan dương với P, đồng thời hệ số này cũng có ý nghĩa thống kê ở mức ý nghĩa 5%
- Biến ROE cũng có tương quan dương với biến P/E, đồng thời hệ số này cũng có ý nghĩa thống kê ở mức ý nghĩa 5%
- Biến P/E có tương quan dương với biến P, ROE và P/E Tuy nhiên chỉ có
hệ số giữa hai biến P/E và biến P là có ý nghĩa thống kê ở mức 5%
- Biến LEV có tương quan dương với biến P, ROE và tương quan âm với biến P/E Trong 3 hệ số thì chỉ có 2 hệ số có mức ý nghĩa thống kê đó là giữa biến LEV với biến P và biến P/E
- Biến SIZE có tương quan dương với cả 4 biến P, ROE, P/E, LEV, nhưng trong 4 biến chỉ có 2 biến là có ý nghĩa thống kê đó là giữa biến SIZE với biến P và ROE
Trang 9- Biến ROE*SIZE có tương quan dương với các biến P, ROE, LEV, SIZE vàtương quan âm với biến P.E Trong đó thì chỉ có 3 biến có ý nghĩa thống
kê đó là giữa biến ROE*SIZE và các biến P, ROE, SIZE
Từ kết quả trên, ta nhận thấy mối tương quan giữa các biến có độ lớn khá cao, và đa số đều có ý nghĩa thống kê Điều này có thể gây ra hiện tượng
đa cộng tuyến cho mô hình Vì thế, tiếp đến chúng ta sẽ kiểm định xem liệu có hiện tượng đa cộng tuyến trong mô hình hay không
1.3 Kiểm định hiện tượng đa cộng tuyến của mô hình
Sử dụng hệ số phóng đại phương sai Variance Inflation Factor (VIF) để kiểm định hiện tượng đa cộng tuyến trong mô hình
1.4 Báo cáo thống kê mô tả
quan
sát
Trung bình
Độ lệch chuẩn
Giá trị nhỏnhất
Giá trị lớnnhất
ROE 120 0.1380085 0.4103559 -1.93115 1.827065P/E 120 17.33095 21.92766 -109.5468 6.6923LEV 120 0.4712122 0.1585648 0.1400355 0.7837252
ROE*SIZE 120 0.1674102 0.1674309
-0.0170188
1.159437
Trang 10Bảng 1.4 Báo cáo thống kê mô tả
Tên biến Hệ số hồi
quy Độ lệch chuẩn Gía trị thốngkê t P-value
Trang 11Bảng 2.1 Kết quả hồi quy theo mô hình Pooled OLS
2.2 Hồi quy dữ liệu bảng theo mô hình Fixed effect và kiểm định F-test
Giá trị thống kê t
Trang 12H1: Kết quả hồi quy từ mô hình Fixed effect phù hợp hơn kết quả của
mô hình Pooled OLS
là 86.3857 Như vậy khi biến ROE*SIZE tăng 1% thì sẽ xảy ra tác động tích cực lên giá thị trường cổ phiếu, cụ thể là làm P tăng 86.3857 nghìn đồng
- Thông qua kết quả kiểm định F-test, với Prob > F= 0.0000 thì ta có thể kếtluận kết quả hồi quy theo mô hình Fixed effect sẽ phù hợp hơn kết quả từ
mô hình Pooked OLS ở cả 3 mức ý nghĩa 1%, 5%, 10%
2.3 Hồi quy dữ liệu bảng theo mô hình Random effect và kiểm định Breusch and Pagan LM
Tên biến Hệ số hồi
quy Độ lệch chuẩn Giá trị thống kê t P-value
Trang 13Kiểm định Breusch and Pagan LM:
H0: Không có sự khác biệt giữa kết quả hồi quy theo Pooled OLS và Random effect
H1: Kết quả hồi quy từ mô hình Random effect phù hợp hơn kết quả của mô hình Pooled OLS
- Thông qua kết quả kiểm định Breusch and Pagan LM, với Prob > Chibar 2
= 0.0000 thì ta có thể kết luận kết quả hồi quy theo mô hình Random effect sẽ phù hợp hơn kết quả mô hình Pooled OLS ở cả 3 mức ý nghĩa thồng kê 1%, 5%, 10%
2.4 Kiểm định sự phù hợp giữa 2 mô hình hồi quy Fixed effect và Random effect
Sử dụng kiểm định Hausman để đánh giá độ phù hợp giữa 2 mô hình này
Giả thuyết:
H0: Kết quả hồi quy từ mô hình Random effect phù hợp hơn kết quả từ
mô hình Fixed effect
Trang 14H1: Kết quả hồi quy từ mô hình Fixed effect phù hơn kết quả từ mô hình Random effect
Hệ số Chi2 56.83Prob > Chi2 0.0000
Kết luận:
Từ kết quả kiểm định Hausman, ta thấy Prob>Chi = 0.0000 < 1% nên 2không thể bác bỏ H Suy ra, kết quả hồi quy từ mô hình Fixed effect sẽ1phù hợp hơn so với kết quả hồi quy từ mô hình Random effect
Tóm lại:
- Thông qua kết quả kiểm định F-test, kết quả hồi quy theo mô hình Fixed effect sẽ phù hợp hơn kết quả từ mô hình Pooled OLS => Lựa chọn mô hình Fixed effect
- Thông qua kết quả kiểm định Breusch and Pagan Lm; kết quả hồi quy theo
mô hình Random effect sẽ phù hợp hơn kết quả từ mô hình Pooled OLS
=> Lựa chọn mô hình Random effect
- Thông qua kết quả kiểm định Hausman, kết quả hồi quy từ mô hình Fixed effect sẽ phù hợp hơn so với kết quả hồi quy từ mô hình Random effect =>Lựa chọn mô hình Random effect
- => Kết quả hồi quy từ mô hình Fixed effect là phù hợp nhất đối với dữ liệu bảng
- Mô hình hồi quy đạt được theo Fixed effect:
P it = 38.53084 + 0.3076709*ROE + 0.1565229*P/E + 9.452623*LEV it it -13.71014*SIZE it + 86.3857*ROE*SIZE + ε it it
2.5 Kiểm định các khuyết tật của mô hình
Trang 152.5.1 Kiểm định hiện tượng tự tương quan trong mô hình
Sử dụng kiểm định Wooldridge
Giả thuyết
H0: Không có hiện tượng tự tương quan bậc 1
H1: Có hiện tượng tự tương quan bậc 1
Hệ số F 11.100Prob > F 0.0049
Kết luận:
Vì Prob > F = 0.0049 < 1% nên chúng ta có thể bác bỏ H hay mô hình hồi0quy tồn tại hiện tượng tự tương quan bậc 1
2.5.2 Kiểm định hiện tượng phương sai thay đổi
Sử dụng kiểm định Breusch and Pagan LM
Giả thuyết:
H0: Không có hiện tượng phương sai thay đổi
H1: Có hiện tượng phương sai thay đổi
Hệ số Chi2 3870.69Prob > Chibar2 0.0000
Bảng 1 1 Kết quả kiểm định Bruesch and Pagan LM
Kết luận:
Vì Prob > Chibar = 0.0000 < 1% nên chúng ta có thể bác bỏ H hay mô hình hồi2
0quy tồn tại hiện tượng phương sai thay đổi
Mô hình mắc phải 2 khuyết tật là hiện tượng tự tương quan bậc 1 và phương sai thay đổi Suy ra, chúng ta cần phải sử dụng mô hình hồi quy GLS để khắc phục hai hiện tượng này
Trang 162.6 Hồi quy theo mô hình GLS
Prob > Chi2 0.0000
Tên biến Hệ số hồi
quy
Độ lệch chuẩn
Giá trị thống kê t P-value
- Tất cả các biến trừ hai biến ROE và SIZE đều có tác động cùng chiều với giá thị trường cổ phiếu của các công ty Cụ thể:
+ Khi P/E tăng 1 đơn vị, P sẽ tăng 0.2921175 nghìn đồng
+ Khi LEV tăng 1 đơn vị, P sẽ tăng 38.62066 nghìn đồng
+ Khi ROE ở những công ty có SIZE (quy mô thị trường) lớn, P sẽ tăng 81.97467 nghìn đồng
Mô hình hồi quy GLS:
Trang 17P it = -4.580618 - 2.053796*ROE + 0.2921175*P/E + 38.62066*LEV + it it it 6.500107*SIZE it + 81.97467*ROE*SIZE + ε it
Trang 18Phần II Ứng dụng R
2.1 Giới thiệu về bộ dữ liệu
Lấy dữ liệu 52 tuần của chỉ số Nyse (từ tháng 4 năm 2022 đến tháng 4 năm 2023)
2.2 Mô tả chuỗi thời gian
Hình ảnh 2.2 Mô tả chuỗi thời gian (Kết quả từ Ứng dụng R)
Chuỗi thời gian được mô tả bằng các giá trị số đại diện cho khoảng thời gian cụ thể, trong trường hợp này là các giá trị ngày Mô tả chuỗi thời gian cho thấy khoảng giá trị từ 13472 đến 15999, với giá trị trung bình (mean) là 15122 Median (giá trị trung vị) là 15246, nghĩa là có một nửa các giá trị nhỏ hơn 15246
và một nửa các giá trị lớn hơn nó 1st Qu (phân vị thứ nhất) là 14745, cho thấy 25% giá trị nhỏ hơn hoặc bằng nó 3rd Qu (phân vị thứ ba) là 15592, cho thấy 75% giá trị nhỏ hơn hoặc bằng nó Giá trị Min và Max cho thấy giá trị nhỏ nhất
và lớn nhất trong chuỗi thời gian Từ mô tả này, ta có thể suy ra rằng chuỗi thời gian này là một chuỗi tăng dần và có phân bố đối xứng
2.2.1 Biểu đồ chuỗi thời gian Nyse
Trang 19Hình ảnh 2.2.1 Biểu đồ chuỗi thời gian (Kết quả từ Ứng dụng R)
Thông qua hình ảnh, ta quan sát thấy chỉ số Nyse duy trì một xu hướng tăng trong giai đoạn nghiên cứu Do vậy, chỉ số Nyse khó có khả năng cótính dừng
2.3 Kiểm định nghiệm đơn vị cho chuỗi thời gian
Trang 20Hình ảnh 3 kiểm định nghiệm đơn vị cho chuỗi thời gian (Kết quả từ Ứng dụng R)
Dựa trên kết quả kiểm định Augmented Dickey-Fuller (ADF) cho chuỗi thời gian "Nyse", ta có thể nhận xét rằng:
- Giá trị thống kê Dickey-Fuller (DF) là -2.667 Giá trị này được sử dụng để
so sánh với các giá trị ngưỡng ở bước tiếp theo để xác định xem liệu chuỗithời gian có nghiệm đơn vị hay không
- Lag order (thứ tự độ trễ) là 3 Thông thường, lựa chọn giá trị Lag order dựa trên quy tắc "Sử dụng số độ trễ sao cho phương sai của chuỗi thời gian được giảm đáng kể và không còn có xu hướng" Tuy nhiên, việc lựa chọn Lag order phụ thuộc vào từng trường hợp cụ thể
- Giá trị p-value của kiểm định là 0.3061 Giá trị này thể hiện mức độ chắc chắn của kết quả kiểm định Nếu giá trị p-value nhỏ hơn ngưỡng ý nghĩa (thường là 0.05), chúng ta có thể bác bỏ giả thuyết không có nghiệm đơn
vị và chấp nhận giả thuyết có nghiệm đơn vị Trong trường hợp này, giá trịp-value là 0.3061, tức là không thể bác bỏ giả thuyết không có nghiệm đơn vị
- Alternative hypothesis là stationary Điều này có nghĩa là giả thuyết mà chúng ta muốn chứng minh là chuỗi thời gian "Nyse" là ổn định (stationary), tức là không bị phụ thuộc vào thời gian
Dựa trên kết quả trên, chúng ta không có đủ bằng chứng để bác bỏ giả thuyết rằng chuỗi thời gian "Nyse" không có nghiệm đơn vị và không
bị phụ thuộc vào thời gian
2.4 Xác định sai phân d thích hợp
2.4.1 Đồ thị của sai phân bậc 1
Trang 21Hình ảnh 2.4.1 Đồ thị sai phân d bậc 1 (Hình ảnh từ Ứng dụng R) 2.4.2 Thực hiện các kiểm định nghiệm đơn vị cho sai phân bậc 1
+ ADF test cho sai phân bậc 1
Trang 22Hình ảnh 4 ADF test cho sai phân bậc 1 (Kết quả từ Ứng dụng R)
Dựa trên kết quả kiểm định Augmented Dickey-Fuller (ADF) cho chuỗi thời gian "diff(Nyse, differences = 1)", ta có thể nhận xét rằng:
- Giá trị thống kê Dickey-Fuller (DF) là -3.1006 Giá trị này được sử dụng
để so sánh với các giá trị ngưỡng ở bước tiếp theo để xác định xem liệu chuỗi thời gian đã được sai phân bậc 1 có nghiệm đơn vị hay không
- Lag order (thứ tự độ trễ) là 3 Thông thường, lựa chọn giá trị Lag order dựa trên quy tắc "Sử dụng số độ trễ sao cho phương sai của chuỗi thời gian được giảm đáng kể và không còn có xu hướng" Tuy nhiên, việc lựa chọn Lag order phụ thuộc vào từng trường hợp cụ thể
- Giá trị p-value của kiểm định là 0.1319 Giá trị này thể hiện mức độ chắc chắn của kết quả kiểm định Nếu giá trị p-value nhỏ hơn ngưỡng ý nghĩa (thường là 0.05), chúng ta có thể bác bỏ giả thuyết không có nghiệm đơn
vị và chấp nhận giả thuyết có nghiệm đơn vị Trong trường hợp này, giá trịp-value là 0.1319, tức là không thể bác bỏ giả thuyết không có nghiệm đơn vị
- Alternative hypothesis: stationary Điều này có nghĩa là giả thuyết mà chúng ta muốn chứng minh là chuỗi thời gian đã được sai phân bậc 1 là ổnđịnh (stationary), tức là không bị phụ thuộc vào thời gian
Dựa trên kết quả trên, chúng ta không có đủ bằng chứng để bác bỏ giả thuyết rằng chuỗi thời gian "diff(Nyse, differences = 1)" đã được sai phân bậc 1 không có nghiệm đơn vị và không bị phụ thuộc vào thời gian
2.4.3 Đồ thị sai phân bậc 2
Trang 23Hình ảnh 2.4.3.1 Đồ thị sai phân bậc 2 (Hình ảnh từ Ứng dụng R)
Trang 24+ ADF test cho sai phân bậc 2
Hình ảnh 2.4.3.2 ADF test cho sai phân bậc 2 (Kết quả từ Ứng dụng R)
Dựa trên kết quả kiểm định Augmented Dickey-Fuller (ADF) cho chuỗi thời gian "diff(Nyse, differences = 2)", ta có thể nhận xét rằng:
- Giá trị thống kê Dickey-Fuller (DF) là -4.4268 Giá trị này được sử dụng
để so sánh với các giá trị ngưỡng ở bước tiếp theo để xác định xem liệu chuỗi thời gian đã được sai phân bậc 2 có nghiệm đơn vị hay không
- Lag order (thứ tự độ trễ) là 3 Thông thường, lựa chọn giá trị Lag order dựa trên quy tắc "Sử dụng số độ trễ sao cho phương sai của chuỗi thời gian được giảm đáng kể và không còn có xu hướng" Tuy nhiên, việc lựa chọn Lag order phụ thuộc vào từng trường hợp cụ thể
- Giá trị p-value của kiểm định là 0.01 Giá trị này thể hiện mức độ chắc chắn của kết quả kiểm định Nếu giá trị p-value nhỏ hơn ngưỡng ý nghĩa (thường là 0.05), chúng ta có thể bác bỏ giả thuyết không có nghiệm đơn
vị và chấp nhận giả thuyết có nghiệm đơn vị Trong trường hợp này, giá trịp-value là 0.01, tức là có đủ bằng chứng để bác bỏ giả thuyết không có nghiệm đơn vị
- Alternative hypothesis là stationary Điều này có nghĩa là giả thuyết mà chúng ta muốn chứng minh là chuỗi thời gian đã được sai phân bậc 2 là ổnđịnh (stationary), tức là không bị phụ thuộc vào thời gian
Dựa trên kết quả trên, chúng ta có đủ bằng chứng để bác bỏ giả thuyết rằng chuỗi thời gian "diff(Nyse, differences = 2)" đã được sai phân bậc 2 không có nghiệm đơn vị và đã trở thành chuỗi dừng (stationary)
Trang 252.5 Xác định độ trễ p,q thích hợp
2.5.1 Sử dụng các giản đồ tự tương quan để tìm kiếm gợi ý
+ Biểu đồ ACF
Tự tương quan (ACF - AutoCorrelation Function): “Tự tương quan là
một khái niệm quan trọng trong chuỗi thời gian Hầu hết các chuối thời gian sẽ có sự tương quan với giá trị trễ của nó và các giá trị càng gần nhau thì tương quan càng mạnh hoặc giá trị cùng thuộc 1 chu kì của chuỗi thì sẽ
có tương quan cao (chẳng hạn như cùng tháng trong chu kì năm hay cùng quí trong chu kì năm) Chính vì vậy hệ số này mới có tên là tự tương quan
Hệ số tự tương quan được viết tắt là ACF và thường dùng để tìm ra độ trễ của quá trình trung bình trượt MV( ) để xây dựng các mô hình như q
ARIMA, GARCH, ARIMAX,… và kiểm tra yếu tố mùa vụ.” Hế số tự tương quan bậc được xác định như sau:s
“Gía trị p(s,t) đo lường khả năng dự báo của biến x nếu chỉ sử dụng biến t
xs Trong trường hợp 2 đại lượng có tương quan hoàn hảo tức p(s,t) = ±1 ta
có thế biểu diễn x = β + β Hệ số của β sẽ ảnh hưởng lên chiều của hệ t 0 1xs 1
số tương quan Theo đó p(s,t) = 1 khi β > 0 và p(s,t) = -1 khi β < 0.” Qua 1 1
đó chúng ta có thể vẽ biểu đồ các hệ số tự tương quan ACF như bên dưới
Trang 27nằm ngoài khoảng tin cậy thì đó chính là độ trễ phù hợp lớn nhất mà ta nên lựa chọn cho quá trình trung bình trượt MV( ) Nhìn chung bậc q q
không quá lớn.” Đối với bài toán này hầu hết các hệ số tự tương quan với bậc nhỏ hơn hoặc bẳng 5 đều có giá trị nằm trong khoảng tin cậy 95% của
0 Do đó ta có thể linh hoạt chọn bậc q = 1 là vị trí mà hệ số tự tương quanlớn nhất
x ,…,xt-1 t – k nằm giữa x và x Khi đó ta thu được phương trình hồi qui t t – ktuyến tính tổng quát bậc k là:
“Trong đó corr() là hàm tính hệ số tương quan PACF sẽ có tác dụng tìm ra
hệ số bậc tự do p của quá trình tự hồi qui AR(p) Tương tự như ACF, thông qua một biểu đồ PACF về giá trị các hệ số tương quan riêng phần tương ứng với các độ trễ khác nhau, chúng ta sẽ tìm ra được các bậc tự do
p phù hợp Đó chính là vị trí mà giá trị của hệ số tương quan riêng phần nằm ngoài ngưỡng tin cậy 95% của giả thuyết hệ số tương quan riêng phần bằng 0”
Trang 28Hình ảnh 2.5.1.2 Biểu đồ PACF (Hình ảnh từ Ứng dụng R)
Tương tự như ACF, bậc của PACF cũng thường nhỏ hơn 5 Như vậy ta cũng có thể lựa chọn bậc tự do của PACF là một giá trị nào đó từ 1 đến 5 Kết hợp giữa bậc của p và q và giá trị d = 2 ta có thể thu được một số kịch bản như sau:
ARIMA (0,2,0)
Trang 292.6 Sử dụng các chỉ số AIC, AICC, BIC để tìm kiếm mô hình tốt nhất
Các giá trị AIC, AICC và BIC được tính toán để so sánh các mô hình ARIMA khác nhau và tìm ra mô hình tốt nhất dựa trên các tiêu chí này Các giá trị này càng thấp thì mô hình càng tốt
Hình ảnh 2.6.1 Các giá trị AIC, AICC, BIC (Kết quả từ Ứng dụng R)
Hình ảnh 2.6.2 Giá trị nhỏ nhất của AIC, AICC và BIC (Kết quả từ Ứng dụng R)
Trong số liệu trên, mô hình ARIMA(0,2,1) có giá trị AIC thấp nhất là 754.5772, theo sau là mô hình ARIMA(1,2,1) với giá trị AIC là 756.5091 Tương tự, giá trị AICC và BIC cũng cho thấy rằng mô hình ARIMA(0,2,1)