5. Kết cấu của đề tài nghiên cứu
3.3 Xây dựng mô hình ROA
3.3.1 Khảo sát các dạng hàm hồi quy
Sau khi xem xét hệ số tương quan giữa các biến độc lập với biến phụ thuộc là ROA thì ta giữ lại các biến độc lập sau để xem xét xây dựng mô hình ROA:
D (TDTA/TDTE/STDTA): Tỷ lệ nợ
Tiến hành khảo sát riêng dạng hàm hồi quy phù hợp của từng biến độc lập trên với biến phụ thuộc ROA20:
ROA và TDTA: Kết quả cho thấy giá trị R2 của mô hình bậc 3 là cao nhất (55.6%) thể hiện khả năng giải thích của dạng mô hình này mạnh nhất. Do đó, ta chọn dạng mô hình bậc 3 cho mối quan hệ giữa ROA và TDTA. Như vậy, ta tạo thêm biến
TDTA2 (TDTA bình phương) và TDTA3 (TDTA lập phương) để sử dụng cùng với
biến TDTA (xem Phụ lục 3, trang 1)
ROA và TDTE: Kết quả cho thấy giá trị R2 của mô hình log là cao nhất (53.5%) thể hiện khả năng giải thích của dạng mô hình này mạnh nhất. Do đó, ta chọn dạng mô hình log-tuyến tính cho mối quan hệ giữa ROA và TDTE. Như vậy, ta tạo thêm
biến LOG_TDTE để sử dụng trong mô hình (xem Phụ lục 3, trang 2)
ROA và STDTA: Kết quả cho thấy giá trị R2 của mô hình bậc 3 là cao nhất (46.3%) thể hiện khả năng giải thích của dạng mô hình này mạnh nhất. Do đó, ta chọn dạng mô hình bậc 3 cho mối quan hệ giữa ROA và STDTA. Như vậy, ta tạo
thêm biến STDTA2 (STDTA bình phương) và STDTA3 (STDTA lập phương) để sử
dụng cùng với biến TDTA (xem Phụ lục 3, trang 3)
ROA và GROWTH: Kết quả cho thấy giá trị R2 của mô hình bậc 3 là cao nhất (21.3%) thể hiện khả năng giải thích của dạng mô hình này mạnh nhất. Do đó, ta chọn dạng mô hình bậc 3 cho mối quan hệ giữa ROA và GROWTH. Như vậy, ta tạo
thêm biến GROWTH2 (GROWTH bình phương) và GROWTH3 (GROWTH lập
phương) để sử dụng cùng với biến GROWTH (xem Phụ lục 3, trang 5)
Từ kết quả khảo sát các biến, tác giả xây dựng mô hình hồi quy bội với các biến có khả năng giải thích cho ROA như sau:
Bảng 3.3: Các biến đưa vào mô hình
Mô hình 1 Mô hình 2 Mô hình 3
TDTA TDTA2 TDTA3 GROWTH GROWTH2 GROWTH3 LOG_TDTE GROWTH GROWTH2 GROWTH3 STDTA STDTA2 STDTA3 GROWTH GROWTH2 GROWTH3
3.3.2 Xây dựng hàm hồi quy ROA
Đưa các biến vừa xây dựng được vào một mô hình tương ứng, dùng phương pháp Enter cho mọi bước khảo sát để tự nhận xét và chọn lựa các biến, sử dụng mức ý nghĩa sig = 5% cho cả 3 mô hình. Kết quả xây dựng mô hình như sau:
Mô hình 1 (mô hình sử dụng tỷ lệ nợ TDTA):
Có 6 biến độc lập được đưa vào mô hình ROA, gồm có: TDTA, TDTA2,
TDTA3, GROWTH, GROWTH2, GROWTH3. Trong quá trình xây dựng mô hình
hồi quy, tác giả loại bỏ dần các biến gây ra hiện tượng đa cộng tuyến (VIF > 5) và các biến không có ý nghĩa thống kê (sig > 5%). Kết quả các biến có ý nghĩa thống kê là: SIZE3, TDTA3 và với các biến này thì mô hình xây dựng được21 có R2 hiệu chỉnh 40%. Mô hình có dạng như sau:
Mô hình 1: ROAi = 0.089 – 1.03TDTAi3
Mô hình 2 (mô hình sử dụng tỷ lệ nợ TDTE):
Có 6 biến độc lập được đưa vào mô hình ROA, gồm có: LOG_TDTE,
GROWTH, GROWTH2, GROWTH3. Thực hiện xử lý tương tự mô hình 1, cuối
cùng tác giả giữ lại các biến có ý nghĩa thống kê là: LOG_TDTE và với các biến
này thì mô hình xây dựng được22 có R2 hiệu chỉnh 55.8%. Mô hình có dạng như
21 Chi tiết xem tại Phụ lục 4: Kết quả ước lượng mô hình 1 – mô hình sử dụng biến tỷ lệ nợ TDTA 22 Chi tiết xem tại Phụ lục 5: Kết quả ước lượng mô hình 2 – mô hình sử dụng biến tỷ lệ nợ TDTE
sau:
Mô hình 2: ROAi = 0.084 – 0.073LOG_TDTEi
Mô hình 3 (mô hình sử dụng tỷ lệ nợ STDTA):
Với 6 biến độc lập được đưa vào mô hình ROA, gồm có: STDTA, STDTA2,
STDTA3, GROWTH, GROWTH2, GROWTH3. Thực hiện xử lý tương tự mô hình 1,
kết quả cho thấy chỉ có STDTA có ý nghĩa thống kê và với biến này thì mô hình
xây dựng được23 có R2 hiệu chỉnh 30%. Mô hình có dạng như sau:
Mô hình 3: ROAi = 0.078 – 0.101 STDTAi3
3.3.3 Kiểm định mô hình
3.3.3.1Kiểm định mô hình 1 (mô hình sử dụng biến tỷ lệ nợ TDTA)
Kiểm định giả thuyết về độ phù hợp của mô hình
Chỉ số R2 là thước đo đánh giá độ phù hợp của mô hình, tức là mô hình hồi
quy đã được xây dựng trên dữ liệu mẫu phù hợp đến mức nào so với dữ liệu. Nhưng sự phù hợp này chỉ mới thể hiện giữa mô hình xây dựng được với tập dữ liệu mẫu, rất có thể mô hình hồi quy này với các hệ số được ước lượng bằng phương pháp OLS không có giá trị gì khi áp dụng cho mô hình thực của tổng thể. Để kiểm định độ phù hợp của mô hình hồi quy tổng thể, tác giả đặt giả thuyết như sau:
H0: R2 của tổng thể = 0 (mô hình hồi quy xây dựng được không phù hợp với tổng
thể)
Đại lượng F được sử dụng cho kiểm định này. Nếu xác suất của F nhỏ thì giả
thuyết H0 bị bác bỏ. Căn cứ vào Bảng phân tích ANOVA (Phụ lục 4) của SPSS thể
hiện giá trị F = 26.908 tương ứng với mức ý nghĩa sig = 0.000, do đó có thể an
toàn bác bỏ giả thuyết H0 và kết luận mô hình hồi quy xây dựng được phù hợp với tổng thể.
Kiểm định giả thuyết về ý nghĩa của hệ số hồi quy
Mô hình hồi quy mẫu xây dựng được có hệ số độ dốc β ≠ 0, nhưng ta chưa thể chắc chắn hệ số độ dốc của mô hình tổng thể β ≠ 0, vì vậy ta phải kiểm định để kết luận về β của tổng thể. Đặt giả thuyết này như sau:
H0: β = 0 (Biến phụ thuộc và biến độc lập không có ảnh hưởng gì đến nhau)
Trị thống kê dùng để kiểm định giả thuyết này là trị thống kê t. Căn cứ vào
Bảng hệ số của mô hình hồi quy (Phụ lục 4), có thể thấy được các mức ý nghĩa quan
sát được đối với các hệ số độ dốc của mô hình lần lượt là sig = 0.000, chứng tỏ
rằng giả thuyết H0 bị bác bỏ với độ tin cậy rất cao (99%), nghĩa là biến phụ thuộc và biến độc lập có mối quan hệ ảnh hưởng lẫn nhau.
Kiểm định phương sai của sai số không đổi
Hiện tượng phương sai của sai số thay đổi là hiện tượng độ lớn của phần dư tăng hoặc giảm cùng với các giá trị dự đoán hay giá trị của biến độc lập mà ta nghi ngờ gây ra hiện tượng phương sai của sai số thay đổi. Tiêu chuẩn ước lượng của phương pháp OLS là dựa trên tổng bình phương các phần dư đạt giá trị cực tiểu. Tác giả sẽ kiểm định phương sai của sai số thay đổi bằng cách kết hợp 2 phương pháp: vẽ biểu đồ và kiểm định tương quan hạng Spearman
Vẽ biểu đồ bình phương phần dư theo ROA
Biểu đồ 3.1: Biểu đồ bình phương phần dư theo ROA (mô hình 1)
ROA .16 .14 .12 .10 .08 .06 .04 .02 0.00 B P _ re s 1 .006 .005 .004 .003 .002 .001 0.000 -.001
(BPres_1: biến bình phương phần dư của mô hình 1)
Rõ ràng từ đồ thị cho thấy bình phương của phần dư tăng cùng với sự gia tăng của biến ROA hay phương sai thay đổi, vì vậy rất có khả năng mô hình đã vi phạm giả thuyết phương sai không thay đổi. Tác giả sẽ sử dụng kiểm định tương quan hạng Spearman giữa các biến độc lập với trị tuyệt đối của phần dư.
Kiểm định tương quan hạng Spearman giữa các biến độc lập với trị tuyệt đối của phần dư
Đặt Giả thuyết Ho: hệ số tương quan hạng của tổng thể bằng 0 (phương sai của sai số không đổi)
Bảng 3.4: Hệ số tương quan Spearman giữa biến TDTA3 và ABSres_1
TDTA3 ABSres_1
Spearman's rho TDTA3 Hệ số tương quan 1.000 -.756(**)
Mức ý nghĩa (2 đuôi) . .000
Số lượng 40 40
Kết quả kiểm định cho thấy giá trị sig của kiểm định = 0.000 < mức ý nghĩa 5% => bác bỏ giả thuyết Ho, tức là Mô hình 1 đã vi phạm giả thuyết phương sai của sai số thay đổi. Hiện tượng phương sai thay đổi gây ra hậu quả lớn nhất là các hệ số hồi quy không có ý nghĩa thống kê, tuy nhiên đối với mô hình xây dựng đã được tác giả thực hiện kiểm định giả thuyết về ý nghĩa của hệ số hồi quy thì các hệ số đều có ý nghĩa về mặt thống kê. Do đó tác giả đánh giá vi phạm này có thể chấp nhận được.
Kiểm định phân phối chuẩn của phần dư
Có nhiều nguyên nhân dẫn đến phần dư có thể không tuân theo phân phối chuẩn như sai dạng mô hình, số lượng các phần dư không đủ nhiều để phân tích … Vì vậy, chúng ta sẽ lần lượt khảo sát phân phối của phần dư bằng cách xây dựng các biểu đồ tần số của các phần dư như sau:
Biểu đồ 3.2: Biểu đồ tần số Histogram khảo sát phân phối của phần dư (mô hình 1) Standardized Residual 3.00 2.50 2.00 1.50 1.00 .50 0.00 -.50 -1.00 -1.50 -2.00 20 10 0 Std. Dev = .99 Mean = 0.00 N = 40.00
Biểu đồ trên cho thấy một đường cong phân phối chuẩn được đặt lên biểu đồ tần số. Phân phối phần dư có trung bình Mean = 0 và độ lệch chuẩn Std. Dev =
0.99, gần bằng 1. Do đó có thể kết luận rằng giả định phân phối chuẩn không bị vi phạm.
Biểu đồ tần số Q-Q Plot khảo sát phân phối của phần dư
Biểu đồ tần số Q-Q plot thể hiện những giá trị các điểm phân vị phân phối của biến theo các phân vị của phân phối chuẩn. Những giá trị kỳ vọng này tạo thành một đường chéo. Các điểm quan sát thực tế sẽ tập trung sát đường chéo nếu dữ liệu có phân phối chuẩn.
Biểu đồ 3.3: Biểu đồ tần số Q-Q Plot khảo sát phân phối của phần dư (mô hình 1)
Normal Q-Q Plot of Standardized Residual
Observed Value 3 2 1 0 -1 -2 -3 E x p e c te d N o rm a l V a lu e 3 2 1 0 -1 -2 -3
Biểu đồ trên cho thấy các dữ liệu quan sát tập trung và rất sát với đường
kỳ vọng nên dữ liệu có phân phối chuẩn hay giả định phân phối chuẩn không bị vi phạm.
Kiểm định tính độc lập của sai số (không có tương quan giữa các phần dư)
Trong kinh tế lượng chuỗi thời gian rất dễ xảy ra hiện tượng tự tương quan - các phần dư có quan hệ với nhau, tức là một hạng nhiễu (µ) ở thời điểm này có thể có quan hệ với một hạng nhiễu ở một điểm khác. Điều này sẽ dẫn tới sai số chuẩn của các hệ số hồi quy OLS sẽ bị chệch và không nhất quán và vì thế việc kiểm định thống kê sẽ không còn đáng tin cậy nữa. Xác định được tầm quan trọng của việc kiểm định mối tương quan giữa các phần dư, tác giả tiến hành kiểm định theo 2 phương pháp sau:
Sử dụng đại lượng thống kê Durbin – Watson:
Giá trị d của mô hình là 1.654 (Phụ lục 4). Tra bảng Durbin – Watson 2 biến độc lập, 40 quan sát và mức ý nghĩa 5% ta có dL = 1.39, dU = 1.60. Như vậy, dU = 1.60 < d = 1.808 < 2 nên chấp nhận giả thuyết không có tương quan chuỗi bậc nhất giữa các phần dư
Phương pháp đồ thị
Bên cạnh việc sử dụng đại lượng thống kê Durbin – Watson để kiểm định, tác giả sử dụng thêm phương pháp đồ thị để vẽ đồ thị phân tán phần dư chuẩn hóa theo thứ tự quan sát để kiểm chứng điều này.
Biểu đồ 3.4: Biểu đồ phân tán phần dư chuẩn hóa theo thứ tự quan sát
THUTU 50 40 30 20 10 0 S ta n d a r d iz e d R e s id u a l 3 2 1 0 -1 -2 -3
Dựa vào biểu đồ cho thấy các phần dư phân tán không theo một quy luật
nào trong mối quan hệ giữa các phần dư nên giữa các phần dư không có tương quan với nhau.
Kiểm định không có mối tương quan giữa các biến độc lập (hiện tượng đa cộng tuyến)
Trong hồi quy đa biến, nhất là hồi quy chuỗi thời gian, thường có hiện tượng các biến độc lập có mối quan hệ nhất định nào đó với nhau, hiện tượng này còn được gọi là hiện tượng đa cộng tuyến. Đa cộng tuyến có thể dẫn tới một số hậu quả như các giá trị ước lượng của hệ số hồi quy OLS có thể không chính xác do có sai số chuẩn quá lớn và dấu của hệ số hồi quy có thể sai so với kỳ vọng (từ cơ sở lý thuyết). Có nhiều cách giúp phát hiện đa cộng tuyến trước và sau khi thực hiện việc ước lượng mô hình, trong luận văn này tác giả sử dụng 2 phương pháp sau:
Hệ số tương quan
Hầu hết các nhà nghiên cứu kinh tế lượng cho rằng khi hệ số tương quan > 0.9 thì đó là một dấu hiệu quan trọng xảy ra hiện tượng đa công tuyến. Quan sát bảng 3.2 Hệ số tượng quan giữa các biến của mô hình thì không có hệ số nào > 0.9. Chỉ có các biến độc lập đại diện cho tỷ lệ nợ như TDTA, TDTE, STDTA có hệ số tương quan khá cao > 0.8. Tuy nhiên, các hệ số tỷ lệ nợ tác giả đã không đưa cùng một lúc vào một mô hình mà được đưa vào từng mô hình hồi quy nên có thể tránh hiện tượng đa cộng tuyến xảy ra.
Độ chấp nhận của biến (Tolerance) hoặc Hệ số phóng đại phương sai (Variance inflation factor – VIF)
Độ chấp nhận Tolerance thường được sử dụng để đo lường hiện tượng cộng tuyến. Quy tắc là nếu độ chấp nhận của một biến nhỏ thì nó gần như là một kết hợp tuyến tính của các biến độc lập khá và đó là dấu hiệu của đa cộng tuyến. Vậy ở mức nào thì độ chấp nhận được cho là nhỏ và sẽ xảy ra hiện tượng cộng tuyến?
Hệ số phóng đại phương sai VIF có liên hệ gần với độ chấp nhận, thực tế nó là nghịch đảo của độ chấp nhận. Khi Tolerance nhỏ thì VIF lớn, quy tắc là khi VIF
vượt quá 10, đó là dấu hiệu của đa cộng tuyến. Quan sát bảng hệ số hồi quy của mô hình, hệ số VIF của các biến = 1.010 nên không có hiện tượng đa cộng tuyến
xảy ra.
3.3.3.2Kiểm định mô hình 2 (mô hình sử dụng biến tỷ lệ nợ TDTE)
Thực hiện tương tự mô hình 1, tác giả kiểm định mô hình 2 như sau: Kiểm định giả thuyết về độ phù hợp của mô hình
Đặt giả thuyết H0: R2 của tổng thể = 0 (mô hình hồi quy xây dựng được
không phù hợp với tổng thể)
Căn cứ vào Bảng phân tích ANOVA (Phụ lục 5) của SPSS thể hiện giá trị F
= 43.793 tương ứng với mức ý nghĩa sig = 0.000, do đó có thể an toàn bác bỏ giả thuyết H0 và kết luận mô hình hồi quy xây dựng được phù hợp với tổng thể.
Kiểm định giả thuyết về ý nghĩa của hệ số hồi quy
H0: β = 0 (Biến phụ thuộc và biến độc lập không có ảnh hưởng gì đến nhau)
Căn cứ vào Bảng hệ số của mô hình hồi quy (Phụ lục 5), có thể thấy được
các mức ý nghĩa quan sát được đối với hệ số độ dốc của mô hình là sig = 0.000,
chứng tỏ rằng giả thuyết H0 có thể bị bác bỏ với độ tin cậy cao (95%), nghĩa là biến phụ thuộc và biến độc lập có mối quan hệ ảnh hưởng lẫn nhau.
Kiểm định phương sai của sai số không đổi
Tác giả sẽ kiểm định phương sai của sai số thay đổi bằng cách kết hợp 2 phương pháp: vẽ biểu đồ và kiểm định tương quan hạng Spearman
Vẽ biểu đồ bình phương phần dư theo ROA
Biểu đồ 3.5: Biểu đồ bình phương phần dư theo ROA (mô hình 2)
ROA .16 .14 .12 .10 .08 .06 .04 .02 0.00 B P r e s _ 2 .003 .002 .001 0.000 -.001
(BPres_2: biến bình phương phần dư của mô hình 2)
Rõ ràng từ đồ thị cho thấy bình phương của phần dư tăng cùng với sự gia tăng của biến ROA hay phương sai thay đổi, vì vậy rất có khả năng mô hình đã vi