Sau khi tiếp cận phương pháp nghiên cứu của Kraus và Litzenberger (1976) & Hung và cộng sự (2003) để xây dựng mô hình nghiên cứu thì mục này sẽ trình bày các phương pháp hồi quy để ước lượng các hệ số phần bù cho từng yếu tố rủi ro với bộ dữ liệu bảng không cân bằng, cụ thể bao gồm các phương pháp ước lượng Pooled OLS, RE, FE và System GMM. Sau đó luận văn tiến hành thực hiện các kiểm định cần thiết để đánh giá khuyết tật mô hình và lựa chọn phương pháp ước lượng phù hợp.
Đầu tiên, phương pháp ước lượng hồi quy Pooled OLS được sử dụng dựa trên giả định các hệ số hồi quy không chịu tác động của các công ty riêng biệt cũng như không thay đổi theo thời gian. Đây thực chất chỉ là phương pháp ước lượng OLS thông thường vì phương pháp này không phân biệt chuỗi thời gian trong bảng, dữ liệu sẽ được gộp như kiểu dữ liệu chéo. Việc dựa trên rất nhiều giả định và không quan tâm đến chuỗi dữ liệu của các công ty theo thời gian chính là những nhược điểm của mô hình, sai số ngẫu nhiên có thể sẽ tương quan với biến độc lập làm cho kết quả ước lượng bị thiên chệch và không vững. Do đó để sử dụng mô hình cần phải thực hiện các kiểm định cần thiết để đánh giá khuyết tật mô hình:
Thứ nhất, kiểm định Breusch-Pagan (Breusch-Pagan test) để phát hiện hiện tượng phương sai thay đổi với giả thuyết H0 là không có hiện tượng phương sai thay đổi. Nếu giá trị p-value của thống kê chi bình phương nhỏ hơn 0.05 thì bác bỏ giả thuyết H0, kết luận mô hình không tồn tại hiện tượng phương sai thay đổi và ngược lại.
Thứ hai, kiểm định Wooldridge (Wooldridge test) đánh giá tự tương quan mô hình với giả thuyết H0 là không có hiện tượng tự tương quan trong mô hình. Nếu giá trị p-value của thống kê chi bình phương nhỏ hơn 0.05 thì bác bỏ giả thuyết H0, kết luận mô hình không tồn tại hiện tượng tự tương quan và ngược lại.
Thứ ba, dùng hệ số nhân tử phóng đại phương sai (VIF) để xem xét vấn đề đa cộng tuyến. Khi có hiện tượng này xảy ra trong mô hình, các hệ
số hồi quy của mô hình không xác định. Nếu biến nào có hệ số VIF lớn hơn 10 thì xảy ra hiện tượng đa cộng tuyến trong mô hình.
Trong trường hợp giả thuyết hiện tượng phương sai thay đổi và hiện tượng tự tương quan bị vi phạm, có thể dùng phương pháp ước lượng hồi quy cluster để điều chỉnh trong ước lượng nhằm khắc phục các nhược điểm dữ liệu, tuy nhiên sẽ không giải quyết triệt để các vấn đề này.
Để khắc phục nhược điểm của mô hình Pooled OLS, giả định các công ty được quan sát đều có những đặc điểm riêng biệt có thể tác động đến lợi nhuận cổ phiếu, mô hình tác động cố định (FEM) sử dụng phương pháp tác động cố định phân tích mối tương quan giữa phần dư của mỗi công ty với lợi nhuận cổ phiếu nhằm kiểm soát và tách ảnh hưởng của những tác động cố định riêng biệt không thay đổi theo thời gian ra khỏi biến độc lập. Trong mô hình sẽ không có hiện tượng tự tương quan và kết quả hồi quy đáng tin cậy hơn. Nhưng nếu trong mô hình tác động cố định có sự tương quan giữa biến độc lập với sự biến động của các công ty thì mô hình tác động ngẫu nhiên (REM) giả định sự biến động này là ngẫu nhiên và không tương quan với biến độc lập. Kết quả hồi quy sẽ cho các tham số ước lượng không chệch nhưng sẽ không hiệu quả vì đã bỏ qua sự tự tương quan trong trong thành phần sai số mô hình. Nhìn chung, mô hình REM hay FEM được sử dụng dựa trên giả định có hay không sự tương quan giữa sai số mô hình và các biến độc lập. Việc lựa chọn một trong ba mô hình Pooed OLS, REM, FEM phụ thuộc các kiểm định riêng cho từng mô hình. Cụ thể, để lựa chọn giữa các mô hình Pooled OLS và FEM và REM, luận văn kiểm định về sự tương quan chéo giữa các đơn vị quan sát (Breusch – Pagan Larganian multiplier test) để là cơ sở lựa chọn giữa Pooled OLS và REM, kiểm định sự tồn tại của các ảnh hưởng cố định (F-test) để lựa chọn giữa Pooled OLS và FEM. Nếu sau hai kiểm định này, mô hình Pooled OLS không được lựa chọn thì tiếp tục thực hiện kiểm định Hausman (Hausman test) để chọn mô hình hiệu quả hơn giữa REM và FEM.
Kiểm định Breusch – Pagan Larganian multiplier (LM)
Giả thuyết H0: không có sự tương quan chéo giữa đơn vị quan sát (cross- sectional independence)
Kết quả kiểm định có p-value nhỏ hơn 0.05 thì bác bỏ giả H0 nghĩa là có sự tương quan chéo giữa các công ty chứng khoán, mô hình REM sẽ được ưu tiên sử dụng.
Kiểm định F-test
Giả thuyết H0: không có sự khác biệt giữa các đối tượng quan sát
Khi kết quả kiểm định có Prob (F-stat) nhỏ hơn 0.05 thì bác bỏ giả thuyết H0
nghĩa là có sự khác biệt giữa các đối tượng là các công ty chứng khoán hoặc các thời điểm khác nhau, mô hình FEM sẽ được lựa chọn trong trường này để giải thích mối tương quan giữa các biến.
Kiểm định Hausman
Giả thuyết H0: không có sự tự tương quan giữa sai số đặc trưng của các đối tượng với các biến độc lập
Khi kết quả kiểm định có p-value Hausman nhỏ hơn 0.05 thì bác bỏ giả thuyết H0 nghĩa là có sự tự tương quan giữa sai số đặc trưng của các đối tượng với các biến độc lập thì ước lượng tác động cố định là phù hợp hơn so với ước lượng tác động ngẫu nhiên. Ngược lại, khi chưa đủ cơ sở để bác bỏ giả thuyết H0 thì không bác bỏ được sự tương quan giữa sai số và biến độc lập thì ước lượng tác động cố định không còn phù hợp và ước lượng tác động ngẫu nhiên sẽ thay thế.
Tuy nhiên, REM và FEM chỉ thực hiện được ở mô hình bảng tĩnh, trường hợp tồn tại tác động cố định riêng lẻ trong mô hình bảng động tuyến tính (biến trễ của biến phụ thuộc được sử dụng như là biến giải thích) thì không thể sử dụng REM hoặc FEM để ước lượng. Thật vậy, uớc lượng dữ liệu bảng luôn tồn tại hai vấn đề cần kiểm định liên quan đến phần dư của mô hình là sự tương quan của biến độc lập với tác động riêng lẻ và sự tương quan của biến độc lập với thành phần sai số nhiễu. Sự tồn tại của một và/hoặc hai vấn đề này làm cho kết quả ước lượng OLS bị thiên chệch hoặc không hiệu quả. Có thể giải quyết bằng cách sử dụng ước lượng tác động cố định để loại bỏ các thành phần tác động riêng lẻ và sử dụng ước lượng tác động ngẫu
nhiên để kiểm soát hiện tượng tương quan với sai số nhiễu. Nhưng với mô hình bảng động tuyến tính, sử dụng sai phân để loại bỏ tác động cố định nhưng không loại bỏ được hiện tượng tương quan sai số nhiễu vì biến trễ luôn tương quan với phần dư của mô hình, do đó giả thuyết của mô hình REM cũng bị vi phạm. Đặc biệt, khi mô hình xuất hiện vấn đề nội sinh thì không những Pooed OLS mà còn REM, FEM đều không cho ra các ước lượng hiệu quả, thậm chí mô hình bị xác định sai. Đây là một trong những giả thuyết mà rất ít nghiên cứu thực hiện khi sử dụng các mô hình này để ước lượng. Có khá nhiều nguyên nhân làm mô hình bị hiện tượng nội sinh, một trong những nguyên nhân của hiện tượng này là biến trễ của biến phụ thuộc được sử dụng như là một biến độc lập trong mô hình (mô hình Dynamic Panel Data). Trong bài, luận văn tiến hành kiểm định vấn đề nội sinh như sau: tiến hành hồi quy mô hình 1 nhưng thay biến phụ thuộc là biến trễ của chính biến phụ thuộc (suất sinh lời vượt trội), sau đó lấy phần dư (resid) và hồi quy lại mô hình 1 có bổ sung thêm phần dư nhằm kiểm định sự tác động của phần dư đến biến phụ thuộc, trong trường hợp nếu hệ số hồi quy của phần dư có ý nghĩa thống kê thì kết luận mô hình bị hiện tượng nội sinh và ngược lại. Đây là một trong những cơ sở quan trọng mà phướng pháp ước lượng System GMM được sử dụng để khắc phục các khuyết điểm mà ba mô hình Pooled OLS và FEM và REM không thể giải quyết được. Chính vì vậy mà kết quả ước lượng sẽ cho ra các hệ số đáng tin cậy và hiệu quả cao.
Phương pháp ước lượng GMM được Lars Peter Hansen giới thiệu lần đầu tiên vào năm 1982 trong bài viết “Large Sample Properties of Generalized Methods of Moments Estimators”. Rất nhiều phương pháp ước lượng phổ biến như OLS, GLS, MLE, 2SLS….chỉ là phương trình đặt biệt của GMM. Phương pháp GMM bao gồm hai dạng ước lượng thay thế lẫn nhau là Difference GMM (DGMM) được phát triển bởi Arellano và Bond năm 1991 và System GMM (SGMM) được nhóm tác giả Arellano và Bover (1995) & Blundell và Bond (1998) xây dựng theo cách tiếp cận mới dựa trên giả định khác so với DGMM. Đặc trưng của DGMM là chuyển đổi dữ liệu bằng cách sử dụng phương pháp sai phân để loại bỏ các tác động cố định của các quan sát, sau đó sử dụng biến trễ của biến phụ thuộc đóng vai trò là biến đại diện cho biến sai phân phụ thuộc trong khi đặc trưng của SGMM là thay biến phụ thuộc và các biến nội sinh giống nhau khác bằng biến không tương quan với các tác động cố định,
đồng thời cho phép đưa vào các biến giải thích không thay đổi theo thời gian mà những biến này không hiện diện trong DGMM.
Ước lượng SGMM đòi hỏi nhiều giả định hơn và nếu đáp ứng được các giả định này thì SGMM sẽ cho ra ước lượng hiệu quả hơn. Trên thực tế, nhiều công trình nghiên cứu cũng khẳng định SGMM có nhiều lợi ích hơn so với DGMM vì SGMM được phát triển từ DGMM khắc phục được một số hạn chế mô hình như hiện diện được biến không thay đổi theo thời gian (trong DGMM khi sử dụng sai phân thì những biến có tính chất không thay đổi theo thời gian sẽ biến mất), đồng thời các nghiên cứu cũng cho thấy kết quả ước lượng từ SGMM hiệu quả hơn và vững hơn so với DGMM (Bond, 2002; Roodman, 2006; Baum, 2006; Roodman, 2009; Efendic và cộng sự, 2009). Do đó trong bài nghiên cứu, phương pháp System GMM sẽ được ưu tiên sử dụng.
Bất cứ mô hình nào cũng đều có những kiểm định riêng, với GMM cần kiểm định giả thuyết liên quan đến sự tư tương quan của phần dư, tính phù hợp của biến đại diện, tính vững của hệ số ước lượng để đảm bảo tính hiệu quả và độ tin cậy mô hình.
Kiểm định Arellano và Bond
Ước lượng GMM yêu cầu có sự tự tương quan bậc một và không có sự tự tương quan bậc hai của phần dư (Arellano và Bond, 1991).
Giả thuyết H0: không có sự tự tương quan bậc một (kiểm định AR1) hoặc bậc hai (kiểm định AR2) của phần dư.
Như vậy, để kết quả phù hợp thì cần bác bỏ giả thuyết H0 ở kiểm định AR1 và chấp nhận giả thuyết H0 ở kiểm định AR2. Thông thường, p-value AR1 phải nhỏ hơn 0.05 và p-value AR2 lớn hơn 0.1 thì mới kết luận được biến công cụ được sử dụng phù hợp.
Kiểm định F-test
Mục đích của kiểm định nhằm kiểm tra tính phù hợp của mô hình. Giả thuyết H0: tấc cả các hệ số ước lượng đều bằng 0.
phù hợp và ngược lại nếu Prob (F-stat) lớn hơn 0.05 thì không có cơ sở bác bỏ giả thuyết H0, kết luận mô hình không phù hợp và không thể sử dụng kết quả để giải thích sự biến động của các nhân tố beta, skewness và kurtois đến lợi nhuận cổ phiếu.
Kiểm định Sargan hoặc Hansen
Mục đích nhằm kiểm định giới hạn các ràng buộc quá mức. Giả thuyết H0: biến công cụ được xác định đúng.
Để chấp nhận giả thuyết H0 thì một trong hai kiểm định này phải có ý nghĩa thống kê. Thông thường thống kê Sargan hoặc Hansen hoàn hảo khi giá trị p- value của kiểm định này bằng 1, giá trị có thể chấp nhận được theo lý thuyết là p-value lớn hơn 0.05 hoặc 0.1. Tuy nhiên theo Roodman (2009) thì giá trị p-value tối thiểu phải bằng 0.25.
CHƯƠNG 4: KẾT QUẢ NGHIÊN CỨU VÀ THẢO LUẬN
Chương 4 sẽ trình bày các kết quả và thảo luận của nghiên cứu. Cụ thể, luận văn sẽ khái quát lại mẫu nghiên cứu để có cái nhìn tổng quan về tình hình thị trường; tiến hành phân tích thực nghiệm bằng hồi quy các mô hình với các phương pháp khác nhau. Dựa trên những kiểm định cần thiết như kiểm định lựa chọn mô hình, kiểm định tự tương quan, đa cộng tuyến, phương sai thay đổi, nội sinh…để lựa chọn mô hình tốt nhất phục vụ giải thích kết quả hồi quy. Tiếp theo, luận văn sẽ thảo luận kết quả nghiên cứu về khả năng giải thích của các nhân tố rủi ro đặc biệt là hai nhân tố rủi ro moment bậc cao skewness và kurtosis tới suất sinh lời vượt trội cổ phiếu.