CHƯƠNG 3 : PHƯƠNG PHÁP NGHIÊN CỨU VÀ MÔ TẢ DỮ LIỆU
3.4 PHƯƠNG PHÁP ƯỚC LƯỢNG
3.1.1 Kỹ thuật panel data
Để thực hiện việc đo lường ảnh hưởng của cấu trúc vốn lên TSSL bất thường của công ty tác giả lựa chọn kỹ thuật phân tích dữ liệu bảng hay cịn gọi là kỹ thuật phân tích panel data. Phương pháp panel data được định nghĩa là cách thức phân tích mối quan hệ kinh tế trong dữ liêu chéo (cross-section) theo thời gian (time-demension) (Greene, 2003). Đặc trưng quan trọng nhất của phương pháp panel data là nó bao quát cả những ảnh hưởng của thời gian, và sự khác biệt trong các chủ thể chéo (Wooldridge,2002). Một trong những lý do chính để tác giả chọn phương pháp panel data mà không phải là các phương pháp khác là vì phương pháp này có thể giúp kiểm soát những ảnh hưởng riêng từ các yếu tố khác khơng có trong mơ hình nghiên cứu. Hơn nữa, việc thu thập dữ liệu tài chính trên sàn chứng khốn thơng thường là dữ liệu chéo theo thời gian, có nghĩa là ta quan sát một cơng ty qua nhiều năm, như vậy có thể quan sát được sự thay đổi từ một chủ thể nhất định theo thời gian và phương pháp panel data có thể phục vụ cho mục đích đó phù hợp hơn so với mơ hình khác.
Trong nghiên cứu tài chính, phương pháp panel data được đánh giá cao hơn phương pháp dữ liệu chéo hoặc chuỗi thời gian vì nhiều lý do. Thứ nhất, trong phân tích panel data chúng ta khắc phục được hiện tượng thiếu quan sát, một điều rất thường gặp trong nghiên cứu dữ liệu chéo hoặc chuỗi thời gian. Một chủ thể được quan sát qua nhiều thời điểm tạo ra nhiều quan sát hơn để kiểm định mơ hình (Sun và Parikh, 2001). Thứ hai, vì kỹ thuật panel data làm giảm bớt sự tương tác giữa các biến nên tham số hồi quy sẽ đáng tin cậy hơn (Hsiao, 1999). Điều này cho phép mơ hình có thể khai thác được nhiều thơng tin hơn so với các mơ hình khác. Thứ ba, phương pháp phân tích panel data trong một số trường hợp đặc biệt khi mơ hình trở nên phức tạp thì phương pháp cho thấy kết quả tốt hơn so với dữ liệu chéo hoặc chuỗi thời gian (Gujarati, 2003). Và một số ưu điểm khác của panel data có thể kể ra như:
giảm bớt việc thất thoát dữ liệu, giảm hiện tượng đa cộng tuyến, tăng mức độ ý nghĩa thống kê của mơ hình (Baltagi,2001 ; Balestra,1992).
Sự hiệu dụng của phương pháp panel data được kể ra như trên phần lớn xuất phát từ những giả định của sai số hồi quy và tính bất ổn của các hệ số trong mơ hình hồi quy. Giả sử ta có mơ hình hồi quy tổng qt của biến phụ thuộc Y và biến độc lập X như sau:
Yit = αit + βit Xit + eit (i)
Trong đó, ký hiệu i đại diện cho chủ thể quan sát thứ i, và t đại diện cho thời điểm t. Như vậy trong mơ hình trên ta cho phép những ảnh hưởng từ biến độc lập trong mơ hình có thể thay đổi theo thời gian và theo chủ thể nghiên cứu. Để làm được điều này trong thực tế thường rất phức tạp, để đơn giản hóa người ta thường tập trung vào 3 mơ hình con của phương pháp này.
Thứ nhất là mơ hình hỗn hợp (Pooled model) có thể diễn tả như sau: Yit = α + β Xit + eita (ii)
Mơ hình pool là mơ hình đơn giản nhất với giả định rằng ảnh hưởng từ các yếu tố trong mơ hình sẽ cố định theo khơng gian và thời gian – các chỉ số i và t trên các hệ số đã được lược bỏ. Sai số trong mơ hình sẽ khơng có hiện tượng tương quan theo khơng gian và thời gian. Mơ hình pool được ưa thích sử dụng bằng cách đơn giản là trộn lẫn tất cả quan sát theo không gian và thời gian để tạo nên mẫu lớn. Ví dụ ta có 10 chủ thể quan sát trong 10 năm nghĩa là mơ hình pool sẽ hồi quy trên 10x10=100 quan sát. Tuy nhiên, giả định của mơ hình Pool thường khơng tồn tại trong thực tế, một cách để phát hiện là chúng ta dùng kiểm định phương sai thay đổi của White hoặc Glejser. Nếu tồn tại phương sai thay đổi thì chúng ta phải thay thể bằng 2 mơ hình khác được trình bày dưới đây.
Yit = αi + βXit + eit (iii)
Trong mơ hình này, các ảnh hưởng từ biến quan sát được giả định là thay đổi theo từng chủ thể nghiên cứu và được thể hiện trên sự thay đổi của hệ số chặn α. Hệ số chặn trong trường hợp này đại diện cho tất cả những yếu tố không quan sát được ảnh hưởng lên biến Y, tuy nhiên trong mơ hình này ảnh hưởng từ các yếu tố theo thời gian được giả định là khơng đổi ở từng chủ thể nghiên cứu vì vậy được gọi là hiệu ứng cố định (fixed effect). (Green, 2003)
Mơ hình thứ ba là mơ hình hiệu ứng ngẫu nhiên (Random effect) được mô tả như sau:
Yit = (α + ui ) + β Xit + eit
Trong mơ hình này, ảnh hưởng từ các đặc điểm riêng có của chủ thể nghiên cứu khơng cịn cố định nữa mà sẽ mang tính chất ngẫu nhiên (random) được thể hiện qua hệ số ui ~ (0, σu2). Khi số chủ thể nghiên cứu tăng lên thì mơ hình hiệu ứng cố định sẽ bị giảm đi mức ý nghĩa thống kê do số lượng tham số lớn, mơ hình random effect sẽ khắc phục được hiện tượng này. Mơ hình này giả định rằng, ảnh hưởng của các đặc điểm riêng có sẽ tác động ngẫu nhiên lên biến nghiên cứu ở từng chủ thể. (Tunay, 2009)
3.4.2 Kiểm định đa cộng tuyến
Khi sử dụng hồi quy OLS đa biến, phương sai của các tham số ước lượng βj được tính theo cơng thức sau:
Var (βj) = 𝜎2
𝑆𝑆𝑇𝑗 (1− 𝑅𝑗2)
Trong đó SSTj là tổng phương sai của biến quan sát xj, Rj2 là hệ số phù hợp khi hồi
quy biến xj theo tất cả các biến độc lập xk cịn lại trong mơ hình. Như vậy khi giữa các biến độc lập x có tương quan với nhau thì hệ số Rj2 lớn và phương sai của các βj
sẽ tăng lên rất cao và khi đó ước lượng OLS khơng cịn là ước lượng hiệu quả nữa. Khi các biến X có tương quan cao ta gọi đây là hiện tượng đa cộng tuyến trong mơ hình. (Wooldridge, 2003)
Như vậy đa cộng tuyến là vấn đề khá quan trọng của hồi quy đa biến khi nó ảnh hưởng trực tiếp lên tính hiệu quả của các ước lượng. Vì vậy trước khi kiểm định mơ hình chúng ta cần kiểm tra mối tương quan giữa các biến. Trong nghiên cứu thực nghiệm, khi hệ số tương quan giữa 2 hoăc nhiều biến tăng lên bao nhiêu thì ảnh hưởng đến tính hiệu quả của ước lượng vẫn cịn nhiều tranh cãi. Tuy nhiên theo Wooldridge (2003) thì các nhà kinh tế lượng cho rằng khi hệ số tương quan giữa 2 biến lớn hơn 0.9 thì vấn đề “đa cộng tuyến” mới thực sự tác động mạnh đến tính hiệu quả của ước lượng, nếu nhỏ hơn thì ta có thể bỏ qua vấn đề này.
3.4.3 Kiểm định phương sai thay đổi
Trong 3 mơ hình panel data tác giả đề cập gồm: Pool, Fixed effect và Random effect thì mơ hình Pool trong thực tế khó áp dụng nhất vì có hiện tượng phương sai thay đổi (Heteroskedasticity). Phương sai thay đổi là việc sai số mơ hình hồi quy có phương sai không đồng nhất giữa các chủ thể nghiên cứu (cơng ty), hay nói cách khác cịn tồn tại nhiều yếu tố khác tác động đến biến phụ thuộc nhưng chúng ta chưa tìm được.
Khi trong mơ hình nghiên cứu tồn tại hiện tượng phương sai thay đổi sẽ làm phương sai của hệ số ước lượng, Var(βj), khơng cịn là ước lượng đúng (unbiased) nữa. Vì tất cả thống kê t trong mơ hình đều dựa trên phương sai của βj nên các thống kê t sẽ khơng cịn hiệu lực cho việc thực hiện kiểm định thống kê. Vì thế khơng thể khẳng định rằng các ước lượng OLS của mơ hình Pool là ước lượng bình phương bé nhất tốt nhất (BLUE) nữa. (Wooldridge,2003).
3.4.4 Kiểm định Hausman test (FE hay RE)
Trong mơ hình FE, hệ số ảnh hưởng riêng αi có thể có tương quan với biến giải thích Xi, cịn mơ hình RE thì khơng có tương quan. Mơ hình FE được áp dụng khá nhiều trong nghiên cứu thực nghiệm, tuy nhiên một trong những khuyết điểm lớn của FE đó là khi panel data có số chủ thể chéo (N) lớn và thời gian (T) quan sát nhỏ. Khi đó người ta sẽ dùng phương pháp de-meaning data để bỏ qua việc phải đưa thêm nhiều biến giả vào mơ hình. Mà điều này thì khơng thể áp dụng nếu trong mơ hình có biến khơng đổi theo thời gian, vì khi lấy giá trị biến trừ cho trung bình của nó thì giá trị ln bằng 0. Trong những trường hợp như vậy thì mơ hình RE tỏ ra có ưu thế hơn. Mặc dù vậy để sử dụng mơ hình RE thì ta cần có giả định quan trọng là hệ số riêng có của từng chủ thể αi độc lập với các biến giải thích xi. Về lý thuyết khi so sánh thì mơ hình RE gần với mơ hình Pool hơn, tuy nhiên mơ hình RE thì mang tính tổng qt hơn so với Pool.
CHƯƠNG 4 : KẾT QUẢ NGHIÊN CỨU
4.1 Kết quả thống kê mô tả
Từ mẫu nghiên cứu chúng ta tính ra được thống kê mơ tả của biến CAAR và biến địn bẩy tài chính qua các năm như sau như sau:
Bảng 4.1: Thống kê mô tả biến CAAR
Descriptive Statistics for CAAR
Sample: 2007 2012
Included observations: 338
NAM Mean Median Max Min. Std. Dev. Skew. Kurt. Obs. 2007 -85.10181 -135.0117 409.6790 -188.2099 126.3613 2.136445 7.886625 36 2008 2.226611 -3.311598 97.20469 -20.38677 22.73039 2.051916 8.804276 41 2009 8.782786 -6.824083 569.4097 -97.13788 101.1262 3.350283 19.18244 52 2010 -24.00295 -28.98224 62.46904 -65.17189 26.37261 1.041367 4.076777 66 2011 -9.292787 -12.53972 97.55374 -63.65083 31.19024 1.063464 4.612935 69 2012 -0.642788 -7.515596 139.8379 -79.45073 41.80053 1.006079 4.762836 74 All -14.16755 -14.37136 569.4097 -188.2099 68.49574 2.259554 22.19901 338
Bảng 4.2: Thống kê mô tả biến GEAR
Descriptive Statistics for GEAR
Sample: 2007 2012
Included observations: 430
NAM Mean Median Max Min. Std. Dev. Skew. Kurt. Obs.
2007 39.69111 35.48000 86.32000 1.500000 20.84573 0.428119 2.295929 63 2008 42.80931 42.34000 89.01000 5.100000 22.87401 0.111706 1.894580 72 2009 45.36548 44.21000 89.22000 2.920000 21.04465 0.094462 2.246762 73 2010 42.51324 41.56500 80.07000 0.840000 18.33545 -0.045850 2.096354 74 2011 44.39797 45.12000 81.81000 2.920000 19.77852 -0.088424 2.161971 74 2012 44.11189 41.80000 82.97000 3.900000 20.05256 0.010212 2.069694 74 All 43.23302 42.31500 89.22000 0.840000 20.47006 0.088248 2.119639 430 Nguồn: Tác giả tự tính tốn.
Từ Bảng 4.1 chúng ta thấy rằng: nhìn chung các cổ phiếu trong mẫu nghiên cứu có
xu hướng giảm giá trong giai đoạn 2007-2012, trong đó giai đoạn giá giảm mạnh nhất là năm 2007 khi TSSL bất thường tích lũy bị âm 85.1% và giá khơi phục nhẹ vào năm 2009 khi TSSL bất thường tích lũy trung bình đạt 8.7%, tính trung bình giai đoạn nghiên cứu 2007-2012 thì các cổ phiếu giảm giá, TSSL bất thường tích lũy trung bình là âm 14% cho tồn mẫu. Mức độ biến động giá cổ phiếu trong năm 2007 và 2009 là rất cao với sai số chuẩn lần lượt là 126% và 101%. Xu hướng biến động TSSL bất thường tích lũy của các cổ phiếu trong mẫu không ổn định qua các năm, chia mẫu nghiên cứu thành 2 giai đoạn: giai đoạn biến động mạnh từ 2007- 2009 và giai đoạn biến động thấp hơn từ 2010-2012.
Trong khi đó từ Bảng 4.2 chúng ta thấy rằng địn bẩy tài chính của các cơng ty có xu hướng biến động nhẹ và có trung bình hội tụ về một giá trị ổn định – đạt tỷ lệ nợ khoảng 44%. Tuy vậy, cấu trúc vốn của các công ty ở những ngành khác nhau thì có sự khác biệt tương đối rõ ràng. Theo Bảng 4.3 thì xét về trung bình ngành xây
dựng sử dụng đòn bẩy nhiều nhất với tỷ lệ tổng nợ xấp xỉ 56% tổng tài sản, kế tiếp là bất động sản và ngành bán buôn bán lẻ với tỷ lệ lần lượt là 52% và 50%. Ngành sử dụng ít địn bẩy nhất là nơng nghiệp với tỷ lệ trung bình là 27%. Và mức độ khác nhau (được đo lường bằng độ lệch chuẩn) trong địn bẩy tại các cơng ty trong cùng một ngành thể hiện khá đồng đều trong mẫu nghiên cứu, chỉ có ngành nơng nghiệp thì tỷ lệ địn bẩy giữa các cơng ty là tương đối giống nhau nhất nếu so với các ngành còn lại.
Bảng 4.3: Thống kê mơ tả về địn bẩy giữa các ngành.
Descriptive Statistics for GEAR Categorized by values of NGANH Sample: 2007 2012
Included observations: 430
NGANH Mean Median Max Min. Std. Dev. Skew. Kurt. Obs.
Ban buon ban le 50.26576 53.68000 85.26000 12.46000 19.30949 -0.314653 2.160541 59
Bat dong san 52.39833 53.91000 81.70000 24.52000 15.77154 0.102537 2.050969 48
Khai khoang 36.07094 34.13000 89.22000 0.840000 21.23513 0.545372 2.785018 53 Nang luong 40.61491 45.02000 72.06000 1.500000 20.37405 -0.446137 2.134706 53 Nong nghiep 27.23476 26.31500 51.63000 9.420000 10.71796 0.343096 2.305653 42 SX Che bien 33.04250 28.19500 69.86000 9.290000 18.55022 0.495261 1.835778 60 Van tai 47.10345 42.80500 89.20000 15.69000 19.55099 0.312372 1.939295 58 Xay dung 55.90596 57.64000 88.70000 18.61000 17.71539 -0.234776 2.432221 57 All 43.23302 42.31500 89.22000 0.840000 20.47006 0.088248 2.119639 430
4.2 Kiểm định đa cộng tuyến
Kết quả kiểm tra tương quan giữa các biến được trình bày trong Bảng 4.4. Từ kết quả này, chúng ta thấy được rằng giữa các biến độc lập có mối tương quan với nhau khá thấp, đa số đều thấp hơn 0.7. Như vậy chúng ta có thể nói rằng giữa các biến độc lập khơng có hiện tượng đa cộng tuyến rõ ràng nên chúng ta có thể bỏ qua hiện tượng này.
Bảng 4.4: Hệ số tương quan giữa các biến
Correlation Analysis: Ordinary Sample: 2007 2012
Included observations: 339
Balanced sample (listwise missing value deletion)
Correlation GEAR HI INDUSTR
GEAR INTEREST MTB PE REGULAT ION RISK GEAR 1.000000 HI -0.121159 1.000000 INDUSTRYGEAR 0.357952 -0.149458 1.000000 INTEREST 0.041273 -0.025778 0.040356 1.000000 MTB -0.103415 -0.091505 -0.058415 -0.354859 1.000000 PE 0.182344 -0.063145 0.053529 0.004951 0.016009 1.000000 REGULATION -0.146905 0.686219 0.130277 0.037379 0.026334 -0.072158 1.000000 RISK 0.245128 -0.137197 0.237796 -0.075314 -0.272767 -0.057003 -0.045264 1.000000 Nguồn: tác giả tự tính tốn
4.3 Kiểm định phương sai thay đổi
Để phát hiện hiện tượng phương sai thay đổi tác giả dùng phương pháp kiểm định thông dụng hiện nay là phương pháp của White (1980) và Glejser (1969) để kiểm tra hiện tượng phương sai thay đổi trong mơ hình. Đầu tiên tác giả hồi quy bằng mơ hình Pool, sau đó dùng kiểm định phương sai thay đổi có sẵn trong phần mềm Eviews 6. Các thông số khác được để mặc định trong chương trình. Kết quả được trình bày trong Bảng 4.5.
Bảng 4.5: Kết quả kiểm định phương sai thay đổi
Heteroskedasticity Test: White
F-statistic 2.762750 Prob. F(44,294) 0.0000 Obs*R-squared 99.16518 Prob. Chi-Square(44) 0.0000 Scaled explained SS 131.3561 Prob. Chi-Square(44) 0.0000 Heteroskedasticity Test: Glejser
F-statistic 6.064091 Prob. F(8,330) 0.0000 Obs*R-squared 43.44851 Prob. Chi-Square(8) 0.0000 Scaled explained SS 48.09474 Prob. Chi-Square(8) 0.0000
Nguồn: tác giả tự tính tốn
Cả hai phương pháp kiểm định đều sử dụng giả thiết Không: “Phương sai của sai số mơ hình là đồng nhất”. Theo kết quả kiểm định từ Bảng 4.5 thì ta có giá trị thống kê F từ phương pháp của White và Gleijser lần lượt là 2.76 và 6.06, như vậy với mức ý nghĩa 1% ta có thể bác bỏ giả thiết Khơng. Kết quả của 2 kiểm định đều cho cùng một kết quả là có tồn tại hiện tượng phương sai thay đổi, vì vậy nếu sử dụng mơ hình Pool cho ước lượng khơng cịn đáng tin cậy nữa.
Một trong những lý do có sự xuất hiện của phương sai thay đổi là do trong thực tế mỗi một cơng ty có đặc điểm riêng có khác nhau mà chúng ta chưa thể quan sát, và những đặc điểm đó có thể tác động đến mối quan hệ giữa cấu trúc vốn và TSSL của
cổ phiếu làm phương sai của sai số ở từng cơng ty là khác nhau. Vì thế, như đã trình bày ở phần trên thì trong trường hợp này chúng ta sử dụng mơ hình Fixed Effect hoặc Random Effect là phù hợp hơn vì 2 mơ hình này có tính đến các yếu tố riêng có của từng cơng ty khơng thể quan sát được trong mơ hình.