CHƯƠNG 3 : DỮ LIỆU VÀ PHƯƠNG PHÁP NGHIÊN CỨU
3.3. Dữ liệu và phương pháp nghiêncứu
Dữ liệu nghiên cứu của luận văn được thu thập từ 390 công ty cổ phần Việt Nam niêm yết trên Sở giao dịch chứng khoán Thành phố Hồ Chí Minh và Sở giao dịch chứng khoán Hà Nội từ năm 2008 đến năm 2012. Sau khi xử lý dữ liệu loại bỏ 162công ty, cịn lại 228 cơng ty đưa vào phân tích. Dữ liệu của các công ty được thu thập từ báo cáo thường niên, báo cáo tài chính, các thơng tin được cơng bố chính thức,
website của các cơng ty, website của các sở giao dịch chứng khốn (nguồn do Cơng ty cổ phần Tài Việt cung cấp). Các biến phụ thuộc, biến độc lập, biến kiểm soát được tổ chức thành dữ liệu bảng (panel data) theo từng công ty, phân bố theo từng năm.
Để trả lời cho câu hỏi nghiên cứu và kiểm chứng các giả thiết nghiên cứu luận văn sử dụng dữ liệu bảng (panel data) với trình tự thực hiện các ước lượng như sau: Thống kê mơ tả và trình bày dữ liệu, phân tích tương quan, ước lượng mơ hình với sự hỗ trợ của phần mềm Stata 11.
Thống kê mô tả
Thống kê mô tả được sử dụng nhằm mơ tả những đặc tính cơ bản của dữ liệu thu thập và đưa ra những nhận định ban đầu về chuỗi dữ liệu nghiên cứu, cụ thể luận văn sẽ mơ tả dữ liệu dựa trên các tiêu chí: giá trị trung bình, giá trị lớn nhất, giá trị nhỏ nhất, độ lệch chuẩn, trung vị .
Phân tích tương quan
Phân tích tương quan được sử dụng để xem xét mối quan hệ giữa các biến độc lập và biến phụ thuộc. Hệ số tương quan (Pearson) được đưa ra đầu tiên bởi Francis và Galton theo đó hệ số tương quan được tính bằng cách chia hiệp phương sai của biến với tích độ lệch chuẩn của chúng. Luận văn xây dựng ma trận hệ số tương quan kèm theo mức ý nghĩa nhằm đánh giá bước đầu về mối tương quan giữa các biến.
Phương pháp ước lượng mơ hình và kiểm định mơ hình
Phương pháp ước lượng mơ hình
Trong khi phân tích tương quan nhằm xem xét các biến nghiên cứu có mối quan hệ với nhau hay khơng thì phân tích hồi quy được dùng để đo lường mức độ ảnh hưởng của các biến độc lập với các biến phụ thuộc qua đó cho biết chiều hướng tác động của từng biến độc lập đến biến phụ thuộc. Phương pháp này cho phép luận văn đưa ra bằng chứng thực nghiệm để trả lời cho câu hỏi nghiên cứu của luận văn và kiểm chứng các giả thiết nghiên cứu. Theo đó để ước lượng mơ hình luận văn thực hiện ước lượng theo ba cách: Pooling, Random effect model (mơ hình hiệu ứng ngẫu nhiên), Fixed effect model (mô hình hiệu ứng cố định). Lý do của việc ước lượng thêm hai mơ hình Fixed effect và Random effect là:
- Thứ nhất, ước lượng Pool thì đơn giản có thể dẫn đến việc biến độc lập khơng phản ánh đúng mối quan hệ giữa các biến độc lập với biến phụ thuộc. Và do trong mơ hình có nhiều biến giải thích nên có thể xảy ra hiện tượng tự tương quan giữa các biến độc lập. Và khi có điều này xảy ra sẽ dẫn đến ước lượng theo Pool sẽ khơng cịn hiệu quả. Do đó cần có một mơ hình ước lượng tốt hơn Pool. Mặt khác để xem xét đặc điểm riêng của từng công ty trong mẫu nghiên cứu do có những thuộc tính chúng ta khơng thể quan sát được bằng giá trị thì lúc này mơ hình phù hợp hơn so với Pool là Fixed effect model. Theo đó mơ hình này sẽ xem xét được đặc điểm riêng của từng công ty trong mẫu nghiên cứu theo sự thay đổi của hệ số chặn tuy nhiên sự thay đổi này là cố định theo thời gian và để xem xét sự khác nhau đó thì chúng ta có thể dùng biến giả. Do mơ hình chỉ quan tâm đến những khác biệt mang tính cá nhân đóng góp vào mơ hình nên nó khơng xảy ra hiện tượng tự tương quan. Một minh hoạ cho mơ hình này như sau:
𝑌𝑖𝑡 = 𝛽1𝑖 + 𝛽2𝑋2𝑖𝑡 + 𝛽3𝑋3𝑖𝑡 + ⋯ + 𝛽𝑘𝑋𝑘𝑖𝑡 + 𝑢𝑖𝑡
Trong đó𝛽1𝑖: thể hiện cho sự khác nhau giữa các cơng ty nghiên cứu nhưng sự khác nhau đó khơng thay đổi theo thời gian. Khi đó 𝛽1𝑖 được triển khai theo các biến giả để xem xét những đặc điểm riêng biệt của từng đối tượng nghiên cứu.
- Thứ hai, khi những đặcđiểm riêng biệt giữa các đối tượng nghiên cứu được giả sử là ngẫu nhiên và khơng tương quan đến các biến giải thích thì chúng ta có thể dùng mơ hình hiệu ứng ngẫu nhiên (Random effect model). Cách tiếp cận của mơ hình này là dựa trên phần dư. Mơ hình tác động ngẫu nhiên được thể hiện như sau:
𝑌𝑖𝑡 = 𝛽1𝑖 + 𝛽2𝑖𝑡 + 𝛽3𝑖𝑡 + ⋯ + 𝛽𝑘𝑋𝑘𝑖𝑡+ 𝑢𝑖𝑡 𝛽1𝑖 = 𝛽1 + 𝜀𝑖 𝑌𝑖𝑡 = 𝛽1+ 𝛽2𝑖𝑡 + 𝛽3𝑖𝑡+ ⋯ + 𝛽𝑘𝑋𝑘𝑖𝑡+ 𝜀𝑖 + 𝑢𝑖𝑡 𝑤𝑖𝑡 = 𝜀𝑖+ 𝑢𝑖𝑡 𝐸(𝑤𝑖𝑡) = 0 𝑣𝑎𝑟(𝑤𝑖𝑡) = 𝜎𝜀2+ 𝜎𝑢2 𝑐𝑜𝑣 (𝑤𝑖𝑡, 𝑤𝑖𝑠) = 𝜎𝜀 2 𝜎𝜀2+ 𝜎𝑢2
𝜀𝑖~𝑁 (0, 𝜎𝜀2)𝑢𝑖~𝑁(0, 𝜎𝑢2) 𝐸(𝜀𝑖𝑢𝑖𝑡) = 0 𝐸(𝜀𝑖𝜀𝑗) = 0
Trong đó, 𝑤𝑖𝑡 là phần dư tổng hợp gồm hai thành phần 𝜀𝑖 là sai số thành phần đại diện cho các đặc điểm riêng của từng công ty, 𝑢𝑖𝑡 là sai số thành phần kết hợp khác nhau của các đặc điểm riêng của các công ty và theo thời gian. 𝛽1 là giá trị trung bình của tất cả các hệ số chặn của các công ty nghiên cứu và sai số thành phần 𝜀𝑖 đại diện cho chênh lệch ngẫu nhiên của từng hệ số chặn của các công ty này với giá trị trung bình.
Như vậy vấn đề đặt ra là mơ hình nào là phù hợp cho nghiên cứu. Để trả lời câu hỏi này luận văn sẽ sử dụng kiểm định Hausman (Hausman, 1978) nhằm so sánh mơ hình Fixed effect và Random effect và kiểm định Redundant fixed Effects Tests nhằm so sánh sự phù hợp giữa hai mơ hình Pool và Random effect.
Phương pháp kiểm định các hệ số hồi quy, sự phù hợp của mơ hình
Trong phần này luận văn sử dụng kiểm định t (t-test) để đánh giá sự phù hợp của các hệ số hồi quy. Các mức ý nghĩa thường được sử dụng trong thống kê là 1%, 5% và 10% (hay nói cách khác là độ tin cậy 99%, 95% và 90%). Đối với nghiên cứu này luận văn chọn mức ý nghĩa là 5% để đánh giá mức độ phù hợp của các hệ số hồi quy, tức biến độc lập chỉ xem là có tác động đến biến phụ thuộc khi mà hệ số hồi quy có P- value nhỏ hơn 5%. Tuy nhiên, trong một số trường hợp hệ số hồi quy có P-value lớn hơn 5% nhưng nhỏ hơn 10% vẫn được luận văn lưu ý
Để kiểm tra sự phù hợp của mơ hình hồi quy luận văn sử dụng kiểm định F với giả thuyết H0 là R2 =0. Mức ý nghĩa luận văn chọn là 5% theo đó nếu giá trị P-value <5% thì bác bỏ giả thuyết H0 nên mơ hình là phù hợp