3.2 .1Mô tả biến
3.2.2 Thu thập dữ liệu
3.2.2.1 Nguồn dữ liệu
Mẫu nghiên cứu bao gồm các cơng ty niêm yết trên sàn giao dịch chứng khốn Thành phố Hồ Chí Minh trong giai đoạn từ năm 2009 đến 2013 theo các tiêu chí: loại bỏ các cơng ty tài chính, bảo hiểm; loại bỏ các doanh nghiệp niêm yết từ năm 2010 trở về sau; loại bỏ các doanh nghiệp khơng có đầy đủ thơng tin cần thu thập. Dữ liệu về tỷ lệ sở hữu nội bộ được thu thập từ báo cáo thường niên và dữ liệu về các tỷ số tài chính được lấy từ báo cáo tài chính (đã kiểm tốn) của các cơng ty. Để hạn chế tác động từ bên ngoài, những cơng ty có Tobin’s q lớn hơn 4.00 được loại bỏ khỏi mẫu. Ngồi ra, vì tác giả chủ yếu tập trung vào các mối quan hệ giữa tỷ lệ sở hữu nội bộ và giá trị công ty nên tất cả những cơng ty có tỷ lệ sở hữu nội bộ gần bằng 0 (dưới 0.1%) đã được loại ra khỏi việc phân tích. Tổng cộng có 130 cơng ty đáp ứng tất cả các yêu cầu dữ liệu cho các mục đích phân tích.
Tác giả sử dụng dữ liệu từ các công ty niêm yết trên sàn chứng khốn Hồ Chí Minh để đại diện cho đối tượng khảo sát vì những lý do sau:
- Những cơng ty niêm yết trên sàn chứng khốn thành phố Hồ Chí Minh là những cơng ty cổ phần có quy mơ vốn lớn bao gồm cả cơng ty được cổ phần hóa từ DNNN, các cơng ty cổ phần tư nhân và các công ty cổ phần có vốn đầu tư trực tiếp nước ngồi.
- Dữ liệu có sẵn, dễ thu thập. Khi niêm yết trên sở giao dịch chứng khốn Hồ Chí Minh, các cơng ty này có nghĩa vụ phải cơng khai thơng tin định kỳ, thông tin bất thường và thông tin theo yêu cầu của cơ quan quản lý nhà nước và cơ quan quản lý thị trường theo quy định của pháp luật.
Nguồn thơng tin: báo cáo thường niên, báo cáo tài chính năm (đã kiểm toán), bản cáo bạch và một số thông tin thứ cấp đáng tin cậy được thu thập từ các website của các công ty chứng khoán như: http://finance.vietstock.vn,
http://cafef.vn/, Trang Sở giao dịch HCM: http://www.hsx.vn, Trang tổng cục thống kê Việt Nam: http://www.gso.gov.vn
3.2.2.2 Phương pháp xử lý dữ liệu:
Dữ liệu được xử lý bằng phần mềm Microsoft Excel 2003 và Eview 6. Quy trình xử lý số liệu bao gồm các bước sau: (1) mô tả và trình bày dữ liệu, (2) khảo sát tương quan cặp giữa các biến độc lập và các biến kiểm soát, (3) đánh giá mức độ phù hợp của phương trình tương quan.
Khảo sát tương quan cặp giữa các biến được thực hiện bằng cách thiết lập ma trận hệ số tương quan và xem xét hệ số tương quan cặp giữa các biến độc lập và biến kiểm sốt, tìm ra những cặp biến có hệ số tương quan cao. Để giảm thiểu hiện tượng đa cộng tuyến, tác giả đề xuất tiêu chí loại bỏ một biến ra khỏi phương trình hồi quy đối với các cặp biến có hệ số tương quan cặp lớn hơn hoặc bằng 0,7.
Để chứng minh sự phù hợp của phương trình hồi quy trong việc giải thích bản chất, mối liên hệ giữa các sự vật, hiện tượng tác giả sử dụng hệ số xác định R2. Theo lý thuyết, tính chất của hệ số xác định là 0≤ R2≤1, R2 là độ biến động trong biến đầu ra được giải thích bởi các giá trị đầu vào khác nhau. Hay nói cách khác, giá trị R2 thường được xem như một chỉ thị cho tính “tốt” của mơ hình, khi R2 gần bằng 1, mơ hình phù hợp; khi giá trị này nhỏ, gần bằng 0, mơ hình khơng phù hợp với số liệu. Đối với các hiện tượng kinh tế- xã hội, R2 thường không cao như trong các hiện tượng tự nhiên hoặc kỹ thuật, nằm trong khoảng từ 30% đến 40%. Tiêu chí lựa chọn phương trình hồi quy phù hợp do tác giả đề xuất là R2 lớn hơn hoặc bằng 0,3.
Để lựa chọn các biến giải thích từ phương trình hồi quy theo tiêu chí mức có ý nghĩa thống kê, tác giả sử dụng mức có ý nghĩa 1%, 5%, và 10%.