3. PHƯƠNG PHÁP NGHIÊN CỨU VÀ DỮ LIỆU
3.2. Phương pháp nghiên cứu
3.2.1. Mô hình nghiên cứu
Tương tự như cách tiếp cận của W. He & J. Shen (2014), tác giả xây dựng mô hình để xem xét mối quan hệ giữa 2 biến sở hữu NĐT NN và hiệu quả phản ánh thông tin của giá cả như sau:
𝐈𝐍𝐄𝐅𝐅𝐈𝐂𝐈𝐄𝐍𝐂𝐘𝐢,𝐭 = 𝛃𝟎+ 𝛃𝟏𝐈𝐍𝐄𝐅𝐅𝐈𝐂𝐈𝐄𝐍𝐂𝐘𝐢,𝐭−𝟏 +𝛃𝟐𝐅𝐈𝐎 𝐢,𝐭−𝟏 +𝛃𝟑𝐅𝐈𝐎 𝐢,𝐭−𝟏 +𝛃𝟒𝐃𝐈𝐎 𝐢,𝐭−𝟏 +𝛃𝟓𝐃𝐈𝐎 𝐢,𝐭−𝟏 +𝛃𝟔𝐒𝐈𝐙𝐄 𝐢,𝐭−𝟏 +𝛃𝟕𝐏𝐑𝐈𝐂𝐄 𝐢,𝐭−𝟏 +𝛃𝟖𝐙𝐄𝐑𝐎𝐒 𝐢,𝐭−𝟏 +𝛃𝟗𝐀𝐌𝐈𝐇𝐔𝐃 𝐢,𝐭−𝟏 + 𝛆𝐢,𝐭 (1)
Trong đó:
𝐈𝐍𝐄𝐅𝐅𝐈𝐂𝐈𝐄𝐍𝐂𝐘𝐢,𝐭 đo lường hiệu quả phán ánh thông tin của giá cổ phiếu, dựa trên tỷ số phương sai và hệ số tự tương quan của TSSL cổ phiếu i được tính từ dữ liệu TSSL trong năm tài chính t, bao gồm: 𝑨𝑼𝑻𝑶𝑫 𝒊,𝒕 , 𝑨𝑼𝑻𝑶𝑾 𝒊,𝒕 ,
|𝟏 − 𝑽𝑹(𝟏, 𝟓) 𝒊,𝒕| và |𝟏 − 𝑽𝑹(𝟏, 𝟏𝟎) 𝒊,𝒕|
Lưu ý: Các biến phụ thuộc trong mô hình là nhóm biến gồm 2 biến tỷ lệ phương sai và 2 biến biến tự tương quan. Các biến này nhận giá trị càng lớn, thì hiệu quả phản ánh thông tin càng thấp, tức là thị trường càng kém hiệu quả. Do vậy, cụm từ phi hiệu quả (inefficiency) thay cho cụm từ hiệu quả (efficiency) được sử dụng để thể hiện hàm ý này.
𝐈𝐍𝐄𝐅𝐅𝐈𝐂𝐈𝐄𝐍𝐂𝐘𝐢,𝐭−𝟏 là biến trễ một giai đoạn của biến INEFFICIENCY.
Tác giả sử dụng biến trễ 1 đơn vị của tất cả các biến phụ thuộc trong mô hình bởi vì, tính chuỗi thời gian các các phương pháp đo lường hiệu quả thông tin trong giá cổ phiếu thì tương đối dai dẳng (persistent). Tính hiệu quả của giá cổ phiếu giai đoạn t, có thể có liên quan, hoặc được tạo ra bởi tính hiệu quả của giai đoạn trước đó (t-1) khi mà các NĐT NN có thể tiến hành tiếp tục đầu tư vào các cổ phiếu dựa trên các quyết định từ giai đoạn (t-1) trước đó.
𝐅𝐈𝐎 𝐢,𝐭−𝟏 và 𝐃𝐈𝐎 𝐢,𝐭−𝟏 tương ứng là là tỷ lệ (%) sở hữu của NĐT NN và NĐT tổ
chức trong nước của doanh nghiệp i, tại thời điểm cuối năm tài chính (t-1).
𝐅𝐈𝐎 𝐢,𝐭−𝟏 và 𝐃𝐈𝐎 𝐢,𝐭−𝟏 tương ứng là trị tuyệt đối của sự thay đổi trong FIO và DIO của doanh nghiệp i tại 2 thời điểm đầu và cuối năm tài chính (t-1).
𝐒𝐈𝐙𝐄 𝐢,𝐭−𝟏 là logarit tự nhiên (logarit nêpe) của vốn hóa thị trường của doanh nghiệp i tại thời điểm cuối năm tài chính (t-1).
𝐏𝐑𝐈𝐂𝐄 𝐢,𝐭−𝟏 là logarit tự nhiên (logarit nêpe) của giá đóng cửa của cổ phiếu i tại thời điểm cuối năm tài chính (t-1).
𝐙𝐄𝐑𝐎𝐒 𝐢,𝐭−𝟏 là tỷ lệ (%) của số ngày giao dịch không có biến động giá / số ngày giao dịch trong năm (số ngày có TSSL =0) của doanh nghiệp i trong năm tài chính (t-1).
𝐀𝐌𝐈𝐇𝐔𝐃 𝐢,𝐭−𝟏 là tỷ số thanh khoản Amihud trong năm tài chính (t-1), được tính bằng giá trị tuyệt đối của tỷ lệ giữa TSSL theo ngày của doanh nghiệp i trên khối lượng giao dịch, nhân cho 100.000 (làm mượt dữ liệu)
Trong nghiên cứu này, các biến độc lập được sử dụng ở giai đoạn (t-1), trễ một giai đoạn so với các biến phụ thuộc (giai đoạn t) nhằm giảm tác động tiềm năng của sự thay đổi của các biến hiệu quả giá đồng thời lên các biến giải thích. Đây cũng là cách mà Boehmer & Kelley (2009) và W. He & J. Shen (2014) đã sử dụng. Cách tính từng biến và nhóm biến được tác giả trình bày cụ thể ở phần tiếp theo và phương trình (1) được hồi quy theo các phương pháp sau đây.
Thứ nhất, phương trình (1) được hồi quy với phép hồi quy gộp (pool OLS regressions) và sai số (standard errors) được điều chỉnh theo 2 tùy chọn cluster theo doanh nghiệp và theo năm (year and firrm clustering effects). Thông thường, hồi quy OLS giả định các phần dư phải độc lập với nhau, trong nhiều trường hợp, do đặc thù của mẫu, phần dư trong mỗi nhóm là không độc lập với nhau, để khắc phục vấn đề này, hồi quy với sai số chuẩn mạnh (standard errors- option- robust) cùng tùy chọn cluster. Theo đó, hồi quy với tùy chọn cluster tạo ra các điều chỉnh trong ước lượng để khắc phục các nhược điểm của dữ liệu, cụ thể phân biệt các đối tượng trong mỗi nhóm, ở đây là nhóm doanh nghiệp, hoặc nhóm theo năm. Các
phép hồi quy này được thực hiện trên Stata. Măc dù vậy, Stata chỉ cho phép cluster vào chỉ một nhóm biến, hoặc doanh nghiệp, hoặc là thời gian (năm). Thompson (2006) và Cameron, Gelbach và Miller (2006) gợi ý có thể cho phép cluster vào nhiều nhóm. Theo đó, Petersen (2009) đã kết hợp cả 2 cluster vào một phép hồi quy. Trong nghiên cứu này, tác giả sử dụng sự hỗ trợ của các code được sử dụng như add-in trong Stata từ Petersen (2009).
Thứ hai, khi hồi quy phương trình (1), một vấn đề phát sinh khi thực hiện hồi quy gộp là sự tương quan giữa các quan sát theo cả dữ liệu chéo (cross-sectional) và chuỗi thời gian (time-series). Mặc dù sai số (standard errors) đã được điều chỉnh theo 2 tùy chọn cluster theo doanh nghiệp và theo năm (year and firrm clustering effects) theo Petersen (2009) trong hồi quy gộp. Tác giả tiếp tục giải quyết vấn đề này bằng cách chạy hồi quy chéo (cross-sectional) theo tần suất hàng năm tương tự như Fama và MacBeth (1973). Cụ thể tác giả thực hiện các phép hồi quy chéo theo từng năm và rút ra kết luận từ hệ số ước lượng theo chuỗi thời gian. Tác giả điều chỉnh tương quan chuỗi trong các hệ số hàng năm bằng cách tính sai số chuẩn của hệ số trung bình theo cách Newey và West (1987).
Thứ ba, trong phương trình (1), những vẫn đề nội sinh (endogeneity issue) tiềm năng có thể ngăn cản tác giá suy luận ra mối quan hệ trong bài nghiên cứu. Vấn đề nội sinh này có thể liên quan đến vấn đề bỏ sót biến (omitted variables) trong mô hình hồi quy. Ví dụ, giá cổ phiếu có khuynh hướng hiệu quả hơn đối với những những cổ phiếu có thanh khoản tốt hơn và NĐT NN lại ưa thích những cổ phiếu có thanh khoản. Nếu tác động của thanh khoản lên hiệu quả giá không được nắm bắt đầy đủ trong mô hình hồi quy, hoặc là do các đo lường thanh khoản không phù hợp trong mô hình hồi quy dẫn đến xuất hiện tình trạng tương quan của hiệu quả giá cổ phiếu và sự thay đổi trong tỷ lệ sở hữu của NĐT NN. Để giải quyết vấn đề bỏ sót biến (omitted variable), tác giả thực hiện phép hồi quy với hiệu ứng cố định theo nhóm doanh nghiệp (firm-fixed effects) và do đó, kiểm soát được sự khác nhau trong hiệu quả giá giữa các doanh nghiệp do bản chất của doanh nghiệp ít thay đổi (stable firm natures).
Tóm lại, để giải quyết tất cả các vấn đề vừa trình bày, trong phần thực nghiệm, tác giả tiến hành các phép hồi quy và kiểm định sau đây. Đầu tiên, (i) tác giả thực hiện một phép hồi quy gộp (pool OLS regressions), tiếp theo, (ii) tác giả hồi quy chéo (cross-sectional) theo tần suất hàng năm để giải quyết vấn đề tương quan và cuối cùng, (iii) tác giả thực hiện hồi quy theo hiệu ứng cố định theo nhóm doanh nghiệp (firm-fixed effects) nhằm giải quyết vấn đề nội sinh. Sau đây, để làm rõ hơn các biến trong mô hình 1, phần tiếp theo, tác giá sẽ đi vào phần lập luận và tính các biến trong mô hình.