Mã biến Tên biến Cách đo lường Nghiên cứu đã sử dụng
Biến phụ thuộc AIQ Chất lượng thơng tin kế tốn trên BCTC Mơ hình chất lượng dồn tích của Kothari và cộng sự (2005) Ran và cộng sự (2015) Biến độc lập DUAL Kiêm nhiệm chức vụ chủ tịch HĐQT và CEO Biến định danh: nhận giá trị 1 nếu có sự kiêm nhiệm chức vụ chủ tịch HĐQT và CEO, nhận giá trị 0 nếu ngược lại
Byard và cộng sự, 2006; Kelton và Yang, 2008; Holtz và Sarlo Neto, 2014; Giáp Thị Liên, 2014; Ran và cộng sự, 2015; BIND Tỷ lệ thành viên HĐQT độc lập Số lượng thành viên HĐQT độc lập trên tổng số thành viên HĐQT Byard và cộng sự, 2006; Firth và cộng sự, 2007; Kelton và Yang, 2008; Cho và Rui, 2009; Cascino và cộng sự, 2010; Qin và Wenyao, 2011; Holtz và Sarlo Neto, 2014; Nguyễn Trọng Nguyên, 2015
BSIZE Quy mô
HĐQT Số lượng thành viên của HĐQT
Byard và cộng sự, 2006; Holtz và Sarlo Neto, 2014; Cao Nguyễn Lệ Thư, 2014; Ran và cộng sự, 2015; SUP Tỷ lệ thành viên BKS có chun mơn kế tốn Số lượng thành viên BKS có chun mơn về kế toán trên tổng số thành viên BKS Kelton và Yang, 2008; Ran và cộng sự (2015); Nguyễn Trọng Nguyên, 2015 MANA Tỷ lệ cổ phần của Ban giám đốc
Tỷ lệ cổ phần cá nhân của các thành viên Ban giám đốc
Byard và cộng sự, 2006; Kelton và Yang, 2008; Cho và Rui, 2009; Giáp Thị Liên, 2014; INTER Tỷ lệ cổ phần của nhà đầu tư nước ngoài
Số cổ phần được nắm giữ bởi nhà đầu tư nước ngoài (cá nhân và tổ chức) trên tổng số cổ phần
Firth và cộng sự, 2007; Bagaeva, 2008;
GOV Tỷ lệ cổ phần của Nhà nước Tỷ lệ cổ phần của Nhà nước trên tổng số cổ phần Wang và Wu, 2011; Wang và Yung, 2011; Ran và cộng sự, 2015; Nguyễn Trọng Nguyên, 2015
Biến kiểm soát
LEV Tỷ số nợ trên
tổng tài sản Tỷ lệ nợ phải trả trên tổng tài sản
Cascino và cộng sự, 2010; Qin và Wenyao, 2011; Ran và cộng sự, 2015
ROA Tỷ suất sinh lời trên tài sản
Tỷ lệ lợi nhuận sau thuế trên tổng tài sản
Firth và cộng sự, 2007; Cascino và cộng sự, 2010; Qin và Wenyao, 2011; Wang và Wu, 2011; Wang và Yung, 2011;
Nguồn: Tác giả tự phân tích
3.3. Quy trình chọn mẫu nghiên cứu Bước 1: Xác định đám đông nghiên cứu
Xác định đám đông nghiên cứu là công việc đầu tiên khi tiến hành nghiên cứu khoa học. Sau khi xác định được đám đông nghiên cứu, nhà nghiên cứu có thể xác định được nguồn dữ liệu cần thu thập hay đối tượng nào cần được thu thập dữ liệu. Với mục tiêu tìm hiểu sự tác động của cơ chế QTCT đến CLTTKT công bố trên BCTC tại các DN niêm yết trên sàn chứng khốn TP.HCM thì đám đơng nghiên cứu là tất cả các DN hiện đang niêm yết trên sàn chứng khoán TP.HCM. Theo thống kê tại trang www.vietstock.vn, có tất cả 308 cơng ty niêm yết trên sàn chứng khốn TP.HCM tính đến ngày 31/10/2015 phân thành các nhóm ngành: sản xuất Nơng - Lâm - Ngư nghiệp, khai khống, tiện ích cộng đồng, xây dựng và bất động sản, sản xuất, thương mại, vận tải và kho bãi, cơng nghệ - truyền thơng, tài chính và bảo hiểm, thuê và cho thuê, dịch vụ khoa học kỹ thuật, dịch vụ quản trị doanh nghiệp, dịch vụ xử lý và tái chế rác thải, giáo dục và đào tạo, dịch vụ chăm sóc sức khỏe, dịch vụ lưu trú và ăn uống, hành chính cơng và dịch vụ khác. Trên cơ cở thống kê đám đông nghiên cứu, tác giả sẽ tiến hành xác định kích thước mẫu phù hợp cho nghiên cứu của mình dựa vào một số tiêu chí nhất định.
Trong nghiên cứu định lượng, chọn mẫu là một trong những khâu quyết định chất lượng của kết quả nghiên cứu. Tuy mục đích của nghiên cứu là tìm hiểu những đặc tính của đám đơng nhưng vì nhiều lý do mà nhà nghiên cứu sẽ khơng thể thu thập tồn bộ dữ liệu của đám đông mà chỉ chọn một nhóm nhỏ hơn gọi là mẫu nghiên cứu (Nguyễn Đình Thọ, 2012). Tác giả tiến hành xác định kích thước mẫu mẫu theo trình tự như sau:
- Loại khỏi đám đơng nghiên cứu các cơng ty niêm yết thuộc nhóm ngành ngân hàng – bảo hiểm và chứng khoán do việc lập và trình bày BCTC tuân thủ theo các chế độ kế tốn riêng. Sau khi loại 19 cơng ty khơng thuộc đối tượng thu thập dữ liệu, cịn lại 289 công ty.
- Căn cứ vào phương pháp xử lý số liệu, tác giả sẽ tiến hành xử lý hồi quy để xác định mức độ tác động của từng nhân tố thuộc QTCT đến CLTTKT trên BCTC. Đối với mơ hình hồi quy, cỡ mẫu nên lớn hơn hoặc bằng 50 + 8p (với p là số biến độc lập trong mơ hình) cho kiểm nghiệm tương quan bội (Green, 1991). Như vậy, mơ hình hồi quy (2) với 9 biến độc lập thì kích thước mẫu tối thiểu cho kiểm định hồi quy bội là 122 mẫu.
- Căn cứ vào mục tiêu nghiên cứu của luận văn, để tìm hiểu sự ảnh hưởng của cơ chế QTCT đến CLTTKT, tác giả lựa chọn thu thập dữ liệu về QTCT của các DN niêm yết trong giai đoạn 2010 – 2014. Các văn bản pháp luật về việc công bố thơng tin trên thị trường chứng khốn và quy chế QTCT áp dụng cho các cơng ty niêm yết có ảnh hưởng nhất định đến cách thức tổ chức quản trị và chất lượng của thơng tin kế tốn cơng bố có thể kể đến như thơng tư 09/2010/TT-BTC, thông tư 121/2012/TT-BTC, thông tư 52/2012/TT-BTC. Lựa chọn giai đoạn thu thập dữ liệu 2010 – 2014, có thể cung cấp các dữ liệu phù hợp cho việc đánh giá tác động của QTCT đến CLTTKT sau khi có những văn bản pháp luật này. Tuy nhiên, việc phân tích hồi quy ở mơ hình (1) địi hỏi dữ liệu phải được thu thập từ BCTC đã kiểm toán trong giai đoạn 2009 – 2014 do đó tác giả đã chọn mẫu gồm 131 DN có thời điểm niêm yết từ năm 2008 trở về trước.
- Căn cứ vào cách thức thiết kế dữ liệu, tác giả lựa chọn loại dữ liệu cho phân
+ Bằng cách kết hợp chuỗi thời gian của các quan sát chéo, dữ liệu bảng cung cấp “dữ liệu chứa nhiều thơng tin hữu ích hơn, tính biến thiên nhiều hơn, ít hiện tượng đa cộng tuyến giữa các biến hơn và hiệu quả cao hơn”
+ Dữ liệu bảng có thể phát hiện và đo lường tốt hơn các tác động mà người ta không thể quan sát được trong dữ liệu thời gian hay dữ liệu chéo thuần túy.
+ Dữ liệu bảng có liên hệ đến các cá nhân, DN,….theo thời gian nên chắn chắc có tính khơng đồng nhất giữa các đơn vị này. Các kỹ thuật ước lượng dựa trên dữ liệu bảng có thể tính đến tính khơng đồng nhất đó nhằm phản ánh kết quả nghiên cứu một cách chính xác nhất.
- Sau cùng, tác giả xác định kích thước mẫu chính thức cho nghiên cứu: dựa vào
các yêu cầu về mục tiêu nghiên cứu, dữ liệu cần thu thập cũng như cách thức thiết kế dữ liệu thì số DN niêm yết trên sàn chứng khoán TP.HCM được chọn là 131 DN. Tuy nhiên, khi tiến hành thu thập dữ liệu xảy ra tình trạng một số báo cáo thường niên không thể hiện đầy đủ các thông tin về QTCT cần thu thập nên sau khi loại ra khỏi mẫu số mẫu chính thức là 101 DN. Như vậy mẫu nghiên cứu chính thức gồm 505 DN – 5 năm đáp ứng điều kiện về cỡ mẫu tối thiểu đã nêu ở trên (Chi tiết về mẫu nghiên cứu được trình bày ở phụ lục 04).
Bước 3: Xác định phương pháp chọn mẫu
Tác giả chọn mẫu theo phương pháp phi xác suất, cụ thể là phương pháp phán đoán. Theo phương pháp này, tác giả sẽ phán đoán những cơng ty nào trong giai đoạn nào sẽ có những đặc tính phù hợp cho nghiên cứu để tiến hành chọn mẫu. (Nguyễn Đình Thọ, 2012).
Bước 4: Tiến hành chọn mẫu
Sau khi xác định được kích thước và phương pháp chọn mẫu, tác giả sẽ tiến hành chọn mẫu theo phương pháp đã chọn.
3.4. Thu thập dữ liệu
Quy trình thu thập dữ liệu được tác giả thực hiện rất nghiêm túc nhằm đảm bảo tính tin cậy của dữ liệu thu thập cũng như kết quả nghiên cứu, quy trình thực hiện gồm các bước cụ thể sau:
Bước 1: Xác định các dữ liệu cần có cho phân tích hồi quy. Tác giả sẽ tiến hành
liệt kê các dữ liệu cụ thể cần thu thập nhằm xác định khối lượng công việc cần thực hiện để có thể bố trí thời gian phù hợp.
Bước 2: Xác định nguồn dữ liệu có thể thu thập. Luận văn sử dụng các dữ liệu
thể hiện trên BCTC năm đã được kiểm toán trong giai đoạn 2009 - 2014 để đo lường chất lượng biến kế tốn dồn tích trong mơ hình hồi quy (1). Sau đó để đo lường mức độ tác động của QTCT đến CLTTKT trên BCTC, tác giả sẽ thu thập thơng tin về cơ chế QTCT được trình bày trong báo cáo thường niên (phần cơng bố các thông tin về cơ chế QTCT) của các DN giai đoạn 2010 - 2014.
Bước 3: Tiến hành thu thập dữ liệu
Sau khi phân tích các dữ liệu cần thiết và nguồn có thể thu thập, tác giả tiến hành thu thập BCTC năm đã kiểm toán và báo cáo thường niên của các DN bằng công cụ internet tại các trang www.vietstock.vn, www.stockbiz.vn.
Bước 4: Nhập dữ liệu vào bảng dữ liệu đã được thiết kế sẵn chuẩn bị cho việc
phân tích thống kê.
3.5. Phương pháp phân tích dữ liệu 3.5.1. Thống kê mô tả 3.5.1. Thống kê mô tả
Thống kê mô tả được sử dụng để mơ tả những đặc tính cơ bản của dữ liệu thu thập được từ nghiên cứu thực nghiệm qua nhiều cách thức khác nhau. Thống kê mô tả cung cấp những tóm tắt đơn giản về mẫu nghiên cứu, tạo nền tảng cho các phân tích định lượng khác.
3.5.2. Phân tích hồi quy đa biến (i) Ước lượng mơ hình hồi quy (i) Ước lượng mơ hình hồi quy
Trong nghiên cứu này, tác giả sử dụng dữ liệu thiết kế theo dạng bảng (Panel data) là sự kết hợp của dữ liệu chéo và dữ liệu thời gian. Các mơ hình hồi quy dựa trên dữ liệu bảng được gọi là mơ hình hồi quy dữ liệu bảng. Phương pháp hồi quy đơn giản nhất khơng kể đến các kích thước khơng gian và thời gian của dữ liệu là phương pháp bình phương nhỏ nhất thơng thường OLS. Tuy nhiên phương pháp này không thể hiện các đặc tính riêng của từng DN mà những đặc tính này có thể ảnh hưởng đến các biến giải thích dẫn đến việc ước lượng hồi quy khơng hiệu quả.
Điều cần thực hiện là tìm cách để phản ánh đúng bản chất cụ thể của từng DN trong mẫu nghiên cứu.
Một cách có thể thực hiện đó là giả định tung độ gốc thay đổi đối với từng DN nhưng các hệ số gốc khơng đổi. Một mơ hình ước lượng như thế được gọi là mơ hình hồi quy tác động cố định (FEM – Fixed Effects Model). Giả sử với mơ hình hồi quy có Y là biến phụ thuộc và X2, X3 là biến độc lập, mơ hình FEM được viết dưới dạng:
1 2 2 3 3
it i it it it Y X X u
Một mơ hình ước lượng khác cũng xem xét đến các đặc tính riêng của các DN là mơ hình các tác động ngẫu nhiên (REM – Random Effects Model). Trong mơ hình này thay vì coiitnhư hằng số thì giả định đây là một biến ngẫu nhiên với giá trị1 là giá trị trung bình của tất cả các tung độ gốc và thành phần sai số i biểu hiện độ lệch của từng tung độ gốc khỏi giá trị trung bình này. Tuy nhiên ikhông thể quan sát được một cách trực tiếp, nên được gọi là biến không thể quan sát hay biến tiềm ẩn. Mơ hình REM được viết dưới dạng:
1 2 2 3 3t 1 2 2 3 3t w
it it i i it it i it
Y X X u X X
Trong đó, số hạng sai số tổng hợp wit gồm hai thành phần gồm i là thành phần sai số chéo hay theo từng công ty và uitlà thành phần sai số chéo và chuỗi thời gian kết hợp.
Việc lựa chọn mơ hình FEM hay REM phụ thuộc vào mối tương quan có thể có giữa thành phần sai số chéoivà các biến độc lập X. Nếu ivà các biến độc lập X khơng tương quan thì mơ hình REM có thể thích hợp hơn, trong khi đó nếu ivà các biến X có tương quan thì FEM thích hợp hơn. Để lựa chọn giữa ba mơ hình Pooled OLS, FEM và REM, tác giả sử dụng các kiểm định LM, Likelihood và Hausman với trình tự như sau:
- Kiểm định LM để lựa chọn giữa mơ hình Pooled và REM với H0 là tất cả các sai số ngẫu nhiên i= 0. Nếu P-value < 0.05, ta bác bỏ giả thuyết H0 nghĩa là mơ hình REM phù hợp hơn.
- Kiểm định Likelihood để kiểm định giữa mơ hình Pooled OLS và FEM với H0 là tất cả các sai số ngẫu nhiên i= 0. Nếu P-value < 0.05, ta bác bỏ giả thuyết H0 nghĩa là mơ hình FEM phù hợp hơn.
- Kiểm định Hausman: kiểm định giữa mơ hình FEM và REM với giả thuyết H0 là khơng có sự tương quan giữa các biến giải thích và thành phần sai số ngẫu nhiên
i
, H1 là“có sự tương quan giữa các biến giải thích và thành phần sai số ngẫu nhiên i”. Nếu P-value < 0.05, ta bác bỏ giả thuyết H0 nghĩa là mơ hình FEM phù hợp hơn. Việc lựa chọn mơ hình FEM hay REM là tốt hơn cho nội dung nghiên cứu phụ thuộc vào giả định có hay khơng sự tương quan giữa εi và các biến độc lập. Nếu giả định cho rằng khơng có sự tương quan thì mơ hình REM là phù hợp và ngược lại.
(ii) Kiểm định các vi phạm giả thiết của mơ hình hồi quy
Kiểm định hiện tượng đa cộng tuyến
Hiện tượng đa cộng tuyến là hiện tượng các biến độc lập tương quan tuyến tính với nhau. Tác giả xem xét mức độ tương quan của từng biến độc lập với biến phụ thuộc và giữa các biến độc lập với nhau thông qua ma trận hệ số tương quan cặp. Nếu mức độ tương quan tuyến tính giữa các biến độc lập cao, ta nghi ngờ có hiện tượng đa cộng tuyến xảy ra. Theo nguyên tắc kinh nghiệm, mức độ tương quan giữa các biến nghiên cứu lớn hơn 0.8 được xem là cao và cần thực hiện các kiểm định chính thức khác để xác định chính xác hiện tượng đa cộng tuyến trong mơ hình. Hiện tượng đa cộng tuyến có thể được bỏ qua hay phải dùng biện pháp khắc phục tùy vào mục tiêu xây dựng mơ hình và mức độ đa cộng tuyến cụ thể.
Kiểm định hiện tượng tự tương quan
Khi có hiện tượng tự tương quan, các sai số ngẫu nhiên tương quan với nhau và dẫn đến việc ước lượng hồi quy không hiệu quả. Đối với dữ liệu bảng, phần mềm Eview 8.0 chưa cung cấp công cụ nhằm kiểm định hiện tượng tự tương quan. Do vậy, tác giả sẽ sử dụng thêm công cụ kiểm định Wooldridge của phần mềm thống kê Stata 12 để kiểm định tự tương quan của mơ hình. Nếu P-value < 0.05, ta kết luận mơ hình xảy ra hiện tượng tự tương quan.
Kiểm định hiện tượng phương sai sai số thay đổi
Nếu độ lớn của phần dư tăng hoặc giảm cùng với sự thay đổi các giá trị của biến độc lập ta nghi ngờ có hiện tượng phương sai sai số thay đổi trong mơ hình. Để kiểm định hiện tượng phương sai sai số thay đổi, tác giả sử dụng công cụ hỗ trợ của phần mềm Stata 12 là kiểm định nhân tử Lagrange hoặc kiểm định Wald tùy theo mơ hình ước lượng hồi quy được chọn là mơ hình REM hay FEM. Nếu P- value < 0.05, ta kết luận mơ hình xảy ra hiện tượng phương sai sai số thay đổi.
(iii) Kiểm định hệ số hồi quy