Thống kê ngành mẫu nghiên cứu

Tên ngành

Mẫu có sai sót Mẫu khơng có sai sót

Số lượng Tỷ lệ % Số lượng Tỷ lệ %

Nông nghiệp, lâm nghiệp và

thủy sản 2 2.02% 30 11.15% Khai khoáng 6 6.06% 26 9.67% Công nghiệp chế tạo máy 46 60.52% 148 50.68% Sản xuất-phân phối điện, khí đốt,

nước nóng, hơi nước và điều hịa khơng khí

11 11.47% 35 11.98%

Xây dựng 1 1.01% 3 1.12% Vận tải kho bãi 10 10.10% 50 18.59% Tổng cộng 76 100.00% 292 100.00%

(Nguồn: Tác giả tự thu thập)

Trong 76 mẫu quan sát có sai sót thì số lượng các doanh nghiệp có sai sót thuộc ngành công nghiệp chế biến, chế tạo là 46 doanh nghiệp (chiếm đến 60.52% số mẫu sai sót). Tiếp đến, số lượng doanh nghiệp sản xuất - phân phối điện, khí đốt, nước nóng, hơi nước và điều hịa khơng khí là 11 doanh nghiệp (chiếm đến 11.47% số mẫu sai sót). Các mẫu quan sát sai sót cịn lại là thuộc các ngành nông-lâm nghiệp, thủy sản, khai khoáng, xây dựng và vận tải. Với 292 mẫu quan sát khơng có sai sót thì ngành cơng nghiệp chế biến, chế tạo chiếm tỷ trọng lớn nhất là 50.68%, sau đó là ngành vận tải kho bãi chiếm 18.59% số mẫu khơng có sai sót. Chiếm các tỷ trọng cịn lại theo thứ tự là các ngành nơng - lâm thủy sản, ngành khai khoáng, ngành sản xuất phân phối điện và ngành xây dựng.

3.4 Thiết kế dữ liệu nghiên cứu

Dữ liệu nghiên cứu được tổng hợp theo dạng bảng (panel data).Với dữ liệu bảng, các đơn vị chéo theo không gian - Cross section (các doanh nghiệp trong mẫu nghiên cứu) được khảo sát theo thời gian - Time series. Các ưu điểm của dữ liệu

- Dữ liệu bảng liên quan đến các doanh nghiệp theo thời giannên chắc chắn sẽ tồn tại những điểm dị biệt (không đồng nhất) giữa các đơn vị này. Với kỹ thuật phân tích theo dữ liệu bảng có thể xem xét được đến những tính dị biệt này thơng qua việc xem xét các biến số đặc trưng cho từng doanh nghiệp. - Thông qua kết hợp các chuỗi theo thời gian của các quan sát theo không

gian, dữ liệu bảng cung cấp những dữ liệu có nhiều thơng tin hơn, đa dạng hơn, ít đa cộng tuyến hơn giữa các biến số, nhiều bậc tự do hơn và hiệu quả hơn.

- Ngồi ra, dữ liệu bảng có thể phát hiện và đo lường tốt hơn những ảnh hưởng mà không thể quan sát trong dữ liệu chuỗi thời gian đơn thuần hay dữ liệu chéo theo không gian thuần túy.

- Thông qua nghiên cứu các quan sát theo không gian lặp lại, dữ liệu bảng phù hợp hơn để nghiên cứu tính động của thay đổi.

- Dữ liệu bảng có thể tối thiểu hóa sự chênh lệch có thể xảy ra khi tiến hành tổng hợp số liệu của các doanh nghiệp trong mẫu nghiên cứu thành số tổng.

3.5 Quy trình thực hiện nghiên cứu

Trình tự nghiên cứu của việc áp dụng chỉ số F-score trong việc dự báo rủi ro BCTC có sai sót tại các doanh nghiệp được niêm yết tại HOSE gồm những bước như sau:

- Bước 1: Phân tích cơ bản

Bước phân tích cơ bản được thực hiện đầu tiên nhằm mục đích sàng lọc mẫu nghiên cứu, nhằm loại bỏ những quan sát quá lớn, quá nhỏ, hay quá khác biệt so với cỡ mẫu. Bước phân tích cơ bản này giúp kiểm tra mức độ phù hợp của mẫu nghiên cứu trước khi thực hiện phân tích hồi quy logit, nhằm đảm bảo độ tin cậy cho kết quả định lượng. Cụ thể bài luận văn sẽ tiến hành phân tích mơ tả thống kê, phân tích tương quan nhằm loại bỏ hiện tượng đa cộng tuyến giữa các biến độc lập.

Ngồi mục đích là sàng lọc mẫu nghiên cứu như ở bước 1, thực hiện kiểm định sự khác biệt giữa hai nhóm sai sót và khơng sai sót ở bước 2 này sẽ củng cố thêm bằng chứng làm tăng độ tin cậy cho kết quả phân tích hồi quy đa biến sẽ được thực hiện ở bước tiếp theo. Luận văn sẽ thực hiện việc kiểm định sự khác biệt giữa hai nhóm thơng qua kiểm định Paired t-test, kiểm định Wilcoxon matched-pairs signed- ranks test và kiểm định mẫu Arbuthnott (1970)-signtest. Ở bước này sẽ giúp nhận diện được những biến độc lập có sự khác biệt, và những biến độc lập khơng có sự khác biệt giữa hai nhóm mẫu có sai sót và khơng có sai sót. Bước kiểm định này cũng góp phần vào việc nhanh chóng tìm ra những biến có ảnh hưởng đến khả năng sai sót trên BCTC. Đồng thời nếu kết quả kiểm định cho thấy những biến nào có sự khác biệt giữa hai nhóm mẫu, thì việc thực hiện hồi quy đa biến sẽ đáng tin cậy và có ý nghĩa hơn.

- Bước 3: Xác định mối quan hệ

Sau khi đã thực hiện hai bước đầu tiên nhằm mục đích củng cố độ tin cậy cho kết quả phân tích hồi quy đa biến. Bài luận văn sẽ tiến hành xác định lần lượt các biến độc lập tác động có ý nghĩa thống kê hay không đến biến phụ thuộc thông qua việc kiểm định chỉ số hồi quy mơ hình đa biến. Dữ liệu dùng để thực hiện bước kiểm định này là toàn bộ cỡ mẫu gồm tất cả các thông tin BCTC của các doanh nghiệp niêm yết tại HOSE trong bốn năm từ 2010 đến 2013. Mục đích của việc này nhằm tìm ra những biến độc lập nào có mối quan hệ ý nghĩa thống kê đến biến phụ thuộc, và từ đó sẽ đưa ra những chính sách phù hợp, mang lại hiệu quả trong việc dự báo sai sót trên BCTC.

- Bước 4: Xây dựng mơ hình hồi quy

Mơ hình hồi quy sẽ được xây dựng lại dựa trên toàn bộ dữ liệu mẫu trong 4 năm từ 2010 đến 2013, những biến độc lập nào khơng có mối quan hệ ý nghĩa thống kê với biến phụ thuộc (đã được kiểm định ở bước 3) sẽ bị loại bỏ nhằm xác định chính xác các nhân tố dự báo trong mơ hình.

Tiến hành xây dựng mơ hình hồi quy logit với mục đích dự báo tương tự như bước 4, nhưng với dữ liệu mẫu hai năm là 2010 và 2011. Sau đó, áp dụng mơ hình mới này để tính chỉ số F-score cho dữ liệu nghiên cứu trong hai năm 2012 và 2013 nhằm mục đích đánh giá xem khả năng dự báo của các nhân tố trong mơ hình này.

Tóm tắt chương 3

Trên cơ sở dựa vào nghiên cứu của Dechow và các công sự (2012), chương 3 đã tiến hành xây dựng các giả thiết nghiên cứu, mơ hình nghiên cứu và phương pháp tính các biến liên quan đến mơ hình. Đồng thời mơ tả một cách cụ thể phương pháp chọn mẫu nghiên cứu, thiết kế dữ liệu nghiên cứu và các bước tiến hành thực hiện nghiên cứu thực nghiệm. Luận văn đã tiến hành chọn 368 mẫu quan sát tương ứng với 92 doanh nghiệp được thu thập trong khoảng thời gian từ năm 2010 đến 2013, trong đó có 76 mẫu quan sát sai sót và 292 mẫu quan sát khơng có sai sót. Dữ liệu nghiên cứu được thiết kế theo dạng bảng (panel data).Với dữ liệu bảng, các đơn vị chéo theo không gian - Cross section (các doanh nghiệp trong mẫu nghiên cứu) được khảo sát theo thời gian - Time series. Trình tự nghiên cứu của việc áp dụng chỉ số F-score trong việc dự báo rủi ro BCTC có sai sót tại các doanh nghiệp được niêm yết tại HOSE gồm có bốn bước cơ bản. Bước 1 luận văn sẽ tiến hành phân tích cơ bản, bước 2 tiến hành kiểm định sự khác biệt giữa hai nhóm sai sót và khơng sai sót. Bài luận văn sẽ tiến hành xác định lần lượt các biến độc lập tác động có ý nghĩa thống kê hay khơng đến biến phụ thuộc thông qua việc kiểm định chỉ số hồi quy mơ hình đa biến ở bước 3. Bước 4 xây dựng mơ hình hồi quy cho các doanh nghiệp niêm yết tại HOSE sau khi đã loại bỏ những biến khơng có mối quan hệ có ý nghĩa thống kê với hành vi gây sai sót trên BCTC. Và bước cuối cùng là kiểm định lại mơ hình với mục đích dự báo.

CHƯƠNG 4. KẾT QỦA NGHIÊN CỨU VÀ THẢO LUẬN4.1 Kết quả nghiên cứu: 4.1 Kết quả nghiên cứu:

4.1.1 Phân tích thống kê mơ tả đặc điểm của mẫu nghiên cứu

Bài nghiên cứu thực hiện thống kê mơ tả nhằm có cái nhìn tổng quan về dữ liệu thơng qua các chỉ số trung bình (mean), độ lệch chuẩn (Standard Deviation), giá trị lớn nhất (Maximum), và giá trị bé nhất (Minimum). Kết qủa thống kê mơ tả các biến trong mơ hình giai đoạn từ 2010 đến 2013 được thể hiện ở bảng 4.1 (chi tiết được trình bày trong phụ lục số 3).

Bảng 4.1: Thống kê mô tả các biến trong mơ hình

Variable Number of Observations

Mean Standard

Deviation Minimum Maximum

Rsst-acc 368 0.031 0.173 -1.544 0.738 Chrec 368 0.022 0.087 -0.286 0.460 Chinv 368 0.019 0.07 -0.476 0.371 Softasset 368 0.363 0.379 -0.954 0.953 Chcs 368 7.198 36.378 -240.755 422.379 Chroa 368 -0.006 0.086 -0.878 0.882 Issue 368 0.779 0.414 0 1

(Nguồn: Tác giả tổng hợp kết quả phân tích từ phần mềm Stata 12)

- Các biến đại diện cho khía cạnh chất lượng các khoản kế tốn dồn tích trong mơ hình nghiên cứu lần lượt là biến Rsst-acc, biến Chinv, biến Chrec và biến Softasset. Biến Rsst-acc đại diện cho biến kế tốn dồn tích khơng hợp lý có giá trị lớn nhất 0.738, nhỏ nhất là -1.544. Giá trị trung bình là 0.031 và độ lệch chuẩn là 0.173 cho thấy các mẫu trong nghiên cứu khơng có sự đồng đều trong hành visai sót trên BCTC. Tương tự cho kết quả các biến Chinv đại diện cho sự thay đổi hàng tồn kho, biến Chrec đại diện cho sự thay đổi

khoản phải thu và biến Softasset đại diện cho phần trăm tài sản có tính thanh khoản trung bình trên tổng tài sản.

- Các biến còn lại đại diện cho khía cạnh hiệu quả tài chính và thị trường chứng khốn trong mơ hình nghiên cứu là biến Chcs, biến Chroa và biến Issue. Biến Chcs đại diện cho sự thay đổi trong doanh thu bằng tiền, biến này có mức biến động lớn là 36.378, có giá trị thấp nhất là -240.755 và giá trị lớn nhất là 422.379. Cho thấy có những doanh nghiệp có dịng tiền mặt trong doanh thu rất lớn, nhưng cũng có những doanh nghiệp có dịng tiền mặt trong doanh thu thấp. Ngược lại, biến Chroa đại diện cho sự thay đổi tỷ suất sinh lời trên tài sản,có mức biến động khá thấp là 0.086 với mức độ trung bình là -0.006, thấp nhất là từ -0.087 đến lớn nhất là 0.882. Biến còn lại là biến phát hành thêm cổ phiếu có giá trị lớn nhất là 1 và nhỏ nhất là 0. Cho thấy có những doanh nghiệp có phát hành thêm cổ phiếu, nhưng cũng có những doanh nghiệp không phát hành thêm cổ phiếu trong giai đoạn từ 2012 - 2013. Cỡ mẫu của bài nghiên cứu là 368 là cỡ mẫu lớn trong thống kê, dữ liệu mẫu là hoàn toàn phù hợp cho việc thực hiện nghiên cứu định lượng.

4.1.2 Kiểm định vi phạm giả thuyết của mơ hình hồi quy

Để đảm bảo dữ liệu được sử dụng trong bài nghiên cứu là phù hợp để thực hiện phân tích hồi quy, luận văn sẽ tiến hành thực hiện phân tích tương quan nhằm phát hiện những khiếm khuyết của mơ hình trước khi thực hiện phân tích hồi quy.

Một mơ hình lý tưởng là giữa các biến độc lập khơng có sự tương quan lẫn nhau, mỗi biến chứa đựng những thông tin riêng lẻ về các yếu tố giải thích cho biến phụ thuộc và thơng tin đó khơng có trong các biến độc lập khác, khi đó chỉ số hồi quy riêng sẽ cho biết mức độ ảnh hưởng của từng biến độc lập đối với biến phụ thuộc với giả định các biến độc lập khác không thay đổi. Hiện tượng đa cộng tuyến xảy ra khi biến độc lập trong mơ hình tương quan với một biến độc lập khác. Bảng 4.2 thể hiện mức độ tương quan đơn tuyến tính giữa các biến trong mơ hình nghiên cứu (chi tiết ở phụ lục số 4).

Bảng 4.2: Ma trận tương quan giữa các biến trong mơ hình nghiên cứu

Miss Rsstacc Chrec Chinv Softas set Chcs Chroa Issue Miss 1.00 Rsst-acc 0.07 1.00 Chrec -0.13 0.02 1.00 Chinv 0.17 0.03 -0.01 1.00 Softasset 0.21 0.13 0.07 0.13 1.00 Chcs 0.28 -0.01 -0.22 0.04 0.01 1.00 Chroa -0.14 -0.13 0.07 -0.05 -0.20 0.01 1.00 Issue -0.10 0.11 0.09 -0.04 0.06 -0.02 0.13 1.00

(Nguồn: Tác giả tổng hợp kết quả phân tích từ phần mềm Stata 12)

Khả năng sai sót trên BCTC tỷ lệ nghịch với biến thay đổi nợ phải thu (Chcs), biến thay đổi tỷ suất sinh lời trên tài sản (Chroa), và biến phát hành thêm cổ phiếu (Issue). Ngược lại, biến khả năng có sai sót trên BCTC tỷ lệ thuận với các biến cịn lại trong mơ hình là biến chất lượng các khoản dồn tích (RSST-acc), biến thay đổi hàng tồn kho (Chinv), biến phần trăm tài sản có tính thanh khoản trung bình (Softasset) và biến thay đổi trong khoản doanh thu bằng tiền (Chcs).

Có một số quy tắc nhằm phát hiện và đánh giá mức độ đa cộng tuyến như: Chỉ số tương quan giữa các biến độc lập cao, nhân tử phóng đại phương sai VIF. Luận văn lựa chọn quy tắc chỉ số tương quan để xem xét hiện tượng đa cộng tuyến. Theo kết quả kiểm định cho thấy mối tương quan giữa các biến độc lập hầu như khá thấp do hầu hết các chỉ số tương quan đều nhỏ hơn 0.5 cho thấy mức độ tương quan yếu. Điều này đã giúp loại bỏ nghi ngờ xảy ra hiện tượng đa cộng tuyến trong mơ hình.

4.1.3 Kiểm định sự khác biệt giữa hai nhóm mẫu quan sát sai sót và khơng sai sót khơng sai sót

Ngồi việc thực hiện kiểm định sự khác biệt giữa hai nhóm là mẫu có sai sót (MISSTATEMENT) và mẫu không sai sót (NON-MISSTATEMENT) thơng qua các phương pháp hồi quy logit. Kiểm định Paired t-test được dùng để kiểm tra sự giống nhau về giá trị trung bình giữa hai nhóm và kiểm định Wilcoxon matched- pairs signed-ranks test dùng để kiểm tra sự giống nhau về phân phối giữa hai nhóm. Bài luận văn còn mở rộng sử dụng thêm kiểm định Arbuthnott (1970) - signtest dùng để kiểm tra sự giống nhau về trung vị giữa hai nhóm. Việc thực hiện kiểm tra sự khác biệt giữa hai nhóm mẫu có sai sót và nhóm mẫu khơng có sai sót về giá trị trung bình, tham số đặc trưng của phân phối và trung vị, sẽ góp phần củng cố và làm tăng độ tin cậy cho kết quả phân tích ở bước tiếp theo – bước phân tích hồi quy đa biến.

4.1.3.1 Kiểm định Paired t-test Giả thiết của kiểm định này như sau: Giả thiết của kiểm định này như sau:

Ho: Giá trị trung bình của nhóm có sai sót bằng với nhóm khơng có sai sót H1: Giá trị trung bình của nhóm có sai sót khác với nhóm khơng có sai sót Tổng hợp kết quả kiểm định Paired t-test được tổng hợp ở bảng 4.3 (chi tiết được trình bày trong phụ lục số 5).

Bảng 4.3: Kết quả kiểm định Paired t-test

Biến TB nhóm NON- MISSTATEMENT TB nhóm MISSTATEMENT Khác biệt TB Giá trị thống kê Rsstacc 0.0234312 0.0572095 -0.0337783 -1.5120 Chrc 0.028278 -0.0007245 0.0290025 2.5947*** Chiv 0.012254 0.046359 -0.0341049 -3.4281***

Softasset 0.3207935 0.5255535 -0.20476 -4.2833***

Chcs 1.998768 27.17755 -25.17878 -5.5921***

Chroa -0.0000713 -0.0319942 0.031923 2.9007***

*, **, *** Có ý nghĩa thống kê tương ứng với .10, .05, .01

(Nguồn: Tác giả tổng hợp kết quả phân tích từ phần mềm Stata 12)

Từ kiểm định Paired t-test cho ta kết quả lần lượt đối với các biến độc lập như sau:

- Các khoản kế tốn dồn tích (Rsst-acc) giá trị thống kê là -1.5120 khơng có ý nghĩa thống kê với mức ý nghĩa là 5%, hay chấp nhận giả thiết H0 là khơng có sự tồn tại khác nhau về giá trị trung bình của biến Rsst-acc giữa hai nhóm có sai sót và khơng có sai sót.

- Biến sự thay đổi khoản phải thu (Chrec) có giá trị thống kê là 2.5947 hay giá trị P-value nhỏ hơn 0.05 có ý nghĩa thống kê với mức ý nghĩa là 5%, cho phép bác bỏ giả thiết H0, và chấp nhận giả thiết H1 là giá trị trung bình của biến Chrec giữa nhóm có sai sót và nhóm khơng có sai sót là khác nhau.

Mô tả các biến trong nghiên cứu

Kết quả kiểm định Paired t-test