Dữ liệu nghiên cứu

Một phần của tài liệu (LUẬN văn THẠC sĩ) đánh giá nguy cơ phá sản của các doanh nghiệp niêm yết trên thị trường chứng khoán việt nam (Trang 42)

CHƢƠNG 3 : PHƢƠNG PHÁP NGHIÊN CỨU

3.2 Dữ liệu nghiên cứu

3.2.1 Dữ liệu thu thập

Dữ liệu nghiên cứu của đề tài là dữ liệu thứ cấp được trích từ báo cáo tài chính (đã được kiểm toán) kết thúc năm 2012, 2013, 2014 của các doanh nghiệp niêm yết trên sàn chứng khoán HOSE và HNX. Nghiên cứu cũng loại trừ các quan sát là các tổ chức tín dụng như: ngân hàng, công ty chứng khoán, công ty bảo hiểm, các quỹ đầu tư, công ty tài chính vì các công ty này có cơ cấu tài sản và vốn khác với các công ty sản xuất kinh doanh khác.

Theo Li-Jen Ko, Edward J. Blocher and P. Paul Lin (2003) cho thấy rằng các mô hình sử dụng tỷ số tài chính trong năm ngay trước khi xảy ra việc phá sản thường đưa tới kết quả tốt nhất, do đó thời gian được nghiên cứu là các năm 2012, 2013, 2014 để mô hình có tính cập nhật. Trong tổng số 668 doanh nghiệp thu thập số liệu hoạt động liên tục trong 3 năm 2012-2014, mẫu cuối cùng được chọn gồm 471 doanh nghiệp. Các doanh nghiệp có giá trị dị biệt ở các biến bị loại ra khỏi mẫu.

3.2.2 Xử lý dữ liệu thu thập

Sau khi xác định được đối tượng, phương tiện và phạm vi nghiên cứu, tác giả tiến hành các bước lọc mẫu như sau:

Bƣớc 1: Đầu tiên trong 668 doanh nghiệp niêm yết trên sàn HOSE và HNX hoạt động liên tục trong khoảng thời gian 2012-2014, tác giả loại bỏ 79 doanh nghiệp có báo cáo tài chính không được kiểm toán và là các tổ chức tín dụng, tác giả chọn 589 doanh nghiệp.

Bƣớc 2: Tác giả tiếp tục loại bỏ các doanh nghiệp có vốn hóa thị trường bằng 0 và doanh thu 2 năm liền kề bằng 0, với tiêu chí trên tác giả loại 86 doanh nghiệp, còn lại 503 doanh nghiệp.

Bƣớc 3: Để tránh làm ảnh hưởng đến kết quả hồi quy, với 503 doanh nghiệp tác giả loại 32 doanh nghiệp cho ra báo cáo dị biệt như: thanh

khoản, vốn hóa thị trường/tổng nợ, EBIT/doanh thu thuần cho ra kết quả quá cao (229,779; 327,193) hay quá thấp (-39,866). Từ đó còn lại 471 doanh nghiệp.

Bƣớc 4: Tác giả đã xây dựng bộ dữ liệu gồm 471 doanh nghiệp niêm yết trên sàn HOSE và HNX, thời gian nghiên cứu là 3 năm (2012- 2014), kích cở mẫu gồm 1413 quan sát.

Dữ liệu ban đầu (từ báo cáo tài chính đã được kiểm toán – dữ liệu thô) sẽ được trích ra xử lý qua excel để tính toán và tạo ra các biến số cần thiết trong quá trình nghiên cứu. Với điều kiện để xếp các công ty vào diện phá sản bao gồm 2 trường hợp:

Trường hợp 1: ROA < 0 và vốn hoá thị trường < tổng nợ phải trả.

Trường hợp 2: Vốn lưu động < 0 và vốn hoá thị trường < tổng nợ phải trả. Bảng 3.2 thống kê số lượng công ty có nguy cơ phá sản ứng với các điều kiện xác định nguy cơ phá sản khác nhau:

Bảng 3.2 Tỷ lệ các thành phần trong nhóm quan sát Điều kiện để xác định nguy cơ

phá sản Tổng số quan sát

Không có nguy cơ phá sản Có nguy cơ phá sản Trường hợp 1 1413 (100%) 1326 (93,84%) 87 (6,16%) Trường hợp 2 1413 (100%) 1276 (90,3%) 137 (9,69%) Trường hợp 1 hoặc trường hợp 2 1413

(100%) 1203 (85,13%) 210 (14,86%) Đồng thời cả 2 trường hợp 1413 (100%) 1367 (96,74%) 46 (3,26%)

Nguồn: tác giả tính toán từ số liệu thực tế thu thập được

Do số lượng các quan sát có nguy cơ phá sản tương đối thấp nên đề tài sẽ sử dụng điều kiện để xác định nguy cơ phá sản là trường hợp 1 hoặc trường hợp 2, tức số quan sát có nguy cơ phá sản là 210 (chiếm 14,86%) để chạy mô hình hồi quy.

3.3 Phƣơng pháp hồi quy

Nghiên cứu sử dụng dữ liệu bảng cho việc phân tích hồi quy. Những ưu điểm của việc sử dụng dữ liệu bảng trong ước lượng, theo Gujarati (2004), như sau:

- Dữ liệu bảng liên kết các đối tượng cá thể (các công ty, các quốc gia) theo thời gian, nên có sự không đồng nhất (heterogeneity) giữa các cá thể này. Kỹ thuật ước lượng dữ liệu bảng có thể xem xét đến sự không đồng nhất này bằng cách đưa vào những biến số đặc trưng riêng của từng cá thể (các công ty, các quốc gia) nghiên cứu.

- Bằng cách kết hợp những chuỗi quan sát theo thời gian và không gian, dữ liệu bảng hạn chế được hiện tượng đa cộng tuyến giữa các biến số độc lập, bậc tự do được tăng thêm và hiệu quả hơn.

- Dữ liệu bảng có thể phát hiện và đo lường một cách tốt hơn sự tác động không thể quan sát được theo dữ liệu chỉ theo thời gian hoặc chỉ theo không gian thuần túy, tránh được phần nào việc bỏ sót các biến số có ý nghĩa trong mô hình.

- Dữ liệu bảng có thể tối thiểu hóa độ chệch (bias) có thể phát sinh nếu chúng ta kết hợp các cá thể thành nhóm.

Tác giả so sánh phương pháp chạy mô hình FEM (Fixed Effect model) và REM (Random Effect model) để lựa chọn mô hình phù hợp nhất cho dữ liệu bảng. Sau khi thu thập xong dữ liệu, số liệu được xử lý theo trình tự khai báo biến, nhập dữ liệu, khảo sát tương quan cặp giữa các biến, chạy thống kê mô tả và trình bày dữ liệu, phân tích hồi quy. Trong việc lý giải kết quả nghiên cứu, tác giả sẽ sử dụng các lý thuyết đã nghiên cứu, kết hợp thực tiễn của môi trường khảo sát để biện luận ý nghĩa kinh tế của mối tương quan có ý nghĩa thống kê giữa các biến độc lập từ kết quả kiểm định.

3.3.1 Phương pháp hồi quy dữ liệu bảng

Đối với dữ liệu bảng, có rất nhiều phương pháp để ước lượng hồi quy cho mô hình nghiên cứu. Mỗi một phương pháp đều có ưu và nhược điểm của nó, hầu hết các nghiên cứu sử dụng từ mô hình phổ biến nhất đến phức tạp hơn, phù hợp với dữ liệu nghiên cứu.

Như đã trình bày ở phần trên, do biến phụ thuộc là biến nhị phân nhận giá trị là 0 và 1 nên mô hình hồi quy được chọn trong mô hình nghiên cứu là mô hình logit. Với dữ liệu hồi quy là dữ liệu bảng thì có 2 mô hình thông dụng để chạy hồi quy là:mô hình các yếu tố ảnh hưởng cố định (Fixed Effect model – FEM) và mô hình các yếu tố tác động ngẫu nhiên (Random Effect model – REM). Mô hình FEM phân tích những khác biệt về các hệ số chặn của nhóm, trong khi đó giả sử rằng các độ dốc là giống nhau và sai số không đổi. Ngược lại, mô hình REM phân tích những thành phần của phương sai và sai số, trong khi giả sử rằng các hệ số chặn không thay đổi và các độ dốc là giống nhau.

3.3.2 Trình tự thực hiện nghiên cứu định lượng

Bằng phương pháp xử lý số liệu và ước lượng hồi quy đã được trình bày ở phần trên, nghiên cứu thực hiện lần lượt theo trình tự sau:

3.3.2.1 Phân tích thống kê mô tả

Phương pháp này được sử dụng để mô tả những đặc tính cơ bản của dữ liệu thu thập nhằm có cái nhìn tổng quát nhất về mẫu nghiên cứu. Thông qua phân tích thống kê mô tả, có thể đánh giá được sơ bộ về các biến độc lập đưa vào mô hình nghiên cứu (giá trị trung bình, độ lệch chuẩn, giá trị lớn nhất, giá trị nhỏ nhất).

3.3.2.2 Phân tích tương quan

Được sử dụng để xem xét mối quan hệ giữa các biến độc lập và biến phụ thuộc. Kết quả phân tích tương quan có thể bước đầu đánh giá được các dự báo của mô hình. Ngoài ra, trong trường hợp các biến độc lập có mối tương quan cao thì đây là dấu hiệu của đa cộng tuyến. Để phát hiện trường hợp một biến có tương quan tuyến tính mạnh với các biến còn lại của mô hình, ta khảo sát các cặp tương quan

giữa các biến độc lập được thực hiện bằng cách thiết lập ma trận hệ số tương quan để tìm ra những cặp biến có hệ số tương quan cao. Gujarati K. (1995) cho rằng để loại trừ vấn đề đa cộng tuyến, cần nghiên cứu kỹ hệ số tương quan giữa các biến, nếu chúng vượt quá 0,8 mô hình hồi quy sẽ gặp vấn đề đa cộng tuyến nghiêm trọng.

3.3.2.3 Phân tích hồi quy

Trong khi phân tích tương quan kiểm tra có tồn tại mối tương quan giữa các biến hay không thì phân tích hồi quy được dùng để đo lường mức độ ảnh hưởng của các biến độc lập với biến phụ thuộc, qua đó cho biết chiều tác động của từng biến độc lập đến biến phụ thuộc. Phân tích này sẽ cho phép tác giả đưa ra những bằng chứng xác thực để trả lời các câu hỏi nghiên cứu của đề tài. Thông qua phương pháp hồi quy Binary logistic, hằng số và các tham số của mô hình sẽ được ước lượng. Hệ số Prob (p-value) của kết quả phân tích hồi quy cho biết mức độ tác động của từng biến độc lập lên biến phụ thuộc. Các mức thống kê có ý nghĩa thường được sử dụng là 1%, 5% hoặc 10% (hay nói cách khác độ tin cậy là 99%, 95% hoặc 90%). Trong luận văn này, tác giả chọn mức thống kê là 5%, tức là biến độc lập chỉ được xem là có ảnh hưởng mạnh đến biến phụ thuộc khi giá trị Prob của từng biến độc lập trong mô hình hồi quy nhỏ hơn 5% (p-value <0,05), và ngược lại.

Các bước thực hiện phân tích hồi quy và kiểm định trong đề tài này:

Bƣớc 1: So sánh mô hình theo phương pháp FEM với phương pháp REM, tác giả kiểm chứng bằng kiểm định Hausman để lựa chọn mô hình.

Bƣớc 2: Sau khi lựa chọn phương pháp chạy mô hình phù hợp, tác giả sẽ kiểm tra đa cộng tuyến, kiểm định ý nghĩa các hệ số, đo lường độ chính xác của mô hình và phân tích đường cong ROC

3.3.3 Các phương pháp kiểm định

3.3.3.1 Kiểm định lựa chọn mô hình

Kiểm định Hausman

Trong 2 mô hình Fixed Effect và Random Effect, để lựa chọn mô hình hồi quy nào là phù hợp nhất tác giả sẽ thực hiện kiểm định Hausman (1978) để quyết định lựa chọn mô hình. Trong đó, nếu giả thiết H0 của kiểm định Hausman là đúng thì cả Fixed Effect và Random Effect đều tương thích nhưng Random Effect sẽ giải thích tốt hơn nên lựa chọn Random Effect. Ngược lại nếu giả thiết H0 là sai thì Fixed Effect sẽ giải thích tốt hơnRandom Effect nên lựa chọn Fixed Effect.

3.3.3.2 Các kiểm định giả thuyết hồi quy

Kiểm định đa cộng tuyến

Khi phân tích tương quan, hệ số tương quan giữa các biến cao là dấu hiệu của hiện tượng đa cộng tuyến. Để phát hiện trường hợp một biến có tương quan tuyến tính mạnh với các biến còn lại của mô hình, ta khảo sát các cặp tương quan giữa các biến độc lập được thực hiện bằng cách thiết lập ma trận hệ số tương quan để tìm ra những cặp biến có hệ số tương quan cao Hoàng Trọng và Chu Nguyễn Mộng Ngọc (2008). Gujarati K. (1995) cho rằng để loại trừ vấn đề đa cộng tuyến, cần nghiên cứu kỹ hệ số tương quan giữa các biến, nếu chúng vượt quá 0,8 mô hình hồi quy sẽ gặp vấn đề đa cộng tuyến nghiêm trọng. Do đó, để giảm thiểu đa cộng tuyến tác giả sẽ loại bỏ biến ra khỏi mô hình hồi quy đối với cặp biến có hệ số tương quan lớn hơn 0,8.

Ngoài ra, để đảm bảo tính chính xác, tác giả sẽ sử dụng thêm hệ số phóng đại phương sai (VIF – Variance Inflation Factor) để kiểm định hiện tượng đa cộng tuyến. Theo quy tắc khi VIFj > 10 thì mức độ cộng tuyến được xem là cao, và khi đó các hệ số hồi quy được ước lượng với độ chính xác không cao. Vì vậy các biến có hệ số VIF > 10 sẽ bị loại ra khỏi mô hình và tiếp tục phân tích hồi quy cho đến khi không còn biến nào có giá trị VIF > 10, tức là không còn hiện tượng đa cộng tuyến.

Kiểm định ý nghĩa các hệ số của mô hình (kiểm định Wald)

Trong mô hình nghiên cứu căn cứ vào hệ số ý nghĩa thống kê (p-value) để loại bỏ các biến có mức ý nghĩa thống kê thấp. Tuy nhiên, ta cần phải kiểm định xem việc loại bỏ các biến này có ảnh hưởng nhiều đến khả năng dự báo của mô hình hay không. Hoàng Trọng và Chu Nguyễn Mộng Ngọc (2008) cho rằng đối với hồi quy tuyến tính thì sử dụng kiểm định T để kiểm định giả thiết H0: βk=0. Còn đối với mô hình hồi quy Binary Logistic, đại lượng Wald Chi Square được sử dụng để kiểm định ý nghĩa thống kê của hệ số hồi quy tổng thể. Từ kết quả kiểm định Wald ta có thêm cơ sở để loại bỏ các biến có mức ý nghĩa thống kê thấp mà không ảnh hưởng kết quả dự báo của mô hình.

Kiểm định độ chính xác của mô hình so với kết quả thực tế

Sau khi phân tích hồi quy tác giả sẽ kiểm định xem mô hình hồi quy này đánh giá đúng và sai bao nhiêu công ty được xếp vào có hay không có nguy cơ phá sản theo điều kiện:

+ Trường hợp 1: ROA < 0 và vốn hoá thị trường < tổng nợ phải trả.

+ Trường hợp 2: Vốn lưu động < 0 và vốn hoá thị trường < tổng nợ phải trả.

Phân tích đƣờng cong ROC

Sử dụng AUC (Area Under the ROC Curve). AUC là vùng diện tích vùng dưới đường ROC cho đến điểm có tọa độ (1;0) ở góc phải của đồ thị. Altman và các cộng sự (2010) đã cho rằng “vùng dưới đường cong ROC (AUC) là một công cụ đo lường mức độ chính xác trong dự báo của mô hình, với giá trị bằng 1 đại diện cho một mô hình hoàn hảo”. Hay nói cách khác, nếu đường ROC càng gần điểm (0;1) ở góc trái của đồ thị thì khả năng dự báo của mô hình càng tốt.

CHƢƠNG 4

KẾT QUẢ NGHIÊN CỨU

4.1 Thống kê mô tả các biến định lƣợng trong mô hình

Để có đánh giá sơ bộ về các biến độc lập dựa vào mô hình nghiên cứu. Bảng 4.1 sẽ trình bày tóm tắt các thống kê về giá trị trung bình, độ lệch chuẩn, giá trị lớn nhất, giá trị nhỏ nhất của các biến độc lập trong mô hình nghiên cứu.

Bảng 4.1 Thống kê mô tả các biến định lƣợng hiệu Biến Số quan sát Giá trị trung bình Độ lệch chuẩn Giá trị nhỏ nhất Giá trị lớn nhất X1 Hệ số thanh khoản 1413 1,838117 1,272227 0,143 9,786 X2 ROA 1413 0,0893609 0,1478275 -1,134 0,719 X3 ROE 1413 0,0463687 0,0713238 -0,39 0,398 X4 EBIT/Tổng tài sản 1413 0,0612994 0,0738916 -0,53 0,432 X5

Doanh thu thuần/Tổng

tài sản 1413 1,173648 1,107951 0 10,632

X6 EBIT/Doanh thu thuần 1413 0,0568401 0,1812128 -2,124 0,809

X7 Đòn bẩy tài chính 1413 0,5233121 0,2140167 0,027 0,967

X8 Tăng doanh thu thuần 1413 0,111644 0,668054 -1 11,304

X9 Tăng tổng tài sản 1413 0,0671904 0,239975 -0,687 2,808

X10

Vốn hóa thị

trường/Tổng nợ 1413 1,348656 2,115389 0,021 20,269

X11 Cơ cấu nợ 1413 0,8233892 0,222019 0,052 1

X12 Cơ cấu tổng tài sản 1413 0,6212562 0,2276448 0,027 0,995

Bảng 4.1 thể hiện rằng:

Hệ số thanh khoản ngắn hạn (X1) - tài sản ngắn hạn trên nợ ngắn hạn:có giá trị lớn nhất là 9,786 của LBE năm 2012, giá trị nhỏ nhất là 0,143 của SBA năm 2012, giá trị trung bình của các doanh nghiệp là 1,84 và độ lệch chuẩn là 1,272.

Các biến đại diện cho hiệu quả hoạt động:

ROA (X2) - Tỷ suất sinh lời trên tổng tài sản: có giá trị trung bình là 0,89 với giá trị nhỏ nhất thuộc về mã PVX vào năm 2014 là -1,134 giá trị lớn nhất là 0,719 của mã LGC năm 2014. Nhìn chung, tỷ số lợi nhuận sau thuế trên tổng tài sản của các quan sát ở mức tương đối nhỏ. Đặc biệt có 139/1413 quan sát có giá trị âm thể hiện thời điểm các công ty làm ăn thua lỗ chiếm 9,84% tổng số quan sát.

ROE (X3) - Tỷ suất sinh lời trên vốn chủ sở hữu:có giá trị trung bình là 0,046 với giá trị nhỏ nhất -0,39 thuộc về mã VNH năm 2014, còn giá trị lớn nhất 0,398 thuộc về WCS năm 2014. Cũng giống như biến ROA thì biến ROE cũng có 139/1413 quan sát có giá trị âm.

X4 - EBIT chia tổng tài sản: cũng có phân bố tương tự như ROE và ROA khi có giá trị trung bình là 0,061 giá trị lớn nhất thuộc về mã NNC năm 2014 với giá trị là 0,432 và giá trị nhỏ nhất thuộc về LAF năm 2012 với giá trị là -0,53.

Một phần của tài liệu (LUẬN văn THẠC sĩ) đánh giá nguy cơ phá sản của các doanh nghiệp niêm yết trên thị trường chứng khoán việt nam (Trang 42)

Tải bản đầy đủ (PDF)

(81 trang)