3.4.1 Cỡ mẫu
Việc lựa chọn cỡ mẫu có ý nghĩa mang tính quyết định đến tính chính xác của mô hình được xây dựng. Trong các kỹ thuật phân tích thống kê khác yêu cầu về kích thước mẫu là khá rõ ràng. Như trong mô hình probit, mô hình OLS cỡ mẫu tối thiểu đạt được cần là 10(s+1) với s là số biến độc lập và có thể cần
58
20(S+1) để có thể giảm đi sai số ngẫu nhiên. Tuy nhiên hầu hết trong các tài liệu không đề cập đến cỡ mẫu tối thiểu cho kỹ thuật Binary Logistic.
Dựa trên các nghiên cứu trước đây ta có thể thấy bộ mẫu cũng có sự chênh lệch rất lớn giữa các bài tuỳ quy mô và điều kiện nghiên cứu mà có quy mô mẫu lớn nhỏ, khác nhau. Trong đó phổ biến có những bài thực hiện trên mẫu tương đối trong khoảng trên dưới 100 công ty. Cụ thể như trong nghiên cứu năm 1980 của Ohlson bộ mẫu của ông gồm 2.163 doanh nghiệp trong đó có 105 công ty phá sản và 2058 công ty không phá sản, bài nghiên cứu trên thị trường Tehran (Hassan Ghodrati & Moghhaddam 2012 ) sử dụng 30 công ty phá sản và 30 công ty đang hoạt động, trong trường hợp bài nghiên cứu của Zavgren (1985) sử dụng 45 công ty phá sản và 45 công ty tương đương; nghiên cứu của Peter Back với 42 công ty phá sản và 42 công ty không phá sản. Tuy nhiên không có một kết luận nào cho thấy việc sử dụng bộ số liệu bao nhiêu là phù hợp cho bài nghiên cứu. Nếu căn cứ xem xét Binary Logistic như một mô hình hồi quy có 6 biến độc lập thì ta cần bộ mẫu 70 quan sát.
Xem xét dựa trên các doanh nghiệp huỷ niêm yết về nguyên nhân tài chính trên thị trường chứng khoán Việt Nam nằm trong các nhóm công ty phi tài chính. Cỡ mẫu đạt được trên 42 doanh nghiệp huỷ niêm yết và 42 doanh nghiệp có quy mô tương đương hoạt động. Như vậy bộ mẫu sử dụng trong bài gồm khoảng 84 mẫu. Đây chưa phải là cỡ mẫu lý tưởng để thực hiện phân tích nhưng cũng đảm bảo đạt được mức độ tương đối phục vụ cho nhu cầu phân tích và cũng là toàn bộ các doanh nghiệp đủ điều kiện đưa vào xem xét đối với huỷ niêm yết về nguyên nhân tài chính.
Một điểm cần chú ý là trong nghiên cứu mô hình dự báo để đảm bảo tính khoa học trong nghiên cứu người ta thường chia bộ mẫu nghiên cứu thành hai phần. Một phần phục vụ cho quá trình xây dựng mô hình và phần 2 dùng để kiểm định khả năng dự báo của mô hình đó. Tuy nhiên đối với luận văn này do hạn chế trong bộ mẫu nghiên cứu do đó sẽ không chia thành 2 nhóm để thực hiện bước kiểm định mà sẽ sử dụng một bộ mẫu cho cả hai bước kết hợp. Điều này có thể
59
ảnh hưởng nhất định đến hiệu quả kiểm định. Tuy nhiên theo thống kê từ nhiều nghiên cứu về mô hình dự báo phá sản cho thấy có số lượng nghiên cứu không thực hiện chia bộ dữ liệu vẫn chiếm tỷ trọng lớn hơn và vẫn cho kết quả chính xác. Điển hình như mô hình Z-Score (Altman 1968) không thực hiện chia bộ dữ liệu vẫn cho khả năng dự báo chính xác lên đến 96% và được vận dụng rộng rãi tại nhiều quốc gia. Ngoài ra có thể kể đến một số mô hình khác như Springate (1978), Fulmer (1984)…
Bảng 3.3. Thống kê các nghiên cứu có thực hiện chia mẫu kiểm định
Giai đoạn Số nghiên cứu có thực hiện chia mẫu
Số nghiên cứu không thực hiện chia mẫu 1961 – 1970 2 1 1971 – 1980 8 20 1981 – 1990 23 29 1991 – 2000 39 31 2000 – 2007 5 6 Tổng 77 87
Nguồn: A Review of Bankruptcy Prediction Studies – Marquette University
Dựa vào bảng 3.3 ta cũng thấy qua các giai đoạn thì các nghiên cứu không thực hiện chia mẫu vẫn chiếm số lượng đông hơn so với thực hiện chia mẫu. Nhiều báo cáo cho rằng việc chia mẫu sẽ đem lại kết quả dự báo chính xác hơn nhưng thực tế khi bộ dữ liệu mẫu nhỏ thì nhiều nghiên cứu được ứng dụng phổ biến rộng rãi trong dự báo phá sản vẫn không sử dụng phương pháp chia mẫu.
3.4.2 Phương pháp chọn lọc mẫu
Nhằm đảm bảo cho việc đánh giá được chính xác và khách quan thì chọn lọc mẫu là một khâu quan trọng. Như đã đề cập trên việc lựa chọn mẫu gồm hai
60
nhóm: Một là nhóm công ty bị huỷ niêm yết, hai là nhóm các công ty hoạt động bình thường.
Trong đó các mẫu được chọn thoả các điều kiện sau:
Đối với nhóm các công ty bị huỷ niêm yết: Lựa chọn những công ty thoả các điều kiện sau: (1) Tất cả các công ty bị huỷ niêm yết trên cả 2 sàn giao dịch chứng khoán Tp. HCM và Hà Nội trong giai đoạn 2008 -2013; (2) Công ty phải thuộc lĩnh vực phi tài chính. Vì các công ty hoạt động trong lĩnh vực tài chính có những đặc thù và môi trường phá sản khác; (3) Báo cáo tài chính và thông tin của các công ty này có thể tiếp cận được và có ít nhất 3 năm.
Đối với nhóm các công ty hoạt động bình thường: Gồm những công ty thoả điều kiện sau: (1) Các công ty được chọn là công ty có quy mô vốn tương đương và hoạt động cùng ngành với một công ty bị huỷ niêm yết tương ứng; (2) Không có sự thay đổi nào trong hoạt động ở giai đoạn xem xét; (3) Công ty được lựa chọn không đang trong quá trình đầu tư hoặc có tình hình tài chính có vấn đề; (4) Báo cáo tài chính và thông tin của công ty này có thể tiếp cận được và có ít nhất 3 năm.
3.5Các bước thực hiện nghiên cứu
Sơ đồ 3.1. Các bước thực hiện nghiên cứu
KIỂM ĐỊNH MÔ HÌNH O-SCORE
Phù hợp Không phù hợp
Đưa vào áp dụng
Đưa thêm biến vào
Chọn lọc biến
Xây dựng mô hình Phân tích kết quả
61
TÓM TẮT CHƯƠNG 3
Chương 3 tập trung giới thiệu phương pháp hồi quy Binary Logistic. Đây là một phương pháp có các giả thiết nghiên cứu khá đơn giản và có khả năng tính toán xác suất xảy ra phá sản do đó tính khả thi cao khi vận dụng trong thực tiễn. Ở chương này cũng đồng thời giới thiệu 9 biến trong mô hình O-Score sẽ được tiến hành kiểm định trong chương 4, đồng thời tác giả cũng đưa ra 50 biến thuộc 5 nhóm: Khả năng thanh khoản, khả năng sinh lời, cơ cấu tài chính, nguy cơ vỡ nợ, khả năng hoạt động sẽ được chọn lọc đưa vào mô hình trong trường hợp mô hình O-Score không khả quan trong dự báo trên thị trường Việt Nam. Cuối cùng tác giả cũng giới thiệu bộ mẫu tác giả chọn lọc từ các công ty huỷ niêm yết trên Thị trường Chứng khoán Việt Nam.
62
CHƯƠNG 4: PHÂN TÍCH KẾT QUẢ NGHIÊN CỨU
4.1 Kiểm định khả năng dự báo phá sản của mô hình O- Score
Ở mỗi quốc gia với các đặc trưng kinh tế khác nhau, việc thống kê dựa hoàn toàn vào mô hình sẵn có đôi khi gây ra những sai lệch trong kết quả dự báo do các biến dự báo không thoả các điều kiện kiểm định, không đem lại mức ý nghĩa mô hình cao… Do đó, để xác định các biến dự báo có thoả mãn được các điều kiện của mô hình hay không ta tiến hành chạy lại phương pháp Binary Logistic trên các biến của mô hình O-Score để đánh giá.
4.1.1 Thực hiện kiểm định cho các biến trong mô hình O-Score
Để đánh giá mức độ phù hợp của mô hình O-Score khi áp dụng vào thị trường Việt Nam ta tiến hành 2 nhóm kiểm định cơ bản: Kiểm định đánh giá mức độ phù hợp của mô hình và kiểm định mức ý nghĩa các biến tham gia mô hình.
Kiểm định mức ý nghĩa các biến
Trong hồi quy Binary Logistic để kiểm định mức ý nghĩa các biến ta sử dụng kiểm định Wald. Đây là kiểm định giả thiết hệ số hồi quy . Nếu các hệ số hồi quy 1, 2,...,n bằng 0 thì mô hình hồi quy sẽ không có tác dụng dự báo.
Bảng 4.1. Variables in the Equation
B S.E. Wald Df Sig. Exp(B)
Step 1a CHIN ,233 ,199 1,372 1 ,241 1,263 TLTA ,380 ,529 ,516 1 ,472 1,463 WCTA 2,543 1,911 1,772 1 ,183 12,720 CLCA 1,017 1,040 ,956 1 ,328 2,766 NITA -14,322 4,373 10,725 1 ,001 ,000 FUTL -,824 ,692 1,418 1 ,234 ,439 Constant -1,418 1,070 1,754 1 ,185 ,242
a. Variable(s) entered on step 1: CHIN, TLTA, WCTA, CLCA, NITA, FUTL.
63
Theo đó biến nào có giá trị Sig > 0.05 ta chấp nhận giả thiết H0 và có cơ sở kết luận biến không có đóng góp đáng kể cho mô hình dự báo và có thể loại ra khỏi mô hình. Dựa vào đó ta thấy ngoại trừ biến NITA có giá trị Sig < 0.05 còn tất cả các biến còn lại đều có giá trị Sig > 0.05. Như vậy chỉ có biến NITA phù hợp đưa vào mô hình các biến còn lại đều không có ý nghĩa khi đưa vào mô hình xem xét.
Dựa vào kiểm định Wald ta thấy các biến trong mô hình O- Score không phù hợp trong đưa vào xem xét trên thị trường Việt Nam mà cần sử dụng các biến khác thoả mãn điều kiện cho mô hình.
Kiểm định sự phù hợp của mô hình
Bảng 4.2. Model Summary Step -2 Log
likelihood
Cox & Snell R Square
Nagelkerke R Square
1 75,174a ,388 ,518
a. Estimation terminated at iteration number 7 because parameter estimates changed by less than ,001.
Nguồn: Tính toán và tổng hợp của tác giả
Bảng 4.2 trình bày mức ý nghĩa của mô hình. Gía trị này có ý nghĩa tương tự với R2 trong hồi quy bội. Tuy nhiên khác với hồi quy bội thông thường hệ số R2 càng lớn thì mô hình càng phù hợp, hồi quy Binary Logistic sử dụng chỉ tiêu - 2LL (-2 log likelihood) để đánh giá độ phù hợp của mô hình. Trong đó -2LL càng nhỏ thì độ phù hợp của mô hình càng cao. Ở đây ta thấy mô hình O-score có hệ số -2LL là 75,174. Đây là một giá trị khá cao do đó ước lượng khả năng dự báo đối với mô hình O-Score sẽ có mức ý nghĩa mô hình không cao.
Ta tiếp tục xem xét giá trị Cox & Snell R square cho thấy khả năng giải thích của mô hình. Kết quả mô hình đạt giá trị là 0,388. Như vậy khi đưa các biến trong mô hình của Ohlson ứng dụng trên thị trường Việt Nam mức độ giải thích của
64
mô hình chỉ đạt 38,8%. Đây là mức giải thích khá thấp cho một mô hình dự báo.Nói khác hơn còn khoảng 61,2% mô hình chưa được giải thích.
Trước khi tìm kiếm một mô hình dự báo phá sản phù hợp cho Thị trường Chứng Khoán Việt Nam ta tiến hành kiểm định lại mô hình O-Score với các ngưỡng sử dụng trong đúng mô hình gốc trên bộ dữ liệu sẵn có để đánh giá khả năng dự báo của mô hình này trên thị trường nước ta. Kết quả thống kê được trình bày trong bảng sau:
4.1.2 Thống kê khả năng dự báo của mô hình O-Score Bảng 4.3. Thống kê khả năng dự báo mô hình Ohlson Bảng 4.3. Thống kê khả năng dự báo mô hình Ohlson
OBSERVED
PREDICTED
TINH TRANG Percentage Correct Hoat dong Pha san
1 years TINH TRANG Hoat dong 10 32 23,81 Pha san 5 37 88,09 Overall Percentage 55,95 2 years TINH TRANG Hoat dong 5 37 11,91 Pha san 3 39 92,86 Overall Percentage 52,39
Nguồn: Tác giả tổng hợp và tính toán
Nhìn chung xét dựa trên mô hình dự báo phá sản O- Score của Ohlson ta có thể đánh giá được mức độ chính xác trong khả năng phân loại của mô hình này đối từng nhóm doanh nghiệp qua các năm. Một vài điểm lưu ý trong kết quả ứng dụng mô hình O-Score. Vì khó khăn trong thu thập số liệu do đó việc kiểm định chỉ dừng lại 2 năm trước phá sản do chỉ tiêu CHIN18 đòi hỏi tính toán chênh lệch lợi nhuận sau thuế giữa kỳ hiện hành và kỳ trước đó và số liệu 4 năm trước phá
18
65
sản không đầy đủ để thực hiện và tương tự chỉ tiêu SIZE 19 cũng loại ra khỏi mô hình do các hạn chế trong tìm kiếm số liệu.
Xem xét đối với nhóm doanh nghiệp phá sản khi ứng dụng mô hình của O- Score đối với 1 năm trước phá sản thì có đến 88,09% được dự báo đúng về nguy cơ phá sản. Trong đó có 11,91% dự báo sai lệch. Đối với trường hợp 2 năm thì khả năng dự báo chính xác đối với nhóm doanh nghiệp phá sản lên đến 92,86%. Như vậy mô hình O-Score cho khả năng dự báo phá sản có độ chính xác khá cao.
Xem xét đối với nhóm doanh nghiệp không phá sản khi đưa vào mô hình dự báo xét đối với 1 năm trước phá sản thì có đến 76,19% được dự báo là phá sản, 23,81% được đánh giá là an toàn. Hay nói khác hơn tỷ lệ dự báo chính xác doanh nghiệp khoẻ mạnh chỉ đạt mức 23,81%. Đối với trường hợp 2 năm trước phá sản thì khả năng dự báo chính xác doanh nghiệp khoẻ mạnh chỉ còn 11,91%. Một trong những nguyên nhân làm giảm khả năng dự báo đối với doanh nghiệp lành mạnh là do khủng hoảng kinh tế ảnh hưởng chung đến toàn nền kinh tế. Tuy nhiên ta thấy mức độ sai lệch khá lớn. Cụ thể cứ 100 doanh nghiệp đưa vào xem xét sẽ có đến 76 doanh nghiệp bị đánh giá có nguy cơ phá sản. Điều này làm giảm đi khả năng ứng dụng của mô hình trên thị trường Việt Nam, làm cho nhà đầu tư đánh giá tiêu cực về tình hình tài chính của các doanh nghiệp và dẫn đến sai lầm loại bỏ những cơ hội đầu tư tốt.
Đánh giá chung về khả năng dự báo tổng thể 1 năm trước phá sản là 55,95%. Đối với 2 năm trước phá sản khả năng dự báo tổng thể là 52,39%. Đây là tỷ lệ khả năng dự báo tương đối cho một mô hình dự báo khi áp dụng trên điều kiện kinh tế khác nhau. Từ kết quả dự báo ta có thể thấy mô hình O-Score cho khả năng dự báo chính xác đối với trường hợp phá sản các doanh nghiệp tuy nhiên lại dự báo rất kém chính xác đối với nhóm doanh nghiệp khoẻ mạnh. Điều này cho thấy một thực tế là tình hình tài chính các doanh nghiệp Việt Nam kém hơn so với tình hình doanh nghiệp được xem xét trong mô hình O-Score. Trong
19
Chỉ tiêu SIZE = Log (Tổng tài sản/ GNP price-level index) với GNP price-level index = (Nominal GNP/Real GNP)*100, xem chương 2
66
đó ngay cả các doanh nghiệp khoẻ mạnh cũng có điều kiện tình hình tài chính gây nhầm lẫn. Tuy nhiên việc đánh giá sai lệch dễ làm loại bỏ những cơ hội đầu tư vào nhóm doanh nghiệp khoẻ mạnh và cũng cho thấy sự khiếm khuyết trong khả năng dự báo của mô hình O-Score trên thị trường Việt Nam.
Dựa trên kết quả dự báo của mô hình O-Score kết hợp với tình hình tài chính trên thị trường Việt Nam ta thấy kết quả đó là hợp lý. Bởi lẽ nhìn chung trước ảnh hưởng của cuộc khủng hoảng tài chính dẫn đến tình hình tài chính các doanh nghiệp trong giai đoạn này có rất nhiều vấn đề phát sinh. Điều này thể hiện khá rõ qua các chỉ tiêu tài chính của doanh nghiệp trong giai đoạn này.
4.2 Chạy Stepwise
Dựa trên việc kiểm định mô hình O-Score trên thị trường Việt Nam đã cho thấy có nhiều điểm chưa phù hợp của mô hình này khi ứng dụng trong thực tiễn. Xuất phát từ thực tế đó việc xây dựng một mô hình phù hợp có khả năng dự báo trên thị trường Việt Nam là cần thiết. Cơ sở việc xây dựng mô hình mới xuất phát từ việc lựa chọn các biến phù hợp để đưa vào mô hình dự báo. Một trong những công cụ hỗ trợ hiệu quả cho việc lựa chọn các biến phù hợp đưa vào mô hình là