1. Trang chủ
  2. » Giáo Dục - Đào Tạo

Ứng dụng Data Mining dự báo kiệt quệ tài chính ở các Công ty Dược niêm yết tại Việt Nam

93 296 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 93
Dung lượng 2,51 MB

Nội dung

2 Mục tiêu nghiên cứu Trong luận văn sẽ áp dụng phương pháp khai phá dữ liệu data mining để dự báo kiệt quệ tài chính của các công ty Việt Nam.Từ đó xem xét những chỉ số tài chính nào h

Trang 2

TRƯỜNG ĐẠI HỌC KINH TẾ TP HỒ CHÍ MINH

LUẬN VĂN THẠC SĨ KINH TẾ

NGƯỜI HƯỚNG DẪN KHOA HỌC: PGS.TS Nguyễn Thị Ngọc Trang

Tp Hồ Chí Minh – 2016

Trang 3

– Giảng viên Trường Đại học Kinh tế Thành phố Hồ Chí Minh

TP Hồ Chí Minh, ngày 31 tháng 10 năm 2016

Hồ Thị Thanh Thảo

Trang 4

MỤC LỤC

DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ VIẾT TẮT

DANH MỤC CÁC BẢNG

DANH MỤC CÁC HÌNH VẼ

MỞ ĐẦU 1

1 Lý do nghiên cứu 1

2 Mục tiêu nghiên cứu 1

3 Đối tượng và phạm vi nghiên cứu 2

4 Phương pháp nghiên cứu 2

5 Ý nghĩa thực tiễn của đề tài 2

6 Kết cấu luận văn 2

Chương 1 – CÁC NGHIÊN CỨU TRƯỚC ĐÂY VỀ DỰ BÁO KIỆT QUỆ TÀI CHÍNH 4

1.1 Kiệt quệ tài chính và những ảnh hưởng của kiệt quệ tài chính đến các chủ thể trong nền kinh tế 4

1.1.1 Kiệt quệ tài chính 4

1.1.2 Những ảnh hưởng của kiệt quệ tài chính đến các chủ thể trong nền kinh tế 9

1.2 Các kỹ thuật thống kê được sử dụng phổ biến để dự báo kiệt quệ tài chính

12

1.2.1 Phân tích phân biệt (DA) 12

1.2.1.1 Phân tích phân biệt đơn biến của Beaver 12

1.2.1.2 Phân tích phân biệt đa biến của Altman 14

Trang 5

1.2.2.2 Nghiên cứu của Ying Wuang và Michael Campbell (2010) 19

1.2.2.3 Nghiên cứu của Dionysios Polemis và Dimitrios Gounopoulos (2012) 20

1.2.3 Phương pháp máy học dựa trên trí tuệ thông minh nhân tạo 22

Chương 2 – DỰ BÁO KIỆT QUỆ TÀI CHÍNH BẰNG PHƯƠNG PHÁP KHAI PHÁ DỮ LIỆU (DATA MINING) 24

2.1 Tổng quan về Khai phá dữ liệu (Data mining) 24

2.1.1 Khái niệm của Data mining 24

2.1.2 Nhiệm vụ của Data Mining 24

2.1.3 Ứng dụng của Data Mining: 25

2.2 Một số thuật toán sử dụng trong Data mining 25

2.2.1 Neural network (NN) 25

2.2.2 Thuật toán cây quyết định Decision tree (DT) 27

2.2.3 Support Vector Machine (SVM) 28

2.3 Áp dụng Data mining trong dự báo kiệt quệ tài chính 31

Chương 3 – PHƯƠNG PHÁP NGHIÊN CỨU 33

3.1 Thu thập dữ liệu 33

3.2 Các biến sử dụng trong nghiên cứu 34

3.3 Chuẩn bị dữ liệu 40

Chương 4 - KẾT QUẢ NGHIÊN CỨU VÀ THẢO LUẬN KẾT QUẢ 46

4.1 Thuật toán cho kết quả dự báo tốt nhất 46

4.2 Khung thời gian nào để dự báo là tốt nhất 51

Trang 6

Kết luận 61

Hạn chế của đề tài và hướng nghiên cứu tiếp theo 62

TÀI LIỆU THAM KHẢO 1

Trang 7

NN Neural network

SVM Support Vector Machine

Trang 8

Bảng 1.2 Xếp loại trái phiếu Mỹ dựa trên chỉ số mô hình EMS 16

Bảng 2.1 Một số hàm truyền trong mạng neural yk = f(ak) 27

Bảng 3.1 Các chỉ số tài chính được dùng để dự báo trong luận văn 34

Bảng 3.2 Các công ty có lợi nhuận ròng âm liên tục 2 năm 2011 và 2012 41

Bảng 3.3 Các công ty có lợi nhuận ròng âm liên tục 2 năm 2012 và 2013 42

Bảng 3.4 Các công ty có lợi nhuận ròng âm liên tục 2 năm 2013 và 2014 44

Bảng 4.1 Kết quả dự báo của thuật toán DT khi sử dụng bộ dữ liệu gồm 26 tỷ số tài chính 46

Bảng 4.2 Kết quả dự báo của thuật toán NN khi sử dụng bộ dữ liệu gồm 26 tỷ số tài chính 47

Bảng 4.3 Kết quả dự báo của thuật toán SVM khi sử dụng bộ dữ liệu gồm 26 tỷ số tài chính 48

Bảng 4.4 Tổng hợp kết quả dự báo của thuật toán khi sử dụng bộ dữ liệu gồm 26 tỷ số tài chính 48

Bảng 4.5 Các biến có ý nghĩa trong dự báo kiệt quệ tài chính khi sử dụng dữ liệu ở năm t – 3 (năm 2012) 53

Bảng 4.7 Các biến có ý nghĩa trong dự báo kiệt quệ tài chính khi sử dụng dữ liệu ở năm t – 1 (năm 2014) 55

Bảng 4.8 Các tỷ số tài chính có nghĩa quan trọng trong dự báo kiệt quệ tài chính 56

Bảng 4.9 Kết quả dự báo của các thuật toán khi sử dụng bộ dữ liệu gồm 09 tỷ số tài chính 57

Trang 9

Hình 2.3 Mô tả các bước thực nghiệm để dự báo kiệt quệ tài chính 32

Hình 4.1 Độ chính xác của các thuật toán theo từng khung thời gian 49

Hình 4.2 Độ phủ của các thuật toán theo từng khung thời gian 50

Hình 4.3 Trung bình độ chính xác của các thuật toán 50

Hình 4.4 Trung bình độ phủ của các thuật toán 51

Hình 4.5 Độ chính xác của các thuật toán theo từng khung thời gian 52

Hình 4.6 Độ chính xác của các thuật toán theo hai bộ dữ liệu(Sử dụng khung thời gian t -1) 58

Hình 4.7 Độ chính xác của các thuật toán theo hai bộ dữ liệu (Sử dụng khung thời gian t -2) 58

Hình 4.8 Độ chính xác của các thuật toán theo hai bộ dữ liệu (Sử dụng khung thời gian t -3) 59

Trang 10

MỞ ĐẦU

1 Lý do nghiên cứu

Dự báo kiệt quệ tài chính là một chủ đề đáng quan tâm trong những thập kỷ qua

vì tầm quan trọng rất lớn của nó cho các công ty niêm yết, các nhà đầu tư, các chủ

nợ, các nhà quản lý và thậm chí cả nền kinh tế của một quốc gia (Wanke,Barros,

& Faria, 2014) Nếu dự đoán kiệt quệ tài chính là đáng tin cậy, các nhà quản lý của các công ty có thể bắt đầu các biện pháp khắc phục hậu quả để tránh suy giảm trước khi cuộc khủng hoảng xảy ra và các nhà đầu tư có thể nắm bắt được tình hình lợi nhuận của các công ty niêm yết và điều chỉnh các chiến lược đầu tư của họ để tối ưu hóa các khoản đầu tư

Tuy nhiên, sự phát triển nhanh chóng của thị trường vốn và hội nhập của nền kinh tế toàn cầu đã tăng số lượng của các công ty bị khủng hoảng tài chính trong những năm qua Theo thống kê của Vietstock, tính đến thời điểm tháng 8/2014 có

28 cổ phiếu trước nguy cơ bị hủy niêm yết bắt buộcvà 41 doanh nghiệp thua lỗ hai năm liên tiếp và lỗ lũy kế vượt vốn

Doanh nghiệp phá sản sẽ gây ra nhiều tác động tiêu cực cho cả xã hội và nền kinh tế Điều này gây ảnh hưởng lớn đến nền kinh tế Việt Nam vốn đang trong giai đoạn hội nhập Thêm vào đó, việc bắt buộc hủy niêm yết gây ra tâm lý hoang mang cho nhà đầu tư làm ảnh hưởng đến thị trường chứng khoán Việt Nam đang phát triển Do đó, rất cần thiết để thiết lập sớm một hệ thống cảnh báo hiệu quả để dự báo kiệt quệ tài chính từ đó có thể quản trị doanh nghiệp tốt hơn, góp phần phát triển thị trường chứng khoán và nền kinh tế

2 Mục tiêu nghiên cứu

Trong luận văn sẽ áp dụng phương pháp khai phá dữ liệu (data mining) để dự báo kiệt quệ tài chính của các công ty Việt Nam.Từ đó xem xét những chỉ số tài chính nào hiệu quả nhất trong dự báo và xác định khung thời gian dự báo nào là hiệu quả nhất

Trang 11

3 Đối tượng và phạm vi nghiên cứu

Các công ty cổ phần của Việt Nam được đưa vào diện kiểm soát đặc biệt khi thua lỗ 2 năm liên tiếp từ năm 2011 – 2015 và những công ty không đưa vào diện kiểm soát đặc biệt từ năm 2011 – 2015 tại Sở Giao dịch chứng khoán Tp.HCM và

Sở Giao dịch chứng khoán Hà Nội

4 Phương pháp nghiên cứu

Sử dụng phương pháp khai phá dữ liệu (data mining) để nhận biết được sớm những dấu hiệu của sự suy giảm lợi nhuận của công ty.Đồng thời chỉ ra những chỉ

số tài chính hiệu quả nhất trong dự báo kiệt quệ tài chính của công ty

5 Ý nghĩa thực tiễn của đề tài

Đề tài với mục đích là để dự báo kiệt quệ tài chính thật sự có ý nghĩa đối với nhiều chủ thể khác nhau trong nền kinh tế từ chính bản thân các doanh nghiệp đến các đối tượng khác như nhà đầu tư, các đối tác, các ngân hàng và cả chính phủ Phương pháp để dự báo dễ sử dụng, dữ liệu dùng để phân tích đưa ra dự báo là

có sẳn, có thể tự thu thập dễ dàng

Chính hai yếu tố trên đã đem lại ý nghĩa thực tiễn của đề tài

6 Kết cấu luận văn

Luận văn được viết thành hai phần chính:

Phần mở đầu sẽ nêu rõ lý do nghiên cứu, mục tiêu nghiên cứu, đối tượng, phạm

vi, phương pháp nghiên cứu Trong phần này cũng trình bày ý nghĩa thực tiễn của

đề tài nghiên cứu

Phần thứ hai là nội dung chính của luận văn được chia thành ba chương

- Chương 1 là tổng quan vấn đề cần nghiên cứu Trong chương này sẽ nêu bật được Kiệt quệ tài chính là gì, ảnh hưởng của kiệt quệ tài chính đến các chủ thể khác nhau trong nền kinh tế và tổng quan các nghiên cứu trước đây về dự báo kiệt quệ tài chính

- Trong chương 2 tác giả trình bày dự báo kiệt quệ tài chính bằng phương pháp khai phá dữ liệu Trong nội dung chương này sẽ khái quát về

Trang 12

phương pháp khai phá dữ liệu, các thuật toán sử dụng trong khai phá dữ liệu và ứng dụng của khai phá dữ liệu trong dự báo kiệt quệ tài chính

- Tiếp đến là áp dụng phương pháp khai phá dữ liệu để dự báo kiệt quệ tài chính cho các công ty cổ phần được niêm yết trên hai sàn HOSE và HNX

sẽ được trình bày ở chương 3 Trong chương này sẽ trình bày cụ thể việc thực nghiệm bao gồm việc thu thập dữ liệu, miêu tả các biến sử dụng trong dự báo, thực hiện thí nghiệm, đọc hiểu và đánh giá kết quả dự báo Cuối cùng thay cho lời kết của luận văn là phần kết luận, hạn chế và hướng nghiên cứu tiếp theo của đề tài

Trang 13

Chương 1 – CÁC NGHIÊN CỨU TRƯỚC ĐÂY VỀ DỰ BÁO KIỆT QUỆ

TÀI CHÍNH 1.1 Kiệt quệ tài chính và những ảnh hưởng của kiệt quệ tài chính đến các chủ thể trong nền kinh tế

1.1.1 Kiệt quệ tài chính

Kiệt quệ tài chính là một khái niệm với nghĩa khá rộng, nó thể hiện tình trạng các doanh nghiệp phải đối mặt với khó khăn về tài chính.Thuật ngữ phổ biến nhất

sử dụng để mô tả những tình trạng này là “thất bại” (failure), “mất thanh khoản” (insolvency), “vỡ nợ” (default), và “phá sản” (bankruptcy)

Thất bại (failure): Altman và Hotckiss (2005) định nghĩa “thất bại”theo chuẩnkinh tế học, nghĩa là “tỷ suất sinh lợi thực tế trên vốn đầu tư, cùng với các tỷ

số khác để đánh giá rủi ro, là thấp hơn liên tục và đáng kể so với các tỷ số của các đầu tư tương đương trên thị trường, hoặc doanh thu không đủ bù đắp chi phí của công ty” Tuy nhiên, định nghĩa như trên vẫn chưa đủ, bởi vì mặc dù có doanh thu không đủ bù đắp chi phí hoặc tỷ suất sinh lợi thực trên vốn đâu tư thấp hơn so với

tỷ số của các đầu tư tương đương trên thị trường thì một công ty trong tình huống này cũng có thể tiếp tục hoạt động kinh doanh nếu các nhà đầu tư đồng ý chấp nhận mức tỷ suất sinh lợi thấp Vì vậy, rất khó để phân loại một công ty đối mặt các tình huống ở trên như một doanh nghiệp kiệt quệ tài chính

Một quan điểm khác, dựa theo chuẩn tài chính, “thất bại” là việc dòng tiền của doanh nghiệp không đủ để thỏa mãn nghĩa vụ tài chính hiện tại Các nghĩa vụ tài chính này bao gồm việc không thể giải quyết nợ đối với các nhà cung cấp tín dụng

và người lao động, hoặc gánh chịu tổn thất từ quá trình pháp lý diễn ra dai dẳng, hoặc không thể hoàn trả nợ gốc và lãi vay (Wruck, 1990)

Từ các quan điểm trên, “thất bại” của công ty được chia làm 2 loại, đó là: “thất bại kinh tế” (economic failure) và “thất bại tài chính” (financial failure) Andrade

và Kaplan (1998) nhấn mạnh cần thiết phải phân biệt giữa “thất bại tài chính” và

“thất bại kinh tế” Hai ông định nghĩa rằng một công ty vi phạm việc trả nợ là “thất

Trang 14

bại tài chính”, còn một công ty đang thua lỗ trong hoạt động kinh doanh là “thất bại kinh tế”

Ở một quan điểm phổ biến khác, “thất bại tài chính” được định nghĩa là việc công ty bất lực trong việc hoàn thành các nghĩa vụ nợ.Tuy nhiên, một công ty không đủ khả năng thanh toán các khoản nợ cũng có thể xảy ra ngay cả khi công

ty có giá trị tài sản ròng dương (Gaughan, 2011) Như vậy, có thể hiểu rằng bên cạnh tình trạng “bất lực” của công ty trong việc trả nợ, thì tình trạng “khó khăn” của công ty trong việc thanh toán các khoản nợ cũng được xem là “thất bại tài chính”

Cuối cùng, cần nhấn mạnh rằng “thất bại tài chính” không đồng nghĩa với “phá sản” hay “giải thể” Bởi vì, tất cả các công ty khi gặp khó khăn trong hoạt động kinh doanh thì đều sẽ trải qua “thất bại tài chính” và “thất bại kinh tế”, nhưng chỉ một số công ty trong số đó sẽ đi đến “phá sản” hay “giải thể” chứ không phải tất

cả

Mất thanh khoản (insolvency): là một dạng khác đểmô tảkết quảhoạt động kinhdoanh thất bại và kiệt quệ tài chính Một công ty “mất thanh khoản” có thể đượcđịnh nghĩa là không đủ khả năng để hoàn thành các nghĩa vụ tài chính bao gồm cả các khoản nợ đối với người lao động, nhà cung cấp, chủ nợ (Shrader và Hickman, 1993)

Mất thanh khoản thể hiện kết quả hoạt động kém liên quan đến vấn đề về thanh khoản và giá trị ròng của doanh nghiệp âm (Zopounidis & Dimitras, 1998) Các đối tượng thường gặp nhất trở nên mất thanh khoản là do vay nợ quá nhiều Định nghĩa trên giống với định nghĩa “thất bại tài chính” của Whitaker (1999)

và Wruck (1990) Thực tế, Wruck (1990) nhấn mạnh rằng, mặc dù “mất thanh khoản” là khác biệt so với “thất bại tài chính”, nhưng 2 khái niệm này vẫn được sử dụng thay thế lẫn nhau Wruck (1990), Ross và cộng sự (2003) chia khái niệm

“mất thanh khoản” thành 2 dạng: do giá trị và do dòng tiền

Trang 15

Quan điểm “mất thanh khoản do giá trị” cho rằng việc mất thanh khoản xảy ra khi giá trị thị trường các tài sản của công ty là thấp hơn so với giá trị các khoản nợ, theo đó, khái niệm này còn được hiểu là giá trị kinh tế ròng âm

Ngoài ra, kiệt quệ tài chính cũng có thể bắt nguồn từ “mất thanh khoản do dòng tiền”; nói cách khác, công ty này không thể tạo ra đủ dòng tiền để đảm bảo các nghĩa vụ tài chính hiện tại Trường hợp này còn được gọi là “mất thanh khoản kỹ thuật” (technical insolvency)

Vỡ nợ (default): là một khái niệm tài chính khácliên quan đến kiệt quệtài chính

“Vỡ nợ” được thể hiện như là tình trạng khi một công ty không thể trả được nợ gốc hay lãi đối với chủ nợ khi chúng đến hạn, và do đó, vi phạm điều kiện của hợp đồng tín dụng, dẫn đến các hành động pháp lý (Altman và Hotchkiss, 2005) Ross, Westerfield và Jaffe (2002) nói rằng '' khủng hoảng tài chính là một tình huống mà dòng tiền hoạt động của một công ty không đủ để đáp ứng nghĩa vụ hiện tại (như tín dụng thương mại hoặc chi phí lãi vay) và công ty buộc phải nhận những hành động trừng phạt''

Gilson và cộng sự (1990) và Altman và Hotchkiss (2005) tách khái niệm “vỡ nợ” ra làm 2 phạm trù riêng: “vỡ nợ thanh toán” do không thể trả nợ gốc và lãi đến hạn, và “vỡ nợ kỹ thuật” do vi phạm các điều khoản hợp đồng tín dụng của công

ty

Ngoài ra, có sự nhầm lẫn phổ biến giữa “mất thanh khoản” và “vỡ nợ” Cần có

sự phân biệt rõ ràng giữa hai khái niệm này Theo đó, để phân biệt giữa “vỡ nợ” (default) và “mất thanh khoản” (insolvency), cần tham chiếu đến thời điểm đáo hạn (date of maturity) của nợ Một công ty có thể ở trong tình trạng “mất thanh khoản” trong một khoảng thời gian dài Tuy nhiên, chỉ đến thời điểm nợ đáo hạn, công ty mới được xem là “vỡ nợ”, và khi đối mặt với với sự kiện này, công ty sẽ

cố gắng tái thương thảo hợp đồng tín dụng và tái cấu trúc nợ (đảo nợ) trước khi tình trạng “phá sản” (bankruptcy) bắt đầu

Phá sản (bankruptcy): cũng là khái niệm tài chính liên quan đến kiệt quệ tài chính

Trang 16

Altman (1993) đưa ra một mô tả và định nghĩa hoàn chỉnh của kiệt quệ tài chính

và chỉ ra rằng phá sản là định nghĩa pháp lý gần nhất của khủng hoảng tài chính “Phá sản” là việc công ty đệ trình đơn xin phá sản chính thức đến tòa án và được tòa án phê duyệt cho phép phá sản Diễn biến sau đó sẽ theo 2 hướng: công

ty bán tài sản để trả nợ (thanh lý tài sản) hoặc nổ lực thực hiện một chương trình tái cấu trúc (Altman và Hotchkiss, 2005)

Zmijewski (1984) định nghĩa kiệt quệ tài chính là hành động nộp đơn nộp đơn xin phá sản Tuy nhiên, nhiều công ty đã rơi vào kiệt quệ tài chính chưa bao giờ nộp đơn phá sản, do quá trình sáp nhập hoặc tư nhân hóa, trong khi đó những công

ty có tình trạng tốt thường nộp đơn phá sản để tránh thuế và các vụ kiện tốn kém (Theodossiou, Kahya, Saidi & Philippatos, 1996)

Trong các nghiên cứu thực tiễn, “phá sản” (bankruptcy), “thất bại tài chính” (financial failure), “vỡ nợ” (default) và “kiệt quệ tài chính” (financial distress) được sử dụng thay thế nhau Việc sử dụng “thất bại tài chính” hay “kiệt quệ tài chính” để cung cấp tính linh động trong phương diện nghiên cứu “Kiệt quệ tài chính” là một định nghĩa linh động hơn so với “phá sản” và giúp nghiên cứu gia tăng kích cỡ mẫu; ngược lại, “phá sản” là một hình thái đặc biệt của “kiệt quệ tài chính”, “phá sản” tập trung vào các nghiên cứu giảm kích cỡ mẫu Việc sử dụng

“kiệt quệ tài chính” cung cấp mạnh hơn không chỉ trong thực tiễn mà còn trong lý thuyết, bởi vì không phải tất cả các công ty kiệt quệ tài chính đều đi đến “phá sản”.“Phá sản” chỉ là sự lựa chọn cuối cùng đối với các công ty khi mà chúng không thể giải quyết các vấn đề tài chính (Aktas, 1993)

Ngoài ra, Karels và Prakash (1987) trong các nghiên cứu thực nghiệm của hai ông về ước lượng thất bại tài chính, đã liệt kê các định nghĩa của thất bại tài chính, các định nghĩa đó là giá trị ròng (net value) âm, mất thanh khoản (insolvency), vỡ

nợ (default) đối với gốc hoặc lãi, phát hành các tờ séc xấu, hoãn chi trả cổ tức, việc quản lý chuyển giao cho các chủ nợ, v.v… Tương tự, Lin và McClean (2000) liệt

kê các định nghĩa về thất bại tài chính và kiệt quệ tài chính phổ biến như: doanh nghiệp phải tái cấu trúc, không đủ khả năng trả lãi, báo cáo kiểm toán bị đánh giá

Trang 17

xấu, bán tài sản để trả nợ rồi giải thể, thua lỗ trong hoạt động kinh doanh, thua lỗ năm hiện tại, thua lỗ liên tiếp 2 năm, thua lỗ liên tiếp 3 năm, v.v… Các định nghĩa khác nhau của kiệt quệ tài chính dẫn đến việc lựa chọn mẫu khác nhau để nghiên cứu trong lĩnh vực này

Nhãn ST đã được sử dụng như là biểu tượng của sự kiệt quệ tài chính trong nhiều nghiên cứu liên quan đến các công ty ở Trung Quốc (Altman, Heine, Zhang,

và Yen, 2007; Bailey, Huang, & Yang, 2011; Sun & Li, 2008a) Các công ty bị gán nhãn ST trải qua một hoặc nhiều hơn của bốn giai đoạn đó bao gồm thiếu sót hoặc giảm mức chi trả cổ tức hàng năm do thiếu tiền mặt, không thanh toán vốn vay dẫn đến một vụ kiện, bị tái cấu trúc và xoá tên khỏi thị trường chứng khoán,

và chuyển giao cho công ty quản lý tài sản để xử lý (Altman et al., 2007) Có hai

lý do chính cho việc xem các công ty bị đưa vào dạng kiểm soát đặc biệt là các công ty bị kiệt quệ tài chính Thứ nhất, sự suy thoái tài chính của một công ty được xem là một quá trình từng bước một, nó như là một sự kiện tiên nghiệm (ex ante) của phá sản là một đại diện tốt của kiệt quệ tài chính (Newton (1975), Gestel cùng cộng sự (2006), và Lau (1987)) Thứ hai, các nhà nghiên cứu ở Trung Quốc tìm thấy nó khó khăn để có được dữ liệu liên quan đến các công ty bị phá sản do các quá trình phá sản ở Trung Quốc Dairui và Jia (2009) xác định các công ty kiệt quệ tài chính là các công ty bị đưa vào diện đặc biệt (gán nhãn ST) bởi vì thiếu cơ sở

dữ liệu của phá sản công ty trên thị trường chứng khoán Trung Quốc

Trang 18

1.1.2 Những ảnh hưởng của kiệt quệ tài chính đến các chủ thể trong nền kinh

tế

Kiệt quệ tài chính rất tốn kém khi các mâu thuẫn quyền lợi cản trở các quyết định đúng đắn về hoạt động, đầu tư, tài trợ.Khi một doanh nghiệp gặp khó khăn, kiệt quệ tài chính, cả chủ nợ và các cổ đông đều muốn doanh nghiệp phục hồi, nhưng ở khía cạnh khác, quyền lợi của họ có thể mâu thuẫn nhau.Họ thường có khuynh hướng thực hiện các “trò chơi” riêng để đảm bảo lợi ích của mình

Điều này làm phát sinh những chi phí do tình trạng kiệt quệ tài chính gây ra Chi phí của kiệt quệ tài chính gồm nhiều mục cụ thể như:

- Chi phí phá sản: gồm các chi phí trực tiếp như lệ phí tòa án và các chi phí gián tiếp mà doanh nghiệp phải hứa hẹn nhiều hơn để được vay nợ, các chủ nợ đòi hỏi được đền bù trước dưới hình thức các chi trả cao hơn khi doanh nghiệp chưa mất khả năng thực hiện nghĩa vụ Họ đòi hỏi một lãi suất hứa hẹn cao hơn Điều này lại càng gây khó khăn cho doanh nghiệp đang lâm vào kiệt quệ tài chính

- Ngoài ra, doanh nghiệp còn phải chịu những chi phí khác như sự khó khăn trong việc điều hành một công ty đang kiệt quệ, phá sản; các rắc rối

về mặt pháp lý của việc đang trong quá trình phá sản thường phá hỏng các nỗ lực của ban giám đốc nhằm ngăn chặn việc kinh doanh của doanh nghiệp không tồi tệ thêm, chẳng hạn như khi doanh nghiệp muốn bán bớt một ít tài sản để trang trải nhưng bị chủ nợ ngăn chặn, còn vốn nhưng không thể sử dụng

- Chi phí kiệt quệ tài chính nhưng chưa phá sản: là mâu thuẫn quyền lợi giữa trái chủ và cổ đông khi doanh nghiệp gặp khó khăn Khi doanh nghiệp gặp khó khăn, cảchủ nợ lẫn cổ đông đều muốn doanh nghiệp phục hồi, nhưng quyền lợi làm họ mâuthuẫn nhau trong những quyết định về hoạt động, đầu tư Họ thường thưc hiện các “ trò chơi”- ý đồ riêng nhằm đảm bảo quyền lợi của mình Các trò chơi này sẽ đưa đến các chi phí kiệt quệ tài chính như: trò chơi chuyển dịch rủi ro, từ chối góp vốn cổ phần,

Trang 19

thu tiền bỏ chạy, kéo dài thời gian, thả mồi bắt bóng Những “trò chơi” này sẽ khiến kiệt quệ tài chính của doanh nghiệp ngày càng trầm trọng

và có thể đi đến phá sản.Một điều đáng lưu ý là các chi phí liên quan đến kiệt quệ tài chính càng nghiêmtrọng hơn đối với những công ty có nhiều tài sản vô hình Điều này được hiểu là do các tài sản vô hình gắn với tình hình sức khỏe doanh nghiệp sẽ mất giá trị nếu công ty rơi vào tình trạng phá sản Dự báo kiệt quệ/ phá sản là quan trọng đối với những công

- Các nhà đầu tư cần một số chỉ dẫn để giúp họ dự đoán tình hình tài chính của doanh nghiệp mà họ đầu tư để có phản ứng kịp thời với đồng vốn mà

họ đã bỏ ra Khi một nhà đầu tư đầu tư vào một doanh nghiệp, chỉ tiêu

về lợi nhuận luôn được đặt lên hàng đầu vì đó là cơ sở chính để đánh giá khả năng sinh lời của đồng vốn mà họ đã bỏ ra Tuy nhiên, với tình hình kinh tế nhiều biến động việc một doanh nghiệp bị lỗ trong một thời gian

là rất dễ xảy ra Việc dự báo kiệt quệ tài chính sẽ giúp các nhà đầu tư có thể nắm bắt được tình hình lợi nhuận của các công ty niêm yết và điều chỉnh các chiến lược đầu tư của họ để tối ưu hóa các khoản đầu tư Nếu

Trang 20

thấy khả năng kiệt quệ tài chính của doanh nghiệp còn thấp, nhà đầu tư

có thể duy trì đầu tư mà chưa cần tính đến phương án thoái vốn Ngược lại, nhà đầu tư nên xem xét việc rút vốn khi mà khả năng kiệt quệ tài chính của doanh nghiệp là đáng báo động

- Các ngân hàng cũng cần có một công cụ để đánh giá tình hình tài chính của doanh nghiệp trước khi đưa ra những quyết định tín dụng Những năm gần đây, với tình hình nợ xấu nghiêm trọng các ngân hàng, các doanh nghiệp khó khăn hơn trongtiếp cận nguồn vốn vay Điều này gây thiệt hại cho cả 2 phía doanh nghiệp và ngânhàng Một phương pháp dự báo kiệt quệ/phá sản sẽ cho các ngân hàng thêm một khía cạnhthông tin trong việc thẩm định các hồ sơ vay vốn của doanh nghiệp Điều này sẽ đem lại lợi ích không chỉ cho doanh nghiệp được xem xét cấp tín dụng, ngân hàng cho vay mà còn lợi ích cho cả nền kinh tế

- Xét về khía cạnh nền kinh tế thị trường, chuyện doanh nghiệp giải thể, phá sản, ngừng hoạt động là chuyện không phải quá bất thường Bởi vì trong vòng đời của một doanh nghiệp khi gặp khó khăn, doanh nghiệp

có thể ngừng hoạt động sản xuất, kinh doanh trong một thời gian nhất định Đây là một dạng rút lui tạm thời khỏi thị trường Tuy nhiên, khi không thể tiếp tục hoạt động kinh doanh, doanh nghiệp phải rút lui khỏi thị trường thông qua hình thức giải thể hoặc phá sản doanh nghiệp Khi

đó xét về khía cạnh tổng thể nền kinh tế việc phá sản là tốt Bởi vì nếu doanh nghiệp không còn hoạt động nhưng không thực hiện quy trình giải thể, phá sản dẫn tới việc Nhà nước thất thu thuế, người lao động bị xâm hại quyền lợi… và làm sai lệch các thông tin thống kê về doanh nghiệp, ảnh hưởng tới sự minh bạch của môi trường kinh doanh Nhưng cũng cần nhìn nhận rằng, việc có quá nhiều doanh nghiệp phá sản trong những năm gần đây là rất đáng quan ngại Bởi đi theo việc doanh nghiệp phá sản, giải thể, kiệt quệ tài chính sẽ là một loạt người lao động mất việc làm, bị nợ lương, thu nhập bấp bênh; là rất nhiều doanh nghiệp của các

Trang 21

công ty đối tác với công ty phá sản bị nợ tiền và cũng rơi vào khó khăn tài chính, là các ngân hàng với hàng đống nợ xấu, là nhà nước không thu được thuế gây bội chi ngân sách nghiêm trọng, là nền kinh tế đất nước lâm vào suy thoái

Không phải công ty nào gặp khó khăn về tài chính cũng đều đi đến phá sản.Nếu doanh nghiệp có chiến lược đúng đắn, phản ứng kịp thời, xoay xở được các khoản nợ doanh nghiệp có thể hoãn việc phá sản lại nhiều năm.Cuối cùng, doanh nghiệp có thể phục hồi, trả hết nợ và thoát được cảnh phá sản.Dự báo được

“ngưỡng” kiệt quệ tài chính góp một phần giúp doanh nghiệp đưa ra những giải pháp hợp lý cho tình hình tài chính, tránh được những phát sinh từ chi phí kiệt quệ tài chính có thể kéo tình hình doanh nghiệp khó khăn hơn

1.2 Các kỹ thuật thống kê được sử dụng phổ biến để dự báo kiệt quệ tài chính 1.2.1 Phân tích phân biệt (DA)

Phân tích phân biệt (DA) là phương pháp thường được sử dụng trước năm 1980 (Altman, 1968; Beaver, 1966)

1.2.1.1 Phân tích phân biệt đơn biến của Beaver

William Beaver đã sử dụng các tỷ số tài chính được rút ra từ việc nghiên cứu thực nghiệm 79 doanh nghiệp phá sản và một số lượng tương ứng các doanh nghiệp không phá sản trong thời gian 10 năm (1954 – 1964)

Nghiên cứu của Beaver chỉ ra rằng tỷ lệ tiền mặt/tổng nợ phải trả là chỉ tiêu quan trọng nhất trong việc dự báo dấu hiệu kiệt quệ tài chính và phá sản doanh nghiệp Chỉ tiêu này phản ánh tính cân đối giữa khả năng tạo ra tiền của doanh nghiệp với số nợ mà doanh nghiệp phải thanh toán, và do đó sẽ thể hiện rõ ràng nhất khả năng thanh toán của doanh nghiệp Ngoài ra, tỷ suất sinh lời của tài sản

và hệ số nợ (tổng nợ phải trả/tổng tài sản) cũng là các chỉ tiêu quan trọng trong việc phát hiện dấu hiệu kiệt quệ và phá sản doanh nghiệp bởi vì các chỉ tiêu này phản ánh hiệu quả hoạt động kinh doanh của doanh nghiệp và mức độ rủi ro tài chính mà doanh nghiệp đang gặp phải

Trang 22

So sánh các chỉ tiêu được rút ra từ nghiên cứu của Beaver cho thấy tất cả các chỉ tiêu tài chính của doanh nghiệp lâm vào tình trạng khủng hoảng thấp hơn rất nhiều so với một doanh nghiệp hoạt động bình thường

Như vậy kết quả thực nghiệm của Beaver đã chỉ ra một cách thức để dự báo khả năng kiệt quệ tài chính của một doanh nghiệp như sau:

Khi muốn phát hiện dấu hiệu kiệt quệ tài chính /phá sản của một doanh nghiệp, chúng ta sẽ so sánh các chỉ số tài chính của doanh nghiệp đó với mức trung bình được Beaver đưa ra Mức trung bình được William Beaver đưa ra theo bảng 1.1 Mức trung bình của các chỉ số tài chính dùng phân loại doanh nghiệp trong nghiên cứu của Beaver (1966)

Bảng 1.1 Mức trung bình của các chỉ số tài chính dùng phân loại doanh nghiệp trong

nghiên cứu của Beaver (1966)

CHỈ SỐ TÀI

CHÍNH

DOANH NGHIỆP

Thu nhập

ròng / Tổng

tài sản

Phá sản -0.23 -0.08 -0.04 0.01 0.02 Không phá sản 0.08 0.08 0.09 0.08 0.07

Nợ phải trả

/ Tổng tài

sản

Phá sản 0.76 0.62 0.52 0.54 0.51 Không phá sản 0.36 0.34 0.35 0.37 0.34

Vốn luân

chuyển /

Tổng tài sản

Phá sản 0.04 0.04 0.27 0.29 0.27 Không phá sản 0.4 0.39 0.4 0.39 0.43

Tỷ số thanh

toán hiện

hành

Phá sản 2.0 2.3 2.35 2.4 2.5 Không phá sản 3.2 3.24 3.2 3.4 3.35

Trang 23

Nguồn: nghiên cứu của Beaver (1966)

1.2.1.2 Phân tích phân biệt đa biến của Altman

Khác với Beaver, Altman sử dụng phương pháp phân tích phân biệt đa biến (MDA) để tìm ra phương trình tuyến tính của các tỷ số tài chính để xác định công

ty nào là phá sản và công ty nào là không phá sản

Atlman sử dụng kĩ thuật phân tích phân biệt (MDA) với các biến được sử dụng là:

X1 = Working capital/Total assets: Vốn luân chuyển/Tổng tài sản;

X2 = Retained earning/ Total assets: Lợi nhuận giữ lại/Tổng tài sản

X3 = Earning before tax and interest/Total assets: EBIT/Tổng tài sản

X4 = Market value equity/Book value of total liabilities: Giá trị thị trường của vốn chủ sở hữu/Giá trị sổ sách của nợ phải trả

X5= Sales/Total assets: Tổng doanh thu/Tổng tài sản

Z = Overal index: chỉ số tổng hợp

Dựa trên cơ sở số liệu của 66 doanh nghiệp tại Mỹ, trong đó 66 doanh nghiệp được phân thành 2 nhóm, mỗi nhóm gồm 33 doanh nghiệp Nhóm 1 gồm 33 doanh nghiệp bị phá sản từ năm 1946 đến năm 1965.Nhóm 2 gồm 33 doanh nghiệp không

bị phá sản và vẫn hoạt động bình thường đến năm 1966.Các doanh nghiệp không

bị phá sản có quy mô, ngành nghề tương ứng từng cặp với các doanh nghiệp bị phá sản được chọn lấy dữ liệu Từ số liệu của bảng cân đối kế toán và báo cáo kết quả hoạt động kinh doanh, 22 chỉ số tài chính được tính toán và phân thành 5 nhóm: thanh khoản, lợi nhuận, đòn bẩy, khả năng thanh toán và chỉ số hoạt động Trong danh mục 22 chỉ số tài chính, có 5 chỉ số được lựa chọn để sử dụng vào mô hình

Trang 24

Nếu Z<1.81: công ty nằm trong vùng nguy hiểm, có nguy cơ cao phá phá sản/kiệt quệ tài chính

Mô hình dự đoán phá sản trên của Altman nhận được nhiều ý kiến là khó có thể

áp dụng đại trà cho các doanh nghiệp nhất là các doanh nghiệp chưa tiến hành cổ phần hóa.Khắc phục điều này, Altman và các cộng sự phát triển thêm chỉ số Z ban đầu thành chỉ số Z’ trong đó biến X4 dùng giá trị sổ sách của vốn chủ sở hữu thay thế giá trị thị trường để có thể áp dụng cho các loại hình doanh nghiệp khác ngoài công ty cổ phần

Mô hình Z’- score dùng cho các doanh nghiệp chưa cổ phần hóa là:

Z’ = 0,717 X1+ 0,847 X2+ 3,107X3+ 0,420 X4+ 0,998 X5

Trong đó các biến đều được giữ nguyên với mô hình cũ, ngoại trừ biến X4 Nếu Z’ > 2,9 : Doanh nghiệp nằm trong vùng an toàn, chưa có nguy cơ phá sản Nếu 1,23< Z’ < 2,9 : Doanh nghiệp nằm trong vùng cảnh báo, có thể có nguy

Giống với chỉ số Z’, biến X4 trong chỉ số Z” vẫn sử dụng giá trị sổ sách của vốn chủ sở hữu.Chỉ số Z” có thể được dùng cho hầu hết các ngành và các loại hình doanh nghiệp

Nếu Z” > 2,6: Doanh nghiệp nằm trong vùng an toàn, chưa có nguy cơ phá sản Nếu 1,1< Z” < 2,6: Doanh nghiệp nằm trong vùng cảnh báo, có thể có nguy cơ phá sản

Nếu Z” < 1,1: Doanh nghiệp nằm trong vùng nguy hiểm, có nguy cơ phá sản cao

Trang 25

Altman và cộng sự còn thực hiện nhiều nghiên cứu tiếp theo cùng lĩnh vực dự báo phá sản Năm 1995, Altman cùng cộng sự, từ mô hình Z- score đã phát triển nên thành mô hình EMS (Z” điều chỉnh).Trong đó, nghiên cứu đưa ra chỉ số xếp loại trái phiếu của Mỹ

Bảng 1.2 Xếp loại trái phiếu Mỹ dựa trên chỉ số mô hình EMS

US bond rating equivalent based on EMS

Trang 26

Năm 1977, Altman, Haldeman và Narayanan đã tiếp tục xây dựng mô hình rủi

ro tín dụng còn gọi là mô hình ZETA với nhiều cải tiến hơn mô hình Z- score với

7 biến được sử dụng Mô hình mới đã có hiệu quả trong việc phân loại các công ty

bị phá sản đến 5 năm trước khi thất bại dựa trên một mẫu bao gồm các nhà sản xuất và nhà bán lẻ

Các nghiên cứu của Edward I Altman về dự đoán phá sản khá phong phú, có thể áp dụng cho nhiều loại hình doanh nghiệp khác nhau và góp phần đặt nền móng cho những nghiên cứu tiếp sau với cùng chủ đề dự đoán phá sản/kiệt quệ

Phương pháp phân tích phân biệt bao gồm phân tích phân biệt đơn biến và đa biến này khá đơn giản và việc xác định các biến trong mô hình là dễ dàng Tuy nhiên phương pháp chỉ dừng lại ở việc dự đoán là công ty kiệt quệ hay không kiệt quệ chứ không xác định được xác suất kiệt quệ xảy ra Ngoài ra phương pháp này còn bị chỉ trích vì những giả định không thực tế của nó, chẳng hạn như sự phân chia tuyến tính, biến dự báo độc lập

Để khắc phục những hạn chế như vậy, các nhà nghiên cứu đã đề xuất mô hình xác suất có điều kiện tuyến tính (LPM) và logit hay probit phân tích hồi quy.Điển hình phương pháp dự báo về những thất bại kinh doanh của Ohlson (1980)

1.2.2 Kỹ thuật phân tích Logit

1.2.2.1 Phân tích Logit của Ohlson (1980)

Không giống như phân tích phân biệt - chỉ xác định được công ty là kiệt quệ hay không kiệt quệ, phân tích logit còn có thể xác định được xác suất xảy ra kiệt quệ tài chính của công ty.Các hệ số của mô hình phân tích logit được ước lượng bằng phương pháp “hợp lý cực đại” (maximum likelihood).Phân tích logit sử dụng hàm số xác suất tích lũy logistic để dự báo kiệt quệ tài chính Kết quả của hàm số

có giá trị trong khoảng 0 và 1, đó là xác suất xảy ra kiệt quệ tài chính, có dạng như phương trình sau:

Trang 27

Sử dụng mô hình hồi quy Logistic và dữ liệu từ báo cáo tài chính của các doanh nghiệp Mỹ trong giai đoạn 1970-1976, ông đã phát triển một mô hình ước tính về khả năng thất bại của các doanh nghiệp Thu thập dữ liệu từ 105 doanh nghiệp phá sản và 2.058 doanh nghiệp không bị phá sản trong lĩnh vực công nghiệp, giai đoạn

từ 1970-1976 mà đã giao dịch trên Thị trường chứng khoán Mỹ ít nhất 3 năm Các chỉ số tài chính được tính toán và lựa chọn sử dụng trong mô hình đại diện cho 4 nhóm chỉ số tài chính cơ bản trong việc dự đoán khả năng phá sản của doanh nghiệp gồm: quy mô, cấu trúc tài chính, hiệu quả hoạt động và tính thanh khoản

Từ đó, Ohlson lựa chọn 9 biến độc lập mà ông cho rằng sẽ hiệu quả trong việc dự báo sự phá sản/kiệt quệ tài chính

Các biến độc lập gồm:

SIZE = log (total assets/GNP price-level index);

TLTA = Tổng nợ phải trả/ tổng tài sản;

WCTA = Vốn lưu động ròng/ tổng tài sản;

CLCA = Nợ ngắn hạn/tài sản lưu động;

OENEG = 1 nếu tổng nợ phải trả > tổng tài sản và ngược lại;

NITA = Lợi nhuận sau thuế/tổng tài sản;

FUTL = Quỹ hoạt động / tổng phải trả;

INTWO = 1 nếu thu nhập ròng giảm trong 2 năm liên tiếp và ngược lại;

CHIN = (NIt - NIt-1)/(│NIt│+│NIt-1│), NIt là thu nhập ròng

Trang 28

Trên cơ sở lý thuyết và các nghiên cứu trước về khả năng phá sản/ kiệt quệ tài chính, Ohlson đưa ra tính chất biến thiên của biến độc lập so với biến phụ thuộc như sau: TLTA, CLCA, INTWO có tính chất đồng biến; SIZE, WCTA, NITA, FULT,CHIN có tính chất nghịch biến; OENEG không xác định Ba mô hình được nghiên cứu gồm: mô hình thứ nhất là dự báo sự thất bại trong 1 năm, mô hình thứ hai là dự báo sự thất bại trong 2 năm, và mô hình thứ ba là dự báo sự thất bại trong

1 hoặc 2 năm Sau đó Ohlson sử dụng phương pháp hồi quy Logistic để dự báo khả năng phá sản của doanh nghiệp cho mỗi mô hình

Kết quả thực nghiệm cho thấy khả năng dự đoán chính xác của các mô hình là trên 90%.Việc phân loại doanh nghiệp dựa vào giá trị tính toán được của P (P là xác suất doanh nghiệp có nguy cơ phá sản/ kiệt quệ).Nếu P>0.5 doanh nghiệp bị phân vào nhóm có khả năng phá sản/kiệt quệ tài chính còn nếu P<0.5 thì không có khả năng phá sản/ kiệt quệ

1.2.2.2 Nghiên cứu của Ying Wuang và Michael Campbell (2010)

Năm 2011, Ying Wuang và Michael Campbell đã tiến hành kiểm chứng lại mô hình của Ohlson về dự báo phá sản, kiệt quệ Lấy dữ liệu từ các công ty niêm yết thông tin công khai trên sàn giao dịch của Trung Quốc gồm các công ty bị hủy niêm yết và các công ty vẫn tiếp tục hoạt động Thời gian thu thập dữ liệu là trong khoảng thời gian 11 năm từ năm 1998 đến năm 2008, dữ liệu được thu thập tại www.sina.com.cn

Nghiên cứu của 2 ông giống nghiên cứu trước của Ohlson về mô hình áp dụng, các biến được lựa chọn nhưng có một số khác biệt như quan điểm lựa chọn về phá sản khác nhau Ohlson chọn các doanh nghiệp là phá sản khi họ nộp đơn xin bảo

hộ phá sản, trong khi nghiên cứu của Ying Wuang và Michael Campbell chọn các công ty bị hủy niêm yết trên sàn giao dịch do vấn đề tài chính Ohlson chỉ lấy dữ liệu của các công ty thuộc lĩnh vực công nghiệp, trong khi nghiên cứu của Ying Wuang và Michael Campbell mở rộng ra với cả các công ty không phải trong lĩnh vực công nghiệp

Trang 29

Cũng giống nghiên cứu của Ohlson, mô hình hồi qui Logistic được sử dụng Biến phụ thuộc là ở dạng nhị phân và được xác định là 1 nếu doanh nghiệp bị loại khỏi sàn và 0 nếu doanh nghiệp không bị loại khỏi sàn Chín biến độc lập sử dụng cho nghiên cứu này được chọn theo mô hình Ohlson gồm:

SIZE = log (total assets/GNP price-level index);

TLTA = Tổng nợ phải trả/ tổng tài sản;

WCTA = Vốn lưu động ròng/ tổng tài sản;

CLCA = Nợ ngắn hạn/tài sản lưu động;

OENEG = 1 nếu tổng nợ phải trả > tổng tài sản và ngược lại;

NITA = Lợi nhuận sau thuế/tổng tài sản;

FUTL = Quỹ hoạt động / tổng phải trả;

INTWO = 1 nếu thu nhập ròng giảm trong 2 năm liên tiếp và ngược lại;

CHIN = (NIt - NIt-1)/(│NIt│+│NIt-1│), NIt là thu nhập ròng

Dựa vào lý thuyết và nghiên cứu trước đây của Ohlson (1980), 2 tác giả đã chỉ

ra dấu của các biến như sau: TLTA, CLCA, INTWO có tính chất đồng biến; SIZE, WCTA, NITA, FULT, CHIN có tính chất đồng biến; OENEG không xác định Ying Wuang và Michael Campbell cũng xây dựng 3 mô hình ước lượng gồm: mô hình 1 dự đoán khả năng loại hủy niêm yết trong vòng một năm, mô hình 2 dự đoán khả năng hủy niêm yết trong vòng hai năm, mô hình 3 dự đoán khả năng hủy niêm yết trong vòng một hoặc hai năm Phân tích hồi quy Logistic được sử dụng

để ước lượng cho 3 mô hình và thu được kết quả như sau: INTWO và OENEG có

ý nghĩa thống kê cho cả 3 mô hình SIZE có ý nghĩa thống kê trong mô hình 1và

2, CHIN có ý nghĩa thống kê trong mô hình 2 Tỷ lệ dự đoán chính xác của mô hình khoảng trên 95%

1.2.2.3 Nghiên cứu của Dionysios Polemis và Dimitrios Gounopoulos (2012)

Nghiên cứu của 2 tác giả Dionysios Polemis và Dimitrios Gounopoulos(2012)

đi vào xác định các đặc điểm tài chính mà đánh giá và dự đoán khủng hoảng tài chính công ty trong các công ty giao dịch công khai niêm yết tại thị trường chứng khoán Luân Đôn Hai tác giả sử dụng phân tích logit nhị phân để mô tả mối quan

Trang 30

hệ giữa biến phụ thuộc và một bộ biến độc lập Trong trường hợp nghiên cứu, biến phụ thuộc được phân thành nhóm các công ty khỏe mạnh và nhóm công ty khủng hoảng Một tập hợp 76 công ty khủng hoảng tài chính và đang tiếp tục của Anh được thu thập dữ liệu từ năm 1998 đến năm 2003 Những đặc điểm tài chính của các công ty được lấy từ cơ sở dữ liệu WorldScope European Disclosure Các công

ty trong mẫu chủ yếu thuộc lĩnh vực sản xuất và bán lẻ

Trong 76 công ty trong mẫu, 38 công ty đã trải qua khủng hoảng và bị hủy niêm yết trong giai đoạn nghiên cứu, 38 công ty còn lại là những công ty là những công

ty tiếp tục (nghĩa là họ vẫn tiếp tục giao dịch trên sàn giao dịch chứng khoán Luân Đôn tại thời điểm phân tích trong ít nhất 2 năm nữa) Những công ty tiếp tục được lựa chọn theo ngành công nghiệp, tổng tài sản, năm khủng hoảng và tiêu chí bổ sung được sử dụng để chọn những công ty tiếp tục là tồn tại ít nhất 2 năm sau năm khủng hoảng của công ty được xem là đối tác Các biến độc lập là các hệ số tài chính được tính toán từ các báo cáo tài chính được công khai của các công ty Việc lựa chọn các biến độc lập nào dựa vào những nghiên cứu trước

Sau khi tiến hành một phân tích phân biệt từ danh sách 10 biến được chọn chỉ còn 5 biến tìm thấy có ý nghĩa thống kê đáng kể Đó là:

R1: vốn lưu động ròng trên tổng tài sản Vốn lưu động ròng là sự khác biệt giữa tài sản ngắn hạn và nợ ngắn hạn Một giá trị tiêu cực của tỷ lệ này báo hiệu rằng công ty có thể gặp vấn đề trong việc đáp ứng các nghĩa vụ ngắn hạn bởi vì không

có đủ tài sản ngắn hạn để trang trải nghĩa vụ nợ

R2: tổng nợ trên tổng tài sản Chỉ số này đo lường mức độ trong đó vốn vay được sử dụng tài trợ cho hoạt động của công ty Điều này cung cấp những hiểu biết về các điều kiện tài chính của công ty

R3: Lợi nhuận trước thuế trên tổng tài sản(ROA) Đây là chỉ tiêu đo lường lợi nhuận trên tài sản cho cả chủ nợ và chủ sở hữu và đưa ra thông tin giá trị về cách

sử dụng có hiệu quả nguồn tài nguyên

Trang 31

R4: Thu nhập trước thuế và lãi vay trên tổng tài sản Tỷ lệ này ước tính hiệu quả một công ty có thể kiếm được lợi nhuận từ tài sản của mình Một giá trị cao của chủ số này cung cấp một dấu hiệu cảu hiệu suất hoạt động vững chắc

MVTD: log của tổng tài sản Đây là đo lường tổng tài sản công ty

Tuy nhiên, khi phân tích tương quan, biến lợi nhuận trước thuế trên tổng tài sản (R3) và thu nhập trước thuế và lãi vay trên tổng tài sản (R4)được tìm thấy có liên quan cao Do tỷ số tài chính R3 có ý nghĩa thống kê hơn tỷ số tài chính R4, tỷ số R4 đã bị loại bỏ với sự mất mát tối thiểu độ chính xác của dự báo Hồi qui logit nhị phân được sử dụng để ước lượng mô hình Kết quả ước lượng:

Z= -2,8 +1,29R1 -1,34R2 +1,68R3 +0,65LGMVTD

Mô hình sử dụng giá trị điểm cắt là 0,5 để phân loại công ty Độ chính xác dự báo của mô hình là 79% cho việc thực hiện phân loại công ty một năm trước khủng hoảng; tổng công suất dự báo của mô hình giảm xuống còn 70% khi thực hiện phân loại 2 năm trước khủng hoảng(trong đó phân loại chính xác cho nhóm khủng hoảng

là 63%, nhóm tiếp tục là 76%) Khi mô hình được áp dụng cho dữ liệu 3 năm trước khủng hoảng, tổng độ chính xác của mô hình giảm xuống còn 66%

1.2.3 Phương pháp máy học dựa trên trí tuệ thông minh nhân tạo

Theo Ravi Kumar và Ravi (2007), các nhà nghiên cứu sử dụng nhiều phương pháp khác nhau của các kỹ thuật thông minh để giải quyết vấn đề này (Carlos, 1996; Fletcher &Goss, 1993; Wilson & Sharda, 1994) và mạng nơron (NN) là kỹ thuật thường được sử dụng nhất Phương pháp khai thác dữ liệu khác bao gồm cây quyết định (DT) (Frydman, Altman, & Kao, 1985) và support vector machines (SVM) (Fan & Palaniswami, 2000; Gestel et al, 2006) được sử dụng để nghiên cứu dự báo kiệt quệ tài chính

Mạng neural nhân tạo (Artificial Neural Network: ANN), gọi tắt neuralnetwork

là mô hình xử lý thông tin mô phỏng hoạt động của các hệ neural sinhhọc mà cụ thể hơn ở đây là bộ não con người Trong đó, thành phần cơ bản của ANN là neural nhân tạo có cách thức hoạt động và xử lý tương tự neural sinhhọc ANN được hình thành từ số lượng lớn các neural được liên kết với nhau theocấu trúc từng tầng

Trang 32

(layer), các neural kết nối với nhau giữa các tầng thông quatrọng số liên kết (weight)

Dhar, Mukherjee, và Ghoshal (2010) đã chỉ ra rằng việc tối ưu hóa lựa chọn trọng số liên kết trong quá trình xây dựng mô hình, chẳng hạn như thay đổi số lượng các tế bào thần kinh cho mỗi lớp, số ẩn lớp, và việc lựa chọn tỷ lệ huấn luyện/thử nghiệm, làm tăng hiệu quả dự báo

Cây quyết định (Decision Tree) là một cây phân cấp có cấu trúc được dùng để phân lớp các đối tượng dựa vào dãy các luật (series of rules) Khi cho dữ liệu về các đối tượng gồm các thuộc tính cùng với lớp (classes) của nó, cây quyết định sẽ sinh ra các luật để dự đoán lớp của các đối tượng chưa biết (unseen data)

Support vector machines (SVM) là một mô hình máy học giám sát được dùng

để phân tích, phân lớp dữ liệu SVM nhận dữ liệu vào và phân loại chúng vào hai lớp khác nhau.Với một bộ các ví dụ luyện tập thuộc hai thể loại cho trước, thuật toán SVM xây dựng một mô hình SVM để phân loại các ví dụ khác vào hai thể loại đó

Trang 33

Chương 2 – DỰ BÁO KIỆT QUỆ TÀI CHÍNH BẰNG PHƯƠNG PHÁP KHAI PHÁ DỮ LIỆU (DATA MINING)

2.1 Tổng quan về Khai phá dữ liệu (Data mining)

2.1.1 Khái niệm của Data mining

Khái niệm về khai phá dữ liệu (Data Mining) hay phát hiện tri thức (Knowledge Discovery) có rất nhiều cách diễn đạt khác nhau nhưng về bản chất đó là quá trình tự động trích xuất thông tin có giá trị (thông tin dự đoán – Predictive Information) ẩn chứa trong khối lượng dữ liệu khổng lồ trong thực tế

Data mining nhấn mạnh 2 khía cạnh chính đó là khả năng trích xuất thông tin

có ích tự động (Automated) và thông tin mang tính dự đoán (Predictive)

Data Mining liên quan chặt chẽ đến các lĩnh vực sau:

Statistics (Thống kê): Kiểm định model và đánh giá tri thức phát hiện được Machine Learning (Máy học): Nghiên cứu xây dựng các giải thuật trên nền tảng của trí tuệ nhân tạo giúp cho máy tính có thể suy luận (dự đoán) kết quả tương lai thông qua quá trình huấn luyện (học) từ dữ liệu lịch sử

Databases (Cơ sở dữ liệu): Công nghệ quản trị dữ liệu nhất là kho dữ liệu Visualization (Trực quan hóa): Giúp dữ liệu dễ hiểu, dễ sử dụng như biểu đồ,

đồ, đồ thị

2.1.2 Nhiệm vụ của Data Mining

Nhiệm vụ của data mining có thể phân thành 2 loại chính đó là dự đoán (Predictive) vàmô tả (Descriptive)

- Trong nhiệm vụ dự đoán (Predictive) data mining thực hiện các công việc như:

 Classification : Phân lớp

 Regression : Hồi qui

 Deviation Detection: Phát hiện độ lệch

- Trong nhiệm vụ dự đoán (Descriptive) data mining thực hiện các công việc như:

 Clustering: Phân cụm

Trang 34

 Association Rule Discovery: Phát hiện luật kết hợp

Để thực hiện các nhiệm vụ nàymột số thuật toán phổ biến được dùng trong Data Mining như cây quyết định (decision tree), mạng nơ ron nhân tạo (neural network), Support Vector Machine (SVM) v.v

2.1.3 Ứng dụng của Data Mining:

Trong cuộc sống, ứng dụng của khai phá dữ liệu vô cùng đa dạng, có thể dùng trong:

– Bảo hiểm, tài chính và thị trường chứng khoán: phân tích tình hình tài chính của một công ty dựa trên báo cáo tài chính; dựa vào dữ liệu về thị trường chứng khoán để dự đoán được giá cổ phiếu; phát hiện gian lận,…

– Thống kê, phân tích dữ liệu và hỗ trợ ra quyết định

– Y học: dựa vào mối liên hệ giữa các triệu chứng để chuẩn đoán bệnh và hướng điều trị

– Mạng viễn thông: phân tích các cuộc gọi điện thoại để dự đoán hành vi người dùng nhằm nâng cao chất lượng dịch vụ

– Bán hàng: phân tích các mặt hàng để dự đoán nhu cầu người dùng để đưa ra hướng phát triển đúng cho nhà sản xuất…

2.2 Một số thuật toán sử dụng trong Data mining

2.2.1 Neural network (NN)

Mạng Neuron nhân tạo (Artificial Neural Network- ANN) gọi tắt neural network là mô hình xử lý thông tin được mô phỏng dựa trên hoạt động của hệ thống thần kinh của sinh vật, bao gồm số lượng lớn các Neuron được gắn kết để

xử lý thông tin.ANN giống như bộ não con người, được học bởi kinh nghiệm (thông qua huấn luyện), có khả năng lưu giữ những kinh nghiệm hiểu biết (tri thức)

và sử dụng những tri thức đó trong việc dự đoán các dữ liệu chưa biết (unseen data)

Các ứng dụng của mạng Neuron được sử dụng trong rất nhiều lĩnh vực như điện, điện tử, kinh tế, quân sự,… để giải quyết các bài toán có độ phức tạp và đòi hỏi có

độ chính xác cao như điều khiển tự động, khai phá dữ liệu, nhận dạng,…

Trang 35

Một neural là một đơn vị xử lý thông tin và là thành phần cơ bản của một mạng ANN Cấu trúc của một neural được mô tả trong Hình 2.1 Trong đó:

• Các giá trị đầu vào (x1,x2, xN ) Trong quá trình thực nghiệm dữ liệu này thường được đưa vào dưới dạng một véc tơ N chiều

• Tập các liên kết: Có chức năng truyền thông tin trong đó ứng với một liên kết

có một trọng số (hay trọng số liên kết là số thực biểu thị mức độ quan trọng của liên kết với đầu ra -weight)Wk1,Wk2, WkN , Thông thường, các trọng số này được khởi tạo một cách ngẫu nhiên ở thời điểm khởi tạo mạng và được cập nhật liên tục trong quá trình học mạng

• Hàm kết hợp ak (combination function): Thường dùng để tính tổng của tích các giá trị đầu vào với trọng số liên kết tương ứng của nó (vì thế một số tài liệu là hàm tổng - summing function)

Hình 2.1 Cấu trúc của một neural

(3.1) Với Wki là trọng số liên kết giữa của các neural đầu vào và bk là ngưỡng hay độ lệch (bias)

• Hàm truyền f(.) (transfer function) hay hàm kích hoạt (active function): Hàm này được dùng để giới hạn phạm vi đầu ra của mỗi neural Nó nhận đầu vào là kết quả của hàm kết hợp và ngưỡng đã cho Thông thường, phạm vi đầu ra của mỗi

Trang 36

nơron được giới hạn trong đoạn [0,1] hoặc [-1, 1] Các hàm truyền rất đa dạng, có thể là các hàm tuyến tính hoặc phi tuyến.Việc lựa chọn hàm truyền nào là tuỳ thuộc vào từng bài toán và kinh nghiệm của người thiết kế mạng.Một số hàm truyền thường sử dụng trong các mô hình mạng nơron được đưa ra trong 3.1.Trong đó các nghiên cứu trước đây thường sử dụng hàm sigmod, các nghiên cứu gần đây về

DL thường sử dụng hàm ReLu ra đời thường hay được sử dụng

• Đầu ra yk: Là tín hiệu đầu ra của một neural

Bảng 2.1 Một số hàm truyền trong mạng neural yk = f(ak)

Như vậy, tương tự như neural sinh học, neural nhân tạo cũng nhận các tín hiệu đầu vào, xử lý (nhận các tín hiệu này với trọng số liên kết, tính tổng các tích thuđược rồi

gửi kết quả tới hàm truyền), và cho một tín hiệu đầu ra (là kết quả của hàm truyền)

2.2.2 Thuật toán cây quyết định Decision tree (DT)

Trang 37

Cây quyết định (Decision Tree) là một cây phân cấp có cấu trúc được dùng để phân lớp các đối tượng dựa vào dãy các luật (series of rules).Các thuộc tính của đối tượng (ngoại trừ thuộc tính phân lớp – Category attribute) có thể thuộc các kiểu

dữ liệu khác nhau (Binary, Nominal, ordinal, quantitative values) trong khi đó thuộc tính phân lớp phải có kiểu dữ liệu là Binary hoặc Ordinal

Tóm lại, cho dữ liệu về các đối tượng gồm các thuộc tính cùng với lớp (classes) của nó, cây quyết định sẽ sinh ra các luật để dự đoán lớp của các đối tượng chưa biết (unseen data)

Cây quyết định là một phương pháp phân lớp rất hiệu quả và dễ hiểu Tuy nhiên

có một số chú ý khi sử dụng cây quyết định trong xây dựng các mô hình phân lớp như sau:

Hiệu quả của phân lớp của cây quyết định (Series of Rules) phụ thuộc rất lớn vào training data Chẳng hạn cây quyết định được tạo ra bởi chỉ giới hạn trong một

ít samples training data thì hiệu quả ứng dụng cây quyết định để dự đoán các trường hợp khác là không cao (thường training data phải đủ lớn và tin cậy) và vì vậy ta không thể nói rằng tập các luật (Series of Rules) được sinh ra bởi cây quyết định trên là tập luật tốt nhất

2.2.3 Support Vector Machine (SVM)

SVM là một thuật toán phân loại nhị phân, SVM nhận dữ liệu vào và phân loại chúng vào hai lớp khác nhau.Với một bộ các ví dụ huấn luyện thuộc hai thể loại cho trước, thuật toán SVM xây dựng một mô hình SVM để phân loại các ví dụ khác vào hai thể loại đó

Support vector machine (SVM) xây dựng (learn) một siêu phẳng (hyperplane)

để phân lớp (classify) tập dữ liệu thành 2 lớp riêng biệt.Để làm được điều này SVM

sẽ xây dựng một siêu phẳng hoặc một tập hợp các siêu phẳng trong một không gian nhiều chiều hoặc vô hạn chiều, có thể được sử dụng cho phân loại, hồi quy, hoặc các nhiệm vụ khác Để phân loại tốt nhất thì phải xác định siêu phẳng (Optimal hyperplane) nằm ở càng xa các điểm dữ liệu của tất cả các lớp (Hàm lề) càng tốt,

vì nói chung lề càng lớn thì sai số tổng quát hóa của thuật toán phân loại càng bé

Trang 38

Một siêu phẳng là một hàm tương tự như phương trình đường thẳng, y = ax + b Trong thực tế, nếu ta cần phân lớp tập dữ liệu chỉ gồm 2 feature, siêu phẳng lúc này chính là một đường thẳng

Về ý tưởng thì SVM sử dụng thủ thuật để ánh xạ tập dữ liệu ban đầu vào không gian nhiều chiều hơn Khi đã ánh xạ sang không gian nhiều chiều, SVM sẽ xem xét và chọn ra siêu phẳng phù hợp nhất để phân lớp tập dữ liệu đó

Muốn các điểm dữ liệu có thể được chia tách một cách tuyến tính, thì bạn phải cần chọn hai siêu phẳng của lề sao cho không có điểm nào ở giữa chúng và khoảng cách giữa chúng là tối đa

Trong nhiều trường hợp, không thể phân chia các lớp dữ liệu một cách tuyến tính trong một không gian ban đầu được dùng để mô tả một vấn đề.Vì vậy, nhiều khi cần phải ánh xạ các điểm dữ liệu trong không gian ban đầu vào một không gian mới nhiều chiều hơn, để việc phân tách chúng trở nên dễ dàng hơn trong không gian mới

Dùng để làm gì? Support vector machine (SVM) xây dựng (learn) một siêu

phẳng (hyperplane) để phân lớp (classify) tập dữ liệu thành 2 lớp riêng biệt

Siêu phẳng là cái gì? Một siêu phẳng là một hàm tương tự như phương trình

đường thẳng, y = ax + b Trong thực tế, nếu ta cần phân lớp tập dữ liệu chỉ gồm 2 feature, siêu phẳng lúc này chính là một đường thẳng

Về ý tưởng thì SVM sử dụng thủ thuật để ánh xạ tập dữ liệu ban đầu vào không gian nhiều chiều hơn Khi đã ánh xạ sang không gian nhiều chiều, SVM sẽ xem xét và chọn ra siêu phẳng phù hợp nhất để phân lớp tập dữ liệu đó

Ta lấy ví dụ đơn giản về phân chia tập các quả bóng trắng và đen đặt trên một cái bàn Nếu các quả bóng phân bố không quá đan xen vào nhau, ta có thể dùng một cây que dài để chia các quả bóng thành hai tập trắng và đen mà không động đến các quả bóng

Lúc này, khi đưa một quả bóng mới đặt lên mặt bàn, bằng cách xác định nó nằm bên phía nào của cây que, ta có thể dự đoán màu sắc của quả bóng đó

Trang 39

Vậy các quả bóng, cái bàn và cây que tượng trưng cho cái gì? Các quả bóng

tượng trưng cho các điểm dữ liệu, màu trắng và đen tượng trưng cho 2 lớp.Cái bàn tượng trưng cho một mặt phẳng Cây que tượng trưng cho một siêu phẳng đơn giản

đó là một đường thẳng

Điểm hấp dẫn ở đây đó là SVM có thể hình dung ra được đâu là siêu phẳng phù hợp nhất

Đối với trường hợp phức tạp hơn thì sao? Thật ra dữ liệu ngoài thực tế rất

phức tạp.Nếu các quả bóng xen lẫn vào nhau thì một cây que khó có thể phân lớp được

Ta sử dụng thủ thuật: nhấc bổng cái bàn lên, nhanh chóng hất các quả bóng lên trời Trong khi các quả bóng đang lơ lửng và nằm ở các vị trí thích hợp, ta dùng một mảnh giấy lớn để phân lớp các quả bóng đang lơ lửng này.Mảnh giấy lớn lúc này cũng được gọi là một siêu phẳng, chỉ có điều đây là phương trình mặt phẳng chứ không phải phương trình đường thẳng

Hình 2.2 Support vector machine

Hình 2.2 mô tả về thuật toán SVM: Cho trước một tập huấn luyện được biểu diễn trong không gian vector trong đó mỗi tài liệu là một điểm, phương pháp này tìm ra một siêu mặt phẳng h quyết định tốt nhất có thể chia các điểm trên không

Trang 40

gian này thành hai lớp riêng biệt tương ứng lớp chứa các dữ liệu có chứa đặc trưng được mô phỏng bằng chấm tròn đen và lớp lớp chứa các dữ liệu có chứa đặc trưng được mô phỏng bằng chấm tròn trắng Chất lượng của siêu mặt phẳng này được quyết định bởi khoảng cách (gọi là biên) của điểm dữ liệu gần nhất của mỗi lớp đến mặt phẳng này.Khoảng cách biên càng lớn thì mặt phẳng quyết định càng tốt đồng thời việc phân loại càng chính xác.Mục đích thuật toán SVM tìm được khoảng cách biên lớn nhất

2.3 Áp dụng Data mining trong dự báo kiệt quệ tài chính

Trong luận văn này, học viên sẽ dự báo kiệt quệ tài chính bằng cách sử dụng phương pháp khai phá dữ liệu.Trong đó, cây quyết định (decision tree), mạng nơ ron nhân tạo (neural network), Support Vector Machine (SVM) sẽ là ba kỹ thuật được sử dụng kết hợp để cho ra kết quả dự báo.Hình2.3mô tả các bước thực nghiệm

để dự báo kiệt quệ tài chính được sử dụng trong luận văn

Mục tiêu quan trọng của luận văn này là để xác định xemchúng ta có thể thấy trước những dấu hiệu của sự suy thoái tài chínhbằng phương pháp khai phá dữ liệu hay không? Để đạt được mục tiêu này thì học viên sẽ thu thập dữ liệu của những công ty niêm yết trong khung thời gian 1 năm, 2 năm, 3 năm trước thời điểm cần

dự báo.Các dữ liệu này được dùng để xây dựng mô hình và xem xét mức độ chính xác của dự báo

Như vậy, các bước thực hiện để dự báo kiệt quệ tài chính được tiến hành trình

tự như sau: Dữ liệu đầu vào là các chỉ số tài chính của các công ty được thu thập trong khung thời gian 1 năm, 2 năm, 3 năm trước khi công ty bị rơi vào tình trạng kiệt quệ tài chính Các dữ liệu đầu vào này được dùng để xây dựng mô hình dự báo.Học viên sẽ xem xétcác thuật toán máy học gồm cây quyết định (decision tree), mạng nơ ron nhân tạo (neural network), Support Vector Machine (SVM)có cho kết quả dự báo kiệt quệ tài chính tốt hay không và phương pháp nào dự báo tốt nhất

Ngoài ra dùng dữ liệu tài chính của năm quá khứ (t – z) nào để dự báo cho năm thứ t sẽ cho kết quả dự báo tốt nhất và chỉ số tài chính nào có ý nghĩa quan trọng

Ngày đăng: 10/08/2017, 16:58

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w