1. Trang chủ
  2. » Luận Văn - Báo Cáo

1228 Ước Lượng Xác Suất Vỡ Nợ Của Khách Hàng Doanh Nghiệp Bằng Phương Pháp Học Máy 2023.Docx

77 1 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 77
Dung lượng 281,17 KB

Cấu trúc

  • CHƯƠNG 1: GIỚI THIỆU (12)
    • 1.1. Đặt vấn đề (12)
    • 1.2. Tính cấp thiết của đề tài (14)
    • 1.3. Mục tiêu của đề tài (16)
    • 1.4. Câu hỏi nghiên cứu (17)
    • 1.5. Đối tượng và phạm vi nghiên cứu (17)
    • 1.6. Phương pháp nghiên cứu (17)
    • 1.7. Đóng góp của đề tài (18)
    • 1.8. Bố cục của đề tài nghiên cứu (18)
  • CHƯƠNG 2: CƠ SỞ LÝ THUYẾT VÀ KHẢO LƯỢC CÁC NGHIÊN CỨU (20)
    • 2.1. Xác suất vỡ nợ (20)
    • 2.2. Các chỉ số tài chính (22)
    • 2.3. Các mô hình ước lượng xác suất vỡ nợ của doanh nghiệp (23)
    • 2.4. Khảo lược các nghiên cứu (29)
  • CHƯƠNG 3: MÔ HÌNH VÀ PHƯƠNG PHÁP NGHIÊN CỨU (34)
    • 3.1. Phương pháp xây dựng các mô hình (34)
    • 3.2. Thu thập và xử lý dữ liệu (36)
    • 3.3. Lựa chọn các biến đầu vào trong mô hình dự báo xác suất vỡ nợ (38)
    • 3.4. Các mô hình dự báo xác suất vỡ nợ được nghiên cứu (42)
      • 3.4.1. Mô hình Logistic (42)
      • 3.4.2. Mô hình cây quyết định (43)
      • 3.4.3. Mô hình random forest (44)
    • 3.5. Phương pháp lựa chọn mô hình dự báo xác suất vỡ nợ (45)
      • 3.5.1. Ma trận Confussion (45)
      • 3.5.2. Điểm số F1 (F1-score) (48)
  • CHƯƠNG 4: KẾT QUẢ NGHIÊN CỨU (50)
    • 4.1. Kết quả thống kê mô tả (50)
    • 4.2. Hệ số tương quan (51)
    • 4.3. Kết quả hồi quy của mô hình tham số (54)
      • 4.3.1. Kết quả hồi quy của mô hình logistic (54)
      • 4.3.2. Ma trận Confusion của mô hình hồi quy logistic (56)
    • 4.4. Kết quả hồi quy của các mô hình phi tham số (58)
      • 4.4.1. Mô hình cây quyết định (Decision tree) (58)
      • 4.4.2. Mô hình Random forest (60)
  • CHƯƠNG 5: KẾT LUẬN (63)
    • 5.1. Ứng dụng mô hình ước lượng xác suất vỡ nợ của khách hàng doanh nghiệp tại các Ngân hàng thương mại Việt Nam (63)
      • 5.1.1. Các công cụ hỗ trợ xác định các nhóm khách hàng doanh nghiệp tiềm năng 54 5.1.2. Kết quả mô hình làm cơ sở định hướng chính sách tín dụng (64)
      • 5.1.3. Vận dụng kết quả mô hình nhằm nâng cao hiệu quả quản trị rủi ro tín dụng tại các Ngân hàng thương mại (65)
    • 5.2. Áp dụng mô hình ước lượng xác suất vỡ nợ cho các Tổ chức xếp hạng tín dụng tại Việt Nam (66)
    • 5.3. Hạn chế của đề tài và hướng nghiên cứu tiếp theo (68)
      • 5.3.1. Hạn chế của đề tài (68)
      • 5.3.2. Hướng nghiên cứu tiếp theo (69)
  • TÀI LIỆU THAM KHẢO .........................................................................................60 (69)
  • PHỤ LỤC ...................................................................................................................64 (73)

Nội dung

BỘ GIÁO DỤC VÀ ĐÀO TẠO NGÂN HÀNG NHÀ NƯỚC VIỆT NAM TP HỒ CHÍ MINH, NĂM 2023 TRƯỜNG ĐẠI HỌC NGÂN HÀNG TP HỒ CHÍ MINH HOCHIMINH UNIVERSITYOF BANKING TRẦN KIM NGÂN ƯỚC LƯỢNG XÁC SUẤT VỠ NỢ CỦA KHÁCH HÀNG[.]

GIỚI THIỆU

Đặt vấn đề

Thứ nhất , "đại dịch Covid - 19 xuất hiện trong từ năm 2019 và diễn biến vô cùng phức tạp và dẫn đến nhiều ảnh hưởng nghiêm trọng" Nền kinh tế toàn cầu hiện đang phục hồi, dần mở cửa trở lại và các chiến dịch tiêm chủng vẫn đang tiếp tục Nhưng các doanh nghiệp trên thế giới ít nhiều "điêu đứng" vì Covid-19 khi đại dịch vẫn chưa kết thúc Không những thế, với sự xuất hiện của biến thể Delta, hay gần đây là biến chủngOmicron có khả năng lây lan nhanh và mạnh, cuộc chiến chống Covid - 19 trên thế giới bước sang giai đoạn khác khó khăn hơn Làn sóng phá sản của các công ty lớn các doanh nghiệp trên toàn cầu được hình thành từ giữa năm 2020 khi đại dịch Covid- 19 ảnh hưởng đến hầu hết các nước lớn trên thế giới.

Hình 1.1: Dự báo tỷ lệ vỡ nợ năm 2023 so với năm 2019

Nhìn vào Hình 1.1, có thể thấy rằng tỷ lệ vỡ nợ sẽ cao nhất ở Hồng Kông (+39%), Vương quốc Anh (+23%), Ý (+23%) và Đan Mạch (+15%) so với mức trước khi đại dịch diễn ra Thêm vào đó, tỷ lệ này tăng nhẹ tại Ca-na-da, Nam Phi và Cô-lôm-bi-a lần lượt là +9%, +5% và +5% Ngoài ra, nền kinh tế Pháp (+3%) và Thuỵ Điển (+1%) là gần như không thay đổi Ngược lại, nền kinh tế Mỹ với mức giảm mạnh, ước tính rằng sẽ giảm 12% so với năm 2019 tại năm 2023.

Thứ hai, "dịch Covid-19 cũng đã tàn phá các doanh nghiệp Việt Nam từ năm 2019".

Theo báo cáo "Tác động của Covid-19 đối với doanh nghiệp tại Việt Nam: Khảo sát nhanh về doanh nghiệp và Covid-19" của Ngân hàng Thế giới (2020), có khoảng 50% doanh nghiệp nhỏ và hơn 40% doanh nghiệp vừa phải đóng cửa tạm thời hoặc vĩnh viễn do ảnh hưởng của dịch Covid-19 Năm 2021, số doanh nghiệp tạm ngừng kinh doanh có thời hạn là gần 55.000, Tăng 18% theo năm; 48,1 nghìn doanh nghiệp tạm ngừng hoạt động chờ làm thủ tục giả thể, tăng 27,8%; 16,7 nghìn doanh nghiệp hoàn

The Insovency Growth forecasting in 2023 compared to 2019 tất thủ tục giải thể, giảm 4,1%, trong đó có 14,8 nghìn doanh nghiệp có quy mô vốn dưới 10 tỷ đồng, giảm 4% Có 211 doanh nghiệp có quy mô vốn trên 100 tỷ đồng, giảm20,7% Trung bình mỗi tháng có khoảng 10.000 công ty rời thị trường do không thể

"sống chung" với cường độ của đại dịch Covid-19.

Thứ ba, với nền kinh tế bị ảnh hưởng nặng nề bởi dịch bệnh Covid-19 và tình trạng phá sản doanh nghiệp gia tăng, "hệ thống xếp hạng tín dụng nội bộ của NHTM đánh giá rủi ro khi vay khách hàng và vô cùng hữu ích khi giúp ngân hàng đưa ra quyết định cho vay, điều này đóng một vai trò quan trọng trong quản lý rủi ro" Các NHTM tại ViệtNam ngày càng hiểu ra được ý nghĩa quan trọng của hệ thống này đối với hoạt động cho vay và quản lý rủi ro, đặc biệt khi các ngân hàng thương mại tại Việt Nam nỗ lực tuân thủ các tiêu chuẩn Basel II.

Tính cấp thiết của đề tài

Trong bối cảnh đó, tính cấp thiết của đề tài nghiên cứu này được thể hiện ở một số khía cạnh cụ thể sau:

Thứ nhất, "các mô hình xếp hạng tín dụng hiện nay còn một số hạn chế nhất định", còn nhiều ý kiến thảo luận và bất đồng về độ tin cậy của các mô hình xếp hạng tín nhiệm khiến việc lựa chọn mô hình trở nên khó khăn Xếp hạng tín dụng là yếu tố ước lượng tốt về xác suất vỡ nợ của các công ty (Huseyin & Bora, 2009) Theo công trình của Aysegul Iscanoglu (2005) và Hayden & Daniel (2010), có nhiều mô hình trong lĩnh vực thẩm định tín dụng đã được nghiên cứu, bao gồm mô hình phân tích biệt thức, mô hình logit (hồi quy logistic), mô hình cây quyết định và mạng nơ ron nhân tạo (ANN)), các mô hình hồi quy probit nêu ưu nhược điểm của từng mô hình Một số phân tích chi tiết của các mô hình trên đã được thực hiện Platt (1991) đã sử dụng mô hình logit để kiểm tra và lựa chọn các biến tài chính, đồng thời gợi ý rằng các biến tài chính theo tiêu chuẩn ngành nên được sử dụng trong báo cáo phá sản thay vì chỉ các biến tài chính của công ty Lawrence (1992) sử dụng mô hình logit để ước lượng xác suất vỡ nợ thế chấp Altman (1968) đã sử dụng mô hình phân tích vi phân.

" Thứ hai, "xác định các chỉ số tài chính ảnh hưởng đến kết quả của xếp hạng tín dụng luôn là mục tiêu và vấn đề nghiên cứu trong nghiên cứu xác suất vỡ nợ" Từ năm 1926 đến 1936, các nhà nghiên cứu đã sử dụng các chỉ số tài chính cơ bản để xếp hạng và nhiều phương pháp khác, chẳng hạn như Ramser & Foster (1931) với Vốn chủ sở hữu/tổng thu nhập thuần hoặc Fitzpatrick (1932) đã sử dụng tỷ lệ vốn chủ sở hữu/tài sản cố định Trong giai đoạn tiếp theo, Altman (1968) sử dụng các chỉ số tài chính trong các mô hình phân tích khác nhau để dự đoán khả năng phá sản của doanh nghiệp, bao gồm giá trị vốn chủ sở hữu/giá trị sổ sách của khoản nợ, thu nhập ròng của doanh nghiệp/tổng tài sản, thu nhập hoạt động/tổng tài sản, lợi nhuận sau thuế/tổng tài sản và vốn lưu động/tổng tài sản Tuy nhiên, sử dụng các mô hình phân tích khác nhau, Deakin

(1972) đã chọn 14 biến tài chính: tiền mặt/nợ ngắn hạn, dòng tiền thực/tổng nợ, tiền mặt/doanh thu ròng, tiền mặt/tài sản cố định, khả năng thanh toán hiện tại, tài sản ngắn hạn/ doanh thu thuần, tài sản lưu động/tổng tài sản, thu nhập/tổng tài sản, tài sản có tính thanh khoản cao/nợ ngắn hạn, tài sản có tính thanh khoản cao/doanh thu thuần, tài sản có tính thanh khoản cao/tổng tài sản, tổng nợ/tổng tài sản, vốn lưu động/doanh thu thuần, vốn lưu động /Tổng tài sản Theo thời gian trôi qua, các nhà khoa học đã phát hiện ra nhiều chỉ số tài chính có thể ảnh hưởng đến kết quả xếp hạng tín dụng, như Blum (1974) sử dụng tỷ suất lợi nhuận thị trường, tỷ lệ thanh toán nhanh, các biến tài chính của tài sản/hàng tồn kho thanh khoản cao, dòng tiền/tổng nợ, giá trị sổ sách/tổng nợ phải trả, giảm xu hướng lợi nhuận, giảm xu hướng tài sản/hàng tồn kho có tính thanh khoản cao hoặc Back, Laitinen, Sere & Wesel (1996) sử dụng 31 chỉ số khác nhau.

Thứ ba, "phương pháp xếp hạng tín nhiệm tại các NHTM Việt Nam còn mang tính chủ quan, định tính và dựa trên kinh nghiệm đánh giá của cán bộ tín dụng trực tiếp phục vụ khách hàng" (phương pháp chuyên gia) Do đó, không có cơ sở khoa học đáng tin cậy nào để ước lượng khả năng phá sản của một doanh nghiệp, mà cơ sở này chỉ hỗ trợ cho việc ra quyết định cho vay chứ không phải là cơ sở để ra quyết định Cho đến nay, ở Việt Nam có rất ít nghiên cứu được công bố về việc lựa chọn mô hình ước lượng xác suất vỡ nợ của doanh nghiệp dựa trên các chỉ số tài chính.

Thứ tư, "chính phủ đã tạo hành lang pháp lý giúp bộ phận xếp hạng tín nhiệm tăng cường tính minh bạch của thông tin, giúp các ngân hàng quản lý rủi ro tín dụng ngay từ đầu, hỗ trợ thị trường chứng khoán và thị trường trái phiếu" Việc nghiên cứu và lựa chọn các mô hình xếp hạng phù hợp sẽ góp phần rất lớn vào sự phát triển của hoạt động xếp hạng tín nhiệm tại Việt Nam Đặc biệt, Chính phủ đã ban hành Nghị định số 88/2014/NĐ-CP ngày 26/09/2014, nghị định này quy định về hoạt động kinh doanh dịch vụ xếp hạng và điều kiện hoạt động của các tổ chức xếp hạng hiện có đang hoạt động tại Việt Nam Đồng thời, Thủ tướng Chính phủ quyết định phê duyệt Kế hoạch phát triển dịch vụ xếp hạng tín nhiệm đến năm 2020 và định hướng đến năm 2030 của Thủ tướng Chính phủ số 507/QĐ-TTg ngày 17/4/2015, việc phát hành trái phiếu doanh nghiệp phải được xếp hạng từ của năm 2020 Rõ ràng, một trong những biện pháp quản lý rủi ro, được gọi là lựa chọn mô hình ước lượng xác suất vỡ nợ của công ty trên cơ sở các chỉ số tài chính liên quan, là phân loại khách hàng ngay từ đầu và đo lường nợ phải trả ngân hàng theo khuyến nghị của Uỷ ban Basel (Basel II, 2004).

Vì vậy, khoá luận tập trung vào vấn đề "Ước lượng xác suất vỡ nợ của khách hàng doanh nghiệp bằng phương pháp học máy" nhằm cung cấp cho các NHTM một cách cơ sở lý luận có hệ thống và bằng chứng thực nghiệm cho việc lựa chọn các mô hình dự báo phá sản doanh nghiệp phù hợp nhằm góp phần nâng cao hiệu quả quản trị rủi ro tín dụng của ngân hàng trong thời gian tới."

Mục tiêu của đề tài

Trên cơ sở xác định tiêu chí mô hình dự báo phù hợp và lựa chọn mô hình, nghiên cứu tiến hành lựa chọn mô hình dự báo xác suất vỡ nợ của các doanh nghiệp tại các NHTM ở Việt Nam dựa trên các chỉ số tài chính giai đoạn từ 2020 đến 2022 Giúp các ngân hàng thương mại sàng lọc khách hàng và quản trị rủi ro tín dụng tốt hơn Các mục tiêu cụ thể là:

Thứ nhất là điều tra xem các chỉ số tài chính nào có tác động lớn đến việc lựa chọn mô hình ước lượng xác suất vỡ nợ để hỗ trợ hệ thống NHTM Việt Nam và các tổ chức xếp hạng tín nhiệm trong việc xác định các khách hàng doanh nghiệp tiềm năng của họ.

Thứ hai là điều tra xem mô hình nào là phù hợp nhất cho ước lượng xác suất vỡ nợ của các khách hàng doanh nghiệp trong hệ thống NHTM Việt Nam bằng phương pháp học máy.

Thứ ba là nhận ra ảnh hưởng to lớn của các phương pháp học máy đối với việc ước lượng các ước lượng xác suất vỡ nợ của khách hàng doanh nghiệp.

Câu hỏi nghiên cứu

Để đạt được mục tiêu nghiên cứu, khoá luận tập trung trả lời các câu hỏi nghiên cứu chính:

(i) Các chỉ số tài chính nào có ảnh hưởng lớn đến việc lựa chọn mô hình ước lượng xác suất vỡ nợ của doanh nghiệp?

(ii) Làm thế nào để phương pháp học máy ảnh hưởng lớn đến việc xác định lại xác xuất vỡ nợ của các doanh nghiệp và mô hình nào mang lại kết quả tốt nhất trong việc ước lượng xác suất vỡ nợ của các doanh nghiệp?

(iii) Giới hạn của đề tài nghiên cứu và đề xuất, gợi ý, kết luận về đề tài như thế nào khi có kết quả của sự ảnh hưởng trên?

Đối tượng và phạm vi nghiên cứu

Đối tượng nghiên cứu: Đối tượng của nghiên cứu này là xác suất vỡ nợ của các doanh nghiệp ở Việt Nam.

Phạm vi nghiên cứu: Dữ liệu được thu thập từ các chỉ tiêu tài chính của báo cáo tài chính của 462 doanh nghiệp tại Việt Nam giai đoạn 2020 - 2022.

Phương pháp nghiên cứu

Nghiên cứu thực hiện cả hai phương pháp định tính và định lượng nhằm khắc phục những hạn chế của từng phương pháp và nâng cao độ tin cậy của kết quả nghiên cứu.

Phương pháp định tính: Thảo luận các quan điểm và khảo sát các yếu tố ảnh hưởng đến ước lượng xác suất vỡ nợ của các doanh nghiệp tại các NHTM Việt Nam bằng phương pháp học máy Từ đó, các thang đo được xây dựng để tiến hành nghiên cứu định lượng.

Phương pháp định lượng: Sử dụng nhiều phương pháp bao gồm Thống kê mô tả để xây dựng dữ liệu dựa trên các đặc điểm liên quan; Phương pháp so sánh giữa mô hình và thực tiễn để kết luận; Phương pháp Analytic-Synthetic để tổng hợp và phân tích dữ liệu phù hợp trong quá trình nghiên cứu Bên cạnh đó, khoá luận cũng sử dụng mô hình xếp hạng theo phương pháp cây quyết định (Decision tree) và phương pháp Random Forest để đánh giá hạng tín nhiệm của các doanh nghiệp.

Ngoài ra, công trình này sử dụng kết hợp nhiều phương pháp như phương pháp thống kê mô tả, phương pháp tổ chức dữ liệu theo các đặc trưng cần mô tả Rút ra kết luận bằng cách so sánh và đối chiếu các mô hình và thực tiễn Tổng hợp phân tích để tổng hợp và phân tích các dữ liệu có liên quan trong quá trình nghiên cứu.

Cuối cùng, ma trận Confusion và F1 - Score được sử dụng để đánh giá lại và lựa chọn các mô hình ước lượng xác suất vỡ nợ phù hợp.

Đóng góp của đề tài

Kết quả nghiên cứu của khoá luận có ý nghĩa khoa học và thực tiễn trên các mặt sau: (i) Phân tích một cách có hệ thống các lý thuyết cơ bản và nền tảng liên quan đến các mô hình ước lượng xác suất vỡ nợ và tiêu chí lựa chọn mô hình phù hợp.

(ii) Cung cấp các nghiên cứu đã công bố tổng thể và toàn diện để chỉ ra những thiếu sót của các nghiên cứu trước đây liên quan đến việc lựa chọn mô hình phù hợp nhất để ước lượng xác suất vỡ nợ của các doanh nghiệp tại các NHTM Việt Nam Bằng phương pháp học máy để phân tích các chỉ số tài chính Điều này cung cấp một nền tảng vững chắc cho các nhà nghiên cứu để tiến hành các nghiên cứu mới có liên quan hơn.

(iii) Đề xuất để chọn mô hình xếp hạng tín nhiệm phù hợp, có thể ước tính xác suất vỡ nợ của các doanh nghiệp dựa trên các chỉ số tài chính và để cải thiện hiệu quả của việc kiểm soát rủi ro tín dụng của các NHTM tại Việt Nam.

Bố cục của đề tài nghiên cứu

Bài viết được phân chia thành 5 chương: giới thiệu tổng quan, đưa ra cơ sở lý thuyết và các nghiên cứu trước đây, mô hình ước lượng xác suất vỡ nợ, phân tích kết quả và thảo luận kèm theo, chi tiết cụ thể như sau:

" Chương 1 (GIỚI THIỆU): Tính cấp thiết của đề tài, vấn đề nghiên cứu, mục tiêu nghiên cứu, câu hỏi nghiên cứu, đối tượng và phạm vi nghiên cứu, phương pháp nghiên cứu, những đóng góp của đề tài và kết cấu của luận án đều được trình bày trong chương này nhằm cung cấp cho người đọc một cái nhìn tổng thể về toàn bộ nghiên cứu.

Chương 2 (CƠ SỞ LÝ THUYẾT VÀ KHẢO LƯỢC CÁC NGHIÊN CỨU): Minh họa các lý thuyết cơ bản và nền tảng liên quan đến xác suất vỡ nợ, tổng quan về các mô hình được sử dụng để ước lượng xác suất vỡ nợ của doanh nghiệp (mô hình Cấu trúc và mô hình Phi Cấu trúc), cũng như kết quả đánh giá của các nghiên cứu trước đây đã được công bố làm rõ tính cấp thiết của đề tài và làm cơ sở cho việc đề xuất mô hình nghiên cứu và phân tích kết quả nghiên cứu được trình bày ở các chương sau.

Chương 3 (MÔ HÌNH VÀ PHƯƠNG PHÁP NGHIÊN CỨU): Dựa trên cơ sở lý thuyết của chương 2, chương 3 trình bày khung mô hình phương pháp luận, mô tả đầy đủ dữ liệu thu thập được, cách lựa chọn biến đầu vào và các mô hình ước lượng xác suất vỡ nợ đề xuất để thể hiện mức độ tin cậy của kết quả nghiên cứu.

Chương 4 (KẾT QUẢ NGHIÊN CỨU): Từ các mô hình tham số và phi tham số để phân tích kết quả hồi quy Bên cạnh đó, dựa trên các chỉ tiêu đã được tính toán từ ma trận confusion (Accuracy, Sensitivity, Specificity, Precision, F1 - Score) nhằm mục đích so sánh từng mô hình và đánh giá khả năng dự báo xác suất vỡ nợ của chúng.

Chương 5 (KẾT LUẬN): Tóm tắt các kết quả của khoá luận, đề xuất các giải pháp hỗ trợ cải thiện khả năng ước lượng xác suất vỡ nợ của các doanh nghiệp tại các NHTM và tổ chức xếp hạng tín nhiệm Việt Nam; có chính sách định hướng kịp thời cũng như chỉnh sửa việc cấp tín dụng của các NHTM để đạt hiệu quả cao hơn, giảm thiểu rủi ro tín dụng, đảm bảo an toàn vốn; đem lại những kết quả nhất định cho quy chế quản trị công ty nhằm giảm thiểu rủi ro phá sản; trao đổi về những hạn chế, tồn tại và những hướng nghiên cứu cần tiếp tục thực hiện trong thời gian tới."

CƠ SỞ LÝ THUYẾT VÀ KHẢO LƯỢC CÁC NGHIÊN CỨU

Xác suất vỡ nợ

Xác suất vỡ nợ là một trong ba yếu tố chính để xác định rủi ro tín dụng Nghiên cứu này tập trung vào xác suất vỡ nợ: khả năng vỡ nợ trong một khoảng thời gian nhất định Nó ước tính rủi ro mà người đi vay sẽ không thể đáp ứng các cam kết nợ của mình xác suất vỡ nợ được sử dụng trong nhiều hệ thống đánh giá tín dụng và quản lý rủi ro Khung Basel cập nhật yêu cầu các ngân hàng ước lượng xác suất vỡ nợ của tất cả các đối tác của họ bằng cách dựa trên xếp hạng nội bộ và sử dụng các phương pháp tiếp cận Basel

II sử dụng định nghĩa cho xác suất vỡ nợ như sau: "Xác suất vỡ nợ, được biểu thị dưới dạng phần trăm, là khả năng một người đi vay sẽ đáp ứng tiêu chí vỡ nợ trong vòng một năm Một vụ vỡ nợ được coi là đã xảy ra đối với một người có nghĩa vụ nhất định khi xảy ra một hoặc cả hai điều kiện sau: người có nghĩa vụ đã quá hạn 90 ngày đối với bất kỳ nghĩa vụ tín dụng quan trọng nào và người có nghĩa vụ không có khả năng đáp ứng các nghĩa vụ tín dụng của mình (Basel Committee on Banking Supervision, 2006)".

"Office of the Comptroller of the Currency" định nghĩa xác suất vỡ nợ như sau: "Xác suất vỡ nợ là rủi ro mà bên vay sẽ không thể hoặc không muốn trả nợ đầy đủ hoặc đúng hạn Rủi ro vỡ nợ được xác định bằng cách phân tích khả năng trả nợ của người có nghĩa vụ trả nợ theo các điều khoản hợp đồng Xác suất vỡ nợ thường liên quan đến các đặc điểm tài chính như dòng tiền không đủ để trả nợ, giảm doanh thu hoặc lợi nhuận hoạt động, đòn bẩy cao, thanh khoản giảm hoặc cận biên và không có khả năng thực hiện thành công kế hoạch kinh doanh Ngoài các yếu tố có thể định lượng này,thiện chí trả nợ của người đi vay cũng phải được đánh giá."

Xác suất vỡ nợ là một thước đo quản lý rủi ro quan trọng có thể được sử dụng cho các yêu cầu cho vay, ước tính xếp hạng, định giá phái sinh tín dụng và nhiều lĩnh vực tài chính thiết yếu khác Việc ước tính sai xác suất vỡ nợ dẫn đến xếp hạng không hợp lý và định giá sai các công cụ tài chính, và do đó, là một trong những nguyên nhân của cuộc khủng hoảng tài chính toàn cầu. Để ước lượng xác suất vỡ nợ, họ thiết lập một hệ thống xếp hạng tín dụng Xếp hạng tín dụng là đánh giá về khả năng và sự sẵn sàng thanh toán một nghĩa vụ cụ thể của công ty một cách kịp thời trong suốt thời hạn của nghĩa vụ đó Hệ thống xếp hạng được trình bày trong báo cáo này được biểu thị bằng ba chữ cái ABC, mỗi chữ cái được xếp hạng từ AAA (ổn định nhất) đến C (rủi ro nhất) Kể từ đó, việc sử dụng xếp hạng tín dụng đã trở nên rất phổ biến, mục đích và xếp hạng của họ đã đa dạng hóa, nhận thức và quan điểm của xã hội cũng thay đổi.

Theo Michael K.Ong (2003), "xếp hạng tín nhiệm là một quá trình đánh giá và phân loại các mức độ tín nhiệm tương ứng với các mức độ rủi ro khác nhau, mỗi xếp hạng là một phản ánh rõ ràng và ngắn gọn về khả năng thanh toán của công ty được xếp hạng, đồng thời, tín nhiệm xếp hạng là một quá trình sử dụng thông tin có sẵn và hiện tại để dự báo kết quả trong tương lai."

Theo quan điểm của Standard & Poor's, "xếp hạng tín nhiệm là đánh giá mức độ đáng tin cậy về khả năng trả nợ của một bên đối với các nghĩa vụ tài chính trong tương lai dựa trên các yếu tố hiện tại và ý kiến của người thẩm định Nói cách khác, xếp hạng tín dụng là một quan điểm về rủi ro tín dụng" Cụ thể, nó đưa ra ý kiến về khả năng và sự sẵn sàng của các tổ chức phát hành (Rating issuers) - chẳng hạn như các tập đoàn, nhà nước và chính quyền địa phương, để đáp ứng các nghĩa vụ của họ một cách kịp thời và phù hợp Xếp hạng tín dụng cũng có thể đề cập đến chất lượng tín dụng (Rating issuers) của một nghĩa vụ cá nhân, chẳng hạn như trái phiếu doanh nghiệp hoặc chính phủ, hoặc đánh giá rủi ro liên quan đến nó có thể dẫn đến thua lỗ Fitch Ratings tuyên bố rằng xếp hạng tín dụng là xếp hạng khả năng đáp ứng các nghĩa vụ của một cá nhân như lãi suất, cổ tức ưu đãi, bảo hiểm và các khoản nợ khác Phương pháp xếp hạng tín dụng của Fitch kết hợp cả yếu tố tài chính và phi tài chính Do đó, số liệu cũng chỉ ra khả năng sinh lời trong tương lai của tổ chức được đánh giá.

Nhìn chung, xếp hạng tín nhiệm là quá trình đánh giá, phân loại các cấp độ tín dụng tương ứng với các mức độ rủi ro khác nhau, phản ánh chất lượng và khả năng thanh toán của đối tượng xếp hạng tín dụng Kết quả tương lai thể hiện qua hệ thống ký hiệu đánh giá Do đó, xếp hạng tín nhiệm cung cấp cho nhà đầu tư thông tin về tình hình tài chính và mức độ rủi ro của các tổ chức tài chính để đưa ra các quyết định đầu tư phù hợp Các yếu tố định giá thường bao gồm các yếu tố tài chính và phi tài chính Thành phần tài chính chủ yếu bao gồm các tỷ số tài chính từ báo cáo tài chính Các yếu tố phi tài chính là những yếu tố khó định lượng, chẳng hạn như: Chính trị, lĩnh vực kinh doanh, môi trường kinh tế vĩ mô, …

Các chỉ số tài chính

Các chỉ số tài chính là các mối quan hệ được xác định từ thông tin tài chính của công ty và được sử dụng cho mục đích so sánh Ba ví dụ điển hình thường được nhắc đến khi nói về các tỷ số tài chính là tỷ lệ hoàn vốn/lợi tức đầu tư (ROI), tỷ suất sinh lời trên tài sản (ROA) và nợ trên vốn chủ sở hữu nợ thành vốn chủ sở hữu Các số liệu này là kết quả của việc chia số dư tài khoản hoặc thước đo tài chính cho một yếu tố khác Thông thường, các số liệu hoặc số dư tài khoản này được tìm thấy trong báo cáo tài chính của công ty - bảng cân đối kế toán, báo cáo thu nhập, báo cáo lưu chuyển tiền tệ tiền tệ (báo cáo lưu chuyển tiền tệ) và/hoặc báo cáo vốn chủ sở hữu Các chỉ số tài chính có thể cung cấp một công cụ có giá trị để đo lường tiến độ so với mục tiêu nội bộ được xác định trước, so với một đối thủ cạnh tranh nhất định hoặc so với toàn bộ ngành mà họ hoạt động Ngoài ra, theo dõi nhiều chỉ số khác nhau theo thời gian là một cách cực kỳ hiệu quả để xác định các xu hướng hoạt động trong giai đoạn đầu Các chỉ số tài chính cũng được các chủ ngân hàng, nhà đầu tư và nhà phân tích kinh doanh sử dụng để đánh giá tình hình tài chính của công ty.

Các chỉ số tài chính là các tỷ lệ được tính bằng cách chia một số tài chính/kinh doanh cho một số khác, ví dụ: tổng doanh thu chia cho số lượng nhân viên Các tỷ số tài chính cho phép chủ doanh nghiệp kiểm tra mối quan hệ giữa các yếu tố tài chính và đo lường chúng Các số liệu này thường rất dễ tính toán và sử dụng Chúng cung cấp cái nhìn sâu sắc về các vấn đề (tốt và xấu) đang diễn ra trong doanh nghiệp; Chỉ xem báo cáo tài chính thôi đôi khi không thể tìm hiểu thông tin chi tiết về doanh nghiệp.

Có 4 nhóm chỉ số tài chính phổ biến và đặc điểm của chúng như sau:

Hình 2.1: 4 nhóm chỉ số tài chính

Các mô hình ước lượng xác suất vỡ nợ của doanh nghiệp

Hiện nay, đã có số lượng lớn các nghiên cứu trong tài liệu tập trung vào việc ước lượng xác suất vỡ nợ của các doanh nghiệp Có hai loại mô hình ước lượng xác suất vỡ nợ khác nhau là: phương pháp thống kê và phương pháp học máy Sau đây là những khác biệt chính giữa hai phương pháp:

Các mô hình thống kê đặc biệt phù hợp với suy luận và chúng thường bao gồm một số giả định về các kết nối cấu trúc giữa các biến, số lượng tham số có thể được ước tính thành công và các đặc điểm phân phối của quy trình tạo dữ liệu Mặt khác, phương pháp học máy chủ yếu quan tâm đến độ chính xác của ước lượng và đưa ra các giả định cực kỳ yếu về cấu trúc của quá trình tạo dữ liệu Tính năng này phát hiện các tương tác dựa trên dữ liệu cũng như các mối tương quan phi tuyến tính hoặc không đơn điệu giữa các biến dự đoán và biến kết quả Ngoài ra, lý do chính khiến phương pháp học máy chuyên sâu hơn về mặt tính toán là do các kỹ thuật của phương pháp học máy thường có thể ước tính nhiều mô hình thay vì một mô hình duy nhất Chỉ mô hình chính xác nhất mới được sử dụng để hoàn thành các tác vụ dự đoán Khía cạnh này của phương pháp học máy đặc biệt quan trọng để ước lượng xác suất vỡ nợ, tuy nhiên, nó phải trả giá bằng việc giảm tính minh bạch khi so sánh với các mô hình thống kê: Các mô hình bằng phương pháp học máy không đưa ra các ước tính về các tham số liên kết các yếu tố dự đoán với biến kết quả (các mô hình không phải là tham số), điều này có thể khiến cho lý luận và dự đoán của chúng khó giải thích hơn Phần này xem xét ngắn gọn các mô hình ước lượng xác suất vỡ nợ:

Bảng 2.1: Đánh giá các mô hình ước lượng xác xuất vỡ nợ Tên mô hình Tổng quan về mô hình Ưu điểm Nhược điểm

Mô hình hồi - Phân tích hồi quy là một tập hợp - Dễ hiểu và - Dữ liệu phi quy các kỹ thuật thống kê được sử thực hiện để dự số không

(Regression dụng để ước tính mối liên hệ giữa đoán Hoạt động được sử dụng

Tên mô hình Tổng quan về mô hình Ưu điểm Nhược điểm

Models) một biến phụ thuộc và một hoặc nhiều biến độc lập.

- Orgler (1970) đã phát hiện ra mối quan hệ tuyến tính giữa các đặc điểm của khách hàng và tình trạng mặc định của khách hàng đó. tốt bất kể hệ thống dữ liệu ít. trong mô hình hồi quy.

- Khả năng ngoại suy có thể thấp Dễ nhạy cảm trong những trường hợp đặc biệt.

Mô hình phân tích phân biệt

- Phân tích phân biệt được Fisher

(1936) đưa ra để phân tách người đi vay (tốt hay xấu) dựa trên đặc điểm của họ thông qua ước lượng hàm phân biệt tuyến tính, trong đó các biến số là biến định lượng (các số liệu được lấy từ BCTC hàng năm của doanh nghiệp)

- Dễ hiểu và thực hiện để dự đoán,

- Hoạt động tốt bất kể hệ thống dữ liệu ít.

- Dữ liệu phi số không được sử dụng trong mô hình hồi quy.

- Khả năng ngoại suy có thể thấp, nhạy cảm trong trường hợp đặc biệt.

Mô hình hồi quy Logit và

Probit (Logit and Probit models)

- Được sử dụng trong nghiên cứu của Olso (1980), Gilbert (1990), Hayden (2010).

- Mô hình Logit và Probit nghiên cứu sự phụ thuộc của một biến

- Dễ dàng đưa ra kết quả và kết quả thì dễ giải thích.

- Có thể vi phạm giả định chuẩn của các biến trong mô hình.

Tên mô hình Tổng quan về mô hình Ưu điểm Nhược điểm nhị phân (biến phụ thuộc Y) vào các biến độc lập khác (Xi), qua đó có thể ước lượng xác suất vỡ nợ của một doanh nghiệp có nguy cơ phá sản là bao nhiêu trực tiếp từ mẫu. là xác suất vì vậy hỗ trợ cho việc đưa ra quyết định.

- Có thể kiểm định được mức độ tin cậy của kết quả xếp hạng và các biến.

- Mô hình không thể ứng dụng đối với các trường hợp doanh nghiệp khiếm khuyết dữ liệu hoặc doanh nghiệp có cấu trúc tài chính đặc biệt.

- Các vấn đề đánh giá quá cao hoặc đánh giá thấp có thể xuất hiện trong mô

Mô hình cây hình quyết định

- Mô hình cây quyết định là mô hình phi tham số được giới thiệu lần đầu tiên bởi Brieman vào năm

1980 và được sử dụng rộng rãi để phân loại và ước lượng vỡ nợ trong kinh doanh.

- Cây quyết định là một quá trình phân tích và phân loại dữ liệu Cụ thể, cây quyết định chia tập dữ

- Không có các giả định về phân phối chuẩn của các biến trong mô hình.

- Xác suất phá sản có thể tính toán được.

- Dễ xảy ra lỗi khi có quá nhiều lớp.

- Chi phí tính toán để xây dựng mô hình cao.

- Sự ổn định của mô hình

Tên mô hình Tổng quan về mô hình Ưu điểm Nhược điểm liệu thành các tập dữ liệu con để làm cho các tập dữ liệu đó nhất quán hơn với các biến phân loại.

- Quá trình phân nhánh hay quá trình ra quyết định ở từng bước đều được dựa trên những điều kiện, hệ số đo lường, tính toán nhất định. nhìn, dễ dàng giải thích các kết quả.

- Mối quan hệ phi tuyến giữa các biến độc lập và biến phụ thuộc được mô hình hóa dễ dàng. không thể được đánh giá bằng các bài kiểm tra thống kê.

- Random forest được đưa ra bởi

Ho vào năm 1995, là mô hình ướ lượng xác suất vỡ nợ, phân loại bằng cách xây dựng nhiều cây quyết định và trả kết quả như là giá trị Mode của nhóm hoặc là giá trị Mean của cây quyết định.

- Random Forest là một tập hợp của hàng trăm cây quyết định, trong đó mỗi cây quyết định được tạo nên ngẫu nhiên từ việc tái chọn mẫu và random các biến từ toàn bộ các biến trong tập dữ liệu.

Với một cơ chế như vậy, mô hình Random Forest thường hoạt động rất chính xác, nhưng chúng ta

- Kết quả dự báo chính xác và đáng tin cậy.

- Có thể tránh được hiện tượng overfitting tệp dữ liệu (hiện tượng mô hình tìm được quá khớp với tập dữ liệu).

- Mô hình vẫn có thể chạy được khi dữ liệu thiếu giá trị.

- Khó giải thích hơn mô hình Cây quyết định.

- Mất nhiều thời gian để đưa ra kết quả dự báo.

Tên mô hình Tổng quan về mô hình Ưu điểm Nhược điểm không thể nào hiểu được cơ chế hoạt động bên trong mô hình vì cấu trúc quá phức tạp. Đánh giá về mô hình mạng thần kinh nhân tạo

- Mô hình mạng thần kinh nhân tạo là một hệ thống học máy được thiết kế để bắt chước cách hoạt động của bộ não con người thực.

- Trước những năm 1990, người ta đã cố gắng đưa ra các dự đoán mặc định bằng mô hình mạng thần kinh nhân tạo Yang và cộng sự (1999) phân tích một số phương pháp và chỉ ra rằng phân tích phân biệt Fisher và mạng thần kinh xác suất vượt trội hơn chúng về hiệu suất dự đoán.

- Với mẫu hơn 7.000 doanh nghiệp của Ý, Ciampi và Gordini

(2013) điều tra mô hình mạng thần kinh nhân tạo Họ chứng minh rằng mô hình mạng thần kinh nhân tạo có thể đóng góp nhiều hơn cho việc đánh giá rủi ro tín dụng của các doanh nghiệp và độ chính xác dự đoán của mô hình mạng thần kinh nhân tạo đặc

- Có khả năng mô phỏng các mối quan hệ phi tuyến tính phức tạp.

- Ít ràng buộc thống kê chính thức hơn được yêu cầu.

- Dự đoán đáng tin cậy.

- Có khả năng quản lý một lượng lớn dữ liệu và các biến đầu vào

- Một mạng lưới thần kinh rộng lớn cần nhiều thời gian để xử lý.

- Dự đoán chính xác cần một lượng dữ liệu đáng kể.

- Dành một lượng thời gian đáng kể để đào tạo ngoại tuyến.

Tên mô hình Tổng quan về mô hình Ưu điểm Nhược điểm biệt cao đối với các doanh nghiệp nhỏ nhất.

Nguồn: Tác giả tự tổng hợp

Khảo lược các nghiên cứu

Một số nghiên cứu đã được thực hiện để ước tính xác suất vỡ nợ và rủi ro phá sản cho các doanh nghiệp, nhưng nghiên cứu cho thấy rằng do đối tượng và phạm vi của các nghiên cứu cũng như các mô hình và phương pháp được sử dụng, điều này đã được chứng minh là khó khăn.

(1) Các nghiên cứu liên quan tại Việt Nam Ở Việt Nam cũng có nhiều nghiên cứu về chủ đề này, chủ yếu được công bố trên các phương tiện thông tin đại chúng, khảo sát các yếu tố ảnh hưởng đến rủi ro phá sản doanh nghiệp, dự báo xác suất phá sản, tài sản trong định giá doanh nghiệp (Hay Sinh 2003, Le Đạt Chí & Lê Tuấn Anh 2012; Lê Nguyễn Sơn Vũ 2013; Võ Hồng Đức & Nguyễn Đình Thiện 2013; nhóm tác giả khoa học kinh tế học Kinh tế TP.HCM 2013; Nguyễn Minh

Hà & Nguyễn Bá Hưởng 2016) Công trình đã công bố chủ yếu sử dụng phương pháp phân tích thống kê mô tả dựa trên dữ liệu dạng bảng và chưa tập trung nghiên cứu các mô hình ước lượng xác suất vỡ nợ Vì vậy, hiện nay thiếu bằng chứng thực nghiệm từ kết quả phân tích hồi quy để cung cấp bằng chứng vững chắc hơn cho việc đề xuất mô hình ước lượng xác suất vỡ nợ ngân hàng nhằm thu được kết quả chính xác nhất có thể.

"Cụ thể hơn là nghiên cứu của Hay Sinh (2003) về ước lượng xác suất phá sản trong định giá doanh nghiệp Theo tác giả, "xác suất phá sản là một biến số tài chính ảnh hưởng trực tiếp đến giá trị của một doanh nghiệp Giá được đánh giá theo hai cách, bao gồm cả cách tiếp cận dòng tiền" Điều này bao gồm xác suất phá sản, chưa được ước tính như một tham số độc lập Nó thường được thể hiện bằng tỷ lệ chiết khấu và phương pháp giá trị hiện tại đã điều chỉnh Ước tính xác suất phá sản như một tham số độc lập Mục đích kết quả nghiên cứu của tác giả là thiết lập một phương pháp ước lượng xác suất phá sản của các doanh nghiệp, góp phần phổ biến phương pháp giá trị hiện tại hiệu chỉnh và góp phần đa dạng hóa các phương pháp đánh giá doanh nghiệp tại Việt Nam.

Hay Lê Nguyễn Sơn Vũ (2013) xem xét các quyết định đầu tư và rủi ro phá sản của các công ty niêm yết trên Sở giao dịch chứng khoán Việt Nam và đưa ra bằng chứng thực nghiệm về tác động của các tỷ số tài chính đối với các quyết định tài chính từ năm 2003 đến năm 2012 Bộ dữ liệu chứa 737 công ty từ các ngành nghề khác nhau Trong nghiên cứu này, ba yếu tố là thu nhập ròng âm trong hai năm qua, thanh khoản ngắn hạn và nợ phải trả/tổng tài sản, có tương quan thuận với chỉ số ước lượng phá sản Oscore và đồng thời có mối quan hệ nghịch biến giữa tỷ lệ lợi nhuận/tổng tài sản và tốc độ tăng trưởng thu nhập ròng với chỉ số dự báo phá sản Oscore; tất cả đều có ý nghĩa thống kê Bốn yếu tố còn lại, bao gồm quy mô doanh nghiệp, tổng nợ/tổng tài sản, vốn lưu động/tổng tài sản và quỹ hoạt động/tổng nợ, cũng ảnh hưởng đến ước lượng phá sản của Oscore, nhưng không có ý nghĩa thống kê.

Mới đây, Nguyễn Thị Tuyết Lan (2019) đã thực hiện nghiên cứu các nhân tố ảnh hưởng đến rủi ro phá sản của các doanh nghiệp niêm yết ngành xây dựng tại Việt Nam Mô hình được sử dụng để nghiên cứu là mô hình logit với 5 biến độc lập là tổng nợ/tổng tài sản, vốn lưu động/tổng tài sản, khả năng thanh toán ngắn hạn, tỷ lệ lợi nhuận/tổng tài sản và tăng trưởng thu nhập ròng Tổng thể mẫu khảo sát bao gồm 109 doanh nghiệp niêm yết ngành xây dựng Việt Nam trên 2 sàn HNX và HOSE giai đoạn 2005 - 2017. Kết quả nghiên cứu cho thấy các nhân tố bao gồm tổng nợ/tổng tài sản có mối tương quan thuận chiều với rủi ro phá sản của các doanh nghiệp niêm yết ngành xây dựng tại Việt Nam và tác động ngược chiều với tỷ suất sinh lời/tổng tài sản." (ii) Các nghiên cứu liên quan khác

Nói chung, điểm mạnh của các mô hình này là gấp đôi: thứ nhất, khả năng tính toán độ chắc chắn (xác suất) của các kết quả, và; thứ hai, đánh giá tác động của từng yếu tố riêng lẻ Mặc dù được sử dụng rộng rãi trong cả nghiên cứu và công nghiệp, những loại mô hình này đã được chứng minh là sai lầm, ngụ ý rằng cần phải cải thiện mô hình vỡ nợ và rủi ro (Begley, Ming, & Watts, 1996) Hơn nữa, họ có khả năng hạn chế để cải thiện kết quả ước lượng, thường không quá một năm (Altman, 2014; Altman et al., 2017) Ngoài ra, chúng không thể tự động được đưa vào dữ liệu chuỗi thời gian khổng lồ và phải dựa vào lý thuyết giá trị trung bình thông thường; tuy nhiên, phần lớn, các sự kiện cực đoan là các biến số quyết định và do đó, lý thuyết giá trị cực đoan có thể mang lại cái nhìn sâu sắc hơn (Baldi, Manerba, Perboli, & Tadei, 2019; Perboli, Tadei, & Gobbato, 2014) Để khắc phục những hạn chế của các mô hình Thống kê, nghiên cứu chứng minh cách các mô hình Học máy vượt trội hơn các phương pháp phân loại truyền thống đã được tích cực sản xuất (Barboza, Kimura và Altman 2017). Đầu tiên, nghiên cứu của Guido Perboli và Ehsan Arabnezhad (2021) áp dụng các mô hình như Random Forest, Neural Network, Logistic Regression và Gradient Boosting đã được hiệu chỉnh bằng cách sử dụng 15 biến độc lập của dữ liệu báo cáo tài chính từ hơn 160.000 doanh nghiệp của Ý đang hoạt động bởi cuối năm 2018, kết hợp với dữ liệu của khoảng 3.000 doanh nghiệp phá sản từ năm 2001 đến 2018 Kết quả của họ chính xác trên 80% không chỉ trong ngắn hạn (12 tháng) mà còn trong trung hạn (36 tháng) và dài hạn (đến 60 tháng).

Thứ hai, Liou (2008) đã đánh giá ba phương pháp khai thác dữ liệu để xác định các báo cáo tài chính gian lận và dự đoán thất bại của công ty: Hồi quy logistic, ANN và mô hình Cây quyết định Sử dụng hồi quy logistic từng bước, 19 trong số 52 tỷ lệ tài chính từ nghiên cứu trước đây đã được chứng minh là có giá trị tiên đoán đáng kể trong việc ước lượng sự phá sản của công ty Tuy nhiên, theo kết quả của nghiên cứu, Cây quyết định đạt được tỷ lệ thành công cao hơn trong ước lượng sự phá sản của công ty.

Thứ ba, Ravi và Pramodh (2008) đã phát triển mô hình ANN để dự báo vỡ nợ cho các ngân hàng Thổ Nhĩ Kỳ và Tây Ban Nha, có tính đến 9 chỉ số tài chính cho các ngân hàng Thổ Nhĩ Kỳ và 12 khía cạnh tài chính cho các ngân hàng Tây Ban Nha Mức độ chính xác của mô hình tòa nhà là 96,6 % đối với bộ dữ liệu của các ngân hàng Tây Ban Nha và 100% đối với bộ dữ liệu của các ngân hàng Thổ Nhĩ Kỳ Tuy nhiên, do sự phức tạp của mô hình, cấu trúc của nó khó hiểu và không nằm trong tầm kiểm soát của người lập mô hình nên tính hữu dụng của nó bị hạn chế.

Thứ tư, tài liệu thực nghiệm gần đây cũng đang đạt được sức hút trong việc tìm hiểu hành vi rủi ro tín dụng của các doanh nghiệp nhỏ Altman và Sabato (2007) đã điều tra một nhóm các doanh nghiệp của Hoa Kỳ năm 2010 bao gồm 120 trường hợp vỡ nợ từ năm 1994 đến năm 2002 Họ đã chọn năm loại tỷ lệ kế toán mô tả các khía cạnh chính trong hồ sơ tài chính của công ty: tính thanh khoản, khả năng sinh lời, đòn bẩy, mức độ bao phủ và hoạt động Họ đã phát triển một số tỷ lệ tài chính được xác định trong tài liệu là thành công nhất trong việc ước lượng sự phá sản của công ty đối với từng loại này. Cuối cùng, năm biến (một biến từ mỗi danh mục) có khả năng ước lượng vỡ nợ cao nhất của doanh nghiệp đã được chọn và một mô hình ước lượng khó khăn cho các doanh nghiệp được tạo bằng kỹ thuật hồi quy logistic Tuy nhiên, họ nhận ra tầm quan trọng của việc sử dụng dữ liệu định tính để cải thiện hiệu suất ước lượng của mô hình của họ.

Cuối cùng, David Gun-Fie Yong và Wai-Ching Poon (2010) đã tiến hành sử dụng mô hình Phân tích đa phân biệt (MDA) để ước lượng xác suất vỡ nợ cho các công ty Malaysia Một mẫu gồm 64 doanh nghiệp sử dụng 16 biến chỉ số tài chính đã được kiểm tra Kết quả nghiên cứu cho thấy 7 yếu tố chỉ số tài chính có ảnh hưởng lớn đến tỷ lệ chính xác cao từ 88% đến 94% đối với từng tổ chức trước khi phá sản Tuy nhiên, kỹ thuật này có những hạn chế liên quan đến các giả định thiết yếu trong mô hình (giả định về phân phối chuẩn và phương sai bằng nhau) có thể bị phá vỡ, làm giảm độ tin cậy và khả năng ứng dụng của mô hình.Tuy nhiên, với bộ dữ liệu được xây dựng trong các thời kỳ khác nhau, việc lựa chọn mô hình xếp hạng tín nhiệm và các chỉ tiêu tài chính phù hợp có ảnh hưởng đến xác suất vỡ nợ của các nhà nghiên cứu là khác nhau,cũng như việc ứng dụng trong nghiên cứu ước lượng khả năng vỡ nợ của khách hàng doanh nghiệp tại Việt Nam theo tác giả là một điểm mới.

Chương này làm rõ tính cấp thiết thông qua việc trình bày lý thuyết cơ bản và lý thuyết nền tảng về xếp hạng tín dụng, các phương pháp đo lường và ước lượng xác suất vỡ nợ của doanh nghiệp và nội dung chi tiết của nó, kết quả đánh giá và tổng kết các nghiên cứu đã công bố của đề tài đồng thời làm cơ sở cho việc phân tích mô hình nghiên cứu đề xuất và kết quả nghiên cứu được trình bày trong chương tiếp theo.

MÔ HÌNH VÀ PHƯƠNG PHÁP NGHIÊN CỨU

Phương pháp xây dựng các mô hình

Trong bài nghiên cứu này, tác giả sử dụng các mô hình tham số và phi tham số để dự báo khả năng vỡ nợ của các doanh nghiệp tại Việt Nam trong giai đoạn 2020 - 2022. Các bước xây dựng mô hình được thực hiện như sau:

Bước 1: Thu thập và xử lý dữ liệu Dữ liệu sử dụng được lấy từ báo cáo tài chính hàng năm có kiểm toán của khoảng 462 doanh nghiệp thuộc 9 ngành khác nhau tại Việt Nam từ năm 2020 đến năm 2022.

Bước 2: Lựa chọn các biến đầu vào của mô hình Để dự báo khả năng nợ vỡ nợ của các doanh nghiệp, tác giả đã lựa chọn 14 biến đầu vào là các chỉ số tài chính được tính toán từ báo cáo tài chính của các doanh nghiệp Các biến độc lập này thuộc 4 nhóm chỉ số tài chính: nhóm chỉ số về khả năng thanh khoản, nhóm chỉ số về mức độ sử dụng nợ, nhóm chỉ số về khả năng sinh lời, và nhóm chỉ số về hiệu quả hoạt động của doanh nghiệp.

Bước 3: Thực hiện chạy hồi quy trên các mô hình xếp hạng tín nhiệm được lựa chọn, bao gồm mô hình tham số và phi tham số Mô hình tham số bao gồm mô hình logit; các mô hình phi tham số bao gồm mô hình cây quyết định, mô hình random foerest.

Bước 4: Sử dụng ma trận Confusionvà điểm số F1 (F1 – Score) để đánh giá kết quả hồi quy của từng mô hình Trên cơ sở đó, lựa chọn mô hình xếp hạng tín nhiệm phù hợp và có khả năng dự báo tốt xác suất vỡ nợ của khách hàng.

Hình 3.1: Sơ đồ các bước xây dựng mô hình

• Thu thập và xử lý dữ liệu

• Lựa chọn các biến đầu vào của mô hình

• Thực hiện chạy hồi quy trên các mô hình xếp hạng tín nhiệm được lựa chọn, bao gồm mô hình tham số và phi tham số

• Sử dụng ma trận Confusion và điểm số F1 (F1 - Score) để đánh giá kết quả hồi quy của từng mô hình

Quy trình sơ đồ được đề xuất đã cho chỉ ra cách xây dựng các mô hình ước lượng xác suất của các doanh nghiệp để đạt được các mục tiêu của nghiên cứu đã đề ra. Trước hết, dữ liệu thô được thu thập từ Báo cáo tài chính kiểm toán hàng năm của khoảng 462 doanh nghiệp thuộc 9 ngành chính tại Việt Nam từ năm 2020 đến 2022 và được xử lý Ở giai đoạn tiếp theo, dựa trên các nghiên cứu đã có ở Chương 2, 14 biến độc lập đầu vào là các chỉ số tài chính tính toán từ Báo cáo tài chính kiểm toán hàng năm của doanh nghiệp đã được lựa chọn Các biến độc lập này được chia thành bốn loại chỉ số tài chính: chỉ số thanh khoản, chỉ số sử dụng nợ, chỉ số khả năng sinh lời và chỉ số hoạt động của công ty Sau khi chọn các biến đầu vào, các mô hình được chọn bao gồm: Mô hình logistic, mô hình cây quyết định, mô hình random forest để xác định xem các chỉ số này ảnh hưởng như thế nào đến xác suất vỡ nợ của các doanh nghiệp. Quá trình kết thúc bằng việc sử dụng ma trận Confusion và điểm số F1 (F1 - Score) để đánh giá và lựa chọn các mô hình phù hợp.

Nguồn: Thống kê từ tác giả

Thu thập và xử lý dữ liệu

Để đưa ra ước lượng về xác suất vỡ nợ của các doanh nghiệp tại Việt Nam, cơ sở dữ liệu được sử dụng từ báo cáo tài chính của các doanh nghiệp tại Việt Nam trong giai đoạn từ năm 2020 đến 2022 Các báo cáo tài chính này đã được kiểm toán để chắc chắn rằng nguồn dữ liệu là đáng tin cậy Theo hai tiêu chuẩn để lựa chọn doanh nghiệp, tác giả xem xét 462 doanh nghiệp, trong đó: có 38 doanh nghiệp thuộc lĩnh vực kinh doanh thương mại hàng tiêu dùng; 32 doanh nghiệp thuộc ngành kinh doanh xăng dầu; 44 doanh nghiệp thuộc ngành kinh doanh ô tô; 42 doanh nghiệp thuộc ngành thi công xây lắp; 53 doanh nghiệp thuộc ngành kinh doanh dược phẩm và thiết bị y tế; 52 doanh nghiệp thuộc ngành dệt may; 58 doanh nghiệp thuộc ngành thủy sản (cá tra, tôm, nghêu…); 67 doanh nghiệp thuộc ngành sắt thép và 76 doanh nghiệp thuộc ngành kinh doanh nông sản (lúa gạo, cà phê, điều, tiêu…).

Bảng 3.1: Tổng hợp số lượng doanh nghiệp - ngành nghề kinh doanh

T Ngành nghề kinh doanh Số lượng công ty

1 Thương mại hàng tiêu dùng 38

5 Kinh doanh dược phẩm - thiết bị y tế 53

7 Thuỷ sản (cá tra, tôm, nghêu, …) 58

9 Kinh Doanh nông sản (lúa gạo, cà phê, tiêu, điều, …) 76

Lý do tại sao nghiên cứu này phải được thực hiện qua ba năm là do tình trạng của nền kinh tế và hiệu quả hoạt động của doanh nghiệp hầu như không thay đổi Theo Crouhy, Galai & Mark (2001), "điểm yếu chính của mô hình ước lượng rủi ro là mẫu dựa trên dữ liệu tài chính trước đây được thu thập trong các tình huống có thể hoặc không thể áp dụng trong tương lai hoặc dữ liệu được sử dụng trong các mô hình hiếm khi được cập nhật" Hơn nữa, chúng lập luận rằng phân tích rủi ro tín dụng dựa trên một số đặc điểm của người đi vay, bao gồm tài chính, quản lý, thu nhập, dòng tiền, chất lượng tài sản và tính thanh khoản Do đó, giả định này có thể được xây dựng như sau:

Các doanh nghiệp này được phân loại thành hai nhóm: những doanh nghiệp đã nộp đơn xin phá sản được đánh dấu là 1 và những doanh nghiệp chưa nộp đơn xin phá sản được đánh dấu là 0 Vốn chủ sở hữu từ bảng cân đối kế toán, lợi nhuận ròng sau thuế từ báo cáo lãi lỗ, và dòng tiền hoạt động từ báo cáo lưu chuyển tiền tệ được sử dụng để phân tách các nhóm này Nếu một công ty thuộc một trong các loại sau, công ty đó được coi là phá sản (được đánh dấu là 1): (i) Vốn chủ sở hữu là số âm; (ii) Lợi nhuận ròng sau thuế và dòng tiền hoạt động đã âm trong hai năm qua; (iii) Doanh nghiệp tuyên bố mất khả năng thanh toán; (iv) Trong nhóm nợ xấu (nhóm 3, 4, 5).

Bảng 3.2: Phân tách các doanh nghiệp phá sản và không phá sản

Năm Các doanh nghiệp phá sản

Các doanh nghiệp không phá sản Tổng

Nguồn: Thống kê từ tác giả

Các giá trị thiếu, sai sót hoặc không quan trọng trong bộ dữ liệu sẽ được điều chỉnh theo nguyên tắc sau: Đầu tiên, thay thế dữ liệu còn thiếu bằng mức trung bình của người đi vay Lấy giá trị còn thiếu từ một doanh nghiệp phá sản làm ví dụ, nó sẽ được thay thế bằng giá trị trung

2 7 bình của nhóm phá sản.

Thứ hai, các giá trị nguyên bản nên được thay thế bằng các giá trị tối đa hoặc tối thiểu, tùy thuộc vào giá trị nào phù hợp nhất.

Cuối cùng, một nhóm định lượng 5% hoặc 95% của các chỉ số tài chính sẽ được sử dụng để thay thế các mức độ biến động bất thường.

Lựa chọn các biến đầu vào trong mô hình dự báo xác suất vỡ nợ

Các chỉ số tài chính đã được sử dụng rộng rãi và đóng một vai trò thiết yếu, đặc biệt là các điều kiện cam kết để ước lượng xác suất vỡ nợ của các doanh nghiệp trong các tài liệu hiện có Một số bài báo học thuật đề xuất sử dụng các chỉ số tài chính làm nguồn thông tin để đánh giá rủi ro tín dụng (Demerjian, 2007) Ngoài ra, việc khách hàng vi phạm các điều khoản của cam kết sẽ gửi các dấu hiệu liên quan đến khả năng trả nợ ngân hàng của họ (Smith và Warner, 1979) Hơn nữa, Dichev và Skinner (2002) phát hiện ra rằng các yêu cầu cam kết về tỷ lệ tài chính cũng sẽ ảnh hưởng đến nội dung của cam kết hợp đồng tín dụng Các ràng buộc cam kết về tỷ số tài chính cực kỳ có lợi vì

" nếu công ty bắt đầu có dấu hiệu lâm vào cảnh túng quẫn, ngân hàng có thể đòi lại khoản vay hoặc xử lý tài sản trước khi công ty mất khả năng thanh toán." (Lundholm và Sloan, 2004) Ngoài ra, Beaver (1966) đưa ra bằng chứng thực nghiệm rằng một số chỉ số tài chính cung cấp các tín hiệu thống kê tuyệt vời chống lại sự thất bại thực sự của công ty Tuy nhiên, nghiên cứu này chủ yếu tập trung vào các tỷ lệ nợ và thanh khoản, vốn có thể không cung cấp đủ thông tin tài chính để đưa ra các ước tính đáng tin cậy. Các biến cổ điển đã được sử dụng trong nghiên cứu, theo báo cáo của Altman và Sabato

(2007), Shumway (2001), Bekhet và Eletter (2014), Addo et al (2018), và Arora và Kaur (2020):

(i) Mức bảo hiểm tối thiểu (thu nhập/ chi phí liên quan đến nợ định kỳ)

(ii) Nợ tối đa đối với dòng tiền (tổng nợ/ thu nhập)

(iii) Giá trị thuần tối thiểu (tài sản - nợ phải trả = vốn cổ phần của cổ đông)

(iv) Đòn bẩy tối đa (tổng nợ/ tổng tài sản)

(v) Khả năng thanh toán tối thiểu (tài sản ngắn hạn/ nợ ngắn hạn)

Moody's và Standard and Poor's đã tiết lộ nhiều biện pháp tài chính thiết yếu khác nhau trong quy trình xếp hạng của họ, bao gồm như Tỷ lệ Tổng Nợ trên Tổng Tài sản; Thu nhập trước lãi vay và thuế (EBIT); Triển vọng kinh doanh tốt (dòng tiền tăng hoặc lợi nhuận tài sản tăng); Cổ tức và các khoản thanh toán khác; Rủi ro kinh doanh (Dòng tiền hoặc biến động giá trị tài sản); Tính thanh khoản của tài sản.

Trong một bài báo năm 2001, Moody's đã phát triển RiskCalc, một phương pháp xếp hạng tín dụng định lượng để đánh giá các doanh nghiệp trong lĩnh vực cao cấp của Nhật Bản Mô hình này sử dụng bảy biến số, bao gồm Khả năng sinh lời, Đòn bẩy tài chính, Thanh khoản, Trả nợ gốc, Trả lãi, Quy mô và Tỷ lệ hoạt động (Phụ lục - Bảng 1).

Engelmann & Rauhmeier (2010) đã mở rộng nghiên cứu của Hayden với 14 tỷ lệ tài chính đã được lựa chọn và chia thành 9 nhóm rủi ro bao gồm đòn bẩy tài chính, khả năng thanh khoản, chỉ số hoạt động, khả năng kiểm soát chi phí, hiệu quả sử dụng tài sản, khả năng sinh lời, quy mô doanh nghiệp, tốc độ tăng trưởng và tốc độ gia tăng nợ vay (Phụ lục - Bảng 2).

Nhìn chung, các biến độc lập được sử dụng trong mô hình dự báo vỡ nợ thuộc một trong bốn nhóm chỉ số tài chính được liệt kê dưới đây:

Nhóm chỉ số về khả năng thanh toán: Tập hợp các chỉ tiêu này thể hiện khả năng chuyển hóa tài sản thành tiền của doanh nghiệp để thanh toán các khoản nợ ngắn hạn hoặc thể hiện khả năng thanh toán ngắn hạn của doanh nghiệp Các hệ số này càng thấp thì khả năng mất khả năng thanh toán của doanh nghiệp càng lớn.

Nhóm chỉ số về đòn bẩy tài chính: Loại chỉ số này đánh giá lượng vốn ở dạng nợ (khoản vay) hoặc đánh giá khả năng đáp ứng các cam kết tài chính của công ty như hệ số nợ trên tổng tài sản, hệ số nợ trên vốn chủ sở hữu, khả năng thanh toán lãi vay, khả năng thanh toán nợ dài hạn Tỷ lệ nợ càng lớn và khả năng thanh toán càng thấp thì khả năng vỡ nợ của công ty càng lớn.

Nhóm chỉ số về khả năng sinh lời: Loại chỉ số này đánh giá khả năng sinh lời của doanh nghiệp bằng cách sử dụng các chỉ số bao gồm lợi nhuận gộp biên, thu nhập trước thuế trên doanh thu thuần, thu thập trước thuế trên tổng tài sản, thu thập trước thuế trên vốn

2 9 chủ sở hữu thường được sử dụng để đánh giá tình hình tài chính của công ty Người ta coi khả năng sinh lời của một công ty là một yếu tố dự đoán mạnh mẽ về việc liệu công ty sau đó có thể trả hết các cam kết nợ hay không, một công ty làm ăn thua lỗ cuối cùng sẽ cạn kiệt nguồn vốn chủ sở hữu và không thể trả nợ.

Nhóm chỉ số về hiệu quả hoạt động: Chỉ số này cho thấy công ty đã sử dụng tài sản của mình tốt như thế nào Chỉ số này càng thấp thì rủi ro tín dụng của doanh nghiệp càng lớn khi tài sản của nó, đặc biệt là hàng tồn kho, các khoản phải thu và các tài sản của doanh nghiệp, không được sử dụng kém hiệu quả.

Dựa trên kết quả của các nghiên cứu đã công bố trước đó, tác giả đã chọn 14 chỉ số tài chính làm biến độc lập cho các mô hình xếp hạng tín dụng sẽ sử dụng trong nghiên cứu này Bảng dưới đây minh họa cách xác định 14 biến độc lập, cũng như kỳ vọng về dấu của chúng trong mô hình dự đoán mặc định.

Bảng 3.3: Các biến độc lập trong mô hình dự báo xác suất vỡ nợ

Các biến độc lập Các chỉ số tài chính Nhóm chỉ số tài chính

Kỳ vọng về dấu X1 Lợi nhuận gộp/Doanh thu thuần Khả năng sinh lời -

X2 Thu nhập trước thuế/Doanh thu thuần Khả năng sinh lời -

Nguồn: Thống kê từ tác giả

Các biến độc lập Các chỉ số tài chính Nhóm chỉ số tài chính

Kỳ vọng về dấu X3 Thu nhập trước thuế/Tổng tài sản Khả năng sinh lời -

X4 Thu nhập trước thuế/Vốn chủ sở hữu Khả năng sinh lời -

X5 Tổng nợ phải trả/Tổng tài sản Đòn bẩy tài chính

X6 Tổng nợ phải trả/Vốn chủ sở hữu Đòn bẩy tài chính

X7 Tài sản ngắn hạn/Nợ ngắn hạn Khả năng thanh khoản -

X8 (Tài sản ngắn hạn - Hàng tồn kho)/Nợ ngắn hạn

X9 Lợi nhuận trước thuế và lãi vay/Lãi vay Thanh toán lãi vay -

Thu nhập trước thuế, lãi vay và khấu hao/

Thanh toán nợ dài hạn -

X11 Tiền và các khoản tương đương tiền/Vốn chủ sở hữu

Giá vốn hàng bán/Hàng tồn kho bình quân

X13 Các khoản phải thu/Doanh thu bình quân

X14 Tổng doanh thu/Tổng tài sản

Các mô hình dự báo xác suất vỡ nợ được nghiên cứu

Trong thống kê, Mô hình Logistic là mô hình hồi quy trong đó biến phụ thuộc (Y) được coi là biến giả hoặc biến nhị phân chỉ với hai giá trị có thể có: 0 và 1, các biến độc lập có thể là biến rời rạc hoặc biến liên tục Xác suất P là đối tượng nghiên cứu, trong khi các biến độc lập X i là biến rời rạc hoặc liên tục và biến phụ thuộc Y là biến nhị phân Trong mô hình xếp hạng tín nhiệm, biến phụ thuộc Y nhận giá trị 1 khi khách hàng không trả được nợ và Y nhận giá trị 0 khi khách hàng trả được nợ

Bảng 3.4: Cấu trúc dữ liệu các biến trong mô hình Logit

Phụ thuộc Y Nhị phân Độc lập X i Liên tục hoặc rời rạc

Nguồn: Tổng hợp từ tác giả

Phương trình sau mô tả mối liên hệ giữa biến phụ thuộc (Y) và các biến độc lập:

- P là xác suất trả nợ của khách hàng.

- $1 , $2,… , Pk là các hệ số.

- ^1 , 2V2,…, ^k là các nhân tố ảnh hưởng. Để xác định xác suất vỡ nợ của khách hàng, chúng ta cần phải tìm giá trị ̂ ̂ được xem là giá trị ước lượng của Y, thu được khi hồi quy Y theo các biến độc lập

Công thức tính xác suất phá sản của doanh nghiệp được ước lượng theo mô hình logit như sau:

3.4.2 Mô hình cây quyết định

Cây quyết định (DT) là một mô hình để giải quyết các vấn đề hồi quy và phân loại bằng cách sử dụng cấu trúc cây để lập biểu đồ các quy tắc quyết định Nút gốc, nút bên trong và nút lá tạo thành mô hình này Mỗi nút trong DT đại diện cho một biến và đường dẫn kết nối nó với con của nó biểu thị một giá trị cụ thể cho biến đó (đây là điều kiện hoặc quy tắc phân nhánh cho mỗi nút) Giá trị dự đoán của biến mục tiêu được biểu thị bằng từng nút lá, trong khi giá trị được cung cấp của các biến được biểu thị bằng tuyến đường từ nút gốc đến nút lá đó.

Hình 3.2: Mô phỏng mô hình cây quyết định

Cây quyết định được xây dựng bằng cách tách thuộc tính của các giá trị tại mỗi nút theo một đặc tính đầu vào Quy trình phân loại sử dụng các phẩm chất có thể phân tách và chạy vô thời hạn cho đến khi đạt đến các nút lá (giá trị đích) Các luật quyết định có hàm mục tiêu trả về giá trị của mức độ rủi ro tương ứng với khách hàng sẽ được xác định bởi một tập hợp các luật đường đi từ nút nốc đến nút lá Với thuật toán CART,

3 3 việc phân chia nút sẽ được quyết định bằng cách sử dụng chỉ số Gini (Cây phân loại và hồi quy):

Trong đó: m là tổng số lớp pi là xác suất để 1 bộ bất kỳ trong D thuộc về lớp Cí

Mô hình cây quyết định là một hệ thống phân loại dễ hiểu và khá thành công Mặt khác, hiệu quả phân loại của cây quyết định phụ thuộc nhiều vào dữ liệu huấn luyện Do đó, việc xây dựng một mô hình cây quyết định khả thi đòi hỏi phải sử dụng một bộ dữ liệu khổng lồ về lịch sử khoản vay của khách hàng.

Hình 3.3: Mô phỏng mô hình random forest

Random forest là một kỹ thuật học máy đơn giản và linh hoạt Các kết quả có độ chính xác cao đã được báo cáo ngay cả khi không điều chỉnh siêu tham số Hơn nữa, đây cũng là một cách để xây dựng một mảng lớn các cây quyết định nhằm tạo ra các dự đoán về tính năng mục tiêu được dự đoán Mỗi cây quyết định được xây dựng ngẫu nhiên bằng cách chọn lại (bootstrap, random sampling) và chỉ sử dụng một tập hợp giới hạn các đặc điểm ngẫu nhiên từ tất cả các biến dữ liệu Mô hình Random forest thường hoạt động khá chính xác ở dạng cuối cùng, nhưng nhược điểm của phương pháp là do cấu trúc phức tạp nên chúng ta không thể nắm bắt được cơ chế hoạt động của mô hình CácRandom forest thường được sử dụng làm mô hình "hộp đen" trong các doanh nghiệp vì chúng đưa ra các dự đoán tuyệt vời về nhiều loại dữ liệu với sự sửa đổi tối thiểu trong các gói tìm hiểu khoa học.

Phương pháp lựa chọn mô hình dự báo xác suất vỡ nợ

Để đánh giá mức độ phù hợp của các mô hình dự báo xác suất vỡ nợ, một vài kỹ thuật được sử dụng như ma trận Confussion (Confussion Matrix), tỷ lệ độ chính xác (Accuracy ratio), tỷ lệ nhạy cảm (Sensitivity ratio), tỷ lệ Specificity (Specificity ratio), điểm F1 (F1 - score).

Ma trận Confussion là một phương pháp được xây dựng để đánh giá kết quả của những bài toán phân loại bằng việc xem xét tỷ lệ về độ chính xác và độ bao quát của các dự đoán cho từng lớp cụ thể Một ma trận Confussion gồm có 4 chỉ số sau đối với mỗi lớp phân loại: True positive (TP) là chỉ số số lượng dự đoán chính xác; True Negative (TN) chỉ số số lượng dự báo chính xác một cách gián tiếp; False positive (FP) chỉ số số lượng các dự báo sai lệch; False Negative (FN) chỉ số số lượng các sai lệch một cách gián tiếp.Trong trường hợp đánh giá kết quả dự báo khả năng vỡ nợ của các doanh nghiệp, ma trận Confussion được mô hình như bảng dưới đây:

Actual Classes Không phá sản Phá sản class

Không phá sản True Negative (TN) False Positive (FP) Phá sản False Negative (FN) True Positive (TP)

Nguồn: Tổng hợp từ tác giả

Trong đó các chỉ số đối với mỗi lớp phân loại được hiểu như sau:

Bảng 3.6: Chỉ số đối với mỗi lớp trong Ma trận Confussion True Positive

Số lượng dự báo chính xác Là khi mô hình dự báo đúng một công ty bị phá sản.

Số lượng dự báo chính xác một cách gián tiếp Là khi mô hình dự đoán đúng một doanh nghiệp không bị phá sản, tức là việc không chọn trường hợp doanh nghiệp bị phá sản là chính xác.

Số lượng các dự đoán sai lệch Là khi mô hình dự báo một công ty bị phá sản nhưng công ty đó hoàn toàn khỏe mạnh Đây có thể được xem là lỗi loại 1 của mô hình.

Số lượng các dự đoán sai lệch một cách gián tiếp Là khi mô hình dự đoán một công ty không bị phá sản nhưng công ty đó lại rơi vào tình trạng phá sản, tức là việc không chọn trường hợp công ty đó bị phá sản là sai Đây được xem là lỗi loại 2 của mô hình.

Nguồn: Tổng hợp từ tác giả

Theo các nghiên cứu của Haydenand Daniel thấy rằng, mục tiêu của mô hình dự báo xác suất vỡ nợ là phân tích, đánh giá và xếp hạng các khách hàng vay, để từ đó phân loại được khách hàng tốt và khách hàng xấu Tuy nhiên khi rủi ro xảy ra, các thống kê cho thấy rằng False Negative tức là lỗi loại 2, sẽ mang đến những tổn thất lớn cho ngân hàng hơn là False Positive tức là lỗi loại 1, do khả năng không thu hồi vốn được từ nhóm khách hàng do lỗi loại 2 gây ra.

Từ bốn chỉ số trên, các nhà nghiên cứu xây dựng các nhóm chỉ số để đánh giá mức độ tin cậy của một mô hình dự báo xác suất vỡ nợ của doanh nghiệp.

Bảng 3.7: Các nhóm chỉ số để đánh giá mức độ tin cậy của một mô hình

Chỉ số Định nghĩa Công thức

Tỷ lệ đo lường sự chính xác của mô hình

Mức độ chính xác là khả năng mô hình phân biệt được những công ty phá sản và không phá sản một cách chính xác

Accuracy = (TN + TP)/ (TN + FN + TP + FP)

Tỷ lệ đo lường mức độ nhạy cảm của mô hình

Mức độ chính xác là khả năng mô hình phân biệt được những công ty phá sản và không phá sản một cách chính xác

(specificity ratio) Đây là tỷ lệ được xây dựng nhằm đo lường khả năng mô hình xác định được các trường hợp các công ty không bị phá sản một cách chính xác.

Tỷ lệ này được xác định bởi tỷ lệ các công ty được dự báo không phá sản chính xác trên tổng các công ty không bị phá sản thật sự

(precision ratio) Đây là tỷ lệ đo lường số lượng công ty được dự báo phá sản chính xác trên

Chỉ số Định nghĩa Công thức tổng các công ty được dự báo phá sản

Nguồn: Tổng hợp từ tác giả

3.5.2 Điểm số F1 (F1-score) Điểm số F1-score được đưa ra nhằm khắc phục nhược điểm của việc đánh giá mức độ tin cậy của mô hình dựa trên các nhóm chỉ số được xây dựng dựa trên ma trận Confussion Trong các bài toán phân loại các công ty thuộc lớp phá sản hoặc không phá sản, bộ dữ liệu được sử dụng để xây dựng và kiểm định mô hình thường có sự phân bố không đồng đều, trong trường hợp này dữ liệu về các công ty không phá sản sẽ chiếm một tỷ lệ lớn hơn rất nhiều so với dữ liệu của các công ty phá sản, từ đó dẫn đến các tỷ lệ sensitivity và tỷ lệ precision thường bị lệch và cho kết quả dự báo không thật sự chính xác Vì vậy, F1 - Score được đưa ra, nó là chỉ số được xây dựng dựa trên việc đánh giá đồng thời giữa 2 nhóm tỷ lệ sensitivity và precision, từ đó dẫn đến kết quả đánh giá tính hiệu quả của các mô hình xếp hạng sẽ cho kết quả đáng tin cậy hơn F1 - Score hay còn gọi là F-measure được xác định bởi công thức như sau:

F1 Score = 2 * (Precision*Sensitivity) / (Precision + Sensitivity)

F1 - Score càng tiệm cận với giá trị là 1 thì mức độ chính xác và hiệu quả của mô hình xếp hạng tín nhiệm càng cao và đáng tin cậy.

Trong chương này, tác giả trình bày chi tiết về nội dung của mô hình nghiên cứu (mô hình ước lượng xác suất vỡ nợ đề xuất), mô tả chi tiết dữ liệu thu thập được và các phương pháp nghiên cứu được sử dụng để xác định xác suất vỡ nợ, đồng thời trong chương tiếp theo sẽ trình bày độ tin cậy của mô hình nghiên cứu Các mô hình ước lượng xác suất vỡ nợ được đề xuất được sử dụng bao gồm các mô hình logit, cây quyết định và random forest.

KẾT QUẢ NGHIÊN CỨU

Kết quả thống kê mô tả

Bảng 4.1: Thống kê mô tả các biến độc lập Biến độc lập Các chỉ số tài chính Mean Media n Min Max

X1 Lợi nhuận gộp/Doanh thu thuần (%)

X2 Thu nhập trước thuế/Doanh thu thuần (%)

X3 Thu nhập trước thuế/Tổng tài sản (%)

X4 Thu nhập trước thuế/Vốn chủ sở hữu (%)

Tổng nợ phải trả/Tổng tài sản

X6 Tổng nợ phải trả/Vốn chủ sở hữu (%)

Tài sản ngắn hạn/Nợ ngắn hạn (lần)

(Tài sản ngắn hạn - Hàng tồn kho)/Nợ ngắn hạn (lần)

Lợi nhuận trước thuế và lãi vay/Lãi vay (lần) 328.103 3.30

Thu nhập trước thuế, lãi vay và khấu hao/Nợ dài hạn (lần)

X11 Tiền và các khoản tương 0.22

Biến độc lập Các chỉ số tài chính Mean Media n Min Max đương tiền/Vốn chủ sở hữu

X12 Giá vốn hàng bán/Hàng tồn kho bình quân (vòng) 19.42

X13 Các khoản phải thu/Doanh thu bình quân (lần) 172.769 46.049 -3847.237 22564.721

Tổng doanh thu/Tổng tài sản

Nguồn: Thống kê từ tác giả

Bảng 4.1 trình bày các giá trị của 14 biến độc lập về giá trị trung bình, độ lệch tuyệt đối trung bình (MAD), giá trị nhỏ nhất (Min) và giá trị lớn nhất (Max) để giúp chúng ta hiểu tập dữ liệu được sử dụng để phát triển các mô hình dự báo tỷ lệ vỡ nợ Xét về giá trị trung bình, Lợi nhuận trước thuế và lãi vay/Lãi vay (X9) đạt giá trị cao nhất (328.103) và giá trị thấp nhất (X2) là Thu nhập trước thuế/Doanh thu thuần (0.002) Trong khi đó, biến có giá trị MAD lớn nhất là Các khoản phải thu/Doanh thu bình quân (X13) (46.049) và X2 (Thu nhập trước thuế/Doanh thu thuần) có giá trị nhỏ nhất với 0.035 Ngoài ra, Các khoản phải thu/Doanh thu bình quân (X13) có giá trị nhỏ nhất tại -3847.237 và biến có giá trị tối thiểu cao nhất (0.153) là Tài sản ngắn hạn/Nợ ngắn hạn (X7) Cuối cùng,Lợi nhuận trước thuế và lãi vay/Lãi vay (X9) là giá trị lớn nhất lớn nhất (77002.674) và giá trị lớn nhất nhỏ nhất (0.915) là Thu nhập trước thuế/Tổng tài sản (X3).

Hệ số tương quan

Ma trận tương quan giữa các biến trong mô hình: Hình 4.1 thể hiện hệ số tương quanPearson giữa các cặp biến Hệ số tương quan Pearson (r) là thước đo tương quan tuyến

Nguồn: Thống kê từ tác giả tính giữa hai biến Giá trị của nó nằm trong khoảng từ -1 đến +1, -1 biểu thị tổng tương quan tuyến tính âm, 0 biểu thị không có tương quan tuyến tính và 1 biểu thị tổng tương quan tuyến tính dương Hơn nữa, r bất biến dưới những thay đổi riêng biệt về vị trí và tỷ lệ của hai biến, ngụ ý rằng đối với một hàm tuyến tính, góc đối với trục x không ảnh hưởng đến r Để tính r cho hai biến X và Y, người ta chia hiệp phương sai của X và Y cho tích các độ lệch chuẩn của chúng.

Nguồn: Thống kê từ tác giả

Hình 4.1 thể hiện mối quan hệ giữa các biến độc lập trong mô hình ước lượng xác suất vỡ nợ, trong ma trận tương quan trên có cặp biến độc lập có mức độ tương quan cao Ví dụ: (i) biến Thu nhập trước thuế/Doanh thu thuần (X2) và Lợi nhuận gộp/Doanh thu thuần (X1): mức độ tương quan là 0.68; (ii) biến Tiền và các khoản tương đương tiền/Vốn chủ sở hữu (X11) và Tổng nợ phải trả/Vốn chủ sở hữu (X6): mức độ tương quan là 0.71; (iii) biến Tổng nợ phải trả/Tổng tài sản (X5) và Thu nhập trước thuế/Tổng tài sản (X3): mức độ tương quan là -0.48 Tuy nhiên, các mức độ tương quan này đều nhỏ hơn 0,8, do đó hiện tượng đa cộng tuyến giữa các biến trong mô hình có thể không tác động quá lớn đến kết quả hồi quy của mô hình.

Hình 4.1: Ma trận tương quan

Nguồn: Thống kê từ tác giả

Kết quả hồi quy của mô hình tham số

4.3.1 Kết quả hồi quy của mô hình logistic

Bảng 4.2: Kết quả hồi quy của mô hình logistic

Bảng 4.2 chỉ ra kết quả hồi quy của mô hình logistic (Phần code dùng để chạy mô hình logistic gồm 5 bước tại phụ lục - Hình 1) , các biến độc lập Lợi nhuận gộp/Doanh thu thuần (X1), Thu nhập trước thuế/Tổng tài sản (X3), Thu nhập trước thuế/Vốn chủ sở hữu (X4), Tổng nợ phải trả/Tổng tài sản (X5), Tài sản ngắn hạn/Nợ ngắn hạn (X7), Thu nhập trước thuế, lãi vay và khấu hao/Nợ dài hạn (X10), Tiền và các khoản tương đương tiền/Vốn chủ sở hữu (X11), Giá vốn hàng bán/Hàng tồn kho bình quân (X12), Tổng doanh thu/Tổng tài sản (X14) di chuyển ngược chiều với biến phụ thuộc Sự biến thiên này tương ứng với kỳ vọng về dấu của các biến độc lập được trình bày trong Bảng 3.3. Các biến X4, X7 và X14 có tác động đáng kể đến kết quả dự báo khả năng vỡ nợ của các doanh nghiệp, với các hệ số đo lường lớn lần lượt là -0.31, -0.52 và - 0.63 Ngược lại, biến X1 và X10 có mức độ ảnh hưởng không rõ ràng với các hệ số đo lường lần lượt là -0.025 và -0.01. Điều này cho rằng, lợi nhuận gộp và thu nhập trước thuế trên doanh thu thuần và vốn chủ sở hữu của một doanh nghiệp càng lớn thì khả năng tạo ra lợi nhuận của doanh nghiệp càng cao và khả năng phá sản của doanh nghiệp càng thấp Bên cạnh đó, khả năng thanh toán lãi vay được đánh giá bằng tỷ lệ phần trăm tài sản ngắn hạn trên nợ ngắn hạn càng lớn nghĩa là doanh nghiệp đang nắm giữ lượng tiền mặt nhiều thì xác suất phá sản của doanh nghiệp càng thấp Hơn nữa, khả năng trả lãi vay bằng tỷ lệ lợi nhuận trước thuế và lãi vay trên lãi vay chiếm tỷ lệ càng lớn thì xác suất phá sản của doanh nghiệp đó cũng sẽ giảm Ngoài ra, vòng quay tổng tài sản càng lớn, tức là doanh nghiệp đó sử dụng các tài sản trong doanh nghiệp càng hiệu quả thì khả năng vỡ nợ của doanh nghiệp càng có xu hướng giảm.

Mặt khác, các biến độc lập như Thu nhập trước thuế/Doanh thu thuần (X2), Tổng nợ phải trả/Vốn chủ sở hữu (X6), (Tài sản ngắn hạn - Hàng tồn kho)/Nợ ngắn hạn (X8), Lợi nhuận trước thuế và lãi vay/Lãi vay (X9), Các khoản phải thu/Doanh thu bình quân(X13) theo cùng chiều với biến phụ thuộc Sự biến động cùng chiều này phù hợp với các kỳ vọng về dấu của các biến độc lập được dự báo trong các nghiên cứu trước đây.

Hơn nữa, trong đó biến X2 có tác động lớn hơn đến kết quả của mô hình dự báo tỷ lệ vỡ nợ với các hệ số đo được trong Mô hình logistic là 0.25 Ngược lại, biến X9 có ảnh hưởng yếu hơn với hệ số đo được khá thấp là 0.000018.

Dựa vào kết quả hồi quy của mô hình logistic, có thể thấy rằng nếu một doanh nghiệp nếu sử dụng nợ vay càng cao thì khả năng tự chủ tài chính của doanh nghiệp càng thấp, áp lực tài chính càng lớn dẫn đến khả năng phá sản càng tăng cao Bên cạnh đó, việc quản lý hàng tồn kho cũng đóng vai trò vô cùng quan trọng đến khả năng sinh lời của doanh nghiệp Đặc biệt, các doanh nghiệp sản xuất phải luôn lưu trữ một lượng hàng hóa nhất định để đảm bảo việc sản xuất được diễn ra thường xuyên và giảm đến mức tối đa thiệt hại do biến động giá nguyên vật liệu.

Trong mô hình logistic, có 6 trong số 14 biến độc lập có ý nghĩa thống kê, bao gồm các biến X1, X2, X3, X5, X11 và X14; trong đó biến X2, X3, X5 và X14 có ý nghĩa thống kê tại mức 1%, biến X1 có ý nghĩa thống kê tại mức 10% và biến X11 có ý nghĩa thống kê tại mức 5% Do đó, xác suất vỡ nợ được ước lượng theo mô hình logit có thể được thể hiện như sau: ехр(-0 47 - 0 025^1 + 0 25․47 - 0․025^1 + 0․25 ․47 - 0․025^1 + 0․25 ․47 - 0․025^1 + 0․25 X 2 - 0 065․47 - 0․025^1 + 0․25 X 3 - 0 23․47 - 0․025^1 + 0․25 X 5 - 0 13^11 - 0 63^14 )․47 - 0․025^1 + 0․25 ․47 - 0․025^1 + 0․25

4.3.2 Ma trận Confusion của mô hình hồi quy logistic

Bảng 4.3: Ma trận Confusion của mô hình hồi quy logistic

Accuracy = 0.9020 Sensitivity = 0.1111 Specificity = 0.9936 Precision = 0.6667 F1 - Score = 0.1905

Nguồn: Tổng hợp từ tác giả

Bảng 4.3 chỉ ra ma trận Confusion của mô hình hồi quy logistic forest (Phần code dùng để chạy ma trận Confusion của mô hình cây quyết định tại phụ lục - Hình 2) Chọn ngẫu nhiên 347 doanh nghiệp để kiểm tra xem có bao nhiêu doanh nghiệp phá sản và không phá sản được dự đoán chính xác Từ đó xác định Accuracy, Sensitivity, Specificity, Precision và F1 - Score Có thể thấy rằng trong số 347 doanh nghiệp, mô hình đã dự đoán đúng 309 doanh nghiệp không phá sản Hơn nữa, mô hình đã dự đoán chính xác sự phá sản của 4 doanh nghiệp Chỉ số Accuracy của mô hình cây quyết định là 0.9020, cho thấy mô hình cây quyết định có thể phân biệt một cách đáng tin cậy giữa các doanh nghiệp bị phá sản và không bị phá sản với tỷ lệ 90.20% Thông qua chỉ số Sensitivity, nó có thể được thấy khả năng xác định chính xác doanh nghiệp phá sản của mô hình hồi quy logistic chỉ 11.11% Theo chỉ số Precision, 66.67% các doanh nghiệp dự đoán phá sản là chính xác Hiệu quả của mô hình hồi quy logistic được đánh giá thông qua F1 -Score với giá trị là 19.05%, điều đó có nghĩa là việc đánh giá mô hình này cho kết quả chưa thật sự đáng tin cậy.

Kết quả hồi quy của các mô hình phi tham số

4.4.1 Mô hình cây quyết định (Decision tree)

Hình 4.2: Kết quả hồi quy của mô hình cây quyết định

Nguồn: Tổng hợp từ tác giả

Sử dụng tập huấn luyện (X_train) gồm 14 doanh nghiệp để tìm ra 2 biến có ảnh hưởng nhiều nhất đến mô hình cây quyết định Do đó, X11 và X2 có tác động rất lớn đến việc xác định có bao nhiêu doanh nghiệp vỡ nợ và không vỡ nợ, (Phần code dùng để vẽ mô hình cây quyết định tại phụ lục - Hình 3).

Bước 1: Sử dung biến độc lập X11 chia tổng thể thành hai nhóm: 3 doanh nghiệp phá sản và 11 doanh nghiệp không phá sản Nếu X11 ≤ 0.685, giá trị đầu ra được dự đoán chính xác là 0 doanh nghiệp phá sản Ngược lại, xem xét bước tiếp theo.

Bước 2: Nếu X11 > 0.685 và X2 ≤ 0.004, mô hình dự đoán đúng 3 doanh nghiệp phá sản trong tổng số 4 doanh nghiệp Ngược lại, X2 > 0.004, xem xét bước tiếp theo.

Bước 3: Nếu X11 > 0.685, X2 > 0.004 thì có 0 doanh nghiệp phá sản.

Bảng 4.4: Ma trận Confusion của mô hình cây quyết định (Decision Tree)

Accuracy = 0.9049 Sensitivity = 0.4444 Specificity = 0.9582 Precision = 0.5517 F1 - Score = 0.4923

Nguồn: Tổng hợp từ tác giả

Bảng 4.4 chỉ ra ma trận Confusion của mô hình cây quyết định (Phần code dùng để chạy ma trận Confusion của mô hình cây quyết định tại phụ lục - Hình 4) Chọn ngẫu nhiên

347 doanh nghiệp để kiểm tra xem có bao nhiêu doanh nghiệp phá sản và không phá sản được dự đoán chính xác Từ đó xác định Accuracy, Sensitivity, Specificity, Precision và F1 - Score Có thể thấy rằng trong số 347 doanh nghiệp, mô hình đã dự đoán đúng 298 doanh nghiệp không phá sản Hơn nữa, mô hình đã dự đoán chính xác sự phá sản của 16 doanh nghiệp Chỉ số Accuracy của mô hình cây quyết định là 0.9049, cao hơn mô hình hồi quy Logistic, cho thấy mô hình cây quyết định có thể phân biệt một cách đáng tin cậy giữa các doanh nghiệp bị phá sản và không bị phá sản với tỷ lệ 90.49% Thông qua chỉ số Sensitivity, nó có thể được thấy khả năng xác định chính xác doanh nghiệp phá sản của mô hình cây quyết định lên tới 44.44%, cao hơn so với mô hình hồi quy logistic. Theo chỉ số Precision, 55.17% các doanh nghiệp dự đoán phá sản là chính xác Hiệu quả của mô hình cây quyết định được đánh giá thông qua F1 - Score với giá trị là 49.23%, cao hơn mô hình hồi quy Logistic, điều đó có nghĩa là việc đánh giá mô hình này cho kết quả đáng tin cậy hơn mô hình hồi quy

Bảng 4.5: Ma trận Confusion của mô hình Random forest

Accuracy = 0.9452 Sensitivity = 0.5556 Specificity = 0.9904 Precision = 0.8696 F1 - Score = 0.6780

Nguồn: Tổng hợp từ tác giả

Bảng 4.5 chỉ ra ma trận Confusion của mô hình random forest (Phần code dùng để chạy ma trận Confusion của mô hình random forest tại phụ lục - Hình 5) Chọn ngẫu nhiên

347 doanh nghiệp để kiểm tra xem có bao nhiêu doanh nghiệp phá sản và không phá sản được dự đoán chính xác Từ đó xác định Accuracy, Sensitivity, Specificity, Precision và F1 - Score Có thể thấy rằng trong số 347 doanh nghiệp, mô hình đã dự đoán đúng 308 doanh nghiệp không phá sản Hơn nữa, mô hình đã dự đoán chính xác sự phá sản của 20 doanh nghiệp Chỉ số Accuracy của mô hình cây quyết định là 0.9052, cao hơn mô hình hồi quy Logistic, cho thấy mô hình random forest có thể phân biệt một cách đáng tin cậy giữa các doanh nghiệp bị phá sản và không bị phá sản với tỷ lệ 90.52% Thông qua chỉ số Sensitivity, nó có thể được thấy khả năng xác định chính xác doanh nghiệp phá sản của mô hình cây quyết định lên tới 55.56%, cao hơn so với mô hình hồi quy logistic. Theo chỉ số Precision, 86.96% các doanh nghiệp dự đoán phá sản là chính xác Hiệu quả của mô hình random forest được đánh giá thông qua F1 -Score với giá trị là 67,8%, cao hơn mô hình hồi quy Logistic, điều đó có nghĩa là việc

5 0 đánh giá mô hình này cho kết quả đáng tin cậy hơn mô hình hồi quy Logistic.

Thông qua hai bảng ma trận confusion bên trên của hai mô hình ước lượng xác suất vỡ nợ là: mô hình cây quyết định và mô hình random forest, ta có thể đưa ra nhận định rằng mô hình cây quyết định mang lại kết quả kém mô hình random forest khi tất cả chỉ sốAccuracy, Sensitivity, Specificity, Precision và F1 - Score đều thấp hơn Điều này cho thấy rõ ràng sự vượt trội của mô hình random forest so với mô hình cây quyết định.

Trong chương này, tác giả phân tích kết quả hồi quy từ các mô hình tham số và phi tham số và sử dụng các tiêu chí (Accuracy, Sensitivity, Specificity, Precision, F1 - Score) được tính từ ma trận confusion để đánh giá khả năng ước lượng xác suất vỡ nợ của từng mô hình Qua đó đã tìm thấy một mô hình phù hợp để ước lượng xác suất vỡ nợ của các doanh nghiệp.

Ngày đăng: 28/08/2023, 22:03

HÌNH ẢNH LIÊN QUAN

Hình 1.1: Dự báo tỷ lệ vỡ nợ năm 2023 so với năm 2019 - 1228 Ước Lượng Xác Suất Vỡ Nợ Của Khách Hàng Doanh Nghiệp Bằng Phương Pháp Học Máy 2023.Docx
Hình 1.1 Dự báo tỷ lệ vỡ nợ năm 2023 so với năm 2019 (Trang 13)
Hình 2.1: 4 nhóm chỉ số tài chính - 1228 Ước Lượng Xác Suất Vỡ Nợ Của Khách Hàng Doanh Nghiệp Bằng Phương Pháp Học Máy 2023.Docx
Hình 2.1 4 nhóm chỉ số tài chính (Trang 23)
Hình Tổng quan về mô hình Ưu điểm Nhược điểm - 1228 Ước Lượng Xác Suất Vỡ Nợ Của Khách Hàng Doanh Nghiệp Bằng Phương Pháp Học Máy 2023.Docx
nh Tổng quan về mô hình Ưu điểm Nhược điểm (Trang 25)
Hình Tổng quan về mô hình Ưu điểm Nhược điểm - 1228 Ước Lượng Xác Suất Vỡ Nợ Của Khách Hàng Doanh Nghiệp Bằng Phương Pháp Học Máy 2023.Docx
nh Tổng quan về mô hình Ưu điểm Nhược điểm (Trang 26)
Hình Tổng quan về mô hình Ưu điểm Nhược điểm - 1228 Ước Lượng Xác Suất Vỡ Nợ Của Khách Hàng Doanh Nghiệp Bằng Phương Pháp Học Máy 2023.Docx
nh Tổng quan về mô hình Ưu điểm Nhược điểm (Trang 27)
Bảng 3.1: Tổng hợp số lượng doanh nghiệp - ngành nghề kinh doanh ST - 1228 Ước Lượng Xác Suất Vỡ Nợ Của Khách Hàng Doanh Nghiệp Bằng Phương Pháp Học Máy 2023.Docx
Bảng 3.1 Tổng hợp số lượng doanh nghiệp - ngành nghề kinh doanh ST (Trang 36)
Bảng 3.2: Phân tách các doanh nghiệp phá sản và không phá sản - 1228 Ước Lượng Xác Suất Vỡ Nợ Của Khách Hàng Doanh Nghiệp Bằng Phương Pháp Học Máy 2023.Docx
Bảng 3.2 Phân tách các doanh nghiệp phá sản và không phá sản (Trang 37)
Bảng 3.3: Các biến độc lập trong mô hình dự báo xác suất vỡ nợ Các biến - 1228 Ước Lượng Xác Suất Vỡ Nợ Của Khách Hàng Doanh Nghiệp Bằng Phương Pháp Học Máy 2023.Docx
Bảng 3.3 Các biến độc lập trong mô hình dự báo xác suất vỡ nợ Các biến (Trang 40)
Bảng 3.4: Cấu trúc dữ liệu các biến trong mô hình Logit - 1228 Ước Lượng Xác Suất Vỡ Nợ Của Khách Hàng Doanh Nghiệp Bằng Phương Pháp Học Máy 2023.Docx
Bảng 3.4 Cấu trúc dữ liệu các biến trong mô hình Logit (Trang 42)
Hình 3.2: Mô phỏng mô hình cây quyết định - 1228 Ước Lượng Xác Suất Vỡ Nợ Của Khách Hàng Doanh Nghiệp Bằng Phương Pháp Học Máy 2023.Docx
Hình 3.2 Mô phỏng mô hình cây quyết định (Trang 43)
Hình 3.3: Mô phỏng mô hình random forest - 1228 Ước Lượng Xác Suất Vỡ Nợ Của Khách Hàng Doanh Nghiệp Bằng Phương Pháp Học Máy 2023.Docx
Hình 3.3 Mô phỏng mô hình random forest (Trang 44)
Bảng 3.5: Ma trận Confussion Predicted class - 1228 Ước Lượng Xác Suất Vỡ Nợ Của Khách Hàng Doanh Nghiệp Bằng Phương Pháp Học Máy 2023.Docx
Bảng 3.5 Ma trận Confussion Predicted class (Trang 46)
Bảng 3.7: Các nhóm chỉ số để đánh giá mức độ tin cậy của một mô hình - 1228 Ước Lượng Xác Suất Vỡ Nợ Của Khách Hàng Doanh Nghiệp Bằng Phương Pháp Học Máy 2023.Docx
Bảng 3.7 Các nhóm chỉ số để đánh giá mức độ tin cậy của một mô hình (Trang 47)
Bảng 4.1: Thống kê mô tả các biến độc lập Biến - 1228 Ước Lượng Xác Suất Vỡ Nợ Của Khách Hàng Doanh Nghiệp Bằng Phương Pháp Học Máy 2023.Docx
Bảng 4.1 Thống kê mô tả các biến độc lập Biến (Trang 50)
Bảng 4.1 trình bày các giá trị của 14 biến độc lập về giá trị trung bình, độ lệch tuyệt đối trung bình (MAD), giá trị nhỏ nhất (Min) và giá trị lớn nhất (Max) để giúp chúng ta hiểu tập dữ liệu được sử dụng để phát triển các mô hình dự báo tỷ lệ vỡ nợ - 1228 Ước Lượng Xác Suất Vỡ Nợ Của Khách Hàng Doanh Nghiệp Bằng Phương Pháp Học Máy 2023.Docx
Bảng 4.1 trình bày các giá trị của 14 biến độc lập về giá trị trung bình, độ lệch tuyệt đối trung bình (MAD), giá trị nhỏ nhất (Min) và giá trị lớn nhất (Max) để giúp chúng ta hiểu tập dữ liệu được sử dụng để phát triển các mô hình dự báo tỷ lệ vỡ nợ (Trang 51)
Hình 4.1 thể hiện mối quan hệ giữa các biến độc lập trong mô hình ước lượng xác suất vỡ nợ, trong ma trận tương quan trên có cặp biến độc lập có mức độ tương quan cao - 1228 Ước Lượng Xác Suất Vỡ Nợ Của Khách Hàng Doanh Nghiệp Bằng Phương Pháp Học Máy 2023.Docx
Hình 4.1 thể hiện mối quan hệ giữa các biến độc lập trong mô hình ước lượng xác suất vỡ nợ, trong ma trận tương quan trên có cặp biến độc lập có mức độ tương quan cao (Trang 53)
Bảng 4.2: Kết quả hồi quy của mô hình logistic - 1228 Ước Lượng Xác Suất Vỡ Nợ Của Khách Hàng Doanh Nghiệp Bằng Phương Pháp Học Máy 2023.Docx
Bảng 4.2 Kết quả hồi quy của mô hình logistic (Trang 54)
Bảng 4.3 chỉ ra ma trận Confusion của mô hình hồi quy logistic forest (Phần code dùng để chạy ma trận Confusion của mô hình cây quyết định tại phụ lục - Hình 2) - 1228 Ước Lượng Xác Suất Vỡ Nợ Của Khách Hàng Doanh Nghiệp Bằng Phương Pháp Học Máy 2023.Docx
Bảng 4.3 chỉ ra ma trận Confusion của mô hình hồi quy logistic forest (Phần code dùng để chạy ma trận Confusion của mô hình cây quyết định tại phụ lục - Hình 2) (Trang 57)
Hình 4.2: Kết quả hồi quy của mô hình cây quyết định - 1228 Ước Lượng Xác Suất Vỡ Nợ Của Khách Hàng Doanh Nghiệp Bằng Phương Pháp Học Máy 2023.Docx
Hình 4.2 Kết quả hồi quy của mô hình cây quyết định (Trang 58)
Bảng 4.4: Ma trận Confusion của mô hình cây quyết định (Decision Tree) - 1228 Ước Lượng Xác Suất Vỡ Nợ Của Khách Hàng Doanh Nghiệp Bằng Phương Pháp Học Máy 2023.Docx
Bảng 4.4 Ma trận Confusion của mô hình cây quyết định (Decision Tree) (Trang 59)
Bảng 1: Các biến đầu vào của RiskCalc - mô hình công ty tư nhân Nhật Bản - 1228 Ước Lượng Xác Suất Vỡ Nợ Của Khách Hàng Doanh Nghiệp Bằng Phương Pháp Học Máy 2023.Docx
Bảng 1 Các biến đầu vào của RiskCalc - mô hình công ty tư nhân Nhật Bản (Trang 73)
Bảng 3: Mẫu các chỉ tiêu tài chính của các doanh nghiệp Doanh - 1228 Ước Lượng Xác Suất Vỡ Nợ Của Khách Hàng Doanh Nghiệp Bằng Phương Pháp Học Máy 2023.Docx
Bảng 3 Mẫu các chỉ tiêu tài chính của các doanh nghiệp Doanh (Trang 75)

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w