Tiểu luận kết thúc học phần môn khoa học dữ liệu đề tài dự đoán phá sản

41 7 0
Tiểu luận kết thúc học phần môn khoa học dữ liệu đề tài dự đoán phá sản

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Vì vậy, nhómchúng em chọn “Dự đoán phá sản” làm đề tài nghiên cứu nhằm mục đích giúp các nhàquản lý, nhà đầu tư có thêm thông tin khi đưa ra quyết định của mình.II.Mục tiêu nghiên cứu:Mụ

ĐẠI HỌC KINH TẾ THÀNH PHỐ HỒ CHÍ MINH KHOA CÔNG NGHỆ THÔNG TIN KINH DOANH BÀI TIỂU LUẬN KẾT THÚC HỌC PHẦN Môn: KHOA HỌC DỮ LIỆU Đề tài: DỰ ĐOÁN PHÁ SẢN Giảng viên hướng dẫn: Thạc sĩ Trương Việt Phương Mã lớp HP: 23C1INF50905974 Buổi: Sáng thứ Thành phố Hồ Chí Minh, 11 tháng 10 năm 2023 TỈ LỆ ĐIỂM CỦA CÁC THÀNH VIÊN CỦA NHÓM HỌ VÀ TÊN MSSV MỨC ĐỘ HOÀN THÀNH (%) Võ Thiệu Bình 31221022404 100% Vũ Đức Dũng 31221022804 100% Huỳnh Thị An Kiều 31211025334 100% Trần Thị Ngọc Tuyền 31221021726 100% Trương Ý Vy 31221024165 100% MỤC LỤC Phần 1: MỤC ĐÍCH, NỘI DUNG VÀ PHƯƠNG PHÁP NGHIÊN CỨU I Lý chọn đề tài II Mục tiêu nghiên cứu III Phương pháp nghiên cứu Phương pháp nghiên cứu lý luận 2 Phương pháp nghiên cứu thực tiễn Phần 2: GIỚI THIỆU TỔNG QUAN VỀ BỘ DỮ LIỆU .3 I Giới thiệu liệu Thông tin tổng quát Thông tin thuộc tính .4 II Các nghiên cứu liên quan đến liệu 11 Phần 3: QUY TRÌNH TIỀN XỬ LÍ BỘ DỮ LIỆU .11 I Quy trình thực tiền xử lí liệu 11 II Quan sát tổng quan liệu 11 Thực quan sát đặc điểm đặc tính 11 Phân tích kết quan sát 12 III Quy trình tiền xử lí tổng quan liệu 15 Phần 4: THỰC HIỆN PHÂN CỤM DỮ LIỆU 17 I Lựa chọn phương pháp phân cụm liệu 17 II Thực phân tích kết phân cụm .17 Phân cụm phân cấp 17 Thuật toán K-Means 23 III Kết luận cuối 25 Phần 5: THỰC HIỆN PHÂN LỚP DỮ LIỆU .25 I Lựa chọn phương pháp phân lớp liệu 25 II Thực phân tích kết phân lớp 27 Hồi quy Logistic hiệu chỉnh hồi quy Logistic 27 Cây định 31 SVM 32 Mạng thần kinh nơ ron nhân tạo 33 III Lời nói sau kết luận 34 Phần 6: THỰC HIỆN DỰ BÁO DỰA TRÊN MƠ HÌNH HỌC MÁY TỐT NHẤT 35 Phần 7: KẾT LUẬN 37 DANH MỤC TÀI LIỆU THAM KHẢO 39 Phần 1: MỤC ĐÍCH, NỘI DUNG VÀ PHƯƠNG PHÁP NGHIÊN CỨU I Lý chọn đề tài: Lời đầu tiên, chúng em xin gửi lời cảm ơn chân thành đến Thạc sĩ Trương Việt Phương hỗ trợ chúng em suốt thời gian học tập giúp chúng em có nhìn tổng qt hồn thiện phần mềm Orange nói riêng mơn Khoa học liệu nói chung Qua dự án lần này, nhóm chúng em xin trình bày kiến thức kỹ mà chúng em hướng dẫn qua buổi học Trong q trình hồn thành dự án chúng em cịn nhiều hạn chế nên khơng tránh khỏi thiếu sót Vì vậy, nhóm chúng em mong nhận phản hồi góp ý thầy để dự án kết thúc môn học chúng em hồn thiện cách tốt Dự đốn khả phá sản doanh nghiệp vấn đề vơ quan trọng cần thiết giúp doanh nghiệp dự tính trước mức độ sử dụng nguồn vốn cho hợp lý việc quản lí doanh nghiệp để khơng rơi vào tình trạng phá sản Trong bối cảnh kinh tế phức tạp nay, việc sản xuất, vận hành doanh nghiệp gặp khơng khó khăn việc dự báo khả phá sản doanh nghiệp lại quan trọng hết Vì vậy, nhóm chúng em chọn “Dự đoán phá sản” làm đề tài nghiên cứu nhằm mục đích giúp nhà quản lý, nhà đầu tư có thêm thơng tin đưa định II Mục tiêu nghiên cứu: Mục tiêu nghiên cứu dự báo khả phá sản doanh nghiệp, để từ đưa biện pháp nhìn tổng quan, giúp cho doanh nghiệp giảm nguy phá sản Nghiên cứu tập trung vào lý thuyết kỹ thuật khoa học liệu khai thác liệu Các mơ hình xây dựng dựa liệu sẵn có mơ hình phù hợp lựa chọn để thực dự báo liệu dự báo Nghiên cứu góp phần tạo tảng cho nghiên cứu III Phương pháp nghiên cứu: Phương pháp nghiên cứu lý luận: Tiến hành nghiên cứu, thu thập, chọn lọc phân tích liệu, thơng tin cách đọc sách, báo, tài liệu nhằm tìm quan niệm, quan điểm xây dựng sở lý luận cho nghiên cứu, dự đốn thuộc tính đối tượng nghiên cứu, xây dựng sơ lý luận Các phương pháp nghiên cứu bao gồm: + Phương pháp phân tích tổng hợp lý thuyết: kết hợp kỹ phân tích lẫn kỹ tổng hợp tư liệu Phân tích dựa tảng thơng tin khoa học thu từ nguồn tài liệu có sẵn + Phương pháp phân tích - tổng hợp lý thuyết: Đọc tổng hợp lý thuyết, quan niệm, quan điểm liên quan đến đối tượng nghiên cứu để rút nội dung cần thiết + Phương pháp mô hình hóa: Xây dựng mơ hình nghiên cứu dựa lý thuyết ứng dụng mơ hình để dự báo nhằm kiểm định tính xác mơ hình Phương pháp nghiên cứu thực tiễn: Từ sở lý luận ấy, tiến hành vận dụng vào phương pháp nghiên cứu thực tiễn: Thơng qua thuật tốn phần mềm Orange - công cụ trực quan để nghiên cứu thuật toán machine learning thực hành khoa học liệu phổ biến để phân tích liệu làm rõ vấn đề nghiên cứu Từ đó, xây dựng mơ hình dự báo dựa vào liệu huấn luyện có sẵn so sánh kết rút với nhằm giúp nhà quản lý, nhà đầu tư có thêm thơng tin đưa định Phần 2: GIỚI THIỆU TỔNG QUAN VỀ BỘ DỮ LIỆU I Giới thiệu liệu: Thông tin tổng quát: - Bộ liệu sử dụng tiểu luận liệu có tên “Taiwanese Bankruptcy Prediction” (Dự đoán phá sản Đài Loan) - Bộ liệu lấy từ UCI Machine Learning Repository, với tác giả Deron Liang Chih-Fong Tsai, deronliang '@' gmail.com; cftsai '@' mgt.ncu.edu.tw, Đại học Quốc lập Trung Ương Đài Loan (National Central University), Đài Loan - Bộ liệu lấy thông tin doanh nghiệp từ Tạp chí Tài Đài Loan giai đoạn 1999 đến 2009 Định nghĩa phá sản công ty liệu định đoạt dựa luật doanh nghiệp Sàn chứng khoán Đài Loan - Bộ liệu bao gồm số thông tin sau:  Đặc điểm liệu: Đa biến  Lĩnh vực chủ yếu liệu: Doanh nghiệp, tài  Loại liệu thuộc tính: Số thực  Số lượng thuộc tính: 96  Số lượng thực thể: 6819 Thông tin thuộc tính: - Bộ liệu bao gồm 96 thuộc tính với nội dung là: Bankruptcy Label: Thuộc tính phân nhãn Nhãn liệu: khơng phá sản, phá 0,1 sản Cost of Interest-bearing Debt: Chi phí nợ Số thực dương liên tục có lãi [0;1] Cash Reinvestment Ratio: Số thực dương liên tục [0;1] Current Ratio: Hệ số toán hành Số thực dương liên tục [0;2.75e+09] Acid Test: Hệ số tốn nhanh (Cịn Số thực dương liên tục gọi Quick Ratio) [0;9.23e+09] Interest Expenses/Total Revenue: Tỉ lệ chi Số thực dương liên tục phí lãi tổng doanh thu trước thuế trả [0;1] lãi Total Liability/Equity Ratio: Tỉ số nợ phải Số thực dương liên tục trả/vốn chủ sở hữu [0;9.94e+09] Liability/Total Assets: tỉ số nợ phải trả/tổng Số thực dương liên tục tài sản [0;1] Interest-bearing Debt/Equity: Tỉ số nợ có Số thực dương liên tục lãi/vốn chủ sở hữu [0;9.9e+08] Contingent Liability/Equity: Tỉ số nợ Số thực dương liên tục không chắn/vốn chủ sở hữu 10 [0;1] Operating Income/Capital: Thu nhập hoạt Số thực dương liên tục động/Vốn 11 [0;1] Pretax Income/Capital: Thu nhập trước Số thực dương liên tục thuế/Vồn 12 [0;1] Working Capital to Total Assets: Vốn lưu Số thực dương liên tục động tổng tài sản 13 [0;1] 14 Quick Assets/Total nhanh/Tổng tài sản assets: Tài sản Số thực dương liên tục [0;1] Current Assets/Total Assets: Tài sản ngắn Số thực dương liên tục hạn/Tổng tài sản 15 [0;1] Cash/Total Assets: Tiền/Tổng tài sản Số thực dương liên tục 16 [0;1] Quick Assets/Current Liability: Tài sản Số thực dương liên tục 17 nhanh/Nợ ngắn hạn [0;8.82e+09] Cash/Current Liability: Tiền/Nợ ngắn hạn 18 Số thực dương liên tục [0;9.65e+09] Current Liability to Assets: Nợ ngắn hạn Số thực dương liên tục tài sản 19 [0;1] Operating Funds to Liability: Số thực dương liên tục 20 21 [0;1] Inventory/Working kho/Vốn lưu động Capital: Inventory/Current Liability: 22 kho/Nợ phải trả ngắn hạn Hàng tồn Số thực dương liên tục [0;1] Hàng tồn Số thực dương liên tục [0;9.91e+09] Current Liabilities/Liability: Nợ phải trả Số thực dương liên tục ngắn hạn/Nợ phải trả 23 [0;1] 24 Working Capital/Equity: động/Vốn chủ sổ hữu Vốn lưu Số thực dương liên tục [0;1] 25 Current Liabilities/Equity: Nợ phải trả ngắn Số thực dương liên tục hạn/Vốn chủ sở hữu [0;1] Long-term Liability to Current Assets: Nợ Số thực dương liên tục 26 phải trả dài hạn/Tài sản ngắn hạn [0;9.54e+09] Current Liability to Current Assets: Nợ Số thực dương liên tục phải trả ngắn hạn Tài sản ngắn hạn 27 [0;1] One if Total Liability exceeds Total Assets: Giá trị định tính Chỉ số tổng nợ phải trả cao tổng 0;1 28 tài sản Equity to Liability: Vốn chủ sở hữu nợ Số thực dương liên tục phải trả 29 [0;1] Equity/Total Assets: Vốn chủ sở hữu/Tổng Số thực dương liên tục tài sản 30 [0;1] (Long-term Liability+Equity)/Fixed Assets: Số thực dương liên tục (Nợ phải trả dài hạn + Vốn chủ sở hữu)/Tài [0;1] 31 sản cố định Fixed Assets to Assets: Tài sản cố định/Tài Số thực dương liên tục 32 sản [0;8.32e+09] Current Liability to Liability: Nợ phải trả Số thực dương liên tục ngắn hạn/ Nợ phải trả 33 [0;1] Current Liability to Equity: Nợ phải trả Số thực dương liên tục ngắn hạn/Vốn chủ sở hữu 34 [0;1] Equity to Long-term Liability: Vốn chủ sở Số thực dương liên tục hựu/Nợ phải trả dài hạn 35 [0;1] Liability to Equity: Nợ phải trả/Vốn chủ sở Số thực dương liên tục hữu 36 [0;1] Degree of Financial Leverage: Mức độ/ tỉ Số thực dương liên tục số đòn bẩy tài 37 [0;1] 38 Interest Coverage Ratio: Hệ số trả lãi Số thực dương liên tục [0;1] Operating Expenses/Net Sales: Chi phí Số thực dương liên tục 39 hoạt động/Lợi nhuận gộp [0;9.99e+09] (Research and Development Expenses)/Net Số thực dương liện tục Sales: Chi phí nghiên cứu phát triển/Lợi [0;9.98e+9] 40 nhuận gộp Effective Tax Rate: Tỉ lệ thuế thực tế 41 Số thực dương liên tục [0;1] Book Value Per Share(B): Giá cổ phiếu ghi Số thực dương liên tục sổ theo tiêu chí (B) 42 [0;1] Book Value Per Share(A): Giá cổ phiếu ghi Số thực dương liên tục sổ theo tiêu chí (A) 43 [0;1] Book Value Per Share(C): Giá cổ phiếu ghi Số thực dương liên tục sổ theo tiêu chí (C) 44 [0;1] Cash Flow Per Share: Dòng tiền Số thực dương liên tục cổ phiếu 45 [0;1] Sales Per Share: Thu nhập cố Số thực dương liên tục 46 phiếu [0;3.02e+09] Operating Income Per Share: Thu nhập Số thực dương liên tục hoạt động cổ phiếu 47 [0;1] Sales Per Employee: Doanh thu Số thực dương liên tục 48 nhân viên [0;8.81e+09] Operation Income Per Employee: 49 Số thực dương liên tục [0;1] Fixed Assets Per Employee: Số thực dương liên tục [0;9.99e+09] Total assets to GNP price: Số thực dương liên tục [0;9.57e+09] 50 51 52 Return On Total Assets(C): Tỉ suát sinh lợi Số thực dương liên tục

Ngày đăng: 30/01/2024, 04:55