Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 114 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
114
Dung lượng
2,68 MB
Nội dung
BỘ GIÁO DỤC VÀ ĐÀO TẠO NGÂN HÀNG NHÀ NƯỚC VIỆT NAM TRƯỜNG ĐẠI HỌC NGÂN HÀNG TP HỒ CHÍ MINH BÙI MINH HIẾU ỨNG DỤNG LÝ THUYẾT TẬP HỢP MỀM ĐỂ TỐI ƯU HÓA LỰA CHỌN CÁC TỶ SỐ TÀI CHÍNH TRONG VIỆC DỰ BÁO PHÁ SẢN CỦA DOANH NGHIỆP LUẬN VĂN THẠC SĨ KINH TẾ TP HỒ CHÍ MINH – NĂM 2016 BỘ GIÁO DỤC VÀ ĐÀO TẠO NGÂN HÀNG NHÀ NƯỚC VIỆT NAM TRƯỜNG ĐẠI HỌC NGÂN HÀNG TP HỒ CHÍ MINH BÙI MINH HIẾU ỨNG DỤNG LÝ THUYẾT TẬP HỢP MỀM ĐỂ TỐI ƯU HÓA LỰA CHỌN CÁC TỶ SỐ TÀI CHÍNH TRONG VIỆC DỰ BÁO PHÁ SẢN CỦA DOANH NGHIỆP LUẬN VĂN THẠC SĨ KINH TẾ Chuyên ngành: Tài – Ngân hàng Mã số: 60 34 02 01 Người hướng dẫn khoa học: PGS., TS TRỊNH QUỐC TRUNG TP HỒ CHÍ MINH – NĂM 2016 TÓM TẮT ĐỀ TÀI Nghiên cứu thực nhằm tìm tỷ số tài tối ưu đóng vai trị quan trọng dự báo phá sản dựa mẫu quan sát gồm 104 doanh nghiệp khoảng thời gian từ năm 2009 đến năm 2016 kiểm định mơ hình khác Tác giả sử dụng ba phương pháp chọn lọc biến là: phương pháp truyền thống (Traditional Soft Set - TSS) phương pháp tiên tiến (Novel Soft Set NSS) xây dựng dựa tảng lý thuyết tập mềm (Soft - Set) kết hợp với cách chọn biến Nguyễn Trọng Hòa Dữ liệu sử dụng phân tách thành tập hợp liệu thử nghiệm (Training data) tập hợp liệu kiểm tra (Testing data) nhằm giúp cho việc dự báo xác Với biến lọc từ hai phương pháp trên, nghiên cứu kiểm định tính xác việc dự báo phá sản mơ hình bao gồm: mơ hình hồi quy Logistic (LR), mơ hình kỹ thuật vectơ hỗ trợ (Support Vector Machine - SVM) mô hình mạng thần kinh nhân tạo (Neural Network - NN) Kết nghiên cứu cho thấy mơ hình sử dụng lọc theo phương pháp tiên tiến (Novel Soft Set – NSS) cho khả dự báo tốt với độ xác cao so với mơ hình sử dụng lọc theo phương pháp truyền thống (Traditional Soft Set – TSS) theo cách chọn biến Nguyễn Trọng Hòa (Phương pháp phân biệt – multiple discriminant analysis), đồng thời cao so với biến xây dựng nghiên cứu Wei Xu cộng (Financial ratio selection for business failure prediction using soft set theory, chương 63, tạp chí Knowledge-Based Systems, xuất Elsevier BV năm 2014 hội đồng hiệu trưởng trường kinh doanh Úc (ABDC) xếp hạng A) Nhằm kiểm định tính vững, nghiên cứu so sánh tỷ số chọn lý thuyết tập hợp mềm với tỷ số chọn lọc cách kết hợp dạng liệu: liệu kế tốn, thị trường vĩ mơ Mario Hernandez Tinoco, Nick Wilson (2013) Bài nghiên cứu dùng cụm từ “phá sản” để tích hợp lý thuyết “kiệt quệ” “phá sản” vào mô hình nghiên cứu để phù hợp với tên gọi luận văn Kết nghiên cứu phù hợp với kỳ vọng tác giả tính hiệu lọc tỷ số tài dựa phương pháp tiên tiến liệu doanh nghiệp Việt Nam LỜI CAM ĐOAN Tôi tên là: Bùi Minh Hiếu Sinh ngày 30 tháng 11 năm 1990 Q qn: Tân Đồng, Đồng Xồi, Bình Phước Là học viên cao học khoá 14 Trường Đại Học Ngân hàng TP.HCM Tôi xin cam đoan đề tài “Ứng dụng lý thuyết tập hợp mềm để tối ưu hóa lựa chọn tỷ số tài việc dự báo phá sản doanh nghiệp” chưa trình nộp để lấy học vị thạc sĩ trường đại học Luận văn công trình nghiên cứu riêng tác giả, kết nghiên cứu trung thực, xác có nguồn gốc rõ ràng, khơng có nội dung công bố trước nội dung người khác thực ngoại trừ trích dẫn dẫn nguồn đầy đủ luận văn TP Hồ Chí Minh, ngày tháng Người viết Bùi Minh Hiếu năm 2016 LỜI CẢM ƠN Qua thời gian theo học trường Đại học Ngân hàng TP.HCM, nhận bảo giảng dạy nhiệt tình quý Thầy Cô Quý Thầy Cô truyền đạt cho lý thuyết thực tế suốt thời gian học tập làm luận văn Tôi xin gửi lời cám ơn chân thành đến tất thầy cô, Khoa Sau đại học Trường Đại học Ngân hàng TPHCM Phó Giáo Sư., Tiến Sĩ Trịnh Quốc Trung tận tình hướng dẫn tơi hồn thành luận văn TP Hồ Chí Minh, ngày tháng Người viết Bùi Minh Hiếu năm 2016 MỤC LỤC CHƯƠNG TỔNG QUAN VỀ DỰ BÁO PHÁ SẢN 1.1 Lý chọn đề tài 1.2 Mục tiêu đề tài 1.2.1 Mục tiêu tổng quát 1.2.2 Mục tiêu cụ thể 1.3 Câu hỏi nghiên cứu 1.4 Đối tượng phạm vi nghiên cứu 1.5 Cơ sở lý luận lý thuyết sử dụng nghiên cứu 1.5.1 Định nghĩa phá sản 1.5.2 Lý thuyết soft - set 1.5.2.1 Định nghĩa tập hợp mềm (Tập hợp mềm Theory) 1.5.2.2 Lý thuyết phương pháp lọc truyền thống (Traditional Soft Set – TSS) 1.5.2.3 Lý thuyết theo phương pháp tiên tiến (Novel Soft Set – NSS) CHƯƠNG THỰC TRẠNG VỀ DỰ BÁO PHÁ SẢN TRÊN THẾ GIỚI VÀ Ở VIỆT NAM 2.1 Những nghiên cứu Việt Nam 11 2.1.1 Những nghiên cứu sử dụng mơ hình dự báo dựa tỷ số tài kế tốn 11 2.1.2 Những nghiên cứu sử dụng mơ hình dự báo dựa vào tỷ số tài thị trường 14 2.1.3 Những nghiên cứu sử dụng mô hình dự báo dựa tỷ số tài kế toán kết hợp thị trường 15 2.2 Những nghiên cứu Việt Nam 22 CHƯƠNG GIẢI PHÁP DỰ BÁO PHÁ SẢN THƠNG QUA TỐI ƯU HĨA CHỌN BIẾN VÀ MƠ HÌNH – ÁP DỤNG SOFT SET 27 3.1 Phương pháp chọn biến 27 3.1.1 Biến phụ thuộc (Special Treatment – ST) 27 3.1.2 Biến độc lập 28 3.2 Phân tách liệu nghiên cứu 28 3.2.1 Phân loại công ty 28 3.2.2 Phân tách công ty chạy mơ hình 38 3.2.3 Xác định thời điểm dự báo 39 3.3 Lọc tỷ số tài dựa lý thuyết tập hợp mềm 41 3.3.1 Bảng phân loại tác động biến 41 3.3.2 Rút gọn tham số theo phương pháp NSS 43 3.4 Mơ hình sử dụng nghiên cứu 43 3.4.1 Mơ hình hồi quy Logistic 43 3.4.2 Mơ hình sử dụng phân lớp liệu 44 3.4.2.1 Mơ hình NN 45 3.4.2.2 Mơ hình SVM 46 CHƯƠNG KẾT QUẢ NGHIÊN CỨU 48 4.1 Hồi quy hệ số Beta 48 4.2 Chọn lọc tỷ số tài 51 4.2.1 Dựa cách chọn biến Nguyễn Trọng Hòa (Học viện tài chính) năm 2010 với mơ hình xếp hạng tín dụng z-score (NTH) 51 4.2.2 Dựa phương pháp TSS 52 4.2.3 Dựa phương pháp NSS 52 4.3 Kết tính xác mơ hình 52 4.3.1 Kết tính xác dựa vào mơ hình hồi quy Logistic 52 4.3.1.1 Phương pháp ACC 53 4.3.1.2 Phương pháp kiểm định hệ số thống kê: 66 4.3.2 Kết tính xác dựa vào mơ hình NN 69 4.3.3 Kết tính xác dựa vào mơ hình SVM 70 4.4 Kiểm tra tính vững 71 4.5 Kết tổng hợp 73 CHƯƠNG KẾT LUẬN VÀ KIẾN NGHỊ 76 DANH MỤC CÁC TỪ VIẾT TẮT Tên tiếng Anh Tên tiếng Việt Average Accuracy Độ xác mơ hình dự báo Cross-validiation Nhóm phân loại chéo Decision Tree Cây định Grid-search Tìm kiếm dạng lưới Ký hiệu ACC DT Sở giao dịch chứng khoán HOS Tp Hồ Chí Minh E Logistic regression Hồi quy Logistic LR Multiple Discriminant Analysis Phân tích đa biệt số MDA Neural Network Mạng thần kinh nhân tạo NN Non Special Treatment Khỏe mạnh tài NST Novel Soft Set Phương pháp tiên tiến NSS Soft-Set Lý thuyết tập mềm Special Treatment Phá sản ST Support Vector Machine Kỹ thuật vectơ hỗ trợ SVM Taiwan Economic Journal Tạp chí kinh tế Đài Loan TEJ Ho Chi Minh Stock Exchange Taiwan Stock Exchange Tập đoàn giao dịch cổ phiếu Đài TSEC Corporation Loan Testing data Tập hợp liệu kiểm tra Traditional Soft Set Phương pháp truyền thống Training data Tập hợp liệu thử nghiệm True Nagative Dự báo kiệt quệ xác TN True Possitive Dự báo khỏe mạnh xác TP TSS DANH MỤC BẢNG BIỂU Bảng 2.1 Các biến sử dụng nghiên cứu Phạm Hữu Hồng Thái 24 Số liệu fold 1st testing TSS Bước 1: Sử dụng công cụ Matlab, đường dẫn tới thư mục mang tên Matlab chương trình libsvm: Sử dụng đoạn code sau để chuyển đuôi CSV thành đuôi mang tên TRAIN TEST matlab> SPECTF = csvread('Name.csv'); matlab> labels = SPECTF(:, 1); matlab> features = SPECTF(:, 2:end); matlab>features_sparse = sparse(features); matlab>libsvmwrite('Name.train', labels, features_sparse); matlab> SPECTF = csvread('Name.csv'); matlab> labels = SPECTF(:, 1); matlab> features = SPECTF(:, 2:end); matlab>features_sparse = sparse(features); matlab>libsvmwrite('Name.test', labels, features_sparse); Với fold 1st TSS năm t-1, nhóm em lưu tên tsst-1.1.train tsst-1.1.test Bước 2: Copy địa thư mục Tools chương trình libsvm Sau mở cửa sổ cmd, nhập lệnh cd:/ paste đường dẫn vừa copy sau nhấn Enter Bước 3: Nhập lệnh easy.py tsst-1.1.train tsst-1.1.test Như fold 1st ta có độ xác 70% Ta làm tương tự cho fold lại, 10 fold năm t-2 Ta có kết phần kết mơ hình Chạy tương tự NSS ta có với fold 1st Ta có với fold 1st NSS có độ xác 90% Ta làm tương tự fold lại năm t-2 Bảng kết nằm phần kết mơ hình Mơ hình NN Cũng tương tự mơ hình SVM, mơ hình NN sử dụng định dạng CSV.Bài nghiên cứu sử dụng phần mềm Neuro Solution 7.0 để chạy mơ hình Neural Network Back Propagation Sử dụng số liệu chạy với SVM Nhóm thực ước tính ACC cho fold thời gian t- t-1 Các bước thực hiện: Trường hợp fold 1st t-1 cho TSS Thiết lập định dạng file: Các biến giả 0,1 ta thay tương ứng unhealthy healthy Bởi chương trình hiểu từ ký tự trở lên chuỗi, việc định dạng dễ dàng cho việc ước tính ACC sau Đây cấu trúc file training file testing Cột cuối cột xác định công ty khỏe mạnh hay kiệt quệ, cột lại giá trị biến lọc từ mơ hình TSS cơng ty, Đặt file training 1st tsst-1train1nn.csv testing tsst-1test1nn.csv Bước 1: Khởi động chương trình Neuro Solution 7.0 Nhấp vào mục NeuralExpert Wizard Bước 2: Chương trình vấn đề cần giải Do ta muốn xác định công ty phá sản hay khỏe mạnh dựa tỷ số đưa vào, nên ta chọn mục Classification nhấp Next Bước 3: Chương trình hỏi địa file Input đâu, ta nhấp vào Browse Tìm file input file training tsst-1train1nn.csv nhấp Next Bước 4: Chương trình hỏi cột bạn muốn đưa vào mơ hình Trong trường hợp ta chọn cột có chứa tỷ số tài chính.Đó cột cột 11.Nên ta nhấp dấu tích vào, cịn cột 12 ta để trống Sau ta nhấp Next Bước 5: Chương trình hỏi cột mà ta tích vào bước 4, có cột chuỗi ký tự khơng Trong trường hợp ta khơng chọn mà nhấp Next Bước 6: Chương trình hỏi file đưa vào để chạy mơ hình Ta nhấp vào Use Input File for Desire File Shuffle Data Files sau ta nhấp Next Bước 7: Chương trình hỏi cột mà bạn muốn cho kết mơ hình, chương trình mặc định cột 12, cột ta muốn chương trình trả kết cơng ty dó kiệt quệ hay khỏe mạnh Ta nhấp Next Bước 8: Do cột 12 chứa chuỗi ký tự nên chương trình tự động tích vào cột 12 Ta nhấp Next Bước 9: Chương trình hỏi bạn có muốn chạy Cross-Validiation khơng Do mẫu ta nhỏ 100 nên ta nhấp vào None nhấp Next Bước 10: Ta nhấp Next Nhóm sử dụng testing training data, không sử dụng hold-out data Bước 11: Chỉ cần nhấp Next mẫu ta phải lớn chương trình tìm NN tốt Bước 12: Chọn Low Vì chương trình hỏi ta muốn lớp, trường hợp nhóm Nhóm chạy lớp nhấp Finish Bước 13: Sau ta có mơ hình NN mà chương trình tạo cho ta Ta nhấp vào Start Ta có kết Dịng ta thấy 93.88% kết độ xác việc dự báo cơng ty khỏe mạnh cơng ty khỏe mạnh.Chỉ có 6.12% dự báo công ty khỏe mạnh công ty kiệt quệ.Tương tự dịng 2, xác suất dự báo cơng ty kiệt quệ công ty khỏe mạnh 6.67%, cịn lại 93.33% dự báo xác cơng ty kiệt quệ công ty kiệt quệ Bước 14: Ta sử dụng file testing để test độ xác mơ hình Ta nhấp vào Tesing cơng cụ Bước 15: Chương trình hỏi địa file Input Desire File Ta chọn đường dẫn đến file tsst-1test1nn.csv Sau nhấp Next thấy finish ta nhấp vào Ta có kết Trong việc dự báo cơng ty khỏe mạnh 100%, cịn việc dự báo cơng ty kiết quệ 80%.Nên ta có độ xác fold 1st (100+80)/2=90%.Ta làm tương tự cho fold lại cho năm t-1 t-2.Việc ước lượng ACC cho NSS Neuro Solution tương tự TSS ... MINH HIẾU ỨNG DỤNG LÝ THUYẾT TẬP HỢP MỀM ĐỂ TỐI ƯU HÓA LỰA CHỌN CÁC TỶ SỐ TÀI CHÍNH TRONG VIỆC DỰ BÁO PHÁ SẢN CỦA DOANH NGHIỆP LUẬN VĂN THẠC SĨ KINH TẾ Chuyên ngành: Tài – Ngân hàng Mã số: 60 34... đề tài 1.2.1 Mục tiêu tổng quát Tối ưu hóa dự báo phá sản doanh nghiệp qua việc ứng dụng lý thuyết tập hợp mềm để chọn lọc tỷ số tài tốt cho việc chạy mơ hình dự báo 1.2.2 Mục tiêu cụ thể Dựa... Ngân hàng TP.HCM Tôi xin cam đoan đề tài ? ?Ứng dụng lý thuyết tập hợp mềm để tối ưu hóa lựa chọn tỷ số tài việc dự báo phá sản doanh nghiệp? ?? chưa trình nộp để lấy học vị thạc sĩ trường đại học