Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 114 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
114
Dung lượng
3,61 MB
Nội dung
BỘ GIÁO DỤC VÀ ĐÀO TẠO NGÂN HÀNG NHÀ NƯỚC VIỆT NAM TRƯỜNG ĐẠI HỌC NGÂN HÀNG TP HỒ CHÍ MINH BÙI MINH HIẾU lu ỨNG DỤNG LÝ THUYẾT TẬP HỢP MỀM an n va ĐỂ TỐI ƯU HÓA LỰA CHỌN CÁC TỶ SỐ TÀI CHÍNH p ie gh tn to TRONG VIỆC DỰ BÁO PHÁ SẢN CỦA DOANH NGHIỆP d oa nl w an lu ll u nf va LUẬN VĂN THẠC SĨ KINH TẾ oi m z at nh z m co l gm @ an Lu n va TP HỒ CHÍ MINH – NĂM 2016 ac th si BỘ GIÁO DỤC VÀ ĐÀO TẠO NGÂN HÀNG NHÀ NƯỚC VIỆT NAM TRƯỜNG ĐẠI HỌC NGÂN HÀNG TP HỒ CHÍ MINH BÙI MINH HIẾU lu ỨNG DỤNG LÝ THUYẾT TẬP HỢP MỀM an n va ĐỂ TỐI ƯU HĨA LỰA CHỌN CÁC TỶ SỐ TÀI CHÍNH p ie gh tn to TRONG VIỆC DỰ BÁO PHÁ SẢN CỦA DOANH NGHIỆP d oa nl w LUẬN VĂN THẠC SĨ KINH TẾ lu Mã số: 60 34 02 01 ll u nf va an Chuyên ngành: Tài – Ngân hàng oi m z at nh Người hướng dẫn khoa học: PGS., TS TRỊNH QUỐC TRUNG z m co l gm @ an Lu n va TP HỒ CHÍ MINH – NĂM 2016 ac th si TĨM TẮT ĐỀ TÀI Nghiên cứu thực nhằm tìm tỷ số tài tối ưu đóng vai trò quan trọng dự báo phá sản dựa mẫu quan sát gồm 104 doanh nghiệp khoảng thời gian từ năm 2009 đến năm 2016 kiểm định mơ hình khác Tác giả sử dụng ba phương pháp chọn lọc biến là: phương pháp truyền thống (Traditional Soft Set - TSS) phương pháp tiên tiến (Novel Soft Set NSS) xây dựng dựa tảng lý thuyết tập mềm (Soft - Set) kết hợp với cách chọn biến Nguyễn Trọng Hòa Dữ liệu sử dụng phân tách lu an thành tập hợp liệu thử nghiệm (Training data) tập hợp liệu kiểm tra n va (Testing data) nhằm giúp cho việc dự báo xác Với biến lọc báo phá sản mơ hình bao gồm: mơ hình hồi quy Logistic (LR), mơ hình kỹ gh tn to từ hai phương pháp trên, nghiên cứu kiểm định tính xác việc dự p ie thuật vectơ hỗ trợ (Support Vector Machine - SVM) mơ hình mạng thần kinh nhân tạo (Neural Network - NN) Kết nghiên cứu cho thấy mơ hình sử dụng nl w lọc theo phương pháp tiên tiến (Novel Soft Set – NSS) cho khả dự báo d oa tốt với độ xác cao so với mơ hình sử dụng lọc theo phương pháp an lu truyền thống (Traditional Soft Set – TSS) theo cách chọn biến Nguyễn Trọng nf va Hòa (Phương pháp phân biệt – multiple discriminant analysis), đồng thời cao so với biến xây dựng nghiên cứu Wei Xu cộng lm ul (Financial ratio selection for business failure prediction using soft set theory, z at nh oi chương 63, tạp chí Knowledge-Based Systems, xuất Elsevier BV năm 2014 hội đồng hiệu trưởng trường kinh doanh Úc (ABDC) xếp hạng A) Nhằm kiểm định tính vững, nghiên cứu so sánh tỷ số chọn lý thuyết z gm @ tập hợp mềm với tỷ số chọn lọc cách kết hợp dạng liệu: liệu kế toán, thị trường vĩ mô Mario Hernandez Tinoco, Nick Wilson (2013) Bài l co nghiên cứu dùng cụm từ “phá sản” để tích hợp lý thuyết “kiệt quệ” m “phá sản” vào mơ hình nghiên cứu để phù hợp với tên gọi luận văn Kết an Lu nghiên cứu phù hợp với kỳ vọng tác giả tính hiệu lọc tỷ n va ac th si số tài dựa phương pháp tiên tiến liệu doanh nghiệp Việt Nam lu an n va p ie gh tn to d oa nl w nf va an lu z at nh oi lm ul z m co l gm @ an Lu n va ac th si LỜI CAM ĐOAN Tôi tên là: Bùi Minh Hiếu Sinh ngày 30 tháng 11 năm 1990 Q qn: Tân Đồng, Đồng Xồi, Bình Phước Là học viên cao học khoá 14 Trường Đại Học Ngân hàng TP.HCM Tôi xin cam đoan đề tài “Ứng dụng lý thuyết tập hợp mềm để tối ưu hóa lựa chọn tỷ số tài việc dự báo phá sản doanh nghiệp” chưa lu trình nộp để lấy học vị thạc sĩ trường đại học Luận an va văn cơng trình nghiên cứu riêng tác giả, kết nghiên cứu trung thực, n xác có nguồn gốc rõ ràng, khơng có nội dung cơng gh tn to bố trước nội dung người khác thực ngoại trừ trích dẫn p ie dẫn nguồn đầy đủ luận văn tháng năm 2016 nl w TP Hồ Chí Minh, ngày d oa Người viết nf va an lu z at nh oi lm ul Bùi Minh Hiếu z m co l gm @ an Lu n va ac th si LỜI CẢM ƠN Qua thời gian theo học trường Đại học Ngân hàng TP.HCM, nhận bảo giảng dạy nhiệt tình quý Thầy Cô Quý Thầy Cô truyền đạt cho lý thuyết thực tế suốt thời gian học tập làm luận văn Tôi xin gửi lời cám ơn chân thành đến tất thầy cô, Khoa Sau đại học Trường Đại học Ngân hàng TPHCM Phó Giáo Sư., Tiến Sĩ Trịnh Quốc Trung lu an tận tình hướng dẫn tơi hồn thành luận văn n va tn to ie gh TP Hồ Chí Minh, ngày tháng năm 2016 p Người viết d oa nl w nf va an lu lm ul Bùi Minh Hiếu z at nh oi z m co l gm @ an Lu n va ac th si MỤC LỤC CHƯƠNG TỔNG QUAN VỀ DỰ BÁO PHÁ SẢN Lý chọn đề tài 1.1 1.2 Mục tiêu đề tài 1.2.1 Mục tiêu tổng quát 1.2.2 Mục tiêu cụ thể 1.3 Câu hỏi nghiên cứu 1.4 Đối tượng phạm vi nghiên cứu lu an n va gh tn to 1.5 Cơ sở lý luận lý thuyết sử dụng nghiên cứu 1.5.1 Định nghĩa phá sản 1.5.2 Lý thuyết soft - set 1.5.2.1 Định nghĩa tập hợp mềm (Tập hợp mềm Theory) 1.5.2.2 Lý thuyết phương pháp lọc truyền thống (Traditional Soft Set – TSS) 1.5.2.3 Lý thuyết theo phương pháp tiên tiến (Novel Soft Set – NSS) p ie CHƯƠNG THỰC TRẠNG VỀ DỰ BÁO PHÁ SẢN TRÊN THẾ GIỚI VÀ Ở VIỆT NAM d oa nl w 2.1 Những nghiên cứu Việt Nam 11 2.1.1 Những nghiên cứu sử dụng mơ hình dự báo dựa tỷ số tài kế tốn 11 2.1.2 Những nghiên cứu sử dụng mơ hình dự báo dựa vào tỷ số tài thị trường 14 2.1.3 Những nghiên cứu sử dụng mơ hình dự báo dựa tỷ số tài kế tốn kết hợp thị trường 15 nf va an lu Những nghiên cứu Việt Nam 22 lm ul 2.2 z at nh oi CHƯƠNG GIẢI PHÁP DỰ BÁO PHÁ SẢN THÔNG QUA TỐI ƯU HĨA CHỌN BIẾN VÀ MƠ HÌNH – ÁP DỤNG SOFT SET 27 z 3.1 Phương pháp chọn biến 27 3.1.1 Biến phụ thuộc (Special Treatment – ST) 27 3.1.2 Biến độc lập 28 @ co l gm 3.2 Phân tách liệu nghiên cứu 28 3.2.1 Phân loại công ty 28 3.2.2 Phân tách công ty chạy mơ hình 38 3.2.3 Xác định thời điểm dự báo 39 m 3.3 Lọc tỷ số tài dựa lý thuyết tập hợp mềm 41 3.3.1 Bảng phân loại tác động biến 41 3.3.2 Rút gọn tham số theo phương pháp NSS 43 an Lu n va ac th si 3.4 Mơ hình sử dụng nghiên cứu 43 3.4.1 Mơ hình hồi quy Logistic 43 3.4.2 Mô hình sử dụng phân lớp liệu 44 3.4.2.1 Mơ hình NN 45 3.4.2.2 Mơ hình SVM 46 CHƯƠNG KẾT QUẢ NGHIÊN CỨU 48 Hồi quy hệ số Beta 48 4.1 4.2 Chọn lọc tỷ số tài 51 4.2.1 Dựa cách chọn biến Nguyễn Trọng Hịa (Học viện tài chính) năm 2010 với mơ hình xếp hạng tín dụng z-score (NTH) 51 4.2.2 Dựa phương pháp TSS 52 4.2.3 Dựa phương pháp NSS 52 lu an n va 4.4 Kiểm tra tính vững 71 ie Kết tổng hợp 73 gh tn to 4.3 Kết tính xác mơ hình 52 4.3.1 Kết tính xác dựa vào mơ hình hồi quy Logistic 52 4.3.1.1 Phương pháp ACC 53 4.3.1.2 Phương pháp kiểm định hệ số thống kê: 66 4.3.2 Kết tính xác dựa vào mơ hình NN 69 4.3.3 Kết tính xác dựa vào mơ hình SVM 70 p 4.5 d oa nl w CHƯƠNG KẾT LUẬN VÀ KIẾN NGHỊ 76 nf va an lu z at nh oi lm ul z m co l gm @ an Lu n va ac th si DANH MỤC CÁC TỪ VIẾT TẮT Ký Tên tiếng Anh Tên tiếng Việt Average Accuracy Độ xác mơ hình dự báo Cross-validiation Nhóm phân loại chéo Decision Tree Cây định Grid-search Tìm kiếm dạng lưới hiệu ACC DT Sở giao dịch chứng khốn HOS Tp Hồ Chí Minh E Logistic regression Hồi quy Logistic LR Multiple Discriminant Analysis Phân tích đa biệt số MDA Neural Network Mạng thần kinh nhân tạo NN Khỏe mạnh tài NST Novel Soft Set Phương pháp tiên tiến NSS Soft-Set Lý thuyết tập mềm lu Ho Chi Minh Stock Exchange an n va gh tn to p ie Non Special Treatment nl w d oa Special Treatment an lu Support Vector Machine Taiwan Economic Journal Stock Traditional Soft Set Training data SVM Tạp chí kinh tế Đài Loan TEJ TSEC Loan Tập hợp liệu kiểm tra z at nh oi Testing data Kỹ thuật vectơ hỗ trợ Exchange Tập đoàn giao dịch cổ phiếu Đài lm ul Corporation ST nf va Taiwan Phá sản Phương pháp truyền thống TSS Tập hợp liệu thử nghiệm z Dự báo kiệt quệ xác True Possitive Dự báo khỏe mạnh xác TN gm @ True Nagative TP m co l an Lu n va ac th si DANH MỤC BẢNG BIỂU Bảng 2.1 Các biến sử dụng nghiên cứu Phạm Hữu Hồng Thái 24 lu an n va p ie gh tn to d oa nl w nf va an lu z at nh oi lm ul z m co l gm @ an Lu n va ac th si lu an va n Số liệu fold 1st testing TSS tn to Bước 1: Sử dụng công cụ Matlab, đường dẫn tới thư mục mang tên Matlab ie gh chương trình libsvm: Sử dụng đoạn code sau để chuyển CSV thành đuôi p mang tên TRAIN TEST nl w matlab> SPECTF = csvread('Name.csv'); oa matlab> labels = SPECTF(:, 1); d matlab> features = SPECTF(:, 2:end); lu nf va an matlab>features_sparse = sparse(features); matlab>libsvmwrite('Name.train', labels, features_sparse); lm ul matlab> SPECTF = csvread('Name.csv'); z at nh oi matlab> labels = SPECTF(:, 1); matlab> features = SPECTF(:, 2:end); matlab>features_sparse = sparse(features); z @ matlab>libsvmwrite('Name.test', labels, features_sparse); gm Với fold 1st TSS năm t-1, nhóm em lưu tên tsst-1.1.train tsst-1.1.test co l Bước 2: Copy địa thư mục Tools chương trình libsvm Sau mở cửa an Lu Bước 3: Nhập lệnh easy.py tsst-1.1.train tsst-1.1.test m sổ cmd, nhập lệnh cd:/ paste đường dẫn vừa copy sau nhấn Enter n va ac th si lu an n va p ie gh tn to d oa nl w nf va an lu lm ul z at nh oi Như fold 1st ta có độ xác 70% Ta làm tương tự cho fold lại, 10 fold năm t-2 Ta có kết phần kết mơ hình Chạy tương tự đối z với NSS ta có với fold 1st m co l gm @ an Lu n va ac th si lu an n va p ie gh tn to d oa nl w nf va an lu z at nh oi lm ul Ta có với fold 1st NSS có độ xác 90% Ta làm tương tự fold cịn lại z Mơ hình NN l gm @ năm t-2 Bảng kết nằm phần kết mơ hình co Cũng tương tự mơ hình SVM, mơ hình NN sử dụng định dạng CSV.Bài m nghiên cứu sử dụng phần mềm Neuro Solution 7.0 để chạy mơ hình Neural an Lu Network Back Propagation n va ac th si Sử dụng số liệu chạy với SVM Nhóm thực ước tính ACC cho fold thời gian t- t-1 Các bước thực hiện: Trường hợp fold 1st t-1 cho TSS Thiết lập định dạng file: Các biến giả 0,1 ta thay tương ứng unhealthy healthy Bởi chương trình hiểu từ ký tự trở lên chuỗi, việc định dạng dễ dàng cho việc ước tính ACC sau lu an n va p ie gh tn to w Đây cấu trúc file training file testing Cột cuối cột xác định công ty oa nl khỏe mạnh hay kiệt quệ, cột lại giá trị biến lọc từ mô hình d TSS cơng ty, lu an Đặt file training 1st tsst-1train1nn.csv testing tsst-1test1nn.csv z at nh oi lm ul Wizard nf va Bước 1: Khởi động chương trình Neuro Solution 7.0 Nhấp vào mục NeuralExpert z m co l gm @ an Lu n va ac th si lu an n va tn to Bước 2: Chương trình vấn đề cần giải Do ta muốn xác gh định công ty phá sản hay khỏe mạnh dựa tỷ số đưa vào, nên ta chọn mục p ie Classification nhấp Next d oa nl w nf va an lu z at nh oi lm ul z gm @ m input file training tsst-1train1nn.csv nhấp Next co l Bước 3: Chương trình hỏi địa file Input đâu, ta nhấp vào Browse Tìm file an Lu n va ac th si lu an va n Bước 4: Chương trình hỏi cột bạn muốn đưa vào mơ hình Trong trường hợp tn to ta chọn cột có chứa tỷ số tài chính.Đó cột cột 11.Nên ta p ie gh nhấp dấu tích vào, cịn cột 12 ta để trống Sau ta nhấp Next d oa nl w nf va an lu z at nh oi lm ul z l gm @ Bước 5: Chương trình hỏi cột mà ta tích vào bước 4, có cột chuỗi co m ký tự khơng Trong trường hợp ta khơng chọn mà nhấp Next an Lu n va ac th si lu an n va p ie gh tn to d oa nl w nf va an lu z at nh oi lm ul z m co l gm @ an Lu n va ac th si Bước 6: Chương trình hỏi file đưa vào để chạy mơ hình Ta nhấp vào Use Input File for Desire File Shuffle Data Files sau ta nhấp Next lu an n va ie gh tn to p Bước 7: Chương trình hỏi cột mà bạn muốn cho kết mơ hình, nl w chương trình mặc định cột 12, cột ta muốn chương trình trả kết d oa cơng ty dó kiệt quệ hay khỏe mạnh Ta nhấp Next nf va an lu z at nh oi lm ul z m co l gm @ an Lu n va ac th si Bước 8: Do cột 12 chứa chuỗi ký tự nên chương trình tự động tích vào cột 12 Ta nhấp Next lu an n va p ie gh tn to oa nl w d Bước 9: Chương trình hỏi bạn có muốn chạy Cross-Validiation không Do mẫu ta lu nf va an nhỏ 100 nên ta nhấp vào None nhấp Next z at nh oi lm ul z m co l gm @ an Lu n va ac th si lu an n va p ie gh tn to d oa nl w nf va an lu z at nh oi lm ul z m co l gm @ an Lu n va ac th si Bước 10: Ta nhấp Next Nhóm sử dụng testing training data, không sử dụng hold-out data lu an n va ie gh tn to p Bước 11: Chỉ cần nhấp Next mẫu ta phải lớn chương trình tìm NN d oa nl w tốt nf va an lu z at nh oi lm ul z m co l gm @ an Lu n va ac th si Bước 12: Chọn Low Vì chương trình hỏi ta muốn lớp, trường hợp nhóm Nhóm chạy lớp nhấp Finish lu an n va ie gh tn to p Bước 13: Sau ta có mơ hình NN mà chương trình tạo cho ta Ta nhấp vào Start d oa nl w nf va an lu z at nh oi lm ul z m co l gm @ Ta có kết an Lu n va ac th si Dòng ta thấy 93.88% kết độ xác việc dự báo cơng ty khỏe mạnh cơng ty khỏe mạnh.Chỉ có 6.12% dự báo công ty khỏe mạnh công ty kiệt quệ.Tương tự dịng 2, xác suất dự báo cơng ty kiệt quệ công ty khỏe mạnh 6.67%, cịn lại 93.33% dự báo xác cơng ty kiệt quệ lu công ty kiệt quệ an Bước 14: Ta sử dụng file testing để test độ xác mơ hình Ta nhấp vào va n Tesing công cụ p ie gh tn to d oa nl w nf va an lu lm ul Bước 15: Chương trình hỏi địa file Input Desire File Ta chọn đường dẫn z at nh oi đến file tsst-1test1nn.csv Sau nhấp Next thấy finish ta nhấp vào z m co l gm @ an Lu n va ac th si lu an n va p ie gh tn to d oa nl w nf va an lu z at nh oi lm ul z m co l gm @ an Lu n va ac th si Ta có kết lu an n va p ie gh tn to Trong việc dự báo cơng ty khỏe mạnh 100%, cịn việc dự báo công ty oa nl w kiết quệ 80%.Nên ta có độ xác fold 1st (100+80)/2=90%.Ta làm tương tự cho fold lại cho năm t-1 t-2.Việc ước lượng ACC cho NSS d nf va an lu Neuro Solution tương tự TSS z at nh oi lm ul z m co l gm @ an Lu n va ac th si