3.1.2 .3Nguyên nhân của các tồn tại trên
3.5 Đánh giá kết quả việc ứng dụngcây quyết định vào quản trị rủi ro tín dụng
được thử nghiệm với phần mềm WEKA
Bài toán xây dựng cây quyết định dự báo rủi ro tín dụng được thử nghiệm với phần mềm Weka và bộ số liệu của ngân hàng AGRIBANK đã thu được một số kết quả tốt:
• Mơ hình cây quyết định được xây dựng mô phỏng kết quả phân loại nhóm nợ một cách trực quan, dễ hiểu.
• Rút ra được các quy luật liên quan đến việc cho vay. Chẳng hạn như: Luật 7: Nếu số lần gia hạn <= 0, thời hạn trả nợ = đúng hạn, tài sản đảm bảo = có, tính chất cơng việc = quản lý, tỷ lệ phả trả/thu nhập <=
Qua đó, sử dụng cây quyết định trên sẽ giúp các chuyên gia Ngân hàng dự đoán trước khả năng trả nợ của KH hay mức độ rủi ro của một khoản vay bất kỳ, từ đó đưa ra những quyết định phù hợp nhằm tăng cường chất lượng tín dụng.
Tuy nhiên, hiệu quả phân lớp của cây quyết định phụ thuộc rất nhiều vào tập dữ liệu thử nghiệm (training data). Tập dữ liệu thử nghiệm trong mơ hình trên có kích tương đối nhỏ, do đó, kết quả phân loại khi sử dụng cây quyết định này đối với các trường hợp khác có thể chưa cao.
Như vậy, kết quả thực nghiệm với cơng cụ WEKA có thể khẳng định rằng phương pháp cây quyết định áp dụng trong quản trị rủi ro tín dụng trong ngân hàng là một hướng tiếp cận tiềm năng.
KẾT LUẬN CHUNG •
Luận văn đã trình bày được các vấn đề cơ bản về khai phá dữ liệu và cây quyết định: những vấn đề tổng quan về khai phá dữ liệu, khái niệm, chức năng, các thuật toán cũng như ưu và nhược điểm của kỹ thuật khai phá dữ liệu; Nắm được kỹ thuật khai phá dữ liệu bằng cây quyết định, các thuật toán xây dựng cây quyết định. Phần thử nghiệm đã xây dựng được một mơ hình cây quyết định bằng phần mềm Weka dựa trên bộ số liệu thực tế của Ngân hàng Nông nghiệp và Phát triển Nông thôn - chi nhánh Xuân Mai và sử dụng cây quyết định này để dự đốn nhóm nợ. Thơng qua việc xây dựng cây quyết định có thể khẳng định cây quyết định là một phương pháp tiềm năng giúp ngân hàng giảm thiểu đáng kể mức độ rủi ro của mình khi xét duyệt hồ sơ vay vốn của khách hàng.
Qua việc sử dụng phần mềm thử nghiệm khai phá dữ liệu Weka, tôi nhận thấy đây là một công cụ hữu hiệu trong việc học tập và nghiên cứu về KPDL. Với môi trường làm việc trực quan, sinh động, công cụ này có thể được sử dụng dễ dàng trong nhiều lĩnh vực của KPDL. Bằng việc sử dụng phần mềm Weka, luận văn đã xây dựng thành cơng cây quyết dùng trong dự báo rủi ro tín dụng.
Đối với các thuật toán trong cây quyết định chưa thực sự phù hợp với cơ sở dữ liệu lớn như của ngân hàng. Do hạn chế về mặt thời gian, kĩ thuật và đặc biệt là việc thu thập số liệu rất khó khăn. Bởi vì thông tin của khách hàng đối với ngân hàng phải được bảo mật... Do đó, số lượng các chỉ tiêu chưa đủ để đáp ứng vào bài toán thực tiễn. Rõ ràng mơ hình của chúng tôi cần được phát triển để đáp ứng được u cầu của thực tế. Đó là mục đích của hướng nghiên cứu trong tương lai.
Hướng phát triển của đề tài sẽ nghiên cứu thêm một số thuật toán mới về khai phá dữ liệu bằng cây quyết định, tìm hiểu kỹ hơn về các kỹ thuật khai phá dữ liệu khác và xây dựng được những chương trình ứng dụng phức tạp và có tính thực tế hơn bằng cây quyết định. Khi mà lượng dữ liệu thu thập và lưu trữ ngày càng tăng, cùng với nhu cầu nắm bắt thơng tin, thì nhiệm vụ đặt ra cho Khai phá dữ liệu ngày càng quan trọng. Sự áp dụng được vào nhiều lĩnh vực kinh tế xã hội, an ninh quốc phòng cũng là một ưu thế của khai phá dữ liệu. Với những mong muốn đó tơi hy vọng sẽ dần đưa những kiến thức đã có từ đề tài này sớm trở thành thực tế, phục vụ cho cuộc sống con người chúng ta.
DANH MỤC TÀI LIỆU THAM KHẢO
Tiếng việt:
1. Cẩm nang tín dụng của ngân hàng nông nghiệp và phát triển nông thôn
2. Giáo trình Tín dụng ngân hàng, NXB Thống kê, 2001.
3. Nguyễn Thị Thùy Linh (2005), Khóa luận tốt nghiệp đại học “Nghiên
cứu các thuật toán phân lớp dữ liệu trên cây quyết đinh”, Đại học
công nghệ - ĐH quốc gia Hà Nội, Hà Nội.
4. Nguyễn Trần Minh Khuê (2009), Các phương pháp và kĩ thuật khai
phá dữ liệu, Hà Nội.
5. Nguyễn Thị Hạnh (2011), Nghiên cứu khoa học “Khai phá dữ liệu
bằng cây quyết định”, Khoa công nghệ thông tin- đại học sư phạm Hà
Nội, Hà Nội.
6. PGS.TS Đỗ Phúc (2007), Bài giảng khai thác dữ liệu, Đại học Quốc gia TP.Hồ Chí Minh, TP Hồ Chí Minh.
7. Quyết định số 493/2005/QĐ-NHNN ngày 24/04/2005 của thống đốc NHNN Việt Nam về phân loại nợ, trích lập và sử dụng dự phòng để xử lý rủi ro tín dụng trong hoạt động của các tổ chức tín dụng.
Tiếng anh:
8. Jaiwei Han and Micheline Kamber (2001), Data Mining: Concepts
and Techniques, Morgan Kaufmann Publishers.
9. Thomas (2009), Data mining: Definittions and decision tree
examples, State university of New York.
Danh mục các website tham khảo:
10. BIS - http://bis.net.vn/forums/p/378/661.aspx/