Bảng đo độ chính xác

Một phần của tài liệu Ứng dụng cây quyết định vào xếp hạng khách hàng cá nhân tại NHTMCP hàng hải việt nam chi nhánh hà nội khoá luận tốt nghiệp 786 (Trang 75)

Từ bảng trên ta thấy lớp ‘AAA’ có độ chính xác cao nhất với tỉ lệ các mẫu được phân lớp đúng đạt 97,9%, chỉ có 0,4% mẫu bị phân lớp sai. Tỷ lệ các mẫu thuộc lớp ‘AAA’ được phân loại đúng lần lượt chiếm 96,8%, 97,9% trên tổng số các mẫu được phân loại vào lớp ‘AAA’ và trên tổng số các mẫu có giá trị thực thuộc lớp này. Giá trị F-Measure và ROC Area càng tiến gần về 1 có nghĩa mơ hình càng tốt. Tương tự với các lớp cịn lại.

Với mơ hình cây quyết định kết quả được mơ phỏng phân loại một cách trực quan, dễ hiểu đối với người sử dụng, có thể rút ra các luật một cách nhanh chóng, dễ dàng dự đốn trước được khả năng của khách hàng từ đó đưa ra được những quyết định phù hợp hơn.

3.3.4.3. Hướng phát triển và khuyến nghị

Những năm gần đây, việc khai phá dữ liệu để tìm kiếm tri thức, dự đoán xu hướng và hỗ trợ ra quyết định đã trở thành một nhu cầu cần thiết trong phân tích dữ liệu. Khóa luận cần được phát triển thêm để có thể xây dựng các ứng dụng phân tích dữ liệu mang tính thơng minh hơn.

Ứng dụng cây quyết định xếp hạng khách hàng cá nhân tại Maritime Bank chi nhánh Hà Nội Khóa luận tốt nghiệp

Với ngân hàng, họ thường xuyên phải ra các quyết định liên quan đến quá trình cho vay của mình. Dù rằng ln mong muốn những quyết định của mình là chính xác xong thực tế khơng phải lúc nào cũng được như thế. Rủi ro là một điều hồn tồn có thể xảy ra đi kèm với các quyết định cho vay. Như vậy vấn đề không chỉ ở chỗ ra quyết định đúng mà cịn kiểm sốt được rủi ro liên quan. Sự thành công hay thất bại của một quyết định còn phụ thuộc rất lớn vào những thơng tin mà ngân hàng có được. Với cây quyết định, từ mẫu dữ liệu sẵn có, sau khi tham số hóa và chuyển đổi số liệu mẫu, chúng ta có thể đưa ra quyết định từ các yếu tố xếp hạng tín dụng, tổng thu nhập ...Với dự đốn đã thu được, khi phát sinh những khách hàng có thơng tin như các lớp khách hàng đã được dự đoán, nhà quản trị sẽ dễ dàng ra được quyết định kinh doanh hoặc giúp giảm thiểu thời gian, chi phí, dự đốn được xu hướng kết quả của thông tin.

Tuy nhiên với bộ dữ liệu thu thập được có kích thước tương đối nhỏ do đó kết quả phân loại khi sử dụng cây quyết định này đối với các trường hợp khác có thể chưa cao. Các luật đưa ra cũng chỉ cung cấp thêm thơng tin, gợi ý trong q trình xếp hạng tín dụng chứ khơng dựa vào hoàn toàn, tùy vào từng trường hợp, từng khách hàng cụ thể mà có thể áp dụng một cách linh hoạt. Nhưng với những tri thức đã rút trích được có thể khẳng định rằng phương pháp cây quyết định áp dụng trong xếp hạng tín dụng là một hướng tiếp cận tiềm năng.

Ứng dụng cây quyết định xếp hạng khách hàng cá nhân tại Maritime Bank chi nhánh Hà Nội Khóa luận tốt nghiệp

KẾT LUẬN

Khóa luận đã trình bày được các vấn đề cơ bản của khai phá dữ liệu và cây quyết định: những vấn đề tổng quan, khái niệm, chức năng, các thuật toán cũng như ưu và nhược điểm của kỹ thuật khai phá dữ liệu. Nắm được kỹ thuật khai phá dữ liệu bằng cây quyết định, các thuật toán xây dựng cây quyết định. Xây dựng được mơ hình cây quyết định bằng phần mềm Weka dựa trên bộ dữ liệu thực tế của ngân hàng.

Trong khuôn khổ luận văn mới chỉ dừng lại ở bộ dữ liệu nhỏ tham khảo từ hệ thống xếp hạng tín dụng của các ngân hàng thương mại khác nên kết quả thực nghiệm chưa mang ý nghĩa thực tế. Đối với các thuật toán trong cây quyết định chưa thực sự phù hợp với cơ sở dữ liệu lớn của ngân hàng. Do hạn chế về mặt thời gian, kỹ thuật đặc biệt là việc thu thập dữ liệu rất khó khăn nên số lượng các chỉ tiêu chưa đủ để đáp ứng vào bài toán thực tế. Tuy nhiên có thể khẳng định cây quyết định là là một phương pháp tiềm năng.

Qua quá trình thực nghiệm và nghiên cứu lý thuyết có thể đưa ra một số kết luận như sau:

- Mỗi một giải thuật phân loại, phân cụm ... áp dụng cho một số mục tiêu và

kiểu dữ liệu nhất định.

- Khai phá dữ liệu sẽ hiệu quả hơn khi bước tiền xử ly, lựa chọn thuộc tính, mơ

hình được giải quyết tốt.

- Sử dụng cây quyết định trong xếp hạng tín dụng có ưu điểm hơn phương pháp

truyền thống là có thể thực hiện tự động, thời gian thực hiện nhanh chóng, dễ dàng đưa ra được kết quả ... tuy nhiên hiệu quả thu được chưa cao.

Một số vấn đề luận văn cần được nghiên cứu, tìm hiểu thêm:

- Cần bổ sung thêm dữ liệu cho tập huấn luyện để mơ hình cây quyết định có độ

tin cậy cao hơn và hoạt động hiệu quả hơn. Tiếp tục phát triển hoàn thiện theo hướng trở thành phần mềm khai phá dữ liệu trong tín dụng tiêu dùng nhằm hỗ trợ cho cán bộ tín dụng đưa ra quyết định cho khách hàng vay và quản trị được rủi ro tín dụng.

- Tiến hành cài đặt và tiếp tục nghiên cứu nhiều kỹ thuật khai phá dữ liệu hơn

nữa để triển khai giải quyết các bài toán cụ thể trong thực tế.

Khóa luận tốt nghiệp Ứng dụng cây quyết định xếp hạng khách hàng cá nhân tại Maritime Bank chi nhánh Hà Nội

TÀI LIỆU THAM KHẢO

Tiếng Việt

1. Nguyễn Thị Hạnh (2008), Khai phá dữ liệu bằng cây quyết định, Sinh viên

nghiên cứu khoa học, Trường Đại học Sư phạm Hà Nội, Hà Nội.

2. Nguyễn Công Hoan (2015), Tổng quan về dữ liệu lớn (BigData), Kỷ yếu hội thảo khoa học, Hà Nội.

3. Nguyễn Phan Huy (2010), Báo cáo thực tập tổng hợp, Trường Đại học Kinh tế Quốc Dân, Hà Nội.

4. PGS.TS Tơ Ngọc Hưng (2014), Tín dụng ngân hàng, Nxb Thống Kê, Hà Nội.

5. Ngân hàng TMCP Hàng Hải Việt Nam (2010), Quy định chính sách tín

dụng của Maritimebank, Hà Nội.

6. Nguyễn Đình Tài (2013), Ứng dụng mơ hình cây quyết định vào quản trị rủi

ro tín dụng ngân hàng, Khóa luận tốt nghiệp, Học viện Ngân hàng, Hà Nội.

7. Lê Văn Triết (2010), Hoàn thiện hệ thống xếp hạng tín dụng cá nhân của

ngân hàng TMCP Á Châu, Luận văn thạc sĩ kinh tế, Trường Đại học kinh tế

TP.HCM, TP. Hồ Chí Minh.

8. Vũ Thị Xuân (2014), Ứng dụng khai phá dữ liệu hỗ trợ ra quyết định cho

vay trong hoạt động tín dụng của ngân hàng TMCP Sài Gịn (SHB), Khóa

luận tốt nghiệp, Học viện Ngân hàng, Hà Nội.

9. Bùi Thị Hải Yến (2015), Quản lý rủi ro tín dụng tại ngân hàng TMCP Hàng

Hải Việt Nam, Luận văn thạc sĩ tài chính ngân hàng, Trường Đại học Kinh

tế-Đại học Quốc Gia Hà Nội, Hà Nội.

Tiếng Anh

10. Jiawei Han and Micheline Kamber and Jian Pei (2010), Data Mining:

Concepts and Techniques, Morgan Kaufmann Publisher, 3rd Edition. 11. Max Bramer (2007), Principles of Data Mining, Springer, UK.

Website

12. Trang chủ ngân hàng TMCP Hàng Hải Việt Nam. https://www.msb.com.vn.

Đào Thị Hiền - Lớp K17HTTTB 63

Ứng dụng cây quyết định xếp hạng khách hàng cá nhân tại Maritime Bank chi nhánh Hà Nội Khóa luận tốt nghiệp

13. Trang Wikipedia

https://vi.wikipedia.org/wiki/Khai ph%C3%A1 d%E1%BB%AF li%E1% BB%87u

14. Nghiên cứu ứng dụng công cụ khai phá dữ liệu tại các ngân hàng

https://www.sbv. gov.vn/webcenter/portal/vi/menu/trangchu/hdk/cntt/udptcn

tt/

Một phần của tài liệu Ứng dụng cây quyết định vào xếp hạng khách hàng cá nhân tại NHTMCP hàng hải việt nam chi nhánh hà nội khoá luận tốt nghiệp 786 (Trang 75)

Tải bản đầy đủ (DOCX)

(78 trang)
w