1. Trang chủ
  2. » Luận Văn - Báo Cáo

ứng dụng ai xây dựng mô hình dự đoán khả năng trả nợ của khách hàng cá nhân tại ngân hàng tmcp đầu tư và phát triển việt nam bidv

31 1 0
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Ứng dụng AI xây dựng mô hình dự đoán khả năng trả nợ của khách hàng cá nhân tại Ngân hàng TMCP Đầu tư và Phát triển Việt Nam - BIDV
Tác giả Nhóm 2
Người hướng dẫn Bùi Thị Hồng Nhung
Trường học Học viện Ngân hàng
Chuyên ngành Hệ thống thông tin quản lý
Thể loại Bài thi kết thúc học phần
Năm xuất bản 2022
Thành phố Hà Nội
Định dạng
Số trang 31
Dung lượng 3,53 MB

Nội dung

Nhóm sản phẩm tíndụng bao gồm sản phẩm cho vay có tài sản đảm bảo thế chấp và sản phẩm cho vaykhông tài sản đảm bảo tín chấp, trong đó sản phẩm cho vay tín chấp dành cho kháchhàng cá nhâ

Trang 2

Giảng viên hướng dẫn : Bùi Thị Hồng Nhung Nhóm thực hiện : Nhóm 2

Lớp học phần : K23TCD

Hà Nội, ngày 13 tháng 01 năm 2022

Trang 3

Thành viên nhóm

Trang 4

Mục lục

Trang 5

LỜI MỞ ĐẦU

Trong các hoạt động kinh doanh của ngân hàng, hoạt động tín dụng chiếm tỷ trọng lớnnhất và đóng góp phần lớn vào tổng lợi nhuận của ngân hàng Đồng thời, hoạt động tíndụng cũng là hoạt động tiềm ẩn rất nhiều rủi ro cho ngân hàng khi khách hàng không

đủ khả năng hoặc không thực hiện đầy đủ nghĩa vụ trả nợ đối với ngân hàng Rủi ro tíndụng đầu tiên ảnh hưởng trực tiếp đến ngân hàng cho vay, sau đó sẽ đến các ngân hànghoặc các bên có liên quan, và lan rộng hơn còn có thể ảnh hưởng xấu đến toàn bộ nềnkinh tế, đặc biệt đối với nền kinh tế đang phát triển tại Việt Nam Nhóm sản phẩm tíndụng bao gồm sản phẩm cho vay có tài sản đảm bảo (thế chấp) và sản phẩm cho vaykhông tài sản đảm bảo (tín chấp), trong đó sản phẩm cho vay tín chấp dành cho kháchhàng cá nhân hiện đang là sản phẩm rất phổ biến trên thị trường và đang được cácngân hàng TMCP chú trọng phát triển nhằm phục vụ mọi đối tượng khách hàng, từnhững người có nguồn thu qua thẻ, tiền mặt đến các hộ kinh doanh với mục đích vay

đa dạng như: mua sắm nội thất, mua xe, cưới hỏi, du học, mở rộng sản xuất kinhdoanh…Do tính chất của sản phẩm khách hàng vay không cần thế chấp tài sản và sốtiền vay tối đa có thể lên đến 500 triệu đồng, nên sản phẩm này tiềm ẩn rất nhiều rủi rođối với ngân hàng khi khách hàng không đủ khả năng hoặc không thực hiện đầy đủnghĩa vụ trả nợ

Hiểu được những khó khăn đó, chúng em lựa chọn đề tài nghiên cứu: “ Ứng dụng AIxây dựng mô hình dự đoán khả năng trả nợ của khách hàng cá nhân tại ngân hàngTMCP Đầu tư và Phát triển Việt Nam - BIDV” cho bài thi kết học phần của môn “Trítuệ nhân tạo trong kinh doanh” để góp phần giải quyết vấn đề thuê trọ hiện nay.Trong quá trình thực hiện bài dự báo, mặc dù đã triển khai tìm hiểu và thực hiện kỹlưỡng nhưng cũng khó tránh việc sai sót Vì vậy chúng em mong nhận được sự đánhgiá, nhận xét từ Cô để bài của chúng em được hoàn thiện tốt nhất

Trang 6

NỘI DUNG

I XÁC ĐỊNH VẤN ĐỀ

1.1 Ngân hàng TMCP Đầu tư và Phát triển Việt Nam - BIDV

1.1.1 Giới thiệu chung

- Ngân hàng TMCP Đầu tư và Phát triển Việt Nam, tên giao dịch quốc tế: Joint StockCommercial Bank for Investment and Development of Vietnam (BIDV); được thànhlập ngày 26/4/1957, BIDV là ngân hàng thương mại lâu đời nhất Việt Nam

- Các lĩnh vực hoạt động kinh doanh:

Ngân hàng: là một ngân hàng có kinh nghiệm hàng đầu cung cấp đầy đủ các sản phẩm,dịch vụ ngân hàng hiện đại và tiện ích

Bảo hiểm: cung cấp các sản phẩm Bảo hiểm nhân thọ, phi nhân thọ được thiết kế phùhợp trong tổng thể các sản phẩm trọn gói của BIDV tới khách hàng

Chứng khoán: cung cấp đa dạng các dịch vụ môi giới, đầu tư và tư vấn đầu tư cùngkhả năng phát triển nhanh chóng hệ thống các đại lý nhận lệnh trên toàn quốc.Đầu tư tài chính: góp vốn thành lập doanh nghiệp để đầu tư các dự án, trong đó nổi bật

là vai trò chủ trì điều phối các dự án trọng điểm của đất nước như: Công ty Cổ phầncho thuê Hàng không (VALC) Công ty phát triển đường cao tốc (BEDC), Đầu tư sânbay Quốc tế Long Thành…

- BIDV được biết đến với thương hiệu là ngân hàng nhận được sự lựa chọn, tín nhiệmcủa các tổ chức kinh tế, các doanh nghiệp và cá nhân trong việc tiếp cận các dịch vụtài chính ngân hàng; được cộng đồng trong nước và quốc tế biết đến và ghi nhận như

là một trong những thương hiệu ngân hàng lớn nhất Việt Nam; là niềm tự hào của cácthế hệ CBNV và của ngành tài chính ngân hàng trong 58 năm qua với nghề nghiệptruyền thống phục vụ đầu tư phát triển đất nước BIDV là ngân hàng trong Top 30ngân hàng có quy mô tài sản lớn nhất tại khu vực Đông Nam Á, trong 1.000 ngân hàngtốt nhất thế giới do Tạp chí The Banker bình chọn

1.1.2 Khó khăn doanh nghiệp gặp phải

2

Trang 7

Hoạt động cho vay cá nhân là một bộ phận quan trọng trong hoạt động tín dụng nóichung của ngân hàng Đây là lĩnh vực đem lại tiềm năng phát triển lớn cũng nhưnguồn lợi nhuận bền vững cho các ngân hàng thương mại (NHTM) Tuy nhiên, là mộtngân hàng kinh doanh bán lẻ tốt nhất Việt Nam, hoạt động cho vay với đối tượngkhách hàng cá nhân (KHCN) phát triển rất mạnh và cũng đem lại những rủi ro cao.Việc nhận diện rủi ro tại BIDV, được thực hiện tập trung từ một đầu mối tại PhòngQuản lý rủi ro, do phòng tự thống kê, đánh giá nhưng công tác nhận diện và phân loạirủi ro chưa kịp thời Do chưa có bộ phận nghiên cứu nhận diện rủi ro chuyên nghiệpnên các thông tin đưa ra trước khi quyết định tín dụng đối với các khách hàng đôi khithiếu chính xác, chỉ nhận diện ra rủi ro khi khách hàng đã phát sinh nợ quá hạn hoặchoạt động kinh doanh chuyển hướng xấu Về việc đo lường rủi ro tín dụng chủ yếu dựavào kết quả chấm điểm xếp hạng tín dụng được thực hiện theo trình chấm điểm xếphạng tín dụng khách hàng cá nhân Tuy nhiên, quy trình chấm điểm này mới chỉ hạnchế một vài nhóm ngành nghề chính, chấm điểm bằng phương pháp tính toán thủ côngnên kết quả chấm phụ thuộc vào chủ quan cán bộ chấm điểm, chưa có thống kê xếphạng tín dụng của các khách hàng trên hệ thống thông tin chung của BIDV.

Do vậy, ngân hàng BIDV nhận định rằng việc dự báo khả năng trả nợ đúng hạn và tìmhiểu các nhân tố tác động đến khả năng trả nợ của KHCN bằng ứng dụng AI là vôcùng quan trọng và cần thiết, để giúp các ngân hàng tăng cường khả năng nhận diện,khả năng trả nợ đúng hạn của khách hàng, góp phần giảm thiểu nợ xấu và tăng cườngcông tác quản trị rủi ro tín dụng

1.2 Phát biểu bài toán

Sử dụng mô hình cây quyết định để dự đoán khả năng trả nợ của khách hàng cá nhâncủa BIDV Xác định mối tương quan giữa các biến, thực hiện đánh giá mức độ ảnhhưởng cao hay thấp của các thuộc tính mô tả tới thuộc tính nhãn (khả năng trả nợ)

Trang 8

II PHÂN TÍCH CÁC DỮ LIỆU CẦN THU THẬP

2.1 Xác định các thuộc tính dữ liệu cần thu thập

Khu vực sống của khách hàng: Ngoại Ô / Nông Thôn / Thành Phố /Thị Trấn

Từ nơi ở của khách hàng có thể suy ra mật độ chi nhánh của ngân hàng vàđiều kiện kinh tế của khu vực Khó khăn về mặt địa lý cũng làm cản trở cáccán bộ quản lý giám sát nợ Theo quan sát cho thấy khách hàng sống gần chinhánh của ngân hàng có khả năng trả nợ cao hơn

Thu nhập (nghìn đồng/ quý) : Đây là nhân tố ảnh hưởng quan trọngnhất Dễ dàng nhận định rằng những khách hàng có thu nhập càngcao thì có khả năng trả nợ càng cao

Tài khoản tiết kiệm: Có tài khoản tiết kiệm hay không ? (Yes/No)Khi khách hàng có tài khoản tiết kiệm tương đương với việc khách hàng cókhoản tiền dự phòng và nhận được lãi từ số tiền đó dẫn đến khả năng trả nợcao

Sở hữu nhà riêng: Có nhà riêng hay không ? (Yes/No)

nếu khách hàng cá nhân có sở hữu nhà riêng thì khả năng trả nợ đúng hạncủa khách hàng sẽ cao hơn

Tài sản thế chấp: Có tài sản thế chấp hay không ? (Yes/No)

Khi khách hàng vay có thế chấp thì khả năng xảy ra rủi ro của khoản vay cánhân sẽ thấp hơn, tức khả năng trả nợ cao hơn

4

Trang 9

đã thu thập được được sử dụng để hỗ trợ cho việc đánh giá khả năng trả nợ của kháchhàng cá nhân tại BIDV.

III GIỚI THIỆU TỔNG QUAN THUẬT TOÁN SỬ DỤNG

3.1 Khái quát về mô hình cây quyết định (Decision tree).

Mô hình cây quyết định là một phương pháp đơn giản có thể được sử dụng để phânloại các đối tượng theo các tính năng của chúng Ví dụ: bạn có thể có một cây quyếtđịnh cho bạn biết đối tượng của bạn có phải là một quả táo hay không dựa trên cácthuộc tính sau: màu sắc, kích thước và trọng lượng Một cây quyết định hoạt độngbằng cách đi xuống từ nút gốc cho đến khi nó đạt đến nút quyết định Các nút quyếtđịnh có các nhánh đưa chúng ta đến các nút lá hoặc nhiều nút quyết định hơn Các nút

lá là các nút đầu cuối trình bày quyết định cuối cùng giống như tên của chúng chothấy

Trong lĩnh vực máy học, cây quyết định là một kiểu mô hình dự báo (predictivemodel), nghĩa là một ánh xạ từ các quan sát về một sự vật/hiện tượng tới các kết luận

về giá trị mục tiêu của sự vật/hiện tượng Mỗi một nút trong (internal node) tương ứngvới một biến; đường nối giữa nó với nút con của nó thể hiện một giá trị cụ thể cho biến

đó Mỗi nút lá đại diện cho giá trị dự đoán của biến mục tiêu, cho trước các giá trị củacác biến được biểu diễn bởi đường đi từ nút gốc tới nút lá đó Kỹ thuật học máy dùngtrong cây quyết định được gọi là học bằng cây quyết định, hay chỉ gọi với cái tên ngắngọn là cây quyết định

Trang 10

Cây quyết định cũng là một phương tiện có tính mô tả dành cho việc tính toán các xácsuất có điều kiện.

Cây quyết định có thể được mô tả như là sự kết hợp của các kỹ thuật toán học và tínhtoán nhằm hỗ trợ việc mô tả, phân loại và tổng quát hóa một tập dữ liệu cho trước

3.2 Mô hình cây quyết định.

Mô hình cây quyết định cũng là một trong những phương pháp thông dụng trong khaiphá dữ liệu Khi đó, cây quyết định mô tả một cấu trúc cây và các lá đại diện cho cácphân loại còn cành đại diện cho các kết hợp của các thuộc tính dẫn tới phân loại đó.Một cây quyết định có thể được học bằng cách chia tập hợp nguồn thành các tập condựa theo một kiểm tra giá trị thuộc tính Quá trình này được lặp lại một cách đệ quycho mỗi tập con dẫn xuất Quá trình đệ quy hoàn thành khi không thể tiếp tục thựchiện việc chia tách được nữa, hay khi một phân loại đơn có thể áp dụng cho từng phần

tử của tập con dẫn xuất Một bộ phân loại rừng ngẫu nhiên (random forest) sử dụngmột số cây quyết định để có thể cải thiện tỉ lệ phân loại

Cây quyết định hỗ trợ việc mô tả, phân loại và tổng quát hóa một tập dữ liệu cho trước

Dữ liệu được cho dưới dạng các bản ghi có dạng:

(x, y) = (x1, x2, x3 , xk, y)

Biến phụ thuộc (dependant variable) y là biến mà chúng ta cần tìm hiểu, phân loại haytổng quát hóa x1, x2, x3 là các biến sẽ giúp ta thực hiện công việc đó

3.2.1 Phân loại cây quyết định

- Cây hồi quy (Regression tree): ước lượng các hàm giá có giá trị là số thực thay vìđược sử dụng cho các nhiệm vụ phân loại (ví dụ: ước tính giá thuê trọ ở Hà Nội)

- Cây phân loại (Classification tree): nếu y là một biến phân loại như: quyết định ( cóhoặc không), kết quả của cuộc thi (đỗ hay trật)

3.2.2 Quy trình thực hiện

6

Trang 11

Quy trình phân tích hay mô hình dữ liệu phải thỏa mãn các yêu cầu sau:

- Tập dữ liệu phải đạt đủ chất lượng trước khi dựa vào phân tích, được chia thành cáctập training và fest sao cho phù hợp, với tập training thì phải có đầy đủ biến phân loại,biến mục tiêu (target variable), còn test data thì không có

- Tập dữ liệu training phải dồi dào, đa dạng về các biến, thuộc tính dữ liệu để quá trìnhhuấn luyện cho mộ hình diễn ra tối ưu và kết quả phân loại chính xác

- Các lớp, các nhóm hay giá trị của biển mục tiêu phải rời rạc, rõ ràng Thông thườngkhông thể áp dụng phân tích cây quyết định cho một biến mục tiêu liên tục (continuousvariable) Thay vào đó, biến mục tiêu phải nhận các giá trị được phân định rõ ràng làthuộc về một lớp, nhóm cụ thể nào đó hoặc không thuộc về một lớp, nhóm cụ thể nào

do

3.2.3 Ưu và nhược điểm

* Ưu điểm

Trang 12

- Cây quyết định dễ hiểu Người ta có thể hiểu mô hình cây quyết định sau khi đượcgiải thích ngắn.

- Việc chuẩn bị dữ liệu cho một cây quyết định là cơ bản hoặc không cần thiết Các kỹthuật khác thường đòi hỏi chuẩn hóa dữ liệu, cần tạo các biến phụ (dummy variable)

và loại bỏ các giá trị rỗng

- Cây quyết định có thể xử lý cả dữ liệu có giá trị bằng số và dữ liệu có giá trị là tênthể loại Các kỹ thuật khác thường chuyên để phân tích các bộ dữ liệu chỉ gồm mộtloại biến Chẳng hạn, các luật quan hệ chỉ có thể dùng cho các biến tên, trong khimạng nơ-ron chỉ có thể dùng cho các biến có giá trị bằng số

- Cây quyết định là một mô hình hộp trắng Nếu có thể quan sát một tình huống chotrước trong một mô hình, thì có thể dễ dàng giải thích điều kiện đó bằng logicBoolean Mạng nơ-ron là một ví dụ về mô hình hộp đen, do lời giải thích cho kết quảquá phức tạp để có thể hiểu được

- Có thể thẩm định một mô hình bằng các kiểm tra thống kê Điều này làm cho ta cóthể tin tưởng vào mô hình

- Cây quyết định có thể xử lý tốt một lượng dữ liệu lớn trong thời gian ngắn Có thểdùng máy tính cá nhân để phân tích các lượng dữ liệu lớn trong một thời gian đủ ngắn

để cho phép các nhà chiến lược đưa ra quyết định dựa trên phân tích của cây quyếtđịnh

* Nhược điểm:

- Khó giải quyết được những vấn đề có dữ liệu phụ thuộc thời gian liên tục

- Dễ xảy ra lỗi khi có quá nhiều lớp chi phí tính toán để xây dựng mô hình cây quyếtđịnh cao

8

Trang 13

IV MÃ LỆNH CHƯƠNG TRÌNH

1 Khai báo các thư viện sử dụng

2 Khai báo dữ liệu

3 Mô tả dữ liệu

3.1 Nhận biết dữ liệu

Trang 14

3.2 Đổi dữ liệu từ dạng định danh về dạng số

4 Vẽ các biểu đồ thể hiện mối quan hệ giữa các thuộc tính mô tả hay thuộc tính

mô tả và thuộc tính nhãn

4.1 Biểu đồ ngang thể hiện Thu nhập dựa vào Độ tuổi

10

Trang 15

Qua biểu đồ ta thấy Độ tuổi có ảnh hưởng tương đối lớn đến Thu nhập Khách hàng có

độ tuổi càng lớn thì thu nhập càng cao Đây là mối quan hệ thuận chiều

4.2 Biểu về mối quan hệ giữa thu nhập và tuổi của khách hàng theo tình trạng củatài khoản tiết kiệm

Trang 16

Với những khách hàng không có tài khoản Tiết kiệm, thu nhập cao nhất chỉ đạt gần40.000 nghìn đồng/quý; trong khi thu nhập cao nhất của những khách hàng có tàikhoản tiết kiệm lên tới hơn 60.000 nghìn đồng/quý Điều này chứng tỏ những kháchhàng có tài khoản tiết kiệm thường có thu nhập cao hơn và độ tuổi tỉ lệ thuận với thunhập Còn với những khách hàng không có tài khoản tiết kiệm có thu nhập thấp hơn,

độ tuổi ở phân khúc khách hàng này ít ảnh hưởng đến thu nhập

4.3 Biểu về mối quan hệ giữa thu nhập và tuổi theo Khả năng trả nợ

12

Trang 17

Ta có thể thấy Thu nhập của những khách hàng theo Khả năng trả nợ có xu hướng tăngtheo Độ tuổi, nhưng thu nhập của hai phân khúc khách hàng này không giống nhau.Mặc dù cùng khoảng thu nhập, nhưng những khách hàng có khả năng trả nợ sẽ có thunhập nhỉnh hơn so với khách hàng không có khả năng trả nợ

4.4 Biểu đồ hộp phân bố Tuổi của khách hàng theo khả năng trả nợ

- Khách hàng có khả năng trả nợ:

Độ tuổi của những khách hàng có khả năng trả nợ trong khoảng từ 35-60 tuổi

- Khách hàng không có khả năng trả nợ:

Trang 18

Độ tuổi của những khách hàng không có khả năng trả nợ trong khoảng 25-50 tuổi 4.5 Biểu đồ hộp phân bố thu nhập của khách hàng theo khả năng trả nợ

Trang 19

Chia bộ dữ liệu thành 2 tập train và test theo tỷ lệ 80% train, 20% test

Trang 20

Khai báo mô hình cây quyết định

Thực thi mô hình và xác định ma trận nhầm lẫn

Độ chính xác của mô hình

Sử dụng mô hình cho dữ liệu mới

5.2 Kịch bản 2: Dự đoán khả năng trả nợ của khách hàng đã kết hôn theo độ tuổi,nhà riêng, thế chấp

Tách dữ liệu và xác định thuộc tính mô tả X, thuộc tính dự đoán y

16

Trang 21

Chia bộ dữ liệu thành 2 tập train, test theo tỷ lệ 50% train, 50% test

Trang 22

Thực thi mô hình và khai báo mô hình cây quyết định

Trang 23

5.3 Kịch bản 3: Dự đoán khả năng trả nợ của khách hàng ở nông thônTách dữ liệu và xác định thuộc tính mô tả X, thuộc tính dự đoán y

Chia bộ dữ liệu thành 2 tập train và test theo tỷ lệ 60% train, 40% test

Trang 24

Thực thi mô hình và khai báo mô hình cây quyết định

Trang 25

5.4 Kịch bản 4: Dự đoán khả năng trả nợ của khách hàng với tỷ lệ train, test là 90%train, 10% test

Xác định thuộc tính mô tả X và thuộc tính dự đoán y

Trang 26

Chia bộ dữ liệu thành hai tập train và test theo tỉ lệ 90% train,10% test

Khai báo mô hình cây quyết định và thực thi mô hình

Kiểm thử mô hình

Xác định ma trận nhầm lẫn

Độ chính xác của mô hình

22

Ngày đăng: 23/06/2024, 18:34

TÀI LIỆU CÙNG NGƯỜI DÙNG

  • Đang cập nhật ...

TÀI LIỆU LIÊN QUAN