1. Trang chủ
  2. » Giáo Dục - Đào Tạo

Bộ Môn Khoa Học Dữ Liệu Đề Tài Dự Báo Các Đối Tượng Khách Hàng Đủ Điều Kiện Được Cho Vay

35 13 1

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

hange E d f- x U B to e lic k chang C w c TRƯỜNG Đ䄃⌀I H伃⌀C KINH T쨃Ā TPHCM KHOA K쨃Ā TO䄃ĀN B퐃⌀ MÔN KHOA H伃⌀C DỮ LIỆU B䄃ĀO C䄃ĀO DỰ 䄃ĀN TÊN Đ쨃 T䄃I DỰ B䄃ĀO C䄃ĀC ĐỐI TƯỢNG KH䄃ĀCH H䄃NG ĐỦ ĐI쨃U KIỆN ĐƯỢC CHO VAY Giảng viên môn: ThS Trương Việt Phương Mã lớp học phần: 22C1INF50905959 Danh sách sinh viên nhóm: Mai Th椃⌀ Thanh Huyn - 31211022987 Hoàng Nguyễn Minh Ngọc - 31211022887 Ngô Quốc Thắng - 31211026604 Nguyễn Th椃⌀ Thanh Xuân - 31211022055 - 3121102 Nguyễn Hoàng Vỹ TPHCM, ng愃y 09 th愃Āng 10 năm 2022 om p t Y N Y U B to k lic C ww w di ! XC O W PD F- N ! om O W t or di ww F hange E or PD lOMoARcPSD|9242611 C -X p d f- x chang e c hange E d f- x U B to e lic k chang C w c BẢNG PHÂN CÔNG NHIỆM VỤ Họ v愃 Tên Nhiệm vụ Đánh giá chĀt lượng Mai Th椃⌀ Thanh Huyn Nội dung, trình bày 100% Hồng Nguyễn Minh Ngọc Nội dung, trình bày 100% Ngơ Quốc Thắng Nội dung, trình bày 100% Nguyễn Th椃⌀ Thanh Xuân Nội dung, trình bày 100% Nguyễn Hồng Vỹ Nội dung, trình bày 100% Downloaded by tran quang (quangsuphamhoak35@gmail.com) om p t Y N Y U B to k lic C ww w di ! XC O W PD F- N ! om O W t or di ww F hange E or PD lOMoARcPSD|9242611 C -X p d f- x chang e c hange E d f- x U B to e lic k chang C w c MỤC LỤC GIỚI THIỆU TỔNG QUAN DANH MỤC HÌNH ẢNH N퐃⌀I DUNG -2 Tóm tắt dự án -2 Giới thiệu dự án -2 2.1 L礃Ā ch漃⌀n đ t愃i -2 2.2 M甃⌀c tiêu nghiên cứu 2.3 ĐĀi tượng, ph愃⌀m vi nghiên cứu -3 Phương pháp nghiên cứu, công cụ thực hiệN Quy trình phân tích v愃 kết -4 4.1 Phân tích liệu 4.1.1 Mô tả liệu 4.1.2 Tin xử l礃Ā liệu -5 4.1.3 ThĀng kê mô tả liệu 4.2 Phân cụm liệu -8 4.2.1 Mô tả b愃i to愃Ān 4.2.2 C愃Āc bước tiến h愃nh 4.2.2.1 Xây dựng mơ hình 4.2.2.2 C愃Āc phương ph愃Āp phân c甃⌀m 4.2.2.3 Đ愃Ānh gi愃Ā, nhận xét -15 4.3 Phân lớp liệu 15 4.3.1 Mô tả b愃i to愃Ān -15 4.3.2 C愃Āc bước tiến h愃nh -15 4.3.2.1 Xây dựng mơ hình -15 4.3.2.2 C愃Āc phương ph愃Āp phân lớp -16 4.3.2.3 Đ愃Ānh gi愃Ā, nhận xét -17 4.4 Dự báo khả cho vay -20 4.4.1 Mô tả b愃i to愃Ān -21 4.4.2 C愃Āc bước tiến h愃nh -21 4.4.2.1 Xây dựng mơ hình 21 om p t Y N Y U B to k lic C ww w di ! XC O W PD F- N ! om O W t or di ww F hange E or PD lOMoARcPSD|9242611 C -X p d f- x chang e c d f- x t Y c 4.4.2.2 Kết dự b愃Āo 21 H愃⌀n chế 22 Kết lu⌀n v愃 khuyến ngh椃⌀ -22 6.1 Kết luận -22 6.2 Khuyến ngh椃⌀ -23 T䄃I LIỆU THAM KHẢO 24 om e C om chang lic k to B U Y U B to k lic C p ww ww w di ! hange E O W XC N ! F- N PD t O W di or F hange E or PD lOMoARcPSD|9242611 C -X w p d f- x chang e c hange E d f- x U B to e lic k chang C w c GIỚI THIỆU TỔNG QUAN Bộ môn Khoa học liệu môn học v việc khai phá, quản tr椃⌀ phân tích liệu để dự đốn xu hướng tương lai đưa đ椃⌀nh, chiến lược hành động Việc phân tích sử dụng liệu dựa vào ba nguồn tri thức: toán học (thĀng kê to愃Ān h漃⌀c - Mathematical Statistics), công nghệ thông tin (m愃Āy h漃⌀c Machine Learning) tri thức lĩnh vực ứng dụng cụ thể Do đ漃Ā, suốt trình học t⌀p t愃⌀i Trường Đ愃⌀i học Kinh tế Thành Phố Hồ Chí Minh, ch甃Āng em khơng ch椃ऀ học t⌀p trang b椃⌀ thêm nhiu kiến thức lý thuyết v lĩnh vực khoa học liệu mà cách v⌀n dụng học đ漃Ā vào thực tiễn cho đ甃Āng đắn Những điu l攃̀ đ漃Ā đu nh漃Ām ch甃Āng em tích luỹ, tऀng hợp c甃̀ng cố gắng áp dụng th⌀t hiệu vào dự án thay cho tiểu lu⌀n đánh giá cuối k礃 mang tên “Dự báo đối tượng khách hàng đủ điều kiện cho vay” Qua dự án này, mục tiêu ch甃Āng em c漃Ā thể khái quát r漃̀ v nhu cu, lý tác động s攃̀ ảnh hưởng đến việc phân tích đối tượng khách hàng đủ điu kiện cho vay Đồng thời qua đ漃Ā, ch甃Āng em - nh漃Ām thực dự án c漃Ā thể trau dồi thêm khả làm việc nh漃Ām, kỹ mm cn c漃Ā tích luỹ nhiu kinh nghiệm xử lý liệu cho công việc ở tương lai Nh漃Ām ch甃Āng em xin gửi lời cảm ơn chân thành đến trường Đ愃⌀i học Kinh tế TP.HCM đưa mơn học Khoa học liệu vào chương trình giảng d愃⌀y Và hết, nh漃Ām em xin gửi lời cảm ơn đặc biệt sâu sắc đến ThS Trương Việt Phương giảng viên dạy môn Khoa học liệu nh漃Ām ch甃Āng em Trong trình giảng d愃⌀y, nhờ c漃Ā chu đáo, t⌀n tình hướng d̀n, chia s攃ऀ thy v kiến thức ở môn Khoa học liệu l̀n kinh nghiệm việc khắc phục nhiu thiếu s漃Āt thực dự án mà nh漃Ām em c漃Ā thể hồn thiện nghiên cứu Kiến thức c甃̀ng kinh nghiệm mà nh漃Ām em c漃Ā v̀n chưa đủ hồn hảo v⌀y khơng tránh khỏi việc xảy sai s漃Āt Mong thy c漃Ā g漃Āp ý chân thành để nh漃Ām em c漃Ā thể cải thiện tốt cho ln sau Cuối cùng, em xin ch甃Āc thy gia đình th⌀t nhiu sức khỏe, vui v攃ऀ, h愃⌀nh ph甃Āc Luôn mong thy giữ vững lửa nhiệt om p t Y N Y U B to k lic C ww w di ! XC O W PD F- N ! om O W t or di ww F hange E or PD lOMoARcPSD|9242611 C -X p d f- x chang e c d f- x t Y c huyết để giảng d愃⌀y cho hệ môn học đy th甃Ā v椃⌀ Nh漃Ām em xin chân thành cảm ơn thy! om e C om chang lic k to B U Y U B to k lic C p ww ww w di ! hange E O W XC N ! F- N PD t O W di or F hange E or PD lOMoARcPSD|9242611 C -X w p d f- x chang e c hange E d f- x U B to e lic k chang C w c DANH MỤC HÌNH ẢNH Hình 1: Mơ hình qu愃Ā trình tin xử l礃Ā liệu Hình 2: Mơ hình b愃i to愃Ān phân c甃⌀m Hình 3.1: Mơ tả phương ph愃Āp k-Means -9 Hình 3.2: Mơ hình sĀ Silhouette Scores c甃⌀m phương ph愃Āp kMeans -10 Hình 3.3: Điểm Silhouette cao c甃⌀m theo phương ph愃Āp k-Means 11 Hình 4.1: Mô tả phương ph愃Āp Hierarchical Clustering theo c甃⌀m 11 Hình 4.2: Mơ hình sĀ Silhouette Scores theo c甃⌀m phương ph愃Āp Hierarchical Clustering 12 Hình 4.3: Mơ hình phương ph愃Āp Hierarchical Clustering theo c甃⌀m -13 Hình 4.4: Mơ hình sĀ Silhouette Scores theo c甃⌀m phương ph愃Āp Hierarchical Clustering 13 Hình 4.5: Điểm Silhouette Scores cao c甃⌀m phương ph愃Āp Hierarchical Clustering 14 Hình 5: Mơ hình b愃i to愃Ān phân lớp 15 Hình 6: Kết Test and Score -18 Hình 7: Mơ hình ROC Analysis C1, C2 qua ba phương ph愃Āp phân lớp 18 Hình 8.1: Kết Ma trận nhầm lẫn phương ph愃Āp Logistics Regression - 19 Hình 8.2: Kết Ma trận nhầm lẫn phương ph愃Āp Cây đ椃⌀nh 20 Hình 8.3: Kết Ma trận nhầm lẫn phương ph愃Āp SVM -20 Hình 9: Mơ hình b愃i to愃Ān dự b愃Āo -21 Hình 10: Kết dự b愃Āo công c甃⌀ Predictions 22 om p t Y N Y U B to k lic C ww w di ! XC O W PD F- N ! om O W t or di ww F hange E or PD lOMoARcPSD|9242611 C -X p d f- x chang e c hange E d f- x U B to e c lic k chang C om p t Y N Y U B to k lic C ww w di ! XC O W PD F- N ! om O W t or di ww F hange E or PD lOMoARcPSD|9242611 C -X w p d f- x chang e c hange E d f- x U B to e lic k chang C w c N퐃⌀I DUNG Tóm tắt dự án Nh漃Ām ch甃Āng em xây dựng dự án với mục tiêu phân tích liệu để xác đ椃⌀nh phân kh甃Āc khách hàng, đối tượng đủ điu kiện vay vốn để c漃Ā thể nhắm mục tiêu cụ thể đến khách hàng tim Để thực dự án, nh漃Ām sử dụng phn mm Orange kiến thức học lớp Nhằm tìm hiểu cặn k攃̀ để đưa phân tích xác v thơng tin trên, nh漃Ām ch甃Āng em thu th⌀p liệu cụ thể v thông tin chi tiết khách hàng cung cấp bởi cơng ty tài Dream Housing Dựa vào liệu đ漃Ā, nh漃Ām ch甃Āng em sử dụng phương pháp phân cụm liệu, phân lớp liệu dự báo kết không ch椃ऀ xác đ椃⌀nh yếu tố ảnh hưởng đến việc c漃Ā đủ điu kiện cho vay khơng mà cịn xác đ椃⌀nh yếu tố chủ yếu, yếu tố thứ yếu khả cho vay với yếu tố đ椃⌀nh đến việc cho vay Các yếu tố sau ảnh hưởng trực tiếp đến khả vay vốn bao gồm: Giới tính, Tình tr愃⌀ng nhân, Giáo dục, Thu nh⌀p khách hàng, Số tin Khoản vay, Thời h愃⌀n vay L椃⌀ch sử Tín dụng Từ đ漃Ā xác đ椃⌀nh phân kh甃Āc khách hàng đủ điu kiện vay vốn, nhắm mục tiêu cụ thể đến khách hàng đ漃Ā tìm hướng phát triển cho d椃⌀ch vụ cho vay phù với lợi nhu⌀n chung để c漃Ā thể đ愃⌀t hiệu tốt Giới thiệu dự án 2.1 L礃Ā chọn đề tài Cuộc sống ngày phát triển, nhu cu vay tiêu dùng gia tăng m愃⌀nh m攃̀ gắn lin với nhu cu v hàng tiêu dùng lâu bn nhà, xe, N漃Ā gi甃Āp cải thiện chất lượng sống người dân, công cụ đắc lực gi甃Āp giải nhanh vấn đ liên quan đến tài cá nhân doanh nghiệp Tuy nhiên, để nhu cu đáp ứng đ甃Āng thời điểm l甃Āc c甃̀ng dễ dàng thực bởi n漃Ā phụ thuộc vào nhân tố quan trọng, đ漃Ā khả toán người vay om p t Y N Y U B to k lic C ww w di ! XC O W PD F- N ! om O W t or di ww F hange E or PD lOMoARcPSD|9242611 C -X p d f- x chang e c d f- x t Y c Dựa nghiên cứu trước v việc t愃⌀i người ta khả chi trả khoản nợ với ngân hàng, cơng ty tài Livingston Lunt (1992), mơ hình chấm điểm tín dụng FICO, hệ thống xếp h愃⌀ng tín dụng cá nhân BIDV, Vietinbank, Việc đánh giá khả trả nợ khách hàng s攃̀ gi甃Āp cho công ty c漃Ā thể nh⌀n diện khách hàng “xấu” (khả cao c漃Ā không chi trả khoản vay), từ đ漃Ā đưa biện pháp xử lý để h愃⌀n chế rủi ro từ khoản vay lo愃⌀i khách hàng 2.2 Mục tiêu nghiên cứu Nghiên cứu s攃̀ gi甃Āp ch甃Āng ta c漃Ā thông tin cn thiết đối tượng mà ch甃Āng ta tìm hiểu C漃Ā thể sử dụng cơng cụ hỗ trợ để phân tích đưa kết lu⌀n cụ thể, xu hướng hoặc giải pháp cho doanh nghiệp Từ đ漃Ā, doanh nghiệp c漃Ā thể dự đoán khả c漃Ā nên cho người đ漃Ā vay hay không Dự báo khả cho vay thông qua toán: - B愃i toán 1: Phân cụm lo愃⌀i khách hàng chưa gán nhãn để thấy r漃̀ đặc điểm khách hàng thông qua công cụ Hierarchical clustering, Partitioning clustering (K-Means), - B愃i toán 2: Phân lớp khách hàng từ liệu gán nhãn thơng qua tốn phân cụm để dự đốn khách hàng c漃Ā đủ điu kiện vay công cụ Logistic Regression, SVM, Tree Neural Network - B愃i toán 3: Dự báo khả cho vay qua công cụ Prediction từ phương pháp phân lớp (phương pháp tốt phương pháp phân lớp) 2.3 Đối tượng, phạm vi nghiên cứu Khảo sát thực ph愃⌀m vi 614 khách hàng ng̀u nhiên c漃Ā nhu cu vay nợ mua nhà công ty tài Dream Housing Phương pháp nghiên cứu om e C om chang lic k to B U Y U B to k lic C p ww ww w di ! hange E O W XC N ! F- N PD t O W di or F hange E or PD lOMoARcPSD|9242611 C -X w p d f- x chang e c

Ngày đăng: 24/02/2024, 13:59

Xem thêm:

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w