Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 34 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
34
Dung lượng
1,84 MB
Nội dung
lOMoARcPSD|18034504 BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC KINH TẾ THÀNH PHỐ HỒ CHÍ MINH KHOA TÀI CHÍNH CÔNG �㵠�㵠�㵠 - MÔN: KHOA HỌC DỮ LIỆU ĐỀ TÀI: PHÂN TÍCH BỘ DỮ LIỆU BANK MARKETING VÀ CÁC BÀI TOÁN LIÊN QUAN Giáo viên hướng dẫn: Th.S Nguyễn Mạnh Tuấn Lớp học phần: 22C1INF50905921 Khóa: K46 Nhóm sinh viên thực hiện: Trương Hà Anh 31201022058 Bùi Trần Anh Đào 31201023950 Nguyễn Trần Tiểu Yến 31201021325 Nguyễn Phạm Trà Giang 31201022169 Bùi Nguyễn Thanh Mai 31201020829 Downloaded by vu ga (vuchinhhp2@gmail.com) lOMoARcPSD|18034504 LỜI MỞ ĐẦU Trong thời đại cách mạng công nghệ 4.0 đà phát triển vượt bậc, khoa học liệu nắm giữ vai trị vơ quan trọng cốt lõi Đó lĩnh vực có khả kết hợp công cụ, phương pháp công nghệ để từ đúc kết nên ý nghĩa dựa thông tin liệu “Dữ liệu, để riêng rẽ liệu thơ, giá trị Tuy nhiên, tổng hợp với dung lượng đủ lớn, phân loại, xếp soi chiếu góc nhìn khoa học liệu mang đến công dụng lớn cho tổ chức, cá nhân cần định” Các quan, tổ chức lớn giới nói chung Việt Nam nói riêng tập trung phát triển cổng hệ thống trực tuyến nhằm thu thập nhiều liệu dịch vụ thương mại điện tử, chăm sóc sức khỏe, tài hay khía cạnh sống người lưu trữ chúng dạng văn bản, âm thanh, video hình ảnh Các chuyên viên nghiên cứu khoa học liệu có khả biến liệu thơ thành khuyến nghị có nghĩa Nhà nghiên cứu tìm sửa chữa lỗi mà doanh nghiệp chí khơng biết chúng có mặt Các tổ chức sử dụng phương pháp để làm cho khách hàng yên tâm hơn, tối ưu hóa chuỗi cung ứng phát hành sản phẩm Khoa học liệu khoa học việc quản trị phân tích liệu để tìm hiểu biết, tri thức hành động, định dẫn dắt hành động.“Khoa học liệu có ảnh hưởng rộng lớn trực tiếp đến nhiều lĩnh vực nghiên cứu ứng dụng khác nhau: từ dịch máy, nhận dạng tiếng nói, robot, cơng cụ tìm kiếm, ngành khoa học sinh học, y sinh, chăm sóc sức khỏe, khoa học xã hội nhân văn Khoa học liệu gồm ba phần chính: tạo quản trị liệu, phân tích liệu, chuyển kết phân tích thành giá trị hành động.” Để phù hợp với chuyên ngành mà theo đuổi nhóm chúng em sử dụng liệu tổ chức ngân hàng thương mại dùng công cụ phân tích liệu Orange để tìm phương pháp giải toán liên quan nhằm mục đích nhìn nhận đưa hướng phát triển tổ chức Do đó, nhóm chúng em muốn thơng qua tiểu luận này, cách vận dụng nhũng kiến thức học môn khoa học liệu để tiến hành phân tích, nghiên cứu vấn đề liên quan Downloaded by vu ga (vuchinhhp2@gmail.com) lOMoARcPSD|18034504 MỤC LỤC CHƯƠNG I: TỔNG QUAN Mục tiêu phân tích Mô tả liệu Mô tả toán Mô tả phương pháp a) Phương pháp phân lớp b) Phương pháp phân cụm 12 Tiền xử lý liệu 14 CHƯƠNG II: QUY TRÌNH THỰC HIỆN VÀ KẾT QUẢ 15 Bài toán 15 a) Phân tích điểm đặc thù 15 b) Đánh giá 16 Bài toán 20 a) Phân cụm liệu đánh giá mơ hình 20 b) Kiến nghị 27 Bài toán 13 a) Phân lớp liệu đánh giá mơ hình 29 b) Kiến nghị 33 CHƯƠNG III: KẾT LUẬN 35 TÀI LIỆU THAM KHẢO 35 Downloaded by vu ga (vuchinhhp2@gmail.com) lOMoARcPSD|18034504 DANH MỤC HÌNH ẢNH Hình ảnh 1: Ví dụ minh hoạ phân lớp liệu Hình ảnh 2: Ví dụ mơ hình định (Decision Tree) Hình ảnh 3: Ví dụ mơ hìn SVM (Support Vector Machine) Hình ảnh 4: Ví dụ mơ hình hồi quy Logistic (Logistic Regression) Hình ảnh 5: Mơ tả thuật tốn K-means Hình ảnh 6: Mơ tả thuật tốn Hierachical Clustering Hình ảnh 7: Thực bỏ qua biến y Hỉnh ảnh 8: Mơ tả tốn Hình ảnh 9: Bảng kết mẫu Hierachical Clustering Hình ảnh 10: Bảng kết mẫu K-means Hình ảnh 11: Thực chọn default làm biến phụ thuộc Hình ảnh 12: Mơ tả toán DANH MỤC BIỂU ĐỒ Biều đồ 1: Biểu đồ biểu diễn nhóm tuổi xảy vỡ nợ tín dụng Biều đồ 2: Tình trạng vỡ nợ tín dụng dựa phân loại nghề nghiệp Biểu đồ 3: Tình trạng vỡ nợ tín dụng dựa trình độ học vấn Biểu đồ 4: Sự tương quan trình độ học vấn nghề nghiệp ảnh hưởng đến default Biểu đồ 5: Minh hoạ Silhouette Plot Biểu đồ 6: Minh hoạ Silhouette Plot (1) DANH MỤC BẢNG Bảng 1: Kết thuật toán Hierachical Clustering Bảng 2: Kết thuật toán K-means Bảng 3: Kết Confusion Matrix Bảng 4: Kết Test & Score Bảng 5: Kết dự báo Downloaded by vu ga (vuchinhhp2@gmail.com) lOMoARcPSD|18034504 CHƯƠNG I: TỔNG QUAN Mục tiêu phân tích Bộ liệu “Bank Marketing” liệu tổ chức ngân hàng Bồ Đào Nha cung cấp chiến dịch tiếp thị trực tiếp mà cụ thể Telemarketing (tiếp thị qua điện thoại) Mục tiêu việc phân tích liệu để dự đoán khách hàng có sử dụng dịch vụ gửi tiền ngân hàng (yes) hay khơng (no); dự báo nhóm khách hàng có rủi ro vỡ nợ tín dụng phân tích điểm đặc thù liệu Mơ tả liệu “Bộ liệu bao gồm 4119 khảo sát với 21 thuộc tính gồm: 1) age tuổi khách hàng; biến định tính 2) job nghề nghiệp khách hàng; biến định tính gồm nghề quản trị viên (admin), người lao động phổ thông (blue-collar), doanh nhân (entrepreneur), người giúp việc (housemaid), nhà quản lý (management), người hưu (retired), lao động tự (selfemployed), người làm dịch vụ (services), học sinh/sinh viên chưa tốt nghiệp/sinh viên chưa có việc làm (student), kỹ thuật viên (technician), thất nghiệp (unemployed), chưa xác định (unknown) 3) marital tình trạng nhân; biến định tính gồm ly (divorced), kết (married), độc thân (single), chưa xác định (unknown) 4) education trình độ học vấn; biến định tính gồm năm tiểu học (basic.4y), năm tiểu học (basic.6y), trung học sở (basic.9y), trung học phổ thông (high school), không học (illiterate), bậc đại học (professional.course), tốt nghiệp (university.degree), chưa xác định (unknown) 5) default có tín dụng tình trạng vỡ nợ khơng?; biến định tính gồm giá trị có (yes), khơng (no) 6) housing có khoản vay mua nhà khơng?; biến định tính gồm giá trị có (yes), không (no), chưa xác định (unknown) Downloaded by vu ga (vuchinhhp2@gmail.com) lOMoARcPSD|18034504 7) loan có khoản vay cá nhân khơng?; biến định tính gồm giá trị có (yes), không (no), chưa xác định (unknown) 8) contact hình thức liên lạc; biến định tính gồm điện thoại di động (cellular) điện thoại có dây (telephone) 9) month tháng liên lạc cuối năm; biến định tính gồm từ tháng đến tháng 12, jan, feb, mar, apr, may, jun, jul, aug, sep, oct, nov, dec 10) day_of_week ngày liên lạc cuối tuần; biến định tính gồm thứ hai (mon), thứ ba (tue), thứ tư (wed), thứ năm (thu), thứ sáu (fri) 11) duration thời lượng liên lạc cuối cùng; biến định lượng tính giây Lưu ý quan trọng: thuộc tính ảnh hưởng nhiều đến mục tiêu đầu thời lượng kéo theo biến mục tiêu 12) campaign số lần liên lạc thực khách hàng chiến dịch cho khách hàng này; biến định lượng gồm liên hệ cuối 13) pdays số ngày trôi qua sau khách hàng liên hệ lần cuối từ chiến dịch trước đó; biến định lượng giá trị 999 có nghĩa khách hàng chưa liên hệ trước 14) previous số lần liên lạc thực trước chiến dịch khách hàng này; biến định lượng 15) poutcome kết chiến dịch trước đó; biến định tính gồm thất bại (failure), không tồn (nonexistent), thành công (success) 16) emp.var.rate tỷ lệ thay đổi việc làm - báo hàng quý; biến định lượng 17) cons.price.idx số giá tiêu dùng - báo hàng tháng; biến định lượng 18) cons.conf.idx số niềm tin người tiêu dùng - số hàng tháng; biến định lượng 19) euribor3m lãi suất tháng euribor - báo hàng ngày; biến định lượng 20) nr.employed số lượng nhân viên - số hàng quý; biến định lượng 21) y khách hàng đăng ký tiền gửi có kỳ hạn chưa?; biến mục tiêu gồm có đăng ký (yes) không đăng ký (no).” Downloaded by vu ga (vuchinhhp2@gmail.com) lOMoARcPSD|18034504 Mơ tả tốn Sử dụng excel phần mềm Orange để xử lý liệu giải toán sau: Bài toán 1: Phân tích đặc điểm đặc thù liệu dựa vào lược đồ công cụ thống kê Bài tốn 2: Dự đốn xem liệu khách hàng có sử dụng dịch vụ gửi tiền ngân hàng (yes) hay khơng (no)? Bài tốn 3: Dự báo phân loại nhóm khách hàng cho vay dựa tình trạng vỡ nợ tín dụng ‣‣ Đánh giá mức độ liên quan đến chuyên ngành: 2) Liên quan gần ‣‣ Lý do: Bởi chun ngành tài cơng với vấn đề lĩnh vực ngân hàng vấn đề có liên quan mật thiết đến vấn tài nhà nước Mô tả phương pháp a) Phương pháp phân lớp (Classification) Hiện nay, phân loại liệu hướng nghiên cứu khai phá liệu Thực tế người ta trích xuất định kinh doanh thông minh từ sở liệu chứa lượng lớn thông tin ẩn Phân loại dự báo hai hình thức phân tích liệu trích xuất mơ hình mơ tả danh mục liệu quan trọng dự đoán xu hướng liệu tương lai xếp trước Dự đoán nhãn giá trị phân loại cho giá trị rời rạc, tức phân loại làm việc với đối tượng liệu có giá trị biết trước Đồng thời, dự báo xây dựng mơ hình có chức nhận giá trị liên tục Gồm có bước phân lớp liệu: Bước 1: Xây dựng mơ hình để mơ tả tập hợp lớp liệu khái niệm xác định trước Downloaded by vu ga (vuchinhhp2@gmail.com) lOMoARcPSD|18034504 • Đầu vào cho q trình tập liệu có cấu trúc mơ tả thuộc tính tạo từ tập hợp giá trị thuộc tính Nghiên cứu thuật tốn phân loại liệu dựa định Mỗi gọi chung liệu mẫu, ví dụ, đối tượng, ghi trường hợp Bài báo sử dụng thuật ngữ với ý nghĩa • “Trong tập liệu này, phần tử liệu giả định thuộc lớp xác định trước, lớp giá trị thuộc tính chọn làm thuộc tính nhãn lớp thuộc tính phân lớp Đầu bước thường quy tắc phân loại dạng quy tắc if-then, định, công thức logic mạng nơ-ron.”Như hình sau đây: Hình 1: Ví dụ minh hoạ phân lớp liệu Bước 2: Đánh giá mơ hình (kiểm tra tính đắn) • Dữ liệu đầu vào: tập liệu mẫu khác gắn nhãn tiền xử lý Tuy nhiên lúc đưa vào mô hình phân lớp, ta “lờ” thuộc tình gắn nhãn Downloaded by vu ga (vuchinhhp2@gmail.com) lOMoARcPSD|18034504 • “Tính đắn mơ hình xác định cách so sánh thuộc tính gắn nhãn liệu đầu vào kết phân lớp mơ hình” Bước 3: Phân lớp liệu • Phân loại toán phân lớp: Nhiệm vụ toán phân lớp phân loại đối tượng liệu vào n lớp cho trước nếu: n = 2: Thuộc toán phân lớp nhị phân n > 2: Thuộc toán phân lớp đa lớp Các phương pháp phân lớp sử dụng bài: - Cây định (Decision Tree):“trong lý thuyết quản trị, định đồ thị định kết kèm nhằm hỗ trợ trình định Trong lĩnh vực khai thác liệu, định phương pháp mơ tả, phân loại tổng qt hóa tập liệu cho trước.” Downloaded by vu ga (vuchinhhp2@gmail.com) lOMoARcPSD|18034504 Hình 2: Ví dụ mơ hình định (Decision Tree) - SVM (Support Vector Machine): Là thuật toán giám sát, SVM lấy liệu đầu vào, coi vectơ khơng gian phân loại chúng thành lớp khác cách xây dựng siêu phẳng không gian đa chiều làm giao diện lớp Để tối ưu hóa kết phân loại, siêu phẳng nằm xa điểm liệu tất lớp cần xác định Có nhiều biến thể SVM để phù hợp với nhiều vấn đề phân loại khác Hình 3: Ví dụ mơ hình SVM (Support Vector Machine) Downloaded by vu ga (vuchinhhp2@gmail.com) lOMoARcPSD|18034504 Hình 7: Thực bỏ qua biến y Bước 2: Tiến hành xây dựng mơ hình phân cụm với phương pháp: phân cụm phân cấp (Hierachical Clustering) phân cụm phân hoạch theo thuật toán K-Means Downloaded by vu ga (vuchinhhp2@gmail.com) lOMoARcPSD|18034504 Hình 8: Mơ hình tốn Bước 3: Đánh giá kết mơ hình Phân cụm phân cấp (Hierachical Clustering): Downloaded by vu ga (vuchinhhp2@gmail.com) lOMoARcPSD|18034504 Bảng 1: Kết thuật toán Hierachical Clustering Biểu đồ 5: Minh hoạ Silhouette Plot Nhận xét: Với phương pháp tính khoảng cách single-link, nhóm nhận thấy đa số số Silhouette mơ hình lớn 0.5 sát thực tế nên nhóm lựa chọn phân thành cụm phương án tốt Downloaded by vu ga (vuchinhhp2@gmail.com) lOMoARcPSD|18034504 Phân cụm phân hoạch theo thuật toán K-Means: Bảng 2: Kết thuật toán K-means Nhận xét: Nhìn vào bảng Silhouette Score, nhóm nhận thấy số Silhouette liệu phân thành cụm cao (0.273) nên nhóm phân liệu thành cụm Downloaded by vu ga (vuchinhhp2@gmail.com) lOMoARcPSD|18034504 Biều đồ 6: Minh hoạ Silhouette Plot (1) Nhận xét: nhược điểm phân cụm liệu theo thuật tốn K-Means cịn tồn nhiều số Silhouette mang giá trị âm hay giá trị nhỏ Hình 9: Bảng kết mẫu Hierachical Clustering Nhận xét: Khi so sánh kết phân cụm với kết mẫu, nhóm thấy độ xác lên đến 89,02% (khá tương đồng với kết mẫu), mơ hình cho kết phân cụm tốt Downloaded by vu ga (vuchinhhp2@gmail.com) lOMoARcPSD|18034504 Hình 10: Bảng kết mẫu K-means Nhận xét: Khi so sánh kết phân cụm với kết mẫu nhóm thấy độ xác thấp (28,26%) cho thấy mơ hình phân cụm khơng thực tốt => Kết luận: Nhóm thực đề tài tiến hành nghiên cứu dự báo khách hàng đăng ký khách hàng chưa đăng ký tiền gửi có kỳ hạn So sánh khách hàng chưa đăng ký tiền gửi có kỳ hạn với khách hàng đăng ký tiền gửi có kỳ hạn số khách hàng chưa đăng ký chiếm phần lớn Và kết đạt khơng có chênh lệch nhiều so với nhãn mục tiêu có liệu Những chiến dịch tiếp thị qua điện thoại cách thức hiệu để tiếp cận với nhiều người cung cấp thông tin xác định dự báo khách hàng đăng ký tiền gửi có kỳ hạn Vậy, thơng qua biến thuộc tính nhóm thực đề tài tiến hành nghiên cứu dự báo khách hàng đăng ký tiền gửi có kỳ hạn khách hàng chưa đăng ký tiền gửi có kỳ hạn b) Kiến nghị Sau tiến hành phân tích, nhóm có số hướng phát triển chiến lược ngân hàng Việt Nam thu hút khách hàng tham gia đăng ký tiền gửi có kỳ hạn Downloaded by vu ga (vuchinhhp2@gmail.com) lOMoARcPSD|18034504 - Phân tích xác định lượng khách hàng mục tiêu Đây bước cần thiết cho ngân hàng trình phát triển tiến hành kế hoạch tiếp thị Việc xác định nhóm khách hàng tiềm như: người có mối quan tâm đến việc gửi tiết kiệm, có thu nhập ổn định khoản tiền nhàn rỗi để sẵn sàng gửi tiết kiệm “Qua việc tiếp cận nhóm khách hàng mục tiêu giúp tăng số lượng tiền gửi tiết kiệm vào ngân hàng tối ưu chi phí tiếp thị nhắm mục tiêu vào nhóm khách hàng tiềm tương tác với quảng cáo hạn chế lượng thời gian tiếp cận nhiều người xuống mức thấp đối tượng không cần thiết.” - Thông tin đến khách hàng dịch vụ tiền gửi tiết kiệm Việc thông tin sản phẩm đến khách hàng nhằm mục đích cung cấp đúng, đầy đủ kịp thời thông tin cần thiết có liên quan đến dịch vụ ngân hàng tiền gửi tiết kiệm như: mức lãi suất, kỳ hạn gửi (tuần/ tháng/ năm), phương thức trả lãi (trả lãi trước, trả lãi sau trả lãi định kỳ), ưu đãi (mở thẻ tín dụng khơng cần chứng minh thu nhập, ưu đãi lãi suất vay) đến khách hàng sử dụng dịch vụ Các ngân hàng cần phải tăng cường việc tư vấn cho khách hàng gói tiền gửi như: lợi ích đăng ký gói tiền gửi có hạn, hay đưa dẫn chứng cụ thể thực tế lợi ích cho việc đăng ký tiền gửi ngân hàng so với ngân hàng khác để khách hàng có nhận định việc sử dụng dịch vụ tiền gửi tiết kiệm ngân hàng - Đa dạng dịch vụ tiền gửi có kỳ hạn tiện lợi cho khách hàng Song song với việc cung cấp thông tin dịch vụ tiền gửi tiết kiệm, việc đa dạng hóa dịch vụ điều kiện giúp cho ngân hàng phát triển thu hút thêm lượng khách hàng tiềm trải nghiệm dịch vụ Vì khách hàng ngân hàng có nhiều tầng lớp khác nhu cầu gửi tiền họ đa dạng Vì thế, yếu tố như: an tồn, Downloaded by vu ga (vuchinhhp2@gmail.com) lOMoARcPSD|18034504 tiện lợi, cách phục vụ, hướng dẫn nhân viên hay kể yếu tố lãi suất,… có tác động khơng nhỏ đến việc định gửi tiền vào ngân hàng - Đa dạng hóa gói dịch vụ tiền gửi theo kỳ hạn mức lãi suất hấp dẫn - Đa dạng hóa sản phẩm theo loại đồng tiền gửi - Đa dạng hóa sản phẩm tiền gửi tiết kiệm theo số dư - Đa dạng hóa sản phẩm theo nhóm khách hàng ( thu nhập cao, trung bình thấp) để thiết kế dịch vụ tiền gửi tiết kiệm dành riêng cho nhóm đối tượng khách hàng “Điều giúp cho khách hàng tham gia trải nghiệm dịch vụ chủ động lựa chọn phù hợp với tài Các ngân hàng nên mở mạng lưới chi nhánh tới địa phương để thuận tiện cho việc tăng khả tiếp cận dịch vụ đến người dân, đặc biệt vùng nông thôn, vùng sâu, vùng xa Việc tạo nguồn thu đa dạng, gia tăng hiệu kinh doanh tăng cường lượng khách hàng sử dụng dịch vụ.” - Nâng cấp kênh giao dịch trực tuyến Internet Banking, Mobile Banking với giao diện dễ nhìn, menu thực thao tác rõ ràng, dễ hiểu,… để khách hàng dễ dàng thực gửi tiền trực tuyến Bài tốn 3: Dự báo phân loại nhóm khách hàng cho vay theo tình trạng tín dụng vỡ nợ a) Phân lớp liệu - Sử dụng phương pháp: hồi quy Logistic (Logistic Regression), SVM (Support Vector Machine), định (Decision Tree) - Đánh giá phương pháp Lưu ý thể quan sát liệu theo dạng bảng biều đồ Downloaded by vu ga (vuchinhhp2@gmail.com) lOMoARcPSD|18034504 Bước 1: Vào file chọn liệu từ Bank-additional.xlsx Thay đổi role biến default từ feature thành biến target (biến phụ thuộc) Đối với biến contact; month; day_of_week; duration; campaign; pdays; previous; poutcome; emp.var.rate; cons.price.idx; cons.conf.idx; euribor3m; nr.employed; biến khơng ảnh hưởng đến tình trạng vỡ nợ tín dụng nên nhóm định loại bỏ (ignored) Sau nhấn Apply Hình 11: Thực chọn default làm biến phụ thuộc Bước 2: Tạo bảng Test and Score mơ hình phân lớp gồm: hồi quy Logistics, SVM, Decision Tree Downloaded by vu ga (vuchinhhp2@gmail.com) lOMoARcPSD|18034504 Hình 12: Mơ hình tốn Bước 3: Đánh giá - Theo ma trận nhầm lẫn: • Mơ hình Tree • Mơ hình SVM Downloaded by vu ga (vuchinhhp2@gmail.com) lOMoARcPSD|18034504 • Mơ hình hồi quy Logictis Bảng 3: Kết Confusion Matrix Nhận xét: Confusion Matrix cho thấy mơ hình hồi quy Logistic có sai lầm loại thấp nhất, cịn dự báo mơ hình SVM Tree nhóm khách hàng khơng tình trạng vỡ nợ tín dụng thực tế có Sai lầm khiến ngân hàng thương mại chịu rủi ro nợ xấu tăng cao nên ta phải loại bỏ Dùng Test & Score thực đánh giá lại để có độ tin cậy cao Downloaded by vu ga (vuchinhhp2@gmail.com) lOMoARcPSD|18034504 - Theo Test and Score: Bảng 4: Kết Test & Score Nhận xét: AUC (độ xác): Logistic Regression > SVM & Tree = 0.859 > 0.493 & 0.763 => lựa chọn mơ hình hồi quy Logistic làm phương pháp để đánh giá file liệu “Data Forecast” - Kết dự báo Downloaded by vu ga (vuchinhhp2@gmail.com) lOMoARcPSD|18034504 Bảng 5: Kết dự báo “b) Kiến nghị Sau tiến hành phân tích, nhóm có số cung cấp phương pháp Quản lý, ngăn chặn nợ hạn thẻ tín dụng, thu hồi nợ hạn hữu ngân hàng sau: - Thứ nhất, phân tích nợ hạn theo nhóm Nợ q hạn thẻ tín dụng ngồi phân loại theo Trung tâm thơng tin tín dụng quốc gia (CIC) chia thành nhóm nợ đủ tiêu chuẩn nhóm 1, nợ cần ý nhóm 2, nợ tiêu chuẩn nhóm 3, nợ nghi ngờ nhóm 4, nợ có khả vốn nhóm 5… ngân hàng phân loại nợ theo nhóm như: nhóm khơng cịn địa phương, nhóm cịn địa phương Downloaded by vu ga (vuchinhhp2@gmail.com) lOMoARcPSD|18034504 - Thứ hai, ngăn chặn rủi ro hạn thẻ tín dụng Hiện nay, thẻ ngân hàng phương tiện toán khách hàng ưa chuộng sử dụng phổ biến Vì vậy, việc phòng ngừa, quản lý rủi ro hoạt động thẻ vấn đề quan trọng Các rủi ro xảy chuyên viên khách hàng áp lực tiêu nên không thẩm định kỹ liên kết với đơn vị chấp nhận thẻ thực sai quy định, khách hàng giả mạo hồ sơ đề nghị cấp thẻ tín dụng khách hàng sử dụng thẻ thông đồng với đơn vị chấp nhận thẻ thực giao dịch khống Cần rà soát khách hàng sử dụng thẻ tín dụng để bán chéo triệt để sản phẩm ngân hàng, gắn thu nợ TTD với tài khoản toán, phát sớm nguy phát sinh rủi ro từ phía khách hàng Định kỳ, thực lấy danh sách tài khoản trễ hạn, theo dõi đôn đốc Chủ thẻ tốn để khơng chuyển nợ q hạn Nhóm 2; Gọi điện thoại thu nợ thẻ tín sụng theo danh sách phịng Kiểm sốt rủi ro gửi cảnh báo TTD trễ hạn nhảy Nhóm Thực quy trình thẩm định thẻ tín dụng cho khách hàng dựa theo tiêu chung: nhu cầu thực cần thiết cuả khách hàng, thu nhập ổn định khách hàng cư trú địa phương Trong trình thẩm định phải vào nhà khách hàng sinh sống thực tế để xác minh thẩm định thông tin khách hàng; Đến quan, nơi làm việc, nơi tạo nguồn thu nhập, cập nhật thêm thông tin lân cận nhà khách hàng, nơi làm việc Tra cứu thêm thông tin khách hàng từ trang mạng xã hội: facebook, zalo… - Thứ ba, tạo động lực cho nhân viên để tích cực cơng tác thu hồi thẻ tín dụng Việc thu hồi nợ hạn thẻ tín dụng tốt tạo dựng thương hiệu, uy tín cá nhân việc làm tuân thủ làm tốt định hướng ngân hàng.” CHƯƠNG III: KẾT LUẬN Downloaded by vu ga (vuchinhhp2@gmail.com) lOMoARcPSD|18034504 Qua phân tích, biết khách hàng có đánh dịch vụ ký gửi tiền ngân hàng, đối tượng có khả đăng ký dịch vụ, chiến dịch marketing ngân hàng có hiệu hay khơng Từ ngân hàng xác định đối tượng khách hàng mục tiêu có chiến dịch marketing thành công tương lai Nhìn chung, chiến dịch marketing ngân hàng chưa thực có hiệu đa số kết dự đốn (biến y) cịn nhiều khách hàng chưa đăng ký dịch vụ ngân hàng Chính nhờ kết phân tích ngân hàng tìm giải pháp tối ưu để đáp ứng nhu cầu nhắm vào tâm lí khách hàng số phương hướng nhóm đề mục hướng phát triển Suy cho cùng, việc phân lớp phân cụm liệu việc cần thiết Vì lẽ, kết phân tích giúp ngân hàng đưa sách hợp lý hiệu Về phần time-series, cơng cụ quan trọng q trình phân tích liệu thay đổi theo thời gian, tìm khoảng dao động từ ước lượng giá trị tương lai liệu, từ đưa định đầu tư đắn TÀI LIỆU THAM KHẢO [1] Slie giảng môn Khoa học liệu – Th.S Nguyễn Mạnh Tuấn [2] Orange Data Mining - https://www.youtube.com/c/OrangeDataMining/featured [3] https://tailieunganhang.com/de-tai-cac-bien-phap-huy-dong-tien-gui-tai-ngan-hang- thuong-mai-viet-nam-634/ Downloaded by vu ga (vuchinhhp2@gmail.com) ... hình xác định cách so sánh thuộc tính gắn nhãn liệu đầu vào kết phân lớp mơ hình” Bước 3: Phân lớp liệu • Phân loại tốn phân lớp: Nhiệm vụ toán phân lớp phân loại đối tượng liệu vào n lớp cho... (vuchinhhp2@gmail.com) lOMoARcPSD|18034504 BÀI TOÁN 1: Phân tích điểm đặc thù liệu dựa vào lược đồ công cụ thống kê a) Phân tích liệu đặc trưng có tính phân loại - Dữ liệu thô chứa 4119 hàng (đối tượng)... a) Phân cụm liệu Nhóm tiến hành phân cụm liệu sau: sử dụng phương pháp phân cụm phân cấp (Hierachical Clustering) phân cụm phân hoạch theo thuật toán K-Means Bước 1: Tạo File chọn liệu từ Bank- additional.xlsx