1. Trang chủ
  2. » Luận Văn - Báo Cáo

Ứng dụng khai phá dữ liệu xây dựng hệ thống phân tích hoạt động tiếp thị ngân hàng

69 0 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 69
Dung lượng 1,85 MB

Nội dung

1 MỞ ĐẦU Lý chọn đề tài: Trong thời đại công nghệ 4.0 ngày nay, việc nắm bắt thông tin coi sở hoạt động sản xuất, kinh doanh Các cá nhân tổ chức thu thập, hiểu công nghệ hoạt động dựa công nghệ 4.0 đạt thành công hoạt động sản xuất kinh doanh Công nghệ thông tin (CNTT) cho phép ta khai thác tri thức hữu dụng từ Cơ sở liệu (CSDL) gọi kỹ thuật Khai phá liệu (DM) Khai phá liệu trình tính tốn để tìm mẫu liệu lớn liên quan đến phương pháp giao điểm máy học, thống kê hệ thống sở liệu Đây lĩnh vực liên ngành khoa học máy tính Mục tiêu tổng thể q trình khai phá liệu trích xuất thông tin từ liệu chuyển thành cấu trúc dễ hiểu để sử dụng tiếp Ngồi bước phân tích thơ, cịn liên quan tới sở liệu khía cạnh quản lý liệu, xử lý liệu trước, suy xét mơ hình suy luận thống kê, thước đo thú vị, cân nhắc phức tạp, xuất kết cấu trúc phát hiện, trực quan hóa cập nhật trực tuyến Khai phá liệu bước phân tích q trình "khám phá kiến thức sở liệu" KDD (Knowledge Discovery in Databases) [1] Khai phá liệu (KPDL) sở liệu (CSDL) xu hướng quan trọng công nghệ thông tin (CNTT) KPDL có khả ứng dụng vào nhiều lớp tốn thực tế khác nhau, qui trình mà ngân hàng sử dụng để biến liệu thô thành thơng tin hữu ích Bằng cách dùng phần mềm để tìm mẫu hình tập liệu, ngân hàng hiểu khách hàng họ phát triển chiến lược marketing hiệu quả, giúp tăng doanh thu giảm chi phí Việc khai phá liệu phụ thuộc vào việc thu thập liệu cách hiệu quả, lưu trữ kho liệu xử lí máy tính Các đợt tiếp thị chào hàng tạo thành chiến lược điển hình để nâng cao hoạt động kinh doanh Các ngân hàng sử dụng tiếp thị trực tiếp nhắm đến mục tiêu phân khúc khách hàng cách liên hệ với họ để đáp ứng mục tiêu cụ thể Tập trung hóa tương tác khách hàng từ xa giúp giảm bớt việc quản lý hoạt động đợt Việc liên lạc cho phép giao tiếp với khách hàng qua nhiều kênh khác nhau: điện thoại cố định, điện thoại di động sử dụng rộng rãi Tiếp thị thực thông qua trung tâm liên lạc gọi tiếp thị qua điện thoại Địa liên hệ thực nước, tùy thuộc vào việc bên thực liên hệ (khách hàng trung tâm liên hệ), với trường hợp đặt thách thức khác Công nghệ cho phép thực thương mại cách tập trung vào việc tối đa hóa giá trị lâu dài khách hàng thơng qua việc đánh giá thơng tin sẵn có số khách hàng, cho phép ngân hàng xây dựng mối quan hệ lâu dài chặt chẽ phù hợp với yêu cầu kinh doanh [1] Ngoài ra, cần nhấn mạnh nhiệm vụ lựa chọn nhóm khách hàng tốt nhất, tức có nhiều khả đăng ký sản phẩm Trong luận văn này, em mạnh dạn đề xuất phương pháp khai phá liệu (DM) để dự đốn thành cơng gọi qua điện thoại hoạt động tiếp thị sản phẩm ngân hàng; Để góp phần nâng cao hiệu việc ứng dụng marketing (tiếp thị) hoạt động kinh doanh ngân hàng, em chọn đề tài “Ứng dụng khai phá liệu xây dựng hệ thống phân tích hoạt động tiếp thị ngân hàng” cho đề tài tốt nghiệp Mục tiêu đề tài xuất phát từ đặc điểm chung hoạt động marketing ngành ngân hàng thực trạng ứng dụng ngân hàng để tìm giải pháp giúp cho nhà quản trị ngân hàng nâng cao hiệu việc ứng dụng marketing lĩnh vực kinh doanh Kỹ thuật khai phá liệu mà em áp dụng mơ hình hồi quy logistic (LR), định (DT) Việc khai phá liệu tạo nên mơ hình thu đáng tin cậy có giá trị nhà quản lý đợt tiếp thị qua điện thoại ngân hàng [1] Em xin chân thành cảm ơn Phó giáo sư – Tiến sĩ Võ Thị Lưu Phương tận tình giúp đỡ, hướng dẫn để em hồn thành đề tài Tổng quan vấn đề nghiên cứu: Trong đề tài hướng đến đề xuất Hệ thống hỗ trợ định (DSS) sử dụng công nghệ thông tin để hỗ trợ việc định nhà quản lý DSS cá nhân thông minh tự động dự đốn kết gọi điện thoại để tiếp thị sản phẩm ngân hàng cách sử dụng cách tiếp cận tới khai phá liệu (DM) DSS có giá trị để hỗ trợ nhà quản lý việc ưu tiên lựa chọn khách hàng liên hệ đợt tiếp thị ngân hàng [1] Ví dụ: cách sử dụng mơ hình hồi quy logistic để phân tích xác suất thành công việc tiếp thị qua điện thoại để người quản lý định cần liên hệ với khách hàng khách hàng Do đó, thời gian chi phí số đợt bị giảm Ngoài ra, cách thực gọi điện thoại hiệu Để thực mục đích ý tưởng đề cho việc đóng góp cơng việc là: Tập trung vào tính kỹ thuật, khía cạnh quan trọng DM đề xuất số kinh tế xã hội chung thuộc tính sản phẩm khách hàng sử dụng phổ biến ngân hàng Mơ hình DM cách sử dụng đánh giá phân loại số liệu Đề tài mơ hình tốt mang lại lợi ích cho tiếp thị qua điện thoại ngân hàng việc kinh doanh Mục đích nghiên cứu: Mục đích chính: Nâng cao hiệu tiếp thị qua điện thoại ngân hàng việc kinh doanh việc sử dụng mơ hình hồi quy logistic (LR) định (DT) khai phá liệu Đối tượng phạm vi nghiên cứu: Đối tượng nghiên cứu: Các mơ hình khai phá liệu (DM); Hệ thống hỗ trợ định (DSS) sử dụng công nghệ thông tin; Tập liệu tiếp thị ngân hàng (khách hàng ngân hàng); Công cụ hỗ trợ lập trình Python Anacoda3 số công cụ hỗ trợ khai phá liệu Phạm vi nghiên cứu: Nghiên cứu khai phá liệu dựa mơ hình hồi quy logistic (LR) định (DT) khai phá liệu; Bài toán tiếp thị ngân hàng để dự đoán liệu khách hàng có đăng ký sản phẩm hay không? Giả thuyết nghiên cứu: Xây dựng chương trình dự báo kết thơng qua gọi điện thoại tiếp thị qua điện thoại để tiếp thị khoản tiền gửi dài hạn hiệu Khi nhân viên thực gọi điện thoại đến danh sách khách hàng để tiếp thị sản phẩm khách hàng gọi đến trung tâm liên lạc ngân hàng lý khác, khách hàng yêu cầu đăng ký sản phẩm Do đó, kết nhị phân liên hệ không thành công thành công Câu hỏi nghiên cứu: Trong ngành ngân hàng, tối ưu hóa nhằm mục tiêu cho tiếp thị qua điện thoại vấn đề then chốt, áp lực ngày tăng nhằm tăng lợi nhuận giảm chi phí việc lựa chọn mơ hình mơ hình cho kết tối ưu nhất? Đặt phần trăm tiếp thị ngân hàng thành công, phần trăm không thành công? Phương pháp nghiên cứu: Để hồn thành hệ thống phân tích hoạt động Tiếp thị ngân hàng, em sử dụng ngôn ngữ lập trình Python Anacoda3 để thực mục tiêu cho đề tài Chương 1: CƠ SỞ LÝ LUẬN 1.1 Tổng quan phát tri thức khai phá liệu Khai phá liệu q trình trích xuất khám phá mẫu tập liệu lớn liên quan đến phương pháp điểm giao máy học, thống kê hệ thống sở liệu Khai phá liệu lĩnh vực liên ngành khoa học máy tính thống kê với mục tiêu tổng thể trích xuất thơng tin (bằng phương pháp thông minh) từ tập liệu chuyển đổi thông tin thành cấu trúc dễ hiểu để sử dụng thêm [1] Khai phá liệu bước phân tích q trình "Khám phá kiến thức sở liệu", hay gọi KDD Bên cạnh bước phân tích thơ, bao gồm khía cạnh quản lý sở liệu liệu, xử lý trước liệu, xem xét mơ hình suy luận, số đo mức độ thú vị, cân nhắc độ phức tạp, xử lý sau cấu trúc phát hiện, trực quan hóa cập nhật trực tuyến [1] Khai phá liệu từ sở liệu bao gồm nhiều công đoạn như: xác định vấn đề, tập hợp chọn lọc liệu, khai thác liệu, đánh giá kết quả, giải thích liệu, áp dụng tri thức vào thực tế 1.2 Quá trình phát tri thức khai phá liệu Gom liệu (Gathering): Tập hợp liệu bước trình KPDL Đây bước khai thác CSDL, kho liệu chí liệu từ nguồn ứng dụng Web Trích lọc liệu (Selection): Ở giai đoạn liệu lựa chọn phân chia theo số tiêu chuẩn đó, ví dụ chọn tất người có tuổi đời từ hai mươi lăm đến ba mươi lăm có trình độ đại học Làm sạch, tiền xử lý chuẩn bị trước liệu (Cleansing, Pre-processing and Preparation): Giai đoạn thứ ba giai đoạn hay bị lãng, thực tế bước quan trọng trình KPDL Một số lỗi thường mắc phải gom liệu tính khơng đủ chặt chẽ, logic Vì vậy, liệu thường chứa giá trị vơ nghĩa khơng có khả kết nối liệu Ví dụ: tuổi = sáu trăm bảy mươi ba Giai đoạn tiến hành xử lý dạng liệu khơng chặt chẽ nói Những liệu dạng xem thông tin dư thừa, giá trị Bởi vậy, q trình quan trọng liệu khơng “làm - tiền xử lý - chuẩn bị trước” gây nên kết sai lệch nghiêm trọng Chuyển đổi liệu (Transformation): Tiếp theo giai đoạn chuyển đổi liệu, liệu đưa sử dụng điều khiển việc tổ chức lại Dữ liệu chuyển đổi phù hợp với mục đích khai thác Phát trích mẫu liệu (Pattern Extraction and Discovery): Đây bước mang tính tư KPDL Ở giai đoạn nhiều thuật toán khác sử dụng để trích mẫu từ liệu Thuật tốn thường dùng nguyên tắc phân loại, nguyên tắc kết hợp mơ hình liệu tuần tự, v.v Đánh giá kết mẫu (Evaluation of Result): Đây giai đoạn cuối trình KPDL Ở giai đoạn này, mẫu liệu chiết xuất phần mềm KPDL Không phải mẫu liệu hữu ích, đơi cịn bị sai lệch Vì vậy, cần phải ưu tiên tiêu chuẩn đánh giá để chiết xuất tri thức cần chiết xuất Hình 1.1: Các giai đoạn trình khai phá liệu Trên sáu giai đoạn q trình KPDL, giai đoạn giai đoạn quan tâm nhiều hay gọi KPDL 1.3 Các phương pháp khai phá liệu - Phương pháp nghiên cứu lý luận: Thu thập, đọc hiểu, phân tích thơng tin, liệu từ tài liệu, giáo trình, sách liên quan đến khai phá liệu - Phương pháp nghiên cứu thực tiễn: Tiến hành nghiên cứu kỹ thuật cho phép phân lớp khai phá liệu, ứng dụng kỹ thuật để xây dựng mơ hình dự đoán kết tiếp thị ngân hàng dựa vào thông tin đầu vào Đề tài tiến hành so sánh kết mơ hình để lựa chọn mơ hình cho kết vượt trội Từ đó, xây dựng chương trình dự báo kết thơng qua gọi điện thoại tiếp thị qua điện thoại để tiếp thị khoản tiền gửi dài hạn hiệu Việc xây dựng mơ hình tiến hành theo bước: ▪ Làm tích hợp liệu ▪ Lựa chọn liệu chuyển đổi liệu ▪ Khai thác liệu ▪ Sự trực quan hóa ▪ Biểu diễn đánh giá mơ hình Dữ liệu ghi bao gồm mục tiêu đầu ra, kết liên hệ ({“thất bại”, “thành công”}) tính đầu vào ứng viên Chúng bao gồm thuộc tính tiếp thị qua điện thoại (ví dụ: đường gọi), chi tiết sản phẩm (ví dụ: lãi suất cung cấp) thơng tin khách hàng (ví dụ: tuổi) Các ghi làm giàu với tính ảnh hưởng xã hội kinh tế (ví dụ: tỷ lệ thay đổi thất nghiệp) - Phương pháp nghiên cứu tài liệu: Tìm hiểu ngơn ngữ lập trình, hệ quản trị Cơ sở liệu (CSDL), Xây dựng ứng dụng 1.4 Mơ hình khai phá liệu - Mơ hình Hồi quy Logistic (LR): Mục tiêu hồi qui Logistic nghiên cứu mối tương quan (hay nhiều) yếu tố nguy (risk factor) đối tượng phân tích (outcome) Chẳng hạn nghiên cứu mối tương quan thói quen hút thuốc nguy mắc ung thư phổi yếu tố nguy thói quen hút thuốc đối tượng phân tích nguy mắc ung thư phổi Trong hồi qui logistic đối tượng nghiên cứu thường thể qua biến số nhị phân (binary) xảy ra/ khơng xảy ra; chết/sống; có/khơng,… cịn yếu tố nguy thể qua biến số liên tục (tuổi, huyết áp,…) biến nhị phân (giới tính) hay biến thứ bậc (thu nhập: Cao, trung bình, thấp) Vấn đề đặt cho nghiên cứu dạng để ước tính độ tương quan yếu tố nguy đối tượng phân tích Các phương pháp phân tích hồi qui tuyến tích khơng áp dụng biến phụ thuộc biến liên tục mà biến nhị phân [3] - Mơ hình Cây định (DT): Cây định mơ hình có khả diễn giải cao thực nhiệm vụ phân loại hồi quy Như cho thấy Cây Quyết định mơ hình cấu trúc giống lộn ngược Tại thời điểm này, bạn có câu hỏi có mơ hình họ máy học cổ điển hồi quy tuyến tính hồi quy logistic để thực nhiệm vụ hồi quy phân loại trường hợp cần thiết mơ hình khác Cây định Câu trả lời cho câu hỏi để thực mơ hình tuyến tính cổ điển, cần đảm bảo liệu sử dụng để đào tạo mơ hình khơng có tất bất thường giá trị bị thiếu, giá trị ngoại lệ cần xử lý, đa cộng tuyến cần giải Tồn q trình tiền xử lý liệu cần thực trước Trong Cây định, không cần phải thực loại xử lý trước liệu trước Cây Quyết định đủ mạnh để xử lý tất loại vấn đề để đến định Ngồi ra, Cây định có khả xử lý liệu phi tuyến mà mơ hình tuyến tính cổ điển khơng xử lý Do Cây định đủ đa dạng để thực nhiệm vụ hồi quy phân loại Toàn ưu nhược điểm liên quan đến Cây Quyết định thảo luận chi tiết phần sau viết Trước đó, bắt đầu tìm hiểu Cây định Cây định xây dựng cách đặt loạt câu hỏi vào liệu để đến định Do người ta nói Cây Quyết định bắt chước trình định người Trong q trình xây dựng cây, chia toàn liệu thành tập liệu đưa định Hãy tìm hiểu vài thuật ngữ liên quan đến Quyết định để hiểu rõ Cây định Hình 1.2: Minh họa định 1.5 Kết luận KPDL lĩnh vực quan tâm ứng dụng rộng rãi Một số ứng dụng điển hình KPDL liệt kê: phân tích liệu hỗ trợ định; điều trị y học; phát văn bản; tin sinh học; tài TTCK; bảo hiểm Quá trình nghiên cứu tổng quan khai phá liệu giúp hiểu bước qui trình khai phá liệu, phương pháp, dạng liệu khai phá vấn đề cần giải khai phá liệu 10 Chương 2: PHƯƠNG PHÁP TIẾP CẬN THEO HƯỚNG DỮ LIỆU ĐỂ DỰ ĐỐN SỰ THÀNH CƠNG CỦA TIẾP THỊ QUA ĐIỆN THOẠI NGÂN HÀNG 2.1 Tổng quan sở liệu Tiếp thị ngân hàng Nghiên cứu tập trung vào mục tiêu thông qua gọi điện thoại tiếp thị qua điện thoại để tiếp thị sản phẩm Trong đợt, nhân viên thực gọi điện thoại đến danh sách khách hàng để tiếp thị sản phẩm khách hàng gọi đến trung tâm liên lạc ngân hàng lý khác, khách hàng yêu cầu đăng ký sản phẩm Do đó, kết nhị phân liên hệ không thành công thành cơng [1] 2.2 Phân tích u cầu chức tập liệu - Dữ liệu tiếp thị qua điện thoại ngân hàng (Bank telemarketing data): Nghiên cứu tập trung vào việc thông qua gọi điện thoại tiếp thị qua điện thoại để tiếp thị khoản tiền gửi dài hạn Trong gọi điện thoại đến danh sách khách hàng để tiếp thị tiền ký gửi, khách hàng gọi đến số đường dây nóng ngân hàng miễn phí lý khách yêu cầu đăng ký tiền gửi (inbound) đến ngân hàng, kết nhị phân liên hệ không thành công thành cơng Hình 2.1: Khách hàng có đăng ký tiền gửi hay không đăng ký tiền gửi 55 banktelemarket["job"].value_counts().sort_values(ascending = False).head(20) blue-collar 9732 management 9458 technician 7597 admin 5171 services 4154 retired 2264 self-employed 1579 entrepreneur 1487 unemployed 1303 housemaid 1240 student 938 unknown 288 Name: job, dtype: int64 # Nhận toàn tập hợp biến giả cho tất cột phân loại def one_hot_encode_top(df, col, top_6_labels): for label in top_6_labels: df[col+'_'+label] = np.where(df[col] == label,1,0) banktelemarket_new = pd.read_csv('C:\\input\\bank-full.csv', sep=';', usecols = ['job','month']) 56 57 Tất cột phân loại chuyển đổi thành cột số # Sắp xếp lại cột banktelemarket = banktelemarket[["age", "balance", "day", "campaign" , "duration", "pdays", "previous" , "marital", "education", "default", "housing", "loan", "poutcome", "job_management" , "job_blue-collar", "job_technician", "job_admin.", "job_services", "job_retired", "month_may" , "month_aug", "month_jul", "month_jun" , "month_nov", "month_apr", "y"]] X = banktelemarket.iloc[:, :25] y = banktelemarket.iloc[:, -1] Tách tập liệu thành huấn luyện thử nghiệm X_train, X_test, y_train, y_test = train_test_split(X, y, test_size = 0.2) print("X_train: ", X_train.shape) print("X_test: ", X_test.shape) print("y_train: ", y_train.shape) print("y_test: ", y_test.shape) X_train: (36168, 25) X_test: (9043, 25) y_train: (36168,) y_test: (9043,) clf = DecisionTreeClassifier(random_state=0) clf.fit(X_train, y_train) y_pred_train = clf.predict(X_train) y_pred_test = clf.predict(X_test) acc_train = accuracy_score(y_train, y_pred_train) acc_test = accuracy_score(y_test, y_pred_test) print("Độ xác liệu đạo tạo: ", acc_train) print("Độ xác liệu kiểm tra: ", acc_test) Độ xác liệu đạo tạo: 1.0 Độ xác liệu kiểm tra: 0.8673006745549043 Có thể thấy định plt.figure(figsize = (18, 16)) tree.plot_tree(clf) plt.show() 58 Hình 3.26: Hình dạng định Hoạt động sau cắt tỉa # Sử dụng kỹ thuật cost_complexity_pruning để cắt tỉa nhánh định path=clf.cost_complexity_pruning_path(X_train,y_train) # biến đường dẫn cung cấp ccp_alphas impurities ccp_alphas,impurities=path.ccp_alphas,path.impurities print("Giá trị alpha ccp :",ccp_alphas) print() print("Tạp chất định :",impurities) Giá trị alpha ccp : [0.00000000e+00 1.10502298e-05 1.10508868e-05 2.93801166e-03 9.06406604e-03 2.57927731e-02] Tạp chất định : [0.00000000e+00 5.52511489e-05 1.10505583e-04 1.62249556e-01 1.80377688e-01 2.06170461e-01] 59 Hình 3.27: Độ xác so với alpha cho đào tạo thử nghiệm Nếu đánh đổi độ chệch phương sai cân bằng, chọn điểm có độ chệch thấp (sai số huấn luyện thấp) phương sai thấp (sai số thử nghiệm thấp) Ở lấy điểm giá trị alpha = 0,001 60 3.2.2 Kết mơ hình dự đốn clf=DecisionTreeClassifier(random_state=0,ccp_alpha=0.001) clf.fit(X_train,y_train) plt.figure(figsize=(14,10)) tree.plot_tree(clf,rounded=True,filled=True) plt.show() Hình 3.28: Kết mơ hình định Ở chúng tơi cắt tỉa phát triển vô tận Hãy kiểm tra lại điểm độ xác from sklearn.metrics import roc_curve, auc y_score = clf.predict_proba(X_test)[:, 1] fpr, tpr, thresholds = roc_curve(y_test, y_score) 61 fig = px.area( x=fpr, y=tpr, title=f'ROC Curve (Auc = {auc(fpr, tpr):.4f})', labels=dict(x = 'False Positive Rate', y = 'True Positive Rate'), width = 700, height = 500) fig.add_shape( type = 'line', line = dict(dash='dash'), x0=0, x1=1, y0=0, y1=1) Hình 3.29: Kết mơ hình độ xác định auc = 0,83 có nghĩa có 83% hội để mơ hình chúng tơi phân biệt lớp tích cực lớp tiêu cực 62 Cắt tỉa lại # Sử dụng điều chỉnh siêu tham số from sklearn.model_selection import GridSearchCV #from sklearn.grid_search import GridSearchCV grid_param={"criterion":["gini","entropy"], "splitter":["best","random"], "max_depth":range(5,15,1), "min_samples_leaf":range(5,15,1), "min_samples_split":range(5,15,1) } grid_search=GridSearchCV(estimator=clf,param_grid=grid_param,cv=5,n_jo bs=-1) grid_search.fit(X_train,y_train) GridSearchCV(cv=5, estimator=DecisionTreeClassifier(ccp_alpha=0.001, random_state=0), n_jobs=-1, param_grid={'criterion': ['gini', 'entropy'], 'max_depth': range(5, 15), 'min_samples_leaf': range(5, 15), 'min_samples_split': range(5, 15), 'splitter': ['best', 'random']}) print(grid_search.best_params_) {'criterion': 'entropy', 'max_depth': 11, 'min_samples_leaf': 13, 'min_samples_split': 5, 'splitter': 'random'} clf=DecisionTreeClassifier(criterion = 'gini', max_depth = 4, min_samples_leaf = 1, min_samples_split = 2, splitter = 'best') clf.fit(X_train,y_train) plt.figure(figsize=(20,12)) tree.plot_tree(clf,rounded=True,filled=True) plt.show() 63 Hình 3.30: Kết mơ hình định sau cắt tỉa 64 Hình 3.31: Kết mơ hình độ xác định 82% auc = 0,82 có nghĩa có 82% hội để mơ hình phân biệt lớp tích cực lớp tiêu cực 65 3.3 So sánh mô hình Hồi quy Logistic Cây định (DT) Hồi quy logistic kỹ thuật máy học sử dụng nhiều Ưu điểm kết rõ ràng khả giải thích mối quan hệ đối tượng phụ thuộc địa lý độc lập cách đơn giản Tuy nhiên, có số nhược điểm khả giải vấn đề phi tuyến tính cịn hạn chế Cây định thực nhiệm vụ giống nhau, chia nhỏ liệu thành nút để đạt phân biệt tối đa dương âm, nút định chọn nhiều tính lúc Biết định tốt việc xác định mối quan hệ phi tuyến tính đối tượng phụ thuộc độc lập, chuyển đổi đầu định (các nút) thành biến phân loại sau triển khai hồi quy logistic, cách chuyển đổi loại (các nút) thành biến giả [5] Mơ hình hồi quy logistic định mơ hình trình bày gần tương đồng với Nhưng mơ hình hồi quy logistic tốt chút khơng chênh lệch nhiều so với mơ hình định 66 So sánh Mơ hình Hồi quy Logistic Cây định (DT) Bảng 3.2: So sánh mơ hình Độ xác acc Mơ hình Hồi quy Logistic 0.890523 Cây định (DT) 0.885768 67 III KẾT LUẬN Trong ngành ngân hàng, tối ưu hóa nhằm mục tiêu cho tiếp thị qua điện thoại vấn đề then chốt, áp lực ngày tăng nhằm tăng lợi nhuận giảm chi phí Với ngân hàng có mạnh riêng sản phẩm mang tính truyền thống cho vay huy động tiền gửi ngân hàng có chiến lược sản phẩm riêng thị trường chiến lược marketing cho sản phẩm mang tính truyền thống để có khác biệt nhằm giữ chân khách hàng cũ lơi kéo khách hàng Do đó, hoạt động tiếp thị ngân hàng em xoay quanh sản phẩm tiền gửi khách hàng cũ khách hàng đầy tiềm để tiếp thị Kết thử nghiệm em tập liệu bank-full.csv với 45.211 khách hàng dựa vào thuộc tính có độ tương quan cao cơng việc, tình trạng hôn nhân, nhà khoản vay khách hàng để xây dựng mơ hình hồi quy logistic định dựa 80% liệu đào tạo 20% liệu kiểm tra Kết mô hình dự đốn khách hàng tiềm mơ hình xác đến 89% 88% Đây kết dự đoán khả quan việc tiếp thị sản phẩm tiền gửi ngân hàng Độ xác Mơ hình Hồi quy Logistic 89% Cây Quyết định 88% tức gần 90% khả quan Mơ hình hồi quy logistic định gần tương đồng với Nhưng mơ hình hồi quy logistic tốt chút khơng chênh lệch nhiều so với mơ hình định Việc dùng mơ hình dự đốn tập liệu lớn với kết dự đốn mơ hình giúp cho việc tiếp thị qua điện thoại đỡ thời gian cần dựa vào kết dự đốn khách hàng tiềm để liên lạc qua điện thoại để tiếp thị sản phẩm tiền gửi có hiệu 68 Bên cạnh đó, kết nghiên cứu hồn tồn sử dụng Việt Nam tất trường liệu liệu tiêu chí để ngân hàng dựa vào để liên lạc với khách hàng Hồi quy logistic kỹ thuật máy học sử dụng nhiều Ưu điểm kết rõ ràng khả giải thích mối quan hệ đối tượng phụ thuộc địa lý độc lập cách đơn giản Tuy nhiên, có số nhược điểm khả giải vấn đề phi tuyến tính cịn hạn chế 69 IV DANH MỤC TÀI LIỆU THAM KHẢO Moro, Sérgio, Paulo Cortez, and Paulo Rita A data-driven approach to predict the success of bank telemarketing Decision Support Systems 62 (2014): 22-31 Available:https://www.academia.edu/6412064/A_Data_Driven_Approach_to_P redict_the_Success_of_Bank_Telemarketing http://bis.net.vn/forums/t/484.asp https://ichi.pro/vi/tong-quan-ve-mo-hinh-cay-quyet-dinh-42316283748679 https://www.kaggle.com/nhunguyen1906/logistic-regression-bank-marketing https://www.kaggle.com/madhuribh/bank-marketing-campaign-using-decisiontree https://machinelearningcoban.com/2017/01/27/logisticregression https://rpubs.com/alfandash/lbb-classification-2 https://vncoder.vn/bai-hoc/lay-du-lieu-443

Ngày đăng: 11/07/2023, 17:23

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w