1. Trang chủ
  2. » Luận Văn - Báo Cáo

Xây dựng hệ thống dự đoán nhóm khách hàng tại công ty cho thuê tài chính – Agribanke thương mại (tt)

31 164 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 31
Dung lượng 843,66 KB

Nội dung

Xây dựng hệ thống dự đoán nhóm khách hàng tại công ty cho thuê tài chính – Agribanke thương mại (Luận văn thạc sĩ)Xây dựng hệ thống dự đoán nhóm khách hàng tại công ty cho thuê tài chính – Agribanke thương mại (Luận văn thạc sĩ)Xây dựng hệ thống dự đoán nhóm khách hàng tại công ty cho thuê tài chính – Agribanke thương mại (Luận văn thạc sĩ)Xây dựng hệ thống dự đoán nhóm khách hàng tại công ty cho thuê tài chính – Agribanke thương mại (Luận văn thạc sĩ)Xây dựng hệ thống dự đoán nhóm khách hàng tại công ty cho thuê tài chính – Agribanke thương mại (Luận văn thạc sĩ)Xây dựng hệ thống dự đoán nhóm khách hàng tại công ty cho thuê tài chính – Agribanke thương mại (Luận văn thạc sĩ)Xây dựng hệ thống dự đoán nhóm khách hàng tại công ty cho thuê tài chính – Agribanke thương mại (Luận văn thạc sĩ)

HỌC VIỆN CƠNG NGHỆ BƯU CHÍNH VIỄN THƠNG THÁI QUỐC CƯỜNG XÂY DỰNG HỆ THỐNG DỰ ĐỐN NHĨM KHÁCH HÀNG TẠI CƠNG TY CHO THUÊ TÀI CHÍNH - AGRIBANK Chuyên ngành: Mã số: Hệ thống thơng tin 8480104 TĨM TẮT LUẬN VĂN THẠC SĨ TP HỒ CHÍ MINH - 2018 Luận văn hồn thành tại: HỌC VIỆN CƠNG NGHỆ BƯU CHÍNH VIỄN THÔNG Người hướng dẫn khoa học: TS TÂN HẠNH (Ghi rõ học hàm, học vị) Phản biện 1: TS VÕ THỊ LƯU PHƯƠNG Phản biện 2: TS VŨ NGỌC PHÀN Luận văn bảo vệ trước Hội đồng chấm luận văn thạc sĩ Học viện Công nghệ Bưu Viễn thơng Vào lúc: 9h ngày 14 tháng 07 năm 2018 Có thể tìm hiểu luận văn tại: - Thư viện Học viện Cơng nghệ Bưu Viễn thông MỞ ĐẦU Lý chọn đề tài Hiện Ngân hàng nói chung Ngân hàng nông nghiệp phát triển nông thôn Việt Nam (NHNN&PTNTVN) nói riêng, việc tìm kiếm phát triển nợ khách hàng vấn đề cốt lõi cho việc phát triển doanh nghiệp, bên cạnh việc đánh giá khách hàng để mang lại lợi nhuận kinh tế cao cho doanh nghiệp khơng quan trọng Trước khó khăn đó, việc mong muốn có cơng cụ hỗ trợ đắc lực việc lựa chọn khách hàng, đưa định giải ngân cách đắn cần thiết Do đó, tơi lựa chọn đề tài “Xây dựng hệ thống dự đốn nhóm khách hàng Cơng ty cho thuê tài - Agribank” để làm đề tài luận văn tốt nghiệp thạc sĩ Tổng quan tình hình nghiên cứu đề tài Mục đích nghiên cứu Đối tượng phạm vi nghiên cứu Phương pháp nghiên cứu Cấu trúc luận văn Toàn nội dung luận văn chia thành chương: Chương 1: Tổng quan dự đoán dựa khai phá liệu: Chương trình bày khái niệm khai phá liệu Sau đó, chương trình bày tổng quan thuật toán Naive Bayes sử dụng Naive Bayes khai phá liệu Chương 2: Giải pháp xây dựng hệ thống dự đốn nhóm khách hàng: Chương trình bày tìm hiểu quy trình cho th tài ALC tình hình cho th tài Từ tình hình đưa vấn đề cần giải quyết, việc phân tích xây dựng hệ thống Chương 3: Xây dựng thử nghiệm ứng dụng: Chương cuối trình bày q trình phân tích chức tổ chức tổng thể hệ thống Qua đó, đặc tả việc xây dựng hệ thống thử nghiệm hệ thống Chương TỔNG QUAN DỰ ĐOÁN DỰA TRÊN KHAI PHÁ DỮ LIỆU 1.1 Một số kiến thức kỹ thuật Khai phá liệu 1.1.1 Khái niệm Khai phá liệu (Data mining) trình tìm kiếm mẫu mới, thơng tin tiềm ẩn mang tính dự đốn khối liệu lớn Khai phá liệu lĩnh vực liên ngành, nơi hội tụ nhiều học thuyết công nghệ Hình 1.1: Mối tương quan khai phát liệu với ngành 1.1.2 Các công cụ khai phá liệu Có hai nhóm cơng cụ khai phá liệu: Các cơng cụ mã nguồn mở (open-source tools) nhóm công cụ thương mại - Các công cụ mã nguồn mở (open-source) như: R studio (www.r-project.org), Weka, v v - Các công cụ thương mại: hỗ trợ từ Intelligent Miner (IBM), từ Microsoft data mining tools (MS SQL Server 2000/2005/2008), từ Oracle Data Mining, từ Enterprise Miner (SAS Institute) 1.2 Ứng dụng khai phá liệu lĩnh vực tài chính, ngân hàng Được sử dụng trong: Marketing, quản lý rủi ro, phát gian lận 1.3 Tổng quan Naive Bayes 1.3.1 Giới thiệu chung Đây hướng tiếp cận phân lớp theo mơ hình xác suất Dự đoán xác suất đối tượng thuộc thành viên lớp xét dựa vào định lý Bayes [10] Cho X, C biến (rời rạc, liên tục) Mục tiêu ta dự đốn C từ X Từ mơ hình Bayes [16] ta ước lượng tham số P(X|C), P(C) trực tiếp từ tập huấn luyện Sau đó, ta sử dụng định lý Bayes [10] để tính P(C|X=x) Độc lập điều kiện (conditional independence): X độc lập điều kiện với Y cho Z phân bố xác suất X độc lập với giá trị Y cho giá trị Z Ta thường viết P(X|Y,Z) = P(X|Z) Ví dụ: P(Sấm sét|Mưa,Chớp) = P(Sấm sét|Chớp) Tức Sấm sét liên quan tới Chớp, độc lập với Mưa Naive Bayes Giả sử D tập huấn luyện gồm mẫu biểu diễn dạng X= Ci,D tập mẫu D thuộc lớp Ci = (i = {1, ,m}) Các thuộc tính x1, ,xn độc lập điều kiện đơi với cho lớp C Khi ta cần xác định xác suất P(Ci|X) lớn Theo định lý Bayes: (1.1) Theo tính chất độc lập điều kiện, ta có cơng thức tính (1.2): (1.2) Thuật tốn Bước 1: Huấn luyện Naive Bayes tập liệu huấn luyện Lượng giá P(Ci) P(Xk | Ci) Bước 2: X_new gán vào lớp cho giá trị công thức (1.3) lớn nhất: (1.3) Ở liệu X ta xét giá trị rời rạc Giả sử X= Trong đó, xi nhận giá trị rời rạc Khi đó, lượng giá P(Ci) P(Xk | Ci) theo cơng thức (1.4): (1.4) Để tránh trường hợp giá trị P(Xk |Ci ) = khơng có mẫu liệu huấn luyện thỏa mãn tử số, ta làm trơn cách thêm số mẫu ảo Ta áp dụng công thức làm trơn Laplace (1.5) để thay cho công thức (1.4): (1.5) với m số lớp, r số giá trị rời rạc thuộc tính, n hệ số Laplace Để nhanh trình tính tốn, ta thường cần thêm cơng thức làm trơn (1.5) P(Xk |Ci ) mà không cần thêm vào P(Ci), thuộc tính phân lớp luôn tồn ( tức > 0) Nên công thức làm trơn lúc là: (1.6) 1.3.2 Ví dụ minh họa Giả sử ta có liệu thơng tin nhóm nợ 14 khách hàng ALC Bảng 1.1: Bảng 1.1: Thơng tin nhóm nợ khách hàng ALC Trong đó: • Trường Ngành nghề TT21 có thuộc tính: Hoạt động dịch vụ khác, Xây dựng, vận tải kho bãi • Trường Ngành nghề 337 có thuộc tính: Hoạt động dịch vụ, vận tải đường thủy, vận tải đường sắt đường - đường ống • Trường Loại tài sản có thuộc tính: Dây chuyền sản xuất, vận tải đường sông, vận tải đường thủy, vận tải đường bộ, tài sản khác • Trường Nhóm thành phần kinh tế: Doanh nghiệp • Trường Loại khách hàng có thuộc tính: Nội ngành, ngoại ngành • Trường Quy mơ doanh nghiệp có thuộc tính: Vừa nhỏ, khác • Trường Khách hàng thuộc khu cơng nghiệp, sản xuất có thuộc tính: True (1), false (0) • Trường Loại hình doanh nghiệp có thuộc tính: Doanh nghiệp tư nhân, Cơng ty trách nhiệm hữu hạn, Công ty cổ phần khác, Công ty nhà nước • Trường Nhóm nợ có thuộc tính: Nhóm (N1), Nhóm (N2), Nhóm (N3), Nhóm (N4), Nhóm (N5) Đây trường có tính phân lớp ta cần dự đốn nhóm nợ khách hàng + Ở dòng ta có: Ngành nghề TT21 = Hoạt động dịch vụ khác, Ngành nghề 337 = Hoạt động dịch vụ, Loại tài sản = Dây chuyền sản xuất, Nhóm thành phần kinh tế = Doanh nghiệp , Loại khách hàng = ngoại ngành, Quy mô doanh nghiệp = Vừa nhỏ, Khách hàng thuộc khu cơng nghiệp, sản xuất = False (0), Loại hình doanh nghiệp = Doanh nghiệp tư nhân rơi vào nhóm (N5) + + Tương tự dòng thứ 14 ta có: Ngành nghề TT21 = Vận tải kho bài, Ngành nghề 337 = Vận tải đường sắt - đường đường ống, Loại tài sản = Vận tải đường bộ, Nhóm thành phần kinh tế = Doanh nghiệp , Loại khách hàng = ngoại ngành, Quy mô doanh nghiệp = Vừa nhỏ, Khách hàng thuộc khu công nghiệp, sản xuất = False (0), Loại hình doanh nghiệp = Cơng ty TNHH khác, rơi vào nhóm (N3) Trường hợp thông tin khách hàng sau: Ngành nghề TT21 = Xây dựng, Ngành nghề 337 = Vận tải đường sắt - đường - đường ống, Loại tài sản = Vận tải đường bộ, Nhóm thành phần kinh tế = Doanh nghiệp , Loại khách hàng = ngoại ngành, Quy mô doanh nghiệp = Vừa nhỏ, Khách hàng thuộc khu công nghiệp, sản xuất = False (0), Loại hình doanh nghiệp = Cơng ty trách nhiệm hữu hạn khác, rơi vào nhóm nào? Ta áp dụng thuật tốn Naive Bayes để tính xác suất dự đốn xem thử với thơng tin khách hàng liệu rơi vào nhóm nợ nào, từ lãnh đạo cơng ty rẽ định cho thuê với khách hàng hay khơng? Bước 1: Ta tính xác suất dựa liệu thu thập công thức (1.4): C: thuộc tính phân lớp: NHOM_NO X: gồm thuộc tính xuất tốn đặt (khác thuộc tính phân lớp) Ta có C1 = N1, C2 = N2, C3 = N3, C4 = N4, C5 = N5, X = (Ngành nghề TT21 = Xây dựng, Ngành nghề 337 = Vận tải đường sắt - đường - đường ống, Loại tài sản = Vận tải đường bộ, Nhóm thành phần kinh tế = Doanh nghiệp , Loại khách hàng = ngoại ngành, Quy mô doanh nghiệp = Vừa nhỏ, Khách hàng thuộc khu công nghiệp, sản xuất = False (0), Loại hình doanh nghiệp = Công ty trách nhiệm hữu hạn khác) Ta bắt đầu tính: • P(C1) = P(NHOM_NO = N1) = 4/14 = 0.28571 • P(C2) = P(NHOM_NO = N2) = 3/14 = 0.21429 • P(C3) = P(NHOM_NO = N3) = 2/14 = 0.14286 • P(C4) = P(NHOM_NO = N4) = 1/14 = 0.07143 • P(C5) = P(NHOM_NO = N5) = 4/14 = 0.28571 • P(X|C1) = P(X| NHOM_NO = N1) : o P(Xây dựng | N1) = 1/4 = 0.25 o P(Vận tải đường sắt - đường - đường ống | N1) = 0/4 = o P(Vận tải đường | N1) = 2/4 = 0.5 o P(Doanh nghiệp | N1) = 4/4 = o P(Ngoại ngành | N1) = 2/4 = 0.5 P(Vừa nhỏ | N1) = 2/4 = 0.5 P(0 | N1) = 4/4 = P(Công ty trách nhiệm hữu hạn khác | N1) = 1/4 = 0.25 P(X|C2) = P(NHOM_NO = N2) o P(Xây dựng | N2) = 1/3 = 0.33333 o P(Vận tải đường sắt - đường - đường ống | N2) = 2/3 = 0.66667 o P(Vận tải đường | N2) = 1/3 = 0.33333 o P(Doanh nghiệp | N2) = 3/3 = o P(Ngoại ngành | N2) = 3/3 = o P(Vừa nhỏ | N2) = 2/3 = 0.66667 o P(0 | N2) = 2/3 = 0.66667 o P(Công ty trách nhiệm hữu hạn khác | N2) = 1/3 = 0.33333 P(X|C3) = P(NHOM_NO = N3) : o P(Xây dựng | N3) = 0/2 = o P(Vận tải đường sắt - đường - đường ống | N3) = 1/2 = 0.5 o P(Vận tải đường | N3) = 1/2 = 0.5 o P(Doanh nghiệp | N3) = 2/2 = o P(Ngoại ngành | N3) = 2/2 = o P(Vừa nhỏ | N3) = 2/2 = o P(0 | N3) = 2/2 = o P(Công ty trách nhiệm hữu hạn khác | N3) = 1/2 = 0.5 P(X|C4) = P(NHOM_NO = N4) : o P(Xây dựng | N4) = 0/1 = o P(Vận tải đường sắt - đường - đường ống | N4) = 0/1 = o P(Vận tải đường | N4) = 0/1 = o P(Doanh nghiệp | N4) = 1/1 = o P(Ngoại ngành | N4) = 1/1 = o P(Vừa nhỏ | N4) = 1/1 = o P(0 | N4) = 1/1 = o P(Công ty trách nhiệm hữu hạn khác | N4) = 1/1 = o o o • • • • P(X|C5) = P(NHOM_NO = N5) o P(Xây dựng | N5) = 1/4 = 0.25 o P(Vận tải đường sắt - đường - đường ống | N5) = 0/4 = o P(Vận tải đường | N5) = 0/4 = o P(Doanh nghiệp | N5) = 4/4 = o P(Ngoại ngành | N5) = 4/4 = o P(Vừa nhỏ | N5) = 4/4 = o P(0 | N5) = 3/4 = 0.75 o P(Công ty trách nhiệm hữu hạn khác | N5) = 2/4 = 0.5 Bước 2: Ta chọn X_new giá trị xác suất lớn sau nhân P(C)*P(X|C), áp dụng cơng thức (1.3) ta có: • P(C1)*P(X|C1) = 0.28571* (0.25 * * 0.5 * * 0.5 * 0.5 * * 0.25) = • P(C2) * P(X|C2) = 0.21429* (0.33333* 0.66667* 0.33333 * * * 0.66667 * 0.66667 * 0.33333) = 0.00235157 • P(C3)*P(X|C3) = 0.14286* (0 * 0.5 * 0.5 * * * * * 0.5) = • P(C4)*P(X|C4) = 0.07143* (0 * * * * * * * 1) = • P(C5)*P(X|C5) = 0.28571* (0.25 * * * * * * 0.75 * 0.5) = Ở ta dễ dàng thấy P(C2)*P(X|C2) lớn Vậy X_new thuộc trường hợp C2 (NHOM_NO = N2) Vậy với thơng tin khách hàng X rơi vào nhóm Tuy nhiên, kết lại rơi vào trường hợp tích thừa số = có thừa số = Như kết khơng mang lại độ xác cao, thừa số lại khác Để giải hạn chế này, ta khắc phục cách áp dụng công thức làm trơn Laplace (1.6), lúc ln ln đảm bảo tích thừa số dương Như so sánh kết mang lại độ xác cao Sau dùng cơng thức làm trơn Laplace (1.6) vào Bảng 1.1, với hệ số Laplace = 1, ta có: 15 Chương XÂY DỰNG VÀ THỬ NGHIỆM ỨNG DỤNG 3.1 Xây dựng ứng dụng Chúng ta có sơ đồ quy trình đánh giá khách hàng cho thuê Hình 3.1: Hình 3.1: Quy trình đánh giá khách hàng cho thuê Từ quy trình Hình 3.1, nói việc phân tích, đánh giá khách hàng chiếm vai trò quan trọng quy trình Nó ảnh hưởng trực tiếp đến lợi ích, nguồn vốn, khả thu hồi vốn công ty Tuy nhiên, công việc tốn nhiều thời gian cơng ty, đơi khơng mang lại hiệu mong muốn Việc đánh giá nhân viên làm mà đòi hỏi nhân viên phải có tầm nhìn, kinh nghiệm lĩnh vực chun mơn để đưa đánh giá cách hiệu quả, xác Chính vậy, hệ thống dự đốn nhóm nợ khách hàng giúp cho việc đánh giá cách xác, nhanh chóng Hệ thống phải có chức giải vấn đề 16 3.1.1 Chức hệ thống Hệ thống xây dựng phải đáp ứng chức sau : 3.1.1.1 Lấy liệu khách hàng từ hệ thống Oracle ERP công ty 3.1.1.2 Xây dựng thuật tốn Naive Bayes dự đốn nhóm nợ khách hàng 3.1.1.3 Lưu trữ tiến trình giải ngân khách hàng 3.1.2 Kiến trúc tổng thể hệ thống Từ chức vừa phân tích trên, tơi tổ chức kiến trúc tổng thể hệ thống sau: Hình 3.2: Kiến trúc tổng thể hệ thống 3.1.3 Đặc tả chi tiết thành phần 3.1.3.1 Dữ liệu đầu vào (Input) • Tập liệu huấn luyện lấy trực tiếp từ hệ thống ERP Oracle, sau lưu dạng file Excel Gồm thông tin khách hàng ALC Bảng 3.1 bên • Tập file excel gồm danh sách khách hàng cần dự đoán File phải lấy làm theo mẫu có sẵn (Hình 3.3) 17 Bảng 3.1: Bảng liệu huấn luyện STT Thông tin Ngành nghề Thông tư 21 Ngành nghề theo Quy Định 337 Loại tài sản thuê Nhóm thành phân kinh tế Loại khách hàng Quy mơ doanh nghiệp Khách hàng thuộc khu công nghiệp, chế xuất Loại hình doanh nghiệp Chú thích Bn bán, cơng nghiệp chế tạo, khai khống, nơng nghiệp, xây dựng, vận tải kho bãi Hoạt động chuyên môn khoa học công nghê, bán lẻ, hoạt động sản xuất, hoạt động tài Dây chuyển sản xuất, máy móc thiết bị, vận tải đường sông, biển, Doanh nghiệp, hợp tác xã, hộ sản xuất kinh doanh, đối tượng khác Nội ngành, ngoại ngành Vừa nhỏ, khác True , False (1,0) Công ty nhà nước, công ty cổ phần, doanh nghiệp tư nhân, hợp tác xã, loại hình khác Bảng liệu sàn lọc loại bỏ thuộc tính khơng cần thiết khơng ảnh hưởng tới q trình phân tích đánh giá thuật toán Naive Bayes như: Họ tên, mã số thuế (doanh nghiệp), số CMND (cá nhân), ngày tháng năm sinh, vốn đăng ký kinh doanh doanh nghiệp, nơi ở, nơi đăng ký kinh doanh Dữ liệu huấn luyện thu thập từ 2000 khách hàng thuê cơng ty cho th tài Agribank khu vực thành phố Hồ Chí Minh 18 Hình 3.3: Mẫu danh sách khách hàng cần dự đoán 3.1.3.2 Dữ liệu đầu (Output) Dữ liệu đầu kết dự đốn nhóm nợ khách hàng Gồm: • Chi tiết kết tính xác suất dựa tập liệu huấn luyện • Nhóm nợ dự đốn khách hàng rơi vào: 1, 2, 3, 4, 3.2 Thử nghiệm ứng dụng 3.2.1 Thử nghiệm 3.2.1.1 Dữ liệu thử nghiệm Ta lấy liệu đăng ký chơi Golf để thử nghiệm hệ thống (Bảng 3.2) Bảng 3.2: Dữ liệu thử nghiệm outlook sunny sunny overcast rainy rainy rainy overcast sunny sunny rainy sunny overcast overcast rainy temperature hot hot hot mild cool cool cool mild cool mild mild mild hot mild humidity high high high high normal normal normal high normal normal normal high normal high wind weak strong weak weak weak strong strong weak weak weak strong strong weak strong play no no yes yes yes no yes no yes yes yes yes yes no 19 3.2.1.2 Kết thử nghiệm ứng dụng R Studio Hình 3.4: Kết huấn luyện Naive Bayes R Studio thử nghiệm chưa áp dụng hệ số Laplace Để hạn chế trường hợp có xác suất gây ảnh hưởng tới kết nhân tích xác suất tính P(outlook = overcast, PLAY = NO) = Ta áp dụng công thức Lapalce (1.6) cho R studio , cách gọi lệnh Hình 3.5 20 Hình 3.5: Kết thử nghiệm R với hệ số Laplace = 3.2.1.3 Kết thử nghiệm hệ thống Sau nạp liệu huấn luyện (Hình 3.6), ta có kết Hình 3.7: 21 Hình 3.6: Màn hình liệu thử nghiệm khơng có hệ số Laplace 22 Hình 3.7: Kết thử nghiệm khơng có hệ số Laplace Dựa vào kết Hình 3.7, ta biết xác suất thuộc tính sau huấn luyện qua thuật tốn Naive Bayes: Thuộc tính phân lớp P(Play=YES) = 0.6428571 Thuộc tính phân lớp P(Play=NO) = 0.3571429 • Thuộc tính Humidity, lớp high, phân lớp Play = No có xác suất 0.8, số lần xuất liệu huấn luyện • Thuộc tính Humidity, lớp high, phân lớp Play = Yes có xác suất 0.3333333, số lần xuất liệu huấn luyện • Kết huấn luyện trùng khớp với phần mềm R Studio (Hình 3.4) Tiếp theo ta tiến hành dự đoán hệ thống Ta xét trường hợp điều kiện thời tiết là: X = (outlook = overcast, temperature = cool, humidity = high, wind = strong) Lúc hệ thống sử dụng liệu huấn luyện để tính tích xác suất, kết xem Hình 3.8 Hình 3.9: ✓ P(C1=YES)*P(X|C1) = 0.6428571 * (0.4444444 * 0.3333333 * 0.3333333 * 0.3333333) = 0.0105820 23 Hình 3.8: Kết xác suất thử nghiệm phân lớp PLAY= YES ✓ P(C2=NO) * P(X|C2) = 0.3571429 * (0 * 0.2 * 0.8 * 0.6) = Hình 3.9: Kết xác suất thử nghiệm phân lớp PLAY= NO So sánh kết tính Hệ thống cho kết dự đốn có xác suất cao Play = YES Để giải trường hợp có xác suất = Ta áp dụng công thức Laplace (1.6) vào hệ thống (Hình 3.10) Lúc hệ thống cho kết thử nghiệm Hình 3.11 24 Hình 3.10: Màn hình liệu thử nghiệm với hệ số Laplace = 25 Hình 3.11: Kết thử nghiệm với hệ số Laplace = Kết trùng khớp với Hình 3.5 ứng dụng R studio Tiếp theo ta tính X = (outlook = overcast, temperature = cool, humidity = high, wind = strong), kết Hình 3.12 Hình 3.13: ✓ P(C1=YES)*P(X|C1) = 0.6428571 * (0.4166667 * 0.3333333 * 0.3636364 * 0.3636364) = 0.0118064 Hình 3.12: Kết thử nghiệm với hệ số Laplace =1 phân lớp PLAY=YES ✓ P(C2=NO) * P(X|C2) = 0.3571429 * (0.125 * 0.25 * 0.7142857 * 0.5714286) = 0.0045554 26 Hình 3.13: Kết thử nghiệm với hệ số Laplace =1 phân lớp PLAY=NO So sánh kết tính Hệ thống cho kết dự đốn có xác suất cao Play = YES Vậy với điều kiện thời tiết X có người đăng ký chơi GOLF 3.2.2 Thử nghiệm 3.2.3 Thử nghiệm 3.3 Nhận xét đánh giá kết Với liệu thử nghiệm mô trên, hệ thống cho kết thuộc tính phân lớp đơn giản, dễ hiểu xác Trùng khớp với kết phần mềm thứ ba R studio Tốc độ xử lý hệ thống tương đối nhanh, tiết kiệm thời gian áp dụng xử lý cho khối liệu lớn Hệ thống cơng cụ phân tích hữu ích, giúp cho ALC tăng cường lực cạnh tranh với đối thủ thị trường thông qua việc giảm thiểu tối đa rủi ro nguồn vốn cho cho thuê công ty 3.4 Tổng kết chương Trong chương cuối này, luận văn trình bày cách thức tổ chức, xây dựng thử nghiệm ứng dụng Đồng thời phân tích giải toán đánh giá khách hàng dựa số liệu cụ thể từ Công ty cho thuê tài Agribank Qua thấy khả ứng dụng giải pháp toàn hệ thống ngân hàng cần thiết Hệ thống giúp cho người sử dụng dễ dàng đánh giá khách hàng, sở hỗ trợ nhân viên kinh doanh đưa định hợp lý nhằm nâng cao lợi nhuận ALC 27 KẾT LUẬN Kết đạt 1.1 Về mặt lý thuyết Tìm hiểu kiến thức khai phá liệu, cụ thể thuật toán phân lớp Luận văn tìm hiểu quy trình đánh giá khách hàng việc cho thuê tài Nắm vững phương pháp Naive Bayes, áp dụng để giải toán dự đoán khả xảy lĩnh vực khác nói chung ngành cho th tài nói riêng 1.2 Về mặt thực tiễn Xây dựng ứng dụng phân tích liệu khách hàng ALC, đáp ứng nhu cầu tương lai ALC Giúp giảm thiểu đáng kể thời gian đánh giá xếp loại khách hàng hoạt động cho thuê tài Hệ thống giúp cho kết cách khoa học, tránh tình đánh giá theo cảm tính, hạn chế trường hợp rủi ro tăng cường lợi nhuận ngân hàng Hạn chế Giao diện tương tác với người sử dụng chưa sinh động Yêu cầu liệu phải có thuộc tính độc lập với Phải lọc bớt trường thuộc tính thừa tập liệu huấn luyện dự đốn để thuật tốn có kết xác Hướng phát triển Có thể đồng nhiều chức với hệ thống Oracle ERP như: Thông tin giải ngân, thông tin tài sản, thông tin nhà cung ứng tài sản, giá trị hợp đồng, phụ lục hợp đồng kỳ trả gốc lãi v v Tích hợp báo cáo ngày, tháng, quý, niên, hàng năm gửi tới NHNN, NHNN&PTNTVN trực tiếp qua hệ thống Hoàn thiện thêm số chức để triển khai quan cơng ty cho th tài khác Cần tiếp tục nghiên cứu thêm thuật toán khai phá liệu nâng cao DANH MỤC CÁC TÀI LIỆU THAM KHẢO [1] Đỗ Phúc (2005), Giáo trình khai phá liệu, Trung tâm nghiên cứu phát triển công nghệ thơng tin, Đại học Quốc gia Tp Hồ Chí Minh [2] Ngân hàng nông nghiệp phát triển nông thôn Việt Nam (2000), Quy trình cho th tài chính, Lưu hành nội [3] Lê Văn Dực (2006), Hệ hỗ trợ định, Đại học Quốc gia Tp Hồ Chí Minh [4] Nguyễn Thống, Cao Hào Thi (1998), Phương pháp định lượng quản lý, NXB Thống Kê [5] Jiawei Han, Micheline Kamber, Jian Pei (2011), Data Mining - Concepts and Techniques, 3rd Ed, Morgan Kaufmann [6] Efraim Turban (2001), Decision Support Systems and Intelligent Systems, Prentice Hall [7] Ole Chirstoffer Granmo, Vladimira A Oleshchuk (2007), Privacy Preserving Data Mining in teleconmunication Services, Department of Computer Science, Agder University, Norway [8] P Gray, H J Watson (1998), Decision Support in Data Warehouse, Prentice Hall [9] https://www.codeproject.com/Articles/318126/NaiveBayes-Classifier, truy cập ngày 29/03/2018 [10] http://bis.net.vn/forums/t/390.aspx, truy cập ngày 29/03/2018 [11] http://www.tapchitaichinh.vn/Nghien-cuu-dieu-tra/Buctranh-thi-phan-ngan-hang-Viet-Nam/51534.tctc, truy cập ngày 29/03/2018 [12] https://vi.wikipedia.org/wiki/%C4%90%E1%BB%8Bnh_ l%C3%BD_Bayes, truy cập ngày 29/03/2018 [13] https://gialuan1991.wordpress.com/2016/04/15/2-naivebayes/, truy cập ngày 29/03/2018 [14] https://stackoverflow.com/questions/10059594/a-simpleexplanation-of-naive-bayes-classification, truy cập ngày 29/03/2018 [15] https://www.sbv.gov.vn, truy cập ngày 29/03/2018 [16] https://ongxuanhong.wordpress.com/2015/08/10/scikitlearn-naive-bayes-classifier/, truy cập ngày 29/03/2018 ... trình cho thuê sử dụng công ty, từ liệu thu thập khách hàng phân tích đánh giá khách hàng dựa liệu thu thập Việc xây dựng hệ thống dựa tập liệu thu thập Chương trình bày rõ việc xây dựng hệ thống. .. Chương GIẢI PHÁP XÂY DỰNG HỆ THỐNG DỰ ĐỐN NHĨM KHÁCH HÀNG 2.1 Quy trình cho thuê 2.1.1 Khái niệm cho thuê tài Cho thuê tài hoạt động tín dụng trung dài hạn thơng qua việc cho thuê máy móc thiết... pháp xây dựng hệ thống dự đốn nhóm khách hàng: Chương trình bày tìm hiểu quy trình cho th tài ALC tình hình cho th tài Từ tình hình đưa vấn đề cần giải quyết, việc phân tích xây dựng hệ thống

Ngày đăng: 24/08/2018, 16:21

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w