1. Trang chủ
  2. » Luận Văn - Báo Cáo

Ứng dụng khai phá dữ liệu đánh giá tiềm năng phát triển các sản phẩm dịch vụ tại chi nhánh bidv cao bằng,

75 2 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Ứng Dụng Khai Phá Dữ Liệu Đánh Giá Tiềm Năng Phát Triển Các Sản Phẩm Dịch Vụ Tại Chi Nhánh BIDV Cao Bằng
Tác giả Phan Thị Hồng Ngọc
Người hướng dẫn ThS. Nguyễn Thanh Thụy
Trường học Học viện Ngân hàng
Chuyên ngành Hệ thống thông tin quản lý
Thể loại khóa luận tốt nghiệp
Năm xuất bản 2014
Thành phố Hà Nội
Định dạng
Số trang 75
Dung lượng 1,38 MB

Nội dung

HỌC VIỆN NGÂN HÀNG KHOA HỆ THỐNG THÔNG TIN QUẢN LÝ KHOÁ LUẬN TỐT NGHIỆP ĐẠI HỌC Đề tài: “Ứng dụng khai phá liệu đánh giá tiềm phát triển sản phẩm dịch vụ Chi nhánh BIDV Cao Bằng” Giảng viên hƣớng dẫn : Sinh viên thực hiện: Lớp : Khoá : Hệ : ThS Nguyễn Thanh Thụy Phan Thị Hồng Ngọc HTTTB 13 (2010-2014) Chính quy Hà Nội, tháng 6/2014 Khóa luận tơt nghiệp Ứng dụng KPDL đánh giá tiềm phát triển sản phẩm dịch vụ CN BIDV Cao Bằng HỌC VIỆN NGÂN HÀNG CỘNG HOÀ XÃ HỘI CHỦ NGHĨA VIỆT NAM KHOA HỆ THỐNG THÔNG TIN QUẢN LÝ Độc lập - Tự – Hạnh phúc TĨM TẮT ĐỀ TÀI KHỐ LUẬN TỐT NGHIỆP ĐẠI HỌC Họ tên sinh viên: Phan Thị Hồng Ngọc Lớp: HTTTB Khoá: 13 (2010-2014) Ngành đào tạo: Hệ thống thông tin quản lý Hệ đào tạo: Chính quy 1/ Tên khố luận tốt nghiệp: “Ứng dụng khai phá liệu đánh giá tiềm phát triển sản phẩm dịch vụ Chi nhánh BIDV Cao Bằng” 2/ Nội dung khố luận: Chƣơng 1: Tổng quan chung Chƣơng trình bày vấn đề tổng quan sản phẩm dịch vụ ngân hàng, yêu cầu việc khai phá CSDL khách hàng Nội dung thứ hai nghiên cứu công nghệ kỹ thuật công cụ nhằm phục vụ yêu cầu Chƣơng 2: Kỹ thuật khai phá liệu định Chƣơng nghiên cứu định, thuật toán xây dựng định việc chuyển đổi định thành luật để biết cách thức đƣa quy luật xử lý liệu chƣơng trình Chƣơng 3: Ứng dụng định vào khai phá liệu khách hàng ngân hàng Chƣơng phát biểu toán, xây dựng đƣợc chƣơng trình cài đặt thử nghiệm ứng dựng định vào KPDL khách hàng cá nhân dựa liệu giả định, rút đƣợc số tri thức 3/ Ngày nộp khoá luận : 23/05/2014 GIÁO VIÊN HƢỚNG DẪN (Ký, ghi rõ họ tên) CHỦ NHIỆM KHOA (Ký, ghi rõ họ tên) Ths Nguyễn Thanh Thụy Ths Phan Thanh Đức Phan Thị Hồng Ngọc – Lớp HTTTB/K13 Khóa luận tơt nghiệp Ứng dụng KPDL đánh giá tiềm phát triển sản phẩm dịch vụ CN BIDV Cao Bằng LỜI CẢM ƠN Trƣớc tiên em xin đƣợc bày tỏ trân trọng lòng biết ơn thấy giáo Ths Nguyễn Thanh Thụy suốt thời gian hồn thành khóa luận tốt nghiệp, thầy dành nhiều thời gian quý báu để tận tình bảo, hƣớng dẫn, định hƣớng cho em việc nghiên cứu, thực Em xin gửi lời cảm ơn chân thành tới thầy cô trƣờng Học viện Ngân hàng nói chung, thầy khoa Hệ thống thông tin quản lý - Học viện Ngân hàng nói riêng tận tình truyền đạt kiến thức cho em suốt bốn năm học vừa qua Kiến thức khơng phục vụ cho việc thực tập viết khóa luận em mà cịn hành trang để em bƣớc vào sống Em xin chân thành cảm ơn quý ngân hàng BIDV chi nhánh Cao Bằng nhiệt tình giúp đỡ em trình thực tập, thu thập hồ sơ tài liệu phục vụ cho việc nghiên cứu đề tài chuyên đề Cuối em xin cảm ơn bạn bè, đồng nghiệp đặc biệt ông bà, ba mẹ tạo điều kiện tốt nhất, động viên, cổ vũ suốt q trình học làm khóa luận tốt nghiệp Hà Nội, tháng năm 2014 Sinh viên thực luận văn Phan Thị Hồng Ngọc Lớp HTTTB-K13 Phan Thị Hồng Ngọc – Lớp HTTTB/K13 Khóa luận tơt nghiệp Ứng dụng KPDL đánh giá tiềm phát triển sản phẩm dịch vụ CN BIDV Cao Bằng NHẬN XÉT CỦA GIẢNG VIÊN HƢỚNG DẪN ………………………………………………………………………………………… ………………………………………………………………………………………… ………………………………………………………………………………………… ………………………………………………………………………………………… ………………………………………………………………………………………… ………………………………………………………………………………………… ………………………………………………………………………………………… ………………………………………………………………………………………… ………………………………………………………………………………………… ………………………………………………………………………………………… ………………………………………………………………………………………… ………………………………………………………………………………………… ………………………………………………………………………………………… ………………………………………………………………………………………… ………………………………………………………………………………………… ………………………………………………………………………………………… ………………………………………………………………………………………… ………………………………………………………………………………………… ………………………………………………………………………………………… ………………………………………………………………………………………… ………………………………………………………………………………………… ………………………………………………………………………………………… ………………………………………………………………………………………… ………………………………………………………………………………………… ………………………………………………………………………………………… ………………………………………………………………………………………… ………………………………………………………………………………………… ………………………………………………………………………………………… ………………………………………………………………………………………… ………………………………………………………………………………………… Phan Thị Hồng Ngọc – Lớp HTTTB/K13 Khóa luận tơt nghiệp Ứng dụng KPDL đánh giá tiềm phát triển sản phẩm dịch vụ CN BIDV Cao Bằng Mục lục CHƢƠNG TỔNG QUAN CHUNG .1 1.1 Tổng quan BIDV chi nhánh Cao Bằng sản phẩm dịch vụ .1 1.1.1 Giới thiệu Cao BIDV chi nhánh Bằng 1.1.2 Mơ hình tổ chức BIDV chi nhánh Cao Bằng 1.1.3 Các sản phẩm dịch vụ dành cho khách hàng cá nhân 1.2 Tổng quan khai phá liệu .5 1.2.1 Tại phải khai phá liệu? 1.2.2 Khai phá liệu gì? 1.2.3 Quy trình khai phá tri thức 1.2.4 Hướng tiếp cận kỹ thuật khai phá liệu .7 1.2.5 Ứng dụng khai phá liệu .11 1.2.6 Các phần mềm hỗ trợ khai phá liệu 11 CHƢƠNG KỸ THUẬT KHAI PHÁ DỮ LIỆU BẰNG CÂY QUYẾT ĐỊNH 13 2.1 Tổng quan định .13 2.1.1 Định nghĩa .13 2.1.2 Xây dựng định 14 2.1.3 Ứng dụng định khai phá liệu 15 2.1.4 Đánh giá định 15 2.2 Một số thuật toán xây dựng định 16 2.2.1 Thuật toán ID3 .16 2.2.2 Thuật toán C4.5 .25 2.2.3 Thuật toán Sprint 34 2.2.4 Đánh giá kết luận thuật toán xây dựng định 37 CHƢƠNG ỨNG DỤNG CÂY QUYẾT ĐỊNH VÀO KHAI PHÁ DỮ LIỆU KHÁCH HÀNG CỦA NGÂN HÀNG .39 3.1 Mơ tả tốn .39 3.2 Quy trình thực 39 3.2.1 Thu thập sở liệu 39 3.2.2 Tiền xử lý liệu 40 3.2.3 Khai phá liệu định sử dụng thuật toán C4.5 42 3.3 Ứng dụng liệu cho sản phẩm dịch vụ thẻ .43 Phan Thị Hồng Ngọc – Lớp HTTTB/K13 Khóa luận tơt nghiệp Ứng dụng KPDL đánh giá tiềm phát triển sản phẩm dịch vụ CN BIDV Cao Bằng 3.3.1 Vay tiêu dùng 43 3.3.2 Thẻ visa Flexi 47 3.3.3 Dịch vụ toán qua thẻ ATM 51 3.3.4 Kết luận chung .54 KẾT LUẬN 56 TÀI LIỆU THAM KHẢO .58 PHỤ LỤC 59 Phan Thị Hồng Ngọc – Lớp HTTTB/K13 Khóa luận tơt nghiệp Ứng dụng KPDL đánh giá tiềm phát triển sản phẩm dịch vụ CN BIDV Cao Bằng DANH MỤC BẢNG, HÌNH, HỘP DANH MỤC CÁC BẢNG Bảng 1.1 Các loại sản phẩm dịch vụ ngân hàng BIDV dành cho khách hàng cá nhân [2] Bảng 2.1 So sánh thuật toán xây dựng định 38 DANH MỤC CÁC HỘP Hộp 2.1 Giải thuật ID3 xây dựng định 18 Hộp 2.2 Giải thuật C4.5 xây dựng định 27 Hộp 2.3 Giải thuật Sprint xây dựng định 35 DANH MỤC CÁC HÌNH Hình 1.1 Q trình phân lớp liệu – Bước xây dựng mơ hình Hình 1.2 Quá trình phân lớp liệu – Ước lượng độ xác mơ hình 10 Hình 1.3 Q trình phân lớp liệu – phân lớp liệu 10 Hình 3.1 Cây định cho sản phẩm dịch vụ vay tiêu dùng 44 Hình 3.2 Cây định cho sản phẩm dịch vụ thẻ Flexi 47 Hình 3.3 Cây định cho sản phẩm dịch vụ toán qua thẻ ATM 51 Phan Thị Hồng Ngọc – Lớp HTTTB/K13 Khóa luận tơt nghiệp Ứng dụng KPDL đánh giá tiềm phát triển sản phẩm dịch vụ CN BIDV Cao Bằng KÝ HIỆU CÁC CỤM TỪ VIẾT TẮT Ký hiệu KPDL CSDL KH KPTT BIDV Cao Bằng KDD Phan Thị Hồng Ngọc – Lớp HTTTB/K13 Nội dung Khai phá liệu Cơ sở liệu Khách hàng Khai phá tri thức Ngân hàng Đầu tƣ phá triển Việt Nam chi nhánh Cao Bằng Khai phá liệu sở liệu Khóa luận tơt nghiệp Ứng dụng KPDL đánh giá tiềm phát triển sản phẩm dịch vụ CN BIDV Cao Bằng MỞ ĐẦU Lý chọn đề tài: Hơn thập niên trở lại đây, lƣợng thông tin đƣợc lƣu trữ thiết bị điện tử không ngừng tăng lên Các công nghệ lƣu trữ phục hồi liệu phát triển cách nhanh chóng CSDL doanh nghiệp, quan, đơn vị ngày nhiều thông tin tiềm ẩn phong phú đa dạng Lƣợng liệu khổng lồ thực nguồn “tài nguyên” giá trị thông tin yếu tố then chốt hoạt động kinh doanh giúp ngƣời điều hành quản lý có nhìn sâu sắc, xác, khách quan vào tiến trình kinh doanh trƣớc định KPDL - khai thác thơng tin tiềm ẩn có tính dự đoán từ CSDL lớn - hƣớng tiếp cận với khả giúp công ty trọng vào thơng tin có nhiều ý nghĩa từ tập hợp liệu lớn (database, data warehouse, data repositories) mang tính lịch sử Những cơng cụ KPDL dự đoán xu hƣớng tƣơng lai cho phép doanh nghiệp định kịp thời đƣợc định hƣớng tri thức mà KPDL đem lại Sự phân tích liệu cách tự động mang tính dự báo KPDL có tính ƣu hẳn so với phân tích thơng thƣờng dự kiện khứ hệ hỗ trợ định (decision support systems - DSSs) truyền thống trƣớc Công cụ KPDL trả lời câu hỏi lĩnh vực kinh doanh mà trƣớc đƣợc xem tốn nhiều thời gian để xử lý Với tất ƣu nhƣ trên, KPDL ngày chứng tỏ đƣợc tính hữu dụng mơi trƣờng kinh doanh đầy tính cạnh tranh ngày Ngày nay, ngân hàng lĩnh vực có lƣợng thơng tin lƣu trữ khổng lồ chứa đựng nhiều thông tin tiềm ẩn quý giá KH nhƣ giao dịch KH tình hình tài ngân hàng Cùng với việc cạnh tranh gay gắt ngân hàng việc ứng dụng kỹ thuật KPDL (Data Mining) để phát quy luật ẩn chứa khối liệu khổng lồ, giúp đƣa định đắn mang lại cho ngân hàng hội để phát triển có thêm KH tiềm dựa hoạch định xác mang tính lịch sử thực tiễn cao Với tầm quan trọng hoạt động khai phá liệu khách hàng qua thời gian tìm hiểu thực tập ngân hàng BIDV chi nhánh Cao Bằng, em nhận thấy lƣợng thông tin khách hàng chi nhánh lớn nhƣng lại chƣa đƣợc sử dụng cách có hiệu Chính lý em định lựa chọn nghiên cứu “Ứng Phan Thị Hồng Ngọc – Lớp HTTTB/K13 Khóa luận tơt nghiệp Ứng dụng KPDL đánh giá tiềm phát triển sản phẩm dịch vụ CN BIDV Cao Bằng dụng khai phá liệu đánh giá tiềm phát triển sản phẩm dịch vụ Chi nhánh BIDV Cao Bằng” làm đề tài khóa luận tốt nghiệp Khóa luận trình bày vấn đề phát tri thức, khai phá liệu sở liệu Khách hàng nghiên cứu ứng dụng khai phá liệu nhằm hỗ trợ cho việc đƣa quy luật sử dụng sản phẩm dịch vụ ngân hàng Làm sở để hỗ trợ định, định hƣớng phát triển sản phẩm dịch vụ ngân hàng Em hy vọng đề tài góp phần nâng cao hiệu cho việc phát triển sản phẩm dịch vụ ngân hàng BIDV chi nhánh Cao Bằng Phƣơng pháp đối tƣợng nghiên cứu: Khóa luận nghiên cứu việc đánh giá tiềm phát triển sản phẩm dịch vụ ngân hàng BIDV chi nhánh Cao Bằng Khóa luận sử dụng định với thuật tốn C4.5 để nghiên cứu Cấu trúc khóa luận: Chƣơng 1: Tổng quan chung Chƣơng 2: Kỹ thuật khai phá liệu định Chƣơng 3: Ứng dụng định vào khai phá liệu khách hàng ngân hàng Phan Thị Hồng Ngọc – Lớp HTTTB/K13 Khóa luận tơt nghiệp Ứng dụng KPDL đánh giá tiềm phát triển sản phẩm dịch vụ CN BIDV Cao Bằng 3.3.3 Dịch vụ toán qua thẻ ATM Dịch vụ toán qua thẻ ATM loại dịch vụ với điều kiện sử dụng dễ Với sở liệu nhƣ ta chọn thuộc tính “Dịch vụ tốn qua thẻ ATM” thuộc tính cần phân lớp Kết cho ta định: Hình 3.3 Cây định cho sản phẩm dịch vụ toán qua thẻ ATM Rút luật: Kết đƣa định từ liệu thu thập đƣợc Có thống kê tỉ lệ phân lớp đúng/sai, kèm số thông tin độ đo lỗi phổ biển Trƣờng hợp phân lớp 550 chiếm 91.67%, Trƣờng hợp phân lớp sai 50 chiếm 8.33% R1: Nếu “Thu nhập = Thấp” “DV tốn qua thẻ ATM = Khơng” R2: Nếu “Thu nhập = Trung Bình” “Thẻ ghi nợ = Có” “DV tốn qua thẻ = Có” R3: Nếu “Thu nhập = Trung Bình” “Thẻ ghi nợ = Không” “Thẻ Flexi = Khơng” “DV tốn qua thẻ ATM = Khơng” R4: Nếu “Thu nhập = Trung Bình” “Thẻ ghi nợ = Khơng” “Thẻ Flexi = Có” “DV tốn qua thẻ ATM = Có” Phan Thị Hồng Ngọc – Lớp HTTTB/K13 Page 51 Khóa luận tơt nghiệp Ứng dụng KPDL đánh giá tiềm phát triển sản phẩm dịch vụ CN BIDV Cao Bằng R5: Nếu “Thu nhập = Cao” “Thẻ ghi nợ = Có” “DV tốn qua thẻ ATM = Có” R6: Nếu “Thu nhập = Cao” “Thẻ ghi nợ = Khơng” “Thẻ Flexi = Khơng” “DV tốn qua thẻ ATM = Khơng” R7: Nếu “Thu nhập = Cao” “Thẻ ghi nợ = Không” “Thẻ Flexi = Có” “DV tốn qua thẻ ATM = Có” Đọc hiểu luật ý nghĩa rút từ kết sử dụng luật từ liệu trên: R1: Nếu “Thu nhập = Thấp” “DV tốn qua thẻ ATM = Khơng” Nếu KH có thu nhập thấp DV tốn qua thẻ ATM ngân hàng không đƣợc KH lựa chọn sử dụng Theo luật có 197 KH (chiếm 32,83%) khơng sử dụng dịch vụ Hay luật cho ta biết ngân hàng khơng có khả phát triển dịch vụ tốn qua thẻ ATM cho KH có thu nhập thấp R2: Nếu “Thu nhập = Trung Bình” “Thẻ ghi nợ = Có” “DV tốn qua thẻ ATM = Có” Nếu KH có mức thu nhập trung bình sử dụng dịch vụ thẻ ghi nợ ngân hàng dịch vụ tốn qua thẻ ATM đƣợc KH lựa chọn sử dụng Theo luật có 186 KH (chiếm 31%) sử dụng dịch vụ Hay luật cho ta biết KH có thu nhập trung bình nhƣng sử dụng thẻ ghi nợ có xu hƣớng sử dụng dịch vụ toán qua ATM lớn nguồn KH mà ngân hàng cần hƣớng đến R3: Nếu “Thu nhập = Trung Bình” “Thẻ ghi nợ = Khơng” “Thẻ Flexi = Khơng” “DV tốn qua thẻ ATM = Khơng” Nếu KH có mức thu nhập trung bình khơng sử dụng sản phẩm dịch vụ thẻ ngân hàng dịch vụ tốn qua thẻ ATM khơng đƣợc sử dụng Theo luật có 81 KH (chiếm 13,5%) khơng thể sử dụng đƣợc dịch vụ Hay luật cho ta biết ngân hàng triển khai phát triển dịch vụ toán qua thẻ ATM cho KH chƣa sử dụng loại thẻ R4: Nếu “Thu nhập = Trung Bình” “Thẻ ghi nợ = Khơng” “Thẻ Flexi = Có” “DV tốn qua thẻ ATM = Có” Nếu KH có mức thu nhập trung bình sử dụng thẻ visa Flexi - số sản phẩm dịch vụ thẻ ATM ngân hàng dịch vụ tốn qua thẻ ATM đƣợc sử dụng Theo luật có 30 KH (chiếm 5%) sử dụng đƣợc dịch vụ Hay Phan Thị Hồng Ngọc – Lớp HTTTB/K13 Page 52 Khóa luận tơt nghiệp Ứng dụng KPDL đánh giá tiềm phát triển sản phẩm dịch vụ CN BIDV Cao Bằng luật cho ta biết ngân hàng triển khai phát triển dịch vụ toán qua thẻ ATM cho KH sử dụng sản phẩm dịch vụ thẻ ngân hàng R5: Nếu “Thu nhập = Cao” “Thẻ ghi nợ = Có” “DV tốn qua thẻ ATM = Có” Nếu KH có mức thu nhập cao sử dụng thẻ ghi nợ ngân hàng sử dụng dịch vụ tốn qua thẻ ATM Theo luật có 76 KH (chiếm 12,67%) Hay luật cho ta biết khả KH có sử dụng sản phẩm dụng dịch vụ thẻ ghi nợ có mức thu nhập trung bình sử dụng dịch vụ toán qua thẻ ATM ngân hàng R6: Nếu “Thu nhập = Cao” “Thẻ ghi nợ = Khơng” “Thẻ Flexi = Khơng” “DV tốn qua thẻ ATM = Không” Tƣơng tự nhƣ luật R3, theo luật R6 có 12 KH (chiếm 2%) khơng thể sử dụng đƣợc dịch vụ Hay luật cho ta biết ngân hàng triển khai phát triển dịch vụ toán qua thẻ ATM cho KH chƣa sử dụng loại thẻ R7: Nếu “Thu nhập = Cao” “Thẻ ghi nợ = Khơng” “Thẻ Flexi = Có” “DV tốn qua thẻ ATM = Có” Tƣơng tự luật R4, theo luật R7 có 18 KH (chiếm 3%) sử dụng đƣợc dịch vụ Hay luật cho ta biết ngân hàng triển khai phát triển dịch vụ toán qua thẻ ATM cho KH sử dụng sản phẩm dịch vụ thẻ ngân hàng Nhận xét kết luận: - Không giới thiệu dịch vụ toán qua thẻ ATM KH có mức thu nhập thấp - Giới thiệu sản phẩm dịch vụ toán qua thẻ Atm cho KH có mức thu nhập cao sử dụng sản phẩm dịch vụ thẻ ghi nợ ngân hàng - Đối với KH có mức thu nhập cao nhƣng chƣa sử dụng sản phẩm dịch vụ thẻ ghi nợ nhƣng sử dụng sản phẩm thẻ visa Flexi giới thiệu sản phẩm dịch vụ tốn qua thẻ ATM khả nhóm KH sử dụng dịch vụ cao - Những KH có mức thu nhập trung bình sử dụng thẻ ghi nợ KH tiềm cho dịch vụ toán qua thẻ ATM Phan Thị Hồng Ngọc – Lớp HTTTB/K13 Page 53 Khóa luận tơt nghiệp Ứng dụng KPDL đánh giá tiềm phát triển sản phẩm dịch vụ CN BIDV Cao Bằng 3.3.4 Kết luận chung Với CSDL nhỏ với 600 ghi 11 thuộc tính chƣa bao quát đƣợc hết sản phẩm ngân hàng nhƣng phần khai quát đƣợc tri thức đƣợc trích rút nhƣ cho thấy tiềm lớn định  Với thẻ Flexi sản phẩm dịch vụ có tiềm phát triển với tỉ lệ phân lớp định sản phẩm dịch vụ thẻ Flexi 89.83% cho thấy luật rút cho ta tri thức có chất lƣợng cao,với khoảng 30% KH sử dụng sản phẩm thực tế tỷ lệ sử dụng dịch vụ địa bàn thấp (khoảng 15%) ngƣời dân chƣa đƣợc tiếp cận với gói dịch vụ sản phẩm Để phát triển tốt sản phẩm dịch vụ ngày ngân hàng cần xem xét phân loại khách hàng có tài sản chấp hay khơng Từ đƣa đƣợc kết luận khách hàng có mức thu nhập cao 40 triệu VND sử dụng sản phẩm dịch vụ thẻ ghi nợ ngân hàng khách hàng có tài sản chấp nhƣng chƣa phát sinh khoản vay tín dụng với ngân hàng đồng thời sử dụng dịch vụ toán qua thẻ khách hàng tiềm mà ngân hàng cần tập trung hƣớng đến để phát triển sản phẩm Có thể thấy tƣơng lai kinh tế khôi phục tăng trƣởng trở lại nhu cầu ngƣời dân sản phẩm thẻ visa không ngừng tăng lên với sách khuyến hấp dẫn, sách tích lũy điểm thƣởng cho gói sản phẩm tạo điều kiện để ngân hàng phát triển loại hình sản phẩm dịch vụ  Ngồi dịch vụ thah tốn qua thẻ ATM dịch vụ có tiềm phát triển lớn từ luật rút cho ta kết khoảng 312 tổng số 600 KH (chiếm khoảng 52%) tỷ lệ sử dụng thực tế toàn địa bàn khoảng 210 KH số 600 KH đƣợc nghiên cứu (chiếm khoảng 35%) chi nhánh sử dụng cho thấy dịch vụ đƣợc sử dụng cách có hiệu tƣơng lai phát triển kinh tế dần ổn định phát triển, sở hạ tầng mạng phát triển để tăng tính bảo mật nhƣ an tồn tốn qua thẻ ATM Theo kết trích rút từ định ta thấy điều kiện để sử dụng dịch vụ thẻ tƣơng đối dễ dàng nên xu hƣớng sử dụng dịch vụ ngày phổ biến không với khách hàng có thu nhập cao mà khách hàng có thu nhập trung bình quan tâm đến dịch vụ Với số lƣợng 186 khách hàng có Phan Thị Hồng Ngọc – Lớp HTTTB/K13 Page 54 Khóa luận tơt nghiệp Ứng dụng KPDL đánh giá tiềm phát triển sản phẩm dịch vụ CN BIDV Cao Bằng mức thu nhập từ 20 triệu VNĐ đến 40 triệu VNĐ sử dụng dịch vụ toán qua thẻ ATM cho thấy lƣợng khách hàng tiềm lớn Bên cạnh liệu ngân hàng lớn thƣờng xuyên thay đổi, tăng trƣởng nên việc dùng mơ hình phân lớp định đáp ứng đƣợc yêu cầu giám sát liệu thể tính trực quan phân tích để từ mở cách nhìn KPDL việc giải yêu cầu toàn nêu Mặt khác kết luận đƣợc đƣa dựa thông tin liệu khách hàng Ngân hàng thu thập dựa giao dịch khách hàng với ngân hàng chƣa có phản hồi từ phía khách hàng Nên liệu cịn mang tính chủ quan Ngân hàng Một điểm nhỏ cần lƣu ý luật đƣợc sinh dựa thuật tốn nên phụ thuộc hồn tồn nguồn liệu thu thập đƣợc sử dụng Có thể có phân lớp đƣợc đă chƣa hồn tồn phù hợp với thực tế (đơi mâu thuẫn khơng có sữ liên quan) Các luật giúp cung cấp thêm thông tin cho lãnh đạo định không thiết phải tuân thủ theo luật cách cứng nhắc Trong Data Mining việc sử dụng đƣợc tri thức để phục vụ điều hành quản lý nghệ thuật không đơn dựa vào mơ hình tốn học Phan Thị Hồng Ngọc – Lớp HTTTB/K13 Page 55 Khóa luận tơt nghiệp Ứng dụng KPDL đánh giá tiềm phát triển sản phẩm dịch vụ CN BIDV Cao Bằng KẾT LUẬN Trong công việc hàng ngày, vai trị ngƣời ln trọng tâm Tuy nhiên, thực tế cho thấy ngày có nhiều hỗ trợ đắc lực từ phía máy móc cơng nghệ Vai trị khoa học công nghệ lớn, thiếu đƣợc ảnh hƣởng lớn đến đời sống Đó cơng cụ hỗ trợ đắc lực cho ngƣời, giúp ngƣời giải nhanh chóng, định xác hiệu giúp tiết kiệm nhiều chi phí Trong vai trị nghiên cứu tác giả chọn cơng nghệ KPDL để làm sở cho luận văn Qua q trình nghiên cứu tóm tắt kết sau: Các kết đạt đƣợc: Khóa luận tìm hiểu phát đƣợc yêu cầu KPDL KH BIDV Chi nhánh Cao Bằng nhằm mục đích phát triển sản phẩm dịch vụ ngân hàng Từ yêu cầu đƣợc nêu ra, khóa luận tiếp tục nghiên cứu quy trình KPDL, cơng cụ, thuật toán cần thiết để giải yêu cầu Đồng thời kết đáng ghi nhận ứng dụng đƣợc phân lớp dựa định xử lý toán, cài đặt chạy thử nghiệm thành cơng giải đƣợc tốn cách trọn vẹn CSDL tƣơng đối nhỏ Kết chƣa đạt đƣợc: Thuật toán C4.5 thuật toán hay nhƣng so với thuật gần nhƣ Sprint cịn nhiều nhƣợc điểm Phƣơng pháp để tìm luật C4.5 chậm chiếm nhiều nhớ KPDL công nghệ tri thức liên ngành, Việc nghiên cứu thời gian hạn hẹp khơng thể khám phá hết đƣợc chức công nghệ Do đó, vận dụng vào thực tiễn khơng tránh khỏi khuyết điểm Dữ liệu nghiên cứu nhƣ giới hạn phạm vi nhỏ KH cá nhân nên phân lớp đƣợc đƣa chƣa đƣợc đa dạng Hƣớng nghiên cứu tiếp theo: Hƣớng nghiên cứu khóa luận thứ nghiên cứu thêm tìm hiểu kỹ số thuật toán KPDL định; tìm phƣơng pháp để cải tiến nhƣợc điểm thuật toán sinh định đƣợc trình bày chƣơng Thứ hai thu thập thêm ý kiến phản hồi khách hàng chất lƣợng sản Phan Thị Hồng Ngọc – Lớp HTTTB/K13 Page 56 Khóa luận tơt nghiệp Ứng dụng KPDL đánh giá tiềm phát triển sản phẩm dịch vụ CN BIDV Cao Bằng phẩm ngân hàng hoàn thiện tập liệu hơn; sử dụng thuật tốn Sprint thay thuật tốn C4.5 khơng thể áp dụng xử lý liệu lớn thực tế ngân hàng Trong q trình thực khóa luận, có hƣớng dẫn nhiệt tình Thầy Ths Nguyễn Thanh Thụy với nỗ lực cố gắng tập trung tìm hiểu tham khảo tài liệu có liên quan thân thời gian có hạn nên khơng tránh khỏi thiếu sót Em mong nhận đƣợc nhận xét, góp ý từ quý Thầy, Cô bạn bè đồng nghiệp để hoàn thiện kết nghiên cứu Em xin chân thành cảm ơn./ Phan Thị Hồng Ngọc – Lớp HTTTB/K13 Page 57 Khóa luận tơt nghiệp Ứng dụng KPDL đánh giá tiềm phát triển sản phẩm dịch vụ CN BIDV Cao Bằng TÀI LIỆU THAM KHẢO Tiếng Việt: Vũ Tiến Thành – Lƣu Cơng Tố - Thuật tốn định C4.5 Lê Văn Dực (2006) Hệ hỗ trợ định, NXB Đại học Quốc gia Thành Phố Hồ Chí Minh Nguyễn Nhật Quang (2011), Tập giảng Khai phá liệu – Trƣờng Đại học Bách Khoa Hà Nội Huỳnh Trâm Võ – Học liệu mở Việt Nam – Tiếp cận ký hiệu: Giải thuật quy nạp định ID3 Tiếng Anh: Anurag Srivastava, Eui- Hong Han, Vipin Kumar, Vieet Singh Parallel Formulations of Decision-Tree Classification Algorithm Kluwer Academic Publisher, 1999 Remco R.Bouckaert, et al (2009), Weka Manual for Version -7 -0 Danh mục Website tham khảo: http://vi.wikipedia.org/wiki/Khai_phá_dữ_liệu (Truy cập tháng 4/2014) Cây định - http://vi.wikipedia.org/wiki/Cây_quyết_định (Truy cập tháng 4/2014) http://en.wikipedia.org/wiki/C4.5_algorithm (Truy cập tháng 4/2014) http://www.cs.waikato.ac.nz/ml/weka/ Phan Thị Hồng Ngọc – Lớp HTTTB/K13 Page 58 Khóa luận tôt nghiệp Ứng dụng KPDL đánh giá tiềm phát triển sản phẩm dịch vụ CN BIDV Cao Bằng PHỤ LỤC [1] Jiawei Han, Micheline Kamber, “Data Mining: Concepts and Techniques”, Second Edition, Morgan Kaufmann Publishers, 2006 [2] (Nguồn Website http://www.bidv.com.vn/ truy cập ngày 09/3/2014) === Run information === Scheme:weka.classifiers.trees.J48 -C 0.25 -M Relation: bank-data-XL Instances: 600 Attributes: 10 Tuoi GT KV TN TKTK TC VTD TGN Dv_tren_ATM The_Flexi Test mode:10-fold cross-validation === Classifier model (full training set) === J48 pruned tree -The_Flexi = K | TC = K: K (347.0/126.0) | TC = C: C (78.0/19.0) The_Flexi = C | TN = Thap: K (28.0/2.0) | TN = TB: K (75.0/22.0) Phan Thị Hồng Ngọc – Lớp HTTTB/K13 Page 59 Ứng dụng KPDL đánh giá tiềm phát triển sản phẩm dịch vụ CN BIDV Cao Bằng Khóa luận tơt nghiệp | TN = Cao | | TC = K: K (43.0/14.0) | | TC = C: C (28.0/10.0) The_Flexi = C : K (1.0) Number of Leaves : Size of the tree : Time taken to build model: 0.01 second === Stratified cross-validation === === Summary === Correctly Classified Instances 400 66.6667 % Incorrectly Classified Instances 200 33.3333 % Kappa statistic 0.2379 Mean absolute error 0.4316 Root mean squared error 0.4694 Relative absolute error 89.7887 % Root relative squared error 95.7513 % Total Number of Instances 600 === Detailed Accuracy By Class === TP Rate FP Rate Precision Recall F-Measure ROC Area Class 0.905 0.689 0.662 0.905 0.765 0.612 K 0.311 0.095 0.688 0.311 0.429 0.612 C Weighted Avg 0.667 0.45 0.672 0.667 0.63 0.612 === Confusion Matrix === a b < classified as 325 34 | a = K 166 75 | b = C Bảng 1: Kết chi tiết định cho thuộc tính Vay tiêu dùng === Run information === Scheme:weka.classifiers.trees.J48 -C 0.25 -M Phan Thị Hồng Ngọc – Lớp HTTTB/K13 Page 60 Khóa luận tôt nghiệp Relation: Ứng dụng KPDL đánh giá tiềm phát triển sản phẩm dịch vụ CN BIDV Cao Bằng bank-data-XL Instances: 600 Attributes: 10 Tuoi GT KV TN TKTK TC VTD Dv_tren_ATM The_Flexi TGN Test mode:10-fold cross-validation === Classifier model (full training set) === J48 pruned tree -TC = K | TN = Thap: K (130.0) | TN = TB: K (189.0/1.0) | TN = Cao | | Dv_tren_ATM = K: K (11.0) | | Dv_tren_ATM = C | | | TGN = K: C (13.0) | | | TGN = C | | | | Tuoi = Tre: C (0.0) | | | | Tuoi = T_Nien: K (10.0/3.0) | | | | Tuoi = Gia: C (38.0/11.0) Phan Thị Hồng Ngọc – Lớp HTTTB/K13 Page 61 Khóa luận tơt nghiệp Ứng dụng KPDL đánh giá tiềm phát triển sản phẩm dịch vụ CN BIDV Cao Bằng TC = C | VTD = K | | Dv_tren_ATM = K | | | GT = NU: C (20.0/4.0) | | | GT = NAM | | | | Tuoi = Tre: K (14.0/3.0) | | | | Tuoi = T_Nien: C (7.0/2.0) | | | | Tuoi = Gia: K (2.0/1.0) | | Dv_tren_ATM = C: C (66.0/2.0) | VTD = C | | Dv_tren_ATM = K: K (38.0/5.0) | | Dv_tren_ATM = C | | | TGN = K: C (12.0) | | | TGN = C | | | | TN = Thap: C (1.0) | | | | TN = TB | | | | | TKTK = K | | | | | | GT = NU: C (3.0) | | | | | | GT = NAM | | | | | | | Tuoi = Tre: K (0.0) | | | | | | | Tuoi = T_Nien: C (3.0/1.0) | | | | | | | Tuoi = Gia: K (2.0) | | | | | TKTK = C: K (22.0/4.0) | | | | TN = Cao: C (19.0/5.0) Number of Leaves : 21 Size of the tree : 36 Time taken to build model: 0.01 seconds === Stratified cross-validation === === Summary === Phan Thị Hồng Ngọc – Lớp HTTTB/K13 Page 62 Ứng dụng KPDL đánh giá tiềm phát triển sản phẩm dịch vụ CN BIDV Cao Bằng Khóa luận tơt nghiệp Correctly Classified Instances Incorrectly Classified Instances Kappa statistic 539 89.8333 % 61 10.1667 % 0.7551 Mean absolute error 0.089 Root mean squared error 0.2305 Relative absolute error 32.1344 % Root relative squared error 62.0395 % Total Number of Instances 600 === Detailed Accuracy By Class === TP Rate FP Rate Precision Recall F-Measure ROC Area Class 0.927 0.166 0.931 0.927 0.929 0.936 K 0.833 0.075 0.819 0.833 0.826 0.934 C 0 Weighted Avg 0.898 0.139 0.897 0.452 C 0.898 0.898 0.935 === Confusion Matrix === a b c < classified as 394 31 | a = K 29 145 | b = C 0| c=C Bảng 2: Kết chi tiết định cho thuộc tính Thẻ visa Flexi === Run information === Scheme:weka.classifiers.trees.J48 -C 0.25 -M Relation: bank-data-XL Instances: 600 Attributes: 10 Tuoi GT KV Phan Thị Hồng Ngọc – Lớp HTTTB/K13 Page 63 Khóa luận tơt nghiệp Ứng dụng KPDL đánh giá tiềm phát triển sản phẩm dịch vụ CN BIDV Cao Bằng TN TKTK TC VTD Dv_tren_ATM The_Flexi TGN Test mode:10-fold cross-validation === Classifier model (full training set) === J48 pruned tree -TN = Thap: K (197.0/9.0) TN = TB | TGN = K | | The_Flexi = K: K (81.0/2.0) | | The_Flexi = C: C (30.0/5.0) | | The_Flexi = C : K (0.0) | TGN = C: C (186.0/33.0) TN = Cao | TGN = K | | The_Flexi = K: K (12.0) | | The_Flexi = C: C (18.0) | | The_Flexi = C : C (0.0) | TGN = C: C (76.0/1.0) Number of Leaves : Size of the tree : 14 Time taken to build model: 0.01 seconds === Stratified cross-validation === === Summary === Phan Thị Hồng Ngọc – Lớp HTTTB/K13 Page 64 Ứng dụng KPDL đánh giá tiềm phát triển sản phẩm dịch vụ CN BIDV Cao Bằng Khóa luận tơt nghiệp Correctly Classified Instances Incorrectly Classified Instances Kappa statistic 550 91.6667 % 50 8.3333 % 0.8337 Mean absolute error 0.1438 Root mean squared error 0.2693 Relative absolute error 28.8601 % Root relative squared error 53.9493 % Total Number of Instances 600 === Detailed Accuracy By Class === TP Rate FP Rate Precision Recall F-Measure ROC Area Class 0.877 0.039 0.962 0.877 0.918 0.922 K 0.961 0.123 0.874 0.961 0.916 0.922 C Weighted Avg 0.917 0.078 0.921 0.917 0.917 0.922 === Confusion Matrix === a b < classified as 279 39 | a = K 11 271 | b = C Bảng 3: Kết chi tiết định cho thuộc tính DV Thanh tốn qua thẻ ATM Phan Thị Hồng Ngọc – Lớp HTTTB/K13 Page 65

Ngày đăng: 18/12/2023, 07:09

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w