Mục tiêu chính của đề tài nhằm tìm hiểu các kĩ thuật khai phá dữ liệu, cụ thể là kĩ thuật khai phá dữ liệu dạng lưới, và từ đó nghiên cứu những ứng dụng của kĩ thuật này trong lĩnh vực tài chính.
ĐẠI HỌC ĐÀ NẴNG TRƯỜNG CĐ CÔNG NGHỆ THÔNG TIN BÁO CÁO TỔNG KẾT ĐỀ TÀI KHOA HỌC VÀ CÔNG NGHỆ CẤP CƠ SỞ NGHIÊN CỨU ỨNG DỤNG KỸ THUẬT KHAI PHÁ DỮ LIỆU DẠNG LƯỚI TRONG LĨNH VỰC TÀI CHÍNH Mã số: T2016-07-07 Chủ nhiệm đề tài: Th.s Trần Thu Thủy Đà Nẵng, 12/2016 ĐẠI HỌC ĐÀ NẴNG TRƯỜNG CĐ CÔNG NGHỆ THÔNG TIN BÁO CÁO TỔNG KẾT ĐỀ TÀI KHOA HỌC VÀ CÔNG NGHỆ CẤP CƠ SỞ NGHIÊN CỨU ỨNG DỤNG KỸ THUẬT KHAI PHÁ DỮ LIỆU DẠNG LƯỚI TRONG LĨNH VỰC TÀI CHÍNH Mã số: T2016-07-07 Chủ nhiệm đề tài: Th.s Trần Thu Thủy Xác nhận quan chủ trì đề tài Chủ nhiệm đề tài Đà Nẵng, 12/2016 MỤC LỤC MỞ ĐẦU TÍNH CẤP THIẾT MỤC TIÊU NGHIÊN CỨU ĐỐI TƯỢNG VÀ PHẠM VI NGHIÊN CỨU BỐ CỤC ĐỀ TÀI CHƯƠNG 1: TỔNG QUAN VỀ KHAI PHÁ DỮ LIỆU 10 1.1 KHAI PHÁ DỮ LIỆU 10 1.2 CÁC THUẬT TOÁN VÀ KỸ THUẬT KHAI PHÁ DỮ LIỆU 11 1.2.1 Phân loại 13 1.2.2 Luật kết hợp 14 1.2.3 Việc phân cụm (Clustering) 14 1.2.4 Dự đoán 17 1.2.4.1 Các mẫu 17 1.2.4.2 Các định 18 1.2.4.3 Các tổ hợp 19 1.2.4.4 Xử lý (bộ nhớ) dài hạn 19 1.2.4.5 Chuẩn bị triển khai liệu .20 1.2.4.6 Việc xây dựng SQL 21 1.2.4.7 Các sở liệu tài liệu MapReduce 23 1.3 KẾT LUẬN 26 CHƯƠNG 2: PHÂN CỤM DỮ LIỆU VÀ PHƯƠNG PHÁP PHÂN CỤM DỰA TRÊN LƯỚI 27 2.1 KHÁI NIỆM CHUNG 27 2.2 BÀI TOÁN PHÂN CỤM TRÊN LƯỚI 27 2.3 CÁC PHƯƠNG PHÁP PHÂN CỤM 28 2.3.1 Phương pháp phân cụm phân hoạch .28 2.3.2 Phương pháp phân cụm phân cấp 29 2.3.3 Phương pháp phân cụm dựa mật độ 30 2.3.4 Phương pháp phân cụm dựa lưới 31 2.3.5 Phương pháp phân cụm dựa mơ hình 32 CHƯƠNG 3: ỨNG DỤNG KĨ THUẬT PHÂN CỤM DỰA TRÊN LƯỚI TRONG LĨNH VỰC TÀI CHÍNH VÀ BÁO CÁO KẾT QUẢ NGHIÊN CỨU 33 3.1 MARKETING 34 3.2 QUẢN LÝ RỦI RO .34 3.3 PHÁT HIỆN GIAN LẬN 37 3.4 QUẢN TRỊ QUAN HỆ KHÁCH HÀNG .37 3.5 ĐÁNH GIÁ KẾT QUẢ NGHIÊN CỨU .38 3.5.1 Nghiên cứu tập trung ứng dụng vào lĩnh vực quảng bá bán sản phẩm hệ thống ngân hàng Việt Nam 38 KẾT LUẬN 42 TÀI LIỆU THAM KHẢO 44 DANH MỤC TỪ VIẾT TẮT STT Cụm từ Viết tắc Management Information System MIS Phân cụm liệu PCDL DANH MỤC HÌNH ẢNH Hình 1.1: Phác thảo q trình 12 Hình 1.2: Phác thảo việc phân cụm 16 Hình 1.3: Cây định 18 Hình 1.4: Chuẩn bị liệu 21 Hình 1.5: Định dạng cho việc phân tích liệu cụ thể 22 Hình 1.6: Cấu trúc KPDL 24 Hình 1.7: Nối chuỗi đầu MapReduce bạn theo 25 Hình 2.1 Các chiến lược phân cụm phân cấp 30 Hình 2.2: Một số hình dạng khám phá phân cụm dưa mật độ 31 Hình 2.3: Phân cụm dựa lưới 32 Hình 3.1: Nợ có khả vốn năm 2015 36 Hình 3.2: Lợi nhuận trước thuế ngân hàng năm 2015-2016 39 Hình 3.3: Tổng kết doanh số phát triển thẻ tính đến 2015 40 Hình 3.4: Biểu đồ phân chia thị phần thẻ tính đến 2015 41 ĐẠI HỌC ĐÀ NẴNG TRƯỜNG CĐ CÔNG NGHỆ THƠNG TIN CỘNG HỊA XÃ HỘI CHỦ NGHĨA VIỆT NAM Độc lập – Tự – Hạnh phúc THÔNG TIN KẾT QUẢ NGHIÊN CỨU Thông tin chung: - Tên đề tài: “Nghiên cứu ứng dụng kĩ thuật khai phá liệu dạng lưới lĩnh vực tài chính” - Mã số: T2016- 07-07 - Chủ nhiệm: Trần Thu Thủy - Thành viên tham gia: - Cơ quan chủ trì: Trường Cao đẳng Cơng nghệ Thơng tin - Thời gian thực hiện: Từ 4/2016 12/2016 Mục tiêu: Mục tiêu đề tài nhằm tìm hiểu kĩ thuật khai phá liệu, cụ thể kĩ thuật khai phá liệu dạng lưới, từ nghiên cứu ứng dụng kĩ thuật lĩnh vực tài Tính sáng tạo: Đề tài nghiên cứu điểm mạnh tiềm kĩ thuật khai phá liệu dạng lưới vào lĩnh vực tài chính, lĩnh vực cần có can thiệp khoa học cơng nghệ khai phá liệu để quản lý tốt liệu đồng thời tạo sở tảng để phát triển kinh doanh tốt Tóm tắt kết nghiên cứu: Kỹ thuật khai phá liệu giúp ngân hàng phân tích nhận định đâu khách hàng trung thành đâu khách hàng có xu hương chuyển sang ngân hàng khác với mong muốn dịch vụ tốt Nếu khách hàng chuyển từ ngân hàng sang ngân hàng khác, lý cho việc chuyển giao dịch cuối thực trước chuyển biết giúp ngân hàng hoạt động tốt giữ chân khách hàng Hiệu quả, phương thức chuyển giao kết nghiên cứu khả áp dụng: Đưa tổng kết kết kinh doanh, số phát triển tổ chức có sử dụng kĩ thuật khai phá liệu dạng lưới vào trình kinh doanh Ứng dụng cơng nghệ hiệu vào trình phát triển hệ thống Cơ quan chủ trì Đà Nẵng, ngày 15 tháng 12 năm 2016 Chủ nhiệm đề tài MỞ ĐẦU TÍNH CẤP THIẾT Trong ngành cơng nghiệp dịch vụ tài tồn giới, phương thức liên lạc truyền thống khách hàng mặt đối mặt (face-to-face) thay phương thức điện tử để giảm thời gian chi phí xử lý áp dụng cho sản phẩm khác cuối cải thiện hiệu việc sử dụng tài Tin học hố q trình hoạt động tài chính, sử dụng internet phần mềm tự động hồn tồn làm thay đổi khái niệm kinh doanh cách hoạt động kinh doanh thực Hiển nhiên, lĩnh vực ngân hàng ngoại lệ Kể từ năm 1990 toàn khái niệm ngân hàng chuyển sang sở liệu tập trung, giao dịch trực tuyến máy ATM thực giới, làm cho hệ thống ngân hàng mặt mạnh mẽ mặt kỹ thuật định hướng khách hàng tốt Dữ liệu nguồn tài nguyên có giá trị ngân hàng nào, nhiên thực có giá trị biết cách tiếp cận với thơng tin có giá trị ẩn chứa liệu thô Khai phá liệu cho phép triết suât thông tin từ liệu lịch sử, dự đốn kết tình tương lai Nó giúp cho việc tối ưu hóa định kinh doanh, tăng giá trị khách hàng thông tin kết nối, đồng thời cải thiện hài lòng khách hàng Số lượng liệu thu thập ngân hàng tăng nhanh chóng năm gần Với kỹ thuật phân tích số liệu thống kê khó quản lý tốt với khối lượng lớn liệu có Sự tăng trưởng bùng nổ dẫn đến cần thiết kỹ thuật phân tích liệu cơng cụ để tìm thơng tin thực có ích ẩn chứa liệu Ngân hàng lĩnh vực mà lượng lớn liệu thu thập Dữ liệu tạo từ giao dịch tài khoản ngân hàng, hồ sơ vay vốn, trả nợ, thẻ tín dụng, v.v Người ta cho thơng tin có giá trị hồ sơ tài khách hàng ẩn chữa sở liệu hoạt động lớn thơng tin sử dụng để cải thiện hiệu suất kinh doanh ngân hàng Tại thời điểm ban đầu trung tâm tin học đầu mối ngân hàng, nhiều gói phần mềm sử dụng cho giao dịch hàng ngày Từ đó, thiết kế Hệ thống thông tin (MIS: Management Information System) cấu lại sở hạ tầng khó thể thực khơng đơn giản cần thay gói phầm mềm trung tâm tin học Giải pháp cho vấn đề để thực khái niệm kho liệu khai phá liệu (Data Warehouse and Data Mining) MỤC TIÊU NGHIÊN CỨU - Nghiên cứu tổng quan kiến trúc lưới - Nghiên cứu kĩ thuật khai phá kiến trúc lưới - Ứng dụng kĩ thuật khai phá kiến trúc lưới lĩnh vực tài ĐỐI TƯỢNG VÀ PHẠM VI NGHIÊN CỨU 3.1 Đối tượng nghiên cứu • Kiến trúc lưới • Các kĩ thuật khai phá kiến trúc lưới 3.2 Phạm vi nghiên cứu Tập trung nghiên cứu khai phá liệu mơ hình kiến trúc lưới ứng dụng lĩnh vực tài BỐ CỤC ĐỀ TÀI Ngoài lời mở đầu kết luận, đề tài gồm chương: Chương 1: Tổng quan sở lý thuyết nghiên cứu Giới thiệu tổng quan khai phá liệu, trích chọn thơng tin, kho ngữ liệu, cơng trình nghiên cứu lĩnh vực công bố Chương 2: Khai phá liệu phân cụm dựa mơ hình lưới Chương giới thiệu phương pháp tiếp cận với ưu nhược điểm chúng, từ đưa giải pháp cho toán nghiên cứu Chương 3: Ứng dụng mơ hình phân cụm dựa lưới vào lĩnh vực tài Chương giới thiệu ứng dụng kĩ thuật PCDL dựa lưới lĩnh vực tài chính, cụ thể lĩnh vực tài ngân hàng CHƯƠNG 1: TỔNG QUAN VỀ KHAI PHÁ DỮ LIỆU 1.1 KHAI PHÁ DỮ LIỆU Khai phá liệu đề cập đến tri thức chiết xuất từ lượng lớn liệu Dữ liệu liệu không gian, liệu đa phương tiện, liệu chuỗi thời gian, liệu văn liệu web Khai phá liệu trình khai thác thơng tin hữu ích, thú vị, đặc biệt, tiềm ẩn, chưa biết có khả hữu ích tri thức từ lượng lớn liệu Nó tập hợp hoạt động sử dụng để tìm kiếm, thơng tin tiềm ẩn không tin không mong đợi liệu hình thức thể khác thường liệu Sử dụng thông tin kho liệu, khai phá liệu thường cung cấp câu trả lời cho câu hỏi tổ chức có định trước khơng thơng qua việc hỏi khảo sát: Những sản phẩm nên cất nhắc cho khách hàng đặc biệt? - Mục tiêu quảng bá bán sản phẩm Xác suất mà khách hàng định để lại cho đối thủ cạnh tranh gì? - Quản lý quan hệ khách hàng Chẩn đốn thích hợp cho bệnh nhân này gì? - Sinh học y tế; - Khả khách hàng mặc định trả lại khoản vay gì? - Ngân hàng - Những sản phẩm mua nhiều với nhau? - Phân tích thị trường Giỏ hàng Làm để xác định người gian lận ngành cơng nghiệp viễn thơng? Mơ hình phân tích gian lận Các loại câu hỏi trả lời cách nhanh chóng dễ dàng thơng tin ẩn lượng lớn liệu sở liệu xác định sử dụng 10 Hình 2.1 Các chiến lược phân cụm phân cấp Trong thực tế áp dụng, có nhiều trường hợp người ta kết hợp hai phương pháp phân cụm phân hoạch phương phân cụm phân cấp, nghĩa kết thu phương pháp phân cấp cải tiến thông quan bước phân cụm phân hoạch Phân cụm phân hoạch phân cụm phân cấp hai phương pháp PCDL cổ điển, có nhiều thuật toán cải tiến dựa hai phương pháp áp dụng phổ biến KPDL Một số thuật tốn phân cụm phân cấp điển CURE, BIRCH, Chemeleon, AGNES, DIANA , 2.3.3 Phương pháp phân cụm dựa mật độ Phương pháp nhóm đối tượng theo hàm mật độ xác định Mật độ định nghĩa số đối tượng lân cận đối tượng liệu theo ngưỡng Trong cách tiếp cận này, cụm liệu xác định tiếp tục phát triển thêm đối tượng liệu miễn số đối tượng lân cận đối tượng phải lớn ngưỡng xác định trước Phương pháp phân cụm dựa vào mật độ đối tượng để xác định cụm liệu phát cụm liệu với hình thù Tuy vậy, việc xác định tham số mật độ thuật toán khó khăn, tham số lại có tác động lớn đến kết PCDL Hình minh hoạ cụm liệu với hình thù khác dựa mật độ khám phá từ CSDL 30 khác nhau: Hình 2.2: Một số hình dạng khám phá phân cụm dưa mật độ Các cụm xem vùng có mật độ cao, tách vùng khơng có mật độ Khái niệm mật độ xem số đối tượng láng giềng Một số thuật toán PCDL dựa mật độ điển [2][3]: DBSCAN, OPTICS, DENCLUE, SNN 2.3.4 Phương pháp phân cụm dựa lưới Kỹ thuật phân cụm dựa mật độ khơng thích hợp với liệu nhiều chiều, để giải cho đòi hỏi này, người ta sử dụng phương pháp phân cụm dưa lưới Đây phương pháp dựa cấu trúc liệu lưới để PCDL, phương pháp chủ yếu tập trung áp dụng cho lướp liệu không gian, Thí dụ liệu biểu diển dạng cấu trúc hình học đối tương trọng khơng gian với quan hệ, thuộc tính, hoạt động chúng Mục tiêu phương pháp lượng hóa tập liệu thành ơ, ô tạo thành cấu trúc liệu lưới, sau thao tác PCDL làm việc với đối tượng ô CÁc tiếp cận dựa lưới không di chuyển đối tượng ô mà xây dựng nhiều mức phân ấp nhóm đối tượng ô Trong ngữ cảnh này, phương pháp gần giống với phương pháp phân cụm phân cấp có điều chúng khơng trộn ô Do cumgj không dựa độ đo khoảng cachs (hay gọi độ đo tương tự liệu khơng gian) mà định tham số xác định trước Ưu điểm 31 phương pháp PCDL dựa lưới thời gian xử lý nhanh độc lập với số đối tượng liệu tập liệu ban đầu, thay vào chúng phụ thuộc vào số chiều khơng gian lưới Các thuật tốn PCDL dựa lưới String, Wave Cluster Hình 2.3: Phân cụm dựa lưới 2.3.5 Phương pháp phân cụm dựa mơ hình Phương pháp cố gắng khám phá phép xấu củ tốt tham số mơ hình cho khớp với liệu cách tốt Chúng dử dụng chiến lược phân cụm phân hoạch chiến lược phân cụm phân cấp, dựa cấu trúc mơ hình mà chúng giả định tập liệu cách mà chúng giả định tập liệu cách mà chỉnh mơ hình để nhận dạng phân hoạch Phương pháp PCDL dựa mô hình cố gắng khớp liệu với mơ hình tốn học, dựa giả định liệu tạp hỗn hợp phân phối xác suất Các thuật tốn phân cụm dựa mơ hình có hay cách tiếp cận chính: mơ hình thống kê mạng Nơron Phương pháp gần giống với phương pháp dựa mật độ, bở vù chúng phát triển cumgj riêng việt nhằm cải tiến mô hình xác định trước đó, khơi khơng bắt đầu với số cụm cố định không sử dụng khái niệm mật độ cho cụm 32 CHƯƠNG 3: ỨNG DỤNG KĨ THUẬT PHÂN CỤM DỰA TRÊN LƯỚI TRONG LĨNH VỰC TÀI CHÍNH VÀ BÁO CÁO KẾT QUẢ NGHIÊN CỨU Ngành công nghiệp ngân hàng toàn giới trải qua thay đổi to lớn cách thức kinh doanh Với việc thực nhiệm vụ kinh doanh đặc thù thời gian gần đây, ngân hàng có thay đổi lớn chấp nhận áp dụng công nghệ thông vào việc kinh doanh Như kết hiển nhiên, việc thực giao dịch trở nên dễ dàng đồng thời khối lượng liệu từ giao dịch tăng lên đáng kể Nó vượt khả người để phân tích số lượng liệu thơ khổng lồ chuyển đổi thành tri thức hữu ích cho tổ chức Khai phá liệu giúp đỡ cách đóng góp việc giải vấn đề kinh doanh cách tìm kiếm mẫu, mối kết hợp mối tương quan ẩn chứa thông tin liên quan tới việc kinh doanh lưu trữ sở liệu Bằng cách sử dụng khai phá liệu để phân tích mơ hình xu hướng này, người thực công việc kinh doanh ngân hàng dự đốn với độ xác tăng lên, khách hàng phản ứng với việc điều chỉnh lãi suất, khách hàng có khả chấp nhận chào hàng sản phẩm mới, khách hàng có nguy rủi ro cao mặc định khoản vay, làm để mối quan hệ khách hàng ngày có lợi Ngành ngân hàng nhận tầm quan trọng thông tin mà ngân hàng có khách hàng cách rộng rãi Chắc chắn rằng, họ có biển thơng tin khách hàng, bao gồm nhân học khách hàng, liệu giao dịch, creditcards sử dụng mơ hình, nhiều thuộc tính khác Khi ngành ngân hàng phận ngành cơng nghiệp dịch vụ, nhiệm vụ trì mối quan hệ khách hàng (CRM: Customer relationship Management) cách có hiệu vấn đề quan trọng Để làm điều này, ngân hàng cần phải đầu tư nguồn lực để hiểu rõ khách hàng tiềm họ Bằng cách sử dụng công cụ khai phá liệu phù hợp, sau cung cấp sản phẩm dịch vụ thích hợp cho khách hàng họ 33 Có nhiều lĩnh vực, khai phá liệu ứng dụng ngành công nghiệp ngân hàng, bao gồm việc phân khúc khách hàng phân chia lợi nhuận, chấm điểm phê duyệt tín dụng, dự đoán toán mặc định, quảng bá sản phẩm, phát giao dịch gian lận, quản lý tiền mặt hoạt động dự báo, tối ưu hóa danh mục đầu tư chứng khoán xếp hạng đầu tư Bằng cách phân tích liệu khứ, khai phá liệu giúp ngân hàng dự đốn số lượng khách hàng có khả thay đổi thẻ tín dụng họ, từ họ lập kế hoạch triển khai ưu đãi đặc biệt khác để giữ lại khách hàng Sau số ví dụ phương thức mà ngành ngân hàng sử dụng có hiệu kỹ thuật khai phá liệu lĩnh vực 3.1 MARKETING Một lĩnh vực ứng dụng rộng rãi cho ngành ngân hàng kỹ thuật khai phá liệu lĩnh vực quảng bá sản phẩm Bộ phận tiếp thị bán hàng Ngân hàng sử dụng kỹ thuật khai phá liệu để phân tích sở liệu khách hàng Khai phá liệu thực phân tích khác liệu thu thập để xác định hành vi người tiêu dùng với tham khảo sản phẩm, giá kênh phân phối Với phản hồi khách hàng sản phẩm có sản phẩm mới, ngân hàng có chiến lược quảng bá sản phẩm, nâng cao chất lượng sản phẩm dịch vụ đạt lợi cạnh tranh Phân tích ngân hàng phân tích xu hướng khứ, xác định nhu cầu dự báo hành vi khách hàng sản phẩm dịch vụ khác để thu hội kinh doanh dự đốn mơ hình hành vi Kỹ thuật khai thác liệu giúp xác định khách hàng mang lại lợi nhuận khách hàng không mang lại lợi nhuận Các kỹ thuật khai phá liệu sử dụng để xác định phản ánh khách hàng ngân hàng thực điều chỉnh lãi suất 3.2 QUẢN LÝ RỦI RO Khai phá liệu sử dụng rộng rãi để quản lý rủi ro ngành công nghiệp ngân hàng Giám đốc điều hành ngân hàng cần phải biết khách hàng 34 mà họ có liệu đáng tin cậy hay khơng Khi cung cấp thẻ tín dụng cho khách hàng, mở rộng số lượng khách hàng tín dụng phê duyệt khoản vay, họ mang lại định rủi ro cho ngân hàng họ điều khách hàng họ Ngân hàng tiến hành trình cho khách hàng vay vốn cách kiểm tra chi tiết khác liên quan đến việc cho vay số tiền vay, lãi suất cho vay, kỳ hạn trả nợ, loại tài sản chấp, tình hình nhân sự, thu nhập lịch sử tín dụng họ Khách hàng dài hạn với ngân hàng, với nhóm thu nhập cao nhận khoản vay dễ dàng Mặc dù, ngân hàng thận trọng cung cấp vốn vay cho khách hàng, có khoản nợ mặc định khách hàng Kỹ thuật khai phá liệu giúp phân biệt người trả nợ kịp thời với người khơng có khả trả nợ kịp thời Trên thực tế điểm tín dụng cơng cụ quản lý rủi ro tài phát triển Điểm tín dụng có giá trị cho người cho vay ngành ngân hàng đưa định cho vay Khai phá liệu tìm hành vi tín dụng khách hàng cá nhân với khoản vay trả góp, chấp, tín dụng, việc sử dụng đặc điểm lịch sử tín dụng, thời gian làm việc thời gian cư trú, cho phép người cho vay đánh giá khách hàng định khách hàng có ứng cử viên tốt cho khoản vay, có nguy rủi ro tiềm ẩn Khi biết hội sẵn có khách hàng, tức ngân hàng vị trí tốt để giảm thiểu rủi ro Tính đến thời điểm năm 2016, theo báo cáo tài ngân hàng gửi cho ngân hàng nhà nước tăng trưởng tín dụng tồn ngành tháng đầu năm đạt 8,16%, cao mức 7,86% kỳ năm 2015 Đây mức cao so với kỳ năm gần Dù hoạt động ngân hàng khởi sắc, gam màu tối tranh lợi nhuận ngân hàng năm trích lập dự phịng rủi ro Trích lập dự phòng rủi ro tăng vọt bào mòn lợi nhuận nhiều ơng lớn ngân hàng 35 Điển hình Ngân hàng TMCP Xuất Nhập Khẩu (Eximbank) Quý IV/2015, lợi nhuận trước thuế Eximbank bị lỗ 588 tỷ đồng, sau thuế lỗ 463 tỷ đồng Nguyên nhân khiến Eximbank lỗ quý ngân hàng trích lập dự phòng rủi ro lên tới 935 tỷ đồng Sacombank bị lỗ quý IV/2015 dự phòng rủi ro quý cuối năm tăng vọt, từ mức 187 tỷ đồng kỳ năm 2014 lên tới 1.125 tỷ đồng Lũy kế năm trích lập dự phịng tăng gấp lần khiến cho lợi nhuận ngân hàng bị ảnh hưởng nghiêm trọng Điều khiến cho quý IV/2015, Sacombank lỗ trước thuế 738 tỷ đồng lỗ sau thuế 583 tỷ đồng Mặc dù lợi nhuận cao Vietcombank ngân hàng có mức trích lập dự phịng rủi ro cao Năm 2015, trích lập dự phịng rủi ro Vietcombank tăng lên 8.609 tỷ đồng, tăng 21,5% so với năm 2014 Mức trích lập ảnh hưởng tới lợi nhuận ơng lớn Hình 3.1: Nợ có khả vốn năm 2015 36 BIDVcũng bị sụt giảm mạnh trích lập cao quý IV, BIDV phải trích lập dự phịng rủi ro tín dụng 1.842 tỷ đồng, lũy kế năm 5.802 tỷ đồng Điều khiến cho lợi nhuận trước thuế ngân hàng năm 2015 đạt 7.944 tỷ đồng, lợi nhuận từ hoạt động kinh doanh trước chi phí dự phịng rủi ro tín dụng năm 13.746 tỷ đồng Một nguyên nhân dẫn đến nợ xấu tăng tín dụng ngân hàng tăng quý đầu năm nay, tác động kinh tế giới phục hồi chậm kinh tế nước tăng trưởng chậm lại làm cho DN gặp khó khăn sản xuất, kinh doanh, hàng tồn kho tăng cao, khơng cịn khả trả nợ ngân hàng 3.3 PHÁT HIỆN GIAN LẬN Một lĩnh vực khác khai phá liệu sử dụng ngành công nghiệp ngân hàng việc phát gian lận Có thể phát hành động gian lận mối quan tâm ngày tăng cho nhiều doanh nghiệp, với giúp đỡ kỹ thuật khai phá liệu hành động gian lận ngày phát nhiều Có hai phương pháp tiếp cận phổ biến phát triển tổ chức tài để phát mơ hình gian lận Phương pháp tiếp cận thứ nhất, ngân hàng cần phải sử dụng đến kho liệu bên thứ ba sử dụng kỹ thuật khai phá liệu để xác định mơ hình gian lận Sau đó, ngân hàng tham chiếu chéo mẫu với sở liệu riêng Phương pháp thứ hai, gian lận nhận dạng mẫu dựa mẫu thông tin nội riêng mà khơng phải nhờ vào bên thứ ba Tuy nhiên, thực tế hầu hết ngân hàng sử dụng kết hợp hai phương pháp tiếp cận 3.4 QUẢN TRỊ QUAN HỆ KHÁCH HÀNG Trong thời đại cạnh tranh khốc liệt ngày nói chung, đặc biệt ngành ngân hàng khách hàng coi thượng đế Khai phá liệu hữu ích tất ba giai đoạn chu kỳ mối quan hệ khách hàng: Tìm kiếm khách hàng, tăng giá trị khách hàng trì khách hàng Tìm kiếm khách hàng, chăm sóc 37 trì khách hàng có mối quan tâm quan trọng lĩnh vực kinh doanh nào, đặc biệt lĩnh vực ngân hàng Ngày nay, khách hàng có nhiều lựa chọn nhiều loại sản phẩm dịch vụ cung cấp ngân hàng khác Do đó, ngân hàng phải đáp ứng nhu cầu khách hàng cách cung cấp sản phẩm dịch vụ mà họ ưa thích Điều dẫn đến trung thành khách hàng khả giữ khách hàng ngân hàng Kỹ thuật khai phá liệu giúp ngân hàng phân tích nhận định đâu khách hàng trung thành đâu khách hàng có xu hương chuyển sang ngân hàng khác với mong muốn dịch vụ tốt Nếu khách hàng chuyển từ ngân hàng sang ngân hàng khác, lý cho việc chuyển giao dịch cuối thực trước chuyển biết giúp ngân hàng hoạt động tốt giữ chân khách hàng 3.5 ĐÁNH GIÁ KẾT QUẢ NGHIÊN CỨU 3.5.1 Nghiên cứu tập trung ứng dụng vào lĩnh vực quảng bá bán sản phẩm hệ thống ngân hàng Việt Nam Những năm vừa qua, mạng lưới phục vụ ngành ngân hàng Việt Nam liên tục tăng trưởng để đáp ứng nhu cầu người dân Theo báo cáo Hiệp hội Thẻ ngân hàng Việt Nam, so với năm 2006, tính đến hết năm 2015, số thẻ phát hành tăng từ triệu lên 32 triệu thẻ Số máy POS tăng gấp lần - lên gần 52.000 POS, số máy ATM tăng lần – đạt gần 12.000 ATM nhiều phương tiện toán qua internet phổ cập 38 Hình 3.2: Lợi nhuận trước thuế ngân hàng năm 2015-2016 Với việc ứng dụng khai phá liệu dạng lưới vào việc phát triển hệ thống liên ngân hàng mà tính tới thời điểm nay, hệ thống ngân hàng nước quốc tế có bước tiến đáng kinh ngạc Ngoài mạng lưới hàng ngàn chi nhánh/phòng giao dịch ngân hàng nước, hỗ trợ tích cực cơng nghệ đưa tiện ích ngân hàng đến với hàng chục triệu người tiêu dùng Việt Nam 39 Hình 3.3: Tổng kết doanh số phát triển thẻ tính đến 2015 Trước đây, việc quản lý khách hàng rải rác vô bất tiện cho khách hàng Tiền gửi đâu, phải đến đó, khơng thể rút điểm giao dịch khác, điểm hệ thống ngân hàng Thậm chí khách hàng muốn giao dịch bao nhiều điểm phải mở nhiêu tài khoản Với đời hệ thống liên ngân hàng, ngân hàng trang bị core banking đại, khách hàng cần có mã ngân hàng giao dịch với nhiều sản phẩm, điểm giao dịch không hệ thống Trước năm 2014, có tổ chức lớn đảm nhiệm xây dựng hệ thống chuyển mạch tài quốc gia nhằm kết nối hệ thống toán thẻ nói chung, hệ thống ATM/POS nói riêng ngân hàng Việt Nam 40 Hình 3.4: Biểu đồ phân chia thị phần thẻ tính đến 2015 Việc kết nối tạo điều kiện cho ngân hàng thành viên có khả mở rộng mạng lưới dịch vụ với đầu tư hợp lý, tránh việc đầu tư trùng lặp ngân hàng cho hệ thống sở hạ tầng mạng lưới thiết bị đầu cuối phạm vi tồn quốc, SmartLink Banknetvn Trong có phân chia thị phần phát triển thẻ ngân hàng Tuy nhiên, hướng tới mục đích tạo đồng quản lý phục vụ tốt cho khách hàng, đến 25/12/2014 Công ty Cổ phần Chuyển mạch Tài Quốc gia Việt Nam (Banknetvn) Cơng ty Cổ phần Dịch vụ Thẻ Smartlink (Smartlink)đồng tổ chức Lễ ký kết Hợp đồng sáp nhập chứng kiến Thống đốc Ngân hàng Nhà nước, Ban đạo tái cấu trúc Banknetvn, Hội đồng Quản trị, Ban Kiểm Soát Ban Điều Hành hai công ty đại diện ngân hàng TMCP Nhà nước số ngân hàng TMCP Việc liên kết xây dựng hệ thống liên ngân hàng đẩy mạnh doanh số bán hàng, quản lý khách hàng tốt hơn, cụ thể: Đối với Ngân hàng: - Tiết kiệm thời gian chi phí triển khai khơng phải chỉnh sửa kỹ thuật (Banknetvn chịu trách nhiệm chỉnh sửa khác biệt Ngân hàng tổ chức chuyển mạch nước ngoài) 41 - Mang lại doanh thu nguồn ngoại tệ cho Ngân hàng - Góp phần quảng bá thương hiệu Ngân hàng vượt khỏi lãnh thổ Việt Nam, vươn tới tầm khu vực giới - Gia tăng tiện ích đáp ứng nhu cầu khách hàng công tác, du lịch nước ngồi - Mức phí hấp dẫn so với mức phí mà tổ chức thẻ toán quốc tế áp dụng Đối với khách hàng: - Có thể sử dụng thẻ ghi nợ nội địa thuận tiện công tác, học tập, du lịch nước ngồi thay thẻ tín dụng quốc tế trước - Chi phí thấp so với sử dụng thẻ tín dụng quốc tế - Đảm bảo an tồn khơng phải mang lượng tiền mặt lớn nước - Thêm kênh để gửi tiền từ nước Việt Nam ngược lại - Khách du lịch người nước VN thuận tiện đỡ tốn chi phí, thời gian việc sử dụng dịch vụ thẻ VN KẾT LUẬN Khai phá liệu cơng cụ sử dụng để trích xuất thơng tin quan trọng từ liệu có cho phép định kinh doanh tốt ngành công nghiệp ngân hàng bán lẻ Họ sử dụng kho liệu để kết hợp liệu khác từ sở liệu thành định dạng chấp nhận từ tiến hành việc khai phá liệu Dữ liệu sau phân tích thơng tin thu hỗ trợ cho tổ chức định Kỹ thuật khai phá liệu hữu ích cho ngân hàng thực trình kinh doanh tốt hơn, thu hút khách hàng mới, phát gian lận, cung cấp sản phẩm dựa phân tích khách hàng để trì tốt mối quan hệ khách hàng Những ngân hàng nhận hữu ích khai phá liệu trình xây dựng mơi trường khai phá liệu có lợi ích to lớn cho q trình định họ chiếm lợi cạnh tranh đáng kể tương lai 42 Những kết đạt nghiên cứu: • Trình bày khái quát kĩ thuật khai phá liệu • Nêu lên phương pháp khai phá liệu đặc biệt phương pháp khai phá liệu dạng lưới, ứng dụng kĩ thuật vào hệ thống tài • Trình bày ứng dụng cụ thể kĩ thuật khai phá liệu dạng lưới vào hệ thống quản lý ngân hàng nay, nêu lên tiến vượt bậc ngành ngân hàng áp dụng kĩ thuật công nghệ vào trình xây dựng kinh doanh Bên cạnh kết đạt được, dù cố gắng hữu hạn thời gian kiến thức, nghiên cứu cịn số hạn chế: Chưa tìm hiểu sâu cách thức triển khai hệ thống dịch vụ sử dụng kĩ thuật khai phá liệu dạng lưới đơn vị tài ngân hàng, lý liên quan đến vấn đề bảo mật cạnh tranh công nghệ sử dụng đơn vị kinh doanh Bởi ngân hàng tham gia vào liên minh hệ thống Ngân hàng Nhà nước quản lý trang bị cho một hệ thống phân hệ nghiệp vụ ngân hàng tiền gửi, tiền vay, khách hàng Thông qua đó, ngân hàng phát triển thêm nhiều dịch vụ, sản phẩm quản lý nội chặt chẽ, hiệu 43 TÀI LIỆU THAM KHẢO [1] Mario Cannataro, Domenico Talia, Paolo Trunfio, Distributed data mining on the grid, Future Generation Computer Systems 18 (8) (2002) 1101–1112 [2] Ian Foster, Carl Kesselman, Jeffrey M Nick, Steve Tuecke, The Physiology of the Grid: An Open Grid Services Architecture for Distributed Systems Integration, Tech Report Globus Project, 2002 [3] Ian Foster, the anatomy of the Grid: Enabling scalable virtual organizations, Lecture Notes in Computer Science 2150 (2001) [4] Alberto S´anchez, Jos´e M Pe˜na S´anchez, Mar´ıa S P´erez, Victor Robles, Pilar Herrero, improving distributed data mining techniques by means of a grid infrastructure, in: OTM Workshops, in: LNCS, vol 3292, 2004, pp 111–122 [5] William Allcock, Joe Bester, John Bresnahan, Ann Chervenak, Lee Liming, Steve Tuecke, GridFTP: Protocol extensions to FTP for the Grid, Global Grid Forum Draft, 2001 [6] Giovanni Aloisio, Massimo Cafaro, Italo Epicoco, Early experiences with the gridftp protocol using the grb-gsiftp library, Future Generation Computer Systems 18 (8) (2002) 1053–1059 [7] Ian H Witten, Eibe Frank, Data Mining: Practical machine learning tools with Java implementations, Morgan Kaufmann, San Francisco, 2000 [8] Agrawal R & Srikant, R (1994, September) Fast Algorithms for Mining Association Rules In Proceedings of the 20th International Conference on Very Large Databases (VLDB’94), Santiago, Chile, 487-499 [9] Bauer, E., & Kohavi, R (1999) An empirical comparison of voting classification algorithms: Bagging, boosting, and variants Machine Learning, 36 (1-2), 105-139 [10] Dietterich, 2000; Opitz & Maclin, 1999; Bauer & Kohavi, 1999; Merz & Pazzani, 1999 44 ... dụng kĩ thuật lĩnh vực tài Tính sáng tạo: Đề tài nghiên cứu điểm mạnh tiềm kĩ thuật khai phá liệu dạng lưới vào lĩnh vực tài chính, lĩnh vực cần có can thiệp khoa học công nghệ khai phá liệu để...ĐẠI HỌC ĐÀ NẴNG TRƯỜNG CĐ CÔNG NGHỆ THÔNG TIN BÁO CÁO TỔNG KẾT ĐỀ TÀI KHOA HỌC VÀ CÔNG NGHỆ CẤP CƠ SỞ NGHIÊN CỨU ỨNG DỤNG KỸ THUẬT KHAI PHÁ DỮ LIỆU DẠNG LƯỚI TRONG LĨNH VỰC TÀI CHÍNH Mã... nghiên cứu: • Trình bày khái quát kĩ thuật khai phá liệu • Nêu lên phương pháp khai phá liệu đặc biệt phương pháp khai phá liệu dạng lưới, ứng dụng kĩ thuật vào hệ thống tài • Trình bày ứng dụng