Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 46 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
46
Dung lượng
1,32 MB
Nội dung
HỌC VIỆN NGÂN HÀNG KHOA HỆ THỐNG THÔNG TIN QUẢN LÝ CHUYÊN ĐỀ TỐT NGHIỆP ỨNG DỤNG KHAI PHÁ DỮ LIỆU HỖ TRỢ RA QUYẾT ĐỊNH CHO VAY TRONG HOẠT ĐỘNG TÍN DỤNG TẠI NGÂN HÀNG PV BANK Sinh viên thực : Nguyễn Thu Hường Lớp : K18HTTTC Khóa học : 2015-2019 Mã sinh viên : 18A4040108 Giảng viên hướng dẫn: PGS TS Ngô Thùy Linh HÀ NỘI – NĂM 2019 LỜI CAM ĐOAN Em xin cam đoan số liệu sử dụng phân tích báo cáo chuyên đề thực tập tốt nghiệp có nguồn gốc rõ ràng, công bố theo quy định Các kết nghiên cứu em tự tìm hiểu, phân tích cách trung thực, khách quan Các kết chưa công bố nghiên cứu khác Sinh viên Nguyễn Thu Hường LỜI CẢM ƠN Lời đầu tiên, em xin bày tỏ lòng biết ơn sâu sắc đến thầy cô trường Học viện Ngân hàng đặc biệt thầy cô khoa Hệ thống thông tin quản lý hết lòng dạy dỗ, truyền đạt chia sẻ cho em kinh nghiệm, kiến thức quý báu suốt thời gian học tập rèn luyện trường Với vốn kiến thức tiếp thu trình học khơng tảng cho q trình nghiên cứu chuyên đề mà hành trang quý báu để em để bước vào đời cách vững tự tin Và đặc biệt nữa, em xin gửi lời cảm ơn chân thành tới cô Ngơ Thùy Linh – người tận tình bảo, định hướng, đưa lời khuyên vô quý báu để em hồn thành chun đề Bên cạnh đó, e xin cảm ơn bố mẹ, anh chị, bạn bè người thân yêu ủng hộ, động viên, chia sẻ, giúp đỡ lúc em gặp khó khăn, nản lòng cảm thấy chùn bước để em hồn thành tốt báo cáo Cuối em xin kính chúc q thầy dồi sức khỏe thành công nghiệp cao q Trong q trình thực hồn thành báo cáo tốt nghiệp tránh khỏi thiếu xót, hạn chế, em mong nhận bảo, nhận xét đóng góp ý kiến từ thầy cơ, bạn bè để báo cáo hoàn thiện Em xin chân thành cảm ơn! MỤC LỤC DANH MỤC CÁC CHỮ VIẾT TẮT Từ viết tắt Ý nghĩa CSDL Cơ sở liệu KPDL Khai phá liệu PV BANK Ngân hàng thương mại cổ phần Đại Chúng Việt Nam TMCP Thương mại cổ phần CNTT Công nghệ thông tin NHTM Ngân hàng thương mại DANH MỤC BẢNG BIỂU MỞ ĐẦU Nền kinh tế đà phát triển nên nhu cầu vốn cá nhân tổ chức ngày phong phú Nhằm mở rộng quy mô sản xuất kinh doanh vấn đề dùng ngày cao nên việc vay vốn khách hàng lớn Do đó, đóng vai trò trung gian, ngân hàng PV Bank tạo điều kiện cho cá nhân, doanh nghiệp vay vốn dễ dàng hơn, đáp ứng nhu cầu họ việc phát triển kinh tế Sự phát triển công nghệ thông tin ngày lớn để ứng dụng nhiều lĩnh vực ngân hàng, truyền thông, quảng cáo,… tạo điều kiện tốt giúp giải khó khăn dùng công nghệ thông tin để phát triển mạnh mẽ lĩnh vực Đặc biệt phần mềm khai phá liệu người ta sản xuất nhiều để họ giải vấn đề Ngành ngân hàng bắt đầu nhận cần thiết kỹ thuật khai phá liệu, kỹ thuật giúp họ cạnh tranh thị trường Đồng thời với số lượng khách hàng vay vốn lớn việc quản lý phức tạp để quản lý khách hàng dễ dàng phản ánh tình trạng vay vốn, phân tích nhu cầu khách hàng người ta ứng dụng phần mềm khai phá liệu vào lĩnh vực Với tầm quan trọng việc khai phá liệu, việc phân tích nhu cầu khách hàng, em định lựa chọn nghiên cứu đề tài: “ Ứng dụng khai phá liệu dự đốn tài hoạt động cho vay vốn ngân hàng PV Bank ” làm đề tài báo cáo chuyên đề thực tập tốt nghiệp với mong muốn tìm hiểu KPDL định ứng dụng ngành ngân hàng CHƯƠNG 1: GIỚI THIỆU TỔNG QUAN VỀ BÀI TOÁN NGHIÊN CỨU 1.1 Giới thiệu đơn vị thực tập 1.1.1 Sự hình thành phát triển Ngân hàng TMCP Đại Chúng Việt Nam (PVcomBank) thành lập theo Quyết định số 279/GP-NHNN ngày 16/09/2013 Ngân hàng Nhà nước Việt Nam sở hợp Tổng cơng ty Tài cổ phần Dầu khí Việt Nam (PVFC) Ngân hàng TMCP Phương Tây (WesternBank) Ngày 01/10/2013, PVcomBank thức hoạt động sở Giấy chứng nhận đăng ký doanh nghiệp công ty cổ phần, mã số doanh nghiệp 0101057919 Sở Kế hoạch Đầu tư thành phố Hà Nội cấp PVcomBank có tổng tài sản đạt 100.000 tỷ đồng, vốn điều lệ 9.000 tỷ đồng, cổ đơng lớn Tập đồn Dầu khí Việt Nam (chiếm 52%) cổ đơng chiến lược Morgan Stanley (6,7%) Với mạng lưới 116 điểm giao dịch tỉnh thành trọng điểm toàn quốc; nguồn nhân lực chất lượng cao bề dày kinh nghiệm cung cấp dịch vụ cho doanh nghiệp ngành Dầu khí, lượng, hạ tầng, PVcomBank cung cấp sản phẩm dịch vụ đa dạng đáp ứng đầy đủ nhu cầu khách hàng tổ chức cá nhân Với hiệu hành động “Ngân hàng không khoảng cách”, PVcomBank hướng tới việc xây dựng hình ảnh Ngân hàng gần gũi, thân thiện, tận tụy, thành cơng khách hàng, lấy lợi ích khách hàng – đối tác làm mục tiêu hành động, đồng thời thực tốt trách nhiệm xã hội doanh nghiệp, mang lại lợi ích cho cộng đồng gia tăng giá trị cho cộng đồng 1.1.2 Bộ máy tổ chức Hình 1: Bộ máy tổ chức ngân hàng PV Bank Trong đó: Đại hội cổ đông: giống công ty cổ phần, đại hội cổ đông bao gồm tất cổ đông, quan có định cao ngân hàng Đại hội cổ đơng có quyền nhiệm vụ sau: định loại cổ phần tổng số cổ phần, bầu miễn nhiệm, bãi miễn nhiệm thành viên hội đồng quản trị, thơng qua báo cáo tài hàng năm, thông qua định hướng phát triển ngân hàng Hội đồng quản trị: có quyền nhân danh ngân hàng định vấn đề liên quan đến mục đích, quyền lợi ngân hàng, trừ vấn đề thuộc thẩm quyền đại hội cổ đơng Hội đồng tín dụng ban tín dụng: có nhiệm vụ xem xét, phê duyệt định cấp tín dụng với hạn mức tín dụng Ban kiểm sốt: có nhiệm vụ kiểm tra tính hợp lý, hợp pháp quản lý, điều hành hoạt động kinh doanh, ghi chép sổ sách kế tốn báo cáo tài chính, thẩm định báo cáo tài hàng năm ngân hàng, báo cáo với hội đồng quản trị kết hoạt động, định kiến nghị lên Đại hội cổ đơng Cơ cấu phòng ban chi nhánh cấp I bao gồm: Phòng kiểm tra kiểm tốn nội bộ: chức kiểm tra chủ yếu phòng kiểm tra, kiểm toán nội chứng từ, hồ sơ nghiệp vụ phát sinh để kiến nghị kịp thời biện pháp khắc phục tồn thiếu sót hoạt động kinh doanh đảm bảo an tồn hiệu Phòng phục vụ khách hàng doanh nghiệp: thực chức nghiên cứu thị trường, tìm hiểu khách hàng, đề xuất sách tiếp thị sản phẩm phù hợp với đối tượng khách hàng, hướng dẫn khách hàng Phòng phục vụ khách hàng cá nhân: có chức nhiệm vụ sau: hướng dẫn triển khai, thực sản phẩm dịch vụ cá nhân thống toàn chi nhánh, lập kế hoạch cho vay, thu nợ tín dụng cá nhân tồn chi nhánh, thực nhiệm vụ phân tích vay,… đề xuất điều chỉnh quy định hợp đồng tín dụng cho phù hợp với thực tế địa bàn chi nhánh hoạt động Phòng thẩm định tài sản: đảm bảo thực việc thẩm định đánh giá chấp Xây dựng hoàn thiện hệ thống chuẩn mực việc định giá tài sản cầm cố chấp cho phù hợp với tình hình thực tế đảm bảo an tồn cho ngân hàng Phòng giao dịch kho quỹ: thực nghiệp vụ giao dịch với khách hàng chào đón, giới thiệu, tư vấn, tiếp nhận tiền gửi khách hàng, tiền huy động vốn ngân hàng, thu đổi ngoại tệ, quản lý loại tài khoản dùng giao dịch khách hàng Phòng thu hồi nợ: lập kế hoạch thực thu hồi nợ hạn duyệt, liên hệ với quan, tòa án, viện kiểm sốt, phòng thi hành án, cơng an, luật sư… việc xử lý, giải vấn đề thu hồi nợ chi nhánh Phòng kế toán ngân quỹ: tổ chức hạch toán theo dõi quỹ, vốn tập trung ngân hàng, thực hạch toán nghiệp vụ huy động vốn, cho vay nghiệp vụ kinh doanh khác 10 Hình : Giao diện Weka Explorer 3.1.6 Sử dụng phần mềm Weka để giải toán 3.1.6.1 Thu thập tiền xử lý liệu Bộ liệu sử dụng tác giả thu thập tổng hợp qua phiếu điều tra, khảo sát thông tin khách hàng cho vay Ngân hàng TMCP PV Bank Dữ liệu tổng hợp lưu trữ dạng file.excel.xls, sau chuyển đổi sang dạng csv (file thongtinKH.csv) hai dạng liệu mà Weka cho phép xử lý Số mẫu file liệu thông tin 600 khách hàng Các thuộc tính ( bao gồm 12 thuộc tính) là: Cụ thể, nguồn liệu bankdata.csv: ID: Mã khách hàng, Age: Tuổi khách hàng, Sex: Giới tính (Male/ Female) , Married: Tình trạng kết (Y/N), Region: khu vực cư trú, Income: Thu nhập, Children: Số con, Car ( Xe hơi) , Save_act: Khách hàng có tài khoản tiết kiệm không (Y/N), Current_act: Tài khoản (Y/N), Mortage: Thế chấp (Y/N), Pep: Khách hàng có kế hoạch trả nợ không( personal equity plan) Loại bỏ thuộc tính ID thuộc tính khơng dùng mơ hình Bước1: Mở file liệu bankdata.csv Sau khởi động Weka, chọn Explore->Preproces-> Open file, sau chọn đường dẫn đến file bankdata.csv 32 Hình 9: Bảng liệu bankdata.csv Trong file liệu bank-data.csv, khách hàng xác định thuộc tính id Chúng ta cần loại bỏ thuộc tính trước thực bước Association Rule Mining Công việc thực dễ dàng Weka sau: Hình 10: Loại bỏ thuộc tính Bước 2: Sau nạp liệu trên, ta tiến hành lọc liệu Trong file bankdata.csv ta cần loại bỏ thuộc tính ID cách : Trong fitter->Choose-> filters>unsupervised-> attribute-> remove: 33 Hình 11: Bảng chọn remove Bước 3: bấm vào textbox bên phải nút “Choose” gỏ vào (đây index thuộc tính id file liệu) Chú ý tùy chọn "invertSelection" phải thiết lập false Hình 12: Loại bỏ thuộc tính ID Bước 4: Bấm ” Appy “ để tạo liệu với 11 thuộc tính sau loại bỏ thuộc tính ID 34 Hình 13: Hình sau loại bỏ thuộc tính ID Hình 14: Nội dung file “ bankdata.arff ’’ Khi thuộc tính ID bị loại tất giá trị trường ID ghi bị loại 35 3.2 Xây dựng mơ hình thử nghiệm Bước 1: Chọn menu Process để vào panel lấy nguồn thử nghiệm Bước 2: Click Open file để đến vị trí nguồn liệu chọn file “ bankdata.arff ’’ Hình 15: Mơ hình thử nghiệm Trước tiến hành, ta phải lựa chọn chế độ kiểm thử để xây dựng tập kiểm thử tập huấn luyện Weka tiến hành chế độ kiểm thử: Use training set (Sử dụng tập huấn luyện): Sử dụng tập training data để tiến hành kiểm thử Supplied test set (Tập hỗ trợ kiểm thử): Sử dụng tập liệu khác để kiểm thử Cross-validation (Đánh giá chéo): chia liệu thành nhiều phần (Folds) để thực thành nhiều lần đánh giá kết Số phần chia mặc định 10 Percentage split (Tách theo tỷ lệ): chia liệu thành hai phần theo tỷ lệ %, phần dùng để xây dựng mơ hình, phần lại dành cho kiểm thử Bước 3: Sử dụng chế độ kiểm thử ->Choose-> trees-> J48-> Start Kết thu 36 “Use training set” Chọn Classify Hình 16: Kết thử nghiệm dạng text Đánh giá: Với tập liệu vừa chạy - Trường hợp phân lớp xác: 177 (chiếm 86,7647%) Đây mức độ xác cao Điều cho thấy sử dụng thuật toán để xây dựng định chuẩn xác Các sai số có thơng số nhỏ - Trường hợp phân lớp khơng xác: 27 (chiếm 13.2353 %) Kết dạng Hình 17: Kết dạng 3.3.3 Rút kết luận từ định 37 Hình 18: Các luật sinh từ phần mềm Weka Rule1: if children