NGHIÊN CỨU GIẢI PHÁP KHAI PHÁ DỮ LIỆU ĐẢM BẢO TÍNH RIÊNG TƯ VÀ ỨNG DỤNG TRONG BÀI TOÁN PHÂN LỚP DỮ LIỆU KHÁCH HÀNG CỦA NGÂN HÀNG NoNPTNT CHI NHÁNH HÀ TÂY

68 32 0
NGHIÊN CỨU GIẢI PHÁP KHAI PHÁ DỮ LIỆU ĐẢM BẢO TÍNH RIÊNG TƯ VÀ ỨNG DỤNG TRONG BÀI TOÁN PHÂN LỚP DỮ LIỆU KHÁCH HÀNG CỦA NGÂN HÀNG NoNPTNT CHI NHÁNH HÀ TÂY

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

HỌC VIỆN NGÂN HÀNG KHOA HỆ THỐNG THÔNG TIN QUẢN LÝ KHÓA LUẬN TỐT NGHIỆP ĐẠI HỌC NGHIÊN CỨU GIẢI PHÁP KHAI PHÁ DỮ LIỆU ĐẢM BẢO TÍNH RIÊNG TƯ VÀ ỨNG DỤNG TRONG BÀI TOÁN PHÂN LỚP DỮ LIỆU KHÁCH HÀNG CỦA NGÂN HÀNG NoN&PTNT CHI NHÁNH HÀ TÂY BÙI THỊ ANH THƯ HÀ NỘI – 2018 HỌC VIỆN NGÂN HÀNG KHOA HỆ THỐNG THƠNG TIN QUẢN LÝ KHĨA LUẬN TỐT NGHIỆP ĐẠI HỌC Đề tài: NGHIÊN CỨU GIẢI PHÁP KHAI PHÁ DỮ LIỆU ĐẢM BẢO TÍNH RIÊNG TƯ VÀ ỨNG DỤNG TRONG BÀI TOÁN PHÂN LỚP DỮ LIỆU KHÁCH HÀNG CỦA NGÂN HÀNG NoN&PTNT CHI NHÁNH HÀ TÂY Giảng viên hướng dẫn: ThS Vũ Duy Hiến Sinh viên thực hiện: Bùi Thị Anh Thư Lớp: HTTTA Mã sinh viên: 17A4040080 Khóa: K17 Hệ: Đại học quy HÀ NỘI – 2018 LỜI CẢM ƠN Trong suốt trình nghiên cứu hồn thành khóa luận tốt nghiệp, em nhận nhiều giúp đỡ động viên từ nhiều phía Lời đầu tiên, em xin gửi lời cảm ơn tới quý thầy cô khoa Hệ thống thông tin quản lý – Học viện Ngân hàng với tri thức tâm huyết để truyền đạt vốn kiến thức quý báu cho tất sinh viên em suốt thời gian qua Đặc biệt, em xin gửi lời cảm ơn chân thành tới thầy Vũ Duy Hiến, thầy người ln tận tâm, nhiệt tình hướng dẫn, bảo cho em suốt trình nghiên cứu giúp em hồn thiện tốt khóa luận Em xin gửi lời cảm ơn tới người bạn, người đồng hành em qua môn học giảng đường em vượt qua quãng đời sinh viên đầy ý nghĩa Và không cảm ơn tới nguồn động viên lớn nhất, gia đình, hậu phương vững ln bên cạnh em khó khăn, chia sẻ với em lúc em cần Và cuối cùng, em xin gửi lời cảm ơn sâu sắc tới Ngân hàng NoN&PTNT – Chi nhánh Hà Tây nói chung anh chị Phịng Tín dụng doanh nghiệp nói riêng tạo điều kiện giúp đỡ, cung cấp thông tin, giải đáp thắc mắc để em hồn thành khóa luận tốt nghiệp Em xin chân thành cảm ơn! LỜI CAM KẾT Tôi xin cam đoan cơng trình nghiên cứu khoa học độc lập riêng tơi Các số liệu sử dụng phân tích khóa luận có nguồn gốc rõ ràng, cơng bố theo quy định Các kết nghiên cứu khóa luận tơi tự tìm hiểu, phân tích cách trung thực, khách quan Các kết chưa công bố nghiên cứu khác Sinh viên Bùi Thị Anh Thư CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM Độc lập – Tự – Hạnh phúc ************* Hà Nội, ngày… tháng … năm 2018 GIẤY XÁC NHẬN THỰC TẬP Ngân hàng Nông nghiệp phát triển nông thôn – Chi nhánh Hà Tây Sinh viên: Bùi Thị Anh Thư Mã sinh viên: 17A4040080 Khoa: Hệ thống thông tin quản lý Trường: Học viện Ngân Hàng Đã hoàn thành đợt thực tập Ngân hàng NoN&PTNT – Chi nhánh Hà Tây Nhận xét đơn vị thực tập: …………………………………………………………………………………… …………………………………………………………………………………… …………………………………………………………………………………… …………………………………………………………………………………… ………… Điểm thực tập: … GIÁM ĐỐC (Ký tên đóng dấu) NHẬN XÉT (Của giảng viên hướng dẫn) …………………………………………………………………………………… …………………………………………………………………………………… …………………………………………………………………………………… …………………………………………………………………………………… …………………………………………………………………………………… …………………………………………………………………………………… …………………………………………………………………………………… …………………………………………………………………………………… …………………………………………………………………………………… …………………………………………………………………………………… …………………………………………………………………………………… …………………………………………………………………………………… …………………………………………………………………………………… …………………………………………………………………………………… …………………………………………………………………………………… …………………………………………………………………………………… …………………………………………………………………………………… …………………………………………………………………………………… …………………………………………………………………………………… …………………………………………………………………………………… …………………………………………………………………………………… …………………………………………………………………………………… …………………………………………………………………………………… …………………………………………………………………………………… …………………………………………………………………………………… …………………………………………………………………………………… …………………………………………………………………………………… …………………………………………………………………………………… …………………………………………………………………………………… …………………………………………………………………………………… …………………………………………………………………………………… …………………………………………………………………………………… MỤC LỤC DANH MỤC CHỮ VIẾT TẮT Chữ viết tắt Ý nghĩa Tiếng Anh Ý nghĩa Tiếng Việt CBTD Cán tín dụng CNTT Công nghệ thông tin CSDL Cơ sở liệu DN Doanh nghiệp Doanh nghiệp có vốn đầu từ nhà nước DNĐTNN DNNN Doanh nghiệp nhà nước DNNQD Doanh nghiệp quốc doanh NoN&PTN T Nông nghiệp phát triển nông thôn PPDM Privacy Mining Preserving Data Khai phá liệu đảm bảo tính riêng tư PLKH SMC Phân lớp khách hàng Secure Computation Multiparty Phương pháp tính tốn bảo mật nhiều thành viên XHTD Xếp hạng tín dụng DANH MỤC HÌNH ẢNH 10 Khóa luận tốt nghiệp Nghiên cứu giải pháp PPDM ứng dụng toán phân lớp liệu khách hàng − Nếu Vốn 30-40, Lao động 500-1000, Nộp ngân sách 7-10, Lĩnh vực Nông-lâm-ngư nghiệp hạng A − Nếu Vốn 30-40, Lao động 1000-1500, Quy mơ Vừa hạng A − Nếu Vốn 30-40, Lao động 1000-1500, Quy mơ Lớn hạng AA  Xét nhánh Vốn 40-50: − Nếu Vốn 40-50, Nộp ngân sách 3-5 hạng BB − Nếu Vốn 40-50, Nộp ngân sách 5-7, Doanh thu 20-50 hạng BBB − Nếu Vốn 40-50, Nộp ngân sách 5-7, Doanh thu 50-100 hạng A − Nếu Vốn 40-50, Nộp ngân sách 5-7, Doanh thu 100-200 hạng AA − Nếu Vốn 40-50, Nộp ngân sách 7-10, Lao động 100-500 hạng A − Nếu Vốn 40-50, Nộp ngân sách 7-10, Lao động 500-1000 hạng AA − Nếu Vốn 40-50, Nộp ngân sách 7-10, Lao động 1000-1500 hạng A − Nếu Vốn 40-50, Nộp ngân sách 7-10, Lao động >1500 hạng AA − Nếu Vốn 40-50, Nộp ngân sách >10, Loại hình sở hữu DNNN hạng A − Nếu Vốn 40-50, Nộp ngân sách >10, Loại hình sở hữu DNNQD hạng A − Nếu Vốn 40-50, Nộp ngân sách >10, Loại hình sở hữu DNĐTNN, Quy mơ Vừa hạng A − Nếu Vốn 40-50, Nộp ngân sách >10, Loại hình sở hữu DNĐTNN, Quy mơ Lớn hạng AA  Xét nhánh Vốn >50: − Nếu Vốn >50, Lao động 100-500 hạng BB − Nếu Vốn >50, Lao động 500-1000 hạng AA − Nếu Vốn >50, Lao động 1000-1500, Nộp ngân sách 5-7 hạng AA − Nếu Vốn >50, Lao động 1000-1500, Nộp ngân sách 7-10 hạng BBB − Nếu Vốn >50, Lao động 1000-1500, Nộp ngân sách >10, Lĩnh vực Công nghiệp hạng BBB − Nếu Vốn >50, Lao động 1000-1500, Nộp ngân sách >10, Lĩnh vực Nơng-lâm-ngư nghiệp hạng A − Nếu Vốn >50, Lao động 1000-1500, Nộp ngân sách >10, Lĩnh vực Thương mại & dịch vụ hạng A − Nếu Vốn >50, Lao động >1500, Doanh thu 100-200 hạng A Bùi Thị Anh Thư – K17HTTTA 54 Khóa luận tốt nghiệp Nghiên cứu giải pháp PPDM ứng dụng toán phân lớp liệu khách hàng − Nếu Vốn >50, Lao động >1500, Doanh thu >200 hạng AA 4.5 Nhận xét Tác giả xây dựng phiên với liệu phân tán khơng u cầu đảm bảo bí mật thông tin riêng tư để so sánh với phiên u cầu nghiêm ngặt đảm bảo bí mật thơng tin riêng tư Sau thực thi chương trình, tác giả thu nhận thời gian chạy chương trình khơng u cầu đảm bảo bí mật thơng tin riêng tư 4.18 giây Cịn thời gian chạy chương trình u cầu nghiêm ngặt đảm bảo bí mật thơng tin riêng tư khoảng 10 phút Như vậy, thời gian chạy chương trình yêu cầu nghiêm ngặt đảm bảo bí mật thơng tin riêng tư lớn khơng q lớn có khả ứng dụng cao Hơn nữa, giải pháp đảm bảo thông tin riêng tư liệu giữ bí mật Thời gian thực thi 10 phút hai nguyên nhân chính, thứ chưa song song hóa thuật tốn cho thành viên, thứ hai số giá trị thuộc tính nhiều đặc biệt thuộc tính phân lớp nhận 10 loại nhãn Thời gian giảm n lần song song hóa với n số thành viên Thời gian không tăng lên nhiều số ghi thành viên nắm giữ tăng lên thành viên thực phép đếm đơn giản liệu sở hữu Sau thu luật kết hợp từ chương trình, tác giả thực so sánh kết sử dụng phần mềm RapidMiner – phần mềm chuyên dùng để thực KPDL Kết chương trình thực nghiệm tương đồng với kết từ phần mềm RapidMiner Vì vậy, kết chương trình trả xác đảm bảo Bùi Thị Anh Thư – K17HTTTA 55 Khóa luận tốt nghiệp Nghiên cứu giải pháp PPDM ứng dụng toán phân lớp liệu khách hàng KẾT LUẬN Sau ba tháng học tập, nghiên cứu, thực tập ngân hàng NoN&PTNT – Chi nhánh Hà Tây, tác giả học hỏi trau dồi nhiều kiến thức bổ ích hoạt động chấm điểm tín dụng, nắm kiến thức giao thức giải pháp khai phá liệu đảm bảo tính riêng tư Từ hoạt động nghiên cứu, tác giả lựa chọn đề tài khóa luận tốt nghiệp là: “Nghiên cứu giải pháp khai phá liệu đảm bảo tính riêng tư ứng dụng toán phân lớp liệu khách hàng Ngân hàng NoN&PTNT – Chi nhánh Hà Tây” Sau q trình nghiên cứu tìm hiểu, khóa luận đạt kết sau: − Trong khóa luận này, tác giả xác định tốn mang tính thời đơn vị thực tập nói riêng ngành ngân hàng Việt Nam nói chung Với nhu cầu khám phá thơng tin có giá trị từ liệu lớn, vấn đề cấp thiết cần có phương pháp khai phá liệu mà đảm bảo tính riêng tư thơng tin − Dựa nghiên cứu cải tiến giao thức tính tốn bảo mật nhiều thành viên, tác giả đề xuất cải tiến giải pháp giúp tăng hiệu mà đảm bảo tính riêng tư thông tin − Đề xuất số giải pháp đảm bảo tính riêng tư cho q trình xây dựng mơ hình phân lớp khách hàng doanh nghiệp Ngân hàng NoN&PTNT – Chi nhánh Hà Tây Mô tả giải pháp cụ thể cho thuật toán phân lớp ID3 với kịch liệu phân tán dọc phân tán ngang − Tiến hành thực nghiệm, dựa giải pháp PPDM cho thuật toán ID3 với liệu phân tán ngang, tác giả xây dựng thành cơng mơ hình phân lớp khách hàng với kịch có ba chi nhánh hợp tác để xây dựng lên mơ hình phân lớp Kết thực nghiệm trình bày chương chứng tỏ đề xuất cải tiến tác giả có hiệu Khóa luận giải vấn đề đặt ra, nhiên, khóa luận cịn số hạn chế sau: − Do khn khổ khóa luận thời gian nghiên cứu, khóa luận xây dựng mơ hình phân lớp dựa kịch liệu phân tán ngang − Chương trình viết dựa thuật toán phân lớp ID3 nên sử dụng cho thuật toán − Thời gian thực thi chương trình cịn chậm Bùi Thị Anh Thư – K17HTTTA 56 Khóa luận tốt nghiệp Nghiên cứu giải pháp PPDM ứng dụng toán phân lớp liệu khách hàng − Bộ liệu mẫu sử dụng để huấn luyện có số lượng ghi nên kết thực nghiệm cịn chưa hồn tồn xác Từ mặt hạn chế trên, tác giả đề xuất hướng phát triển đề tài sau: − Tập hợp, thu thập nhiều liệu hơn, sở phân tích đánh giá xác hiệu giải pháp − Cải tiến hồn thiện để chương trình đạt tốc độ nhanh Từ đó, giúp ngân hàng sử dụng phần mềm vào việc xếp hạng tín dụng − Trong thời gian tới, tác giả tiếp tục nghiên cứu giải pháp cho số kịch khai phá liệu đảm bảo tính riêng tư − Bùi Thị Anh Thư – K17HTTTA 57 − − − Chỉ tiêu Chỉ tiêu khoản − Khả toán ngắn hạn − Khả toán nhanh − Chỉ tiêu hoạt động − − − − − − − − B − − − − − − − − C − − − − − − − D − − Kỳ thu tiền bình quân − Hiệu sử dụng tài sản − Chỉ tiêu cân nợ (%) Nợ phải trả/ tổng tài sản − − − − − − − − − − − − − − − − − − − − 1.1 0.8 0.6 − − − − − − % 2.1 10 % − 3 − − − 10 − 11 − − − − Tổng thu nhập trước thuế/ doanh thu Tổng thu nhập trước thuế/ tổng tài sản Tổng thu nhập trước thuế/ nguồn vốn chủ sở hữu − − Tổng − − − − % − 2.5 − − − − 10 8.5 7.6 − − − 4.5 % 10 − − % 0% − − 3.5 − −

Ngày đăng: 17/02/2022, 10:37

Mục lục

    DANH MỤC CHỮ VIẾT TẮT

    DANH MỤC HÌNH ẢNH

    DANH MỤC BẢNG BIỂU

    CHƯƠNG 1: TỔNG QUAN VỀ HỆ THỐNG XẾP HẠNG TÍN DỤNG VÀ ĐẢM BẢO TÍNH RIÊNG TƯ TRONG KHAI PHÁ DỮ LIỆU

    1.1. Khai phá dữ liệu đảm bảo tính riêng tư

    1.1.2. Các bài toán Khai phá dữ liệu đảm bảo tính riêng tư

    1.2. Tổng quan về hệ thống xếp hạng tín dụng

    1.2.1. Định nghĩa của xếp hạng tín dụng

    1.2.2. Sự cần thiết của xếp hạng tín dụng

    1.2.3. Nguyên tắc và quy trình xếp hạng tín dụng

Tài liệu cùng người dùng

Tài liệu liên quan