Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 54 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
54
Dung lượng
253,91 KB
Nội dung
ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ Đỗ Thành Huy TÌM HIỂU ỨNG DỤNG CỦA SVM VÀ GA TRONG PHÂN TÍCH DỮ LIỆU LENDING CLUB KHĨA LUẬN TỐT NGHIỆP ĐẠI HỌC HỆ CHÍNH QUY Ngành : Hệ thống thông tin Hà Nội - 2020 ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ Đỗ Thành Huy TÌM HIỂU ỨNG DỤNG CỦA SVM VÀ GA TRONG PHÂN TÍCH DỮ LIỆU LENDING CLUB KHĨA LUẬN TỐT NGHIỆP ĐẠI HỌC HỆ CHÍNH QUY Ngành : Hệ thống thông tin Cán hướng dẫn: TS Hà Văn Sang Cán đồng hướng dẫn: PGS.TS Nguyễn Hà Nam Hà Nội - 2020 TĨM TẮT Tóm tắt: Khai phá liệu phương pháp hiệu để đánh giá rủi ro với hình thức tín dụng truyền thống Với phát triển cho vay ngang hàng giới năm gần đây, kỹ thuật khai phá liệu áp dụng để đánh giá rủi ro khoản vay sàn cho vay ngang hàng Khóa luận đề xuất sử dụng giải thuật di truyền để lựa chọn tham số tốt cho hàm kernel thuật toán máy vec tơ hỗ trợ, cho phép thuật toán phát tốt khoản vay khơng có khả hồn lại liệu Lending Club Từ khóa: máy vec tơ hỗ trợ, phân lớp, giải thuật di truyền, khai phá liệu LỜI CAM ĐOAN Tôi xin cam đoan khóa luận “Tìm hiểu ứng dụng SVM GA phân tích liệu Lending Club” cơng trình nghiên cứu riêng tơi, khơng chép lại người khác Trong toàn nội dung khóa luận, điều trình bày cá nhân tơi tổng hợp từ nhiều nguồn tài liệu Tất nguồn tài liệu có xuất xứ rõ ràng hợp pháp Tơi xin hồn tồn chịu trách nhiệm chịu hình thức kỷ luật theo quy định cho lời cam đoan Hà Nội, ngày 29 tháng năm 2020 Sinh viên Đỗ Thành Huy LỜI CẢM ƠN Trước tiên xin dành lời cảm ơn chân thành sâu sắc đến thầy giáo, PGS TS Nguyễn Hà Nam TS Hà Văn Sang – người hướng dẫn, khuyến khích, bảo tạo cho điều kiện tốt từ bắt đầu hồn thành cơng việc Tơi xin dành lời cảm ơn chân thành tới thầy cô giáo khoa Công nghệ thông tin, trường Đại học Công nghệ - Đại học Quốc gia Hà Nội tận tình đào tạo, cung cấp cho tơi kiến thức vô quý giá tạo điều kiện tốt cho tơi suốt q trình học tập, nghiên cứu trường Đồng thời xin cảm ơn tất người thân u gia đình tơi tồn thể bạn bè người ln giúp đỡ, động viên tơi vấp phải khó khăn, bế tắc Cuối cùng, xin chân thành cảm ơn bạn bè Đại học Công nghệ Đại học Quốc gia Hà Nội đồng hành, trợ giúp suốt trình học tập Mục lục Chương 1: Đặt vấn đề 1.1 Giới thiệu cho vay ngang hàng 1 1.2 Sự phát triển cho vay ngang hàng vấn đề đánh giá rủi ro tín dụng mạng cho vay ngang hàng 1.3 Một số nghiên cứu liên quan phương pháp đề xuất khóa luận Chương 2: Cơ sở lý thuyết 2.1 Khai phá liệu 6 2.1.1 Nhu cầu khai phá liệu 2.1.2 Khái niệm khai phá liệu 2.1.3 Các tốn điển hình ứng dụng khai phá liệu 2.1.4 Ứng dụng khai phá liệu đánh giá tín dụng sàn cho vay ngang hàng 2.2 Một số phương pháp phân lớp 10 2.2.1 Kiến thức sở toán phân lớp 10 2.2.2 Cây định 11 2.2.3 Naive Bayes 12 2.2.4 Mạng nơ ron nhân tạo 13 2.2.5 Rừng ngẫu nhiên (Random Forest) 15 2.2.6 Máy vectơ hỗ trợ (Support Vector Machine - SVM) 17 2.3 Một số thuật tốn tìm kiếm giải pháp tối ưu 19 2.3.1 Tối ưu bầy đàn (Particle Swarm Optimization - PSO) 19 2.3.2 Giải thuật luyện kim (Simulated Annealing - SA) 20 2.3.3 Giải thuật di truyền (Genetic Algorithm - GA) 22 Chương 3: Mô hình đề xuất 25 3.1 Mơ tả tốn 25 3.2 Cấu trúc phương pháp xây dựng mơ hình đề xuất 26 3.2.1 Hệ thống lựa chọn tham số sử dụng thuật toán di truyền 27 3.2.2 Hệ thống phân lớp khoản vay sử dụng thuật toán SVM 29 Chương 4: Thực nghiệm kết 31 4.1 Công cụ hỗ trợ 31 4.2 Dữ liệu thực nghiệm 31 4.3 Kết thực nghiệm theo phương pháp đề xuất 33 4.4 Kết thực nghiệm với mơ hình SVM không tối ưu tham số 34 4.5 Kết thực nghiệm với mơ hình phân lớp khác 35 4.6 So sánh đánh giá kết 35 Chương 5: Kết luận 37 Tài liệu tham khảo 38 DANH MỤC THUẬT NGỮ Từ viết tắt Từ đầy đủ Ý nghĩa GA Genetic Algorithm Giải thuật di truyền P2P Peer-to-Peer Mạng ngang hàng RF Random Forest Rừng ngẫu nhiên SVM Support Vector Machine Máy vectơ hỗ trợ SVM-P-GA Mô hình máy vectơ hỗ trợ sử dụng hàm kernel Polynomial tham số giải thuật di truyền lựa chọn SVM-RB-GA Mơ hình máy vectơ hỗ trợ sử dụng hàm kernel Radial Basis tham số giải thuật di truyền lựa chọn SVM-S-GA Mơ hình máy vectơ hỗ trợ sử dụng hàm kernel Sigmoid tham số giải thuật di truyền lựa chọn Chương 1: Đặt vấn đề 1.1 Giới thiệu cho vay ngang hàng Những năm gần đây, nhiều ý tưởng kinh doanh xây dựng dựa mạng ngang hàng (P2P) đem lại cho xã hội nhiều tiện ích lĩnh vực vận tải (Uber, Grab), hàng hóa (Amazon, Ebay), bất động sản, v.v Một mơ hình kinh doanh trực tuyến cho vay ngang hàng phát triển mạnh năm gần giới thu hút ý Việt Nam lợi ích rõ ràng mà mang lại Các thị trường tồn mơ hình kinh doanh theo mạng ngang hàng cho phép người mua bán giao dịch hàng hóa dịch vụ cụ thể Tuy nhiên, cho vay mạng ngang hàng không trao đổi dịch vụ sản phẩm hữu hình mà trao đổi tiền, người vay người cho vay cho mượn khoản tiền, tương lai, số tiền phải hoàn trả đầy đủ kèm theo tiền lãi dựa mức lãi suất bên thỏa thuận Hình thức tín dụng cho vay ngang hàng loại bỏ trung gian tài Ngân hàng khỏi quy trình vay - cho vay, người vay tiền người có tiền kết nối trực tiếp với thơng qua việc thỏa thuận trực tiếp khiến phù hợp với cá nhân tổ chức nhỏ lẻ Các sàn cho vay ngang hàng trực tuyến nơi thành viên có nhu cầu vay tiền đăng ký khoản vay, thành viên có khả cho vay xem xét thông tin khoản vay thơng tin cá nhân, lịch sử tín dụng người vay để định có đầu tư vào khoản vay khơng, có số tiền đầu tư Sau nhận tiền, người vay có nghĩa vụ trả khoản lãi định kỳ trả lại toàn số tiền gốc cho chủ nợ đáo hạn Quá trình từ lúc người vay phát sinh nhu cầu vay đến khoản vay hồn trả mơ tả sau: Để tạo tham số có khả đem lại kết phân lớp tốt so với tham số cũ, giải thuật di truyền thực thao tác chọn lọc, lai ghép đột biến Trong đó, thao tác đóng góp ý nghĩa việc tạo tham số tốt Thao tác chọn lọc nhằm mục đích giữ lại tham số tốt quần thể cũ, tạo sở cho việc xây dựng tham số tốt hệ Khóa luận sử dụng phương pháp phương pháp phổ biến chọn lọc theo khả thỏa mãn hàm mục tiêu (Fitness Proportionate Selection) Theo phương pháp này, tham số có xác suất lựa chọn tỷ lệ thuận với độ nhạy với nhãn “rủi ro” mơ hình phân lớp khoản vay mà sử dụng để xây dựng Như vậy, tham số tạo mơ hình có khả phát khoản vay xấu tốt có nhiều khả lựa chọn để lai ghép tạo tham số Với cách lựa chọn vậy, theo thời gian, tham số sau tạo mơ hình đạt độ nhạy với nhãn “rủi ro” cao Sau chọn lọc, giải thuật di truyền hệ thống lựa chọn tham số thực lai ghép để tạo tham số dựa tham số lựa chọn phương pháp số học cục (Local Arithmetic Crossover) Phương pháp tạo nhiễm sắc thể tham số cách tính tốn số học dựa nhiễm sắc thể tham số cha mẹ phương trình (3.1) (3.1) Trong chọn ngẫu nhiên đoạn [0;1] giá trị tham số (gene), x y giá trị tham số tham số cha mẹ 31 Hình 3.3 Minh họa Local Arithmetic Crossover Cuối cùng, nhằm tạo đa dạng quần thể tránh tối ưu cục bộ, thuật toán di truyền thực thao tác đột biến Khóa luận sử dụng kỹ thuật đột biến đồng ngẫu nhiên (Uniform Random Mutation) Trong đó, gene ngẫu nhiên từ nhiễm sắc thể gán giá trị nằm khoảng giá trị ngẫu nhiên, từ tạo nhiễm sắc thể Hình 3.4 Minh họa Uniform Random Mutation Bộ tham số sau sử dụng để huấn luyện kiểm chứng mơ hình SVM 3.2.2 Hệ thống phân lớp khoản vay sử dụng thuật tốn SVM Trong mơ hình đề xuất, hệ thống sử dụng thuật toán SVM bên cạnh việc thực nhiệm vụ phân lớp khoản vay cịn đóng vai trò cung cấp đầu vào cho hàm mục tiêu hệ thống lựa chọn tham số Hệ thống áp dụng kernel polynomial, radial basis sigmoid, sử dụng tham số mà thuật toán di truyền tạo để thực huấn luyện kiểm thử mơ hình phân lớp Bộ liệu huấn luyện chia thành phần để thực kiểm chứng chéo, theo đó, q trình huấn luyện mơ hình chia thành giai đoạn Tại giai đoạn, chọn tập liệu gốc làm tập kiểm thử, sử dụng tập lại làm liệu huấn luyện Sau tập sử dụng làm liệu kiểm thử, cách tính giá trị trung bình độ nhạy với nhãn “rủi ro” mơ hình con, ta thu hiệu phân lớp tồn mơ hình Chỉ số sau hàm mục tiêu hệ thống lựa chọn tham số đánh giá, chưa đạt điều kiện dừng, giải thuật di truyền tạo tham số mới, cung cấp cho hệ thống phân lớp thực lại trình huấn luyện, kiểm thử 32 33 Chương 4: Thực nghiệm kết 4.1 Cơng cụ hỗ trợ Các thử nghiệm khóa luận thực ngôn ngữ môi trường mơ tả bảng 4.1 Bảng 4.1 Cấu hình mơi trường thử nghiệm Cấu hình Chi tiết Phần cứng CPU Intel(R) Xeon(R) CPU @ 2.30GHz, RAM DDR4 16GB Hệ điều hành Linux 4.9.0-5-amd64 Ngôn ngữ R version 3.6.3 R hệ thống tính tốn trực quan hóa liệu thống kê, bao gồm ngơn ngữ lập trình với mơi trường chạy, trình gỡ lỗi số chức khác, có khả chạy chương trình lưu trữ tệp kiểu kịch (script) Đặc biệt, gói (packages) R cộng đồng xây dựng, bảo trì cung cấp nhiều chức hữu ích cho khai phá liệu Một số gói bao gồm sẵn thuật tốn học máy, hồi quy, người sử dụng cần tải tải gói lên phiên làm việc để sử dụng thuật tốn, mơ hình bên 34 4.2 Dữ liệu thực nghiệm Toàn liệu khoản vay thực tảng cho vay Lending Club từ năm 2007 đến Quý năm 2020 tải xuống miễn phí, khơng cần đăng ký tài khoản trang chủ tổ chức Nếu đăng ký đăng nhập tài khoản Lending Club, người dùng phép tải xuống liệu đầy đủ hơn, nhiên, liệu miễn phí có đủ thuộc tính cần thiết cho việc xây dựng mơ hình phân lớp khoản vay ngang hàng Bộ liệu khóa luận sử dụng ghi lại khoản vay thực tháng đầu năm 2012, bao gồm 18523 ghi 115 thuộc tính, có 15682 khoản vay người vay trả lại đầy đủ 2841 khoản vay khơng thể thu hồi Khóa luận chọn 10 số 115 thuộc tính giá trị gốc để tiến hành thực nghiệm Các thuộc tính khác khơng lựa chọn số lý như: có nhiều ghi thiếu giá trị thuộc tính, giá trị thuộc tính khơng thay đổi ghi, thuộc tính thuộc kiểu rời rạc (vì khơng phù hợp với thuật toán máy vec tơ hỗ trợ) thuộc tính khơng có ý nghĩa với mơ hình xây dựng (ví dụ: thuộc tính member_id ghi lại mã người dùng người vay) Các thuộc tính chọn liệt kê bảng 4.2: Bảng 4.2 Các thuộc tính liệu thực nghiệm Tên thuộc tính Diễn giải annual_inc Thu nhập năm người vay delinq_2yrs Số khoản vay hạn 30 ngày vòng năm gần người vay dti Thơng số tính cách lấy tổng số tiền toán nợ hàng tháng chia cho tổng số nợ phải trả số tiền đề xuất vay Lending Club chia cho thu nhập 35 hàng tháng inq_last_6mths Số lượng khoản vay đề xuất tháng qua loan_amnt Số tiền mà người vay đề xuất vay revol_util Tỷ lệ sử dụng tín dụng xoay vịng total_acc Tổng số hạn mức tín dụng có hồ sơ tín dụng người vay loan_status Trạng thái khoản vay (nhãn phân lớp) fico_range_avg Trung bình số fico_range_low fico_range_high Trong đó, thuộc tính fico_range_low fico_range_high hợp thành thuộc tính fico_range_avg cách tính trung bình giá trị thuộc tính Bên cạnh đó, kỹ thuật máy vec tơ hỗ trợ mà khóa luận sử dụng hoạt động tốt thuộc tính dạng biến liên tục giá trị nằm đoạn [0;1], nên, tất thuộc tính chuyển đổi để giá trị nằm đoạn [0;1] Bảng 4.3 Tổng quan liệu sử dụng thực nghiệm Giá trị tối thiểu loan_amnt 0.01 Giá trị tối đa 0.35 36 Trung bình 0.1425 Trung vị 0.12 annual_inc 0.000876 0.7141778 0.0073947 0.0063 dti 0.3499 0.1762 0.1732 delinq_2yrs 0.14 0.002894 inq_last_6mths 0.8 0.08672 0.1 revol_util 0.1139 0.05916 0.06170 total_acc 0.03 0.91 0.2519 0.24 delinq_amnt 0.65 0.0000693 fico_avg 0.662 0.8475 0.6981 0.6920 4.3 Kết thực nghiệm theo phương pháp đề xuất Trong phần này, khóa luận thực xây dựng mơ hình đề xuất với liệu thực nghiệm mô tả bên Bộ liệu chia thành phần để thực kiểm chứng chéo k-fold với k = Các hàm kernel thuật toán SVM mơ hình sử dụng bao gồm: polynomial, radial basis sigmoid Kết chi tiết sau: 37 Bảng 4.5 Kết thực nghiệm với mơ hình đề xuất Tên độ đo Polynomial Radial Basis Sigmoid Giá trị tham số degree = 0.369; gamma = 0.69; coef = 0.446 gamma = 7.995 gamma = 7.16462; coef0 = 7.765631 Recall 0.949 0.1928651 Thời gian xử lý (giây) 6547.8 27360.5 13410.9 Theo kết thực nghiệm, SVM với hàm kernel radial basis cho kết vượt trội so với hàm kernel cịn lại Mơ hình sử dụng hàm polynomial hồn tồn khơng thể nhận biết khoản vay xấu liệu thực nghiệm, cịn mơ hình sử dụng hàm sigmoid nhận biết gần 20% Về thời gian xử lý, thực nghiệm cho thấy mơ hình SVM nhiều thời gian xử lý áp dụng hàm sigmoid so với áp dụng hàm polynomial Việc áp dụng hàm radial khiến mơ hình xử lý lâu có khả nhận biết gần 95% khoản vay xấu 38 4.4 Kết thực nghiệm với mơ hình SVM khơng tối ưu tham số Trong phần này, khóa luận áp dụng phương pháp kiểm chứng chéo k-fold việc xây dựng kiểm chứng mơ hình phân lớp SVM, hàm kernel mơ hình SVM polynomial, radial basis, sigmoid, nhiên, tham số degree, gamma coef0 lựa chọn ngẫu nhiên khác với tham số mà mơ hình đề xuất đưa Kết tổng hợp sau: Bảng 4.6 Kết thực nghiệm với mơ hình SVM khơng tối ưu tham số Tên độ đo Polynomial Radial Basis Sigmoid Recall 0.5751 0.1798662 Thời gian xử lý (giây) 24.8 123.2 40.2 Theo kết thực nghiệm, xét mơ hình SVM sử dụng hàm kernel giống nhau, mơ hình sử dụng tham số lấy ngẫu nhiên cho kết không tốt mơ hình đề xuất Bên cạnh đó, mơ hình sử dụng hàm kernel radial basis cho kết vượt trội so với mơ hình sử dụng hàm kernel lại 4.5 Kết thực nghiệm với mơ hình phân lớp khác Trong phần này, để so sánh chất lượng với thuật toán nghiên cứu trước sử dụng, khóa luận sử dụng liệu thực nghiệm để xây dựng kiểm chứng mơ hình sử dụng dụng thuật tốn định Naïve Bayes, phương pháp kiểm chứng chéo k-fold với k = sử dụng để đảm bảo công việc so sánh Kết chi tiết sau: Bảng 4.7 Kết thực nghiệm với mơ hình phân lớp định random forest 39 Cây định Naïve Bayes Recall 0.2087293 0.05702218 Thời gian xử lý (giây) 37 12.7 4.6 So sánh đánh giá kết Recall 100 90 80 70 60 50 40 30 20 10 SVM-RB-GA SVM-S-GA SVM-RB SVM-S Cây quyế t định Nạve Bayes Recall Hình 4.1 So sánh độ nhạy mơ hình phân lớp Hình 4.1 mơ tả trực quan độ nhạy với nhãn “rủi ro” mơ hình tiến hành thực nghiệm ngoại trừ mơ hình SVM sử dụng hàm kernel polynomial mơ hình khơng thể phát khoản vay xấu liệu, kết luận khơng phù hợp với liệu tốn mà khóa luận xét đến 40 Về độ nhạy với nhãn “rủi ro”, so sánh mơ hình SVM với nhau, mơ hình sử dụng tham số giải thuật di truyền lựa chọn cho kết tốt so với mơ hình sử dụng tham số lựa chọn ngẫu nhiên Như vậy, khả phát khoản vay xấu mơ hình SVM cải thiện thơng qua việc tích hợp hệ thống lựa chọn tham số giải thuật di truyền theo đề xuất khóa luận Ngay so sánh với số mơ hình sử dụng thuật tốn khác định, mặc kết tốt SVM-S-GA so sánh với SVM-RB-GA mơ hình mà khóa luận đề xuất có độ nhạy với nhãn “rủi ro” cao Mơ hình sử dụng định Naïve Bayes cho kết thấp hẳn so với SVM-RB-GA khơng phù hợp với liệu thực nghiệm Tuy nhiên, thời gian xử lý, phải thực thêm thuật tốn di truyền, mơ hình đề xuất nhiều thời gian đáng kể so với mơ hình thơng thường, đó, mơ hình SVM sử dụng hàm kernel radial basis có thời gian xử lý lâu 41 Chương 5: Kết luận Khóa luận trình bày đề xuất áp dụng giải thuật di truyền máy vec tơ hỗ trợ để giải tốn đánh giá tín dụng khoản vay tảng cho vay ngang hàng Mơ hình khóa luận đề xuất gồm hệ thống con, hệ thống sử dụng thuật toán SVM với kỹ thuật kernel có nhiệm vụ phân lớp khoản vay hệ thống sử dụng giải thuật di truyền để tìm tham số tốt cho hệ thống phân lớp Đầu tiên, tập tham số khác khởi tạo, hệ thống phân lớp sử dụng tham số để xây dựng kiểm chứng mơ hình SVM Độ nhạy với nhãn “rủi ro” mơ hình phân lớp hàm mục tiêu thuật toán GA đánh giá, chưa đạt điều kiện dừng, tham số tốt lai ghép đột biến để tạo tham số tốt Kết cuối mà mơ hình đưa tham số kernel tốt cho mô hình SVM việc phát khoản vay xấu Về mặt thực nghiệm, mơ hình sử dụng tham số mơ hình đề xuất lựa chọn có kết tốt so với mơ hình sử dụng tham số lựa chọn ngẫu nhiên, qua chứng minh tính hiệu khả thi phương pháp cải tiến mà khóa luận đề xuất Phương pháp giới thiệu tìm tham số mang lại kết tốt miền giá trị mà thuật toán di truyền tìm kiếm chưa thực lớn hạn chế mặt công cụ hỗ trợ; phương pháp lai ghép, chọn lọc đột biến phương pháp phổ thông; hàm kernel sử dụng hàm kernel phổ thông Trong tương lai, mơ hình đề xuất ln vặn phát triển thêm theo hướng mở rộng khơng gian tìm kiếm lời giải cho thuật toán di truyền; tinh chỉnh giải thuật di truyền cho phù hợp với toán; sử dụng hàm kernel khác cho thuật toán SVM 42 Tài liệu tham khảo Tiếng Việt [1] Phan Xuân Hiếu Khai phá liệu: Giới thiệu môn học Bài giảng môn học Khai phá liệu Trường Đại học Công nghệ - Đại học Quốc gia Hà Nội (2016): 10 Tiếng Anh [2] Ajay Byanjankar, Markku Heikkilä, Jozsef Mezei Predict Credit Risk in Peer-toPeer Lending: A Neural NetWork Approach 2015 IEEE Symposium Series on Computational Intelligence vol – 10 (2015): 719 - 725 [3] Wenjing Tao, Dan Chang, Credit Risk Assessment of P2P Lending Borrowers based on SVM, Proceedings of the 1st International Conference on Business, Economics, Management Science (2019) 43 [4] Milad Malekipirazari, Vural Aksakalli, Risk Assessment in social lending via random forest, Expert Systems with Applications vol 42 (2015): 4621 - 4631 [5] Jiang X Y, Quin J, Credit Risk assessment in P2P based on group decision making, Computer System & Application (2019): 226-231 [6] Michal Polenna Performance Analysis of Credit Scoring Models on Lending Club Data Master’s Thesis Charles University (2017) [7] Sudhanshu Singh, Kevin Tsai, Sivagami Ramiah Peer Lending Risk Predictor CS229: Machine Learning, Stanford University (2014) [8] Stein Information Production and capital allocation: Decentralized versus hierarchical firms Journal of Finance (2002): 1891-1921 [9] Nilas Mollenkamp.Determinants of Loan Performance in P2P Lending, University of Twente (2017) [10] Aboubacar Coulibaly Credit Risk Estimation in the Age of Peer to Peer Lending Master’s Thesis, St Cloud State University (2019) [11] Michal Herzenstein, Scott Sonenshein, Utpal M.Dhollakia Tell Me a Good Story and I May Lend You Money: The role of Narratives in Peer-to-Peer Lending Decisions Journal of Marketing Research vol 48 (2011): 138-149 [12] Van-Sang Ha, Dang-Nhac Lu, Gyoo Seok Choi, Ha-Nam Nguyen, Byeong Yoon Improving Credit Risk Prediction in Online Peer-to-Peer (P2P) Lending Using Feature selection with Deep Learning 21st International Conference on Advanced Communication Technology (2019) [13] Josef Mezei, Ajay Byanjankar, Markku Heikkilla Credit Risk Evaluation in Peerto-Peer Lending With Linguistic Data Transformation anh Supervised Learning 51st Hawaii International Conference on System Sciences vol (2018): 11051115 44 45