Đồ án cuối kì môn học khoa học dữ liệu trong kinh doanh đề tài bài toán scorecard

33 0 0
Đồ án cuối kì môn học khoa học dữ liệu trong kinh doanh đề tài bài toán scorecard

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

NGÂN HÀNG NHÀ NƯỚC VIỆT NAM TRƯỜNG ĐẠI HỌC NGÂN HÀNG TP.HCM ĐỒ ÁN CUỐI KÌ MƠN HỌC: KHOA HỌC DỮ LIỆU TRONG KINH DOANH Đề tài: BÀI TOÁN SCORECARD Giảng viên hướng dẫn: Phạm Thanh An Lớp: L27 - Nhóm Họ tên thành viên MSSV Trần Thị Hồng Nhung 050609211074 Trần Thị Yến Nhi 050609212103 Nguyễn Thụy Băng Tâm 050609211271 TP.HCM, ngày 04 tháng 11 năm 2022 MỤC LỤC CHƯƠNG 1: GIỚI THIỆU 1.1 Sự cần thiết .1 1.2 Lý chọn đề tài .1 1.3 Mục tiêu nghiên cứu, tìm hiểu 1.4 Phạm vi tìm hiểu đồ án, Phương pháp nghiên cứu CHƯƠNG 2: CƠ SỞ LÝ THUYẾT 2.1 Trình bày kiến thức miền lĩnh vực có liên quan 2.2 Khái niệm khoa học liệu học máy .4 2.3 Mơ hình nghiệp vụ toán thực tế, miền ứng dụng 2.4 Cơ sở lý thuyết đồ án 10 CHƯƠNG 3: QUÁ TRÌNH THU NHẬP, TIỀN XỬ DỮ LIỆU 16 3.1 Quá trình thu thập 16 3.2 Làm liệu .16 CHƯƠNG 4: KẾT QUẢ PHÂN TÍCH DỮ LIỆU, DỰ BÁO 19 CHƯƠNG 5: KẾT LUẬN VÀ ĐÁNH GIÁ 24 5.1 Đánh giá 24 5.2 Kết luận 24 TÀI LIỆU THAM KHẢO 25 PHỤ LỤC TRÁCH NHIỆM CÁC THÀNH VIÊN 26 CHƯƠNG 1: GIỚI THIỆU 1.1 Sự cần thiết - Khoa học liệu cho kinh doanh việc thu thập, quản lý, xử lý phân tích lượng liệu để phục vụ cho hoạt động quản trị, kinh doanh, marketing, đầu tư, ….Vậy để thực hoạt động cần những phương pháp xử lý liệu với pandas, trực quan hóa liệu, học máy,… Và phương pháp đặc biệt hiệu phương pháp trực quan hóa liệu - Trực quan hóa liệu phương pháp biểu diễn liệu có sử dụng yếu tố trực quan biểu đồ đồ thị để phát xu hướng, mẫu hình giá trị ngoại lệ, từ tổng hợp nhanh chóng thơng tin chuyên sâu hỗ trợ việc định tức thời Trong giới ngày nay, việc hiểu khối lượng liệu khổng lồ mà doanh nghiệp tạo quan trọng 1.2 Lý chọn đề tài Trong xã hội đại ngày nay, lượng thông tin tiếp thụ hàng ngày nhiều đáng kể, việc phân tích đưa định xác theo trở thành vấn đề đáng nan giải người Chính lý này, nhóm em định chọn chủ đề “ Bài tốn Scorecard” để thực đồ án “Scorecard” hiểu thẻ điểm tín dụng, nơi đánh giá mức độ rủi ro thông qua thông tin mà ta đưa vào Kết dựa điểm số qn, đồng thời mơ hình xét thêm lượng biến thay đổi theo thời gian mà không làm ảnh hưởng tới thời gian đưa dự báo Những lợi nêu trên, phần cho ta thấy lợi ích dùng mơ hình Scorecard Vì thế, cơng cụ thống kê tổ chức cho vay sử dụng rộng rãi để đánh giá mức độ tín nhiệm khách hàng tiềm họ, giúp ngân hàng giảm thiểu rủi ro tối đa hóa lợi nhuận Khơng thế, mơ hình Scorecard áp dụng cho nhiều linh vực khác, kể đến là: xếp hạng khách hàng, doanh nghiệp, quốc gia, hay tổ chức tài chính,… 1.3 Mục tiêu nghiên cứu, tìm hiểu Nhằm để làm rõ tầm quan trọng phương pháp này, nhóm chúng em lựa chọn đề tài “Bài toán Scorecard - hồi quy logistic đánh giá rủi ro tín dụng.” Bài tốn Scorecard - hồi quy logistic cho cách trực quan hiệu số cụ thể dựa điểm tín nhiệm từ tổ chức tài cung cấp sản phẩm, dịch vụ cho khách hàng tùy theo điểm tín nhiệm 1.4 Phạm vi tìm hiểu đồ án, Phương pháp nghiên cứu 1.4.1 Phạm vi tìm hiểu Đồ án Bộ liệu chứa 1000 mục nhập với 20 biến độc lập (7 số, 13 phân loại) biến mục tiêu Giáo sư Hofmann biên soạn Trong tập liệu này, mục nhập đại diện cho người nhận tín dụng ngân hàng 1.4.2 Phương pháp nghiên cứu Tìm hiểu nghiên cứu tài liệu nợ tín dụng kiến thức liên quan Sau đó, nghiên cứu cách học máy, kỹ thuật lập trinh Từ đó, xây dựng phát triển sửa chửa mơ hình cho phù hợp, theo thu nhập ứng dụng Colaboratory Cuối đánh giá kết thu từ mơ hình, đưa nhận xét tính hữu ích mơ hình CHƯƠNG 2: CƠ SỞ LÝ THUYẾT 2.1 Trình bày kiến thức miền lĩnh vực có liên quan Scorecard model lớp mơ hình ứng dụng nhiều lĩnh vực tài chính, kinh doanh, quản lý xã hội Mơ hình Scorecard có tác dụng lượng hóa hồ sơ cá nhân tổ chức thành điểm tín nhiệm dựa khả xảy kiện vỡ nợ, vi phạm luật Dựa điểm tín nhiệm, tổ chức tài phủ cung cấp sản phẩm, dịch vụ tốt chủ thể có điểm tín nhiệm cao thấp chủ thể có điểm tín nhiệm thấp Để đánh giá rủi ro tín dụng áp dụng phương pháp chun gia sử dụng mơ hình thống kê  Phương pháp chuyên gia (Methods) : phương pháp chuyên gia dựa ý kiến thẩm định chuyên gia rủi ro khoản tín dụng Rủi ro thơng tin chủ yếu là:  Đặc điểm chủ thể vay (character): Thẩm định danh tiếng, tính trung thực người vay vốn  Vốn (capital): Nguồn vốn chi phí mà người vay phải chi trả chi tiêu gia đình, chi phí sinh hoạt, chi phí trả lãi từ khoản vay khác,…  Tài sản đảm bảo (collateral): Sẽ có loại hình thức cho vay phân chia dựa tài sản đảm bảo vay chấp (có tài sản đảm bảo) vay tín chấp (khơng có tài sản đảm bảo) Rủi ro hình thức cho vay khác nên lãi suất hạn mức chúng khác biệt để đảm bảo dung hòa lợi nhuận rủi ro ngân hàng Đối với vay chấp ngân hàng phải định giá xác giá trị tài sản chấp Giá trị tài sản định hạn mức tín dụng mà ngân hàng cấp cho người vay Rủi ro khoản vay chấp thấp tín chấp trường hợp khách hàng khơng có khả toán, ngân hàng quyền thu hồi tài sản đảm bảo  Khả trả nợ (capacity): Là thông tin liên quan trực tiếp đến khả tài người vay là: nghề nghiệp, mức thu nhập, trạng thái hôn nhân, số người phụ thuộc,…  Điều kiện (condition): Đánh giá sơ trạng thái người vay có tham chiếu tới điều kiện thị trường, bối cảnh tài chính, áp lực cạnh tranh, mục đích sử dụng vốn Phương pháp chuyên gia phương pháp thủ cơng dựa kinh nghiệm người Do q trình3thẩm định tốn thời gian Đồng thời ý kiến đánh giá khơng qn chun gia Do phương pháp khác khuyến nghị phát triển hội nghị basel nhằm đưa đánh giá nhanh chóng qn Đó phương pháp mơ hình  Phương pháp mơ hình: Phương pháp mơ hình dựa điểm số lượng hóa từ mơ hình học máy, Phương pháp có nhiều điểm tối ưu so với phương pháp chuyên gia:  Những mơ hình đưa kết dường Do thời gian thẩm định hồ sơ nhanh chóng phù hợp với tảng cho vay online  Năng suất thẩm định từ mơ hình cao nhiều so với chun gia Một mơt hình giải số lượng hồ sơ khối lượng công việc hàng trăm chuyên gia  Giảm thiểu chi phí lao động khơng trả lương cho chuyên gia thẩm định  Kết đánh giá hồ sơ quán dựa điểm số tín nhiệm nhất, chuyên gia đưa kết đánh giá khác dựa cảm quan họ rủi ro Khi xảy bất đồng ý kiến, cần hội đồng chuyên gia đánh giá lại hồ sơ tốn thời gian để hồn thành thẩm định  Mơ hình xem xét tồn diện biến số đầu vào chí gia tăng số lượng biến tùy ý mà không ảnh hưởng tới thời gian dự báo Trong phương pháp chuyên gia chịu hạn chế khả người có hạn Việc đánh giá hồ sơ nhận định số biến Chính lợi đó, phương pháp mơ hình dần thay phương pháp chuyên gia trở thành phương pháp thẩm định chủ yếu ngân hàng 2.2 Khái niệm khoa học liệu học máy  Khoa học liệu lĩnh vực nghiên cứu liệu nhằm khai thác đầy đủ thông tin dành cho hoạt động kinh doanh Đây phương thức kết hợp nguyên tắc phương pháp thực hành lĩnh vực toán học, thống kê, trí tuệ nhân tạo kỹ thuật máy tính để phân tích khối lượng liệu lớn phức tạp Kết phân tích liệu giúp nhà khoa Document continues below Discover more fCrơomsở: liệu ITS.302 Trường Đại học Ngâ… 150 documents Go to course TRẮC NGHIỆM HQTCSDL 77 95% (20) 356 Cau trac nghiem CSDL 51 86% (35) Scarselli 2009 - mơ hình neural network 20 Cơ sở 100% (1) liệu Correctional Administration Criminology 96% (114) English - huhu 10 Led hiển thị 100% (3) Preparing Vocabulary FOR UNIT 100% (2) 10 Led hiển thị học liệu đặt trả lời câu hỏi kiện xảy ra, xảy ra, kiện xảy sử dụng kết thu cho mục đích  Học máy (Machine Learning – ML) lĩnh vực nghiên cứu Trí tuệ nhân tạo (Artificial Intelligence – AI)  Các định nghĩa học máy  Một q trình nhờ hệ thống cải thiện hiệu suất (hiệu hoạt động) [Simon, 1983]  Một trình mà chương trình máy tính cải thiện hiệu suất công việc thông qua kinh nghiệm [Mitchell, 1997]  Việc lập trình máy tính để tối ưu hóa tiêu chí hiệu suất dựa liệu ví dụ kinh nghiệm khứ [Alpaydin, 2020] 2.3 Mơ hình nghiệp vụ tốn thực tế, miền ứng dụng 2.3.1 Mơ hình nghiệp vụ rủi ro tín dụng Rủi ro tín dụng rủi ro xảy tổn thất người vay không trả khoản vay không đáp ứng nghĩa vụ theo hợp đồng Nếu cơng ty cung cấp tín dụng cho khách hàng mình, có rủi ro khách hàng họ khơng tốn hóa đơn họ  Các loại rủi ro tín dụng:  Rủi ro tốt: Một khoản đầu tư mà người ta tin có khả sinh lời Thuật ngữ thường đề cập đến khoản vay thực cho người công ty đáng tin cậy Rủi ro tốt coi đặc biệt có khả hồn trả  Rủi ro Xấu: Khoản vay khơng có khả hồn trả lịch sử tín dụng xấu, thu nhập khơng đủ số lý khác Rủi ro xấu làm tăng rủi ro người cho vay khả vỡ nợ người vay  Bài toán thực tế: Trong hoạt động tín dụng, mục tiêu mơ hình scorecard đánh giá lực trả nợ người giữ vị vay tương lai Đầu vào mơ hình Scorecard gồm thơng tin nằm hồ sơ cá nhân khách hàng Giúp giảm thiểu tổn thất từ góc độ ngân hàng, ngân hàng cần có quy tắc định việc người phê duyệt khoản vay người không chấp thuận Hồ sơ nhân học lịch sử tín dụng, thơng tin tài sản đảm bảo cá nhân sử dụng để dự đoán xác suất vỡ nợ người nộp đơn người quản lý khoản vay xem xét trước đưa định đơn xin vay người  Mơ tả tập liệu: Dữ liệu Tín dụng Đức ( German credit ) chứa liệu 20 biến số phân loại xem người nộp đơn coi rủi ro tín dụng Tốt hay Xấu cho 1000 người nộp đơn vay Một mơ hình dự đốn phát triển dựa liệu kỳ vọng cung cấp hướng dẫn cho người quản lý ngân hàng để đưa định có chấp thuận khoản vay cho ứng viên tiềm hay không dựa hồ sơ họ Dữ liệu gồm trường sau: Tên trường liệu Tên trường tiếng việt status.of.existing.checking.account Tình trạng tài khoản séc có Thời hạn tháng duration.in.month credit.history Lịch sử tín dụng purpose Mục đích credit.amount Số tiền tín dụng saving.account.and.bonds Tài khoản tiết kiệm trái phiếu present.employment.since Việc làm việc làm kể từ lúc bắt đầu installment.rate.in.percentage.of.disposab Tỷ lệ trả góp theo tỷ lệ phần trăm thu le.income nhập khả dụng personal.status.and.sex Tình trạng cá nhân giới tính other.debtors.or.guarantors Những người mắc nợ người bảo lãnh khác property Tài sản age.in.years Tuổi tính theo năm CHƯƠNG 3: QUÁ TRÌNH THU NHẬP, TIỀN XỬ DỮ LIỆU 3.1 Quá trình thu thập Đồ án thực nghiên cứu toán Scorecard, mục tiêu mơ hình scorecard đánh giá lực trả nợ người giữ vị vay tương lai Bộ liệu “German credit” chứa 1000 mục nhập với 20 biến độc lập (7 số, 13 phân loại) biến mục tiêu Giáo sư Hofmann biên soạn Đối với tốn scorecard nhóm định sử dụng thư viện “scorecardpy”, đặc biệt thư viện có liệu “German credit”, để lấy liệu ta thực đoạn code đơn giản sau: 3.2 Làm liệu Làm liệu phần thiếu việc chuẩn bị liệu, trình sửa chữa loại bỏ liệu khơng xác khơng cần thiết từ tập liệu trước phân tích liệu Sau bước mà nhóm em làm:  Nhập thư viện cần thiết: ● Nhập bộ liệu germancredit: ● Xác định biến cần loại bỏ: Để chạy mô mô hình tín dụng, cần thơng tin sau: Nhân học (demographic): Là thông tin liên quan đến thu nhập, nghề nghiệp, Lịch sử tín dụng (credit history): Dữ liệu lịch sử vay khách hàng tổng hợp từ toàn ngân hàng hoạt động lãnh thổ quốc gia vào data center Như ngân hàng kiểm tra chéo thơng tin tín dụng khách hàng từ ngân hàng khác

Ngày đăng: 02/03/2024, 17:27

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan