1. Trang chủ
  2. » Luận Văn - Báo Cáo

Ứng dụng giải thuật logic mờ trong xây dựng mô hình xếp hạng tín dụng

17 0 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Ứng Dụng Giải Thuật Logic Mờ Trong Xây Dựng Mô Hình Xếp Hạng Tín Dụng
Tác giả Nguyễn Anh Vinh, Nguyễn Văn Lượng, Đào Ngọc Sang
Trường học Trường Đại học Công nghiệp Thành phố Hồ Chí Minh
Chuyên ngành Công nghệ Điện tử
Thể loại bài báo
Năm xuất bản 2023
Thành phố Thành phố Hồ Chí Minh
Định dạng
Số trang 17
Dung lượng 1,5 MB

Nội dung

Mô hình này bao gồm phần mềm xếphạng tín dụngviết bằng ngôn ngữ lập trìnhPython, có thể truy xuất vào cơ sởdữ liệu luutrữcácthôngtincủa khách hàngvà đưa vào khối xử lý mờđể tính toán và

Trang 1

Hội nghị Khoa học trẻ ỉần 5 năm 2023(YSC2023)-ỈUH

YSC5.F113

NGUYỄN ANH VINH1*, NGUYỄNVĂNLƯỢNG1, ĐÀO NGỌC SANG1

} Khoa Công nghệ Điện tử, Trường Đại học Công nghiệp Thành Phổ Hồ Chỉ Minh

* nguyenanhvinh@iuh.edu.vn

Tóm tắt. Trong thời đại hiện nay, cùng với sự phát hiển của lĩnh vực tài chính ngânhàng thìnhu cầuvề

hỗtrợ tài chính tăng lênkèm theo đó làngày càngnhiều doanh nghiệp với mục đích hỗ trợtài chính rađời Trongbài báonày, chúng tôi đề xuất mộtmô hình xếp hạngtín dụng sử dụng giải thuậtLogic mờ Chúng tôi chọn giải thuậtLogic mờ vì khả năngxử lý các dữ liệu mang tính khôngchắcchắn, mơ hồdo tính chất của ngôn ngữ nói một cách hiệu quả Mô hình này bao gồm phần mềm xếphạng tín dụngviết bằng ngôn ngữ lập trìnhPython, có thể truy xuất vào cơ sởdữ liệu luutrữcácthôngtincủa khách hàngvà đưa vào khối xử lý mờđể tính toán và hiển thị kết quả hên giao diện ngườidùng Kết quảcủamôhình này hứa hẹn

sẽgiúp cho việcduyệt các giao dịch vềtài chính được nhanh gọn và thuận tiện hơn cho cả phía khách hàng lẫn doanhnghiệp

Từ khóa Logicmờ,Cơ sở dữliệu, xếp hạng tín dụng, Python, Giao diện ngườidùng

Abstract In the current era, w ith the development of die banking and finance sector, the demand for financial supporthas increased, leading to the emergence of more and more businesses with the aim of providing financial assistance In this paper, we propose a credit scoring model using a fuzzy logic algorithm We chosethe fuzzy logicalgorithm forits ability to effectivelyhandle uncertain and vague data due to the nature of spoken language This model includes credit rating software written in Python programming language,which can access a databasestoring customer information and input it into afuzzy processingblockto calculate and display results ondie user interface.The results of this model promise to facilitate faster and more convenient financial transactionprocessingforboth customers andbusinesses

Keywords.Fuzzy logic, database, creditscoring, Python,userinterface

1 GIỚI THIỆU

Trong thời đạicông nghiệp4.0hiện nay thì hí tuệ nhân tạonói riêng và học máy (machine learning) nói chung đã dần đượcứng dụngrộng rãi hơn, không chỉ dongcác lĩnh vựcvề cơ điện tử mà còn có thể trong cáclãnh vực khác như ỵ tế, hội họa,

Tuynhiên, trong lĩnh vựctài chính ngânhàng, khi cần đánh giávề mức rủi ro tài chính củamộtthành viên nào đó, khimà các tiêuchí để đánhgiá không chỉ dừnglạiở mức chính xác đểcó thể dùngBinary Decision (0 hoặc 1,có hoặc không,hue hoặc false, ) [ 1] mà lại tùy vàomỗingânhàng khác nhauchocùngmộtcá nhân với cùng 1 mứcđiểm, bằng cáckếtluậnmơ hồ của ngôn ngữ con người thìrất khó để cho máy móc hiểu được.Fuzzy logic ra đời nhằm khắc phụcđược nhượcđiểm đó

Fuzzylogic hay logic mờ môphỏng lại cáchlập luận của con người và chuyển nó về giá trị toán họcđểcó thểtính toán và đưa ra mộtkết luận rõ ràng hơn so với nhữnggìmà con người mô tả Tuynhiên những kết luận của logicmờ cũngchỉ manggiá dịxấp xỉ chứ không hoàn toàn đúng hoặcsai như khi đánh giá nhị phân

Mô hìnhcủa chúng tôi sẽ xây dựngmột chươngtrình chạybằng ngôn ngữ lập hìnhPython, sửdụngdữliệu người dùngtừ database giốngnhư các phần mềm xếp hạngtín dụng đang sử dụngtrong thực tế, nhưnglại

Trang 2

Hội nghị Khoa học trẻ lần 5 năm 2023(ỴSC2023)-ỈUH

sử dụng cơ sở lý thuyết về logicmờ để đánh giá Mô hình này được xây dựng từ các tiêu chí giống mô hình củaKorol [2], tuynhiên được mở rộngvàpháttriển thêm,đồngthời thêm2tiêu chí mói là “khoản nợ hiện

có” và“giaodịchđã thực hiện”, từ đó tập luật mờxây dựng cũng nhiều hơn(Ịên đến81 luật cho kết quả xếp hạng tín dụng) Môhình sẽ cómộtgiao diệnngườidùng để hiển thị trực quan hơn

Và, khôngchỉ tronglĩnh vực tài chính ngân hàng,logic mờ còn có thể được ứng dụng trong rất nhiềuEnh vực khác tươngtự như các giảithuật họcmáykhác

Nội dung còn lại của bài báo đượcbố trínhưsau Tiếp theo phần giói thiệulà phần xây dựng hệthống Các kếtquả ihực nghiệm được trình bày kếđó.Sau cùng,kết luận và một số hướng phát triển cho bài báo được đưa ra

2 PHÂN TÍCH VÀ THIẾT KẾ HỆ THỐNG

2.1 Tổng quan hệ thống

Hình 1 Sơ đồ tổng quan hệ thống Hình 2.1 minh họa chương trình hoạt động Đầu tiên dữ liệutừcơ sở dữ liệu được đưa vào hệthống suy luận mờđểtính toán và trảrakết quả xếphạng cho nhânviên ngân hàng.Tiếp theo, nhân viên nàysẽ quyết định cónên giải quyết yêu cầucủa khách hàng này hay không.Nếuyêucâu giao dịchbịtừ chối,ta sẽ lặp lại quy trình này vóikhách hàng tiếp theo Kháchhàng bị từ chối sẽ phải tìm cáchđểtăng xếp hạng tín dụng củabảnthân lên đểcó thể được giảiquyết giaodịch

Cấu trúc hệ thốngđược minh họaHình 2.2a Cơ sởdữliệuvà hệquản trịcơ sởdữ liệu (MySQL)được lưu nhũng máy khác nhauvà được quản lýbởi admin,có thể truy cập thôngqua mạng nộibộ hoặc kết nối Internet Máy nhânviên có chương trình xếp hạng tíndụng Nhân viên sẽ gửi request từ giao diện chương trinh lênhệ quản trị CSDLlàMySQL

Keđó, dữ liệu sẽđược gửi về vàchươngtrình sẽ lấy các dữliệu đó (ID, tên,tuổi, học vấn,tình trạng hôn nhân, thunhập hàng tháng, ) đưa vào hệ thống suy luận mờ (Hình 1 Error! Reference source not found.).

Dữ liệu đua vàokhối suyluậnmờsẽ đóng vai trò là dữ liệu thô (crisp data) được mờhóa (Fuzzification) chuyển thành dạng số học choquátrìnhtínhtoán, sauđóáp đụngcác tập luật mờ(Fuzzy Rule Base) Sau khi đã tính toánxong, kết quảsẽ được khử mờ (Defuzzification)để hiển thị ra giaodiện người dùng, các bước này được thựchiện nhờ vào thư việnScikit-fùzzy.Kết quả tìả về của chương trình sẽ là số mức độ

uy tín củangười đó, tươngtựcho thang điểm đánh giá của việcxếphạngtín dụng ngoài đời thực

Trang 3

Hội nghị Khoa học trẻ lần 5 năm 2023(YSC2023)-IUH

a) Mô hình hệ thống

b) Hệ thống suy luận mờ Hình 2 Mô hình tổng quan hệ thống Các thông tincủa người dùng cho việc xếp hạng tíndụng gồm: Tên, tuổi, trình độ họcvấn, tình trạng hôn nhân, số con, thu nhập hàng tháng, thâm niên côngviệc, loại hợpđồng lao động, tàisản đảm bảo nhà ở, tài sản đảm bảophưongtiện,tàisản đảm bảo khác, khoảnnợ hiện có, các giaodịch đã giải quyết

Ngoại trừ tên và ID,các dữ liệu trênđược chia thành 5 nhóm: Nhómnhânkhẩu học (tuồi, trình độ học vấn, tình trạng hônnhân, số con), nhóm tài chính (thu nhập hàng tháng, thâm niêncông việc, loại hợp đồng lao động), nhóm tài sảnđảm bảo (tài sản đảm bảo nhà ở,tàisản đảmbảo phương tiện,tàisản đảm bảokhác), nhómtín dụng(khoản nợ hiện có, giao dịch đãgiải quyết)và nhóm kếtquả xếp hạng (Nhân khẩu học,tài chính,tàisản đảmbảo, mức tín dụng) Các thông tin nàysẽ được biểu diễn ở Hình 3

Hình 2 Dữ liệu đầu vào cho chuông trình [2] [4]

2.2 Xây dựng tập mờ cho các tiêu chí

Các tiêu chí đầu vào cho chưongtrình sẽ được mờ hóa, tập mờ và ngưỡng cho các tiêu chí được trình bày trongBảng 1

Trang 4

Hội nghị Khoa học trẻ ỉần 5 năm 2023(YSC2023)-ỈUH

Bảng 1 Ngưỡng cho các tiêu chí [2] [4]

Tuổi

Trẻ: dưới 33 tuổi Trung niên: từ 27 đến53 tuổi Già: trên 48 tuổi Trình độ học vấn

(Côngnhân kĩ thuật

-1, Caođẳng - 2, Đại học - 3)

Thấp: dưới 1 Trungbình: 0.8 - 2.25 Cao: trên 1.5 Tình trạng hôn nhân

(độc thân - 0, có gia đình - 1, đã lỵ hôn

-từ 0 đến 1)

Độcthân: dưới 0.7

Có gia đình: trên 0.7

Sốcon (từ 1 đến 5)

ít con: dưới 2 Vừa: từ 1 đến 3.7 Đông con: lớn hơn3 Loại HĐLĐ

(Từ 0 đến 2)

Part-time: dưới 0.5 HĐLĐ cóthời hạn: từ 0.5 đến 1.5 HĐLĐ không thời hạn: Trên 1.5 Thunhập hàng

tháng(2.900.000 đến 20.000.000)

Thu nhập thấp: nhỏ hơn6.000.000 Thu nhậptrung bình: từ5.500.000 đến 12.000.000

Thu nhập cao: trên 10.000.000

Thâm niên làm việc

Ngan: dưới4năm Trung bình: từ3.5 năm đến 8.5 năm

Lâu năm: trên 8 năm Tàisản nhà ở

(0- 1.500.000.000)

Thấp: dưới 450.000.000 Trungbình: từ350.000.000 đến 1.000.000.000

Cao: trên 800.000.000 Tàisản phương tiện

giao thông (15.000.000-80.000.000)

Thấp: dưới 25.000.000 Vừa: từ20.000.000đến 60.000.000 Cao: trên 50.000.000 Tàisản khác(từ

10.000.000 đến 80.000.000)

Thấp: dưới 22.500.000 Trung bình: từ 20.000.000 đến 50.000.000

Cao: lớn hơn47.500.000 Khoản nợ hiệncó

(Từ 0 đến 3)

Khôngnợ: dưới 0.9

Nợ ít: ỏ.8 - 1.8

Nợ nhiều: trên 1.6 Giao dịch đã hoàn

tất (từ 0 đến 3)

Uy tín yếu: dưới 0.9

Uy tín trung bình: 0.7 - 2

Uy tíncao: trên 1.9 Kết quảxếp hạng tín

dụng

Rủi ro cao: nhỏhơn 0.3 Rủi ro trung bình: từ 0.3đến 0.7 Rủi ro thấp: trên 0.7

Cáctập mờsẽ được biểu diễn dướidạng:

Trong công thức(1) :

- X : Không gian của các đối tượng và Xlàphầntửtổng quát thuộc X.

- ịắa : Hàmthành viên củatập mờ A. [2]

Trang 5

Hội nghị Khoa học trẻ lần 5 nám 2023(YSC2023)-ỈUH

Ví dụ: Để biểudiễn tập mờ cho tiêu chí tuổi củakhách hàng:

{0 khi1 t khi< 1818 <thoặc<27 t > 33

33- t

— - —khi27 < t< 33 33-27

trung nien = {(t^trun^níenCOIt e tuoi}

htmngnien —

r0 khi t < 27 hoặc ủ > 53

í-27

— — — khi 27 <t< 33 33-27

1 khi33 < t < 48

53 -t

—7—7- khi 48 < t < 53

<53-48

gia = {(t,ụ gia (t))ịt e tuoi)

hgia

0 khi t < 48 hoặc t> 65

Ế- 48

1 khi53 < t < 65

(3)

(4)

(5)

(6)

(7)

Saukhi đã xác định được các ngưỡng, tacó được tập mờ cho nhómnhânkhẩu học (Hình4),tậpmờ cho nhómtài chính (Hình 5), tậpmờ cho nhómtài sảnđảm bảo(Hình 6) vàtậpmờ cho nhóm mức tín dụng (Hình 7)

Đôc mân Cỏ gia đinh

Tình trang hôn nhân

Hình 4 Tập mờ cho nhóm nhân khẩu học

Trang 6

Hội nghị Khoa học trẻ lần 5 nám 2023(YSC2023)-ỈUH

Hình 5.Tập mờ cho nhóm tàichính

Hình ố Tập mờ cho nhóm tài sản đảm bão

Khoán nc hiên có Giao OỊchđãmực ntên

Hình7 Tập mờ cho nhóm mức tíndụng

© 2023 TrườngĐại học Côngnghiệp Thành phốHồ Chí Minh 131

Trang 7

Hội nghị Khoa học trẻ lần ĩ năm 2023(YSC2023)-ỈƯH

Hình 8 Tập mờ cho kết quả xếp hạng tín dụng

2.3 Mô-đun tính toán xếp hạng tín dụng

Lưuđồ giải thuậtcủachương trình xếphạngtín dụng đượcbiểu diễn nhưHình 9:

Hình 9 Lưu đồ giải thuật của hệ thống Sau khi đã xác địnhđượccác tập mờ cho 4 nhóm nhânkhẩu học, tài sẵn, tài chính, tíndựng tasẽtiến hành xây dựng luật mờ cho các nhóm đó Luật mờ cũa4 nhómđó đượcbiểu diễn trongBảng2, Bảng 3, Bảng 4, Bảng 5 dưới đây:

Trang 8

Hội nghị Khoa học trẻ ỉần 5 năm 2023(YSC2023)-ỈUH

Bảng 2 Luật mờ cho nhóm nhân khẩu học

Tuổi Học vấn Tình trạng hôn nhân Số con Nhân khẩu

Trung niên Trung bình Có gia đình ít Trung bình

Trung niên Trung bình Độc thân Vừa Trung bình

Trung niên Trung bình Có gia đình Vừa Trung bình

Trung niên Trung bình Độc thân Nhiều Trung bình

Trẻ Trung bình Có gia đình Nhiều Trung bình

Trang 9

Hội nghị Khoa học trẻ ỉần 5 năm 2023(YSC2023)-ỈUH

Trung niên Trung bình Có gia đình Nhiều Trung bình

Già Trung bình Có gia đình Nhiều Trung bình

Bảng 3 Luật mờ cho nhóm tài chính

Thu nhập Thâm niên Loại hợp đồng lao động Tài chính

Trung bình Trung bình Có thời hạn Trung bình

Trung bình Trung bình Khôngthời hạn Trung bình

Bảng 4 Luật mờ cho nhóm tài sản đảm bảo

Tài sản xe Tài sản nhà Tài sản khác Tài sản đảm

bảo

Trang 10

Hội nghị Khoa học trẻ ỉần 5 năm 2023(YSC2023)-ỈUH

Bảng 5 Luật mờ cho nhóm tín dụng

Sau khi đã có tập luật mờ cho 4 nhóm nhân khẩu, tàichính,tài sản đảm bảo, tín dụng, chúngtôitiếp tục xây dựng tập luật mờ cho kết quả xếp hạng tín dụngtừ kết quả của 4 nhóm trôn Tập luật mờ cho kếtquả rủirođược biểu diễn trong Bảng 6 dưới đây:

Bảng 6 Luật mờ cho nhóm kểt quả rủi ro xểp hạng tín dụng

Trang 11

Hội nghị Khoa học trẻ ỉần 5 năm 2023(YSC2023)-ỈUH

Trung bình Trung bình Trung bình Trung bình Trung bình

Trung bình Trung bình Mạnh Trung bình Trung bình

Trung bình Mạnh Trung bình Trung bình Trung bình

Trang 12

Hội nghị Khoa học trẻ lần 5 năm 2023(YSC2023)-ỈƯH

Mạnh Trungbình Trung bình Trung bỉnh Trung bình

Có tống cộng 198 luật mờ cho chương trình xếp hạng tín dụng của chúng tôi

3.1 xếp hạng tín dụng khách hàng dùng logic mờ

Hình 10 là giao diện chươngtrình xếp hạng tín dụng Chương trình 1 ô textboxđể nhập ID vói2nútnhấn Nút Searchthực hiện chức năng tìmkiếm trong cơ sở dữ liệuthông quaIDđã nhập vào,nếuID không tồn tại sẽ báolỗi NútCreditcó chức năng tính toán và đua ra kếtquả xếp hạng Dữ liệutìm được trong database đượchiển thị trong 12 ôtextbox ở dưới.Kết quả xếp hạng tín dụng được hiển thị ởhộpthoạiHình 11

Search I Cí«lã

Name Winifmd Pnod

Academic Iv 3

MaritiLỉtt 0

Mof»th_incoine 19274

Seniority 15

Emplcyment-contract 2.

Bikej:ropetfr/_value 67533

Houicjrcpcrty.vakic 12167S9

Cther.p(opety.vilue /7(550

Cvvneđ.debt 0

finkhed-trancaetian 3

Hình 10 Giao diện phần mềm tìm kiếm thông tin khách hàng

Trang 13

Hội nghị Khoa học trẻ lần 5 năm 2023(YSC2023)-ỈƯH

Thông báo

OTài chinh: 2.243097643097643Nhán khẩu: 1.25 Tài sấn: 2.243097643097643 Mức tín đung: 2.2427336907168174 Kết quả xếp hang tín dung: 0.7733333333333334

OK

Hình 11 Kết quả trả về Kếtquảtrả vềcủa phần mềm như đãđềcập ởBảng 1 sẽ là một số nằm trong khoảng từ0 đến1,biểu diễn cho mứcđộuytíncủa khách hàng Độ uy tíncàng cao, rủiro càng thấpvà nguợc lại Kết quả xếp hạng tín dụngở Hình 11 là 0.773, tức mức uy tín rất cao, rủi ro tín dụngcủanguờinày làrấtthấp

3.2 xếp hạng tín dụng khách hàng ở ngân hàng

Hiện tại, mỗi ngân hàng sử dụngnhững thangđiểm khác nhau(từ 0 đến 450, từ 0 đến 750, từ0 đến 999, hoặc phân hạng A, B, c )đểđánh giá xếp hạng tín dụngcủamộtcánhân Cáctiêu chí xếp hạng cũng phụ thuộc vào ngân hàng khihọ xác định tiêu chí nào sẽ ảnh hưởng đến việckhách hàng có uy tín hay không Trongthục tế, trọng số của mỗi tiêu chí là không cố định, tùy vào việc ngân hàng xem xét mức độquan trọng củatiêu chí đó trong việc xếp hạng tín dụngkhách hàng cá nhân rasaomàhọ có thể điều chỉnh cho phù họp Chúngtôi sẽminhhọa cho môhình xếp hạng tín dụng dùng logicmờ bằng cáchtínhxếp hạng tín dụng khách hàng cá nhân của ngân hàng BIDV qua Bảng7,Bảng8vàBảng9[3]

Bảng 7 Thang điểm nhân thân của ngân hàng của BIDV

tuổi

27-32 tuổi

18-26 tuổi

53 - 65 tuổi

65>

hoặc <

18 tuổi

16.67%

2 Trình độ học

đẳng

Công nhân kỹ thuật

Dưới trung học

16.67%

3 Tìnhtrạng

4 Số con < 2

người 2 nguời 3 người 4 nguời 5 nguời 16.67%

5

Loạihọp đồng lao động

Không thời hạn

Có thời

6 Thâm niên

công việc > 8năm

Từ

4-8năm

Duới4 năm

< 1 năm 16.67%

Trang 14

Hội nghị Khoa học trẻ lẩn 5 năm 2023(YSC2023)-ỈUH

Bảng 8 Thang điềm quan hệ với ngân hàng của BIDV

so

1 Thunhập

hàng tháng

>12 triệu đồng

10-12 triệu đồng

ố-10 triệu đồng

>6 triệu

3 Sổ giao dịch

Công thứcđánh giáđiềm xếp hạngtín dụng khách hàng [3]:

Điềm cá nhân = Điểmnhân thân*Tỷ trọng nhân thân + Điểmkhả năngtrả nợ*Tỷ trọng khả năngtrảnợ Trong đó:

- Điểm cánhân: Điềm xếp hạng cá nhâncủa khách hàng

- Điểmnhânthân: Điềmđược tích bằng tồng củađiểm tùng tiêu chí nhân vớitrọng số của nó (Bảng

- Điểm khả năng trảnợ: Điềm được tíchbằng tồng của đềm từng tiêu chí nhân với trọng số củanó (Bảng8)

- Tỷ trọng nhân thân: Tỷ trọngchotiêuchí về nhân thân được ngânhàngxác địnhlà40%

- Tỷ trọng khả năng trả nợ: Tỷtrọng cho tiêuchí về khả năngtrảnợ được ngân hàng xác đnh 1 à ỐO%L Điềm cá nhân dùng để đánhgiámức tín dụng tạm thời ở Bảng 9 [3]

Hệ ỉ hống kỷ hiệu xếp hạng tú ì (Ịting khách hàng cá nhân của BIDV

Bảng 9 Hệ thống xếp hạng tín dụng của ngân hàng BIDV

Diêm xẻp hạng Đánh giá xẻp hạng

Rùi ro thấp

Rủi ro trung bình

Rùi ro cao

Bảng 10 Thang điềm tài sản đảm bảo của ngân hàng BIDV

Trọng số

1

Tài

sản

đảm

bảo

nhà

>1.000.000.000 1.000.000.000>

nhà >800.000.000

800.000.000>

nhà>

450.000.000

<450.000.000

Không

cótài sản đảm bảo nhà

200%

Ngày đăng: 10/03/2024, 08:15

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w