Mơ hình đề xuất cho nghiên cứu

Một phần của tài liệu (LUẬN văn THẠC sĩ) ứng dụng big data phân tích lỗ hổng tín dụng cho vay và giải pháp hạn chế trường hợp của ngân hàng TMCP sài gòn (SCB) (Trang 34 - 38)

CHƯƠNG 2 : CƠ SỞ LÝ LUẬN

2.5. Mơ hình đề xuất cho nghiên cứu

Mơ hình Fraud được gọi là mơ hình gian lận, mơ hình này được xem xét dựa trên sự tham gia các thông tin về hồ sơ tham gia dịch vụ của khách hàng tại ngân hàng, thông tin giao dịch và lịch sử giao dịch vủa khách hàng khi đến tham gia. Như được chỉ ra ở biểu đồ 2.1 (Eshghi & Kargari, 2019), chuỗi tiếp cận để đi vào phân tích tính gian lận sẽ bao gồm về xu hướng các đặc điểm mới bao gồm về số lượng tham gia giao dịch, thời gian và khoảng thời gian. Tiếp theo đó là các mức độ về thơng tin cá nhân, chủ tài khoản và các thông tin về đặc điểm được xét duyệt khi tham gia giao dịch, ví dụ: tài sản nhà, chức vụ cơng việc, trình độ học vấn. Kế đến là các hoạt động tham gia, ví dụ tham gia giao dịch vay, thẻ tín dụng, gia hạn. Sau cùng là thời gian có thể được đo lường đánh giá theo ngày trong tuần, hay ngày trong tháng, tuần trong tháng, ngày trong năm, tuần trong năm, tháng trong năm, tháng trong vụ mùa, và tổng thể.

Biểu đồ 2.1: Tiến trình tiếp cận phục vụ mơ hình fraud

Nguồn: (Eshghi & Kargari, 2019)

Xuất phát từ việc ứng dụng mơ hình gian lận Fraud, thuật toán được áp dụng trong nghiên cứu này là cơng cụ C5.0 có trong phần mềm IBM SPSS-MODLER. Việc sử dụng phương pháp này được sự hướng dẫn của và hỗ trợ của giáo viên hướng dẫn. Thuật toán C5.0, được xem là thuật toán phân lớp dữ liệu dựa trên cây quyết định của thông tin giao dịch khách hàng. Thuật tốn này có cơ chế sinh cây quyết định hiệu quả và chặt chẽ bằng việc sử dụng mức độ lựa chọn thuộc tính tốt nhất là information-

gain. Các cơ chế xử lý với giá trị lỗi, thiếu và chống “quá vừa” dữ liệu với cơ chế cắt

tỉa cây để tạo nên sức mạnh. Mơ hình C5.0 cịn giúp cho việc dự báo dựa trên thông tin ban đầu của khách hàng, hoặc thông tin hành vi giao dịch theo thời gian. Mơ hình Fraud được thực hiện qua thành 3 bước.

Bước 1: Xác định sự gian lận của việc đánh giá hồ sơ ban đầu do khách hàng cung

cấp. Việc xếp hạng này được chia làm 3 mức: TỐT, VỪA, XẤU. Các thông tin được xếp hạng được dựa vào thông tin hồ sơ của ứng viên tiếp cận ngân hàng cho vay vốn,

Xu hướng của đặc điểm mới Tổng thể Thời gian Khoảng thời gian Mức độ Cá nhân Chủ thời khoản Tổng thể chung Hoạt động kinh doanh/dịch vụ Kinh doanh 1 Kinh doanh# … Kinh doanh thứ n Tổng các hoạt động Các kênh tham gia Kênh loại 1 Kênh loại# … Kênh loại thứ n Tổng thể các kênh

Thời kỳ của giao dịch khách hàng

Ngày trong tuần Ngày trong tháng Tuần trong tháng Ngày trong năm Tuần trong năm Tháng trong năm

Tháng mùa vụ Tổng thể

tham gia dịch vụ thẻ, hoặc gia hạn dịch vụ sử dụng. Thông tin bao gồm: Thu nhập bình quân/tháng, tài sản nhà ở, loại khách hàng (cũ, mới), quan hệ cộng đồng, học vấn, chức vụ lãnh đạo và gia cảnh. Với nguồn thông tin vừa nêu, hồ sơ của khách hàng sẽ được đánh giá xếp hạng (RANK_HOSO) được xem như là trường mục tiêu (target field).

Việc gian lận này có thể xảy ra các trường hơp: (i) Hồ sơ xấu được đánh giá thành

tốt, lỗi này có thể do nhân viên trực tiếp gian lận trong quá trình đánh giá hồ sơ, hoặc

do khách hàng cố tình gian lận trong khai báo; (ii) Hồ sơ tốt được đánh giá thành

xấu, điều này có thể do sự gian lận của nhân viên trực tiếp thẩm định hồ sơ, điều này

xảy ra có thể do nhân viên thẩm định có thành ý khơng tốt đối với khách hàng tham gia giao dịch nên tâm đánh giá có sự lệch so với thực tế; (iii) Hồ sơ vừa được đánh

giá thành tốt hoặc xấu, điều này có thể do gian lận xuất phát từ nhân viên trong ngân

hàng tham gia trực tiếp thẩm định hồ sơ.

Bước 2: Xác định sự gian lận sau khi khách hàng đã được tham gia dịch vụ trên 12

tháng. Hành vi tham gia này thông qua lịch sử giao dịch được đánh giá dựa vào các chỉ số thuộc RFM. Cụ thể dựa vào lần dịch vụ gần nhất (Recency)- Tần suất tham gia giao dịch (Frequency)- Tổng số tiền/số dư tài khoàn tham gia giao dịch (Monetary) của khách hàng. Ba thơng số trên hợp thành RFM để xác định lịng trung thành của khách hàng một khi RFM càng lớn và ngược lại một khi RFM càng nhỏ cho thấy sự xa rời hoặc có khả năng rời dịch vụ của khách hàng càng nhiều. Như vậy sự gian lận có thể từ hồ sơ ban đầu được đánh giá xấu, nhưng sau 12 tháng lịch sử giao dịch, khách hàng này không như đánh giá ban đầu, tức là sau 12 tháng giao dịch, hành vi biểu hiện tốt. Điều này có thể là do gian lận của nhân viên trực tiếp thẩm định từ ban đầu. Trường hợp sau 12 tháng tham gia giao dịch, khách hàng được đánh giá có hồ

sơ rất tốt từ ban đầu, nhưng lại cho RFM nhỏ, tức là lòng trung thành rất thấp, điều

này cho thấy, có sự gian lận về khai báo hồ sơ của khách hàng, để cố tình tìm được ưu đãi trong giao dịch, hoặc do nhân viên thẩm định chủ động đánh điểm tốt. Đồng thời trong bước này, có kết hợp với số dư của khách hàng tham gia giao dịch. Tuy

nhiên cũng có những trường hợp ngược lại, ban đầu hồ sơ được xếp hạng khơng cao, nhưng sau q trình giao dịch trên 12 tháng, kết quả cho RFM cao, điều này cho thấy, khách hàng đã chịu một sự thiệt thòi trong thẩm định của nhân viên thẩm định. Điều này cũng có thể do khách hàng khơng được lịng nhân viên nên vì thế kết quả xếp hạng thấp ban đầu.

Bước 3: Từ kết quả của bước 1 và bước 2, bước 3 này sẽ giúp xác định nhóm có tính

gian lận thật sự dựa vào 2 bước trước đó. Một khi khách hàng được xếp vào nhóm gian lận ở bước 1 và gian lận ở bước 2, khách hàng sẽ được đưa vào nhóm có tính gian lận cảnh báo cao. Ngược lại những nhóm khách hàng khơng thuộc nhóm gian lận ở bước 1 và bước 2, nhóm này sẽ được xem là q trình đánh giá đúng khách hàng tham gia dịch vụ, khơng có sự gian lận xảy ra kể cả trong hồ sơ và trong lịch sử giao dịch.

Tóm lại: Việc sử dụng mơ hình gian lận Fraud sẽ góp phần mang đến hai thơng điệp quan trọng, trong đó có thể giúp cho việc xác định tính gian lận thuộc phía nhân viên gân hàng, hoặc tính gian lận thuộc vào nhóm khách hàng. Một khi các thơng tin này được xác định, các giải pháp kịp thời vơ cùng quan trọng vì làm chặn đứng những rủi ro trong tương lai. Góp phần cũng cố trong quản lý tốt hơn và thẩm định hồ sơ đúng với đối tượng khách hàng.

CHƯƠNG 3: ỨNG DỤNG BIG DATA TẠI SCB VÀ KẾT QUẢ PHÂN TÍCH DỮ LIỆU

Một phần của tài liệu (LUẬN văn THẠC sĩ) ứng dụng big data phân tích lỗ hổng tín dụng cho vay và giải pháp hạn chế trường hợp của ngân hàng TMCP sài gòn (SCB) (Trang 34 - 38)

Tải bản đầy đủ (PDF)

(69 trang)