5 ỨNG DỤNG PHÁT HIỆN DỮ LIỆU NGOẠI LAI
4.22 Trực quan hóa sự biến đổi dữ liệu trong quá trình huấn luyện
Nhận xét
Dựa vào kết quả thực nghiệm ở trên, chúng tôi đưa ra một số nhận xét sau: thứ nhất về thời gian huấn luyện, AESVDD cho kết quả tốt hẳn, thời gian huấn luyện giảm đi rất nhiều so với việc sử dụng OCSVM/SVDD, rõ ràng điều này giúp
4.5. Tập dữ liệu Paysim
cải thiện rất nhiều về khía cạnh thời gian huấn luyện trong thực tế. Đối với kết quả AUCs, setup3 và setup4 của AESVDD có thơng số khơng tốt bằng OCSVM/SVDD. Chúng tơi cũng đưa một số ngun nhân vì kết quả có phần khơng tốt này. Thứ nhất, việc lựa chọn những siêu tham số vẫn mang tính chủ quan. Thứ hai, việc tiền xử lý dữ liệu vẫn chưa đạt được sự tối ưu. Chúng tôi vẫn đang cố gắng tối ưu hai điều này để đạt được kết quả tốt nhất có thể.
5 ỨNG DỤNG PHÁT HIỆN DỮLIỆU NGOẠI LAI LIỆU NGOẠI LAI
5.1 Ứng dụng phát hiện giao dịch gian lận trong thị trường tài chính
5.1.1 Giới thiệu mơ hình
Có thể nói rằng, đầu năm 2010, phần lớn các ngân hàng đã áp dụng hệ thống phát hiện ngoại lai vào việc phát hiện gian lận, lừa đảo một cách tự động. Trong đó, theo như nghiên cứu của tổ chức AI Oppotunity Landscape, khoảng 26% những quỹ đầu tư mạo hiểm của ngành công nghiệp ngân hàng dành sự chú trọng và đầu tư vào những hệ thống, ứng dụng phát hiện gian lận, nhiều hơn bất kỳ lĩnh vực nào khác lúc bấy giờ. Số liệu này để thấy rằng, tiềm năng của việc áp dụng AI vào thực tiễn diễn ra mạnh mẽ như thế nào.
Trước tiên, chúng tôi sẽ tổng quan việc vận dụng học máy vào việc phát hiện gian lận trong ngân hàng và đi sâu vào một case study cụ thể chính là việc phát hiện những giao dịch không nhất quán, cũng như sự khơng chính xác về tài khoản nguồn và tài khoản đích khi thực hiện giao dịch. Khi một ngân hàng sử dụng một mơ hình phát hiện gian lận trong hệ thống và xem nó như một cơng cụ để xử lý dữ liệu, mà ở đây chính là các giao dịch hằng ngày. Những giải pháp cho việc phát hiện và ngăn chặn thường phổ biến hơn so với việc dự đoán cũng như phân tích tập dữ liệu. Loại ứng dụng này u cầu một mơ hình học máy được huấn luyện với loại dữ liệu dạng dịng (streaming) mang tính liên tục (hay cịn gọi là online learning). Ứng dụng sẽ thơng báo cho giao dịch viên trong trường hợp có sự bất thường đối với một giao dịch nào đó. Giao dịch viên sẽ xem xét cảnh báo, thực
5.1. Ứng dụng phát hiện giao dịch gian lận trong thị trường tài chính
hiện kiểm tra để xác thực lại thông tin của giao dịch.
5.1.2 Kiến trúc hệ thống