Trường hợp nghiên cứu 2: Phát hiện gian lận thẻ mua hàng

Một phần của tài liệu Tiểu luận môn hệ hỗ trợ quyết định KỸ THUẬT KHAI PHÁ DỮ LIỆU TRONG DỰ ĐOÁN RỦI RO GIẢI BÀI TOÁN KINH DOANH DÙNG PHẦN MỀM SAS Enterprise Miner (Trang 58)

Chương 3 Bài báo “KỸ THUẬT KHAI PHÁ DỮ LIỆU TRONG DỰ ĐOÁN RỦI RO GIẢI BÀI TOÁN KINH DOANH DÙNG PHẦN MỀM

3.9Trường hợp nghiên cứu 2: Phát hiện gian lận thẻ mua hàng

Một cơ quan liên bang đã thu thập dữ liệu về giao dịch thẻ mua nhân viên của mình và trên Tài khoản thẻ mua 40.000 nhân viên. Các dữ liệu giao dịch chứa thông tin về các

mua ngày được thực hiện, số tiền mua hàng, tên của thương gia, địa chỉ của thương gia, và sự phân loại công nghiệp tiêu chuẩn (SIC) mã của các thương gia trong khác

các lĩnh vực. Các dữ liệu tài khoản chứa thông tin về tài khoản của cá nhân như thông tin về chủ tài khoản, hạn mức giao dịch duy nhất của tài khoản, mua chu kỳ thanh toán giới hạn cho tài khoản và lịch sử mua cho mỗi tài khoản trong các lĩnh vực khác.

3.9.1 Định nghĩa vấn đề

Một tổ chức chính phủ tìm cách xác định những nhóm mua tồn tại trong mua chương trình thẻ có thể là dấu hiệu của một sự lạm dụng công quỹ. Tổ chức đã thu thập thông tin về đặc điểm mua để nhận biết một sự lạm dụng vốn của chính phủ. Thông tin này là cư dân trong các báo cáo về nguy cơ thẻ mua hàng. Cư trú thông tin bổ sung với các chuyên gia tên miền. Các tổ chức tìm kiếm để xác định loại gì khác giao dịch nhóm cùng với kiến thức hiện vì lợi ích của việc ngăn chặn tiếp tục lạm dụng quỹ của các cá nhân có thẩm quyền.

Sau khi xác định các vấn đề kinh doanh, bước tiếp theo trong quá trình khai phá dữ liệu là để liên kết các nguồn dữ liệu khác nhau. Trong nghiên cứu trường hợp này, dữ liệu từ các tập tin giao dịch tài khoản và được liên kết.

Dữ liệu được tham gia ở mức độ giao dịch bởi vì các câu hỏi kinh doanh tập trung vào xác khai phá các thuộc tính vốn có của giao dịch để nhận biết gian lận sử dụng vốn.

Thông thường, không phải tất cả các dữ liệu đã được tham gia sẽ được lựa chọn cho các đầu vào mô hình. Một số tập hợp con của các trường sẽ được sử dụng để phát triển các mô hình khai phá dữ liệu.

Chuyển đổi dữ liệu có thể được thực hiện trên các dữ liệu thu thập được. Chuyển đổi dữ liệu liên quan đến chuyển đổi đầu vào nguyên liệu. Ví dụ, chuyển đổi dữ liệu có thể nhóm biến phân loại hạt như mã SIC vào nhóm tổng quát hơn, hoặc hồ sơ tổng hợp. Dữ liệu biến đổi sử dụng hiệu quả hơn các thông tin nhúng trong dữ liệu thô. Dữ liệu biến đổi có thể được thực hiện với sự hỗ trợ của chuyên gia tên miền. Trong nghiên cứu trường hợp này, các chuyên gia đã chỉ ra một số miền SIC đang mua cho một sự lạm dụng vốn.

Thông thường, khai phá dữ liệu đòi hỏi phải có bản vẽ mẫu từ các bản ghi trong dữ liệu tham gia do các nguồn lực cường độ cao cần thiết trong việc đào tạo của các thuật toán khai phá dữ liệu. Mẫu cần phải là đại diện của dân số để mô hình có một cơ hội để "nhìn thấy" kết hợp có thể có của các lĩnh vực.

Một phần của tài liệu Tiểu luận môn hệ hỗ trợ quyết định KỸ THUẬT KHAI PHÁ DỮ LIỆU TRONG DỰ ĐOÁN RỦI RO GIẢI BÀI TOÁN KINH DOANH DÙNG PHẦN MỀM SAS Enterprise Miner (Trang 58)