Mô hình chiến lược

Một phần của tài liệu Tiểu luận môn hệ hỗ trợ quyết định KỸ THUẬT KHAI PHÁ DỮ LIỆU TRONG DỰ ĐOÁN RỦI RO GIẢI BÀI TOÁN KINH DOANH DÙNG PHẦN MỀM SAS Enterprise Miner (Trang 59)

Chương 3 Bài báo “KỸ THUẬT KHAI PHÁ DỮ LIỆU TRONG DỰ ĐOÁN RỦI RO GIẢI BÀI TOÁN KINH DOANH DÙNG PHẦN MỀM

3.9.3Mô hình chiến lược

Trong nghiên cứu trường hợp này, không có trường mục tiêu tồn tại bởi vì tổ chức này đã không bao giờ phân tích dữ liệu thẻ mua trong tìm kiếm gian lận. Do đó, các quyết định được thực hiện để sử dụng không có giám sát phương pháp học tập để phát hiện ra trong dữ liệu. Học không giám sát sẽ được sử dụng để nhóm các dữ liệu vào bộ các trường hợp tương tự.

Hình 12 hiển thị việc lựa chọn một phương pháp học không giám sát sử dụng SAS Enterprise Miner. Một ví dụ về khoảng 13.000 tài khoản được tạo ra. Phân đoạn phân tích cụm các dữ liệu mẫu vào bộ tương tự.

Hình 12: Lựa chọn các cụm theo Phương pháp học tập có giám sát

Phương pháp học không giám sát được lựa chọn trong hình 12 thực hiện phân tích cụm phân chia trên cơ sở khoảng cách Euclide tính từ một hay nhiều biến số lượng và các loại hạt được tạo ra và cập nhật bởi một thuật toán phân cụm. Về cơ bản các phương pháp phân nhóm thùng các dữ liệu thành các nhóm theo cách như vậy là để giảm thiểu sự khác biệt trong các nhóm đồng thời gian mà nó tối đa hóa sự khác biệt giữa các nhóm.

Hình 13 hiển thị kết quả phân nhóm giả. Những thánh giá lớn đại diện cho cụm trung tâm

Các trường hợp được giao cho ba cụm (mỗi với một hình elip được rút ra về nó). Trong không gian đại diện, không có cách nào tốt hơn để chỉ định trường hợp các cụm để giảm thiểu khoảng cách từ mỗi điểm dữ liệu đến các trung tâm của mỗi cụm. Tất nhiên, ví dụ này hiển thị một đại diện hai chiều đơn giản; phân tích nhóm thực hiện thói quen tối ưu hóa của nó trong m không gian chiều, nơi m là số lượng các trường hoặc các biến. Do đó, nếu có 20 biến trong các hoạt động nhóm, không gian trong đó phân nhóm được thực hiện là Không gian 20 chiều.

Hình 13: Cụm Phân tích hiệu quả phân đoạn dữ liệu vào Nhóm các trường hợp tương tự

Sự khác biệt giữa phân tích thăm dò và phát hiện mô hình trong mối quan tâm phân nhóm những gì tạo nên một kết quả như thế nào và kết quả sẽ được đưa vào sử

dụng. Phân tích thăm dò có thể hài lòng để khám phá một số trường hợp thú vị trong dữ liệu. Phát hiện mô hình sẽ tận dụng cụm hiện có và các mô hình chung gắn liền với những cụm chỉ định trường hợp các cụm mới. Là kết quả của việc này khách quan hơn về phía trước, tìm kiếm, phân tích cụm trong mô hình phát hiện đòi hỏi mô hình cụm được thử nghiệm trước khi triển khai. Kiểm tra này đảm bảo một kết quả đáng tin cậy, một trong đó có thể giúp đảm bảo rằng "phát hiện" cụm trong các dữ liệu tồn tại trong trường hợp tổng quát.

Trong nghiên cứu trường hợp này, phân tích cụm được sử dụng như một kỹ thuật phát hiện mô hình; do đó,kết quả mô hình cụm sẽ cần phải được kiểm tra được nó được áp dụng.

Một phần của quá trình đào tạo mô hình liên quan đến các thông số lựa chọn cho mô hình cụm.

Hình 14 cho thấy các thiết lập thông số cho mô hình cụm hiện hành. Trong trường hợp này, bốn trung tâm cụm được lựa chọn.

3.9.5 Kết quả phân tích

Hình 15 hiển thị kết quả phân tích cụm sử dụng dữ liệu thẻ mua hàng. Các thông số để phân tích cụm đã được thiết lập đến 40 cụm. Chiều cao và màu sắc của mỗi chiếc bánh lát đại diện số trường hợp trong cluster. Chiều rộng lát đề cập đến bán kính của vòng tròn đó chuyển đổi tất cả các điểm dữ liệu trong cụm được đo từ trung tâm của cụm. Cụm 31 tổ chức số lượng lớn nhất các trường hợp tại 6334, trong khi các cụm 1,11, và 19 từng có trong quá 500 trường hợp. Cụm 6 có 345 trường hợp.

Hình 15: Kết quả phân tích cụm

Hình 16 hiển thị cụm số liệu thống kê. Các chức danh đại diện cho cột phân loại công nghiệp tiêu chuẩn (SIC) Mã nơi mua đã diễn ra. Số lượng trong mỗi tế bào tương ứng với tần số trung bình của mua hàng của chủ tài khoản trong tài khoản đó. Trong

trường hợp này,cụm 6 (với 345 trường hợp) được đánh dấu như chủ tài khoản trong nhóm này kiếm được trung bình 6.51 thể thao và giải trí mua mỗi một.

Hình 16: Cụm Thống kê

Nhìn vào các dữ liệu thô cho các trường hợp trong cụm 6, chúng tôi thấy rằng chủ tài khoản trong cụm đó cũng làm cho một số tiền cao cuối tuần và ngày lễ mua hàng, mua hàng và chi phí khách sạn.. Các tài khoản này có vấn đề như các mô hình trưng bày của họ thể hiện rõ sử dụng không đúng thẻ mua cho chi phí cá nhân và / hoặc không có cơ sở.

Như điều tra của cụm tiền, nó cũng là cần thiết để đảm bảo rằng đủ của một phân chia

Một phần của tài liệu Tiểu luận môn hệ hỗ trợ quyết định KỸ THUẬT KHAI PHÁ DỮ LIỆU TRONG DỰ ĐOÁN RỦI RO GIẢI BÀI TOÁN KINH DOANH DÙNG PHẦN MỀM SAS Enterprise Miner (Trang 59)