Chức năng Mô tả Các thuật toán
Phân nhóm Clustering Mô hình phân nhóm xác đ nh các nhóm t nhiên trong tập dữ liệu Enhanced k-means,
Orthogonal Clustering (O- Cluster - Thuật toán bản quyền của Oracle)
Các luật kết hợp Association Rules
Mô hình kết hợp xác đ nh các quan hệ và khả n ng xuất hiện của chúng trong tập dữ liệu
Apriori
Trích chọn đặc trưng Feature Extraction
Mô hình trích chọn đặc trưng tạo tập dữ liệu tối ưu làm cơ sở cho mô hình trên đó.
Non-Negative Matric Factorization
3.2. Quy trình khai phá dữ liệu sử dụng Oracle Data Miner
Oracle Data Miner là ứng dụng có giao diện đồ họa thân thiện dùng cho khai phá dữ liệu trên cơ sở dữ liệu Oracle. Oracle Data Miner cung cấp công cụ hỗ trợ người dùng chuẩn b dữ liệu, xây d ng mô hình, đánh giá mô hình và áp dụng mô hình khai phá dữ liệu.
Các bước khai phá dữ liệu với Oracle Data Miner:
1. Phân tích bài toán, l a chọn chức n ng khai phá và thuật toán khai phá
2. Phân tích và chuẩn b dữ liệu dùng cho xây d ng các mô hình khai phá (build activity), kiểm thử các mô hình (test activity), và áp dụng mô hình (apply activity). Ba tập dữ liệu sau đây phải có cấu trúc giống nhau.
+ Tập dữ liệu huấn luyện là tập dữ liệu đã có sẵn giá tr của các thu c tính mục tiêu, dùng xây d ng mô hình đoán.
+ Tập dữ liệu kiểm thử là tập dữ liệu đã có sẵn giá tr của các thu c tính mục tiêu, dùng kiểm tra tính chính xác của mô hình d đoán, tập này phải khác với tập huấn luyện.
+ Tập dữ liệu đích là tập dữ liệu chưa có giá tr của các thu c tính mục tiêu, ta sẽ dùng mô hình d đoán đã xây d ng để d đoán giá tr của thu c tính mục tiêu.
3. Xây d ng mô hình khai phá trên tập dữ liệu huấn luyện. 4. Kiểm thử mô hình trên tập dữ liệu kiểm thử.
Sau đây là chi tiết th c hiện của bước 3, bước 4, bước 5.
Bước 3: Xây dựng mô hình khai phá trên tập dữ liệu huấn luyện
- Trên giao diện chương trình, chọn Activity -> chọn Build
Hình 3.1. Màn hình ODM - chọn chức năng xây dựng mô hình khai phá dữ liệu
- Chọn chức n ng và giải thuật khai phá
- Chọn Schema, table/view, unique indentifier,Colums:
Hình 3.3. Màn hình ODM - chọn bảng dữ liệu học cho khai phá dữ liệu
- Chọn đích (Target)
- Nhập tên mô hình, nhấn Next, sau đó nhấn Finish
Hình 3.5. Màn hình ODM - nhập tên cho mô hình khai phá dữ liệu
- Nhấn Run Activity
Bước 4: Kiểm thử mô hình trên tập dữ liệu kiểm thử:
- Trên giao diện chương trình, chọn Activity -> chọn Test
Hình 3.7. Màn hình ODM – chọn chức năng kiểm thử mô hình khai phá dữ liệu
- Chọn mô hình cần kiểm thử
- Chọn bảng dữ liệu kiểm thử
Hình 3.9. Màn hình ODM – chọn bảng dữ liệu kiểm thử
- Nhấn Result để xem kết quả kiểm thử
- Đ tin cậy của mô hình được thể hiện ở thẻ Preditive Confidence như hình sau:
Hình 3.11.Màn hình ODM – độ tin cậy của mô hình khai phá dữ liệu
- Đ chính xác của mô hình được thể hiện ở thẻ Accuracy như hình sau:
Bước 5: Áp dụng mô hình khai phá vào khai phá dữ liệu:
- Trên giao diện chương trình, chọn Activity -> chọn Apply
Hình 3.13. Màn hình ODM – chọn chức năng áp dụng mô hình khai phá dữ liệu
- Chọn mô hình khai phá
- Chọn bảng dữ liệu cần khai phá
Hình 3.15. Màn hình ODM – chọn bảng dữ liệu cần khai phá
- Chọn thu c tính đầu vào
- Nhập tên hoạt đ ng khai phá dữ liệu
Hình 3.17. Màn hình ODM – nhập tên cho hoạt động khai phá
- Chọn Run Activity để hoàn thành việc khai phá
- Chọn Result để xem kết quả d đoán
Hình 3.19. Màn hình ODM – kết quả khai phá dữ liệu
3.3. Tổng kết chƣơng 3
Chương này trình bày lý do sử dụng công nghệ khai phá dữ liệu của Oracle, quy trình khai phá dữ liệu sử dụng công cụ Oracle Data Miner.
CHƢƠNG 4: THỰC NGHIỆM PHÂN LỚP CÁC NGÂN HÀNG THƢƠNG MẠI 4.1. Môi trƣờng thực nghiệm 4.1. Môi trƣờng thực nghiệm
4.1.1 Cấu hình phần cứng, hệ điều hành
Bảng 4.1. Cấu hình phần cứng, hệ điều hành
Thành phần Chỉ số
CPU Intel Core 2 Duo 3.00 GHz
RAM 2 GB
HDD 150 GB
OS Microsoft Window XP Service Park 3
4.1.2 Công cụ phần mềm
Trong luận v n đã sử dụng các phần mềm trong bảng sau: