Các chức năng khai phá dữ liệu mô tả trong Oracle

Một phần của tài liệu (LUẬN văn THẠC sĩ) khai phá dữ liệu trên nền ORACLE và ứng dụng (Trang 46 - 57)

Chức năng Mô tả Các thuật toán

Phân nhóm Clustering Mô hình phân nhóm xác đ nh các nhóm t nhiên trong tập dữ liệu Enhanced k-means,

Orthogonal Clustering (O- Cluster - Thuật toán bản quyền của Oracle)

Các luật kết hợp Association Rules

Mô hình kết hợp xác đ nh các quan hệ và khả n ng xuất hiện của chúng trong tập dữ liệu

Apriori

Trích chọn đặc trưng Feature Extraction

Mô hình trích chọn đặc trưng tạo tập dữ liệu tối ưu làm cơ sở cho mô hình trên đó.

Non-Negative Matric Factorization

3.2. Quy trình khai phá dữ liệu sử dụng Oracle Data Miner

Oracle Data Miner là ứng dụng có giao diện đồ họa thân thiện dùng cho khai phá dữ liệu trên cơ sở dữ liệu Oracle. Oracle Data Miner cung cấp công cụ hỗ trợ người dùng chuẩn b dữ liệu, xây d ng mô hình, đánh giá mô hình và áp dụng mô hình khai phá dữ liệu.

Các bước khai phá dữ liệu với Oracle Data Miner:

1. Phân tích bài toán, l a chọn chức n ng khai phá và thuật toán khai phá

2. Phân tích và chuẩn b dữ liệu dùng cho xây d ng các mô hình khai phá (build activity), kiểm thử các mô hình (test activity), và áp dụng mô hình (apply activity). Ba tập dữ liệu sau đây phải có cấu trúc giống nhau.

+ Tập dữ liệu huấn luyện là tập dữ liệu đã có sẵn giá tr của các thu c tính mục tiêu, dùng xây d ng mô hình đoán.

+ Tập dữ liệu kiểm thử là tập dữ liệu đã có sẵn giá tr của các thu c tính mục tiêu, dùng kiểm tra tính chính xác của mô hình d đoán, tập này phải khác với tập huấn luyện.

+ Tập dữ liệu đích là tập dữ liệu chưa có giá tr của các thu c tính mục tiêu, ta sẽ dùng mô hình d đoán đã xây d ng để d đoán giá tr của thu c tính mục tiêu.

3. Xây d ng mô hình khai phá trên tập dữ liệu huấn luyện. 4. Kiểm thử mô hình trên tập dữ liệu kiểm thử.

Sau đây là chi tiết th c hiện của bước 3, bước 4, bước 5.

Bước 3: Xây dựng mô hình khai phá trên tập dữ liệu huấn luyện

- Trên giao diện chương trình, chọn Activity -> chọn Build

Hình 3.1. Màn hình ODM - chọn chức năng xây dựng mô hình khai phá dữ liệu

- Chọn chức n ng và giải thuật khai phá

- Chọn Schema, table/view, unique indentifier,Colums:

Hình 3.3. Màn hình ODM - chọn bảng dữ liệu học cho khai phá dữ liệu

- Chọn đích (Target)

- Nhập tên mô hình, nhấn Next, sau đó nhấn Finish

Hình 3.5. Màn hình ODM - nhập tên cho mô hình khai phá dữ liệu

- Nhấn Run Activity

Bước 4: Kiểm thử mô hình trên tập dữ liệu kiểm thử:

- Trên giao diện chương trình, chọn Activity -> chọn Test

Hình 3.7. Màn hình ODM – chọn chức năng kiểm thử mô hình khai phá dữ liệu

- Chọn mô hình cần kiểm thử

- Chọn bảng dữ liệu kiểm thử

Hình 3.9. Màn hình ODM – chọn bảng dữ liệu kiểm thử

- Nhấn Result để xem kết quả kiểm thử

- Đ tin cậy của mô hình được thể hiện ở thẻ Preditive Confidence như hình sau:

Hình 3.11.Màn hình ODM – độ tin cậy của mô hình khai phá dữ liệu

- Đ chính xác của mô hình được thể hiện ở thẻ Accuracy như hình sau:

Bước 5: Áp dụng mô hình khai phá vào khai phá dữ liệu:

- Trên giao diện chương trình, chọn Activity -> chọn Apply

Hình 3.13. Màn hình ODM – chọn chức năng áp dụng mô hình khai phá dữ liệu

- Chọn mô hình khai phá

- Chọn bảng dữ liệu cần khai phá

Hình 3.15. Màn hình ODM – chọn bảng dữ liệu cần khai phá

- Chọn thu c tính đầu vào

- Nhập tên hoạt đ ng khai phá dữ liệu

Hình 3.17. Màn hình ODM – nhập tên cho hoạt động khai phá

- Chọn Run Activity để hoàn thành việc khai phá

- Chọn Result để xem kết quả d đoán

Hình 3.19. Màn hình ODM – kết quả khai phá dữ liệu

3.3. Tổng kết chƣơng 3

Chương này trình bày lý do sử dụng công nghệ khai phá dữ liệu của Oracle, quy trình khai phá dữ liệu sử dụng công cụ Oracle Data Miner.

CHƢƠNG 4: THỰC NGHIỆM PHÂN LỚP CÁC NGÂN HÀNG THƢƠNG MẠI 4.1. Môi trƣờng thực nghiệm 4.1. Môi trƣờng thực nghiệm

4.1.1 Cấu hình phần cứng, hệ điều hành

Bảng 4.1. Cấu hình phần cứng, hệ điều hành

Thành phần Chỉ số

CPU Intel Core 2 Duo 3.00 GHz

RAM 2 GB

HDD 150 GB

OS Microsoft Window XP Service Park 3

4.1.2 Công cụ phần mềm

Trong luận v n đã sử dụng các phần mềm trong bảng sau:

Một phần của tài liệu (LUẬN văn THẠC sĩ) khai phá dữ liệu trên nền ORACLE và ứng dụng (Trang 46 - 57)

Tải bản đầy đủ (PDF)

(66 trang)