.Tổng quan về phần mềm Weka

Một phần của tài liệu (LUẬN VĂN THẠC SĨ) Khai phá mẫu phổ biến, luật kết hợp và thước đo tương quan (Trang 65 - 67)

Weka là phần mềm khai phá dữ liệu viết dưới dạng mã nguồn mở bằng ngôn ngữ Java. Weka tập hợp các thuật toán máy học cho các tác vụ khai thác dữ liệu. Weka gồm các công cụ thực hiện: Tiền xử lý dữ liệu (Data Pre-processing), phân lớp (Classification), hồi quy (Regression), Gom cụm (Clustering), luật kết hợp (Association rules). Công cụ khai phá dữ liệu này có thể dễ dàng tìm hiểu và sử dụng qua website chính:

http://www.cs.waikato.ac.nz/~ml/weka/index.html.

Weka hỗ trợ bốn ứng dụng mà người dùng có thể lựa chọn thông quan giao diện cửa sổ đầu tiên Weka GUI Chooser như sau:

Hình 3.1. Cửa sổ lựa chọn ứng dụng của Weka

Các nút có thể sử dụng để bắt đầu các ứng dụng sau:

Explorer: Một môi trường để khai phá dữ liệu với Weka.

Experimenter: Một môi trường thực hiện các thử nghiệm và quản lý thống kê các thử nghiệm.

KnowledgeFlow: Môi trường này hỗ trợ các chức năng cơ bản giống như Explorer nhưng thực hiện với giao diện kéo thả ( drag and drop). Tiện ích này giúp hỗ trợ tốt cho người học.

Simple CLI : Cung cấp một giao diện dạng dòng lệnh (command-line) cho phép thực hành trực tiếp các lệnh của Weka.

Hệ thống menu bao gồm bốn phần:

(1)Menul Program:

LogWindow: Mở một cửa sổ để bắt/chụp (capture) tất cả những gì đã được in cho stdout hoặc stderr. Thuận tiện đối với các môi trường giống như MSWindows, trong đó thông thường Weka không bắt đầu từ cuối. Exit Đóng Weka.

(2)Menu Tool gồm các ứng dụng hữu ích khác

Package manager: Một giao diện đồ họa về hệ thống quản lý đóng gói trong Weka.

ArffViewer: Một ứng dụng MDI đối với việc kiểm tra các file Arff trong định dạng bảng tính.

SqlView: Mô tả một môi trường SQL, đối với việc truy vấn dữ liệu qua JDBC.

Bayes net editor: Một ứng dụng dùng để sửa chữa, mô phỏng việc học mạng Bayer.

(3)Menu Visualization Cách thức mô phỏng dữ liệu với Weka.

ROC: Hiển thị đường cong ROC được lưu trước đây.

Tree Visualizer: Hiển thị trực tiếp những minh họa bằng đồ họa, ví dụ: cây quyết định.

Graph Visualizer: Mô phỏng định dạng đồ họa XML, BIF hoạc DOT , ví dụ: mạng Bayesian.

Boundary Visualizer: Cho phép mô phỏng phân lớp đường bao quyết định theo hai chiều.

(4)Menu Help: Nguồn trực tuyến của Weka có thể tìm thấy ở đây.

Weka homepage: Mở một cửa sổ trình duyệt với trang chủ của Weka.

HOWTOs, code snippets, etc: Weka Wiki nói chung, bao gồm rất nhiều các ví dụ và tài liệu tham khảo xung quanh việc phát triển và sử dụng Weka.

Weka on Sourceforge: Trang chủ Weka’s project trên trang web

Sourceforge.net.

SystemInfo: Danh sách một sốt nội dung bên trong về Java / môi trường Weka, ví dụ như: CLASSPATH.

Một phần của tài liệu (LUẬN VĂN THẠC SĨ) Khai phá mẫu phổ biến, luật kết hợp và thước đo tương quan (Trang 65 - 67)

Tải bản đầy đủ (PDF)

(88 trang)