Trong quý I và II của năm 2015, CSDL quản lý triển khai các dự án lớn. Để thử nghiệm khai phá, ở đây chỉ trích chọn một phần nhỏ của dữ liệu thực.
Tên dự án Địa điểm dự án Tên phòng ban Tên nhân viên
Thời gian
ProjectA TP Hải Dƣơng Giải pháp mạng Quỳnh Anh 7
ProjectB TP Hải Dƣơng Phần mềm ngoại Quỳnh Anh 5
ProjectD Chí Linh Phần mềm nội Quỳnh Anh 8
ProjectD Chí Linh Phần mềm nội Lan Anh 9
ProjectA TP Hải Dƣơng Giải pháp mạng Hồng Anh 6
ProjectB Sao Đỏ Phần mềm ngoại Lan Anh 6
ProjectD Ninh Giang Phần mềm nội Hải Hà 9
ProjectE Kim Thành Chăm sóc KH Hồng Anh 5
Bảng 3.1: Dữ liệu trích chọn để khai phá.
Chuyển đổi dữ liệu để khai phá:
Để chuẩn bị dữ liệu cho khai phá phụ thuộc hàm xấp xỉ, các thuộc tính đƣợc mã hóa bởi tập số tự nhiên (tức là ánh xạ sang các số tự nhiên).
Thuộc tính Mã
Tên dự án (TenDA) A
Địa điểm dự án (DiadiemDA) B
Tên phòng ban (TenPB) C
Tên nhân viên (TenNV) D
Thời gian (Thoigian) E
Bảng 3.2: Bảng mã hóa các thuộc tính
Tiếp đến, dữ liệu đƣợc tiền xử lý đƣa về dạng Text, ghi trên tệp BANG.txt. Mỗi giao tác đƣợc mô tả thành một dòng text trong tệp BANG.txt nhƣ sau: Liệt kê mã giá trị các thuộc tính, các mã cách nhau một dấu cách. Hình 3.1 là tệp
BANG.txt biểu diễn một phần dữ liệu trong bảng 3.1.
Hình 3.1: Dữ liệu đã mã hóa chuẩn bị cho khai phá
Tệp BANG.txt biểu diễn dữ liệu đã tiền xử lý, chuẩn bị cho khai phá phụ thuộc hàm xấp xỉ. Kết quả sẽ đƣợc ánh xạ ngƣợc lại để xác định tên thuộc tính.
3.1.3. Xây dựng chương trình thực nghiệm
Chƣơng trình sử dụng thuật toán để khai phá phụ thuộc hàm xấp xỉ sử dụng phủ tối thiểu và lớp tƣơng đƣơng, đƣợc trình bày trong chƣơng 2.
Chƣơng trình đƣợc xây dựng trên ngôn ngữ Free Pascal IDE và cài đặt trên môi trƣờng hệ điều hành Windows 7 bản 32bit. Máy tính thực nghiệm có cấu hình tối thiểu nhƣ sau:
- Tốc độ CPU: 2.0GHz; Dung lƣợng bộ nhớ RAM: 512MB - Không gian trống trên ổ cứng: 1GB
Chƣơng trình đƣợc dịch thành tệp AFDMCEC.EXE. Để khởi động chƣơng trình, nhấp đúp chuột vào biểu tƣợng AFDMCEC.EXE đƣợc đặt ở ổ C trong thƣ mục ThucNghiem của chƣơng trình.