II. CHƯƠNG 2: KHAI PHÁ DỮ LIỆU VÀ CÁC ỨNG DỤNG CHO
2.3.6 Khai phá tri thức trên cơ sở dữ liệu chuỗi thời gian
Hiện nay lĩnh vực khám phá tri thức trên cơ sở dữ liệu chuỗi thời gian cĩ nội dung rất phong phú. Các phương pháp cổ điển như sử dụng các mơ hình như tự hồi qui,. . . trên các mơ hình này nhà nghiên cứu quan tâm chủ yếu đến các tính chất tổng quát của chuỗi thời gian. Gần đây các nhà khoa học bắt đầu tập trung khám phá các tính chất cĩ tính cục bộ, địa phương trong các cơ sở dữ liệu chuỗi thời gian như: Các mẫu tuần hồn, các mẫu tương đồng, luật liên kết các mẫu đặc trưng, các sự kiện thể hiện khuynh hướng hay thay đổi của chuỗi thời gian, . . .
Quá trình khám phá tri thức trong cơ sở dữ liệu chuỗi thời gian bao gồm làm sạch và lọc dữ liệu chuỗi thời gian, nhận dạng hầu hết các thuộc tính dự báo quan trọng, trích ra một tập các luật kết hợp mà ta cĩ thể dùng để dự báo các hành vi của chuỗi thời gian trong tương lai. Khám phá tri thức cung cấp các thơng tin hữu dụng cho quá trình quyết định. Ta cĩ thể chia quá trình khám phá tri thức trên cơ sở dữ liệu chuỗi thời gian thành hai giai đoạn: Giai đoạn tiền xử lý và giai đoạn khai phá dữ liệu.
Giai đoạn tiền xử lý cĩ thể chia thành các bước: + Làm sạch dữ liệu thơ
+ Định danh các đặc điểm mơ tả cơ sở dữ liệu
+ Chia thang thời gian thành các đoạn liên tục, xác định các mẫu đặc trưng trên các dãy con(gom cụm và định danh chúng) hoặc trích xuất ra các sự kiện giữa các đoạn.
+ Tạo cơ sở dữ liệu các mẫu đặc trưng hoặc cơ sở dữ liệu các sự kiện, đây sẽ là nguyên liệu để cung cấp cho giai đoạn khai phá.
Giai đoạn khai phá gồm các bước: + Trích xuất các luật
+ Thu gọn các luật để được các luật chặt chẽ, hữu ích.