.2 Mơ tả chuỗi thời gian trên đồ thị

Một phần của tài liệu (LUẬN VĂN THẠC SĨ) Xây dựng hệ thống dự đoán công nợ tiền điện khách hàng, sản lượng điện tổn thất ngành điện (Trang 33 - 34)

Định nghĩa 2: Cho một chuỗi thời gian X độ dài n, một dãy con S của X là một dãy cĩ độ dài m (1≤ m ≤ n) các vị trí liền nhau trong X:

S = (xp, …, xp+m-1), 1 ≤ p ≤ n-m-1

Từ định nghĩa, cĩ thể thấy chuỗi thời gian X với độ dài n sẽ cĩ n – m + 1dãy con cĩ độ dài m. Mỗi dãy con cũng chính là một chuỗi thời gian cĩ độ dài m. Khái niệm dãy con khác với khái niệm mẫu tuần tự (sequential pattern), mẫu tuần tự chấp nhận các phần tử trong mẫu cĩ thể khơng liên tục trong dãy ban đầu, trong khi trong một dãy con các phần tử là liên tiếp nhau trong chuỗi thời gian ban đầu.

Ví dụ: Cho chuỗi thời gian X = (3, 2, 5, 7, 4, 8, 10, 7), nhận thấy S1 = (2,5,7) là một dãy con của X, S2 = (5,7,8) khơng phải là dãy con của X do 7 và 8 là các giá trị khơng liên tiếp nhau nhau X.

Để trích xuất các dãy con từ trong chuỗi thời gian, người ta cịn sử dụng khái niệm “cửa sổ”: Cho chuỗi thời gian X = (x1, x2,…xn), một cửa sổ X’ với độ rộng ω là một dãy các phần tử liên tiếp nhau X’ (xi, …, xi+ω-1). Về bản chất cửa sổ là một dãy con được nhấn mạnh về cách thức rút trích dữ liệu giống như khi quan sát chuỗi thời

dài bằng nhau. Ký hiệu W (X) = {Si | i= 1, …, n-ω+1} là tập các dãy con Si cĩ chiều dài ω thu được từ chuỗi thời gian X.

Định nghĩa 3 ; Cho chuỗi thời gian X = (x1, x2, …, xn) trên đoạn thời gian [t1, tn], hàm theo thời gian x (t) được gọi là đại diện cho chuỗi thời gian X nếu x (ti) = xi với ti = t1, t2, …, tn.

Định nghĩa 4: Hàm tuyến tính f (t) = at + b thoả mãn |x (ti) – f (ti)|< ε, với ti thuộc [t1, tm] và ε > 0 thì a được gọi là một đặc trưng (feature) của chuỗi thời gian X trên [t1, tm].

Trong định nghĩa trên, ε là một sai số chọn trước, đại diện cho độ nhiễu trong ứng dụng mà ta cần xây dựng. Một đặc trưng của chuỗi thời gian tương ứng với dãy con S thực chất là hệ số gĩc của hàm f (t). Tuỳ theo giá trị của a mà nĩ thể hiện xu thế (trend) của chuỗi thời gian trên đoạn đĩ. Hệ số gĩc được xem là một đặc trưng quan trọng nhất trên chuỗi thời gian.

Định nghĩa 5: Một sự thay đổi đặc trưng giữa hai đoạn liền kề nhau được gọi là một sự kiện

Một phần của tài liệu (LUẬN VĂN THẠC SĨ) Xây dựng hệ thống dự đoán công nợ tiền điện khách hàng, sản lượng điện tổn thất ngành điện (Trang 33 - 34)

Tải bản đầy đủ (PDF)

(74 trang)