2.1.1.1 Khái niệm chuỗi thời gian
Một chuỗi thời gian là một dãy các giá trị quan sát X:={x1, x2,……… xn} đƣợc xếp thứ tự diễn biến thời gian với x1 là các giá trị quan sát tại thời điểm đầu tiên, x2 là quan sát tại thời điểm thứ 2 và xn là quan sát tại thời điểm thứ n.
Ví dụ: Các báo cáo tài chính mà ta thấy hằng ngày trên báo chí, tivi hay Internet về các chỉ số chứng khoán, tỷ giá tiền tệ, chỉ số tăng cƣờng hay chỉ số tiêu dùng đều là những thể hiện rất thực tế của chuỗi thời gian.
2.1.1.2 Tính chất chuỗi thời gian
Các tính chất đặc trƣng của chuỗi thời gian là: tính dừng, tuyến tính, xu hƣớng, và thời vụ. Dù một chuỗi thời gian có thể biểu hiện một hoặc nhiều tính chất nhƣng khi trình bày, phân tích và dự báo giá trị của chuỗi thời gian thì mỗi tính chất đƣợc xử lý tách rời.
a. Tính dừng
Tính chất này của quá trình ngẫu nhiên là sự không phụ thuộc vào thời gian. Nó có liên quan đến giá trị trung bình và phƣơng sai của dữ liệu quan sát đều bất biến theo thời gian, và hiệp phƣơng sai giữa quan sát xt và xt-
d chỉ phụ thuộc vào khoảng cách giữa hai quan sát và không thay đổi theo thời gian. Ví dụ trong mối quan hệ dƣới đây:
Với t = 1,2. E{xt} = µ, t = 1, 2,... Var(xt) = E{(xt - µ)2 } = k0, t= 1, 2,... Cov(xt, xt-d) = E{(xt - µ)(xt-d - µ )} = kd
..; d = ...-2, -1, 0, 1, 2,...; µ, k0, kd là những hằng số xác định. Về mặt thống kê, chuỗi thời gian có tính dừng khi quá trình ngẫu nhiên cơ bản là trạng thái đặc biệt của trạng thái cân bằng thống kê. Chẳng hạn hàm phân bổ kết nối của X(t) và X(t- ) chỉ phụ thuộc vào mà không phụ thuộc vào t. Do đó, các mô hình có tính dừng của một chuỗi thời gian có thể dễ dàng xây dựng nếu quá trình vẫn còn trong trạng thái cân bằng ở t thời gian xung quanh một mức độ trung bình liên tục.
b. Tuyến tính
Tính tuyến tính của một chuỗi thời gian là sự phụ thuộc vào trạng thái của nó, do đó các trạng thái hiện hành xác định các mô hình chuỗi thời gian. Nếu một chuỗi thời gian là tuyến tính, sau đó nó có thể đƣợc thể hiện bằng một hàm tuyến tính của các giá trị hiện tại và giá trị quá khứ. Ví dụ của thể hiện tuyến tính là các mô hình AR, MA, ARMA và ARIMA. Chuỗi thời gian
phi tuyến có thể đƣợc đại diện bởi các mô hình phi tuyến hay song tuyến tính tƣơng ứng.
Chuỗi thời gian đại diện của mô hình tuyến tính: i
i=- ( ) t i
X t Z
Xt thƣờng mô tả một quá trình tuyến tính với i là một tập các hằng số thỏa mãn điều kiện: i
i=-
và |Zt| là một ồn trắng với giá trị trung bình 0 và biến 2
.
Dạng đa biến của một quá trình tuyến tính đƣợc xác định bởi mối quan hệ:
Xt = i t i
i
C Z (2.1)
Trong đó: Ci là chuỗi các ma trận n×n với các phần tử có thể tính tổng; Zt là ồn trắng với giá trị trung bình 0 và hiệp phƣơng sai ma trận .
c. Tính xu hướng
Phân tích xu hƣớng là quan trọng trong dự báo chuỗi thời gian. Trong thực tế, nó đƣợc thực hiện bằng cách sử dụng kỹ thuật hồi quy tuyến tính và phi tuyến giúp xác định thành phần xu hƣớng không đơn điệu trong chuỗi thời gian.
Ví dụ, để xác định các đặc tính của xu hƣớng hiện tại trong một chuỗi thời gian là tuyến tính, cấp số nhân, hoặc đa thức liên quan thì các hàm dƣới đây đƣợc sử dụng cho phù hợp với dữ liệu thu thập đƣợc:
xt = t t
xt = exp( t t) xt = t t2 t d. Tính mùa vụ
Các tính chất mùa vụ của một chuỗi thời gian đƣợc thể hiện thông qua mô hình dao động định kỳ của nó. Tính chất này là phổ biến hơn trong chuỗi
thời gian kinh tế và các quan sát đƣợc lấy từ cuộc sống thực, nơi mà các mô hình có thể lặp lại hàng giờ, hàng ngày, hàng tuần, hàng tháng, hàng năm, v.v. Vì vậy, mục đích chính của phân tích chuỗi thời gian theo mùa vụ là tập trung vào phát hiện của các thành phần biến động định kỳ của nó và giải thích của chúng. Trong kỹ thuật, chuỗi thời gian theo mùa đƣợc thấy trong các vấn đề của khí ga, điện, nƣớc, và hệ thống phân phối khác, dự đoán nhu cầu tiêu dùng.
Phân loại chuỗi thời gian
Dựa vào các đặc tính của dữ liệu mà chuỗi thời gian đƣợc phân thành các loại sau:
• Dừng và không dừng.
• Theo mùa vụ và không theo mùa vụ. • Tuyến tính và phi tuyến.
• Đơn biến và đa biến. • Hỗn loạn.
Chuỗi thời gian trong thực tế có thể có 2 hoặc nhiều hơn các thuộc tính đƣợc liệt kê ở trên.
a. Chuỗi thời gian tuyến tính
Chuỗi thời gian tuyến tính đƣợc tạo ra thông qua quan sát của các quá trình tuyến tính, một cách toán học, mô hình tuyến tính đƣợc định nghĩa:
yt = j (t j) i x (2.2) Trong đó: i i| |
b. Chuỗi thời gian phi tuyến
Nhiều chuỗi thời gian trong kỹ thuật đòi hỏi mô hình phi tuyến. Một số chúng đƣợc biểu diễn nhƣ mô hình song tuyến:
xt =zt + t i t j r i s j ij q j j t i p i i t ix bz c x z a 1 1 1 1 (2.3)
c. Chuỗi thời gian đơn biến
Chuỗi thời gian đơn biến là chuỗi thời gian thu đƣợc bằng cách lấy mẫu một mô hình quan sát duy nhất, ví dụ nhƣ giá trị của một biến vật lý duy nhất hay của một tín hiệu phụ thuộc vào thời gian duy nhất tại các khoảng thời gian bằng nhau. Nhƣ vậy, trong chuỗi thời gian đơn biến thì thời gian là một biến ngầm thƣờng đƣợc thay thế bằng một biến chỉ số. Nếu mẫu dữ liệu đƣợc lấy cách đều thì biến chỉ số có thể bỏ qua. Trong trƣờng hợp một chuỗi thời gian đơn biến có thể đƣợc biểu diễn chính xác bởi một mô hình toán học thì chuỗi thời gian đó đƣợc cho là xác định. Nếu không, nếu chuỗi thời gian chỉ có thể đƣợc biểu diễn bằng một hàm phân bố xác suất thì chuỗi thời gian đƣợc cho là không xác định hoặc ngẫu nhiên.
d. Chuỗi thời gian đa biến
Chuỗi thời gian đa biến đƣợc sinh ra bằng cách quan sát đồng thời hai hay nhiều quá trình. Các giá trị quan sát thu đƣợc đƣợc thể hiện nhƣ là giá trị vector. Các loại quan sát này rất phổ biến trong kỹ thuật, nơi hai hay nhiều biến vật lý (nhiệt độ, áp suất, dòng chảy, .v.v) phải đƣợc lấy mẫu đồng thời để xây dựng mô hình của hệ thống động. Chuỗi thời gian đa biến đƣợc hiểu nhƣ là một tập các chuỗi thời gian xây dựng đồng thời , giá trị của mỗi phần của chuỗi vừa phụ thuộc vào chính chuỗi đó, vừa phụ thuộc vào giá trị của chuỗi khác.
e. Chuỗi thời gian hỗn loạn
Các thành phần ngẫu nhiên của một chuỗi thời gian chủ yếu rơi vào một trong hai loại:
Chúng thực sự ngẫu nhiên, nghĩa là các quan sát rút ra từ phân bổ xác suất cơ bản đƣợc đặc trƣng bởi một hàm phân phối thống kê hoặc những thời điểm thống kê dữ liệu, chẳng hạn nhƣ trung bình, phƣơng sai, ...
Chúng là hỗn loạn, đặc trƣng bởi giá trị xuất hiện đƣợc phân phối ngẫu nhiên và không định kỳ, nhƣng thực tế kết quả từ một quá trình hoàn toàn xác định.
Các thuộc tính chính của chuỗi thời gian hỗn loạn là không có tính chu kỳ nhất định, tức là chúng có thể đƣợc biểu diễn bởi các giá trị có thể lặp lại ngẫu nhiên nhiều lần mà không thuộc bất kỳ chu kỳ nhất định nào.
Mô hình chuỗi thời gian
Trong thống kê, hai mô hình hệ thống toán học cơ bản thƣờng đƣợc sử dụng là:
Mô hình xác định: Về mặt toán học, nó đƣợc xem nhƣ là mô hình phân tích biểu diễn bởi các quan hệ xác định giống nhƣ: xt = f(t) hoặc bởi biểu thức hồi quy: xt = f(xt-1, xt-2,...)
Mô hình ngẫu nhiên: Về mặt thống kê, nó đƣợc xem nhƣ là hàm của các biến ngẫu nhiên.
Mô hình toán học dùng cho phân tích chuỗi thời gian thông thƣờng gồm:
Mô hình hồi quy.
Mô hình miền thời gian. Mô hình miền tần số.
Trong đó mô hình miền thời gian bao gồm: Mô hình hàm chuyển.
Mô hình trạng thái không gian.