CHƯƠNG I : TỔNG QUAN VỀ VẤN ĐỀ NGHIÊN CỨU
1.3. Quá trình chuẩn hóa chuỗi thời gian
1.3.1. Khái niệm
Một chuỗi thời gian là một dãy các giá trị quan sát X:={x1, x2,……… xn} được xếp thứ tự diễn biến thời gian với x1 là các giá trị quan sát tại thời điểm đầu tiên, x2 là quan sát tại thời điểm thứ 2 và xn là quan sát tại thời điểm thứ n.
Ví dụ: Các báo cáo tài chính mà ta thấy hằng ngày trên báo chí, tivi hay Internet về các chỉ số chứng khoán, tỷ giá tiền tệ, chỉ số tăng cường hay chỉ số tiêu dùng đều là những thể hiện rất thực tế của chuỗi thời gian.
1.3.2. Chuẩn hóa dữ liệu
Các chuỗi này được chuẩn hóa sử dụng kỹ thuật Min-Max để chuyển đổi các chuỗi thời gian về dạng số nằm trong khoảng [0,1]. Công thức như sau:
𝑁𝑖 = 𝑇𝑖 − 𝑚𝑖𝑛(𝑇)
𝑚𝑎𝑥(𝑇) − 𝑚𝑖𝑛(𝑇)
Trong đó:
Ti: giá trị chuỗi thời gian ở thời điểm thứ i.
Ni: giá trị chuỗi thời gian đã được chuẩn hóa ở thời điểm thứ i. max(T): giá trị lớn nhất trong chuỗi thời gian.
min(T): giá trị nhỏ nhất trong chuỗi thời gian. 1.3.3. Chuỗi thời gian và quá trình ngẫu nhiên
Bước đầu tiên của việc phân tích chuỗi thời gian là chọn một mô hình toán học phù hợp với tập dữ liệu cho trước X:={x1, x2,……… xn} nào đó. Để có thể nói về bản chất của những quan sát chưa diễn ra, ta giả thiết mỗi quan sát xt là một giá trị thể hiện của biến ngẫu nhiên Xt với tT. Ở đây T được gọi là tập chỉ số.
Khi đó ta có thể coi tập dữ liệu X:={x1, x2,……… xn} là thể hiện của quá trình ngẫu nhiên Xt, tT . Và vì vậy, ta có thể định nghĩa một quá trình ngẫu nhiên như sau:
Định nghĩa 1
Một quá trình ngẫu nhiên là một họ các biến ngẫu nhiên Xt, tT được định nghĩa trên một không gian xác suất(, ,).
Chú ý:Trong việc phân tích chuỗi thời gian, tập chỉ số T là một tập các thời điểm, ví dụ như là tập {1,2..} hay tập (-,+). Tất nhiên cũng có những quá trình ngẫu nhiên có T không phải là một tập con của R nhưng trong giới hạn của đề tài này ta chỉ xét cho trường hợp TR. Và thường thì ta xem T là các tập các số nguyên, khi đó ta sẽ sử dụng ký hiệu tập chỉ số là Z thay vì T ở trên. Một điểm
chú ý nữa là trong đề tài này chúng ta sẽ dùng thuật ngữ chuỗi thời gian để đồng thời chỉ dữ liệu cũng như quá trình có dữ liệu đó là một thể hiện.
1.3.4. Quá trình ngẫu nhiên dừng
1.3.4.1 Định nghĩa 2
Giả sử Xt, t Z là một quá trình ngẫu nhiên có var(Xt)< với mỗi t Z. Khi đó hàm tự hiệp phương sai của Xt được định nghĩa theo công thức sau:
x (r, s) : cov( X r , X s ) E[( X r EXr )( X s EXs )], với r, s Z.
1.3.4.2. Định nghĩa 3
Chuỗi thời gian Xt, t Z được gọi là dừng nếu nó thoả mãn 3 điều kiện sau:
- E X t 2 , t Z
- EX t m, t Z
- x (r, s) x (r t, s t),t, r, s Z
1.3.4.3. Định nghĩa 4
Nếu Xt, t Z là một quá trình dừng, và nếu như at R, i Z thoả mãn
Chú ý: Cũng có tài liệu gọi “dừng” theo nghĩa trên là dừng yếu, đừng theo
nghĩa rộng hay dừng bậc hai. Tuy nhiên ở đây ta chỉ xem xét tính dừng theo nghĩa đã định Khi chuỗi thời gian Xt, t Zlà dừng thì
y x (r, s) x (r s,0),r, s Z ,
Và vì vậy, với một quá trình dừng thì có thể định nghĩa lại hàm tự hiệp phương sai bằng cách chỉ thông qua hàm một biến. Khi đó, với quá trình dừng Xt, t Z ta có:
Hàm số yx (.) được gọi là hàm tự hiệp phương sai của Xt, còn x(h)là giá trị của nó tại “trễ” h. Đối với một quá trình dừng thì ta thường ký hiệu hàm tự hiệp phương sai bởi (.) thay vì x(.).
Với một quá trình dừng thì hàm hiệp phương sai có các tính chất
(0) 0, (h)(0), hZ Và nó còn là một hàm chẵn nghĩa là:
(h) = (-h),hZ. 1.3.5. Hàm tự tương quan
Định nghĩa 5
Hàm tự tương quan của quá trình ngẫu nhiên Xt, t Z được định nghĩa tại trễ h như sau:
(h): = (h)/(0):=corr(Xt+h,Xt), t, hZ
Chú ý: Trong thực tế, ta chỉ quan sát được một thể hiện hữu hạn X:={xt, t=1,2,..n} của một chuỗi thời gian đừng nên về nguyên tắc ta không thể biết chính xác được các hàm tự hiệp phương sai của chuỗi thời gian đó, muốn ước lượng nó ta đưa vào khái niệm hàm tự hiệp phương sai mẫu của thể hiện X.
CHƯƠNG II: THIẾT KẾ GIẢI THUẬT TIẾN HÓA VI PHÂN ĐÁNH GIÁ ẢNH HƯỞNG PHƯƠNG PHÁP SHUFFLE CHO BÀI TOÁN DỰ BÁO 2.1. Thiết kế tiến hoá của mạng neural nhân tạo