Chương 8 : PHÂN TÍCH CHUỖI TUẦN TỰ THEO THỜI GIAN VÀ DỰ BÁO Time series Analysis and Forecasting 8.1 Chuỗi tuần tự theo thời gian Time series 8.1.1 Định nghĩa: - Chuỗi tuần tự thao
Trang 1Chương 8 : PHÂN TÍCH CHUỖI TUẦN TỰ THEO THỜI
GIAN VÀ DỰ BÁO
( Time series Analysis and Forecasting) 8.1 Chuỗi tuần tự theo thời gian ( Time series)
8.1.1 Định nghĩa:
- Chuỗi tuần tự thao thời gian là một chuỗi các gía trị của một đại lượng nào đó được ghi nhận tuần tự theo thời gian
Ví dụ:
• Số lượng hàng bán được trong 12 tháng của một công ty
- Các gía trị của chuỗi tuần tự theo thời gian của đại lượng X được ký hiệu X1,
X2, ………, Xt, … Xn, với Xt, là gía trị quan sát của X ở thời điểm t
8.1.2 Các thành phần của chuỗi tuần tự theo thời gian: (Components of time series)
Các thành thống kê thường chia chuỗi tuần tự theo thời gian ra làm 4 thành phần:
- Thành phần xu hướng dài hạn (long-term teend component)
- Thành phần chu kỳ ( Cyclical component)
- Thành phần bất thường ( ireegular component)
8.1.2.1 Thành phần xu hướng dài hạn:
Thành phần này dùng để chỉ xu hướng tăng giảm của đại lượng X trong khoảng thời gian dài Về mặt đồ thị thành phần này có thể diễn tả bằng một đường thẳng hay bằng một đường cong tròn (Smooth curve)
t
Xt
X
t
Xu hướng giảm theo thời gian
Trang 28.1.2.2 Thành phần mùa:
Thành phần này chỉ sự thay đổi của đại lượng X theo các mùa trong năm (có thể theo các tháng trong năm)
Ví dụ:
- Lượng tiêu thụ chất đốt sẽ tăng vào mùa đông và sẽ giảm vào mùa hè Ngược lại lượng tiêu thụ xăng sẽ tăng vào mùa hè và giảm vào mùa đông
- Lượng tiêu thụ đồà dùng học tập sẽ tăng vào mùa khai trường
8.1.2.3 Thành phần chu kỳ:
Thành phần này chỉ thay đổi của đại lượng X theo chu kỳ Sự khác biệt của thành phần này so với thành phần mùa là chu kỳ của nó dài hơn một năm Để đánh gía thành phần chu kỳ các gía trị của chuỗi tuần tự theo thời gian sẽ được quan sát hằng năm
Ví dụ:
Lượng dòng chảy đến hồ chứa Trị An từ năm 1959 đến 1985
t
Chất
đốt
Xu hướng tăng theo thời gian
Thay đổi theo mùa
6 12 6 12 6 12
t (năm)
1985
Q
(m 3 /s)
1959 1960
Trang 38.1.2.4 Thành phần bất thường:
Thành phần này dùng để chỉ những sự thay đổi bất thường của các gía trị trong chuỗi tuần tự theo thời gian Sự thay đổi này không thể dự đoán bằng các số liệu kinh nghiệm trong qúa khứ, về mặt bản chất này không có tính chu kỳ
8.1.3 Mô hình hóa việc dự báo gía trị của đại lượng X
8.1.3.1 Mô hình nhân: ( Multiplicative model)
Xt: Gía tị của đại lượng X ở thời điểm t
Tt: Gía trị của thành phần xu hướng ở thời điểm t Tt có cùng đơn vị với Xt
St, Ct, It: là các hệ số đánh gía ảnh hưởng của các thành phần mùa, thành phần
chu kỳ và thành phần bất kỳ đến gía trị của X ở thời điểm t Trong thực tế việc xác định It rất khó khăn nên thường được bỏ qua, khi đó:
8.1.3.2 Mô hình cộng: (Additive model)
Xt: gía trị của đại lượng X ở thời điểm t
Tt, St, Ct, It: Gía trị của thành phần xu hướng, mùa, chu kỳ và bất thường ở thời điểm t
Trong thực tế, để dự báo gía trị của đại lượng X ta có thểa phối hợp cả 2 loại mô hình trên
8.2 Các phương pháp làm trơn: (Smoothing methods)
Trong một số chuỡi tuần tự theo thời gian thành phần mùa và thành phần bất thường thay đổi quá lớn làm cho việc xác định thành phần xu hướng và thành phần chu kỳ gặp nhiều khó khăn Sự thay đổi lớn này có thể được giảm nhỏ bằng các phương pháp làm trơn Các phương pháp làm trơn được đề cập trong chương này gồm phương pháp trung bình dịch chuyển và phương pháp làm trơn bằng hàm số mũ (Moving average and exponential smoothing methods)
8.2.1 Phương pháp trung bình dịch chuyển: (Trung bình trượt – Moving average)
Xt = Tt * St * Ct* It
Xt = Tt * St *Ct
Xt = Tt + St + Ct + It
Trang 4Nội dung của phương pháp này là thay thế gía trị quan sát
Xt bằng gíatrị trung bình của chính nó với m gía trị trước nó và m gía trị sau nó Nghĩa là thay Xt bằng X*
t, với:
X*
t : là gía trị trung bình dịch chuyển của (2m+1) điểm
Nếu m =2, ta có gía trị trung bình trượt của 5 điểm được tính theo công thức:
5
X X X X
1
Nếu t = 3
X*
3 =
5
X X X X X
5
4 3 2
8.2.2 Phương pháp làm trơn bằng hàm số mũ đơn giản:
(Simple exponential smoothing method)
Phương pháp làm trơn hàm số mũ tiến hành dựa trên việc xem xét một cách liên tục các gía trị của quá khứ, dựa trên trung bình có trọng số của chuỗi dữ liệu Trong phương pháp này trọng số có gía trị càng nhỏ khi nó càng cách xa thời điểm dự báo Với ý nghĩa trên ta có:
t
X = α Xt + (1-2) α Xt-1 + (1-α)2 α Xt-2 + (1-α)3 α Xt-3 +…+(1-2)t-1 α X1
4 t
3 3
t
2 2
t 1
t 1
−
−
−
−
−
3 t
3 2
t
2 1
t 1
X ) 1
−
−
−
−
Từ các phương trình trên ta có:
Trong tóm tắt ta lấy
− +
+
m m j
j t
X 1 m 2 1
Xt* =
1 m 2
X X
X
X
+
+ +
+ + +
−
1 t t
Với 0≤α≤1 α: hằng số làm trơn (Smoothing Constant)
1
X
Hàm 2
Cho (1-α)
Trang 51 2
2 3
1 t t
1 n n
Ví dụ:
Bảng số liệu sau đây cho thấy số lượng máy tính được bán ra của cửa hàng trong 24 tháng vừa qua
a) Tìm chuỗi thời gian trung bình trượt 5 tháng
b) Tìm các gía trị trung bình bằng phương pháp làm trơn hàm mũ với hệ số làm trơn STT
t
Tháng Số liệu quan sát
Xt trượt 5 tháng XSố trung bình *
t
Số trung bình bằng
PP làm trơn hàm mũ
Xt
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
2 năm trước
Một Hai
Ba
Tư Năm Sáu Bảy Tám Chín Mười Mười Một
Mười Hai
1 năm trước
Môt Hai
Ba
Tư Năm Sáu Bảy Tám Chín Mười Mười một
Mười hai
21
20
19
18
14
15
22
28
25
25
25
20
25
25
24
28
36
32
25
23
22
23
22
27
18.4 17.2 17.6 19.4 20.8 23.0 25.0 24.6 24.0 24.0
23.8 24.4 27.6 29.0 29.0 28.8 27.6 25.0 23.0 23.4
21.0 20.0 19.8 18.9 16.5 15.8 18.9 23.5 24.3 24.7 24.9 22.5
23.8 24.4 24.2 26.1 31.0 31.5 28.3 25.7 23.8 23.4 22.7 24.9
Trang 68.3 Dự báo:
8.3.1 Khái niệm chung :
Dự báo là khả năng nhận thức được sự vận động của các đối tượng nghiên cứu trong tương lai dựa trên sự phân tích chuỗi thông tin quá khứ và hiện tại Cho đến nay, nhu cầu dự báo đã trở nên hết sức cần thiết ở mỗi lĩnh vực
8.3.1.1 Bản chất các khái niệm liên quan đến dự báo:
8.3.1.1.1 Tiên đoán (Predicting) Đoán trước sự vận động của đối tượng nghiên cứu trong tương lai Đó là kết quả nhận thức chủ quan của con người dựa trên một số cơ sở nhất định Có thể nêu mức độ tiên đoán ở 3 khía cạnh
a) Tiên đoán không tưởng:
Đó là những tiên đoán không có cơ sở khoa học, chỉ dựa trên những mối liên hệ không tưởng thiếu căn cứ
b) Tiên đoán kinh nghiệm:
Đó là những tiên đoán dựa trên chuỗi thông tin lịch sử Mức độ ít nhiều có cơ sở khách quan, tuy nhiên có nhược điểm là loại tiên đoán này không giải thích được xu thế vận động của đối tượng nghiên cứu và đa số dừng lại ở bước định tính
c) Tiên đoán khoa học:
Đó là tiên đoán dựa trên phân tích mối liên hệ qua lại giữa các đối tượng
nghiên cứu và phương pháp xử lý thông tin khoa học nhằm phát hiện tính quy luật của đối tượng
Dự báo là tiên đoán khoa học mang tính xác suất và tính phương án trong khoảng thời gian hữu hạn về tương lai phát triển của đối tượng nghiên cứu
a) Tính xác suất :
Do dự báo dựa trên việc xử lý chuỗi thông tin bao gồm cả 2 yếu tố xu thế phát triển và yếu tố ngẫu nhiên, vì vậy kết quả dự báo so với thực tế có sự chên lệch mang tính xác suất
b) Tính chất phương án:
Dự báo được thể hiện bằng nhiều dạng kết quả có thể xảy ra trong tương lai (dạng định tính, dạng định lượng, dạng khoảng, dạng điểm, …)
Trang 7c) Tính chất thời gian hữu hạn:
Sự chênh lệch giữa thời điểm dự báo và thời điểm hiện tại được gọi là khoảng cách dự báo (tầm xa dự báo l), khoảng cách này không thể tùy tiện mà nó phụ thuộc vào mức độ ổn định của đối tượng nghiên cứu trong quá trình phát triển Vì vậy dự báo được tiến hành với khoảng cách dự báo thích hợp tương ứng một khoảng thời gian hữu hạn nào đó
8.3.1.2 Phân loại dự báo :
a) Dựa vào thời gian :
Căn cứ vào khoảng cách dự báo, người ta chia dự báo thành 2 loại chính:
- Dự báo ngắn hạn : Khoảng cách dự đoán ngắn hạn dùng cho cấp quản lý trung bình và thấp, cho chiến lược tức thời
- Dự báo dài hạn : Khoảng cách dự báo dài dùng cho quản lý cấp cao, cho các đối tượng nghiên cứu mang tầm cỡ chiến lược
b) Dựa theo kết quả :
- Dự báo điểm : Kết quả dự báo được thể hiện bằng một giá trị duy nhất
Ft+l : giá trị dự báo thời điểm t+l
- Dự báo khoảng : Kết quả dự báo được thể hiện dưới dạng khoảng tin cậy với xác suất xảy ra được chủ định
c) Dựa theo đối tượng nghiên cứu:
- Dự báo tài nguyên
- Dự báo khoa học kỹ thuật
- Dự báo dân số lao động
- Dự báo xã hội
- Dự báo thị trường…
8.3.2 Các bước dự báo:
Công tác dự báo gồm 4 bước:
8.3.2.1 Thu thập số liệu:
Yêu cầu phải có số liệu
- Đúng mục đích dự báo
F t+l = A
Ft+l = A±ε
Trang 8Đây là phần khó khăn và tốn thời gian
8.3.2.2 Xử lý sơ bộ số liệu:
- Bỏ những số liệu không cần thiết, không chính xác
- Bổ xung những số liệu còn thiếu
- Chia tập số liệu thành 2 nhóm : nhóm đầu và nhóm kiểm tra
8.3.2.3 Lựa chọn phương pháp và xây dựng mô hình dự báo
- Phương pháp dự báo được chọn sao cho phù hợp với số kiệu thuộc nhóm đầu và với đối tượng nghiên cứu
- Lập mô hình dự báo sao cho sai số dự báo là nhỏ nhất Sai số dự báo được kiểm định bởi nhóm số liệu kiểm tra
8.3.2.4 Dự báo:
- Từ mô hình dự báo xác định giá trị dự báo
- Phân tích kết quả nhận được
8.3.3 Các phương pháp dự báo thông dụng:
Các phương pháp dự báo thường dùng có thể chia làm 3 loại:
- Phương pháp giản đơn (naive method)
- Phương pháp làm tròn (smoothing method)
8.3.3.1 Phương pháp dự báo giản đơn:
A Phương pháp 1:
Trongphương pháp này người ta giả thiết giá trị gần đây nhất là giá trị đúng nhất cho tương lai
Ft+1 : là giá trị dự báo ở thời điểm t+1
Xt : là trị quan sát được ở thời điểm t
Nhận Xét:
- Đây là mô hình đơn giản nhất Mô hình này không thể hiện được các thành phần của chuổi thời gian
- Để đánh giá độ chính xác của công tác dự báo người ta phải tính sai số dự báo e
Ft+1= Xt
et+1 = Xt+1 – Ft+1
Trang 9Ví dụ:
Lượng hàng bán ra theo qúy của một công ty từ năm 1979 đến 1985 được cho trong bảng số liệu
Dựa vào bảng số liệu lập mô hình dự báo lượng hàng bán ra theo quý trong tương lai
bán được
1979
1980
1981
1982
1983
1984
1985
1
2
3
4
1
2
3
4
1
2
3
4
1
2
3
4
1
2
3
4
1
2
3
4
1
2
3
4
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
500
350
250
400
450
350
200
300
350
200
150
400
550
350
250
550
550
400
350
600
750
500
400
650
850
600
450
700
Trang 10Giải:
Nếu chúng ta sử dụng số liệu từ năm 1979 đến năm 1984 làm phần đầu của nhóm số liệu và sử dụng số liệu năm 1985 là phần kiểm tra
Giá trị dự báo chko quí I năm 1985 (thời điểm 25)
F25 = F24 + 1 = X24 = 650
Sai số dự báo ở thời điểm 25 là
e25 = X25 – F25 = 850 – 650 = 200
Tương tự, giá trị dự báo cho quí II năm 1985 (thời điểm 26) là
F26 = X25 = 850
Sai số dự báo ở thời điểm 26 là
e26 = X26 – F26 = 600 –850 = -250
Nhận Xét: Sai số lớn cần phải sửa đổi mô hình
B Phương pháp 2:
Trong phương pháp này, người ta thêm vào ác số hạng để dánh giá ảnh hưởng của thành phần xu hướng trong chuỗi thời gian Mô hình có thể có dạng:
a)
Đánh giá ảnh hưởng của thành phần xu hướng
Ví dụ:
Giá trị dự báo ở thời điểm 25
F25 = X24 + ( X24 - X23 )
= 650 + ( 650 – 400)
F25 = 900
Sai số dự báo ở thời điểm 25
E25 = X25 - F25
= 850 - 900
e25 = -50
b)
Ft+1 = Xt + ( Xt – Xt – 1)
Ft+1 = Xt *
1 t
t
X X
−
Trang 11Ví dụ:
F25 = X24 *
23
24
X X
= 650 *
400 650
F25 = 1050
e25 = X25 - F25
= 850 -1056
e25 = -206
C Phương pháp 3:
Trong phương pháp này, người ta có chú ý đến ảnh hưởng của thành phần mùa trong chuỗi thời gian
Với công thức này lượng sản phẩm bán ra ở quý dự báo bằng lượng sản phẩm bán ra trong quý tương ứng ở năm trước đó Nhược điểm của phương pháp này là không chú ý tới tác động khác nhau giữa các năm và thành phần xu hướng
F25 = X21 = 750
e25 = X25 - F25
= 850 – 750
e25 = 100
D Phương pháp 4:
Trong phương pháp này, người ta chú ý đến ảnh hưởng của thành phần mùa và thành phần xu hướng của chuỗi thời gian
Ft+1 = Xt-3
Trang 12Ví dụ:
F25 = X21 +
4
) X X ( ) X X ) X X ( ) X X
= 750 +
4
) 600 750 ( ) 750 500 ( ) 500 400 ( ) 400 650
= 750 +12,5
F25 = 762,5
e25 = X25 - F25
= 850 - 762.5
e25 = 87.5
Nhận xét chung:
Phương pháp Naive có ưu điểm đơn giản và phù hợp cho những phân tích ban đầu nhưng sai số lớn
8.3.3.2 Các phương pháp trung bình:
a Phương pháp trung bình giản đơn:
Trong phương pháp này, người ta sử dụng giá trị trung bình của toàn bộ số liệu đã có trước thời điểm dự báo làm giá trị dự báo
Ví dụ: giá trị dự báo cho quí I/1985 (thời điểm t = 25)
Ft+1 = Xt-3 +
4
) X X (
) X X ( t − t−1 + + t−3− t−4
T/phần mùa Giá trị trung bình của sự thay đổi của 4
qúy gần nhất T/phần xu hướng
Ft+1 =
n
1
∑
=
n 1 t t
X
Trang 13F25 =
24
1
∑
=
24 1 t t
X
= *(9800)
24 1
F25 = 408.33
e25 = X25 – F25
= 850 – 408,33
e25 = 441,67
Giá trị dự báo cho quí II/1985 (thời điểm t = 26)
∑
=
=
25 24
1 t t 25
1 t
25
1 X 25 1
= [9800 850]
25
F26 =
25
1 * 10650 = 426
e26 = X26 - F26
= 600 - 426
e26 = 174
Trong ví dụ này, các sai số dự báo lớn → dự báo không chính xác
Phương pháp trung bình đơn giản thường được sử dụng khi dãy số liệu không biến đổi theo mùa,không có hướng, không đối xứng và với tập số liệu lớn
b Phương pháp trung bình dịch chuyển ; (Moving – Average)
Trong phương pháp này, người ta sử dụng giá trị trung bình của n số liệu quan sát trước thời điểm dự báo
Ft+1 =
n 1
(Xt + Xt-1 + Xt-2 +….+ Xt-n+1)
Trang 14Nhận xét:
- Mô hình này chú ý đến n số liệu quan sát đã biết gần thời điểm dự báo nhất
- Số n không thay đổi khi tính giá trị trung bình dịch chuyển
• n = 1⇒ Ft+1 = Xt : Phương pháp nạve
• n = 1⇒ Ft+1 = ∑
=
n 1 t t
X n
- Tổng quát, phương pháp trung bình dich chuyển tốt hơn phương pháp trung bình giản đơn
Ví dụ:
Giá trị dự báo cho quí I/1985 với n = 4
F25 =
4
1(X24 +X23 + X22 +X21 )
=
4
1 (650 + 400 +500 +750 ) =
4
1 * 2300
F25 = 575
e25 = X25 - F25
= 850 – 575
e25 = 275
c Phương pháp làm tròn hàm mũ:(Exponentral Smoothing Methods)
Ft+1 :giá trị dự báo ở thời điểm t+1
Ft :giá trị dự báo ở thời điểm t
Xt :giá trị quan sát ở thời điểm t
α :hằng số làm tròn ,0≤α≤1
(toàn bộ số
liệu)
Ft+1 = α Xt + (1-α) Ft
Trang 158.3.3.3 Phương pháp tự hồi qui:(Autoregressive models)
a) Mô hình tự hồi qui bậc 1:(first-order autoregressive models)
β, Φ1: là các tham số cố định
at : là biến ngẫu nhiên có số trung bình là 0
b) Mô hình tự hồi qui bậc 2 (second order autoregressive models )
c) Mô hình tự hồi qui bậc p: (Autoregressive model of order p)
Xt= β + Φ1 Xt-1 + at
Xt = β +Φ1 Xt-1+ Φ2Xt-2+ at
Xt = β + Φ1 Xt-1 + Φ2 Xt-2 + … + ΦpXt-p +at