Cùng với mô hình ARIMA, mô hình Holt-Winters cũng đang được xem là rất thích hợp cho dự báo ngắn hạn một số vấn đề về kinh tế - xã hội từ dữ liệu chuỗi thời gian có tính mùa vụ.. Luận vă
Trang 1ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ
-*** -
Tạ Mạnh Cường
DỰ BÁO CHUỖI DỮ LIỆU PHỤ
THUỘC THỜI GIAN THEO MÙA VỤ BẰNG MÔ HÌNH HOLT-WINTERS
LUẬN VĂN THẠC SĨ
Hà nội - 2006
Trang 2ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ
-*** -
Tạ Mạnh Cường
DỰ BÁO CHUỖI DỮ LIỆU PHỤ THUỘC THỜI GIAN THEO MÙA VỤ BẰNG MÔ HÌNH HOLT-WINTERS
Ngành: Công nghệ thông tin
Mã số: 1.01.10
LUẬN VĂN THẠC SĨ
Người hướng dẫn khoa học: TS Đỗ Văn Thành
Hà nội - 2006
Trang 3Mục lục
Lời cảm ơn 1
Mở đầu 2
Chương 1: Chuỗi thời gian và phân tích dự báo chuỗi thời gian 5
1 Chuỗi thời gian và dự báo chuỗi thời gian 5
1.1 Định nghĩa chuỗi thời gian 5
1.2 Dự báo chuỗi thời gian 6
2 Đại lượng đặc trưng chuỗi thời gian 7
2.1 Các đại lượng thống kê đặc trưng cho chuỗi thời gian 7
2.2 Các đại lượng mô tả mối quan hệ giữa các phần tử trong chuỗi 8
3 Phân tích, dự báo chuỗi thời gian 10
4 Các mô hình chuỗi thời gian đơn giản 12
4.1 Nhiễu trắng 12
4.2 Mô hình bước ngẫu nhiên 12
4.3 Bước ngẫu nhiên có bụi 12
5 Một số phép toán và kiểm định thống kê 13
5.1 Kiểm định T 13
5.2 Toán tử trễ 13
6 Kết luận chương 1 14
Chương 2: Mô hình làm trơn hàm mũ Holt-Winters 15
1 Một số khái niệm cơ bản 15
1.1 Mô hình mùa vụ cộng và mô hình mùa vụ nhân 15
1.2 Xu thế tuyến tính, hàm mũ hoặc kết hợp cả hai 18
1.3 Chỉ số mùa vụ SI (Seasonal Index) 18
Trang 42 Làm trơn hàm mũ (Exponential smoothing) 18
2.1 Làm trơn hàm mũ dạng đơn giản (single exponential smoothing) 18 2.2 Làm trơn hàm mũ bậc hai (double exponential smoothing) 20
2.3 Làm trơn hàm mũ bậc ba (triple exponential smoothing) 21
3 Mô hình mùa vụ nhân 21
3.1 Khái quát 21
3.2 Ứng dụng mô hình 22
3.3 Chi tiết 22
3.3.1 Các ký hiệu sử dụng 22
3.3.2 Thủ tục cho việc cập nhật các ước lượng tham số mô hình 22
3.3.3 Giá trị dự báo 23
3.3.4 Khởi tạo giá trị của các tham số trong mô hình 24
4 Mô hình mùa vụ cộng 25
4.1 Khái quát 25
4.2 Ứng dụng mô hình 26
4.3 Chi tiết 26
4.3.1 Các ký hiệu sử dụng 26
4.3.2 Thủ tục cho việc cập nhật các ước lượng tham số mô hình 26
4.3.3 Giá trị dự báo 27
5 Xây dựng mô hình làm trơn hàm mũ HW 28
5.1 Các bước xây dựng và lựa chọn các tham số 28
5.2 Đánh giá dự báo và sai số của dự báo 29
5.3 So sánh các bước xây dựng mô hình Holt-Winters và ARIMA: 30
5.4 Chuyển đổi mô hình HW sang mô hình ARIMA 31
5.5 Lựa chọn đặc tính chuỗi phù hợp với mô hình Holt-Winters 32
Trang 56 Kết luận chương 2 33
Chương 3: Ứng dụng mô hình Holt-Winters cho mùa vụ 34
1 Bài toán 1 - Dự báo chỉ số giá tiêu dùng 34
1.1 Bước 1: Nhận dạng chuỗi 36
1.1.1 Nhận dạng thành phần xu thế 36
1.1.2 Nhận dạng thành phần mùa vụ 37
1.2 Lựa chọn mô hình Holt-Winters theo mùa vụ 38
1.3 Kiểm định các tham số ước lượng mô hình 40
1.4 Dự báo 41
2 Bài toán 2 - Dự báo giá trị hàng hoá xuất khẩu của Việt nam 43
2.1 Bước 1: Nhận dạng chuỗi 44
2.1.1 Nhận dạng thành phần xu thế 44
2.1.2 Nhận dạng thành phần mùa vụ 45
2.2 Lựa chọn mô hình Holt-Winters theo mùa vụ 47
2.3 Kiểm định các tham số ước lượng mô hình 48
2.4 Dự báo 49
3 So sánh, nhận xét giữa mô hình Holt-Winters và SARIMA 51
4 Kết luận chương 3 54
Kết Luận 55
Tài Liệu Tham Khảo 58
Trang 6Danh mục hình vẽ
Hình 1 - Chuỗi nhiễu trắng 12
Hình 2 - Đồ thị của chuỗi thời gian theo mô hình mùa vụ cộng 17
Hình 3 - Đồ thị của chuỗi thời gian theo mô hình mùa vụ nhân 17
Hình 4 - Các bước xây dựng mô hình Holt-Winters 28
Trang 7Danh mục bảng biểu
Bảng 1 - So sánh các bước xây dựng mô hình HW và ARIMA 31Bảng 2 - Chuyển đổi một số mô hình làm trơn hàm mũ sang ARIMA 31Bảng 3 - Lựa chọn mô hình HW theo đặc tính chuỗi 33Bảng 4 - Số liệu chỉ số giá tiêu dùng (nguồn dữ liệu: Tổng cục thống kê; đơn
vị tính 1/10.000) 35Bảng 5 – Giá trị xuất khẩu của Việt nam (nguồn: tổng cục thống kê; đơn vị: triệu USD) 44Bảng 6 - Một số kết quả so sánh dự báo giữa mô hình HW & ARIMA 53Bảng 7 - Một số đánh giá, nhận xét giữa mô hình HW & ARIMA 54
Trang 8Bảng từ ngữ, thuật ngữ viết tắt
tắt
Từ tiếng Anh
Hàm tự tương quan ACF AutoCorrelation Function
Tiêu chuẩn thông tin
AIC/SIC
AIC/SIC Akaike Information Criteria,
Schwarz Information Criteria Sai số phần trăm tuyệt đối APE Absolute Percent Error
Tích hợp trung bình trượt tự
hồi qui
ARIMA AutoRegressive Integrated
Moving Average Trung bình trượt tự hồi qui ARMA AutoRegressive Moving
Distribution
Sai số tuyệt đối trung bình MAE Mean Absolute Error
Sai số bình phương trung
bình
MSE Mean Square Error
Trang 9Ước lượng bình phương nhỏ
hồi qui theo mùa vụ
SARIMA Seasonal AutoRegressive
Integrated Moving Average Trung bình trượt theo mùa
vụ
SMA Seasonal Moving Average
Tổng bình phương sai số SSE Sum of Square Error
Trang 10Lời cảm ơn
Luận văn thạc sĩ chuyên ngành CNTT: “Dự báo chuỗi dữ liệu phụ thuộc thời gian theo mùa vụ bằng mô hình Holt-Winters” được TS Đỗ Văn
Thành công tác tại Trung tâm thông tin và dự báo Kinh tế - Xã hội Quốc gia -
Bộ kế hoạch và đầu tư, người đã tận tình hướng dẫn và giúp đỡ tác giả rất nhiều trong quá trình thực hiện luận văn này, người đã mở ra cho tác giả những cách tiếp cận mới của công nghệ thông tin vào trong đời sống thực tế Qua đây, tác giả xin gửi tới TS Đỗ Văn Thành lời cảm ơn chân thành và sâu sắc nhất
Tác giả cũng xin bày tỏ lời cảm ơn tới các thầy TS Hà Quang Thụy, GS.TSKH Phan Đình Diệu, PGS.TS Trịnh Nhật Tiến, PGS.TS Đoàn Văn Ban, TS Nguyễn Việt Hà, TS Hoàng Xuân Huấn, PGS.TS Nguyễn Ngọc Bình, PGS TS Đinh Mạnh Tường những người đã truyền cho tác giả nhiều kiến thức và kinh nghiệm quý báu trong thời gian tác giả theo học cao học tại Trường Đại học Công nghệ - Đại học Quốc gia Hà nội
Tác giả cũng xin gửi lời cảm ơn chân thành đến một số cán bộ thuộc Tổng cục Thống kê Việt nam, những người đã giúp đỡ nhiệt tình trong việc cung cấp số liệu đầy đủ, trung thực phục vụ cho luận văn này
Cuối cùng, tác giả xin gửi lời cảm ơn đến bạn Trần Văn Thái, người đã giúp đỡ tác giả hoàn thành luận văn này đồng thời cũng xin gửi lời cám ơn tới tất cả người thân trong gia đình, bạn bè trong quá trình học tập và công tác
Tác giả
Tạ Mạnh Cường
Trang 11Với sự bùng nổ về thông tin và dữ liệu về kinh tế - xã hội, để dự báo chính xác và kịp thời tình hình biến động của kinh tế - xã hội Việt Nam và thế giới phục vụ công tác chỉ đạo, điều hành về kinh tế của Chính phủ thì việc ứng dụng các phương tiện kỹ thuật và công nghệ của CNTT nhằm phát hiện tri thức mới từ dữ liệu kinh tế - xã hội hiện tại và quá khứ là cách tiếp cận đang được các nhà nghiên cứu và ứng dụng Việt Nam hết sức quan tâm Luận văn này nằm trong hướng nghiên cứu ứng dụng đó
Như đã biết các dữ liệu phát triển kinh tế - xã hội là phụ thuộc thời gian, được thu thập định kỳ theo tháng, quý, năm và có tính mùa vụ rất rõ Hiện đã có nhiều phương pháp dự báo kinh tế - xã hội khác nhau, mỗi phương pháp thường phù hợp với một số vấn đề dự báo kinh tế - xã hội nhất định trong một nền kinh tế cụ thể, bởi vậy việc nghiên cứu xác định phương pháp
dự báo hiệu quả, phù hợp với thực tiễn phát triển kinh tế - xã hội Việt nam là vấn đề đòi hỏi phải được quan tâm nghiên cứu ứng dụng
Trong phân tích và dự báo dữ liệu chuỗi thời gian về kinh tế - xã hội, hiện có bốn mô hình đang được đặc biệt quan tâm, đó là mô hình hồi quy
Trang 12chuỗi thời gian, mô hình tích hợp trung bình trượt tự hồi quy ARIMA, mô hình tự hồi quy véc tơ VAR và mô hình làm trơn hàm mũ Holt-Winters Cùng với mô hình ARIMA, mô hình Holt-Winters cũng đang được xem là rất thích hợp cho dự báo ngắn hạn một số vấn đề về kinh tế - xã hội từ dữ liệu chuỗi thời gian có tính mùa vụ
Luận văn ”Dự báo chuỗi dữ liệu phụ thuộc thời gian theo mùa vụ bằng
mô hình Holt-Winters” sẽ tập trung khảo cứu và ứng dụng mô hình làm trơn
hàm mũ Holt-Winters để dự báo biến động về chỉ số giá tiêu dùng và giá cả một số mặt hàng theo tháng, tổng giá trị xuất khẩu của Việt nam theo tháng trên những số liệu chính thống do Tổng cục Thống kê thu thập Việc dự báo những nội dung trên đã được thực hiện bằng việc ứng dụng mô hình ARIMA
đã được trình bầy trong một luận văn cao học, khoa CNTT - Đại học Công nghệ thực hiện, trong luận văn này sẽ tập trung nghiên cứu làm rõ sự giống và khác nhau của hai mô hình này, so sánh kết quả dự báo bằng việc ứng dụng cả hai mô hình trên cùng tập dữ liệu thử nghiệm
Luận văn gồm 3 chương nội dung, không kể phần mở đầu, phần kết luận, phần phụ lục và tài liệu tham khảo
Chương 1: Chuỗi thời gian và Phân tích chuỗi thời gian, sẽ giới thiệu
một cách tóm tắt những khái niệm chủ yếu liên quan đến chuỗi thời gian và các bước tiến hành phân tích và dự báo chuỗi thời gian, giới thiệu một số mô hình chuỗi thời gian đơn giản và một số kiểm định thống kê sử dụng cho phân tích, dự báo dữ liệu chuỗi thời gian Chi tiết của những khái niệm này có thể được tham khảo trong phần phụ lục
Chương 2: Mô hình làm trơn hàm mũ Holt-Winters Nội dung chính
của chương là trình bày một cách có hệ thống mô hình làm trơn hàm mũ đơn,
mô hình làm trơn hàm mũ bậc hai và mô hình làm trơn hàm mũ bậc ba Winters) để dự báo dữ liệu chuỗi thời gian có tính chất xu thế và tính chất
Trang 13(Holt-mùa vụ Việc lựa chọn mô hình làm trơn hàm mũ nào phụ thuộc vào tính chất
dữ liệu chuỗi thời gian cụ thể
Chương 3: Ứng dụng mô hình Holt-Winters Chương này tập trung
trình bày qui trình ứng dụng mô hình Holt-Winters theo mùa vụ để dự báo một số chỉ số kinh tế vĩ mô quan trọng phản ánh mức độ tăng trưởng kinh tế Việt nam như dự báo chỉ số giá tiêu dùng theo tháng (CPI), tổng giá trị hàng hóa xuất khẩu của Việt nam theo tháng Dữ liệu được sử dụng để dự báo là số liệu thực tế của nền kinh tế do Tổng cục Thống kê công bố Các kết quả dự báo theo mô hình Holt-Winters sẽ được so sánh với các kết quả dự báo theo
mô hình ARIMA
Phần kết luận: Tổng kết những công việc đã thực hiện và kết quả đạt
được trong luận văn này, đồng thời đề xuất một số hướng nghiên cứu tiếp theo
Phụ lục: Gồm hai phần, Phần 1 của phụ lục sẽ giới thiệu chi tiết hơn
một số khái niệm quan trọng liên quan đến chuỗi thời gian và phân tích, dự báo dữ liệu chuỗi thời gian, Phần 2 của phụ lục sẽ giới thiệu mô hình ARIMA cho mùa vụ
Trang 14dự báo, như dùng phương pháp phân tích hồi qui bội xem xét GDP phụ thuộc vào lượng đầu tư trong nước, lượng đầu tư nước ngoài, dân số…
Luận văn này chỉ tập trung vào phân tích, dự báo theo mức thời gian dựa trên giả định cơ bản là các yếu tố ảnh hưởng đến biến động của hiện tượng trong quá khứ và hiện tại sẽ còn tiếp tục tồn tại trong tương lai
Chương này sẽ trình bày sơ lược một số vấn đề chủ yếu liên quan đến chuỗi thời gian bao gồm khái niệm, dự báo cho chuỗi thời gian và các đại lượng đặc trưng của nó, tiếp đó trình bày về các mô hình chuỗi thời gian đơn giản, đưa ra một số phương pháp kiểm định thống kê cho mô hình chuỗi thời gian Chi tiết xin tham khảo ở phần Phụ lục
1 Chuỗi thời gian và dự báo chuỗi thời gian
1.1 Định nghĩa chuỗi thời gian
Chuỗi dữ liệu phụ thuộc thời gian được chia làm hai loại:
- Chuỗi dữ liệu phụ thuộc thời gian được quan sát, đo đạc trong khoảng thời gian rời rạc: Các quan sát được thực hiện tại các thời điểm tách
Trang 15biệt, chúng thường là các quan sát được đo tại các mốc thời gian cách đều nhau, ví dụ chuỗi thời gian được đo theo tuần, quý, tháng, năm, …
- Chuỗi dữ liệu liên tục theo thời gian: Các quan sát được đo trong khoảng thời gian liên tục, ví dụ chuỗi dữ liệu đo nhiệt độ trong ngày (nhiệt kế)
Luận văn này tập trung vào chuỗi dữ liệu phụ thuộc thời gian được đo trong khoảng thời gian rời rạc và cách đều nhau, gọi là chuỗi thời gian (series time data)
Như vậy: Chuỗi thời gian là một tập giá trị các quan sát của biến ngẫu nhiên, ký hiệu là {z t}, t 1, ,n là số các quan sát, đo được trong các khoảng
thời gian t như nhau (hàng năm, quý, tháng, tuần, ngày …) và được xếp theo
thứ tự thời gian
Ví dụ:
- Chuỗi giá trị tổng sản phẩm quốc nội (GDP) được đo theo từng quý
- Chuỗi giá trị đo lượng mưa trung bình hàng năm
- Chuỗi giá trị chỉ số thị trường chứng khoán đo theo ngày
- Chuỗi giá trị đo sản lượng điện năng tiêu thụ của Việt Nam đo theo từng tháng, từng quí trong nhiều năm
- Chuỗi giá trị về chỉ số giá tiêu dùng của Việt Nam theo từng tháng, quý trong năm
1.2 Dự báo chuỗi thời gian
Dự báo chuỗi thời gian là ước lượng các giá trị của biến ngẫu nhiên chuỗi thời gian z th (h1), ký hiệu là z ˆ h t( ), dựa trên sự tương quan với các giá trị của biến ngẫu nhiên {z t} đã được quan sát trong quá khứ
Chất lượng của dự báo phụ thuộc vào nhiều yếu tố chẳng hạn sự phức tạp của chuỗi thời gian khi thực hiện phân tích, tác động của nhiều yếu tố bất
Trang 16thường không thể lường trước được khi tiến hành dự báo, ngoài ra độ chính xác cũng còn phụ thuộc phần lớn vào khoảng cách xa gần của dự báo (dự báo gần thì cho độ chính xác của dự báo tốt hơn so với dự báo xa)
2 Đại lượng đặc trưng chuỗi thời gian
Giả sử có chuỗi thời gian {z t} gồm n các quan sát, t1, ,n
2.1 Các đại lượng thống kê đặc trưng cho chuỗi thời gian
Kỳ vọng: Đại diện cho giá trị trung tâm trong chuỗi:
)(z t
z n
) (z t z2 t 2
Tương tự, phương sai mẫu được tính:
2 1
2
)(
Trang 172.2 Các đại lượng mô tả mối quan hệ giữa các phần tử trong chuỗi
Tự hiệp phương sai: Tự hiệp phương sai giữa hai z t và z tk, giữa chúng có k 1 quan sát gọi là k độ trễ, được xác định như sau:
cov)
z k z t z tk E z t z tk (1.6)Trong đó, là kỳ vọng chung của z t và z tk Tự hiệp phương sai khi
độ trễ k 0 chính là phương sai của z t: 2
,cov)
0
Tương tự, tự hiệp phương sai mẫu được tính:
))(
(
1)(ˆ
1
z z
z z n
k n
t t
Trong đó, z là kỳ vọng mẫu của z t và z tk
Hàm tự tương quan (ACF): Mô tả tương quan tại trễ k giữa các giá
trị trong chuỗi thời gian, được xác định:
)(
)(
))(
()
()
,cov(
z z
z z
z
k t t k
z E z
E
z z
E k
z z
k t t k
t t
(1.8)
Trong đó, z( k ) là tự hiệp phương sai,
k t
z
lần lượt là độ lệch chuẩn của z t và z tk
Tự tương quan mẫu được tính theo công thức:
)0(ˆ
)(ˆˆ
z
z k
, do khi đó cov(z t,z tk)0 Nhưng điều ngược lại chưa hẳn đã đúng
Hàm tự tương quan từng phần (PACF): Tự tương quan giữa hai biến
t
z và z tk gồm k 1 biến trung gian z t1, z t2, … , z tk1:
Trang 181 1 , 1
1
k
j
j j k
k
j
j k j k k
kj 1, 1,
Giá trị ban đầu, 11 1
Bằng tính toán tương tự trên các quan sát mẫu có được tự tương quan từng phần mẫu ˆ Khảo sát tự tương quan từng phần như một hàm với tham kk
số biến thiên theo độ trễ k được gọi là hàm tự tương quan từng phần
Hệ số R 2
: Được sử dụng để đo độ thích hợp của mô hình ước lượng
Giả sử cho mô hình hồi qui chuỗi thời gian y t 12z t a t Hệ số R2
i i
n
i
i i
y y z
z
y y z z R
1
2 1
2
2 1
2
)(
)(
))(
((
(1.12)
Trong đó, n là số các quan sát, z là kỳ vọng mẫu của biến độc lập z t, y là
kỳ vọng mẫu của biến phụ thuộc y t Dễ dàng thấy 0 R2 1 nếu R2 tiến đến 1 thì mô hình hồi qui được lựa chọn là hợp lý, ngược lại nếu 2
R tiến về 0 thì mô hình được lựa chọn là chưa hợp lý
Hệ số điều chỉnh 2
R : Đôi khi hệ số 2
R không phản ánh trung thực mức độ hợp lý của mô hình, chẳng hạn khi thêm các tham biến được cho là không hợp lý vào mô hình thì 2
R không những không giảm mà ngược lại còn tăng lên Vì thế hệ số điều chỉnh 2
R được xem xét để thẩm định rõ sự phù hợp của mô hình:
Trang 19k n
n R R
ở đây n là số các quan sát của chuỗi thời gian, k là số các tham biến trong
mô hình R2 luôn nhỏ hơn R2, và giảm nếu bổ sung thêm biến hồi qui không hợp lý vào mô hình
3 Phân tích, dự báo chuỗi thời gian
Quá trình phân tích, dự báo chuỗi thời gian {z t} là để tìm ra các mô hình, luật ẩn trong nó, việc này được thực hiện trên các quan sát mẫu, gồm có những bước sau:
Bước 1: Nhận dạng các thành phần ẩn tồn tại trong chuỗi thời gian [4]
- Thành phần xu thế (Trend - T): Thể hiện chiều hướng biến động tăng hoặc giảm của các hiện tượng nghiên cứu trong thời gian dài
- Thành phần chu kỳ (Period - P): Thể hiện biến động của hiện tượng được lặp lại với chu kỳ nhất định, thường kéo dài từ 2 đến 10 năm
- Thành phần mùa vụ (Seasonal - S): Biểu hiện sự tăng hoặc giảm mức
độ của hiện tượng ở một số thời điểm (tháng, quý, năm) nào đó được lặp đi lặp lại qua nhiều năm
- Thành phần ngẫu nhiên (Irregular - I): Thể hiện những biến động không
có qui luật và hầu như không dự báo hoặc quan sát được trong của hiện tượng đang nghiên cứu
Những thành phần này kết hợp với nhau trong chuỗi thời gian bằng nhiều cách thức khác nhau, chẳng hạn chuỗi thời gian z t được mô tả là tích các thành phần, z t T PS I gọi là mô hình tích, hoặc z t T PS I
gọi là mô hình tổng, hoặc kết hợp cả hai z t TPS I Do vậy, để phân tích và nghiên cứu hành vi cũng như dự báo biến động của chuỗi thời gian thì
Trang 20cần thiết phải ước lượng được các thành phần nói trên trong chuỗi thời gian
và cách thức kết hợp chúng với nhau trong chuỗi
Bước 2: Làm trơn số liệu
Tuỳ theo mô hình dự báo áp dụng mà cần thiết tiến hành bước làm trơn
số liệu hay không ? Trong trường hợp mô hình dự báo áp dụng cần quá trình làm trơn số liệu ta tiến hành loại trừ được thành phần xu thế và mùa vụ trong chuỗi thời gian Chuỗi thu được sau cùng không còn chứa các thành phần đó (chuỗi được làm trơn) sẽ khiến cho việc phân tích dễ dàng hơn
Bước 3: Chọn lựa, ước lượng và đánh giá mô hình
Chọn lựa mô hình trong lớp các mô hình, sao cho mô hình được lựa
chọn là “tốt nhất” trong số các mô hình ứng cử và nó cũng phải đơn giản và
có thể hiểu được dễ dàng Sau đó thực hiện ước lượng các tham số, phần dư cho mô hình vừa chọn lựa và chúng phải thỏa mãn các tiêu chí kiểm định, đánh giá Mô hình ước lượng được đánh giá là hợp lý khi đó sẽ sinh ra chuỗi
“gần giống” với chuỗi dữ liệu quan sát thực
Bước 4: Dự báo
Dựa trên mô hình thực hiện dự báo giá trị tương lai cho chuỗi thời gian, phân tích sự phù hợp của giá trị dự báo cả về mặt thực nghiệm và lý thuyết Xác định độ chệch giữa giá trị dự báo với giá trị quan sát thực và khoảng tin cậy của dự báo tức là giới hạn mà giá trị quan sát thực sẽ nằm trong
Ứng dụng kết quả dự báo vào thực tế
Trên cơ sở các dự báo về các giá trị tương lai của hiện tượng nghiên cứu đề ra các quyết định kinh doanh hoặc chính sách Đồng thời gộp thêm các giá trị quan sát mới vào chuỗi dữ liệu quan sát nhằm mục đích hiệu chỉnh lại
mô hình để đưa ra dự báo tốt hơn
Trang 214 Các mô hình chuỗi thời gian đơn giản
4.1 Nhiễu trắng [2]
Chuỗi thời gian là nhiễu trắng nếu nó hầu như không thể hiện một cấu trúc, hình mẫu rõ rệt nào cũng như không có bất kỳ sự tự tương quan nào trong chuỗi Chuỗi nhiễu trắng, ký hiệu a t, là dãy các biến ngẫu nhiên có phân phối đồng nhất độc lập (Independent Identical Distribution - i.i.d)
Nhiễu trắng a t được ký hiệua t ~WN(0,a2)
Hình 1 - Chuỗi nhiễu trắng
Trong thực tế, rất hiếm chuỗi thời gian là nhiễu trắng, nhưng nó lại là công cụ cơ bản để tạo ra mô hình phức tạp
4.2 Mô hình bước ngẫu nhiên [9] [3]
Mô hình bước ngẫu nhiên là mô hình mà giá trị sinh ra từ nó được xác định bằng giá trị của quan sát ngay trước nó cộng thêm nhiễu trắng:
t t
trong đó, t1,2 a t là nhiễu trắng, a t và z t không tương quan với nhau
4.3 Bước ngẫu nhiên có bụi
Mô hình bước ngẫu nhiên có bụi là mô hình bước ngẫu nhiên cộng thêm một hằng số α:
Trang 22t t
trong đó, giả định a t là nhiễu trắng, 1 là hệ số chặn và 2 là hệ số góc Một
số phép toán và kiểm định thống kê cho mô hình trên gồm:
5.1 Kiểm định T
Do các hệ số 1,2 là tổng thể, chúng chỉ có thể ước lượng được qua từng mẫu cụ thể, gọi là hệ số ước lượng mẫu ˆ1, ˆ2 Khi thực hiện các ước lượng này, điều được quan tâm hơn cả là hệ số ước lượng này có bằng 0 hay không ? Kiểm định T còn được gọi là kiểm định ý nghĩa của hệ số ước lượng trong mô hình, với giả thiết kiểm định thống kê H0:j 0 để kiểm chứng điều đó Thống kê:
j j
j j
ˆ ˆ là phương sai ước lượng của
hệ số ước lượng mẫu j, thống kê T tuân theo phân phối chuẩn T với n1
bậc tự do
5.2 Toán tử trễ [1]
Giả sử có chuỗi các quan sát {z t}, t 1, ,n
Toán tử B được gọi là toán tử trễ nếu nó thực hiện phép biến đổi:
Trang 23Toán tử trễ có các tính chất điển hình sau:
- Sai phân theo trễ mùa vụ bậc 1:
t z s B s
t z t z t
để tiến hành phân tích, dự báo chuỗi thời gian và một số mô hình chuỗi thời gian đơn giản cũng như các đại lượng đặc trưng như trung bình, phương sai,
tự tương quan, tự tương quan từng phần… cho chuỗi thời gian và công thức xác định chúng cũng được đề cập đến trong chương này Chi tiết xin tham khảo ở phần Phụ lục
Trong chương tiếp theo của luận văn sẽ trình bày mô hình dự báo dữ liệu chuỗi thời gian mang tính mùa vụ đang được quan tâm nghiên cứu ứng dụng: mô hình làm trơn hàm mũ Holt-Winters
Trang 24Chương 2:
Mô hình làm trơn hàm mũ Holt-Winters
Có rất nhiều dữ liệu chuỗi thời gian có tính chất mùa vụ, ví dụ số lượng tiêu thụ quần áo hay doanh thu mặt hàng đồ chơi cho trẻ em, chỉ số giá tiêu dung trong năm… Bài toán dự báo theo mùa vụ có một vị trí quan trọng trong
dự báo tình hình phát triển kinh tế - xã hội hay trong sản xuất kinh doanh của bất kỳ đơn vị sản xuất kinh doanh nào Chương này tập trung giới thiệu mô hình làm trơn hàm mũ Holt-Winters Hai mô hình trong kỹ thuật làm trơn hàm mũ Holt-Winters được giới thiệu trong chương này là: mô hình mùa vụ nhân (Multiplicative Seasonal Model) và mô hình mùa vụ cộng (Additive Seasonal Model) cho chuỗi thời gian có tính chất xu thế và tính chất mùa vụ
1 Một số khái niệm cơ bản
1.1 Mô hình mùa vụ cộng và mô hình mùa vụ nhân
Rất nhiều chuỗi thời gian trong thực tế thể hiện các mẫu, hành vi lặp lại
có tính mùa vụ Có một sự khác biệt nhỏ trong khái niệm giữa tính chu kỳ và tính mùa vụ, đó là tính chu kỳ thể hiện một hành vi, mẫu xuất hiện lặp lại không ít thì nhiều trong một khoảng thời gian nào đó, chẳng hạn chu kỳ nhật thực, chu kỳ tuần hoàn… còn tính mùa vụ chỉ ra rằng các hành vi, mẫu lặp đi lặp lại đều đặn trong những khoảng thời gian cố định như hàng năm, hàng
ngày, hàng tuần, hàng thập kỷ Thuật ngữ “mùa vụ” đã trở thành thông dụng
khi dữ liệu chuỗi thời gian được phân tích theo tháng, quý hoặc năm Khoảng
thời gian của một mùa vụ được ký hiệu là s Nếu dữ liệu được lấy theo tháng thì khoảng thời gian cho một mùa vụ s là 12 (có 12 tháng/năm), nếu lấy theo quý thì khoảng thời gian cho một mùa vụ s là 4 (có 4 quí/năm), theo ngày thì
Trang 25s là 24 (24 giờ/ngày), theo tuần thì s là 7; 6; 5 (7 ngày/tuần, 6 ngày/tuần, 5
ngày/tuần tuỳ theo số ngày thu thập dữ liệu)
Ví dụ, doanh thu từ một mặt hàng đồ chơi cho trẻ em nào đó thường lên đến đỉnh điểm vào tháng 11, 12 trong năm và giảm thấp nhất vào mùa hè trong năm Doanh thu bán hàng của mặt hàng đồ chơi này có thể tăng đỉnh điểm thêm khoảng 1 triệu dollar tháng 12 hàng năm Vì vậy, chúng ta có thể đưa vào phần dự báo cho tháng 12 doanh thu tăng thêm 1 triệu dollar (trên doanh thu trung bình hàng năm) của việc bán hàng và doanh thu này diễn ra đều đặn hàng năm Trong trường hợp này, ta nói dữ liệu chuỗi thời gian này
có tính chất mùa vụ tăng trưởng theo cấp số cộng hay tuân theo mô hình mùa
vụ cộng (Additive Seasonal Model)
Một cách khác, trong tháng 12 doanh thu bán hàng của của một mặt hàng đồ chơi cho trẻ em nào đó có thể tăng 40% (so với doanh thu trung bình hàng năm) có nghĩa là hệ số tăng trưởng của doanh thu là 1,4 Vì vậy, doanh thu bán hàng của mặt hàng đồ chơi trong tháng 12 có thể đạt cao hay thấp nhưng mức độ tăng trưởng doanh thu của tháng sẽ tăng tỷ lệ theo một hệ số
cố định nào đó (trong trường hợp này là 1,4) Trong trường hợp này, ta nói dữ liệu chuỗi thời gian có tính chất mùa vụ tăng trưởng theo cấp số nhân hay tuân theo mô hình mùa vụ nhân (Multiplicative Seasonal Model)
Trang 261 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Khoảng thời gian
Đồ thị chuỗi theo mùa vụ Cộng
Hình 2 - Đồ thị của chuỗi thời gian theo mô hình mùa vụ cộng
Khoảng thời gian
Đồ thị chuỗi theo mùa vụ Nhân
Hình 3 - Đồ thị của chuỗi thời gian theo mô hình mùa vụ nhân
Trang 27Đồ thị biểu diễn các chuỗi mùa vụ trong hình trên cho thấy: đối với chuỗi theo mô hình cộng, dao động của chuỗi là khác đều đặn với các chu kỳ mùa vụ khác nhau và không có mức độ biến thiên lớn (về biên độ) trên toàn
bộ chuỗi; trong trường hợp chuỗi theo mô hình nhân, mức độ biến thiên về biên bộ dao động giữa các chu kỳ mùa vụ có sự biến động trên toàn bộ chuỗi
1.2 Xu thế tuyến tính, hàm mũ hoặc kết hợp cả hai
Tiếp theo ví dụ về doanh thu bán hàng mặt hàng đồ chơi đã trình bày ở trên, doanh thu bán hàng cho mặt hàng đồ chơi có thể biểu diễn qua hàm tuyến tính biểu diễn tính xu thế (ví dụ: với mỗi năm, doanh thu bán hàng tăng
1 triệu USD); hoặc xu thế theo hàm mũ (ví dụ: với mỗi năm, doanh thu bán hàng tăng với một tỷ lệ là 1,4); hoặc xu thế là kết hợp của cả hai (trong năm đầu tiên doanh thu tăng 1 triệu USD, trong năm thứ hai doanh thu tăng 40%
so với doanh thu năm trước đó)
1.3 Chỉ số mùa vụ SI (Seasonal Index)
Chỉ số mùa vụ của một chu kỳ chỉ ra độ lệch cơ bản của chu kỳ đó đối với trung bình của năm là bao nhiêu Ít nhất cần đầy đủ dữ liệu của một mùa
vụ để tính toán SI
2 Làm trơn hàm mũ (Exponential smoothing)
2.1 Làm trơn hàm mũ dạng đơn giản (single exponential smoothing)
Làm trơn hàm mũ dạng đơn giản được sử dụng cho các dự báo ngắn hạn, thường chỉ dự báo một tháng trong tương lai Mô hình này giả sử rằng dữ liệu dao động xung quanh một giá trị trung bình ổn định chấp nhận được
Trang 28(không có xu thế tăng hoặc giảm) Nghĩa là đối với chuỗi không thay đổi hoặc thay đổi rất chậm theo thời gian thì có thể áp dụng phương pháp này
Công thức của phương pháp làm trơn hàm mũ dạng đơn giản:
Vì vậy, theo kết quả, mỗi giá trị được làm trơn sẽ có trọng số trung bình
của quan sát trước đó, nơi mà các trọng số giảm dần theo hàm mũ phụ thuộc vào giá trị của tham số Nếu 1 (một) thì quan sát trước đó được hoàn toàn bỏ qua; nếu 0 (không), khi đó quan sát hiện tại được bỏ qua hoàn toàn; và giá trị được làm trơn hoàn toàn bao gồm các giá trị được làm trơn trước đó (được lần lượt tính toán từ các giá trị được làm trơn trước …, và
cứ như vậy; tất cả các giá trị được làm trơn sẽ bằng giá trị ban đầu S0) Giá trị khởi tạo ban đầu của S t có vai trò quan trọng trong tính toán cho tất cả các giá trị sau đó Đặt S0 y1 là một phương án chọn giá trị khởi tạo Một phương án khác có thể lấy trung bình của 4 hoặc 5 giá trị quan sát đầu tiên Với giá trị nhỏ, việc chọn giá trị khởi tạo ban đầu cho S t là rất quan trọng
Trang 292.2 Làm trơn hàm mũ bậc hai (double exponential smoothing)
Phương pháp này được sử dụng khi dữ liệu có tính xu thế Làm trơn hàm mũ với xu thế phức tạp hơn so với làm trơn hàm mũ đơn giản với hai thành phần phải được cập nhật lại tại mỗi mức chu kỳ và mức xu thế Tại mỗi mức này, giá trị ước lượng được làm trơn cho dữ liệu ở cuối mỗi kỳ Thành phần xu thế được làm trơn bằng ước lượng của mức tăng trung bình tại cuối mỗi kỳ Công thức cho làm trơn hàm mũ bậc hai như sau:
))(
1( 1 1
t t n
1 y y
b
3/)]
()(
)
1 y y n
Trang 302.3 Làm trơn hàm mũ bậc ba (triple exponential smoothing)
Phương pháp này được sử dụng khi trong dữ liệu có tính xu thế và tính mùa vụ Để theo dõi được tính mùa vụ, ta cần phải đưa thêm vào phương trình thứ ba Sau đây chúng ta giới thiệu phương trình thứ ba để theo dõi tính mùa vụ Kết quả của hệ các phương trình này được gọi là phương pháp làm trơn Holt-Winters (HW) Có hai mô hình Holt-Winters hay được áp dụng tuỳ theo đặc trưng tăng trưởng của mùa vụ (Chương 2, mục 1.1) đó là:
- Mô hình mùa vụ nhân (Multiplicative Seasonal Model)
- Mô hình mùa vụ cộng (Additive Seasonal Model)
3 Mô hình mùa vụ nhân
Mô hình này được sử dụng khi dữ liệu có tính chất tăng trưởng mùa vụ theo hệ số được thảo luận ở Chương 2, mục 1.1
3.1 Khái quát
Trong mô hình này, chúng ta giả sử rằng các chuỗi thời gian được biểu diễn bởi mô hình:
t t
là thành phần sai số ngẫu nhiên
Đặt L là độ dài của của chu kỳ mùa vụ
Trang 31Thành phần mùa vụ được định nghĩa là tổng của độ dài của mùa vụ tăng trưởng theo tỷ lệ:
L S
L t
3.2 Ứng dụng mô hình
Mô hình mùa vụ nhân phù hợp với chuỗi thời gian mà sự thay đổi của mẫu theo mùa vụ là tỷ lệ với mức trung bình của chuỗi Ví dụ như một chuỗi thời gian được trình bầy theo mô hình nhân ở Chương 2, mục 1.1
3.3 Chi tiết
Phần này mô tả chi tiết các phương trình dự báo được sử dụng trong mô hình cùng với giá trị khởi tạo ban đầu được sử dụng cho các tham số trong mô hình
S : là ước lượng của thành phần mùa vụ (chỉ số mùa vụ)
3.3.2 Thủ tục cho việc cập nhật các ước lượng của tham số
mô hình
1 Làm trơn toàn bộ (overall smoothing)
Trang 32với 0 1 là hằng số làm trơn thứ hai
Ước lượng của thành phần xu thế tính bằng độ lệch giữa hai ước lượng thành công ở mức loại trừ thành phần mùa vụ
3 Làm trơn chỉ số mùa vụ
L t t
với 0 1 là hằng số làm trơn thứ ba
Ước lượng của thành phần mùa vụ là một sự kết hợp của hầu hết các thành phần mùa vụ gần nhất quan sát được đã cho bằng cách chia y t cho ước lượng chuỗi ở mức đã loại trừ thành phần mùa vụ R t và ước lượng thành phần mùa
vụ tốt nhất trước đó cho thời gian này của chu kỳ
3.3.3 Giá trị dự báo
1 Dự báo cho kỳ tiếp theo
Dự báo cho kỳ tiếp theo được cho bởi công thức:
L t t t
Chú ý rằng ước lượng tốt nhất của thành phần mùa vụ cho mùa vụ trong chu
kỳ thời gian này được sử dụng đã được cập nhật L chu kỳ trước đó
Trang 332 Dự báo cho nhiều giai đoạn
Giá trị dự báo T chu kỳ được cho bởi công thức:
L T t t t
T
y ( 1 1) (2.11)
3.3.4 Khởi tạo giá trị của các tham số trong mô hình
Theo quy tắc chung, tối thiểu cần có đầy đủ dữ liệu lịch sử của hai mùa
vụ (hoặc L2 chu kỳ) để khởi tạo giá trị của thành phần mùa vụ Giả sử dữ liệu
từ m mùa vụ đã có và đặt x j;j 1,2, ,mL biểu diễn giá trị trung bình của các quan sát trong th
j mùa vụ
1 Ước lượng thành phần xu thế
Ước lượng thành phần xu thế bởi công thức:
L m
y y
)1(
1 0
2 Ước lượng mức loại bỏ nhân tố mùa vụ
Ước lượng mức loại bỏ thành phần mùa vụ bởi công thức:
0 1
0
2G
L x
3 Ước lượng thành phần mùa vụ
Thành phần mùa vụ được tính toán cho mỗi thời gian chu kỳ
x S
i
t t
với x i là giá trị trung bình của mùa vụ tương ứng với chỉ số t , và j là vị trí
của chu kỳ t trong mùa vụ Phương trình trên sẽ đưa ra m ước lượng của các
thành phần mùa vụ cho các chu kỳ:
Trang 34L S S
1
)0
là thành phần sai số ngẫu nhiên
Đặt L là độ dài của của chu kỳ mùa vụ
Thành phần mùa vụ được định nghĩa là tổng của độ dài của mùa vụ tăng trưởng theo hằng số:
Thành phần xu thế b2 nếu thấy rằng không cần thiết, có thể loại bỏ khỏi mô hình