1. Trang chủ
  2. » Luận Văn - Báo Cáo

Dự báo chuỗi dữ liệu phụ thuộc thời gian theo mùa vụ bằng mô hình Holt - Winters

69 4,5K 6

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 69
Dung lượng 1,35 MB

Nội dung

Cùng với mô hình ARIMA, mô hình Holt-Winters cũng đang được xem là rất thích hợp cho dự báo ngắn hạn một số vấn đề về kinh tế - xã hội từ dữ liệu chuỗi thời gian có tính mùa vụ.. Luận vă

Trang 1

ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ

-*** -

Tạ Mạnh Cường

DỰ BÁO CHUỖI DỮ LIỆU PHỤ

THUỘC THỜI GIAN THEO MÙA VỤ BẰNG MÔ HÌNH HOLT-WINTERS

LUẬN VĂN THẠC SĨ

Hà nội - 2006

Trang 2

ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ

-*** -

Tạ Mạnh Cường

DỰ BÁO CHUỖI DỮ LIỆU PHỤ THUỘC THỜI GIAN THEO MÙA VỤ BẰNG MÔ HÌNH HOLT-WINTERS

Ngành: Công nghệ thông tin

Mã số: 1.01.10

LUẬN VĂN THẠC SĨ

Người hướng dẫn khoa học: TS Đỗ Văn Thành

Hà nội - 2006

Trang 3

Mục lục

Lời cảm ơn 1

Mở đầu 2

Chương 1: Chuỗi thời gian và phân tích dự báo chuỗi thời gian 5

1 Chuỗi thời gian và dự báo chuỗi thời gian 5

1.1 Định nghĩa chuỗi thời gian 5

1.2 Dự báo chuỗi thời gian 6

2 Đại lượng đặc trưng chuỗi thời gian 7

2.1 Các đại lượng thống kê đặc trưng cho chuỗi thời gian 7

2.2 Các đại lượng mô tả mối quan hệ giữa các phần tử trong chuỗi 8

3 Phân tích, dự báo chuỗi thời gian 10

4 Các mô hình chuỗi thời gian đơn giản 12

4.1 Nhiễu trắng 12

4.2 Mô hình bước ngẫu nhiên 12

4.3 Bước ngẫu nhiên có bụi 12

5 Một số phép toán và kiểm định thống kê 13

5.1 Kiểm định T 13

5.2 Toán tử trễ 13

6 Kết luận chương 1 14

Chương 2: Mô hình làm trơn hàm mũ Holt-Winters 15

1 Một số khái niệm cơ bản 15

1.1 Mô hình mùa vụ cộng và mô hình mùa vụ nhân 15

1.2 Xu thế tuyến tính, hàm mũ hoặc kết hợp cả hai 18

1.3 Chỉ số mùa vụ SI (Seasonal Index) 18

Trang 4

2 Làm trơn hàm mũ (Exponential smoothing) 18

2.1 Làm trơn hàm mũ dạng đơn giản (single exponential smoothing) 18 2.2 Làm trơn hàm mũ bậc hai (double exponential smoothing) 20

2.3 Làm trơn hàm mũ bậc ba (triple exponential smoothing) 21

3 Mô hình mùa vụ nhân 21

3.1 Khái quát 21

3.2 Ứng dụng mô hình 22

3.3 Chi tiết 22

3.3.1 Các ký hiệu sử dụng 22

3.3.2 Thủ tục cho việc cập nhật các ước lượng tham số mô hình 22

3.3.3 Giá trị dự báo 23

3.3.4 Khởi tạo giá trị của các tham số trong mô hình 24

4 Mô hình mùa vụ cộng 25

4.1 Khái quát 25

4.2 Ứng dụng mô hình 26

4.3 Chi tiết 26

4.3.1 Các ký hiệu sử dụng 26

4.3.2 Thủ tục cho việc cập nhật các ước lượng tham số mô hình 26

4.3.3 Giá trị dự báo 27

5 Xây dựng mô hình làm trơn hàm mũ HW 28

5.1 Các bước xây dựng và lựa chọn các tham số 28

5.2 Đánh giá dự báo và sai số của dự báo 29

5.3 So sánh các bước xây dựng mô hình Holt-Winters và ARIMA: 30

5.4 Chuyển đổi mô hình HW sang mô hình ARIMA 31

5.5 Lựa chọn đặc tính chuỗi phù hợp với mô hình Holt-Winters 32

Trang 5

6 Kết luận chương 2 33

Chương 3: Ứng dụng mô hình Holt-Winters cho mùa vụ 34

1 Bài toán 1 - Dự báo chỉ số giá tiêu dùng 34

1.1 Bước 1: Nhận dạng chuỗi 36

1.1.1 Nhận dạng thành phần xu thế 36

1.1.2 Nhận dạng thành phần mùa vụ 37

1.2 Lựa chọn mô hình Holt-Winters theo mùa vụ 38

1.3 Kiểm định các tham số ước lượng mô hình 40

1.4 Dự báo 41

2 Bài toán 2 - Dự báo giá trị hàng hoá xuất khẩu của Việt nam 43

2.1 Bước 1: Nhận dạng chuỗi 44

2.1.1 Nhận dạng thành phần xu thế 44

2.1.2 Nhận dạng thành phần mùa vụ 45

2.2 Lựa chọn mô hình Holt-Winters theo mùa vụ 47

2.3 Kiểm định các tham số ước lượng mô hình 48

2.4 Dự báo 49

3 So sánh, nhận xét giữa mô hình Holt-Winters và SARIMA 51

4 Kết luận chương 3 54

Kết Luận 55

Tài Liệu Tham Khảo 58

Trang 6

Danh mục hình vẽ

Hình 1 - Chuỗi nhiễu trắng 12

Hình 2 - Đồ thị của chuỗi thời gian theo mô hình mùa vụ cộng 17

Hình 3 - Đồ thị của chuỗi thời gian theo mô hình mùa vụ nhân 17

Hình 4 - Các bước xây dựng mô hình Holt-Winters 28

Trang 7

Danh mục bảng biểu

Bảng 1 - So sánh các bước xây dựng mô hình HW và ARIMA 31Bảng 2 - Chuyển đổi một số mô hình làm trơn hàm mũ sang ARIMA 31Bảng 3 - Lựa chọn mô hình HW theo đặc tính chuỗi 33Bảng 4 - Số liệu chỉ số giá tiêu dùng (nguồn dữ liệu: Tổng cục thống kê; đơn

vị tính 1/10.000) 35Bảng 5 – Giá trị xuất khẩu của Việt nam (nguồn: tổng cục thống kê; đơn vị: triệu USD) 44Bảng 6 - Một số kết quả so sánh dự báo giữa mô hình HW & ARIMA 53Bảng 7 - Một số đánh giá, nhận xét giữa mô hình HW & ARIMA 54

Trang 8

Bảng từ ngữ, thuật ngữ viết tắt

tắt

Từ tiếng Anh

Hàm tự tương quan ACF AutoCorrelation Function

Tiêu chuẩn thông tin

AIC/SIC

AIC/SIC Akaike Information Criteria,

Schwarz Information Criteria Sai số phần trăm tuyệt đối APE Absolute Percent Error

Tích hợp trung bình trượt tự

hồi qui

ARIMA AutoRegressive Integrated

Moving Average Trung bình trượt tự hồi qui ARMA AutoRegressive Moving

Distribution

Sai số tuyệt đối trung bình MAE Mean Absolute Error

Sai số bình phương trung

bình

MSE Mean Square Error

Trang 9

Ước lượng bình phương nhỏ

hồi qui theo mùa vụ

SARIMA Seasonal AutoRegressive

Integrated Moving Average Trung bình trượt theo mùa

vụ

SMA Seasonal Moving Average

Tổng bình phương sai số SSE Sum of Square Error

Trang 10

Lời cảm ơn

Luận văn thạc sĩ chuyên ngành CNTT: “Dự báo chuỗi dữ liệu phụ thuộc thời gian theo mùa vụ bằng mô hình Holt-Winters” được TS Đỗ Văn

Thành công tác tại Trung tâm thông tin và dự báo Kinh tế - Xã hội Quốc gia -

Bộ kế hoạch và đầu tư, người đã tận tình hướng dẫn và giúp đỡ tác giả rất nhiều trong quá trình thực hiện luận văn này, người đã mở ra cho tác giả những cách tiếp cận mới của công nghệ thông tin vào trong đời sống thực tế Qua đây, tác giả xin gửi tới TS Đỗ Văn Thành lời cảm ơn chân thành và sâu sắc nhất

Tác giả cũng xin bày tỏ lời cảm ơn tới các thầy TS Hà Quang Thụy, GS.TSKH Phan Đình Diệu, PGS.TS Trịnh Nhật Tiến, PGS.TS Đoàn Văn Ban, TS Nguyễn Việt Hà, TS Hoàng Xuân Huấn, PGS.TS Nguyễn Ngọc Bình, PGS TS Đinh Mạnh Tường những người đã truyền cho tác giả nhiều kiến thức và kinh nghiệm quý báu trong thời gian tác giả theo học cao học tại Trường Đại học Công nghệ - Đại học Quốc gia Hà nội

Tác giả cũng xin gửi lời cảm ơn chân thành đến một số cán bộ thuộc Tổng cục Thống kê Việt nam, những người đã giúp đỡ nhiệt tình trong việc cung cấp số liệu đầy đủ, trung thực phục vụ cho luận văn này

Cuối cùng, tác giả xin gửi lời cảm ơn đến bạn Trần Văn Thái, người đã giúp đỡ tác giả hoàn thành luận văn này đồng thời cũng xin gửi lời cám ơn tới tất cả người thân trong gia đình, bạn bè trong quá trình học tập và công tác

Tác giả

Tạ Mạnh Cường

Trang 11

Với sự bùng nổ về thông tin và dữ liệu về kinh tế - xã hội, để dự báo chính xác và kịp thời tình hình biến động của kinh tế - xã hội Việt Nam và thế giới phục vụ công tác chỉ đạo, điều hành về kinh tế của Chính phủ thì việc ứng dụng các phương tiện kỹ thuật và công nghệ của CNTT nhằm phát hiện tri thức mới từ dữ liệu kinh tế - xã hội hiện tại và quá khứ là cách tiếp cận đang được các nhà nghiên cứu và ứng dụng Việt Nam hết sức quan tâm Luận văn này nằm trong hướng nghiên cứu ứng dụng đó

Như đã biết các dữ liệu phát triển kinh tế - xã hội là phụ thuộc thời gian, được thu thập định kỳ theo tháng, quý, năm và có tính mùa vụ rất rõ Hiện đã có nhiều phương pháp dự báo kinh tế - xã hội khác nhau, mỗi phương pháp thường phù hợp với một số vấn đề dự báo kinh tế - xã hội nhất định trong một nền kinh tế cụ thể, bởi vậy việc nghiên cứu xác định phương pháp

dự báo hiệu quả, phù hợp với thực tiễn phát triển kinh tế - xã hội Việt nam là vấn đề đòi hỏi phải được quan tâm nghiên cứu ứng dụng

Trong phân tích và dự báo dữ liệu chuỗi thời gian về kinh tế - xã hội, hiện có bốn mô hình đang được đặc biệt quan tâm, đó là mô hình hồi quy

Trang 12

chuỗi thời gian, mô hình tích hợp trung bình trượt tự hồi quy ARIMA, mô hình tự hồi quy véc tơ VAR và mô hình làm trơn hàm mũ Holt-Winters Cùng với mô hình ARIMA, mô hình Holt-Winters cũng đang được xem là rất thích hợp cho dự báo ngắn hạn một số vấn đề về kinh tế - xã hội từ dữ liệu chuỗi thời gian có tính mùa vụ

Luận văn ”Dự báo chuỗi dữ liệu phụ thuộc thời gian theo mùa vụ bằng

mô hình Holt-Winters” sẽ tập trung khảo cứu và ứng dụng mô hình làm trơn

hàm mũ Holt-Winters để dự báo biến động về chỉ số giá tiêu dùng và giá cả một số mặt hàng theo tháng, tổng giá trị xuất khẩu của Việt nam theo tháng trên những số liệu chính thống do Tổng cục Thống kê thu thập Việc dự báo những nội dung trên đã được thực hiện bằng việc ứng dụng mô hình ARIMA

đã được trình bầy trong một luận văn cao học, khoa CNTT - Đại học Công nghệ thực hiện, trong luận văn này sẽ tập trung nghiên cứu làm rõ sự giống và khác nhau của hai mô hình này, so sánh kết quả dự báo bằng việc ứng dụng cả hai mô hình trên cùng tập dữ liệu thử nghiệm

Luận văn gồm 3 chương nội dung, không kể phần mở đầu, phần kết luận, phần phụ lục và tài liệu tham khảo

Chương 1: Chuỗi thời gian và Phân tích chuỗi thời gian, sẽ giới thiệu

một cách tóm tắt những khái niệm chủ yếu liên quan đến chuỗi thời gian và các bước tiến hành phân tích và dự báo chuỗi thời gian, giới thiệu một số mô hình chuỗi thời gian đơn giản và một số kiểm định thống kê sử dụng cho phân tích, dự báo dữ liệu chuỗi thời gian Chi tiết của những khái niệm này có thể được tham khảo trong phần phụ lục

Chương 2: Mô hình làm trơn hàm mũ Holt-Winters Nội dung chính

của chương là trình bày một cách có hệ thống mô hình làm trơn hàm mũ đơn,

mô hình làm trơn hàm mũ bậc hai và mô hình làm trơn hàm mũ bậc ba Winters) để dự báo dữ liệu chuỗi thời gian có tính chất xu thế và tính chất

Trang 13

(Holt-mùa vụ Việc lựa chọn mô hình làm trơn hàm mũ nào phụ thuộc vào tính chất

dữ liệu chuỗi thời gian cụ thể

Chương 3: Ứng dụng mô hình Holt-Winters Chương này tập trung

trình bày qui trình ứng dụng mô hình Holt-Winters theo mùa vụ để dự báo một số chỉ số kinh tế vĩ mô quan trọng phản ánh mức độ tăng trưởng kinh tế Việt nam như dự báo chỉ số giá tiêu dùng theo tháng (CPI), tổng giá trị hàng hóa xuất khẩu của Việt nam theo tháng Dữ liệu được sử dụng để dự báo là số liệu thực tế của nền kinh tế do Tổng cục Thống kê công bố Các kết quả dự báo theo mô hình Holt-Winters sẽ được so sánh với các kết quả dự báo theo

mô hình ARIMA

Phần kết luận: Tổng kết những công việc đã thực hiện và kết quả đạt

được trong luận văn này, đồng thời đề xuất một số hướng nghiên cứu tiếp theo

Phụ lục: Gồm hai phần, Phần 1 của phụ lục sẽ giới thiệu chi tiết hơn

một số khái niệm quan trọng liên quan đến chuỗi thời gian và phân tích, dự báo dữ liệu chuỗi thời gian, Phần 2 của phụ lục sẽ giới thiệu mô hình ARIMA cho mùa vụ

Trang 14

dự báo, như dùng phương pháp phân tích hồi qui bội xem xét GDP phụ thuộc vào lượng đầu tư trong nước, lượng đầu tư nước ngoài, dân số…

Luận văn này chỉ tập trung vào phân tích, dự báo theo mức thời gian dựa trên giả định cơ bản là các yếu tố ảnh hưởng đến biến động của hiện tượng trong quá khứ và hiện tại sẽ còn tiếp tục tồn tại trong tương lai

Chương này sẽ trình bày sơ lược một số vấn đề chủ yếu liên quan đến chuỗi thời gian bao gồm khái niệm, dự báo cho chuỗi thời gian và các đại lượng đặc trưng của nó, tiếp đó trình bày về các mô hình chuỗi thời gian đơn giản, đưa ra một số phương pháp kiểm định thống kê cho mô hình chuỗi thời gian Chi tiết xin tham khảo ở phần Phụ lục

1 Chuỗi thời gian và dự báo chuỗi thời gian

1.1 Định nghĩa chuỗi thời gian

Chuỗi dữ liệu phụ thuộc thời gian được chia làm hai loại:

- Chuỗi dữ liệu phụ thuộc thời gian được quan sát, đo đạc trong khoảng thời gian rời rạc: Các quan sát được thực hiện tại các thời điểm tách

Trang 15

biệt, chúng thường là các quan sát được đo tại các mốc thời gian cách đều nhau, ví dụ chuỗi thời gian được đo theo tuần, quý, tháng, năm, …

- Chuỗi dữ liệu liên tục theo thời gian: Các quan sát được đo trong khoảng thời gian liên tục, ví dụ chuỗi dữ liệu đo nhiệt độ trong ngày (nhiệt kế)

Luận văn này tập trung vào chuỗi dữ liệu phụ thuộc thời gian được đo trong khoảng thời gian rời rạc và cách đều nhau, gọi là chuỗi thời gian (series time data)

Như vậy: Chuỗi thời gian là một tập giá trị các quan sát của biến ngẫu nhiên, ký hiệu là {z t}, t1, ,n là số các quan sát, đo được trong các khoảng

thời gian t như nhau (hàng năm, quý, tháng, tuần, ngày …) và được xếp theo

thứ tự thời gian

Ví dụ:

- Chuỗi giá trị tổng sản phẩm quốc nội (GDP) được đo theo từng quý

- Chuỗi giá trị đo lượng mưa trung bình hàng năm

- Chuỗi giá trị chỉ số thị trường chứng khoán đo theo ngày

- Chuỗi giá trị đo sản lượng điện năng tiêu thụ của Việt Nam đo theo từng tháng, từng quí trong nhiều năm

- Chuỗi giá trị về chỉ số giá tiêu dùng của Việt Nam theo từng tháng, quý trong năm

1.2 Dự báo chuỗi thời gian

Dự báo chuỗi thời gian là ước lượng các giá trị của biến ngẫu nhiên chuỗi thời gian z th (h1), ký hiệu là z ˆ h t( ), dựa trên sự tương quan với các giá trị của biến ngẫu nhiên {z t} đã được quan sát trong quá khứ

Chất lượng của dự báo phụ thuộc vào nhiều yếu tố chẳng hạn sự phức tạp của chuỗi thời gian khi thực hiện phân tích, tác động của nhiều yếu tố bất

Trang 16

thường không thể lường trước được khi tiến hành dự báo, ngoài ra độ chính xác cũng còn phụ thuộc phần lớn vào khoảng cách xa gần của dự báo (dự báo gần thì cho độ chính xác của dự báo tốt hơn so với dự báo xa)

2 Đại lượng đặc trưng chuỗi thời gian

Giả sử có chuỗi thời gian {z t} gồm n các quan sát, t1, ,n

2.1 Các đại lượng thống kê đặc trưng cho chuỗi thời gian

Kỳ vọng: Đại diện cho giá trị trung tâm trong chuỗi:

)(z t

z n

) (z t z2 t 2

Tương tự, phương sai mẫu được tính:

2 1

2

)(

Trang 17

2.2 Các đại lượng mô tả mối quan hệ giữa các phần tử trong chuỗi

Tự hiệp phương sai: Tự hiệp phương sai giữa hai z tz tk, giữa chúng có k1 quan sát gọi là k độ trễ, được xác định như sau:

cov)

z kz t z tkE z tz tk  (1.6)Trong đó,  là kỳ vọng chung của z tz tk Tự hiệp phương sai khi

độ trễ k 0 chính là phương sai của z t:   2

,cov)

0

   Tương tự, tự hiệp phương sai mẫu được tính:

))(

(

1)(ˆ

1

z z

z z n

k n

t t

Trong đó, z là kỳ vọng mẫu của z tz tk

Hàm tự tương quan (ACF): Mô tả tương quan tại trễ k giữa các giá

trị trong chuỗi thời gian, được xác định:

)(

)(

))(

()

()

,cov(

z z

z z

z

k t t k

z E z

E

z z

E k

z z

k t t k

t t

(1.8)

Trong đó, z( k ) là tự hiệp phương sai,

k t

z  

 lần lượt là độ lệch chuẩn của z tz tk

Tự tương quan mẫu được tính theo công thức:

)0(ˆ

)(ˆˆ

z

z k

 , do khi đó cov(z t,z tk)0 Nhưng điều ngược lại chưa hẳn đã đúng

Hàm tự tương quan từng phần (PACF): Tự tương quan giữa hai biến

t

zz tk gồm k1 biến trung gian z t1, z t2, … , z tk1:

Trang 18

1 1 , 1

1

k

j

j j k

k

j

j k j k k

kj  1,   1, 

Giá trị ban đầu, 11  1

Bằng tính toán tương tự trên các quan sát mẫu có được tự tương quan từng phần mẫu ˆ Khảo sát tự tương quan từng phần như một hàm với tham kk

số biến thiên theo độ trễ k được gọi là hàm tự tương quan từng phần

Hệ số R 2

: Được sử dụng để đo độ thích hợp của mô hình ước lượng

Giả sử cho mô hình hồi qui chuỗi thời gian y t  12z ta t Hệ số R2

i i

n

i

i i

y y z

z

y y z z R

1

2 1

2

2 1

2

)(

)(

))(

((

(1.12)

Trong đó, n là số các quan sát, z là kỳ vọng mẫu của biến độc lập z t, y

kỳ vọng mẫu của biến phụ thuộc y t Dễ dàng thấy 0 R2 1 nếu R2 tiến đến 1 thì mô hình hồi qui được lựa chọn là hợp lý, ngược lại nếu 2

R tiến về 0 thì mô hình được lựa chọn là chưa hợp lý

Hệ số điều chỉnh 2

R : Đôi khi hệ số 2

R không phản ánh trung thực mức độ hợp lý của mô hình, chẳng hạn khi thêm các tham biến được cho là không hợp lý vào mô hình thì 2

R không những không giảm mà ngược lại còn tăng lên Vì thế hệ số điều chỉnh 2

R được xem xét để thẩm định rõ sự phù hợp của mô hình:

Trang 19

k n

n R R

ở đây n là số các quan sát của chuỗi thời gian, k là số các tham biến trong

mô hình R2 luôn nhỏ hơn R2, và giảm nếu bổ sung thêm biến hồi qui không hợp lý vào mô hình

3 Phân tích, dự báo chuỗi thời gian

Quá trình phân tích, dự báo chuỗi thời gian {z t} là để tìm ra các mô hình, luật ẩn trong nó, việc này được thực hiện trên các quan sát mẫu, gồm có những bước sau:

Bước 1: Nhận dạng các thành phần ẩn tồn tại trong chuỗi thời gian [4]

- Thành phần xu thế (Trend - T): Thể hiện chiều hướng biến động tăng hoặc giảm của các hiện tượng nghiên cứu trong thời gian dài

- Thành phần chu kỳ (Period - P): Thể hiện biến động của hiện tượng được lặp lại với chu kỳ nhất định, thường kéo dài từ 2 đến 10 năm

- Thành phần mùa vụ (Seasonal - S): Biểu hiện sự tăng hoặc giảm mức

độ của hiện tượng ở một số thời điểm (tháng, quý, năm) nào đó được lặp đi lặp lại qua nhiều năm

- Thành phần ngẫu nhiên (Irregular - I): Thể hiện những biến động không

có qui luật và hầu như không dự báo hoặc quan sát được trong của hiện tượng đang nghiên cứu

Những thành phần này kết hợp với nhau trong chuỗi thời gian bằng nhiều cách thức khác nhau, chẳng hạn chuỗi thời gian z t được mô tả là tích các thành phần, z tTPSI gọi là mô hình tích, hoặc z tTPSI

gọi là mô hình tổng, hoặc kết hợp cả hai z tTPSI Do vậy, để phân tích và nghiên cứu hành vi cũng như dự báo biến động của chuỗi thời gian thì

Trang 20

cần thiết phải ước lượng được các thành phần nói trên trong chuỗi thời gian

và cách thức kết hợp chúng với nhau trong chuỗi

Bước 2: Làm trơn số liệu

Tuỳ theo mô hình dự báo áp dụng mà cần thiết tiến hành bước làm trơn

số liệu hay không ? Trong trường hợp mô hình dự báo áp dụng cần quá trình làm trơn số liệu ta tiến hành loại trừ được thành phần xu thế và mùa vụ trong chuỗi thời gian Chuỗi thu được sau cùng không còn chứa các thành phần đó (chuỗi được làm trơn) sẽ khiến cho việc phân tích dễ dàng hơn

Bước 3: Chọn lựa, ước lượng và đánh giá mô hình

Chọn lựa mô hình trong lớp các mô hình, sao cho mô hình được lựa

chọn là “tốt nhất” trong số các mô hình ứng cử và nó cũng phải đơn giản và

có thể hiểu được dễ dàng Sau đó thực hiện ước lượng các tham số, phần dư cho mô hình vừa chọn lựa và chúng phải thỏa mãn các tiêu chí kiểm định, đánh giá Mô hình ước lượng được đánh giá là hợp lý khi đó sẽ sinh ra chuỗi

“gần giống” với chuỗi dữ liệu quan sát thực

Bước 4: Dự báo

Dựa trên mô hình thực hiện dự báo giá trị tương lai cho chuỗi thời gian, phân tích sự phù hợp của giá trị dự báo cả về mặt thực nghiệm và lý thuyết Xác định độ chệch giữa giá trị dự báo với giá trị quan sát thực và khoảng tin cậy của dự báo tức là giới hạn mà giá trị quan sát thực sẽ nằm trong

Ứng dụng kết quả dự báo vào thực tế

Trên cơ sở các dự báo về các giá trị tương lai của hiện tượng nghiên cứu đề ra các quyết định kinh doanh hoặc chính sách Đồng thời gộp thêm các giá trị quan sát mới vào chuỗi dữ liệu quan sát nhằm mục đích hiệu chỉnh lại

mô hình để đưa ra dự báo tốt hơn

Trang 21

4 Các mô hình chuỗi thời gian đơn giản

4.1 Nhiễu trắng [2]

Chuỗi thời gian là nhiễu trắng nếu nó hầu như không thể hiện một cấu trúc, hình mẫu rõ rệt nào cũng như không có bất kỳ sự tự tương quan nào trong chuỗi Chuỗi nhiễu trắng, ký hiệu a t, là dãy các biến ngẫu nhiên có phân phối đồng nhất độc lập (Independent Identical Distribution - i.i.d)

Nhiễu trắng a t được ký hiệua t ~WN(0,a2)

Hình 1 - Chuỗi nhiễu trắng

Trong thực tế, rất hiếm chuỗi thời gian là nhiễu trắng, nhưng nó lại là công cụ cơ bản để tạo ra mô hình phức tạp

4.2 Mô hình bước ngẫu nhiên [9] [3]

Mô hình bước ngẫu nhiên là mô hình mà giá trị sinh ra từ nó được xác định bằng giá trị của quan sát ngay trước nó cộng thêm nhiễu trắng:

t t

trong đó, t1,2 a t là nhiễu trắng, a tz t không tương quan với nhau

4.3 Bước ngẫu nhiên có bụi

Mô hình bước ngẫu nhiên có bụi là mô hình bước ngẫu nhiên cộng thêm một hằng số α:

Trang 22

t t

trong đó, giả định a t là nhiễu trắng, 1 là hệ số chặn và 2 là hệ số góc Một

số phép toán và kiểm định thống kê cho mô hình trên gồm:

5.1 Kiểm định T

Do các hệ số 1,2 là tổng thể, chúng chỉ có thể ước lượng được qua từng mẫu cụ thể, gọi là hệ số ước lượng mẫu ˆ1, ˆ2 Khi thực hiện các ước lượng này, điều được quan tâm hơn cả là hệ số ước lượng này có bằng 0 hay không ? Kiểm định T còn được gọi là kiểm định ý nghĩa của hệ số ước lượng trong mô hình, với giả thiết kiểm định thống kê H0:j 0 để kiểm chứng điều đó Thống kê:

j j

j j

ˆ ˆ là phương sai ước lượng của

hệ số ước lượng mẫu j, thống kê T tuân theo phân phối chuẩn T với n1

bậc tự do

5.2 Toán tử trễ [1]

Giả sử có chuỗi các quan sát {z t}, t1, ,n

Toán tử B được gọi là toán tử trễ nếu nó thực hiện phép biến đổi:

Trang 23

Toán tử trễ có các tính chất điển hình sau:

- Sai phân theo trễ mùa vụ bậc 1:

t z s B s

t z t z t

để tiến hành phân tích, dự báo chuỗi thời gian và một số mô hình chuỗi thời gian đơn giản cũng như các đại lượng đặc trưng như trung bình, phương sai,

tự tương quan, tự tương quan từng phần… cho chuỗi thời gian và công thức xác định chúng cũng được đề cập đến trong chương này Chi tiết xin tham khảo ở phần Phụ lục

Trong chương tiếp theo của luận văn sẽ trình bày mô hình dự báo dữ liệu chuỗi thời gian mang tính mùa vụ đang được quan tâm nghiên cứu ứng dụng: mô hình làm trơn hàm mũ Holt-Winters

Trang 24

Chương 2:

Mô hình làm trơn hàm mũ Holt-Winters

Có rất nhiều dữ liệu chuỗi thời gian có tính chất mùa vụ, ví dụ số lượng tiêu thụ quần áo hay doanh thu mặt hàng đồ chơi cho trẻ em, chỉ số giá tiêu dung trong năm… Bài toán dự báo theo mùa vụ có một vị trí quan trọng trong

dự báo tình hình phát triển kinh tế - xã hội hay trong sản xuất kinh doanh của bất kỳ đơn vị sản xuất kinh doanh nào Chương này tập trung giới thiệu mô hình làm trơn hàm mũ Holt-Winters Hai mô hình trong kỹ thuật làm trơn hàm mũ Holt-Winters được giới thiệu trong chương này là: mô hình mùa vụ nhân (Multiplicative Seasonal Model) và mô hình mùa vụ cộng (Additive Seasonal Model) cho chuỗi thời gian có tính chất xu thế và tính chất mùa vụ

1 Một số khái niệm cơ bản

1.1 Mô hình mùa vụ cộng và mô hình mùa vụ nhân

Rất nhiều chuỗi thời gian trong thực tế thể hiện các mẫu, hành vi lặp lại

có tính mùa vụ Có một sự khác biệt nhỏ trong khái niệm giữa tính chu kỳ và tính mùa vụ, đó là tính chu kỳ thể hiện một hành vi, mẫu xuất hiện lặp lại không ít thì nhiều trong một khoảng thời gian nào đó, chẳng hạn chu kỳ nhật thực, chu kỳ tuần hoàn… còn tính mùa vụ chỉ ra rằng các hành vi, mẫu lặp đi lặp lại đều đặn trong những khoảng thời gian cố định như hàng năm, hàng

ngày, hàng tuần, hàng thập kỷ Thuật ngữ “mùa vụ” đã trở thành thông dụng

khi dữ liệu chuỗi thời gian được phân tích theo tháng, quý hoặc năm Khoảng

thời gian của một mùa vụ được ký hiệu là s Nếu dữ liệu được lấy theo tháng thì khoảng thời gian cho một mùa vụ s là 12 (có 12 tháng/năm), nếu lấy theo quý thì khoảng thời gian cho một mùa vụ s là 4 (có 4 quí/năm), theo ngày thì

Trang 25

s là 24 (24 giờ/ngày), theo tuần thì s là 7; 6; 5 (7 ngày/tuần, 6 ngày/tuần, 5

ngày/tuần tuỳ theo số ngày thu thập dữ liệu)

Ví dụ, doanh thu từ một mặt hàng đồ chơi cho trẻ em nào đó thường lên đến đỉnh điểm vào tháng 11, 12 trong năm và giảm thấp nhất vào mùa hè trong năm Doanh thu bán hàng của mặt hàng đồ chơi này có thể tăng đỉnh điểm thêm khoảng 1 triệu dollar tháng 12 hàng năm Vì vậy, chúng ta có thể đưa vào phần dự báo cho tháng 12 doanh thu tăng thêm 1 triệu dollar (trên doanh thu trung bình hàng năm) của việc bán hàng và doanh thu này diễn ra đều đặn hàng năm Trong trường hợp này, ta nói dữ liệu chuỗi thời gian này

có tính chất mùa vụ tăng trưởng theo cấp số cộng hay tuân theo mô hình mùa

vụ cộng (Additive Seasonal Model)

Một cách khác, trong tháng 12 doanh thu bán hàng của của một mặt hàng đồ chơi cho trẻ em nào đó có thể tăng 40% (so với doanh thu trung bình hàng năm) có nghĩa là hệ số tăng trưởng của doanh thu là 1,4 Vì vậy, doanh thu bán hàng của mặt hàng đồ chơi trong tháng 12 có thể đạt cao hay thấp nhưng mức độ tăng trưởng doanh thu của tháng sẽ tăng tỷ lệ theo một hệ số

cố định nào đó (trong trường hợp này là 1,4) Trong trường hợp này, ta nói dữ liệu chuỗi thời gian có tính chất mùa vụ tăng trưởng theo cấp số nhân hay tuân theo mô hình mùa vụ nhân (Multiplicative Seasonal Model)

Trang 26

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

Khoảng thời gian

Đồ thị chuỗi theo mùa vụ Cộng

Hình 2 - Đồ thị của chuỗi thời gian theo mô hình mùa vụ cộng

Khoảng thời gian

Đồ thị chuỗi theo mùa vụ Nhân

Hình 3 - Đồ thị của chuỗi thời gian theo mô hình mùa vụ nhân

Trang 27

Đồ thị biểu diễn các chuỗi mùa vụ trong hình trên cho thấy: đối với chuỗi theo mô hình cộng, dao động của chuỗi là khác đều đặn với các chu kỳ mùa vụ khác nhau và không có mức độ biến thiên lớn (về biên độ) trên toàn

bộ chuỗi; trong trường hợp chuỗi theo mô hình nhân, mức độ biến thiên về biên bộ dao động giữa các chu kỳ mùa vụ có sự biến động trên toàn bộ chuỗi

1.2 Xu thế tuyến tính, hàm mũ hoặc kết hợp cả hai

Tiếp theo ví dụ về doanh thu bán hàng mặt hàng đồ chơi đã trình bày ở trên, doanh thu bán hàng cho mặt hàng đồ chơi có thể biểu diễn qua hàm tuyến tính biểu diễn tính xu thế (ví dụ: với mỗi năm, doanh thu bán hàng tăng

1 triệu USD); hoặc xu thế theo hàm mũ (ví dụ: với mỗi năm, doanh thu bán hàng tăng với một tỷ lệ là 1,4); hoặc xu thế là kết hợp của cả hai (trong năm đầu tiên doanh thu tăng 1 triệu USD, trong năm thứ hai doanh thu tăng 40%

so với doanh thu năm trước đó)

1.3 Chỉ số mùa vụ SI (Seasonal Index)

Chỉ số mùa vụ của một chu kỳ chỉ ra độ lệch cơ bản của chu kỳ đó đối với trung bình của năm là bao nhiêu Ít nhất cần đầy đủ dữ liệu của một mùa

vụ để tính toán SI

2 Làm trơn hàm mũ (Exponential smoothing)

2.1 Làm trơn hàm mũ dạng đơn giản (single exponential smoothing)

Làm trơn hàm mũ dạng đơn giản được sử dụng cho các dự báo ngắn hạn, thường chỉ dự báo một tháng trong tương lai Mô hình này giả sử rằng dữ liệu dao động xung quanh một giá trị trung bình ổn định chấp nhận được

Trang 28

(không có xu thế tăng hoặc giảm) Nghĩa là đối với chuỗi không thay đổi hoặc thay đổi rất chậm theo thời gian thì có thể áp dụng phương pháp này

Công thức của phương pháp làm trơn hàm mũ dạng đơn giản:

Vì vậy, theo kết quả, mỗi giá trị được làm trơn sẽ có trọng số trung bình

 của quan sát trước đó, nơi mà các trọng số giảm dần theo hàm mũ phụ thuộc vào giá trị của tham số  Nếu  1 (một) thì quan sát trước đó được hoàn toàn bỏ qua; nếu  0 (không), khi đó quan sát hiện tại được bỏ qua hoàn toàn; và giá trị được làm trơn hoàn toàn bao gồm các giá trị được làm trơn trước đó (được lần lượt tính toán từ các giá trị được làm trơn trước …, và

cứ như vậy; tất cả các giá trị được làm trơn sẽ bằng giá trị ban đầu S0) Giá trị khởi tạo ban đầu của S t có vai trò quan trọng trong tính toán cho tất cả các giá trị sau đó Đặt S0  y1 là một phương án chọn giá trị khởi tạo Một phương án khác có thể lấy trung bình của 4 hoặc 5 giá trị quan sát đầu tiên Với giá trị  nhỏ, việc chọn giá trị khởi tạo ban đầu cho S t là rất quan trọng

Trang 29

2.2 Làm trơn hàm mũ bậc hai (double exponential smoothing)

Phương pháp này được sử dụng khi dữ liệu có tính xu thế Làm trơn hàm mũ với xu thế phức tạp hơn so với làm trơn hàm mũ đơn giản với hai thành phần phải được cập nhật lại tại mỗi mức chu kỳ và mức xu thế Tại mỗi mức này, giá trị ước lượng được làm trơn cho dữ liệu ở cuối mỗi kỳ Thành phần xu thế được làm trơn bằng ước lượng của mức tăng trung bình tại cuối mỗi kỳ Công thức cho làm trơn hàm mũ bậc hai như sau:

))(

1(  1 1

t t n

1 y y

b  

3/)]

()(

)

1  yy n

Trang 30

2.3 Làm trơn hàm mũ bậc ba (triple exponential smoothing)

Phương pháp này được sử dụng khi trong dữ liệu có tính xu thế và tính mùa vụ Để theo dõi được tính mùa vụ, ta cần phải đưa thêm vào phương trình thứ ba Sau đây chúng ta giới thiệu phương trình thứ ba để theo dõi tính mùa vụ Kết quả của hệ các phương trình này được gọi là phương pháp làm trơn Holt-Winters (HW) Có hai mô hình Holt-Winters hay được áp dụng tuỳ theo đặc trưng tăng trưởng của mùa vụ (Chương 2, mục 1.1) đó là:

- Mô hình mùa vụ nhân (Multiplicative Seasonal Model)

- Mô hình mùa vụ cộng (Additive Seasonal Model)

3 Mô hình mùa vụ nhân

Mô hình này được sử dụng khi dữ liệu có tính chất tăng trưởng mùa vụ theo hệ số được thảo luận ở Chương 2, mục 1.1

3.1 Khái quát

Trong mô hình này, chúng ta giả sử rằng các chuỗi thời gian được biểu diễn bởi mô hình:

t t

 là thành phần sai số ngẫu nhiên

Đặt L là độ dài của của chu kỳ mùa vụ

Trang 31

Thành phần mùa vụ được định nghĩa là tổng của độ dài của mùa vụ tăng trưởng theo tỷ lệ:

L S

L t

3.2 Ứng dụng mô hình

Mô hình mùa vụ nhân phù hợp với chuỗi thời gian mà sự thay đổi của mẫu theo mùa vụ là tỷ lệ với mức trung bình của chuỗi Ví dụ như một chuỗi thời gian được trình bầy theo mô hình nhân ở Chương 2, mục 1.1

3.3 Chi tiết

Phần này mô tả chi tiết các phương trình dự báo được sử dụng trong mô hình cùng với giá trị khởi tạo ban đầu được sử dụng cho các tham số trong mô hình

S : là ước lượng của thành phần mùa vụ (chỉ số mùa vụ)

3.3.2 Thủ tục cho việc cập nhật các ước lượng của tham số

mô hình

1 Làm trơn toàn bộ (overall smoothing)

Trang 32

với 0 1 là hằng số làm trơn thứ hai

Ước lượng của thành phần xu thế tính bằng độ lệch giữa hai ước lượng thành công ở mức loại trừ thành phần mùa vụ

3 Làm trơn chỉ số mùa vụ

L t t

với 0 1 là hằng số làm trơn thứ ba

Ước lượng của thành phần mùa vụ là một sự kết hợp của hầu hết các thành phần mùa vụ gần nhất quan sát được đã cho bằng cách chia y t cho ước lượng chuỗi ở mức đã loại trừ thành phần mùa vụ R t và ước lượng thành phần mùa

vụ tốt nhất trước đó cho thời gian này của chu kỳ

3.3.3 Giá trị dự báo

1 Dự báo cho kỳ tiếp theo

Dự báo cho kỳ tiếp theo được cho bởi công thức:

L t t t

Chú ý rằng ước lượng tốt nhất của thành phần mùa vụ cho mùa vụ trong chu

kỳ thời gian này được sử dụng đã được cập nhật L chu kỳ trước đó

Trang 33

2 Dự báo cho nhiều giai đoạn

Giá trị dự báo T chu kỳ được cho bởi công thức:

L T t t t

T

y  (  1  1)   (2.11)

3.3.4 Khởi tạo giá trị của các tham số trong mô hình

Theo quy tắc chung, tối thiểu cần có đầy đủ dữ liệu lịch sử của hai mùa

vụ (hoặc L2 chu kỳ) để khởi tạo giá trị của thành phần mùa vụ Giả sử dữ liệu

từ m mùa vụ đã có và đặt x j;j 1,2, ,mL biểu diễn giá trị trung bình của các quan sát trong th

j mùa vụ

1 Ước lượng thành phần xu thế

Ước lượng thành phần xu thế bởi công thức:

L m

y y

)1(

1 0

2 Ước lượng mức loại bỏ nhân tố mùa vụ

Ước lượng mức loại bỏ thành phần mùa vụ bởi công thức:

0 1

0

2G

L x

3 Ước lượng thành phần mùa vụ

Thành phần mùa vụ được tính toán cho mỗi thời gian chu kỳ

x S

i

t t

với x i là giá trị trung bình của mùa vụ tương ứng với chỉ số t , và j là vị trí

của chu kỳ t trong mùa vụ Phương trình trên sẽ đưa ra m ước lượng của các

thành phần mùa vụ cho các chu kỳ:

Trang 34

L S S

1

)0

 là thành phần sai số ngẫu nhiên

Đặt L là độ dài của của chu kỳ mùa vụ

Thành phần mùa vụ được định nghĩa là tổng của độ dài của mùa vụ tăng trưởng theo hằng số:

Thành phần xu thế b2 nếu thấy rằng không cần thiết, có thể loại bỏ khỏi mô hình

Ngày đăng: 25/03/2015, 09:41

Nguồn tham khảo

Tài liệu tham khảo Loại Chi tiết
[1] Vũ Thiếu, Nguyễn Quang Dong, Nguyễn Khắc Minh (2001), Kinh tế lượng, NXB Khoa học và kỹ thuật Sách, tạp chí
Tiêu đề: Kinh tế lượng
Tác giả: Vũ Thiếu, Nguyễn Quang Dong, Nguyễn Khắc Minh
Nhà XB: NXB Khoa học và kỹ thuật
Năm: 2001
[2] Nguyễn Khắc Minh (2002), Các phương pháp phân tích và dự báo trong kinh tế. NXB Khoa học và kỹ thuật Hà Nội Sách, tạp chí
Tiêu đề: Các phương pháp phân tích và dự báo trong kinh tế
Tác giả: Nguyễn Khắc Minh
Nhà XB: NXB Khoa học và kỹ thuật Hà Nội
Năm: 2002
[3] Nguyễn Quang Dong (2002), Kinh tế lượng (chương trình nâng cao). NXB Khoa học và kỹ thuật Sách, tạp chí
Tiêu đề: Kinh tế lượng (chương trình nâng cao)
Tác giả: Nguyễn Quang Dong
Nhà XB: NXB Khoa học và kỹ thuật
Năm: 2002
[4] Hà Văn Sơn (2004), Giáo trình lý thuyết thống kê, Nhà xuất bản thống kê Sách, tạp chí
Tiêu đề: Giáo trình lý thuyết thống kê
Tác giả: Hà Văn Sơn
Nhà XB: Nhà xuất bản thống kê
Năm: 2004
[5] Nguyễn Cao Văn (2002), Lý thuyết xác suất và thống kê toán, Nhà xuất bản giáo dục.Tiếng Anh Sách, tạp chí
Tiêu đề: Lý thuyết xác suất và thống kê toán
Tác giả: Nguyễn Cao Văn
Nhà XB: Nhà xuất bản giáo dục. Tiếng Anh
Năm: 2002
[6] Ronald Bewley (2000), Time Series Forecasting, UNSW, Science Department, LGRC University of California Sách, tạp chí
Tiêu đề: Time Series Forecasting
Tác giả: Ronald Bewley
Năm: 2000
[7] Boris Kovalerchuk, Evgenii Vityaev (2001), Dataming in finance advances in relational and hybrid method, Kluwer Acedamic Publishers Sách, tạp chí
Tiêu đề: Dataming in finance advances in relational and hybrid method
Tác giả: Boris Kovalerchuk, Evgenii Vityaev
Năm: 2001
[8] Wiesner Vos (2005), Time Series, Department of Statistics Sách, tạp chí
Tiêu đề: Time Series
Tác giả: Wiesner Vos
Năm: 2005
[9] Philip Hans Franses (2004), Forecasting Seasonal Time Series, Econometric Institute, Erasmus University Rotterdam Sách, tạp chí
Tiêu đề: Forecasting Seasonal Time Series
Tác giả: Philip Hans Franses
Năm: 2004
[10] Lon Mu Liu, Stanlay L.Sclove (2001), DataMining on Time series: An illustration using fast-food restaurant franchise data, Department of Information and decision sciences, the university of Illinois at Chicago Sách, tạp chí
Tiêu đề: DataMining on Time series: An illustration using fast-food restaurant franchise data
Tác giả: Lon Mu Liu, Stanlay L.Sclove
Năm: 2001
[11] Robert H. Shumway (2003), A short course in applied time series analysis, Department of Statistics of the University of California Sách, tạp chí
Tiêu đề: A short course in applied time series analysis
Tác giả: Robert H. Shumway
Năm: 2003
[12] Kevin Michael Reagan (1984), An evaluation of ARIMA (Box-Jenkins) Models for forecasting wastewater treatment process variables, University of California Sách, tạp chí
Tiêu đề: An evaluation of ARIMA (Box-Jenkins) Models for forecasting wastewater treatment process variables
Tác giả: Kevin Michael Reagan
Năm: 1984
[13] Liz John (2004), Time series analysis, School of Engineering and Mathematics in Edith Cowan University Sách, tạp chí
Tiêu đề: Time series analysis
Tác giả: Liz John
Năm: 2004
[14] Hyunyoung Choi (2005), Time series analysis, Statistics and Applied Probability, University of California, Santa Barbara Sách, tạp chí
Tiêu đề: Time series analysis, Statistics and Applied Probability
Tác giả: Hyunyoung Choi
Năm: 2005
[15] Shashank Shekhar (2004), Recursive methods for forecasting short-term traffic flow using seasonal ARIMA time series model, North Carolina State University Sách, tạp chí
Tiêu đề: Recursive methods for forecasting short-term traffic flow using seasonal ARIMA time series model
Tác giả: Shashank Shekhar
Năm: 2004
[16] Kadri Yỹrekl, Ahmet Kurunỗ (2004), Testing the residual of an ARIMA model on the ỗekerek stream, Ankara University Sách, tạp chí
Tiêu đề: Testing the residual of an ARIMA model on the ỗekerek stream
Tác giả: Kadri Yỹrekl, Ahmet Kurunỗ
Năm: 2004
[17] Philip Hans Franses, Dick Van Dijk (2001), The forecasting performance of various models for seasonality and nonlinearity for quarterly industrial production, Econometric Institute – Erasmus University Rotterdam Sách, tạp chí
Tiêu đề: The forecasting performance of various models for seasonality and nonlinearity for quarterly industrial production
Tác giả: Philip Hans Franses, Dick Van Dijk
Năm: 2001
[18] Stephane Hess (2002), A statistical analysis of the effects of safety cameras on traffic accident rates in Cambridge shire, University of Cambridge, Statistical Laboratory Sách, tạp chí
Tiêu đề: A statistical analysis of the effects of safety cameras on traffic accident rates in Cambridge shire
Tác giả: Stephane Hess
Năm: 2002
[20] Oğuz Atuk, Beyza Pınar Ural (2002), Seasonal adjustment in economic time series, Central Bank of The Republic of Turkey Sách, tạp chí
Tiêu đề: Seasonal adjustment in economic time series
Tác giả: Oğuz Atuk, Beyza Pınar Ural
Năm: 2002
[21] William Q.Meeker (2001), Applied time series, Iowa State University. B - Địa chỉ web [22] www.itl.nist.gov Sách, tạp chí
Tiêu đề: Applied time series
Tác giả: William Q.Meeker
Năm: 2001

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w