Mục tiêu của đề tài là nghiên cứu kỹ thuật xử lý mùa trên phương diện toánhọc thuần túy và giới thiệu mô hình theo mùa trong phân tích chuỗi thời gian vàmột số ứng dụng của mô hình theo
Trang 1BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI
Trang 2MỤC LỤC
MỞ ĐẦU 8
CHƯƠNG 1: CÁC KIẾN THỨC CƠ BẢN VỀ CHUỖI THỜI GIAN 9
1 Chuỗi thời gian và quá trình ngẫu nhiên 9
1.1 Khái niệm chuỗi thời gian và quá trình ngẫu nhiên 9
1.2 Quá trình ngẫu nhiên dừng 10
1.3 Hàm tự tương quan 11
1.4 Toán tử tiến, toán tử lùi 12
2 Quá trình ARMA 13
2.1 Quá trình tự hồi quy 13
2.2 Quá trình trung bình trượt 14
2.3 Quá trình tự hồi quy trung bình trượt 16
2.4 Quá trình hợp nhất tự hồi quy trung bình trượt ARIMA 17
CHƯƠNG 2 KỸ THUẬT XỬ LÝ MÙA TRONG PHÂN TÍCH CHUỖI THỜI GIAN 18
1 Kỹ thuật trung bình động 18
1.1 Bài toán tách thành phần tất định 18
1.2 Biến đổi trung bình trượt 19
1.3 Biến đổi trung bình động 22
2 Phương pháp BOX-JENKINS 25
2.1 Nhận dạng 26
2.1.1 Dựa vào lược đồ tự tương quan và tự tương quan riêng 26
2.1.2 Các tiêu chuẩn lựa chọn mô hình 27
2.2 Ước lượng mô hình 29
2.3 Kiểm định tính thích hợp của mô hình 29
2.4 Dự báo 29
2.5 Đánh giá dự báo 30
3 Mô hình theo mùa 31
3.1 Mô hình ARMA hỗn hợp theo mùa 33
3.2 Mô hình ARIMA theo mùa 35
3.2.1 Phác thảo về mô hình ARIMA theo mùa 35
2
Trang 33.2.2 Quy tắc nhận dạng mô hình ARIMA theo mùa 36
3.2.3 Ước lượng 40
3.2.4 Kiểm tra chẩn đoán 41
3.2.5 Dự báo 41
CHƯƠNG 3 MỘT SỐ ỨNG DỤNG 42
1 Ứng dụng biến đổi trung bình trượt trong xử lý yếu tố mùa vụ 42
2 Mô hình theo bội mùa (multiplicative seasonal) 47
3 Ứng dụng phần mềm eviews 6.0 để nhận dạng mô hình ARIMA xử lý yếu tố mùa trong dự báo lạm phát ở Việt Nam .48
KẾT LUẬN 53
TÀI LIỆU THAM KHẢO 54
3
Trang 4DANH MỤC CÁC BẢNG BIỂU
Bảng 1 Bảng lược đồ tự tương quan và tự tương quan riêng 27
Bảng 2 Bảng mô tả về ACF và PACF của mô hình nhân quả khả nghịch ARMA theo mùa 33
Bảng 3 Số liệu doanh thu của một công ty theo tháng 43
Bảng 4 Chỉ số thời vụ cho từng tháng 45
Bảng 5 Bảng chỉ số CPI từ tháng 1/1996 đến tháng 12/2007 49
4
Trang 5DANH MỤC CÁC HÌNH ẢNH, ĐỒ THỊ
Hình 1 Mô phỏng về quá trình ARMA(0,1) (1, 0) 12 34
Hình 2 Mô phỏng về ACF và PACF của quá trình ARMA(0,1) (1, 0) 12 34
Đồ thị 1- Đồ thị chuỗi ADY và chuỗi Y 46
Đồ thị 2 Đồ thị chỉ số CPI Việt Nam qua các tháng 49
Đồ thị 3 Đồ thị tương quan của dữ liệu sau khi biến đổi sai phân bậc 1: 50
Đồ thị 4 Đồ thị tương quan của dữ liệu sau khi tiếp tục biến đổi sai phân thứ 12 của chuỗi sai phân bậc 1 51
Đồ thị 5 Đồ thị tương quan của dữ liệu sau khi tiếp tục biến đổi sai phân thứ 12 của chuỗi sai phân bậc 1 51
5
Trang 6LỜI NÓI ĐẦU
Trước tiên, tôi xin được bày tỏ lòng biết ơn chân thành và sâu sắc tới PGS
TS Tống Đình Quỳ người Thầy đã hướng dẫn tác giả tiếp cận với phương pháp làmviệc khoa học cũng như cơ hội được trở thành một người làm nghiên cứu Sự hướng
dẫn tận tình, động viên khích lệ của thầy trong suốt thời gian tôi thực hiện đề tài
Tôi cũng xin được trân trọng cảm ơn tập thể thầy cô giáo Viện Toán ứngdụng và Tin học, Viện Đào Tạo Sau Đại Học - Trường Đại Học Bách Khoa Hà Nội
đã giúp đỡ tôi trong suốt quá trình học tập và nghiên cứu
Cuối cùng, tôi xin được gửi lời cảm ơn tới gia đình, bạn bè, đồng nghiệp,những người đã cùng chia sẻ, gánh vác mọi công việc tạo điều kiện để tôi yên tâmhoàn thành luận văn
Hà Nội, ngày 29 tháng 9 năm 2013 Tác giả
Hoàng Duy Khánh
6
Trang 7LỜI CAM ĐOAN
Tác giả xin cam đoan toàn bộ kết quả nghiên cứu được trình bày trong Luậnvăn là do tác giả nghiên cứu, do tác giả tự trình bày, không sao chép từ các tài liệukhác Tác giả xin chịu trách nhiệm hoàn toàn về những nội dung, hình ảnh cũng nhưcác kết quả nghiên cứu trong Luận văn
Hà Nội, ngày 29 tháng 9 năm 2013 Tác giả
Hoàng Duy Khánh
7
Trang 8DANH MỤC CÁC KÝ HIỆU VÀ CÁC CHỮ VIẾT TẮT
8
Trang 9MỞ ĐẦU
Chuỗi thời gian đang được sử dụng như một công cụ hữu hiệu để phân tíchtrong kinh tế, xã hội cũng như trong nghiên cứu khoa học Chính do tầm quantrọng của phân tích chuỗi thời gian, rất nhiều tác giả đã đề xuất các công cụ đểphân tích chuỗi thời gian
Công cụ chủ yếu để phân tích chuỗi thời gian là sử dụng các công cụ thống
kê như hồi qui, phân tích Fourier và một vài công cụ khác Nhưng hiệu quảnhất có lẽ là mô hình ARIMA của Box-Jenkins để dự báo các giá trị trongtương lai
Mục tiêu của đề tài là nghiên cứu kỹ thuật xử lý mùa trên phương diện toánhọc thuần túy và giới thiệu mô hình theo mùa trong phân tích chuỗi thời gian vàmột số ứng dụng của mô hình theo mùa trong dự báo
Nội dung chính của luận văn được trình bày trong 3 chương:
Chương 1: Các kiến thức cơ bản về chuỗi thời gian
Chương 2: Một số kỹ thuật xử lý mùa trong phân tích chuỗi thời
gian
Chương 3: Một số ví dụ áp dụng
9
Trang 10CHƯƠNG 1 CÁC KIẾN THỨC CƠ BẢN VỀ CHUỖI THỜI GIAN
Trong phần này, chúng ta sẽ tìm hiểu về một lớp mô hình chuỗi thờigian hết sức thông dụng trong thực tế Đó là mô hình tự hồi quy trung bình trượtARMA (Autoregressive Moving Average) Ta sẽ nghiên cứu các đặc trưng củaquá trình ARMA, xem xét tổng quan về phương pháp ước lượng tham số của lớp
mô hình này và cũng thấy rõ được hạn chế của nó đối với chuỗi thời gian có tínhmùa Ngoài ra, mô hình ARMA còn đóng vai trò quan trong như là cơ sở để phântích chuỗi thời gian sau khi đã xử lý mùa có thể áp dụng mô hình ARMA và cũng
là căn cứ để xây dựng mô hình có mùa nói chung
1 Chuỗi thời gian và quá trình ngẫu nhiên
Trước khi đi vào chi tiết tìm hiểu về mô hình ARMA, ta sẽ nhắc lại một
số khái niệm liên quan đến chuỗi thời gian và quá trình ngẫu nhiên Dù là ta đivào chi tiết mô hình gì đi chăng nữa thì các khái niệm cơ bản này vẫn sẽ theochúng ta trong suốt quá trình nghiên cứu về chuỗi thời gian
1.1 Khái niệm chuỗi thời gian và quá trình ngẫu nhiên
Ví dụ: Các báo cáo tài chính mà ta thấy hằng ngày trên báo chí, tivi hayInternet về các chỉ số chứng khoán, tỷ giá tiền tệ, chỉ số tăng trưởng hay chỉ sốtiêu dùng đều là những thể hiện rất thực tế của chuỗi thời gian
Bước đầu tiên của việc phân tích chuỗi thời gian là chọn một mô hình toán
10
Trang 11Định nghĩa 1.1 (Quá trình ngẫu nhiên)
Một quá trình ngẫu nhiên là một họ các biến ngẫu nhiên { ,X t T t } phụ thuộc vào thời gian t được định nghĩa trên một không gian xác suất( , , ) A P
C hú ý:
Trong việc phân tích chuỗi thời gian, tập chỉ số T là một tập các thời điểm,
nhiên có T không phải là một tập con của R nhưng trong giới hạn của luận văn này
khi đó ta sẽ sử dụng ký hiệu tập chỉ số là Z thay vì T ở trên Một điểm chú ý nữa
là trong luận văn này chúng ta sẽ dùng thuật ngữ chuỗi thời gian để đồng thời chỉ
dữ liệu cũng như quá trình có dữ liệu đó là một thể hiện
1.2 Quá trình ngẫu nhiên dừng
Định nghĩa 1.2 (Hàm tự hiệp phương sai)
Giả sử { ,X t Z t } là một quá trình ngẫu nhiên có varX t với mỗi t Z Khi đó hàm tự hiệp phương sai của X t được định nghĩa theo công thức sau:
Định lý 1.1 Nếu { ,X t Z t } là một quá trình dừng, và nếu như a iR i Z,
thoả mãn điều kiện i
C
hú ý : Cũng có tài liệu gọi “dừng” theo nghĩa trên là dừng yếu, dừng theo
nghĩa rộng hay dừng bậc hai Tuy nhiên ở đây ta chỉ xem xét tính dừng theo
11
Trang 12nghĩa đã định nghĩa ở trên
lượng của nó thông khái niệm hàm tự hiệp phương sai mẫu.
Hàm tự hiệp phương sai mẫu được định nghĩa bởi công thức
1 1
Trang 13và c h : c h ,0 h n, trong đó
_
1 1
n j j
x n x
13
Trang 14Khi đó thì hàm tương tự tương quan mẫu cũng định nghĩa thông qua hàm tự hiệp phương sai mẫu như sau:
r h : c h c / 0 , h n
1.4 Toán tử tiến, toán tử lùi
nhiên { ,Y t Z t } sao cho
Một cách tổng quát, người ta có thể định nghĩa các chuỗi toán tử tiến F hay toán
tử lùi B và muốn thế chúng ta hạn chế trong trường hợp các quá trình dừng Khi đó, giả
Các chuỗi theo B khi đó sẽ có những tính chất cho phép ta xử lý nó tương tự
như đối với chuỗi thông thường Đặc biệt ta có thể thực hiện phép cộng, phép nhânhay phép lấy nghịch đảo Điều này có vai trò quan trọng trong các phép biến đổi của
đa thức tự hồi quy, đa thức trung bình trượt và các phép biến đổi xử lý chuỗi thời giankhác
14
Trang 152 Quá trình ARMA
2.1 Quá trình tự hồi quy
Định nghĩa 1.5 (Quá trình ồn trắng)
Quá trình ngẫu nhiên t,t Z được gọi là một ồn trắng, ký hiệu WN0,2
, khi nó thoả mãn các điều kiện sau:
Định nghĩa 1.6 (Quá trình tự hồi quy)
Người ta gọi quá trình ngẫu nhiên { ,X t Z t } là một quá trình tự hồi quy cấp p, viết là X t AR p , là một quá trình dừng { ,X t Z t } thoả mãn
Trang 16Nếu đa thức a z ở trên có nghiệm nằm ngoài đường tròn đơn vị z 1
a a
a và i Nghĩa là nếu cho i ta sẽ tính được a i và ngược lại cho a i ta cũng sẽ tính
phương trình Jule – Walker tương đương với
đóng vai trò rất quan trọng trong việc xác định bậc của quá trình tự hồi quy cũng nhưviệc ước lượng tham số mô hình tự hồi quy sau này
Trong việc thực tế, khi cho chuỗi quan sát X:x t t, 1, 2, ,n thì ta dùng công
các tự tương quan mẫu ta thay vào hệ phương trình Jule – Walker và giải nó để tìm ước
2.2 Quá trình trung bình trượt
Định nghĩa1.7 (Quá trình trung bình trượt)
Trang 17Một quá trình trung bình trượt cấp q, ký hiệu X t MA q , là một quá trình
{ ,X t Z t } thoả mãn biểu thức X t 1 b1t1 b q t q , , , ,b b1 2 b qR b, q 0 Với t là một ồn trắng.
Ta cũng có thể viết biểu thức trung bình trượt ở trên dưới dạng toán tử lùitương tự như đối với quá trình tự hồi quy như sau
Khác với quá trình AR, biểu thức trên luôn xác định duy nhất một quá trình MA
Một chú ý nữa, cũng giống như trường hợp AR, nếu đa thức trung bình trượt b(z) không
không nói gì thêm thì khi nói về các quá trình AR và MA chúng ta hiểu đó là cácquá trình nhân quả và khả nghịch
Các đặc trưng của quá trình trung bình trượt:
Trang 182.3 Quá trình tự hồi quy trung bình trượt
Định nghĩa 1.8 (Quá trình tự hồi quy trung bình trượt)
Một quá trình { ,X t Z t } được gọi là quá trình tự hồi quy trung bình trượt cấp p,q
, kí hiệu X t ARMA p q , là một quá trình { ,X t Z t } thõa mãn:
Trang 191 1 1 1 ,
trung bình trượt có bậc tương ứng là p và q:
Định nghĩa 1.9 (Quá trình nhân quả khả nghịch)
Một quá trình ARMA(p,q) được gọi là một quá trình nhân quả và khả nghịch nếu nó là một quá trình ARMA(p,q) có a(z) và b(z) thỏa mãn hai điều kiện:
i) a(z) và b(z) không có nghiệm chung ii) a(z) và b(z) luôn có nghiệm có môđun vượt quá 1
C hú ý:
Do tính nhân quả và khả nghịch cộng với tính chất khả đảo của đa thức toán tử,
Các đặc trưng của quá trình ARMA:
e X
k
k k
Trang 202.4 Quá trình hợp nhất tự hồi quy trung bình trượt ARIMA
Chuỗi thời gian xuất phát có thể dừng hoặc không dừng Để làm chuỗi dừngchúng ta sẽ lấy sai phân Chuỗi được gọi là đồng liên kết bậc d nếu chuỗi sai phân bậc
d là chuỗi dừng Áp dụng mô hình ARIMA (p,q) cho ta quá trình trung bình trượt, đồng
liên kết, tự hồi quy ARIMA(p,d,q).
Trang 21CHƯƠNG 2 KỸ THUẬT XỬ LÝ MÙA TRONG PHÂN TÍCH
CHUỖI THỜI GIAN
1 Kỹ thuật trung bình động
1.1 Bài toán tách thành phần tất định
x t D t S t u t (1.1)
thành phần ngẫu nhiên và thường thõa mãn mô hình ARIMA Để tách thành phần
thõa mãn các điều kiện (1.2) và (1.3) dưới đây:
Bx t :x t'D t'S t'u t t', 1,n (1.2)Trong đó:
Dt' 0; St' 0; ut' u tt; 1, n (1.3)Phép biến đổi như thế sẽ là phép biến đổi lý tưởng đối với bài toán tách thành phầntất định trong mô hình (1.1), nhưng rất tiếc chưa có ai đề xuất được một phép biến
hiệu quả hơn, gọi là biến đổi trung bình động, được định nghĩa dưới đây:
D t' D S t, t'0,u t' u t t; 1,n (1.6)
Hoặc: Dt' 0, St' S ut, t' ut (1.7)
Phép biến đổi thõa mãn (1.6) được gọi là phép biến đổi bảo toàn khuynh và
triệt tiêu mùa, còn phép biến đổi (1.7) được gọi là phép biến đổi triệt tiêu khuynh và bảo toàn mùa
18
Trang 221.2 Biến đổi trung bình trượt
h : covx x t', t h' Ex x t t h' ' ; h nguyên dương (1.10)
0 var
2 1
t
x k
phương sai của chuỗi xuất phát (2k+1) lần.
19
Trang 23Thật vậy, phương trình (1.12) là một phương trình sai phân cấp 2k, nên phương
phương trình sai phân (1.12)
Như thế, với một thành phần mùa cho trước thể hiện dưới dạng một hàm tuần
hoàn có chu kỳ lẻ thì bao giờ cũng tìm được một phép biến đổi trung bình số học
dạng (1.8) để khử thành phần đó
20
Trang 24Tuy nhiên, trong thực tế thường xảy ra trường hợp thành phần mùa có chu kỳ
chẵn 2k=4 (quý), 2k=12 tháng, …, khi đó thay vì dùng biến đổi (1.8) có thể dùng
biến đổi (1.1.8a) dưới đây để khử thành phần mùa:
e
j1, 2k1 (1.17)
i là số ảo thuần túy.
hiện dưới dạng một hàm tuần hoàn có chu kỳ chẵn thì bao giờ cũng tìm được mộtphép biến đổi trung bình dạng (1.1.8a) để khử thành phần mùa đó
Cuối cùng ta hãy xét xem biến đổi (1.1.8a) có thể bảo toàn những khuynh tất định
D t nào và muốn thế ta tìm nghiệm của phương trình sai phân:
Trang 25Có thể kiểm tra lại rằng phương trình (1.19) nhận 1 là nghiệm kép, do đóphương trình sai phân (1.1.18) có một họ nghiệm là các đa thức bậc nhất và dĩ nhiên
kể cả hằng số và ta có:
Mệnh đề 1.3
Phép biến đổi trung bình số học (1.8) bảo toàn khuynh tất định dạng đa thức bậc
nhất, làm triệt tiêu thành phần mùa với chu kỳ 2k+1 ( hay chu kỳ 2k ứng với (1.8a)
và biến một dãy ồn trắng thành một dãy có tương quan, có phương sai bé thuaphương sai của dãy ban đầu
Chú ý 1:
1.3 Biến đổi trung bình động
Bây giờ, trở lại phép biến đổi (1.1.4); nếu dùng toán tử lùi B định nghĩa bởi:
i k
C x c x
(1.24)Thì có thể biểu diễn dưới dạng: B C F k (1.25)
Định nghĩa 1.3.1
22
Trang 26Đa thức C(x) được gọi là đa thức trung bình động , bậc của đa thức này là 2k và số (2k+1) dùng trong công thức (1.1.24) được gọi là bậc của phép biến đổi trung bình
động và kí hiệu là d 0 nghĩa là d0 2k1
Một khi đã có đa thức C(x) thì cũng có nghĩa là cho phép biến đổi trung bình động,
chẳng hạn đa thức trung bình động của đa thức (1.8) là:
2k 1 +1 và 2k 2+1, gọi hợp của hai trung bình động 1 k1 và 2 k2 là phép biến đổi
Với C x C x1 , 2 lần lượt là hai đa thức trung bình động ứng với 1 k1 ,2 k2
Có thể dễ dàng kiểm tra lại rằng phép hợp trung bình động có tính giao hoán và kết hợp, do vậy xuất phát từ những trung bình động cấp thấp vẫn xây dựng được một trung bình động bậc cao với tính toán đơn giản hơn
Trang 27i k
c
biến đổi trung bình động, nghĩa là thõa:
24
Trang 28Phương trình sai phân (1.1.32) có phương trình đặc trưng tương ứng là:
sẽ giúp ta xử lý vấn đề này Nội dung của phương pháp gồm 4 bước cơ bản :
Bước 1 : Nhận dạng mô hình Tìm ra các gía trị p,d,q
Bước 2 : Ước lương mô hình
Buớc 3 : Kiểm định giả thiết
Ở bước này cần chọn ra mô hình phù hợp nhất với số liệu hiện có Kiểmđịnh đơn giản nhất là kiểm đinh tính dừng của phần dư Nếu phần dư có tính dừng
25
Trang 29thì mô hình là châp nhận được Quá trình lặp cho đến khi nào tìm được mô hìnhthỏa đáng.
cả quá trình nghệ thuật đòi hỏi nhiều kinh nghiệm Ngày nay đã có phần mềm trợgiúp như Eviews, Stata, …nên việc tính toán đơn giản hơn nhiều
2.1.1 Dựa vào lược đồ tự tương quan và tự tương quan riêng
Trên lược đồ này vẽ ACF và PACF theo độ dài của trễ Đồng thời cũng vẽđường phân dải chỉ khoảng tin cậy 95% cho hệ số tự tương quan và hệ số tự tươngquan riêng Dựa trên các lược đồ này ta biết các hệ số tự tương quan nào và các hệ
số tự tương quan nào là khác không Từ đó đưa ra đoán nhận về p,q của các quá trình AR(p) và MA(q).
1, , 1
hoặc hình sin thì ta có quá trình AR(p).
thì ta có quá trình MA(q) Ta có bảng tổng kết một số trường hợp :
26