1. Trang chủ
  2. » Tài Chính - Ngân Hàng

MÔ HÌNH ARIMA

19 808 4

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Nội dung

MÔ HÌNH ARIMA

HÌNH ARIMA I. Giới Thiệu Hình ARIMA: Như chúng ta đã biết, trong nghiên cứu định lượng, tồn tại 3 loại số liệu cơ bản là số liệu theo thời gian, số liệu chéo và số liệu hỗn hợp. Đối với các vấn đề kinh tế, loại số liệu chúng ta thường xuyên tiếp cận nhất có lẽ là số liệu theo thời gian, hay còn gọi là các chuỗi thời gian như chuỗi số liệu GDP, chỉ số VN-Index hay giá vàng theo thời gian…Tuy nhiên, chuỗi thời gian cũng gây ra không ít khó khăn cho các nhà nghiên cứu, bởi nhiều nghiên cứu đã cho thấy, trong nhiều trường hợp, các hình hồi quy cổ điển dường như không hiệu quả với loại dữ liệu này. Vậy, vấn đề đặt ra là làm thế nào chúng ta có thể nghiên cứu một chuỗi thời gian, rút ra những kết luận và sử dụng nó để dự báo một cách có hiệu quả? Để trả lời cho câu hỏi này có nhiều phương pháp khác nhau, tuy nhiên, có hai phương pháp được hầu hết các nhà nghiên cứu thừa nhận và sử dụng thường xuyên đó là hai hình: ARIMA và VAR. Mô hình Trung bình trượt, đồng liên kết, tự hồi quy ARIMA dựa trên triết lý “hãy để dữ liệu tự nói”, nó không sử dụng các biến ngoại sinh độc lập X 1 , X 2 , X 3 để giải thích cho Y, mà nó sử dụng chính các giá trị trong quá khứ của Y để giải thích cho bản thân nó ở hiện tại. Nó cũng không giả định bất kỳ một hình cụ thể nào, mà việc xác định hình là dựa trên phân tích dữ liệu cụ thể từng trường hợp và cả một chút nghệ thuật của người sử dụng. Chính vì thế, ARIMA đôi khi còn được gọi là hình lý thuyết mới vì nó không dựa bất kỳ một lý thuyết kinh tế nào. Và cũng do đó, ARIMA có được tính linh hoạt và tiết kiệm hơn hẳn các phương pháp khác, đồng thời tính hiệu quả của ARIMA trong công tác dự báo cũng đã được thực tế chứng minh. Tất cả những điều ấy mang đến cho ARIMA một vị thế nhất định trong lĩnh vực nghiên cứu định lượng và ngày càng trở nên thông dụng hơn. 1 II. Cơ Sở Lý Thuyết 1. Tính Dừng 1.1 Khái niệm Dữ liệu của bất kỳ chuỗi thời gian nào đều có thể được coi là được tạo ra từ một quá trình ngẫu nhiên và một tập hợp dữ liệu cụ thể, có thể được coi là một kết quả (cá biệt) của quá trình ngẫu nhiên đó. Hay nói các khác, có thể xem quá trình ngẫu nhiên là tổng thể và kết quả là một mẫu được của tổng thể đó. Một tính chất của quá trình ngẫu nhiên được các nhà phân tích về chuỗi thời gian đặc biệt quan tâm và xem xét kỹ lưỡng là Tính dừng. Một quá trình ngẫu nhiên Y t được coi là dừng nếu kỳ vọng, phương sai và hiệp phương sai tại cùng một độ trễ của nó không đổi theo thời gian. Cụ thể, Y t được gọi là dừng nếu:  Trung bình: E(Y t ) = µ (∀t) (1)  Phương sai: Var(Y t )= E(Y t –µ) 2 = σ 2 (∀t) (2)  Đồng phương sai: Cov(Y t ,Y t+k ) = E[(Y t – µ)(Y t+k – µ)]= γ k (∀t) (3) Điều kiện thứ 3 có nghĩa là hiệp phương sai giữa Yt và Yt+k chỉ phụ thuộc vào độ trễ về thời gian (k) giữa hai thời đoạn này chứ không phụ thuộc vào thời điểm t. Ví dụ Cov( Y2, Y 7 )=Cov(Y 10 ,Y 15 )=Cov(Y 30 ,Y 35 )=…=Cov(Y t ,Y t+5 ). Nhưng Cov(Y t ,Y t+5 ) có thể khác Cov(Y t ,Y t+6 )… Quá trình ngẫu nhiên Y t được coi là không dừng nếu nó vi phạm ít nhất một trong ba điều kiện trên. 1.2 Hậu quả của Chuỗi không dừng. Trong hình hồi quy cổ điển, ta giả định rằng sai số ngẫu nhiên có kỳ vọng bằng không, phương sai không đổi và chúng không tương quan với nhau. Với dữ liệu là các chuỗi không dừng, các giả thiết này bị vi phạm, các kiểm định t, F mất hiệu lực, ước lượng và dự báo không hiệu quả hay nói cách khác phương pháp OLS không áp dụng cho các chuỗi không dừng. Điển hình là hiện tượng hồi quy giả mạo: nếu hình tồn tại ít nhất một biến độc lập có cùng xu thế với biến phụ thuộc, khi ước lượng hình ta có thể 2 thu được các hệ số có ý nghĩa thống kê và hệ số xác định R 2 rất cao. Nhưng điều này có thể chỉ là giả mạo, R 2 cao có thể là do hai biến này có cùng xu thế chứ không phải do chúng tương quan chặt chẽ với nhau. Trong thực tế, phần lớn các chuỗi thời gian đều là chuỗi không dừng, kết hợp với những hậu quả trình bày trên đây cho thấy tầm quan trọng của việc xác định một chuỗi thời gian có tính dừng hay không. 1.3 Kiểm định tính dừng 1.3.1 Dựa trên đồ thị của chuỗi thời gian Một cách trực quan chuỗi Y t có tính dừng nếu như đồ thị Y=f(t) cho thấy trung bình và phương sai của quá trình Y t không đổi theo thời gian. Ta xét chuỗi chỉ số VNIndex từ ngày 2/1/2009 đến ngày 31/12/2010 có đồ thị theo thời gian như sau: Hình 1.3.1: Đồ thị VNIndex theo thời gian 200 300 400 500 600 700 50 100 150 200 250 300 350 400 4 50 500 VNINDEX Nhìn vào đồ thị của VNIndex theo thời gian ta thấy trung bình của nó có xu hướng tăng hoặc giảm theo từng thời kỳ. Như vậy, có thể suy đoán rằng điều kiện một bị vi phạm và VNIndex là chuỗi không dừng. 3 Phương pháp này cho ta cái nhìn trực quan, đánh giá ban đầu về tính dừng của chuỗi thời gian. Tuy nhiên, với những chuỗi thời gian có xu hướng không rõ ràng, phương pháp này trở nên khó khăn và đôi khi không chính xác. 1.3.2 Dựa trên lược đồ tương quan 1.3.2.1 Tự tương quan Một cách kiểm định đơn giản tính dừng là dùng hàm tự tương quan (ACF). ACF với độ trễ k, ký hiệu bằng ρ k , được xác định như sau: Nếu vẽ đồ thị của ρ k theo k, ta được lược đồ tương quan tổng thể. Tuy nhiên, trên thực tế chúng ta chưa có tổng thể mà chỉ có mẫu. Khi đó ta xây dựng hàm tự tương quan mẫu với: Trường hợp mẫu có khích thước nhỏ thì mẫu số của là n-k-1 và của là n-1. Đồ thị thể hiện ρ k ở độ trễ k được gọi là lược đồ tương quan mẫu. Bartlett đã chỉ ra rằng nếu một chuỗi là ngẫu nhiên và dừng, thì các hệ số tự tương quan mẫu sẽ có phân phối xấp xỉ chuẩn với kỳ vọng toán bằng 0 và phương sai 1/n, với n khá lớn. ~ N(0, 1/n) Ta cần kiểm định giả thiết: H 0 : ρ k = 0 (chuỗi dừng) H 1 : ρ k ≠ 0 4 Khoảng tin cậy 95% Nếu ∈(-Z α /2 / n , Z α /2 / n ) thì chấp nhận giả thiết H 0 với mức ý nghĩa α . Giá trị của các chỉ số Z tra trong bảng đã được tính toán sẵn. Với độ tin cậy 95%, khoảng tin cậy ρ k của VNIndex là ± 1,96/ 504 = ± 0.087. Nếu ∈(-0,087; +0,087) ta chấp nhận giả thiết H 0 , ngược lại, nếu không thuộc khoảng này, ta bác bỏ H 0 (với mức ý nghĩa 5%). Sử dụng phần mềm EViews ta có bảng kết quả hàm ACF và lược đồ tương quan của VNIndex với 20 độ trễ như sau: Bảng 1.3.2: Lược đồ tương quan và các kết quả đi kèm của chuỗi VNIndex (Vào View/Correlogram … , xác định biểu đồ tự tương quan của chuỗi gốc hay chuỗi sai phân bậc một, bậc hai, và cuối cùng là xác định độ trễ k) Có thể thấy toàn bộ ρ k của ACF tại 30 độ trễ đều khác 0 có ý nghĩa thống kê. Như vậy, VNIndex là chuỗi không dừng. Một cách trực quan ta có thể nhận 5 định dựa trên lược đồ tương quan, nếu đồ thị có xu hướng giảm chậm, tương đối đều dặn theo độ trễ thì chuỗi không dừng. Ngược lại nếu đồ thị giảm nhanh, ngẫu nhiên, không theo xu hướng thì chuỗi dừng. 1.3.2.2 Tự tương quan riêng Các hệ số tự tương quan ρ k (k≥2) phản ánh mức độ kết hợp tuyến tính của Y t và Y t+k . Tuy nhiên, mức độ kết hợp giữa hai biến còn có thể do một số biến khác gây ra. Trong trường hợp này là ảnh hưởng từ các biên Y t-1 …Y t-k+1 . Do đó để đo độ kết hợp riêng rẽ giữa Y t và Y t-k ta sử dụng hàm tương quan riêng PACF với hệ số tương quan riêng ρ kk được ước lượng theo công thức đệ quy của Durbin: Nếu chuỗi dừng thì các có phân phối chuẩn N(0,1/n). Do đó, kiểm định giả thiết đối với ρ kk tương tự như với ρ k . 1.3.2.3 Kiểm định đồng thời  Box – Pierce đã đưa ra kiểm định về sự đồng thời bằng không của các hệ số tương quan: H 0 : ρ 1 =ρ 2 =…=ρ m =0 H 1 : tồn tại ít nhất một ρ k =0 Giả thiết H 0 được kiểm định bằng thống kê Với n: kích thức mẫu, m: độ dài của trễ. Q ~ Bác bỏ H 0 khi Q >  Một dạng khác của Q là thống kê Ljung-Box (LB): 6 Với . Bác bỏ H 0 khi LB > Thống kê LB được xem là tốt hơn với các mẫu số nhỏ so với thống kê Q. Với Eviews, ta dễ dàng có được các giá trị của LB với các độ trễ khác nhau (cột Q-Stat) và xác suất nhỏ nhất để giả thiết H 0 bị bác bỏ (cột Prob).  Xem xét hình 1.3.2, ta có thể kết luận tổng thể rằng VNIndex là chuỗi thời gian không có tính dừng 1.3.3 Kiểm định nghiệm đơn vị (Unit root test) 1.3.3.1 Nhiễu trắng: Một U t đáp ứng đầy đủ các giả thiết của hình hồi quy tuyến tính cổ điển, tức có kỳ vọng bằng không, phương sai không đổi và hiệp phương sai bằng không gọi là nhiễu trắng. 1.3.3.2 Bước ngẫu nhiên Nếu Y t = Y t-1 +U t với U t là nhiễu trắng, thì Y t được gọi là bước ngẫu nhiên. Ta có: Y 1 =Y 0 +U 1 Y 2 =Y 1 +U 2 =Y 0 +U 1 +U 2 Y t =Y 0 +U 1 +U 2 +…+U t Do Y 0 là hằng số, các Ui độc lập với nhau, phương sai không đổ bằng σ 2 nên: Var(Y t )=tσ 2 (thay đổi theo t). Điều này chứng tỏ Y t là chuỗi không dừng 1.3.3.3 Kiểm định nghiệm đơn vị Dickey – Fuller Xét hình Y t = ρY t-1 +U t với U t là nhiễu trắng. Nếu ρ=1 thì Y t là bước ngẫu nhiên và không dừng. Do đó để kiểm định tính dừng của Y t ta kiểm định giả thiết: H 0 : ρ=1 (chuỗi không dừng) H 1 : ρ≠1 Ở đây ta không thể sử dụng kiểm định t vì Y t có thể là chuỗi không dừng. Trong trường hợp này ta sử dụng tiêu chuẩn kiểm định DF như sau: 7 Phân phối theo quy luật DF Nếu ta bác bỏ giả thiết H 0 và kết luận chuỗi dừng. Tiêu chuẩn DF cũng được áp dụng cho các hình sau: Với giả thiết H 0 : γ=0 (chuỗi dừng). Nếu U t tự tương quan, ta cải biên hình (3) thành hình: Tiêu chuẩn DF áp dụng cho hình (4) được gọi là tiêu chuẩn mở rộng Dickey – Fuller (ADF). Để tiến hành kiểm định nghiệm đơn vị trên Eviews ta chọn View/Unit Root Test …, sẽ xuất hiện hộp thoại Unit Root Test. Ta có các lựa chon tương ứng với các dạng phương trình ở mục Include in test equation:  Intercept: nếu dùng phương trình (2)  Trend and intercept: nếu dùng phương trình (3)  None: nếu dùng phương trình (1),  Trend and intercept và xác định độ trễ ở lựa chọn Lag length: nếu dùng phương trình (4). Kết quả kiểm định chuỗi VNIndex bằng Eviews cho ta kết quả sau: Hình 1.3.4: Kết quả kiểm định nghiệm đơn vị chuỗi VNIndex 8 (1) (2) (3) (4) Ta có ׀ ׀ = 1,86 nhỏ hơn tất cả các giá trị ׀ 0,01 ׀, ׀ 0,05 ׀ và ׀ 0,1 ׀ nên ta chấp nhận giả thiết H 0 : ρ=1 tức VNIndex là chuỗi không dừng. 1.4 Biến đổi chuỗi không dừng thành chuỗi dừng Xét bước ngẫu nhiên: Y t =Y t-1 +U t với U t là nhiễu trắng. Ta lấy sai phân cấp I của Yt: D(Y t )=Y t -Y t-1 =U t . Trong trường hợp này D(Y t ) là chuỗi dừng vì U t là nhiễu trắng. Trường hợp tổng quát, với mọi chuỗi thời gian nếu sai phân cấp I của Y t chưa dừng ta tiếp tục lấy sai phân cấp II, III… Các nghiên cứu đã chứng minh luôn tồn tại một giá trị d xác định để sai phân cấp d của Y t là chuỗi dừng. Khi đó Y t được gọi là liên kết bậc d, ký hiêu là I(d). Sai phân cấp d được lấy như sau:  Sai phân cấp I của Yt: D(Y t )=Y t -Y t-1  Sai phân cấp II: D(D(Y t ))=D 2 (Y t )=(Y t -Y t-1 )-(Y t-1 -Y t-2 ) ….  Sai phân cấp d: D(D d-1 (Y t )) Lấy sai phân cấp I của VNIndex ta được đồ thị theo thời gian như sau: Hình 1.4.1: Biểu đồ chuỗi sai phân cấp I của VNIndex theo thời gian -30 -20 -10 0 10 20 30 50 100 150 200 250 300 350 400 450 500 DVNINDEX 9 Lược đồ tương quan Hình 1.4.2: Lược đồ tương quan chuỗi sai phân cấp I của VNIndex Hầu hết các hệ số tương quan khác 0 không có ý nghĩa thống kê, lược đồ tương quan giảm nhanh sau độ trễ thứ 2 và không có xu hướng nhất định. Và kết quả kiểm định Nghiệm đơn vị: Hình 1.4.1: Kết quả kiểm định nghiệm đơn vị chuỗi sai phân của VNIndex Từ kết quả trên có thể kết luận sai phân bậc nhất của VNIndex là một chuỗi dừng. Như vậy, để biến một chuỗi dừng thành chuỗi dừng ta áp dụng phương pháp lấy sai phân, và thông thường chuỗi dừng ở sai phân cấp I hoặc cấp II. 10 [...]... ta quay lại bước 1 Tuy nhiên, một chuỗi dữ liệu có thể phù hợp với nhiều hình ARIMA khác nhau, do đó chúng ta cần thử nhiều hình để chọn được hình phù hợp nhất Đó là lý do tại sao phương pháp lập hình ARIMA của Box-Jenkins được xem là nghệ thuật nhiều hơn là khoa học Cần phải có kỹ năng tốt để lựa chọn đúng hình ARIMA thích hợp nhất Thông thường, ta dựa trên các tiêu chuẩn: Log likelihood... tra Để kiểm tra tính phù hợp của hình ta kiểm tra xem phần dư của hình có phải là nhiễu trắng hay không? Trong Eviews, sau khi ước lượng xong hình ta thực hiện: 16 Ta được kết quả: Có thể thấy, ngoại trừ độ trễ 3, các hệ số tương quan và tương quan riêng phần đều bằng 0 có nghĩa Như vậy, có thể nói phần dư của hình là nhiễu trắng và hình phù hợp Nếu hình không phù hợp ta quay lại bước... giá trị p, d, q ta sẽ hình hóa được chuỗi Đồng thời ta dễ dàng nhận ra, hình ARIMA chỉ sử dụng các giá trị quá khứ của bản thân nó chứ hoàn toàn không sử dụng thêm một biến độc lập nào khác Đây chính là triết lý “hãy để dữ liệu tự nói” III Phương Pháp Luận BOX-JENKINS (BJ) Một câu hỏi lớn đặt ra đối với hình ARIMA là làm thế nào xác định các giá trị p, d, q và xác định hình phù hợp? Box-Jenkins... Akaike, Schwarz (càng nhỏ càng tốt) hay so sánh với dữ liệu quá khứ để lựa chọn hình thích hợp nhất Với ví dụ của chúng ta, chúng tôi đã thực hiện kiểm tra, so sánh nhiều hình và nhận thấy mô hình ARIMA( 4,1,10) dường như là phù hợp nhất 17 Bước 4: Dự báo Một trong số các lý do về tính phổ biến của phương pháp lập mô hình ARIMA là thành công của nó trong dự báo Trong nhiều trường hợp, các dự báo thu... Như vậy ta có mô hình ARIMA( p,1,q) với:  p ∈ {2,4,10}  q ∈ {1,5,10,13} Bước 2: Ước lượng Để ước lượng các hệ số của hình, đôi khi ta có thể thực hiện bằng phương pháp bình phương tối thiểu, nhưng cũng có trường hợp phải sử dụng các phương pháp ước lượng phi tuyến Ngày nay, với sự trợ giúp của các phần mềm thống kê, ta có thể dễ dàng thực hiện điều này Giả sử ta ước lượng hình ARIMA( 4,1,10)... +…+ β qUt-q ]+ Ut 2.4 Quá trình Trung bình trượt, Đồng liên kết, Tự hồi quy (ARIMA) Một chuỗi thời gian có thể tuân theo nhiều hình khác nhau, tuy nhiên, cả ba hình trên đều đòi hỏi chuỗi thời gian phải có tính dừng Nhưng trong thực tế, tồn tại rất nhiều chuỗi thời gian không dừng Vậy làm cách nào để ứng dụng các hình trên trong thực tế? Câu trả lời chính là dùng phương pháp lấy sai phân để... (AR), Trung Bình Trượt (MA) và Hình ARIMA Nếu một chuỗi thời gian có tính dừng, nó có thể tuân theo nhiều quá trình khác nhau: 2.1 Quá trình Tự Hồi Quy (AR) Nếu một chuỗi thời gian tuân theo hình: Với Y là chuỗi dừng và Ut là nhiễu trắng, ta nói Y tuân theo quá trình Tự hồi quy bậc p Ký hiệu AR(p) 2.2 Quá trình Trung Bình Trượt (MA) Nếu một chuỗi thời gian tuân theo hình: Với Y là chuỗi dừng và... pháp nhận dạng như sau: một chuỗi dừng tự tương quan bậc p nếu:  Các hệ số tự tương quan giảm từ từ theo dạng mũ hoặc hình sin  Các hệ số tương quan riêng phần giảm đột ngột xuống giá tri bằng 0 có nghĩa ngay sau độ trễ p Một số dạng hình học tiêu biểu của hình AR(1) như sau: 13 hình AR(2): Ta quan sát đồ thị tự tương quan và tương quan riêng phần sai phân bậc I của chuỗi log(vnindex): Dễ thấy,... dùng phương pháp lấy sai phân để biến đổi một chuỗi thời gian không dừng thành chuỗi dừng trước khi áp dụng hình ARMA Nếu một chuỗi thời gian dừng ở sai phân bậc d, ta nói chuỗi liên kết bậc d Ký hiệu I(d) Kế hợp với quá trình ARMA ta có được hình Trung bình trượt, 11 Đồng liên kết, Tự hồi quy ARIMA( p,d,q) với p số hạng tự hồi quy và q số hạng trung bình trượt, và cần lấy sai phân bậc d đề chuỗi... 0.14% 1/5/2011 481.9 483.7 0.37% 1/6/2011 482.3 481.1 0.25% 1/7/2011 481.9 483.6 0.35% Với độ tin cậy 95% dự báo này là có thể chấp nhận đươc Với tính linh hoạt, tiết kiệm và khả năng dự báo tốt, mô hình ARIMA đã được sử dụng rộng rãi trên toàn thế giới, tuy nhiên, cần có sự xem xét cẩn thận trong từng trường hợp để đạt được kết quả tốt nhất  Tài Liệu Tham Khảo  Hoàng Ngọc Nhậm và cộng sự, Giáo trình . thể nói phần dư của mô hình là nhiễu trắng và mô hình phù hợp. Nếu mô hình không phù hợp ta quay lại bước 1. Tuy nhiên, một chuỗi dữ liệu có thể phù hợp với nhiều mô hình ARIMA khác nhau, do. cũng được áp dụng cho các mô hình sau: Với giả thiết H 0 : γ=0 (chuỗi dừng). Nếu U t tự tương quan, ta cải biên mô hình (3) thành mô hình: Tiêu chuẩn DF áp dụng cho mô hình (4) được gọi là tiêu. câu hỏi lớn đặt ra đối với mô hình ARIMA là làm thế nào xác định các giá trị p, d, q và xác định mô hình phù hợp? Box-Jenkins đã đưa ra phương pháp để xác định mô hình này qua các bước: Bước

Ngày đăng: 25/03/2014, 09:22

Xem thêm

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w