1. Trang chủ
  2. » Tất cả

MÔ HÌNH ARIMA

19 2 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

MÔ HÌNH ARIMA MÔ HÌNH ARIMA I Giới Thiệu Mô Hình ARIMA Như chúng ta đã biết, trong nghiên cứu định lượng, tồn tại 3 loại số liệu cơ bản là số liệu theo thời gian, số liệu chéo và số liệu hỗn hợp Đối v[.]

MƠ HÌNH ARIMA I Giới Thiệu Mơ Hình ARIMA: Như biết, nghiên cứu định lượng, tồn loại số liệu số liệu theo thời gian, số liệu chéo số liệu hỗn hợp Đối với vấn đề kinh tế, loại số liệu thường xuyên tiếp cận có lẽ số liệu theo thời gian, hay gọi chuỗi thời gian chuỗi số liệu GDP, số VN-Index hay giá vàng theo thời gian…Tuy nhiên, chuỗi thời gian gây khơng khó khăn cho nhà nghiên cứu, nhiều nghiên cứu cho thấy, nhiều trường hợp, mơ hình hồi quy cổ điển dường không hiệu với loại liệu Vậy, vấn đề đặt làm nghiên cứu chuỗi thời gian, rút kết luận sử dụng để dự báo cách có hiệu quả? Để trả lời cho câu hỏi có nhiều phương pháp khác nhau, nhiên, có hai phương pháp hầu hết nhà nghiên cứu thừa nhận sử dụng thường xun hai mơ hình: ARIMA VAR Mơ hình Trung bình trượt, đồng liên kết, tự hồi quy ARIMA dựa triết lý “hãy để liệu tự nói”, khơng sử dụng biến ngoại sinh độc lập X 1, X2, X3 để giải thích cho Y, mà sử dụng giá trị q khứ Y để giải thích cho thân Nó khơng giả định mơ hình cụ thể nào, mà việc xác định mơ hình dựa phân tích liệu cụ thể trường hợp chút nghệ thuật người sử dụng Chính thế, ARIMA đơi cịn gọi mơ hình lý thuyết khơng dựa lý thuyết kinh tế Và đó, ARIMA có tính linh hoạt tiết kiệm hẳn phương pháp khác, đồng thời tính hiệu ARIMA cơng tác dự báo thực tế chứng minh Tất điều mang đến cho ARIMA vị định lĩnh vực nghiên cứu định lượng ngày trở nên thông dụng II Cơ Sở Lý Thuyết Tính Dừng 1.1 Khái niệm Dữ liệu chuỗi thời gian coi tạo từ trình ngẫu nhiên tập hợp liệu cụ thể, coi kết (cá biệt) q trình ngẫu nhiên Hay nói khác, xem q trình ngẫu nhiên tổng thể kết mẫu tổng thể Một tính chất q trình ngẫu nhiên nhà phân tích chuỗi thời gian đặc biệt quan tâm xem xét kỹ lưỡng Tính dừng Một q trình ngẫu nhiên Yt coi dừng kỳ vọng, phương sai hiệp phương sai độ trễ khơng đổi theo thời gian Cụ thể, Yt gọi dừng nếu:  Trung bình: E(Yt) = µ (t) (1)  Phương sai: Var(Yt)= E(Yt –µ)2 = σ2 (t) (2)  Đồng phương sai: Cov(Yt,Yt+k) = E[(Yt – µ)(Yt+k – µ)]= γk (t) (3) Điều kiện thứ có nghĩa hiệp phương sai Yt Yt+k phụ thuộc vào độ trễ thời gian (k) hai thời đoạn không phụ thuộc vào thời điểm t Ví dụ Cov(Y2,Y7)=Cov(Y10,Y15)=Cov(Y30,Y35)=…=Cov(Yt,Yt+5) Nhưng Cov(Yt,Yt+5) khác Cov(Yt,Yt+6)… Q trình ngẫu nhiên Yt coi khơng dừng vi phạm ba điều kiện 1.2 Hậu Chuỗi không dừng Trong mô hình hồi quy cổ điển, ta giả định sai số ngẫu nhiên có kỳ vọng khơng, phương sai không đổi chúng không tương quan với Với liệu chuỗi không dừng, giả thiết bị vi phạm, kiểm định t, F hiệu lực, ước lượng dự báo không hiệu hay nói cách khác phương pháp OLS khơng áp dụng cho chuỗi khơng dừng Điển hình tượng hồi quy giả mạo: mơ hình tồn biến độc lập có xu với biến phụ thuộc, ước lượng mơ hình ta thu hệ số có ý nghĩa thống kê hệ số xác định R cao Nhưng điều giả mạo, R cao hai biến có xu khơng phải chúng tương quan chặt chẽ với Trong thực tế, phần lớn chuỗi thời gian chuỗi không dừng, kết hợp với hậu trình bày cho thấy tầm quan trọng việc xác định chuỗi thời gian có tính dừng hay khơng 1.3 Kiểm định tính dừng 1.3.1 Dựa đồ thị chuỗi thời gian Một cách trực quan chuỗi Yt có tính dừng đồ thị Y=f(t) cho thấy trung bình phương sai q trình Yt khơng đổi theo thời gian Ta xét chuỗi số VNIndex từ ngày 2/1/2009 đến ngày 31/12/2010 có đồ thị theo thời gian sau: Hình 1.3.1: Đồ thị VNIndex theo thời gian VNINDEX 700 600 500 400 300 200 50 100 150 200 250 300 350 400 450 500 Nhìn vào đồ thị VNIndex theo thời gian ta thấy trung bình có xu hướng tăng giảm theo thời kỳ Như vậy, suy đốn điều kiện bị vi phạm VNIndex chuỗi không dừng Phương pháp cho ta nhìn trực quan, đánh giá ban đầu tính dừng chuỗi thời gian Tuy nhiên, với chuỗi thời gian có xu hướng khơng rõ ràng, phương pháp trở nên khó khăn đơi khơng xác 1.3.2 Dựa lược đồ tương quan 1.3.2.1 Tự tương quan Một cách kiểm định đơn giản tính dừng dùng hàm tự tương quan (ACF) ACF với độ trễ k, ký hiệu ρk, xác định sau: Nếu vẽ đồ thị ρk theo k, ta lược đồ tương quan tổng thể Tuy nhiên, thực tế chưa có tổng thể mà có mẫu Khi ta xây dựng hàm tự tương quan mẫu với: Trường hợp mẫu có khích thước nhỏ mẫu số n-k-1 n-1 Đồ thị thể ρk độ trễ k gọi lược đồ tương quan mẫu Bartlett chuỗi ngẫu nhiên dừng, hệ số tự tương quan mẫu có phân phối xấp xỉ chuẩn với kỳ vọng toán phương sai 1/n, với n lớn ~ N(0, 1/n) Ta cần kiểm định giả thiết: H0: ρk = H1: ρk ≠ (chuỗi dừng) Nếu (-Z/2/ n , Z/2/ n ) chấp nhận giả thiết H với mức ý nghĩa  Giá trị số Z tra bảng tính tốn sẵn Với độ tin cậy 95%, khoảng tin cậy ρ k VNIndex 1,96/ 0.087 Nếu 504 = (-0,087; +0,087) ta chấp nhận giả thiết H 0, ngược lại, không thuộc khoảng này, ta bác bỏ H0 (với mức ý nghĩa 5%) Sử dụng phần mềm EViews ta có bảng kết hàm ACF lược đồ tương quan VNIndex với 20 độ trễ sau: Bảng 1.3.2: Lược đồ tương quan kết kèm chuỗi VNIndex Khoảng tin cậy 95% (Vào View/Correlogram … , xác định biểu đồ tự tương quan chuỗi gốc hay chuỗi sai phân bậc một, bậc hai, cuối xác định độ trễ k) Có thể thấy toàn ρ k ACF 30 độ trễ khác có ý nghĩa thống kê Như vậy, VNIndex chuỗi không dừng Một cách trực quan ta nhận định dựa lược đồ tương quan, đồ thị có xu hướng giảm chậm, tương đối dặn theo độ trễ chuỗi khơng dừng Ngược lại đồ thị giảm nhanh, ngẫu nhiên, không theo xu hướng chuỗi dừng 1.3.2.2 Tự tương quan riêng Các hệ số tự tương quan ρk (k≥2) phản ánh mức độ kết hợp tuyến tính Yt Yt+k Tuy nhiên, mức độ kết hợp hai biến cịn số biến khác gây Trong trường hợp ảnh hưởng từ biên Y t-1…Yt-k+1 Do để đo độ kết hợp riêng rẽ Yt Yt-k ta sử dụng hàm tương quan riêng PACF với hệ số tương quan riêng ρkk ước lượng theo công thức đệ quy Durbin: Nếu chuỗi dừng có phân phối chuẩn N(0,1/n) Do đó, kiểm định giả thiết ρkk tương tự với ρk 1.3.2.3 Kiểm định đồng thời  Box – Pierce đưa kiểm định đồng thời không hệ số tương quan: H0: ρ1=ρ2=…=ρm=0 H1: tồn ρk=0 Giả thiết H0 kiểm định thống kê Với n: kích thức mẫu, m: độ dài trễ Q ~ Bác bỏ H0 Q >  Một dạng khác Q thống kê Ljung-Box (LB): Với Bác bỏ H0 LB > Thống kê LB xem tốt với mẫu số nhỏ so với thống kê Q Với Eviews, ta dễ dàng có giá trị LB với độ trễ khác (cột Q-Stat) xác suất nhỏ để giả thiết H0 bị bác bỏ (cột Prob)  Xem xét hình 1.3.2, ta kết luận tổng thể VNIndex chuỗi thời gian khơng có tính dừng 1.3.3 Kiểm định nghiệm đơn vị (Unit root test) 1.3.3.1 Nhiễu trắng: Một Ut đáp ứng đầy đủ giả thiết mơ hình hồi quy tuyến tính cổ điển, tức có kỳ vọng khơng, phương sai khơng đổi hiệp phương sai không gọi nhiễu trắng 1.3.3.2 Bước ngẫu nhiên Nếu Yt = Yt-1+Ut với Ut nhiễu trắng, Yt gọi bước ngẫu nhiên Ta có: Y1=Y0+U1 Y2=Y1+U2=Y0+U1+U2 Yt=Y0+U1+U2+…+Ut Do Y0 số, Ui độc lập với nhau, phương sai không đổ σ nên: Var(Yt)=tσ2 (thay đổi theo t) Điều chứng tỏ Yt chuỗi không dừng 1.3.3.3 Kiểm định nghiệm đơn vị Dickey – Fuller Xét mô hình Yt = ρYt-1+Ut với Ut nhiễu trắng Nếu ρ=1 Yt bước ngẫu nhiên khơng dừng Do để kiểm định tính dừng Yt ta kiểm định giả thiết: H0: ρ=1 (chuỗi không dừng) H1: ρ≠1 Ở ta sử dụng kiểm định t Yt chuỗi khơng dừng Trong trường hợp ta sử dụng tiêu chuẩn kiểm định DF sau: Phân phối theo quy luật DF Nếu ta bác bỏ giả thiết H0 kết luận chuỗi dừng Tiêu chuẩn DF áp dụng cho mơ hình sau: (1) (2) (3) Với giả thiết H0: γ=0 (chuỗi dừng) Nếu Ut tự tương quan, ta cải biên mơ hình (3) thành mơ hình: (4) Tiêu chuẩn DF áp dụng cho mơ hình (4) gọi tiêu chuẩn mở rộng Dickey – Fuller (ADF) Để tiến hành kiểm định nghiệm đơn vị Eviews ta chọn View/Unit Root Test …, xuất hộp thoại Unit Root Test Ta có lựa chon tương ứng với dạng phương trình mục Include in test equation:  Intercept: dùng phương trình (2)  Trend and intercept: dùng phương trình (3)  None: dùng phương trình (1),  Trend and intercept xác định độ trễ lựa chọn Lag length: dùng phương trình (4) Kết kiểm định chuỗi VNIndex Eviews cho ta kết sau: Hình 1.3.4: Kết kiểm định nghiệm đơn vị chuỗi VNIndex Ta có ‫׀‬1,86 = ‫ ׀‬nhỏ tất giá trị ‫׀‬0,01 ‫׀‬, ‫׀‬0,05 ‫ ׀‬và ‫׀‬0,1‫ ׀‬nên ta chấp nhận giả thiết H0: ρ=1 tức VNIndex chuỗi không dừng 1.4 Biến đổi chuỗi không dừng thành chuỗi dừng Xét bước ngẫu nhiên: Yt=Yt-1+Ut với Ut nhiễu trắng Ta lấy sai phân cấp I Yt: D(Yt)=Yt-Yt-1=Ut Trong trường hợp D(Yt) chuỗi dừng Ut nhiễu trắng Trường hợp tổng quát, với chuỗi thời gian sai phân cấp I Y t chưa dừng ta tiếp tục lấy sai phân cấp II, III… Các nghiên cứu chứng minh tồn giá trị d xác định để sai phân cấp d Y t chuỗi dừng Khi Yt gọi liên kết bậc d, ký hiêu I(d) Sai phân cấp d lấy sau:  Sai phân cấp I Yt: D(Yt)=Yt-Yt-1  Sai phân cấp II: D(D(Yt))=D2(Yt)=(Yt-Yt-1)-(Yt-1-Yt-2) …  Sai phân cấp d: D(Dd-1(Yt)) Lấy sai phân cấp I VNIndex ta đồ thị theo thời gian sau: Hình 1.4.1: Biểu đồ chuỗi sai phân cấp I VNIndex theo thời gian DVNINDEX 30 20 10 -10 -20 -30 50 100 150 200 250 300 350 400 450 500 Lược đồ tương quan Hình 1.4.2: Lược đồ tương quan chuỗi sai phân cấp I VNIndex Hầu hết hệ số tương quan khác khơng có ý nghĩa thống kê, lược đồ tương quan giảm nhanh sau độ trễ thứ khơng có xu hướng định Và kết kiểm định Nghiệm đơn vị: Hình 1.4.1: Kết kiểm định nghiệm đơn vị chuỗi sai phân VNIndex Từ kết kết luận sai phân bậc VNIndex chuỗi dừng Như vậy, để biến chuỗi dừng thành chuỗi dừng ta áp dụng phương pháp lấy sai phân, thông thường chuỗi dừng sai phân cấp I cấp II Quá Trình Tự Hồi Quy (AR), Trung Bình Trượt (MA) Mơ Hình ARIMA 10 Nếu chuỗi thời gian có tính dừng, tn theo nhiều q trình khác nhau: 2.1 Quá trình Tự Hồi Quy (AR) Nếu chuỗi thời gian tn theo mơ hình: Với Y chuỗi dừng Ut nhiễu trắng, ta nói Y tuân theo trình Tự hồi quy bậc p Ký hiệu AR(p) 2.2 Quá trình Trung Bình Trượt (MA) Nếu chuỗi thời gian tn theo mơ hình: Với Y chuỗi dừng Ut nhiễu trắng, ta nói Y tn theo q trình Trung bình trượt bậc q Ký hiệu MA(q) 2.3 Quá trình Trung bình trượt kết hợp Tự hồi quy (ARMA) Tất nhiên, có nhiều khả Y có đặc điểm AR MA, ta nói Y tn theo q trình Trung bình trượt kết hợp Tự hồi quy Ký hiệu ARMA(p,q) Một q trình ARMA(p,q) có p số hạng tự hồi quy q số hạng trung bình trượt sau: Yt =  + [αα1Yt -1 +…+ αpYt -p] + [α1Ut-1 +…+ qUt-q ]+ Ut 2.4 Quá trình Trung bình trượt, Đồng liên kết, Tự hồi quy (ARIMA) Một chuỗi thời gian tn theo nhiều mơ hình khác nhau, nhiên, ba mơ hình địi hỏi chuỗi thời gian phải có tính dừng Nhưng thực tế, tồn nhiều chuỗi thời gian không dừng Vậy làm cách để ứng dụng mơ hình thực tế? Câu trả lời dùng phương pháp lấy sai phân để biến đổi chuỗi thời gian không dừng thành chuỗi dừng trước áp dụng mơ hình ARMA Nếu chuỗi thời gian dừng sai phân bậc d, ta nói chuỗi liên kết bậc d Ký hiệu I(d) Kế hợp với q trình ARMA ta có mơ hình Trung bình trượt, Đồng liên kết, Tự hồi quy ARIMA(p,d,q) với p số hạng tự hồi quy q số hạng 11 trung bình trượt, cần lấy sai phân bậc d đề chuỗi dừng Phương trình tổng quát sau: Dd(Yt ) =  + [αα1 Dd(Yt -1) +…+ αp Dd(Yt -p)] + [α1Ut-1 +…+ qUt-q ]+ Ut Như vậy, xác định giá trị p, d, q ta mơ hình hóa chuỗi Đồng thời ta dễ dàng nhận ra, mơ hình ARIMA sử dụng giá trị q khứ thân hồn tồn khơng sử dụng thêm biến độc lập khác Đây triết lý “hãy để liệu tự nói” III Phương Pháp Luận BOX-JENKINS (BJ) Một câu hỏi lớn đặt mơ hình ARIMA làm xác định giá trị p, d, q xác định mơ hình phù hợp? Box-Jenkins đưa phương pháp để xác định mơ hình qua bước: NHẬN DẠNG ƯỚC LƯỢNG KIỂM TRA DỰ BÁO Bước 1: Nhận Dạng (xác định giá tri p, d, q)  d: Đơn giản số lần lấy sai phân để chuỗi dừng, dừng chuỗi gốc d=0 Với chuỗi liệu VNIndex chúng ta, thấy trên, chuỗi dừng sai phân bậc I, ta có d=1 Tuy nhiên, qua q trình thực nghiệm, chúng tơi nhận thấy lấy ln chuỗi liệu trước thực bước sau cho mơ hình phù hợp Đây công việc bước 3, để tránh thời gian, xin phép thực việc lấy ln trước 12 Để tạo chuỗi ln VNIndex, ta vào Genr, khung Enter equation nhập logvnindex=log(vnindex) Kiểm định nghiệm đơn vị chuỗi cho ta d=1  p: Công cụ chủ yếu để xác định p,q dựa Lược đồ tương quan Tương quan riêng phần chuỗi biến đổi thành chuỗi dừng Trong trường hợp chuỗi sai phân bậc I chuỗi log(vnindex) Để xác định p, BJ đưa phương pháp nhận dạng sau: chuỗi dừng tự tương quan bậc p nếu:  Các hệ số tự tương quan giảm từ từ theo dạng mũ hình sin  Các hệ số tương quan riêng phần giảm đột ngột xuống giá tri có nghĩa sau độ trễ p Một số dạng hình học tiêu biểu mơ hình AR(1) sau: 13 Mơ hình AR(2): Ta quan sát đồ thị tự tương quan tương quan riêng phần sai phân bậc I chuỗi log(vnindex): Dễ thấy, đồ thị tương quan riêng phần, tồn bốn hệ số khác có nghĩa độ trễ 1,2,4 10, sau độ trễ 2,4,10 hệ số tương quan riêng phần giảm đội ngột giá trị có nghĩa Đồng thời 14 đồ thị tự tương quan giảm theo hình sin Như vây, p mang giá trị: 2, 10  q: Tương tự cách xác định p, nhiên đổi vai trò hệ số tương quan tương quan riêng phần Một chuỗi dừng trung bình trượt bậc q nếu:  Các hệ số tương quan riêng phần giảm từ từ theo dạng mũ hình sin  Các hệ số tự tương quan giảm đột ngột xuống giá tri có nghĩa sau độ trễ q Quan sát đồ thị tự tương quan tương quan riêng phần sai phân bậc I chuỗi log(VNIndex) ta nhận thấy q mang giá tri: 1, 5, 10 13  Như ta có mơ hình ARIMA(p,1,q) với:  p  {2,4,10}  q  {1,5,10,13} Bước 2: Ước lượng Để ước lượng hệ số mơ hình, đơi ta thực phương pháp bình phương tối thiểu, có trường hợp phải sử dụng phương pháp ước lượng phi tuyến Ngày nay, với trợ giúp phần mềm thống kê, ta dễ dàng thực điều Giả sử ta ước lượng mơ hình ARIMA(4,1,10) có chặn Trong Eviews ta thực sau: 15 Ta kết quả: Với phương trình: Đặt Zt= D1(lnYt ) Zt = 0.0009 – 0.14Zt -1 – 0.01Zt -2 – 0.81Zt -4 + 0.37Ut-1 +0.92Ut-4 + 0.26Ut-5 – 0.05Ut-10 + Ut Bước 3: Kiểm tra Để kiểm tra tính phù hợp mơ hình ta kiểm tra xem phần dư mơ hình có phải nhiễu trắng hay không? Trong Eviews, sau ước lượng xong mơ hình ta thực hiện: 16 Ta kết quả: Có thể thấy, ngoại trừ độ trễ 3, hệ số tương quan tương quan riêng phần có nghĩa Như vậy, nói phần dư mơ hình nhiễu trắng mơ hình phù hợp Nếu mơ hình khơng phù hợp ta quay lại bước Tuy nhiên, chuỗi liệu phù hợp với nhiều mơ hình ARIMA khác nhau, cần thử nhiều mơ hình để chọn mơ hình phù hợp Đó lý phương pháp lập mơ hình ARIMA Box-Jenkins xem nghệ thuật nhiều khoa học Cần phải có kỹ tốt để lựa chọn mơ hình ARIMA thích hợp Thơng thường, ta dựa tiêu chuẩn: Log likelihood (càng lớn tốt), Akaike, Schwarz (càng nhỏ tốt) hay so sánh với liệu khứ để lựa chọn mơ hình thích hợp Với ví dụ chúng ta, thực kiểm tra, so sánh nhiều mơ hình nhận thấy mơ hình ARIMA(4,1,10) dường phù hợp 17 Bước 4: Dự báo Một số lý tính phổ biến phương pháp lập mơ hình ARIMA thành cơng dự báo Trong nhiều trường hợp, dự báo thu từ phương pháp tin cậy so với dự báo từ phương pháp lập mơ hình kinh tế lượng truyền thống, đặc biệt dự báo ngắn hạn Tất nhiên, trường hợp phải kiểm tra cụ thể Để dự báo Eviews trước tiên ta mở rộng liệu: Nhập lượng liệu cần thiết khung Data range Tại cửa số Forecast hàm cần dự báo, ta chọn khoảng dự báo, ví dụ ta dự báo từ giá trị 505 đến 508: 18 Mở chuỗi VNIndexF, ta có kết dự báo giá trị cuối chuỗi, từ 505 đến 508 So sánh với giá trị thực tế ta có chênh lệch: Ngày Thực tế Dự báo Sai số 1/4/2011 486.0 485.3 0.14% 1/5/2011 481.9 483.7 0.37% 1/6/2011 482.3 481.1 0.25% 1/7/2011 481.9 483.6 0.35% Với độ tin cậy 95% dự báo chấp nhận đươc Với tính linh hoạt, tiết kiệm khả dự báo tốt, mơ hình ARIMA sử dụng rộng rãi toàn giới, nhiên, cần có xem xét cẩn thận trường hợp để đạt kết tốt 19 ... phần dư mơ hình nhiễu trắng mơ hình phù hợp Nếu mơ hình khơng phù hợp ta quay lại bước Tuy nhiên, chuỗi liệu phù hợp với nhiều mơ hình ARIMA khác nhau, cần thử nhiều mơ hình để chọn mơ hình phù... mơ hình thích hợp Với ví dụ chúng ta, thực kiểm tra, so sánh nhiều mơ hình nhận thấy mơ hình ARIMA( 4,1,10) dường phù hợp 17 Bước 4: Dự báo Một số lý tính phổ biến phương pháp lập mơ hình ARIMA. .. giảm từ từ theo dạng mũ hình sin  Các hệ số tương quan riêng phần giảm đột ngột xuống giá tri có nghĩa sau độ trễ p Một số dạng hình học tiêu biểu mơ hình AR(1) sau: 13 Mơ hình AR(2): Ta quan sát

Ngày đăng: 12/11/2022, 23:53

Xem thêm:

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w