Kết hợp các dự báo và các phƣơng pháp dự báo

Một phần của tài liệu Dự báo các chỉ tiêu thống kê xã hội và các phương pháp dự báo các chỉ tiêu thống kê xã hội (Trang 38 - 46)

0, (30) bao gồm các giá trị dự đoán của tất cả các biến nội sinh h thời kỳ về sau Mức h0 phụ thuộc chủ

2.5. Kết hợp các dự báo và các phƣơng pháp dự báo

2.5.1. Giới thiệu

Trong những năm gần đây, trong những người sử dụng các dự báo kinh tế (đặc biệt là các dự báo kinh tế lượng vĩ mô) xuất hiện khuynh hướng kết hợp các dự báo này. Trong cách tiếp cận này, dự báo cuối cùng thu được bằng cách đánh trọng số mỗi trong một số dự báo từ các nguồn khác nhau: F* =  1F 1 +  2F 2 + … +  mF m, (49)

ở đây F* là dự báo cuối cùng của người sử dụng, Fi, i=1,2,…,m là những dự báo riêng lẻ được kết hợp (m cả thảy), và các i là các trọng số gán cho các dự báo riêng. (Nói chung, đòi hỏi rằng

tổng của các trọng số, i, bằng 1.) Granger và các đồng tác giả với ông đã chỉ ra rằng nếu ta có

kiến thức tốt về các phương sai và hiệp phương sai trong số các dự báo riêng lẻ (và nếu các dự báo này là không chệch) thì có thể chọn các trọng số trên cơ sở kiến thức này để cực tiểu hoá

phương sai của sai số dự báo (tương đương với sai số bình phương trung bình của nó trong khung cảnh này). Nói chung, ta có các kết quả trực quan: các dự báo quá khứ thể hiện có sai số dự báo bình phương trung bình nhỏ (nghĩa là độ chính xác cao) thu được các trọng số lớn. Trong một số trường hợp, sự giảm trong phương sai của sai số dự báo của F* so với của các thành phần của nó có thể là căn bản. Nếu không phải tất cả các dự báo riêng lẻ là không chệch, sản sinh ra dự báo có trọng số cuối cùng bằng một phép hồi quy bội có thể là thuận tiện hơn. Như vậy, nếu có các số liệu về các dự báo (quá khứ) và các giá trị thực hiện của chúng, ta có thể chạy phép hồi quy: y t =  0 +  1F 1t + … +  m F mt +  t, t=1,2,…,T. (50) Ở đây chỉ số t chỉ thời gian của quan sát; như thường lệ, có một mẫu T quan sát về các dự báo quá khứ và thực hiện của chúng (các yt). Như thường lệ, biến ngẫu nhiên t là một nhiễu ngẫu nhiên. Với việc ước lượng các tham số của phép hồi quy này, dự báo (kết hợp) cuối cùng trở thành: F* T+1 = ˆ0 + ˆ1F 1,T+1 + … +ˆ Fm m,+1, (51) Số hạng hằng số có thể đặt bằng 0 và tổng các trọng số trong (51) có thể đặt bằng 1, nhưng không nhất thiết. Thực tế, với các dự báo chệch, một điều chỉnh không ràng buộc của các hệ số (cho phép số hạng hằng số khác 0) có thể đáng mong muốn.

Nếu ta nghi ngờ tính ổn định của cấu trúc của độ chính xác tương đối của các dự báo riêng lẻ nhưng vẫn muốn kết hợp các dự báo như vậy, người ta gợi ý một trung bình không có trọng số giản đơn (hay trọng số bằng nhau) của các dự báo riêng lẻ. Trung bình giản đơn của các dự báo kinh tế vĩ mô của nền kinh tế Mỹ đã được sử dụng trong cuộc khảo sát các chỉ tiêu kinh tế Chip

xanh với các kết quả tốt. Thực tế, các dự báo trung bình ASA-NBER hay đự báo thống nhất ý

kiến thảo luận là một trung bình không có trọng số như vậy của các dự báo riêng lẻ; nói chung, các dự báo này chính xác hơn so với các dự báo của các nhà dự báo riêng lẻ điển hình. Như vậy, trong một bài toán cụ thể, người sử dụng dự báo có nhiều hơn một dự báo của một biến (hay tập hợp các biến) phải quyết định có kết hợp các dự báo hay không và nếu kết hợp thì sử dụng các trọng số nào trong tổ hợp.

Việc kết hợp các dự báo riêng lẻ, với các kết quả nói chung cải thiện độ chính xác, gợi ý khả năng kết hợp các cách tiếp cận đối với dự báo kinh tế. Trong lĩnh vực dự báo kinh tế vĩ mô,

Pyndyck và Rubinfeld đã gợi ý rằng người ta có thể muốn kết hợp việc mô hình hoá kinh tế lượng vĩ mô truyền thống với cách tiếp cận ARIMA đối với các nhiễu ngẫu nhiên của phương trình cấu trúc. Pyndyck và Rubinfeld nghiên cứu hối phiếu kho bạc ba tháng với ý định cung cấp những dự đoán tốt về biến tài chính này. Hai người đã thấy rằng một mô hình hồi quy trong đó các nhiếu ngẫu nhiên sau đó được lấy đưa vào một quá trình ARIMA cho những dự đoán xuất sắc, chúng tốt hơn nhiều so với những dự đoán của mô hình hồi quy trực tiếp hoặc một phân tích ARIMA giản đơn riêng rẽ. Điều lý thú là, trong khi trước đây người ta phải ước lượng các tham số của phương trình hồi quy, tính các phần dư mẫu và rồi áp dụng phân tích ARIMA, thì ngày nay tất cả các tham số của hệ thống (cả của phương trình hành vi lẫn của quá trình ARIMA) có thể ước lượng đồng thời. Điều này dẫn tới một sự cải thiện quan trọng trong độ chính xác của dự báo, do đó cách tiếp cận này tỏ ra có hứa hẹn lớn.

Cuối cùng, một cách tiếp cận khác trong kỹ thuật kết hợp là hợp nhất các dự báo từ mô hình kinh tế lượng vĩ mô tháng với những dự báo từ mô hình kinh tế lượng quý. Nói đại thể, vấn đề là như sau: các số liệu tháng (gọi là số liệu “tần số cao”) là sẵn có nhanh chóng nhưng nói chung không đầy đủ bằng các tổng gộp theo quý (hoặc năm). Theo đó, các mô hình quý có thể toàn diện và chính xác hơn nhiều nhưng các dự đoán rất ngắn hạn của chúng kém kịp thời hơn. Như vậy, người ta cố gắng hợp nhất hai tập hợp dự báo để lợi dụng sức mạnh của mỗi tập hợp. Như ta có thể tưởng tượng, một sự hợp nhất hoặc kết hợp các dự báo riêng rẽ từ một mô hình quý và một mô hình tháng của cùng một hiện tượng là không đơn giản, và Corrado và Green và cả Howrey đã thảo luận chi tiết một số vấn đề kỹ thuật này. Nói chung, Corrado và Green tiếp cận vấn đề như một cải biên các nhân tố bổ sung trong các dự báo quý để tính đến các thông tin bổ trợ thêm mà mô hình tháng cung cấp, trong khi Howrey dường như tiếp cận vấn đề như một trong những kết hợp tối ưu thu được của các dự báo riêng rẽ của cùng một hiện tượng. Trong mọi trường hợp, cả hai nhóm tác giả cho thấy rằng bằng kỹ thuật này có thể thu được những kết quả to lớn trong độ chính xác của dự báo, ít nhất đối với một số biến quan tâm, đối với những dự báo rất ngắn hạn, tức là những dự báo đối với các chỉ tiêu kinh tế gộp một quý sau, kể cả những dự báo của quý hiện tại chưa kết thúc. Thêm nữa, phải thừa nhận rằng, các kết quả của Corrado và Green gợi ý rằng những kết quả trong độ chính xác của dự báo nhanh chóng tiêu tan khi tầm dự báo kéo dài ra. Tuy nhiên, cả Howrey lẫn Corrado và Green đều cho rằng kỹ thuật này đủ hứa hẹn để đảm bảo nghiên cứu tương lai chuyên sâu.

2.5.2 Sử dụng kiểm định bao để kết hợp dự báo

Kết hợp dự báo thường được dùng để cải thiện tính chính xác của dự báo. Một kết hợp tuyến tính của hai hoặc nhiều kết quả dự báo thường cho chúng ta kết quả dự báo chính xác hơn so với việc sử dụng duy nhất một kết quả dự báo nếu như các phương pháp dự báo thành phần có chứa đựng những thông tin riêng và hữu ích (Newbold và Harvey, 2002). Có hai cách sau để tạo

ra các dự báo độc lập. Cách thứ nhất là xem xét các dữ liệu khác nhau, và cách thứ hai là sử dụng các phương pháp dự báo khác nhau. Một mặt, việc sử dụng các nguồn dữ liệu khác nhau có thể bổ sung thêm thông tin và có thể điều chỉnh được độ chệch. Mặt khác, các phương pháp kết hợp dự báo có thể làm giảm bớt sai số do các giả định sai lầm, độ chệch, hoặc dữ liệu không chính xác. Ở đây, chúng ta sẽ đưa ra một thủ tục thuật toán để cải thiện hiệu quả của các phương

pháp kết hợp dự báo. Thuật toán dựa trên một kiểm định bao được sử dụng tương đối rộng rãi (Harvey, Leybourne, Newbold (HLN), 1998). Thay vì đánh giá dự báo, các thống kê trên được tiến hành để lựa chọn một tập con các dự báo được kết hợp. Theo thủ tục này, các mô hình dự báo trước tiên sẽ được sắp xếp dựa theo thước đo RMSE, và bước tiếp theo là lựa chọn đưa từng dự báo vào trong kết hợp chỉ khi nào nó không bị bao hàm bởi các mô hình dự báo khác. Một kiểm định bao được sử dụng để đánh giá độ vững của thủ tục chọn lựa mô hình. Một ứng dụng thực nghiệm cho mức sản xuất công nghiệp hàng tháng của Ý được đưa ra. Chúng ta sử dụng các mô hình dự báo ngắn hạn hiện đang được ISAE dùng để rút ra các kết quả dự báo cho 6 thời kỳ tiếp theo ở cả hai dạng hồi quy đệ quy và hồi quy cuộn (recursive và rolling regression). Trong phần lớn các trường hợp, dựa trên tiêu chí RMSE thì các kết quả dự báo rút ra từ thủ tục của thuật toán này tốt hơn so với những kết quả thu được bằng việc kết hợp các mô hình trên.

2.5.3. Bao hàm dự báo và RMSFE

Mục đích của phần này là xác định các mối liên hệ về mặt lý thuyết giữa hai tiêu chí được sử dụng nhiều nhất cho đánh giá dự báo, kiểm định bao hàm dự báo và cực tiểu RMSFE. Sử dụng RMSFE và các kiểm định bao mang tính chất bổ sung chứ không phải cạnh tranh bắt nguồn từ những đóng góp về lý thuyết của Ericsson (1992). Để cải thiện việc kiểm chứng khả năng dự báo của các mô hình không bị trùng lặp, tác giả đã chỉ ra rằng kiểm định bao hàm dự báo là một điều kiện đủ để có ưu thế về RMSFE, tức là cực tiểu RMSFE của một mô hình đã cho. Xuất phát điểm là chúng ta xem xét hai mô hình tuyến tính không bị trùng lặp với nhau cho cùng một biến phụ thuộc yt, nó được ước lượng trong thời kỳ mẫu [1,T]:

'1: t 1 1t 1t 1: t 1 1t 1t M y  zv (52) ' 2: t 2 2t 2t M y  zv (53)

Trong đó z1t và z2t không có các biến hồi quy thông thường và được gắn với nhau thông qua quan hệ z1t = z2t + 1t. Thay vào (52) sẽ cho chúng ta các ràng buộc sau đối với phương trình (54):   ' ' 2 1    (55) ' 2,t 1,t 1 1,t vv   (56)

Giả định rằng các dự báo từ các mô hình (52) và (53) là yˆ1j 'z1jyˆ2j 'z2j, (j = T+1,…, T+n), ràng buộc (55) (bao hàm mô hình dự báo) hàm ý rằng z2j không có khả năng giải thích sai số dự báo với z1j đã cho trước. Điều này tương đương với việc kiểm định  = 0 trong phương trình yj = ' 1  z1j + z2j + v1j. Từ ràng buộc (56), chúng ta có:  2  2 ' 2 1 1 1 ˆ ˆ j j j j E yyE yy    (57) Trong đó  2 1 ˆ j j

E yy là RMSFE của mô hình 1,  2 2

ˆ

j j

E yy là RMSFE của mô hình 2 và  = E(1j

'1j 1j

 ). Kiểm định giả thuyết này tương đương với việc kiểm định  = 0 (bao hàm dự báo) trong phương trình:

yj = t'z1j + yˆ2j + v1j (58) Theo Ericsson (1992), điều kiện đủ để điều này xảy ra là  = 0. Ngoài ra, nó còn hàm ý rằng  là ma trận xác định dương, để cho RMSFE1 < RMSFE2 (tính trội của RMSFE). Từ bàn luận trên, với các mô hình dự báo không bị bao hàm thì điều kiện đủ để cực tiểu RMSFE của một mô hình cho trước là chứng minh được nó bao hàm tất cả các mô hình khác. Điều này hàm ý rằng chúng ta sẽ thực hiện kiểm định bao hàm theo một chiều duy nhất (mô hình có RMSFE thấp nhất so với mô hình có RMSFE lớn hơn).

2.5.4. Các phương pháp bao hàm kết hợp dự báo

Tính bổ sung giữa RMSFE và kiểm định bao hàm được sử dụng để xây dựng thuật toán lựa chọn hiệu quả các dự báo không bị trùng lặp và kết hợp chúng lại. Thuật toán dùng các dự

báo ngoài mẫu ảo làm đầu vào. Ý tưởng cơ bản là so sánh tất cả các mô hình dự báo với nhau bằng cách sử dụng kiểm định bao hàm HLN để loại bỏ những mô hình bị bao hàm, và sử dụng các pp kết hợp dự báo để kết hợp các mô hình dự báo còn lại. Thuật toán bao hàm được mô tả như sau:

Bƣớc 1. Tính RMSFE của các dự báo ngoài mẫu cho từng mô hình bằng cách sử dụng dự báo ngoài mẫu và giá trị thực tế. Xếp hạng các mô hình căn cứ theo chất lượng dự báo trong quá khứ, nó được dựa theo tiêu chí RMSFE;

Bƣớc 2. Chọn ra mô hình tốt nhất (tức là mô hình có RMSFE nhỏ nhất) và lần lượt kiểm định liệu mô hình dự báo tốt nhất có bao hàm các mô hình khác không bằng kiểm định HLN. Nếu mô hình tốt nhất bao hàm mô hình khác ở một mức ý nghĩa  nào đó thì sẽ loại bỏ mô hình này ra khỏi danh mục;

Bƣớc 3. Lặp lại bước 2 với mô hình tốt thứ hai. Danh mục các mô hình lúc này không còn mô hình tốt nhất và những mô hình bị mô hình tốt nhất bao hàm.

Bƣớc 4. Tiếp tục với mô hình tốt thứ ba, và cứ tiếp tục như vậy cho tới khi không còn mô hình bị bao hàm nào trong danh mục;

Bƣớc cuối. Xác định dự báo kết hợp của thuật toán này (ACF) bằng cách sử dụng các pp kết hợp dự báo với tất cả các mô hình đã được chọn lựa lúc trước.

Đối với ứng dụng thực nghiệm, một số vấn đề sau cần được giải quyết.

Thứ nhất, một tập hợp dự báo ngoài mẫu ban đầu gồm 24 quan sát được xem xét áp dụng kiểm định HLN. Harvey (1998) đã xây dựng một kiểm định giả thuyết gốc về bao hàm dự báo bằng cách sử dụng kiểm định về tính chính xác tương đương nhau mà Diebold (1995) và Harvey (1998) đã mô tả.

Thứ hai, trong ứng dụng thực nghiệm của chúng ta, chúng ta xem xét một số mức ý nghĩa  của kiểm định HLN: 0.01, 0.05, 0.10, 0.15, 0.20, 0.25.

Thứ ba, một kiểm định bao hàm F-test (Harvey và Newbold, 2000) đã được áp dụng để chứng tỏ tính vững của thủ tục lựa chọn mô hình dựa trên kiểm định bao hàm HLN. Kiểm định F-test sẽ khẳng định liệu mô hình tốt nhất có bao hàm tất cả các mô hình cạnh tranh khác hay không trong từng bước của thủ tục.

Thứ tư, một số pp kết hợp dự báo được sử dụng. Tất cả các pp kết hợp có dạng kết hợp tuyến tính của các dự báo cá biệt:

, | 0, , , | 1 ˆh n ˆh c t h t t i t i t h t i y    y     (59) Trong đó ˆh, | c t h t

y  là dự báo kết hợp đã cho với các trọng số {i,t}in0 được tính bằng cách sử dụng dự báo cá biệt ngoài mẫu, n là số mô hình và h là trục thời gian dự báo. Cụ thể, chúng ta xem xét:

a. Ba phương pháp kết hợp giản đơn: trung bình, trung vị, và trung bình có chọn lọc. Trong phương pháp trung bình, chúng ta cho 0,t = 0 và i,t = 1

n với i = 1,…,n trong phương

trình (10); đối với phương pháp trung vị, chúng ta sử dụng trung vị của mẫu là ˆh, |n1

i t h t iyy

 ; đối với phương pháp trung bình có chọn lọc, chúng ta sử dụng 0,t = 0 và i,t = 0 cho các đối với phương pháp trung bình có chọn lọc, chúng ta sử dụng 0,t = 0 và i,t = 0 cho các mô hình cá biệt tạo ra giá trị dự báo nhỏ nhất và lớn nhất tại thời điểm t, các trường hợp còn lại i,t = 1

2

n ;

b. Phương pháp kết hợp OLS không ràng buộc (xem Granger và Ramanathan, 1984). Các trọng số kết hợp được tính toán bằng cách sử dụng hồi quy OLS;

c. Phương pháp kết hợp WLS do Diebold (1987) đưa ra. Chúng ta áp dụng phương pháp “t- lambda”. Nó bao gồm một phương pháp kết hợp với các trọng số được tính theo hệ số

Một phần của tài liệu Dự báo các chỉ tiêu thống kê xã hội và các phương pháp dự báo các chỉ tiêu thống kê xã hội (Trang 38 - 46)

Tải bản đầy đủ (PDF)

(67 trang)