Giới thiệu khái qt mơ hình VAR

Một phần của tài liệu (LUẬN án TIẾN sĩ) phân tích thống kê dự báo và mô phỏng một số chuỗi thời gian 62 46 15 01 (Trang 144)

Mơ hình VAR

Một mơ hình VAR cơ bản có dạng sau:

yt = A1yt−1 +...+Apyt−p+ B0xt +...+Bqxt−q +CDt +ut, (5.1) trong đó

yt = (y1t, ..., yKt)0

là một K véc-tơ các biến nội sinh quan sát được,xt = (x1t, ..., xM t)0 là một M véc-tơ các biến ngoại sinh quan sát được, Dt chứa các biến tất định như các hằng số, xu thế, các biến giả đặ trưng cho mùa vụ cũng như các biến giả khác do người dùng định nghĩa, ut là quá trình nhiễu trắng K chiều với kỳ vọng 0 và ma trận hiệp phương sai xác định dương E utu0t= P

u. Các ma trận Ai, Bj, C là các ma trận tham số với số chiều K.

Xây dựng và ước lượng mơ hình VAR

Vì mơ hình VAR có thể nói rất hữu hiệu trong dự báo nên ta sẽ sử dụng nó cho dự báo lạm phát ở Việt Nam vì vậy chúng ta cũng sẽ trình bày khái quát cách xây dựng và ước lượng mơ hình VAR. Quy trình ước lượng một mơ hình VAR bao gồm các bước sau:

(1). Kiểm định tính dừng của các chuỗi trong mơ hình. Nếu các chuỗi là khơng dừng ta sẽ kiểm tra quan hệ đồng tích hợp và nếu có quan hệ đồng tích hợp thì chuyển sang mơ hình VECM, nếu khơng có quan hệ đồng tích hợp thì thực hiện các phép biến đổi để chuyển các chuỗi thành các chuỗi dừng.

(2). Chọn độ dài trễ: Về mặt kỹ thuật chúng ta cần phải đưa độ trễ đủ lớn vào mơ hình để triệt tiêu sự tự tương quan trong phần dư. Tuy nhiên việc đưa thêm một trễ vào mơ hình sẽ làm gia tăng thêm k ∗k hệ số cần ước lượng (k là số biến nội sinh trong mơ hình). Trong thực tế, chúng ta thường bắt đầu bằng việc lựa chọn một độ dài trễ khá lớn, sau đó dùng các tiêu chuẩn dưới đây để lựa chọn độ dài thích hợp.

Bậc trễ tối ưu được chọn bằng cách cực tiểu hóa một trong các tiêu chuẩn thơng tin sau đây:

AIC(n) = log det( ˜P

u(n)) + T2nK2, HQ(n) = log det( ˜P u(n)) + 2 log logT TnK2, SC(n) = log det( ˜P u(n)) + 2 logT TnK2, F P E(n) = TT+n−n∗∗K det( ˜P u(n)), Trong đóP˜

u(n)được ước lượng bởi T−1PTt=1uˆtuˆ0t,n∗ là tổng số các tham số trong từng phương trình. Có thể mỗi tiêu chuẩn khác nhau sẽ lựa chọn các mơ hình khác nhau. Khi đó chúng ta tiếp tục q trình để lựa chọn ra mơ hình có khả năng dự báo tốt nhất.

(3). Kiểm định mơ hình và giản lược mơ hình

• Kiểm tra tính ổn định về mặt thống kê của mơ hình, nghĩa là kiểm tra xem nếu có nghiệm lớn hơn hoặc bằng 1 thì mơ hình khơng ổn định. • Kiểm định về phần dư của mơ hình: các kiểm định về tự tương quan của phần dư xem phần dư có tự tương quan hay khơng vì nếu phần có

tự tương quan nghĩa là mơ hình chưa tách hết được những quy luật chứa trong dữ liệu và kiểm định phương sai sai số thay đổi.

• Giản lược mơ hình: Kết quả ước lượng của mơ hình (sau khi đã kiểm định tốt) cho ta thơng tin thống kê về vai trị của trễ các biến trong hệ phương trình. Do đó chúng ta sẽ dùng thông tin này để kiểm định xem một số trễ có ý nghĩa thống kê hay khơng và đưa ra quyết định có nên loại bỏ tồn bộ một biến hay một số biến ra khỏi một phương trình nào đó khơng. Cịn kiểm định loại trừ trễ cho biết có nên bỏ bớt đi trễ nào đó của các biến trong một phương trình hay khơng.

• Kiểm định tính ổn định của các tham số của mơ hình. • Sau khi đã có mơ hình tốt ta có thể phân tích và dự báo. 5.1.2 Giới thiệu về lập trình Gen

Lập trình Gen (Genetic Programming - GP) mơ phỏng q trình tiến hóa theo thuyết tiến hóa sinh học của Darwin. Giả sử ta có một tổng thể các nhiễm sắc thể, trong đó một nhiễm sắc thể là một nghiệm đề cử cho bài toán mà chúng ta cần giải. Nhiễm sắc thể là một thuật ngữ được mượn từ các khái niệm sinh học, cũng giống như trong sinh học nhiễm sắc thể trong giải thuật này đóng vai trị là thành tố quyết định đến độ tốt của một cá thể. Trong sinh học, nhiễm sắc thể là một cấu trúc có tổ chức của ADN và protein nằm trong các tế bào. Đó là một phần đơn lẻ của chuỗi ADN, có chứa nhiều gen, cấu trúc quy định và các trình tự nucleotit khác. Nhiễm sắc thể khác nhau giữa các sinh vật khác nhau. Tế bào của mỗi lồi sinh vật khác nhau thì có bộ nhiễm sắc thể khác nhau, đặc trưng về số lượng và hình dạng của mỗi lồi. Trong giải thuật phỏng tiến hóa sinh học ta đồng nhất một cá thể với NST tương ứng, mỗi một hàm( công thức) dự báo được mô tả như là một NST và được biểu diễn dưới dạng một cây. Mỗi nốt trên cây là một hàm tính tốn cịn mỗi lá trên cây là một toán hạng, đây là cách biểu diễn một biểu thức toán học đơn giản dễ tiến hóa và lượng giá. Gắn với mỗi cây là một giá trị phù hợp (Fitness), nó sẽ xác định độ tốt của cây đó. Giá trị phù hợp này được xác định bằng một hàm

Hình 5.1: Tốn tử lai ghép

phù hợp, chúng ta có thể coi như là một thước đo về độ chính xác của cơng thức mà chúng ta sẽ dùng để dự báo.

Các toán tử trong GP

GP gồm có ba tốn tử cơ bản là lai ghép, đột biến, và chọn lọc tự nhiên ta gọi các toán tử này là các phép tốn Gen.

Tốn tử lai ghép

Q trình này diễn ra bằng cách ghép một hay nhiều đoạn gen từ hai nhiễm sắc thể cha-mẹ để hình thành nhiễm sắc thể mới mang đặc tính của cả cha lẫn mẹ. Phép lai này có thể mơ tả như sau:

• Chọn ngẫu nhiên ở mỗi cây bố mẹ một nốt • Hốn đổi vị trí của hai nốt được chọn cho nhau.

Tốn tử đột biến

Q trình tiến hóa được gọi là q trình đột biến khi một hoặc một số tính trạng củacon không được thừa hưởng từ hai chuỗi nhiễm sắc thể cha-mẹ.

Hình 5.2: Tốn tử đột biến

Phép đột biến xảy ra với xác suất thấp hơn rất nhiều lần so với xác suất xảy ra phép lai. Phép đột biến có thể mơ tả như sau:

• Chọn một nốt bất kì trên cây cha (mẹ) • Xóa cây con thuộc nốt được chọn

• Sinh ngẫu nhiên một cây con mới vào vị trí trên.

Tốn tử chọn lọc tự nhiên Là q trình loại bỏ các cá thể xấu và để lại những cá thể tốt. Phép chọn được mơ tả như sau:

• Sắp xếp quần thể theo thứ tự độ thích nghi giảm dần. • Loại bỏ các cá thể cuối dãy, chỉ để lại n cá thể tốt nhất.

Q trình huấn luyện thơng qua các tốn tử di truyền chúng ta sẽ được thế hệ sau tốt hơn thế hệ trước, quá trình tạo càng nhiều thế hệ thì có khả năng dự báo càng chính xác hơn.

Các bước tiền xử lý trong GP

Như đã phân tích ở trên, để xây dựng một chương trình máy tính nhằm tạo ra một cơng thức dự báo ta cần thực hiện các bước tiền xử lý sau đây: 1. Tập các nút lá (ví dụ như các biến độc lập, các hàm không tham số, các hằng số ngẫu nhiên) cho mỗi nhánh của hàm tiến hóa.

2. Tập các hàm nguyên tố dành cho mỗi nhánh của chương trình tiến hóa. 3. Đưa ra cách đo độ tốt (fitness) (đo độ tương thích của mỗi cá nhân trong quần thể).

4. Xác định rõ về các tham số điều khiển quá trình chạy (số lượng cá thể, độ lớn của nhiễm sắc thể, xác suất biến dị. . . .)

5. Tiêu chuẩn để kết thúc hay phương pháp để xác định kết quả của quá trình chạy.

Các bước tiến hành GP

Một chương trình máy tính chạy thuật tốn phỏng tiến hóa sinh học bắt đầu chạy với một quần thể ngẫu nhiên các công thức dự báo được tạo thành từ các thành phần có thể. Sau đó GP lặp có biến đổi các quần thể thơng qua nhiều thế hệ bằng cách sử dụng các phép tốn Gen. Q trình chọn lọc gắn với việc tính độ tốt của mỗi cá thể. Khả năng một cá thể được chọn để tham gia vào các phép tốn Gen hay khơng phụ thuộc vào độ tốt của nó (cách đo độ tốt được đưa ra ở bước chuẩn bị thứ 3). Việc lặp có biến đổi của quần thể là nội dung chính và được lặp lại rất nhiều lần trong một chương trình GP. Các bước để chạy một chương trình GP: • Khởi tạo ngẫu nhiên một quần thể (thế hệ 0) các cá thể được tạo ra từ các hàm và các nút lá.

• Thực hiện lặp (tạo ra các thế hệ) theo các bước phụ sau cho đến khi điều kiện kết thúc được thỏa mãn:

- Với mỗi một cá thể trong quần thể hiện tại ta tính độ tốt của nó thơng qua hàm Fitness.

sau với một xác suất đã định. + Lai ghép, với xác suất p1 + Đột biến, với xác suất p2

Thông thườngp1 lớn hơn rất nhiều so vớip2. Ta mô phỏng biến ngẫu nhiên U có phân bố đều trên[0,1] phép tốn lai ghép được chọn nếu0 ≤U < p1, phép toán đột biến được chọn nếu p1 ≤U ≤ p1 +p2 = 1.

- Nếu phép đột biến được chọn thì ta chọn một cá thể để thự hiện phép đột biến, nếu phép lai ghép được chọn ta chọn 2 cá thể để thực hiện phép lai ghép. Các cá thể được chọn từ quần thể với xác suất phụ thuộc vào độ tốt của chúng để tham gia vào các phép toán Gen.

Ta gọi fi là độ tốt của cá thể thứ i. Trong bài tốn ta đang xét ở đây nếu fi càng nhỏ thì cá thể đó càng tốt. Đặt gi =

1−Pnfi

j=1fi

n−1 , khi đó gi là xác suất được chọn cho cá thể thứ i để tham gia các phép toán Gen.

Đặt p0 = 0, pk = k P

i=1

gi k ≥ 1, tạo biến ngẫu nhiên U có phân bố đều trên [0,1] cá thể thứ k được chọn nếu pk−1 ≤ U ≤ pk. Các các thể được chọn sẽ tham gia các phép toán Gen để tạo ra các cá thể mới. Bước này có thể được lặp lại một số lần để tạo ra nhiều cá thể mới.

- Thực hiện phép chọn lọc tự nhiên để tạo ra một quần thể mới. Mỗi một thế hệ quần thể mới được đặc trưng bởi độ tốt của cá thể tốt nhất.

Sau khi tiêu chuẩn kết thúc được thỏa mãn, cá thể tốt nhất của tất cả quá trình chạy được coi như là kết quả của quá trình chạy và nếu quá trình chạy tốt thì kết quả là lời giải (hoặc xấp xỉ lời giải) của bài toán.

5.2 Ước lượng thực nghiệm

5.2.1 Áp dụng mơ hình VAR trong dự báo lạm phát

Kết quả thực hiện các bước để lựa chọn mơ hình đã nêu trên ta chọn được mơ hình qua tất cả các kiểm định là mơ hình VAR chỉ có 3 biến gcpi (tốc độ tăng trưởng CPI so với tháng trước), gex (tốc độ tăng tỷ giá) và gm2 (tăng trưởng mức cung tiền). Mơ hình cuối cùng được đưa vào kiểm định là mơ hình sau:

ˆ gcpit (str) p t = 0gcpit−1− 0.319 (0.132) [0.106] −2.418 gext−1+ 0.696 (0.357) [0.052] 1.947 gm2t−1 − 0.291 (0.127) [0.021] −2.229 gcpit−2− 0.208 (0.128) [0.103] −1.629 gext−2+ 0.994 (0.358) [0.005] 2.779 gm2t−2 − 0.242 (0.136) [0.076] −1.774 gcpit−3+0gext−3 + 0gm2t−3 (5.2) ˆ gext (str) p t = 0gcpit−1− 0.651 (0.115) [0.000] −5.685 gext−1+0gm2t−1 −0gcpit−2− 0.559 (0.108) [0.000] −5.176 gext−2+0gm2t−4 − 0.272 (0.156) [0.008] −1.749 gcpit−3− 0.304 (0.101) [0.001] −3.369 gext−3 + 0gm2t−3 (5.3) gm2tˆ (str) p t = 0gcpit−1+ 0.076 (0.039) [0.051] 1.951 gext−1− 1.092 (0.109) [0.000] −10.057 gm2t−1 −0gcpit−2−0gext−2− 0.762 (0.118) [0.000] −6.442 gm2t−2 − 0.109 (0.050) [0.027] −2.005 gcpit−3−0gext−3 − 0.280 (0.099) [0.005] −2.828 0gm2t−3 (5.4)

Mơ hình này qua được các kiểm định tính ổn định, kiểm định tự tương quan, kiểm định phương sai sai số thay đổi.

Để dự báo lạm phát cho năm 2011, chúng tơi sử dụng mơ hình (5.2)-(5.4) ước lượng được và số liệu đến năm 2010 đưa vào mơ hình và làm thủ tục dự báo cho năm 2011. Kết quả thu được cho ở Bảng 5.1 sau:

gcpi4 forecast lowerCI upperCI +/- 2011Q1 -0.0194 -0.0689 0.0301 0.0495 2011Q2 0.0019 -0.0476 0.0514 0.0495 2011Q3 0.0025 -0.047 0.052 0.0495 2011Q4 0.017 -0.0344 0.0684 0.0514

Bảng 5.1 Kết quả dự báo tốc độ tăng lạm phát từ mơ hình cho năm 2011

Nguồn : Ước lượng từ mơ hình. Kết quả dự báo với độ tin cậy 95% với khoảng tin cậy có cận dưới (lowerCI) và cận trên (upperCI) và cột cuối cùng chỉ chênh lệch.

Bảng 5.1 chỉ cho biết tốc độ tăng của lạm phát gcpi, tốc độ tăng của tỷ giá và tốc độ tăng của cung tiền, tuy nhiên khó so sánh với lạm phát thực để biết mơ hình có phải là tốt khơng. Để làm được điều đó, chúng tơi đã tiến hành tính ngược từ tốc độ tăng để lấy lạm phát để so sánh với số liệu thực. Kết quả được cho ở Bảng 5.2 sau:

CPI(real) CPI(DB) Sai số Sai số bình phương 2011Q1 102.1700 100.0016 -0.0212 0.00045 2011Q2 101.0900 102.3641 0.0126 0.00016 2011Q3 100.8200 101.3427 0.0052 0.00003 2011Q4 101.3700 102.5339 0.0115 0.00013 Căn bậc hai của tổng bình phương các sai số 0.013856558

Bảng 5.2 So sánh giá trị của kết quả dự báo

và giá trị thực của tỷ lệ lạm phát cho CPI cho năm 2011

Nguồn : Số liệu từ tổng cục thống kê và ước lượng từ mơ hình.

Nhìn vào bảng trên ta thấy sai số căn bậc hai của trung bình bình phương của sai số dự báo là 1,38% . Q có sai số lớn nhất khơng q 3% . Điều này cho ta thấy mơ hình mà ta tìm được có chất lượng khá tốt.

Dự báo lạm phát cho năm 2012-2013

Để dự báo lạm phát cho năm 2012, chúng tơi sử dụng mơ hình (5.2)-(5.4) ước lượng được và số liệu đến năm 2011 đưa vào mơ hình và làm thủ tục dự báo cho năm 2012. Kết quả thu được cho ở Bảng 5.3:

Dự báo tốc độ tăng trưởng của lạm phát từ mơ hình Dự báo cpi gcpi forecast lowerci upperci +/-

2012q1 -0.0146 -0.0788 0.0496 0.0642 99.889998 2012q2 0.0224 -0.0441 0.0888 0.0665 102.127534 2012q3 0.0363 -0.0325 0.1051 0.0688 105.8347634 2012q4 -0.006 -0.0795 0.0674 0.0735 105.1997549

Bảng 5.3 Kết quả dự báo lạm phát về tốc độ tăng trưởng lạm phát năm 2012.

Nguồn: Kết quả dự báo tốc độ tăng trưởng thu được trực tiếp từ mơ hình cịn dự báo cho cpi có được do kết quả dự báo từ mơ hình và cpi quý 4 năm 2011.

5.2.2 Sử dụng GP cho dự báo lạm phát ở Việt NamCài đặt các hàm và các biến, độ tốt của cá thể Cài đặt các hàm và các biến, độ tốt của cá thể

Các phép tốn mà chúng tơi sử dụng ở đây để tạo ra các công thứ dự báo lạm phát báo gồm: +,−,∗, /,√ ngồi ra cịn các phép tốn do chúng tơi tự định nghĩa như sau:

mylog(x) = 0 if x ≤0 ln (x) if x > 0 , mysinsh(x) =e −x−ex 2 mylogis(x) = 1 1 +e−x, mysqrt(x) = 0 if x ≤ 0 √ x if x > 0 , mydivide(y, x) = 0 if x = 0 y x if x 6= 0

Hàm thích nghi (hàm Fitness) để đo độ tốt của một cá thể được định nghĩa như sau: Fitness = n X i=1 |yi −fi|

trong đó n là cỡ mẫu, yi là giá trị của CPI trong mẫu tại thời điểm thứ i, và fi là giá trị của một cá thể tại thời điểm thứ i trong mẫu (fi là giá trị

phù hợp của yi). Để đánh giá sự nhất qn của một mơ hình dự báo do GP tạo ra ta đưa thêm đại lượng sau:

TestFitness = N X

i=n+1

|yi −fi|

trong đó yi, i = n+ 1, ..., N là giá trị thực của CPI trong tập dữ liệu dùng để kiểm tra ( đối với dữ liệu theo thángyi i = n+ 1, ..., N là giá trị

Một phần của tài liệu (LUẬN án TIẾN sĩ) phân tích thống kê dự báo và mô phỏng một số chuỗi thời gian 62 46 15 01 (Trang 144)