CHƯƠNG 3: PHƯƠNG PHÁP LUẬN VÀ DỮ LIỆU NGHIÊN CỨU
3.2 Dữ liệu nghiên cứu
3.2.1 Điều chỉnh mùa vụ bằng chương trình X-13A-S
Tất cả các dữ liệu của các biến được đưa vào mô hình đều được loại bỏ tính mùa vụ thông qua chương trình điều chỉnh mùa vụ X-13A-S của IMF được thực hiện theo cách tiếp cận hai bước trong sơ đồ sau:
Nguồn: Findley và cộng sự (1988) Hình 1: Tiến trình hiệu chỉnh mùa vụ
Giai đoạn tiền điều chỉnh
Giai đoạn đầu tiên được gọi là giai đoạn tiền điều chỉnh. Mục tiêu của giai đoạn tiền điều chỉnh này là chọn mô hình hồi quy ARIMA có phần dư mô tả tốt nhất các đặc điểm của chuỗi dữ liệu gốc. Mô hình được lựa chọn này sẽ được sử dụng trong quá trình phân tách các thành phần không quan sát được trong chuỗi thời gian. Các bước trong giai đoạn tiền điều chỉnh như sau:
(i) Xem xét các thành phần không quan sát được có liên quan với nhau như thế nào (cấp số cộng, cấp số nhân, hoặc các dạng hỗn hợp khác). Các thành phần không quan sát được này sẽ phân tách thành các loại: xu thế/chu kỳ, mùa vụ, các yếu tố ngoại lai. Mối quan hệ giữa các thành phần không quan sát được này được chuẩn đoán tự động thông qua các chuẩn đoán bằng hình
Các chuẩn đoán mô hình (Phân phối chuẩn, thống kê t,
tự tương quan, v.v) Giai đoạn 1: Tiền điều chỉnh
(Bậc ARIMA, các hiệu ứng hồi quy, các giá trị ngoại lai, v.v)
Giai đoạn 2: Phân rã (Bộ lọc trung bình trượt và
bộ lọc dựa trên mô hình)
Các chuẩn đoán điều chỉnh mùa vụ (Lịch sử sửa đổi, nhịp trượt, phổ, thống kê M, v.v)
ảnh hoặc tiến trình điều chỉnh mùa vụ ở giai đoạn thứ hai. Ví dụ như sau khi đã tách thành phần xu thế ra khỏi chuỗi dữ liệu, mà hình dáng của thành phần mùa vụ vẫn thay đổi tăng theo cấp độ của chuỗi, thì mối quan hệ giữa các thành phần được dự kiến là cấp số nhân. Ngược lại, nếu thành phần mùa vụ xuất hiện ổn định theo thời gian thì sự phân tách sẽ tuân theo cấp số cộng.
(ii) Xem xét bậc của mô hình ARIMA được lựa chọn dựa trên các tiêu chuẩn thống kê BIC. Một mô hình tốt sẽ có giá trị BIC nhỏ nhất. Chương trình X-13A-S sẽ lựa chọn tự động bậc của mô hình ARIMA, và sẽ thay đổi các lựa chọn này nếu các thống kê trên mô hình này là không thỏa mãn. Ví dụ, các chuẩn đoán về phần dư vi phạm các vấn đề về sự tự tương quan, hoặc phân phối chuẩn.
(iii) Xem xét các giá trị ngoại lai còn gọi là giá trị bất thường. Các giá trị này được xác định tự động thông qua tiến trình đặt các biến giả trong mô hình hồi quy cho tất cả các kì trong khoảng thời gian xác định. Các giá trị ngoại lai được xác định thông qua hệ số hồi quy có thông kê t lớn hơn giá trị tới hạn của nó và các chuẩn đoán về tính ổn định của mô hình hồi quy đó.
Một số chương trình điều chỉnh có thể xuất ra chuỗi dữ liệu được điều chỉnh mùa vụ ngay cả khi dữ liệu đầu vào không chứa các hiệu ứng theo mùa. Ngoài ra, nó có thể mang lại các chuỗi dữ liệu điều chỉnh theo mùa trong khi trong phần dư vẫn còn chứa các hiệu ứng theo mùa. Cả hai tình huống này có thể tránh được khi sử dụng chương trình X-13A-S. Chương trình X-13A-S này đã thực hiện các kiểm định chuẩn đoán để đảm bảo tính đúng đắn của các kết quả điều chỉnh mùa vụ. Các kiểm định này bao gồm: kiểm định sự tồn tại của hiệu ứng mùa vụ trong chuỗi dữ liệu gốc bằng các thông kê F, các chuẩn đoán liên quan đến phần dư sau ước lượng mô hình ARIMA. Bởi vì việc xác định không đúng mô hình ARIMA sẽ dẫn đến kết quả điều chỉnh mùa vụ có thể không chuẩn xác. Vì vậy, nếu như phần dư của mô hình vi phạm tính phân phối chuẩn do các giá trị ngoại lai gây ra, thì sẽ được xử lý cố định các giá
trị này, hoặc nếu bị tư tương quan thì các thông số đầu vào của mô hình sẽ được điều chỉnh lại.
Giai đoạn phân rã
Các chuỗi dữ liệu gốc được phân rã thành các thành phần không quan sát được nhằm tách các thành phần mùa vụ ra khỏi chuỗi dữ liệu này. Có hai cách tiếp cận phân rã chuỗi thời gian là bộ lọc trung bình trượt X-11 và bộ lọc SEATS. Đây là hai phương pháp hiệu chỉnh mùa vụ chuẩn được sử dụng ở các tổ chức thống kê quốc tế như IMF. Chương trình X-13A-S được sử dụng trong luận án này cho phép thực hiện cùng lúc cả hai bộ lọc này với cùng một bộ công cụ chuẩn đoán như nhau, tạo điều kiện so sánh kết quả và lựa chọn mô hình tốt nhất. Một số nghiên cứu thực nghiệm đã thực hiện so sánh kết quả điều chỉnh theo mùa từ các bộ lọc X-11 và SEATS, ví dụ như Hood & Findley (1999); Scott và cộng sự (2007). Nhìn chung, cả hai phương pháp đều cho ra kết quả tốt và việc lựa chọn phương pháp nào là dựa trên những cân nhắc và đánh giá chủ quan từ các chuẩn đoán trong thực hành.
Bộ lọc X-11 là một quá trình lặp, trong đó nó áp dụng một chuỗi các bộ lọc trung bình trượt (MA) được xác định trước. Sau đó, các chuỗi dữ liệu được điều chỉnh này sẽ trải ba vòng lọc và điều chỉnh giá trị cực đại được gọi là các bước lặp B, C và D. Bước lặp B là ước lượng các thành phần mùa vụ ban đầu. Bước lặp C là ước lượng tỷ số bất thường của yếu tố mùa vụ (tỷ số SI). Bước lặp D là điều chỉnh chuỗi dữ liệu mùa vụ tìm ra kết quả cuối cùng.
Bộ lọc SEATS là phương pháp dựa trên mô hình ARIMA để điều chỉnh mùa vụ. Cách tiếp cận này bao gồm ước tính mô hình ARIMA cho chuỗi gốc, tạo ra các mô hình ARIMA nhất quán cho các thành phần không quan sát được (chu kỳ/xu hướng, thời vụ và các yếu tố bất thường) và ước tính các thành phần này bằng kỹ thuật trích xuất tín hiệu tối ưu.
Điểm khác biệt quan trọng giữa hai bộ lọc này đó là: Với cách tiếp cận dựa trên mô hình, bộ lọc điều chỉnh mùa vụ sẽ thích nghi với cấu trúc cụ thể của từng chuỗi dữ liệu. Ngược lại, X-11 thì áp dụng một bộ lọc điều chỉnh mùa vụ có sẵn cho mọi
chuỗi dữ liệu đơn lẻ theo cùng một cách thức bất kể cấu trúc của các thành phần theo mùa và không theo mùa (mặc dù chiều dài bộ lọc có thể được thay đổi để phù hợp hơn với các đặc điểm khác nhau).
Trong giai đoạn này, các chuẩn đoán để đảm bảo chất lượng của chuỗi dữ liệu được điều chỉnh mùa vụ cũng được thực hiện. Ngay sau khi điều chỉnh, các kiểm định lên kết quả cuối cùng này được thực hiện ngay lập tức. Đầu tiên là kiểm tra chuỗi dữ liệu đã được điều chỉnh mùa vụ có thực sự còn hiệu ứng mùa vụ hay không. Điều này được thể hiện thông qua kiểm định mùa vụ trên phần dư dựa vào các thống kê F hoặc các kiểm định phi tham số như Kruskal–Wallis. Kết hợp với chuẩn đoán M để kiểm định sự ổn đinh của kết quả hiệu chỉnh mùa vụ. Giá trị M dao động từ 0 đến 1 là có thể chấp nhận được, còn lớn hơn 1 thì thể hiện những vấn đề tiềm tàng trong quá trình điều chỉnh.
Ngoài ra, còn có các chuẩn đoán nâng cao đảm bảo tính ổn định của kết quả điều chỉnh mùa vụ. Công cụ đầu tiên là chẩn đoán khoảng trượt. Nó đo lường mức độ ổn định của các ước tính điều chỉnh mùa vụ khi các khoảng dữ liệu khác nhau trong chuỗi gốc được xem xét trong quá trình ước tính. Thông thường, chương trình sẽ chọn ra bốn khoảng dữ liệu từ chuỗi. Độ dài khoảng được chọn tự động trong khoảng từ 6 đến 11 năm, tùy thuộc vào bộ lọc mùa vụ được chọn, độ dài của chuỗi và tần suất của chuỗi (hàng tháng hoặc hàng quý). Nếu số liệu thống kê ở các khoảng trượt cho thấy tín hiệu về sự không ổn định của dữ liệu được điều chỉnh theo mùa.
Điều này có thể là do sự hiện diện của các điểm gãy trong chuỗi hoặc tính thời vụ di chuyển. Công cụ thứ hai là chẩn đoán lịch sử sửa đổi. Nó xem xét các sửa đổi của các dữ liệu điều chỉnh theo mùa trong các quý gần đây nhất khi các điểm dữ liệu mới được thêm vào. Cả hai công cụ đều rất hữu ích để so sánh hai bộ lọc điều chỉnh theo mùa (X-11 hoặc SEATS)
Mặc dù, tiến trình hai bước này được xử lý một cách riêng biệt, nhưng chúng được xem xét tích hợp đầy đủ trong bất kỳ quy trình điều chỉnh mùa vụ nào. Các lựa chọn khác nhau trong giai đoạn tiền điều chỉnh sẽ dẫn đến kết quả phân tách khác
nhau. Ngoài ra, kết quả từ sự phân tách chuỗi thời gian có thể chỉ ra những thay đổi trong giai đoạn tiền điều chỉnh.