Ứng dụng phép lọc tuyến tính trong phân tích chuỗi thời gian: Nghiên cứu tình huống thực nghiệm tại Việt Nam

MỤC LỤC

KIẾN THỨC LIÊN QUAN

Một dãy các biến ngẫu nhiên được gán chỉ số theo thời gian được gọi là một quá trình ngẫu nhiên hay quá trình chuỗi thời gian, ký hiệu {Xt} với t∈T. Vì dữ liệu được thu thập dựa vào kết quả thực tế đã xảy ra nên trong nghiên cứu thực nghiệm chuỗi thời gian ta chỉ có duy nhất một bộ dữ liệu. Khi đó, tập hợp tất cả các kết quả có thể xảy ra của quá trình ngẫu nhiên được xem là tổng thể và bộ dữ liệu chuỗi thời gian đã được thu thập là một mẫu cụ thể.

Một cách đơn giản, có thể cho rằng dữ liệu chuỗi thời gian là chuỗi các quan sát được thu thập trên cùng một đối tượng tại các thời điểm cách đều. Như vậy, khi{Xt} là chuỗi dừng thì hàm tự hiệp phương sai γX(t, s) không phụ thuộc vào hai biến số t, s mà chỉ phụ thuộc vào khoảng cách thời gian giữa t và s (nói cách khác, phụ thuộc vào t−s). Định lý 1.3.1 cho thấy mối quan hệ giữa hàm tự tương quan và hàm mật độ phổ: từ hàm tự hiệp phương sai có thể tính được hàm mật độ phổ và ngược lại.

Các quá trình tự hồi quy AR, trung bình trượt MA, tự hồi quy trung bình trượt ARMA là những ví dụ về ảnh của nhiễu trắng qua các phép lọc tuyến tính. Trong ứng dụng phép lọc, người ta kỳ vọng biên độ dao động của chuỗi đầu ra không thay đổi so với chuỗi gốc, nghĩa là G(λ) = 1 với λ thuộc khoảng tần số mà phép lọc giữ lại.

Hình 1.2: Đồ thị chuỗi thời gian dừng
Hình 1.2: Đồ thị chuỗi thời gian dừng

TÍNH CHẤT CỦA CÁC PHÉP LỌC TUYẾN TÍNH PHỔ BIẾN

Như vậy, phép sai phân bậc nhất đã loại bỏ các thành phần dao động có tần số rất thấp (≈0) trong chuỗi Xt (tương đương với có thể loại bỏ các thành phần có chu kỳ dài trong chuỗi ban đầu). Mục đích này có thể đạt được bởi vì các phép sai phân này đã loại bỏ các thành phần dao động có tần số rất thấp (≈ 0) trong chuỗi {Xt} (tương đương loại bỏ các thành phần có chu kỳ dài trong chuỗi gốc). Điều đó cũng đồng nghĩa với việc phóng đại các thành phần bất quy tắc (thành phần nhiễu, thành phần có tần số cao) của {Xt} và làm tăng phương sai của chuỗi đầu ra {Yt} so với phương sai của chuỗi gốc {Xt}.

Như vậy, về mặt thực hành, nếu chuỗi {Xt} có tần số cao (ví dụ đơn vị tuần, ngày, giờ) thì không nên sử dụng các phép sai phân để khử thành phần xu hướng của {Xt}. Yếu tố mùa thường xuất hiện khi chuỗi thời gian được quan sát nhiều lần trong một năm, ví dụ dữ liệu được quan sát theo tuần, tháng, quý,. Khi đó, yếu tố mùa được xem như là yếu tố gây ra những dao động với chu kỳ ngắn (không quá12tháng đối với dữ liệu quan sát theo tháng và không quá 4quý đối với dữ liệu quan sát theo quý).

Gọi thành phần điều hòa đơn giản với tần số là π2 trong chuỗi là X(π2) (thành phần này có độ dài chu kỳ quan sát là 4 quý) thìX(π2)bị khử qua phép lọcS4(L). Tuy nhiên, điểm khác biệt là OM Ak(L) giữ lại thành phần có tần số rất bé (≈ 0) và không phóng đại biên độ dao động của các thành phần trong chuỗi gốc. Do đó, phép lọc trung bình trượt đối xứng và tổng các trọng số bằng 0có thể áp dụng để khử thành phần xu thế tất định có dạng bậc hai theo thời gian.

Nhắc lại, phép lọc thông thấp lý tưởng (LFideal) là phép lọc thông thấp và không làm thay đổi biên độ dao động của các thành phần được giữ lại qua phép lọc. Khi khử xu hướng một chuỗi thời gian bằng phép lọc, cần thiết kế phép lọc có thể loại bỏ các thành phần dao động với tần số rất bé của chuỗi ban đầu. Khi đó, nếu mục đích dùng phép lọc tạo ra chuỗi dừng, có thể sử dụng các phép lấy sai phân, phép lấy trung bình trượt hoặc trung bình các giá trị trễ thay vì sử dụng HPF.

Dựa trên quan sát về chu kỳ kinh doanh thực, Baxter và King cho rằng khi nghiên cứu một chuỗi thời gian kinh tế, cần tách riêng thành phần chu kỳ khỏi các thành phần như: xu hướng - thay đổi rất chậm, mùa vụ, và thành phần bất quy tắc - thay đổi rất nhanh chóng. Dựa trên ý tưởng đó, Baxter và King xây dựng một phép lọc thông dải bằng cách sử dụng phép trung bình trượt xấp xỉ phép lọc thông dải lý tưởng, ký hiệu là BKK(p1, p2)(Baxter & King, 1999). Tuy nhiên, đối với các nghiên cứu thực nghiệm, giá trị K được chọn tùy thuộc vào độ dài của chuỗi dữ liệu và yêu cầu chính xác của phép xấp xỉ phép lọc thông dải lý tưởng.

• Với mục đích khử xu hướng: Trừ các phép lọc có tính chất của phép lọc thông thấp như các phép trung bình trượt OMA và CMA, các phép lọc sai phân nói chung, thông cao, HPF, và BKF đều có thể được áp dụng. Đặc biệt, các phép sai phân bậc nhất và bậc hai đã phóng đại các thành phần dao động có tần số cao, là các thành phần nhiễu (thành phần bất quy tắc).

Hình 2.1: Đồ thị hàm lợi ích của các phép sai phân bậc nhất và bậc hai.
Hình 2.1: Đồ thị hàm lợi ích của các phép sai phân bậc nhất và bậc hai.

NGHIÊN CỨU THỰC NGHIỆM

Theo dừi biến động của chuỗi VN-Index từ năm 2000 đến thỏng 5 năm 2021, có thể nhận thấy VN-Index đã trải qua sáu chu kỳ tăng giảm. Có thể nhận định rằng, trung bình độ dài một chu kỳ của chuỗi VN-Index là khoảng ba năm, tính theo tuần là 156 tuần (tương đương tần số là λ0 = 2π. Với mục đích loại phân rã chuỗi LVNI thành hai chuỗi xu hướng và chu kỳ đồng thời không làm thay đổi pha, biên độ dao động của thành phần chu kỳ (là thành phần được giữ lại nghiên cứu tùy vào các mục đích cụ thể), các phép lọc thông cao (HF), HPF và BKF nên được chọn.

Các phép sai phân, trung bình trượt và thông thấp không thỏa mãn các yêu cầu về pha, biên độ dao động và khả năng khử thành phần có chu kỳ dài, vì thế không được áp dụng trong phần nghiên cứu thực nghiệm này. Sau đó, căn cứ vào sự ổn định của độ dao động (đo bằng độ lệch chuẩn) và sự ổn định của độ bền (đo bằng hệ số tự tương quan bậc một), giá trị K hợp lý sẽ được chọn. Vì HPF là một phép lọc thông cao nên sẽ HPF tách được thành phần xu hướng và thành phần chu kỳ với độ dài chu kỳ không quá 156 tuần (tương đương loại bỏ các thành phần có tần số ω ∈ h.

So sánh với các giá trị λ ở Bảng 3.4, nhận thấy hệ số làm trơn theo đề xuất của Ravn và Uhlig là quá lớn. Tuy vậy, hàm lợi ích của phép lọc tương ứng lại là xấp xỉ kém nhất cho hàm lợi ích của phép lọc thông cao lý tưởng. Trong mỗi chu kỳ, chỉ số VN-Index sẽ có những đợt dao động nhỏ điều chỉnh giá với thời gian không quá 4 tuần.

Tương tự quy trình xây dựng phép lọc thông cao, độ lệch chuẩn và hệ số tự tương quan bậc 1 được dùng làm độ đo để xác định giá trị K hợp lý nhất cho BKF. Giữa yêu cầu xấp xỉ tốt phép lọc thông dải lý tưởng và sự mất mát dữ liệu mẫu, giá trị K phù hợp nhất là 36. Như vậy, nghiên cứu đã xác định được các phép lọc có thể phân rã chuỗi LVNI thành các thành phần xu hướng và chu kỳ.

Các đường xu hướng khá tương đồng với chuỗi ban đầu, trong đó hệ số tương quan giữa LVNI và đường xu hướng của BKF là cao nhất (0.9711). Bên cạnh đó, đường xu hướng từ các phép lọc thông cao HF55 và Baxter - King BK36 rất giống nhau về xu hướng vận động. Điều này tương đồng với các nhận định của các nghiên cứu thực nghiệm trước đây (Baxter & King, 1999; Hamilton, 2018).

Bảng 3.1: Thống kê mô tả và kết quả kiểm định nghiệm đơn vị chuỗi LVNI
Bảng 3.1: Thống kê mô tả và kết quả kiểm định nghiệm đơn vị chuỗi LVNI