Mục đích nghiên cứu
Nghiên cứu được thực hiện nhằm các mục đích sau:
• Phân tích tính chất các phép lọc tuyến tính phổ biến, như: các phép lấy sai phân bậc 1, bậc 2, bậc k; các phép trung bình trượt; phép lọc thông thấp, thông cao, thông dải; HPF và BKF Từ đó, nghiên cứu khuyến nghị phạm vi sử dụng các phép lọc trong phân tích chuỗi thời gian kinh tế.
• Đề xuất quy trình ước lượng các tham số của các phép lọc HF, HPF và BKF đối với chuỗi dữ liệu tần số tuần.
• Thực hiện nghiên cứu thực nghiệm trên bộ dữ liệu tần số tuần nhằm đề xuất tham số cho các phép lọc trên đối với chuỗi dữ liệu kinh tế vĩ mô tần số tuần tại Việt Nam.
Phương pháp nghiên cứu
Nghiên cứu sử dụng các phương pháp phân tích dựa trên các tính chất toán học để tìm hiểu tính chất của các phép lọc tuyến tính phổ biến. Đối với nghiên cứu thực nghiệm, nghiên cứu sử dụng phương pháp nghiên cứu định lượng thông qua việc tính toán các hệ số tự tương quan và độ lệch chuẩn của chuỗi chỉ số giá chứng khoán VN-Index tần số tuần và các chuỗi đầu ra khi áp dụng các phép lọc tuyến tính Các bước tính toán được thực hiện bằng ngôn ngữ lập trình R.
Đóng góp mới
Các đóng góp mới của đề tài bao gồm:
• Cung cấp một khung phân tích tính chất của các phép lọc tuyến tính phổ biến như các phép lấy sai phân bậc 1, bậc 2, bậc k; các phép trung bình trượt; phép lọc thông thấp, thông cao, thông dải; HPF và BKF.
• Khuyến nghị tình huống sử dụng các phép lọc nói trên trong phân tích chuỗi thời gian kinh tế.
• Đề xuất tham số cho các phép lọc HF, HPF và BKF khi áp dụng trên chuỗi dữ liệu tần số tuần.
Bố cục
Báo cáo gồm các nội dung sau đây:
1 Chương 1: Các kiến thức liên quan
2 Chương 2: Tính chất của các phép lọc tuyến tính phổ biến
3 Chương 3: Nghiên cứu thực nghiệm.
Số phức
• Số phức z là biểu thức có dạng z = a + ib, trong đó a, b ∈R; a được gọi là phần thực; b được gọi là phần ảo của số phức z; i 2 = −1, i được gọi là đơn vị ảo.
• Tập hợp các số phức được ký hiệu làC Biểu diễn z = a + ib còn được gọi là dạng đại số của số phức.
• Hai số phức bằng nhau khi và chỉ khi phần thực và phần ảo của chúng bằng nhau. a 1 + ib 1 = a 2 + ib 2 ⇔
• Mỗi số thực được xem là một số phức với phần ảo bằng 0.
Biểu diễn hình học của số phức
Người ta dùng mặt phẳng tọa độ để minh họa cho tập hợp các số phức C. Mỗi số phức z = a + ib được biểu diễn bởi một điểm M (a, b) trên mặt phẳng tọa độ Oxy Khi đó,
• Độ dài vector −−→ OM được gọi là mô-đun của số phức z.
Ox) được gọi là argument của số phức z.Như vậy, số phức z = a + ib có thể được viết dưới dạng lượng giác là z = r(cos ϕ + i sin ϕ), trong đó:
• r = √ a 2 + b 2 là mô-đun của số phức z, kí hiệu là |z| = r.
• ϕ được gọi là argument của số phức z với tan ϕ = a b.
• Nếu ϕ ∈ [−π, π] thì ký hiệu ϕ = Arg(z).
Hình 1.1: Minh họa hình học của số phức.
Chú ý: Khi z = 0 thì mô-đun |z| = r = 0 và argument là không xác định.
Phép toán trên tập số phức
Xét z 1 , z 2 ∈C Giả sử z 1 = a 1 + ib 1 , z 2 = a 2 + ib 2 , với a i , b i ∈R (i = 1, 2) Khi đó:
• z 1 z 2 = (a 1 a 2 + b 1 b 2 ) + i(a 2 b 1 − a 1 b 2 ) a 2 2 + b 2 2 , (z 2 6= 0) Ở dạng lượng giác, giả sửz 1 = r 1 (cos ϕ 1 +i sin ϕ 1 ), z 2 = r 2 (cos ϕ 2 +i sin ϕ 2 ), z 2 6= 0, ta có:
Công thức Euler Định lý 1.1.1 Với mọi số thực x, ta có công thức Euler: e ix = cos x + i sin x
Hệ quả 1.1.2 Với mọi số thực x, ta có: cos x = e ix + e −ix
Chuỗi thời gian dừng
Các khái niệm, các định lý được trình bày ở mục này có thể được tìm thấy trong các tài liệu Hamilton (2020); Neusser (2016); Nguyễn Quang Dong (2012); Wooldridge (2010) Chúng tôi không trình bày chi tiết phần chứng minh cho các định lý. Định nghĩa 1.2.1 Một dãy các biến ngẫu nhiên được gán chỉ số theo thời gian được gọi là một quá trình ngẫu nhiên hay quá trình chuỗi thời gian, ký hiệu {X t } với t ∈ T Dữ liệu chuỗi thời gian là dữ liệu cụ thể được thu thập từ một quá trình ngẫu nhiên.
Tập hợpT là tập có thứ tự, chứa các chỉ số xác định thời gian Trong nghiên cứu quá trình chuỗi thời gian (từ đây gọi tắt là chuỗi thời gian), thường gặp hai trường hợp như sau:
• Chuỗi thời gian liên tục: T =R hoặc T = [0, +∞].
• Chuỗi thời gian rời rạc: T =Z hoặc T =N
Vì dữ liệu được thu thập dựa vào kết quả thực tế đã xảy ra nên trong nghiên cứu thực nghiệm chuỗi thời gian ta chỉ có duy nhất một bộ dữ liệu. Tuy vậy, ta không biết chính xác các giá trị tương lai của chuỗi dữ liệu Bên cạnh đó, nếu một điều kiện nào đó trong quá khứ thay đổi, ta có thể nhận được một bộ dữ liệu khác với dữ liệu thực tế hiện có Vì thế, giả định rằng dữ liệu chuỗi thời gian là một kết quả cụ thể từ một quá trình ngẫu nhiên là hợp lý Khi đó, tập hợp tất cả các kết quả có thể xảy ra của quá trình ngẫu nhiên được xem là tổng thể và bộ dữ liệu chuỗi thời gian đã được thu thập là một mẫu cụ thể.
Chuỗi thời gian là chuỗi các quan sát thu thập cùng đối tượng cách đều theo thời gian, với khoảng cách giữa chúng gọi là tần suất Trong kinh tế vĩ mô, chuỗi thời gian thường rời rạc với tần suất năm, quý, tháng, tuần Hàm tự hiệp phương sai đo mức độ biến đổi chung của chuỗi thời gian tại hai thời điểm t và s, còn một chuỗi thời gian dừng hiệp phương sai sở hữu phương sai hữu hạn, giá trị kỳ vọng không đổi và hiệp phương sai chỉ phụ thuộc vào độ trễ thời gian.
Trong khuôn khổ báo cáo, chuỗi thời gian dừng hiệp phương sai được gọi vắn tắt là chuỗi thời gian dừng.
Hình 1.2: Đồ thị chuỗi thời gian dừng
Từ điều kiện iii) suy ra chuỗi thời gian dừng có phương sai không đổi tại mọi thời điểmt vì khi t = s và h tùy ý thì V X t = Cov(X t , X t ) = Cov(X t+h , X t+h ) =
V X t+h , ∀t, h Bên cạnh đó, nếu h = −s thì Cov(X t , X s ) = Cov(X t−s , X 0 ) Viết dưới dạng hàm tự hiệp phương sai thìγ X (t, s) = γ X (t −s, 0) Như vậy, khi{X t } là chuỗi dừng thì hàm tự hiệp phương sai γ X (t, s) không phụ thuộc vào hai biến số t, s mà chỉ phụ thuộc vào khoảng cách thời gian giữa t và s (nói cách khác, phụ thuộc vào t − s) Vì thế, đối với chuỗi thời gian dừng, hàm tự hiệp phương sai là hàm một biến, ký hiệu γ (h) = Cov(X h , X 0 ), h ∈ Z Khi muốn chỉ rõ hàm tự hiệp phương sai của chuỗi thời gian {X t }, ta sử dụng ký hiệu γ X (h).
Ví dụ đơn giản nhất về chuỗi thời gian dừng là Nhiễu trắng (White noise). Định nghĩa 1.2.4 Một chuỗi thời gian {Z t } được gọi là nhiễu trắng, kí hiệu
• γ Z (h) = 0, ∀h > 0. Định lý 1.2.1 (Định lý Wold) Mỗi chuỗi thời gian dừng {X t } có kỳ vọng bằng 0, phương sai hữu hạn được biểu diễn như sau:
• V t là thành phần tất định thuần túy (nghĩa là có thể được dự báo chính xác bởi vô hạn các quan sát trong quá khứ).
Như vậy, định lý Wold đã mô tả cấu trúc một chuỗi thời gian dừng có phương sai hữu hạn trên miền thời gian t Cấu trúc này bao gồm hai thành phần không tương quan nhau: thành phần tất định và thành phần ngẫu nhiên.
Thành phần tất định có thể là hàm số theo biến số thời gian hoặc là một chuỗi điều hòa Thành phần ngẫu nhiên là trung bình trượt vô hạn của các nhiễu trắng.
Chuỗi thời gian dừng trên miền tần số
Ở phần này, chúng ta sẽ mô tả cấu trúc chuỗi dừng trên miền tần số Một khái niệm cần thiết cho phần này là khái niệm quá trình điều hòa (harmonic process). Định nghĩa 1.3.1 Một quá trình điều hòa đơn giản là quá trình có dạng:
X t = A cos(λt) + B sin(λt), t ∈ (0, π). trong đó A, B là các biến ngẫu nhiên không tương quan, trung bình bằng 0 và phương sai hữu hạn; λ được gọi là tần số dao động của {X t }.
Một quá trình điều hòa là tổng hữu hạn của các quá trình điều hòa đơn giản.
[A j cos(λ j t) + B j sin(λ j t)] , 0 < λ 1 < < λ M < π với A j , B i là các biến ngẫu nhiên không tương quan nhau, E A j = E B i = 0 và
Quá trình điều hòa {Y t } là quá trình dừng Thật vậy, với mọi t ta có:
Mỗi quá trình điều hòa có thể chia thành M thành phần điều hòa đơn giản là X j = A j cos(λ j t) + B j sin(λ j t), (j = 1, , M), không tương quan với nhau Phương sai của mỗi thành phần là V X j = σ j 2, đóng góp vào phương sai của quá trình điều hòa {Y t}: V Y t =
Xét quá trình điều hòa đơn giản X t = A cos(λt) + B sin(λt), λ ∈ (0, π) Khi đó, trên miền thời gian, {X t } thỏa mãn: X t = (2 cos λ)X t−1 − X t−2 với mọi t. Nghĩa là, X t hoàn toàn được dự báo chính xác từ hai quan sát liên tiếp trong quá khứ Như vậy, dễ dàng suy ra quá trình điều hòa là một quá trình tất định thuần túy. Định nghĩa 1.3.2 Cho {X t } là chuỗi thời gian dừng có trung bình bằng 0 và γ X (h)là hàm tự hiệp phương sai: γ X (h) = Cov(X h , X 0 )thỏa
X h=−∞ γ X (h)e −ihλ , λ ∈R được gọi là hàm mật độ phổ của chuỗi thời gian {X t }.
Biến đổi hàm mật độ phổ, theo công thức Euler, ta có: f (λ) = 1
Vì hàm sin là hàm số lẻ và hàm cos là hàm số chẵn, nên: f (λ) = γ X (0)
Mặt khác, vì cos là hàm chẵn và là hàm tuần hoàn chu kỳ 2π nên ta chỉ xét miền xác định của hàm mật độ phổ f(λ) là λ ∈ [0, π].
Trong thực hành, ta thường sử dụng khái niệm ‘độ dài chu kỳ’, được định nghĩa: Độ dài chu kỳ= 2π λ Định lý 1.3.1 Cho {X t } là một chuỗi thời gian dừng, trung bình bằng 0 và hàm mật độ phổ là f (λ) Khi đó:
−π cos(hλ)f(λ)dλ Định lý 1.3.2 (Định lý biểu diễn phổ) Giả sử {X t } là một chuỗi thời gian dừng Khi đó,
[A 1 (λ) cos λt + A 2 (λ) sin λt] dλ với A i (.), i = 1, 2 là các biến ngẫu nhiên có trung bình bằng 0 và với bất kỳ các tần số 0 < ω 1 < ω 2 < ω 3 < ω 4 < π thì:
Như vậy, một chuỗi thời gian dừng {X t } là tổng vô hạn của các chuỗi điều hòa đơn giản không tương quan có tần số trong đoạn [0, π] Khi muốn chỉ thành phần dao động tương ứng với tần số cụ thể λ 0 của {X t }, ta viết X(λ 0 ). Khi nghiên cứu cấu trúc bên trong, chuỗi thời gian dừng {X t } được cho rằng bao gồm các thành phần sau đây:
• Thành phần xu hướng (trend component): bao gồm các thành phần dao động tương ứng với các tần số thấp (tương đương với độ dài chu kỳ dài).
• Thành phần chu kỳ (cyclical component): bao gồm các thành dao động tương ứng với các tần số cao (tương đương với độ dài chu kỳ ngắn).
• Thành phần bất quy tắc hay thành phần nhiễu (irregular component): bao gồm các thành phần dao động tương ứng với tần số rất cao (tương đương độ dài chu kỳ rất ngắn).
Trên miền thời gian, nghiên cứu chuỗi thời gian dừng thường được thực hiện dựa trên hàm tự hiệp phương sai γ(h) Trong khi đó, trên miền tần số, các nghiên cứu thường xoay quanh hàm mật độ phổ của chuỗi Định lý 1.3.1 cho thấy mối quan hệ giữa hàm tự tương quan và hàm mật độ phổ: từ hàm tự hiệp phương sai có thể tính được hàm mật độ phổ và ngược lại.
Phép lọc tuyến tính
Định nghĩa 1.4.1 Xét không gian Ω gồm các chuỗi thời gian.
• Ánh xạ L : Ω → Ω sao cho LX t = X t−1 , ∀X t ∈ Ω được gọi là toán tử trễ.
|ψ j | < +∞) được gọi là phép lọc tuyến tính trên không gian Ω.
Nói cách khác, phép lọc tuyến tính ψ(L) là ánh xạ ψ(L) : Ω → Ω sao cho: ψ(L)X t =
X t−j được gọi là đầu ra (ảnh) của chuỗi thời gian {X t } qua phép lọc tuyến tính ψ(L).
Các quá trình tự hồi quy AR, trung bình trượt MA, tự hồi quy trung bình trượt ARMA là những ví dụ về ảnh của nhiễu trắng qua các phép lọc tuyến tính. Định lý 1.4.1 Cho {X t } là một quá trình dừng với trung bình bằng 0 Khi đó, nếu quá trình {Y t } là đầu ra của {X t } qua phép lọc tuyến tính ψ(L) thì {Y t } là một quá trình dừng với trung bình bằng 0 Hơn nữa, các hàm tự hiệp phương sai của chuỗi {X t } và {Y t } có mối quan hệ: γ Y (h) =
Định lý 1.4.2 chứng minh rằng mật độ phổ của dãy {X t } liên hệ với mật độ phổ của dãy {Y t } theo công thức f Y (λ) = ψ(e −iλ )ψ(e iλ )f X (λ), trong đó ψ(e −iλ ) =
P j=−∞ ψ j e −ijλ Định nghĩa 1.4.2 Với mô tả như Định lý 1.4.1, hàm số
X j=−∞ ψ j e −ijλ được gọi là hàm truyền (transfer function) hoặc hàm đáp ứng tần số (frequency- response function) của phép lọc ψ(L) Hàm G(λ) = ψ(e −iλ )ψ(e iλ ) được gọi là hàm lợi ích (gain function) của phép lọc.
Giả sử {Y t } là ảnh của {X t } qua phép lọc ψ(L) : Y t = ψ(L)X t Từ Định lý 1.4.2, trong miền tần số, suy ra: Y (λ) = T F (λ)X(λ) với λ ∈ [0, π].
Vai trò của hàm truyền
Vìarg(Y (λ)) = arg(T F (λ))+arg(X(λ)), nên sau phép lọc, chuỗi{Y t }bị thay đổi argument so với chuỗi {X t } Thuật ngữ mô tả hiện tượng này là ‘phép lọc làm dịch chuyển pha (phase) của chuỗi ban đầu’ Nghĩa là, một sự kiện xảy ra ở thời điểm t được biểu diễn bởi chuỗi thời gian {X t } qua phép lọc sẽ không xảy ra ở thời điểm t nữa (có thể xảy ra trước thời điểm t nếu arg(T F (λ)) < 0 hoặc sau thời điểm t nếu arg(T F (λ)) > 0).
Chuỗi {Y t } không đổi pha so với {X t } khi và chỉ khi
Có thể xảy ra các trường hợp sau đây: Xét λ ∈ [0, π]
• T F (λ) = 0 với λ ≥ λ 0 Nghĩa là, sau phép lọc, các thành phần có tần số cao trong {X t } đã bị loại bỏ, {Y t } chỉ chứa các thành phần với tần số thấp hơn λ 0 Khi đó, phép lọc được gọi là phép lọc thông thấp (low-pass filter).
• T F (λ) = 0 với λ ≤ λ 0 Khi đó, chuỗi {Y t } chỉ chứa các thành phần có tần số lớn hơn λ 0 Khi đó, phép lọc được gọi là phép lọc thông cao (high-pass filter).
• T F (λ) 6= 0 với 0 ≤ λ 1 ≤ λ ≤ λ 2 Khi đó, phép lọc được gọi là phép lọc thông dải (band-pass filter), {Y t }chỉ chứa các thành phần có tần số nằm trong khoảng λ 1 đến λ 2
Các giá trị λ 0 , λ 1 , λ 2 tương ứng với các trường hợp trên được gọi là tần số cắt (tần số ngưỡng).
Vai trò của hàm lợi ích
Vì |Y (λ)| = |T F (λ)| |X(λ)| và G(λ) = |T F (λ)| 2 nên hàm lợi ích cho biết sự thay đổi biên độ dao động của chuỗi {Y t } so với chuỗi {X t }.
• Nếu G(λ 0 ) > 1, phép lọc sẽ khuếch đại dao động của thành phần tương ứng với tần số λ 0 trong chuỗi {X t }.
• Ngược lại, nếu G(λ 0 ) < 1, phép lọc nén thành phần dao động tương ứng với tần số λ 0
Trong ứng dụng phép lọc, người ta kỳ vọng biên độ dao động của chuỗi đầu ra không thay đổi so với chuỗi gốc, nghĩa là G(λ) = 1 với λ thuộc khoảng tần số mà phép lọc giữ lại.
Phép lọc được gọi là lý tưởng nếu chuỗi ảnh {Y t } có pha và biên độ không thay đổi so với chuỗi gốc {X t }.
TÍNH CHẤT CỦA CÁC PHÉP LỌC TUYẾN TÍNH PHỔ BIẾN
Phần này phân tích tính chất một số phép lọc thường được sử dụng trong nghiên cứu kinh tế như các phép sai phân, phép trung bình trượt, phép lọcHodrick-Prescott và phép lọc Baxter-King Các phân tích được thực hiên thông qua phân tích hàm truyền và hàm lợi ích của các phép lọc tuyến tính nói trên Nếu không nói thêm, chuỗi thời gian được hiểu là chuỗi thời gian dừng.
Phép sai phân
Sai phân bậc nhất và bậc hai
Chuỗi {Y t } được gọi là chuỗi sai phân bậc nhất liên kết với chuỗi {X t } nếu
Y t = X t − X t−1 = (1 − L)X t (2.1) Hàm truyền và hàm lợi ích của phép sai phần bậc nhất là
Vì cos là hàm số chẵn trên [−π, π] nên ta chỉ xét miền xác định của G 1 (λ) là [0, π] Khi đó,
Như vậy, phép sai phân bậc nhất đã loại bỏ các thành phần dao động có tần số rất thấp (≈ 0) trong chuỗi X t (tương đương với có thể loại bỏ các thành phần có chu kỳ dài trong chuỗi ban đầu) Tuy vậy, phép sai phân bậc nhất khuếch đại các thành phần có tần số lớn hơn π
3 Cụ thể, các thành phần có tần số là π 2 được phóng đại lên 2 lần; các thành phần có tần số π được phóng đại lên mức cao nhất, là 4 lần.
Hình 2.1: Đồ thị hàm lợi ích của các phép sai phân bậc nhất và bậc hai.
Chuỗi {Y t } được gọi là chuỗi sai phân bậc hai liên kết với chuỗi {X t } nếu
Y t = (1 − L) 2 X t = [X t − X t−1 ] − [X t−1 − X t−2 ] (2.2) Hàm truyền và hàm lợi ích của phép sai phần bậc hai là
Bảng 2.1 thể hiện giá trị hàm lợi ích tương ứng với các tần số khác nhau của các phép sai phân bậc nhất và bậc hai Tương tự như phép sai phân bậc
Bảng 2.1: Giá trị hàm lợi ích của các phép sai phân bậc nhất, bậc hai λ 0 π
Nguồn: Tính toán của tác giả nhất, phép sai phân bậc hai loại bỏ các thành phần dao động có tần số rất thấp (≈ 0) trong chuỗi gốc Tuy nhiên, sự khuếch đại dao động với các thành phần có tần số cao theo quy luật bình phương so với phép sai phân bậc nhất.
Cụ thể, phép sai phân bậc hai phóng đại thành phần có tần số π 2 lên 4 lần; phóng đại thành phần có tần số π lên 16 lần Hình 2.1 minh họa đồ thị các hàm lợi ích của các phép sai phân bậc nhất và bậc hai Từ đồ thị có thể thấy các phép sai phân bậc nhất và bậc hai có tính chất của một phép lọc thông cao Tuy vậy, vì các hàm truyền không là hàm số chẵn, các phép sai phân bậc nhất và bậc hai làm thay đổi pha của chuỗi ban đầu.
Các phép sai phân bậc nhất và bậc hai (thậm chí các phép sai phân bậc cao hơn) thường được sử dụng trong thực hành với mục đích dừng hóa chuỗi thời gian Mục đích này có thể đạt được bởi vì các phép sai phân này đã loại bỏ các thành phần dao động có tần số rất thấp (≈ 0) trong chuỗi {X t }(tương đương loại bỏ các thành phần có chu kỳ dài trong chuỗi gốc) Tuy vậy,các phép sai phân bậc nhất và bậc hai có thể khuếch đại một số thành phần dao động của {X t } Các thành phần có tần số càng cao (≈ π) thì giá trị hàm lợi ích càng lớn, nghĩa là biên độ dao động của chúng được phóng đại nhiều lần Điều đó cũng đồng nghĩa với việc phóng đại các thành phần bất quy tắc(thành phần nhiễu, thành phần có tần số cao) của {X t } và làm tăng phương sai của chuỗi đầu ra {Y t } so với phương sai của chuỗi gốc {X t } Như vậy, về mặt thực hành, nếu chuỗi {X t } có tần số cao (ví dụ đơn vị tuần, ngày, giờ) thì không nên sử dụng các phép sai phân để khử thành phần xu hướng của{X t } Tuy nhiên, nếu{X t } là chuỗi có tần số thấp (ví dụ đơn vị là tháng, quý,năm) thì các phép sai phân có thể cân nhắc áp dụng.
Sai phân mùa
Bên cạnh loại bỏ thành phần xu hướng, trong thực hành, các chuỗi dữ liệu kinh tế thường bị khử yếu tố mùa Yếu tố mùa thường xuất hiện khi chuỗi thời gian được quan sát nhiều lần trong một năm, ví dụ dữ liệu được quan sát theo tuần, tháng, quý, Khi đó, yếu tố mùa được xem như là yếu tố gây ra những dao động với chu kỳ ngắn (không quá12tháng đối với dữ liệu quan sát theo tháng và không quá 4quý đối với dữ liệu quan sát theo quý) Những dao động này tác động một cách hệ thống tới chuỗi dữ liệu kinh tế, vì thế thường được khử đi trong giai đoạn phân tích sơ bộ Phép khử tính mùa thường được thực hiện bằng phép sai phân theo tần số quan sát trong năm của dữ liệu, gọi là phép sai phân mùa Phép sai phân mùa tần suất quan sát k lần/năm, ví dụ:
• k = 4 (dữ liệu thu thập theo quý): Y t = X t − X t−4 = (1 − L 4 )X t
• k = 12 (Dữ liệu thu thập theo tháng): Y t = X t − X t−12 = (1 − L 12 )X t
• Tổng quát, phép sai phân mùa tần suất k quan sát/năm là:
Y t = (1 − L k )X t = S k (L)X t , k ∈N ∗ (2.3) Hàm truyền và hàm lợi ích của phép sai phân mùa S k (L) = 1 − L k là:
Ta có: max G S k (λ) = 4 ⇔ cos kλ = −1 ⇔ λ = (2l + 1)π k , l ∈N , 2l + 1 ≤ k và G S k (λ) = 0 ⇔ λ = 2hπ k , h ∈N , 2h ≤ k
Cụ thể, với k = 4, phép lọc S 4 (L) = 1 − L 4 loại bỏ các thành phần có tần số bội của π 2 (kể cả bội 0) trong chuỗi ban đầu Ví dụ, giả sử {X t } có các quan sát được thu thập theo quý Gọi thành phần điều hòa đơn giản với tần số là π 2 trong chuỗi là X( π 2 ) (thành phần này có độ dài chu kỳ quan sát là 4 quý) thìX( π 2 )bị khử qua phép lọcS 4 (L) Tuy nhiên, thành phầnX( π 4 )(thành phần này có độ dài chu kỳ là 8 quý) được khuếch đại dao động lên 4 lần (vì cos 4 π 4
Hình 2.2 minh họa đồ thị hàm lợi ích của các phép sai phân mùa với k = 4, 6, 12.
Hình 2.2: Đồ thị các hàm lợi ích của một số phép sai phân mùa.
Các phép sai phân mùa S k (L) có tính chất của một phép lọc thông cao:loại bỏ được thành phần có chu kỳ dài trong chuỗi gốc Bên cạnh đó, S k (L) loại bỏ các thành phần có chu kỳ 2π k , 4π k , 6π k trong chuỗi gốc Tuy nhiên, đối với các thành phần có tần số π k , 3π k , 5π k , các phép sai phân mùa đã phóng đại biên độ lên 4 lần Mặt khác, hàm truyền của phép sai phân mùa không là hàm số chẵn nên các phép lọc sai phân mùa làm thay đổi pha của chuỗi ban đầu.
Phép trung bình trượt
Các phép trung bình trượt phổ biến
Các phép trung bình trượt thường được sử dụng trong thực nghiệm là:
• Trung bình trượt một phía (One-sided Moving Average, OMA).
• Trung bình trượt trung tâm có các trọng số bằng nhau (Central Moving Average, CMA).
• Trung bình trượt đối xứng và tổng các trọng số bằng 0.
Phép trung bình trượt OMA
Hàm truyền và hàm lợi ích của phép lọc OM A k (L) là:
G OM A k (λ) = 0 ⇔ λ = h 2π k , 2h ≤ k, h ∈N ∗ ; sup G OM A k (λ) = 1 = lim x→0 G OM A k (λ).
Tương tự phép sai phân mùa S k (L), trong thực nghiệm, phép lọcOM A k (L) được sử dụng nhằm khử tính mùa của các chuỗi thời gian OM A k (L) có thể loại bỏ các thành phần có tần số dao động là bội khác 0 của 2π k và làm thay đổi pha của chuỗi gốc Tuy nhiên, điểm khác biệt là OM A k (L) giữ lại thành phần có tần số rất bé (≈ 0) và không phóng đại biên độ dao động của các thành phần trong chuỗi gốc Bên cạnh đó, OM A k (L) làm thay đổi pha của chuỗi đầu ra so với chuỗi gốc.
Hình 2.3: Đồ thị hàm lợi ích G OM A k , k = 4, 6, 12.
Phép lọc OM A k (L) giúp loại bỏ các thành phần có tần số dao động là π/2 và π, đạt hiệu quả tốt nhất khi k = 4 Đồ thị hàm lợi ích G OM A k (λ) với các giá trị k khác nhau (k = 4, 6, 12) minh họa rõ ràng khả năng triệt tiêu của phép lọc đối với dao động trong khoảng tần số π.
Khác với phép sai phân mùa S 4 (L), OM A 4 (L) có xu hướng nén các thành phần dao động có tần số trong khoảng 0, π 2
Với thành phần có tần số rất bé, OM A 4 (L) giữ không đổi biên độ dao động Nói cách khác, OM A 4 (L) không loại bỏ các thành phần có chu kỳ dài trong chuỗi {X t } Tính chất này khiến phép lọc OM A 4 (L) là một phép lọc thông thấp.
Phép trung bình trượt CMA
Hàm truyền và hàm lợi ích tương ứng là:
Phép lọc CMA loại bỏ các thành phần có tần số dao động là bội khác 0 của 2π
2K + 1 Đối với thành phần có tần số rất bé, CMA không làm thay đổi biên độ dao động Như vậy, CMA không loại bỏ xu hướng của các thành phần có chu kỳ dài trong chuỗi {X t } Mặt khác, CMA không làm thay đổi pha của chuỗi ban đầu Các phép lọc CMA là các phép lọc thông thấp Hình 2.4 minh họa hàm lợi ích của một số phép lọc trung bình trượt CMA với k = 1, 2, 3, 4.
Phép trung bình trượt đối xứng và tổng các trọng số bằng 0
P j=−K ψ j = 0 nên nếu λ bằng 0 thì hàm truyền bằng 0 Phép lọc này khử được thành phần có chu kỳ rất dài và giữ không đổi pha chuỗi đầu ra.
Hình 2.4: Đồ thị hàm lợi ích của một số phép trung bình trượt CMA.
Ta có thể viết lại ψ(L) = (1 − L −1 )(1 − L)α(L) với α(L) là một phép trung bình trượt đối xứng có K − 1 toán tử tiến (lead) và K − 1 toán tử lùi (lag). Chú ý rằng nhân tử ψ(L) = (1 − L −1 )(1 − L) chính là phép lấy sai phân bậc 2.
Do đó, có thể sử dụng phép lọc trung bình trượt đối xứng với tổng các trọng số bằng 0 để khử thành phần xu thế tất định có dạng bậc hai theo thời gian.
Xấp xỉ các phép lọc lí tưởng bằng phép trung bình trượt
Xấp xỉ phép lọc thông thấp lý tưởng bằng phép trung bình trượt
Nhắc lại, phép lọc thông thấp lý tưởng (LF ideal ) là phép lọc thông thấp và không làm thay đổi biên độ dao động của các thành phần được giữ lại qua phép lọc Hàm truyền của phép lọc thông thấp lý tưởng là hàm số chẵn,
; (2.5) với λ 0 là tần số cắt của phép lọc thông thấp lý tưởng Trong miền thời gian,
LF ideal được viết dưới dạng trung bình trượt đối xứng vô hạn:
Thực hiện biến đổi Fourier ngược đối với hàm truyền cho bởi phương trình (2.5), ta có: b j =
Theo công thức (2.6), khi j → +∞ thì b j → 0 Vì thế, có thể xây dựng một phép lọc thông thấp với tần số cắt làλ 0 bằng phép trung bình trượt hữu hạn
Phép lọc thông thấpLF (L)là một xấp xỉ của phép lọc thông thấp lý tưởng
LF ideal Hình 2.5 biểu diễn hàm lợi ích của các xấp xỉ phép lọc thông thấp với tần số ngưỡng λ 0 = π
2 với K = 4, 8 Khi K tăng, kết quả xấp xỉ sẽ tốt hơn; tuy nhiên chuỗi dữ liệu sau phép lọc sẽ mất nhiều quan sát hơn (số quan sát bị mất là 2K) Vì thế, giá trị K được lựa chọn phụ thuộc vào độ dài chuỗi dữ liệu và yêu cầu độ chính xác của phép xấp xỉ.
Xây dựng các phép lọc thông cao và phép lọc thông dải từ phép trung bình trượt
Khi khử xu hướng một chuỗi thời gian bằng phép lọc, cần thiết kế phép lọc có thể loại bỏ các thành phần dao động với tần số rất bé của chuỗi ban đầu Phép lọc thông cao và phép lọc thông dải là những lựa chọn đáp ứng được yêu cầu đó.
Hình 2.5: Đồ thị hàm lợi ích các xấp xỉ phép lọc thông thấp ngưỡng π/2.
Tương tự phép lọc thông thấp lý tưởng, hàm truyền của một phép lọc thông cao lý tưởng và phép lọc thông dải lý tưởng là hàm số chẵn và:
Khi đó, với cùng tần số cắt λ 0, các hàm truyền của các phép lọc lý tưởng thông cao và thấp có mối quan hệ:
Hàm truyền của phép lọc thông dải lý tưởng là sự kết hợp của hàm truyền các phép lọc thông thấp lý tưởng Ký hiệu T F (1) thấp và T F (2) thấp lần lượt là hàm truyền của các phép lọc thông thấp lý tưởng có tần số cắt là λ 1 và λ 2 Khi đó, hàm truyền của phép lọc thông dải lý tưởng sẽ được xác định theo công thức:
Từ các mối quan hệ này, ta có thể xây dựng được các xấp xỉ phép lọc thông cao và phép lọc thông dải lý tưởng.
Phép lọc Hodrick-Prescott
Bài toán tìm phép lọc Hodrick - Prescott
Hodrick và Prescott đề xuất một phương pháp tìm thành phần {G t } như sau:
Hàm mục tiêu trong bài toán tối ưu cho bởi (2.9) có hai thành phần.
(X t − G t ) 2 đo sự tương thích giữa chuỗi dữ liệu gốc {X t } và thành phần xu hướng {G t }.
[(G t+1 − G t ) − (G t − G t−1 )] 2 là tổng bình phương các sai phân bậc hai của chuỗi {G t }, đo độ trơn của chuỗi {G t }.
Thành phần thứ nhất nhỏ nhất khi và chỉ khi X t ≡ G t Khi đó, độ trơn của {G t } rất lớn và thành phần chu kỳ {C t } bằng 0 Mặt khác, thành phần thứ hai nhỏ nhất khi và chỉ khi chuỗi {G t } có sai phân bậc hai bằng 0 Khi đó, {G t } là một hàm tuyến tính theo biến thời gian t Khi đó, sự tương thích giữa {X t } và {G t } rất kém Như vậy, bài toán tối ưu (2.9) đứng trước sự đánh đổi: sự tương thích giữa {G t } và {X t } với độ trơn của chuỗi{G t } Sự đánh đổi này được điều chỉnh bằng tham số λ > 0, gọi là tham số làm trơn (smoothness parameter).
Lời giải của bài toán (2.9) được xác định như sau:
HPF là một phép lọc tuyến tính Theo King and Rebelo (1993), trong miền thời gian, {G HP F t }là kết quả của một phép lọc trung bình trượt vô hạn
4λ(1 − cos ω) 2 4λ(1 − cos ω) 2 + 1 e iωj dω (2.11) Hàm truyền của HPF là:
4λ(1 − cos ω) 2 + 1 với ω chỉ tần số dao động.
Tính chất của HPF
• T F HP F (ω) là hàm số chẵn trên [−π; π] nên HPF không làm thay đổi pha của chuỗi ban đầu.
• Xét trên ω ∈ [0; π] T F HP F (ω) = 0 khi và chỉ khi ω = 0 nên HPF loại các thành phần có chu kỳ dài Đây là một đặc điểm của phép lọc thông cao.
• Xét trên ω ∈ [0; π], |T F HP F (ω)| < 1, ∀ω Khi ω khá lớn, |T F HP F (π)| ≈ 1 nên HPF gần như giữ nguyên biên độ dao động của các thành phần có tần số cao Đặc điểm này khiến HPF gần giống với một phép lọc thông cao lý tưởng.
Những chú ý khi sử dụng HPF
Áp dụng bộ lọc tần số cao Hodrick-Prescott (HPF), công thức (2.10) xác định hàm xu hướng, phụ thuộc vào giá trị tham số làm mượt λ Theo Hodrick và Prescott, nghiên cứu thực nghiệm trên chuỗi GDP của Hoa Kỳ chỉ ra rằng λ = 1600 là thích hợp cho dữ liệu theo quý Với giá trị này, HPF cô lập các thành phần có tần số nhỏ hơn π.
16 (tương đương với chu kỳ lớn hơn 32 quý) Nói cách khác, thành phần chu kỳ {C t } nhận được sau khi áp dụng HPF chỉ gồm các thành phần dao động có độ dài chu kỳ không quá 32 quý (Hodrick & Prescott, 1997) Hình 2.6 thể hiện đồ thị hàm truyền của HPF với dữ liệu lấy theo quý và năm, tần số cắt tương đương là 8 năm.
Hình 2.6: Đồ thị hàm truyền của HPF với ngưỡng cắt là 8 năm.
• Mặc dù có những tranh cãi về giá trị của tham số làm trơn λ, một đề xuất của Ravn và Uhlig thường được áp dụng trong thực hành là λ s = ( s
Trong đó, λ 4 , λ s lần lượt là tham số làm trơn cho dữ liệu quý và dữ liệu lấy tần suất s lần/năm; m có thể nhận giá trị 3.8 hoặc 4 (Ravn & Uhlig, 2002) Nếu chọn λ 4 = 1600 và m = 4 thì giá trị của tham số làm phẳng với các dữ liệu lấy theo tần suất khác nhau được xác định như sau: λ =
• HPF tạo ra thành phần chu kỳ bị sai lệch tương ứng với các quan sát đầu và cuối chuỗi dữ liệu Khi đó, cách đơn giản nhất để khắc phục là áp dụng HPF cho toàn bộ mẫu nhưng sau đó loại bỏ một số các quan sát ở đầu và cuối mẫu (Baxter & King, 1999).
• HPF có thể sinh ra các mối quan hệ động giả mạo khi các chuỗi ban đầu không tách bạch rõ thành phần xu hướng và chu kỳ Một trường hợp điển hình là bước đi ngẫu nhiên (Hamilton, 2018) Khi đó, nếu mục đích dùng phép lọc tạo ra chuỗi dừng, có thể sử dụng các phép lấy sai phân, phép lấy trung bình trượt hoặc trung bình các giá trị trễ thay vì sử dụng HPF.
• HPF cho kết quả tốt với các chuỗi dữ liệu có xu hướng tương đối ổn định (Hodrick & Prescott, 1997) Ngược lại, nếu chuỗi thời gian có thành phần xu hướng là ngẫu nhiên, áp dụng HPF có thể cho kết quả giả mạo(Dadashova, 2012; Hamilton, 2018).
Phép lọc Baxter-King
Ý nghĩa và công thức của phép lọc Baxter-King
Dựa trên quan sát về chu kỳ kinh doanh thực, Baxter và King cho rằng khi nghiên cứu một chuỗi thời gian kinh tế, cần tách riêng thành phần chu kỳ khỏi các thành phần như: xu hướng - thay đổi rất chậm, mùa vụ, và thành phần bất quy tắc - thay đổi rất nhanh chóng Nói cách khác, chu kỳ kinh doanh thực cần nghiên cứu là thành phần có độ dài chu kỳ không vượt quá p 2 và không bé hơn p 1 (p 1 < p 2 ) Dựa trên ý tưởng đó, Baxter và King xây dựng một phép lọc thông dải bằng cách sử dụng phép trung bình trượt xấp xỉ phép lọc thông dải lý tưởng, ký hiệu là BK K (p 1 , p 2 )(Baxter & King, 1999).
Các trọng số a j được tính theo công thức sau: a j = b j + θ (2.13) b j =
Tính chất và chú ý khi sử dụng BKF
Từ tính chất của phép trung bình trượt, BKF kế thừa những tính chất sau đây:
• Không làm thay đổi pha của chuỗi nhận được so với chuỗi gốc.
• Không làm thay đổi biên độ dao động của thành phần chu kỳ so với chuỗi gốc.
• Kết quả của phép lọc không bị ảnh hưởng bởi chiều dài của chuỗi gốc.
Hình 2.7: Đồ thị hàm truyền của BKF cho dữ liệu quý và năm.
Dựa trên dữ liệu kinh tế của Hoa Kỳ, Baxter và King đề nghị K nên được chọn tương đương với phép trung bình trượt tính trên ba năm quá khứ và ba năm tương lai Cụ thể:
• Đối với dữ liệu quý,K = 12, p 1 = 6, p 2 = 32.Phép lọc thông dảiBK 12 (6, 32) tách thành phần dao động có chu kỳ nằm trong khoảng 6 đến 32 quý.
• Đối với dữ liệu năm, K = 3, p 1 = 2, p 2 = 8 Phép lọc thông dải BK 3 (2, 8) tách thành phần dao động có chu kỳ nằm trong khoảng 2 đến 8 năm.
Tuy nhiên, đối với các nghiên cứu thực nghiệm, giá trị K được chọn tùy thuộc vào độ dài của chuỗi dữ liệu và yêu cầu chính xác của phép xấp xỉ phép lọc thông dải lý tưởng Hình 2.7 thể hiện đồ thị hàm truyền của BKF cho dữ liệu quý và năm được đề xuất bởi Baxter và King.
Nhận xét
Từ những phân tích ở Chương 2, một số tính chất quan trọng của các phép lọc tuyến tính phổ biến được tóm tắt ở Bảng 2.2 Ta có thể rút ra một số khuyến nghị về việc sử dụng các phép lọc tuyến tính trong thực nghiệm như sau:
Bảng 2.2: Các tính chất các phép lọc tuyến tính
Thứ tự Phép lọc Thay đổi pha
Khuếch đại biên độ Khử thành phần chu kỳ dài
1 Sai phân bậc nhất Có Có Có
2 Sai phân bậc hai Có Có Có
3 Sai phân mùa Có Có Có
4 Trung bình trượt OMA Có Không Không
5 Trung bình trượt CMA Không Không Không
6 Thông thấp Không Có, không đáng kể Không
7 Thông cao Không Có, không đáng kể Có
8 Hodrick - Prescott Không Không Có
9 Baxter - King Không Có, không đáng kể Có
Nguồn: Tổng hợp của tác giả
• Với mục đích khử xu hướng: Trừ các phép lọc có tính chất của phép lọc thông thấp như các phép trung bình trượt OMA và CMA, các phép lọc sai phân nói chung, thông cao, HPF, và BKF đều có thể được áp dụng. Tuy vậy, các phép sai phân làm thay đổi pha và khuếch đại một số thành phần dao động trong chuỗi gốc Đặc biệt, các phép sai phân bậc nhất và bậc hai đã phóng đại các thành phần dao động có tần số cao, là các thành phần nhiễu (thành phần bất quy tắc) Do đó, các phép lọc thông cao, HPF và BKF là những lựa chọn hợp lý hơn cho mục đích khử thành phần xu hướng của chuỗi dữ liệu gốc.
• Với mục đích khử tính mùa: Phép sai phân mùa và trung bình trượt một phía OMA có thể được áp dụng Tuy vậy, phép sai phân mùa khuếch đại một số thành phần dao động trong chuỗi gốc Do đó, nếu chỉ với mục đích khử tính mùa, phép trung bình trượt một phía OMA nên được lựa chọn Mặt khác, nếu với mục đích khử tính mùa và khử xu hướng, phép sai phân mùa là lựa chọn hợp lý hơn OMA.
Phần này trình bày nghiên cứu thực nghiệm các phép lọc phổ biến trên chuỗi chỉ số giá chứng khoán VN-Index được thu thập theo tần suất tuần. Trong các nghiên cứu trước đây, phân tích về phép lọc thường áp dụng cho dữ liệu kinh tế vĩ mô Hoa Kỳ theo tần suất năm, quý và tháng Vì thế, các tham số của các phép lọc HPF và BKF được đề xuất dựa vào chu kỳ kinh doanh của nền kinh tế Hoa Kỳ và tần suất lấy dữ liệu mẫu Tại Việt Nam, nghiên cứu thực nghiệm phép lọc trên chuỗi dữ liệu có tần suất cao hơn chưa được thực hiện Trong khi đó, các nghiên cứu về thị trường chứng khoán Việt Nam trên dữ liệu tần suất tuần, ngày, giờ đang thu hút nhiều sự quan tâm Do đó, chúng tôi khảo sát một số phép lọc trên chuỗi chỉ số giá chứng khoán VN-Index tần suất tuần với mục đích phân rã chuỗi VN-Index thành hai thành phần cơ bản: Xu hướng và chu kỳ Hơn nữa, chúng tôi mong muốn bổ sung một sự chọn lựa các tham số cho HPF và BKF trên các chuỗi dữ liệu tuần tại Việt Nam.
Dữ liệu thực nghiệm
Thống kê mô tả
Chuỗi thời gian được sử dụng trong phần này là chuỗi logarit tự nhiên của chỉ số giá chứng khoán VN-Index (ký hiệu LVNI) Trong đó, chuỗi VN-Index được thu thập theo tuần, từ tuần lễ đầu tiên đến ngày 12/05/2021, với tổng số quan sát là 1062 tuần Nhằm tránh hiệu ứng ngày đầu tuần và ngày cuối tuần, mẫu dữ liệu thu thập chỉ số đóng cửa vào thứ Tư Nếu thứ Tư không là ngày giao dịch, chỉ số đóng cửa thứ Năm được chọn thay thế Nếu cả ngày thứ Tư và thứ Năm không giao dịch, trung bình chỉ số các ngày còn lại trong
Bảng 3.1: Thống kê mô tả và kết quả kiểm định nghiệm đơn vị chuỗi LVNI
Trung bình 6.150 Độ lệch chuẩn 0.578
Kiểm định nghiệm đơn vị Dickey–Fuller
Thống kê kiểm định -1.986 Giá trị tới hạn 1% -2.330 Giá trị tới hạn 5% -1.646 Giá trị tới hạn 10% -1.282 Nguồn: Tính toán của tác giả tuần được chọn Hình 3.1 minh họa chuỗi LVNI trong giai đoạn 01/2000 đến 05/2021.
Hình 3.1: Chuỗi LVNI giai đoạn 01/2000 - 05/2021
Bảng 3.1 trình bày các đặc trưng thống kê mô tả của chuỗi LVNI và kết quả kiểm định nghiệm đơn vị Kết quả kiểm định thống kê cho thấy chuỗi LVNI có tính dừng ở mức ý nghĩa 5%.
Bảng 3.2: Các chu kỳ của chuỗi VN-Index
Chu kỳ Đáy bắt đầu Đáy kết thúc Thời gian giữa hai đáy
Nguồn: Tính toán của tác giả
Chu kỳ của chuỗi VN-Index
Theo dõi biến động của chuỗi VN-Index từ năm 2000 đến tháng 5 năm
2021, có thể nhận thấy VN-Index đã trải qua sáu chu kỳ tăng giảm Khoảng cách giữa hai đáy của các chu kỳ liên tiếp nhau từ 30 tháng đến 42 tháng. Chu kỳ có độ dài ngắn nhất là giai đoạn 11/7/2018 - 10/02/2021 (30 tháng) và dài nhất là giai đoạn 17/12/2014 - 11/07/2018 (42 tháng) Có thể nhận định rằng, trung bình độ dài một chu kỳ của chuỗi VN-Index là khoảng ba năm, tính theo tuần là 156 tuần (tương đương tần số là λ 0 = 2π
156) Bảng 3.2 tóm tắt thông tin các chu kỳ của chuỗi VN-Index.
Phương pháp thực nghiệm
Với mục đích loại phân rã chuỗi LVNI thành hai chuỗi xu hướng và chu kỳ đồng thời không làm thay đổi pha, biên độ dao động của thành phần chu kỳ (là thành phần được giữ lại nghiên cứu tùy vào các mục đích cụ thể), các phép lọc thông cao (HF), HPF và BKF nên được chọn Các phép sai phân, trung bình trượt và thông thấp không thỏa mãn các yêu cầu về pha, biên độ dao động và khả năng khử thành phần có chu kỳ dài, vì thế không được áp dụng trong phần nghiên cứu thực nghiệm này.
Các phép lọc HF, BKF phụ thuộc vào giá trị K toán tử trễ và toán tử tiến trong phép trung bình trượt Vì thế, chúng tôi thử nghiệm phép lọc đối với các giá trị K khác nhau Sau đó, căn cứ vào sự ổn định của độ dao động (đo bằng độ lệch chuẩn) và sự ổn định của độ bền (đo bằng hệ số tự tương quan bậc một), giá trị K hợp lý sẽ được chọn Phương pháp xác định K như trên đã được các nghiên cứu trước đây áp dụng (Baxter & King, 1999). Đối với HPF, kết quả phép lọc phụ thuộc vào tham số làm trơn λ Chúng tôi đề xuất một cách ước lượng λ Việc chọn giá trị λ tùy thuộc vào yêu cầu xấp xỉ phép lọc thông cao lý tưởng.
Kết quả thực nghiệm
Xây dựng phép lọc thông cao
Quy trình xây dựng phép lọc thông cao
156, phép lọc thông cao được xây dựng theo quy trình như sau.
• Bước 1: Với mỗi giá trị K, xây dựng phép lọc thông thấp tần số cắt λ 0 = 2π
X j=−K b j L j ; trong đó, b j được cho bởi công thức (2.6).
• Bước 2: Phép lọc thông cao, ký hiệu HF K (L) được xác định:
• Bước 3: Lặp lại Bước 1 và 2 với các giá trị K cho đến khi độ lệch chuẩn và hệ số tự tương quan bậc 1 của các thành phần chu kỳ C t K =
HF K (L)LV N I t tương đối ổn định.
Hình 3.2 và Bảng 3.3 mô tả sự biến thiên của độ lệch chuẩn và hệ số tự tương quan bậc 1 của các chuỗi chu kỳ phân rã từ phép lọc thông cao tần số cắt 2π Khi K tăng từ 4 đến 50, độ lệch chuẩn và hệ số tự tương quan bậc 1 của các chuỗi chu kỳ giảm dần Từ K = 55 trở đi, các giá trị này ổn định Do đó, nên sử dụng K ≥ 55 trong phép lọc thông cao Lưu ý rằng giá trị K càng lớn, HF K càng gần với bộ lọc lý tưởng Tuy nhiên, điều này dẫn đến mất 2K quan sát trong chuỗi chu kỳ thu được Do đó, giá trị K = 55 được đề xuất cho phép lọc thông cao với tần số cắt 2π.
156 Hình 3.3 thể hiện kết quả của phép lọc thông cao với K = 55.
Hình 3.2: Độ dao động và độ bền của các chuỗi chu kỳ từ các HF
Bảng 3.3: Độ dao động và độ bền của các chuỗi chu kỳ từ các phép lọc thông cao HF K
Hệ số tương quan bậc 1 0.9971 0.9963 0.9951 0.9933 0.9909 0.9875 0.9801 0.9712
Hệ số tương quan bậc 1 0.9644 0.9586 0.9656 0.9703 0.9705 0.9683 0.9653 0.9636
Nguồn: Theo tính toán của tác giả
Hình 3.3: Kết quả phép lọc thông cao với K = 55.
Xây dựng phép lọc Hodrick - Prescott
Ước lượng hệ số làm trơn
Kí hiệu HPF(λ) là HPF tương ứng với hệ số làm trơn λ.
Hàm lợi ích của HPF(λ) là
4λ(1 − cos 156 2π ) 2 + 1 2 ; Viết một cách đơn giản:
Vì HPF là một phép lọc thông cao nên sẽ HPF tách được thành phần xu hướng và thành phần chu kỳ với độ dài chu kỳ không quá 156 tuần (tương đương loại bỏ các thành phần có tần số ω ∈ h
0; 2π 156 i ) Nói cách khác hệ số làm trơn λ được xác định sao cho hàm lợi ích G HP (ω) ≈ 0 khi ω ∈h
Nếu cho trước giá trị ε 2 ∈ (0, 1) sao cho
= ε 2 thì λ được tính theo công thức: λ = ε
A(1 − ε) với A = 2.63 × 10 −6 (3.1)Bảng 3.4 giới thiệu một số giá trị của hệ số làm trơn λ tương ứng với các giá trị của ε Nhận thấy, ε 2 càng lớn thì λ càng lớn, khi đó HPF tiệm cận với phép lọc thông cao lý tưởng Tuy nhiên, λ quá lớn thì HPF sinh ra thành phần xu hướng khá phẳng Khi λ nhỏ (tương đương với ε 2 khá nhỏ), HPF không xấp xỉ tốt cho phép lọc thông cao lý tưởng Vì thế, từ bảng 3.4, các giá trị λ nên được chọn trong khoảng [886 900; 1 520 400] Nghiên cứu sử dụng gói lệnh mFilter trong ngôn ngữ R để tính toán các kết quả của HPF.
Bảng 3.4: Ước lượng giá trị hệ số làm trơn λ của phép lọc Hodrick - Prescott ε ε 2 λ
Nguồn: Tính toán của tác giả
Kết quả thực nghiệm: HFK với các giá trị λ
Phần này so sánh các chuỗi chu kỳ nhận được từ các HPF tương ứng với các giá trị λ U = 27 360 000; λ 1 = 886 900; λ 2 = 95 000
Trong đó, λ U = 27 360 000 là giá trị được tính toán theo đề xuất của Ravn và Uhlig cho bởi công thức (2.12) với m = 3.8, λ 4 = 1600.
So sánh với các giá trị λ ở Bảng 3.4, nhận thấy hệ số làm trơn theo đề xuất của Ravn và Uhlig là quá lớn Minh họa ở Hình 3.4 cho thấy đường xu hướng của HPF tương ứng với λ U khá phẳng Như vậy, hệ số làm trơn theo đề xuất của Uhlig không phù hợp với chuỗi LVNI Mặt khác, đường xu hướng tương ứng với λ 2 = 95 000gần như tương đồng với chuỗi LVNI Tuy vậy, hàm lợi ích của phép lọc tương ứng lại là xấp xỉ kém nhất cho hàm lợi ích của phép lọc thông cao lý tưởng Có thể cho rằng, trong ba giá trịλ đang xét, λ 1 = 886 900 là phù hợp nhất.
Xây dựng phép lọc Baxter - King
Chuỗi VN-Index dao động theo chu kỳ trung bình là 156 tuần Trong mỗi chu kỳ, chỉ số VN-Index sẽ có những đợt dao động nhỏ điều chỉnh giá với thời gian không quá 4 tuần Như vậy, có thể cho rằng chu kỳ thực của chuỗi LVNI
Hình 3.4: Kết quả một số phép lọc Hodrick - Prescott
Nguồn: Tác giả gồm các thành phần dao động có độ dài chu kỳ từ 4 đến 156 tuần Do đó, phần này nghiên cứu các BKF với p 1 = 4 và p 2 = 156 tại những giá trị K khác nhau Tương tự quy trình xây dựng phép lọc thông cao, độ lệch chuẩn và hệ số tự tương quan bậc 1 được dùng làm độ đo để xác định giá trị K hợp lý nhất cho BKF.
Quy trình ước lượng phép lọc Baxter-King như sau:
• Bước 1: Chọn giá trị K = K 0 khởi đầu.Tính các giá trị a j , b j θ theo công thức (2.13), (2.14), (2.15).
• Bước 2: Phép lọc Baxter-King, kí hiệu BK K 0 (4, 156) được xác định như sau:
• Bước 3: Lặp lại bước 1 và 2 với các giá trị K tăng dần cho đến khi độ lệch chuẩn và hệ số tự tương quan bậc 1 của các thành phần chu kỳ nhận được từ BK K (4, 156) tương đối ổn định.
Bảng 3.5: Độ dao động và độ bền của các chuỗi chu kỳ từ các phép lọc
Hệ số tương quan bậc 1 0.7236 0.8705 0.9208 0.9402 0.9539 0.9620 0.9689
Hệ số tương quan bậc 1 0.9739 0.9761 0.9768 0.9803 0.9815 0.9808 0.9800
Nguồn: Theo tính toán của tác giả
Bảng 3.5 và Hình 3.5 cho thấy từ K = 36 trở đi, độ lệch chuẩn và hệ số tự tương quan bậc 1 của các chuỗi chu kỳ dần ổn định Giữa yêu cầu xấp xỉ tốt phép lọc thông dải lý tưởng và sự mất mát dữ liệu mẫu, giá trị K phù hợp nhất là 36 Hình 3.6 minh họa các thành phần xu hướng và chu kỳ của chuỗi LVNI nhận được từ BK 36 (4, 156).
Hình 3.5: Độ dao động và độ bền của các chuỗi chu kỳ từ các BKF
Nhận xét
Như vậy, nghiên cứu đã xác định được các phép lọc có thể phân rã chuỗi LVNI thành các thành phần xu hướng và chu kỳ Đó là:
• Phép lọc thông cao HF 55 với tần số cắt λ 0 = 156 2π , K = 55.
• Phép lọc Hodrick-PrescottHP F (886 900)với hệ số làm trơn làλ = 886 900.
• Và phép lọc Baxter-King BK 36 (4, 156) với p 1 = 4, p 2 = 156, K = 36.
Hình 3.6: Kết quả phép lọc BK 36 (4, 156)
Hình 3.7: Các đường xu hướng từ HF, HPF và BKF
Bảng 3.6: Ma trận hệ số tương quan của các chuỗi xu hướng tương ứng
LVNI Trend-HF55 1 Trend-HPF 2 Trend-BKF 3
1,2,3 : Các chuỗi xu hướng tương ứng với các phép lọc HF 55 , HPF(886 900), BK 36
Nguồn: Theo tính toán của tác giả
Biểu đồ 3.7 thể hiện các đường xu hướng của chuỗi LVNI được phân tách bởi ba phương pháp lọc Hệ số tương quan giữa chuỗi gốc LVNI và các đường xu hướng thể hiện trong Bảng 3.6 Các đường xu hướng khá tương đồng với chuỗi ban đầu, trong đó đường xu hướng của BFK có hệ số tương quan cao nhất với LVNI (0,9711) Ngoài ra, đường xu hướng từ phương pháp lọc thông cao cũng cho kết quả tương tự.
HF 55 và Baxter - King BK 36 rất giống nhau về xu hướng vận động Vì thế các chuỗi chu kỳ từ phép lọc HF 55 và BK 36 là tương tự nhau (hệ số tương quan của các chuỗi chu kỳ này trên cùng mẫu với 952 quan sát là 0.9531). Mặt khác, phép lọc Baxter - King BK 36 ít làm mất dữ liệu hơn so với phép lọc thông cao HF 55 Vì thế, BK 36 là lựa chọn tốt hơn so với HF 55.
Phép lọc Hodrick - Prescott sinh ra chuỗi chu kỳ với đầy đủ quan sát của chuỗi gốc Tuy vậy, ở các thời điểm đầu và cuối dữ liệu, đường xu hướng có vẻ không khớp với chuỗi dữ liệu gốc Điều này tương đồng với các nhận định của các nghiên cứu thực nghiệm trước đây (Baxter & King, 1999; Hamilton, 2018) Để tránh vấn đề giả mạo thông tin ở chuỗi chu kỳ của HPF, cần loại dữ liệu ở hai đầu chuỗi Nếu căn cứ vào kích thước mẫu của vàBK 36 , số quan sát nên bị loại bỏ là 72(36quan sát ở đầu chuỗi và 36 quan sát ở cuối chuỗi). Như vậy, đối với chuỗi LVNI, phép lọc Baxter - King BK 36 (4, 156) là lựa chọn tốt nhất để tách thành phần xu hướng và khử các yếu tố mùa, các yếu tố bất quy tắc.
Nghiên cứu đã đánh giá các tính chất đặc trưng của các phép lọc tuyến tính thường được áp dụng trong phân tích chuỗi thời gian thông qua hàm truyền và hàm lợi ích Các phép sai phân bậc nhất, sai phân bậc hai và sai phân mùa tuy có thể loại bỏ thành phần xu hướng, nhưng lại phóng đại biên độ dao động của một số thành phần; đồng thời làm thay đổi mối quan hệ về thời gian của các sự kiện trong chuỗi chu kỳ so với chuỗi gốc Các phép trung bình trượt một phía và trung bình trượt trung tâm là phép lọc thông thấp nên không thể tách được thành phần xu hướng Vì thế, với mục đích phân rã chuỗi dữ liệu thành các thành phần xu hướng và chu kỳ; đồng thời không làm thay đổi pha của chuỗi gốc, các phép lọc thông cao, Hodrick - Prescott và Baxter - King có thể được sử dụng.
Trên chuỗi logarit tự nhiên của chỉ số VN-Index tần số tuần, nghiên cứu đã tìm được các tham số hợp lý nhất cho từng phép lọc Đó là phép lọc thông cao
HF 55 tần số cắt 156 2π loại bỏ các thành phần có chu kỳ lớn hơn 156 tuần trong chuỗi LVNI; phép lọc Hodrick - Prescott với tham số làm trơn λ = 886 900 và phép lọc Baxter - King BK 36 (4, 156) loại bỏ các thành phần có chu kỳ trong khoảng 4 đến 156 tuần Trong đó, phép lọc Baxter - King cho kết quả tốt nhất Các tham số của các phép lọc này có thể được áp dụng với những chuỗi dữ liệu tần suất tuần, có chu kỳ dao động là 156 tuần.