CHƯƠNG 3: PHƯƠNG PHÁP LUẬN VÀ DỮ LIỆU NGHIÊN CỨU
3.2 Dữ liệu nghiên cứu
3.2.2 Xử lý dữ liệu Việt Nam bằng phương pháp Denton-Cholette
Riêng đối với Việt Nam, đặc thù bộ dữ liệu về chi tiêu chính phủ, chi tiêu hộ gia đình và tổng sản lượng quốc nội chỉ báo cáo theo năm. Vì vậy, luận án sử dụng kĩ thuật điều chỉnh Denton-Cholette. Một số các nghiên cứu như Chen (2007), Isaac và cộng sự (2015) đã thực hiện một nghiên cứu so sánh các kết quả phân tách dữ liệu theo quý từ các số liệu theo năm có sẵn. Họ đã chỉ ra rằng phương pháp Denton- Cholette đã cho ra kết quả phân tách chuẩn xác và khắc phục được các nhược điểm của phương pháp Denton (1971) nguyên thủy.
Phương pháp điều chỉnh Denton-Cholette
Phương pháp điều chỉnh Denton vận dụng các phương pháp toán học, dựa trên nguyên tắc bảo toàn biến động so với chuỗi dữ liệu gốc ban đầu. Theo nguyên tắc này, chuỗi xt được phân tách theo quý sẽ duy trì biến động trong chuỗi chỉ báo, bởi vì chuyển động trong chuỗi chỉ báo này là thông tin duy nhất có sẵn.
Gọi zt là chuỗi chỉ báo theo quý. Chuỗi dữ liệu sơ bộ này thường được nội suy đơn giản từ chuỗi dữ liệu tổng hợp theo năm qua thời gian. Trên thực tế, Denton không đặt nặng vấn đề ước tính chuỗi sơ bộ này, mà ông tập trung xử lý vấn đề phân phối các phần dư để đảm bảo các ràng buộc từ chuỗi dữ liệu tổng hợp theo năm.
Ta có, xt biểu thị chuỗi dữ liệu theo quý được ước tính ở các năm cho các kì t = 1, 2,…, T, trong đó T là tổng số kì theo quý trong mẫu. Gọi ym là chuỗi dữ liệu theo năm với m = 1, 2 …, M, trong đó M là tổng số năm trong mẫu. Gọi kmt là tỷ lệ số liệu ước tính theo quý của kì t trong tổng dữ liệu theo năm m. Ngoài ra, gọi t1m và t2m thể hiện quý đầu tiên và cuối cùng của năm thứ m, ví dụ: nếu m = 2 thì chuỗi dữ liệu hàng quý có t = t1m = 5 và t = t2m = 8 tương ứng.
Gọi ∆ là toán tử sai phân bậc 1, ví dụ: ∆xt = xt – xt - 1, ∆zt = zt – zt - 1, ∆xt - ∆zt =
∆ (xt - zt) = (xt - zt) - (xt - 1 – zt - 1). Theo đó, Denton xác định hàm trừng phạt, P (x, z),
trong đó x = (x1 …, xT)’, và z = (z1 …, zT)’ là các vecto cột Tx1 của các giá trị hàng quý được ước lượng và chỉ báo theo quý. Giải pháp toán học của mô hình điều chỉnh Denton là chọn ra các giá trị ước tính theo quý cuối cùng, x, sao cho tối thiểu hàm trừng phạt P (x, z), tuân theo các ràng buộc theo chuỗi số liệu tổng hợp theo thời gian:
𝑦𝑚 = ∑ 𝑘𝑚𝑡𝑥𝑡
𝑡2𝑚
𝑡=𝑡1𝑚
Đặt B là ma trận TxM mô tả các giá trị ước tính hàng quý ứng với các ràng buộc hàng năm; và đặt A là ma trận trọng số TxT. Như vậy, mô hình Denton có thể được thể hiện dưới dạng ma trận như sau:
Minx P(x, z) = (x − z)'A(x − z), Với ràng buộc:
y = B’x
Lời giải để tìm ra các giá trị ước tính theo quý cuối cùng là:
x = z + C(y – B’z)
Trong đó, y – B’z đo lường phần dư theo năm và C đại diện cho quy tắc phân phối mức độ các phần dư theo năm cho từng thời kỳ theo quý. Nếu A là ma trận ITxT, thì C sẽ là ma trận nghịch đảo của số thời kỳ theo quý trong một năm. Các phần dư theo năm này sẽ được phân phối đều cho từng kì theo quý. Rõ ràng, đó không phải là một lựa chọn tốt đối với quy tắc phân phối này. Vì vậy, Denton đã đưa ra một số biến thể cho mô hình bảo tồn chuyển động ban đầu của mình dựa trên sự sai phân bậc một hoặc cao hơn cho các chuỗi dữ liệu ước tính theo quý cuối cùng và các chuỗi chỉ số.
Trong đó, mô hình biến thể dựa trên sai phân bậc một được sử dụng rộng rãi nhất.
Biến thể về sai phân bậc một của mô hình Denton cũng duy trì sự thay đổi giữa các kì trong mẫu của các giá trị theo quý được ước tính cuối cùng và các giá trị chỉ báo, (xt - zt), trong các ràng buộc theo năm. Kết quả là, xt sẽ có xu hướng song hành
với zt. Mục tiêu trong trường hợp này là tối thiểu hóa tổng bình phương ∆(xt - zt), do đó hàm trừng phạt lúc này sẽ là:
𝑃(𝑥, 𝑧) = ∑[∆(𝑥𝑡− 𝑧𝑡)]2
𝑇
𝑡=1
Denton áp đặt các điều kiện ban đầu là không có điều chỉnh nào được thực hiện ở các giá trị chỉ báo nằm ngoài mẫu. Do đó, trong các biến thể sai phân bậc một, điều kiện ban đầu sẽ dựa trên x0 = z0. Các điều kiện ban đầu như vậy gây ra một sự giới hạn lớn cho phương pháp Denton phiên bản nguyên thủy, bởi vì nó gây ra một chuyển động thoáng qua ở đầu chuỗi giá trị. Nó buộc các chuỗi giá trị theo quý được ước tính cuối cùng phải bằng với chuỗi số liệu ban đầu ở thời điểm 0 và chỉ thực hiện tối thiểu hóa cho thay đổi đầu tiên (x1 - z1). Những chuyển động nhất thời như vậy sẽ làm vi phạm nguyên tắc bảo toàn các chuyển động của dữ liệu gốc. Cholette (1988) đã đưa ra giải pháp cho vấn đề này bằng cách điều chỉnh hàm trừng phạt đối với biến thể tổng sai phân bậc một thành:
𝑃(𝑥, 𝑧) = ∑[∆(𝑥𝑡− 𝑧𝑡)]2
𝑇
𝑡=2
Biến thể sai phân bậc một được điều chỉnh này đã loại bỏ chính xác kì đầu tiên để giải quyết nhược điểm của phương pháp Denton ban đầu. Điều này đã được minh họa ở hình 12 và hình 13 bên dưới. Ta nhận thấy rằng, với cách xử lý của Denton- Cholette, chuỗi dữ liệu được điều chỉnh theo quý đã bảo toàn những chuyển động của chuỗi dữ liệu gốc ban đầu theo năm.
Hình 2: Số liệu của Việt Nam theo tần suất quan sát năm