Chương 4: Đánh giá định lượng các FTA liên quan đến Việt Nam sử dụng mô hình lực hấp dẫn
4.2 Các đặc tính của mô hình
4.2.1 Các yêu cầu về số liệu
62 Biến số phụ thuộc về thương mại song phương được thể hiện thông qua kim ngạch thương mại, xuất khẩu hoặc số liệu đáng tin cậy hơn là nhập khẩu (sử dụng từng cấu phần chứ không phải là tổng kim ngạch cho phép xác định tác động riêng của chuyển hướng xuất khẩu hoặc nhập khẩu). Như đã chỉ ra ở phần trên, số liệu thường có các giá trị 0 đối với thương mại song phương, bao gồm cả trường hợp mà thương mại trong cùng “một nước” được đưa vào để thể hiện được thương mại nội khối của một nhóm nước như EU, cũng có thể có thương mại giữa các nước thành viên bằng 0 một khi số liệu được cấu trúc, ví dụ theo mảng.
Để nhất quán, một tập hợp tương ứng của 23 nước/nhóm như trong phân tích CGE bao gồm các FTA đang được xem xét sẽ được phân tích, mặc dù trọng tâm ở đây là về AFTA, cộng với các đối tác thương mại lớn của Việt Nam trong tập hợp này (xem Bảng 3.1 về danh sách các nước/vùng). Việc gộp nhóm này làm nảy sinh các vấn đề về gộp biến số sẽ được phân tích chi tiết dưới đây, như các biến giả thể hiện biên giới chung, ngôn ngữ, v.v…
Việc phân tích các FTA có thể được thực hiện thông qua việc so sánh một loạt các nước, một số trong đó là các thành viên của một FTA đã được thực hiện và đủ dài về thời gian để gây ra ảnh hưởng (cách tiếp cận theo chiều ngang tại một thời điểm), hoặc thông qua việc so sánh thương mại của các nước trước và sau khi FTA được tiến hành và gây ra ảnh hưởng (cách tiếp cận theo thời gian) hoặc tập hợp của cả hai cách (cách tiếp cận theo mảng). Do vậy, cần phải có số liệu sau quá trình thực hiện và khi có bất cứ tác động nào của các FTA, hoặc trước khi thực hiện nếu tác động sẽ được phân tích theo cách tiếp cận theo thời gian trong phạm vi một nền kinh tế hơn là giữa các nền kinh tế là thành viên hoặc không phải là thành viên của FTA như trong phân tích theo chiều ngang.
Sử dụng số liệu theo mảng, chứ không phải là số liệu theo chiều ngang hoặc theo thời gian, có một số lợi thế bổ sung, ngoài việc chúng xử lý được cả hai vấn đề thay đổi giữa các nước tại một thời điểm (theo chiều ngang) và thay đổi theo thời gian, còn có thể cho phép khống chế tác động của tính chất hỗn tạp (biến động không bình thường), tuy phù hợp nhưng không quan sát và đo đếm được giữa các nền kinh tế hoặc theo thời gian. Các tác động cố định (hiện diện bằng các biến số như khoảng cách không đổi giữa tất cả các nhà xuất khẩu/nhập khẩu) có thể được ước lượng trực tiếp, khác với các tác động ngẫu nhiên (các biến số với dạng hàm phân phối cụ thể), thường dựa trên giả định mạnh rằng các tác động không quan sát được không tương quan với các tác động quan sát được.
Bảng 3.1 trong PC (2003) đưa ra các giải thích về các biến số độc lập thể hiện thương mại song phương trong mô hình lực hấp dẫn mở rộng trong mục quy mô, (“khoảng cách”) địa lý, tiền tệ và giá cả, chính sách và thể chế:
Biến số về quy mô
63
• Thu nhập, tích số của thu nhập, tổng các loại thu nhập, sự tương đồng của thu nhập, thu nhập đầu người, tích số của thu nhập theo đầu người, sự khác nhau tuyệt đối về thu nhập đầu người;
dân số, đất canh tác.
Biến số về địa lý
• Khoảng cách (cả tích số của diện tích bề mặt); đảo; quốc gia không có biển; nước cận kề; ngôn ngữ; vùng sâu vùng xa; chi phí vận tải (tỷ lệ giá cif/fob)
• Biến số về tiền tệ và giá cả
• Đồng tiền chung; biến động về tỷ giá; giá cả (giá bán buôn, đơn vị, sức mua tương đương, tỷ giá – khía cạnh Armington).
Biến số về chính sách và thể chế
• Thuế quan, hàng rào phi thuế quan (NTB), thuế xuất khẩu; dòng thương mại trễ; quan hệ thuộc địa; quyền sở hữu trí tuệ, tham nhũng.
Dữ liệu GTAP ví dụ như với thương mại, GDP, khoảng cách và thuế quan theo cùng đơn vị như trong mô hình tiền kỳ được sử dụng khi có thể để duy trì sự nhất quán với mô hình GTAP. ARTNeT (2008- 9) gắn mô hình lực hấp dẫn tương tác với cơ sở dữ liệu có thể cung cấp số liệu theo thời gian cho mô hình lực hấp dẫn cơ bản từ năm 1994 đến năm 2007 và số liệu theo mảng, bao gồm cả một số chỉ số về thuận lợi hóa thương mại và luật lệ sau biên giới; nhưng chúng chỉ cho phép ước lượng mô hình theo phương pháp bình phương nhỏ nhất (OLS) (xem TradeMap (www.trademap.org) về việc này).
Hầu hết yêu cầu về số liệu cho mô hình đã nêu là dưới dạng biến số giả, ví dụ như yêu cầu về địa lý, nhưng các số liệu này sẵn có từ nhiều nguồn khác nhau như CEPII (http://www.cepii.fr/anglaisgraph/bdd/distances.htm) và cơ sở dữ liệu mô hình lực hấp dẫn của Rose (http://faculty.haas.berkeley.edu/arose).
4.2.2. Dạng hàm của mô hình
Dạng hàm của mô hình lực hấp dẫn, mặc dù ban đầu được dựa trên khái niệm phi kinh tế, trong những năm gần đây được giải thích trên cơ sở lý thuyết kinh tế, bao gồm cả sự khác biệt giữa các loại hàng hóa là điều giải thích cho hiện tượng thương mại nội ngành giữa các nước có cùng quy mô (PC 2010).
Lý thuyết này có tầm quan trọng vì một số lý do, trong đó có việc đưa các biến số năng lực cạnh tranh truyền thống như giá cả vào trong mô hình. Dạng hàm tổng quát dựa trên dạng hàm rút gọn của PC bao gồm cả yếu tố “làn sóng thứ 3” như đầu tư, là:
64 LnYijt = ai +aj +at + b1LnSGDPijt + b2RLFAijt + b3SIMijt + b4LnDISij + b5LnRERijt + b6LnTARijt + b7LINij + b8BORij + b9COLij + b10CURij + b11ISi + b12ISj + b13LOCi +b14LOCj + SumMRTAij + SumMRTAi-j + SumMRTAj-i + ERRijt
Trong đó
Ln là log tự nhiên
Yijt là giá trị của xuất khẩu từ nước i sang nước j trong năm t ai, aj, và at là các hiệu ứng cố định/ngẫu nhiên
SGDPijt là tổng của GDP của nước i và nước j trong năm t
RLFAijt là sự khác nhau tuyệt đối về GDP đầu người giữa nước i và nước j trong năm t SIMijt là sự tương đồng về GDP gộp giữa nước i và nước j trong năm t
DISij là khoảng cách giữa hai thành phố lớn nhất hoặc thủ đô của các nước i và j RERijt là tỷ giá thực giữa nước i và nước j trong năm t
TARijt là thuế quan trung bình giữa nước i và nước j trong năm t LINij là sự tương đồng về ngôn ngữ giữa nước i và nước j
BORij là biến giả thể hiện biên giới chung trên đất liền giữa nước i và nước j COLij là biến giả thể hiện quan hệ thuộc địa giữa nước i và nước j
CURij là biến giả về đồng tiền chung giữa nước i và nước j ISi/ISj là biến giả về đảo quốc của nước i và nước j
LOCi/LOCj là các biến giả về quốc gia không có biển của nước i và nước j
SumMRTAij là biến giả = 1 nếu cả 2 nước i và j cùng thuộc một FTA (k tại thời điểm t) SumMRTAi-j là biến giả = 1 nếu nước nhập khẩu j thuộc một FTA cụ thể
SumMRTAj-i là biến giả = 1 nếu nước xuất khẩu i thuộc một FTA cụ thể ERRijt là sai số.
Trong phân tích PC (2010b) sau này, một dạng hàm khái quát và đơn giản hơn sử dụng các biến số giả nhiều hơn, được sử dụng khi dòng thương mại song phương phụ thuộc vào log của tổng GDP, log của sự tương đồng về GDP, log của thu nhập đầu người tương đối, biến số giả thể hiện tác động của FTA nội nhóm (có lẽ bao gồm cả đãi ngộ GSP), và tác động FTA ngoại nhóm đối với thành viên đối với nhập khẩu và xuất khẩu giữa các thành viên và các nước không phải thành viên; biến số giả về thời gian thể hiện thay đổi về mức độ thương mại toàn cầu, và biến số giả hiệu ứng cố định mang tính phi đối xứng quốc gia (ví dụ khoảng cách) thể hiện thay đổi trong đối kháng thương mại đa phương phi đối xứng bình quân giữa các nước (xem Anderson và Van Wincoop 2003). Biến số giả FTA trong trường hợp này cũng được sử dụng trong nghiên cứu này là:
• FTADUM1 thể hiện thay đổi trong thương mại giữa các thành viên và có giá trị 1 nếu cả nước nhập khẩu và xuất khẩu cùng là thành viên, và 0 nếu ngược lại;
65
• FTADUM2 thể hiện thay đổi trong nhập khẩu vào các thành viên từ các nước không phải thành viên, có giá trị 1 nếu nước nhập khẩu là thành viên và nước xuất khẩu không phải thành viên, và là 0 nếu ngược lại; và
• FTADUM3 thể hiện thay đổi trong xuất khẩu từ các thành viên sang các nước không phải thành viên, có giá trị 1 nếu nước xuất khẩu là thành viên và nước nhập khẩu không phải là thành viên và ngược lại.
Trong phân tích này, các dạng hàm nêu trên được rút ra cùng với các phương sai để kiểm định các quy mô khác nhau, khoảng cách (ví dụ tổng diện tích bề mặt), tiền tệ/giá cả (ví dụ biến động tỷ giá), chính sách/thể chế (ví dụ tham nhũng/tạo thuận lợi cho kinh doanh), và các biến số giả. Do việc cộng gộp một số nước vào nhóm nước như EU, Châu Mỹ Latin, v.v…, log của tổng chứ không phải là tích số của diện tích bề mặt được dùng cho biến số để có tính đại diện hơn cho một khu vực gộp. Tuy nhiên, phần dưới đây cho thấy giá trị ước lượng được có dấu dương, và điều này nhất quán hơn với biến số này, là biến đại diện cho quy mô (thể hiện tổng đất đai có được), chứ không phải khoảng cách như đã mô tả.
Có sự đánh đổi giữa việc có được dạng hàm tổng quát giải quyết được sự ước lượng chệch do có biến số bị bỏ qua với việc đưa vào các biến số thừa làm giảm khả năng giải thích và gây ra đa cộng tuyến (tương quan lớn giữa các biến số giải thích). Việc lựa chọn mô hình dựa trên ước lượng về lý thuyết kinh tế là cơ sở cho dạng hàm và việc chẩn đoán mô hình là những điều quan trọng để đạt được sự đánh đổi hợp lý giữa hai vấn đề nêu trên.
4.2.3. Kết quả ước lượng
Như được nêu ở trên, một vài giá trị 0 của biến số phụ thuộc nếu thể hiện dưới dạng hàm log tự nhiên có thể gây khó khăn trong ước lượng, nhưng nếu vứt bỏ các số liệu này không chỉ làm mất các số liệu có giá trị và hợp lệ mà còn làm sai lệch kết quả. PC (2003) sử dụng ước lượng Tobit để khắc phục hạn chế của các biến số phụ thuộc. Các phương pháp ước lượng khác được sử dụng để giải quyết các vấn đề liên quan. Ví dụ ARTNeT (2008) sử dụng hàm Probit về khả năng hai nước có thương mại với nhau, là hàm cho phép khắc phục vấn đề ước lượng chệch do loại bỏ các giá trị thương mại bằng 0.
Phương pháp ước lượng tối đa hóa khả năng Poisson Pseudo (hoặc kiểu này) được sử dụng để khắc phục vấn đề các quan sát với giá trị 0, cũng như vấn đề số liệu hỗn tạp do chuyển sang dạng log phi tuyến, là việc gây ra các ước lượng không nhất quán (xem Cheng 2008). PC (2010b) cũng sử dụng ước lượng Poisson27. Ước lượng Poisson chủ yếu dựa trên số liệu “đếm được”, hoặc số nguyên
27Tuy nhiên, theo một nhà phê bình tại hội thảo khi PC (năm 2010) được thuyết trình, thì cách tiếp cận 2 bước của Cragg (1971) được cho là phù hợp hơn, đặc biệt khi phần lớn các quan sát của biến số phụ thuộc bằng không.
66 dương, và điều này có thể ảnh hưởng đến nội dung thông tin của các biến số, như khi chúng ở dạng log thì việc làm tròn số chỉ tạo ra lượng khác biệt rời rạc.
Tất cả các phương pháp ước lượng đều có hạn chế này hay hạn chế khác. Ngân hàng Thế giới (2005) xử lý vấn đề này bằng cách sử dụng 3 phương pháp ước lượng khác nhau (OLS, OLS với hiệu ứng cố định và Tobit) và cho rằng các ước lượng này là vững về mặt thống kê chỉ khi nếu tất cả 3 phương pháp đều cho thấy tác động quan trọng về thống kê với cùng dấu. Phân tích sau được mô tả dưới đây kết hợp cách tiếp cận liên quan.