2.2.2.1 Mô hình đánh giá tác động của tự do hóa thương mại tới ô nhiễm môi trường
Đểước lượng tác động của tự do hóa thương mại tới ô nhiễm môi trường ngành công nghiệp, NCS sử dụng mô hình dưới dạng hàm tải lượng ô nhiễm tổng quát được đề xuất trong nghiên cứu của Hettige và cộng sự (Hettige và cộng sự, 1996) như sau:
P = β0 +β1 X+ β2 T+ β3 D+ui (1)
Trong đó, P là mức độ ô nhiễm, X là véc- tơ các yếu tố đầu vào, T là biến đại diện cho tự do hóa thương mại, D là véc – tơ tập hợp các biến giả, ui là số hạng sai số ngẫu nhiên.
Từ hàm tải lượng ô nhiễm tổng quát, NCS xây dựng mô hình nghiên cứu tải lượng ô nhiễm của một doanh nghiệp và biểu diễn dạng tuyến tính như sau:
Pijt = β0 +β1 Xijt +β2 Tijt +Dijtβ3 +ui (2)
Trong đó, Pijt là mức độ ô nhiễm (được đo bằng ô nhiễm chất độc, kim loại, nước, không khí) của doanh nghiệp thứ i thuộc ngành j theo thời gian t; Xijt là yếu tố đầu vào; T là biến sốđại diện cho mở cửa thương mại; D là véc tơ các biến kiểm soát bao gồm kiểm soát về quy mô doanh nghiệp, loại hình doanh nghiệp và vùng miền phân bố; β là các véc - tơ hệ số của các tham số phù hợp; ui là số hạng sai số ngẫu nhiên.
Ngoài ra, để đánh giá tổng quát hơn về tác động của tự do hóa thương mại đến ô nhiễm môi trường ở cấp độ ngành, mô hình được sử dụng dưới dạng tuyến tính là:
Pjt = β0 +β1 Xjt +β2 Tjt + Djtβ3 +ui (3)
Trong đó, Pjt là mức độ ô nhiễm (được đo bằng ô nhiễm chất độc, kim loại, nước, không khí) của ngành thứ j theo thời gian t; Xjt là yếu tố đầu vào; T là biến số đại diện cho mở cửa thương mại; D là véc tơ các biến kiểm soát bao gồm kiểm soát về loại ngành và vùng miền phân bố; β là các véc – tơ của các hệ số của các tham số phù hợp; ui là số hạng sai số ngẫu nhiên.
2.2.2.2 Phương pháp ước lượng
Mô hình có thểđược ước lượng theo phương pháp hồi quy dữ liệu mảng với các mô hình như sau: Mô hình hồi quy gộp (Pooled Model); Mô hình hồi quy ngẫu nhiên (Random Effects Model – REM); Mô hình hồi quy cốđịnh (Fixed Effects Model- FEM).
Mô hình chung của dạng số liệu mảng như sau:
Yit = β0 + βi*Xit + vit hay Yit = β0 + βi*Xit +ci + uit (vit = ci + uit) (4) Trong đó Yit là biến phụ thuộc; Xit là véc tơ các biến giải thích, vit là các yếu tố ngẫu nhiên, ci là biến không quan sát được (thể hiện đặc điểm riêng của từng quan sát hoặc từng đơn vị), uit thỏa mãn các giả thiết của phương pháp ước lượng bình phương tối thiểu OLS.
Mô hình hồi quy gộp POLS
Nếu không có cit thì mô hình (4) khi được viết lại dưới dạng mô hình hồi quy gộp (Pooled Model) như sau:
Yit = β0 + βi*Xit + uit (4.1)
Trong đó Yit là biến phụ thuộc ; Xit là véc- tơ các biến giải thích trong phương trình 4. Tuy nhiên, mô hình hồi quy gộp thực tế chỉ là mô hình đơn giản với phương pháp ước lượng bình phương nhỏ nhất (OLS). Phương pháp OLS này thích hợp trong những trường hợp dữ liệu không tồn tại các yếu tố riêng biệt (từng doanh nghiệp) và yếu tố thời gian. Gujarati (2004) khẳng định rằng việc sử dụng phương pháp OLS bỏ qua sự kết hợp giữa bình diện không gian và yếu tố thời gian của dữ liệu sẽ khiến kết quả ước lượng bị sai lệch. Chính vì vậy, người ta thường sử dụng hai phương pháp ước lượng các tác động cố định (FEM) và những tác động ngẫu nhiên (REM) để ước lượng một cách chuẩn xác hơn trong trường hợp mô hình tồn tại các yếu tố riêng biệt cit.
Mô hình tác động cốđịnh FEM
Mô hình FEM cho rằng tồn tại những đặc điểm riêng của mỗi quan sát trong mô hình và chúng ảnh hưởng đến các biến giải thích, đồng thời tồn tại sự tương quan giữa phần dư các thực thể đó với biến giải thích. Mô hình FEM sẽ giúp tách những ảnh hưởng này ra khỏi biến giải thích, do đó mô hình sẽ ước lượng được những tác động thực của biến giải thích lên biến phụ thuộc trong mô hình.
Mô hình FEM có dạng như sau:
Yit = β0 + βi*Xit + ci + uit (4.2)
Mô hình FEM được ước lượng bằng phương pháp hồi quy cổ điến với biến giả hoặc phương pháp biến đổi dọc như sau:
Có : Yi = β0 + βi*Xi + ci + uit
(X X ) (u u)
Y
Yit− i=β1 it− t + it− i
Phương pháp này giúp loại bỏ những ảnh hưởng theo chiều ngang của ci và chỉ còn lại những ảnh hưởng theo chiều dọc. Vì thế hàm còn có tên gọi là ước lượng dọc.
Mô hình hồi quy ngẫu nhiên REM
Khác với mô hình FEM, mô hình REM xem các đặc điểm riêng giữa các quan sát là ngẫu nhiên và không tương quan đến các biến giải thích. Mô hình REM coi các phần dư của mỗi quan sát là một biến giải thích mới khi mà đi sâu vào phân tích tác động của ci lên sự thay đổi của tổng thể. Mô hình REM sử dụng phương pháp ước lượng bình phương tối thiểu tổng quát (GLS). Phương pháp ước lượng này giúp xem xét đến cơ cấu tương quan của phần dư trong mô hình REM.
Để lựa chọn mô hình hiệu quả nhất, các kiểm định được sử dụng bao gồm: kiểm định nhân tử Lagrange (xttest0) lựa chọn giữa mô hình POLS với RE. Trong đó, H0 là phương sai của sai số qua các đơn vị là không đổi hay mô hình POLS phù hợp hơn. Kiểm định Hausman (Hausman, 1978) để lự chọn giữa mô hình RE và mô hình FE. Trong đó, H0 là không có sự khác biệt giữa hai mô hình.
Tuy nhiên, bất kể kết quả kiểm định Hausman như thế nào, đối với dữ liệu bảng không cân bằng và T nhỏ, N lớn thì mô hình hiệu ứng ngẫu nhiên hiệu quả hơn mô hình hiệu ứng cốđịnh (Judge, 1980), (Johnston và DiNardo, 1997), (Taylor, 1980).
Cuối cùng, mô hình được lựa chọn sẽ sử dụng hồi quy robust để kiểm soát các vi phạm về phương sai thay đổi và tự tương quan của sai số ngẫu nhiên (Wooldridge, 2002), (Greene, 2003).
2.2.2.3 Dữ liệu i) Nguồn dữ liệu
Trong nghiên cứu này NCS sử dụng dữ liệu doanh nghiệp được chiết từ bộ Điều tra Doanh nghiệp (GES) do Tổng cục Thống kê (GSO) thực hiện trong giai đoạn 2006 - 2014. Bộ dữ liệu điều tra doanh nghiệp cung cấp một nguồn thông tin phong phú ở cấp độ doanh nghiệp, ngành, bao gồm: giá trị xuất nhập khẩu, năm thành lập, ngành hoạt động, hình thức sở hữu, cơ cấu vốn, cơ cấu việc làm, vùng miền phân bố. Các thông tin này được khai thác để có một tập hợp dữ liệu về đặc điểm của doanh nghiệp, ngành để sử dụng cho khung phân tích đã nêu trên.
Mặc dù trong bộ dữ liệu điều tra doanh nghiệp GES, các doanh nghiệp có báo cáo về chất thải công nghiệp của doanh nghiệp, nhưng thông tin này không bao gồm “hàm lượng ô nhiễm” của chất thải và không đầy đủ. Vì vậy, luận án sử dụng hệ thống ước tính ô nhiễm công nghiệp của Ngân hàng thế giới (IPPS) để ước tính tải lượng ô nhiễm cho các doanh nghiệp thuộc ngành chế biến, chế tạo. IPPS được xây dựng dựa trên giả thuyết rằng: ô nhiễm công nghiệp được xác định theo quy mô hoạt động, cấu tạo ngành, và công nghệ sử dụng trong quá trình sản xuất. IPPS quy đổi các thông tin việc làm, giá trị gia tăng, sản lượng thành cường độ ô nhiễm. Cường độ ô nhiễm được định nghĩa là: lượng ô nhiễm trên một đơn vị hoạt động gây ra bởi các chất gây ô nhiễm. Sau đó, cường độ ô nhiễm được dùng làm mức ô nhiễm ước tính, Hettige và cộng sựđã đưa ra nghiên cứu về cường độ ô nhiễm năm 1996 (Hettige và cộng sự, 1996).
Cường độ ô nhiễm = Lượng ô nhiễm
Một đơn vị hoạt động gây ra ô nhiễm
ii) Xử lý dữ liệu
Để có bộ dữ liệu mảng hoàn chỉnh phục vụ cho nghiên cứu, NCS đã xử lý, ghép nối từng bộ số liệu như sau:
Bước 1: Đọc và nghiên cứu bảng hỏi của bộ số liệu vềđiều tra Doanh nghiệp từ 2006 - 2014.
Bước 2: Giữ lại các chỉ tiêu cần thiết cho nghiên cứu. Do tên các chỉ tiêu qua các năm có sự thay đổi nên phải đổi tên các chỉ tiêu nghiên cứu cho đồng nhất.
Bước 3: Nối số liệu các năm lại với nhau và thiết lập số liệu bảng theo mã của ngành, doanh nghiệp và năm nghiên cứu thu được bộ số liệu bảng cho doanh nghiệp và ngành.
Bước 4: Ước tính tải lượng ô nhiễm của doanh nghiệp từ bộ số liệu của IPPS. Bước 5: Ghép mã ngành của IPPS và bộ số liệu về điều tra DN. IPPS sử dụng phân loại ngành công nghiệp theo tiêu chuẩn quốc tế (ISIC) phiên bản lần thứ 2, còn số liệu điều tra DN sử dụng phân loại ngành công nghiệp theo tiêu chuẩn Việt Nam (VSIC) phiên bản lần thứ 4. Do đó, NCS phải quy đổi tiêu chuẩn ISIC theo tiêu chuẩn VSIC.
Bước 6: Giảm giữ liệu, chỉ giữ lại những doanh nghiệp đang hoạt động, có giá trị xuất nhập khẩu, loại bỏ những doanh nghiệp có thông tin không hợp lý.
iii) Biến số và thước đo
* Biến phụ thuộc
Hệ thống IPPS sử dụng ba loại hệ số ô nhiễm, bao gồm: (i) các hệ số dựa vào sản lượng; (ii) các hệ số dựa vào giá trị gia tăng; (iii) các hệ số dựa vào việc làm. Cả ba loại hệ số trên đều được nhận thấy có tương quan cao với nhau. Nhưng ô nhiễm và việc làm được nhận thấy có biến thiên cùng chiều nên các hệ số dựa vào việc làm thường được dùng đểước tính ô nhiễm ở các nước đang phát triển. Điều này được giải thích trong nghiên cứu của Hettige và cộng sự năm 1995. Ngoài ra, hệ thống IPPS được kiểm tra với bộ dữ liệu ngành ở Mỹ và ở Indonesia cho ô nhiễm nguồn nước, nghiên cứu cho thấy sự thay đổi cao đối với cường độ ô nhiễm dựa trên hệ số lao động. Mặc khác, bộ số liệu điều tra doanh nghiệp của GSO không có các thông tin về sản lượng, giá trị gia tăng. Vì vậy trong luận án, NCS dựa vào việc làm để suy tính giá trị ước tính tải lượng ô nhiễm .
Cường độ ô nhiễm = Lượng ô nhiễm (kg) 1.000 (Lao động)
Tải lượng ô nhiễm = Lượng ô nhiễm (kg) * Tổng lao động của doanh nghiệp 1.000 (Lao động)
Tải lượng ô nhiễm được lấy logarit trước khi đưa vào mô hình nghiên cứu. Đối với mỗi chất ô nhiễm không khí, nước và các chất độc hại cho hơn 240 hóa chất và kim loại, IPPS cung cấp một giá trị giới hạn thấp, giá trị giới hạn cao và giá trị giới hạn trung vị. Trong nghiên cứu của WB áp dụng IPPS để tính ảnh hưởng ô nhiễm từ các ngành công nghiệp năm 2008, đã sử dụng giá trị giới hạn thấp của cường độ ô nhiễm, để áp dụng cho nhiều biện pháp bảo toàn của cường độ ô nhiễm. Vì vậy, trong luận án này NCS cũng sử dụng giá trị giới hạn thấp của cường độ ô nhiễm.
Cuối cùng, dựa vào nghiên cứu của Hettige và cộng sự (1995, trang 4) thì “các cường độ ô nhiễm theo ngành luôn luôn có phân phối theo hàm số mũ, với một ít ngành cường độ cao và nhiều ngành cường độ rất thấp”. Như vậy các giá trịước tính ô nhiễm nên được thực hiện ở càng chi tiết càng tốt. Vì vậy NCS sử dụng các hệ số ô nhiễm ở cấp độ 4 chữ số, đây là cấp độ chi tiết nhất hiện có trong hệ thống IPPS.
* Nhóm biến giải thích
Yếu tốđầu vào sản xuất được đo bằng K (nguồn vốn). Nguồn vốn (K) được đại diện bởi nguồn vốn bình quân (trung bình cộng của nguồn vốn đầu năm và nguồn vốn cuối năm) (Nguyễn Thị Cành, 2004; Bernanke và Gilchrist, 1996). Biến số này được logarit hóa khi đưa vào mô hình hồi quy.
Tự do hóa thương mại tác động đến môi trường là trọng tâm chính trong nghiên cứu của luận án. Do vậy điều quan trọng là phải thu thập những dữ liệu cần thiết để có biến số đại diện cho sự tham gia thương mại. Theo nghiên cứu của Edward năm 1997, đã phân tích sự khó khăn khi xây dựng các thước đo đáng tin cậy về sự mở cửa của thương mại (Sebastian, 1997). Chứng minh bằng thực tế rằng trong khi đối với Hàn Quốc đã trở thành một nền kinh tế mở và hướng ngoại (Greenaway, 1998), nhưng một số quan điểm khác lại cho rằng đây là một ví dụ điển hình của một nền kinh tế nửa kín với một mức độ cao sự can thiệp của chính phủ. Nhiều nghiên cứu sử dụng tỷ lệ phụ thuộc thương mại làm thước đo cho sự mở cửa, điểm hình là nghiên cứu của Balassa (Balassa, 1982). Hạn chế chính của các chỉ số này là không liên quan đến chính sách thương mại như: một nước có thể bóp méo chính sách thương mại, nhưng lại phụ thuộc thương mại rất cao - và họ cho rằng phần lớn là do nội sinh. Một số nhà nghiên cứu đã cố gắng để tránh những vấn đề này bằng cách sử dụng thông tin về chính sách để phân loại các nước theo mức độ mà thương mại bị bóp méo, trong đó phân loại các nước thành năm loại theo mức thuế quan và nhận thấy sự biến dạng khác (Johnson, 1996). Một nghiên cứu khác của Michaely và đồng nghiệp năm 1991 đã xây dựng một "chỉ số chủ quan" của tự do hóa thương mại đối với hàm hồi quy xuyên quốc gia (Michaely, 1991). Một nghiên cứu điển hình của Sachs và Warner năm 1995 sử dụng một loạt các chỉ số thương mại liên quan đến thuế quan, bảo hiểm hạn ngạch, phí bảo hiểm thị trường chợ đen, tổ chức xã hội và sự tồn tại của Ban tiếp thị xuất khẩu - để xây dựng một chỉ số tổng hợp cho độ mở của thương mại. Mặc dù chỉ số này đã thể hiện sự nỗ lực cải tiến hơn những chỉ số trước đó nhưng nó chỉ cung cấp một phân loại nhị phân - một quốc gia hoặc là có tự do thương mại hoặc là không có tự do thương mại. Kết quả là, các nước có mức độ khác nhau của sự can thiệp thương mại được phân loại bằng nhau là mở cửa thương
mại (Sachs, 1995). Như vậy, can thiệp thương mại không phải là thước đo tốt để đại diện cho biến số tự do thương mại.
Một số nghiên cứu sử dụng rào cản thương mại làm chỉ số của tự do thương mại. Phổ biến nhất của chỉ số này là trung bình thuế quan, bảo hiểm trung bình, tỷ lệ thuế thu. Một lợi thế của các chỉ số này là dữ liệu đã được quan sát thích hợp với các tình huống trung gian, nghĩa là phù hợp cho cả quốc gia không hoàn toàn tự do thương mại hoặc không hoàn toàn khép kín. Pritchett và Sethi năm 1994 nhận thấy rằng "tỷ lệ thuế thu” đánh giá thấp sự bảo hộ thực tế. Nghiên cứu mẫu với hơn 3.000 quan sát ở Jamaica, Kenya và Pakistan, họ phát hiện ra rằng mối quan hệ giữa mức thuế suất chính thức và tỷ lệ thuế thu không phải là tuyến tính (Pritchett, 1994). Anderson và Neary năm 1994 đã lập luận rằng: nếu thuế quan là hình thức duy nhất của sự bảo hộ, thì một chỉ số cởi mở duy nhất có thể được định nghĩa là các phúc lợi tương đương "thuế quan trung bình". Chỉ số này được dựa trên khái niệm về "Thuế quan trung bình" được phát triển bởi Corden (1966). Sự thay đổi trong chỉ số này là kết quả từ một cuộc cải cách thương mại bằng bình quân gia quyền của sự thay đổi giá cả trong nước. Anderson năm 1994 tính toán các chỉ số Anderson-Neary cho một nhóm 23 quốc gia và thấy rằng mức thuế bình quân có xu hướng đánh giá thấp thực tế mức độ hạn chế thương mại. Mặc dù sự phát triển của chỉ số mới này là một bước quan trọng trong việc đánh giá chính sách thương mại, nhưng các yêu cầu dữ liệu cho tính toán của nó là rất khó khăn. Một số tác giảđã phải đối mặt với vấn đề này bằng cách sử dụng phân