Về cơ bản, dữ liệu được sử dụng trong nghiên cứu có nguồn gốc từ Ngân Hàng Thế Giới (World Bank - WB) công bố từ năm 1993 đến 2013 (21 năm), Tổ Chức Y Tế Thế Giới (WHO) công bố từ 1992 đến 2012 (21 năm), và Đại học Uppsala (Uppsala universitet) của Thụy Điển. Số liệu được quan sát hằng năm của 54 quốc
6
Hàm lợi ích xã hội biên được hiển thị không rút gọn biến L là nhằm ngầm ý thể hiện đây là phương trình
gia và lãnh thổ nhóm Thu nhập Trung bình theo phân loại của Ngân Hàng Thế Giới. Tổng số quan sát là 881.
Bài nghiên cứu này lựa chọn phạm vi quan sát là các quốc gia và lãnh thổ có
thu nhập trung bình và khơng phải là quốc gia loại nhỏ. Theo phân loại của Ngân
Hàng Thế Giới, nền kinh tế phân loại nhóm thu nhập trung bình được định nghĩa là có GNI bình qn đầu người năm 2014 theo phương pháp tính World Bank Atlas là
nhiều hơn 1.045 USD và ít hơn 12.736 USD. Ngân Hàng Thế Giới xem những quốc gia có dân số dưới 1,5 triệu dân được gọi là các quốc gia thuộc loại nhỏ. Những quốc gia này, tuy có sự khác biệt với nhau về trình độ phát triển, quy mô kinh tế và phân bổ địa lý, nhưng chúng có cùng chung các thách thức cho sự phát triển kinh tế. Một điều cần chú ý là, số lượng các quốc gia được lựa chọn điều tra là theo danh sách phân loại vào năm 2014. Trong khi đó, phạm vi thời gian của nghiên cứu bao hàm giai đoạn 21 năm, có thể khơng tránh khỏi việc các quốc gia được chọn đã từng khơng thỏa đúng các tiêu chí này trong các năm ở quá khứ, hoặc các năm trong quá khứ có thể đảm bảo khơng bỏ sót những quốc gia từng thỏa tiêu chí phân loại. Tuy nhiên, bài viết này tạm xem danh sách được Ngân Hàng Thế Giới phân loại trong năm 2014 như đã trình bày ở trên là cơ sở dữ liệu để giới hạn phạm vi không gian của mẫu nghiên cứu.
Một điểm chú ý khác, đó là tác giả chỉ xem chỉ số GNI làm cơ sở phân loại quốc gia khi giới hạn phạm vi nghiên cứu về mặt khơng gian. Vì vậy, trong việc xây dựng mơ hình nghiên cứu đánh giá tác động không nhất thiết chỉ số này phải xuất hiện như một biến số độc lập.
Tóm tắt
Chương này trình bày mơ hình kinh tế học của dịng FDI bao gồm π0, py0, pk0, S, px, z, và ω. Trong đó lần lượt là lợi nhuận của đầu tư, giá Thế giới của xuất lượng, chi phí vốn tại địa phương, năng lực hấp thụ vốn của địa phương, chi phí địa phương của nhập lượng, chính sách thương mại, và các yếu tố khác mang tính rủi
ro của đầu tư. Lập luận theo hàm sản xuất Cobb-Douglas, bên cạnh yếu tố Vốn và Lao động, giả thuyết còn tồn tại các yếu tố khác. Bệnh truyền nhiễm được xem là một trong số các thành phần của yếu tố khác đó. Trên nền tảng này, mơ hình kinh tế lượng được xây dựng, với lập luận cho việc chọn từng biến thành phần, trong đó FDI rịng là biến phụ thuộc và các biến bệnh truyền nhiễm là biến độc lập mục tiêu. Ngoại tác của thị trường kiểm sốt bệnh truyền nhiễm có thể được nhận diện thông qua phương pháp Mincerian với giản lược hóa hàm Cobb-Douglas. Dữ liệu sử dụng được thu thập từ Ngân Hàng Thế Giới, Tổ Chức Y Tế Thế Giới, và Đại học Uppsala, với thời gian quan sát của dữ liệu là 21 năm.
Bảng 3.1. MÔ TẢ BIẾN SỐ VÀ DẪN NGUỒN GỐC
Biến số chƣa
logarit hóa Mơ tả biến Các nghiên cứu
tham khảo Nguồn
FDI Dòng đầu tư trực tiếp nước ngồi rịng (USD giá cố định 2005)
Poelhekke và Van der Ploeg (2010); Desbordes và Azémar (2008); Alsan, Bloom và Canning (2006); Noorbakhsh và Youssef (2001); Gastanaga, Nugent và Pashamova (1998) World Bank tháng 7 năm 2014
Mal Số lượng nhiễm bệnh sốt rét (người)
World Health Organisation (2014)
TBmp100k Tử suất bệnh lao âm tính HIV trên 100.000 người (ca tử vong)
World Health Organisation (2014)
TBHIVmp100k Tử suất bệnh lao đồng nhiễm HIV trên 100.000 người (ca tử vong)
World Health Organisation (2014)
IncFDI Lợi nhuận của đầu tư trực tiếp nước ngoài (USD giá cố định 2005)
World Bank tháng 7 năm 2014
Openness Tỷ số của tổng giá trị xuất nhập khẩu hàng hóa và dịch vụ trên GDP (USD giá cố định 2005) Desbordes và Azémar (2008); Alsan, Bloom và Canning (2006); Noorbakhsh và Youssef (2001); Gastanaga, Nugent và Pashamova (1998) World Bank tháng 7 năm 2014
LendInt Lãi suất cho vay ngắn- trung hạng của ngân hàng cho khu vực tư nhân (%)
World Bank tháng 7 năm 2014
GasrpGDP Tỷ lệ chi phí khí đốt trên Tổng sản phẩm quốc nội (%)
Poelhekke và Van der Ploeg (2010); Gastanaga, Nugent và Pashamova (1998). Sử dụng biến đo lường tương đồng. World Bank tháng 7 năm 2014 GDPpcppp GDP bình quân theo cách tính đồng mãi lực (PPP) (USD giá cố định 2005) Alsan, Bloom và Canning (2006) World Bank tháng 7 năm 2014
POP Tổng dân số (người) Alsan, Bloom và Canning (2006)
World Bank tháng 7 năm 2014
GDPgrowth Tốc độ tăng trưởng Tổng sản phẩm quốc nội (%) Noorbakhsh và Youssef, 2001; Gastanaga, Nugent và Pashamova (1998) World Bank tháng 7 năm 2014
EDUyear Số năm bình quân học bậc trung học (năm) Desbordes và Azémar (2008) World Bank tháng 7 năm 2014
GBFDI Dịng đầu tư trực tiếp nước ngồi rịng tồn cầu (USD giá cố định 2005)
World Bank tháng 7 năm 2014
NegFDI FDI ròng năm trước (1 nếu giá trị dương, 0 nếu giá trị âm) Desbordes và Azémar (2008) Diễn dịch từ nguồn World Bank tháng 7 năm 2014
Conflict Chỉ báo tình trạng xung đột vũ trang (0 nếu đang trong tình trạng hịa bình; 1 nếu tối thiểu 25 người chết/năm và ít hơn 1.000 người chết trong xung đột; 2 nếu trên 1.000 chết/năm)
Desbordes và Azémar (2008)
Uppsala Universitet
Chƣơng 4: ƢỚC LƢỢNG HỒI QUY 4.1. Thống kê mô tả dữ liệu
Dữ liệu của Ngân Hàng Thế Giới năm 2014 phân loại nhóm được gọi là thu nhập trung bình có tổng cộng 105 quốc gia. Loại trừ đi những quốc gia có dân số
dưới 1,5 triệu người, số cịn lại bao gồm 78 quốc gia và lãnh thổ (phụ lục 2) là đối tượng quan sát của nghiên cứu này.Tuy nhiên, dữ liệu sử dụng trong nghiên cứu được thu thập theo phương pháp lấy mẫu phi xác suất, chỉ đến từ 54 quốc gia và lãnh thổ (phụ lục 1). Đây là số quốc gia và lãnh thổ được tổng hợp sau khi loại trừ đi những quốc gia mà khơng tìm thấy có bất kỳ quan sát nào trong giai đoạn 1993- 2013 được ghi nhận giá trị dữ liệu đầy đủ cho tất cả các biến trong mơ hình. Như vậy, số lượng quốc gia và lãnh thổ được quan sát chỉ chiếm 69,23% tổng quốc gia nhóm thu nhập trung bình.
Dữ liệu nghiên cứu bao trùm thời gian trong vòng 21 năm với tổng số quan sát là 1.134 đơn vị quan sát (Bảng 4.1, trang tiếp theo). Một số biến, bao gồm biến độc lập được quan tâm nhất là Ln_TBmp100k, có dữ liệu đầy đủ 100% tổng số quan sát. Biến phụ thuộc, Ln_FDI, có dữ liệu cho 91,71% tổng số quan sát. Biến có số quan sát ít nhất là LendInt, chỉ đủ dữ liệu cho 90,12% tổng số. Khơng có bất kỳ quốc gia nào có đầy đủ dữ liệu trong toàn bộ 21 năm ở tất cả các biến. Số quan sát đầy đủ dữ liệu nhất ở các biến cho một quốc gia là 20 năm, với 18 quốc gia có được điều này. Có 2 quốc gia chỉ có dữ liệu trong 4 năm. Việt Nam có đủ dữ liệu trong 17 năm.
Ước lượng hồi quy chỉ thực hiện thao tác trên những quan sát nào có dữ liệu đầy đủ cho tất cả các biến. Vì vậy, số quan sát thực sự được sử dụng để tính tốn trong mơ hình ước lượng được quan tâm nhất, như tác giả sẽ trình bày ở các trang sau của chương này, chỉ là 881, chiếm 77,69% tổng số quan sát. Trong trường hợp ước lượng tác động của biến độc lập Ln_Mal, số lượng quan sát trong mơ hình cịn thấp hơn, chỉ chiếm 76,28%.
Bảng 4.1. Thống kê dữ liệu các biến
Biến
Mơ hình hồi quy Dữ liệu
Tổng thể Tỷ lệ % trên tổng thể Tỷ lệ % trên dữ liệu Số quan sát Tỷ lệ % trên tổng thể Số quan sát Ln_FDI 77,69% 84,71% 881 91,71% 1.040 1.134 Ln_IncFDI 77,69% 82,11% 881 94,62% 1.073 1.134 Openess 77,69% 80,97% 881 95,94% 1.088 1.134 LendInt 77,69% 86,20% 881 90,12% 1.022 1.134 GasrpGDP 77,69% 82,88% 881 93,74% 1.063 1.134 Ln_GDPpcppp 77,69% 78,38% 881 99,12% 1.124 1.134 Ln_Pop 77,69% 77,69% 881 100,00% 1.134 1.134 GDPgrowth 77,69% 78,24% 881 99,29% 1.126 1.134 EDUyear 77,69% 77,69% 881 100,00% 1.134 1.134 Ln_GBFDI 77,69% 77,69% 881 100,00% 1.134 1.134 NegFDI1 77,69% 81,27% 881 95,59% 1.084 1.134 NegFDI2 77,69% 81,27% 881 95,59% 1.084 1.134 Conflict1 77,69% 77,69% 881 100,00% 1.134 1.134 Conflict2 77,69% 77,69% 881 100,00% 1.134 1.134 Conflict3 77,69% 77,69% 881 100,00% 1.134 1.134 Ln_Mal 76,28% 77,58% 865 98,32% 1.115 1.134 TBmp100k 77.69% 77,69% 881 100,00% 1.134 1.134 TBHIVmp100k 77,69% 77,58% 881 100,00% 1.134 1.134
Bảng 4.2. Thống kê mô tả của các yếu tố định lượng
Yếu tố Quan sát Trung bình Độ lệch chuẩn Cực tiểu Cực đại FDI 1.088 5,23e+09 2,30e+10 -2,09e+10 3,48e+11 IncFDI 1.080 2,81e+09 1,15e+10 -3,78e+08 2,04e+11 Openess 1.088 81,97465 36,69017 14,93285 220,4074 LendInt 1.022 22,9523 26,44251 4,248333 300 GasrpGDP 1.063 1,334971 3,133591 0 29,39287 GDPpcppp 1.124 6,878,533 4,289,49 1.007,293 23.297,63 Pop 1.134 7,54e+07 2,24e+08 1.025.559 1,36e+09 GDPgrowth 1.126 4,271476 5,691187 -30,50847 88,95766 EDUyear 1.134 6,325397 0,957586 4 8 GBFDI 1.134 1,07e+12 6,41e+11 2,12e+11 2,43e+12 NegFDI 1.084 0,045203 0,207845
Conflict 1.134 0,255732 0,547672
Mal 1.115 325.625,4 857.735,7 0 4.731.338 TBmp100k 1.134 20,07435 27,38512 0,37 154 TBHIVmp100k 1.134 12,11815 36,74405 0 263
Chú thích: NegFDI và Conflict là các biến giả, chúng khơng có giá trị cực tiểu và cực đại. Nguồn: Tính tốn của tác giả trên dữ liệu từ WB, WHO và Uppsala universitet
Bảng 4.3. Thống kê mơ tả các biến trong mơ hình hồi quy
Biến Quan sát Trung bình Độ lệch chuẩn Cực tiểu Cực đại Ln_FDI 1.040 20,56177 1,963179 6,907755 26,57503 Ln_IncFDI 1.073 16,74176 7,705265 0 26,04371 Openess 1.088 81,97465 36,69017 14,93285 220,4074 LendInt 1.022 22,9523 26,44251 4,248333 300 GasrpGDP 1.063 1,334971 3,133591 0 29,39287 Ln_GDPpcppp 1.124 8,636465 0,653416 6,915021 10,05611 Ln_Pop 1.134 16,61018 1,530166 13,84075 21,02882 GDPgrowth 1.126 4,271476 5,691187 -30,50847 88,95766 EDUyear 1.134 6,325397 0,957586 4 8 Ln_GBFDI 1.134 27,4827 0,710583 26,07849 28,51762 Ln_Mal 1.115 6,956312 5,818886 -2,302585 15,36972 Ln_TBmp100k 1.134 2,184063 1,330041 -0,994252 5,036952 TBHIVmp100k 1.134 12,11815 36,74405 0 263
Biến Quan sát Tần suất Tỷ lệ % NegFDI1 1.084 1.035 95,48 NegFDI2 1.084 49 4,52 Conflict1 1.134 906 79,89 Conflict2 1.134 166 14,64 Conflict3 1.134 62 5,47
Ghi chú: Biến EDUyear không phải là dữ liệu số thực liên tục mà là biến số tự nhiên. Các biến giả hiển thị Tần suất và Tỷ lệ % khi chúng được nhận diện là 1. Nguồn: Tính tốn của tác giả trên dữ liệu từ WB, WHO và Uppsala universitet.
4.2. Kiểm định tƣơng quan cặp biến
Đa cộng tuyến là khái niệm đề cập đến hiện tượng tồn tại sự tương quan tuyến
tính giữa các biến độc lập với nhau trong mơ hình ước lượng. Trong nghiên cứu các tác động kinh tế xã hội, khó có khả năng xây dựng được một mơ hình hồi quy đa biến tránh mọi hiện tượng đa cộng tuyến, nhưng về mặt kỹ thuật, có thể loại trừ trường hợp đa cộng tuyến hồn hảo và hạn chế tính đa cộng tuyến ở mức độ cao. Hiện tượng đa cộng tuyến nếu ở mức độ cao sẽ làm mất đi tính ổn định của hệ số hồi quy và phóng đại sai số chuẩn của hệ số, dẫn tới kết quả ước lượng sẽ khó phản ảnh được tác động thực sự của các biến độc lập lên biến phụ thuộc.
Kỹ thuật cơ bản nhất có thể nhận diện hiện tượng đa cộng tuyến là thông qua ma trận thể hiện sự tương quan từng cặp biến trong mơ hình hồi quy dự kiến.
Bảng 4.4. Ma trận sự tương quan cặp biến
Ln_FDI Ln_IncFDI Openess LendInt GasrpGDP Ln_GDPpcppp Ln_Pop Ln_FDI 1,0000 Ln_IncFDI 0,3148 1,0000 Openess -0,0739 -0,0459 1,0000 LendInt -0,2622 -0,1913 -0,0233 1,0000 GasrpGDP 0,1130 -0,0761 -0,0433 -0,0937 1,0000 Ln_GDPpcppp 0,4726 0,1864 0,1650 -0,2329 0,1306 1,0000 Ln_Pop 0,5875 0,1472 -0,4227 -0,1042 0,1844 -0,0481 1,0000 GDPgrowth 0,2044 0,0963 0,0378 -0,2306 0,0068 -0,0129 0,0670 EDUyear -0,0104 -0,2974 0,1414 0,0866 0,0658 0,0589 -0,0300 Ln_GBFDI 0,3976 0,3190 0,1347 -0,3358 0,0980 0,4179 0,0459 NegFDI1 0,1120 -0,0374 -0,0186 0,0280 0,0011 0,0011 0,0581 Conflict2 0,1464 0,0565 -0,1692 -0,0447 0,1929 -0,0406 0,3445 Conflict3 -0,0167 -0,0848 -0,0927 0,0012 0,0414 -0,1515 0,1265 Ln_Mal 0,1641 0,2361 -0,3104 -0,1043 0,0598 -0,2620 0,4444 Ln_TBmp100k -0,0640 0,0464 -0,0568 0,0507 0,0203 -0,4335 0,2483 TBHIVmp100k -0,0863 0,0133 -0,0185 -0,0004 -0,1035 -0,0687 -0,1105
GDPgrowth EDUyear Ln_GBFDI NegFDI1 Conflict2 Conflict3 Ln_Mal GDPgrowth 1,0000 EDUyear 0,0110 1,0000 Ln_GBFDI 0,1338 -0,0288 1,0000 NegFDI1 -0,0078 0,0147 0,0240 1,0000 Conflict2 0,0474 -0,1277 -0,0240 0,0035 1,0000 Conflict3 -0,0875 0,1330 -0,0719 -0,0135 -0,0996 1,0000 Ln_Mal 0,0751 -0,4128 -0,0204 -0,1400 0,2783 0,1380 1,0000 Ln_TBmp100k 0,0355 -0,0569 -0,1407 -0,1684 0,2213 0,1022 0,5640 TBHIVmp100k -0,0186 -0,2547 0,0066 -0,0496 -0,0773 -0,0400 0,2560 Ln_TBmp100k TBHIVmp100k Ln_TBmp100k 1,0000 TBHIVmp100k 0,4130 1,0000
Nguồn: Tính tốn của tác giả trên dữ liệu từ WB, WHO và Uppsala universitet
Thông qua ma trận trên, tác giả phát hiện hệ số tương quan cao giữa cặp biến
Ln_Mal và Ln_TBmp100k (0,5640). Được biết, hệ số tương quan cao cho thấy cặp
biến này có thể đại diện cho hai nhân tố kinh tế xã hội có cùng tính chất giải thích hoặc bản chất rất tương đồng. Trong một mơ hình hồi quy, nếu cùng xuất hiện cặp biến này, tác động của tính chất liên quan có thể bị khuếch đại và kết quả ước lượng bị đánh giá sai lệch. Nhằm tránh hiện tượng khá gần với đa cộng tuyến, mơ hình hồi quy hợp lý không nên được xây dựng mà trong đó hiện diện đồng thời cặp biến này. Hai biến đo lường hai biến thể của tử suất bệnh lao là Ln_TBmp100k và
TBHIVmp100k, tuy trên góc độ kỹ thuật, ma trận thể hiện mức tương quan không
cao, nhưng bản chất dữ liệu của chúng lại cùng phản ảnh một thuộc tính ít nhiều tương đồng. Do đó, để tránh ước lượng chệch tác động riêng của mỗi biến này lên biến phụ thuộc, việc xây dựng hai mơ hình hồi quy gần giống nhau và chỉ khác ở mỗi biến loại này là lựa chọn hợp lý (Bảng 4.10).
Ở góc độ kỹ thuật thành lập biến, sự tương quan không cao giữa
Ln_TBmp100k và TBHIVmp100k có thể là do cặp biến này có một biến là logarit còn biến kia là biến số thực. Tuy nhiên, về bản chất kinh tế xã hội được phản ảnh từ các biến này, tác giả không đủ cơ sở để cho rằng chúng tránh được hiện tượng đa cộng tuyến.
4.3. Mơ hình hồi quy và các kiểm định cơ bản
Bảng 4.5 báo cáo giá trị ước tính trên dữ liệu bảng của 54 quốc gia thu nhập trung bình cho quan sát mỗi quốc gia trong thời gian 21 năm. Phương pháp hồi quy được sử dụng là bình phương cực tiểu thơng thường (Ordinary Least Square – OLS). Các kiểm định cơ bản sẽ được thực hiện trên mơ hình có đầy đủ các biến.
Cột thứ nhất tính từ trái sang phải của Bảng 4.5 hiện thị tổng cộng 13 biến độc lập và phần dư (cons) được ước lượng. Ba chỉ số cuối cùng được trình bày dưới đường kẻ là báo cáo về số quan sát (obs), R2 (R-squared) và R2 hiệu chỉnh (Adj R- squared). Các cột thứ hai, ba, bốn và năm hiển thị kết quả ước lượng tác động của các biến độc lập lên biến phụ thuộc, trong bốn mơ hình OLS khác nhau như được định danh tại dòng ngang thứ nhất. Kết quả ước lượng, tương ứng với mỗi biến độc lập, sẽ được hiển thị gồm hai thơng số, hệ số tương quan ở dịng trên và giá trị P (P- value) đặt trong ngoặc đơn ở dòng dưới.
Trong mơ hình OLS1, tác giả chọn lựa các biến cơ bản được cho là có tác động
đến FDI theo mơ hình kinh tế học được nói ở Chương 3. Theo đó, mỗi yếu tố π0
,
py0, pk0, px và ω sẽ tương ứng một biến trong khi yếu tố S sẽ có hai biến đại diện. Tiếp theo, biến Ln_TBmp100k sẽ được đưa thêm vào để hình thành mơ hình OLS2. Mơ hình OLS3 được ước lượng với sự thêm vào các biến được đo lường bằng số