CHƯƠNG 2 PHƯƠNG PHÁP NGHIÊN CỨU
2.2. Số liệu sử dụng trong nghiên cứu
2.2.3. Xử lý số liệu
Mối quan hệ giữa trình độ phát triển kinh tế và đầu tư trực tiếp nước ngoài của một quốc gia theo mô hình IDP được mô tả theo hai cách: Đồ thị và hàm ước lượng. Việc mô tả bằng đồ thị (biểu đồ phân tán) tuy rằng cung cấp một minh họa trực quan nhưng không thể minh chứng cho giá trị quỹ đạo IDP. Phần lớn số liệu thống kê của các quốc gia không đủ dài để minh họa cho toàn bộ quá trình phát triển FDI.
quốc gia, một số trường hợp có thể xảy ra rằng các quốc gia có cùng trình độ phát triển kinh tế lại không có cùng trình độ phát triển FDI và ngược lại.
Để tránh vấn đề này, một số tác giả sử dụng phương pháp phân tích cụm để kiểm định chính xác hơn mô hình IDP và tránh các kết quả sai lệch khi mẫu số liệu không đồng nhất do những khác biệt trong cấu trúc kinh tế của các quốc gia. Học viên cũng kế thừa và sử dụng phương pháp này để có thể phân tích và giải quyết vấn đề nghiên cứu cụ thể và chính xác hơn. Đồng thời, việc phân cụm các quốc gia ASEAN cũng nhằm mục đích so sánh giữa các cụm và các quốc gia trong cùng một cụm. Từ đó, học viên đưa ra một số bình luận và hàm ý cho Việt Nam thông qua sự so sánh trường hợp của Việt Nam với các quốc gia ASEAN.
Như đã đề cập, bản thân hai chỉ số lượng vốn FDI và GDP (có hay không có điều chỉnh theo dân số) là không đầy đủ trong việc đánh giá mối quan hệ; nhưng tôn trọng tư tưởng cơ bản của mô hình IDP do Dunning đề xuất và sử dụng kỹ thuật Ward, học viên chỉ sử dụng hai biến cơ bản NOIpc và GDPpc trong ước lượng và lấy hai chỉ tiêu này làm cơ sở phân cụm (tương tự Boudier-Bensebaa, 2008 và Tomas, 2014). Năm gốc để phân cụm là năm 2015 với số liệu được cập nhật đầy đủ nhất cho tất cả các quốc gia được kiểm định.
Học viên sử dụng công cụ XLSTAT (Statistical software and data analysis add-on for Excel) để tiến hành phân cụm. Quá trình phân cụm được tiến hành theo hai bước (Yasar, 2015) như sau:
Bước 1 - Phân các quốc gia vào từng cụm. Ban đầu, mỗi quốc gia sẽ được chỉ định là một cụm (9 cụm). Hai cụm có khoảng cách gần nhau nhất được hợp thành một cụm mới, nên số cụm giảm đi sau từng bước. Kỹ thuật Ward được sử dụng để tối thiểu hóa số lượng cụm trong quá trình phân nhóm. Khoảng cách Euclid bình phương được sử dụng để đo khoảng cách giữa các đối tượng.
Bước 2 - Kiểm tra ý nghĩa và độ tin cậy. Sau khi có được các cụm, tác giả tiến hành kiểm tra ý nghĩa và độ tin cậy của số liệu mới của cụm bằng kiểm định phân tích phương sai nhiều chiều (Multivariate Analyse of Variance MANOVA). Hai giả thuyết kiểm định là:
H0: Biến độc lập không có tác động/ý nghĩa thống kê với biến phụ thuộc Ha: Biến độc lập có tác động/ý nghĩa thống kê với biến phụ thuộc
Nếu số liệu mới của một cụm có ý nghĩa về mặt thống kê (bác bỏ giả thuyết H0, chấp nhận giả thuyết Ha hay biến độc lập có tác động/ý nghĩa thống kê đến biến phụ thuộc) thì kết quả của cụm đó được chấp nhận.
Phân tích phân cụm có một đặc điểm là không đòi hỏi biết trước số cụm và các đối tượng ở mỗi cụm. Vì thế, phương pháp này cho phép người sử dụng lựa chọn số cụm tùy theo mục đích nghiên cứu cũng như đặc điểm của các đối tượng được phân cụm. Sau khi phân tích số liệu dựa trên hai chỉ tiêu NOIpc và GDPpc của các đối tượng, học viên lựa chọn phân tích sáu cụm (C1, C2, C3, C4, C5 và C6).
Kết quả phân cụm như sau:
HÌNH 2.2. Sơ đồ hình cây kết quả phân cụm Ward
Nguồn: Tính toán của học viên
Cụm 1 (1 quốc gia) gồm: Brunei
Cụm 3 (2 quốc gia) gồm: Indonesia, Philipines. Cụm 4 (1 quốc gia) gồm: Malaysia.
Cụm 5 (1 quốc gia) gồm: Singapore. Cụm 6 (1 quốc gia) gồm: Thái Lan.
Mối quan hệ giữa NOIpc và GDPpc của các quốc gia trong từng cụm được mô tả bằng biểu đồ phân tán dưới đây:
ASEAN -1400 -1200 -1000 -800 -600 -400 -200 0 0 500 1000 1500 2000 2500 3000 3500 4000 4500 GDPpc NO Ipc C1 (Brunei) -16000 -14000 -12000 -10000 -8000 -6000 -4000 -2000 0 2000 0 10000 20000 30000 40000 50000 GDPpc N O Ip c
C2 (Campuchia, Lào, Việt Nam)
-1200 -1000 -800 -600 -400 -200 0 0 500 1000 1500 2000 2500 GDPpc NO Ipc C3 (Indonesia, Philipines) -700 -600 -500 -400 -300 -200 -100 0 0 500 1000 1500 2000 2500 3000 3500 4000 GDPpc N O Ip c C4 (Malaysia) -2000 -1500 -1000 -500 0 500 1000 0 2000 4000 6000 8000 10000 12000 GDPpc NO Ipc
HÌNH 2.3. Biểu đồ phân tán của khu vực ASEAN và các cụm quốc gia
C5 (Singapore) -70000 -60000 -50000 -40000 -30000 -20000 -10000 0 0 10000 20000 30000 40000 50000 60000 GDPpc NO Ipc C6 (Thái Lan) -2500 -2000 -1500 -1000 -500 0 0 1000 2000 3000 4000 5000 6000 7000 GDPpc NO Ipc
HÌNH 2.3. Biểu đồ phân tán của khu vực ASEAN và các cụm quốc gia (tiếp)
Nguồn: Tính toán của học viên