Quy trình nghiên cứu

Nghiên cứu này được thực hiện theo phương pháp qui nạp với tuần tự theo hai bước.

Bước 1: tác giả tiến hành kỹ thuật tổng hợp các lý thuyết và phân tích các nghiên cứu trước đây về mối quan hệ giữa các yếu tố đến bất bình đẳng thu nhập đặc biệt là tác động của giáo dục đến bất bình đẳng thu nhập, kết hợp với phân tích tình hình thực tiễn của các quốc gia được nghiên cứu, mô hình nghiên cứu lý thuyết đề xuất được xây dựng.

Bước 2: phân tích dữ liệu nhằm kiểm chứng mô hình lý thuyết đã xây dựng ở Bước 1. Trên cơ sở mô hình nghiên cứu lý thuyết đề xuất, tác giả tiến hành thu thập thông tin và dữ liệu; dữ liệu thu thập về được tổng hợp, làm sạch và xử lý trước khi phân tích. Bằng phương pháp POOLED OLS, FEM, REM, tác giả sẽ tiến hành sử dụng phần mềm STATA 12 để kiểm chứng mối quan hệ giữa các biến số đến bất bình đẳng thu thập trong trường hợp các quốc gia có mức thu nhập trung bình thấp giai đoạn 1990-2015. Cuối cùng, tác giả tiến hành các kiểm định đánh giá mô hình phù hợp và phân tích kết quả.

Mục tiêu Lý thuyết Phân tích Kết quả Thảo luận

Hình 3.1: Quy trình nghiên cứu

Nguồn: Tác giả tổng hợp

3.2. Mô hình nghiên cứu

Từ khung phân tích, mô hình kinh tế lượng được đề xuất trong nghiên cứu như sau:

IncGinii,t = 0 + 1*EduGinii,t + 2*Yschooli,t + 3*Gdpperi,t

+ 4*Expenditurei,t-1 + 5*Urbani,t + 6*EFIi,t + ui,t

Trong đó:

IncGinii,t : bất bình đẳng về thu nhập EduGinii,t : bất bình đẳng về giáo dục Yschooli,t : trung bình số năm đi học Gdpperi,t : thu nhập bình quân đầu người

Expenditurei,t-1 : chi tiêu của chính phủ cho giáo dục trễ 1 kỳ

Tổng hợp lý thuyết Thu thập dữ liệu từ các nguồn Phân tích Ước lượng tác động giáo dục đến bất bình đẳng thu nhập Hàm ý chính sách và hướng nghiên cứu tiếp theo Tổng hợp và xử lý dữ liệu Mục tiêu nghiên cứu Lý thuyết Các nghiên cứu liên quan Xây dựng mô hình nghiên cứu lý thuyết Phân tích, kiểm định mô hình

Urbani,t : tỷ lệ dân số thành thị EFIi,t : chỉ số tự do hóa kinh tế ui,t : các phần dư của mô hình.

3.3. Mô tả biến số

3.3.1. Bất bình đẳng thu nhập

Biến phụ thuộc bất bình đẳng thu nhập (IncGini) được đo lường bằng cách sử dụng hệ số Gini được lấy từ cơ sở dữ liệu bất bình đẳng thu nhập của công cụ chỉ báo phát triển thế giới (WDI), Ngân hàng thế giới (World Bank) trong giai đoạn 1990-2015 với dữ liệu theo năm với đơn vị tính là phần trăm. Đây là thước đo được sử dụng phổ biến nhất trong kinh tế và nghiên cứu về bất bình đẳng vì thế có thể tiếp cận và so sánh dễ dàng hơn với các nghiên cứu trước. (Psacharopoulos, 1977; Winegarden, 1979; Barro, 2000; Gregorio và Lee, 2002; Checchi, 2003; Tselios, 2008; Rodríguez‐Pose và Tselios, 2009; Yang và cộng sự, 2009; Földvári và Leeuwen, 2011; Castelló-Climent và Domenech, 2014; Kanwal và Munir, 2015).

3.3.2. Bất bình đẳng giáo dục

Biến bất bình đẳng giáo dục (EduGini) được đo lường bằng cách sử dụng hệ số Gini. Các hệ số Gini giáo dục được xây dựng theo phương pháp Barro và Lee (2001). Tác giả sử dụng công thức như đề nghị của Castelló và Domenech (2002), Thomas và cộng sự (2001) như sau:

(1)

Trong đó là trung bình số năm đi học của dân số từ 15 tuổi trở lên, i và j là các mức độ khác nhau của giáo dục, ni và nj là tỷ lệ dân số ở từng mức giáo dục, và và là số năm đi học trung bình tích lũy của từng cấp học. Theo Barro và Lee (2001), giáo dục sẽ được xem xét với bốn cấp độ: không đi học (0), tiểu học (1),

trung học (2) và giáo dục đại học (3). Với là số năm học trung bình của mỗi cấp giáo dục i, ta có:

(2) Mở rộng biểu thức (1) và sử dụng (2), hệ số Gini có thể được tính như sau:

Như vậy, hệ số Gini được tác giả tính toán thông qua các biến thành phần với nguồn dữ liệu từ Barro và Lee, công cụ chỉ báo phát triển thế giới (WDI), Ngân hàng thế giới (World Bank) giai đoạn 1990-20156 cho nhóm dân số có độ tuổi từ 15 trở lên bao gồm: tỷ lệ dân số không đi học (n0), tỷ lệ dân số hoàn thành mức giáo dục cao nhất là tiểu học (n1), tỷ lệ dân số hoàn thành mức giáo dục cao nhất là trung học (n2), tỷ lệ dân số hoàn thành mức giáo dục cao nhất là cao đẳng, đại học (n3), trung bình số năm đi học ở bậc tiểu học (x1), trung bình số năm đi học ở bậc trung học (x2), trung bình số năm đi học ở bậc cao đẳng, đại học (x3). Ngoài ra, chỉ số bất bình đẳng giáo dục được tính toán theo Barro và Lee (2001) đã giải quyết hầu hết các nhược điểm góp phần giảm sai số đo lường và cải thiện tình trạng chính xác của các ước tính bằng cách sử dụng thông tin từ dữ liệu điều tra dân số và một phương pháp mới sử dụng các dữ liệu tách biệt theo nhóm tuổi. Thế nên nó cũng được sử dụng rộng rãi trong các nghiên cứu về bất bình đẳng (Tselios, 2008; Rodríguez‐Pose và Tselios, 2009; Yang và cộng sự, 2009; Földvári và Leeuwen, 2011; Castelló-Climent và Domenech, 2014; Kanwal và Munir, 2015).

3.3.3. Trung bình số năm đi học

Trung bình số năm đi học (Yschool) được tính toán dựa trên nhóm dân số từ 15 tuổi trở lên và là biến đại diện cho mở rộng giáo dục ở các quốc gia (Barro và Lee, 2001). Biến số này được thu thập từ nguồn dữ liệu của Barro và Lee, công cụ

chỉ báo phát triển thế giới (WDI), Ngân hàng thế giới (World Bank) cho giai đoạn 1990-2015 và được sử dụng trong một số nghiên cứu trước đây (Psacharopoulos, 1977; Winegarden, 1979; Gregorio và Lee, 2002; Checchi, 2003; Tselios, 2008; Rodríguez‐Pose và Tselios, 2009; Castelló-Climent và Domenech, 2014; Kanwal và Munir, 2015).

3.3.4. Thu nhập bình quân đầu người

Tác giả sử dụng GDP bình quân đầu người (Gdpper) (giá so sánh năm 2010 $ US) là biến đại diện cho phát triển kinh tế được sử dụng khá nhiều trong các nghiên cứu trước đây (Psacharopoulos, 1977; Winegarden, 1979; Gregorio và Lee, 2002; Checchi, 2003; Tselios, 2008; Rodríguez‐Pose và Tselios, 2009; Castelló-Climent và Domenech, 2014; Kanwal và Munir, 2015). Biến số này được thu thập từ các chỉ số phát triển của công cụ chỉ báo phát triển thế giới (WDI), Ngân hàng thế giới (World Bank) giai đoạn 1990-2015.

3.3.5. Chi tiêu giáo dục

Chi tiêu giáo dục (Expenditure) đại diện cho tỷ lệ phần trăm của chi tiêu công của mỗi quốc gia dành cho các mục tiêu giáo dục. Biến số này được thu thập từ các chỉ số phát triển của công cụ chỉ báo phát triển thế giới (WDI), Ngân hàng thế giới (World Bank) giai đoạn 1990-2015. Nghiên cứu của Sylwester (2002); Deininger và Squire (1998); Checchi (2003) cũng sử dụng biến số này làm biến kiểm soát.

3.3.6. Tỷ lệ dân số thành thị

Đô thị hóa (Urban) là sự mở rộng của đô thị, tính theo tỉ lệ phần trăm giữa số dân đô thị hay diện tích đô thị trên tổng số dân hay diện tích của một vùng hay khu vực. Trong nghiên cứu này, tác giả tiếp cận đô thị hóa thông qua tỷ lệ phần trăm dân số thành thị trong tổng dân số mở mỗi quốc gia. Chỉ số này còn được gọi là mức độ đô thị hóa và cũng được thu thập từ các chỉ số phát triển của công cụ chỉ báo phát triển thế giới (WDI), Ngân hàng thế giới (World Bank) (WDI) giai đoạn

1990-2015. Theo Rodríguez‐Pose và Tselios (2009), Sicular và cộng sự (2008), tỷ lệ dân số thành thị có tác động đến bất bình đẳng thu nhập.

3.3.7. Chỉ số tự do hóa kinh tế

Để đo lường chính sách tự do kinh doanh ở các quốc gia, tác giả sử dụng chỉ số tự do hóa kinh tế (Economic Freedom of the World index - EFI) được báo cáo hàng năm ở Viện Fraser. Với chỉ số này, các nền tảng của tự do hóa kinh tế bao gồm: (i) sự lựa chọn cá nhân (personal choice), (ii) trao đổi tự nguyện được điều phối bởi thị trường (voluntary exchange coordinated by markets), (iii) tự do gia nhập và cạnh tranh trên thị trường (freedom to enter and compete in markets), và (iv) bảo vệ cá nhân và quyền lợi từ sự xâm hại của người khác (protection of persons and their property from aggression by others).

Như vậy, EFI là một chỉ số tổng hợp được đo lường thông qua 5 thành phần bao gồm (i) Độ lớn của nhà nước (Government Size); (ii) hệ thống luật pháp và Quyền tư hữu (Legal system and property rights); (iii) Tiền tệ lành mạnh (Sound money); (iv) Tự do thương mại quốc tế (Freedom to trade internationally); (v) Quy định (Regulation). Mỗi chỉ số thành phần sẽ được cho điểm từ 0 đến 10, trong đó 0 là tượng trưng ít tự do nhất, 10 là tượng trưng cho nhiều tự do nhất. EFI được tính bằng cách lấy trung bình của các chỉ số thành phần (0-10). Và chỉ số này được tác giả tổng hợp cho 18 quốc gia trong mẫu nghiên cứu giai đoạn 1990-20157 theo cách sử dụng trong một số nghiên cứu của Edwards (1997), Dollar và Kraay (2002), Milanovic và Squire (2005), Petcu (2014).

Bảng 3.1: Biến số và nguồn dữ liệu

Tên

biến Mô tả Đơn vị Phương thức đo lường Nguồn dữ liệu Kỳ vọng IncGini Bất bình đẳng thu nhập % 0 - Bình đẳng hoàn toàn 100 - Bất bình đẳng hoàn toàn ADB World Bank EdGini Bất bình đẳng giáo dục % 0 - Bình đẳng hoàn toàn 100 - Bất bình đẳng hoàn toàn ADB Barro-Lee World Bank + Yschool Trung bình số

năm đi học Năm Barro-Lee

ADB Barro-Lee World Bank - Gdpper Thu nhập bình quân đầu người

(giá so sánh năm 2010 $

US)

Nghìn USD

GDP quốc gia (giá so sánh năm 2010 $ US) /tổng dân số ADB World Bank - Edinvest Tỷ lệ chi tiêu giáo dục trong tổng GDP %

0 - Hoàn toàn không chi tiêu cho giáo dục 100 - Chi tiêu cho giáo dục hoàn toàn

ADB World Bank - Urban Tỷ lệ dân số thành thị % 0 - Dân số thành thị hoàn toàn 100 - Không có dân số thành thị ADB World Bank + EFI Chỉ số tự do kinh tế Điểm 1- Ít tự do

10 – Tự do hoàn toàn Viện Fraser -

Nguồn: Tổng hợp của tác giả

3.4. Phương pháp nghiên cứu

3.4.1. Phương pháp phân tích và tổng hợp

Phương pháp phân tích lý thuyết: được tác giả sử dụng nhằm phân tích lý thuyết thành những mặt, những bộ phận, những mối quan hệ theo lịch sử thời gian để nhận thức, phát hiện và khai thác các khía cạnh khác nhau của mối quan hệ giữa các biến số và bất bình đẳng thu nhập từ đó chọn lọc những thông tin cần thiết phục vụ cho đề tài.

Phương pháp tổng hợp lý thuyết: được tác giả sử dụng nhằm kết hợp những mặt, những bộ phận, những mối quan hệ thông tin từ các lý thuyết đã thu thập được thành một chỉnh thể để tạo ra một hệ thống lý thuyết mới đầy đủ và sâu sắc về chủ đề nghiên cứu.

3.4.2. Phương pháp định lượng

Với dữ liệu thu thập từ các nguồn, tác giả kiểm tra, chọn lọc và tổng hợp thành bộ dữ liệu đầy đủ. Trong các trường hợp dữ liệu bị khuyết tác giả sẽ sử dụng phương pháp dự báo giản đơn8 nhằm cải thiện dữ liệu tuy nhiên trong phạm vi cho phép và không làm ảnh hưởng đến kết quả. Sau khi có dữ liệu hoàn chỉnh, tác giả sẽ tiến hành phân tích và xử lý số liệu bằng phần mềm STATA 12. Trình tự thực hiện phân tích số liệu theo các bước: thống kê mô tả, chạy các mô hình hồi quy, thực hiện các kiểm định để lựa chọn mô hình, kiểm định các giả thuyết mô hình, hiệu chỉnh và phân tích kết quả mô hình.

3.4.2.1. Phương pháp thống kê mô tả

Tác giả sử dụng phương pháp thống kê mô tả nhằm thể hiện những đặc tính cơ bản của dữ liệu thu thập được từ nghiên cứu thực nghiệm qua các cách thức khác nhau. Từ đó có thể tóm tắt đơn giản về mẫu và các thước đo. Trong phần này, nghiên cứu sẽ sử dụng các kỹ thuật sau: (i) Biểu diễn dữ liệu bằng các đồ thị nhằm so sánh đối chiếu dữ liệu; (ii) Biểu diễn dữ liệu thành các bảng số liệu tóm tắt về dữ liệu; (iii) Thống kê tóm tắt nhằm mô tả dữ liệu.

3.4.2.2. Mô hình hồi quy gộp (Pooled OLS)

Cách tiếp cận đơn giản nhất là bỏ qua bình diện không gian và thời gian của dữ liệu kết hợp và chỉ ước lượng hồi quy bằng phương pháp bình phương nhỏ nhất (OLS). Mô hình này có các hệ số không biến đổi, gộp chung toàn bộ số liệu chéo và

8Các phương pháp dự báo giản đơn được sử dụng hầu hết trong các nghiên cứu là một kỹ thuật đề xử lý cho các trường hợp các dữ liệu có quan sát bị lỗi, là bước Chuẩn bị dữ liệu trước khi tiến hành ước lượng. Các phương pháp này dựa vào tài liệu của tác giả Nguyễn Trọng Hoài (2001) và được đính kèm một số phương pháp tiêu biểu ở phần Phụ lục.

chuỗi thời gian rồi chạy mô hình hồi quy hay còn được gọi là mô hình hồi quy gộp (Pooled OLS). Mô hình ước lượng: Yit = C1 + βi*Xit + uit, trong đó: Yit là biến phụ thuộc, Xit là biến độc lập, C1 là hệ số chặn, βi là hệ số gốc đối với biến độc lập Xi, uit là phần dư.

Tuy nhiên, trên thực tế việc đồng nhất hiệu ứng đặc thù theo không gian và thời gian là điều không thể. Vì mỗi không gian sẽ có đặc thù riêng và có thể thay đổi theo thời gian. Do đó, trong mô hình Pooled OLS rất dễ vi phạm các giả định về mô hình hồi quy.

3.4.2.3. Mô hình tác động cố định (Fixed Effect Model - FEM)

Với giả định mỗi thực thể đều có những đặc điểm riêng biệt có thể ảnh hưởng đến các biến giải thích, mô hình tác động cố định phân tích mối tương quan này giữa phần dư của mỗi thực thể với các biến giải thích. Qua đó kiểm soát và tách ảnh hưởng của các đặc điểm riêng biệt (không đổi theo thời gian) ra khỏi các biến giải thích để chúng ta có thể ước lượng những ảnh hưởng thực của biến giải thích lên biến phụ thuộc. Mô hình FEM: Yit = Ci + βi*Xit + uit, trong đó: Yit là biến phụ thuộc, Xit là biến độc lập, Ci (i = 1,...., n) lần lượt là hệ số chặn cho từng thực thể nghiên cứu, βi là hệ số gốc đối với biến độc lập Xi, uit là phần dư. Tuy nhiên mô hình FEM do đưa vào nhiều biến giả, mô hình sẽ làm giảm số bậc tự do; và có khả năng xảy ra đa cộng tuyến.

3.4.2.4. Mô hình tác động ngẫu nhiên (Random Effect Model - REM)

Điểm khác biệt giữa mô hình ảnh hưởng ngẫu nhiên và mô hình ảnh hưởng cố định được thể hiện ở sự biến động giữa các thực thể. Nếu sự biến động giữa các thực thể có tương quan đến biến độc lập - biến giải thích trong mô hình ảnh hưởng cố định thì trong mô hình ảnh hưởng ngẫu nhiên sự biến động giữa các thực thể được giả sử là ngẫu nhiên và không tương quan đến các biến giải thích. Chính vì vậy, nếu sự khác biệt giữa các thực thể có ảnh hưởng đến biến phụ thuộc thì REM

sẽ thích hợp hơn so với FEM. Trong đó, phần dư của mỗi thực thể (không tương quan với biến giải thích) được xem là một biến giải thích mới.

Mô hình REM: Yit = Ci + β*Xit + uit trong đó: Yit là biến phụ thuộc, Xit là biến độc lập, βi là hệ số gốc đối với biến độc lập Xi, uit là phần dư. Ngoài ra, thay vì trong mô hình FEM, Ci là cố định thì trong REM có giả định rằng nó là một biến ngẫu nhiên với trung bình là Ci và giá trị hệ số chặn được mô tả như sau: Ci = C + εi (i = 1,...,n) với εi: Sai số ngẫu nhiên có trung bình bằng 0 và phương sai là σ2ε. Như vậy, thay vào mô hình ta có: Yit = C + β*Xit + εi + uit

Hay: Yit = C + β*Xit + wit, với wit = εi + uit; εi : Sai số thành phần của các đối tượng khác nhau (đặc điểm khác nhau của từng đối tượng); uit : Sai số thành phần kết hợp khác của cả đặc điểm riêng theo từng đối tượng và thời gian. Mô hình REM quan tâm đến cả vấn đề về những khác biê ̣t của riêng các đối tượng phân tích qua thời gian đóng góp vào mô hình. Do đó, tự tương quan là mô ̣t vấn đề tiềm tàng trong mô hình này cần phải giải quyết, đồng thời nó la ̣i loa ̣i bỏ tốt yếu tố phương sai thay đổi. Nhìn chung mô hình FEM hay REM tốt hơn cho nghiên cứu phụ thuộc vào giả định có hay không sự tương quan giữa εi các biến giải thích X. Nếu giả định

Khuyến nghị từ kết quả nghiên cứu