3.2 Mơ hình nghiên cứu
3.2.1.1 Biến phụ thuộc
Biến phụ thuộc của bài nghiên cứu là bất bình đẳng thu nhập. Hệ số Gini được sử dụng khá phổ biến hơn trong những thống kê và các bài nghiên cứu trên thế giới. Tuy nhiên, vì khơng có một khái niệm về thu nhập nào (thu nhập trước thuế/sau thuế, thu nhập gộp/ròng…) là nền tảng khi tính tốn hệ số Gini nên những mâu thuẫn và chất lượng của dữ liệu bất bình đẳng thu nhập là một vấn đề lớn. Một số nghiên cứu sử dụng hệ số Gini do Deininger và Squire (1996) xây dựng (đã được đưa vào cơ sở dữ liệu bất bình đẳng thu nhập thế giới - WIID). Mặc dù vậy, bộ dữ liệu D&S này khá ít, chỉ có khoảng 700 quan sát cho tất cả quốc gia, vì vậy bộ dữ liệu này khá hạn chế trong việc cung cấp số liệu hàng năm trong thời gian dài của nhiều nước, điều này có nghĩa rằng các nghiên cứu đánh giá các xu hướng sự bất bình đẳng sẽ bị ảnh hưởng nếu không cố gắng lấp đầy dữ liệu bằng phương pháp nội suy (Atkinson và Bourguignon, 2000; Atkinson và Brandolini, 2001; Galbraith và Kum, 2005). Dự án
bất bình đẳng thu nhập của trường Đại học Texas (UTIP) đã xây dựng một bộ dữ liệu bất bình tồn cầu, dựa trên cơ sở dữ liệu thống kê công nghiệp xuất bản hàng năm của Tổ chức Phát triển Công nghiệp Liên hợp quốc (UNIDO) với khoảng 3.200 quan sát hơn 36 năm (1963-1999). Một nhược điểm của bộ dữ liệu này đó là cũng chỉ cho thấy sự bất bình đẳng tiền lương khu vực sản xuất mà chưa đo lường được bất bình đẳng thu nhập gia đình. Galbraith và Kum, 2005 cung cấp một phương pháp kết hợp các thông tin trong dữ liệu D&S với các thông tin trong dữ liệu UTIP-UNIDO, cùng với một số điều chỉnh đã tạo ra một tập hợp dữ liệu ước tính bất bình đẳng thu nhập hộ gia đình tồn diện và đáng tin cậy hơn9. Những dữ liệu này cung cấp độ chính xác,
nhất quán của trên nhiều quốc gia trên thế giới. Bộ dữ liệu UTIP có quy mơ lớn hơn nhiều so với D&S, tuy nhiên, nó vẫn thiếu hụt khá nhiều nước, trong đó có Việt Nam, ngoài ra, bản cập nhật mới nhất là dữ liệu đến năm 2008, khá xa so với thời điểm hiện tại. Một thay thế dữ liệu D&S khác và cũng được nhiều nhà kinh tế sử dụng trong nghiên cứu là bộ dữ liệu LIS10. Mục tiêu chính của dự án LIS là tạo ra một cơ sở dữ liệu vi mơ có chứa dữ liệu xã hội và kinh tế thu được trong các cuộc điều tra hộ gia đình từ các nước khác nhau. Bộ dữ liệu LIS khá đầy đủ cho các nước, nhất là những năm gần đây, đảm bảo được tính liên tục dữ liệu và giảm thiểu những vướng mắc về chuỗi dữ liệu khi thực hiện các nghiên cứu thực nghiệm. Với những phân tích trên, đồng thời đảm bảo dữ liệu cho bài nghiên cứu, tác giả sẽ sử dụng dữ liệu LIS được chuẩn hóa bởi SWIID11.