5. Kết cấu của Luận văn
3.3 Dữ liệu nghiên cứu
Dữ liệu nghiên cứu được lấy từ 380 đối tượng được khảo sát chủ yếu ở khu vực thành phố Hồ Chí Minh có độ tuổi tối thiểu là 18 ( độ tuổi được phép sử dụng xe gắn máy trên 50cc) và độ tuổi tối đa là 60 ( độ tuổi về hưu đối với nam)
Dữ liệu được gửi đi và thu hồi về qua đường internet: 50% Dữ liệu được gửi đi và thu hồi về qua đường văn bản: 40% Dữ liệu được lấy trực tiếp bằng phỏng vấn nhanh: 10%
Đa số đối tượng khảo sát là bạn bè của tác giả và nhân viên, lãnh đạo các doanh nghiệp.
Số người được khảo sát: 380
Số người hoàn thành bảng khảo sát: 352 ( chiếm 92,63% tổng khảo sát).
Số người khơng hồn thành đúng yêu cầu của bảng khảo sát: 28 ( chiếm 7,37% tổng khảo sát, chủ yếu qua đường văn bản)
Sau đây là các thống kê chi tiết về dữ liệu thu thập:
Bảng 3.4 Thống kê về độ tuổi các đối tượng được khảo sát:
Độ tuổi 18-25 26-35 36-45 46-60 Số lượng đối tượng khảo sát 178 145 35 22 Tỉ lệ (%) trên tổng số người khảo sát 46.84 38.16 9.21 5.79
Nguồn: Dữ liệu khảo sát thực tế
Bảng 3.5 Thống kê về giới tính đối tượng được khảo sát
Giới tính Nam Nữ Số lượng đối tượng khảo sát 141 239 Tỉ lệ (%) trên tổng số người khảo sát 37.11 62.89 Nguồn: Dữ liệu khảo sát thực tế
Bảng 3.6 Thống kê về trình độ học vấn của đối tượng được khảo sát Trình độ học vấn cao nhất Chưa tốt nghiệp THPT Đã tốt nghiệp THPT Đã tốt nghiệp đại học, cao đẳng Cao học trở lên Số lượng đối tượng khảo sát 4 40 275 61 Tỉ lệ (%) trên tổng số người khảo sát 1.05 10.53 72.37 16.05
Nguồn: Dữ liệu khảo sát thực tế
Bảng 3.7 Các thống kê khác về dữ liệu khảo sát
Chỉ tiêu khảo sát Thu nhập cá nhân ( nghìn đồng/ tháng)
Chi phí xăng dầu ( nghìn đồng/ tháng) Thấp nhất 300 ( đối tượng thất nghiệp) 100
Trung bình 6561 415 Cao nhất 50000 5000
Nguồn: Dữ liệu khảo sát thực tế
3.4 Phương pháp nghiên cứu
Dữ liệu của biến Support ( mức độ ủng hộ thuế bảo vệ môi trường đối với xăng dầu của cá nhân được khảo sát) sẽ được kí hiệu là yi và có giá trị từ 1 đến 5 và chỉ có ý
nghĩa phân cấp, khơng mang ý nghĩa về mức ủng hộ chính xác của mỗi cá nhân. Giả
định mỗi cá nhân sẽ lựa chọn mức yi dựa trên sự so sánh đối với mức độ ủng hộ thực sự của họ (Si) , khi đó sẽ có một số giá trị ngưỡng (threshold value) như sau:
Vì phải ước lượng gián tiếp qua y, khơng thể dùng hồi quy OLS để trực tiếp ước lượng mơ hình mà phải qua mơ hình trung gian là mơ hình phân cấp logit (ordered logit). Ưu điểm của mơ hình phân cấp logit là ngồi việc ước lượng các hệ số của các biến trong mơ hình, mơ hình cịn cung cấp n-1 giá trị ngưỡng (n là số lượng mức độ yi)
Gọi µ là các điểm ngưỡng ( threshold points)
Với 5 lựa chọn ta có tương ứng 5 giá trị Yi ( Yi = 1, 2, 3, 4, 5) và 04 giá trị µ. Yi = 1 khi Si ≤ µ1
Yi = 2 khi µ1 ≤ Si ≤ µ2 Yi = 3 khi µ2 ≤ Si ≤ µ3 Yi = 4 khi µ3 ≤ Si ≤ µ4 Yi = 5 khi S ≥ µ4
Trong một mẫu quan sát, ta có :
Si = Σ βkXki + ei= Zi+ ei ( với k là số biến độc lập)
Vì ei tuân theo quy luật phân phối logistic, nên giá trị Si và Zi có thể bằng nhau hoặc không bằng nhau. Trong nhiều trường hợp, Zi là chỉ số dự đoán cho Si khi ei rất nhỏ, từ Si được dự đoán ( Si = Zi) ta có thể suy ra giá trị Yi qua việc so sánh Si với µi và biết được đối tượng được khảo sát có sự ủng hộ thuế bảo vệ môi trường đối với xăng dầu ở mức nào. Tuy nhiên, đây vẫn là dự đốn và Zi có thể lớn hơn hoặc nhỏ hơn Si và vì thế khi so sánh Si được dự đốn với µi có thể cho có thể cho ra kết quả sai lệch về giá trị Yi.
Một cách khác để tìm giá trị Yi là ta tính xác suất đối tượng khảo sát sẽ lựa chọn mức ủng hộ nào ( tức là lựa chọn mức nào nào trong 5 mức ở đáp án câu hỏi đầu tiên ).
Ta có : Zi = Σ βkXki
Với n giá trị Yi nhận được, ta có n xác suất xảy ra cho từng giá trị Yi
Gọi P(Yi = n) là xác suất xảy ra tương ứng với từng lựa chọn mức độ ủng hộ : P(Yi = 1) = P1 = 1 - exp( Zi - µ1)
1+[exp(Zi - µ1)]
P(Yi = j) = Pj = 1+[exp(Zi - µj-1)]exp(Zi - µj-1) - 1+[exp(Zi - µj)]exp(Zi - µj) với j = 2, 3…., n-1
P(Yi = n) = Pn = 1+[exp(Zi - µn-1)]exp(Zi - µn-1)
Nếu n =5 ( số lựa chọn là 5), ta có cơng thức cụ thể cho 5 xác suất dự đoán là : P(Yi = 1) = P1 = 1 - 1+[exp(Zi - µ1)]exp( Zi - µ1)
P(Yi = 2) = P2 = 1+[exp(Zi - µ1)]exp( Zi - µ1) - 1+[exp(Zi - µ2)]exp(Zi - µ2)
P(Yi = 3) = P3 = exp(Zi - µ2) 1+[exp(Zi - µ2)] - exp(Zi - µ3) 1+[exp(Zi - µ3)] P(Yi = 4) = P4 = exp(Zi - µ3) 1+[exp(Zi - µ3)] - exp(Zi - µ4) 1+[exp(Zi - µ4)] P(Yi = 5) = P5 = 1+[exp(Zi - µ4)]exp(Zi - µ4)