Đưa biến không liên quan vào mô hình tuy không làm thiên lệch ước lượng, song làm giảm hiệu quả của ước lượng, đặc biệt là khi biến này có tương quan với biến giải thích chính. Thừa bi[r]
(1)Vũ Thành Tự Anh
(2) Sai số đo lường
Bỏ sót biến quan trọng
Thừa biến khơng liên quan
Biến nội sinh
(3) Thiết kế nghiên cứu xác định
Nhất quán nội tại
Không thiên lệch: Trung tâm khoảng giá trị gần
với giá trị ước lượng đúng
Hiệu quả: Thu hẹp khoảng giá trị ước lượng Nhắc lại tiêu chí đánh giá
(4)
1 Sai số đo lường: Khi ghi nhận khác thực tế
(5)
1 Sai số đo lường
[Ví dụ: Số ca ghi nhận nhiễm COVID-19]
Gồm trường hợp chẩn đốn thơng qua hình ảnh phổi Chỉ gồm xét nghiệm
(6)
Thang đo biểu danh (nominal): Sử dụng cho liệu mà
thuộc tính chúng khơng ngầm định hay khác biệt thứ bậc (VD giới tính, tơn giáo, sắc tộc) Số liệu có tính mã hóa, khơng dùng để tính tốn đại số
Thang đo thứ bậc (ordinal): Thứ bậc phản ánh khác
biệt, song khoảng cách bậc lại khơng có nhiều ý nghĩa (VD trình độ học vấn) Thang đo khơng dùng phép tính đại số
Thang đo khoảng (interval): Dùng để đo đại lượng
liên tục, khoảng cách thang đo đại diện cho khoảng cách thuộc tính (VD điểm thi) Phép chia đại số khơng có ý nghĩa
Thang đo tỷ lệ (ratio): Cũng dùng để đo đại lượng liên
tục, phép chia đại số lại có ý nghĩa (VD GDP)
1 Sai số đo lường
(7)
Định lượng: Mọi thang đo số
Định tính:
Thang đo khơng thiết số (VD chế độ
trị, hình thức sở hữu, hay mức độ phân cấp quyền trung ương địa phương)
Những thang đo gần (proxy) không thiết
phản ảnh thuộc tính (VD số lượng thương vong khơng thiết phản ảnh tầm quan trọng chiến tranh)
Điều then chốt nên sử dụng thang đo phù hợp nhất với mục tiêu nghiên cứu.
Sai số đo lường
(8) Sai số có tính
hệ thống Sai số có tínhngẫu nhiên
Biến phụ thuộc
• Làm thiên lệch suy luận mơ tả
• Khơng làm thiên lệch suy luận nhân
• Làm thiên lệch suy luận mơ tả
• Khơng làm thiên lệch suy luận nhân
• Giảm hiệu ước
lượng nhân
Biến độc lập • Làm thiên lệch suyluận mơ tả • Khơng làm thiên lệch
suy luận nhân
• Làm thiên lệch suy luận mơ tả
• Làm suy yếu suy luận
nhân
• Giảm hiệu ước
lượng nhân
Tác động sai số đo lường
(9)
Bỏ sót biến khơng ảnh hưởng đến kết ước lượng nếu:
Biến (bị sót) khơng tương quan với biến phụ thuộc
Biến bị sót có tương quan với biến phụ thuộc song khơng tương quan với (các) biến giải thích khác mơ hình Khi ấy:
Ước lượng quan hệ (các) biến giải thích biến phụ thuộc
khơng bị ảnh hưởng
Nhưng mức độ xác dự báo giá trị biến phụ thuộc bị giảm
Ví dụ [Xé rào ưu đãi FDI]: Khoảng cách đến thị trường số PCI khơng có tương quan
Trong trường hợp cịn lại, bỏ sót biến (quan trọng) dẫn
tới ước lượng thiên lệch
Ví dụ: Khi biến bỏ sót tương quan với biến phụ thuộc lẫn biến độc lập khác mơ hình
(10)
Ví dụ bạn muốn ước lượng giá xe cũ: Giá = β1 + β2 .Số dặm + β3 .Tuổi xe
Giả sử ước lượng mình, bạn bỏ quên biến “tuổi xe”:
Giá = β1 + β2 .Số dặm
Ước lượng có bị thiên lệch khơng?
Có - tuổi xe tương quan với “giá” “số dặm”
Chiều hướng thiên lệch nào?
Nó làm cho β2 nhận giá trị âm lớn β2
phản ảnh tác động (tiêu cực) “tuổi xe” đến “giá”
(11)
Giả sử Y biến phụ thuộc, A B biến giải thích, B biến bị bỏ qn mơ hình.
Bỏ sót biến quan trọng
[Chiều hướng thiên lệch]
B A
tương quan (+)
B A
tương quan (-) B Y
tương quan (+) Thiên lệch (+) Thiên lệch (-) B Y
(12)(13)
Việc đưa thêm nhiều biến liên quan không phải là giải pháp cho nguy bỏ sót biến quan trọng.
Cơ sở mơ hình (cả định lượng định tính) thường lý thuyết kiểm chứng.
Khi số lượng quan sát ít, đưa q nhiều biến giải thích có nguy biến mơ hình trở thành “khơng xác định”.
Đưa biến khơng liên quan vào mơ hình khơng làm thiên lệch ước lượng, song làm giảm hiệu quả của ước lượng, đặc biệt biến có tương quan với biến giải thích chính.
(14)
Vấn đề nội sinh: Giá trị biến giải thích hệ quả chứ khơng phải nguyên nhân biến phụ thuộc
Ví dụ 1: “Matthew Effect” hay “nước chảy chỗ trũng”
Đồng tác giả báo hay dự án
Ví dụ 2: “Self-selection” hay “đồng tương ứng”
Học viên Fulbright
Ví dụ 3: Chi KH-CN với lực KH-CN
(15) Tối đa hóa địn bẩy suy luận
Vấn đề nghiên cứu dựa vào quan sát
Bao nhiêu quan sát đủ?
Làm để tăng số lượng quan sát?
(16)
Một nhiệm vụ thiết kế nghiên cứu tối đa hóa
“địn bẩy” cho suy luận (mô tả nhân quả).
Để thực mục tiêu này, biểu quan sát được nhiều mạnh tốt.
Số lượng quan sát nhiều khả tối đa
hóa địn bẩy cao.
Tối đa hóa địn bẩy suy luận
Số lượng quan sát
Biểu quan sát
Địn bẩy suy
(17)
Không kiểm định giả thuyết thay thế
Rủi ro cao gặp sai số đo lường
Thế giới xác suất (ngẫu nhiên sv tất định)
Làm để khắc phục nhược điểm này?
Suy luận tương tự (reasoning by analogy) đòi hỏi giả
định mạnh – tất biến số khác giữ nguyên
Suy luận so sánh
Tăng số quan sát tăng số biểu quan sát
được
(18)
Số lượng quan sát cần thiết phụ thuộc vào:
Nghiên cứu định tính hay định lượng
Thiết kế nghiên cứu
Suy luận nhân cần thực hiện
Phạm vi mức độ nhân tố tầm kiểm sốt
Kích thước mẫu cần thiết phụ thuộc vào:
Mức độ bất định biến phụ thuộc
Mức độ chắn mong muốn suy luận nhân quả
Mức độ cộng tuyến biến xử lý biến kiểm soát
(19)
Một quan sát = đo lường biến phụ thuộc cho một đơn vị phân tích (và biến giải thích tương ứng đơn vị phân tích đó)
Để tăng số quan sát, câu hỏi cần trả lời là:
Đâu biểu quan sát lý
thuyết/giả thuyết?
Đâu trường hợp ta kiểm chứng
được biểu quan sát này?
Cách tăng số lượng quan sát:
Tăng số đơn vị phân tích
Dùng thêm đo lường khác
Đơn vị phân tích & đo lường mới
(20)
Sử dụng lý thuyết (giả thuyết), sử dụng cùng tập hợp biến giải thích phụ thuộc, nhưng áp dụng cho trường hợp mới.
Xuyên không gian: Ví dụ như
Các tỉnh thành Việt Nam (sub-units)
Các quốc gia phát triển …
Xuyên thời gian
Các giai đoạn khác (lưu ý tính quán)
Ví dụ: Bảo hộ khu vực DNNN hội nhập
Mức độ bảo hộ ngành khác nhau
Mức độ bảo hộ hệ hiệp định thương mại
tự khác
(21)
Cách tiếp cận tìm kiếm tác động khác nhau của nguyên nhân.
Tìm thêm biến phụ thuộc để kiểm định giả thuyết
Ví dụ: Tác động sách cải thiện mơi trường kinh doanh kết hoạt động kinh tế các địa phương: Có thể đo lường kết bằng:
Tốc độ tăng trưởng GDP
GDP bình quân đầu người
Thu nhập bình quân đầu người
Chi tiêu bình quân đầu người
Tỷ lệ tăng lao động/dân số (cơ học) v.v.
(22)
Ví dụ 1: Mối quan hệ giá đền bù giải tỏa đất
nông nghiệp phản kháng người dân VN
Đơn vị phân tích thấp hơn: tỉnh/thành phố | quận,
huyện
Sự phản kháng đo nhiều thước đo
(số đơn khiếu kiện, khiến kiện vượt cấp, biểu tình …)
Sự phản kháng ngồi ngun nhân giá đền bù thấp
cịn số nhân tố có tính địa phương
Ví dụ 2: Giải thích tình trạng bỏ học cấp của
học sinh phổ thông Việt Nam
Đơn vị phân tích thấp hơn
Việc học sinh bỏ học nhân tố có tính địa
phương (văn hóa, tập quán)
Journal of the American Medical Association