1. Trang chủ
  2. » Cao đẳng - Đại học

Bài giảng 5. Một số điều cần tránh và tăng số lượng quan sát

22 15 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 22
Dung lượng 1,17 MB

Nội dung

 Đưa biến không liên quan vào mô hình tuy không làm thiên lệch ước lượng, song làm giảm hiệu quả của ước lượng, đặc biệt là khi biến này có tương quan với biến giải thích chính. Thừa bi[r]

(1)

Vũ Thành Tự Anh

(2)

  Sai số đo lường

 Bỏ sót biến quan trọng

 Thừa biến khơng liên quan

 Biến nội sinh

(3)

  Thiết kế nghiên cứu xác định

Nhất quán nội tại

Không thiên lệch: Trung tâm khoảng giá trị gần

với giá trị ước lượng đúng

Hiệu quả: Thu hẹp khoảng giá trị ước lượng Nhắc lại tiêu chí đánh giá

(4)

1 Sai số đo lường: Khi ghi nhận khác thực tế

(5)

1 Sai số đo lường

[Ví dụ: Số ca ghi nhận nhiễm COVID-19]

Gồm trường hợp chẩn đốn thơng qua hình ảnh phổi Chỉ gồm xét nghiệm

(6)

Thang đo biểu danh (nominal): Sử dụng cho liệu mà

thuộc tính chúng khơng ngầm định hay khác biệt thứ bậc (VD giới tính, tơn giáo, sắc tộc) Số liệu có tính mã hóa, khơng dùng để tính tốn đại số

Thang đo thứ bậc (ordinal): Thứ bậc phản ánh khác

biệt, song khoảng cách bậc lại khơng có nhiều ý nghĩa (VD trình độ học vấn) Thang đo khơng dùng phép tính đại số

Thang đo khoảng (interval): Dùng để đo đại lượng

liên tục, khoảng cách thang đo đại diện cho khoảng cách thuộc tính (VD điểm thi) Phép chia đại số khơng có ý nghĩa

Thang đo tỷ lệ (ratio): Cũng dùng để đo đại lượng liên

tục, phép chia đại số lại có ý nghĩa (VD GDP)

1 Sai số đo lường

(7)

Định lượng: Mọi thang đo số

Định tính:

 Thang đo khơng thiết số (VD chế độ

trị, hình thức sở hữu, hay mức độ phân cấp quyền trung ương địa phương)

 Những thang đo gần (proxy) không thiết

phản ảnh thuộc tính (VD số lượng thương vong khơng thiết phản ảnh tầm quan trọng chiến tranh)

Điều then chốt nên sử dụng thang đo phù hợp nhất với mục tiêu nghiên cứu.

Sai số đo lường

(8)

Sai số có tính

hệ thống Sai số có tínhngẫu nhiên

Biến phụ thuộc

• Làm thiên lệch suy luận mơ tả

• Khơng làm thiên lệch suy luận nhân

• Làm thiên lệch suy luận mơ tả

• Khơng làm thiên lệch suy luận nhân

• Giảm hiệu ước

lượng nhân

Biến độc lập • Làm thiên lệch suyluận mơ tả • Khơng làm thiên lệch

suy luận nhân

• Làm thiên lệch suy luận mơ tả

• Làm suy yếu suy luận

nhân

• Giảm hiệu ước

lượng nhân

Tác động sai số đo lường

(9)

Bỏ sót biến khơng ảnh hưởng đến kết ước lượng nếu:

 Biến (bị sót) khơng tương quan với biến phụ thuộc

 Biến bị sót có tương quan với biến phụ thuộc song khơng tương quan với (các) biến giải thích khác mơ hình Khi ấy:

 Ước lượng quan hệ (các) biến giải thích biến phụ thuộc

khơng bị ảnh hưởng

 Nhưng mức độ xác dự báo giá trị biến phụ thuộc bị giảm

 Ví dụ [Xé rào ưu đãi FDI]: Khoảng cách đến thị trường số PCI khơng có tương quan

 Trong trường hợp cịn lại, bỏ sót biến (quan trọng) dẫn

tới ước lượng thiên lệch

 Ví dụ: Khi biến bỏ sót tương quan với biến phụ thuộc lẫn biến độc lập khác mơ hình

(10)

 Ví dụ bạn muốn ước lượng giá xe cũ: Giá = β1 + β2 .Số dặm + β3 .Tuổi xe

 Giả sử ước lượng mình, bạn bỏ quên biến “tuổi xe”:

Giá = β1 + β2 .Số dặm

 Ước lượng có bị thiên lệch khơng?

 Có - tuổi xe tương quan với “giá” “số dặm”

 Chiều hướng thiên lệch nào?

 Nó làm cho β2 nhận giá trị âm lớn β2

phản ảnh tác động (tiêu cực) “tuổi xe” đến “giá”

(11)

 Giả sử Y biến phụ thuộc, A B biến giải thích, B biến bị bỏ qn mơ hình.

Bỏ sót biến quan trọng

[Chiều hướng thiên lệch]

B A

tương quan (+)

B A

tương quan (-) B Y

tương quan (+) Thiên lệch (+) Thiên lệch (-) B Y

(12)(13)

 Việc đưa thêm nhiều biến liên quan không phải là giải pháp cho nguy bỏ sót biến quan trọng.

 Cơ sở mơ hình (cả định lượng định tính) thường lý thuyết kiểm chứng.

 Khi số lượng quan sát ít, đưa q nhiều biến giải thích có nguy biến mơ hình trở thành “khơng xác định”.

 Đưa biến khơng liên quan vào mơ hình khơng làm thiên lệch ước lượng, song làm giảm hiệu quả của ước lượng, đặc biệt biến có tương quan với biến giải thích chính.

(14)

Vấn đề nội sinh: Giá trị biến giải thích hệ quả chứ khơng phải nguyên nhân biến phụ thuộc

 Ví dụ 1: “Matthew Effect” hay “nước chảy chỗ trũng”

 Đồng tác giả báo hay dự án

 Ví dụ 2: “Self-selection” hay “đồng tương ứng”

 Học viên Fulbright

 Ví dụ 3: Chi KH-CN với lực KH-CN

(15)

  Tối đa hóa địn bẩy suy luận

 Vấn đề nghiên cứu dựa vào quan sát

 Bao nhiêu quan sát đủ?

 Làm để tăng số lượng quan sát?

(16)

Một nhiệm vụ thiết kế nghiên cứu tối đa hóa

“địn bẩy” cho suy luận (mô tả nhân quả).

 Để thực mục tiêu này, biểu quan sát được nhiều mạnh tốt.

Số lượng quan sát nhiều khả tối đa

hóa địn bẩy cao.

Tối đa hóa địn bẩy suy luận

Số lượng quan sát

Biểu quan sát

Địn bẩy suy

(17)

Không kiểm định giả thuyết thay thế

Rủi ro cao gặp sai số đo lường

Thế giới xác suất (ngẫu nhiên sv tất định)

Làm để khắc phục nhược điểm này?

Suy luận tương tự (reasoning by analogy) đòi hỏi giả

định mạnh – tất biến số khác giữ nguyên

Suy luận so sánh

Tăng số quan sát tăng số biểu quan sát

được

(18)

Số lượng quan sát cần thiết phụ thuộc vào:

 Nghiên cứu định tính hay định lượng

 Thiết kế nghiên cứu

 Suy luận nhân cần thực hiện

 Phạm vi mức độ nhân tố tầm kiểm sốt

Kích thước mẫu cần thiết phụ thuộc vào:

 Mức độ bất định biến phụ thuộc

 Mức độ chắn mong muốn suy luận nhân quả

 Mức độ cộng tuyến biến xử lý biến kiểm soát

(19)

 Một quan sát = đo lường biến phụ thuộc cho một đơn vị phân tích (và biến giải thích tương ứng đơn vị phân tích đó)

 Để tăng số quan sát, câu hỏi cần trả lời là:

 Đâu biểu quan sát lý

thuyết/giả thuyết?

 Đâu trường hợp ta kiểm chứng

được biểu quan sát này?

 Cách tăng số lượng quan sát:

 Tăng số đơn vị phân tích

 Dùng thêm đo lường khác

 Đơn vị phân tích & đo lường mới

(20)

 Sử dụng lý thuyết (giả thuyết), sử dụng cùng tập hợp biến giải thích phụ thuộc, nhưng áp dụng cho trường hợp mới.

Xuyên không gian: Ví dụ như

 Các tỉnh thành Việt Nam (sub-units)

 Các quốc gia phát triển …

Xuyên thời gian

 Các giai đoạn khác (lưu ý tính quán)

 Ví dụ: Bảo hộ khu vực DNNN hội nhập

 Mức độ bảo hộ ngành khác nhau

 Mức độ bảo hộ hệ hiệp định thương mại

tự khác

(21)

 Cách tiếp cận tìm kiếm tác động khác nhau của nguyên nhân.

 Tìm thêm biến phụ thuộc để kiểm định giả thuyết

 Ví dụ: Tác động sách cải thiện mơi trường kinh doanh kết hoạt động kinh tế các địa phương: Có thể đo lường kết bằng:

 Tốc độ tăng trưởng GDP

 GDP bình quân đầu người

 Thu nhập bình quân đầu người

 Chi tiêu bình quân đầu người

 Tỷ lệ tăng lao động/dân số (cơ học) v.v.

(22)

Ví dụ 1: Mối quan hệ giá đền bù giải tỏa đất

nông nghiệp phản kháng người dân VN

 Đơn vị phân tích thấp hơn: tỉnh/thành phố | quận,

huyện

 Sự phản kháng đo nhiều thước đo

(số đơn khiếu kiện, khiến kiện vượt cấp, biểu tình …)

 Sự phản kháng ngồi ngun nhân giá đền bù thấp

cịn số nhân tố có tính địa phương

Ví dụ 2: Giải thích tình trạng bỏ học cấp của

học sinh phổ thông Việt Nam

 Đơn vị phân tích thấp hơn

Việc học sinh bỏ học nhân tố có tính địa

phương (văn hóa, tập quán)

Journal of the American Medical Association

Ngày đăng: 12/04/2021, 00:21

w