Kiểm định phi tham số ÔN TẬP – GIẢI ĐÁP THẮC MẮC Thái Thanh Trúc Nội dung • Thống kê mô tả • Các kiểm định có tham số • Các kiểm định phi tham số • Ước lượng mức độ liên quan • Giải đáp thắc mắc Thống kê mô tả • Biến định tính – Tần số – Tỉ lệ phần trăm – Tỉ lệ phần trăm cộng đồn (với biến thứ tự) – Khoảng tin cậy 95% – Stata • tab1 CácBiếnSố – Ví dụ: tab1 gioi nghenghiep • ci prop BiếnNhịGiá – Ví dụ: ci prop ungthu
ÔN TẬP – GIẢI ĐÁP THẮC MẮC Thái Thanh Trúc Nội dung • Thống kê mơ tả • Các kiểm định có tham số • Các kiểm định phi tham số • Ước lượng mức độ liên quan • Giải đáp thắc mắc Thống kê mơ tả • Biến định tính – Tần số – Tỉ lệ phần trăm – Tỉ lệ phần trăm cộng đồn (với biến thứ tự) – Khoảng tin cậy 95% – Stata • tab1 CácBiếnSố – Ví dụ: tab1 gioi nghenghiep • ci prop BiếnNhịGiá – Ví dụ: ci prop ungthu Thống kê mơ tả • Biến định lượng Cách 1: hist biếnsố, norm freq – Ví dụ: hist tlsosinh, norm freq → Bình thường có dạng hình chng Cách 2: pnorm biếnsố # Normal probability plot – Ví dụ: pnorm tlsosinh → Bình thường hai đường (đậm nhạt) trùng Cách 3: qnorm biếnsố # Quantiles of normal distribution plot – Ví dụ: qnorm tlsosinh → Bình thường hai đường (đậm nhạt) trùng Thống kê mơ tả • Biến định lượng Cách 4: swilk biếnsố # Shapiro Wilk test – Ví dụ: swilk tlsosinh, norm freq → Bình thường p > 0,05 → Kiểm định nhạy → nên hạn chế dùng • Nếu số liệu có phân phối khơng bình thường (lệch) xem gợi ý cách biến đổi số liệu – gladder biến số, freq – Ví dụ: gladder tlsosinh, freq 2.00e+10 4.00e+10 6.00e+10 8.00e+10 1.00e+11 0 20 40 60 80 identity 20 40 60 80 square 20 40 60 80 cubic 5000000 1.00e+07 1.50e+07 2.00e+07 30 40 50 60 70 6.5 7.5 8.5 -.04 -.035 -.03 -.025 -.02 -.015 100200300400500 1/cubic 200 400 600 1/square 100 200 300 inverse -.0015 -.001 -.0005 -2.50e-06 -2.00e-06 -1.50e-06 -1.00e-06 -5.00e-07 0 20 50 0 50 100150200 1/sqrt 100 150 log 100 20 40 60 80 sqrt 1000 2000 3000 4000 5000 -4.00e-09 -3.00e-09 -2.00e-09 -1.00e-09 luong so sinh (gram) Histograms by transformation Thống kê mô tả • Biến định lượng – Khi có phân phối bình thường → Trung bình ± Độ lệch chuẩn – Khi khơng có phân phối bình thường → Trung vị (Khoảng tứ vị) – Khoảng tin cậy 95% – Stata • sum CácBiếnSố, d – Ví dụ: sum tuoi bmi • ci mean BiếnĐịnhLượng – Ví dụ: ci mean bmi Thống kê mơ tả • Biến định tính – Tần số – Phần trăm – Phần trăm cộng dồn – KTC 95% • Biến định lượng – Có phân phối bình thường • Trung bình • Độ lệch chuẩn • Phạm vi – Khơng có phân phối bình thường • Trung vị • Khoảng tứ vị • Phạm vi – KTC 95% Kiểm định thống kê • Kết định tính – Kiểm định Chi bình phương – Kiểm định xác Fisher • Khi ≥ 20% số ô có vọng trị