Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 22 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
22
Dung lượng
512,28 KB
Nội dung
Kiểm định giả thuyết thống kê Tuan A Nguyen natuan@upes.edu.vn Tuan A Nguyen Kiểm định giả thuyết thống kê / 22 Nội dung chương Bài toán kiểm định giả thuyết Kiểm định giả thuyết mẫu Kiểm định giả thuyết hai mẫu độc lập Kiểm định giả thuyết hai mẫu ghép cặp Tuan A Nguyen Kiểm định giả thuyết thống kê / 22 Bài toán kiểm định giả thuyết Ý tưởng Kiểm định giả thuyết Các đặc trưng mẫu việc sử dụng để ước lượng dùng để đánh giá xem đốn tổng thể hay sai Việc tìm kết luận để bác bỏ hay chấp nhận đoán gọi kiểm định giả thuyết Ví dụ Người ta nghi ngờ VĐV đua xe đạp Lance Amstrong sử dụng doping Câu hỏi: biết nghi ngờ hay sai? Thường làm: Bước 1: xét nghiệm mẫu máu/nước tiểu Amstrong ⇒ liệu D Bước 2: Từ liệu D, đưa kết luận Bước thường dựa vào nguyên tắc suy diễn thống kê mà nguyên tắc suy diễn bị nhiều người phản đối mặt logic1 D A Berry (2008), The science of doping, Nature 454, 692–693 Tuan A Nguyen Kiểm định giả thuyết thống kê / 22 Bài toán kiểm định giả thuyết Giả thuyết H0 H1 Giả thuyết Trong kiểm định giả thuyết, ta có hai loại giả thuyết: H0 : phải có “=” H1 : trái ngược với H0 Ví dụ Thu nhập trung bình SV UPES trường năm µ (triệu/tháng) Ta tin rằng, số tầm khoảng triệu/tháng Vậy thì, ta kiểm định (cặp) giả thuyết H0 : µ = H : µ = ̸ Ta khảo sát thu nhập vài chục SV UPES tốt nghiệp năm Trên sở đó, tính tốn định chấp nhận H0 hay H1 Tuan A Nguyen Kiểm định giả thuyết thống kê / 22 Bài toán kiểm định giả thuyết Sai lầm kiểm định giả thuyết Vì dựa mẫu nên ta phạm sai lầm định: XXX XXX Sự thực XXX XXX Quyết định XX X Bác bỏ H0 Chấp nhận H0 H0 H0 sai Sai lầm loại Kiểm định Kiểm định Sai lầm loại Một phần lý đạo đức2 , người ta ấn định khả mắc sai lầm loại số α cho trước, i.e Xác suất “Bác bỏ H0 H0 đúng” = α Ta gọi α mức ý nghĩa − α độ tin cậy kiểm định Các nhà thống kê thường chấp nhận α ⩽ 5%, i.e − α ≥ 95% Sai lầm loại giống kết án người vô tội Tuan A Nguyen Kiểm định giả thuyết thống kê / 22 Bài toán kiểm định giả thuyết Tổng hợp bước tiến hành kiểm định giả thuyết Thiết lập giả thuyết H0 H1 Tính giá trị kiểm định Tìm giá trị tới hạn mức ý nghĩa α cho trước Ra định: chấp nhận H0 hay chấp nhận H1 Kết luận: trả lời cách rõ ràng câu hỏi mà toán đặt Nhận xét chung Các phương pháp kiểm định giống công thức nấu ăn ⇒ đa dạng, phong phú Kết kiểm định khơng tuyệt đối mà có độ tin cậy định Tuan A Nguyen Kiểm định giả thuyết thống kê / 22 Kiểm định giả thuyết mẫu [One Sample Test] Cơ sở lý thuyết Một tổng thể có trung bình µ chưa biết Với α cho trước, ta muốn so sánh µ với số µ0 H0 : µ = µ0 Giả thuyết: H : µ = ̸ µ0 Giá trị kiểm định: t = √ |¯ x −µ0 | n sˆ Giá trị tới hạn: tdf ;α với df = n − Qui tắc định: t ≥ tdf ;α : chấp nhận H1 t < tdf ;α : chấp nhận H0 Chú ý: số tác giả gọi t ttính tdf ;α tbảng 3 Khơng khuyến khích sử dụng thuật ngữ khơng phổ biến, buồn cười! Tuan A Nguyen Kiểm định giả thuyết thống kê / 22 Kiểm định giả thuyết mẫu [One Sample Test] Ví dụ mẫu Trong thập niên 80, cân nặng trung bình niên 48kg Hiện nay, người ta cân ngẫu nhiên 100 niên thấy cân nặng trung bình 50kg phương sai mẫu hiệu chỉnh 10kg Ở mức ý nghĩa 1%, kết luận cân nặng niên có thay đổi so với thập niên 80 khơng? Giải Ký hiệu µ cân nặng trung bình (tồn bộ) niên Ta chưa biết giá trị µ cần so sánh với µ0 = 48kg thập niên 80 mức ý nghĩa α = 1% H0 : µ = 48 Giả thuyết: H : µ ̸= 48 Tuan A Nguyen Kiểm định giả thuyết thống kê / 22 Kiểm định giả thuyết mẫu [One Sample Test] Ví dụ mẫu √ Giá trị kiểm định: theo đề n = 100, x¯ = 48 sˆ = 10 Suy √ √ |¯ x − µ0 | n |50 − 48| 100 √ t= = 6, 32 = sˆ 10 Giá trị tới hạn: Tra bảng t-Student có t99;0,01 = 2, 626 Quyết định: t = 6, 32 > 2, 626 = t99;0,01 ⇒ bác bỏ H0 , chấp nhận H1 Kết luận: µ ̸= 48 ⇒ Cân nặng niên KHÁC so với thập niên 80 Nhận xét: KHÁC tăng hay giảm? Để trả lời, ta quan sát thấy x¯ = 50 > 48 = µ0 Do đó, khơng biết giá trị µ, ta suy diễn µ > µ0 , i.e cân nặng niên tăng lên so với thập niên 80 Tuan A Nguyen Kiểm định giả thuyết thống kê / 22 Kiểm định giả thuyết mẫu [One Sample Test] Bài tập Có lý thuyết nhà khảo cổ học cho tuổi lấy chồng lần đầu trung bình Roma thời cổ đại 19 tuổi, mộ phụ nữ mà có văn bia (epitaph) người cha viết tuổi trung bình < 19, cịn chồng viết tuổi trung bình > 19 Theo ghi chép lịch sử, tuổi lấy chồng lần đầu 26 phụ nữ Roma thời cổ đại ghi lại là: 11, 12, 12, 12, 12, 13, 13, 13, 13, 13, 14, 14, 14, 14, 14, 14, 15, 15, 15, 15, 15, 15, 16, 16, 17, 17 Với α = 5%, kiểm tra xem nhận định nhà khảo cổ học có khơng? Cho biết huyết áp trung bình phụ nữ khỏe mạnh 120mmHg Đo huyết áp 20 nữ VĐV giải nghệ có kết quả: 128, 127, 118, 115, 144, 142, 133, 140, 132, 131, 111, 132, 149, 122, 139, 119, 136, 129, 126, 128 Với độ tin cậy 99%, nói huyết áp nữ VĐV giải nghệ khác biệt so với phụ nữ bình thường không? Tuan A Nguyen Kiểm định giả thuyết thống kê 10 / 22 Kiểm định giả thuyết mẫu [One Sample Test] Bài tập Năng suất lúa trung bình vụ mùa trước 4, tạ/ha Năm nay, người ta thử nghiệm kỹ thuật 100ha đất trồng lúa có bảng suất Với α = 1%, kết luận kỹ thuật mới? Tuan A Nguyen Năng suất Diện tích 30 – 35 35 – 40 12 40 – 45 18 45 – 50 27 50 – 55 20 55 – 60 60 – 65 65 – 70 Kiểm định giả thuyết thống kê 11 / 22 Kiểm định giả thuyết hai mẫu độc lập [Independent Samples Test] Cơ sở lý thuyết Hai tổng thể A B độc lập (khảo sát hai khách thể khác nhau) có trung bình µA µB chưa biết Với α cho trước, so sánh µA µB H0 : µA = µB Giả thuyết: H : µ ̸= µ A B Giá trị kiểm định: từ hai tổng thể A B, chọn hai mẫu xA xB (gọi hai mẫu độc lập) có kích thước nA nB Tính x¯A , sˆA , x¯B sˆB Giá trị kiểm định tính sau: Nếu nA , nB ≥ 30: Nếu nA , nB < 30: |¯ xA − x¯B | t=s sˆB2 sˆA2 + nA nB t=s |¯ xA − x¯B | sˆA2 (nA − 1) + sˆB2 (nB − 1) nA + nB · nA + nB − nA · nB Giá trị tới hạn: tdf ;α với df = nA + nB − Tuan A Nguyen Kiểm định giả thuyết thống kê 12 / 22 Kiểm định giả thuyết hai mẫu độc lập [Independent Samples Test] Ví dụ mẫu Đo chiều cao 120 nam sinh lớp 12 vùng nội thành thấy chiều cao trung bình em 163cm với độ lệch chuẩn hiệu chỉnh 6cm Đo chiều cao 100 nam sinh lớp 12 ngoại thành thấy chiều cao trung bình em 161cm với độ lệch chuẩn hiệu chỉnh 10cm Ở mức ý nghĩa 1%, so sánh chiều cao nam sinh lớp 12 thuộc hai vùng Giải Ta có hai tổng thể độc lập nhau: chiều cao nam sinh lớp 12 vùng nội thành (A) vùng ngoại thành (B) Ký hiệu: µA : chiều cao trung bình (tồn bộ) nam sinh lớp 12 nội thành µB : chiều cao trung bình (tồn bộ) nam sinh lớp 12 ngoại thành Ta chưa biết giá trị µA lẫn µB cần so sánh chúng với mức ý nghĩa α = 1% Tuan A Nguyen Kiểm định giả thuyết thống kê 13 / 22 Kiểm định giả thuyết hai mẫu độc lập [Independent Samples Test] Ví dụ mẫu H0 : µA = µB Giả thuyết kiểm định: H : µ = A ̸ µB Giá trị kiểm định: theo đề nA = 120, nB = 100, x¯A = 163, sˆA = 6, x¯B = 161 sˆB = 10 Suy |163 − 161| = 1, 75 t=r 62 102 + 120 100 Giá trị tới hạn: t118;0,01 = 2, 601 Quyết định: t = 1, 75 < 2, 601 = t118;0,01 ⇒ chấp nhận H0 Kết luận: µA = µB ⇒ chiều cao nam sinh lớp 12 thuộc hai vùng BẰNG Tuan A Nguyen Kiểm định giả thuyết thống kê 14 / 22 Kiểm định giả thuyết hai mẫu độc lập [Independent Samples Test] Bài tập Kiểm tra 50 nam SV thích tham gia mơn điền kinh thấy chiều cao trung bình 68,2 inches với độ lệch chuẩn hiệu chỉnh 2,5 inches Kiểm tra 50 nam SV khơng thích tham gia mơn điều kinh thấy chiều cao trung bình 67,5 inches với độ lệch chuẩn hiệu chỉnh 2,8 inches So sánh chiều cao hai nhóm SV độ tin cậy 95% Quan sát cân nặng (kg) số trẻ sơ sinh trai trẻ sơ sinh gái, ta có liệu sau: Cân nặng – 3,2 3,2 – 3,4 3,4 – 3,6 3,6 – 3,8 3,8 – Số trẻ trai 10 Số trẻ gái 10 10 Với α = 5%, kiểm tra xem trẻ sơ sinh trai trẻ sơ sinh gái có cân nặng GIỐNG hay KHÁC nhau? Và, KHÁC trẻ sơ sinh nặng hơn? Tuan A Nguyen Kiểm định giả thuyết thống kê 15 / 22 Kiểm định giả thuyết hai mẫu ghép cặp [Paired Samples Test] Cơ sở lý thuyết Tổng thể ghép cặp [tổng thể có liên quan] Là hai tổng thể khảo sát từ khách thể khác thời điểm khảo sát, đặc tính khảo sát hay điều kiện khảo sát Ví dụ Dưới ba tình hai tổng thể ghép cặp: Tổng thể dung tích sống HS trước học bơi tổng thể dung tích sống HS sau học bơi năm Tổng thể lực bóp tay trái tổng thể lực bóp tay phải nhóm VĐV Tổng thể thành tích chạy 100m đường đất tổng thể thành tích chạy đường nhựa nhóm VĐV Tuan A Nguyen Kiểm định giả thuyết thống kê 16 / 22 Kiểm định giả thuyết hai mẫu ghép cặp [Paired Samples Test] Cơ sở lý thuyết Có hai tổng thể ghép cặp A B với trung bình µA µB chưa biết Ở mức ý nghĩa α, ta muốn so sánh µA với µB H0 : µA = µB Giả thuyết kiểm định: H : µ ̸= µ A B Giá trị kiểm định: Từ hai tổng thể A B, ta chọn hai mẫu xA xB Giá trị kiểm định tính sau: ¯ √n |d| t= sˆd đó: d¯ sˆd đặc trưng mẫu d = xA − xB (trừ theo cặp) n = số cặp (xA , xB ) Giá trị tới hạn: tdf ;α với df = n − Tuan A Nguyen Kiểm định giả thuyết thống kê 17 / 22 Kiểm định giả thuyết hai mẫu ghép cặp [Paired Samples Test] Ví dụ mẫu Người ta chọn ngẫu nhiên 11 VĐV dùng thử chất kích thích (khơng bị cấm sử dụng) Đo nhịp tim VĐV trước sử dụng (A) sau sử dụng (B) có liệu Với α = 5%, kiểm tra xem chất kích thích có ảnh hưởng đến nhịp tim VĐV hay không? xA 65 68 61 69 65 71 63 67 70 65 68 xB 63 65 65 62 70 70 60 70 75 67 71 Giải Có hai tổng thể ghép cặp: nhịp tim VĐV trước sử dụng chất kích thích sau sử dụng chất kích thích Ký hiệu: µA : nhịp tim trung bình VĐV trước sử dụng chất kích thích µB : nhịp tim trung bình VĐV sau sử dụng chất kích thích Tuan A Nguyen Kiểm định giả thuyết thống kê 18 / 22 Kiểm định giả thuyết hai mẫu ghép cặp [Paired Samples Test] Ví dụ mẫu Ta chưa biết giá trị µA lẫn µB cần so sánh chúng với mức ý nghĩa α = 1% H0 : µA = µB Giả thuyết kiểm định: H : µ = A ̸ µB Giá trị kiểm định: trừ cặp (xA , xB ) ta d : 2, 3, −4, 7, −5, 1, 3, −3, −5, −2, −3 Tính d¯ = −0, 55 sˆd = 3, 96 Suy √ | − 0, 55| 11 = 0, 46 t= 3, 96 Giá trị tới hạn: t10;0,05 = 2, 228 Quyết định: t = 0, 46 < 2, 228 = t10;0,05 ⇒ chấp nhận H0 Kết luận: µA = µB ⇒ nhịp tim VĐV trước sau sử dụng BẰNG ⇒ chất kích thích khơng ảnh hưởng đến nhịp tim VĐV Tuan A Nguyen Kiểm định giả thuyết thống kê 19 / 22 Kiểm định giả thuyết hai mẫu ghép cặp [Paired Samples Test] Bài tập Để đánh giá tác dụng chế độ ăn bồi dưỡng cho VĐV mà dấu hiệu quan sát số lượng hồng cầu, người ta áp dụng chế độ ăn bồi dưỡng cho 20 VĐV Đếm số hồng cầu 20 VĐV trước ăn (A) sau ăn bồi dưỡng (B) thu liệu sau: xA xB 32 40 38 42 41 35 36 47 50 30 38 45 43 36 50 38 42 41 45 44 40 45 42 50 52 43 48 45 55 34 32 54 58 30 60 35 50 48 40 50 Ở độ tin cậy 99%, kết luận chế độ ăn bồi dưỡng có tác dụng làm TĂNG số lượng hồng cầu VĐV không? Tuan A Nguyen Kiểm định giả thuyết thống kê 20 / 22 Kiểm định giả thuyết hai mẫu ghép cặp [Paired Samples Test] Bài tập Người ta chọn 20 người béo (BMI > 30) để thực chương trình giảm cân (tập thể dục đặn, hợp lý kết hợp với ăn kiêng) Cân nặng người trước thực (A) sau thực (B) chương trình sau: xA xB 80 78 85 70 90 78 92 88 75 75 63 72 89 76 77 71 83 78 82 90 75 77 80 70 84 74 85 82 80 65 62 71 83 72 82 71 79 76 83 81 Với α = 1%, chương trình có tác dụng làm GIẢM cân nặng khơng? Chú thích: BMI viết tắt Body Mass Index, tính cơng thức Cân nặng: kg Cân nặng BMI = 2 ; Chiều cao: m Chiều cao Tuan A Nguyen Kiểm định giả thuyết thống kê 21 / 22 Kết thúc chương Tuan A Nguyen Kiểm định giả thuyết thống kê 22 / 22 ... ăn bồi dưỡng (B) thu liệu sau: xA xB 32 40 38 42 41 35 36 47 50 30 38 45 43 36 50 38 42 41 45 44 40 45 42 50 52 43 48 45 55 34 32 54 58 30 60 35 50 48 40 50 Ở độ tin cậy 99%, kết luận chế độ... lần đầu 26 phụ nữ Roma thời cổ đại ghi lại là: 11, 12, 12, 12, 12, 13, 13, 13, 13, 13, 14, 14, 14, 14, 14, 14, 15, 15, 15, 15, 15, 15, 16, 16, 17, 17 Với α = 5%, kiểm tra xem nhận định nhà khảo... trước 4, tạ/ha Năm nay, người ta thử nghiệm kỹ thuật 100ha đất trồng lúa có bảng suất Với α = 1%, kết luận kỹ thuật mới? Tuan A Nguyen Năng suất Diện tích 30 – 35 35 – 40 12 40 – 45 18 45 – 50