Bài giảng Thống kê cho khoa học xã hội - Bài 3: Ước lượng và kiểm định giả thuyết thống kê thông tin đến các bạn những kiến thức về điều tra chọn mẫu; ước lượng số trung bình và tỷ lệ từ kết quả điều tra chọn mẫu; kiểm định giả thuyết thống kê.
GIỚI THIỆU MÔN HỌC THỐNG KÊ CHO KHOA HỌC XÃ HỘI Giảng viên: ThS Nguyễn Thị Xuân Mai BÀI ƯỚC LƯỢNG VÀ KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ Giảng viên: ThS Nguyễn Thị Xuân Mai MỤC TIÊU BÀI HỌC • Trình bày số vấn đề điều tra chọn mẫu • Trình bày yếu tố ước lượng • Trình bày phương pháp ước lượng số trung bình tổng thể chung • Trình bày phương pháp ước lượng tỷ lệ tổng thể chung • Trình bày cơng thức xác định cỡ mẫu cần điều tra • Giới thiệu số vấn đề kiểm định giả thuyết thống kê khái niệm có liên quan • Trình bày phương pháp kiểm định giả thuyết thống kê giá trị trung bình tổng thể chung • Trình bày phương pháp kiểm định giả thuyết thống kê tỷ lệ tổng thể chung CÁC KIẾN THỨC CẦN CÓ Kiến thức chung kinh tế - xã hội HƯỚNG DẪN HỌC • Đọc tài liệu tham khảo • Thảo luận với giáo viên sinh viên khác vấn đề chưa hiểu rõ • Trả lời câu hỏi học • Đọc tìm hiểu thêm điều tra thống kê, điều tra chọn mẫu phương pháp thống kê suy luận CẤU TRÚC NỘI DUNG 3.1 Điều tra chọn mẫu 3.2 Ước lượng số trung bình tỷ lệ từ kết điều tra chọn mẫu 3.3 Kiểm định giả thuyết thống kê 3.1 ĐIỀU TRA CHỌN MẪU 3.1.1 Khái niệm điều tra chọn mẫu 3.1.2 Ưu nhược điểm điều tra chọn mẫu 3.1.3 Sai số điều tra chọn mẫu 3.1.1 KHÁI NIỆM ĐIỀU TRA CHỌN MẪU • Điều tra chọn mẫu loại điều tra không tồn người ta chọn số đơn vị thuộc đối tượng nghiên cứu để tiến hành điều tra thực tế Các đơn vị chọn theo quy tắc định để đảm bảo tính đại biểu Kết điều tra chọn mẫu dùng để suy rộng cho tổng thể chung • Các khái niệm liên quan: Chọn mẫu ngẫu nhiên: Là phương pháp tổ chức chọn mẫu cách hoàn tồn ngẫu nhiên khơng qua xếp Ví dụ: bốc thăm, quay số chọn theo bảng số ngẫu nhiên hay chọn Có nhiều phương pháp chọn mẫu ngẫu nhiên: chọn ngẫu nhiên giản đơn, chọn mẫu hệ thống, chọn mẫu chùm, chọn mẫu phân tầng, chọn mẫu phân tổ X i pháp chọn đơn vị điều xphụ Chọn mẫu phi ngẫu nhiên: phương tra thuộc vào i x N thông tin biết n tổng thể ý muốn chủ quan người chọn, dựa * * N n Ví dụ: chọn đơn vị trung bình, chọn p chuyên gia f N 2 n Xi N S2 xi x n 1 3.1.1 KHÁI NIỆM ĐIỀU TRA CHỌN MẪU • Tổng thể chung tập hợp bao gồm toàn đối tượng nghiên cứu → Xác định tổng thể nghiên cứu quan trọng Việc xác định sai dẫn đến kết tính tốn mẫu bị chệch dẫn đến sai số phi chọn mẫu • Tổng thể mẫu (còn gọi mẫu) tập hợp rút từ tổng thể nghiên cứu → Điều tra chọn mẫu thu thập thông tin từ đơn vị mẫu • Suy rộng (ước lượng) từ tham số (mức độ) tính tốn đơn vị điều tra (TTM) suy tham số tương ứng tồn tượng (TTC) Qui mơ Tổng thể chung Tổng thể mẫu N n 2 = p(1- p) S2 = f(1 – f) Số trung bình Tỷ lệ theo tiêu thức Phương sai 3.1.2 ƯU NHƯỢC ĐIỂM CỦA ĐIỀU TRA CHỌN MẪU • Ưu điểm: Tiết kiệm mặt thời gian chi phí so với điều tra tồn Do điều tra đơn vị nên mở rộng nội dung điều tra sâu nghiên cứu chi tiết nhiều mặt tượng Tài liệu thu điều tra chọn mẫu có độ xác cao giảm sai số phi chọn mẫu Tiến hành nhanh gọn, bảo đảm tính kịp thời số liệu thống kê Mặt khác, điều tra chọn mẫu khơng địi hỏi phải có tổ chức lớn, cần quan nhóm người tiến hành điều tra • Nhược điểm: Không cho biết thông tin đầy đủ, chi tiết đơn vị tổng thể, không cho biết qui mô tổng thể Do tiến hành điều tra số đơn vị dùng kết để suy rộng cho tồn tổng thể nên chắn khơng tránh khỏi sai số suy rộng Kết điều tra chọn mẫu tiến hành phân nhỏ theo phạm vi tiêu thức nghiên cứu điều tra tồn mà thực mức độ định tuỳ thuộc vào quy mô mẫu cách rải mẫu 10 3.2.2 ƯỚC LƯỢNG SỐ TRUNG BÌNH CỦA TỔNG THỂ CHUNG Ví dụ: Một mẫu gồm 20 nhân viên tiến hành điều tra nhằm thu thập thơng tin liên quan đến chương trình đào tạo Người ta tính thời gian trung bình để hồn tất chương trình 20 nhân viên 51,5 ngày với độ lệch tiêu chuẩn 6,84 ngày Hãy ước lượng thời gian trung bình để hồn tất chương trình với độ tin cậy 95% • Do chưa biết phương sai tổng thể chung nên dùng phương sai tổng thể mẫu để ước lượng • Tra bảng t-Student với mức ý nghĩa 0,05 19 bậc tự do, t0,025;19 = 2,093 • Cơng thức ước lượng: • 6,84 51,5 2, 093 hay 51,5 3, 20 Kết luận: Với mẫu cho, khoảng tin cậy 95% cho thời gian trung bình để hồn tất chương trình là: 48,3 54, (ngày) 17 3.2.3 ƯỚC LƯỢNG TỶ LỆ CỦA TỔNG THỂ CHUNG • Theo tiêu thức nghiên cứu, tổng thể có loại biểu Khi tổng thể chung có phân phối nhị thức Phân phối xấp xỉ chuẩn sử dụng • Với mẫu đủ lớn (n.p n(1-p) 5), công thức ước lượng khoảng tin cậy cho tỷ lệ tổng thể chung sau: Trong đó: f f p f f f sai số chọn mẫu ước lượng tỷ lệ tổng thể chung f z / f (1 f ) n z/2 giá trị tới hạn phân phối chuẩn 18 3.2.4 XÁC ĐỊNH CỠ MẪU ĐIỀU TRA Cơ sở xác định cỡ mẫu: • Sai số chọn mẫu nhỏ • Chi phí điều tra thấp → Đây hai yêu cầu đối lập → Khi xác định cỡ mẫu thường dựa vào độ xác ước lượng • Cỡ mẫu xác định ước lượng số trung bình là: Z 2/2 2 n 2x Ví dụ: Cỡ mẫu để khoảng tin cậy 90% ước lượng số trung bình nằm phạm vi Một nghiên cứu cho độ lệch chuẩn 45 Z 2/ 1, 6452.452 n 219, 220 2 x Cỡ mẫu xác định ước lượng tỷ lệ là: n Z 2/ p 1 p 2f Lưu ý: Cỡ mẫu ln làm trịn lên 19 3.2.4 XÁC ĐỊNH CỠ MẪU ĐIỀU TRA Để xác định cỡ mẫu, cần phải biết yếu tố: • Độ tin cậy mong muốn, xác định giá trị z/2 • Sai số chọn mẫu chấp nhận được, • Độ lệch tiêu chuẩn tổng thể, , yếu tố thường khơng biết đa phần trường hợp Có số cách để xác định giá trị sau: Lấy phương sai lớn lần điều tra trước (nếu có) Lấy phương sai tượng khác tương tự (nếu có) Điều tra thí điểm để tính phương sai Có thể ước lượng độ lệch tiêu chuẩn qua khoảng biến thiên tùy theo phân phối tổng thể Cụ thể, tổng thể có phân phối chuẩn thì: R xmax xmin 6 20 3.3 KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ 3.3.1 Một số vấn đề chung kiểm định giả thuyết thống kê 3.3.2 Kiểm định giả thuyết giá trị trung bình tổng thể chung 3.3.3 Kiểm định giả thuyết tỷ lệ tổng thể chung 21 3.3.1 MỘT SỐ VẤN ĐỀ CHUNG VỀ KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ • Giả thuyết thống kê giả thuyết vấn đề tổng thể chung Cặp giả thuyết thống kê gồm: Giả thuyết không (H0) giả thuyết mà ta muốn kiểm định Giả thuyết đối (H1) giả thuyết đối lập với H0 • Kiểm định thống kê tìm kết luận việc thừa nhận hay bác bỏ giả thuyết dựa vào thơng tin thực nghiệm mẫu Các loại kiểm định: Kiểm định hai phía; Kiểm định phía trái; Kiểm định phía phải 22 3.3.1 MỘT SỐ VẤN ĐỀ CHUNG VỀ KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ Kiểm định phía bác bỏ giả thuyết H0 tham số đặc trưng mẫu cao thấp so với giá trị giả thuyết tổng thể chung Kiểm định phía có miền bác bỏ Kiểm định phía trái bác bỏ giả thuyết H0 tham số đặc trưng mẫu nhỏ cách đáng kể so với giá trị giả thuyết H0 Miền bác bỏ nằm phía trái đường phân phối Kiểm định phía phải bác bỏ giả thuyết H0 tham số đặc trưng mẫu lớn cách đáng kể so với giá trị giả thuyết H0 Miền bác bỏ nằm phía phải đường phân phối 23 3.3.1 MỘT SỐ VẤN ĐỀ CHUNG VỀ KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ (tiếp theo) • Sai lầm mức ý nghĩa kiểm định Khi phải lựa chọn hai giả thuyết H0 H1, mắc phải: Sai lầm loại bác bỏ giả thuyết H0 Sai lầm loại thừa nhận H0 sai Kết luận • Thực tế Chấp nhận H0 Bác bỏ H0 nhận H1 H0 Kết luận Sai lầm loại H0 sai Sai lầm loại Kết luận Xác suất mắc sai lầm loại gọi mức ý nghĩa, ký hiệu Xác suất mắc sai lầm loại gọi β; 1- β gọi lực kiểm định Tiêu chuẩn kiểm định Tiêu chuẩn kiểm định thống kê tuân theo quy luật phân phối xác suất xác định (quy luật phân phối chuẩn, phân phối T-Student, phân phối 2, phân phối Fisher ) giả thuyết không Trong tập hợp kiểm định thống kê có mức ý nghĩa , kiểm định có xác suất mắc sai lầm loại nhỏ xem “tốt nhất” 24 3.3.1 MỘT SỐ VẤN ĐỀ CHUNG VỀ KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ (tiếp theo) • Các bước tiến hành kiểm định giả thiết thống kế Phát biểu giả thuyết H0 giả thuyết đối H1 Định rõ mức ý nghĩa Chọn tiêu chuẩn kiểm định Tính giá trị tiêu chuẩn kiểm định từ mẫu quan sát Kết luận: Nếu giá trị tiêu chuẩn kiểm định thuộc miền bác bỏ: H0 sai, bác bỏ giả thuyết H0 Nếu giá trị tiêu chuẩn kiểm định thuộc miền chấp nhận: với mẫu cụ thể chưa đủ sở để bác bỏ H0 t x 0 1344, 27 1123 3, 71 S n 231 15 25 3.3.2 KIỂM ĐỊNH GIẢ THUYẾT VỀ GIÁ TRỊ TRUNG BÌNH CỦA TỔNG THỂ CHUNG • Giả sử lượng biến tiêu thức X tổng thể chung phân phối theo quy luật Ký chuẩn với trung bình phương sai x2 hiệu: N(, 2) Ta chưa biết , t có sở 0 Vậy S / giả n thuyết thống kê H0: = 0 • Để kiểm định giả thuyết này, từ tổng thể ta tiến hành điều tra chọn mẫu ngẫu nhiên n đơn vị tính trung bình mẫu x • Phương sai tổng thể chung σ2 biết Tiêu chuẩn kiểm định thống kê z: z x 0 / n H0 đúng, z phân phối theo quy luật chuẩn hóa N(0,1) Kiểm định phía phải: Kiểm định phía trái: Kiểm định hai phía: H0: = 0 H1: > 0 H0: = 0 H1: < 0 H0: = 0 H1: ≠ 0 Nếu z > Z, bác bỏ giả thuyết H0 Nếu z < -Z, bác bỏ giả thuyết H0 Nếu |z| > Z/2, bác bỏ giả thuyết H0 26 3.3.2 KIỂM ĐỊNH GIẢ THUYẾT VỀ GIÁ TRỊ TRUNG BÌNH CỦA TỔNG THỂ CHUNG • Phương sai tổng thể σ2 chưa biết Tiêu chuẩn kiểm định thống kê t: H0 đúng, t phân phối theo quy luật Student với (n - 1) bậc tự Kiểm định phía phải: Kiểm định phía trái: Kiểm định hai phía: H0: = 0 H1: > 0 H0: = 0 H1: < 0 H0: = 0 H1: ≠ 0 Nếu t > t,(n-1), bác bỏ giả thuyết H0 Nếu t < -t,(n-1), bác bỏ giả thuyết H0 Nếu |t| > t/2,(n-1), bác bỏ giả thuyết H0 Lưu ý: thực tế, với quy mô mẫu lớn (n ≥30), thống kê t phân phối xấp xỉ chuẩn, nên so sánh tiêu chuẩn kiểm định với giá trị Z 27 3.3.2 KIỂM ĐỊNH GIẢ THUYẾT VỀ GIÁ TRỊ TRUNG BÌNH CỦA TỔNG THỂ CHUNG Ví dụ: Theo công bố nghiên cứu chi tiêu hộ gia đình thành thị, năm 2012, trung bình hộ phải trả 1123 nghìn đồng tháng cho tiêu dùng lượng Để kiểm tra thông tin này, người ta chọn 15 hộ gia đình tính chi tiêu dùng lượng trung bình hộ 1344,27 nghìn đồng tháng với độ lệch tiêu chuẩn 231 nghìn đồng Ở mức ý nghĩa 5%, liệu kết luận nghiên cứu có thấp thực tế hay khơng? • Gọi mức chi cho tiêu dùng lượng trung bình hộ tháng • Ta cần kiểm định giả thuyết: H0: = 1123 H1: > 1123 • Do chưa biết phương sai tổng thể chung nên tiêu chuẩn kiểm định thống kê t • Tra bảng phân phối Student với 14 bậc tự ta tìm t0,05;14 = 1,761 • Kết luận: t > t,(n-1) với mẫu nghiên cứu, bác bỏ H0 Các hộ gia đình chi tiêu dùng lượng nhiều mức công bố nghiên cứu 28 3.3.3 KIỂM ĐỊNH GIẢ THUYẾT VỀ TỶ LỆ CỦA TỔNG THỂ CHUNG • Giả sử tổng thể chung, tỷ lệ theo tiêu thức A p Nếu p chưa biết, song có sở cho giá trị p0, ta đưa giả thuyết: H0: p = p0 • Để kiểm định giả thuyết đó, lấy mẫu ngẫu nhiên kích thước n thấy có nA đơn vị có biểu nghiên cứu tiêu thức A Như ta có tỷ lệ mẫu: f = nA/n • Với n đủ lớn (n.p0 ≥ n(1 – p0) ≥ 5), tiêu chuẩn kiểm định thống kê Z: z • f p0 p (1 p ) n H0 đúng, z phân phối theo quy luật chuẩn hóa N(0,1) Kiểm định phía phải: Kiểm định phía trái: Kiểm định hai phía: H0: p = p0 H1: p > p0 H0: p = p0 H1: p < p0 H0: p = p0 H1: p ≠ p0 Nếu z > Z, bác bỏ giả thuyết H0 Nếu z < -Z, bác bỏ giả thuyết H0 Nếu |z| > Z/2, bác bỏ giả thuyết H0 29 3.3.3 KIỂM ĐỊNH GIẢ THUYẾT VỀ TỶ LỆ CỦA TỔNG THỂ CHUNG Ví dụ: Trong nghiên cứu công ty AZ, người ta thực vấn 758 khách du lịch đến HL có sử dụng tour du lịch biển xem liệu họ có hài lịng hay không 394 người số hỏi trả lời có Với mức ý nghĩa 5%, kiểm định xem liệu có đa số (>50%) người đến HL có sử dụng tour du lịch biển hài lịng với tour hay khơng? • Gọi p tỷ lệ khách du lịch đến HL có sử dụng tour du lịch biển hài lòng với tour • Giả thuyết cần kiểm định là: H0: p = 0,5 H1: p > 0,5 • Ta có np0 = 758.0,5 = 379 n(1-p0) = 758.0,5 = 379 điều kiện kiểm định thỏa mãn • Tỷ lệ mẫu f = 394/758 = 0,52 tiêu chuẩn kiểm định thống kê z 30 TÓM LƯỢC CUỐI BÀI Trong học này, nghiên cứu nội dung sau: • Điều tra chọn mẫu số khái niệm liên quan, ưu nhược điểm điều tra chọn mẫu trường hợp vận dụng • Ước lượng số trung bình tỷ lệ tổng thể chung từ kết điều tra chọn mẫu • Kiểm định giả thuyết số trung bình tỷ lệ tổng thể chung 31 ... xmax xmin 6 20 3. 3 KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ 3. 3.1 Một số vấn đề chung kiểm định giả thuyết thống kê 3. 3.2 Kiểm định giả thuyết giá trị trung bình tổng thể chung 3. 3 .3 Kiểm định giả thuyết... phương pháp thống kê suy luận CẤU TRÚC NỘI DUNG 3. 1 Điều tra chọn mẫu 3. 2 Ước lượng số trung bình tỷ lệ từ kết điều tra chọn mẫu 3. 3 Kiểm định giả thuyết thống kê 3. 1 ĐIỀU TRA CHỌN MẪU 3. 1.1 Khái...BÀI ƯỚC LƯỢNG VÀ KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ Giảng viên: ThS Nguyễn Thị Xuân Mai MỤC TIÊU BÀI HỌC • Trình bày số vấn đề điều tra chọn mẫu • Trình