ThS Phạm Trí Cao * Chương # TC 31/08/2016 Trong thực tế ta thường gặp vấn đề: phải kiểm tra xem điều hay sai, nội dung thông tin mà ta nhận từ nguồn cung cấp (1 người, quan, tờ báo, tổ chức, ) có đáng tin cậy không CHƯƠNG 7: KIỂM ĐỊNH GIẢ THIẾT THỐNG KÊ Thông tin để kiểm đònh là: số, quy luật phân phối xác suất, tính độc lập dấu hiệu nghiên cứu, … Công việc kiểm tra lại nội dung thông tin mà ta nhận xem có đáng tin cậy không toán kiểm đònh Thí dụ 1: Một tổ chức cho chiều cao trung bình niên VN 1,65m Hãy lập giả thiết để kiểm chứng kết này? HD: = 1,65 H1: ≠ 1,65 : chiều cao TB niên thực tế 0= 1,65: chiều cao TB niên theo lời tổ chức H0: H0 H1 gọi giả thiết thống kê (giả thiết không) gọi giả thiết đối Ta tiến hành kiểm đònh (kiểm tra) sau: Thu thập số liệu thực tế (lấy mẫu): đo chiều cao khoảng triệu người Dùng quy tắc kiểm đònh tương ứng với giả thiết xét (kiểm đònh giá trò trung bình) để đònh: chấp nhận hay bác bỏ H0 Chấp nhận H0: tổ chức báo cáo Con số 1,65m đáng tin cậy Bác bỏ H0: tổ chức báo cáo sai ThS Phạm Trí Cao * Chương # TC 31/08/2016 Thí dụ 2: Một sinh viên tuyên bố tỷ lệ sinh viên thi cuối kỳ đạt môn XSTK 50% Hãy lập giả thiết thống kê để kiểm chứng điều này? HD: H0: p = 0,5 H1: p ≠ 0,5 p: tỷ lệ sinh viên thi đạt môn XSTK thực tế p0= 0,5 : tỷ lệ sinh viên thi đạt môn XSTK theo lời sinh viên Ta tiến hành kiểm đònh (kiểm tra) sau: Thu thập số liệu thực tế (lấy mẫu): thu thập điểm thi cuối kỳ môn XSTK khoảng 500 sinh viên Dùng quy tắc kiểm đònh tương ứng với giả thiết xét (kiểm đònh tỷ lệ) để đònh: chấp nhận hay bác bỏ H0 Chấp nhận H0: sinh viên tuyên bố Con số 50% đáng tin cậy Bác bỏ H0: sinh viên tuyên bố sai Thí dụ 3: Một cô gái cho thùy mò, nết na, đằm thắm, dòu dàng, ngăn nắp, chu đáo, …nói chung hết… ý! Và ta muốn để ý! Ta phải kiểm tra điều này! Tuy nhiên ta không đònh lập giả thiết thống kê nào, sai lầm đau khổ cả! Và ta tự tiến hành kiểm đònh được! Bài toán loại ta xét được, quy tắc đònh chung Ctmb đònh nào! Để xét xem chấp nhận hay bác bỏ H0 ta phải lấy mẫu, đưa đònh dựa mẫu Trong trình làm, có trường hợp sau: Quyết đònh H0 sai H0 Chủ quan Thực tế khách quan H0 sai Đúng Sai lầm loại H0 Sai lầm loại Đúng P(sll1) = P(bác bỏ H0 / H0 đúng) , P(sll2) = P(chấp nhận H0 / H0 sai) ThS Phạm Trí Cao * Chương # TC 31/08/2016 Thực tế khách quan không sai, không bò yếu tố chi phối Quyết đònh chủ quan người sai, bò yếu tố tâm sinh lý chi phối (vui/ buồn, cười/ khóc, hạnh phúc/ đau khổ, khỏe/ mệt, tha thứ/ hận thù, thương/ ghét, đẹp/ xấu, xì tin/ xì phé ) Ta làm giảm P(sll1) P(sll2) xuống lúc (cỡ mẫu cố đònh), làm giảm P(sll1) làm tăng P(sll2), ngược lại Chỉ làm giảm P(sll1) P(sll2) lúc cách tăng cỡ mẫu lên Về mặt khách quan loại sai lầm nguy hiểm, nói nguy hiểm Tuy nhiên mặt chủ quan ta coi sai lầm loại nguy hiểm sai lầm loại Do người ta lập giả thiết cho sai lầm loại nguy hiểm VD: 10 ÔN CỐ TRI TÂN Một người bò nghi ngờ ăn trộm Ta lập giả thiết: H0: Người vô tội H1: Người có tội (Trong xã hội văn minh, dân chủ mong muốn điều tốt đẹp xảy ra!) Công an thu thập chứng cớ để bác bỏ H0 Nếu có đủ chứng cớ kết luận người có tội (bác bỏ H0), không đủ chứng cớ phải kết luận người vô tội (chấp nhận H0) 11 Ngày xửa ngày xưa, xưa thật xưa, xưa cục đất, có bác tiều phu sống gần Hai nhà qua lại chơi thân, thường giúp đỡ lẫn Một hôm bác tiều phu A phát bò rìu (ngày xưa rìu vật quý giá, cần câu cơm để nuôi sống nhà bác, giá trò 1000 lạng vàng SJC thật), bác tìm hoài tìm mà không nên bác nghó bò trộm Gần nhà có bác tiều phu B nên bác A nghi ngờ bác B lấy trộm Từ nghi ngờ bác B lấy trộm bác A thấy bác B có dáng vẽ lấm léc, thậm thụt, mắt gian gian 12 giống y tên trộm ThS Phạm Trí Cao * Chương # TC 31/08/2016 ÔN CỐ TRI TÂN (TT) Vài ngày sau bác A tìm thấy rìu để đống củi, bò củi che lấp Sau hồi bóp trán suy nghó bác A nhớ lại: Bửa trước bác B qua rủ bác A tới nhà nhậu rượu đế Gò đen hiệu với gà chân voi Đông cảo mà bác bắt rừng đốn củi Bác A vui nên vội lấy củi lấp che rìu lại, sau nhậu quắc cần câu nhà bác B bác A không nhớ hết nên nghi ngờ bác B lấy Từ nhớ lại chuyện, bác A thấy bác B đáng yêu ngày nào, dáng vẽ bác B đấng nam nhi đường đường chính Bác A muốn vích cổ bác B xuống hôn 13 cho thỏa lòng mong nhớ !!! (Bác A ???) VD: Ta có loại sai lầm sau: Trong thực tế người vô tội, tắc trách CA bò hãm hại mà người bò kết luận có tội BẮT OAN (sll1) Trong thực tế người có tội, SIÊU TRỘM nên CA không tìm chứng cớ nên phải thả THẢ LẦM (sll2) Ta thấy BẮT OAN nguy hiểm THẢ LẦM, có thả lầm ta hy vọng “Lưới trời lồng lộng, thưa mà khó lọt, lọt lần chưa lọt lần khác!” (Bao Công) 14 CÁC DẠNG KIỂM ĐỊNH: Do ta đưa quy tắc kiểm đònh cho: P(sll1) 0 Phía trái: H0: =0 ; H1: 0 Kiểm đònh phía H0: =0 ; H1: 0 19 20 ThS Phạm Trí Cao * Chương # TC 31/08/2016 2a) n < 30, bieát 2 (X có phân phối chuẩn) (x ) n t , t/2 (tra baûng F) |t| t/2 : bác bỏ H0 2b) n < 30, 2 (X có pp chuẩn) (x o) n , t/2(n–1) (tra baûng H) t s |t| t/2(n–1) : bác bỏ H0 VD1 : Giám đốc xí nghiệp cho biết lương trung bình công nhân thuộc xí nghiệp 600 ngàn đồng/tháng Chọn ngẫu nhiên 36 công nhân thấy lương trung bình 520 ngàn đồng/tháng, với độ lệch chuẩn mẫu s = 40 ngàn đồng/tháng Lời báo cáo giám đốc có tin cậy không, với mức có ý nghóa = 5% HÌNH KIỂM ĐỊNH PHÍA 21 22 Giải: H0 : = 600 ; H1: 600 : laø tiền lương trung bình thực CN o = 600 : tiền lương trung bình CN theo lời GĐ = 5% = – = 2(t/2) = 0,95 (t/2)= 0,475 t/2 = 1,96 (tra baûng F) t 23 ( x o ) n (5 00) 12 s 40 Ta có |t| = 12 > 1,96 = t/2 : bác bỏ H0 Kết luận : với mức ý nghóa 5%, không tin vào lời giám đốc Lương trung bình thực CN bé 600 ngàn đồng/ thaùng (do x 520 600 o ) 24 ThS Phạm Trí Cao * Chương # TC 31/08/2016 VD1bis : Giám đốc xí nghiệp cho biết lương trung bình công nhân thuộc xí nghiệp 600 ngàn đồng/tháng Chọn ngẫu nhiên 36 công nhân thấy lương trung bình 520 ngàn đồng/tháng, với độ lệch chuẩn mẫu s = 40 ngàn đồng/tháng Lời báo cáo giám đốc có tin cậy không, với mức có ý nghóa = 5% HD: TIN LỜI GIÁM ĐỐC VD2: Một cửa hàng thực phẩm nhận thấy thời gian vừa qua trung bình khách hàng mua thực phẩm với số tiền 25 ngàn đồng/ngày Nay cửa hàng chọn ngẫu nhiên 15 khách hàng thấy trung bình khách hàng mua thực phẩm với số tiền 24 ngàn đồng/ ngày phương sai mẫu hiệu chỉnh s2 = (2 ngàn đồng/ngày)2 Với mức ý nghóa 5% , thử xem có phải sức mua khách hàng (số tiền trung bình khách hàng mua) có thay đổi so với trước đây? Chú ý quan trọng: Trước tiên phải đặt giả thiết thống kê rùi muốn làm làm! Đặt giả thiết rùi phải giải thích giả thiết Nếu không đặt giả thiết thống kê mà có tính toán hổng điểm Tính toán, tra bảng kết luận sai hổng điểm “Uổng uổng!” 25 26 Giải Giả thiết H0 : = 25 H1: 25 : sức mua khách hàng o = 25 : sức mua khách hàng trước n = 15< 30 , s = , x = 24 = 5% = 1- = 0,95 t/2(n–1) = t0,025(14) = 2,1448 (tra baûng H) ( x o ) n ( 24 25 ) 15 1,9364 s Ta coù |t| = 1,9364 < 2,1448 = t/2(n– 1): Chấp nhận H0 Kết luận : với mức có ý nghóa 5%, sức mua khác28h hàng hay không thay đổi so với trước t 27 ThS Phạm Trí Cao * Chương # TC 31/08/2016 2) Kiểm đònh tỷ lệ: n 30 Giả thiết thống kê : H0 : p = p0 Giả thiết đối : H1 : p p0 ( f p ) n (tính) t p (1 p ) 0 t/2 (tra baûng F) |t| > t/2 : bác bỏ H0 |t| p0 p > p0 + Nếu f < p0 p < p0 2) Kiểm đònh tỷ lệ Để cho kiểm đònh tỷ lệ có ý nghóa thực tế điều kiện áp dụng là: n p n ( p )5 29 Lưu ý: Cần nhớ kỹ gì? 30 Giải VD3: Theo nguồn tin tỷ lệ hộ dân thích xem dân ca Tivi 80% Thăm dò 36 hộ dân thấy có 25 hộ thích xem dân ca Với mức có ý nghóa 5% Kiểm đònh xem nguồn tin có đáng tin cậy không? 31 Giả thiết H0 : p = 0,8 ; H1 : p 0,8 p : tỷ lệ hộ dân thực thích xem DC thực tế po = 0,8 : tỷ lệ hộ dân thích xem DC theo nguồn tin Tỷ lệ maãu f = 25/36 = 0,69 = 5% = 1– = 0,95 t/2 = 1,96 ( f po ) n (0, 0,8) t 1, p o (1 p o ) , (1 , ) |t| = 1,65 < t/2 = 1,96 : Chấp nhận H0 Kết luận: với mức ý nghóa 5%, NT đáng tin cậy 32 ThS Phạm Trí Cao * Chương # TC 31/08/2016 VD4: Một máy sản xuất tự động, lúc đầu tỷ lệ sản phẩm loại A 20% Sau áp dụng phương pháp sản xuất mới, người ta lấy 40 hộp, hộp gồm 10 sản phẩm để kiểm tra Kết kiểm tra cho bảng sau : Số sản phẩm loại A hộp 10 Soá hoäp 10 Với mức ý nghóa 5% Hãy cho kết luận phương pháp 33 sản xuất Xem Giaûi H0: p = 0,2 ; H1: p 0,2 ; = 0,05 t/2 = 1,96 p tỷ lệ sp loại A máy sau áp dụng pp sx p0= 0,2 : tỷ lệ sp loại A máy trước ad pp sx Tỷ lệ mẫu là: f 1 10 1 400 215 0,5375 400 t (0,5375 0,2) 400 16 ,875 0,2 (1 0,2) |t| = 16,875 > t/2 = 1,96 : bác bỏ H0 Do f= 0,5375 > po= 0,2 nên ta kết luận pp sản xuất mớ 34 i làm tăng tỷ lệ sản phẩm loại A Mời ghé thăm trang web: thêm sách: 36 BÀI TẬP XSTK, ThS Lê Khánh Luận & GVC Nguyễn Thanh Sơn & ThS Phạm Trí Cao, NXB ĐHQG TP.HCM 2013 https://sites.google.com/a/ueh.edu.vn/phamtricao/ https://sites.google.com/site/phamtricao/ Bài tập Chương 7: Bài 1, 3-7 (từ trang 129-134) 35 ... có phải sức mua khách hàng (số tiền trung bình khách hàng mua) có thay đổi so với trước đây? Chú ý quan trọng: Trước tiên phải đặt giả thiết thống kê rùi muốn làm làm! Đặt giả thiết rùi phải. .. 1 400 215 0,5 375 400 t (0,5 375 0,2) 400 16 , 875 0,2 (1 0,2) |t| = 16, 875 > t/2 = 1,96 : bác bỏ H0 Do f= 0,5 375 > po= 0,2 nên ta kết luận pp sản xuất mớ 34 i làm tăng tỷ lệ sản... đạt môn XSTK 50% Hãy lập giả thiết thống kê để kiểm chứng điều này? HD: H0: p = 0,5 H1: p ≠ 0,5 p: tỷ lệ sinh viên thi đạt môn XSTK thực tế p0= 0,5 : tỷ lệ sinh viên thi đạt môn XSTK