1 Bài 9 Kiểm định giả thuyết thống kê (Trường hợp hai mẫu) I So sánh kỳ vọng giữa hai tổng thể độc lập Giả sử 1 2, , , nX X X (mẫu 1) là mẫu ngẫu nhiên chọn từ một tổng thể có phân phối chuẩn với kỳ vọng là X và phương sai là 2 X và 1 2, , , mY Y Y (mẫu 2) là mẫu ngẫu nhiên độc lập chọn từ một tổng thể có phân phối chuẩn với kỳ vọng là Y và phương sai 2 Y Trong phần thực hành, ta giả sử 2 X và 2 Y không biết Các giả thuyết Một phía – bên trái 0 1 X Y X Y H H .
Bài Kiểm định giả thuyết thống kê (Trường hợp hai mẫu) I So sánh kỳ vọng hai tổng thể độc lập: Giả sử X1 , X ,, X n (mẫu 1) mẫu ngẫu nhiên chọn từ tổng thể có phân phối chuẩn với kỳ vọng X phương sai X2 Y1 , Y2 ,, Ym (mẫu 2) mẫu ngẫu nhiên độc lập chọn từ tổng thể có phân phối chuẩn với kỳ vọng Y phương sai Y2 Trong phần thực hành, ta giả sử X2 Y2 Các giả thuyết: H : X Y H1 : X Y Một phía – bên trái: H : X Y Một phía – bên phải: H1 : X Y Hai phía: H : X Y H1 : X Y Trường hợp X2 Y2 : giả sử phương sai hai tổng thể Sử dụng phương sai mẫu chung S P2 , S P n 1 S X2 m 1 SY2 nm2 (1) Thống kê kiểm định, T0 X Y 1 SP n m (2) T0 có phân phối Student với n + m – bậc tự Với X , S X Y , SY trung bình mẫu độ lệch tiêu chuẩn mẫu tương tứng với mẫu mẫu Kết luận: Giả thuyết H0 Đối thuyết H1 X Y Miền bác bỏ với mức ý nghĩa 𝛂 T0 t1nm/22 X Y P – giá trị 2P{Tn m2 | T0 |} X Y X Y T0 t1nm2 P{Tn m2 T0 } X Y X Y T0 t1nm2 P{Tn m2 T0 } Bảng Trường hợp X2 Y2 : số trường hợp, ta giả sử phương sai X2 Y2 Khi thống kê kiểm định: T0* X Y (3) S X2 SY2 n m T0 có phân phối Student với bậc tự df xác định S X2 SY2 n m df 2 S X2 / n SY2 / m n 1 m 1 (4) Thay T0 bảng T0* ta thu kết luận tương ứng Chú ý, biết X2 Y2 cơng thức (3) trở thành ̅ ̅ (5) √ Thống kê Z ~ N(0,1), thay giá trị thống kê phân vị bảng thống kê Z phân vị z1 / z1 tương ứng Thực hành R: Sử dụng hàm t.test t.test(x, y, alternative = c("two.sided", "less", "greater"), var.equal = FALSE, conf.level = 0.95) Trong x, y : véc-tơ liệu tương ứng với hai mẫu alternative: đối thuyết (hai phía – “two.sided”, bên trái – “less”, bên phải – “greater”) var.equal: giá trị mặc định FALSE nghĩa phương sai khác conf.level: độ tin cậy khoảng tin cậy cho X Y , mặc định 95% Nếu hai mẫu x1 ,, xn ( y1 ,, ym ) chứa biến, chẳng hạn data phân biệt biến chia nhóm, group Ta sử dụng hàm t.test với cú pháp sau t.test(data ~ group, alternative = c("two.sided", "less", "greater"), var.equal = FALSE, conf.level = 0.95) Ví dụ 1: File scores.rda chứa điểm thi kỳ cuối kỳ môn Thống kê (Thang điểm: 100) > load('scores.rda') > scores $midterm [1] 66 78 62 99 80 63 82 86 84 70 98 81 66 42 92 74 75 89 87 84 89 87 76 45 84 $final [1] 79 78 65 75 84 94 79 84 79 66 76 76 79 91 88 78 77 87 86 73 73 84 88 79 Hỏi: điểm trung bình kỳ cuối kỳ có hay khơng với α = 0.05? > alpha (var.equal t.test(scores$midterm, scores$final, var.equal=FALSE) Welch Two Sample t-test data: scores$midterm and scores$final t = -0.7354, df = 35.656, p-value = 0.4669 alternative hypothesis: true difference in means is not equal to 95 percent confidence interval: -8.858370 4.145037 sample estimates: mean of x mean of y 77.56000 79.91667 p giá trị = 0.4669 > 0.05, ta kết luận điểm thi kỳ không khác với điểm thi cuối kỳ với mức ý nghĩa 0.05 Biểu đồ Boxplot cho midterm final: > boxplot(scores) II So sánh theo cặp: Giả sử X1 , X ,, X n Y1 , Y2 ,, Yn hai mẫu có cỡ chọn từ tổng thể có phân phối chuẩn với kỳ vọng X Y ; vậy, có mối liên hệ giá trị X i Yi Do đó, cặp giá trị X i , Yi , i 1,, n không độc lập Do đó, ta sử dụng phương pháp kiểm định theo cặp để kiểm tra giả thuyết liên quan đến X Y Thông thường, toán so sánh theo cặp, ta ghi nhận hai giá trị phần tử mẫu hai thời điểm khác nhau, chẳng hạn trước sau áp dụng phương pháp nghiên cứu phần tử Ví dụ: đo lượng cholesterol người béo phì trước sau cho họ áp dụng tập thể dục chế độ ăn kiêng; đo nhịp tim người tham gia thí nghiệm trước sau cho họ uống cà-fê để so sánh tác dụng chất caffein cà-fê, … Với X1 , Y1 , X , Y2 ,, X n , Yn n cặp quan trắc, đặt Di X i Yi , i 1,, n Biến ngẫu nhiên Di giả sử có phân phối chuẩn với kỳ vọng (5) D = E Di E X i Yi E X i E Yi X Y phương sai D2 Các giả thuyết: H : D H1 : D H : D H1 : D H : D H1 : D Thống kê kiểm định: T0 D SD n có phân phối Student với n – bậc tự Trong đó: D n n Di D Di S D2 n i 1 n i 1 Kết luận: Giả thuyết H0 Đối thuyết H1 D Miền bác bỏ với mức ý nghĩa 𝛂 T0 t1n1/ D 2P{Tn1 | T0 |} D D T0 t1n1 P{Tn1 T0 } D D n 1 1 T0 t P – giá trị P{Tn1 T0 } Bảng Thực hành R: Sử dụng hàm t.test t.test(x, y, alternative = c("two.sided", "less", "greater"), paired = TRUE, conf.level=0.95) t.test(x ~ group, alternative = c("two.sided", "less", "greater"), paired = TRUE, conf.level=0.95) Tương tự trường hợp hai mẫu độc lập, sử dụng paired = TRUE Ví dụ 2: File cholesterol.txt chứa hàm lượng cholesterol máu đo 15 người đàn ơng béo phì từ độ tuổi 35 – 50 Những người tham gia thử nghiệm thực chế độ ăn kiêng tập thể dục vòng tháng Bác sĩ đo hàm lượng cholesterol máu người trước sau thử nghiệm Với mức ý nghĩa 5%, chế độ ăn kiêng tập thể dục có hiệu việc giảm hàm lượng cholesterol máu người béo phì khơng? > cholesterol = read.table('cholesterol.txt',header=T) > cholesterol > boxplot(cholesterol[2:3]) > attach(cholesterol) > v.equal p.v.equal alpha v.equal y = c(94,76) > n = c(360,320) > prop.test(y,n,alternative = 'greater') 2-sample test for equality of continuity correction data: y out of n X-squared = 0.3856, df = 1, p-value = 0.2673 alternative hypothesis: greater 95 percent confidence interval: proportions with -0.03393952 1.00000000 sample estimates: prop prop 0.2611111 0.2375000 P - giá trị = 0.2673 > 0.05 => khơng có đủ sở để bác bỏ giả thuyết , chưa đủ chứng để kết luận phương pháp có hiệu phương pháp cũ BÀI TẬP Hai máy máy rót sữa tự động sử dụng để đưa sữa vào hộp giấy có dung tích lít dây chuyền sản xuất Lượng sữa thực tế hai máy đưa vào hộp có phân phối chuẩn với độ lệch tiêu chuẩn 0.002 0.0025 lít Một thành viên số kỹ sư giám sát dây chuyền cho thể tích tích sữa trung bình hai máy đưa vào hộp không phụ thuộc vào dung tích hộp chứa Một mẫu ngẫu nhiên lấy từ hai máy cho file volume.csv a) Bạn có cho phán đốn kỹ sư hay khơng? Sử dụng 0.05 b) P-giá trị kiểm định bao nhiêu? c) Hãy tìm khoảng tin cậy 95% cho khác biệt trung bình lượng sữa hai máy đưa vào hộp d) Viết hàm test.leq.oneside(x, y, 0 , 1 , , ) để kiểm định giả thiết H : 0 đối thuyết H1 : 0 1 2 với 1 , 2 thể tích sữa trung bình hai máy đưa vào hộp; x, y hai vector liệu chứa thể tích sữa máy số máy số đưa vào hộp giấy; mức ý nghĩa Hàm xuất kết chấp nhận bác bỏ cho biết P-giá trị e) Viết hàm test.geq.oneside(x, y, 0 , , 2 ) để kiểm định giả thiết H : 0 đối thuyết H1 : 0 với ký hiệu yêu cầu câu Đường kính (mm) thép sản xuất hai máy cán thép nhà máy đem so sánh Hai mẫu ngẫu nhiên đường kính thép sản xuất hai máy thu thập tổng hợp file diameter.csv Giả sử đường kính thép cán hai máy có phân phối chuẩn với phương sai a) Hỏi có chứng ủng hộ giả thiết hai máy cho thép với đường kính khác hay không? Hãy kiểm tra đưa kết luận với mức ý nghĩa 0.05 b) Hãy tìm P-giát trị cho thống kê bạn tính câu vừa c) Hãy ước lượng sai biệt đường kính trung bình thép hai máy sản xuất với độ tin cậy 95% d) Viết hàm test.leq.oneside(x, y, 0 , ) để kiểm định giả thiết H : 0 đối thuyết H1 : 0 1 2 với 1 , 2 đường kính trung bình thép máy số máy số sản xuất ra; x, y hai vector liệu chứa đường kính thép máy số máy số sản xuất ra; mức ý nghĩa Hàm xuất kết chấp nhận bác bỏ cho biết P-giá trị e) Viết hàm test.geq.oneside(x, y, 0 , ) để kiểm định giả thiết H : 0 đối thuyết H1 : 0 với ký hiệu yêu cầu câu Một hãng công nghệ (G) sản xuất hệ điều hành (HĐH) cho máy tính cơng bố tốc độ khởi động HĐH họ cho thời gian khởi động nhanh gấp đôi HĐH hãng đối thủ (M) Một mẫu khảo sát gồm 250 laptop cấu hình, 100 laptop cài HĐH hãng (G) 150 laptop lại cài HĐH hãng đối thủ (M) Kết ghi lại file “tg.khoidong.csv” Giả sử độ lệch chuẩn thởi gian khởi động HĐH hãng (G) (M) (s) (s) Hỏi công bố thời gian khởi động hãng (G) có phù hợp với số liệu thu thập được? Với mức ý nghĩa 5\% Hai mươi người nam với độ tuổi từ 35 đến 50 tham gia vào nghiên cứu để đánh giá ảnh hưởng chế độ ăn uống luyện tập thể thao lên hàm lượng cholesterol máu Mỗi người tham gia đo lượng cholesterol trước bắt đầu chương trình tập luyện thể dục chuyển sang ăn uống với chế độ chất béo Dữ liệu cho file cholesterol.csv a) Hỏi liệu có ủng hộ kết luận chế độ ăn kiêng luyện tập thể dục có tác dụng việc giảm lượng cholesterol máu hay không? Hãy tiến hành mức ý nghĩa 0.05 b) Giả sử hàm lượng cholesterol người tham gia nghiên cứu trước sau bắt đầu chương trinh luyện tập thể dục thể thao có phân phối chuẩn với phương sai khác Viết hàm test.leq.oneside(x, y, 0 , ) để kiểm định giả thiết H1 : 0 đối thiết H1 : 0 1 2 với 1 , 2 trung bình hàm lượng cholesterol trước sau tham gia chương trình luyện tập, mức ý nghĩa Hàm xuất kết chấp nhận bác bỏ cho biết P-giá trị c) Với giả định câu b, viết hàm test.geq.oneside(x, y, 0 , ) để kiểm định giả thiết H1 : 0 đối thuyết H1 : 0 với ký hiệu yêu cầu câu Một sản phẩm ăn kiêng dạng lỏng nhà sản xuất quảng cáo có tác dụng giảm cân 1.5 kg sử dụng sản phẩm tháng Một mẫu ngẫu nhiên 50 người sử dụng sản phẩm tháng, kết trọng lượng (kg) trước sử dụng sản phẩm sau dùng tháng ghi lại file ‘giamcan.csv’ Hãy sử dụng thủ tục kiểm định giả thuyết để trả lời câu hỏi sau (a) Dữ liệu có phù hợp với quảng cáo nhà sản xuất sản phẩm ăn kiêng hay không với mức ý nghĩa 0.05? 10 (b) Dữ liệu có phù hợp với quảng cáo nhà sản xuất sản phẩm ăn kiêng hay không với mức ý nghĩa 0.01? (c) Để cải thiện doanh số bán hàng, nhà sản xuất xem xét thay đổi quảng cáo từ “ít 1.5 kg” thành “ít 2.5 kg” Thực lại câu (a), (b) để kiểm định quảng cáo Một nhà khoa học máy tính tiến hành kiểm tra hữu dụng hai ngôn ngữ thiết kế khác việc cải thiện tác vụ lập trình Hai mươi chuyên gia lập trình thành thạo với hai ngơn ngữ u cầu lập trình cho module chức hai ngôn ngữ thiết kế Thời gian hồn thành cơng việc (tính theo phút tuân theo phân phối chuẩn) ghi lại tóm tắt file pro.time.csv a) Hãy xác định khoảng tin cậy 95% cho sai khác thời gian lập trình trung bình hai ngơn ngữ Có dấu hiệu cho thấy hai ngôn ngữ tốt hay không? b) Viết hàm test.leq.oneside(x, y, 0 , ) để kiểm định giả thiết H1 : 0 đối thuyết H1 : 0 1 2 với 1 , 2 thời gian trung bình lập trình viên viết xong module ngơn ngữ thứ thứ hai, mức ý nghĩa Hàm xuất kết chấp nhận bác bỏ cho biết P-giá trị c) Viết hàm test.geq.oneside(x, y, 0 , ) để kiểm định giả thiết H1 : 0 đối thuyết H1 : 0 với ký hiệu yêu cầu câu Hai loại máy đúc khác sử dụng để gia công chi tiết plastic Một chi tiết xem phế phẩm có thay đổi hình dạng khối lượng sai biệt màu sắc so với chi tiết mẫu vượt mức cho phép Hai mẫu ngẫu nhiên thu thập, mẫu có cỡ 300 Trong mẫu thu từ máy số người ta nhận thấy có 15 chi tiết phế phẩm mẫu thu từ máy thứ có chi tiết phế phẩm Liệu có sở để kết luận hai loại máy có tỉ lệ phế phẩm hay không (mức ý nghĩa 0.025)? Tìm P-giá trị cho kiểm định vừa Trong mẫu ngẫu nhiên gồm 500 người sống thành phố Hồ Chí Minh người ta thấy có 385 người ủng hộ việc tăng tốc độ lưu thông tuyến đường quốc lộ lên 65 km/h Trong mẫu ngẫu nhiên khác gồm 400 người sống Hà Nội cho thấy có 267 nguời ủng hộ việc tăng tốc độ Liệu số liệu thu thập có cho ta kết luận có khác biệt tỉ lệ người ủng hộ việc tăng tốc độ hai thành phố hay không ( 0.05 )? P-giá trị cho kiểm định bao nhiêu? Trong mẫu ngẫu nhiên 200 tài xế Tp.HCM có 165 trường hợp mang đai an tồn thường xun, mẫu khác, 250 tài xế Hà Nội, cho thấy có 198 trường hợp mang đai an toàn thường xuyên (a) Thực thủ tục kiểm định giả thuyết để xác định xem có khác biệt mang ý nghĩa thống kê việc sử dụng đai an tồn Tp.HCM Hà Nội hay khơng? Với mức ý nghĩa 0.05 (b) Tương tự câu (a) với mức ý nghĩa 0.1 11 (c) Giả sử số liệu nhân đôi Nghĩa là, mẫu ngẫu nhiên 400 tài xế Tp.HCM có 330 trường hợp mang đai an toàn thường xuyên, mẫu khác, 500 tài xế Hà Nội cho thấy có 396 trường hợp mang đai an tồn thường xuyên Thực lại câu (a), (b) cho nhận xét ảnh hưởng việc tăng kích thước mẫu mà không thay đổi tỉ lệ lên kết kiểm định 10 Doanh số bán hàng (triệu đồng) hai chi nhánh hệ thống siêu thị Co-op Mart đặt quận quận 200 ngày cho file Profit.csv a) Hãy xác định khoảng tin cậy 95% cho sai khác doanh số bán hàng trung bình hai chi nhánh b) Một ngày gọi có doanh số cao doanh số bán hàng ngày 600 triệu đồng Có nhận xét tỉ lệ ngày có doanh số cao chi nhánh quận cao tỉ lệ ngày có doanh số bán hàng cao chi nhánh quân Hãy kiểm chứng nhận xét với 0.05 Hãy cho biết P-giá trị kiểm định vừa c) Viết hàm prop.test.leq(x, y, ) để kiểm định giả thiết đối thuyết H1 : px p y px , p y tỉ lệ ngày có doanh số bán cao (trên 600 triệu) chi nhánh quận quận 3; x, y hai vector chứa doanh số bán hàng hai chi nhánh Co-op Mart đặt quận quận số ngày đó; mức ý nghĩa Hàm xuất kết chấp nhận bác bỏ cho biết P-giá trị 11 Thu nhập nhân viên ngành công nghệ thông tin hai thành phố Hà Nội thành phố Hồ Chí Minh cho file Inf.Sal.csv a) Hãy xác định khoảng tin cậy 95% cho sai khác mức lương trung bình nhân viên ngành cơng nghệ thông tin hai thành phố b) Một người gọi có thu nhập cao thu nhập người 11,5 triệu đồng Có nhận xét tỉ lệ nhân viên cơng nghệ thơng tin có thu nhập cao thành phố Hồ Chí Minh cao so với tỷ lệ Hà Nội Hãy kiểm chứng nhận xét với 0.025 Hãy cho biết P-giá trị kiểm định vừa c) Viết hàm prop.test.geq(x, y, ) để kiểm định giả thiết đối thuyết px , p y tỉ lệ người có thu nhập cao (trên 11,5 triệu đồng) thành phố Hồ Chí Minh Hà Nội; x, y hai vector chứa giá trị thu nhập số nhân viên ngành công nghệ thông tin Hà Nội thành phố Hồ Chí Minh; mức ý nghĩa Hàm xuất kết chấp nhận bác bỏ cho biết P-giá trị d) Tìm khoảng tin cậy 95% cho hiệu hai tỉ lệ 12 ... phần tử thoả tính chất quan tâm tương ứng với hai tổng thể Từ hai tổng thể chọn hai mẫu độc lập với cỡ mẫu và ( lớn) H : p1 p2 Ta cần kiểm định giả thuyết sau: H1 : p1 p2 Gọi H : p1 ... P-giá trị cho kiểm định bao nhiêu? Trong mẫu ngẫu nhiên 200 tài xế Tp.HCM có 165 trường hợp mang đai an toàn thường xuyên, mẫu khác, 250 tài xế Hà Nội, cho thấy có 198 trường hợp mang đai an tồn... nghĩa 0.1 11 (c) Giả sử số liệu nhân đôi Nghĩa là, mẫu ngẫu nhiên 400 tài xế Tp.HCM có 330 trường hợp mang đai an toàn thường xuyên, mẫu khác, 500 tài xế Hà Nội cho thấy có 396 trường hợp mang đai