XÁC SUT THNG KÊ TRONG Y HOC XÁC SUẤT THỐNG KÊ TRONG Y HỌC KHOA CÔNG NGHỆ THÔNG TIN BỘ MÔN KHOA HỌC CƠ BẢN Lê Thị Mai Thanh Ngày 30 tháng 3 năm 2022 Đặt vấn đề Một địa phương đang trồng thử nghiệm một.
XÁC SUẤT THỐNG KÊ TRONG Y HỌC KHOA CÔNG NGHỆ THÔNG TIN BỘ MÔN KHOA HỌC CƠ BẢN Lê Thị Mai Thanh Ngày 30 tháng năm 2022 Đặt vấn đề Một địa phương trồng thử nghiệm giống lúa đất nhỏ Sau thu hoạch,ta thấy suất trung bình giống lúa 6,0 tấn/ha Năng suất lúa trung bình giống lúa truyền thống 5,5 tấn/ha Năng suất trung bình giống lúa có cao giống lúa truyền thống hay không? Từ thông tin thu (từ mẫu), có phương pháp trả lời câu hỏi khơng có cách thức giải nào? ĐH NTT XSTK-YH Ngày 30 tháng năm 2022 / 24 Chương 5: Kiểm định giả thuyết thống kê 5.1 Kiểm định giả thuyết thống kê 5.1.1 Định nghĩa Giả thuyết thống kê phát biểu (chưa biết hay sai) tham số, dạng qui luật phân phối tính độc lập biến ngẫu nhiên Việc dựa vào số liệu thu tìm kết luận bác bỏ hay chấp nhận giả thuyết(H0 ) với mức ý nghĩa gọi kiểm định giả thuyết thống kê • H0 : giả thuyết khơng (giả thuyết cần kiểm định) • H1 : đối thuyết ĐH NTT XSTK-YH Ngày 30 tháng năm 2022 / 24 5.1 Kiểm định giả thuyết thống kê 5.1.1 Định nghĩa Ví dụ H0 : Biến ngẫu nhiên X có phân phối chuẩn tắc H1 : Biến ngẫu nhiên X khơng có phân phối chuẩn tắc Đây giả thuyết đặt phân phối chưa biết biến, tức ta ngờ biến có phân phối chuẩn tắc ĐH NTT XSTK-YH Ngày 30 tháng năm 2022 / 24 5.1 Kiểm định giả thuyết thống kê 5.1.2 Các thành phần kiểm định Xét định vấn đề cần kiểm định Lập giả thuyết H0 , H1 Tiêu chuẩn kiểm định G = G(X1 , , Xn ) - Là hàm thống kê, tính tốn theo giá trị mẫu - Nói đơn giản, tiêu chuẩn G đo sai khác giả thuyết đặt thực tế quan sát X - Ta đưa định chấp nhận hay bác bỏ giả thuyết dựa vào tiêu chuẩn G cách “hợp lí” Thơng thường, G nhận giá trị lớn ta bác bỏ giả thuyết ngược lại - Vì ta khơng có tồn thơng tin biến X nên định mà ta đưa dựa tiêu chuẩn G hồn tồn dẫn tới sai lầm ĐH NTT XSTK-YH Ngày 30 tháng năm 2022 / 24 5.1 Kiểm định giả thuyết thống kê 5.1.2 Các thành phần kiểm định Sai lầm kiểm định Sai lầm loại • Bác bỏ H0 thực tế H0 • Xác suất mắc sai lầm loại : P (G ∈ Wα |H0 ) = α Sai lầm loại • Chấp nhận H0 thực tế H0 sai • Xác suất mắc sai lầm loại P (G ∈ / Wα |H1 ) = β Sai lầm quan trọng hơn? Làm xác định đâu sai lầm loại 1, 2? Sai lầm loại I loại II tương đối, khơng có sẵn từ đầu, mà xác định ta đặt giả thuyết Ta phải xem xét sai lầm quan trọng hơn, tức phạm phải chịu tổn thất lớn hơn, ta đặt tốn để sai lầm loại I ĐH NTT XSTK-YH Ngày 30 tháng năm 2022 / 24 Ví dụ Với bác sĩ khám bệnh, ơng ta sai phải hai tình sai lầm sau: Người có bệnh, sau thử nghiệm, ông kết luận bệnh Người không bệnh, sau thử nghiệm, ông kết luận: nhập viện! Sai lầm loại 1? Sai lầm loại 2? Ta chưa xác định Bệnh lao phổi bệnh mà phát để điều trị gần chắn khỏi, cịn khơng phát kịp thời để điều trị bệnh nặng dần dẫn đến tử vong Khi sai lầm "có bệnh bảo khơng" quan trọng hơn, dẫn đến tử vong, cịn sai lầm "khơng bệnh bảo có" gây tổn hại, tổn hại sai lầm Do ta đặt giả thuyết H0 : “người có bệnh” ĐH NTT XSTK-YH Ngày 30 tháng năm 2022 / 24 5.1 Kiểm định giả thuyết thống kê 5.1.2 Các thành phần kiểm định Nguyên lí xác suất nhỏ Nếu biến cố có xác suất nhỏ không xảy một vài lần thực phép thử Miền bác bỏ H0 - Kí hiệu: Wα = {miền giá trị G cho thấy H0 sai} - P (G ∈ Wα |H0 ) = α - Nếu G ∈ Wα bác bỏ H0 Nếu giả thuyết Wα miền có xác suất nhỏ ⇒ biến cố G ∈ Wα có xác suất nhỏ Do đó, lần đầu lấy mẫu, G rơi vào miền Wα , điều mâu thuẫn với nguyên lí xác suất nhỏ nên phải bác bỏ giả thuyết ĐH NTT XSTK-YH Ngày 30 tháng năm 2022 / 24 5.1 Kiểm định giả thuyết thống kê 5.1.3 Quy trình kiểm định Lập cặp giả thuyết H0 : = H1 : = Tiêu chuẩn kiểm định miền bác bỏ G = G (X1 , X2 , , Xn ) , Wα Từ mẫu cụ thể tính giá trị quan sát G so sánh với miền bác bỏ Wα - Nếu G ∈ Wα bác bỏ H0 - Nếu G ∈ / Wα chưa đủ sở bác bỏ H0 ĐH NTT XSTK-YH Ngày 30 tháng năm 2022 / 24 5.2 Kiểm định trung bình kiểm định tỉ lệ 5.2.1 Kiểm định trung bình tổng thể Giả sử tổng thể X có trung bình E(X) = µ chưa biết Với mức ý nghĩa α , kiểm định giả thuyết H0 : H1 : µ = µ0 µ = µ0 Trường hợp biết σ ¯ − µ0 )√n (X Chọn tiêu chuẩn kiểm định G = σ Nếu H0 G ∼ N (0, 1) miền bác bỏ giả thuyết Wα = −∞, −zα/2 ∪ zα/2 , ∞ zα/2 giá trị tới hạn mức ĐH NTT α phân phối chuẩn tắc XSTK-YH Ngày 30 tháng năm 2022 10 / 24 5.2 Kiểm định trung bình kiểm định tỉ lệ 5.2.1 Kiểm định trung bình tổng thể Quy trình bước thực Lập cặp giả thuyết 1−α tra bảng Laplace tìm zα/2 √ (¯ x − µ0 ) n Tính giá trị kiểm định g = σ Nếu |g| ≥ zα/2 bác bỏ H0 , ngược lại chấp nhận H0 Từ mức ý nghĩa α: ϕ(zα/2 ) = ĐH NTT XSTK-YH Ngày 30 tháng năm 2022 11 / 24 5.2.1 Kiểm định trung bình tổng thể Ví dụ Theo tiêu chuẩn trọng lượng gói hạt nêm đóng máy tự động 453 g Kiểm tra ngẫu nhiên 81 gói ta thấy trọng lượng trung bình 448 g Với mức ý nghĩa 0,05 cho trọng lượng gói hạt nêm khơng đạt tiêu chuẩn hay khơng, biết trọng lượng gói hạt nêm biến ngẫu nhiên có phân phối chuẩn với độ lệch chuẩn 36g? Giải Gọi X trọng lượng gói hạt nêm µ trọng lượng trung bình gói hạt nêm nhà máy Ta có: X ∼ N (µ, σ), với σ = 36g; n = 81; x ¯ = 448; α = 0, 05%; µ0 = 453 ĐH NTT XSTK-YH Ngày 30 tháng năm 2022 12 / 24 5.2 Kiểm định trung bình kiểm định tỉ lệ 5.2.1 Kiểm định trung bình tổng thể Xét giả thuyết H0 : H1 : µ = 453 µ = 453 • Với mức ý nghĩa α = 0, 05, ta có 1−α Laplace = 0, 475 −→ zα/2 = 1, 96 ϕ(zα/2 ) = • Tính giá √ trị kiểm định √ (¯ x − µ0 ) n (448 − 453) 81 g= = = −1, 25 σ 36 • Do |g| < zα/2 nên chấp nhận giả thuyết H0 Kết luận gói hạt nêm đóng gói đạt tiêu chuẩn ĐH NTT XSTK-YH Ngày 30 tháng năm 2022 13 / 24 5.2 Kiểm định trung bình kiểm định tỉ lệ 5.2.1 Kiểm định trung bình tổng thể Ví dụ Một người khẳng định: suất trung bình giống lúa A tấn/ha Tuy nhiên, trồng loại lúa 100 ruộng thấy suất trung bình 6.5 tấn/ha Giả sử, suất lúa A có phân phối chuẩn với phương sai Với mức ý nghĩa 5%, khẳng định đưa có đáng tin không? ĐH NTT XSTK-YH Ngày 30 tháng năm 2022 14 / 24 5.2 Kiểm định trung bình kiểm định tỉ lệ 5.2.1 Kiểm định trung bình tổng thể Giải Gọi X suất lúa A, X ∼ N (µ, 4) Xét giả thuyết H0 : H1 : Từ α = 5% ⇒ zα/2 = 1.96 Ta tính được: x ¯ = 6.5; σ2 µ=6 µ=6 √ (¯ x − µ0 ) n = 4; g = = 2.5 σ Do |g| > zα/2 nên bác bỏ H0 Vậy suất trung bình lúa A khác 6.0 tấn/ha hay khẳng định đưa chưa hợp lí ĐH NTT XSTK-YH Ngày 30 tháng năm 2022 15 / 24 5.2 Kiểm định trung bình kiểm định tỉ lệ 5.2.1 Kiểm định trung bình tổng thể Trường hợp chưa biết σ n ≥ 30 Chọn tiêu chuẩn kiểm định G = ¯ − µ0 )√n (X làm hoàn toàn tương S tự trường hợp biết σ Ví dụ Điều tra nhịp mạch 64 niên làm nghề điện ta có nhịp mạch trung bình 74 lần/phút độ lệch mẫu hiệu chỉnh Với mức ý nghĩa 5%, nhịp mạch niên làm nghề điện có khác nhịp mạch trung bình bình thường 72 lần/phút hay khơng? ĐH NTT XSTK-YH Ngày 30 tháng năm 2022 16 / 24 5.2.1 Kiểm định trung bình tổng thể Gọi µ nhịp mạch trung bình Ta có: n = 64; x ¯ = 74; α = 5%; s = 9; µ0 = 72 Xét giả thuyết H0 : H1 : µ = 72 µ = 72 1−α Laplace = 0.475 −→ zα/2 = 1.96 √ √ (¯ x − µ0 ) n (74 − 72) 64 • Giá trị kiểm định g = = = 1.78 s • Với α = 5% ϕ(zα/2 ) = • Do |g| < zα/2 nên chấp nhận H0 Vậy với mức ý nghĩa 5%, nhịp mạch niên làm nghề điện nhịp mạch trung bình bình thường ĐH NTT XSTK-YH Ngày 30 tháng năm 2022 17 / 24 5.2 Kiểm định trung bình kiểm định tỉ lệ 5.2.1 Kiểm định trung bình tổng thể Trường hợp chưa biết σ n < 30 ¯ − µ0 )√n (X Chọn tiêu chuẩn kiểm định G = S Nếu X ∼ N (µ, σ ) G ∼ t(n − 1) có phân phối Student với bậc tự (n − 1) Phương pháp thực quy tắc thực hành tương tự trường hợp đầu khác chỗ ta tra bảng Student tìm tα/2 (n − 1) ĐH NTT XSTK-YH Ngày 30 tháng năm 2022 18 / 24 5.2 Kiểm định trung bình kiểm định tỉ lệ 5.2.1 Kiểm định trung bình tổng thể Ví dụ Đường kính trục máy theo thiết kế biến ngẫu nhiên có phân phối chuẩn với trung bình quy định 10cm Sau thời gian sản xuất, người ta nghi ngờ đường kính trung bình nhỏ so với thiết kế ban đầu Do đó, người ta tiến hành khảo sát 25 trục máy nhận thấy đường kính trung bình 9.975cm độ lệch chuẩn 0.035cm Với mức ý nghĩa 5%, cho nhận xét nghi ngờ ĐH NTT XSTK-YH Ngày 30 tháng năm 2022 19 / 24 5.2.1 Kiểm định trung bình tổng thể Gọi µ đường kính trung bình trục máy Ta có: n = 25; x ¯ = 9.975; α = 5%; s = 0.0035; µ0 = 10 Xét giả thuyết H0 : H1 : = 10 = 10 ã Với mức ý nghĩa α = 5% tα/2 (n − 1) = t0.025 (24) = 2.064 √ √ (¯ x à0 ) n (9.975 10) 25 ã Giá trị kiểm định g = = = −3.57 s 0.035 • Do |g| > tα/2 (n − 1) nên bác bỏ H0 mà x ¯ = 9.975 < µ0 = 10 ⇒ µ < 10 Vậy với mức ý nghĩa 5%, đường kính trung bình nhỏ so với thiết kế ĐH NTT XSTK-YH Ngày 30 tháng năm 2022 20 / 24 5.2 Kiểm định trung bình kiểm định tỉ lệ 5.2.2 Kiểm định giả thuyết tỉ lệ Giả sử tổng thể X có tỷ lệ phần tử có tính chất A p chưa biết Với mức ý nghĩa α , kiểm định giả thuyết H0 : H1 : Chọn tiêu chuẩn kiểm định G = p = p0 p = p0 √ (F − p0 ) n p0 (1 − p0 ) Nếu H0 G ∼ N (0, 1) ĐH NTT XSTK-YH Ngày 30 tháng năm 2022 21 / 24 5.2 Kiểm định trung bình kiểm định tỉ lệ 5.2.2 Kiểm định giả thuyết tỉ lệ Quy trình bước thực 1−α tra bảng Laplace tìm zα/2 √ (f − p0 ) n Từ mức ý nghĩa α: ϕ(zα/2 ) = Tính giá trị kiểm định g = p0 (1 − p0 ) Nếu |g| ≥ zα/2 bác bỏ H0 , ngược lại chấp nhận H0 ĐH NTT XSTK-YH Ngày 30 tháng năm 2022 22 / 24 5.2 Kiểm định trung bình kiểm định tỉ lệ 5.2.2 Kiểm định giả thuyết tỉ lệ Ví dụ Trong dây chuyền sản xuất thuốc có ý kiến cho rằng: có 20% viên khơng đạt tiêu chuẩn Kiểm tra ngẫu nhiên 100 viên thấy có 13 viên khơng đạt tiêu chuẩn Với mức ý nghĩa 5%, cho nhận xét ý kiến Giải Gọi p tỉ lệ viên thuốc không đạt chuẩn dây chuyền sản xuất 13 Ta có: p0 = 20% = 0.2; n = 100; f = = 0.13; α = 5% 100 H0 : H1 : ĐH NTT p = 20% p = 20% XSTK-YH Ngày 30 tháng năm 2022 23 / 24 5.2 Kiểm định trung bình kiểm định tỉ lệ 5.2.2 Kiểm định giả thuyết tỉ lệ • Với mức ý nghĩa α = 5%: ϕ(zα/2 ) = 1−α Laplace −→ zα/2 = 1.96 • Tính giá trị kiểm định √ √ (0.13 − 0.2) 100 (f − µ0 ) n = = −1.75 g= p0 (1 − p0 ) 0.2(1 − 0.2) • Do |g| ≤ zα/2 nên chấp nhận H0 Vậy với mức ý nghĩa 5%, tỉ lệ viên thuốc không đạt chuẩn 20% ĐH NTT XSTK-YH Ngày 30 tháng năm 2022 24 / 24 ... ĐH NTT XSTK-YH Ngày 30 tháng năm 2022 / 24 Chương 5: Kiểm định giả thuyết thống kê 5. 1 Kiểm định giả thuyết thống kê 5. 1.1 Định nghĩa Giả thuyết thống kê phát biểu (chưa biết hay sai) tham số,... ĐH NTT XSTK-YH Ngày 30 tháng năm 2022 / 24 5. 1 Kiểm định giả thuyết thống kê 5. 1.2 Các thành phần kiểm định Nguyên lí xác suất nhỏ Nếu biến cố có xác suất nhỏ khơng xảy một vài lần thực phép thử... có: n = 25; x ¯ = 9.9 75; α = 5% ; s = 0.00 35; µ0 = 10 Xét giả thuyết H0 : H1 : µ = 10 µ = 10 • Với mức ý nghĩa α = 5% tα/2 (n − 1) = t0.0 25 (24) = 2.064 √ √ (¯ x − µ0 ) n (9.9 75 − 10) 25 • Giá