D. Công th c tính xác su tứ ấ
4.2.2 Kiểm định so sánh hai trung bình
Cho hai bi n ngế ẫu nhiên độ ập X v Y, trong đó X có phân phốc l i chuẩn 𝑁(𝜇1; 𝜎12) mẫu kích thước n1,biến Y có phân ph i chuố ẩn 𝑁(𝜇 ; 𝜎2 22) m u kí ẫ ch thước n . Ta có 2 giả thi t Hế 0:𝜇1= 𝜇2, ta có các d ng b toán: ạ ài
i. Trường hợp 𝜎12; 𝜎22 đãbiết: chia th h 3 i thuy t Hàn đố ế 1:μ1>μ2 ;H1:μ1<μ2 ;H1:μ1≠μ2 Ta có quy t c kiắ ểm định như sau: Tìm 𝑍𝛼 từ h ệthức 2𝛷 𝑍( 𝛼) = 1 − 𝛼;Tính th ng kê ố 𝑍𝛼= |𝑋 − 𝑌| √𝜎12 𝑛1+ 𝜎22 𝑛2 Nếu 𝑍0≤ 𝑍𝛼, thì chấp nhận H. Nếu 𝑍0> 𝑍𝛼 ì bác b H th ỏ
ii. Trường h p ợ 𝜎12; 𝜎22chưabiết: chia th h 3 i thuy t Hàn đố ế 1:μ1>μ2 ;H1:μ1<μ2 ;H1:μ1≠μ2 ài toán Behrens Fisher) (B
- Trong th ng kê, bài toán Behrens-ố Fisher, được đặt theo tên của Walter
Behrens v Ronald Fisher, l bi toán ước lượng khoảng thời gian và kiểm
định giả thuyết liên quan đến sự khác biệt gi a giá trữ ị trung bình c a hai ủ
quần th phân b chuể ố ẩn khi phương sai của hai qu n thầ ểkhông được gi ả định là b ng nhau , d a trên hai mằ ự ẫu độc lập.
- Các gi i pháp cho vả ấn đề Behrens-Fisher đã được trình bày sử dụng quan
điểm cổđiển hoặc suy luận Bayes và một trong hai gi i pháp s không hả ẽ ợp lệ v m t hình thề ặ ức được đánh giá theoquan điểm khác. N u vi c xem xét ế ệ
chỉ bịgiới h n trong suy lu n th ng kê cạ ậ ố ổ điển, thì có th tìm ki m các giể ế ải pháp cho vấn đề suy lu n d áp dậ ễ ụng theo nghĩa thự ế, ưu tiên sực t đơn giản
ny hơn bất kỳ sự không chính xác nào trong các câu xác suất tươngứng. Khi yêu cầu độ chính xác c a các mủ ức ý nghĩa của các th nghi m th ng kê, ử ệ ố
có th có yêu c u b sung r ng th t c ph i s d ng tể ầ ổ ằ ủ ụ ả ử ụ ối đa thông tin thống kê trong t p dậ ữ liệu. Ai cũng biế ằt r ng có thểđạt được m t th nghi m chính ộ ử ệ
xác b ng cách lo i bằ ạ ỏ ngẫu nhiên dữ liệ ừ ậu t t p dữ liệ ớn hơn cho đếu l n khi
các kích thước mẫu bằng nhau, tập hợp dữ liệu theo từng cặp và lấy chênh lệch, sau đó sử dụng phân phối Student thông thường để kiểm tra sựđộ
chênh lệch giữa hai k v ng bỳ ọ ằng 0 rõ rng điều này s không ẽ phải là "tối
ưu" theo bất kỳnghĩa no.
- Nhiệm vụ chỉđịnh ước lượng khoảng thời gian cho vấn đề này là một nhiệm vụ mà cách ti p c n theo suy lu n Frenquentist không cung c p gi i pháp ế ậ ậ ấ ả
chính xác, m c dù có s n mặ ẵ ột số phép gần đúng. Các phương pháp tiếp c n ậ
Bayes tiêu chuẩn cũng không đưa ra được câu tr l i có thả ờ ểđược bi u th ể ị dưới dạng các công thức đơn giản, nhưng các phương pháp tính toán hiện
đại của phân tích Bayes cho phép tìm ra các gi i pháp chính xác vả ềcơ bản. giữa phương pháp tiếp cận thường xuyên v Bayes để ước lượng khoảng thời gian.
Ta có quy t c kiắ ểm định như sau: Tìm 𝑇𝛼= 𝑇𝛼/2(𝑛1+ 𝑛2− 2) t b ng phân ph i Student ừ ả ố Tính th ng kê ố 𝑇0= |𝑋−𝑌| √𝜎12𝑛1+𝑛2𝜎22 Nếu 𝑇0≤ 𝑇𝛼, thì chấp nhận H. Nếu 𝑇0> 𝑇𝛼 ì bác b H th ỏ +Ví d : ụ
Có hai ph ng pháp s n ươ ả xuất . Ph ng án 1ươ thử 6 m u thì trung bình c n 2.5 ẫ ầ
nguyên liệu,với phương sai là 0.1. Phương án 2 thử 5 m u thì trung bình c n 3.3 ẫ ầ
nguyên li u , v i ệ ớ phương sai là 195. C n 0. ầ chọn ph ng án nào phù h p, v i mươ ợ ớ ức ý ngh a 0.05? ĩ
Giải: H0:𝜇1= 𝜇2(số trung bình các đơn v nguyên li u c n thi t s n xu t ra ị ệ ầ ế để ả ấ
một s n ph m c a hai ph ng pháp là bả ẩ ủ ươ ằng nhau) -𝑇𝛼= 𝑇0.025(9) = 2.26
-𝑇0= |2.5−3.3|
√0.16+0.1955 = 3.39
Vì 𝑇0> 𝑇𝛼 thì bác b H, nêỏ n số trung bình các đơn vị nguyên li u s n xu t ra ệ để ả ấ
một s n ph m là ông bả ẩ kh ằng nhau