Kiểm ịnh so sánh hai trung bình

Một phần của tài liệu Báo cáo cuối kỳ môn phân tích dữ liệu (Trang 53 - 55)

D. Công thức tính xác suất

4.2.2 Kiểm ịnh so sánh hai trung bình

Cho hai biến ngẫu nhiên ộc lập X và Y, trong ó X có phân phối chuẩn 𝑁(𝜇1; 𝜎12)

mẫu kích thước n1,biến Y có phân phối chuẩn 𝑁(𝜇2; 𝜎22) mẫu kích thước n2. Ta có giả thiết H0:𝜇1 = 𝜇2, ta có các dạng bài toán:

i. Trường hợp 𝜎12; 𝜎22 ã biết: chia thành 3 ối thuyết H1:μ1>μ2 ;H1:μ1<μ2 ;H1:μ1≠μ2

Ta có quy tắc kiểm ịnh như sau:

Tìm 𝑍𝛼 từ hệ thức 2𝛷(𝑍𝛼) = 1 − 𝛼;Tính thống kê

|𝑋− 𝑌|

𝑍𝛼

Nếu 𝑍0 ≤ 𝑍𝛼, thì chấp nhận H. Nếu 𝑍0 > 𝑍𝛼 thì bác bỏ H

ii. Trường hợp 𝜎12; 𝜎22 chưa biết: chia thành 3 ối thuyết H1:μ1>μ2 ;H1:μ1<μ2 ;H1:μ1≠μ2 (Bài toán Behrens Fisher)

- Trong thống kê, bài toán Behrens-Fisher, ược ặt theo tên của Walter Behrens và Ronald Fisher, là bài toán ước lượng khoảng thời gian và kiểm ịnh giả thuyết liên quan ến sự khác biệt giữa giá trị trung bình của hai quần thể phân bố chuẩn khi phương sai của hai quần thể không ược giả ịnh là bằng nhau , dựa trên hai mẫu ộc lập.

- Các giải pháp cho vấn ề Behrens-Fisher ã ược trình bày sử dụng quan iểm cổ iển hoặc suy luận Bayes và một trong hai giải pháp sẽ không hợp lệ về mặt hình thức ược ánh giá theo quan iểm khác. Nếu việc xem xét chỉ bị giới hạn trong suy luận thống kê cổ iển, thì có thể tìm kiếm các giải pháp cho vấn ề suy luận dễ áp dụng theo nghĩa thực tế, ưu tiên sự ơn giản này hơn bất kỳ sự không chính xác nào trong các câu xác suất tương ứng. Khi yêu cầu ộ chính xác của các mức ý nghĩa của các thử nghiệm thống kê, có thể có yêu cầu bổ sung rằng thủ tục phải sử dụng tối a thông tin thống kê trong tập dữ liệu. Ai cũng biết rằng có thể ạt ược một thử nghiệm chính xác bằng cách loại bỏ ngẫu nhiên dữ liệu từ tập dữ liệu lớn hơn cho ến khi các kích thước mẫu bằng nhau, tập hợp dữ liệu theo từng cặp và lấy chênh lệch, sau ó sử dụng phân phối Student thông thường ể kiểm tra sự ộ chênh lệch giữa hai kỳ vọng bằng 0 rõ ràng iều này sẽ không phải là "tối ưu" theo bất kỳ nghĩa nào.

- Nhiệm vụ chỉ ịnh ước lượng khoảng thời gian cho vấn ề này là một nhiệm vụ mà cách tiếp cận theo suy luận Frenquentist không cung cấp giải pháp chính xác, mặc dù có sẵn một số phép gần úng. Các phương pháp tiếp cận Bayes tiêu chuẩn cũng không ưa ra ược câu trả lời có thể ược biểu thị dưới dạng các công thức ơn giản, nhưng các phương pháp tính toán hiện ại của phân tích Bayes cho phép tìm ra các giải pháp chính xác về cơ bản. giữa phương pháp tiếp cận thường xuyên và Bayes ể ước lượng khoảng thời gian.

Ta có quy tắc kiểm ịnh như sau:

Tìm 𝑇𝛼= 𝑇𝛼/2(𝑛1 + 𝑛2 − 2) từ bảng phân phối Student

𝑇 = |𝑋−𝑌| Tính thống kê

+Ví dụ:

Có hai phương pháp sản xuất . Phương án 1thử 6 mẫu thì trung bình cần 2.5 nguyên liệu,với phương sai là 0.1. Phương án 2 thử 5 mẫu thì trung bình cần 3.3 nguyên liệu , với phương sai là 0.195. Cần chọn phương án nào phù hợp, với mức ý nghĩa 0.05?

Giải: H0:𝜇1 = 𝜇2 (số trung bình các ơn vị nguyên liệu cần thiết ể sản xuất ra một sản phẩm của hai phương pháp là bằng nhau)

-𝑇𝛼= 𝑇0.025(9) = 2.26

-𝑇 =

Vì 𝑇0 > 𝑇𝛼 thì bác bỏ H, nên số trung bình các ơn vị nguyên liệu ể sản xuất ra một

sản phẩm là không bằng nhau

Một phần của tài liệu Báo cáo cuối kỳ môn phân tích dữ liệu (Trang 53 - 55)