Kiểm định so sánh hai trung bình

Một phần của tài liệu BÁO CÁO CUỐI KỲ MÔN HỌC PHÂN TÍCH DỮ LIỆU (Trang 62 - 64)

CHƯƠNG 4 KIỂM ĐỊNH GIẢ THIẾT

4.2 Kiểm định giả thiết tham số

4.2.2 Kiểm định so sánh hai trung bình

Cho hai biến ngẫu nhiên độc lập X và Y, trong đó X có phân phối chuẩn 𝑁(𝜇1; 𝜎12)

mẫu kích thước n1,biến Y có phân phối chuẩn 𝑁(𝜇2; 𝜎22) mẫu kích thước n2. Ta có giả thiết H0:𝜇1 = 𝜇2, ta có các dạng bài toán:

i. Trường hợp 𝜎12; 𝜎22đã biết: chia thành 3 đối thuyết H1:μ1>μ2 ;H1:μ1<μ2

;H1:μ1≠μ2 Ta có quy tắc kiểm định như sau: Tìm 𝑍𝛼 từ hệ thức 2𝛷(𝑍𝛼) = 1 − 𝛼;Tính thống kê 𝑍𝛼 = |𝑋 − 𝑌| √𝜎12 𝑛1 + 𝜎2 2 𝑛2 Nếu 𝑍0 ≤ 𝑍𝛼, thì chấp nhận H. Nếu 𝑍0 > 𝑍𝛼 thì bác bỏ H

ii. Trường hợp 𝜎12; 𝜎22 chưa biết: chia thành 3 đối thuyết H1:μ1>μ2

- Trong thống kê, bài toán Behrens-Fisher, được đặt theo tên của Walter

Behrens và Ronald Fisher, là bài toán ước lượng khoảng thời gian và kiểm

định giả thuyết liên quan đến sự khác biệt giữa giá trị trung bình của hai quần thể phân bố chuẩn khi phương sai của hai quần thể không được giả định là bằng nhau , dựa trên hai mẫu độc lập.

- Các giải pháp cho vấn đề Behrens-Fisher đã được trình bày sử dụng quan

điểm cổ điển hoặc suy luận Bayes và một trong hai giải pháp sẽ không hợp lệ về mặt hình thức được đánh giá theo quan điểm khác. Nếu việc xem xét chỉ bị giới hạn trong suy luận thống kê cổ điển, thì có thể tìm kiếm các giải pháp cho vấn đề suy luận dễ áp dụng theo nghĩa thực tế, ưu tiên sựđơn giản

này hơn bất kỳ sự không chính xác nào trong các câu xác suất tương ứng. Khi yêu cầu độ chính xác của các mức ý nghĩa của các thử nghiệm thống kê, có thể có yêu cầu bổ sung rằng thủ tục phải sử dụng tối đa thông tin thống kê trong tập dữ liệu. Ai cũng biết rằng có thể đạt được một thử nghiệm chính xác bằng cách loại bỏ ngẫu nhiên dữ liệu từ tập dữ liệu lớn hơn cho đến khi

các kích thước mẫu bằng nhau, tập hợp dữ liệu theo từng cặp và lấy chênh lệch, sau đó sử dụng phân phối Student thông thường để kiểm tra sự độ

chênh lệch giữa hai kỳ vọng bằng 0 rõ ràng điều này sẽ không phải là "tối

ưu" theo bất kỳnghĩa nào.

- Nhiệm vụ chỉ định ước lượng khoảng thời gian cho vấn đề này là một nhiệm vụ mà cách tiếp cận theo suy luận Frenquentist không cung cấp giải pháp chính xác, mặc dù có sẵn một số phép gần đúng. Các phương pháp tiếp cận Bayes tiêu chuẩn cũng không đưa ra được câu trả lời có thể được biểu thị dưới dạng các công thức đơn giản, nhưng các phương pháp tính toán hiện

đại của phân tích Bayes cho phép tìm ra các giải pháp chính xác về cơ bản. giữa phương pháp tiếp cận thường xuyên và Bayes để ước lượng khoảng thời gian.

Ta có quy tắc kiểm định như sau: Tìm 𝑇𝛼 = 𝑇𝛼/2(𝑛1+ 𝑛2− 2) từ bảng phân phối Student Tính thống kê 𝑇0 = |𝑋−𝑌| √𝜎12 𝑛1+𝜎22𝑛2 Nếu 𝑇0 ≤ 𝑇𝛼, thì chấp nhận H. Nếu 𝑇0 > 𝑇𝛼 thì bác bỏ H +Ví dụ:

Có hai phương pháp sản xuất . Phương án 1thử 6 mẫu thì trung bình cần 2.5 nguyên liệu,với phương sai là 0.1. Phương án 2 thử 5 mẫu thì trung bình cần 3.3 nguyên liệu , với phương sai là 0.195. Cần chọn phương án nào phù hợp, với mức ý nghĩa 0.05?

Giải: H0:𝜇1 = 𝜇2 (số trung bình các đơn vị nguyên liệu cần thiết để sản xuất ra một sản phẩm của hai phương pháp là bằng nhau)

-𝑇𝛼 = 𝑇0.025(9) = 2.26

-𝑇0 = |2.5−3.3|

√0.16 +0.1955 = 3.39

Vì 𝑇0 > 𝑇𝛼 thì bác bỏ H, nên số trung bình các đơn vị nguyên liệu để sản xuất ra một sản phẩm là không bằng nhau

Một phần của tài liệu BÁO CÁO CUỐI KỲ MÔN HỌC PHÂN TÍCH DỮ LIỆU (Trang 62 - 64)