Cho X là biến ngẫu nhiên và là mẫu ngẫu nhiên thu được về biến X. Giả thiết X là biến ngẫu nhiên có phân phối chuẩn
Bài toán kiểm định: Với mức cho trước, kiểm định các giả thiết sau: - Bài toán 1: Giả thiết / Đối thiết ;
- Bài toán 2: Giả thiết / Đối thiết
- Bài toán 3: Giả thiết / Đối thiết .
Bài toán 1 được gọi là bài toán kiểm định hai phía, bài toán 2 và bài toán 3 được gọi là bài toán kiểm định một phía.
Ta giải các bài toán trên trong ba trường hợp sau:
Trường hợp 1: và đã biết, là tham số chưa biết. Lời giải bài toán 1:
{
Tiêu chuẩn kiểm định:
̅ √
Giả sử, đúng, tức là . Người ta chứng minh được rằng tiêu chuẩn T có phân phối chuẩn tắc.
Với cho trước, ta tìm một số thỏa mãn ( ) . Từ đây, tra bảng phân phối chuẩn tắc ta sẽ tìm được giá trị cụ thể của .
Đặt {| | }. Đây chính là miền có xác suất nhỏ hơn hoặc bằng . Như vậy, với việc xác định được phân phối của U và mức ý nghĩa cho trước, ta luôn xác định được miền tiêu chuẩn hay bác bỏ giả thiết.
Từ mẫu ngẫu nhiên thu được về biến X, tính giá trị của tiêu chuẩn U. Sau đó, ta so sánh | | với .
Kết luận: Nếu | | thì ta bác bỏ giả thiết. Ngược lại, ta chấp nhận giả thiết.
Ví dụ 2. Khối lượng quy định cho mỗi gói mì là 80g. Kiểm tra ngẫu nhiên 100 gói mì sau một ca sản xuất người ta thấy khối lượng trung bình một gói mì là 79,92 g. Biết rằng khối lượng gói mì tuân theo luật phân phối chuẩn với phương sai 0,1584. Với mức ý nghĩa 5%, kiểm tra chất lượng của ca sản xuất?
Giải:
Gọi X trọng lượng của một gói mì. Theo giả thiết, . Bài toán đặt ra: với mức ý nghĩa , kiểm định giả thiết:
{
Với , tra ngược bảng phân phối chuẩn tắc tại mức 0,975 ta tìm được giá trị .
Từ mẫu và giả thiết, ta có ̅ . Do đó, giá trị của tiêu chuẩn kiểm định là:
̅ √
√ √
Ta có | | . Như vậy, mẫu điều tra được rơi vào miền bác bỏ giả thiết. Kết luận đưa ra là bác bỏ giả thiết H0, chấp nhận H1, tức là chất lượng của ca làm việc không đạt yêu cầu.
Lời giải bài toán 2:
Với cách làm hoàn toàn tương tự, bài toán 2 được giải như sau: Tiêu chuẩn kiểm định:
Với mức cho trước, ta tìm một số thỏa mãn: . Tra bảng phân phối chuẩn tắc ta nhận được giá trị của .
Đặt đây chính là miền bác bỏ giả thiết của bài toán 2. Từ mẫu quan sát được, tính giá trị của tiêu chuẩn U.
Kết luận: Nếu giá trị của tiêu chuẩn U rơi vào miền ta sẽ bác bỏ . Nếu ngược lại, ta chấp nhận nó.
Bài toán 3 được giải quyết tương tự như Bài toán 1 và Bài toán 2 với cùng tiêu chuẩn kiểm định.
Miền bác bỏ giả thiết là:
Trong đó, được tra từ bảng phân phối chuẩn tắc với mức .
Ví dụ 3. Tốc độ trung bình của xe máy là 45km/h. Sau khi triển khai bắn tốc độ, người ta kiểm tra ngẫu nhiên 121 người điều hành phương tiện tính được vận tốc trung bình là 43 km/h. Biết vận tốc xe máy tuân theo luật phân phối chuẩn với 8.577. Với mức ý nghĩa 1%, hãy kiểm tra xem việc bắn tốc độ có làm người điều khiển xe máy giảm vận tốc hay không?
Giải:
Gọi X vận tốc của xe máy. Ta có 2 . Bài toán đặt ra:
{
Tiêu chuẩn kiểm định:
̅ √
Với , ta có .
Với mẫu thu được, giá trị của tiêu chuẩn kiểm định là:
̅ √
√
Vì nên ta bác bỏ giả thiết, tức là, việc bắn tốc độ có làm người điều khiển xe máy giảm tốc độ.
Trƣờng hợp 2: là tham số cần kiểm định và chưa biết, cỡ mẫu nhỏ (n < 30).
Ta vẫn xét ba bài toán kiểm định giả thiết: Bài toán 1; Bài toán 2 và Bài toán 3 với cùng mức .
Lời giải bài toán 1:
Ta phát biểu lại bài toán 1:
{
Tiêu chuẩn kiểm định được sử dụng:
̅ √ ̅
̂ √
Trong đó, là ước lượng không chệch, vững và hiệu quả cho ; ̂ là phương sai mẫu.
Ta chứng minh được rằng khi đúng thì tiêu chuẩn T có phân phối Student với bậc tự do là n-1. Do vậy, miền bác bỏ giả thiết được tìm như sau:
Với cho trước, ta tìm số thỏa mãn (| | ) . Vì T có phân phối Student với n-1 bậc tự do nên chính là phân vị mức
của phân phối này. Vậy miền bác bỏ là:
{ | | }
Trong đó, được tra ở bảng phân phối Student n-1 bậc tự do và mức .
Từ mẫu quan sát được, tính ̅ hoặc ̂ và giá trị của tiêu chuẩn T:
̅ √ ̅
̂ √
- So sánh | | với .
- Kết luận: Nếu | | thì ta bác bỏ giả thiết, ngược lại ta tạm thời chấp nhận giả thiết đặt ra.
Ví dụ 4. Một bản nghiên cứu thông báo rằng mức tiền tiêu dùng hằng tháng của một sinh viên là 1.520.000 đồng. Để kiểm tra người ta chọn ngẫu nhiên 25 sinh viên và tìm được trung bình mỗi tháng họ tiêu 1.600.000 đồng với độ lệch tiêu chuẩn là 160.000 đồng. Với mức ý nghĩa 5%, hãy kiểm định xem báo cáo có khác so với thực tế không?
Giải:
Bài toán đặt ra: { Với: ̅ Và: ̅ √ √
Tra bảng phân phối Student bậc tự do 24 mức 2,5%, ta được
.
Vậy | | .
Ta chấp nhận giả thiết, tức là, có thể coi mức độ tiêu dùng trung bình của một sinh viên là 1.520.000 đồng.
Tương tự như trong trường hợp 1, Bài toán 2 và Bài toán 3 có miền bác bỏ giả thiết lần lượt là:
Trong đó, được tra ở bảng phân phối Student n-1 bậc tự do, mức .
Trƣờng hợp 3: Cỡ mẫu lớn (n > 30), trong trƣờng hợp này, ta không cần giả thiết về tính chuẩn của biến.
Trong trường hợp này, ta ước lượng phương sai chưa biếtcủa biến từ mẫu là Sau đó, thay và giải ba bài toán kiểm định giả thiết như trường hợp 1. Điều này đạt được vì tiêu chuẩn ̅ √ có phân phối xấp xỉ phân phối chuẩn tắc khi cỡ mẫu đủ lớn. Người ta thường chọn cỡ mẫu n > 30 được cho là mẫu lớn vì khi cỡ mẫu lớn hơn 30 thì sai số khi xấp xỉ khá nhỏ.
Ví dụ 5.
.
Ví dụ 6. Đo chỉ số mỡ trong sữa của 130 con bò lai Hà - Ấn. Ta có số liệu. Gọi X là tỉ lệ mỡ trong sữa, ni là số bò lai.
Xi 3,0-3,6 3,6-4,2 4,2-4,8 4,8-5,4 5,4-6,0 6,0-6,6 6,6-7,2
ni 2 8 35 43 22 15 5
Biết rằng chỉ số mỡ trong sữa của bò Hà Lan thuần chủng là 4,95. Với mức ý nghĩa là 5%, hãy kiểm tra xem việc lai tạo giống bò có làm tăng tỉ lệ mỡ trong sữa không?
Giải:
Bài toán kiểm định là:
{
Dựa vào mẫu ta tính được: ̅
Và ̅ √
√ .
Với mức , tra bảng phân phối chuẩn tắc, ta được . Vì nên ta bác bỏ giả thiết, tức là việc lai tạo đã làm tăng tỉ lệ mỡ trong sữa.