Cho X là biến ngẫu nhiên và là mẫu ngẫu nhiên thu đƣợc về biến X.
Bài toán kiểm định: Với mức cho trƣớc, kiểm định các giả thuyết sau:
Bài toán 1: Giả thuyết / Đối thuyết .
Bài toán 2: Giả thuyết / Đối thuyết .
Bài toán 3: Giả thuyết / Đối thuyết .
Bài toán 1 đƣợc gọi là bài toán kiểm định hai phía, bài toán 2 và bài toán 3 đƣợc gọi là bài toán kiểm định một phíạ
Ta giải các bài toán trên trong ba trƣờng hợp sau:
Trƣờng hợp 1: và đã biết, là tham số chƣa biết.
Lời giải bài toán 1:
{
Tiêu chuẩn kiểm định: ̅ √
Giả sử, đúng, tức là . Ngƣời ta chứng minh đƣợc rằng tiêu chuẩn T có phân phối chuẩn tắc.
Ta có:
(| | ) (| | ) ( )
Vì tiêu chuẩn U có phân phối chuẩn tắc nên:
( ) ( ) ( ) ( )
Do đó, ta có ( ) . Từ đây, tra bảng phân phối chuẩn tắc ta sẽ tìm đƣợc giá trị cụ thể của .
Đặt {| | }. Đây chính là miền có xác suất nhỏhơn hoặc bằng . Nhƣ vậy, với việc xác định đƣợc phân phối của U và mức ý nghĩa cho trƣớc, ta luôn xác định đƣợc miền tiêu chuẩn hay bác bỏ giả thuyết.
Từ mẫu ngẫu nhiên thu đƣợc về biến X, tính giá trị của tiêu chuẩn Ụ Sau đó, ta so sánh | |với .
Kết luận: Nếu | | thì ta bác bỏ giả thuyết. Ngƣợc lại, ta chấp nhận giả thuyết.
Ví dụ 1: Một ngƣời khẳng định năng suất trung bình của giống lúa A là 6,0 tấn/hạ Tuy nhiên, khi trồng loại lúa này trên 100 thửa ruộng thì thấy rằng năng suất trung bình 6,5 tấn/hạ Giả sử, năng suất lúa A có phân phối chuẩn với phƣơng sai là 4. Với mức ý nghĩa 5%, khẳng định đƣa ra có đáng tin không?
Giải:
Gọi X là năng suất của lúa Ạ Theo giả thiết, .
Bài toán đặt ra: với mức ý nghĩa , kiểm định giả thuyết:
{
Với , tra ngƣợc bảng phân phối chuẩn tắc tại mức 0,975 ta tìm đƣợc giá trị .
Từ mẫu và giả thiết, ta có ̅ . Do đó, giá trị của tiêu chuẩn kiểm định là:
̅ √ √
Ta có | | . Nhƣ vậy, mẫu điều tra đƣợc rơi vào miền bác bỏ giả thuyết. Kết luận đƣa ra là bác bỏ giả thuyết, tức là năng suất trung bình của lúa A khác 6,0 tấn/ha hay khẳng định đƣa ra chƣa hợp lí.
Lời giải bài toán 2:
Với cách làm hoàn toàn tƣơng tự, bài toán 2 đƣợc giải nhƣ sau: Tiêu chuẩn kiểm định:
̅
√
Với mức cho trƣớc, ta tìm một số thỏa mãn: .
Nếu giả thuyết đúng ngƣời ta chứng minh đƣợc tiêu chuẩn U có phân phối chuẩn tắc. Dođó, ta có:
Mặt khác, . Tra bảng phân phối chuẩn tắc ta nhận đƣợc giá trị của .
Đặt đây chính là miền bác bỏ giả thuyết của bài toán 2.
Từ mẫu quan sát đƣợc, tính giá trị của tiêu chuẩn Ụ
Kết luận: Nếu giá trị của tiêu chuẩn U rơi vào miền ta sẽ bác bỏ . Nếu ngƣợc lại, ta chấp nhận nó.
Ví dụ 2: Tiêu chuẩn khai thác gỗ keo Tai Tƣợng của một nhà máy là đƣờng kính 1m30 phải từ 30 cm trở lên. Tại một lâm trƣờng trồng loại keo này, khi đo đƣờng kính 1m30 của 50 cây thì đƣờng kính trung bình là 32 cm. Giả sử, đƣờng kính có phân phối chuẩn với phƣơng sai là 25 cm. Loại keo của lâm trƣờng này đã đạt tiêu chuẩn khai thác chƣa, với mức 10%?
Giải:
Gọi X là đƣờng kính cây keọ Ta có . Bài toán đặt ra:
{
Tiêu chuẩn kiểm định:
̅ √
Với , ta có .
Với mẫu thu đƣợc, giá trị của tiêu chuẩn kiểm định là:
Kết luận:
Vì nên ta bác bỏ giả thuyết, tức là đƣờng kính trung bình của cây keo Tai Tƣợng tại lâm trƣờng đƣợc khảo sát lớn hơn 30 cm.
Bài toán 3 đƣợc giải quyết tƣơng tự nhƣ Bài toán 1 và Bài toán 2 với cùng tiêu chuẩn kiểm định.
Miền bác bỏ giả thuyết đƣợc xác định nhƣ sau: Ta tìm số thỏa mãn
. Dựa vào phân phối chuẩn tắc của tiêu chuẩn kiểm định miền
bác bỏ giả thuyết là:
Trong đó, đƣợc tra từ bảng phân phối chuẩn tắc với mức .
Trƣờng hợp 2: là tham số cần kiểm định và chƣa biết, cỡ mẫu nhỏ (n < 30).
Ta vẫn xét ba bài toán kiểm định giả thuyết: Bài toán 1; Bài toán 2 và Bài toán 3 với cùng mức .
Lời giải bài toán 1:
Ta phát biểu lại bài toán 1:
{
Tiêu chuẩn kiểm định đƣợc sử dụng:
̅ √ ̅
̂ √
Trong đó, là ƣớc lƣợng không chệch, vững và hiệu quả cho ; ̂ là phƣơng sai mẫụ
Ta chứng minh đƣợc rằng khi đúng thì tiêu chuẩn T có phân phối Student với bậc tự do là n-1. Do vậy, miền bác bỏ giả thuyết đƣợc tìm nhƣ sau:
Với cho trƣớc, ta tìm số thỏa mãn (| | ) . Vì T có phân phối Student với n-1 bậc tự do nên chính là phân vị mức
của phân phối nàỵ Vậy miền bác bỏ là:
Trong đó, đƣợc tra ở bảng phân phối Student n-1 bậc tự do và mức .
Từ mẫu quan sát đƣợc, tính ̅ hoặc ̂ và giá trị của tiêu chuẩn T:
̅ √ ̅
̂ √
-So sánh | | với .
-Kết luận: Nếu | | thì ta bác bỏ giả thuyết, ngƣợc lại ta tạm thời chấp nhận giả thuyết đặt rạ
Ví dụ 3: Nhiệt độ tháng 6 đo đƣợc tại một địa phƣơng ở nhiều điểm quan trắc khác nhau là: 25; 26; 28; 34; 37; 39; 34; 30; 26; 36; 38; 39 và 35 (thang đo độ C). Giả sử, nhiệt độ là biến có phân phối chuẩn. Với mức 5% có thể khẳng định rằng nhiệt độ trung bình trên địa phƣơng này vào tháng 6 là 350C không?
Giải:
Gọi X là nhiệt độ tại địa phƣơng đó. Ta có . Bài toán đặt ra:
{
Từ mẫu ta tính đƣợc: ̅
Và ̅ √ √
Tra bảng phân phối Student bậc tự do 12 mức 2,5% Ta đƣợc .
Vậy | | .
Ta chấp nhận giả thuyết, tức là, có thể coi nhiệt độ trung bình vào tháng 6 tại địa phƣơng này là 350C. Ở ví dụ này, ta thấy rằng mặc dù trung bình mẫu và giả thuyết chêch lệch khá lớn 2,10C nhƣng giả thuyết không bị bác bỏ là vì cỡ mẫu nhỏ và độ lệch mẫu lớn.
Tƣơng tự nhƣ trong trƣờng hợp 1, Bài toán 2 và Bài toán 3 có miền bác bỏ giả thuyết lần lƣợt là:
Trong đó, đƣợc tra ở bảng phân phối Student n-1 bậc tự do, mức .
Trƣờng hợp 3: Cỡ mẫu lớn (n > 30), trong trƣờng hợp này, ta không cần giả thiết về tính chuẩn của biến.
Trong trƣờng hợp này, ta ƣớc lƣợng phƣơng sai chƣa biết của biến từ mẫu là Sau đó, thay và giải ba bài toán kiểm định giả thuyết nhƣ trƣờng hợp 1. Điều này đạt đƣợc vì tiêu chuẩn ̅ √ có phân phối xấp xỉ phân phối chuẩn tắc khi cỡ mẫu đủ lớn. Ngƣời ta thƣờng chọn cỡ mẫu n > 30 đƣợc cho là mẫu lớn vì khi cỡ mẫu lớn hơn 30 thì sai số khi xấp xỉ khá nhỏ.
Ví dụ:
Ví dụ 4: Chiều cao của một số sinh viên đo đƣợc cho ở bảng sau:
Chiều cao (m) 1,40-1,50 1,50-1,55 1,55-1,60 1,60-1,65 1,65-1,70 1,70-1,80
Số sinh viên 7 25 30 34 18 10
Với mức 5%, có thể khẳng định chiều cao trung bình của sinh viên lớn hơn 1,55 m đƣợc không?
Giải:
Gọi X là chiều cao sinh viên. Bài toán kiểm định là:
{
Dựa vào mẫu ta tính đƣợc: ̅
Và ̅ √ √
Với mức , tra bảng phân phối chuẩn tắc, ta đƣợc . Vì nên ta bác bỏ giả thuyết, tức là chiều cao trung bình của sinh viên lớn hơn 1,55 m.