Cho X là một biến ngẫu nhiên có phân phối là mẫu về X.
Định nghĩa 1: Giả thuyết là một khẳng định về phân phối hay về tham số chƣa biết của biến ngẫu nhiên, thông thƣờng ta kí hiệu là H hoặc .
Định nghĩa 2: Đối thuyết là khẳng định về phân phối hay tham số của biến ngẫu nhiên nhƣng trái ngƣợc với giả thuyết đƣợc nêu, kí hiệu là K hoặc .
Ví dụ 1:
Giả thuyết H: Biến ngẫu nhiên X có phân phối chuẩn tắc.
Đối thuyết K: Biến ngẫu nhiên X không có phân phối chuẩn tắc.
Đây là giả thuyết đặt ra đối với phân phối chƣa biết của biến, tức là ta đang ngờ rằng biến có phân phối chuẩn tắc.
Ví dụ 2: Giả sử , biến X có phân phối chuẩn và phƣơng sai
đã biết, kì vọng là tham số chƣa biết. Ta có thể đặt ra các giả thuyết và đối thuyết tƣơng ứng với nhƣ sau:
Giả thuyết :
Đối thuyết
Đối thuyết có thể đƣợc thay bằng các đối thuyết hoặc
.
Bài toán đặt ra nhƣ sau: Ta quan tâm tới biến ngẫu nhiên X có phân phối chƣa biết. Có hai khẳng định trái ngƣợc nhau về biến X là giả thuyết và đối thuyết. Với dữ liệu thu đƣợc về X (mẫu ngẫu nhiên), ta phải quyết định lựa chọn một trong hai khẳng định đó theo một cách “hợp lí nhất”.
Phƣơng pháp chung giải bài toán kiểm định giả thuyết:
Để giải bài toán kiểm định giả thuyết, ngƣời ta làm nhƣ sau:
Dựa trên mẫu ngẫu nhiên thu đƣợc về X, ngƣời ta xây dựng tiêu chuẩn kiểm định (test thống kê) T là hàm của mẫu, tức là . Nói đơn giản, tiêu chuẩn T đo sự sai khác giữa giả thuyết đặt ra và thực tế quan sát đƣợc về X.
Ta sẽ đƣa ra quyết định chấp nhận hay bác bỏ giả thuyết dựa vào tiêu chuẩn T một cách “hợp lí”. Thông thƣờng, nếu có sự khác biệt lớn hay T nhận giá trị lớn ta sẽ bác bỏ giả thuyết. Nếu T nhận giá trị nhỏ thì ta sẽ chấp nhận giả thuyết, tức là, sự sai khác không đáng kể (sai do yếu tố ngẫu nhiên - lấy mẫu).
Vì ta không có toàn bộ thông tin về biến X nên quyết định mà ta đƣa ra dựa trên tiêu chuẩn T hoàn toàn có thể dẫn tới sai lầm. Có hai sai lầm có thể mắc phải nhƣ sau:
a) Sai lầm loại 1: Giả thuyết sai nhƣng ta lại chấp nhận nó. b)Sai lầm loại 2: Giả thuyết đúng nhƣng ta lại bác bỏ nó.
Một cách tự nhiên, ta cố gắng tìm một tiêu chuẩn sao cho khi đƣa ra quyết định dựa trên nó thì khả năng mắc hai sai lầm trên là nhỏ nhất. Tuy nhiên, ngƣời ta chứng minh đƣợc rằng một tiêu chuẩn nhƣ vậy là không tồn tạị Trong tình huống này, ngƣời ta xử lí nhƣ sau:
Ta khống chế xác suất mắc sai lầm loại 1 nhỏ hơn một mức đã ấn định trước (thường nhỏ) và tìm một tiêu chuẩn cực tiểu xác suất mắc sai lầm loại 2. May mắn thay, một tiêu chuẩn nhƣ vậy luôn tồn tạị
Nguyên tắc đƣa ra quyết định: Ngƣời ta đƣa ra quyết định dựa trên “nguyên lí xác suất nhỏ”.
Nguyên lí xác suất nhỏ: Nếu một biến cố có xác suất nhỏ thì nó sẽ không xảy ra trong một hoặc một vài lần thực hiện phép thử.
Đến đây, bài toán kiểm định giả thuyết đƣợc giải quyết bằng phƣơng pháp phản chứng nhƣ sau:
Giả sử, giả thuyết đặt ra là đúng, khi ấy tiêu chuẩn T có một phân phối hoàn toàn xác định. Dựa vào phân phối này, ta tìm một miền S thỏa mãn
| . Miền S đƣợc gọi là miền tiêu chuẩn hay miền bác bỏ giả thuyết. Từ dữ liệu thực tế có đƣợc, ta tính ra giá trị của T và đối chiếu giá trị của T với miền tiêu chuẩn. Nếu thì ta sẽ bác bỏ giả thuyết. Nếu ngƣợc lại, ta chấp nhận giả thuyết. Đó là lời giải của bài toán kiểm định giả thuyết.
Cơ sở của quyết định trên đƣợc giải thích: Nếu giả thuyết là đúng đắn thì S là miền có xác suất nhỏ (vì đƣợc chọn nhỏ). Do đó, biến cố có xác suất nhỏ. Một biến cố có xác suất nhỏ phải không xảy ra trong một hoặc một vài lần lấy mẫu mới là hợp lí. Do đó, nếu trong lần đầu lấy mẫu, ta thấy rằng T rơi vào miền S, điều này mâu thuẫn với nguyên lí xác suất nhỏ và quyết định ta đƣa ra là bác bỏ giả thuyết. Khả năng phạm sai lầm loại 1 khi chọn quyết định này nhỏ hơn hoặc bằng .
Chú ý:
Phƣơng pháp giải trên đƣợc gọi là phƣơng pháp kiểm định truyền thống. Một phƣơng pháp khác thƣờng đƣợc dùng trong các phần mềm thống kê là phƣơng pháp P - value (P - giá trị).
Tiêu chuẩn T là một biến ngẫu nhiên. Ta đƣa ra quyết định dựa trên T hay chính dựa trên mẫu (những bằng chứng thu thập đƣợc). Nếu hai mẫu khác nhau có thể dẫn tới hai quyết định trái ngƣợc nhaụ
Xác suất mắc sai lầm loại 1 đƣợc ƣu tiênkhống chế vì ngƣời ta cho rằng sai lầm này nghiêm trọng hơn nếu phạm phảị
Xác suất mắc sai lầm loại 2 chƣa đƣợc xác định. Do vậy, quyết định bác bỏ giả thuyết nói chung “an toàn” hơn quyết định chấp nhận giả thuyết vì nhỏ và đã biết.