Chương 3 Kiểm định giả thuyết
3.1. Khái niệm chung
3.1.1. Giả thuyết thống kê và kiểm định giả thuyết thống kê
Với mỗi biến ngẫu nhiên đều gắn với một hàm mật độ xác suất nào đó và mỗi hàm mật độ xác suất lại chứa một hay nhiều tham số mà nhiều khi ta chưa thể xác định được các tham số này. Chẳng hạn, phân phối nhị thức có hàm mật độ f(x) = Cnxpx(1−p)n−1, x ∈ {0; 1;...;n} chứa tham số p; phân phối chuẩn có
hàm mật độ f(x) = 1
σ√
2πe
−(x−µ)2
2σ2 , x ∈ R chứa tham số µ và σ2. Trong chương trước, chúng ta đã xây dựng ước lượng khoảng một tham số từ dữ liệu mẫu. Tuy nhiên, nhiều vấn đề trong thực tiễn yêu cầu chúng ta cần phải ra quyết định chấp nhận hoặc từ chối một khẳng định về một tham số nào đó của một biến ngẫu nhiên hoặc các số đặc trưng của một tổng thể trên cơ sở mẫu số liệu của biến ngẫu nhiên đó mà ta quan sát được.
Giả thuyết thống kê là một khẳng định về giá trị tham số của biến ngẫu nhiên hoặc giá trị các số đặc trưng của một tổng thể, về phân phối xác suất của một biến ngẫu nhiên hoặc của một tổng thể.
Ví dụ:
(1) µ là tuổi thọ trung bình của người Việt Nam. Giả thuyết thống kê có thể là: µ= 60 (tuổi) hoặc µ > 60, hoặc µ6= 60,....
(2) p là tỉ lệ phế phẩm của nhà máy A. Giả thuyết thống kê có thể là:
p <0,1 hoặc p= 0,1 hoặc p6= 0,1,....
(3) X là chiều cao của nam thanh niên Việt Nam. Giả thuyết thống kê có thể là: X có phân phối chuẩn hoặc X khơng có phân phối chuẩn,...
được đưa ra để xem xét. Chẳng hạn, giả thuyết tỉ lệ phế phẩm của nhà máy:
p < 0,1 và p ≥ 0,1, giả thuyết tuổi thọ trung bình: µ = 60 và µ 6= 60. 1 trong
2 giả thuyết đó gọi là giả thuyết khơng được kí hiệu là H0 và giả thuyết cịn lại gọi là đối thuyết được kí hiệu là H1. Giả thuyết H0 được xem là giả thuyết đúng, thủ tục kiểm định giả thuyết là phương pháp sử dụng số liệu thu thập được để để bác bỏ H0. Giả thuyết không H0 bị bác bỏ và chấp nhận đối thuyết
H1 khi có đủ cơ sở để cho rằngH0 sai. Nếu mẫu số liệu thu thập được không đủ mạnh để chứng tỏ H0 sai thì ta sẽ tiếp tục chấp nhận H0 đúng. Việc công nhận
H0 đúng ở đây cần hiểu là các chứng cứ và số liệu thu thập được chưa có cơ sở để bác bỏ H0, cần phải nghiên cứu tiếp.
Ví dụ 3.1. Gieo 1 đồng xu 100 lần thấy có 60 lần xuất hiện mặt sấp. Ta nghi ngờ rằng xác suất xuất hiện mặt sấp lớn hơn xác suất xuất hiện mặt ngữa. Gọi
p là xác suất xuất hiện mặt sấp. Như vậy ta có bài tốn kiểm định giả thuyết là
H0: p= 0,5, H1 :p >0,5. Thủ tục kiểm định ở đây là dựa trên kết quả của 100 lần tung đồng xu để bác bỏ H0. Nếu không chứng minh được H0 sai thì ta phải chấp nhận H0 đúng.
3.1.2. Sai lầm loại I và sai lầm loại II
Khi tiến hành kiểm định giả thuyết thông kê theo cách trên ta sẽ có thể phạm phải một trong hai sai lầm sau:
- Bác bỏ H0 trong khi thực tế là H0 đúng. Sai lầm này gọi là sai lầm loại I. - Chấp nhận H0 trong khi thực tế là H0 sai. Sai lầm này gọi là sai lầm loại II.
H0 đúng H0 sai
Bác bỏ H0 sai lầm loại I quyết định đúng
Chấp nhận H0 quyết định đúng sai lầm loại II
Ví dụ 3.2. Cơ quan điều tra đang tạm giam một nghi phạm trong một vụ án. Nghi phạm sẽ chưa bị kết luận là có tội khi tội của anh ta chưa được chứng minh. Cơ quan điều tra cố gắng chứng minh tội của nghi phạm. Chỉ khi có đủ bằng chứng thì nghi phạm mới bị buộc tội.
Có hai giả thuyết được đưa ra là H0: "nghi phạm khơng có tội" vàH1: "nghi phạm có tội".
Giáo trình thống kê thực hành Sai lầm loại I ở đây là kết luận nghi phạm có tội trong khi nghi phạm vơ tội, cịn sai lầm loại II là bỏ thốt tội nghi phạm trong khi thực tế nghi phạm có tội. Bởi vì chúng ta khơng muốn đổ oan cho người vơ tội nên cần kiểm sốt sao cho sai lầm loại I này ít xảy ra nhất cho dù xác suất mắc sai lầm loại II có thể lớn.
α=P(sai lầm loại I) =P(bác bỏ H0/H0 đúng)được gọi là mức ý nghĩa của kiểm định. Trong bài toán kiểm định ta thường cho trước mức ý nghĩa αđể kiểm soát mắc sai lầm loại I.
3.1.3. P-giá trị
Ta xét ví dụ sau: Ở một quốc gia có chiều cao của nam thanh niên trưởng thành tuân theo quy luật phân phối chuẩn với chiều cao trunh bình là 1,60(m) và độ lệch chuẩn là 0,1 (m). Ở một địa phương nọ của quốc gia trên người ta chọn ngẫu nhiên 100 nam thanh niên trưởng thành, tiến hành đo chiều cao 100 nam thanh niên này người ta tính được trung bình mẫu x = 1,63 (m). Trên cơ sở mẫu số liệu này liệu có thể cho rằng chiều cao nam thanh niên trưởng thành ở địa phương trên lớn hơn 1,60 (m) không?
Gọi Gọi X là phân bố chiều cao của nam thanh niên trưởng thành ở địa
phương trên và E(X) = µ là chiều cao trung bình chưa biết, khi đó X ∼
N(µ; 0,12). Bài toán kiểm định giả thuyết được đưa ra là H0 : µ = 1,60 và
H1 :µ >1,60.
Gọi X1, X2, ..., X100 là mẫu ngẫu nhiên về chiều cao của 100 nam thanh niên được chọn ở địa phương trên, ta có
X = X1+X2+...+X100 100
có phân phối chuẩn N(µ;σ2) với σ2= 0,1 2
100 = 0,01 2.
Nếu H0 đúng (µ = 1,60) thì X ∼ N(160; 0,12) và X ∼ N(160; 0,012). Theo luật số lớn ta có x cũng phải khá gần với µ= 160. Do đó ta sẽ bác bỏ H0 nếu x lớn hơn so với 1,60 một cách có ý nghĩa, điều này tương đương với: nếu xác suất
P(X ≥x) quá nhỏ thì ta sẽ bác bỏ H0.
Với x= 1,63 ta có xác suấtP(X ≥1,65) với điều kiện µ= 1,60 là
P(X ≥1,65/µ = 1,60) = 1−Φ(1,63−1,6
0,01 ) = 1−Φ(3) = 0,00135
Xác suất này rất nhỏ nên ta có thể bác bỏ H0 và chấp nhận H1. Giá trị xác suất P(X ≥1,65/µ= 1,60) được gọi là P-giá trị.
Một vấn đề đặt ra ở đây là P-giá trị như thế nào được xem là nhỏ để có thể bác bỏ H0? Trong thống kê người ta quy ước như sau:
+) P-giá trị>0,05: khơng có đủ cơ sở để bác bỏ H0;
+) 0,01≤P-giá trị≤0,05: có đủ cơ sở để bác bỏ H0;
+) P-giá trị<0,01: có cơ sở vững chắc để bác bỏ H0. Trong trường hợp cho trước mức ý nghĩa α thì
bác bỏ H0 nếu P-giá trị≤α;
chấp nhận H0 nếu P-giá trị> α.
Nói cách khác, P-giá trị chính là mức ý nghĩa thấp nhất mà ta có thể bác bỏ
H0.