Các kiểm định Z-test và t-test chỉ dùng để kiểm định một trung bình một mẫu với một trị số tham khảo hoặc kiểm định 2 giá trị trung bình của 2 nhóm. Nếu có nhiều hơn 2 nhóm cần so sánh, ta dùng phân tích phương sai (Kiểm định ANOVA: analysis of variance)
A. Ký hiệu sử dụng cho phân tích phương sai
Giả sử ta có k nhóm, mỗi nhóm có N1, N2, …, Nk đối tượng, số liệu được ký hiệu như sau:
Quan sát X1 X2 X3 … Xk 1 x11 x12 x13 x1k 2 x21 x22 x23 x2k 3 x31 x32 x33 x3k • • • ni Trung bình SSE
xij với i = 1,2,…, n và j = 1,2,…, k ( i là đối tượng và j là nhóm)
Trung bình (8.1)
Tổng bình phương các độ lệch (Sum of squares : SS) (8.2)
Ghi chú: Ký hiệu viết tắt:
: Sum of squares Total : : Between-group SS : : Within-group SS :
Thực hành tại lớp
Điểm thi môn toán của 3 tổ như sau. Tính và điền các thông tin cân thiết
Nhóm Tổ 1 Tổ 2 Tổ 3 6 8 5 7 8 7 5 9 6 Đối tượng 9 10 4 Số đối tượng 5 4 3 Trung bình Ghi chú: = +
B. Phân tích phương sai
Trong trường hợp muốn so sánh trung bình của nhiều mẫu với nhau, ta có thể dùng kiểm định t-
test để kiểm định từng cặp với nhau. Ví dụ: Nếu muốn so sánh trung bình của 3 mẫu, ta có 3 cặp
cần so sánh: µ1 - µ2 ; µ1 - µ3 ; và µ2 - µ3 . Dùng kiểm định t trong trường hợp này sẽ nảy sinh các vấn đề sau:
(1) Khó diễn giải kết quả
(2) Tăng sai lầm loại I. Nếu có n cặp cần so sánh, sai lầm loại I = 1-(1-α)n
. Ví dụ nếu có 6 nhóm cần so sánh, ta cần so sánh 15 cặp với nhau, sai lầm loại I = 1-(1-0,05)15= 0,54 Phân tích phương sai (ANOVA) cho phép ta có thể diễn giải kết quả so sánh nhiều nhóm với nhau mà không làm tăng sai lầm loại I
Điều kiện để áp dụng kiểm định ANOVA cho trung bình nhiều mẫu: Tương tự như t-test (1) Mẫu phải được chọn ngẫu nhiên, số liệu là biến số liên tục
(2) Số liệu phải có phân phối bình thường. Theo định lý giới hạn trung tâm, cỡ mẫu tương đối lớn (trên 30 hoặc trên 15) là đủ để có phân phối xấp xỉ bình thường.
(3) Các mẫu phải độc lập với nhau: biến cố xảy ra ở một mẫu không ảnh hưởng đến biến cố ở các mẫu khác
(4) Phương sai hai mẫu bằng nhau, trên thực tế, nếu phương sai mẫu lớn nhất và mẫu nhỏ nhất không chênh lệch quá 2 lần thì có thể coi như phương sai các mẫu đó xấp xỉ nhau
Các bước tiến hành: Tương tự như kiểm định Z và t
(1) Xây dựng giả thiết không (H0)
(2) Tính giá trị thống kê F của phép kiểm định và giá trị giới hạn (tra phụ lục C) (3) Chấp nhận hay bác bỏ H0
Xây dựng giả thiết không (H0)
H0 : Các mẫu được rút ra ngẫu nhiên từ các dân số có trung bình không khác nhau
H1 : Ít nhất một mẫu được rút ra ngẫu nhiên từ một dân số có trung bình khác với nhóm còn lại (hoặc không phải tất cả trung bình đều bằng nhau)
Hoặc
H0 : µ1 = µ2 =… = µk
H1 : không phải tất cả trung bình đều bằng nhau
Tính giá trị thống kê F của phép kiểm định và giá trị F giới hạn: Các bước như sau
(1) Tính , và
(2) Tính trung bình tổng bình phương (Mean Squares: MS). Trung bình tổng bình phương là tổng bình phương (SS) chia cho độ tự do (degree of freedom: DF)
Như vậy
Với độ tự do như sau
DFT = n – 1 (n là tổng toàn bộ đối tượng) DFB = k – 1 (k là số nhóm)
DFW = n – k
Ghi chú: Tương tự như tổng bình phương, DFT = DFB + DFW. Tuy nhiên trung bình tổng bình phương không có tính chất cộng tính.
(3) Tính giá trị F thống kê
F có một phân phối F với hai độ tự do DF1 = DFB và DF2 = DFW . Hình dạng của phân phối F như sau
(4) Lập bảng phân tích phương sai (ANOVA) Nguồn SS DF MS F Giữa các nhóm (between-group) SSB k – 1 Bên trong nhóm (Within-group) SSW n – k Tổng SST n – 1
(5) Tra bảng tìm giá trị F giới hạn: Tra phụ lục C với hai độ tự do. Chấp nhận hay bác bỏ H0
Thực hành tại lớp: Số liệu điểm thi môn toán của 3 tổ
(1) Xây dựng giả thiết không (H0)
H0 : Các mẫu được rút ra ngẫu nhiên từ các dân số có trung bình không khác nhau µ1 = µ2 = µ3
H1 : Không phải tất cả trung bình đều bằng nhau
(2) Tính SS, MS, F thống kê và lập bảng phân tích phương sai
Với số liệu của điểm thi môn toán trên, ta có bảng phân tích phương sai như sau
Nguồn SS DF MS F
Giữa các nhóm (between-group)
Bên trong nhóm (Within-group) Tổng
(3) Tra bảng giá trị tại α = 0,05 , thì F(2, ) giới hạn = ………….. (4) Chấp nhận hay bác bỏ H0
Vì F thống kê = F( ) = nên ta………. giả thiết không rằng trung bình điểm của ba tổ bằng nhau. Kết luận: Trung bình điểm của ba tổ ………… khác nhau có ý nghĩa thống kê tại ngưỡng α = 0,05, F= , p 0,05
Thực hành tại lớp 2: Phản ứng co thắt phế quản với các khí như bảng sau
n Trung bình Độ lệch chuẩn SSW
Sulfur dioxide 5 18,840 9,692
Nitrous dioxide 6 6,617 3,945
Oxygen 4 4,975 3,409
Tổng 15 10,253 8,651
Với số liệu trên, ta có bảng phân tích phương sai như sau
Nguồn SS DF MS F
Giữa các nhóm 559,450 2 279,275 6,873
Bên trong nhóm 488,408 12 40,701
(1) Tính trung bình, phương sai cho mỗi chương trình. (2) Xây dựng giả thiết không
(3) Tính trung bình chung và trung bình từng nhóm (4) Tính SST, SSB và SSW
(5) Tính MST, MSB và MSW
(6) Lập bảng phân tích phương sai
Bài 9