Bảng kết quả I.10 có hai cột, một cột cho mẫu quan sát 1, cột kia cho mẫu 2 (tính tới hàng thứ ba). Bảng này gồm có:
- Trung bình của mẫu a1và a2. - Phương sai ñã cho (σ2
1, σ22). 2). - Số quan sát n1và n2.
- Giá trị z thực nghiệm: z=(a1-a2)/Sqrt(σ12
/n1 + σ22
/n2 ) - Giá trị P một phía và giá trị P hai phía.
- Giá trị z lý thuyết (tới hạn) một phía và hai phía.
Chú ý rằng, có thể dùng một số hàm trong Excel ñể tính một số kết quả: - Giá trị P một phía tính bằng hàm 1-Normsdist(z).
- Giá trị P hai phía tính bằng hàm (1-Normsdist(z))×2.
- Giá trị tới hạn của hàm phân phối chuẩn tắc z một phía tính bằng hàm Normsinv(0.95).
- Giá trị z tới hạn hai phía tính bằng hàm Normsinv(0.975).
Trong ví dụ 8 ta thấy: giá trị z thực nghiệm 0.14335 nhỏ hơn z lý thuyết (tới hạn) một phía 1.64485 cũng như z lý thuyết hai phía 1.95996 (giá trị P một phía và hai phía ñều lớn hơn mức ý nghĩa α = 0.05). Kết luận: kỳ vọng của hai biến không khác nhau.
5.2. So sánh hai mẫu kiểu cặp ñôi
Ta xét thí dụ: lấy một ổ chim và cân trọng lượng chim cái, trọng lượng chim ñực ta
ñược hai mẫu quan sát của hai tổng thể chim cái và chim ñực. Nếu lấy một số chim ñực ngẫu nhiên trong nhiều chim ñực và lấy một số chim cái ngẫu nhiên trong nhiều chim cái thì có hai mẫu quan sát ñộc lập.
Trường hợp khác, nếu ta ñem 10 mẫu ñất, mỗi mẫu chia ñôi, một nửa giao cho phòng phân tích A thực hiện, nửa kia giao cho phòng phân tích B thì thu ñược số liệu cặp
ñôi ñể so sánh kết quả của hai phòng phân tích, hoặc nếu ta ñem hai giống lúa cấy trên một số ruộng, mỗi ruộng chia ñôi, một nửa cấy giống A, một nửa cấy giống B thì có hai mẫu cặp ñôi ñể so sánh, hay nếu ño một chỉ số sinh lý hoặc sinh hoá của một bệnh nhân khi mới nhập viện và ño lại chỉ sốñó sau một thời gian ñiều trị thì có hai mẫu quan sát cặp ñôi
ñểñánh giá hiệu quảñiều trị.
Chú ý rằng, khi rút hai mẫu cặp ñôi ta có hai mẫu cùng số quan sát n, các số liệu sắp xếp thành cặp ñứng ở hai cột cạnh nhau.
a. Các bước thực hiện
Chọn Tools >Data Analysis > t-Test: Paired Two Sample for Means, sau ñó lần lượt trả lời:
- Input Variable 1 Range: miền vào của biến 1 tức là miền chứa số liệu của biến 1, kể cả tên hàng ñầu của mẫu quan sát.
- Input Variable 2 Range: Miền vào của mẫu quan sát thứ hai kể cả tên hàng ñầu của mẫu quan sát.
- Labels: Nếu cần thêm hàng ñầu về tên biến thì chọn mục này.
- Hypothesized means difference: Giả thiết về hiệu hai trung bình của hai tổng thể. Nếu lấy giả thuyết H0: m1=m2 thì ghi 0. Nếu lấy giả thuyết H0: m1=m2+d (d là một số nào ñó) thì ghi d.
- Output Range: Chọn miền trống ñểñặt ra kết quả.
Ví dụ 9: Có 8 cặp số liệu của hai mẫu x và y cho trong bảng sau:
x 39.6 32.4 33.1 27 36 32 25.9 32.4 y 39.2 33.1 32.4 25.2 33.1 29.5 24.1 29.2
Thực hiện phân tích trong Excel ta ñược bảng kết quả (bảng I.11.)
Bảng I.11. Kết quả so sánh hai mẫu cặp ñôi
x y Giải thích
Mean 32.3 30.725 Trung bình mẫu Variance 19.54 23.451 Phương sai mẫu Observations 8 8 Số quan sát
Pearson Correlation 0.96187 Hệ số tương quan R Hypothesized Mean
Difference
0 Giả thuyết về hiệu số
trung bình df 7 Bậc tự do
t Stat 3.31055 Giá trị t thực nghiệm P(T<=t) one-tail 0.00647 Giá trị P một phía
t Critical one-tail 1.89458 Giá trị t lý thuyết khi kiểm ñịnh một phía P(T<=t) two-tail 0.01293 Giá trị P hai phía
t Critical two-tail 2.36462 Giá trị t lý thuyết khi kiểm ñịnh hai phía
b. Phân tích kết quả
Bảng kết quả có hai cột cho hai mẫu quan sát. Bảng này có các hàng: - Trung bình mẫu a1, a2.
- Phương sai mẫu s12, s22.
- Số quan sát n1 và n2 (bằng nhau và bằng số cặp số liệu n). - Hệ số tương quan r của 2 mẫu (coi như 2 biến).
- Bậc tự do df ñể kiểm ñịnh giả thuyết H0, df bằng số cặp (n-1). - Giá trị t thực nghiệm: 3.31055.
- Giá trị P một phía: 0.00647. - Giá trị t một phía: 1.894577508. - Giá trị P hai phía: 0.01293. - Giá trị t hai phía: 2.36462256.
Do t thực nghiệm lớn hơn t lý thuyết một phía cũng như hai phía (giá trị P một phía và hai phía ñều nhỏ hơn mức ý nghĩa α = 0.05), nên trong ví dụ trên ta chấp nhận giả
thuyết H1 .
5.3. So sánh hai mẫu ñộc lập với giả thiết hai phương sai bằng nhau
Trường hợp mẫu lớn: Khi việc rút hai mẫu quan sát từ hai tổng thể ñược tiến hành một cách ñộc lập thì chúng ta có hai mẫu ñộc lập. Nếu dung lượng của cả hai mẫu ñều lớn (thường quy ước là n1≥ 30, n2 ≥ 30) ta có thể tiến hành z-test nhưng thay hai phương sai của tổng thểσ12
và σ22
bằng phương sai mẫu s12 và s22. Trường hợp mẫu bé (n1,n2 nhỏ hơn 30) thì ta gặp bài toán khó, gọi tên là bài toán Berens – Fisher. Trong trường hợp này, nếu
coi hai phương sai của hai tổng thể bằng nhau (cần kiểm ñịnh giả thuyết phụ về sự bằng nhau của hai phương sai) thì có thể tiếp tục tính toán như sau: