hợp mẫu độc lập
Điều kiện của kiểm định giả thiết về trị trung bình của hai mẫu độc lập là hai mẫu phải được lấy ngẫu nhiên từ hai tổng thể có phân phối chuẩn.
Để thực hiện kiểm định giả thiết về sự bằng nhau của hai trung bình tổng thể trong trường hợp này trên SPSS, ta chọn Analyze > Compare Means > Independent- Sample T-Test.
Ví dụ 3.2: Ta xét lại ví dụ 1.6 về ý kiến cho rằng “Giá trị trung bình của các tờ séc ở hai thành phố Alphaville và Betaville là như nhau” với số liệu như sau:
Bảng 1.2: Bảng số liệu về số tờ séc ở hai thành phố Alphaville và Betaville
Thành phố Số tiền Thành phố Số tiền Thành phố Số tiền Thành phố Số tiền Thành phố Số tiền
Alphaville 5777.09 Alphaville 3389.32 Betaville 5277.02 Betaville 867.84 Betaville 8474.79 Alphaville 7084.28 Alphaville 3790.81 Betaville 8466.76 Betaville 7681.87 Betaville 3085.16 Alphaville 8835.02 Alphaville 1947.26 Betaville 6139.15 Betaville 3497.02 Betaville 5367.51 Alphaville 7991.03 Alphaville 8717.98 Betaville 6148.06 Betaville 2787.2 Betaville 4436.18 Alphaville 5973.38 Alphaville 6709.22 Betaville 5091.6 Betaville 2564.88 Betaville 3199.03 Alphaville 4610.17 Alphaville 6363.45 Betaville 6413.81 Betaville 5755.03 Betaville 2259.1 Alphaville 3412.3 Alphaville 6877.04 Betaville 4347.14 Betaville 6072.04 Betaville 4260.72 Alphaville 3432.09 Alphaville 5324.94 Betaville 4382.56 Betaville 6333.22 Betaville 2666.77 Alphaville 5742.21 Alphaville 8725.03 Betaville 1662.87 Betaville 2845.85 Betaville 2956.85 Alphaville 3738.43 Alphaville 8260.05 Betaville 3934.55 Betaville 2989.74 Betaville 5390.57 Alphaville 6962.54 Alphaville 9236.12 Betaville 3193.24 Betaville 5508.15 Betaville 2250.45 Alphaville 3786.4 Alphaville 8120.87 Betaville 7325.73 Betaville 10610.63 Betaville 9031.56 Alphaville 9224.84 Alphaville 5599.97 Betaville 9197.8 Betaville 7147.34 Betaville 6223.58 Alphaville 6204.26 Alphaville 8455.03 Betaville 6453.58 Betaville 5681.7 Betaville 7368.8
48
Alphaville 4234.49 Alphaville 4556.03 Betaville 6436.26 Betaville 5146.53 Betaville 5549.03 Alphaville 4679.02 Alphaville 5217.34 Betaville 7610.27 Betaville 7317.2 Betaville 4677.99 Alphaville 5450.01 Alphaville 6594.01 Betaville 1766.05 Betaville 1170.19 Betaville 7243.39 Alphaville 3523.68 Alphaville 4882.65 Betaville 5328.59 Betaville 7719.83 Betaville 2526.81 Alphaville 7965.06 Alphaville 6674.81 Betaville 4510.68 Betaville 613.97 Betaville 4864.92 Alphaville 3831.61 Alphaville 7293.22 Betaville 8057.88 Betaville 3721.19 Betaville 7688.37 Alphaville 6941.38 Alphaville 5028.87 Betaville 5962.47 Betaville 5549.84 Betaville 6036.61 Alphaville 5098.01 Alphaville 4270.85 Betaville 4256.96 Betaville 1504.88 Betaville 6328.62 Alphaville 5500.95 Alphaville 5099.8 Betaville 5796.46 Betaville 4562.56 Betaville 5332.64 Alphaville 7442.07 Betaville 3863.02 Betaville 4762.7 Betaville 3737.22 Betaville 1466.56 Alphaville 6322.64 Betaville 10649.82 Betaville 5222.84 Betaville 3795.45 Betaville 6678.37 Alphaville 6419.44 Betaville 6699.12 Betaville 2470.49 Betaville 4473.34 Betaville 1987.66 Alphaville 5959.78 Betaville 3958.07 Betaville 2009.22 Betaville 2536 Betaville 5495.28 Alphaville 2272.12 Alphaville 10744.41 Betaville 6355.62 Betaville 1319.92 Betaville 8177.78 Alphaville 3516.99 Betaville 4708.66 Betaville 2085.26 Betaville 4740.31 Betaville 5838.95 Alphaville 8370.71 Betaville 3086.25 Betaville 2066.4 Betaville 9626.76 Betaville 6714.95 Alphaville 2836.04 Betaville 975.23 Betaville 5706.3 Betaville 1446.65 Betaville 4021.06 Alphaville 6757.57 Betaville 6687.69 Betaville 4898.64 Betaville 4607.03 Betaville 5174.74
v Ta tiến hành kiểm định trên SPSS:
1. Đặt giả thiết:
H0: Giá trị trung bình của các tờ séc ở Alphaville và Betaville bằng nhau.
2. Sau khi mã hóa và nhập số liệu xong, ta chọn Analyze > Descriptive Statistics > Frequencies để kiểm tra tính phân phối chuẩn của dữ liệu. Ta có các kết quả sau:
Statistics so tien ($) N Valid 160 Missing 0 Mean 5265.2856 Median 5326.7650 Std. Deviation 2199.8575 6 Skewness .109 Std. Error of Skewness .192
Trong phân phối này, trị trung bình (5265.2856) và trung vị (5326.7650) gần bằng nhau, và độ xiên (Skewness = 0.109) gần với 0 nên ta kết luận phân phối này là phân phối chuẩn.
Thật vậy, nhìn vào biểu đồ Histogram ta thấy dữ liệu phân phối với đường cong chuẩn có hình chuông, có trị trung bình là 5265.2856 và phân bốđều về hai bên.
49 12000.00 10000.00 8000.00 6000.00 4000.00 2000.00 0.00 so tien ($) 20 15 10 5 0 Fr eq ue nc y Mean = 5265.2856 Std. Dev. = 2199.85756 N = 160 Histogram
Hình 3.1: Biểu đồ thể hiện số tiền trên các tờ séc ở Alphaville và Betaville
Vậy điều kiện của phép kiểm định đã không bị vi phạm, ta tiến hành thực hiện so sánh hai trị trung bình.
3. Chọn Analyze > Compare Means > I ndependent-Samples T-test. Trong hộp thoại này, ta lần lượt đưa biến So tien($)vào khung ô Test Variable(s) và sau đó đưa biến cần chia nhóm để so sánh với nhau (thanhpho) vào khung Grouping Variable. Chọn tiếp nút Define Group và gõ mã số của hai nhóm thành phố Alphaville (1) và Betaville (2).
4. Nhấn nút Options để chọn khoảng tin cậy cho bài toán là 95%. Rồi nhấn OK ta có được các kết quả sau:
Group Statistics
Ten thanh pho nop sec N Mean Std. Deviation
Std. Error Mean So tien
($) Alphaville 60 5949.0787 2040.95887 263.48666
Betaville 100 4855.0097 2199.19193 219.91919
Independent Samples Test
So tien ($) Equal variances assumed Equal variances not assumed Levene's Test for
Equality of Variances F .328
Sig. .568
t-test for Equality of
Means t 3.129 3.188
df 158 131.736
50
Mean Difference 1094.06897 1094.06897
Std. Error Difference 349.70110 343.20500
99% Confidence Interval
of the Difference Lower 182.29200 197.04606
Upper 2005.84593 1991.09187
Nhận xét:
§ Dựa vào kết quả của kiểm định phương sai Leneve’s Test ở bảng thứ hai, ta thấy giá trị Sig. = 0.568 > 0.05 thì phương sai của giá trị các tờ séc của hai thành phố sẽ không khác nhau. Nên ta sẽ sử dụng kết quả kiểm định t ở cột Equal variances assumed.
§ Với giá trị Sig. = 0.02 < 0.05 ở kết quả kiểm định trên ta tiến hành bác bỏ giả thiết H0. Vậy sự khác biệt về giá trị trung bình của các tờ séc ở hai thành phố là có ý nghĩa. Cụ thể là giá trị trung bình trên các tờ séc ở Aphaville lớn hơn ở Betaville, trung bình khác nhau là khoảng 1094.06897, một sự khác biệt khá lớn.
ðKết luận: Kết quả kiểm định trên SPSS và kết quả kiểm định ở ví dụ1.6 đều bác bỏ giả thiết H0. Như vậy, cả hai cách thực hiện đều có kết quả trùng khớp với nhau.
3.1.2.2 Kiểm định giả thiết về sự bằng nhau của hai trung bình tổng thể - trường hợp mẫu phụ thuộc hay phối hợp từng cặp hợp mẫu phụ thuộc hay phối hợp từng cặp
Điều kiện để áp dụng kiểm định giả thiết về sự bằng nhau của hai trung bình tổng thểtrong trường hợp mẫu phối hợp từng cặp là:
- Kích cỡ hai mẫu so sánh phải bằng nhau.
- Chênh lệch giữa các giá trị hai mẫu phải có phân phối chuẩn hoặc cỡ mẫu đủ lớn để xấp xĩ phân phối chuẩn.
Để thực hiện kiểm định này ta vào lệnh Analyze > Compare Means > Paired- Sample T-Test.
Ví dụ 3.3: Hãy thực hiện lại ví dụ 1.7 về thành tích chạy 100m (giây) của 46 sinh viên chuyên ngành sư phạm TDTT Trường Đại Học Cần Thơ khi thi vào trường và thành tích sau một năm tập luyện được cho trong bảng 1.3 nhưng với mức ý nghĩa là 2.5%.
Bảng 1.3: Thành tích chạy 100m của mẫu gồm 46 sinh viên
STT Thi ĐH Sau 1 năm STT Thi ĐH Sau 1 năm
1 12.2 11.8 24 13.8 13.2 2 12.0 11.7 25 13.1 12.4 3 13.3 12.2 26 13.0 12.6 4 12.0 11.2 27 13.2 12.6 5 12.5 12.0 28 12.5 12.2 6 13.1 12.2 29 12.6 11.8 7 12.3 12.5 30 12.7 12.5
51 8 12.8 12.2 31 13.6 12.4 9 12.6 12.5 32 12.8 12.0 10 12.7 12.2 33 12.0 11.4 11 14.2 13.0 34 13.2 12.8 12 12.5 12.0 35 13.8 13.5 13 13.3 12.7 36 13.5 12.9 14 14.4 13.1 37 13.4 12.9 15 13.4 12.8 38 13.6 13.0 16 12.6 12.5 39 13.7 13.0 17 12.6 12.4 40 13.0 12.5 18 14.8 13.5 41 14.0 13.2 19 14.0 12.8 42 12.6 12.5 20 12.0 11.2 43 12.3 11.2 21 13.5 13.2 44 14.0 13.2 22 13.2 12.7 45 14.7 13.1 23 13.2 12.8 46 13.6 13.0 v Tiến hành kiểm định
Ta thực hiện như ở trường hợp so sánh hai trung bình tổng thể trường hợp mẫu độc lập:
1. Đặt giả thiết:
H0: Không có sự khác biệt về hai thành tích trung bình của sinh viên khi thi đại học và sau một năm tập luyện.
2. Ta mã hóa dữ liệu với hai biến thành tích thidh và sau1nam và thêm một biến D nữa thể hiện sự chênh lệch giữa hai thành tích. Trước tiên, ta kiểm định tính phân phối chuẩn của chênh lệch D: Analyze > Descriptive Statistics > Frequencies ta có kết quả: Statistics chenh lech N Valid 46 Missing 0 Mean .626 Median .600 Std. Deviation .3702 Skewness .465 Std. Error of Skewness .350
Qua bảng kết quả trên, giá trị trung bình (0.626) và trung vị (0.600) của biến chênh lệch khá gần nhau và độxiên (Skewness = 0.465) dao động trong khoảng -1 đến 1 nên ta có thể kết luận sự chênh lệch của hai biến thành tích là có phân phối chuẩn.
Thật vậy, khi nhìn vào biểu đồbên dưới ta cũng thấy có đường cong chuẩn dạng hình chuông, giá trị trung bình là 0.626 và phân bốđều về hai bên.
52 1.6 1.4 1.2 1.0 0.8 0.6 0.4 0.2 0.0 -0.2 chenh lech 12 10 8 6 4 2 0 Fr eq ue nc y Mean = 0.626 Std. Dev. = 0.3702 N = 46 Histogram Hình 3.2: Biểu đồ tần số thể hiện các chênh lệch
3. Chọn lệnh Analyze > Compare Means mở ra hộp thoại Paired-Sample. Trong hộp thoại này, chọn hai biến cần so sánh (thidh và sau1nam) đưa vào khung Paired Variables.
4. Chọn nút Options để chỉnh lại độ tin cậy cho ước lượng khoảng chênh lệch giữa hai trung bình (mặc định 0.95) là 0.975 trong ô Confidence Interval và sau đó nhấn Continue.
5. Chọn OK, ta có các bảng kết quả sau:
Paired Samples Statistics
Mean N Std. Deviation Std. Error Mean
Pair 1 khi thi dh 13.128 46 .7185 .1059
sau 1 nam tap luyen 12.502 46 .5886 .0868
Paired Samples Correlations
N Correlation Sig.
53
Paired Samples Test
Pair 1 khi thi dh - sau 1
nam tap luyen
Paired Differences Mean .6261
Std. Deviation .3702
Std. Error Mean .0546
97.5% Confidence Interval of the Difference
Lower .4995 Upper .7527 t 11.469 df 45 Sig. (2-tailed) .000 Nhận xét và kết luận:
§ Bảng đầu tiên cho ta các giá trị thống kê của hai mẫu.
§ Bảng thứ hai thể hiện mối tương quan tuyến tính rất cao giữa hai biến thidh và
sau1nam với giá trị Sig. = 0.
§ Bảng cuối, vì giá trị Sig. = 0 < 0.025 nên ta có thể kết luận rằng có sự chênh lệch
có ý nghĩa thống kê về thành tích chạy 100m của sinh viên khi thi vào trường và sau một năm tập luyện. Cụ thể ta thấy thành tích chạy 100m của sinh viên sau một năm tập luyện đã cải thiện rõ rệt hơn khi thi vào trường, trung bình là nhanh hơn khoảng 0.6261 giây.
FQua hai ví dụ 1.7 và ví dụ 3.3 với việc chọn hai mức ý nghĩa khác nhau, ta thấy kết quảđều đi đến kết luận bác bỏ giả thiết H0 là “Không có sự khác biệt về thành tích chạy 100m của sinh viên khi thi vào trường và sau một năm tập luyện”. Sự khác biệt này là bản chất. Như vậy, thành tích chạy 100m của 46 nam sinh viên sau 1 năm tập luyện thực sự cải thiện rất nhiều và có thể nói chất lượng giảng dạy của trường Đại học Cần Thơ thực sựđược đảm bảo.
3.2 Kiểm định tỷ lệ