Chương 3: Ứng dụng thử nghiệm trong điều tra xã hội học
3.4. Kiểm định giả thuyết
3.4.3. Kiểm định giả thuyết về tỷ lệ học sinh bị TNTT trước và sau can thiệp và
3.4.3.1. Kiểm định giả thuyết về sự khác nhau về tỷ lệ học sinh bị TNTT trước và sau can thiệp
Chúng ta kiểm định sự khác nhau giữa tỷ lệ học sinh bị TNTT của trường Quang Trung ( tức là nhóm can thiệp) trước và sau can thiệp. Điều đó đồng nghĩa với việc kiểm định một giả thuyết về sự khác nhau giữa hai tỷ lệ này ( p1 – p2) với độ tin cậy 95%.
p1: tỷ lệ học sinh bị TNTT trên tổng số học sinh của trường Quang Trung trước can thiệp.
p2: tỷ lệ học sinh bị TNTT trên tổng số học sinh của trường Quang Trung sau can thiệp.
Giả thiết rằng hai tỷ lệ này là tương đương nhau, nghĩa là p1 = p2. H0: ( p1 – p2) = 0
Hα: ( p1 – p2) < 0
Các tỷ lệ p1 và p2 được tính toán để thay vào công thức của thống kê kiểm định. Ta có:
ˆ1
p = n1/n = 52/811=0.064
(Với n1: tổng số học sinh bị TNTT trường Quang Trung trước can thiệp; n:
tổng số học sinh trường Quang Trung trước can thiệp) ˆ2
p = m1/m = 35/702 = 0.05
(Với m1: tổng số học sinh bị TNTT trường Quang Trung sau can thiệp; m:
tổng số học sinh trường Quang Trung sau can thiệp)
Do đó: qˆ1 1 pˆ1 1 0.0640.936, qˆ2 1 pˆ2 1 0.050.95. Với ( p1 – p2) = 0, tức là D0 = 0, nên ta tính z như sau:
1 2
1 2 0 1 2 0
ˆ ˆ
( )
1 2
ˆ ˆ ˆ ˆ
( ) ( )
1 1
ˆ ˆ
p p
p p D p p D
z
p p n m
Trong đó: ˆ 1 1 35 52 702 811 n m
p n m
= 0.058.
Thay giá trị này vào công thức trên ta có:
(0.064 0.05) 0
1 1
(0.058)(0.942)
702 811
z
= 1.162
Có độ tin cậy là 95%, α = 0.05. Giả thuyết không bị bác bỏ vì:
z < z0.05 = 1.645
Vì vậy, với α= 0.05 chúng ta bác bỏ được giả thuyết không. Điều này có nghĩa là hai tỷ lệ của học sinh bị TNTT sau can thiệp thấp hơn so với trước can thiệp. Thông qua kết quả kiểm định này, chúng ta có thể đưa ra nhận định rằng quá trình can thiệp đã đạt được hiệu quả đáng kể.
3.4.4.2. Kiểm định giả thuyết về sự khác nhau về tỷ lệ học sinh bị TNTT theo giới Có một số ý kiến cho rằng, ở các trường phổ thông các học sinh nam bị TNTT nhiều hơn học sinh nữ. Nhưng một số ý kiến khác lại cho rằng giới tính không ảnh hưởng gì đến việc học sinh bị TNTT. Sau đây chúng ta kiểm định sự khác nhau giữa tỷ lệ học sinh bị TNTT có giới tính là nam với tỷ lệ học sinh bị TNTT có giới tính là nữ. Điều đó đồng nghĩa với việc kiểm định một giả thuyết về sự khác nhau giữa hai tỷ lệ này ( p1 – p2) với độ tin cậy 95%.
p1: tỷ lệ học sinh bị TNTT trên tổng số học sinh nam.
p2: tỷ lệ học sinh bị TNTT trên tổng số học sinh nữ.
Giả thiết rằng hai tỷ lệ này là tương đương nhau, nghĩa là p1 = p2. H0: ( p1 – p2) = 0
Hα: ( p1 – p2) < 0
Tiến hành thử nghiệm trên bộ số liệu trước can thiệp, ta thu được bảng tỷ lệ như sau:
Bảng 3.11: Tỷ lệ TNTT về giới Giới
Tổng số
Nam Nữ
TNTT Có 62 7.8% 52 5.5% 114 6.5%
Không 647 81.5% 789 82.9% 1436 82.2%
Không nhớ 85 10.7% 111 11.7% 196 11.2%
Total 794 100.0% 952 100.0% 1746 100.0%
Bảng 3.12. Kiểm định Chi bình phương (Chi-Square Tests)
Value df Asymp. Sig. (2-sided)
Pearson Chi-Square 4.104a 2 .128
Likelihood Ratio 4.085 2 .130
Linear-by-Linear Association 2.688 1 .101
N of Valid Cases 1746
a. 0 cells (.0%) have expected count less than 5. The minimum expected count is 51.84.
Ta có giá trị: 0.052 với bậc tự do là 2 có giá trị bằng 5.992.
Theo bảng trên, ta nhận thấy giá trị 2= 4.104 < 0.052 . Từ đó có thể kết luận rằng sự khác nhau giữa hai tỷ lệ này không có ý nghĩa thống kê, hay nói cách khác là tỷ lệ học sinh bị TNTT giữa nam và nữ là không có sự khác biệt đáng kể.
Sau đây ta thử tiến hành kiểm định giả thuyết trên với bậc tự do là 1, bằng cách không xét đến các phần tử có giá trị là “không nhớ” ta thu được mối tương quan như sau:
Bảng 3.13: Tỷ lệ TNTT về giới Giới
Tổng số
Nam Nữ
TNTT
Có 56 8.6% 36 4.6% 92 6.5%
Không 593 91.4% 741 95.4% 1334 93.5%
Tổng số 649 100.0% 777 100.0% 1426 100.0%
Bảng 3.14. Kiểm định Chi bình phương (Chi-Square Tests) Value df Asymp. Sig.
(2-sided)
Exact Sig.
(2-sided)
Exact Sig.
(1-sided) Pearson Chi-Square 9.353a 1 .002
Continuity Correctionb 8.703 1 .003
Likelihood Ratio 9.331 1 .002
Fisher's Exact Test .002 .002
Linear-by-Linear Association 9.347 1 .002 N of Valid Cases 1426
a. 0 cells (.0%) have expected count less than 5. The minimum expected count is 41.87.
b. Computed only for a 2x2 table
Ta có giá trị: 0.052 với bậc tự do là 1 có giá trị bằng 3.845
Theo bảng trên, ta nhận thấy giá trị 2= 9.353, giá trị này lớn hơn 0.052 nhiều. Từ đó có thể kết luận rằng sự khác nhau giữa hai tỷ lệ này có ý nghĩa thống kê. Đồng thời, ta có: 0.012 với bậc tự do là 1 có giá trị bằng 6.635. 0.012 <2. Vậy
ta kết luận là sự khác nhau giữ hai tỷ lệ về TNTT theo giới có ý nghĩa thống kê với độ tin cậy là 98%.
Tiếp theo đây, chúng ta sẽ nhóm hai nhóm học sinh có câu trả lời là không và không nhớ về một nhóm. Thực hiện phân tích dữ liệu trên SPSS ta thu được bảng sau:
Bảng 3.15: Tỷ lệ TNTT về giới Giới
Tổng số
Nam Nữ
TNTT Có 62 7.8% 52 5.5% 114 6.5%
Không/ Không nhớ 732 92.2% 900 94.5% 1632 93.5%
Tổng số 794 100.0% 952 100.0% 1746 100.0%
Bảng 3.16. Kiểm định Chi bình phương(Chi-Square Tests)
Value df
Asymp. Sig.
(2-sided)
Exact Sig.
(2-sided)
Exact Sig.
(1-sided)
Pearson Chi-Square 3.905a 1 .048
Continuity Correctionb 3.530 1 .060
Likelihood Ratio 3.886 1 .049
Fisher's Exact Test .052 .030
Linear-by-Linear Association 3.903 1 .048
N of Valid Cases 1746
a. 0 cells (.0%) have expected count less than 5. The minimum expected count is 51.84.
b. Computed only for a 2x2 table
Ta có giá trị: 0.052 với bậc tự do là 1 có giá trị bằng 3.845
Theo bảng trên, ta nhận thấy giá trị 2= 3.905, giá trị này lớn hơn 0.052 . Từ đó có thể kết luận rằng sự khác nhau giữa hai tỷ lệ này có ý nghĩa thống kê với α = 0.05 (độ tin cậy là 95%).
Từ các kiểm định trên, ta có thể dễ dàng nhận thấy, việc thay đổi bậc tự do, có thể dẫn đến thay đổi về sự khác nhau giữa hai tỷ lệ.