Kiểm định giả thuyết về tỷ lệ học sinh bị TNTT trên tổng số học sinh

Một phần của tài liệu phân tích thống kê dữ liệu trong điều tra xã hội học (Trang 61 - 76)

Chúng ta tiến hành kiểm định tỷ lệ số học sinh bị TNTT trên tổng số học sinh. Một số người giả thiết rằng, có khoảng 5% học sinh phổ thông bị TNTT, nhưng một số ý kiến khác lại cho rằng tỷ lệ đó cao hơn. Dựa trên quần thể mẫu thu được của học sinh hai trường phổ thông, chúng ta tiến hành kiểm định với mức ý nghĩa α = 0.05.

H0: p = 0.05 H1: p > 0.05

Ở bảng 3.6. chúng ta có tỷ lệ học sinh bị TNTT chiếm 6.5 %.

Trong đó p là tỷ lệ đúng của tỷ lệ học sinh bị TNTT trên tổng số học sinh. Với mức ý nghĩa α = 0.05, miền bác bỏ đối với kiểm định hai đầu này gồm tất cả giá trị z thỏa mãn điều kiện z > zα.

0 0 0 ˆ p p z p q n   với q0 = 1 - p0. Ta có p0= 0.05; q0 = 0.95. ˆ ˆ (0.065)(0.935) ˆ 2 0.065 2 0.065 1746 pq p n

    0.012 không chứa 0 và 1 nên

cỡ mẫu đủ lớn để đảm bảo tính hợp lý của phép kiểm định này. ˆ

plà tỷ lệ học sinh bị TNTT trên tổng số học sinh của cả hai trường phổ thông Quang Trung và Chu Văn An. pˆ =0.065.

0 0 0 ˆ 0.065 0.05 (0.05)(095) 1746 p p z p q n     = 2.88

z > zα = 1.645. Giá trị z nằm bên trong miền bác bỏ, vì vậy chúng ta kết luận rằng tỷ lệ của những học sinh bị TNTT cao hơn 5%. Xác suất để mắc sai lầm loại I, tức là sai lầm loại bỏ giả thiết “5% học sinh phổ thông bị TNTT” trong khi nó đúng là α = 0.05.

Bảng 3.9. Tỷ lệ học sinh bị TNTT

Observed N Expected N Residual

Có 114 87.3 26.7

Không/ không nhớ 1632 1658.7 -26.7

Tổng số 1746

Bảng 3.10. Kết quả phân tích kiểm định (Test Statistics)

Có bị TNTT

Chi-square 8.596a

df 1

Asymp. Sig. .003

a. 0 cells (.0%) have expected frequencies less than 5. The minimum expected cell frequency is 87.3.

Từ bảng 3.10. ta có giá trị thống kê là 0.03 < 0.05 và có ý nghĩa thống kê (p<0.05). Từ đó ta có thể bác bỏ giả thuyết ban đầu và đưa ra kết luận là tỷ lệ học sinh phổ thông bị TNTT là lớn hơn 5% trên tổng số học sinh.

3.4.3. Kiểm định giả thuyết về tỷ lệ học sinh bị TNTT trƣớc và sau can thiệp và theo giới

3.4.3.1. Kiểm định giả thuyết về sự khác nhau về tỷ lệ học sinh bị TNTT trước và sau can thiệp

Chúng ta kiểm định sự khác nhau giữa tỷ lệ học sinh bị TNTT của trường Quang Trung ( tức là nhóm can thiệp) trước và sau can thiệp. Điều đó đồng nghĩa với việc kiểm định một giả thuyết về sự khác nhau giữa hai tỷ lệ này ( p1 – p2) với độ tin cậy 95%.

p1: tỷ lệ học sinh bị TNTT trên tổng số học sinh của trường Quang Trung trước can thiệp.

p2: tỷ lệ học sinh bị TNTT trên tổng số học sinh của trường Quang Trung sau can thiệp.

Giả thiết rằng hai tỷ lệ này là tương đương nhau, nghĩa là p1 = p2. H0: ( p1 – p2) = 0

Hα: ( p1 – p2) < 0

Các tỷ lệ p1 và p2 được tính toán để thay vào công thức của thống kê kiểm định. Ta có:

1

ˆ

p = n1/n = 52/811=0.064

(Với n1: tổng số học sinh bị TNTT trường Quang Trung trước can thiệp; n: tổng số học sinh trường Quang Trung trước can thiệp)

2

ˆ

p = m1/m = 35/702 = 0.05

(Với m1: tổng số học sinh bị TNTT trường Quang Trung sau can thiệp; m: tổng số học sinh trường Quang Trung sau can thiệp)

Do đó: qˆ1 1 pˆ1 1 0.0640.936, qˆ2  1 pˆ2  1 0.050.95. Với ( p1 – p2) = 0, tức là D0 = 0, nên ta tính z như sau:

1 2 1 2 0 1 2 0 ˆ ˆ ( ) 1 2 ˆ ˆ ˆ ˆ ( ) ( ) 1 1 ˆ ˆ p p p p D p p D z p p n m                Trong đó: 1 1 35 52 ˆ 702 811 n m p n m       = 0.058.

Thay giá trị này vào công thức trên ta có: (0.064 0.05) 0 1 1 (0.058)(0.942) 702 811 z           = 1.162

Có độ tin cậy là 95%, α = 0.05. Giả thuyết không bị bác bỏ vì: z < z0.05 = 1.645

Vì vậy, với α= 0.05 chúng ta bác bỏ được giả thuyết không. Điều này có nghĩa là hai tỷ lệ của học sinh bị TNTT sau can thiệp thấp hơn so với trước can thiệp. Thông qua kết quả kiểm định này, chúng ta có thể đưa ra nhận định rằng quá trình can thiệp đã đạt được hiệu quả đáng kể.

3.4.4.2. Kiểm định giả thuyết về sự khác nhau về tỷ lệ học sinh bị TNTT theo giới

Có một số ý kiến cho rằng, ở các trường phổ thông các học sinh nam bị TNTT nhiều hơn học sinh nữ. Nhưng một số ý kiến khác lại cho rằng giới tính không ảnh hưởng gì đến việc học sinh bị TNTT. Sau đây chúng ta kiểm định sự khác nhau giữa tỷ lệ học sinh bị TNTT có giới tính là nam với tỷ lệ học sinh bị TNTT có giới tính là nữ. Điều đó đồng nghĩa với việc kiểm định một giả thuyết về sự khác nhau giữa hai tỷ lệ này ( p1 – p2) với độ tin cậy 95%.

p1: tỷ lệ học sinh bị TNTT trên tổng số học sinh nam. p2: tỷ lệ học sinh bị TNTT trên tổng số học sinh nữ.

Giả thiết rằng hai tỷ lệ này là tương đương nhau, nghĩa là p1 = p2.

H0: ( p1 – p2) = 0 Hα: ( p1 – p2) < 0

Tiến hành thử nghiệm trên bộ số liệu trước can thiệp, ta thu được bảng tỷ lệ như sau: Bảng 3.11: Tỷ lệ TNTT về giới Giới Tổng số Nam Nữ TNTT Có 62 7.8% 52 5.5% 114 6.5% Không 647 81.5% 789 82.9% 1436 82.2% Không nhớ 85 10.7% 111 11.7% 196 11.2% Total 794 100.0% 952 100.0% 1746 100.0%

Bảng 3.12. Kiểm định Chi bình phương (Chi-Square Tests)

Value df Asymp. Sig. (2-sided)

Pearson Chi-Square 4.104a 2 .128

Likelihood Ratio 4.085 2 .130

Linear-by-Linear Association 2.688 1 .101

N of Valid Cases 1746

a. 0 cells (.0%) have expected count less than 5. The minimum expected count is 51.84.

Ta có giá trị: 2 0.05

 với bậc tự do là 2 có giá trị bằng 5.992. Theo bảng trên, ta nhận thấy giá trị 2= 4.104 < 2

0.05

 . Từ đó có thể kết luận rằng sự khác nhau giữa hai tỷ lệ này không có ý nghĩa thống kê, hay nói cách khác là tỷ lệ học sinh bị TNTT giữa nam và nữ là không có sự khác biệt đáng kể.

Sau đây ta thử tiến hành kiểm định giả thuyết trên với bậc tự do là 1, bằng cách không xét đến các phần tử có giá trị là “không nhớ” ta thu được mối tương quan như sau:

Bảng 3.13: Tỷ lệ TNTT về giới Giới Tổng số Nam Nữ TNTT Có 56 8.6% 36 4.6% 92 6.5% Không 593 91.4% 741 95.4% 1334 93.5% Tổng số 649 100.0% 777 100.0% 1426 100.0%

Bảng 3.14. Kiểm định Chi bình phương (Chi-Square Tests)

Value df Asymp. Sig. (2-sided) Exact Sig. (2-sided) Exact Sig. (1-sided) Pearson Chi-Square 9.353a 1 .002 Continuity Correctionb 8.703 1 .003 Likelihood Ratio 9.331 1 .002

Fisher's Exact Test .002 .002

Linear-by-Linear Association 9.347 1 .002 N of Valid Cases 1426

a. 0 cells (.0%) have expected count less than 5. The minimum expected count is 41.87.

b. Computed only for a 2x2 table Ta có giá trị: 2

0.05

 với bậc tự do là 1 có giá trị bằng 3.845

Theo bảng trên, ta nhận thấy giá trị 2= 9.353, giá trị này lớn hơn 2 0.05

 nhiều. Từ đó có thể kết luận rằng sự khác nhau giữa hai tỷ lệ này có ý nghĩa thống kê. Đồng thời, ta có: 2

0.01

 với bậc tự do là 1 có giá trị bằng 6.635. 2 0.01

ta kết luận là sự khác nhau giữ hai tỷ lệ về TNTT theo giới có ý nghĩa thống kê với độ tin cậy là 98%.

Tiếp theo đây, chúng ta sẽ nhóm hai nhóm học sinh có câu trả lời là không và không nhớ về một nhóm. Thực hiện phân tích dữ liệu trên SPSS ta thu được bảng sau: Bảng 3.15: Tỷ lệ TNTT về giới Giới Tổng số Nam Nữ TNTT Có 62 7.8% 52 5.5% 114 6.5% Không/ Không nhớ 732 92.2% 900 94.5% 1632 93.5% Tổng số 794 100.0% 952 100.0% 1746 100.0%

Bảng 3.16. Kiểm định Chi bình phương(Chi-Square Tests)

Value df Asymp. Sig. (2-sided) Exact Sig. (2-sided) Exact Sig. (1-sided) Pearson Chi-Square 3.905a 1 .048 Continuity Correctionb 3.530 1 .060 Likelihood Ratio 3.886 1 .049

Fisher's Exact Test .052 .030

Linear-by-Linear Association 3.903 1 .048

N of Valid Cases 1746

a. 0 cells (.0%) have expected count less than 5. The minimum expected count is 51.84.

b. Computed only for a 2x2 table Ta có giá trị: 2

0.05

 với bậc tự do là 1 có giá trị bằng 3.845

Theo bảng trên, ta nhận thấy giá trị 2= 3.905, giá trị này lớn hơn 2 0.05

 . Từ đó có thể kết luận rằng sự khác nhau giữa hai tỷ lệ này có ý nghĩa thống kê với α = 0.05 (độ tin cậy là 95%).

Từ các kiểm định trên, ta có thể dễ dàng nhận thấy, việc thay đổi bậc tự do, có thể dẫn đến thay đổi về sự khác nhau giữa hai tỷ lệ.

Kết luận

Thống kê là một môn khoa học về phương pháp thu thập, làm sáng tỏ và rút ra các kết luận thông tin thông qua các con số. Điều tra xã hội học chính là nghiên cứu các hiện tượng xã hội, từ đó sẽ đưa ra các quyết định, xây dựng khuôn mẫu xã hội có hiệu quả, lập kế hoạch và các chính sách trong tương lai. Phân tích thống kê dữ liệu điều tra xã hội học chính là một quá trình quan trọng để hỗ trợ người nghiên cứu trong quá trình đưa ra quyết định và hoạch định chính sách. Có hai phương pháp thống kê đó là thống kê mô tả và thống kê suy luận. Quá trình tổng quát hóa là một bộ phận quan trọng của quá trình phân tích thống kê dữ liệu, và nó thường được trải qua các phép ngoại suy: ước lượng và kiểm định giả thuyết.

Trong bản luận văn này, đã đề cập được đến các vấn đề về điều tra xã hội học, các phương pháp thống kê dữ liệu và các kỹ thuật phân tích thống kê dữ liệu. Bản luận văn này cũng đã xây dựng những thử nghiệm về thống kê suy luận là ước lượng và kiểm định giả thuyết trên bộ số liệu đã có. Thông qua phương pháp ước lượng, bản luận văn này đã thực hiện thử nghiệm ước lượng về sự hiểu biết trung bình của học sinh phổ thông về phòng tránh TNTT do bỏng của học sinh phổ thông, ước lượng sự khác nhau về mức độ hiểu biết trung bình của học sinh trước và sau can thiệp, ước lượng tỷ lệ học sinh bị TNTT. Áp dụng phương pháp kiểm định giả thuyết, bản luận văn này đã kiểm định một số giả thuyết về sự khác nhau về mức độ hiểu biết trung bình của học sinh về phòng tránh TNTT do bỏng trước và sau can thiệp, về tỷ lệ học sinh bị TNTT trên tổng số học sinh, và kiểm định giả thuyết về sự khác nhau về tỷ lệ học sinh bị TNTT trước và sau can thiệp và theo giới tính. Đây cũng chính là cơ sở để đánh giá hiệu quả của cuộc nghiên cứu.

Tuy nhiên, do giới hạn của đề tài, và hạn chế về thời gian, bản luận văn này chỉ đề cập đến một phần số liệu rất nhỏ của cuộc nghiên cứu mà chưa đánh giá được trên toàn bộ tổng thể các chỉ tiêu của cuộc nghiên cứu.

Kiến nghị những nghiên cứu tiếp theo

Trong nhiều nghiên cứu, mục tiêu đặt ra là thiết lập được mối quan hệ, được thể hiện qua một phương trình, để dự đoán hoặc ước lượng các trị số cụ thể của một biến, cho trước trị số của biến kia. Các đồ thị phân tán này là rất hữu ích trong việc xem xét một đường thằng sẽ thích hợp ra sao trong việc tổng kết mối quan hệ.

Trong luận văn này, em chưa tìm hiểu và nghiên cứu sâu hơn được về tương quan và hồi quy trong phân tích thống kê dữ liệu. Tương quan và hồi quy là những kỹ thuật thống kê rất cần thiết trong phân tích và đánh giá dữ liệu và rất quan trọng đối với người ra quyết định trong việc xác định mối liên quan giữa các biến.

- Tương quan: là phương pháp dùng để nghiên cứu mối quan hệ giữa hai hay nhiều biến ngẫu nhiên.

- Hồi quy được dùng để xem xét mối liên hệ tuyến tính giữa hai biến là biến độc lâp và biến phụ thuộc (chịu ảnh hưởng của biến độc lập).

Mục tiêu tiếp theo cho các nghiên cứu sắp tới đây sẽ xét đến vấn đề tương quan và hồi quy trong phân tích thống kê suy luận.

Tài liệu tham khảo Tiếng Việt

1. Trịnh Xuân Đàn (2009), Mô tả thực trạng, kiến thức, hành vi phòng chống tai nạn thương tích của học sinh phổ thông trước và sau can thiệp. Xây dựng và đánh giá mô hình phòng chống TNTT tại trường phổ thông thành phố Thái Nguyên, Trường Đại học Y Dược TP Thái Nguyên, Thái Nguyên.

2. Bùi Thế Hồng (2010), Giáo trình Phân tích thống kê dữ liệu, NXB Khoa

học và kỹ thuật, Hà Nội.

3. Đỗ Hàm (2007), Phương pháp luận trong nghiên cứu khoa học y học, NXB Y học, Hà Nội.

4. Nguyễn Công Khanh (2006), Đại cương về thống kê và ứng dụng phần mềm

SPSS, NXB Đại học Quốc gia Hà Nội, Hà Nội.

5. Nguyễn Công Khanh (2001), Ứng dụng SPSS FOR WINDOWS: xử lý và phân tích dữ liệu, NXB ĐHQG Hà Nội, Hà Nội.

6. Nguyễn Xuân Nghĩa, Phương pháp nghiên cứu xã hội học, Trường Đại học Mở TP Hồ Chí Minh, Hồ Chí Minh.

7. Hà Văn Sơn (2004), Giáo trình lý thuyết thống kê, NXB Thống kê.

8. Đỗ Anh Tài (2008), Giáo trình phân tích số liệu thống kê, NXB Thống kê, Hà Nội.

Tiếng Anh

9. John K. Taylor and Cheryl Cihon (2004), Statistical Techniques for Data Analysis, Second Edition.

10.Bereson, M.L and D.M Levine, Basic Business Statistics: Conceps and Application, 4th ed. Englewwood Cliffs, NJ, Prentice Hall, 1989.

PHỤ LỤC

PHIẾU ĐIỀU TRA KIẾN THỨC - KỸ NĂNG NHẬN BIẾT NGUY CƠ TAI NẠN THƢƠNG TÍCH CỦA HỌC SINH THCS

Phiếu số…………. Chấn thương là những thương tổn do: tai nạn giao thông, ngã, tai nạn lao động, va chạm.... dẫn đến bị vết thương phần mềm gây chảy máu, bong gân, phù nề xây xát, gãy xương, gãy răng, vỡ thủng nội tạng, chấn thương sọ não, bỏng, ngạt hơi, ngạt nước, ngộ độc các loại.... Mà cần đến sự chăm sóc y tế hoặc bị hạn chế sinh hoạt phải nghỉ học tối thiểu trong 1 ngày.

Điều tra này nhằm tìm hiểu những chấn thương đã xảy ra với các em trong 1 năm qua (từ tháng 11/2007 đến tháng 10/2008), cũng như kiến thức, kỹ năng của các em trong nhận biết và phòng ngừa nguy cơ tai nạn thương tích ở học sinh. Đề nghị các em đọc kỹ nội dung để điền đầy đủ các thông tin ghi trong phiếu bằng cách khoanh tròn vào mã số câu trả lời tương ứng.

I. THÔNG TIN CÁ NHÂN

II. THÔNG TIN VỀ CHẤN THƢƠNG

Q1. Từ tháng 11 năm 2007 đến nay em có bị chấn thương gây hạn chế sinh hoạt bình thường mà phải nghỉ học hoặc phải đi bệnh viện tối thiểu 1 ngày không?

1. Có  Số lần chấn thương?...lần 2. Không  Chuyển đến câu Q12

3. Không nhớ Chuyển đến câu Q12

Cô giáo chủ nhiệm ký xác nhận: ………

Q2. Lần chấn thương gần đây nhất là do: (chỉ chọn 1 phƣơng án trả lời)

1. Không chủ định (tai nạn)

Một phần của tài liệu phân tích thống kê dữ liệu trong điều tra xã hội học (Trang 61 - 76)

Tải bản đầy đủ (PDF)

(76 trang)