Phân tích thống kê dữ liệu trong điều tra xã hội học

70 502 0
Phân tích thống kê dữ liệu trong điều tra xã hội học

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

http://www.ictu.edu.vn i MỤC LỤC Trang phụ bìa MỤC LỤC i Danh mục bảng iv Lời mở đầu Chương 1: Tổng quan thống kê liệu điều tra xã hội học 1.1 Khái quát liệu thống kê .3 1.1.1 Dữ liệu gì? .3 1.1.2 Thống kê gì? 1.1.3 Một số khái niệm thường dùng thống kê 1.1.4 Khái quát trình nghiên cứu thống kê 1.2 Giới thiệu phương pháp tiến hành điều tra xã hội học .7 1.2.1 Đối tượng nghiên cứu xã hội học .7 1.2.2 Những phương pháp nghiên cứu xã hội học 1.3 Các phương pháp kỹ thuật phân tích thống kê liệu .11 1.3.1 Ước lượng .11 1.3.2 Tương quan hồi quy 11 1.3.3 Kiểm định giả thuyết .12 1.4 Giới thiệu phần mềm ứng dụng phân tích thống kê liệu 13 1.4.1 Phần mềm SPSS 13 1.4.2 Phần mềm Epidata 13 Chương 2: Một số vấn đề phân tích liệu thống kê 14 2.1 Thống kê mô tả 14 2.1.1 Mục tiêu nghiên cứu mô tả 14 2.1.2 Những nội dung nghiên cứu mô tả 14 2.1.3 Thiết kế nghiên cứu mô tả 16 2.1.4 Mối quan hệ nhân .17 2.2 Cơ sở liệu 18 http://www.ictu.edu.vn ii 2.2.1 Cơ sở liệu gì? 18 2.2.2 Các dạng sở liệu 19 2.2.3 Biểu diễn thông tin thống kê sở liệu 19 2.2.4 Mã hóa thông tin sở liệu .21 2.2.5 Xác định xử lý giá trị bị thiếu vượt trội sở liệu 23 2.3 Ước lượng 24 2.3.1 Khái niệm 24 2.3.2 Ước lượng trung bình quần thể .25 2.3.3 Ước lượng tỷ lệ quần thể 27 2.3.4 Ước lượng khác hai trung bình quần thể 28 2.3.5 Ước lượng khác hai tỷ lệ quần thể 29 2.4 Kiểm định giả thuyết thống kê 30 2.4.1 Khái niệm 30 2.4.2 Hình thành giả thuyết .31 2.4.3 Các kết luận kết có từ việc kiểm định giả thuyết 32 2.4.4 Các bước việc kiểm định giả thuyết thống kê 33 2.4.5 Các thống kê kiểm định miền bác bỏ 33 2.4.6 Ứng dụng lý thuyết kiểm định 35 Chương 3: Ứng dụng thử nghiệm điều tra xã hội học 40 3.1 Giới thiệu điều tra .40 3.1.1 Đối tượng nghiên cứu .40 3.1.2 Địa điểm thời gian nghiên cứu 40 3.1.3 Phương pháp nghiên cứu 41 3.2 Phương pháp thu thập xử lý số liệu 43 3.2.1 Phương pháp thu thập số liệu 43 3.2.2 Phương pháp xử lý nhập số liệu .43 3.2.3 Kết nghiên cứu 44 3.3 Sử dụng phương pháp ước lượng tham số rút từ quần thể 45 http://www.ictu.edu.vn iii 3.3.1 Ước lượng hiểu biết trung bình học sinh phổ thông phòng tránh TNTT bỏng 46 3.3.2 Ước lượng khác hiểu biết trung bình học sinh trước sau can thiệp 49 3.3.3 Ước lượng tỷ lệ học sinh bị TNTT tổng số học sinh 50 3.4 Kiểm định giả thuyết .51 3.4.1 Kiểm định giả thuyết khác mức độ hiểu biết trung bình học sinh phòng tránh TNTT bỏng trước sau can thiệp 52 3.4.2 Kiểm định giả thuyết tỷ lệ học sinh bị TNTT tổng số học sinh 54 3.4.3 Kiểm định giả thuyết tỷ lệ học sinh bị TNTT trước sau can thiệp.55 Kết luận .56 Kiến nghị nghiên cứu .58 Tài liệu tham khảo 59 PHỤ LỤC 60 http://www.ictu.edu.vn iv Danh mục bảng Bảng 2.1 Các kết luận kết kiểm định giả thuyết Bảng 3.1 Tỷ lệ học sinh có hành vi TNTT bỏng trước can thiệp Bảng 3.2 Bảng kết khoảng tin cậy cho trung bình quần thể chung cho toàn thể mẫu Bảng 3.3 Bảng mô tả trung bình quần thể kiến thức phòng tránh TNTT trước can thiệp sau can thiệp trường Quang Trung Bảng 3.4 Kết tìm khoảng tin cậy cho khác hai trung bình mẫu với độ tin cậy 95% Bảng 3.5 Kết tìm khoảng tin cậy cho khác hai trung bình mẫu với độ tin cậy 98% Bảng 3.6 Tỷ lệ học sinh bị TNTT Bảng 3.7 Kết nhóm thống kê (Group Statistics) Bảng 3.8 Kết kiểm định mức độ hiểu biết trung bình phòng tránh TNTT bỏng học sinh trước sau can thiệp Bảng 3.9 Tỷ lệ học sinh bị TNTT Bảng 3.10 Kết phân tích kiểm định (Test Statistics) http://www.ictu.edu.vn Lời mở đầu Tính cấp thiết đề tài Thống kê môn khoa học bao gồm phương pháp thu thập, tổ chức phân tích liệu Ngày thống kê vào hầu hết lĩnh vực xã hội kinh tế thị trường, số giá cả, tỷ lệ tăng giảm dân số, khí hậu, thời tiết, y tế Những khảo sát thăm dò dư luận, điều tra chọn mẫu dân số, sức khỏe, giáo dục dự báo dân số tiến hành, tất chứng thực cho tầm quan trọng phương pháp thống kê kiện quan trọng ngày Phân tích thống kê phận khoa học hình thành từ lâu, chứng minh cần thiết quan trọng đời sống phát triển kinh tế xã hội đại Mục tiêu nghiên cứu đề tài - Tìm hiểu điều tra xã hội học phân tích liệu thống kê - Ứng dụng thực tế điều tra xã hội học Đối tượng phạm vi nghiên cứu - Các khảo sát điều tra xã hội học - Phân tích thống kê số liệu điều tra xã hội học - Các công cụ phân tích thống kê liệu - Các phương pháp đánh giá ước lượng hỗ trợ định xu hướng hay sách xã hội Phương pháp nghiên cứu - Tìm hiểu phương pháp tiến hành điều tra xã hội học - Nghiên cứu phương pháp phân tích thống kê liệu - Chọn lựa phương pháp phân tích tổng hợp công cụ đánh giá liệu http://www.ictu.edu.vn Kết cấu luận văn Bố cục Luận văn gồm ba chương sau: Chương 1: Tổng quan thống kê liệu điều tra xã hội học - Khái quát liệu thống kê - Giới thiệu phương pháp tiến hành điều tra xã hội học - Các phương pháp kỹ thuật phân tích thống kê liệu Chương 2: Một số vấn đề phân tích liệu thống kê - Thống kê mô tả - Cơ sở liệu - Ước lượng - Kiểm định giả thuyết Chương 3: Ứng dụng thử nghiệm điều tra xã hội học Dựa số liệu điều tra, sử dụng thống kê suy luận để: - Tìm khoảng tin cậy - Kiểm định giả thuyết Kết đạt Qua trình thực luận văn em thực số công việc sau: - Hiểu điều tra xã hội học, trình thực điều tra xã hội học, ý nghĩa xã hội đại - Hiểu thống kê liệu phân tích thống kê liệu - Áp dụng ước lượng kiểm định giả thuyết vào phân tích thống kê liệu Ý nghĩa khoa học đề tài - Đề tài có ý nghĩa khoa học, thời mang đậm tính thực tiễn - Thông qua trình phân tích liệu thống kê điều tra xã hội học đưa đánh giá hỗ trợ cho việc định xu hướng hay sách xã hội http://www.ictu.edu.vn Chương 1: Tổng quan thống kê liệu điều tra xã hội học 1.1 Khái quát liệu thống kê 1.1.1 Dữ liệu gì? Dữ liệu định nghĩa điều biết đến, giả định kiện số, mà từ kết luận suy Nói chung, liệu thông tin dạng thô chất lượng số lượng Việc chuyển đổi từ liệu kiến thức xem xét bao gồm trình tự phân cấp [9]: Dữ liệu Phân tích Thông tin Mô hình hóa Tri thức Dữ liệu thường xem cấp thấp trừu tượng mà từ thông tin sau kiến thức có nguồn gốc Dữ liệu thô, tức liệu chưa qua chế biến, đề cập đến tập hợp số, ký tự, hình ảnh, kết đầu khác từ thiết bị thu thập thông tin để chuyển đổi số lượng vật lý vào biểu tượng [9] 1.1.2 Thống kê gì? a Khái niệm thống kê Thống kê hệ thống phương pháp dùng để thu thập, xử lý phân tích số (mặt lượng) tượng số lớn để tìm hiểu chất qui luật vốn có chúng (mặt chất) điều kiện không gian thời gian cụ thể [7] Mọi vật, tượng có hai mặt chất lượng không tách rời nhau, nghiên cứu tượng, điều muốn biết chất tượng Nhưng mặt chất thường ẩn bên trong, mặt lượng biểu bên dạng đại lượng ngẫu nhiên Do phải thông qua phương pháp xử lý thích hợp mặt lượng số lớn đơn vị cấu thành tượng, tác động yếu tố ngẫu nhiên bù trừ triệt tiêu, chất tượng bộc lộ ta nhận thức đắn chất, quy luật vận động [7] Thống kê chia làm hai lĩnh vực [7]: http://www.ictu.edu.vn - Thống kê mô tả : bao gồm phương pháp thu thập số liệu, mô tả trình bày số liệu, tính toán đặc trưng đo lường - Thống kê suy diễn : Bao gồm phương pháp ước lượng, kiểm định, phân tích mối liên hệ, dự đoán sở thông tin thu thập từ mẫu b Đối tượng nghiên cứu thống kê Đối tượng nghiên cứu thống kê mặt lượng mối quan hệ chặt chẽ với mặt chất tượng kinh tế - xã hội, tự nhiên không gian thời gian cụ thể, biến động học dân số, tượng trình tái sản xuất sản phẩm, đời sống vật chất văn hoá… Cũng vật tồn xã hội, tượng kinh tế xã hội tồn hai mặt: chất lượng có liên quan mật thiết với Trong tượng kinh tế - xã hội mặt chất biểu ở: đặc điểm, tính chất, đặc trưng, tính qui luật phát triển tượng nghiên cứu Mặt lượng biểu biểu số cụ thể nói lên: qui mô, tốc độ phát triển, kết cấu… Thống kê không nghiên cứu trực tiếp mặt chất tượng kinh tế - xã hội mà nghiên cứu mặt số lượng cụ thể tượng kinh tế xã hội Thông qua phân tích hệ thống tiêu thống kê số cụ thể, rút đặc điểm, tính chất, đặc trưng tính qui luật phát triển kinh tế xã hội qua thời gian địa điểm cụ thể, thống kê nghiên cứu tượng kinh tế xã hội xuất phát từ qui luật số lớn lý thuyết xác suất tính qui luật thống kê Thông qua nghiên cứu số lớn tượng cá biệt nhằm loại bỏ tác động ngẫu nhiên, riêng lẻ cá biệt, nhằm bộc lộ rõ tính tất nhiên, tính phổ biến, điển hình chung số lớn tượng nghiên cứu [7] 1.1.3 Một số khái niệm thường dùng thống kê 1.1.3.1 Tổng thể thống kê, đơn vị tổng thể thống kê Tổng thể thống kê tập hợp đơn vị (hay phần tử) thuộc tượng nghiên cứu, cần quan sát, thu thập phân tích mặt lượng chúng theo hay số tiêu thức Các đơn vị (hay phần tử) cấu thành tổng thể thống kê gọi đơn vị tổng thể [7] http://www.ictu.edu.vn Như thực chất việc xác định tổng thể thống kê việc xác định đơn vị tổng thể Đơn vị tổng thể xuất phát điểm trình nghiên cứu thống kê chứa đựng thông tin ban đầu cho qua trình nghiên cứu Tổng thể đồng chất: Là tổng thể bao gồm đơn vị giống hay số đặc điểm chủ yếu có liên quan trực tiếp đến mục đích nghiên cứu [7] 1.1.3.2 Các loại tổng thể - Tổng thể chung: Bao gồm đơn vị thuộc phạm vi tượng nghiên cứu xác định - Tổng thể phận: Bao gồm nột số đơn vị thuộc phạm vi tượng nghiên cứu xác định - Tổng thể đồng chất: Bao gồm đơn vị giống số đặc điểm chủ yếu có liên quan với mục đích nghiên cứu - Tổng thể không đồng chất: Bao gồm đơn vị không giống số đặc điểm chủ yếu có liên quan với mục đích nghiên cứu - Tổng thể bộc lộ: Bao gồm đơn vị mà trực tiếp quan sát, nhận biết - Tổng thể tiềm ẩn: Bao gồm đơn vị mà không trực tiếp quan sát, nhận biết 1.1.3.3 Tiêu thức thống kê Nghiên cứu thống kê phải dựa vào đặc điểm đơn vị tổng thể Đơn vị tổng thể có nhiều đặc điểm, tuỳ theo mục đích nghiên cứu số đặc điểm chọn để nghiên cứu [7] Ví dụ: Nghiên cứu nhân khẩu, nhân có tiêu thức giới tính, độ tuổi…., nghiên cứu doanh nghiệp số lượng công nhân, vốn, giá trị sản xuất Tiêu thức thống kê phân làm hai loại: Tiêu thức thuộc tính: tiêu thức phản ánh tính chất hay loại hình đơn vị tổng thể, biểu trực tiếp số [7] Ví dụ: Các tiêu thức như: giới tính, nghề nghiệp, tôn giáo… Tiêu thức số lượng: tiêu thức có biểu trực tiếp số [7] http://www.ictu.edu.vn Ví dụ: tiêu thức như: tiền lương công nhân, chiều cao, cân nặng trung bình người Các trị số khác tiêu thức số lượng gọi lượng biến Lượng biến phân làm hai loại: • Lượng biến rời rạc: lượng biến mà giá trị hữu hạn hay vô hạn đếm được, số công nhân, số sản phẩm • Lượng biến liên tục: giá trị lấp kín khoảng trục số, trọng lượng, chiều cao sinh viên, suất trồng [7] 1.1.3.4 Chỉ tiêu thống kê Chỉ tiêu thống kê trị số phản ánh đặc điểm, tính chất tổng thể thống kê điều kiện thời gian không gian xác định Chỉ tiêu thống kê chia làm hai loại [7]: • Chỉ tiêu khối lượng: Các tiêu biểu quy mô, khối lượng tổng thể nghiên cứu, số nhân khẩu, số doanh nghiệp, số vốn, vốn lưu động… • Chỉ tiêu chất lượng: tiêu biểu tính chất trình độ phổ biến, quan hệ so sánh tượng nghiên cứu, giá thành 1.1.4 Khái quát trình nghiên cứu thống kê Quá trình nghiên cứu thống kê hay trình nghiên cứu nào, trải qua bước, khái quát mô hình sau [7]: http://www.ictu.edu.vn 52 Không giống với ước lượng, kiểm định giả thuyết lại hướng theo mục tiêu là: xác định chứng cung cấp liệu để ủng hộ cho tuyên bố cụ thể Dưới đây, xem xét kỹ phương pháp thống kê suy luận kiểm định giả thuyết 3.4.1 Kiểm định giả thuyết khác mức độ hiểu biết trung bình học sinh phòng tránh TNTT bỏng trước sau can thiệp Với phương pháp nghiên cứu can thiệp có đối chứng, tiến hành kiểm định mức độ hiểu biết trung bình phòng tránh TNTT bỏng sau can thiệp nhóm can thiệp có thay đổi hay không? Giả thiết rằng, sau trình can thiệp, mức độ hiểu biết trung bình học sinh trường Quang Trung trước sau can thiệp thay đổi µ1: mức độ hiểu biết trung bình học sinh trường Quang Trung phòng tránh TNTT trước can thiệp µ2: mức độ hiểu biết trung bình học sinh trường Quang Trung phòng tránh TNTT sau can thiệp Giả thiết trình can thiệp hiệu đáng kể, nghĩa mức độ hiểu biết học sinh trường Quang Trung phòng tránh TNTT bỏng trước sau can thiệp - H0: (µ1 - µ2) = (nghĩa µ1 = µ2; khác mức độ hiểu biết trung bình học sinh trường Quang Trung phòng tránh TNTT bỏng trước sau can thiệp) - H1: (µ1 - µ2) < ( nghĩa µ1 < µ2; mức độ hiểu biết trung bình học sinh trường Quang Trung trước can thiệp thấp so với mức độ hiểu biết trung bình học sinh Quang Trung sau can thiệp) Sử dụng SPSS để kiểm định giả thuyết này, với độ tin cậy α = 0.05 ta thu bảng kết sau: Q18 Bảng 3.7 Kết nhóm thống kê (Group Statistics) Trường N Mean Std Deviation Std Error Mean Sau can thiệp 702 3.11 933 035 Trước can thiệp 811 2.91 1.154 041 http://www.ictu.edu.vn 53 Bảng 3.8 Kết kiểm định mức độ hiểu biết trung bình phòng tránh TNTT bỏng học sinh trước sau can thiệp Levene's Test for Equality t-test for Equality of Means of Variances F Sig t df Sig Std Mean (2Error Differetailed Differe-nce ) -nce 95% Confidence Interval of the Difference Lower Upper Q18 Equal variances assumed Equal variances not assumed 35.576 000 3.57 1511 000 195 054 088 301 3.63 1504.134 000 195 054 089 300 Trong bảng 3.7 ta có trường Quang Trung trước can thiệp có 811 học sinh, sau can thiệp 702 học sinh Mức độ hiểu biết trung bình hai nhóm phòng tránh TNTT bỏng tương đối khác nhau, trước can thiệp 2.91 sau can thiệp 3.11 Sự khác biệt 0.2, số lớn để khẳng định sau can thiệp mức độ hiểu biết học sinh phòng tránh TNTT học sinh trường Quang Trung sau can thiệp cao trước Trong bảng 3.8 sử dụng dòng cuối ứng với trường hợp phương sai giả thiết không sử dụng giá trị t cột dành cho phép thử t giá trị trung bình ( t – test for Equality of Means) Ở đây, ta có t = 3.63 Giá trị lớn giá trị tới hạn zα /2 = z0.025 = 1.96 Vì ta bác bỏ giả thuyết không mức độ hiểu biết học sinh phòng tránh TNTT bỏng sau can thiệp so với trước can thiệp thay đổi Từ http://www.ictu.edu.vn 54 kiểm định này, khẳng định trình can thiệp học sinh kiến thức phòng tránh TNTT bỏng có hiệu 3.4.2 Kiểm định giả thuyết tỷ lệ học sinh bị TNTT tổng số học sinh Chúng ta tiến hành kiểm định tỷ lệ số học sinh bị TNTT tổng số học sinh Một số người giả thiết rằng, có khoảng 5% học sinh phổ thông bị TNTT, số ý kiến khác lại cho tỷ lệ cao Dựa quần thể mẫu thu học sinh hai trường phổ thông, tiến hành kiểm định với mức ý nghĩa α = 0.05 H0: p = 0.05 H1: p > 0.05 Ở bảng 3.6 có tỷ lệ học sinh bị TNTT chiếm 6.5 % Trong p tỷ lệ tỷ lệ học sinh bị TNTT tổng số học sinh Với mức ý nghĩa α = 0.05, miền bác bỏ kiểm định hai đầu gồm tất giá trị z thỏa mãn điều kiện z > zα z= pˆ − p0 p0 q0 với q0 = - p0 Ta có p0= 0.05; q0 = 0.95 n pˆ ± ˆˆ pq (0.065)(0.935) = 0.065 ± = 0.065 ± 0.012 không chứa nên n 1746 cỡ mẫu đủ lớn để đảm bảo tính hợp lý phép kiểm định pˆ tỷ lệ học sinh bị TNTT tổng số học sinh hai trường phổ thông Quang Trung Chu Văn An pˆ =0.065 z= pˆ − p0 0.065 − 0.05 = p0 q0 (0.05)(095) = 2.88 1746 n z > zα = 1.645 Giá trị z nằm bên miền bác bỏ, kết luận tỷ lệ học sinh bị TNTT cao 5% Xác suất để mắc sai lầm loại I, tức sai lầm loại bỏ giả thiết “5% học sinh phổ thông bị TNTT” α = 0.05 Sử dụng phần mềm SPSS số liệu, ta thu bảng sau: http://www.ictu.edu.vn 55 Bảng 3.9 Tỷ lệ học sinh bị TNTT Observed N Expected N Có 114 87.3 Không/ không nhớ 1632 1658.7 Tổng số 1746 Residual 26.7 -26.7 Bảng 3.10 Kết phân tích kiểm định (Test Statistics) Có bị TNTT Chi-square 8.596a df Asymp Sig .003 a cells (.0%) have expected frequencies less than The minimum expected cell frequency is 87.3 Từ bảng 3.10 ta có giá trị thống kê 0.03 < 0.05 có ý nghĩa thống kê (p

Ngày đăng: 16/04/2017, 17:30

Từ khóa liên quan

Mục lục

  • MỤC LỤC

  • Danh mục các bảng

  • Lời mở đầu

  • Chương 1: Tổng quan về thống kê dữ liệu và điều tra xã hội học

    • 1.1. Khái quát về dữ liệu và thống kê

      • 1.1.1. Dữ liệu là gì?

      • 1.1.2. Thống kê là gì?

      • 1.1.3. Một số khái niệm thường dùng của thống kê

      • 1.1.4. Khái quát quá trình nghiên cứu thống kê

      • 1.2. Giới thiệu các phương pháp tiến hành điều tra xã hội học.

        • 1.2.1. Đối tượng nghiên cứu của xã hội học

        • 1.2.2. Những phương pháp nghiên cứu xã hội học

        • 1.3. Các phương pháp và kỹ thuật đó phân tích thống kê dữ liệu.

          • 1.3.1. Ước lượng

          • 1.3.2. Tương quan và hồi quy

          • 1.3.3. Kiểm định giả thuyết

          • 1.4. Giới thiệu về các phần mềm ứng dụng phân tích thống kê dữ liệu

            • 1.4.1. Phần mềm SPSS

            • 1.4.2. Phần mềm Epidata

            • Chương 2: Một số vấn đề trong phân tích dữ liệu thống kê

              • 2.1. Thống kê mô tả

                • 2.1.1 Mục tiêu của các nghiên cứu mô tả

                • 2.1.2. Những nội dung chính của các nghiên cứu mô tả

                • 2.1.3. Thiết kế nghiên cứu mô tả

                • 2.1.4. Mối quan hệ nhân quả

                • 2.2. Cơ sở dữ liệu

                  • 2.2.1. Cơ sở dữ liệu là gì?

                  • 2.2.2. Các dạng cơ sở dữ liệu

Tài liệu cùng người dùng

Tài liệu liên quan