Trường Đại học Kinh tế Luật Bài tập quá trình PHÂN TÍCH CÁC KIỂM ĐỊNH TRÊN SPSS QUA DỮ LIỆU KHẢO SÁT VỀ ĐIỂM THI CỦA HỌC SINH CẤP III Môn Thống kê ứng dụng Giảng viên TS Phạm Văn Chững Nhóm Đinh Gia V.
Trường Đại học Kinh tế - Luật Bài tập trình: PHÂN TÍCH CÁC KIỂM ĐỊNH TRÊN SPSS QUA DỮ LIỆU KHẢO SÁT VỀ ĐIỂM THI CỦA HỌC SINH CẤP III Môn: Thống kê ứng dụng Giảng viên: TS Phạm Văn Chững Nhóm Đinh Gia Vỹ K184010067 Trần Ánh Huyền K184080999 Lê Minh Tân K194141744 Nguyễn Huỳnh K204100509 Phùng Nguyễn Kim Nguyên K204110603 Học kỳ hè 2021 Kiểm định One-way ANOVA Kiểm tra giả thuyết: Mức độ thời gian tự học học sinh (biến nguyên nhân) có ảnh hưởng đến điểm mơn Tốn (biến kết quả) khơng? Với mức ý nghĩa 5% Giả thuyết: { H :Thời gian tự học khơng ảnh hưởng đến điểm mơnTốn H :T hời gian tự học có ảnhhưởng đến điểm mơn Tốn Bước 1: Trên cơng cụ, chọn Analyze > Compare Means > One-way ANOVA Bước 2: Sau cửa sổ One-way ANOVA, ta đưa biến Điểm Tốn vào ơ Dependent List và biến Thời gian tự học vào ô Factor Bước 3: Nhấn nút Options, stick vào ơ Descriptive để tính đại lượng thống kê cho nhóm Sau đó ấn Continue trở hộp thoại trước ấn OK Kết sau: Bảng đưa kết tính số đại lượng thống kê mơ tả cho nhóm số lượng học sinh, điểm trung bình, phương sai,… Bảng thứ hai, cho biết Sig = 0.421, lớn 0.05 => chấp nhận H Như cho rằng, thời gian tự học khơng ảnh hưởng đến điểm thi mơn Tốn. Kiểm định chi bình phương: Giả sử, muốn kiểm tra xem thời gian tự học có ảnh hưởng tới xếp loại học lực hay không? Phát biểu giả thuyết thống kê { H : Khơng có liên hệ giới tính xếp loại học lực H :Có liên hệ giới tính xếp loại học lực Trên công cụ chọn Analyze => Descriptive Statistic => Crosstabs… Sau click vào Crosstabs… cửa sổ Crosstabs lên Lúc ta đưa biến giới tính vào Row(s) đưa biến phân loại vào Column(s) Sau ta bấm vào nút Stactistics phía bên phải cửa sổ Crosstabs Khi cửa sổ Crosstabs: Stactistics lên, ta tiến hành tick vào ô Chi-square bấm vào nút Continue Tiếp đến ta bấm vào nút Cells phía bên phải cửa sổ Crosstabs Sau cửa sổ Crosstabs: Cell Display, tiến hành tick vào ô Observed, Expected phần Counts ô Total phần Percentages Sau tick ô trên, ta bấm vào nút continue bấm vào nút OK sổ Crosstabs để nhận kết Trong kết Output, bảng Crosstabulation cho nhìn sơ mối quan hệ hai biến mặt thống kê tần số Giới tính Total Giới tính * phanloai Crosstabulation phanloai Xuất Khá Giỏi Xắc Total Nữ Count 15 25 Expected 6.0 15.5 3.5 25.0 Count % of Total 10.0% 30.0% 10.0% 50.0% Nam Count 16 25 Expected 6.0 15.5 3.5 25.0 Count % of Total 14.0% 32.0% 4.0% 50.0% Count 12 31 50 Expected 12.0 31.0 7.0 50.0 Count % of Total 24.0% 62.0% 14.0% 100.0% Tiếp đến, đọc bảng quan trọng Chi-Square Tests Ta thấy giá trị Asymptotic Significance (2-sided) hàng Pearson Chi-Square lớn 0.05, chấp nhận giả thuyết Ho, tương đương biến giới tính biến phân loại khơng có mối quan hệ với nhau. Chi-Square Tests Value 1.651a 1.695 1.324 Asymptotic Significance df (2-sided) 438 428 250 Pearson Chi-Square Likelihood Ratio Linear-by-Linear Association N of Valid Cases 50 a cells (33.3%) have expected count less than The minimum expected count is 3.50 Kiểm định Wilconxon Giả sử, muốn đánh giá nhận định cho xếp loại người học khơng có khác theo giới tính Phát biểu giả thuyết thống kê { H : Xếploại học lực namvà xếp loại học lực nữ khơng có khác biệt H : Xếp loại học lực nam xếp loại học lực nữ có khác biệt Trên công cụ, chọn Analyze => Nonparametric Tests => Legacy Dialogs => Related Samples Trong cửa sổ Two- Related- Samples Tests ta đưa biến giới tính và xếp loại vào ô Variable Variable Chọn Wilconxon trong phần Test type bấm vào nút OK để nhận kết Ở bảng kết thấy thơng tin xếp hạng âm dương xếp hạng trung bình, số xếp hạng âm, số xếp hạng dương hay tổng xếp hạng xếp hạng âm dương Wilcoxon Signed Ranks Test Ranks 7a Mean Rank 12.50 Sum of Ranks 87.50 22b 15.80 347.50 N phanloai - Giới tính Negative Ranks Positive Ranks Ties Total a phanloai < Giới tính b phanloai > Giới tính c phanloai = Giới tính 21c 50 Tiếp đến đọc bảng quan trọng nhất, bảng Test Statistics Với giá trị Asymp Sig (2-tailed) tính 0,02 bé 0.05 chấp nhận giả thuyết H1, tương đương xếp loại học lực nam nữ có khác biệt Test Statisticsa phanloai Giới tính Z -3.023b Asymp Sig (2.002 tailed) a Wilcoxon Signed Ranks Test b Based on negative ranks Kiểm định trung bình cho tổng thể Giả sử cho trung bình điểm Tốn 5, kiểm tra xem khẳng định có phù hợp với mức ý nghĩa 5% hay không? { H : μ=5 Phát biểu giả thuyết thống kê H : μ ≠5 Trên công cụ chọn Analyze > Compare Means > One Sample T Test Sau cửa sổ One-Sample T Test lên, ta đưa biến Điểm Tốn vào Test Variable(s) điền vào Test Value giá trị { H : μ=5 Bây ta kiểm định giả thiết sau: H0 : μ> SPSS không hỗ trợ kiểm định giả thiết phía (one-tailed), ta dùng giá trị t có từ kiểm định để so sánh với giá trị t tới hạn t 49 0.95 (phân vị t mức 0.95 độ tự 49) Dùng bảng để tra ta có t 49 0.95=1.67655 H mức ý nghĩa 5% chấp nhận giả thiết Vì t=21.996>t 49 0.95 nên ta bác bỏ giả thiết H : μ> { H : μ=8.5 Kiểm định giả thiết: H : μ≠ 8.5 Thao tác tương tự trên, cửa sổ One-Sample T Test lên, điền vào ô Test Value giá trị 8.5 Kết quả: Kết cho giá trị p−value=0.287>5 %, chưa đủ sở để bác bỏ giả thuyết H mức ý nghĩa 5% kết luận trung bình điểm Tốn học sinh 8.5 Kiểm định sai khác trung bình cho hai tổng thể độc lập Kiểm tra xem trung bình điểm tốn học sinh nữ nam có khác khơng, nam hay nữ học giỏi toán hơn? { H : μ =μ Phát biểu giả thuyết thống kê: H : μ ≠ μ μ1, μ2 trung bình điểm tốn 2 cho tổng thể nữ nam Trên công cụ, chọn Analyze > Compare Means > Independent-Sample T Test Đưa biến Điểm Toán vào Test Variable(s), đưa biến Giới Tính vào ô Grouping Variable, điều chỉnh độ tin cậy phần Options Nhấn nút Define Groups Vì biến Giới Tính ta ghi nhận hai giá trị cho nữ cho nam, nên để phân biệt hai tổng thể nam nữ ta nhập vào ô Group Group (ta đặt Group Group 1) Sau bấm Continue Cuối bấm OK, kết sau: Giá trị p-value cho hai trường hợp phương sai hai tổng thể không 0.78> 0.05, nên ta chưa đủ sở để bác bỏ giả thuyết H mức ý nghĩa 5% kết luận trung bình điểm tốn học sinh nữ nam khơng khác Kiểm định trung bình cho mẫu cặp (paired) Kiểm tra xem trung bình điểm Tốn Lý học sinh có khác hay khơng, trung bình tốn cao hay trung bình lý cao hơn? { H : μ D =0 Phát biểu giả thuyết thống kê: H : μ ≠ D Trên công cụ chọn Analyze > Compare Means > Paired-Samples T Test Sau cửa sổ Paired-Samples T Test lên, ta đưa biến Điểm Tốn vào Variable biến Điểm Lý vào ô Variable 2, tùy chỉnh độ tin cậy phần Options Nhấn OK để nhận kết quả: Với p-value kiểm định 0.349 > 0.05, ta chấp nhận giả thuyết H : μD =0 (tức trung bình Tốn trung bình Lý) mức ý nghĩa 5% Kiểm định Mann-Whitney Kiểm định Mann-Whitney xem xét giống hai tổng thể, cụ thể kiểm định giả thuyết trung bình hai tổng thể, song thực dựa hai mẫu độc lập Giả sử kiểm tra xem trung bình điểm tốn tổng thể nam nữ có khác hay không? Trên công cụ, chọn Analyze > Nonparametric Tests > Independent Samples Trong cửa sổ lên, ta đưa biến Điểm Tốn vào Test Variable List, đưa biến Giới Tính vào Grouping Variable chọn Mann-Whitney U phần Test type Nhấn Define Groups sau nhập số vào Group1, số vào Group ( biến Giới Tính có giá trị 2, việc nhập giúp SPSS phân biệt tổng thể nam nữ biến Điểm Toán) Bấm Continue để quay cửa sổ trước, bấm Ok để nhận kết Với giá trị p-value=0,778 ta kết luận trung bình điểm toán nam nữ mức ý nghĩa 5% Kiểm định tỉ lệ cho tổng thể Kiểm định xem tỷ lệ nam nữ có 1.5 với mức ý nghĩa 5% hay không? { H : p=1.5 Phát biểu giả thuyết thống kê H : p≠ 1.5 Trên công cụ chọn Analyze > Compare Means > One Sample T Test Sau cửa sổ One-Sample T Test lên, ta đưa biến Giới tính vào Test Variable(s) điền vào ô Test Value giá trị 1.5 Kết quả: Trong bảng One-Sample Statistic, ta có trung bình biến Giới tính 1.50 độ lệch chuẩn 0.505 Giá trị p-value (sig (2-tailed)) từ phép kiểm định 1.000 > 0.05 nên ta khơng có sở để bác bỏ giả thuyết H0 tại mức ý nghĩa 5% Tỷ lệ nam nữ 1.5 Kiểm định phương sai tổng thể Giả sử độ đồng điểm trung bình lớp 10 lớp 12 Kiểm định xem điều có với mức ý nghĩa 5% hay không? { H : σ 1=σ Phát biểu giả thuyết thống kê H :σ ≠ σ 1 Với σ phương sai lớp 10 σ phương sai lớp 12 Trên công cụ chọn Analyze > Compare Means > Independent Samples T Test… Sau cửa sổ Independent-Samples T Test hiện lên, đưa biến Điểm Trung Bình vào ơ Test Variable(s), đưa biến Lớp vào ô Grouping Variable Nhấn Define Groups để phân nhóm liệu biến Lớp theo biến Điểm Trung Bình sau: Kết quả: Trong bảng Group Statistics: Điểm trung bình 13 học sinh lớp 10 8.3410, độ lệch chuẩn 0.79246 sai số chuẩn 0.21979 Điểm trung bình 14 học sinh lớp 12 có trung bình 8.4452, độ lệch chuẩn 0.33782 sai số chuẩn 0.09029 Trong Independent Samples Test: Trong kiểm định Leneve giá trị sig = 0.026 < 0.05 Bác bỏ H0 Độ đồng điểm trung bình lớp 10 lớp 12 không Kiểm định xem mức độ thời gian tự học nam nữ có không? { H : σ 1=σ Phát biểu giả thuyết thống kê H :σ ≠ σ 1 Với σ phương sai nam σ phương sai nữ Trên công cụ chọn Analyze > Compare Means > Independent Samples T Test… Sau cửa sổ Independent-Samples T Test hiện lên, đưa biến Thời gian tự học vào ơ Test Variable(s), đưa biến Giới tính vào ơ Grouping Variable Nhấn Define Groups để phân nhóm liệu biến Giới tính theo biến Thời gian tự học sau: Kết quả: Trong bảng Group Statistics: Thời gian tự học 25 nữ có trung bình 3.04, độ lệch chuẩn 1.020 sai số chuẩn 0.204 Điểm trung bình 25 nam có trung bình 3.60, độ lệch chuẩn 1.000 sai số chuẩn 0.200 Trong kiểm định Leneve giá trị sig = 0.808 > 0.05 => Chấp nhận H0 => mức độ thời gian tự học nam nữ ... biết trung bình điểm Tốn học sinh lớn { H : μ=5 Bây ta kiểm định giả thi? ??t sau: H0 : μ> SPSS không hỗ trợ kiểm định giả thi? ??t phía (one-tailed), ta dùng giá trị t có từ kiểm định để so sánh... luận trung bình điểm Tốn học sinh 8.5 5 Kiểm định sai khác trung bình cho hai tổng thể độc lập Kiểm tra xem trung bình điểm tốn học sinh nữ nam có khác khơng, nam hay nữ học giỏi toán hơn? { H... mức ý nghĩa 5% kết luận trung bình điểm tốn học sinh nữ nam không khác 6 Kiểm định trung bình cho mẫu cặp (paired) Kiểm tra xem trung bình điểm Tốn Lý học sinh có khác hay khơng, trung bình