Phân tích bài toán kiểm định: Ta thấy cột venes Test for Equality of Variances cho ta giá trị sig = 0.943>0.05, ta có thể cho rằng phương sai của hai mẫu là bằng nhau nên ta phân tích kiểm định hai trung bình ở dòng Equal variances assumed. Từ bảng số liệu sig = 0.473 >0.05, nên ta chấp nhận giả thiết. vậy ta có thể nói rằng điểm ngoại ngữ trung bình của nhóm học sinh thích lý và không thích lý là như nhau với mức ý nghĩa 5%(hay độ chính xác là 95%).
Trang 1Họ và tên học viên: Nguyễn Thanh Thừa Lớp: Lý thuyết Xác suất thống kê K22
Với số liệu trong tệp tracnghiemhs hãy sử dụng phần mềm SPSS để
1 Mô tả riêng rẽ các biến hocluc11 (học lực năm lớp 11) và toan (điểm tổng kết học kỳ 1 môn Toán) một cách thích hợp bằng các tham số thống kê và bằng đồ thị.
Giải:
Mô tả biến định tính hoclưc11
* Lệnh: Analyze/Descriptive Statistic/Frequencien/
Cho biến hocluc11 vào ô Variable(s)
Kết quả:
Statistics
hocluc11
hocluc11
Frequency Percent Valid Percent Cumulative Percent
Phân tích mô tả:
- Bảng số liệu cho thấy có 297 học sinh;
- Học sinh có học lực năm lớp 11 thuộc nhóm 1 là 24 chiếm tỷ lệ 8.1%, có học lực năm lớp 11 thuộc nhóm 2 là 199 chiếm tỷ lệ 67%, học sinh có học lực năm lớp 11 thuộc nhóm 3 là 72 học sinh chiếm tỷ lệ 24.2 %, học sinh có học lực năm lớp 11 thuộc nhóm 4 là 2 chiếm tỷ lệ 0.7%;
Biểu đồ hình cột
Trang 2Biểu đồ hình bánh:
Qua biểu đồ thể hiện số lượng học sinh có học lực tập trung nhóm 2 là nhiều nhất và thuộc nhóm 4 là ít nhất
Mô tả biến định lượng toan:
* Lệnh: Analyze/Descriptive Statistic/Explore/
Cho biến toan vào ô Dependent List
Kết quả:
Case Processing Summary
Cases
Trang 3Statistic Std Error
95% Confidence Interval for Mean Lower Bound 7.089
Phân tích mô tả:
- Số lượng học sinh 297;
- Điểm trung bình môn toán của học sinh là 7.228 điểm; điểm trung bình sau khi loại bỏ 5% (2.5% điểm nhỏ nhất và 2.5% điểm lớn nhất) nhằm loại bỏ giá trị ngoại lai (nếu có) là 7.260 điểm, điểm lớn nhất là 9.6 điểm, điểm nhỏ nhất là 4.0 điểm, trung vị là 7.300 điểm
- Khoảng ước lượng điểm trung bình môn toán là (7.089; 7.367)
- Mức độ phân tán của điểm là không quá lớn với phương sai là 1.487 điểm và độ lệch chuẩn 1.2194 điểm
Biểu đồ thân - lá:
toan Stem-and-Leaf Plot
Frequency Stem & Leaf
3.00 Extremes (=<4.0)
2.00 4 23
5.00 4 56688
21.00 5 000000001111122222233
11.00 5 55666677888
25.00 6 0000000000001122222344444
39.00 6 555555555556666677777777888888888999999
52.00 7 0000000000000000000000000011111112222223333333333444
43.00 7 5555555555555556666666666777888888999999999
42.00 8 000000000000000001111112222222233333333444
35.00 8 55555555555556666666677777788899999
16.00 9 0000111123333334
3.00 9 556
Stem width: 1.0
Each leaf: 1 case(s)
Trang 4Biểu đồ Boxlot:
2 Dùng phép kiểm định T-test để so sánh giá trị của biến ngoaingu (điểm tổng kết học kỳ 1 môn Ngoại ngữ) giữa hai nhóm học sinh không thích môn Lý (0) và học sinh thích môn Lý (1) xác định bằng biến thichly (học sinh thích môn Lý).
Giải
* Lệnh: Analyze/Compare/Independent – sample T-test/
Cho biến ngoaingu vào ô Test Variable, biến thichly vào ô Grouping Variable/ bấm
define Groups nhập 0 và 1
Kết quả:
Group Statistics
thichly N Mean Std Deviation Std Error Mean
Independent Samples Test
Levene's Test for Equality of Variances t-test for Equality of Means
Sig (2-tailed)
Mean Difference
Std Error Difference
95% Confidence Interval of the Difference Lower Upper ngoaingu Equal variances
assumed .005 .943 .718 295 .473 .1001 .1393 -.1741 .3743 Equal variances not
Trang 5Phân tích bài toán kiểm định:
- Ta thấy cột vene's Test for Equality of Variances cho ta giá trị sig = 0.943>0.05, ta có
thể cho rằng phương sai của hai mẫu là bằng nhau nên ta phân tích kiểm định hai trung bình ở
dòng Equal variances assumed.
- Từ bảng số liệu sig = 0.473 >0.05, nên ta chấp nhận giả thiết vậy ta có thể nói rằng điểm ngoại ngữ trung bình của nhóm học sinh thích lý và không thích lý là như nhau với mức ý nghĩa 5%(hay độ chính xác là 95%)
3 Dùng phép kiểm định phi tham số thích hợp để so sánh giá trị của biến ngoaingu (điểm tổng kết học kỳ 1 môn Ngoại ngữ) giữa hai nhóm học sinh không thích môn Lý (0) và học sinh thích môn Lý (1) xác định bằng biến thichly (học sinh thích môn Lý).
Giải:
Dùng phương pháp kiệm định phi tham số Mann - Whitney
* Lệnh: Analyze/Nonparametric Test/ 2 Independent Sample /
Cho biến ngoaingu vào ô Test Variable List, biến thichly vào ô Grouping Variable/ bấm Define Groups nhập 0 và 1, chọn ô Mann – Whitney.
Kết quả:
Ranks
thichly N Mean Rank Sum of Ranks
Test Statistics a
ngoaingu Mann-Whitney U 1.034E4
Asymp Sig (2-tailed) 530
a Grouping Variable: thichly
Phân tích bài toán kiểm định Mann – Whitney:
Theo bảng kết quả ta thấy giá trị sig = 0.530, nên ta chấp nhận giải thiết Vậy ta có thể cho rằng điểm trung bình của nhóm học sinh thích lý và không thích lý là như nhau
4 Dùng phép kiểm định phi tham số thích hợp để kiểm tra tính độc lập giữa hai biến sudungvt
(khả năng sử dụng vi tính của học sinh) và tiepthu (học sinh học tập khó khăn do khả năng tiếp thu kém)
Giải:
Đặt giải thiết H: Khả năng sử dụng vi tính và khả năng tiếp thu của học sinh độc lập
* Lệnh: Analyze/Descriptive Statistic/Crosstabs/
Trang 6Cho biến sudungvt vào ô Row(s), biến tiepthu vào ô column(s), trong tab Statistic chọn
phương pháp Chi – square
Kết quả:
Kh¶N¨ngSöDng * tiepthu Crosstabulation
Count
tiepthu
Total
Phương pháp Chi-Square Tests
Chi-Square Tests
Value df Asymp Sig (2-sided)
Linear-by-Linear Association 6.777 1 009
a 0 cells (.0%) have expected count less than 5 The minimum expected count is 8.67.
Trong bảng Chi-Square Tests cho ta giá trị sig = 0.018<0.05 ta có thể cho rằng hai biến
không độc lập với mức ý nghĩa 5%
Phương pháp Kendall's tau-b và Gamma
Symmetric Measures
Value Asymp Std Error a Approx T b Approx Sig.
Ordinal by Ordinal Kendall's tau-b 150 053 2.803 005
a Not assuming the null hypothesis.
b Using the asymptotic standard error assuming the null hypothesis.
Trong bảng Symmetric Measures cho ta giá trị sig = 0.005<0.05 ta có thể cho rằng hai
biến không độc lập với mức ý nghĩa 5%
Tuy nhiên, phương pháp Kendall's tau-b và Gamma giúp ta phát hiện mối liên hệ của hai biến tốt hơn thể hiện qua giá trị sig
Trang 7Vậy đối với hai biến định tính thức bậc ta nên chọn phương pháp Kendall's tau-b và Gamma để kiểm định tính độc lập tốt hơn.
5 Xây dựng mô hình hồi qui logistic mô tả mối quan hệ giữa biến phụ thuộc thichhoa (học sinh thích môn Hóa) với các biến độc lập matruong, gioitinh, toan, ly, hoa, sinh, van, su, dia,
ngoaingu, theduc, ktcnghie, gdcongda, suckhoe, sachvo, phuongti, giadinh và tiepthu Hãy
phân tích mô hình hồi qui đó
Giải:
Đặt biến Y:=thichhoa;
X i = matruong, gioitinh, toan, ly, hoa, sinh, van, su, dia, ngoaingu, theduc, ktcnghie,
gdcongda, suckhoe, sachvo, phuongti, giadinh, tiepthu (i = 1, ,18)
* Lệnh: Analyze/Regression/binary Logistic/
Cho biến phụ thuộc thichhoa vào ô Dependent, các biến độc lập matruong, gioitinh, toan, ly, hoa, sinh, van, su, dia, ngoaingu, theduc, ktcnghie, gdcongda, suckhoe, sachvo, phuongti, giadinh và tiepthu vào ô Covariates.
Chọn Method: enter
Kết quả:
Block 1: Method = enter
Omnibus Tests of Model Coefficients
Chi-square df Sig.
Phân tích độ phù hợp tổng thể của mô hình: bảng Omnibus Tests of Model Coefficients
cho ta giá trị sig =0.000 cho ta thấy mối liên hệ của biến Y với ít nhất một biến X i của mô hình
Hosmer and Lemeshow Test
Step Chi-square df Sig.
Trang 8Contingency Table for Hosmer and Lemeshow Test
thichhoa = 0 thichhoa = 1
Total Observed Expected Observed Expected
Classification Table a
Observed
Predicted thichhoa
Percentage Correct
a The cut value is 500
Bảng này cho biết mức độ chính xác của dự báo Qua đó, trong 144 học sinh không thích hóa thì mô hình dự đoán đúng 115 với tỷ lệ dự đoán đúng là 75.2% và trong 151 học sinh thích hóa mô hình dự đoán đúng 113 học sinh với tỷ lệ dự đoán đúng là 79.6% từ đó tính được tỷ lệ
dự đoán đúng toàn bộ mô hình là 77.3%
Trang 9Variables in the Equation
95.0% C.I.for EXP(B) Lower Upper
a Variable(s) entered on step 1: matruong, gioitinh, toan, ly, hoa, sinh, van, su, dia, ngoaingu, theduc, ktcnghie, gdcongda, suckhoe, sachvo, phuongti, giadinh, tiepthu.
Bảng Variables in the Equation thể hiện kết quả kiểm định Wald của mô hình Quan sát ở
cột sig, ta thấy rằng chỉ có biến van có sig = 0.000 < 0.05 là có ý nghĩa trong mô hình Do đó mô
hình được xây dựng như sau:
2.817 0.970 2.817 0.970 ln( ) 2.817 0.970
van van
Vậy kết quả môn văn có ảnh hưởng đến khả năng thích học môn hóa hoặc không thích
học môn hóa Với xác suất dự báo là p