So sánh hai giá trị TB mẫu• Nếu biến không có phân bố chuẩn dùng kiểm định phi tham số: Mann- Whitney hoặc Wilconxon • Nếu phương sai đồng nhất sử dụng kiểm định t cho phương sai đồng nh
Trang 1THỐNG KÊ CHO BIẾN LIÊN TỤC
Nguyễn thị Trang Nhung
Trang 2Mục tiêu
Sau khi hoàn thành bài học này, sinh viên có thể:
- Thực hiện được các kiểm định cho biến liên tục
- Phiên giải được kết quả đầu ra của máy tính
- Viết được báo cáo phân tích số liệu cho biến định lượng
Trang 3Nội dung
• Ước lượng cho một giá trị trung bình mẫu
• Ước lượng, so sánh cho giá trị trung bình của hai mẫu độc lập
• Ước lượng so sánh cho nhiều hơn hai giá trịtrung bình mẫu độc lập
• Ước lượng so sánh cho hai trung bình của hai mẫu phụ thuộc
Trang 4So sánh một giá trị TB mẫu
• Câu hỏi: TB tuổi khi sinh con của những phụ
nữ này có khác 35 tuổi không?
Để đánh giá một giá trị trung bình chúng ta tiến hành kiểm tra phân bố của biến
Trang 6So sánh một giá trị trung bình mẫu
One-Sample Statistics
640 33.9781 3.87029 15299 Maternal age
N Mean Std Deviation
Std Error Mean
One-Sample Test
-6.679 639 000 -1.02188 -1.3223 -.7215 Maternal age
t df Sig (2-tailed)
Mean Difference Lower Upper
95% Confidence Interval of the Difference Test Value = 35
Trung bình tuổi sinh con của những phụ nữ trong nghiên cứu này là 34
tuổi thấp hơn tuổi sinh con có nguy cơ của nghiên cứu đựoc so sánh có
ý nghĩa thống kê (P< 0,001, 95% CI của sự khác biệt là 0,7 tuổi đến 1,3 tuổi)
Trang 7So sánh hai giá trị TB mẫu
H0: hai phương sai đồng nhất
Ha: Hai phương sai không đồng nhất
Trang 8So sánh hai giá trị TB mẫu
• Nếu biến không có phân bố chuẩn dùng kiểm định phi tham số: Mann- Whitney hoặc
Wilconxon
• Nếu phương sai đồng nhất sử dụng kiểm định t cho phương sai đồng nhất
• Nếu phương sai không đồng nhất sử dụng
kiểm định t cho phương sai không đồng nhất
Trang 9So sánh hai giá trị TB mẫu
Câu hỏi: So sánh trọng lượng sơ sinh của trẻ nam
và trẻ nữ
- Kiểm tra tính chuẩn của biến (bweight)
- Kiểm định thống kê: dùng kiểm định t cho hai mẫu độc lập:
Analyze/Compare Means/Independent
Samples T test
Trang 10So sánh hai giá trị TB mẫu
Trang 11gai Birthweight
N Mean Std Deviation
Std Error Mean
Independent Samples Test
Std Error Difference Lower Upper
95% Confidence Interval of the Difference t-test for Equality of Means
chuẩn
•Giá trị P của kiểm định t
•Kiểm
định
Levene
Trang 12Std Error Difference Lower Upper
95% Confidence Interval of the Difference t-test for Equality of Means
Giá trị của kiểm định t
gai Birthweight N Mean Std Deviation
Std Error Mean
Do s 2
max / s 2
min = 665*665/629*629 < 3 nên có thể kết luận là phương sai đồng nhất.
Trang 13Kết quả
• Trung bình cân nặng khi sinh của trẻ trai là 3,2
kg (SD = 0,7) cao hơn trung bình cân nặng của trẻ gái là 3,0 kg (SD = 0,6) có ý nghĩa thống
kê (P< 0,001; 95%CI của sự khác biệt là 266,0g)
Trang 1464,5-So sánh hai giá trị TB mẫu
Câu hỏi: So sánh trọng lượng sơ sinh của con
của những bà mẹ bị THA và không bị THA
- Kiểm tra tính chuẩn của biến (bweight)
- Kiểm định thống kê: dùng kiểm định t cho hai mẫu độc lập:
Analyze/Compare Means/Independent
Samples T test
Trang 15Câu lệnh so sánh hai giá trị TB
Trang 16N Mean Std Deviation
Std Error Mean
Independent Samples Test
Std Error Difference Lower Upper
95% Confidence Interval of the Difference t-test for Equality of Means
Kiểm định Levene có ý nghĩa nên ps không đồng nhất Kết quả kiểm định t với ps
không đồng nhất
Trang 17Phiên giải
Kết quả cho biết trọng lượng sơ sinh ở nhóm con bà mẹ cao huyết áp là 2742 gram (độ lệch chuẩn = 813 gram) so với trọng lượng sơ sinh ở nhóm con bà mẹ không cao huyết áp
là 3192 gram (độ lệch chuẩn 601 gram) Chúng ta cũng nhận thấy trọng lượng trẻ con bà mẹ cao huyết áp thấp hơn
449 gram so với con bà mẹ không bị cao huyết áp (KTC 95% của hiệu số này là từ 271 gram đến 628 gram) và sự khác biệt này có ý nghĩa thống kê với p<0.001
Trang 18So sánh hai giá trị TB mẫu
Câu hỏi: So sánh tuổi thai của trẻ nam và trẻ nữ
- Kiểm tra tính chuẩn của biến (gestwks)
Trang 19So sánh hai giá trị TB mẫu
Biến tuổi thai không có phân bố chuẩn nên chúng ta phải dùng kiểm định phi tham số để so sánh hai giá trị trung bình: Mann – Whitney hoặc Wilcoxon
Trang 20So sánh hai giá trị TB mẫu
Analyze/Non Parametric
tests/2-Independent-Samples Tests
Trang 21Kết quả
Ranks
324 316.06 102404.00
314 323.05 101437.00 638
Sex of infant trai
gai Total Gestational age N Mean Rank Sum of Ranks
Test Statistics a
49754.000 102404.000 -.479 632
Mann-Whitney U Wilcoxon W Z
Asymp Sig (2-tailed)
Gestational age
Grouping Variable: Sex of infant
a
Không có sự khác biệt có ý nghĩa thống kê của thời gian mang thai giữa trẻ nam và trẻ nữ (P = 0,632).
Trang 22So sánh nhiều hơn hai giá trị trung bình
• Sử dụng phép phân tích phương sai (ANOVA)
• Giả định:
¾Biến có phân bố chuẩn
¾Và các phương sai đồng nhất
Trang 23So sánh nhiều giá trị TB
• Nếu biến không có phân bố chuẩn thì kiểm
định Brown- Forsy or Welch thay thế kiểm
Trang 24Kiểm định Post hoc
• LSD (Least –significant Difference): kiểm định này không
kiểm sóat sai lầm loại I mà chỉ thực hiện các kiểm định như kiểm định t (so sánh từng cặp 1)
• Bonferroni: Kiểm sóat sai lầm loại 1 rất tốt khi mà số nhóm
so sánh là nhỏ.
• Turkey: kiểm sóat sai lầm loại 1 tốt nếu sử dụng khi số nhóm
so sánh là lớn và cỡ mẫu trong mỗi nhóm tương tự nhau.
• R-E-G-W Q : kiểm sóat sai lầm loại 1 tốt, được áp dụng nhiều
khi cỡ mẫu của các nhóm tương tự nhau
• Gabriel and Hochberg’s GT2: sử dụng nhiều khi cỡ mẫu của
các nhóm so sánh khác nhau nhiều.
Trang 25So sánh nhiều giá trị TB
Hãy so sánh trọng lượng khi sinh của bé con của những bà mẹ có độ tuổi khác nhau
9Kiểm tra phân bố chuẩn cho biến (bweight)
9Kiểm định ANOVA : Analyze/Compare
Means/One-way ANOVA
Trang 26Kiểm định ANOVA
Trang 27N Mean Std Deviation Std Error Lower Bound Upper Bound
95% Confidence Interval for
Trang 28Kiểm định Levene không
có ý nghĩa thống kê nên
phương sai đồng nhất và
kiểm định ANOVA có
giá trị
Con bà mẹ tuổi dưới 30 có trọng lượng trung bình là 3102 gram, của bà mẹ 30-34
là 3138 gram, của bà mẹ 35-39 là 3133 gram và của con bà mẹ trên 40 là 3113 gram Với giá trị F = 0.077 và mức ý nghĩa (Sig hay còn gọi là p-value) là 0.972 chúng ta kết luận không có sự khác biệt về trọng lượng sơ sinh của các nhóm tuổi
bà mẹ
Trang 29Kiểm định ANOVA và kiểm định t
• ANOVA kiểm soát tốt sai lầm loại 1
• Nếu so sánh chỉ có hai nhóm của hai mẫu độc lập thì kiểm định ANOVA tương đương với kiểm định t
Trang 30Kiểm định ANOVA và kiểm định t
Hãy so sánh trọng lượng sơ sinh của trẻ gái vàtrẻ trai
Kết quả kiểm định t ở phía trên
N Mean Std Deviation Std Error Lower Bound Upper Bound
95% Confidence Interval for
Mean
Minimum Maximum
Trang 31Kiểm định ANOVA và kiểm định t
Test of Homogeneity of Variances
Birthweight
Levene Statistic df1 df2 Sig.
ANOVA
Birthweight
4476041 1 4476041.400 10.663 001 2.68E+08 639 419787.293
2.73E+08 640
Between Groups Within Groups Total
Sum of Squares df Mean Square F Sig.
Trang 32Kiểm định ANOVA và kiểm định t
Hãy so sánh trọng lượng sơ sinh của
con bà mẹ cao huyết áp và bà mẹ
không cao huyết áp
Kết quả kiểm định t ở phía trên
Kiểm định ANOVA
Trang 33Kiểm định ANOVA và kiểm định t
Test of Homogeneity of Variances
Birthweight
Levene Statistic df1 df2 Sig.
N Mean Std Deviation Std Error Lower Bound Upper Bound
95% Confidence Interval for Mean
Minimum Maximum
Kiểm định Levene có ý nghĩa nên phương sai
không đồng nhất vậy kiểm định ANOVA
không có ý nghĩa sử dụng kiểm định phi tham số
Trang 34Tự thực hành
So sánh điểm trung bình cuộc sống trước khi chấn thương (Qol_bef) của các nhóm đối tượng nghề nghiệp khác nhau
(occugroup) (bộ số liệu Biostats2.sav)
Trang 35N Mean Std Deviation Std Error Lower Bound Upper Bound
95% Confidence Interval for
Mean
Minimum Maximum
Test of Homogeneity of Variances
General quality of life before injury
1.537 3 1686 203
Levene Statistic df1 df2 Sig.
ANOVA
General quality of life before injury
2733.000 3 911.000 15.867 000 96802.363 1686 57.415
99535.363 1689
Between Groups Within Groups Total
Sum of Squares df Mean Square F Sig.
Trang 36Kiểm định post hoc
Trang 37Kiểm định Post hoc
Multiple Comparisons
Dependent Variable: General quality of life before injury
Hochberg
-.57559 49001 807 -1.8663 7151 4.58861* 72552 000 2.6776 6.4996 -.87120 64620 691 -2.5733 8309 57559 49001 807 -.7151 1.8663 5.16421* 81410 000 3.0199 7.3085 -.29560 74428 999 -2.2560 1.6648 -4.58861* 72552 000 -6.4996 -2.6776 -5.16421* 81410 000 -7.3085 -3.0199 -5.45981* 91663 000 -7.8742 -3.0454 87120 64620 691 -.8309 2.5733 29560 74428 999 -1.6648 2.2560 5.45981* 91663 000 3.0454 7.8742
(J) occupation groups study ing
children unemployer employer children unemployer employer study ing unemployer employer study ing children
(I) occupation groups
95% Confidence Interval
The mean difference is significant at the 05 level.
*
Trang 38Kiểm định post hoc
General quality of life before injury
Subset for alpha = 05
Means for groups in homogeneous subsets are displayed.
Uses Harmonic Mean Sample Size = 212.586.
a
The group sizes are unequal The harmonic mean
of the group sizes is used Type I error levels are
not guaranteed.
b
Trang 39Kết quả
Trung bình điểm chất lượng cuộc sống trước chấn thương của trẻ
em, là 56 điểm, thấp hơn các nhóm còn lại, của những người đi làm là 61 điểm, những người đi học là 61 điểm, của những người không đi làm là 61, có ý nghĩa thống kê ( P < 0,001)
Trang 40Tự thực hành
• Hãy trọng lượng sơ sinh của con theo các nhóm tuổi của mẹ
Trang 41Kiểm định
• Analyze/Non parametric Tests/ K independent Sample
Trang 42Test Statistics a,b
3.056 3 383
Trang 44So sánh hai TB ghép cặp
Hãy so sánh trung bình điểm chất lượng cuộc sống trước chấn thương và sau chấn
thương của những người trong nghiên
cứu Chấn thương (bộ số liệu
Biostats2.sav)
Trang 46Compare means/Paired – Sample
t test
Trang 47Paired Samples Statistics
General quality of life before injury general quality of life after injury
Pair
1
Std Error Mean
Paired Samples Correlations
1692 787 000
General quality of life before injury & gener quality of life after inju
General quality of life
before injury - genera
quality of life after inju
Pair
1
Mean Std Deviation
Std Error Mean Lower Upper
95% Confidence Interval of the Difference Paired Differences
t df Sig (2-tailed)
Trang 48Hồi quy và tương quan
Hãy xây dựng mô hình hồi quy giữa tuổi thai (gestwks) và trọng lượng thai
(bweight).
- Vẽ biểu đồ phân tán
- Xây dựng đường hồi quy
Trang 49Vẽ biểu đồ phân tán
Gestational age
50 40
30 20
Trang 50Analyze – Regression – Linear
Trang 51Kết quả
Model Summary
.738a .544 543 441.16
Model 1
R R Square
Adjusted
R Square
Std Error of the Estimate
Predictors: (Constant), Gestational age
a
ANOVA b
1.48E+08 1 148354317.0 762.255 000a1.24E+08 639 194625.673
Predictors: (Constant), Gestational age
Beta
Standardi zed Coefficien ts
t Sig.
Dependent Variable: Birthweight
a
Trang 52Trọng lượng sơ sinh = -4865.245 + 206.641 x tuổi thai (tính theo tuần).
Trang 53Hồi quy và tương quan
• Tương quan cho chúng ta biết mối liên quan giữa hai biến
• Hệ số tương quan nằm trong khoảng -1 đến 1
• Nếu hệ số tương quan âm thì tương quan
nghịch
• Nếu hệ số tương quan mà dương thì tương quan thuận
Trang 54Hệ số tương quan
Tương quan mạnh
75 , 0
≥
R
Tương quan bình thường
30 , 0 70
Trang 55Hồi quy
• Thể hiện mối quan hệ giữa các biến
• Hiệu chỉnh giữa các biến
¾ Trẻ gái ở bà mẹ không cao huyết áp:
Trọng lượng thai = -4729.05 + tuổi thai x 201.425
¾ Trẻ trai ở bà mẹ không cao huyết áp:
Trọng lượng thai = -4561.23 + tuổi thai x 201.425
¾ Trẻ gái ở bà mẹ cao huyết áp:
Trọng lượng thai = -4871.19 + tuổi thai x 201.425
¾ Trẻ trai ở bà mẹ cao huyết áp:
Trọng lượng thai = -4703.37 + tuổi thai x 201.425
Trang 56Thảo luận
• Sử dụng kiểm định t so sánh trọng lượng sơ sinh
của những trẻ con của bà mẹ cao huyết áp và
con những bà mẹ không bị cao huyết áp.
• Xây dựng mô hình trọng lượng sơ sinh theo tuổi
thai, cao huyết áp mẹ và giới tính cho hệ số của biến cao huyết áp
So sánh sự khác biệt giữa trọng lượng sơ sinh ( của những bà mẹ CHA và bà mẹ không CHA)
Trang 57Bài tập thực hành
• Sinh viên làm bài tập thực hành