BÀI THỰC HÀNH PHÂN TÍCH SỐ LIỆU SỬ DỤNG PHẦN MỀM SPSS 1. Mô tả tuổi mẹ, giới tính và trọng lượng sơ sinh của trẻ. Vẽ biểu đồ phù hợp. Xem xét biến: Tuổi của mẹ: biến liên tục Giới tính: là biến phân loại, có 2 nhóm Thực hiện thống kê mô tả biến liên tục hay biến phân loại ta tiến hành vào anlyzeDescriptive statisticfrequencies
Trang 1BÀI THỰC HÀNH PHÂN TÍCH SỐ LIỆU
SỬ DỤNG PHẦN MỀM SPSS
Giới thiệu bộ số liệu: Cân nặng sơ sinh của trẻ chịu ảnh hưởng của rất nhiều yếu tố thuộc về
mẹ và cả những yếu tố thuộc về thai nhi Các nhà nghiên cứu tại một một nhà hộ sinh đã tiến hành thu thập số liệu của 586 trẻ được sinh ra tại đây trong khoảng thời gian điều tra Các trẻ được sinh ra đều được cân để xác định cân nặng sơ sinh ngoài ra các nhà nghiên cứu cũng ghi nhận một số thông tin về tiền sử thai sản và thông tin cá nhân của mẹ
Anh/ chị hãy sử dụng bộ số liệu ivf2.sav của nghiên cứu này có trên elearning để phân tích
và trả lời các câu hỏi sau:
1 Mô tả tuổi mẹ, giới tính và trọng lượng sơ sinh của trẻ Vẽ biểu đồ phù hợp.
*Xem xét biến:
- Tuổi của mẹ: biến liên tục
- Giới tính: là biến phân loại, có 2 nhóm
Thực hiện thống kê mô tả biến liên tục hay biến phân loại ta tiến hành vào
anlyze/Descriptive statistic/frequencies
Chúng ta không thể đưa cả hai loại biến liên tục và phân loại phân tích mô tả một lượt được
vì mỗi loại biến có các tùy chọn là khác nhau Mà phải đưa lần lượt từng loại biến vào
variable(s):
1.1 Mô tả biến tuổi của mẹ (biến liên tục):
- Click bỏ lựa chọn thống kê mô tả tần xuất:
Tại tùy chọn tatistics ta tiến hành chọn các
đại lượng mô tả vị trí trung tâm và giá trị
phân tán đặc trưng cho một biến liên tục như
hình
Tại tùy chọn Chart click chọn như hình
Trang 2Quay về cửa số frequancies, click chọn OK để cho kết quả:
Statistics
tuoi me (nam)
Std Deviation 3.835
Phiên giải: “Trong 586 bà mẹ nghiên cứu Trung bình tuổi của bà mẹ là
34,08 với độ lệch chuẩn là 3.84 Tuổi nhỏ nhất 20 và tuổi cao nhất là 43 tuổi.”
1.2 Mô tả biến giới tính (Biến phân loại có hai nhóm).
- Cần lấy thông tin mô tả tần xuất:
- Tại tùy chọn chart, ta có thể vẽ biểu đồ hình cột hoặc hình bánh.
gioi tinh tre
Frequency Percent Valid Percent Cumulative
Percent
Valid
Phiên giải: Trong 586 trẻ đẻ ra sống, tỷ lệ trẻ gái (50.5%) cao hơn tỷ lệ trẻ trai
(49.5%).
Trang 32 Một nghiên cứu cộng đồng cho thấy cân nặng sơ sinh trung bình của trẻ là khoảng 3000gram Theo anh/chị, cân nặng sơ sinh TB của nhóm trẻ trong NC
có khác cân nặng TB của quần thể trẻ sơ sinh từ NC cộng đồng không?
*Xác định biến: Cân nặng sơ sinh là biến liên tục
Bằng việc thực hiện mô tả biến liên tục cân nặng sơ sinh như mục 1.1, ta thấy biến cân nặng
sơ sinh có phân phối chuẩn với cân nặng trung bình là 3150 gram với độ lệch chuẩn là 487,29 gram
*Ta tiến hành so sánh trung bình mẫu với 1 giá trị
Đưa trọng lượng sơ sinh vào test variable(s) và giá trị so sánh 3000 gram vào test value
Click OK để xem và đọc kết quả so sánh:
One-Sample Statistics
N Mean Std Deviation Std Error Mean trong luong so sinh (gram) 586 3150.73 487.288 20.130
One-Sample Test
Test Value = 3000
Trang 4t df Sig (2-tailed) Mean Difference 95% Confidence Interval of the
Difference
trong luong so sinh
Phiên giải: “Trong 586 trẻ nghiên cứu, trọng lượng sơ sinh trung bình (3150 gram, độ lệch chuẩn
478,29 gram) là cao hơn một nghiên cứu tại cộng đồng khác (3000 gram) Sự khác biệt này có ý
nghĩa thống kê với ttest = 7.49, p<0.05 Khoảng tin cậy 95% sự khác biệt này dao động từ 111,19
gram đến 190,26 gram.”
3 Tuổi thai ở nhóm mẹ bị tăng huyết áp có khác tuổi thai ở nhóm bà mẹ không tăng huyết áp không?
*Xác định biến:
- Tuần tuổi thai là biến liên tục
- Tình trạng tăng huyết áp của bà mẹ là biến phân loại với 2 nhóm
*Tiến hành kiểm định t-test để so sánh giá trị trung bình giữa 2 nhóm
Đưa biến liên tục, tuần tuổi thai vào test variable(s) và biến phân loại tình trạng tăng huyết
áp của bà mẹ vào grouping variable Và Click vào define groups để đưa lần lượt các giá
trị mã hóa của biến tình trạng tăng huyết áp
Sau đó click OK để xem và đọc kết quả:
Group Statistics
tang huyet ap thai ki N Mean Std Deviation Std Error Mean tuoi thai (tuan) HA binh thuong 511 39.00 1.781 .079
Independent Samples Test
Levene's Test for Equality of Variances
t-test for Equality of Means
(2-tailed)
Mean Difference
Std Error Difference
95% Confidence Interval of the Difference Lower Upper
Trang 5tuoi thai
(tuan)
Equal variances
Equal variances
Phiên giải: “Trong 511 bà mẹ có huyết áp bình thường có tuần tuổi thai trung bình là 39 tuần với
độ lệch chuẩn là 1,78 tuần Trong 75 bà mẹ bị tăng huyết áp có trung bình tuần tuổi thai là 38.26 với
độ lệch chuẩn 1.71 tuần Phương sai tuần tuổi thai giữa 2 nhóm bà mẹ bị tăng huyết áp và không bị tăng huyết áp là như nhau với Plevene’sTest=0.766<0.05 Trung bình tuần tuổi thai của bà mẹ bị tăng huyết áp cao hơn trung bình tuần tuổi thai của bà mẹ bình thường một cách có ý nghĩa thống kê với ttest = 3.367, p=0.001<0.05 Khoảng tin cậy 95% sự khác biệt là 0.307 đến 1.168 tuần tuổi thai.”
4 Cân nặng sơ sinh của trẻ nam và nữ có khác nhau hay không?
*Xác định biến:
- Trọng lượng sơ sinh là biến liên tục có phân phối chuẩn
- Giới tính của trẻ là biến phân loại với 2 nhóm
*Tiến hành kiểm định t-test để so sánh giá trị trung bình giữa 2 nhóm
*Cách làm tương tự như câu 3
5 Ở những bà mẹ có nghề nghiệp khác nhau: Tuổi thai của trẻ có khác nhau hay không? Trọng lượng sơ sinh của trẻ có khác nhau hay không?
*Xác định biến:
- Tuần tuổi thai của trẻ là biến liên tục có phân phối chuẩn.
- Nghề nghiệp của bà mẹ là biến phân loại, có 3 nhóm
*Tiến hành kiểm định One-way ANOVA để so sánh giá trị trung bình nhiều hơn 2 nhóm.
*Cách làm:
Đưa biến liên tục (phụ thuộc) – Tuần tuổi thai vào Dependent List và biến phân loại (độc lập) – Nhóm nghề nghiệp vào Factor.
Trang 6Tại tùy chọn Post Hoc, để xem xét trung bình giữa từng cặp nhóm nào thực sự khác nhau:
- Click chọn Kiểm định Tukey: Nếu phương sai giữa các nhóm là đồng nhất.
- Click chọn kiểm định Dunnett’s T3: Nếu phương sai giữa các nhóm là khác biệt
- Ghi chú: Về sau, ta chỉ đọc kết quả 1 trong 2 kiểm định này sau khi đã xem xét tính đồng nhất phương sai giữa các nhóm
Tại tùy chọn Option, ta click chọn
- Descriptive để tiến hành mô tả giá trị trung
tâm (trung bình) và độ phân tán (độ lệch
chuẩn)
- Homogeneity of variance test để xem xét
phương sai có đồng nhất hay không đồng
nhất giữa các nhóm
Quay trở về cửa sổ ban đầu click OK để xem và đọc kết quả
Descriptives Bảng mô tả, giá trị trung bình, độ lệch chuẩn tuần tuổi thai từng ở
từng nhóm
Trang 7tuoi thai (tuan)
N Mean Std Deviation Std Error 95% Confidence Interval for
Mean Minimum Maximum Lower Bound Upper Bound
Test of Homogeneity of Variances
tuoi thai (tuan)
Levene Statistic df1 df2 Sig.
ANOVA
tuoi thai (tuan)
Sum of Squares df Mean Square F Sig.
Within Groups 1847.583 583 3.169
Post Hoc Tests
Multiple Comparisons
Dependent Variable: tuoi thai (tuan)
(I) nghe nghiep cua
me (J) nghe nghiep cua me DifferenceMean
(I-J)
Std.
Error Sig. 95% Confidence IntervalLower
Bound
Upper Bound
Tukey
HSD
Dunnett
T3
* The mean difference is significant at the 0.05 level.
Homogeneous Subsets
tuoi thai (tuan)
nghe nghiep cua me N Subset for alpha = 0.05
Tukey HSD a,b
Means for groups in homogeneous subsets are displayed.
a Uses Harmonic Mean Sample Size = 162.330.
b The group sizes are unequal The harmonic mean of the group sizes is used Type I
error levels are not guaranteed.
Cho biết phương sai giữa các nhóm là không đồng nhất, do đó sẽ đọc kiểm định Dunnett’s T3
Trang 8Phiên giải:
- Trung bình tuần tuổi thai ở các nhóm bà mẹ có nghề nghiệp khác nhau là có sự khác biệt
Trung bình số tuần tuổi thai của nhóm bà mẹ làm nghề tự do có giá trị lớn nhất (với trung
bình là 39.25, độ lệch chuẩn là 1.44 tuần); thấp nhất ở nhóm bà mẹ làm công nhân (với trung bình là 38.71; độ lệch chuẩn là 1.93 tuần).
- Có ít nhất một cặp nhóm nghề nghiệp có sự khác biệt về tuần tuổi thai với p-Anova= 0.041
<0.05
- Có sự khác biệt giữa phương sai tuần tuổi thai giữa 3 nhóm nghề nghiệp khác nhau của bà
mẹ với Plevene’s Test= 0.032 < 0.05 Sử dụng kiểm định Dunett’s T3 để xác định trung bình tuần tuổi thai thực sự khác nhau ở nhóm nào
- Với kiểm định Dunnett’s T3, cho biết có sự khác biệt có nghĩa thống kê về tuần tuổi thai giữa bà mẹ làm nghề tự do với bà mẹ làm công nhân với p=-0.018<0.05 Khoảng tin cậy 95% khác biệt giữa 2 nhóm này là từ 0.07 đến 1.01 tuần Và không tìm thấy sự khác biệt giữa 2 nhóm bà mẹ làm nghề tư do với viên chức (p=0.237>0.05) và bà mẹ làm viên chức với công nhân (p=0.439>0.05)
Trang 96 Biết rằng trẻ có cân nặng dưới 2500 gram là sơ sinh nhẹ cân, từ 2500 gram trở lên là bình thường Các nhà nghiên cứu cho rằng các bà mẹ sinh con ở lứa tuổi
từ 35 trở lên sẽ ảnh hưởng nhiều đến sức khỏe của con, một trong những ảnh hưởng đó là cân nặng của sơ sinh của trẻ Theo anh/chị, nhận định này có đúng không? Nếu có, sự ảnh hưởng đó thể hiện như thế nào?
*Chuẩn bị biến.
Phân loại tình trạng nhẹ cân sơ sinh chưa có trong bộ số liệu, do đó ta cần tạo biến
phân tích này Bằng cách vào Transform/Recode into different Variables
- Đưa biến trọng lượng sơ sinh vào Numeric Variable -> Outvariable
- Đặt tên biến mới tại name
- Gán nhán giá trị biến tại Label
- Click change
Click chọn Old and new Values để thiết lập điều kiện nhóm giá trị của biến.
Giá trị biến Nhãn giá trị Đặt điều kiện trong SPSS
(>= 2500 gram)
=
Click continue và Ok để thực hiện Sau đó vào variable view để gán nhãn với điều kiện ở
trên
Phân nhóm tuổi của bà mẹ, theo một cách tương tự vào Transform/Recode into
Trang 10different Variables để thực hiện.
=
=
Click continue và Ok để thực hiện Sau đó vào variable view để gán nhãn với điều kiện ở
trên
*Mô tả biến số:
- Phân nhóm trọng lượng sơ sinh của trẻ là biến phân loại, 2 nhóm (Biến phụ thuộc)
- Phân nhóm Tuổi của bà mẹ là biến phân loại, 2 nhóm (Biến độc lập)
*Sử dụng kiểm định khi bình phương để so sánh giá trị tỷ lệ giữa 2 nhóm
*Thao tác trên SPSS:
Đưa:
- Biến số độc lập – Nhóm tuổi của bà mẹ vào hàng
- Biến số phụ thuộc – nhóm cân nặng của trẻ vào cột
Trang 11Tại tùy chọn statistic, click chọn:
- Kiểm định khi bình phương chi quare
- Tỷ số chênh OR, để sự khác biệt thực
sự giữa các nhóm (Risk)
Tại tùy chọn cell, click chọn:
- Observed: Lấy giá trị quan sát thực
- Row: Lấy tỷ lệ % theo hàng (tỷ lệ
nhẹ cân ở từng nhóm bà mẹ).
Trang 12Case Processing Summary
Cases
Nhom tuoi cua ba me * Phan
Nhom tuoi cua ba me * Phan loai can nang so sinh Crosstabulation
Phan loai can nang so sinh Total Nhe can (<2500
gram)
Binh thuong (>=2500 gram)
Nhom tuoi cua ba me
> 35 tuoi
% within Nhom tuoi cua ba
=< 35 tuoi
% within Nhom tuoi cua ba
Total
% within Nhom tuoi cua ba
Chi-Square Tests
Value df Asymp Sig
(2-sided) Exact Sig (2-sided) Exact Sig (1-sided)
Continuity Correction b 000 1 1.000
Linear-by-Linear Association 014 1 907
N of Valid Cases 586
a 0 cells (0.0%) have expected count less than 5 The minimum expected count is 21.41.
b Computed only for a 2x2 table
Risk Estimate
Value 95% Confidence Interval
Odds Ratio for Nhom tuoi cua ba me (>
For cohort Phan loai can nang so sinh =
For cohort Phan loai can nang so sinh =
Phiên giải:
- Trong 586 đối tượng nghiên cứu Tỷ lệ sinh con nhẹ cân ở nhóm bà mẹ trên 35 tuổi (9.4%) thấp hơn nhóm bà mẹ từ 35 tuổi trở xuống (9.7%) Tỷ số chênh chỉ ra sự khác biệt này là 0.967 với Khoảng tin cậy 95% của sự khác biệt này từ 0.547 đến 1.707 Tuy nhiên sự khác biệt này là không có ý nghĩa thông kê với X2<0.001, p=1<0.05
- Trong nghiên cứu này, chúng ta chưa thể kết luận rằng các bà mẹ sinh con ở lứa tuổi
từ 35 trở lên sẽ ảnh hưởng nhiều đến sức khỏe của con, một trong những ảnh hưởng
đó là cân nặng của sơ sinh của trẻ
Trang 137 Giả sử tỷ số giới tính khi sinh của trẻ nam: nữ là 105:100 Theo anh/chị, tỷ số này trong nghiên cứu trên có còn đúng không?
Xác định biến:
- Giới tính của trẻ là biến phân loại có 2 nhóm (0=Nữ, 1 Nam)
- Tỷ số so sánh nam/nữ: 105/100 0.52195/0.47805
*Sử dụng kiểm định khi bình phương để so sánh giá trị tỷ lệ với số đã cho trước
*Thao tác trên SPSS:
Vào anlyze/Noparamatric test/…/chiquare
Đưa biến giới tính vào Test
Variables list
*Giới tính mã hóa (0.Nữ,
1.Nam) và Spss đặt thứ tự từ
nhỏ đến lớn, do đó ta đưa giá tỷ
lệ của nữ vào trước (0.47805),
tiếp đó đến Nam (0.52195)
Click OK để xem và đọc kết quả
Chi-Square Test
Frequencies
gioi tinh tre
Observed N Expected N Residual
Test Statistics
gioi tinh tre
a 0 cells (0.0%) have expected frequencies
less than 5 The minimum expected cell
frequency is 280.1.
Phiên giải: Trong 586 đối tượng nghiên cứu, số trẻ nam ít hơn số trẻ nữ, tỷ số nam/nữ của
nghiên cứu là 290/296 Không có sự khác biệt giữa tỷ số này với tỷ số nghiên cứu trước đó nam/nữ là 105/100 với X2=1.271, p=0.190<0.05
Trang 148 Huyết áp thường chịu ảnh hưởng của nhiều yếu tố trong đó có cả yếu tố về tuổi tác và tuổi thai Nếu xác định thai từ 35 tuần trở lên là đủ tháng (qui định cho
NC này) và dưới 35 tuần là thiếu tháng, nhóm tuổi mẹ được chia thành 2 nhóm như câu 2; theo anh/chị, tình trạng tăng huyết áp của mẹ có liên quan đến nhóm tuổi mẹ không? Tình trạng tăng HA của mẹ có liên quan đến tuổi thai không? Tuổi thai có liên quan đến nhóm tuổi mẹ không? Anh/chị có nhận xét gì về mối quan hệ của 3 yếu tố này?
*Xác định biến:
- Tăng huyết áp là biến phân loại có 2 nhóm (1 tăng huyết áp, 0=Không tăng huyết áp)
- Nhóm tuổi thai là biến phân loại có 2 nhóm (1.Thiếu tháng (<35 tuần); 2 Đủ tháng (>= 35 tuần))
- Nhóm tuổi mẹ là biến phân loại có 2 nhóm
*Xác định kiểm định thống kê:
- Tình trạng tăng huyết áp của mẹ có liên quan đến nhóm tuổi mẹ không? (So sánh giá trị tỷ lệ giữa 2 nhóm Cách làm tương tự như câu 6).
- Tình trạng tăng HA của mẹ có liên quan đến tuổi thai không? (So sánh giá trị tỷ lệ giữa 2 nhóm Cách làm tương tự như câu 6).
- Nhóm tuổi thai có liên quan đến nhóm tuổi mẹ không? (So sánh giá trị tỷ lệ giữa 2 nhóm Cách làm tương tự như câu 6).
Phiên giải: Lưu ý mối quan hệ đường đi giữa phơi nhiễm, và bệnh để kết luận về mối quan
hệ giữa các yếu tố
Lưu ý: cách mã hóa giá trị của biến để được bảng 2x2 như trong dịch tễ
Trang 159 Theo anh/chị, tuổi thai có tương quan với cân nặng sơ sinh của trẻ không? Giải thích mối tương quan (nếu có)
*Xác định biến số:
- Tuổi thai là biến liên tục, có phân phối chuẩn
- Cân nặng sơ sinh của trẻ là biến liên tục có phân phối chuẩn
*Sử dụng hệ số tương quan R để xác định mối liên quan giữa 2 biến liên tục.
*Thao tác trên SPSS.
Đưa các biến 2 liên tục phân tích vào
variable.
Chọn hệ số tương quan person Click OK để cho kết quả:
Correlations
tuoi thai (tuan) trong luong so
sinh (gram) tuoi thai (tuan)
Pearson Correlation 1 615 **
trong luong so sinh (gram)
Pearson Correlation 615 ** 1 Sig (2-tailed) 000
** Correlation is significant at the 0.01 level (2-tailed).
Phiên giải:
- Có mối tương quan giữa tuổi thai và trọng lượng sơ sinh của trẻ (p<0.05)
- R=0.615>0, cho thấy rằng tuổi thai và trọng lượng sơ sinh có mối tương quan thuận, khi tuổi thai tăng thì trọng lượng so sinh tăng
- R=0,615 > 0,5 có thể thấy có mối quan hệ rất mạnh giữa tuần tuổi thai và trong lượng
so sinh của trẻ
Ghi chú:
Hệ số tương quan luôn nằm trong đoạn [-1, 1]
- R=0 (hay r<0,1): Không có mối liên hệ tuyến tính giữa 2 biến đố
- 0,1 ≤ r ≤ 0,3: Quan hệ yếu
- 0,3 ≤ r ≤ 0,5: Quan hệ trung bình
- R > 0,5: Quan hệ mạnh