1. Trang chủ
  2. » Kinh Tế - Quản Lý

thống kê cho biến liên tục

57 620 2

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 57
Dung lượng 607,03 KB

Nội dung

So sánh hai giá trị TB mẫu• Nếu biến không có phân bố chuẩn dùng kiểm định phi tham số: Mann- Whitney hoặc Wilconxon • Nếu phương sai đồng nhất sử dụng kiểm định t cho phương sai đồng nh

Trang 1

THỐNG KÊ CHO BIẾN LIÊN TỤC

Nguyễn thị Trang Nhung

Trang 2

Mục tiêu

Sau khi hoàn thành bài học này, sinh viên có thể:

- Thực hiện được các kiểm định cho biến liên tục

- Phiên giải được kết quả đầu ra của máy tính

- Viết được báo cáo phân tích số liệu cho biến định lượng

Trang 3

Nội dung

• Ước lượng cho một giá trị trung bình mẫu

• Ước lượng, so sánh cho giá trị trung bình của hai mẫu độc lập

• Ước lượng so sánh cho nhiều hơn hai giá trịtrung bình mẫu độc lập

• Ước lượng so sánh cho hai trung bình của hai mẫu phụ thuộc

Trang 4

So sánh một giá trị TB mẫu

• Câu hỏi: TB tuổi khi sinh con của những phụ

nữ này có khác 35 tuổi không?

Để đánh giá một giá trị trung bình chúng ta tiến hành kiểm tra phân bố của biến

Trang 6

So sánh một giá trị trung bình mẫu

One-Sample Statistics

640 33.9781 3.87029 15299 Maternal age

N Mean Std Deviation

Std Error Mean

One-Sample Test

-6.679 639 000 -1.02188 -1.3223 -.7215 Maternal age

t df Sig (2-tailed)

Mean Difference Lower Upper

95% Confidence Interval of the Difference Test Value = 35

Trung bình tuổi sinh con của những phụ nữ trong nghiên cứu này là 34

tuổi thấp hơn tuổi sinh con có nguy cơ của nghiên cứu đựoc so sánh có

ý nghĩa thống kê (P< 0,001, 95% CI của sự khác biệt là 0,7 tuổi đến 1,3 tuổi)

Trang 7

So sánh hai giá trị TB mẫu

H0: hai phương sai đồng nhất

Ha: Hai phương sai không đồng nhất

Trang 8

So sánh hai giá trị TB mẫu

• Nếu biến không có phân bố chuẩn dùng kiểm định phi tham số: Mann- Whitney hoặc

Wilconxon

• Nếu phương sai đồng nhất sử dụng kiểm định t cho phương sai đồng nhất

• Nếu phương sai không đồng nhất sử dụng

kiểm định t cho phương sai không đồng nhất

Trang 9

So sánh hai giá trị TB mẫu

Câu hỏi: So sánh trọng lượng sơ sinh của trẻ nam

và trẻ nữ

- Kiểm tra tính chuẩn của biến (bweight)

- Kiểm định thống kê: dùng kiểm định t cho hai mẫu độc lập:

Analyze/Compare Means/Independent

Samples T test

Trang 10

So sánh hai giá trị TB mẫu

Trang 11

gai Birthweight

N Mean Std Deviation

Std Error Mean

Independent Samples Test

Std Error Difference Lower Upper

95% Confidence Interval of the Difference t-test for Equality of Means

chuẩn

•Giá trị P của kiểm định t

•Kiểm

định

Levene

Trang 12

Std Error Difference Lower Upper

95% Confidence Interval of the Difference t-test for Equality of Means

Giá trị của kiểm định t

gai Birthweight N Mean Std Deviation

Std Error Mean

Do s 2

max / s 2

min = 665*665/629*629 < 3 nên có thể kết luận là phương sai đồng nhất.

Trang 13

Kết quả

• Trung bình cân nặng khi sinh của trẻ trai là 3,2

kg (SD = 0,7) cao hơn trung bình cân nặng của trẻ gái là 3,0 kg (SD = 0,6) có ý nghĩa thống

kê (P< 0,001; 95%CI của sự khác biệt là 266,0g)

Trang 14

64,5-So sánh hai giá trị TB mẫu

Câu hỏi: So sánh trọng lượng sơ sinh của con

của những bà mẹ bị THA và không bị THA

- Kiểm tra tính chuẩn của biến (bweight)

- Kiểm định thống kê: dùng kiểm định t cho hai mẫu độc lập:

Analyze/Compare Means/Independent

Samples T test

Trang 15

Câu lệnh so sánh hai giá trị TB

Trang 16

N Mean Std Deviation

Std Error Mean

Independent Samples Test

Std Error Difference Lower Upper

95% Confidence Interval of the Difference t-test for Equality of Means

Kiểm định Levene có ý nghĩa nên ps không đồng nhất Kết quả kiểm định t với ps

không đồng nhất

Trang 17

Phiên giải

Kết quả cho biết trọng lượng sơ sinh ở nhóm con bà mẹ cao huyết áp là 2742 gram (độ lệch chuẩn = 813 gram) so với trọng lượng sơ sinh ở nhóm con bà mẹ không cao huyết áp

là 3192 gram (độ lệch chuẩn 601 gram) Chúng ta cũng nhận thấy trọng lượng trẻ con bà mẹ cao huyết áp thấp hơn

449 gram so với con bà mẹ không bị cao huyết áp (KTC 95% của hiệu số này là từ 271 gram đến 628 gram) và sự khác biệt này có ý nghĩa thống kê với p<0.001

Trang 18

So sánh hai giá trị TB mẫu

Câu hỏi: So sánh tuổi thai của trẻ nam và trẻ nữ

- Kiểm tra tính chuẩn của biến (gestwks)

Trang 19

So sánh hai giá trị TB mẫu

Biến tuổi thai không có phân bố chuẩn nên chúng ta phải dùng kiểm định phi tham số để so sánh hai giá trị trung bình: Mann – Whitney hoặc Wilcoxon

Trang 20

So sánh hai giá trị TB mẫu

Analyze/Non Parametric

tests/2-Independent-Samples Tests

Trang 21

Kết quả

Ranks

324 316.06 102404.00

314 323.05 101437.00 638

Sex of infant trai

gai Total Gestational age N Mean Rank Sum of Ranks

Test Statistics a

49754.000 102404.000 -.479 632

Mann-Whitney U Wilcoxon W Z

Asymp Sig (2-tailed)

Gestational age

Grouping Variable: Sex of infant

a

Không có sự khác biệt có ý nghĩa thống kê của thời gian mang thai giữa trẻ nam và trẻ nữ (P = 0,632).

Trang 22

So sánh nhiều hơn hai giá trị trung bình

• Sử dụng phép phân tích phương sai (ANOVA)

• Giả định:

¾Biến có phân bố chuẩn

¾Và các phương sai đồng nhất

Trang 23

So sánh nhiều giá trị TB

• Nếu biến không có phân bố chuẩn thì kiểm

định Brown- Forsy or Welch thay thế kiểm

Trang 24

Kiểm định Post hoc

• LSD (Least –significant Difference): kiểm định này không

kiểm sóat sai lầm loại I mà chỉ thực hiện các kiểm định như kiểm định t (so sánh từng cặp 1)

• Bonferroni: Kiểm sóat sai lầm loại 1 rất tốt khi mà số nhóm

so sánh là nhỏ.

• Turkey: kiểm sóat sai lầm loại 1 tốt nếu sử dụng khi số nhóm

so sánh là lớn và cỡ mẫu trong mỗi nhóm tương tự nhau.

• R-E-G-W Q : kiểm sóat sai lầm loại 1 tốt, được áp dụng nhiều

khi cỡ mẫu của các nhóm tương tự nhau

• Gabriel and Hochberg’s GT2: sử dụng nhiều khi cỡ mẫu của

các nhóm so sánh khác nhau nhiều.

Trang 25

So sánh nhiều giá trị TB

Hãy so sánh trọng lượng khi sinh của bé con của những bà mẹ có độ tuổi khác nhau

9Kiểm tra phân bố chuẩn cho biến (bweight)

9Kiểm định ANOVA : Analyze/Compare

Means/One-way ANOVA

Trang 26

Kiểm định ANOVA

Trang 27

N Mean Std Deviation Std Error Lower Bound Upper Bound

95% Confidence Interval for

Trang 28

Kiểm định Levene không

có ý nghĩa thống kê nên

phương sai đồng nhất và

kiểm định ANOVA có

giá trị

Con bà mẹ tuổi dưới 30 có trọng lượng trung bình là 3102 gram, của bà mẹ 30-34

là 3138 gram, của bà mẹ 35-39 là 3133 gram và của con bà mẹ trên 40 là 3113 gram Với giá trị F = 0.077 và mức ý nghĩa (Sig hay còn gọi là p-value) là 0.972 chúng ta kết luận không có sự khác biệt về trọng lượng sơ sinh của các nhóm tuổi

bà mẹ

Trang 29

Kiểm định ANOVA và kiểm định t

• ANOVA kiểm soát tốt sai lầm loại 1

• Nếu so sánh chỉ có hai nhóm của hai mẫu độc lập thì kiểm định ANOVA tương đương với kiểm định t

Trang 30

Kiểm định ANOVA và kiểm định t

Hãy so sánh trọng lượng sơ sinh của trẻ gái vàtrẻ trai

Kết quả kiểm định t ở phía trên

N Mean Std Deviation Std Error Lower Bound Upper Bound

95% Confidence Interval for

Mean

Minimum Maximum

Trang 31

Kiểm định ANOVA và kiểm định t

Test of Homogeneity of Variances

Birthweight

Levene Statistic df1 df2 Sig.

ANOVA

Birthweight

4476041 1 4476041.400 10.663 001 2.68E+08 639 419787.293

2.73E+08 640

Between Groups Within Groups Total

Sum of Squares df Mean Square F Sig.

Trang 32

Kiểm định ANOVA và kiểm định t

Hãy so sánh trọng lượng sơ sinh của

con bà mẹ cao huyết áp và bà mẹ

không cao huyết áp

Kết quả kiểm định t ở phía trên

Kiểm định ANOVA

Trang 33

Kiểm định ANOVA và kiểm định t

Test of Homogeneity of Variances

Birthweight

Levene Statistic df1 df2 Sig.

N Mean Std Deviation Std Error Lower Bound Upper Bound

95% Confidence Interval for Mean

Minimum Maximum

Kiểm định Levene có ý nghĩa nên phương sai

không đồng nhất vậy kiểm định ANOVA

không có ý nghĩa sử dụng kiểm định phi tham số

Trang 34

Tự thực hành

So sánh điểm trung bình cuộc sống trước khi chấn thương (Qol_bef) của các nhóm đối tượng nghề nghiệp khác nhau

(occugroup) (bộ số liệu Biostats2.sav)

Trang 35

N Mean Std Deviation Std Error Lower Bound Upper Bound

95% Confidence Interval for

Mean

Minimum Maximum

Test of Homogeneity of Variances

General quality of life before injury

1.537 3 1686 203

Levene Statistic df1 df2 Sig.

ANOVA

General quality of life before injury

2733.000 3 911.000 15.867 000 96802.363 1686 57.415

99535.363 1689

Between Groups Within Groups Total

Sum of Squares df Mean Square F Sig.

Trang 36

Kiểm định post hoc

Trang 37

Kiểm định Post hoc

Multiple Comparisons

Dependent Variable: General quality of life before injury

Hochberg

-.57559 49001 807 -1.8663 7151 4.58861* 72552 000 2.6776 6.4996 -.87120 64620 691 -2.5733 8309 57559 49001 807 -.7151 1.8663 5.16421* 81410 000 3.0199 7.3085 -.29560 74428 999 -2.2560 1.6648 -4.58861* 72552 000 -6.4996 -2.6776 -5.16421* 81410 000 -7.3085 -3.0199 -5.45981* 91663 000 -7.8742 -3.0454 87120 64620 691 -.8309 2.5733 29560 74428 999 -1.6648 2.2560 5.45981* 91663 000 3.0454 7.8742

(J) occupation groups study ing

children unemployer employer children unemployer employer study ing unemployer employer study ing children

(I) occupation groups

95% Confidence Interval

The mean difference is significant at the 05 level.

*

Trang 38

Kiểm định post hoc

General quality of life before injury

Subset for alpha = 05

Means for groups in homogeneous subsets are displayed.

Uses Harmonic Mean Sample Size = 212.586.

a

The group sizes are unequal The harmonic mean

of the group sizes is used Type I error levels are

not guaranteed.

b

Trang 39

Kết quả

Trung bình điểm chất lượng cuộc sống trước chấn thương của trẻ

em, là 56 điểm, thấp hơn các nhóm còn lại, của những người đi làm là 61 điểm, những người đi học là 61 điểm, của những người không đi làm là 61, có ý nghĩa thống kê ( P < 0,001)

Trang 40

Tự thực hành

• Hãy trọng lượng sơ sinh của con theo các nhóm tuổi của mẹ

Trang 41

Kiểm định

• Analyze/Non parametric Tests/ K independent Sample

Trang 42

Test Statistics a,b

3.056 3 383

Trang 44

So sánh hai TB ghép cặp

Hãy so sánh trung bình điểm chất lượng cuộc sống trước chấn thương và sau chấn

thương của những người trong nghiên

cứu Chấn thương (bộ số liệu

Biostats2.sav)

Trang 46

Compare means/Paired – Sample

t test

Trang 47

Paired Samples Statistics

General quality of life before injury general quality of life after injury

Pair

1

Std Error Mean

Paired Samples Correlations

1692 787 000

General quality of life before injury & gener quality of life after inju

General quality of life

before injury - genera

quality of life after inju

Pair

1

Mean Std Deviation

Std Error Mean Lower Upper

95% Confidence Interval of the Difference Paired Differences

t df Sig (2-tailed)

Trang 48

Hồi quy và tương quan

Hãy xây dựng mô hình hồi quy giữa tuổi thai (gestwks) và trọng lượng thai

(bweight).

- Vẽ biểu đồ phân tán

- Xây dựng đường hồi quy

Trang 49

Vẽ biểu đồ phân tán

Gestational age

50 40

30 20

Trang 50

Analyze – Regression – Linear

Trang 51

Kết quả

Model Summary

.738a .544 543 441.16

Model 1

R R Square

Adjusted

R Square

Std Error of the Estimate

Predictors: (Constant), Gestational age

a

ANOVA b

1.48E+08 1 148354317.0 762.255 000a1.24E+08 639 194625.673

Predictors: (Constant), Gestational age

Beta

Standardi zed Coefficien ts

t Sig.

Dependent Variable: Birthweight

a

Trang 52

Trọng lượng sơ sinh = -4865.245 + 206.641 x tuổi thai (tính theo tuần).

Trang 53

Hồi quy và tương quan

• Tương quan cho chúng ta biết mối liên quan giữa hai biến

• Hệ số tương quan nằm trong khoảng -1 đến 1

• Nếu hệ số tương quan âm thì tương quan

nghịch

• Nếu hệ số tương quan mà dương thì tương quan thuận

Trang 54

Hệ số tương quan

Tương quan mạnh

75 , 0

R

Tương quan bình thường

30 , 0 70

Trang 55

Hồi quy

• Thể hiện mối quan hệ giữa các biến

• Hiệu chỉnh giữa các biến

¾ Trẻ gái ở bà mẹ không cao huyết áp:

Trọng lượng thai = -4729.05 + tuổi thai x 201.425

¾ Trẻ trai ở bà mẹ không cao huyết áp:

Trọng lượng thai = -4561.23 + tuổi thai x 201.425

¾ Trẻ gái ở bà mẹ cao huyết áp:

Trọng lượng thai = -4871.19 + tuổi thai x 201.425

¾ Trẻ trai ở bà mẹ cao huyết áp:

Trọng lượng thai = -4703.37 + tuổi thai x 201.425

Trang 56

Thảo luận

• Sử dụng kiểm định t so sánh trọng lượng sơ sinh

của những trẻ con của bà mẹ cao huyết áp và

con những bà mẹ không bị cao huyết áp.

• Xây dựng mô hình trọng lượng sơ sinh theo tuổi

thai, cao huyết áp mẹ và giới tính cho hệ số của biến cao huyết áp

So sánh sự khác biệt giữa trọng lượng sơ sinh ( của những bà mẹ CHA và bà mẹ không CHA)

Trang 57

Bài tập thực hành

• Sinh viên làm bài tập thực hành

Ngày đăng: 25/06/2014, 19:48

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w