Tóm Tắt Đề tài này trình bày khái niệm và làm rõ ý nghĩa của các moment, bàn về phương pháp hiệu chỉnh phương sai Bessel và ứng dụng của độ nhọn và độ đối xứng trong kiểm định phân phối
Trang 1BỘ Y TẾ
ĐẠI HỌC Y DƯỢC TP HỒ CHÍ MINH
BÁO CÁO TỔNG KẾT
ĐỀ TÀI KHOA HỌC VÀ CÔNG NGHỆ
Thành Phố Hồ Chí Minh 3/2017
Chủ nhiệm đề tài: Ths BÙI ANH TÚ
CÁC MOMENT VÀ PHÂN PHỐI CHUẨN
Trang 2Abstract
This subject represents definitions and analysis of Moments In addition, we discuss about Bessel’s correction and applications of kurtosis and skewness in Normality test
Tóm Tắt
Đề tài này trình bày khái niệm và làm rõ ý nghĩa của các moment, bàn về phương pháp hiệu chỉnh phương sai Bessel và ứng dụng của độ nhọn và độ đối xứng trong kiểm định phân phối chuẩn
Trang 3BỐ CỤC TRÌNH BÀY
Phần 1.1: Giới thiệu các khái niệm về moment thống kê
Phần 1.2: Moment trung tâm bậc 2 - Phương sai và phép hiệu chỉnh
phương sai Bessel
Phần 1.3: Moment trung tâm bậc 3 - Hệ số bất đối xứng Skewness Phần 1.4: Moment trung tâm bậc 4 - Hệ số nhọn Kurtosis
Phần 1.5: Kiểm định phân phối chuẩn, phép kiểm kết hợp
D’Agostino-Pearson
Phần 1.6: Ví dụ thực hành
Trang 41.1 Moment thống kê
Định nghĩa 1.1.1 Cho X là một biến ngẫu nhiên, k là một số tự
nhiên, thì đại lượng được gọi là moment bậc
k của X, và đại lượng được gọi là các moment trung tâm bậc k của X
k , 1, 2,3, 4
E X k
k , 1, 2,3, 4
Thông thường các moment trung tâm của X thường được
ký hiệu là k E X E X k , k 1, 2,3, 4.
Theo định nghĩa, moment bậc 1 của X chính là giá trị kỳ vọng của nó, moment trung tâm bậc 1 của X thì luôn bằng 0, moment trung tâm bậc 2 của X chính là phương sai của nó, và
có thể được biểu diễn qua các moment của X theo công thức:
2 2 2
.
Tương tự, các moment trung tâm bậc cao hơn của X cũng
có thể khai triển dưới dạng đa thức của các moment của X
Trang 51.2 Moment trung tâm bậc 2 – Phương sai
Giả sử số số liệu trong toàn bộ dân số là Np, khi đó phương sai của dân số là
2
2
1
1
,
p
N
i i
p
x N
1
1
.
p
N
i i
p
x N
Trung bình mẫu và phương sai mẫu (cỡ mẫu n):
1
1
,
n i i
n
1
1
.
n
i i
n
Phương sai hiệu chỉnh : 2 2
1
1
1
n
i i
Sự điều chỉnh từ thành được gọi là phép hiệu chỉnh Bessel Lý do ở đây là vì
1
n
1 1
n
2
2
.
Trang 61.3 Moment trung tâm bậc 3 - Hệ số bất đối xứng skewness
Định nghĩa 1.3.1 Cho X là một biến ngẫu nhiên Khi đó,
hệ số skewness của X là 1 33
2 2
.
Hệ số skewness đo lường mức độ đối xứng của một phân bố xác suất Hệ số skewness có thể âm (negative skew) hoặc dương (positive skew) hoặc bằng 0 Tuy nhiên tất cả các phân phối đối xứng đều có 1 0
Trang 7Tính Toán
Để ước tính hệ số skewness của toàn bộ dân số, ta dùng hệ
số skewness của mẫu
Cho là một mẫu ngẫu nhiên từ dân số Khi đó
được dùng để ước tính các moment Hệ số skewness mẫu là
1 , 2 , , n
1
1
, 2,3, 4
n
k
i
n
, 2,3, 4.
k k
2 2
.
m g
m
Tuy nhiên, nếu dùng g1 để ước tính cho hệ số skewness của toàn bộ dân số thì đây là một ước lượng lệch Cramer (1957) sử dụng hệ số skewness mẫu như sau và nó là một ước lượng không lệch dưới điều kiện chuẩn
1
2
n n
n
Trang 8Chiều cao ( inches) X n
Ví dụ: Chiều cao của nam sinh
Trang 9Ta có: 3
2 2
1,0815.
m g
m
Suy ra, hệ số skewness mẫu là
1
0,1098.
2
n n
n
Hệ số skewness âm và gần 0 điều này chứng tỏ dữ liệu về chiều cao của sinh viên nam hơi lệch xiên về bên trái
Để biết khi nào hệ số skewness của mẫu là quá lớn, chúng ta cần sai số chuẩn (SES) của nó để tiến hành kiểm định thống kê
Công thức trên được Joanes và Gill (1998) đưa ra dưới điều kiện phân phối chuẩn
n n
Trang 101.4 Moment trung tâm bậc 4 – Hệ số nhọn Kurtosis
4
2
3.
Định nghĩa 1.4.1 Cho X là một biến ngẫu nhiên Khi đó, hệ
số Kurtosis của X là
Kurtosis của một phân bố chuẩn bằng 0 Khi một phân bố xác suất có kurtosis dương (phân bố như vậy gọi là phân bố
leptokurtic hay nhọn vượt chuẩn) thì có nghĩa là nó “nhọn”
hơn phân bố chuẩn có cùng độ lệch chuẩn, còn khi kurtosis âm
(phân bố như vậy gọi là phân bố platykurtic) thì có nghĩa là nó
“bẹt” hơn phân bố chuẩn có cùng độ lệch chuẩn Nếu kurtosis
bằng 0 thì phân bố được gọi là mesokurtic
Trang 11Cramer (1957) sử dụng hệ số kurtosis mẫu như sau và nó
là một ước lượng không lệch dưới điều kiện chuẩn
Cho là một mẫu ngẫu nhiên từ dân số Hệ số kurtosis của mẫu là
1 , 2 , , n
4
2
3.
m g
m
Tính toán
1
n
Trang 122
3 0, 25824.
m g
m
1
1 6 0, 20915.
n
Ví dụ: Với dữ liệu về chiều cao của nam sinh viên ở trên, ta có
Do đó, hệ số kurtosis mẫu là
Suy ra mẫu có độ nhọn dưới chuẩn một ít, nghĩa là đỉnh của
nó thấp hơn một ít so với đỉnh của phân bố chuẩn có cùng độ lệch chuẩn
Dưới điều kiện chuẩn, Joanes và Gill (1998) đưa ra công
thức cho sai số chuẩn (SEK) của G2 như sau:
2 1
n
Trang 131.5 Kiểm định phân phối chuẩn
Phép kiểm được D’Agostino và Stephens (1986) đưa ra, có
tên là phép kiểm kết hợp D’Agostino-Pearson Phép kiểm
định này kết hợp cả hai hệ số skewness và kurtosis để tìm ra
giá trị p Với giả thiết là dữ liệu phù hợp với phân phối chuẩn,
khi đó:
,
~ 2 ,
s k
trong đó: và 1
SES
s
G
SEK
k
G
Z
Phép kiểm được khuyến cáo không dùng với cỡ mẫu dưới 20
Trang 14Ví dụ: Với mẫu chiều cao 100 nam sinh viên ở trên Ta có
0, 455
0, 437
s
k
Z Z
Do đó: DP Z s2 Z k2 0,398.
Suy ra p 0,81955 0,05.
Vì không đủ cơ sở bác bỏ giả thiết không, nên ta chấp nhận rằng mẫu chiều cao nam sinh viên ở trên phù hợp với phân phối chuẩn
Trang 151.6 Ví dụ thực hành
Kết quả đường huyết (mg%) của 100 người lớn khỏe mạnh
97 100 94 106 103 108 97 92 113 112
88 108 95 101 124 95 119 99 84 93
82 114 88 85 79 90 104 104 109 98
94 89 102 98 93 102 102 102 110 109
94 114 106 109 103 90 93 83 104 106
100 111 101 88 80 91 103 91 91 119
97 116 118 117 95 92 123 81 102 95
106 106 95 103 96 89 94 122 110 104
84 108 104 98 98 97 105 109 98 86
105 97 87 111 107 115 96 94 79 107 Mẫu xét nghiệm đường huyết 100 người lớn khỏe mạnh có kết quả như sau:
Trang 16Biểu đồ
Nhìn vào biểu đồ trên, ta thấy mẫu đường huyết của 100 người lớn khỏe mạnh có vẻ như tuân theo quy luật của phân
phối chuẩn Tiếp theo, ta sẽ sử dụng phép kiểm D’Agostino-Pearson để kiểm định nhận định trên
Trang 17Với SPSS, ta được n Valid 100
Missing 0
Std Error of Skewness 241
Std Error of Kurtosis 478
Sử dụng phép kiểm D’Agostino-Pearson, ta có
0, 427
0,925.
0,862
s
s k k
Z
DP Z Z Z
Suy ra p 0,63 0, 05.
Vì không đủ cơ sở bác bỏ giả thiết không, nên ta chấp nhận rằng mẫu đường huyết máu ở trên phù hợp với phân phối chuẩn
Trang 18TÀI LIỆU THAM KHẢO
[1] Cramer, H 1957 Mathematical methods of statistic Princeton
University Press, Seventh Printing
[2] Cramer, Duncan 1997 Basic Statistics for Social Research
Routledge
[3] D’Agostino, Ralph B., and Michael A Stephens 1986
Goodness-of-Fit Techniques Dekker
[4] Bulmer, M G 1979 Principles of Statistics Dover
[5] Stan Brown 2016 Measures of Shape: Skewness and Kurtosis
BrownMath.com
[6] D N Joanes and C A Gill 1998 Comparing Measures of Sample
Skewness and Kurtosis The Statistician, Vol 47, No 1
[7] Spiegel, Murray R., and Larry J Stephens 1999 Theory and
Problems of Statistics 3d ed McGraw-Hill
[8] Stephen So, PhD, MIEEE 2008 Why is the sample variance a
biased estimator Griffith University, Brisbane, QLD, Australia, 4111
[9] Karl G Jöreskog 1999 Formulas for Skewness and Kurtosis
Papers published on internet
Trang 19XIN CHÂN THÀNH CẢM ƠN QUÝ THÀY CÔ LẮNG NGHE BUỔI TRÌNH BÀY CỦA TÔI
Trang 20BỘ Y TẾ
ĐẠI HỌC Y DƯỢC TP HỒ CHÍ MINH
BÁO CÁO TỔNG KẾT
ĐỀ TÀI KHOA HỌC VÀ CÔNG NGHỆ
Thành Phố Hồ Chí Minh 3/2017
Chủ nhiệm đề tài: Ths BÙI ANH TÚ
CÁC MOMENT VÀ PHÂN PHỐI CHUẨN