Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 74 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
74
Dung lượng
737,21 KB
Nội dung
Chương 2
THỐNG KÊ
Bài 1
THAM SỐ MẪU
MỤC TIÊU
1. Trình bày được công thức định nghĩa và công thức tính các tham số mẫu.
2. Tính được các tham số mẫu và nêu được ý nghĩa của chúng.
1. CÁC KHÁI NIỆM
Khoảng số thực
khoảng đóng [a, b] = {x là số thực : a ≤ x ≤ b}
khoảng nửa đóng nửa mở
[a, b) = {x là số thực : a ≤ x < b}
hoặc (a, b] = {x là số thực : a < x ≤ b}
khoảng mở (a, b) = {x là số thực : a < x < b}.
Ký hiệu tổng:
Tập hợp tổng quát và tập hợp mẫu
Tập hợp tổng quát là tập hợp bao gồm tất cả các đối tượng cần nghiên cứu. Số phần tử của tập hợp tổ
ng
quát gọi là kích thước tập hợp tổng quát, ký hiệu là N.
Vì các điều kiện hạn chế, thường lấy ra một mẫu để nghiên cứu. Tập hợp mẫu là tập hợp gồm các đố
i
tượng lấy ra để nghiên cứu. Số phần tử của tập hợp mẫu gọi là kích thước mẫu, ký hiệu n. Nói chung N ≥ n.
1 2
1
=
= + + +
∑
n
i n
i
x x x x
1 1 1
( )
= = =
+ = +
∑ ∑ ∑
n n n
i i i i
i i i
x y x y
1 1
= =
=
∑ ∑
n n
i i
i i
ax a x
1
.
=
=
∑
n
i
a n a
Page
1
of
74
12/10/2012
file://C:\WINDOWS\Temp\ttwyprsdrx\Chapter2.htm
Cần lấy mẫu ngẫu nhiên, khách quan sao cho tính chất của tập hợp mẫu phản ánh đúng tính chất tập hợ
p
tổng quát.
Có hai cách lấy các phần tử ra để nghiên cứu. Lấy có hoàn lại là lấy ra một phần tử để nghiên cứu rồi tr
ả
lại tập hợp mẫu. Kết quả các lần nghiên cứu sau không phụ thuộc các kết quả nghiên cứu trước đó, phép th
ử
độc lập. Lấy không hoàn lại là lấy ra một phần tử để nghiên cứu sau đó không trả lại tập hợp mẫu. Kết qu
ả
các nghiên cứu sau phụ thuộc kết quả các nghiên cứu trước, phép thử không độc lập.
Dấu hiệu nghiên cứu
Khi nghiên cứu chỉ quan tâm xem xét một số mặt, một số tính chất của đối tượng nghiên cứu. Các đặ
c
tính, tính chất cần nghiên cứu gọi là dấu hiệu nghiên cứu. Có dấu hiệu nghiên cứu về chất, có dấu hiệ
u
nghiên cứu về lượng. Các dấu hiệu về chất được nghiên cứu khả năng xuất hiện của chúng, các dấu hiệu v
ề
lượng được tính các tham số mẫu.
2. SẮP XẾP SỐ LIỆU
Khi tiến hành nghiên cứu, số liệu thu được theo thứ tự thời gian. Như vậy số liệu chưa có thứ tự
theo giá
trị. Trước khi tính các tham số mẫu, số liệu được sắp xếp theo thứ tự giá trị.
Việc sắp xếp lại số liệu không làm thay đổi kết quả tính. Có những bài toán mà thuật toán đòi hỏi phả
i
giữ nguyên thứ tự thu được theo thời gian thì không được sắp xếp lại số liệu.
Sắp xếp số liệu thành dãy tăng hoặc bằng gọi là dãy không giảm
(1)
Sắp xếp số liệu thành dãy giảm hoặc bằng gọi là dãy không tăng
(2)
Có thể sắp xếp số liệu thành dãy các giá trị khác nhau tăng dần tương ứng với tần số xuất hiện củ
a
chúng.
với (3)
Với những nghiên cứu có kích thước mẫu n rất lớn, để tính các tham số mẫu thuận tiện mà sai số
không
đáng kể, có thể phân chia số liệu thành nhiều lớp.
Gọi k là số lớp cần phân chia : k ≥ 1 + 3,32 lgn.
Gọi khoảng rộng của mỗi lớp là ∆x
Như vậy sai số . Với ∆x đã biết, phân chia số liệu vào các lớp từ α
i– 1
đến α
i
.
1 2 3 n
x x x x
≤ ≤ ≤ ≤
1 2 3 n
x x x x
≥ ≥ ≥ ≥
1 2 k
x x x
K
1 2 k
m m m
K
k
i
i 1
m n
=
=
∑
x
R
x
k
∆ ≤
x
2
∆
δ =
Page
2
of
74
12/10/2012
file://C:\WINDOWS\Temp\ttwyprsdrx\Chapter2.htm
Kết quả thu được dãy giá trị giữa các lớp tương ứng với tần số xuất hiện của lớp:
Đôi khi từ số liệu thu được, chọn δ sao cho phù hợp với số liệu, từ đó có:
∆x = 2δ, sau đó phân chia số liệu vào các lớp như trên.
Gọi x là áp lực động mạch phổi thì tâm thu bệnh nhân hẹp hai lá (mmHg).
Đo 153 bệnh nhân, ,
.
Lấy k = 9 .
Sắp xếp số liệu vào 9 lớp được kết quả sau:
Chú ý : Từ số liệu chia k lớp sẽ thành k + 1 lớp.
Tính các tham số mẫu khi chia lớp sẽ có sai số.
3. CÁC THAM SỐ MẪU
Trong phần này chỉ nêu các tham số mẫu thường dùng. Đó là trung bình mẫu, phương sai và độ lệ
ch
mẫu.
3.1. Trung bình mẫu
Định nghĩa và công thức tính
theo (1) (4)
theo (3) (5)
. (6)
Trong (6) với x
0
và ∆x tuỳ chọn.
(α
i-1 -
α
i
)
13 – 28
28 – 43
43 – 58
58 – 73
73 – 88
88 –
103
103 –
118
118 –
133
133 –
148
148 –
163
x
i
20,5
35,5
50,5
65,5
80,5
95,5
110,5
125,5
140,5
155,5
m
i
6
20
33
24
28
12
17
8
4
1
i
i
max x 157
∀
=
i
i
min x 15
∀
=
x
R 157 15 142
= − =
k 1 3,32lg153 8,2
≥ + =
142
x 15,77 x 15
9
∆ ≤ = ⇒ ∆ =
10
i
i 1
m 153
=
=
∑
x
n
i
i 1
1
x x
n
=
=
∑
k
i i
i 1
1
m x
n
=
=
∑
k
0 i i 0
i 1
1
x x . m u x xu
n
=
= + ∆ = + ∆
∑
i 0
i
x x
u
x
−
=
∆
Page
3
of
74
12/10/2012
file://C:\WINDOWS\Temp\ttwyprsdrx\Chapter2.htm
Từ (5) suy ra (6) bằng cách thay vào (5)
Trung bình cộng là trị số bình quân của các giá trị khác nhau, nhưng thuộc cùng một loại.
có cùng đơn vị x
i
. Số thập phân của hơn số thập phân của x
i
một chữ số.
là tâm quần tụ của tập hợp mẫu.
Tính chất
3.2. Phương sai s
2
, độ lệch mẫu s
Định nghĩa và công thức tính
theo (1) (7)
theo (3) (8)
(9)
(10)
trong đó với ∆x, x
0
tuỳ chọn, ∆x ≠ 0.
Từ (8), sau khi bình phương và thay suy ra (9).
Trong (9) thay
d
ẫ
n
đế
n
0
.
= ∆ +
i i
x x u x
k k k
0
i i 0 i i i
i 1 i 1 i 1
x
1 x
m ( x.u x ) m u m
n n n
= = =
∆
∆ + = +
∑ ∑ ∑
k
0 i i
i 1
1
x x m u
n
=
= + ∆
∑
x
x
x
i i 0 0 0
y x x y x x x y-x
= + ⇒ = + ⇔ =
i
i
x x
y ( x 0) y x xy
x x
= ∆ ≠ ⇒ = ⇔ = ∆
∆ ∆
i i i
z y x z y x .
= + ⇒ = +
n
2 2
i
i 1
1
s (x x)
n 1
=
= −
−
∑
k
2
i i
i 1
1
m (x x)
n 1
=
= −
−
∑
2
k k
2
i i i i
i 1 i 1
1
n m x m x
n(n 1)
= =
= −
−
∑ ∑
2
2
k k
2
i i i i
i 1 i 1
x
n m u m u
n(n 1)
= =
∆
= −
−
∑ ∑
i 0
i
x x
u
x
−
=
∆
k
i i
i 1
1
x m x
n
=
=
∑
i i 0
x x.u x
= ∆ +
Page
4
of
74
12/10/2012
file://C:\WINDOWS\Temp\ttwyprsdrx\Chapter2.htm
s
2
=
. (10) được chứng minh.
s
2
không cùng đơn vị với x
i
.
s = được gọi là độ lệch mẫu.
s có cùng đơn vị và số thập phân với . Như vậy s
2
có số thập phân gấp hai số thập phân của s.
s
2
là trung bình của bình phương khoảng lệch giữa x
i
và cho nên gọi tắt là phương sai. s
2
hay s cho
biết mức độ tản mạn của x
i
so với tâm của mẫu là như vậy cũng cho biết độ đại diện của cho các x
i
tố
t
hay không. Khi đo một đại lượng nhiều lần, s
2
và s cho biết độ chính xác của các giá trị đo được, s
2
hay s
được xem là sai số của cách đo.
s và cùng đơn vị, có cùng số thập phân. Người ta thường viết ± s đại diện cho mẫu thu được.
Công thức (6) và (10) được sử dụng khi các x
i
lớn hoặc có số thập phân hoặc cách đều.
Tính chất
khi X và Y là hai đại lượng độc lập.
Các công thức khác
Trong một số trường hợp, phương sai được cho dưới dạng sau:
đượ
c xem là ph
ươ
ng sai lý thuy
ế
t DX c
ủ
a
đạ
i l
ượ
ng ng
ẫ
u nhiên khi n
đủ
l
ớ
n
.
với MX đã biết. (11)
2
k k
2
i i 0 i i 0
i 1 i 1
1
n m ( xu x ) m ( xu x )
n(n 1)
= =
∆ + − ∆ +
−
∑ ∑
2
k k k
2 2 2 2
i i 0 i i 0 i i
i 1 i 1 i 1
k
2
0 i i 0
i 1
1
n x m u 2nx x m u (nx ) x m u
n(n 1)
2nx x m u (nx )
= = =
=
= ∆ + ∆ + − ∆ −
−
− ∆ −
∑ ∑ ∑
∑
2
2
k k
2
i i i i
i 1 i 1
x
n m u m u
n(n 1)
= =
∆
= −
−
∑ ∑
2
s
x
x
,
x
x
x
x
2 2
i i 0 y x
y x x s s
= + ⇒ =
2
2 2 2 2
i x
i y x y
2
x s
y ( x 0) s s x s
x
x
= ∆ ≠ = ⇔ = ∆
∆
∆
2 2 2
i i i z x y
z x y s s s
= + ⇒ = +
*2 2
1
1
( )
=
= −
∑
k
i i
i
s m x MX
n
*2
s
Page
5
of
74
12/10/2012
file://C:\WINDOWS\Temp\ttwyprsdrx\Chapter2.htm
. (12)
là phương sai chệch của phương sai lý thuyết của đại lượng ngẫu nhiên. Cách viết (12) thường gặ
p
trong các công thức tính tham số của đường cong hồi quy và hệ số tương quan tuyến tính.
3.3. Phương sai của k dãy giá trị
Trong các nghiên cứu đồng thời k đại lượng, số liệu được cho dưới dạng sau:
Gọi là trung bình chung của k dãy, là trung bình của dãy thứ j
(13)
(14)
Tuỳ thuộc k dãy giá trị của cùng một đại lượng hay của k đại lượng khác nhau sẽ có tương ứ
ng hai
ph
ương sai.
Phương sai của k dãy giá trị của cùng một đại lượng
(15)
(16)
2 2
= −
x x
2
*
s
1 2 j k
1 2 j k
11 12 1j 1k
21 22 2 j 2k
i1 i2 ij ik
n 1 n 2 n j n k
X X X X
x x x x
x x x x
x x x x
x x x x
K K
K K
K K
M M K M K M
K K
M M K M K M
K K
x
j
x
j
k,n
ij
j,i 1
1
x x
N
=
=
∑
j
n
j ij
j
i 1
1
x x
n
=
=
∑
j 1,k
=
2
S
k
2
2
j j
j 1
1
S n (x x)
k 1
=
= −
−
∑
j j
2 2
n k,n
k
ij ij
j
j 1 i 1 j,i 1
1 1 1
x x
k 1 n N
= = =
= −
−
∑ ∑ ∑
Page
6
of
74
12/10/2012
file://C:\WINDOWS\Temp\ttwyprsdrx\Chapter2.htm
với , .
là trung bình của bình phương khoảng lệch giữa trung bình của từng dãy và trung bình chung củ
a k
dãy
Thực hiện bình phương công thức (15)
Thu được công thức (16)
Phương sai của k dãy giá trị của k đại lượng khác nhau thuộc cùng một loại S
2
(17)
(18)
, với và B đã biết.
là trung bình của bình phương các khoảng lệch giữa các giá trị trong dãy và trung bình của dãy.
Thực hiện bình phương công thức (17)
B C
k 1
−
−
j
2
n
k
ij
j
j 1 i 1
1
B x
n
= =
=
∑ ∑
j
2
k,n
ij
j,i 1
1
C x
N
=
=
∑
2
S
2 2 2
1
1
( 2 )
1
=
= − +
−
∑
k
j j j
j
S n x x x x
k
2
,
2
1 1 , 1
1 1
2
1
−
= = =
= − +
−
∑ ∑ ∑
j j
n k n
k
ij ij
j
j i j i
x x x Nx
k n
2 2
,
1 1 , 1
1 1 1
1
= = =
= −
−
∑ ∑ ∑
j j
n k n
k
ij ij
j
j i j i
x x
k n N
j
k, n
2 2
ij j
j, i 1
1
S (x x )
N k
=
= −
−
∑
j j
2
k,n n
k
2
i j ij
j
j,i 1 j 1 i 1
1 1
x x
N k n
= = =
= −
−
∑ ∑ ∑
2
A B
S
N k
−
=
−
j
k,n
2
ij
j,i 1
A x
=
=
∑
2
S
j
k,n
2 2
ij j
j, i 1
1
S (x x )
N k
=
= −
−
∑
j
k,n
2 2
ij j ij j
j,i 1
1
(x 2x x x )
N k
=
= − +
−
∑
Page
7
of
74
12/10/2012
file://C:\WINDOWS\Temp\ttwyprsdrx\Chapter2.htm
Công thức (18) được chứng minh.
3.4. Các tham số khác
Hệ số biến thiên C
v
(
0
/
00
)
C
v
cho biết độ chính xác tương đối giữa s so với . C
v
là tỷ số, viết dưới dạng % hay
0
/
00
.
, cho phép so
sánh độ chính xác tương đối giữa các đại lượng không cùng đơn vị.
Số trung vị :
là giá trị giữa của n giá trị đã sắp xếp
Số mốt M
0
M
0
= x
i
mà m
i
lớn nhất trong các m
1
, m
2
, , m
k
M
0
là giá trị hay gặp nhất trong k giá trị x
1
, x
2
, …, x
k
.
Với số liệu chuẩn theo một nghĩa nào đấy thì M
e
= M
0
=
Vậy M
e
, M
0
là các giá trị cũng cho biết tâm của tập hợp mẫu.
Trung bình nhân, Trung bình điều hoà.
Khi nghiên cứu thu được dãy số liệu x
1
x
2
. . . x
n
.
Đôi khi sử dụng trung bình nhân hoặc trung bình điều hoà trong xử lý số liệu. Công thứ
c tính có
dạng sau:
Ví dụ:
1. Gọi X là áp lực động mạch phổi thời tâm trương người bình thường
j j j
2
k,n n n
k k
2
j
ij ij j ij
j
j,i 1 j 1 i 1 j 1 i 1
1 1
x 2 x x n x
N k n
= = = = =
= − +
−
∑ ∑ ∑ ∑ ∑
j j
2
k,n n
k
2
i j ij
j
j,i 1 j 1 i 1
1 1
x x
N k n
= = =
= −
−
∑ ∑ ∑
v
s
C
x
=
x
e
M
e
M
x
g
h
1 2
1 2
1 1 1
=
= + + +
n
n
n
g x x x
h
x x x
Page
8
of
74
12/10/2012
file://C:\WINDOWS\Temp\ttwyprsdrx\Chapter2.htm
Đo 30 người được kết quả sau:
Tính các tham số của mẫu trên.
Giải:
Cách 1. Lập bảng tính theo (5) và theo (9)
.
Cách 2. Lập bảng kiểm tra, tính theo (6) và theo (10).
Giá tr
ị
x
i
(mm Hg)
2
3
4
5
6
7
8
9
S
ố
ng
ườ
i m
i
1
4
7
8
2
5
2
1
i
x
i
m
i
m
i
x
i
m
i
1
2
1
2
4
2
3
4
12
36
3
4
7
28
112
4
5
8
40
200
5
6
2
12
72
6
7
5
35
245
7
8
2
16
128
k = 8
9
1
9
81
∑
∑∑
∑
30
154
878
Chọn x
0
= 5 và ∆x = 1 dẫn
đến
x
2
x
s
2
i
x
154
x 5,133 5,1.
30
= = −
%
2 2 2
x
1 2624
s [30 878 154 ] 3,0161 1,74
30 29 870
= × − = = −
×
%
v
1,74
C 0,339
5,13
= =
e 30
2
M x 5,
= =
0
M 5
=
x
2
x
s
i
i i
x -5
u = = x -5
1
Page
9
of
74
12/10/2012
file://C:\WINDOWS\Temp\ttwyprsdrx\Chapter2.htm
Các giá trị của và trùng với các kết quả trên.
2. Gọi X là lượng Protein huyết thanh người bình thường (g/l). Điện di 17 mẫu của 17 người thu đượ
c
kết quả sau:
Tính các tham số của mẫu trên
Giải:
Lập bảng tính theo (6) và theo (10) với và
.
3. Gọi X
1
, X
2
, X
3
, X
4
là thời gian hết ký sinh trùng sốt rét trong máu (giờ) của bốn nhóm bệ
nh nhân
điều trị theo bốn cách khác nhau. Kết quả nghiên cứu thu được số liệu sau:
Giá trị x
i
(g/l)
6,9
7,2
7,6
8,2
8,5
Số người m
i
2
3
5
6
1
X
1
18
37
46
46
46
51
62
78
85
90
X
2
38
41
41
42
43
44
45
50
50
52
X
3
36
48
50
52
58
60
60
68
74
74
36
38
40
42
48
60
62
70
72
72
1
5 4 5,133 5,1.
30
= + × = −x
%
2
2 2 2
x
1 2624
s [30 88 4 ] 3,0161 1,74
30 29 870
= × − = = −
×
%
x
2
x
s
x
2
x
s
i
i
x 7,5
u
0,1
−
=
i
i
x 8
v
0,1
−
=
0,1 0,1
x = 7,5+ ×36 = 8+ ×(-49) = 7,71
17 17
2 2 2
2 2 2 2
x
0,1 0,1 0,1 ×7170
s = 17×498-36 = 17×563- 49 = = 0, 2636 = 0,51
17×16 17×16 272
x s 7,71 0,51(g / l)
± = ±
v e 0
0,51
C 0,066, M 7,6, M 8,2
7,71
= = = =
Page
10
of
74
12/10/2012
file://C:\WINDOWS\Temp\ttwyprsdrx\Chapter2.htm
[...]... không ? i u tra n i tư ng nghiên c u th y m có úng không ? Trên ây là nh ng bài toán ki m 1 GI THI T VÀ i tư ng có c tính A Kh năng xu t hi n hi n tư ng A là po nh gi thi t th ng kê I GI THI T Trong bài toán ki m nh gi thi t th ng kê, gi thi t c n ki m nh ký hi u H 0 , ư c nêu ra dư i d ng: các t l như nhau, các trung bình như nhau Các gi thi t i l p v i gi thi t H 0 g i t t là i thi t, ký hi u H1 i gi... trung bình c a s li u trên (S li u Finney) K t qu : A 0,02846; B 0,0247; C 0,0253; D 0,0255; file://C:\WINDOWS\Temp\ttwyprsdrx\Chapter2.htm E s khác 12/10/2012 Page 14 of 74 Bài 2 KI M NH GI THI T TH NG KÊ M C TIÊU Trình bày ư c các bư c c a bài toán ki m nh i u tr m t b nh b ng nhi u phương pháp, m i phương pháp có m t t l kh i nh t kh i c a các phương pháp có như nhau không ? nh Các t l nh lư ng Protein... t(8 + 10 – 2; 0,01/2) = 2,921 Do T = 3,173 > 2,921 : bác b gi thi t H0 Trung bình hai dãy s li u khác nhau m c 99% ư ng kính trung bình c a các viên thu c do hai máy d p ra là khác bi t có ý nghĩa th ng kê Không nên dùng hai máy d p các viên thu c N u c n dùng c hai máy thì ph i ch nh máy file://C:\WINDOWS\Temp\ttwyprsdrx\Chapter2.htm 12/10/2012 Page 20 of 74 2 nh lư ng Protein toàn ph n trong huy t thanh... 1; α/2): ch p nh n gi thi t H0 Ngư c l i T > t(n – 1; α) ho c t(n – 1; α/2): bác b gi thi t H0, ch p nh n 2.2 Các xác su t c a bài toán ki m i thi t H1 nh Khi ti n hành bài toán ki m nh gi thi t th ng kê, k t lu n c a bài toán ki m nh úng hay sai ph thu c vào H0 úng hay sai Trong ph n này c n xét các xác su t liên quan t i ki m nh Bài toán ư c gi i v i gi thi t: H0: MX = µ 0 ; H1: MX ≠ µ 0 và bi t DX . những bài toán kiểm định giả thiết thống kê.
1. GIẢ THIẾT VÀ ĐỐI GIẢ THIẾT
Trong bài toán kiểm định giả thiết thống kê, giả thiết cần kiểm định ký hiệu. Chương 2
THỐNG KÊ
Bài 1
THAM SỐ MẪU
MỤC TIÊU
1. Trình bày được công thức định