[r]
(1)TH NG KÊ, BI N S VÀ PHÂN PH IỐ Ế Ố Ố Mục tiêu
Sau khi nghiên c u ch đ , h c viên có kh năng:ứ ủ ề ọ ả
Trình bày đ nh nghĩa c a th ng kê, s li u, thông tin và bi n sị ủ ố ố ệ ế ố
Phân bi t đệ ược các lo i bi n s : đ nh lạ ế ố ị ượng và đ nh tính trong có có bi n s nh giá,ị ế ố ị danh đ nh hay th t ị ứ ự
Xây d ng đự ược b ng phân ph i t n su t cho s li u đ nh tính và đ nh lả ố ầ ấ ố ệ ị ị ượng
L a ch n đự ọ ược các lo i bi u đ hay đ th thích h p đ trình bày s li u đ nh tính vàạ ể ồ ị ợ ể ố ệ ị đ nh lị ượng
Tính được các s th ng kê tóm t t nh trung bình, trung v , y u v , đ l ch chu n,ố ố ắ ị ế ị ộ ệ ẩ phương sai.
1 Một số định nghĩa
Th ng kê là phố ương pháp khoa h c dùng đ thu th p, tóm t t, trình bày và phân tích sọ ề ậ ắ ố li u. Phệ ương pháp th ng kê đố ược s d ng trong nghiên c u nh m đ so sánh m tử ụ ứ ằ ể ộ nhóm đ i tố ượng ch khơng nh m nghiên c u t ng cá nhân đ n l ứ ằ ẻ
S li u: K t qu có đố ệ ế ả ược do vi c quan sát hay thu th p đ c tính hay đ i lệ ậ ặ ượng cácở đ i tố ượng khác nhau hay th i gian khác nhau.ở
Thí d : Quan sát gi i tính c a các h c viên trong l p, s li u ghi nh n đụ ủ ọ ố ệ ậ ược là: Nam, nam, n , n , n , nam, n , v.vữ ữ ữ ữ
Thí d : M t nhà nghiên c u đo n ng đ hemoglobin c a 70 thai ph có k t qu nhụ ộ ứ ộ ủ ụ ế ả ư sau:
10.2 13.7 10.4 14.9 11.5 12.0 11.0 13.3 12.9 12.1 9.4 13.2 10.8 11.7 10.6 10.5 13.7 11.8 14.1 10.3 13.6 12.1 12.9 11.4 12.7 10.6 11.4 11.9 9.3 13.5 14.6 11.2 11.7 10.9 10.4 12.0 12.9 11.1 8.8 10.2 11.6 12.5 13.4 12.1 10.9 11.3 14.7 10.8 13.3 11.9 11.4 12.5 13.0 11.6 13.1 9.7 11.2 15.1 10.7 12.9 13.4 12.3 11.0 14.6 11.1 13.5 10.9 13.1 11.8 12.2
và nh ng con s này đữ ố ược g i là s li u.ọ ố ệ
C n l u ý s li u ph i liên k t v i m t đ c tính hay đ i lầ ố ệ ả ế ộ ặ ượng nh t đ nh. Ghi nh nấ ị ậ gi i tính ngớ ười này, tu i c a ngổ ủ ười khác, qu n áo c a m t ngầ ủ ộ ười khác n a thì k tữ ế qu này đả ược khơng ph i là s li u.ả ố ệ
(2)2 Biến số loại biến số
Bi n s là nh ng đ i lế ố ữ ượng hay nh ng đ c tính có th thay đ i t ngữ ặ ể ổ ười này sang người khác hay t th i đi m này sang th i đi m khác.ừ ể ể
Nh v y bi n s có th th hi n đ i lư ậ ế ố ể ể ệ ượng hay đ c tính. N u nó th hi n m t đ iặ ế ể ệ ộ ạ lượng nó được g i là bi n s đ nh lọ ế ố ị ượng. N u nó nh m th hi n m t đ c tính noế ằ ể ệ ộ ặ được g i là bi n s đ nh tính. ọ ế ố ị
Bi n s đ nh tínhế ố ị
Bi n s đ nh tính cịn đế ố ị ược chia làm 3 lo i: bi n s th t , bi n s danh đ nh và bi nạ ế ố ứ ự ế ố ị ế s nh giá.ố ị
Bi n s th t là bi n s đ nh tính v i các giá tr có th s p x p th t đế ố ứ ự ế ố ị ị ể ắ ế ứ ự ược
Thí d : tình tr ng kinh t xã h i (giàu, khá, trung bình, nghèo, r t nghèo) là bi n s thụ ế ộ ấ ế ố ứ t b i vì ngự ười giàu có đi u ki n kinh t t t h n ngề ệ ế ố ười khá, người khá h n ngơ ười trung bình, trung bình h n nghèo, v.vơ
Nh ng thí d khác là h c l c c a h c sinh (gi i, khá, trung bình, kém), tiên lữ ụ ọ ự ủ ọ ỏ ượng (t t,ố khá, x u, t vong).ấ
Theo phân lo i tăng huy t áp c a T ch c Y t Th gi i đạ ế ủ ổ ứ ế ế ược trình bày nh sau, theoư phân lo i huy t áp v i các giá tr huy t áp bình thạ ế ị ế ường, tăng huy t áp đ 1, tăng huy tế ộ ế áp đ 2, tăng huy t áp đ 3 là bi n s th tộ ế ộ ế ố ứ ự
Huy t áp bình thế ường: HA tâm thu ≤139 và HA tâm trương ≤ 89 Tăng huy t áp đ 1: ế ộ HA tâm thu ≤ 179 hay HA tâm trương ≤ 104 Tăng huy t áp đ 2:ế ộ HA tâm thu ≥ 180 hay HA tâm trương >114 Tăng huy t áp đ 3:ế ộ HA tâm thu ≥180 và HA tâm trương ≥ 115 mmHg
Bi n s danh đ nh là bi n s đ nh tính mà giá tr c a nó khơng th bi u th b ng s màế ố ị ế ố ị ị ủ ể ể ị ằ ố ph i bi u di n b ng m t tên g i (danh: tên) và các giá tr này không th s p đ t theoả ể ễ ằ ộ ọ ị ể ắ ặ m t tr t t t th p đ n cao.ộ ậ ự ấ ế
Thí d : Bi n s dân t c v i các giá tr : Kinh, Khmer, Hoa, Chăm,… là bi n s đ nhụ ế ố ộ ị ế ố ị tính vì chúng ta khơng th s p x p các giá tr này t theo m t tr t t t th p đ n caoể ắ ế ị ộ ậ ự ấ ế hay ngượ ạc l i
M t s thí d khác c a bi n s danh đ nh là tình tr ng hơn nhân (có 4 giá tr : đ c thân,ộ ố ụ ủ ế ố ị ị ộ có gia đình, li d , góa) nhóm máu (A, B, AB và O).ị
Đơi khi bi n s danh đ nh ch có 2 giá tr : thí d nh s ng hay ch t; có hút thu c lá hayế ố ị ỉ ị ụ ố ế ố khơng hút thu c lá; có suy dinh dố ưỡng hay khơng suy dinh dưỡng; nam hay n Nh ngữ ữ bi n s thu c lo i này đế ố ộ ược g i là bi n s nh giá (binary variable)ọ ế ố ị
Mã hoá
(3)Gi i tính là bi n s danh đ nh và có hai giá tr là nam và n Chúng ta có th mã hóa gi i tính và ớ ế ố ị ị ữ ể quy ước Nam là 1 và N là 2. Tuy nhiên vi c mã hóa này là áp đ t và chúng ta hồn tồn có th ữ ệ ặ ể quy ước Nam là 1 và N là 0. Vi c mã hóa ch nh m giúp vi c nh p s li u và x lí s li u trữ ệ ỉ ằ ệ ậ ố ệ ố ệ ở nên d dàng h n ch khơng nh m ph n ánh b n ch t c a bi n s đó.ễ ứ ằ ả ả ấ ủ ế ố
Bi n s đ nh lế ố ị ượng
Bi n s đ nh lế ố ị ượng nh m th hi n m t đ i lằ ể ệ ộ ượng và do đó có giá tr là nh ng con s ị ữ ố Thí d : tu i là bi n s liên t c b i vì ta có th nói ngụ ổ ế ố ụ ể ười này 20 tu i, ngổ ười kia 32 tu i, v.v.ổ
Nh ng thí d khác là đữ ụ ường huy t, hemoglobin, hematocrite, chi u cao, cân n ng, thuế ề ặ nh p, v.vậ
3 Phương pháp trình bày số liệu bảng
S li u ghi nh n các đ c tính hay đ i lố ệ ậ ặ ượng có th trình bày thành b ng và b ng nàyể ả ả được g i là b ng phân ph i t n su t.ọ ả ố ầ ấ
Phân ph i t n su t c a bi n s đ nh tínhố ầ ấ ủ ế ố ị
S li u c a bi n s r i r c có th đố ệ ủ ế ố ể ược trình bày dướ ại d ng m t phân ph i t n su t.ộ ố ầ ấ Phân ph i t n su t là m t b ng ch ra t n su t xu t hi n c a t ng giá tr r i r c c aố ầ ấ ộ ả ỉ ầ ấ ấ ệ ủ ị ủ bi n s (B ng 1). Nh v y b ng phân ph i t n su t g m 2 c t, m t c t li t kê các giáế ố ả ậ ả ố ầ ấ ộ ộ ộ ệ tr c a bi n s và m t c t trình bày t n su t tị ủ ế ố ộ ộ ầ ấ ương ng c a các giá tr đó.ứ ủ ị
Table 1. Phân ph i gi i tính c a 69 h c sinh l p c m thố ủ ọ ường trường m m non 23 tháng 11, Huy n Hóc ầ ệ mơn
Gi iớ S trố ẻ Ph n trămầ
Nam 45 65%
Nữ 24 35%
T ng sổ ố 69 100%
B ng trên là b n phân ph i t n su t c a gi i tính. B i vì gi i tính có 2 giá tr nam vàả ả ố ầ ấ ủ ị n nên ta li t kê 2 giá tr này m t c t. c t th nhì ta ghi t n su t tữ ệ ị ộ ộ Ở ộ ứ ầ ấ ương ng c aứ ủ các giá tr này. Ðơi khi b ng phân ph i t n su t có thêm c t ph n trăm nh trong thí dị ả ố ầ ấ ộ ầ ụ
trên. B ng 2 là m t thí d khác v b ng phân ph i t n su t
ở ả ộ ụ ề ả ố ầ ấ
Table 2. Phương pháp đ đ c a 600 tr trong b nh vi nỡ ẻ ủ ẻ ệ ệ Phương pháp đỡ
đẻ S
ố
sinh Ph n ầ trăm Sinh thường 478 79,7 Sinh forceps 65 10,8
Sinh mổ 57 9,5
(4)Ðôi khi trong b ng phân ph i ngả ố ười ta không ghi con s th c t c a t n su t mà chố ự ế ủ ầ ấ ỉ ghi nh n ph n trăm. Trong trậ ầ ường h p h p này, ph i ghi rõ s đ i tợ ợ ả ố ố ượng c a toàn bủ ộ phân ph i (s đ i tố ố ố ượng tồn b trong thí d trên là 600)ộ ụ
Phân ph i t n su t c a bi n s đ nh lố ầ ấ ủ ế ố ị ượng
N u bi n s là bi n s liên t c chúng ta không th li t kê t t c các giá tr c a bi nế ế ố ế ố ụ ể ệ ấ ả ị ủ ế s Trong trố ường h p này chúng ta có th nhóm (làm trịn) giá tr c a bi n s l i.ợ ể ị ủ ế ố
C th các bụ ể ước xây d ng b ng phân ph i t n su t cho bi n s đ nh lự ả ố ầ ấ ế ố ị ượng nh sau:ư 1 Tìm ph m vi (giá tr c c ti u và giá tr c c đ i) c a s li u. Trong thí d vạ ị ự ể ị ự ủ ố ệ ụ ề hemoglobin c a 70 ph n ph m vi là 8,8 đ n 15,1ủ ụ ữ ế
2. Chia ph m vi s li u ra làm n kho ng v i đ r ng c a m i kho ng là d. C n l u ýạ ố ệ ả ộ ộ ủ ỗ ả ầ đ r ng m i kho ng d nên là đ i lộ ộ ỗ ả ượng ch n nh 1, 2, 5, 10 hay 0,5, 0,2 và s cácẵ ố kho ng n nên t 512 (trung bình là 78). Trong thí d trên ta có th chia ph m vi raả ụ ể làm 8kho ng v i chi u r ng kho ng b ng 1 đ n v Khi đó các kho ng là: 88,9; 99,9;ả ề ộ ả ằ ị ả 1010,9; 1111,9; 1212,9; 1313,9; 1414,9; 1515,9
3. Ð m các giá tr thích h p vào kho ng đã đ nh trế ị ợ ả ị ước Hemoglobin
(g/100ml)
Ð mế
88,9
99,9 111
1010,9 1111 1111 1111 1111,9 1111 1111 1111 1111 1212,9 1111 1111 1111 1313,9 1111 1111 111 1414,9 1111
1515,9
4. Xây d ng b ng phân ph i t n su t v i bi n s và các kho ng giá tr c a bi n s vàự ả ố ầ ấ ế ố ả ị ủ ế ố t n su t tầ ấ ương ng v i các kho ng giá tr đó. Chúng ta cũng có th thêm vào c t ph nứ ả ị ể ộ ầ trăm và c t ph n trăm tích lũy (n u thích h p)ộ ầ ế ợ
Table 3. Hemoglobin c a 70 ph nủ ụ ữ Hemoglobin T nầ
su tấ Ph n ầ
trăm Ph n trăm tích
ầ
lũy
88,9 1.43 1.43
99,9 4.29 5.71
(5)1111,9 19 27.14 52.86
1212,9 14 20.00 72.86
1313,9 13 18.57 91.43
1414,9 7.14 98.57
1515,9 1.43 100.00
Thí d nh n u biên s là chu vi vịng cánh tay c a tr chúng ta có th làm trịn chu viụ ế ố ủ ẻ ể vịng cánh tay đ n 1 cm. Khi đó ta có th xem thang đo c a bi n s là r i r c và trìnhế ể ủ ế ố bày b ng phân ph i t n su t c a bi n s (b ng 2).ả ố ầ ấ ủ ế ố ả
Table 4. Phân ph i s đo vòng cánh tay c a 69 tr l p c m thố ố ủ ẻ ường nhà tr 23 tháng 11, Hóc mơn.ẻ Vịng cánh tay T nầ
su tấ Ph n ầ
trăm Ph n trăm tích
ầ
lũy 13 <14 2.78 2.78 14 <15 31 43.06 45.83 15 <16 27 37.50 83.33 16 <17 12.50 95.83 17 <18 12.50 95.83 18 <19 2.78 98.61 19 <20 1.39 100.00 4 Các số thống kê mơ tả
Vi c trình bày s li u b ng b ng là th a mãn cho các bi n s đ nh tính (c bi n sệ ố ệ ằ ả ỏ ế ố ị ả ế ố danh đ nh và bi n s th t ). Tuy nhiên các s li u đ nh lị ế ố ứ ự ố ệ ị ượng có th tóm t t h n n aể ắ ữ b ng các s th ng kê mơ t Có hai lo i th ng kê mơ t : th ng kê mô t khuynhằ ố ố ả ố ả ố ả hướng t p trung và th ng kê mơ t tính phân tán.ậ ố ả
Th ng kê mơ t khuynh hố ả ướng t p trungậ
Th ng kê mô t khuynh hố ả ướng t p trung có th là trung bình (mean), trung v (median)ậ ể ị và y u v (mode). Nh ng th ng kê này cho bi t giá tr tiêu bi u cho s li u.ế ị ữ ố ế ị ể ố ệ
Thí d : có hai lo i thu c h áp A và B. Gi s có 5 đ i tụ ố ả ố ượng sau khi s d ng thu c h áp A ử ụ ố s có huy t áp 110 115 120 125 130 và 5 đ i tẽ ế ố ượng khác sau khi s d ng thu c h áp B ử ụ ố s có huy t áp 120 125 130 135 140. Con s tiêu bi u nh t đ cho bi t tác d ng c a ẽ ế ố ể ấ ể ế ụ ủ thu c A là huy t áp trung bình sau khi s d ng thu c A và là 120. Con s huy t áp trung bình ố ế ụ ố ố ế này th p h n huy t áp trung bình sau khi s d ng thu c B cho bi t thu c A có tác d ng m nh ấ ế ụ ố ế ố ụ h n.ơ
(6)N x
x i
Thí d : S li u v huy t áp tâm thu c a 5 đ i tụ ố ệ ề ế ủ ố ượng là 120, 125, 130, 135,
150. Huy t áp tâm thu trung bình s là 132ế ẽ
132
150 135 130 125 120
N x
x i
Do khơng th th c hi n các phép tốn s h c trên các bi n s đ nh tính (danh đ nh vàể ự ệ ố ọ ế ố ị ị th t ) chúng ta ch có th tính trung bình cho s li u c a bi n s đ nh lứ ự ỉ ể ố ệ ủ ế ố ị ượng
N u chúng ta s p x p s li u theo th t , giá tr đ ng gi a đế ắ ế ố ệ ứ ự ị ứ ữ ược g i là trung v ọ ị N u có hai giá tr cùng đ ng gi a, trung bình c ng c a hai giá tr này là trung v ế ị ứ ữ ộ ủ ị ị
Thí d : S li u v huy t áp tâm thu (mmHg) c a 5 đ i tụ ố ệ ề ế ủ ố ượng là 120, 125, 130, 135, 150. Trung v c a huy t áp tâm thu là giá tr đ ng gi a và b ng 130ị ủ ế ị ứ ữ ằ
S li u v chi u cao (cm) c a 6 ngố ệ ề ề ủ ười là 153, 155, 160, 162, 165, 161. Ð tínhể trung v , trị ước tiên chúng ta ph i s p x p s li u này: 153, 155, 160, 161, 162, ả ắ ế ố ệ
165. Do có hai giá tr 160 và 161 cùng gi a, trung v s là (160+161)/2 = ị ữ ị ẽ
160,5 cm
Ðôi khi người ta ch n con s th ng kê tiêu bi u là y u v (mode). Y u v là giá tr xu tọ ố ố ể ế ị ế ị ị ấ hi n ph bi n nh t (có t n su t cao nh t).ệ ổ ế ấ ầ ấ ấ
Thí d : S li u v huy t áp tâm thu (mmHg) c a 5 đ i tụ ố ệ ề ế ủ ố ượng là 120, 125, 130, 135, 150. Trong trường h p này khơng có y u v ợ ế ị
Ði m s c a 5 h c sinh là 5, 5, 6, 7, 9. Y u v c a đi m s là 5.ể ố ủ ọ ế ị ủ ể ố
Trong m t s li u c th , có th khơng có y u v , có th có m t y u v ho c hai hayộ ố ệ ụ ể ể ế ị ể ộ ế ị ặ nhi u y u v Ðây là khuy t đi m chính c a s th ng kê này. Do v y ngề ế ị ế ể ủ ố ố ậ ười ta thường ch dùng trong các trỉ ường h p đ c bi tợ ặ ệ
Có th s d ng trung bình, trung v hay y u v cho bi n s đ nh lể ụ ị ế ị ế ố ị ượng. Khi bi n sế ố đ nh lị ượng có phân ph i bình thố ường (hình chng) thì ba con s này x p x b ng nhauố ấ ỉ ằ và khi đó người ta thường tính trung bình b i vì trung bình có nh ng đ c tính tốn h cở ữ ặ ọ m nh. Tuy nhiên n u s li u b l ch thì con s trung v ph n ánh giá tr tiêu bi u m tạ ế ố ệ ị ệ ố ị ả ị ể ộ cách chính xác h n.ơ
Thí d : B nh nhân b loét d dày tá tràng đụ ệ ị ược đi u tr theo m t phác đ di t vi ề ị ộ ệ khu n Helicobacter. Sau đi u tr , b nh nhân đẩ ề ị ệ ược theo dõi và ghi nh n th i gian k t ậ ể khi s d ng thu c đ n lúc b t đ u c i thi n tri u ch ng đau. 10 b nh nhân th i ử ụ ố ế ắ ầ ả ệ ệ ứ Ở ệ gian này (ngày ) là nh sau: 1, 2, 2, 2, 2, 2, 3, 3, 3, 30. B nh nhân có th i gian t lúc ư ệ u tr đ n lúc gi m tri u ch ng là 30 ngày trên th c ch t là b nh nhân không đáp ề ị ế ả ệ ứ ự ấ ệ ng v i đi u tr Trung v và trung bình c a s li u là 2 và 5 ngày. Con s trung v
ứ ề ị ị ủ ố ệ ố ị
ph n ánh chân th c h n b i vì v i t cách là m t bác sĩ lâm sàng t s li u trên có th ả ự ộ ố ệ ể nh n xét r ng m t b nh nhân tiêu bi u s gi m đau sau 2 ngày dùng thu c. Con sơs 30ậ ằ ộ ệ ể ẽ ả ố trong thí d trên đụ ược g i là s ngo i lai (outlier) và làm s li u b l ch. Nhìn chung, ọ ố ố ệ ị ệ khi s li u b l ch thì con s trung bình s b nh hố ệ ị ệ ố ẽ ị ả ưởng r t nhi u và không ph n ánh ấ ề ả giá tr tiêu bi u nh con s trung v ị ể ố ị
Th ng kê mô t tính phân tán:ố ả
(7)Thí d : Thu c h áp A đụ ố ượ ục s d ng trên 5 b nh nhân và huy t áp tâm thu sau khi dùng thu c ệ ế ố là 110, 115, 120, 125 và 130. Thu c h áp B đố ượ ục s d ng trên 5 b nh nhân và có huy t áp sau ệ ế s d ng thu c là 100, 110, 120, 130, 140. Nh v y hai thu c h áp này có hi u qu h áp là ử ụ ố ậ ố ệ ả tương đương (b i vì trung bình c a hai s li u là b ng nhau) nh ng k t qu c a thu c B phân ở ủ ố ệ ằ ế ả ủ ố tán h n và đi u này làm thu c B tr nên kém an toàn.ơ ề ố
Ð l ch chu n (standard deviation vi t t t là SD hay s) là con s đánh giá m c độ ệ ẩ ế ắ ố ứ ộ phân tán và được tính theo cơng th c:ứ
n i i N x x s ) (
Nh v y đ l ch chu n ph n ánh kho ng cách trung bình c a s li u so v i giá tr tiêuư ậ ộ ệ ẩ ả ả ủ ố ệ ị bi u. Khái ni m đ l ch chu n ch có th áp d ng cho bi n s đ nh lể ệ ộ ệ ẩ ỉ ể ụ ế ố ị ượng b i vìở chúng ta có th th c hi n các phép tốn s h c trên các đ i lể ự ệ ố ọ ượng nh ng không thư ể th c hi n trên các giá tr c a bi n s đ nh tính là các đ c tính.ự ệ ị ủ ế ố ị ặ
Thí d : S li u v huy t áp tâm thu (mmHg) c a 5 đ i tụ ố ệ ề ế ủ ố ượng là 120, 125, 130, 135, 150. Trung bình c a huy t áp là 132 và đ l ch chu n b ngủ ế ộ ệ ẩ ằ
5 , 11 , 132 530 324 49 144 ) 132 150 ( ) 132 135 ( ) 130 132 ( ) 132 125 ( ) 132 120 ( ) ( 2 2 2 n i i N x x s
Phương sai v m t t nguyên là bình phề ặ ương c a sai bình phủ ương c a đ l chủ ộ ệ chu n. Phẩ ương sai (variance) có th để ược kí hi u và Var hay s2 và đệ ược tính theo cơng th c sau:ứ
s xi x n
i n 2 1 ( ) / ( )
Ph m vi c a s li u là t t c các giá tr c a s li u t giá tr nh nh t đ n giá tr l nạ ủ ố ệ ấ ả ị ủ ố ệ ị ỏ ấ ế ị nh t.ấ
Thí d : S li u v huy t áp tâm thu (mmHg) c a 5 đ i tụ ố ệ ề ế ủ ố ượng là 120, 125, 130, 135, 150. Ph m ạ vi c a bi n s huy t áp là 120 đ n 150.ủ ế ố ế ế
Thí d : Thu c h áp A đụ ố ượ ục s d ng trên 5 b nh nhân và huy t áp tâm thu sau khi dùng thu c ệ ế ố là 110, 115, 120, 125 và 130. Thu c h áp B đố ượ ục s d ng trên 5 b nh nhân và có huy t áp sau ệ ế s d ng thu c là 100, 110, 120, 130, 140. S li u c a thu c B có tính phân tán cao h n do ử ụ ố ố ệ ủ ố ph m vi thay đ i t 100140 trong khi đó ph m v c a s li u thu c A ch t 110130.ạ ổ ị ủ ố ệ ố ỉ
(8)Thí d : S li u v huy t áp tâm thu (mmHg) c a 5 đ i tụ ố ệ ề ế ủ ố ượng là 120, 125, 130, 135, 150. S ố li u này đệ ược chia làm 2 ph n: ph n 1 g m 120, 125, 130 và ph n 2 g m 130, 135, và 150. ầ ầ ầ Trung v c a ph n trên là 125 trung v c a ph n dị ủ ầ ị ủ ầ ưới là 135, do đó ph m t v là 125135.ạ ứ ị Do b n ch t c a kho ng t v là trung v c a ph n s li u trên và ph n s li u dả ấ ủ ả ứ ị ị ủ ầ ố ệ ầ ố ệ ưới, cũng gi ng nh trung v , kho ng t v không b nh hố ị ả ứ ị ị ả ưởng b i các giá tr ngo i lai nhở ị ư trong trường h p c a đ l ch chu n. Cũng nh trung v , kho ng t v ch có th ápợ ủ ộ ệ ẩ ị ả ứ ị ỉ ể d ng cho bi n s đ nh lụ ế ố ị ượng hay th t ứ ự
Có 3 th ng kê mơ t tính phân tán: đ l ch chu n, kho ng t v và ph m vi c a số ả ộ ệ ẩ ả ứ ị ủ ố li u. Vi c l a ch n th ng kê mơ t tính phân tán đệ ệ ự ọ ố ả ược trình bày trong b ng 2.ả
B ng 6. Ch n l a các th ng kê mơ t tính phân tán cho các lo i bi n s ả ọ ự ố ả ế ố Trường h pợ Th ng kê tóm t t giá tr tiêuố ắ ị
bi uể Th ng kê m c đ phân tác
ố ứ ộ
Phân ph i cân đ iố ố Trung bình (mean) Ð l ch chu n (standardộ ệ ẩ deviation)
Th ng kê b l chố ị ệ Trung v (median)ị Kho ng t v (interquartile)ả ứ ị Ph m vi (Range)ạ
Câu h i: Phân tích trên máy tính v bi n s hemoglobin cho k t qu sau. Hãy th đ cỏ ề ế ố ế ả ọ và lí gi i k t qu :ả ế ả
Variable | Obs Mean Std Dev Min Max -+ -hemoglobin | 70 11.98429 1.416122 8.8 15.1
Thí d v s li u b l ch: Th i gian n m vi n c a 17 đ i tụ ề ố ệ ị ệ ằ ệ ủ ố ượng sau khi ph u thu tẫ ậ (đượ ắc s p x p t nh đ n l n) là:ế ỏ ế
3 4 4 6 8 8 8 10 10 12 14 14 17 25 27 37 42
Phân ph i này b l ch nên con s th i gian n m vi n trung bình là 14,6 khơng ph i conố ị ệ ố ằ ệ ả s phù h p đo lố ợ ường trung tâm. Ð đánh giá T phân ph i này ta nh n th y trung v làể ố ậ ấ ị 10; t v trên là 17 và t v dứ ị ứ ị ưới là 8
Logarithm
M t cách khác đ đ i phó v i s l ch b l ch, trong trộ ể ố ố ệ ị ệ ường h p b l ch dợ ị ệ ương là sử d ng logarithm (hay g i t t là log) c a giá tr s li u thay vì dùng b n thân giá tr ụ ọ ắ ủ ị ố ệ ả ị Có nhi u lo i logarithms khác nhau. Logarithm c s 10 là lo i thề ố ường đượ ục s d ng trong quá kh đ nhân hay chia các con s m t cách nhanh chóng. G n đây do s phátứ ể ố ộ ầ ự tri n c a các máy vi tính và máy tính c m tay, vi c s d ng logarithms c s 10 trể ủ ầ ệ ụ ố ở nên b phôi pha. Hi n này ngị ệ ười ta thường ch dùng logarithms c s e (e=2,71) hayỉ ố cịn g i là logarithms t nhiên do lo i logarithms này có m t s đ c tính tốn h cọ ự ộ ố ặ ọ đáng quý. Logarithms t nhiên c a m t s x thự ủ ộ ố ường được kí hi u ln(x).ệ
(9)ln(x/y)=ln(x)ln(y)
ln(xn)=ln(xx x)=ln(x)+ln(x)+ +ln(x)=nln(x)
ln(1+x)(x (v i x nh )ớ ỏ
N u chúng ta đã bi t ln(x) và mu n bi t x b ng bao nhiêu chúng ta s d ng hàmế ế ố ế ằ ụ antilog(x) hay còn g i là hàm exp(x).ọ
Trong trường h p s li u b l ch dợ ố ệ ị ệ ương, người ta l y log c a s li u và tính trungấ ủ ố ệ bình c a log s li u. Sau đó tính giá tr th i gian n m vi n tiêu bi u (con s này đủ ố ệ ị ằ ệ ể ố ược g i là trung bình nhân geometric mean) b ng cách l y antilog c a trung bình c a logọ ằ ấ ủ ủ s li u.ố ệ
Tr l i thí d v th i gian n m vi n c a 17 b nh nhân. Sau khi l y log chúng ta cóở ụ ề ằ ệ ủ ệ ấ trung bình c a log th i gian n m vi n b ng 2,41 và l y antilog c a s này chúng ta cóủ ằ ệ ằ ấ ủ ố trung bình nhân c a th i gian n m vi n là 11,13. Con s này g n v i giá tr trung v làủ ằ ệ ố ầ ị ị 10 h n con s trung bình c ng là 14,6ơ ố ộ
Bi u đ và đ thể ồ ồ ị
S li u cũng có th đố ệ ể ược trình bày dướ ại d ng đ th ho c bi u đ M c dù khơng cóồ ị ặ ể ặ ranh gi i tuy t đ i hồn tồn rõ r t, nói chung đ th (graph) có tính ch t tốn h cớ ệ ố ệ ị ấ ọ nhi u h n, trong đó có tr c hồnh và tr c tung cịn bi u đ (chart) là hình nh mangề ụ ụ ể ả tính ch t tấ ượng tr ng.ư
N u bi n s là bi n r i r c, có th trình bày dế ế ố ế ể ướ ại d ng bi u đ hình thanh (bar chart ể hình 1) ho c bi u đ hình bánh (pie chart). N u bi n s là bi n liên t c, thì phân ph iặ ể ế ế ố ế ụ ố c a bi n s có th trình bày dủ ế ố ể ướ ại d ng t ch c đ (histogram hình 2) ho c đa giácổ ứ ặ t n su t.ầ ấ
Bi u đ hình thanhể ồ
Bi u đ hình thang là bi u đ nh m mô t s phân b c a bi n s r i r c. Bi u để ể ằ ả ự ố ủ ế ố ể ồ hình thanh g m có tr c hồnh trên đó xác đ nh nh ng giá tr c a bi n s ng v i t ngồ ụ ị ữ ị ủ ế ố Ứ giá tr c a bi n s ngị ủ ế ố ười ta v các thanh có chi u cao t l v i t n su t c a giá tr đó.ẽ ề ỉ ệ ầ ấ ủ ị C n l u ý ln ln có kho ng tr ng gi a các thanh.ầ ả ố ữ
45
24
0 10 20 30 40 50
(10)Figure 2. Bi u đ hình thanh (bar chart) mơ t phân b gi i tính c a nh ng h c sinh trong trể ả ố ủ ữ ọ ường m m ầ non 23/11, Hóc mơn
Chúng ta cũng có th xây d ng các thanh theo chi u ngang nh trong ví d sauể ự ề ụ
478 65
57
0 100 200 300 400 500
S inh thư øng S inh fo rceps S inh mo å
Figure 3. Phương pháp sinh c a 600 tr sanh t i b nh vi n X trong năm 1998ủ ẻ ệ ệ
Ð i v i bi n s th t , đi u c n l u ý là các giá tr c a bi n s ph i đố ế ố ứ ự ề ầ ị ủ ế ố ả ượ ẵc s p x pế th t theo tr c hoành.ứ ự ụ
T
a
àn
s
u
a
át
e d u m a t
m u ø c h ö õ c a áp c a áp - ñ a ïi h o ï
1 0 0
Figure 4. Trình đ h c v n c a các bà m trong nghiên c uộ ọ ấ ủ ẹ ứ Bi u đ hình bánhể ồ