1. Trang chủ
  2. » Địa lý lớp 12

Bài giảng Thống kê y học - Bài 6: Thống kê, biến số và phân phối

10 10 0

Đang tải... (xem toàn văn)

THÔNG TIN TÀI LIỆU

[r]

(1)

TH NG KÊ, BI N S  VÀ PHÂN PH I Mục tiêu

Sau khi nghiên c u ch  đ , h c viên có kh  năng:ứ ủ ề ọ ả

­ Trình bày đ nh nghĩa c a th ng kê,  s  li u, thông tin và bi n sị ủ ố ố ệ ế ố

­ Phân bi t đệ ược các lo i bi n s : đ nh lạ ế ố ị ượng và đ nh tính trong có có bi n s  nh  giá,ị ế ố ị   danh đ nh hay th  t ị ứ ự

­ Xây d ng đự ược b ng phân ph i t n su t cho s  li u đ nh tính và đ nh lả ố ầ ấ ố ệ ị ị ượng

­ L a ch n đự ọ ược các lo i bi u đ  hay đ  th  thích h p đ  trình bày s  li u đ nh tính vàạ ể ồ ị ợ ể ố ệ ị   đ nh lị ượng

­ Tính được các s  th ng kê tóm t t nh  trung bình, trung v , y u v , đ  l ch chu n,ố ố ắ ị ế ị ộ ệ ẩ   phương sai. 

1 Một số định nghĩa

Th ng kê là phố ương pháp khoa h c dùng đ  thu th p, tóm t t, trình bày và phân tích sọ ề ậ ắ ố  li u. Phệ ương pháp th ng kê đố ược s  d ng trong nghiên c u nh m đ  so sánh m tử ụ ứ ằ ể ộ   nhóm đ i tố ượng ch  khơng nh m nghiên c u t ng cá nhân đ n l ứ ằ ẻ

S  li u: K t qu  có đố ệ ế ả ược do vi c quan sát hay thu th p đ c tính hay đ i lệ ậ ặ ượng   cácở   đ i tố ượng khác nhau hay   th i gian khác nhau.ở

Thí d :  Quan sát gi i tính c a các h c viên trong l p, s  li u ghi nh n đụ ủ ọ ố ệ ậ ược là: Nam, nam, n , n , n , nam, n , v.vữ ữ ữ ữ

Thí d : M t nhà nghiên c u đo n ng đ  hemoglobin c a 70 thai ph  có k t qu  nhụ ộ ứ ộ ủ ụ ế ả ư  sau:

10.2 13.7 10.4 14.9 11.5 12.0 11.0 13.3 12.9 12.1 9.4 13.2 10.8 11.7 10.6 10.5 13.7 11.8 14.1 10.3 13.6 12.1 12.9 11.4 12.7 10.6 11.4 11.9 9.3 13.5 14.6 11.2 11.7 10.9 10.4 12.0 12.9 11.1 8.8 10.2 11.6 12.5 13.4 12.1 10.9 11.3 14.7 10.8 13.3 11.9 11.4 12.5 13.0 11.6 13.1 9.7 11.2 15.1 10.7 12.9 13.4 12.3 11.0 14.6 11.1 13.5 10.9 13.1 11.8 12.2

và nh ng con s  này đữ ố ược g i là s  li u.ọ ố ệ

C n l u ý s  li u ph i liên k t v i m t đ c tính hay đ i lầ ố ệ ả ế ộ ặ ượng nh t đ nh. Ghi nh nấ ị ậ   gi i tính   ngớ ười này, tu i c a ngổ ủ ười khác, qu n áo c a m t ngầ ủ ộ ười khác n a thì k tữ ế   qu  này đả ược khơng ph i là s  li u.ả ố ệ

(2)

2 Biến số loại biến số

Bi n s  là nh ng đ i lế ố ữ ượng hay nh ng đ c tính có th  thay đ i t  ngữ ặ ể ổ ười này sang  người khác hay t  th i đi m này sang th i đi m khác.ừ ể ể

Nh  v y bi n s  có th  th  hi n đ i lư ậ ế ố ể ể ệ ượng hay đ c tính. N u nó th  hi n  m t đ iặ ế ể ệ ộ ạ  lượng nó được g i là bi n s  đ nh lọ ế ố ị ượng. N u nó nh m th  hi n m t đ c tính noế ằ ể ệ ộ ặ   được g i là bi n s  đ nh tính. ọ ế ố ị

Bi n s  đ nh tínhế ố ị

Bi n s  đ nh tính cịn đế ố ị ược chia làm 3 lo i: bi n s  th  t , bi n s  danh đ nh và bi nạ ế ố ứ ự ế ố ị ế   s  nh  giá.ố ị

Bi n s  th  t  là bi n s  đ nh tính v i các giá tr  có th  s p x p th  t  đế ố ứ ự ế ố ị ị ể ắ ế ứ ự ược

Thí d : tình tr ng kinh t  xã h i (giàu, khá, trung bình, nghèo, r t nghèo) là bi n s  thụ ế ộ ấ ế ố ứ  t  b i vì ngự ười giàu có đi u ki n kinh t  t t h n ngề ệ ế ố ười khá, người khá h n ngơ ười  trung bình, trung bình h n nghèo, v.vơ

Nh ng thí d  khác là h c l c c a h c sinh (gi i, khá, trung bình, kém), tiên lữ ụ ọ ự ủ ọ ỏ ượng (t t,ố   khá, x u, t  vong).ấ

Theo phân lo i tăng huy t áp c a T  ch c Y t  Th  gi i đạ ế ủ ổ ứ ế ế ược trình bày nh  sau, theoư   phân lo i huy t áp v i các giá tr  huy t áp bình thạ ế ị ế ường, tăng huy t áp đ  1, tăng huy tế ộ ế  áp đ  2, tăng huy t áp đ  3 là bi n s  th  tộ ế ộ ế ố ứ ự

Huy t áp bình thế ường:  HA tâm thu ≤139 và HA tâm trương ≤ 89 Tăng huy t áp đ  1: ế ộ HA tâm thu ≤ 179 hay HA tâm trương ≤ 104 Tăng huy t áp đ  2:ế ộ HA tâm thu ≥ 180 hay HA tâm trương >114 Tăng huy t áp đ  3:ế ộ HA tâm thu ≥180 và HA tâm trương ≥ 115 mmHg

Bi n s  danh đ nh là bi n s  đ nh tính mà giá tr  c a nó khơng th  bi u th  b ng s  màế ố ị ế ố ị ị ủ ể ể ị ằ ố   ph i bi u di n b ng m t tên g i (danh: tên) và các giá tr  này không th  s p đ t theoả ể ễ ằ ộ ọ ị ể ắ ặ   m t tr t t  t  th p đ n cao.ộ ậ ự ấ ế

Thí d : Bi n s  dân t c v i các giá tr : Kinh, Khmer, Hoa, Chăm,… là bi n s  đ nhụ ế ố ộ ị ế ố ị   tính vì chúng ta khơng th  s p x p các giá tr  này t  theo m t tr t t  t  th p đ n caoể ắ ế ị ộ ậ ự ấ ế   hay ngượ ạc l i

M t s  thí d  khác c a bi n s  danh đ nh là tình tr ng hơn nhân (có 4 giá tr : đ c thân,ộ ố ụ ủ ế ố ị ị ộ   có gia đình, li d , góa) nhóm máu (A, B, AB và O).ị

Đơi khi bi n s  danh đ nh ch  có 2 giá tr : thí d  nh  s ng hay ch t; có hút thu c lá hayế ố ị ỉ ị ụ ố ế ố   khơng hút thu c lá; có suy dinh dố ưỡng hay khơng suy dinh dưỡng; nam hay n  Nh ngữ ữ   bi n s  thu c lo i này đế ố ộ ược g i là bi n s  nh  giá (binary variable)ọ ế ố ị

Mã hoá

(3)

Gi i tính là bi n s  danh đ nh và có hai giá tr  là nam và n  Chúng ta có th  mã hóa gi i tính và ớ ế ố ị ị ữ ể quy ước Nam là 1 và N  là 2. Tuy nhiên vi c mã hóa này là áp đ t và chúng ta hồn tồn có th  ữ ệ ặ ể quy ước Nam là 1 và N  là 0. Vi c mã hóa ch  nh m giúp vi c nh p s  li u và x  lí s  li u trữ ệ ỉ ằ ệ ậ ố ệ ố ệ ở  nên d  dàng h n ch  khơng nh m ph n ánh b n ch t c a bi n s  đó.ễ ứ ằ ả ả ấ ủ ế ố

Bi n s  đ nh lế ố ị ượng

Bi n s  đ nh lế ố ị ượng nh m th  hi n m t đ i lằ ể ệ ộ ượng và do đó có giá tr  là nh ng con s ị ữ ố Thí d : tu i là bi n s  liên t c b i vì ta có th  nói ngụ ổ ế ố ụ ể ười này 20 tu i, ngổ ười kia 32  tu i, v.v.ổ

Nh ng thí d  khác là đữ ụ ường huy t, hemoglobin, hematocrite, chi u cao, cân n ng, thuế ề ặ   nh p, v.vậ

3 Phương pháp trình bày số liệu bảng

S  li u ghi nh n các đ c tính hay đ i lố ệ ậ ặ ượng có th  trình bày thành b ng và b ng nàyể ả ả   được g i là b ng phân ph i t n su t.ọ ả ố ầ ấ

Phân ph i t n su t c a bi n s  đ nh tínhố ầ ấ ủ ế ố ị

S  li u c a bi n s  r i r c có th  đố ệ ủ ế ố ể ược trình bày dướ ại d ng m t phân ph i t n su t.ộ ố ầ ấ   Phân ph i t n su t là m t b ng ch  ra t n su t xu t hi n c a t ng giá tr  r i r c c aố ầ ấ ộ ả ỉ ầ ấ ấ ệ ủ ị ủ   bi n s  (B ng 1). Nh  v y b ng phân ph i t n su t g m 2 c t, m t c t li t kê các giáế ố ả ậ ả ố ầ ấ ộ ộ ộ ệ   tr  c a bi n s  và m t c t trình bày t n su t tị ủ ế ố ộ ộ ầ ấ ương  ng c a các giá tr  đó.ứ ủ ị

Table 1. Phân ph i gi i tính c a 69 h c sinh l p c m thố ủ ọ ường trường m m non 23 tháng 11, Huy n Hóc ầ ệ mơn

Gi iớ S  trố ẻ Ph n trămầ

Nam 45 65%

Nữ 24 35%

T ng sổ ố 69 100%

B ng trên là b n phân ph i t n su t c a gi i tính. B i vì gi i tính có 2 giá tr  nam vàả ả ố ầ ấ ủ ị   n  nên ta li t kê 2 giá tr  này   m t c t.   c t th  nhì ta ghi t n su t tữ ệ ị ộ ộ Ở ộ ứ ầ ấ ương  ng c aứ ủ   các giá tr  này. Ðơi khi b ng phân ph i t n su t có thêm c t ph n trăm nh  trong thí dị ả ố ầ ấ ộ ầ ụ 

 trên. B ng 2 là m t thí d  khác v  b ng phân ph i t n su t

ở ả ộ ụ ề ả ố ầ ấ

Table 2. Phương pháp đ  đ  c a 600 tr  trong b nh vi nỡ ẻ ủ ẻ ệ ệ Phương   pháp   đỡ 

đẻ S

ố 

sinh Ph n ầ   trăm Sinh thường 478 79,7 Sinh forceps 65 10,8

Sinh mổ 57 9,5

(4)

Ðôi khi trong b ng phân ph i ngả ố ười ta không ghi con s  th c t  c a t n su t mà chố ự ế ủ ầ ấ ỉ  ghi nh n ph n trăm. Trong trậ ầ ường h p h p này, ph i ghi rõ s  đ i tợ ợ ả ố ố ượng c a toàn bủ ộ  phân ph i (s  đ i tố ố ố ượng tồn b  trong thí d  trên là 600)ộ ụ

Phân ph i t n su t c a bi n s  đ nh lố ầ ấ ủ ế ố ị ượng

N u bi n s  là bi n s  liên t c chúng ta không th  li t kê t t c  các giá tr  c a bi nế ế ố ế ố ụ ể ệ ấ ả ị ủ ế   s  Trong trố ường h p này chúng ta có th  nhóm (làm trịn) giá tr  c a bi n s  l i.ợ ể ị ủ ế ố

C  th  các bụ ể ước xây d ng b ng phân ph i t n su t cho bi n s  đ nh lự ả ố ầ ấ ế ố ị ượng nh  sau:ư 1­ Tìm ph m vi (giá tr  c c ti u và giá tr  c c đ i) c a s  li u. Trong thí d  vạ ị ự ể ị ự ủ ố ệ ụ ề  hemoglobin c a 70 ph  n  ph m vi là 8,8 đ n 15,1ủ ụ ữ ế

2. Chia ph m vi s  li u ra làm n kho ng v i đ  r ng c a m i kho ng là d. C n l u ýạ ố ệ ả ộ ộ ủ ỗ ả ầ   đ  r ng m i kho ng d nên là đ i lộ ộ ỗ ả ượng ch n nh  1, 2, 5, 10 hay 0,5, 0,2 và s  cácẵ ố   kho ng n nên t  5­12 (trung bình là 7­8). Trong thí d  trên ta có th  chia ph m vi raả ụ ể   làm 8kho ng v i chi u r ng kho ng b ng 1 đ n v  Khi đó các kho ng là: 8­8,9; 9­9,9;ả ề ộ ả ằ ị ả   10­10,9; 11­11,9; 12­12,9; 13­13,9; 14­14,9; 15­15,9

3. Ð m các giá tr  thích h p vào kho ng đã đ nh trế ị ợ ả ị ước Hemoglobin

(g/100ml)

Ð mế

8­8,9

9­9,9 111

10­10,9 1111  1111  1111 11­11,9 1111  1111  1111  1111 12­12,9 1111  1111  1111 13­13,9 1111  1111  111 14­14,9 1111

15­15,9

4. Xây d ng b ng phân ph i t n su t v i bi n s  và các kho ng giá tr  c a bi n s  vàự ả ố ầ ấ ế ố ả ị ủ ế ố   t n su t tầ ấ ương  ng v i các kho ng giá tr  đó. Chúng ta cũng có th  thêm vào c t ph nứ ả ị ể ộ ầ   trăm và c t ph n trăm tích lũy  (n u thích h p)ộ ầ ế ợ

Table 3. Hemoglobin c a 70 ph  nủ ụ ữ Hemoglobin T nầ  

su tấ Ph n ầ  

trăm Ph n trăm tích

ầ  

lũy

8­8,9 1.43 1.43

9­9,9 4.29 5.71

(5)

11­11,9 19 27.14 52.86

12­12,9 14 20.00 72.86

13­13,9 13 18.57 91.43

14­14,9 7.14 98.57

15­15,9 1.43 100.00

Thí d  nh  n u biên s  là chu vi vịng cánh tay c a tr  chúng ta có th  làm trịn chu viụ ế ố ủ ẻ ể   vịng cánh tay đ n 1 cm. Khi đó ta có th  xem thang đo c a bi n s  là r i r c và trìnhế ể ủ ế ố   bày b ng phân ph i t n su t c a bi n s  (b ng 2).ả ố ầ ấ ủ ế ố ả

Table 4. Phân ph i s  đo vòng cánh tay c a 69 tr  l p c m thố ố ủ ẻ ường nhà tr  23 tháng 11, Hóc mơn.ẻ Vịng cánh tay T nầ  

su tấ Ph n ầ  

trăm Ph n trăm tích

ầ  

lũy     13­ <14 2.78 2.78     14­ <15  31 43.06 45.83     15­ <16  27 37.50 83.33     16­ <17  12.50 95.83     17­ <18  12.50 95.83     18­ <19  2.78 98.61     19­ <20  1.39 100.00 4 Các số thống kê mơ tả

Vi c trình bày s  li u b ng b ng là th a mãn cho các bi n s  đ nh tính (c  bi n sệ ố ệ ằ ả ỏ ế ố ị ả ế ố  danh đ nh và bi n s  th  t ). Tuy nhiên các s  li u đ nh lị ế ố ứ ự ố ệ ị ượng có th  tóm t t h n n aể ắ ữ   b ng các s  th ng kê mơ t  Có hai lo i th ng kê mơ t : th ng kê mô t  khuynhằ ố ố ả ố ả ố ả   hướng t p trung và th ng kê mơ t  tính phân tán.ậ ố ả

Th ng kê mơ t  khuynh h ướng t p trung

Th ng kê mô t  khuynh hố ả ướng t p trung có th  là trung bình (mean), trung v  (median)ậ ể ị   và y u v  (mode). Nh ng th ng kê này cho bi t giá tr  tiêu bi u cho s  li u.ế ị ữ ố ế ị ể ố ệ

Thí d : có hai lo i thu c h  áp A và B. Gi  s  có 5 đ i tụ ố ả ố ượng sau khi s  d ng thu c h  áp A ử ụ ố s  có huy t áp 110 ­ 115 ­120 ­ 125 ­130 và   5 đ i tẽ ế ố ượng khác sau khi s  d ng thu c h  áp B ử ụ ố s  có huy t áp 120 ­ 125 ­ 130 ­ 135 ­ 140. Con s  tiêu bi u nh t đ  cho bi t tác d ng c a  ẽ ế ố ể ấ ể ế ụ ủ thu c A là huy t áp trung bình sau khi s  d ng thu c A và là 120. Con s  huy t áp trung bình ố ế ụ ố ố ế này th p h n huy t áp trung bình sau khi s  d ng thu c B cho bi t thu c A có tác d ng m nh ấ ế ụ ố ế ố ụ h n.ơ

(6)

N x

x i

Thí d : S  li u v  huy t áp tâm thu c a 5 đ i tụ ố ệ ề ế ủ ố ượng là 120, 125, 130, 135, 

150. Huy t áp tâm thu trung bình s  là 132ế ẽ

132

150 135 130 125 120

N x

x i

Do khơng th  th c hi n các phép tốn s  h c trên các bi n s  đ nh tính (danh đ nh vàể ự ệ ố ọ ế ố ị ị   th  t ) chúng ta ch  có th  tính trung bình cho s  li u c a bi n s  đ nh lứ ự ỉ ể ố ệ ủ ế ố ị ượng

N u chúng ta s p x p s  li u theo th  t , giá tr  đ ng   gi a đế ắ ế ố ệ ứ ự ị ứ ữ ược g i là trung v ọ ị  N u có hai giá tr  cùng đ ng   gi a, trung bình c ng c a hai giá tr  này là trung v ế ị ứ ữ ộ ủ ị ị

Thí d : S  li u v  huy t áp tâm thu (mmHg) c a 5 đ i tụ ố ệ ề ế ủ ố ượng là 120, 125, 130,  135, 150. Trung v  c a huy t áp tâm thu là giá tr  đ ng   gi a và b ng 130ị ủ ế ị ứ ữ ằ

S  li u v  chi u cao (cm) c a 6 ngố ệ ề ề ủ ười là 153, 155, 160, 162, 165, 161. Ð  tínhể   trung v , trị ước tiên chúng ta ph i s p x p s  li u này: 153, 155, 160, 161, 162, ả ắ ế ố ệ

165. Do có hai giá tr  160 và 161 cùng   gi a, trung v  s  là (160+161)/2 = ị ữ ị ẽ

160,5 cm

Ðôi khi người ta ch n con s  th ng kê tiêu bi u là y u v  (mode). Y u v  là giá tr  xu tọ ố ố ể ế ị ế ị ị ấ  hi n ph  bi n nh t (có t n su t cao nh t).ệ ổ ế ấ ầ ấ ấ

Thí d : S  li u v  huy t áp tâm thu (mmHg) c a 5 đ i tụ ố ệ ề ế ủ ố ượng là 120, 125, 130,  135, 150. Trong trường h p này khơng có y u v ợ ế ị

Ði m s  c a 5 h c sinh là 5, 5, 6, 7, 9. Y u v  c a đi m s  là 5.ể ố ủ ọ ế ị ủ ể ố

Trong m t s  li u c  th , có th  khơng có y u v , có th  có m t y u v  ho c hai hayộ ố ệ ụ ể ể ế ị ể ộ ế ị ặ   nhi u y u v  Ðây là khuy t đi m chính c a s  th ng kê này. Do v y ngề ế ị ế ể ủ ố ố ậ ười ta thường  ch  dùng trong các trỉ ường h p đ c bi tợ ặ ệ

Có th  s  d ng trung bình, trung v  hay y u v  cho bi n s  đ nh lể ụ ị ế ị ế ố ị ượng. Khi bi n sế ố  đ nh lị ượng có phân ph i bình thố ường (hình chng) thì ba con s  này x p x  b ng nhauố ấ ỉ ằ   và khi đó người ta thường tính trung bình b i vì trung bình có nh ng đ c tính tốn h cở ữ ặ ọ   m nh. Tuy nhiên n u s  li u b  l ch thì con s  trung v  ph n ánh giá tr  tiêu bi u m tạ ế ố ệ ị ệ ố ị ả ị ể ộ   cách chính xác h n.ơ

Thí d : B nh nhân b  loét d  dày ­ tá tràng đụ ệ ị ược đi u tr  theo m t phác đ  di t vi ề ị ộ ệ khu n Helicobacter. Sau đi u tr , b nh nhân đẩ ề ị ệ ược theo dõi và ghi nh n th i gian k  t  ậ ể khi s  d ng thu c đ n lúc b t đ u c i thi n tri u ch ng đau.   10 b nh nhân th i ử ụ ố ế ắ ầ ả ệ ệ ứ Ở ệ gian này (ngày ) là nh  sau: 1, 2, 2, 2, 2, 2, 3, 3, 3, 30. B nh nhân có th i gian t  lúc ư ệ u tr  đ n lúc gi m tri u ch ng là 30 ngày trên th c ch t là b nh nhân không đáp ề ị ế ả ệ ứ ự ấ ệ ng v i đi u tr  Trung v  và trung bình c a s  li u là 2 và 5 ngày. Con s  trung v  

ứ ề ị ị ủ ố ệ ố ị

ph n ánh chân th c h n b i vì v i t  cách là m t bác sĩ lâm sàng t  s  li u trên có th  ả ự ộ ố ệ ể nh n xét r ng m t b nh nhân tiêu bi u s  gi m đau sau 2 ngày dùng thu c. Con sơs 30ậ ằ ộ ệ ể ẽ ả ố   trong thí d  trên đụ ược g i là s  ngo i lai (outlier) và làm s  li u b  l ch. Nhìn chung, ọ ố ố ệ ị ệ khi s  li u b  l ch thì con s  trung bình s  b   nh hố ệ ị ệ ố ẽ ị ả ưởng r t nhi u và không ph n ánh ấ ề ả giá tr  tiêu bi u nh  con s  trung v ị ể ố ị

Th ng kê mô t  tính phân tán:

(7)

Thí d : Thu c h  áp A đụ ố ượ ục s  d ng trên 5 b nh nhân và huy t áp tâm thu  sau khi dùng thu c ệ ế ố là 110, 115, 120, 125 và 130. Thu c h  áp B đố ượ ục s  d ng trên 5 b nh nhân và có huy t áp sau ệ ế s  d ng thu c là 100, 110, 120, 130, 140.  Nh  v y hai thu c h  áp này có hi u qu  h  áp là ử ụ ố ậ ố ệ ả tương đương (b i vì trung bình c a hai s  li u là b ng nhau) nh ng k t qu  c a thu c B phân ở ủ ố ệ ằ ế ả ủ ố tán h n và đi u này làm thu c B tr  nên kém an toàn.ơ ề ố

Ð  l ch chu n (standard deviation ­ vi t t t là SD hay s) là con s  đánh giá m c độ ệ ẩ ế ắ ố ứ ộ  phân tán và được tính theo cơng th c:ứ

n i i N x x s ) (

Nh  v y đ  l ch chu n ph n ánh kho ng cách trung bình c a s  li u so v i giá tr  tiêuư ậ ộ ệ ẩ ả ả ủ ố ệ ị   bi u. Khái ni m đ  l ch chu n ch  có th  áp d ng cho bi n s  đ nh lể ệ ộ ệ ẩ ỉ ể ụ ế ố ị ượng b i vìở   chúng ta có th  th c hi n các phép tốn s  h c trên các đ i lể ự ệ ố ọ ượng nh ng không thư ể  th c hi n trên các giá tr  c a bi n s  đ nh tính là các đ c tính.ự ệ ị ủ ế ố ị ặ

Thí d : S  li u v  huy t áp tâm thu (mmHg) c a 5 đ i tụ ố ệ ề ế ủ ố ượng là 120, 125, 130, 135, 150. Trung  bình c a huy t áp là 132 và đ  l ch chu n b ngủ ế ộ ệ ẩ ằ

5 , 11 , 132 530 324 49 144 ) 132 150 ( ) 132 135 ( ) 130 132 ( ) 132 125 ( ) 132 120 ( ) ( 2 2 2 n i i N x x s

Phương sai v  m t t  nguyên là bình phề ặ ương c a sai ­ bình phủ ương c a đ  l chủ ộ ệ   chu n. Phẩ ương sai (variance) có th  để ược kí hi u và Var hay s2 và đệ ược tính theo cơng  th c sau:ứ

s xi x n

i n 2 1 ( ) / ( )

Ph m vi c a s  li u là t t c  các giá tr  c a s  li u t  giá tr  nh  nh t đ n giá tr  l nạ ủ ố ệ ấ ả ị ủ ố ệ ị ỏ ấ ế ị   nh t.ấ

Thí d : S  li u v  huy t áp tâm thu (mmHg) c a 5 đ i tụ ố ệ ề ế ủ ố ượng là 120, 125, 130, 135, 150. Ph m ạ vi c a bi n s  huy t áp là 120 đ n 150.ủ ế ố ế ế

Thí d : Thu c h  áp A đụ ố ượ ục s  d ng trên 5 b nh nhân và huy t áp tâm thu  sau khi dùng thu c ệ ế ố là 110, 115, 120, 125 và 130. Thu c h  áp B đố ượ ục s  d ng trên 5 b nh nhân và có huy t áp sau ệ ế s  d ng thu c là 100, 110, 120, 130, 140. S  li u c a thu c B có  tính phân tán cao h n do ử ụ ố ố ệ ủ ố ph m vi thay đ i t  100­140 trong khi đó ph m v  c a s  li u thu c A ch  t  110­130.ạ ổ ị ủ ố ệ ố ỉ

(8)

Thí d : S  li u v  huy t áp tâm thu (mmHg) c a 5 đ i tụ ố ệ ề ế ủ ố ượng là 120, 125, 130, 135, 150. S  ố li u này đệ ược chia làm 2 ph n: ph n 1 g m 120, 125, 130 và ph n 2 g m 130, 135, và 150. ầ ầ ầ Trung v  c a ph n trên là 125 ­ trung v  c a ph n dị ủ ầ ị ủ ầ ưới là 135, do đó ph m t  v  là 125­135.ạ ứ ị Do b n ch t c a kho ng t  v  là trung v  c a ph n s  li u trên và ph n s  li u dả ấ ủ ả ứ ị ị ủ ầ ố ệ ầ ố ệ ưới,  cũng gi ng nh  trung v , kho ng t  v  không b   nh hố ị ả ứ ị ị ả ưởng b i các giá tr  ngo i lai nhở ị ư  trong trường h p c a đ  l ch chu n. Cũng nh  trung v , kho ng t  v  ch  có th  ápợ ủ ộ ệ ẩ ị ả ứ ị ỉ ể   d ng cho bi n s  đ nh lụ ế ố ị ượng hay th  t ứ ự

Có 3 th ng kê mơ t  tính phân tán: đ  l ch chu n, kho ng t  v  và ph m vi c a số ả ộ ệ ẩ ả ứ ị ủ ố  li u. Vi c l a ch n th ng kê mơ t  tính phân tán đệ ệ ự ọ ố ả ược trình bày trong b ng 2.ả

B ng 6. Ch n l a các th ng kê mơ t  tính phân tán cho các lo i bi n s  ả ọ ự ố ả ế ố Trường h pợ Th ng kê tóm t t giá tr  tiêuố ắ ị  

bi uể Th ng kê m c đ  phân tác

ố ứ ộ

Phân ph i cân đ iố ố Trung bình (mean) Ð   l ch   chu n   (standardộ ệ ẩ   deviation)

Th ng kê b  l chố ị ệ Trung v  (median)ị Kho ng t  v  (inter­quartile)ả ứ ị Ph m vi (Range)ạ

Câu h i: Phân tích trên máy tính v  bi n s  hemoglobin cho k t qu  sau. Hãy th  đ cỏ ề ế ố ế ả ọ   và lí gi i k t qu :ả ế ả

Variable | Obs Mean Std Dev Min Max -+ -hemoglobin | 70 11.98429 1.416122 8.8 15.1

Thí d  v  s  li u b  l ch: Th i gian n m vi n c a 17 đ i tụ ề ố ệ ị ệ ằ ệ ủ ố ượng sau khi ph u thu tẫ ậ   (đượ ắc s p x p t  nh  đ n l n) là:ế ỏ ế

3  4  4  6  8  8  8   10  10  12  14  14  17  25  27  37  42

Phân ph i này b  l ch nên con s  th i gian n m vi n trung bình là 14,6 khơng ph i conố ị ệ ố ằ ệ ả   s  phù h p đo lố ợ ường trung tâm. Ð  đánh giá T  phân ph i này ta nh n th y trung v  làể ố ậ ấ ị   10; t  v  trên là 17 và t  v  dứ ị ứ ị ưới là 8

Logarithm

M t cách khác đ  đ i phó v i s  l ch b  l ch,  trong trộ ể ố ố ệ ị ệ ường h p b  l ch dợ ị ệ ương là sử  d ng logarithm (hay g i t t là log) c a giá tr  s  li u thay vì dùng b n thân giá tr ụ ọ ắ ủ ị ố ệ ả ị Có nhi u lo i logarithms khác nhau. Logarithm c  s  10 là lo i thề ố ường đượ ục s  d ng  trong quá kh  đ  nhân hay chia các con s  m t cách nhanh chóng. G n đây do  s  phátứ ể ố ộ ầ ự   tri n c a các máy vi tính và máy tính c m tay, vi c s  d ng logarithms c  s  10 trể ủ ầ ệ ụ ố ở  nên b  phôi pha. Hi n này ngị ệ ười ta thường ch  dùng logarithms c  s  e (e=2,71) hayỉ ố   cịn g i là logarithms t  nhiên do lo i   logarithms này   có m t s  đ c tính tốn h cọ ự ộ ố ặ ọ   đáng quý. Logarithms t  nhiên c a m t  s  x thự ủ ộ ố ường được kí hi u ln(x).ệ

(9)

ln(x/y)=ln(x)­ln(y)

ln(xn)=ln(xx x)=ln(x)+ln(x)+ +ln(x)=nln(x)

ln(1+x)(x (v i x nh )ớ ỏ

N u chúng ta đã bi t ln(x) và mu n bi t x b ng bao nhiêu chúng ta s  d ng hàmế ế ố ế ằ ụ   antilog(x) hay còn g i là hàm exp(x).ọ

Trong trường h p s  li u b  l ch dợ ố ệ ị ệ ương, người ta l y log c a s  li u và tính trungấ ủ ố ệ   bình c a log s  li u. Sau đó tính giá tr  th i gian n m vi n tiêu bi u (con s  này đủ ố ệ ị ằ ệ ể ố ược  g i là trung bình nhân ­ geometric mean) b ng cách l y antilog c a trung bình c a logọ ằ ấ ủ ủ   s  li u.ố ệ

Tr  l i thí d  v  th i gian n m vi n c a 17 b nh nhân. Sau khi l y log chúng ta cóở ụ ề ằ ệ ủ ệ ấ   trung bình c a log th i gian n m vi n b ng 2,41 và l y antilog c a s  này chúng ta cóủ ằ ệ ằ ấ ủ ố   trung bình  nhân c a th i gian n m vi n là 11,13. Con s  này g n v i giá tr  trung v  làủ ằ ệ ố ầ ị ị   10 h n con s  trung bình c ng là 14,6ơ ố ộ

Bi u đ  và đ  th ồ ị

S  li u cũng có th  đố ệ ể ược trình bày dướ ại d ng đ  th  ho c bi u đ  M c dù khơng cóồ ị ặ ể ặ   ranh gi i tuy t đ i hồn tồn rõ r t,  nói chung đ  th   (graph) có tính ch t tốn h cớ ệ ố ệ ị ấ ọ   nhi u h n, trong đó có tr c hồnh và tr c tung cịn bi u đ  (chart) là hình  nh mangề ụ ụ ể ả   tính ch t tấ ượng tr ng.ư

N u bi n s  là bi n r i r c, có th  trình bày dế ế ố ế ể ướ ại d ng bi u đ  hình thanh (bar chart ­ể   hình 1) ho c bi u đ  hình bánh (pie chart). N u bi n s  là bi n liên t c, thì phân ph iặ ể ế ế ố ế ụ ố   c a bi n s  có th  trình bày dủ ế ố ể ướ ại d ng t  ch c đ  (histogram ­ hình 2) ho c đa giácổ ứ ặ   t n su t.ầ ấ

Bi u đ  hình thanh

Bi u đ  hình thang là bi u đ  nh m mô t  s  phân b  c a bi n s  r i r c. Bi u để ể ằ ả ự ố ủ ế ố ể ồ  hình thanh g m có tr c hồnh trên đó xác đ nh nh ng giá tr  c a bi n s   ng v i t ngồ ụ ị ữ ị ủ ế ố Ứ   giá tr  c a bi n s  ngị ủ ế ố ười ta v  các thanh có chi u cao t  l  v i t n su t c a giá tr  đó.ẽ ề ỉ ệ ầ ấ ủ ị   C n l u ý ln ln có kho ng tr ng gi a các thanh.ầ ả ố ữ

45

24

0 10 20 30 40 50

(10)

Figure 2. Bi u đ  hình thanh (bar chart) mơ t  phân b  gi i tính c a nh ng h c sinh trong trể ả ố ủ ữ ọ ường m m ầ non 23/11, Hóc mơn

Chúng ta cũng có th  xây d ng các thanh theo chi u ngang nh  trong ví d  sauể ự ề ụ

478 65

57

0 100 200 300 400 500

S inh thư øng S inh fo rceps S inh mo å

Figure 3. Phương pháp sinh c a 600 tr  sanh t i b nh vi n X trong năm 1998ủ ẻ ệ ệ

Ð i v i bi n s  th  t , đi u c n l u ý là các giá tr  c a bi n s  ph i đố ế ố ứ ự ề ầ ị ủ ế ố ả ượ ẵc s p x pế   th  t  theo tr c hoành.ứ ự ụ

T

a

àn

s

u

a

át

e d u m a t

m u ø c h ö õ c a áp c a áp - ñ a ïi h o ï

1 0 0

Figure 4. Trình đ  h c v n c a các bà m  trong nghiên c uộ ọ ấ ủ ẹ ứ Bi u đ  hình bánh

Ngày đăng: 09/03/2021, 07:33

Xem thêm:

w