Chuong 2 Thống kê sinh học

47 480 2
Chuong 2 Thống kê sinh học

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

2 Chương Mô tả & Trình bày liệu Biostatistics - Bùi Tấn Anh Thống kê Sinh học – Bùi Tấn Anh Nội dung Mô tả trình bày liệu bảng Mô tả trình bày liệu biểu đồ Các số đo định tâm Các số đo độ phân tán 02/03/2012 Biostatistics - Bùi Tấn Anh 1 Mô tả trình bày liệu bảng Mô tả trình bày liệu biểu đồ Các số đo định tâm Các số đo độ phân tán 02/03/2012 Biostatistics - Bùi Tấn Anh Nhập liệu • Mở tập tin liệu: File > Open Worksheet… • Các liệu: – Nhập trực tiếp vào bảng tính minitab, lưu dạng file *.mtw – Truy xuất từ file nhập bảng tính excel, dạng file *.xls 02/03/2012 Biostatistics - Bùi Tấn Anh Mở tập tin liệu 02/03/2012 Biostatistics - Bùi Tấn Anh Biostatistics - Bùi Tấn Anh Tập tin Dữ liệu 02/03/2012 Mở file excel 02/03/2012 Biostatistics - Bùi Tấn Anh Lập bảng tần số chiều • Stat > Tables > Tally Individual Variables… 02/03/2012 Biostatistics - Bùi Tấn Anh Lập bảng tần số chiều Bảng 2.1 Tần số giới tính 200 bệnh nhân Giới tính Nam Nữ Tổng Số bệnh nhân 146 Tần số (%) 73 54 27 200 100 Bảng 2.2 Tần số độ tuổi 200 bệnh nhân Độ tuổi Tables > Cross Tabulation and Chi-square… 02/03/2012 Biostatistics - Bùi Tấn Anh 10 Bảng tần số hai chiều Bảng 2.3 Chỉ số thể trọng giới tính 200 bệnh nhân BMI Ốm Giới tính Nam (%) Nữ (%) Tổng (%) (2.05) (0.00) (1.50) Trung bình 51 (34.93) 24 (44.44) 75 (37.50) Mập 63 (43.15) 22 (40.74) 85 (42.50) Béo phì 29 (19.86) (14.81) 37 (18.50) Tổng 02/03/2012 146 (100) 54 (100) 200 (100) Biostatistics - Bùi Tấn Anh 11 2 Mô tả trình bày liệu bảng Mô tả trình bày liệu biểu đồ Các số đo định tâm Các số đo độ phân tán 02/03/2012 Biostatistics - Bùi Tấn Anh 12 Pie chart • Dùng so sánh giá trị liệu dạng tỉ lệ % • Thí dụ: Bảng 2.3 Độ tuổi Dưới 40 40 – 49 50 – 59 60 – 69 70 – 79 Tổng 02/03/2012 Số bệnh nhân 11 12 40 Biostatistics - Bùi Tấn Anh 13 Biostatistics - Bùi Tấn Anh 14 Nhập liệu 02/03/2012 Vẽ biểu đồ: Graph > Pie Chart … 02/03/2012 Biostatistics - Bùi Tấn Anh 15 Biostatistics - Bùi Tấn Anh 16 Khai báo 02/03/2012 Ghi nhãn 02/03/2012 Biostatistics - Bùi Tấn Anh 17 Pie Chart vẽ Minitab 02/03/2012 Biostatistics - Bùi Tấn Anh 18 Time Series Plot • Dùng biểu diễn thay đổi liệu theo thời gian 02/03/2012 Biostatistics - Bùi Tấn Anh 19 Thí dụ • Nồng độ Hg 20 năm hai vị trí khác Địa Trung hải Year 1973 1974 1975 1976 1977 1978 1979 1980 1981 1982 02/03/2012 Site 100.40 96.70 60.10 50.50 28.10 16.50 11.00 25.80 18.20 21.50 Nồng độ thuỷ ngân Site Year 1983 462.00 705.10 1984 369.90 1985 542.60 1986 329.40 1987 363.90 1988 123.30 1989 262.10 1990 197.70 1991 147.80 1992 Biostatistics - Bùi Tấn Anh Site 24.60 15.20 12.70 19.30 10.30 18.30 8.70 18.00 12.90 14.80 Site 139.60 170.60 117.60 156.20 129.00 103.10 100.30 102.80 160.50 70.20 20 10 02/03/2012 Biostatistics - Bùi Tấn Anh 65 Thí dụ • Trung bình ̅ = 63,86x11 + 71,00x31 + ⋯ + 151,55x12 11 + 31 + ⋯ + 12 = 110,48kg 02/03/2012 Biostatistics - Bùi Tấn Anh 66 33 Trung bình cộng gia quyền (Weighted mean) • Còn gọi số trung bình số học có trọng số • Được dùng khảo sát nhiều mẫu có kích cỡ khác • Công thức tính:  (w • x) xw = w w trọng số 02/03/2012 Biostatistics - Bùi Tấn Anh 67 Thí dụ • Khảo sát mật độ khoáng xương đốt sống thắt lưng kiểu gen khác nhau, người ta thu nhận số liệu sau: Kiểu gen Cở mẫu (n) Trung bình mẫu TT 40 1.25 g/cm2 Tt 45 1.10 g/cm2 tt 15 1.00 g/cm2 Xw  02/03/2012 (40)(1.25)  (45)(1.10)  (15)(1.00) = 1.145 g/cm2 40  45  15 Biostatistics - Bùi Tấn Anh 68 34 Trung bình điều hòa (Harmonic mean) • Là nghịch đảo trung bình cộng biến nghịch đảo • Công thức để tính trung bình điều hoà là: = ∑ 02/03/2012 1 1 1 n  (    )   H x n x1 x2 xn n i 1 xi Biostatistics - Bùi Tấn Anh 69 Trung bình điều hòa (Harmonic mean) • Thường dùng nhóm liệu có giá trị đo lường tốc độ thay đổi • Thí dụ: Một người lái xe từ nhà đến quan với tốc độ 40 km/giờ từ quan nhà với tốc độ 60 km/giờ Tốc độ trung bình hai lượt bao nhiêu? 02/03/2012 Biostatistics - Bùi Tấn Anh 70 35 Trung bình điều hòa (Harmonic mean) • Câu trả lời là: (40+60)/2 = 50 • Trung bình phải là: = 1 + 40 60 = 48 Tại vận tốc trung bình 48 km/giờ mà 50 km/giờ? 02/03/2012 Biostatistics - Bùi Tấn Anh 71 Trung bình nhân (Geometric mean) • Còn gọi trung bình hình học • Dùng để tính tốc độ phát triển trung bình giá trị xi số tốc độ phát triển liên hoàn = = ∗ ∗ ⋯∗ ∏ Không dùng liệu có giá trị âm 02/03/2012 Biostatistics - Bùi Tấn Anh 72 36 Thí dụ • Tỉ lệ % gia tăng lượng calci xương nhóm 10 bệnh nhân lần khám bệnh ghi nhận sau: 5.4%, 8.9%, 9.6%, 6.4% • Các tỉ lệ % viết dạng tỉ số: 1.054 1.089 1.096 1.064 = 1.054 ∗ 1.089 ∗ 1.096 ∗ 1.064 = (1.339)( ) = 1.076 = 7.6% 02/03/2012 Biostatistics - Bùi Tấn Anh 73 Trung bình cụt (Trimmed Mean) • Trường hợp liệu bị lẫn giá trị ngoại lai (outlier), nghĩa giá trị lớn nhỏ, trung bình liệu bị kéo lệch phía giá trị • Để điều chỉnh, người ta tính trung bình cụt cách loại bỏ phần đầu cuối chuỗi liệu (theo tỉ lệ %), lấy trung bình cộng phần liệu lại 02/03/2012 Biostatistics - Bùi Tấn Anh 74 37 Trung vị (Median) • Là giá trị nằm chuỗi liệu • Khi chuỗi liệu có n giá trị quan sát: – Nếu n số lẻ → trung vị số thứ (n+1)/2 – Nếu n số chẵn → trung vị trung bình số thứ n/2 số thứ (n/2)+1 Để tìm trung vị trước tiên cần xếp lại liệu theo thứ tự từ nhỏ đến lớn (sort) 02/03/2012 Biostatistics - Bùi Tấn Anh 75 Thí dụ • Chuỗi liệu n = 98 100 100 103 105 107 110 113 115 Trung vị nằm vị trí thứ (9+1)/2 =  Md = 105 • Chuỗi liệu n = 101 103 104 105 107 108 108 112 Trung vị nằm vị trí số thứ (8/2) = thứ (8+1)/2 =  Md = (105+107)/2 = 106 02/03/2012 Biostatistics - Bùi Tấn Anh 76 38 Yếu vị = Số trội (Mod) • Là giá trị có tần số cao chuỗi liệu • Thí dụ: liệu trọng lượng bò (kg) 260 260 230 280 290 280 260 270 260 300 280 290 260 250 270 320 320 250 320 220 • Yếu vị = ? 02/03/2012 Biostatistics - Bùi Tấn Anh 77 Độ lệch (Skewness) • Dùng xác định tính đối xứng phân bố tần số → hình dạng phân bố • Giá trị độ lệch tính bằng: • = ( ̅ ) = ( ̅ ) – Nếu µ = Md = Mo → phân bố đối xứng – Nếu µ < Md < Mo → phân bố lệch trái – Nếu µ > Md > Mo → phân bố lệch phải 02/03/2012 Biostatistics - Bùi Tấn Anh 78 39 Các dạng phân bố Phân bố đối xứng Phân bố lệch phải 02/03/2012 Phân bố lệch trái Biostatistics - Bùi Tấn Anh 79 • • • • Mô tả trình bày liệu bảng Mô tả trình bày liệu biểu đồ Các số đo định tâm Các số đo độ phân tán 02/03/2012 Biostatistics - Bùi Tấn Anh 80 40 Khoảng biến thiên (Range) • Là khoảng khác biệt hai giá trị quan sát lớn nhỏ • Range = Max – Min • Khoảng biến thiên nhỏ tổng thể đồng đều, số trung bình có tính đại diện cao ngược lại 02/03/2012 Biostatistics - Bùi Tấn Anh 81 Tứ vị (Quartile) – Khoảng tứ vị • Là vị trí chia chuỗi liệu thành phần nhau: – 25% giá trị quan sát  tứ vị (Q1) = lower quartile – 50% giá trị quan sát  tứ vị (Q2) = trung vị – 75% giá trị quan sát  tứ vị (Q3) = upper quartile • Tứ vị giá trị vị trí thứ • Tứ vị giá trị vị trí thứ ( ) ( ) • Khoảng tứ vị (Inter Quartile Range) = Q3 – Q1 02/03/2012 Biostatistics - Bùi Tấn Anh 82 41 Thí dụ 98  100  100  103  105  107  110  113  115   n 1  Lower quartile giá trị vị trí thứ   = (9+1)/4 = 2.5    Q1 = (100+100)/2 = 100 ngày  3(n  1)   = 3(9+1)/4 = 7.5   Upper quartile giá trị vị trí thứ   Q3 = (110+113)/2 = 111.5 ngày Khoảng tứ vị: IQR = Q3 – Q1 = 111.5 – 100 = 11.5 ngày 02/03/2012 Biostatistics - Bùi Tấn Anh 83 Phương sai (Variance) • Là số trung bình cộng bình phương độ lệch biến số trung bình cộng biến • Phương sai mẫu tính bằng: = ( − ̅) −1 • Các số liệu phân tán quanh giá trị trung bình nhiều phương sai lớn ngược lại 02/03/2012 Biostatistics - Bùi Tấn Anh 84 42 Độ lệch chuẩn (Standard deviation) • Bằng bậc hai phương sai = −1 ( − ̅) • Có số đo đơn vị với số đo gốc 02/03/2012 Biostatistics - Bùi Tấn Anh 85 Sai số chuẩn (Standard Error) • Là số đo phản ánh độ biến thiên số trung bình mẫu mẫu rút từ tổng thể • Nếu chọn mẫu N lần (mỗi lần với n đối tượng) ta có N số trung bình Độ lệch chuẩn N số trung bình sai số chuẩn (Se) • Se thường ước lượng bởi: = 02/03/2012 Biostatistics - Bùi Tấn Anh 86 43 Hệ số biến động (Coefficient of Variation) • Dùng để so sánh độ biến thiên tương đối tổng thể có trung bình khác nhau, để so sánh độ phân tán tượng có đơn vị tính khác • Công thức tính: = x 100 ̅ 02/03/2012 Biostatistics - Bùi Tấn Anh 87 Box plot • Còn gọi box and whiskers plot cung cấp: – số đo vị trí trung tâm liệu (trung vị) – số đo độ phân tán số liệu (khoảng biến thiên khoảng tứ vị) – Các số ngoại lai (outlier) • “box” có dạng hộp hình chữ nhật, chứa 50% liệu với giá trị Q1, Q2 (trung vị) Q3 • Mỗi “whisker” biểu diễn cho 25% liệu với giá trị cực tiểu (min) cực đại (max) 02/03/2012 Biostatistics - Bùi Tấn Anh 88 44 Thí dụ • Dữ liệu hàm lượng nước ngầm đất (%): 7.5  9.0  9.3  10.4  10.4  Q1 10.6  10.7  11.6  Q2 12.1  12.8  Q3 • Để vẽ box plot cần xác định giá trị: – Min, Max (phải xếp lại liệu theo thứ tự) – Q1, Q2, Q3 02/03/2012 Biostatistics - Bùi Tấn Anh 89 • Min = 7.5; Max = 12.8 • Trung vị = giá trị thứ (n + 1)/2 = (10 + 1)/2 =giá trị thứ 5.5 = trung bình giá trị thứ thứ = ½ *(10.4 + 10.6) = 10.5%  n 1 Q1 = giá trị vị trí thứ   = (10 + 1)/4 = 2.75   = trung bình gia quyền giá trị thứ thứ = (0.25* 9.0) + (0.75*9.3 = 9.225%  3( n  1)   = (3(10+1))/4 = 8.25   Q3 = giá trị vị trí thứ  = trung bình gia quyền giá trị thứ thứ = (0.75*11.6) + (0.25*12.1) = 11.725% 02/03/2012 Biostatistics - Bùi Tấn Anh 90 45 IRQ Q1 Q2 9.225 10.5 Q3 11.725 12.8 7.5 02/03/2012 10 11 12 13 Biostatistics - Bùi Tấn Anh 91 • Box plot giúp ta xác định phân bố liệu – Nếu liệu phân bố đối xứng, trung vị nằm hộp (khoảng tứ vị IRQ) hai thành Whisker có độ dài xấp xỉ – Nếu liệu phân bố lệch, trung vị không nằm hộp mà lệch phía, Whisker dài lại – Các giá trị ngoại lai (outlier) ký hiệu dấu * 02/03/2012 Biostatistics - Bùi Tấn Anh 92 46 02/03/2012 Biostatistics - Bùi Tấn Anh 93 47 [...]... 02/ 03 /20 12 Biostatistics - Bùi Tấn Anh 21 02/ 03 /20 12 Biostatistics - Bùi Tấn Anh 22 11 Khai báo 02/ 03 /20 12 Biostatistics - Bùi Tấn Anh 23 02/ 03 /20 12 Biostatistics - Bùi Tấn Anh 24 12 02/ 03 /20 12 Biostatistics - Bùi Tấn Anh 25 02/ 03 /20 12 Biostatistics - Bùi Tấn Anh 26 13 Hình 2. 2 Time Series Plot với 1 trục Y Nồng độ Hg (ng/g trọng lượng khô 700 Variable Site 1 Site 2 600 500 400 300 20 0 100 0 1974 02/ 03 /20 12. .. chiều 02/ 03 /20 12 Biostatistics - Bùi Tấn Anh 49 Bảng 2. 9 Tần số huyết áp tối đa (mmHg) Giá trị 85 90 95 96 100 1 02 104 105 106 108 110 02/ 03 /20 12 Tần số 1 5 2 1 14 1 2 1 2 2 16 Giá trị 1 12 114 115 116 118 120 122 124 125 126 128 Tần số 1 5 2 8 5 25 4 4 3 1 3 Giá trị 128 130 131 1 32 134 135 136 138 139 140 1 42 Biostatistics - Bùi Tấn Anh Tần số 3 23 1 2 1 2 1 1 2 26 1 Giá trị 144 145 148 150 1 52 155... 02/ 03 /20 12 Biostatistics - Bùi Tấn Anh 42 21 Thí dụ 2 • Tỉ lệ người mắc bệnh tiểu đường theo 5 độ tuổi Độ tuổi Tỉ lệ % < 40 40 – 49 50 – 59 60 – 69 70 – 79 28 .6 26 .1 25 .0 24 .3 32. 7 02/ 03 /20 12 Biostatistics - Bùi Tấn Anh 43 Bar Chart < 40 28 .6 Độ tuổi 40 – 49 26 .1 50 – 59 25 .0 60 – 69 24 .3 70 – 79 32. 7 0 02/ 03 /20 12 5 10 15 20 Tỉ lệ % Biostatistics - Bùi Tấn Anh 25 30 35 44 22 Stack Bar Chart (theo tần số) 70... triệu – Năm 20 00: 80.9 triệu 02/ 03 /20 12 Biostatistics - Bùi Tấn Anh 37 Vẽ biểu đồ: Graph > Bar Chart… 02/ 03 /20 12 Biostatistics - Bùi Tấn Anh 38 19 02/ 03 /20 12 Biostatistics - Bùi Tấn Anh 39 02/ 03 /20 12 Biostatistics - Bùi Tấn Anh 40 20 02/ 03 /20 12 Biostatistics - Bùi Tấn Anh 41 Bar Chart 90 Số người tham gia HMO (triệu) 20 00 80 70 60 50 40 1990 30 20 10 1980 0 1980 1990 20 00 Năm 02/ 03 /20 12 Biostatistics... 02/ 03 /20 12 1976 1978 1980 19 82 1984 1986 Năm 1988 1990 19 92 Biostatistics - Bùi Tấn Anh 27 Thêm thang đo thứ hai cho trục Y • Click chuột phải lên trục Y > Edit Y scale 02/ 03 /20 12 Biostatistics - Bùi Tấn Anh 28 14 02/ 03 /20 12 Biostatistics - Bùi Tấn Anh 29 Hình 2. 2 Time Series Plot với 2 trục Y 100 Variable Site 1 Site 2 600 80 500 60 400 300 Site 1 Nồng độ Hg (ng/g trọng lượng khô 700 40 20 0 20 100... 5.1 6.0 7.0 8.4 8.8 10.6 12. 0 13.4 13.3 32 16 Vẽ biểu đồ: Graph > Line Plot … 02/ 03 /20 12 Biostatistics - Bùi Tấn Anh 33 02/ 03 /20 12 Biostatistics - Bùi Tấn Anh 34 17 02/ 03 /20 12 Biostatistics - Bùi Tấn Anh 35 Line Plot Line Plot of Can, UK, USA Variable C an UK USA 13 12 11 %GDP 10 9 8 7 6 5 4 1960 02/ 03 /20 12 1965 1970 1975 1980 Year 1985 1990 Biostatistics - Bùi Tấn Anh 1995 20 00 36 18 Bar Chart • Dùng... 40 20 0 20 100 0 0 1974 02/ 03 /20 12 1976 1978 1980 19 82 1984 Năm Biostatistics - Bùi Tấn Anh 1986 1988 1990 19 92 30 15 Line Plot • Dùng so sánh dữ liệu của 2 hay nhiều nhóm 02/ 03 /20 12 Biostatistics - Bùi Tấn Anh 31 Thí dụ: • Chi phí y tế (%GDP) trong giai đoạn từ 1960 đến 20 00 Năm 1960 1965 1970 1975 1980 1985 1990 1995 20 00 02/ 03 /20 12 Canada 5.4 5.6 7.0 7.0 7.1 8.0 9.0 9 .2 9 .2 Biostatistics - Bùi Tấn... 15 2 16 2 17 02/ 03 /20 12 Leaves 0045 05666 00 024 88 00000048 000000044 000 02 00 Biostatistics - Bùi Tấn Anh 54 27 Dotplot • Trình bày sự phân bố của một biến liên tục • Dùng cho các dữ liệu nhỏ • Graph > Dotplot … Biostatistics - Bùi Tấn Anh 02/ 03 /20 12 55 Dotplot • Thí dụ: huyết áp tối đa của 40 bệnh nhân được chia thành hai nhóm: dưới 60 và trên 60 tuổi Tuổi trên 60 Tuổi dưới 60 100 02/ 03 /20 12 110 120 ... 1 62 165 170 Tần số 3 1 1 12 3 1 3 1 1 5 50 25 Histogram • Trước khi vẽ biểu đồ cần: – Chia dữ liệu thành các lớp (khoảng) • Thường chia thành 5 – 15 khoảng • Tính số khoảng = log2 n+1 [Sturges và Scott (1979)] – Xác định độ rộng mỗi lớp (class interval) (Xmax – Xmin)/ (log2 n + 1) 02/ 03 /20 12 Biostatistics - Bùi Tấn Anh 51 Histogram đ ố ế 50 48 40 36 Tần số 34 30 27 20 20 17 10 6 6 5 0 85 02/ 03 /20 12. .. Piétrain x (Yorkshire x Landrace) nuôi vỗ béo đến 21 0 ngày tuổi (kg) 02/ 03 /20 12 Biostatistics - Bùi Tấn Anh 64 32 02/ 03 /20 12 Biostatistics - Bùi Tấn Anh 65 Thí dụ • Trung bình ̅ = 63,86x11 + 71,00x31 + ⋯ + 151,55x 12 11 + 31 + ⋯ + 12 = 110,48kg 02/ 03 /20 12 Biostatistics - Bùi Tấn Anh 66 33 Trung bình cộng gia quyền (Weighted mean) • Còn gọi là số trung bình số học có trọng số • Được dùng khi khảo sát nhiều

Ngày đăng: 06/10/2016, 23:30

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan