Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 86 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
86
Dung lượng
1,99 MB
Nội dung
TRƯỜNG ĐẠI HỌC Y KHOA PHẠM NGỌC THẠCH DỰ ÁN U-PNT-03 PHƯƠNG PHÁP NGHIÊN CỨU KHOA HỌC (LỚP CƠ BẢN 3) PHẦN THỐNG KÊ Y HỌC Tháng 3/2010 Bài KHÁI NIỆM THỐNG KÊ Y HỌC CÁCH SẮP XẾP & TỔ CHỨC SỐ LIỆU ThS BS Nguyễn Thế Dũng MỤC TIÊU: Sau học xong này, học viên có thể: 1/ Phân biệt loại biến số thường dùng thống kê y học 2/ Phân biệt thang đo lường dùng thống kê y học 3/ Biết cách thiết lập bảng phân phối tần số, tần số tương đối, tần số dồn, tần số tương đối dồn 4/ Phát biểu ý nghóa số liệu bảng phân phối tần số, tần số tương đối, tần số dồn, tần số tương đối dồn I MỘT SỐ KHÁI NIỆM CƠ BẢN : Thống kê học (Statistics): môn học cách : thu thập, tổ chức, tóm tắt phân tích số liệu rút suy diễn cho toàn (số liệu) từ kết khảo sát phần số liệu Thống kê sinh học (Biostatistics): thống kê học có số liệu phân tích có nguồn gốc sinh y học Biến số (Variable): đặc tính mang nhiều giá trị khác người, nơi chốn, vật khác – Biến số định lượng (Quantitative variable): biến số đo đạc phép đo lường thông thường Số đo thực biến số định lượng chuyển tải thông tin số (khối) lượng – Biến số định tính (Qualitative variable) : biến số đo phép đo lường thông thường, mà nhóm loại (categorized) Số đo thực biến số định tính chuyển tải thông tin thuộc tính – Biến số ngẫu nhiên (Random variable): biến số mà giá trị có kết yếu tố mang tính hội (chance factors) tiên đoán xác trước Các giá trị có qua phương pháp đo lường gọi quan sát (observations) số đo easurements) – Biến số ngẫu nhiên rời (Discrete random variable): biến số đặc trưng khoảng trống giá trị ⎯ Biến số ngẫu nhiên liên tục (Continous random variable): biến số khoảng trống giá trị DÂN SỐ (Quần thể – Population): tập hợp lớn thực thể mà ta quan tâm thời điểm xác định Nếu đo biến số thực thể dân số, có dân số giá trị biến số Dân số giá trị tập hợp lớn giá trị biến số ngẫu nhiên mà ta quan tâm thời điểm xác định MẪU (Sample): phần (bộ phận) dân số II SỰÏ ĐO LƯỜNG THANG ĐO LƯỜNG (Measurement & Measurement Scale) Sự đo lường định nghóa gán số cho vật thể biến cố theo hệ thống qui tắc Do việc đo lường thực với nhiều hệ thống qui tắc khác nên phải có nhiều thang đo lường khác Thang định danh (Nominal Scale): thang đo lường (ở mức độ) thấp bao gồm việc “đặt tên” cho quan sát phân loại chúng vào nhóm độc lập hỗ tương (mutually exclusive) Thí dụ: chẩn đoán y khoa (bệnh cao huyết áp, bệnh nội tiết, v.v.), thực thể nhị phân nam-nữ, bệnh-khỏe, v v Thang thứ tự (Ordinal Scale): thang đo lường bao gồm không việc định danh mà phân hạng (rank) nhóm loại theo số tiêu chuẩn Thí dụ: bệnh (rất nặng, nặng, vừa, nhẹ), tình trạng kinh tế (cao, vừa, kém), v v Lưu ý mức độ khác biệt số đo thuộc nhóm loại phân hạng Thang khoảng (Interval Scale): tinh vi thang thứ tự chỗ khoảng cách hai số đo biết rõ Thí dụ: hiệu số đo 20 30 với hiệu số đo 30 40 Thang khoảng dùng đơn vị khoảng cách điểm zero chọn tùy ý Tuy nhiên điểm zero trường hợp zero thật (chỉ thị hoàn toàn khối lượng đo) Thí dụ rõ thang khoảng cách đo nhiệt độ, 00 C không đồng nghóa với việc hoàn toàn nhiệt lượng nào.Thang khoảng thang định lượng Thang Tỉ số (Ratio Scale): thang đo lường mức độ cao nhất, đặc trưng tỉ số khoảng định rõ Điểm thang tỉ số có điểm zero thật Thí dụ: chiều cao, cân nặng, chiều dài,v.v III CHUỖI THỐNG KÊ (Ordered array) : danh mục giá trị tập hợp số liệu xếp theo thứ tự từ giá trị nhỏ đến giá trị lớn IV PHÂN PHỐI TẦN SỐ (quency Distribution) Phân nhóm số liệu: số liệu tổ chức, xếp cách phân vào nhiều nhóm (Khoảng cách lớp – KCL) Cách tính số KCL Số KCL tập hợp số liệu thường không nên nhỏ không lớn 15 Để xác hơn, dùng công thức Sturges để tính soá KCL : k = + 3,322 (log10 n) với k : số KCL & n : số giá trị có Thí du: có tập hợp số liệu gồm 57 giá trị, nên phân vào KCL vừa? n = 57 log10 57 = 1,7559 k = + 3,322 (1,7559) Cách tính độ rộng KCL w = R k ≈ w : độ rộng KCL với R: biên độ chuỗi số liệu Thí dụ: có tập hợp số liệu gồm 57 giá trị, giá trị lớn 79 giá trị nhỏ 12 Tính độ rộng KCL? 79 − 12 = 9, ≈ 10 Tập hợp 57 giá trị cân nặng tính ounces 57 khối u ác tính lấy từ bụng 57 bệnh nhân : w 68 24 28 31 49 63 25 25 50 28 42 44 45 38 23 = 27 65 12 21 19 30 43 57 16 46 36 25 51 24 30 28 74 12 69 43 32 51 32 47 49 79 36 49 23 12 27 42 38 22 22 28 42 43 23 31 27 27 Lập bảng phân phối tần số KCL 10 20 30 40 50 60 70 – – – – – – – Tần số 19 29 39 49 59 69 79 19 10 13 4 57 Lập bảng phân phối tần số, tần số dồn, tần số tương đối, tần số tương đối dồn KCL 10 20 30 40 50 60 70 – – – – – – – Taàn soá 19 29 39 49 59 69 79 19 10 13 4 57 Tần số dồn 24 34 47 51 55 57 Tần số tương đối 0,0877 0,3333 0,1754 0,2281 0,0702 0,0702 0,0351 Tần số tương đối dồn 0,0877 0,4210 0,5964 0,8245 0,8947 0,9649 1,0000 1,0000 Lưu ý: Tùy theo nhu cầu mà chọn cột (tần số, tần số tương đối, tần số dồn, tần số tương đối dồn) để trình bày Thông thường trình bày tần số tần số tương đối (tính %) bảng Lập biểu đồ Histogram Histogram biểu đồ phân phối tần số hình que (cột) đặc biệt biến số liên tục Do biểu đồ biến số liên tục nên trình bày cần phải dùng giới hạn thật KCL Tìm giới hạn thật KCL cách trừ ½ đơn vị giới hạn cộng thêm ½ đơn vị giới hạn Bảng phân phối tần số dùng giới hạn thật (để vẽ histogram) Giới hạn thật KCL Tần số 9,5 – 19,5 19,5 – 29,5 29,5 – 39,5 39,5 – 49,5 49,5 – 59,5 59,5 – 69,5 69,5 – 79,5 19 10 13 4 Tần số 20 18 16 14 12 10 9,5 19,5 29,5 39,5 49,5 59,5 69,5 79,5 X Lập biểu đồ đa giác tần số Biểu đồ đa giác tần số thiết lập dựa histogram Bằng cách nối trung điểm mặt ô chữ nhật tượng trưng cho tần số KCL, ta có đa giác tần số Tần ố 20 18 16 14 12 10 9,5 29,5 39,5 49,5 59,5 69,5 19,5http://www.ebook.edu.vn 79,5 X Lập biểu đồ thân–và–lá (Stem-and-leaf) Thân Lá 2 0 2 2 3 4 5 7 7 8 8 2 6 8 3 9 9 Bài TÓM TẮT SỐ LIỆU MỤC TIÊU: Sau học xong này, học viên có thể: 1/ Biết cách tính số đo khuynh hướng tập trung phát biểu ý nghóa số đo 2/ Biết cách tính số đo khuynh hướng phân tán phát biểu ý nghóa số đo 3/ Biết cách thiết lập biểu trình bày số đo khuynh hướng tập trung phân tán I GIỚI THIỆU : Số đo mô tả (descriptive measure) phương tiện tóm tắt số liệu (TTSL) – Số đo mô tả tính từ số liệu mẫu gọi số thống kê (statistic) – Số đo mô tả tính từ số liệu dân số gọi thông số (parameter) II SỐ ĐO KHUYNH HƯỚNG TẬP TRUNG (Measures of Central Tendency) : Số đo khuynh hướng tập trung chuyển tải thông tin giá trị trung bình (average value) tập hợp số liệu Ba số đo khuynh hướng tập trung thường dùng là: số trội số trung vị , số trung bình Số trội (Mode) : Số trội tập hợp giá trị giá trị xuất nhiều lần Một tập hợp giá trị số trội nào, có nhiều số trội Đặc điểm số trội Số trội sử dụng để mô tả số liệu định tính Số trung vị (Median) Số trung vị tập hợp số liệu giá trị đứng phần tập hợp (số giá trị lớn số trung vị với số giá trị nhỏ số trung vị) Nếu số giá trị số lẻ, số trung vị giá trị đứng chuỗi thống kê Nếu số giá trị số chẵn, số trung vị số trung bình giá trị đứng chuỗi thống kê Đặc điểm số trung vị: – Độc (đối với tập hợp số liệu có số trung vị) – Đơn giản (dễ hiểu dễ tính toán) – Giá trị cực (extreme values) không gây ảnh hưởng nhiều đến số trung vị Số trung bình toán học (Arithmatic Mean) : Trung bình (của) dân số (Population Mean) : N μ ∑x i = i =1 N: số giá trị dân số N Trung bình (của) mẫu (Sample Mean) : n x ∑x i = i =1 n n: số giá trị mẫu Đặc điểm số trung bình: – Độc (đối với tập hợp số liệu có số trung bình) – Đơn giản (dễ hiểu dễ tính toán) – Giá trị cực (extreme values) gây ảnh hưởng nhiều đến số trung bình Số trung bình gia trọng (Weighted mean) Là số trung bình tính phân tích số liệu từ nhiều mẫu loại thông tin thu thập thời điểm khác có cỡ mẫu khác Số trung bình gia trọng tính sau: Weighted x = ∑ ni x i/N ni số giá trị mẫu i số trung bình mẫu i xI N tổng số giá trị mẫu Trimmed mean (số trung bình gọn) Winsorized mean (số trung bình gán) Là hai phép tính lại số trung bình nhằm hạn chế tác động giá trị cực – Trimmed mean: số trung bình tính sau “gọt bỏ” giá trị đầu giá trị cuối chuỗi thống kê – Winsorize mean: số trung bình tính sau gán 5% số giá trị đầu chuỗi thống kê (các giá trị cực thấp) với giá trị thấp (so với 5% giá trị cực thấp), 5% số giá trị cuối chuỗi thống kê (các giá trị cực cao) với giá trị cao (so với 5% giá trị cực cao) III SỐ ĐO KHUYNH HƯỚNG PHÂN TÁN (Measures of Dispersion) : Số đo phân tán chuyển tải thông tin khối lượng (mức độ) biến thiên diện tập hợp số liệu Biên độ(Range) : R = xL – xs Công dụng biên độ giới hạn (vì dùng có giá trị) Phương sai (Variance) : Phương sai tập hợp số liệu số đo độ phân tán tương đối giá trị (thuộc tập hợp) xung quanh số trung bình (của tập hợp số liệu) + Phương sai (của) dân số (Population Variance) N σ2 = ∑ (x − μ) i i =1 N N: số giá trị dân số + Phương sai (của) mẫu (Sample Variance) Trường hợp mẫu nhỏ : n S2 = ∑ (x i i =1 − x) n −1 n: số giá trị mẫu Trường hợp mẫu lớn : n n× ∑ xi2 S = i =1 − ⎛⎜ ∑ xi ⎞⎟ ⎝ i =1 ⎠ n n(n −1) Độ lệch chuẩn (Standard Deviation) ĐLC số đo độ phân tán giống phương sai, diễn tả đơn vị đo ban đầu ĐLC tính cách rút phương sai ĐLC dân số có ký hiệu σ (sigma), ĐLC mẫu có ký hiệu s IV Bách phân vị Tứ phân vị (Percentiles and Quartiles) Cho tập hợp có n giá trị x1, x2, …… , xn, bách phân vị thứ p (gọi P) giá trị X mà theo có ≤ p% số giá trị nhỏ P (100–p)% số giá trị lớn P P10 bách phân vị thứ 10, P50 bách phân vị thứ 50, v v Thông thường, bách phân vị tính trường hợp tập hợp số liệu lớn ...Bài KHÁI NIỆM THỐNG KÊ Y HỌC CÁCH SẮP XẾP & TỔ CHỨC SỐ LIỆU ThS BS Nguyễn Thế Dũng MỤC TIÊU: Sau học xong n? ?y, học viên có thể: 1/ Phân biệt loại biến số thường dùng thống kê y học 2/ Phân biệt... : Thống kê học (Statistics): môn học cách : thu thập, tổ chức, tóm tắt phân tích số liệu rút suy diễn cho toàn (số liệu) từ kết khảo sát phần số liệu Thống kê sinh học (Biostatistics): thống kê. .. chuỗi thống kê – Winsorize mean: số trung bình tính sau gán 5% số giá trị đầu chuỗi thống kê (các giá trị cực thấp) với giá trị thấp (so với 5% giá trị cực thấp), 5% số giá trị cuối chuỗi thống kê