– Biến số định tính Qualitative variable : là biến số không thể được đo bằng những phép đo lường thông thường, mà chỉ có thể được nhóm loại categorized.. – Biến số ngẫu nhiên Random v
Trang 1KHÁI NIỆM về THỐNG KÊ Y HỌC và
CÁCH SẮP XẾP & TỔ CHỨC SỐ LIỆU
I MỘT SỐ KHÁI NIỆM CƠ BẢN :
Thống kê học (Statistics): là môn học về cách :
1 thu thập, tổ chức, tóm tắt và phân tích số liệu
2 rút ra những suy diễn cho toàn bộ (số liệu) từ kết quả khảo sát 1 phần
của số liệu
Thống kê sinh học (Biostatistics): là thống kê học có số liệu phân tích có
nguồn gốc sinh hoặc y học
Biến số (Variable): là đặc tính có thể mang nhiều giá trị khác nhau ở người,
nơi chốn, vật khác nhau
– Biến số định lượng (Quantitative variable): là biến số có thể đo đạc được
Trang 2bằng các phép đo lường thông thường Số đo thực hiện trên các biến số
định lượng chuyển tải thông tin về số (khối) lượng
– Biến số định tính (Qualitative variable) : là biến số không thể được đo
bằng những phép đo lường thông thường, mà chỉ có thể được nhóm loại
(categorized) Số đo thực hiện trên các biến số định tính chuyển tải thông
tin về thuộc tính
– Biến số ngẫu nhiên (Random variable): là biến số mà các giá trị có được
là kết quả của các yếu tố mang tính cơ hội (chance factors) không thể
tiên đoán chính xác trước được Các giá trị có được qua các phương pháp
đo lường được gọi là các quan sát (observations) hoặc số đo easurements)
– Biến số ngẫu nhiên rời (Discrete random variable): là biến số đặc trưng bởi
các khoảng trống giữa các giá trị
Biến số ngẫu nhiên liên tục (Continous random variable): là biến số không
có các khoảng trống giữa các giá trị
Trang 3DÂN SỐ (Quần thể – Population): là tập hợp lớn nhất các thực thể mà ta quan
tâm ở 1 thời điểm xác định
Nếu đo một biến số trên từng thực thể của dân số, chúng ta sẽ có 1 dân số các
giá trị của biến số đó Dân số các giá trị là tập hợp lớn nhất các giá trị của 1 biến
số ngẫu nhiên mà ta quan tâm ở 1 thời điểm xác định
MẪU (Sample): là 1 phần (bộ phận) của 1 dân số
II SỰ ĐO LƯỜNG và THANG ĐO LƯỜNG (Measurement & Measurement
Scale)
Sự đo lường được định nghĩa là sự gán con số cho các vật thể hoặc biến cố theo 1 hệ thống qui tắc Do việc đo lường được thực hiện với nhiều hệ thống qui tắc khác nhau nên phải có nhiều thang đo lường khác nhau
1 Thang định danh (Nominal Scale): là thang đo lường (ở mức độ) thấp
nhất và chỉ bao gồm việc “đặt tên” cho các quan sát hoặc phân loại chúng vào các nhóm độc lập hỗ tương (mutually exclusive) Thí dụ: các chẩn đoán y khoa (bệnh cao huyết áp, bệnh nội tiết, v.v.), các thực thể nhị phân như nam-nữ, bệnh-khỏe, v v
2 Thang thứ tự (Ordinal Scale): là thang đo lường bao gồm không chỉ việc
định danh mà còn phân hạng (rank) các nhóm loại theo 1 số tiêu chuẩn nào đó
Trang 4Thí dụ: bệnh (rất nặng, nặng, vừa, nhẹ), tình trạng kinh tế (cao, vừa, kém), v v
Lưu ý là mức độ khác biệt giữa các 2 số đo thuộc 2 nhóm loại đã phân hạng
không được biết là bằng bao nhiêu
3 Thang khoảng (Interval Scale): tinh vi hơn thang thứ tự ở chỗ khoảng
cách giữa hai số đo bất kỳ được biết rõ Thí dụ: hiệu của số đo 20 và 30 bằng với hiệu của số đo 30 và 40 Thang khoảng dùng 1 đơn vị về khoảng cách và một điểm zero được chọn tùy ý Tuy nhiên điểm zero trong trường hợp này không phải là zero thật sự (chỉ thị sự hoàn toàn không có khối lượng đang được đo) Thí dụ rõ nhất về thang khoảng là cách đo nhiệt độ, trong đó 00 C không đồng nghĩa với việc hoàn toàn không có nhiệt lượng nào.Thang khoảng là một thang định lượng
4 Thang Tỉ số (Ratio Scale): là thang đo lường ở mức độ cao nhất, đặc
trưng bởi sự bằng nhau của các tỉ số cũng như của các khoảng có thể được định
rõ Điểm cơ bản của thang tỉ số là có điểm zero thật Thí dụ: chiều cao, cân nặng, chiều dài,v.v
III CHUỖI THỐNG KÊ (Ordered array) :
Trang 5là danh mục các giá trị của 1 tập hợp số liệu xếp theo thứ tự từ giá trị nhỏ đến
giá trị lớn
IV PHÂN PHỐI TẦN SỐ (Frequency Distribution)
1 Phân nhóm số liệu: số liệu có thể được tổ chức, sắp xếp bằng cách phân
vào nhiều nhóm (Khoảng cách lớp – KCL)
Cách tính số KCL
Số KCL của 1 tập hợp số liệu thường không nên nhỏ hơn 6 và không lớn
hơn 15 Để chính xác hơn, có thể dùng công thức Sturges để tính số KCL :
k = 1 + 3,322 (log 10 n)
với k : số KCL & n : số giá trị có được
Thí du: có tập hợp số liệu gồm 57 giá trị, nên phân vào bao nhiêu KCL thì vừa?
n = 57 log10 57 = 1,7559
k = 1 + 3,322 (1,7559) 7
Trang 6Cách tính độ rộng của KCL
w =
k
R
với R : biên độ của chuỗi số liệu
Thí du: có tập hợp số liệu gồm 57 giá trị, giá trị lớn nhất là 79 và giá trị nhỏ
nhất là 12 Tính độ rộng của các KCL?
w = 79 12 9, 6
7
10
Tập hợp 57 giá trị là cân nặng tính bằng ounces của 57 khối u ác tính lấy ra từ bụng của 57 bệnh nhân :
Trang 731 50 38 21 16 24 69 47 23 22 43 27
2 Lập bảng phân phối tần số
Trang 870 – 79 2
3 Lập bảng phân phối tần số, tần số dồn, tần số tương đối, tần số tương đối dồn
đối dồn
20 – 29 19 24 0,3333 0,4210
30 – 39 10 34 0,1754 0,5964
40 – 49 13 47 0,2281 0,8245
50 – 59 4 51 0,0702 0,8947
60 – 69 4 55 0,0702 0,9649
Trang 970 – 79 2 57 0,0351 1,0000
Lưu ý: Tùy theo nhu cầu mà chọn cột (tần số, tần số tương đối, tần số dồn, tần số tương đối dồn) để trình bày Thông thường nhất là trình bày tần số và tần số tương đối (tính
bằng %) trong cùng 1 bảng
4 Lập biểu đồ Histogram
Histogram là biểu đồ phân phối tần số hình que (cột) đặc biệt của các biến số liên tục Do là biểu đồ là của biến số liên tục nên khi trình bày cần phải dùng các giới hạn thật của các KCL Tìm giới hạn thật của 1 KCL bằng cách trừ đi ½ đơn vị đối với giới hạn
dưới và cộng thêm ½ đơn vị đối với giới hạn trên
Bảng phân phối tần số dùng giới hạn thật (để vẽ histogram)
Trang 10của KCL
5 Lập biểu đồ đa giác tần số
Taà n soá
X
2 4 6 8 10 12 14 16 18 20
9,5 19,5 29,5 39,5 49,5 59,5 69,5 79,5
Trang 11Biểu đồ đa giác tần số được thiết lập dựa trên histogram Bằng cách nối trung điểm
của các mặt trên của từng ô chữ nhật tượng trưng cho tần số của các KCL, ta
sẽ có 1
đa giác tần số
6 Lập biểu đồ thân–và–lá (Stem-and-leaf)
1 2 2 6 9
2 1 2 2 3 3 3 4 4 5 5 5 7 7 7 7 8 8 8 8
3 0 0 1 1 2 2 6 6 8 8
4 2 2 2 3 3 3 4 5 6 7 9 9 9
5 0 1 1 7
Tần ố
X
2 4 6 8 10 12 14 16 18 20
9,5 19,5 29,5 39,5 49,5 59,5 69,5 79,5
Trang 126 3 5 8 9
7 4 9
-