Biến khoảng interval BS Định tính BS phân loại: mô tả đặc tính Danh định nominal: không có tính thứ tự Thứ tự ordinal: có tính thứ tự Nhị giá binary: chỉ có hai giá trị Biến s
Trang 1Thống kê mô tả Trình bày kết quả nghiên cứu
Đỗ Văn Dũng Đại học Y Dược TP Hồ Chí Minh
Trang 2Các bước phân tích số liệu
1- Mở tập tin; thăm dò tập tin; Làm sạch số liệu (nếu cần)
Log để ghi kết quả
Trang 4 Biến khoảng (interval)
BS Định tính (BS phân loại): mô tả đặc tính
Danh định (nominal): không có tính thứ tự
Thứ tự (ordinal): có tính thứ tự
Nhị giá (binary): chỉ có hai giá trị
Biến sống còn
Trang 5Biến số, thống kê, tham số
Biến số: Đặc tính hay đại lượng có thể thay đổi của các đối
tượng:
Có hút thuốc lá hay không hút thuốc lá
Chiều cao của một người
Thống kê: đặc trưng của đặc tính hay đại lượng của mẫu
Tỉ lệ hút thuốc lá ở trong mẫu nghiên cứu gồm 100 thanh niên
Chiều cao trung bình 100 thanh niên trong mẫu nghiên cứu
Tham số: Đặc trưng của đặc tính hay đại lượng của dân số
Tỉ lệ hút thuốc lá ở nam thanh niên Việt Nam
Chiều cao trung bình của nam thanh niên Việt Nam
Trang 7Số thống kê tóm tắt
Giá trị tiêu biểu
Trung bình (mean)
Trung vị: (median) Giá trị ở giữa của số liệu được sắp thứ tự
(Nếu có 2 giá trị ở giữa, trung vị là trung bình của 2 giá trị này)
Yếu vị: (mode) Giá trị phổ biến nhất (tần suất cao nhất)
Độ phân tán
Độ lệch chuẩn (standard deviation)
Phương sai (variance)
s
1
2 2
1 ) (
Trang 9Tính trung vị của số liệu sau
Trang 10Tính trung vị của số liệu sau
Trang 11° Một công ty có 100 công nhân và 1 giám đốc
Công nhân lãnh lương 2 triệu đồng /tháng và giám đốc lãnh 200 triệu đồng/tháng Lương bình quân là
4 triệu đồng
Trang 12Phân phối bình thường Lệch dương Lệch âm
Phân phối hai đỉnh Phân phối J ngược
Trang 13Số thống kê tóm tắt
Giá trị tiêu biểu
Trung bình (mean)
Trung vị: (median) Giá trị ở giữa của số liệu được sắp thứ tự
(Nếu có 2 giá trị ở giữa, trung vị là trung bình của 2 giá trị này)
Yếu vị: (mode) Giá trị phổ biến nhất (tần suất cao nhất)
Độ phân tán
Độ lệch chuẩn (standard deviation)
Phương sai (variance)
s
1
2 2
1 ) (
Trang 14° Số liệu đường huyết (mg%) của 5 người khỏe
mạnh là: 80, 90, 100, 110, 120 Đường huyết trung bình là 100 mg% Độ lệch chuẩn (standard
deviation = Std dev) của đường huyết là:
a 5
b 15
c 40
d 225
Trang 17Nguyên tắc chung cho bảng
– Đơn giản
• Đặc tính của không quá 2 biến phân nhóm
• Tối ưu hóa số số lẻ của số thống kê
– Đầy đủ thông tin
• Bảng, hàng, cột phải có tiêu đề
• Biến định lượng có đơn vị; biến định tính có liệt kê đủ giá trị
• Biến số định lượng phải có trung bình và độ lệch chuẩn; biến định tính
phải có tỉ lệ %
• Các chữ viết tắt và kí hiệu phải được chú thích
Trang 22Tuổi (Năm) Giới nam (%)
Huyết áp (mmHg) Tâm thu
Tâm trương Nhịp tim (lần/phút) Chỉ số khối cơ thể Phân loại Killip (%)
TS cao huyết áp (%)
Đột tử do tim mạch
N=1067
Chết do nguyên nhân khác
N=1905
Trang 25Tuổi (Năm)
Giới nam (%) Chủng tộc (% da trắng, vàng, đen khác)
Chỉ số khối (kg/m2)
Đường huyết lúc đói (mmol/L
Trang 26 Biểu đồ thanh đơn
Biểu đồ thanh chùm, thanh chồng, thanh %
Biểu đồ hình bánh
Trang 27Bảng 2 chiều Biểu đồ thanh chồng
Bảng 1 chiều Biểu đồ thanh
đơn
Bảng 1 chiều Biểu đồ thanh
chùm
Trang 28Các bước kiểm định ý nghĩa
Chọn kiểm định phù hợp
Xây dựng giả thuyết Ho
Tính toán giá trị thống kê
Thống kê t
Thống kê χ 2
Xác định giá trị p (p-value) và kết luận
Đọc khoảng tin cậy của tham số cần ước lượng (nếu phù hợp)
Trang 29Whitney
Mann-Kruskal-Wallis TQ Spearman
Nhị giá Chi bình
phương (cc, Chi bình phương (tabodds) Hồi quy logistic Hồi quy Poisson
Trang 30minh được giả thuyết Ho
Giả thuyết Ho là phủ định của giả
thuyết nghiên cứu
Trang 31Giả thuyết thống kê: Các thí dụ
bình ở nữ
Tỉ lệ bị nhồi máu cơ tim ở nhóm tăng
cholesterol = tỉ lệ nhồi máu cơ tim ở nhóm
có cholesterol thấp
dụng misoprostol bằng nguy cơ ở nhóm sử dụng placebo
Trang 35 Giá trị p (p-value)
Giá trị p=Xác suất sai lầm loại 1
Giá trị p=P(bác bỏ Ho|Ho đúng)
P <0,05: bằng chứng chống lại Ho 0,05 là ngưỡng để bác bỏ Ho
Kí hiệu của giá trị p trong phần mềm
Trang 37 Risk ratio = Tỉ số nguy cơ = Nguy cơ tương đối = Ở nhóm phơi nhiễm là bao nhiêu so với nhóm không phơi nhiễm
Prev frac ex (Preventable Risk Fraction) Phân số nguy cơ phòng ngừa được ở nhóm phơi nhiễm (Giảm nguy cơ tương đối) = Trong nhóm phơi nhiễm,nguy cơ giảm bao nhiêu % so với nhóm không phơi nhiễm
Prev frac pop (Preventable Risk Fraction in
population) = Phân số nguy cơ phòng ngừa được
ở chung quần thể = Trong quần thể nguy cơ giảm
Trang 38 Risk ratio = Tỉ số nguy cơ = Nguy cơ tương đối = Ở nhóm phơi nhiễm là bao nhiêu so với nhóm không phơi nhiễm
Attr frac ex (Attributable Risk Fraction)= Phân số nguy cơ quy trách (ở nhóm phơi nhiễm) = Trong nhóm tăng huyết áp, tăng huyết áp là căn nguyên của bao nhiêu % các trường hợp sinh non
Attr frac pop (Attributable Risk Fraction in
population) = Phân số nguy cơ quy trách dân số (ở dân số chung) = Trong dân số chung, tăng huyết áp
là căn nguyên của bao nhiêu % các trường hợp sinh non