Biến số: Đặc tính hay đại lượng có thể thay đổi của các đối tượng: Có hút thuốc lá hay không hút thuốc lá Chiều cao của một người Tham số: Đặc trưng của đặc tính hay đại lượng của dân số Tỉ lệ hút thuốc lá ở nam thanh niên Việt Nam Chiều cao trung bình của nam thanh niên Việt Nam Thống kê: đặc trưng của đặc tính hay đại lượng của mẫu Tỉ lệ hút thuốc lá ở trong mẫu nghiên cứu gồm 100 thanh niên Chiều cao trung bình 100 thanh niên trong mẫu nghiên cứu
Trang 1Nguyên lí kiểm định thống kê
TS Đỗ Văn Dũng
Trang 2Biến số, thống kê, tham số
Biến số: Đặc tính hay đại lượng có thể thay đổi của các đối tượng:
Có hút thuốc lá hay không hút thuốc lá
Chiều cao của một người
Tham số: Đặc trưng của đặc tính hay đại lượng của
dân số
Tỉ lệ hút thuốc lá ở nam thanh niên Việt Nam
Chiều cao trung bình của nam thanh niên Việt Nam
Thống kê: đặc trưng của đặc tính hay đại lượng của
mẫu
Tỉ lệ hút thuốc lá ở trong mẫu nghiên cứu gồm 100 thanh niên
Chiều cao trung bình 100 thanh niên trong mẫu nghiên cứu
Trang 4Kiến thức tiền nghiệm
lượng protein cao
Chặt chẽ nhưng phụ thuộc vào giá trị của đại mệnh đề
Nếu tiểu mệnh đề đúng chưa chắc đại mệnh đề
đã đúng
Trang 5Kiến thức hậu nghiệm
đại mệnh đề
suy ra tiểu mệnh đề
Nếu tiểu mệnh đề đúng => không kết luận được
Nếu tiểu mệnh đề sai => bác bỏ đại mệnh đề
Trang 7Kiểm định ý nghĩa
bởi R A Fisher
ở bệnh nhân thiếu máu
Một nhóm gồm 50 bệnh nhân điều trị với thuốc A
Sau khi điều trị Hemoglobin trung bình cải thiện
2,5 (g/lít)
Xác suất xảy ra sự khác biệt là 2 nếu thực sự
thuốc A không có tác dụng cải thiện tình trạng
thiếu máu
Trang 8Nguyên tắc kiểm định ý nghĩa theo Fisher Đường phân phối màu xanh dương thể hiện phân phối khi thuốc A không có tác dụng (giả thuyết Ho) , Vùng diện tích màu
Trang 9 Nếu thuốc A không có hiệu quả lên
hemoglobin (giả thuyết Ho)
và hemoglobin thay đổi giá trị s
giá trị s > 0,05
Trang 10 Nếu thuốc A không có hiệu quả lên
hemoglobin (giả thuyết Ho)
bệnh nhân này tăng không quá 2g/l
Trang 11Cơ sở lý luận của kiểm định
P(A)P(B|A) = P(B)P(A|B) = P(A và B)
P(A|B)= thấp P(B|A)= thấp
Nếu P (cĩ cải thiện hemoglobin 2,5 nếu thuốc A vơ
dụng) thấp => P (thuốc A vơ dụng khi cĩ sự
hemoglobin cải thiện) thấp
Trong thống kê
(A B ) {P(B ) thấp P(B ) thấp P(A) thấp)
Ho Tkê S P(Tkê S | H0 ) < ngưỡng bác bỏ Ho
P(Tkê S | H0 ) : giá trị p
)(
)
|()
()
|
(
A P
B A P B
P A
B
Trang 12Cơ sở lý luận của kiểm định
Trong logic học
P(A|B)=0 P(B|A)=0
Nếu khơng cĩ trung tiện ở bệnh nhân tắc ruột
=> khơng xảy ra tắc ruột ở BN cĩ trung
tiện
(A B ) (B A)
Trang 13 Giá trị p (p-value)
P (có cải thiện hemoglobin trung bình tăng trên
2,5 nếu thuốc A không có hiệu quả)
Giá trị p=P(Xảy ra thống kê cực đoan hơn kết quả
|Giả thuyết Ho)
Chỉ số đo lường sức mạnh chống lại giả thuyết Ho: Xác định nguy cơ bác bỏ nhầm giả thuyết Ho
Trang 14 Nếu sử dụng ANOVA để so sánh trung bình giữa các nhóm nhưng test Barlet cho thấy
phương sai giữa các nhóm là khác nhau, có thể sử dụng 1 trong 2 giải pháp
Sử dụng kiểm định phi tham số Kruskal-Wallis
Sử dụng phép biến đổi log: tạo biến mới bằng
logarithm của biến phụ thuộc và thực hiện lệnh oneway trên biến số này
Trang 15Giả thuyết thống kê
hành suy luận thống kê
cứu muốn chứng minh (do việc chứng
minh được thực hiện bằng phản chứng)
sự khác biệt
Trang 16Giả thuyết thống kê: Các thí dụ
Chiều cao trung bình nam = chiều cao trung bình ở nữ
Tỉ lệ bị nhồi máu cơ tim ở nhóm tăng
cholesterol = tỉ lệ nhồi máu cơ tim ở nhóm
có cholesterol thấp
Thuốc A có hiệu quả điều trị bằng thuốc B
Trang 17 Kiểm định 1 bên và kiểm định 2 bên
Trang 18 Vì không thể tính được xác suất thuốc A không có hiệu quả khi có thay đổi
hemoglobin
hemoglobin khi thuốc A không có hiệu quả
Trang 19Giả thuyết Ho
không khác biệt, không có liên quan
được giả thuyết H
Trang 20 Nguyên lí của kiểm định là gì?
Giá trị p là gì?
có phải là giả thuyết Ho hay không?
không có tác dụng phòng bệnh cúm” Nếu giá trị p là 0,01, có thể rút ra kết luận gì?
Trang 21Kiểm định giả thuyết
Do Neyman và Pearson đề xuất
Đưa ra cách tiếp cận khách quan, dựa vào quyết định để thay thế quan điểm chủ quan của sức mạnh bằng chứng chống lại giả thuyết Ho
Quan tâm đến cả nguy cơ bác bỏ nhầm giả thuyết Ho lẫn nguy cơ chấp nhận nhầm giả thuyết Ho
“Không có kiểm định nào cho bằng chứng có giá trị về chân
lí hay sai lầm của giả thuyết Nhưng chúng ta có thể nhìn nhận mục đích của kiểm định theo quan điểm khác …
Chúng ta tìm quy tắc quy định hành vi của chúng ta đối với các giả thuyết để nhìn chung, chúng ta ít mắc phải các sai
Trang 22Các loại sai lầm
Chân líKết quả thực
Trang 23Xác suất sai
lầm loại 1
Nhỏ
<0,05
Bác bỏ giả thuyết
Xác suất sai lầm loại 2
Không nhỏ
Thuật tốn kiểm định giả thuyết
Trang 24Kiểm định giả thuyết
Để sử dụng cách tiếp cận của Neyman-Pearson, chúng
ta phải xác định giả thuyết thay thế một cách chính xác
Nói cách khác, nói rằng thuốc A có hiệu quả là không
đủ mà phải xác định thuốc A có hiệu quả bao nhiêu
Quy tắc kiểm định có thể xác định bằng xác định nguy
cơ sai lầm loại I, nguy cơ sai lầm loại II và xác định giả thuyết thay thế
Không thể lí giải giá trị p để đánh giá sức mạnh của
bằng chứng chống lại giả thuyết không trong một
nghiên cứu riêng lẻ
Ít nhà nghiên cứu thông suốt được các điều lí tưởng này
Trang 25Phân biệt 2 cách tiếp cận
Phải khẳng định giả thuyết không (Ho) và giả thuyết thay thế (Ha) một cách chính xác
Trang 26Mối liên quan giữa sai lầm loại 1, sai lầm loai 2, cỡ mẫu và khoảng cách giữa Ho -
Ha (khoảng 3 lần se) Đường phân phối màu xanh dương thể hiện giả thuyết Ho ,
đường màu đỏ thể hiện giả thuyết Ha Vùng diện tích màu đỏ là xác suất sai lầm loại
Trang 28Khi khoảng cách Ho-Ha tăng lên, vùng diện tích màu xanh thể hiện xác suất sai lầm loại 2 (2%) sẽ giảm đi Nếu đã xác định Ha và cỡ mẫu để có =20%, thì 20%
Trang 29Khi khoảng cách Ho-Ha giảm đi, vùng diện tích màu xanh thể hiện xác suất sai lầm loại 2 (70%) sẽ tăng lên
Trang 30Khi khoảng cách Ho-Ha giảm đi, cần phải tăng cỡ mẫu để đường cong phân phối của giả thuyết Ho và Ho hẹp lạI để vùng diện tích màu xanh thể hiện xác suất sai lầm
Trang 31Bài tập
Dựa vào đề cương nghiên cứu của nhóm hãy
Nêu sai lầm loại II
Trang 35Chọn lựa kiểm định phù hợp
Biến phụ thuộc
(hậu quả) Biến độc lập (nguyên nhân)
Nhị giá Danh định Thứ tự -Định lượng
Đa biến Định lượng T-test ANOVA Hồi quy tuyến tính
Sống còn Wilcoxon
tổng quát Wilcoxon tổng quát Hồi quy Cox
Phi tham số - Phân tích đa biến – Biến sống còn
Trang 36Kết luận
tổng quát cho toàn bộ dân số mục tiêu
nghiên cứu và phải thể hiện bằng một đẳng thức
càng nhỏ chúng ta càng mạnh dạn bác bỏ giả thuyết Ho
Trang 37 Có kiểm định 2 bên và kiểm định 1 bên Kiểm định 2 bên tốt hơn vì không đòi hỏi các giả
định
lầm loại 2 là sai lầm khi chấp nhận
độc lập và biến phụ thuộc
lượng không phân phối bình thường (hay biến thứ tự) được gọi là kiểm định phi tham số
Trang 38 Cho 2 nhóm trẻ em, một nhóm có tiêm ngừa và một nhóm không tiêm ngừa
Sau đó theo dõi nhóm nào có tỉ lệ bệnh
ho gà cao hơn.
Trang 39số, tỉ lệ trong dân số) đặc tính của toàn
bộ dân số
Trang 40 Cho 2 nhóm bệnh nhân, một nhóm suy dinh dưỡng và nhóm dinh dưỡng tốt
Đánh giá hiệu giá kháng thể sau tiêm
vaccine ở 2 nhóm này
Trang 41Loại thiết kế nghiên cứu
Thang đo
của biến số
So sánh hai nhóm khác nhau
So sánh ba (hay nhiều nhóm) nhóm khác nhau
So sánh trước sau trên cùng 1 nhóm
So sánh 3 điều trị (hay
3 thời điểm) trên cùng một nhóm
Liên hệ giữa hai biến số
Phân tích phương sai
t-test bắt cặp
Phân tích phương sai
đo lường lập
lại
Hồi quy tuyến tính
và tương quan pearson Danh định 2 bảng 2 x
Cochrance
Q
Hệ số của bảng n x m (phi, OR, RR) Thứ tự Kiểm định
sắp hạng – tổng Mann- Whitney
Wallis
Kruskal-Kiểm định sắp hạng có dấu Wilcoxon
Friedman hệ số tương
quan Spearman
Trang 42 Thảo luận:
Trang 43Tóm tắt
xác dưới dạng một đẳng thức
càng nhỏ việc bác bỏ giả thuyết Ho càng
mạnh
và sai lầm khi chấp nhận (loại 2)
đo của biến phụ thuộc và thiết kế
Trang 45) 1 (
.
.
2
2 2
4 2 1
2 1
4 1
2
2
2 2 1
2 1
n n
s n
n
s
n
s n
s f
d
2 1
2 1
2 1
/ 1 /
s
x
x se
x x t
2 1
2 1
2 1
n
s n
s
x
x se
x
x t
Trang 46 Kiểm định phi tham số
Không đòi hỏi biến số phân phối bình thường
Không đòi hỏi phương sai đồng nhất
Dễ tính toán
Nhưng: không ước lượng được tham số
Khuynh hướng cũ: sử dụng phi tham số khi biến
không phân phối bình thường
Khuynh hướng mới: dùng kiểm định tham số (và
dùng phép biến đổi biến số (transformation) để có phân phối bình thường hay dùng kiểm định t-test với phương sai không bằng nhau)