Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 27 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
27
Dung lượng
1,85 MB
Nội dung
1 Đại c#ơng về Mục tiêu, Biến số và Phân tích số liệu% L!u Ngọc Hoạt Vin YHDP và YTCC, ĐH Y Hà Nội MT c th: ! Xỏc nh t l cao HA ca ngi cao tui ti huyn A. ! Xỏc nh mt s yu t liờn quan n tỡnh trng cao HA. ! ỏnh giỏ hiu qu ca mt s gii phỏp can thip lm gim t l tng huyt ỏp. Tờn ti: Huyt ỏp ca ngi dõn ti huyn A nm 2005 v mt s yu t nh hng MT chung: Xỏc nh t l cao HA ca ngi cao tui ti huyn A nm 2005 v mt s yu t nh hng Mi liờn quan gia tờn ti, mc tiờu chung v mc tiờu c th Mc tiờu 3 Mc tiờu 2 Mc tiờu 1 Mc tiờu chung % % Tờn ti Mc tiờu 3 Mc tiờu 2 Mc tiờu 1 Mc tiờu chung Tờn ti Cao HA ca ngi cao tui ti huyn A nm 2005 v mt s yu t nh hng Xỏc nh t l cao HA ca ngi cao tui ti huyn A nm 2005 v mt s yu t nh hng ! Xỏc nh t l cao HA ca ngi cao tui ti huyn A. ! Xỏc nh mt s yu t liờn quan n tỡnh trng cao HA. ! xut (v thm dũ) mt s gii phỏp can thip lm gim t l tng huyt ỏp. Mc tiờu 3 Mc tiờu 2 Mc tiờu 1 Mc tiờu chung Bin s 1 Bin s 2 Bin s 3 Bin s 4 Mi liờn quan gia mt s thnh phn ca NC Bin s 1 Bin s 2 Bin s 3 Bin s 4 Bin s 1 Bin s 2 Bin s 3 Bin s 4 Tờn ti! Định nghĩa Biến số% Đặc tính của ng!ời, vật sự việc, hiện t! ợng biến thiên theo các điều kiện khác nhau Do ng!ời nghiên cứu lựa chọn phù hợp với từng mục tiêu nghiên cứu Triển khai nghiên cứu chính là thu thập số liệu cho các biến số này Đối lập với biến số là các hằng số 2 Phân loại theo bản chất của biến số Biến định l"ợng Biến định tính Biến liên tục Biến rời rạc Biến tỷ suất Biến khoảng chia Biến danh mục Biến thứ hạng Biến nhị phân Bài tập 1: Phân loại các biến số Định tính Định l#ợng Danh mục Thứ hạng Nhị phân Khoảng chia Tỷ suất Liên tục Rời rạc Tuổi Hàm l"ợng đ"ờng huyết Độ cận, viễn của mắt (đi ốp) Số l"ợng hồng cầu Nhiệt độ không khí Giới Dân tộc Trình độ văn hoá Số vi khuẩn/vi tr" ờng Bài tập 1: Phân loại các biến số Định tính Định l#ợng Danh mục Thứ hạng Nhị phân Khoảng chia Tỷ suất Liên tục Rời rạc Tuổi X X X Hàm l"ợng đ"ờng huyết X X X Độ cận, viễn của mắt (đi ốp) X X X Số l"ợng hồng cầu X X X Nhiệt độ không khí X X X Giới X X Dân tộc X X Trình độ văn hoá X X Số vi khuẩn/vi tr" ờng X X X Phân loại theo mối t!ơng quan giữa các biến số Biến độc lập (phơi nhiễm) Biến phụ thuộc (bệnh) Yếu tố nhiễu " Nhiễu là yếu tố làm sai lệch ảnh h"ởng của phơi nhiễm với bệnh (thay đổi độ lớn và ý nghĩa thống kê) " Biến độc lập, phụ thuộc và nhiễu đ"ợc xác định bởi ng" ời nghiên cứu và chỉ có ý nghĩa trong nghiên cứu đó. 3 Tiêu chuẩn của 1 yếu tố nhiễu% # Phải là 1 yếu tố nguy cơ đối với bệnh # Phải có liên quan đối với phơi nhiễm nh! ng không lệ thuộc vào phơi nhiễm # Không phải là yếu tố trung gian giữa phơi nhiễm và bệnh # Phải thực sự tác động lên mối t!ơng quan giữa phơi nhiễm và bệnh (khẳng định khi phân tích số liệu) # Có thể đổi chỗ cho yếu tố phơi nhiễm tuỳ theo mục đích ng!ời làm nghiên cứu Tr#ờng hợp nào sau đây là nhiễu?% E E E D E E D D D D D D E E E D D E F F F F F F F F F F Bài tập Nếu muốn xác định các biến số cần và đủ cho một nghiên cứu thì cần dựa vào cách nào d!ới đây (chọn cách mà Anh/Chị cho là hợp lý nhất)? A. Kinh nghiệm của các nghiên cứu t!õng tự đã đ!ợc tác giả khác triển khai, B. Cây vấn đề đ!ợc phát triển từ đề tài nghiên cứu C. Kế hoạch trình bày phần kết quả nghiên cứu và bàn luận D. Mục tiêu nghiên cứu Phân biệt thống kê mô tả và thống kê suy luận% Thống kê mô tả: là mô tả kết quả thu đ!ợc từ mẫu nghiên cứu biểu thị độ lớn, sự phân bố của các tham số của mẫu nghiên cứu nh! , độ lệch chuẩn, các tỷ lệ, bảng, biểu, đồ thị sự phân bố theo các biến số khác nhau nh! tuổi, giới, địa d! Thống kê suy luận: là quá trình ngoại suy kết quả nghiên cứu từ mẫu ra quần thể nghiên cứu. bao gồm 2 ph!ơng pháp: !ớc l!ợng và kiểm định 4 Quần thể đích% Quần thể nghiên cứu% Mẫu% Tham số quần thể% ( à , , P )% Mẫu xác suất% - Ngẫu nhiên đơn ! - Ngẫu nhiên hệ thống! - Mẫu phân tầng ! - Mẫu chùm ! - Mẫu nhiều bậc! Mẫu không xác suất% - Mẫu kinh nghiệm % - Mẫu thuận tiện ! - Mẫu chỉ tiêu! - Mẫu có mục đích.% Chọn mẫu% Ước l#ợng% điểm% khoảng% Kiểm định giả thuyết% Suy luận thông kê (Chỉ áp dụng cho mẫu xác suất với cỡ mẫu đủ lớn)% Kết luận ngoại suy! Các test thống kê Giá trị p Lựa chọn! Mô tả các tham số mẫu% (trình bày kết quả nghiên c&ú)% Tham số mẫu% ( , s, p )! X Biến số! Thống kê mô tả% Thống kê suy luận% 1. Thống kê mô tả% Bài tập Nu mt ngi nghiờn cu mun thu thp s liu v huyt ỏp ti a ca cỏc i tng NC, cỏch thu thp no di õy Anh/Ch cho l hp lý nht? A. Phõn huyt ỏp thnh cỏc nhúm (vớ d < 90 mmHg; 90-120; 121-140 ) sau ú chn nhúm thớch hp B. Ghi y tr s huyt ỏp ti a ca tng i tng. C. Phõn i tng thnh hai loi cú v khụng cao huyt ỏp ti a D. Phõn thnh cỏc nhúm: huyt ỏp thp, bỡnh thng, cao v rt cao Bài tập Nu mt ngi nghiờn cu mun thu thp s liu v s iu thuc lỏ mt ngi hỳt trung bỡnh/ngy, cỏch thu thp no di õy Anh/Ch cho l hp lý nht? A. Phõn thnh cỏc nhúm (vớ d < 5 iu; 5-10; 11-15; 16-20 ) sau ú chn nhúm thớch hp B. Ghi chớnh xỏc s iu thuc hỳt trung bỡnh m i tng ó tr li. C. Phõn i tng thnh hai loi: hỳt trờn 1 bao hoc di mt bao D. Phõn thnh cỏc nhúm: hỳt nh, hỳt trung bỡnh, hỳt nhiu, hỳt rt nhiu. 5 Ví dụ 1: Mô tả đặc điểm của cân nặng khi đẻ của 500 trẻ mới sinh tại bệnh viện M:% 1. Khi cân nặng tính bằng gram (biến định l&ợng)! $ Đo l!ờng độ tập trung của số liệu: - Giá trị trung bình: với số liệu phân bố chuẩn - Giá trị trung vị: với bộ số liệu phân bố không chuẩn $ Đo l!ờng độ phân tán của bộ số liệu: - Khoảng dao động (Max Min) - Độ lệch chuẩn 2. Khi cân nặng tính theo mốc < hoặc 2500 gram (biến định tính)! $ Tỷ lệ trẻ có cân nặng < 2500 gr Ưu điểm của phân tích số liệu d#ới dạng định l#ợng (ví dụ cân nặng khi đẻ của trẻ)% BA XX >> P A = P B = 10%% 2500 gr% 50 trẻ 450 trẻ B 2500 gr% 50 trẻ 450 trẻ A 2500 gr% 50 trẻ 450 trẻ A Ưu điểm của phân tích số liệu d#ới dạng định l#ợng (tiếp) (Huyt áp ti a)% P A = P B = 60%% 120 mmHg% 300 ngi 200 ngi A 120 mmHg% 300 ngi 200 ngi B BA XX s B >> s A % Các nội dung chính của thống kê mô tả% I. Tổng hợp các biến số% Với các biến định tính:! Tần số (frequency)! Tỷ số (ratio)! Tỷ lệ (proportion)! Tỷ suất (rate)! Với các biến định l&ợng: ! Đo l&ờng độ tập trung: giá trị trung bình, trung vị, mốt! Đo l&ờng độ phân tán: ph&ơng sai, độ lệch chuẩn, % 6 Các nội dung chính của thống kê mô tả% II. Trình bày số liệu bằng bảng: % Bảng 1 chiều% Bảng 2 chiều% III. Trình bày số liệu bằng biểu và đồ thị % Đồ thị cột: % Cột rời, ! Cột chồng, ! Cột liên tục! Đồ thị hình tròn% Biểu đồ gấp khúc% Biểu đồ đa giác% Biểu đồ chấm (đám mây)% Bản đồ% 1/ Tổng hợp số liệu với các biến định tính 1.1. Tần số (frequency):% Biểu thị số lần xuất hiện của 1 quan sát nào đó% VD : Phân bố nhóm dân tộc trong số 22 ng#ời nghiên cứu. 22%Tổng cộng% 6%Nùng% 12%Tày% 4%Kinh% Tần số%Đếm số lần xuất hiện% Giá trị biến% 1.2. Tỷ số (ratio):% Là phân số mà mẫu số không bao hàm tử số % Tử số và mẫu số có thể khác nhau về đơn vị đo l!ờng % Hệ số k có thể là 1, 10, 100, 1000 % Ví dụ: a% x k% b% số học sinh nam số học sinh nữ số gi!ờng bệnh dân số trong khu vực 7 1.3. Tỷ lệ (proportion):% &Là 1 phân số mà mẫu số bao hàm tử số, do vậy cả mẫu và tử đều phải cùng đơn vị a% x k% a + b% % Hệ số k có thể là 1, 10, 100, 1000 % Khi k = 100, ta có tỷ lệ phần trăm (percentage)! % Ví dụ:% số học sinh nam Tỷ lệ học sinh nam = tổng số học sinh số ng!ời mắc sốt rét Tỷ lệ mắc sốt rét = tổng số ng!ời đ!ợc khám 1.4. Tỷ suất (rate):% Là 1 dạng đặc biệt của tỷ lệ khi nó đ!ợc đo l! ờng trong một khoảng thời gian nhất định Ví dụ: số biến cố xẩy ra trong 1 khoảng thời gian x k dân số trung bình trong khoảng thời gian đó % Hệ số k có thể là 1, 10, 100, 1000 % Ví dụ:% số ng!ời bị sốt rét tại huyện A năm 2000 x 100 dân số trung bình của huyện A trong năm đó 2/ Tổng hợp số liệu với các biến định l!ợng 2.1. Đo l#ờng độ tập trung: Bài tập Tham s no l thớch hp nht o lng tp trung ca b s liu di õy: 12, 15, 17, 20, 23, 24, 26, 28, 80 A. Trung v B. Khong phn trm C. Giỏ tr trung bỡnh D. lch chun 8 Đ!ợc tính bằng tổng số các giá trị quan sát đ! ợc chia cho số lần quan sát. Giá trị trung bình chỉ tính đ!ợc với các số dạng liệu số (biến định l!ợng) Ví dụ:! Chiều cao của 7 em gái đo đ!ợc nh! sau: 141, 141, 143, 144, 145, 146, 155 cm (tổng cộng tất cả chiều cao là 1015 cm) Vì vậy trung bình bằng 1015/7, tức là 145 cm. n X n XXX X n i i n = = +++ = 121 # Trung bình số học (trung bình cộng): Là giá trị giữa của 1 bộ số liệu khi chúng đ!ợc sắp xếp theo thứ tự tăng dần hoặc giảm dần. Giá trị này chia sự phân bố của số liệu thành hai phần bằng nhau ! Ví dụ:! ta có bộ số liệu: 47, 41, 44, 43, 42, 40, 72 kg. để tính trung vị, tr!ớc hết sắp xếp số liệu theo thứ tự: 40, 41, 42, 43, 44, 47, 72 kg. trung vị sẽ là giá trị của quan sát thứ (n+1)/2, tức là (7+1)/2 =4, và giá trị thứ 4 = 43 kg là trung vị. Với bộ số liệu: 40, 41, 42, 43, 44, 47, 49 và 72 thì trung vị là giá trị trung bình cộng của giá trị thứ 4 và thứ 5 = (43+44)/2 = 43,5 # Trung vị (giá trị trung tâm): Là giá trị quan sát đ!ợc nhiều lần nhất trong bộ số liệu Trong bộ số liệu d!ới đây:141, 141, 143, 144, 145, 146, 155 thì 141 đ!ợc coi là mốt vì quan sát đ!ợc nhiều lần nhất. Mốt ít có giá trị trong đo l!ờng độ tập trung của bộ số liệu khi ở dạng định l!ợng, nh!ng có giá trị với bộ số liệu phân nhóm, hoặc biến định tính Ví dụ: Trong bảng d#ới, nhóm tuổi 36-45 là mốt Nhóm tuổi Tần số Nhóm tuổi Tần số Nhóm tuổi Tần số < 5 15 26-35 67 56-65 43 5-15 24 36-45 120 66-75 27 16-25 32 46-55 94 >75 12 # Mốt: Phân biệt về giá trị trung bình, trung vị và mốt: Mốt = 10 Trung vị = 11 Trung bình = 11,3 Đo l"ờng (cm) 9 Ví dụ phân bố chuẩn% Frequency bwt 709% 4990% 0% 29% Phân biệt về giá trị trung bình, trung vị và mốt (tiếp): Giá trị trung bình đ#ợc sử dụng th#ờng xuyên hơn và có giá trị khi bộ số liệu là 1 phân bố chuẩn.% Khi bộ số liệu phân bố không chuẩn, trung vị có ý nghĩa hơn:% Ví dụ: ! Với bộ số liệu này: 40, 41, 42, 43, 44, 47, 72 thì giá trị trung bình = 47, trong khi giá trị trung vị bằng 43. Nếu ta thay giá trị 72 trong bộ số liệu trên = 51, giá trị trung vị không đổi, nh!ng giá trị trung bình chỉ còn là 44! 2/ Tổng hợp số liệu với các biến định l!ợng (tiếp) 2.2. Đo l#ờng độ phân tán: # Khoảng số liệu (range): % Là hiệu giữa hai giá trị đo l!ờng cao nhất và thấp nhất trong một bộ số liệu. Khoảng số liệu (R) = X max X min Ví dụ: nếu cân nặng của 7 phụ nữ là 40, 41, 42, 43, 44, 47 và 72 kg, khoảng quan sát sẽ là 72 - 40 = 32 kg.% 1 )( 1 2 2 = = n XXi s n i # Ph#ơng sai (variance)% Là tổng bình ph!ơng các khoảng cách giữa giá trị quan sát so với giá trị trung bình chia cho số các quan sát trừ đi 1. # Độ lệch chuẩn (standard deviation)% 2 ss = 10 # Ví dụ minh hoạ: X # Ví dụ minh hoạ (tiếp): 6 10 0 30 1 2 1 0 4 Bình ph!ơng khoảng chênh lệch giữa giá trị quan sát so với giá trị trung bình 1 2 -1 0 -2 Khoảng chênh lệch so với giá trị trung bình 7 8 5 6 4 Tỷ lệ phụ nữ làm kinh tế giỏi (Xi) 01 00 99 98 97 )( XXi 5,2 4 10 1 )( 1 2 2 == = = n XXi s n i X 2 )( XXi 58,15,2 == s # Hệ số biến thiên (coeficient of variation)% Là tỷ số giữa độ lệch chuẩn và trị tuyệt đối của giá trị trung bình Hệ số biến thiên đ!ợc biểu thị bằng tỷ lệ phần trăm (%) và biểu thị mức độ biến thiên của độ lệch chuẩn so với giá trị trung bình Giúp cho việc so sánh mức độ phân tán của nhiều bộ số liệu với nhau: Ví dụ:! CV của cân nặng nam =12/60 = 20% CV của cân nặng nữ = 8/54 = 15% Vậy bộ số liệu của cân nặng nam phân tán hơn X s CV = 8 54 Cân nặng nữ thanh niên 12 60 Cân nặng nam thanh niên s X Thống kê mô tả: Quan tâm đến mẫu NC Tổng hợp số liệu: tỷ lệ, tỷ số, tỷ suất Độ tập trung, độ phân tán của bộ số liệu định l!ợng Trình bày kết quả nghiên cứu: Bảng Biểu đồ, đồ thị Thống kê suy luận: quan tâm đến quần thể Ước l!ợng : Điểm, Khoảng Kiểm định giả thuyết Khác nhau T!ơng quan [...]... ơng đối (RR) và OR! Biến định lượng% Với tất cả các loại nghiên cứu% Phân tích tư ơng quan và hồi quy% Biến nhị phân% Với tất cả các loại nghiên cứu% 2 hoặc 2 của McNemar s% Biến định lượng% Với tất cả các loại nghiên cứu% Phân tích tư ơng quan và hồi quy% Biến nhị phân% 2.2 Kiểm định giả thuyết% Kiểm định mối tương quan giữa 2 biến nhị phân% Đo lường độ lớn của mối tư ơng quan % Phân tích Sự" Tương... quan giữa tuổi và huyết áp tối đa % Bảng lựa chọn test thống kê% Biến độc lập 220 - Hệ số tương quan r Biến Phụ thuộc - Phương trình hồi quy tuyến tính % 1 biến định tính Có 2 nhóm Trên 2 nhóm >2 biến định tính 1 định lư ợng 1 định tính, 1 định lư ợng Nhiều biến định tính và/ hoặc định lượng Factorial design (thừa số) Hệ số tư ơng quan r hoặc hồi quy tuyến tính ANCOVA Phân tích hồi quy đa biến Hồi quy... logistics Test t Test ANOVA 1 biến nhị phân OR, RR, 2 hoặc Fisher test 2 hoặc Phân tích Test t Fisher tầng test Factorial design (thừa số) 1 biến định tính 2 hoặc Fisher test 2 hoặc Phân tích ANOVA Fisher tầng test Factorial design (thừa số) sbp 1 biến định lư ợng 110 17 age 70 16 Một số test thường dùng% ỉ Test t student: Test t ghép cặp% Chức năng hô hấp của 5 bệnh nhân hen trư ớc và sau khi dùng thuốc!... ơng ứng % Kết luận: Nếu t tính từ công thức > t tra từ bảng tức là p < ; Ho bị loại bỏ và mối tương quan giữa 2 biến có ý nghĩa thống kê và ngược lại ,% Tham số quần thể: ,% = 2 % ý nghĩa của hệ số xác định:% Y X r2 = 0,25 Y X r2 = 0,50 Y X r2 = 0,15 22 5 Ví dụ về một số bộ số liệu không thích hợp với hồi quy và tương quan: % X1! Y1! X2! Y2! X3! Y3! X4! Y4! 10% 8.04% 10% 9.14% 10% 7.46% 8% 6.58%... = 103,35 + 0,98 tuổi% Biến tuổi đóng góp 64% sự biến đổi của huyết áp tối đa % Biểu đồ chấm thể hiện mối tương quan tuyến tính rõ% Có 1 mối quan hệ nhân quả giữa 2 biến% Biến x được lựa chọn bởi người nghiên cứu (không ngẫu nhiên) trong khi biến y là ngẫu nhiên.% Phân bố các giá trị của cả biến x và y phải chuẩn, % Một giá trị của x thường cho 1 tập hợp các giá trị của y và chúng phải có các điều... dựa vào sự khác biệt giữa t tra từ bảng và t tính từ công thức.% Number of obs F( 1, 67) Prob > F R-squared Adj R-squared Root MSE = = = = = = Hệ số hồi quy của quần thể được ký hiệu là % Số chặn của quần thể được ký hiệu là % Công thức ước lượng khoảng cho hệ số hồi quy của quần thể: % % b t/ 2 (Y Y ) 2 b2 ( X X )2 (n 2) (X X ) 2 * Chú ý: Hệ số hồi quy và số chặn này khác với và ... Lệnh reg Y1 X1 23 Lệnh reg Y2 X2 Lệnh reg Y4 X4 Lệnh reg Y3 X3 Phân biệt sai số ngẫu nhiên và sai số hệ thống% B (sai)% % A (đúng)% % oo oo oo oo oo oo oo oo o May rủi% oo oooo oooooooooo oooooooooooooooooooooooo oooooooooo oooo oo Sai số% hệ thống% 80% mmHg% 90% 24 Khái niệm về nhiễu% Sai số ngẫu nhiên và sai số hệ thống% Mc l thuc Insulin ** **** ** Tỡnh trng sng sút Cú 326 253 Cht... 7,0 7,5 8,0 8,5 9,0 Tần số 1 2 2 4 5 5 4 4 3 4 1 1 12 * Ước lượng khoảng% Ví dụ phân bố chuẩn% + Với biến định lượng: ố 29% Frequency + Với biến định tính: ố à = X Z / 2 s n P = p Z / 2 p.(1 p) n + Công thức tổng quát: Tham số quần thể = tham số mẫu Z/2.SE SE (Sai số chuẩn) = độ lệch chuẩn của các trung bình mẫu 0% 709% bwt 4990% Ước lượng khoảng còn dùng với nhiều tham số mẫu khác như OR, RR,... (zero) thì tương quan càng nhỏ ! Khi r = 0, hai biến không có sự tương quan tuyến tính (nhưng có thể có tương quan dạng khác).! r là hệ số tương quan xác định từ mẫu, trong khi hệ số tương quan của quần thể là rho () ! 4.4 Hệ số tương quan và hệ số xác định: r = r2 Tham số mẫu:,% = n2 =r 2 1 r 2 (1 r ) (n 2) % r Tra bảng t-student với độ tự do = n - 2 và tư ơng ứng % Kết luận: Nếu t tính từ công... được phân bố chuẩn! ỉChúng có cùng giá trị phương sai! ỉGiá trị trung bình của các tập hợp này phải nằm trên 1 đường thẳng (chính là đường hồi quy)! Các giá trị y là độc lập với nhau, tức là không phụ thuộc vào các giá trị khác nhau của x.% 21 4.2 Một số đặc tính của hệ số tư ơng quan (r): 4 Hệ số tương quan (r) Chỉ áp dụng với 2 biến định lượng có quan hệ nhân quả, tuy nhiên không cần biết biến . thập số liệu cho các biến số này Đối lập với biến số là các hằng số 2 Phân loại theo bản chất của biến số Biến định l"ợng Biến định tính Biến liên tục Biến rời rạc Biến tỷ suất Biến. 6%Nùng% 12%Tày% 4%Kinh% Tần số% Đếm số lần xuất hiện% Giá trị biến% 1.2. Tỷ số (ratio):% Là phân số mà mẫu số không bao hàm tử số % Tử số và mẫu số có thể khác nhau về đơn vị đo l!ờng % Hệ số k có thể là. 1 Đại c#ơng về Mục tiêu, Biến số và Phân tích số liệu% L!u Ngọc Hoạt Vin YHDP và YTCC, ĐH Y Hà Nội MT c th: ! Xỏc nh t l cao HA ca ngi