Introduction to Biostatistics Data Collection Descriptive Statistics Gs, TS LÊ HOÀNG NINH Thống kê mô tả Căn Bản về sinh thống kê Nội dung cần phân biệt • Distinguish between different strategies for[.]
Căn Bản sinh thống kê Thống kê mô tả Gs, TS LÊ HOÀNG NINH Nội dung cần phân biệt • Distinguish between different strategies for obtaining a sample from a population • Understand the measures of central tendency and variability in your data Thống kê mô tả suy lý Thống kê mô tả: dùng số để tổ chức, biểu thị liệu từ mẫu Thống kê suy lý: có kết luận từ thơng tin chưa hồn chi3ng, nghĩa tổng qt hóa kết từ mẫu lên quần thể Inferential statistics use available information in a sample to draw inferences about the population from which the sample was selected Quần thể lý thuyết Sample 1: Representative? Y N Sample 2: Representative? Y N Sample 3: Representative? Y N Cách lấy mẫu • Convenience Sampling: select the most accessible and available subjects in target population Inexpensive, less time consuming, but sample is nearly always non-representative of target population • Random Sampling (Simple): select subjects at random from the target population Need to identify all in target population first Provides representative sample frequently Cách lấy mẫu • Systematic Sampling: Identify all in target population, and select every xth person as a subject • Stratified Sampling: Identify important subgroups in your target population Sample from these groups randomly or by convenience Ensures that important sub-groups are included in sample May not be representative • More complex sampling Sai lầm lấy mẫu • Có khác biệt trị số mẫu ( số thống kê) trị số thật quần thể ( tham số) • Xảy nghiên cứu • Sampling error approximates / √n • Note that larger sample sizes also require time and expense to obtain, and that large sample sizes not eliminate sampling error Research Process Research question Hypothesis Identify research design Data collection Presentation of data Data analysis Interpretation of data Types of Data Collection • Surveys/Questionnaires – Self-report – Interviewer-administered – proxy • Direct medical examination • Direct measurement (e.g blood draws) • Administrative records Understanding and Presenting Data 10 Bảng tần số Bây giờ, bạn trình bày bảng phân phối tần số nghiên cứu tuổi bệnh nhân bị bệnh tim mạch nhập viện khoa tim mạch bệnh viện thành phố Dữ liệu sau thu thập mẫu ngẫu nhiên 30 bệnh nhân phòng khám tim mạch bệnh viện 42, 38, 51, 53, 40, 68, 62, 36, 32, 45, 51, 67, 53, 59, 47, 63, 52, 64, 61, 43, 56, 58, 66, 54, 56, 52, 40, 55, 72, 69 17 Nhóm tuổi Tần số 32 -36 yr 37- 41 yr 42-46 yr 47-51 yr 52-56 yr 57-61 yr 62-66 yr 67-72 yr Tổng n=30 Tần số tương đối 2/30=0.067 3/30=0.100 4/30=0.134 3/30=0.100 8/30=0.267 3/30=0.100 4/30=0.134 3/30=0.100 18 Đa giác tần số • Giúp nhận phân phối liệu Frequency Female Male 20- 30- 40- 50- 60-69 Age in years 19 Bảng báo y học Mô tả dân số nghiên cứu bảng tần số Tên bảng… Tên biến số (đơn vị biến số) Tần số (n) % Số trung bình (SD) - Loại Tổng 20 Các số đo khuynh hướng trung tâm Các số đo? Trung bình(Mean) Trung vị (Median) (Mode) 21 Trung bình mẫu Trung bình số học tổng tất trị số đo mẫu chia cho số khảo sát Thí dụ thu nhập hàng tháng hộ gia đình ( ngàn đồng) sau, 6000, 10,000, 10,000, 14000, 50,000 số trung bình là: 18 triệu 6000 + 10000 + 10000 + 14000 + 50000 X= = 18000 22 Trung vị (Median) Liệt kê liệu từ trị số thấp trị số cao nhất.số trung vị trị số đứng dãy trị số liệu Thí dụ thu nhập hộ gia đình liệt kê sau ( đơn vị ngàn đồng): 6,000 10,000 10,000 14,000 50,000 Trị số trung vị 10.000.000 ( 10 triệu ) 23 Mode • Là trị số có tần số cao • Có thể có nhiều mode liệu 24 Số đo vị trí khơng trung tâm Measures of non-central locations •Tứ phân vị •Bách phân vị 25