Bài giảng cung cấp cho người học các kiến thức: Sinh thống kê, thuật ngữ chuyên ngành, khảo sát đo đạt, giá trị các đối tượng, biến số độc lập, biến số phụ thuộc,... Hi vọng đây sẽ là một tài liệu hữu ích dành cho các bạn sinh viên đang theo học môn dùng làm tài liệu học tập và nghiên cứu. Mời các bạn cùng tham khảo chi tiết nội dung tài liệu.
Sinh thống kê GS TS Lê Hồng Ninh © 2006 Dịnh nghỉa số thuật ngữ sinh thống kê • Dữ liệu: – Số đo hay quan sát biến số • Biến số: – Đặc trưng khảo sát đo đạt – Có thể có nhiều trị số khác từ đối tượng nầy đến đối tượng khác Evidence-based Chiropractic © 2006 Định nghĩa từ dùng thống kê • Biến số độc lập – Có trước biến số phụ thuộc; nguyên/ nguyên nhân hệ – Thuốc -> ung thư phổi – Thuốc A -> khỏi bệnh • Biến số phụ thuộc: – Số đo hệ quả,/ kết – Trị số phụ thuộc biến độc lập Evidence-based Chiropractic © 2006 Từ … • Tham số (Parameters) – Dữ liệu/ số đo quần thể (Summary data from a population) • Số thống kê (Statistics) – Dữ liệu/ số đo mẫu (Summary data from a sample) Evidence-based Chiropractic © 2006 Quần thể • Quần thể tập hợp cá thể mà mẫu lấy – e.g., headache patients in a chiropractic office; automobile crash victims in an emergency room • Trong nghiên cứu, khơng thể đo đạt khảo sát tồn quần thể • Do cần phải lấy mẫu ( tổ hợp quần th) Evidence-based Chiropractic â2006 Mu ngu nhiờn Cỏc đối tượng lấy từ quần thể để cho cá thể có hội chọn • Mẫu ngẫu nhiên đại diện cho quần thể • Mẫu khơng ngẫu nhiên khơng đại diện – May be biased regarding age, severity of the condition, socioeconomic status etc Evidence-based Chiropractic © 2006 Mẫu ngẫu nhiên • Mẫu ngẫu nhiên có nghiên cứu chăm sóc bệnh nhân • Thay vào đó, dùng phân phối ngẫu nhiên vào nhóm điều trị nhóm chứng – Each person has an equal chance of being assigned to either of the groups • Phân phối ngẫu nhiên vào nhóm = randomization Evidence-based Chiropractic © 2006 Thống kê mơ tả (DSs) • Cách tóm tắt liệu • Minh họa liệu = shape, central tendency, and variability of a set of data – The shape of data has to with the frequencies of the values of observations Evidence-based Chiropractic © 2006 Thống kê mô tả – Khuynh hướng trung tâm : vị trí liệu – Khuynh hướng biến thiên: trị số phía , phía trị số trung tâm • Dispersion • Thống kê mơ tả khác biệt với thống kê suy lý – Thống kê mô tả kiểm định giả thuyết Evidence-based Chiropractic â2006 MT B D LiU Distribution provides a summary of: – Frequencies of each of the values • • • • • • 2–3 3–4 4–3 5–1 6–1 7–2 etc – Ranges of values • Lowest = • Highest = Evidence-based Chiropractic 10 Case # 10 11 12 13 14 Visits 2 © 2006 Phân phối lệch Skewed distributions • Because the mean is shifted so much, it is not the best estimate of the average score for skewed distributions • The median is a better estimate of the center of skewed distributions – It will be the central point of any distribution – 50% of the values are above and 50% below the median Evidence-based Chiropractic 34 © 2006 Những tính chất đường cong bình thường • About 68.3% of the area under a normal curve is within one standard deviation (SD) of the mean • About 95.5% is within two SDs • About 99.7% is within three SDs Evidence-based Chiropractic 35 © 2006 More properties of normal curves (cont.) Evidence-based Chiropractic 36 © 2006 Độ lệch chuẩn (SD) • SD is a measure of the variability of a set of data • The mean represents the average of a group of scores, with some of the scores being above the mean and some below – This range of scores is referred to as variability or spread • Variance (S2) is another measure of spread Evidence-based Chiropractic 37 â2006 SD (cont.) In effect, SD is the average amount of spread in a distribution of scores • The next slide is a group of 10 patients whose mean age is 40 years – Some are older than 40 and some younger Evidence-based Chiropractic 38 © 2006 SD (cont.) Ages Agesare arespread spread out outalong alongan anXXaxis axis The Theamount amountages agesare are spread spreadout outisisknown knownas as dispersion dispersionor orspread spread Evidence-based Chiropractic 39 © 2006 Distances ages deviate above and below the mean Etc Adding Addingdeviations deviations always alwaysequals equalszero zero Evidence-based Chiropractic 40 â2006 Calculating S2 To find the average, one would normally total the scores above and below the mean, add them together, and then divide by the number of values • However, the total always equals zero – Values must first be squared, which cancels the negative signs Evidence-based Chiropractic 41 © 2006 Calculating S2 cont SS22isisnot notininthe the same sameunits units(age), (age), but butSD SDisis Symbol Symbolfor forSD SDof ofaasample sample for foraapopulation population Evidence-based Chiropractic 42 © 2006 Wide spread results in higher SDs narrow spread in lower SDs Evidence-based Chiropractic 43 © 2006 Spread is important when comparing or more group means It is more difficult to see a clear distinction between groups in the upper example because the spread is wider, even though the means are the same Evidence-based Chiropractic 44 © 2006 z-scores • The number of SDs that a specific score is above or below the mean in a distribution • Raw scores can be converted to z-scores by subtracting the mean from the raw score then dividing the difference by the SD X z Evidence-based Chiropractic 45 © 2006 z-scores (cont.) • Standardization – The process of converting raw to z-scores – The resulting distribution of z-scores will always have a mean of zero, a SD of one, and an area under the curve equal to one • The proportion of scores that are higher or lower than a specific z-score can be determined by referring to a z-table Evidence-based Chiropractic 46 © 2006 z-scores (cont.) Refer Referto toaaz-table z-table to tofind findproportion proportion under underthe thecurve curve Evidence-based Chiropractic 47 © 2006 Partial ztable (to z = 1.5) showing proportions of the z-scores (cont.) area under a normal curve for different values of z Z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.0 0.5000 0.5040 0.5080 0.5120 0.5160 0.5199 0.5239 0.5279 0.5319 0.1 0.5398 0.5438 0.5478 0.5517 0.5557 0.2 0.5793 0.5832 0.5871 0.5910 0.3 0.6179 0.6217 0.6255 0.6293 0.5596 0.5636 0.5675 0.5714 0.5753 Corresponds to the area Corresponds to the0.6103 area0.6141 0.5948 0.5987 0.6026 0.6064 under the0.6406 curve in black curve 0.6331under 0.6368 the 0.6443in black 0.6480 0.6517 0.4 0.6554 0.6591 0.6628 0.6664 0.6700 0.6736 0.6772 0.6808 0.6844 0.6879 0.5 0.6915 0.6950 0.6985 0.7019 0.7054 0.7088 0.7123 0.7157 0.7190 0.7224 0.6 0.7257 0.7291 0.7324 0.7357 0.7389 0.7422 0.7454 0.7486 0.7517 0.7549 0.7 0.7580 0.7611 0.7642 0.7673 0.7704 0.7734 0.7764 0.7794 0.7823 0.7852 0.8 0.7881 0.7910 0.7939 0.7967 0.7995 0.8023 0.8051 0.8078 0.8106 0.8133 0.9 0.8159 0.8186 0.8212 0.8238 0.8264 0.8289 0.8315 0.8340 0.8365 0.8389 1.0 0.8413 0.8438 0.8461 0.8485 0.8508 0.8531 0.8554 0.8577 0.8599 0.8621 1.1 0.8643 0.8665 0.8686 0.8708 0.8729 0.8749 0.8770 0.8790 0.8810 0.8830 1.2 0.8849 0.8869 0.8888 0.8907 0.8925 0.8944 0.8962 0.8980 0.8997 0.9015 1.3 0.9032 0.9049 0.9066 0.9082 0.9099 0.9115 0.9131 0.9147 0.9162 0.9177 1.4 0.9192 0.9207 0.9222 0.9236 0.9251 0.9265 0.9279 0.9292 0.9306 0.9319 0.9357 0.9370 0.9382 48 0.9394 0.9406 0.9418 0.9429 0.9441 0.9332 0.9332 0.9345 0.9332 Evidence-based Chiropractic 1.5 0.09 0.5359 © 2006 ... © 2006 Thống kê mô tả – Khuynh hướng trung tâm : vị trí liệu – Khuynh hướng biến thiên: trị số phía , phía trị số trung tâm • Dispersion • Thống kê mơ tả khác biệt với thống kê suy lý – Thống kê. ..Dịnh nghỉa số thuật ngữ sinh thống kê • Dữ liệu: – Số đo hay quan sát biến số • Biến số: – Đặc trưng khảo sát đo đạt – Có thể... Từ … • Tham số (Parameters) – Dữ liệu/ số đo quần thể (Summary data from a population) • Số thống kê (Statistics) – Dữ liệu/ số đo mẫu (Summary data from a sample) Evidence-based Chiropractic