Phân tích số liệu thống kê trong nghiên cứu định lượng là một phần rất quan trọng, nó giúp chúng ta khái quát được các đặc trưng của mẫu, giúp xác định được ý nghĩa thống kê của các số liệu. Có thể nói đây là phần thể hiện rõ nhất giá trị khoa học của một nghiên cứu định lượng. Tuy nhiên đây cũng là một vấn đề khá phức tạp, nhất là với những cán bộ y tế không chuyên về nghiên cứu khoa học như chúng ta. Trong quá trình tìm hiểu, chúng tôi có hệ thống lại một số vấn đề cơ bản thường gặp về phân tích số liệu thống kê. Chúng tôi nêu ra đây mong có thể giúp được một số đồng nghiệp trong công việc cũng như rất mong nhận được sự trao đổi, góp ý của các anh chị.
B4 Phân tích liệu (1) Điểm số tốt đến mức độ nào? (2) Điểm số phân bố rộng hay hẹp? (1) Độ tập trung (2) Độ phân tán Mô tả liệu PHÂN TÍCH DỮ LIỆU So sánh liệu Xem xét khác biệt giá trị trung bình hai nhóm khác có ý nghĩa hay không ? Xem xét khác biệt giá trị trung bình nhóm có ý nghĩa hay không ? Đánh giá mức độ ảnh hưởng (ES) tác động thực nghiên cứu ? Liên hệ liệu Mức độ tương quan hai tập hợp điểm số nào? Xem xét khác biệt kết thuộc “miền” khác có ý nghĩa hay không ? Kết kiểm tra sau tác động có phụ thuộc vào kết kiểm tra trước tác động không? B4 Phân tích liệu Mô tả liệu * Mốt (Mode): giá trị có tần suất xuất nhiều tập hợp điểm số =Mode(number1, number 2, …) Độ tập trung * Trung vị (Median): điểm nằm vị trí tập hợp điểm số xếp theo thứ tự =Median(number1, number2, …) * Giá trị trung bình (Mean): giá trị trung bình cộng điểm số =Average(number1, number 2, …) Độ phân tán * Độ lệch chuẩn (SD): tham số thống kê cho biết mức độ phân tán điểm số xung quanh giá trị trung bình =Stdev(number1, number 2, …) Điểm xuất nhiều Điểm vị trí Điểm trung bình cộng Độ lệch chuẩn =Mode(H4:H18) =Median(H4:H18) =Average(H4:H18) =Stdev(H4:H18) =Mode(Q4:Q18 ) =Median(Q4:Q18) =Average(Q4:Q18 =Stdev(Q4:Q18) ) B14=Mode(B3:B12) F14=Mode(F3:F12) B15=Median(B3:B12) F15=Median(F3:F12) B16=Average(B3:B12) F16=Average(F3:F12) B17=Stdev(B3:B12) F17=Stdev(F3:F12) C14=Mode(C3:C12) G14=Mode(G3:G12) C15=Median(C3:C12) G15=Median(G3:G12) C16=Average(C3:C12) G16=Average(G3:G12) C17=Stdev(C3:C12) G17=Stdev(G3:G12) B4 Phân tích liệu So sánh liệu Xem xét khác biệt giá trị trung bình hai nhóm khác có ý nghĩa hay không ? Phép kiểm chứng Xem xét khác biệt giá trị trung bình nhóm có ý nghĩa hay không ? Phép kiểm chứng (theo cặp) t-test độc lập t-test phụ thuộc Đánh giá mức độ ảnh hưởng (ES) tác động thực nghiên cứu ? Độ chênh lệch giá trị trung bình chuẩn (SMD) Xem xét khác biệt kết thuộc “miền” khác có ý nghĩa hay không ? Phép kiểm chứng Khi bình phương So sánh liệu a Phép kiểm chứng t-test độc lập + Phép kiểm chứng t-test độc lập giúp xác định xem chênh lệch giá trị trung bình hai nhóm khác có khả xảy ngẫu nhiên hay không + Trong phép kiểm chứng t-test độc lập, tính giá trị p, đó: p xác suất xảy ngẫu nhiên p =ttest (array 1, array 2, tail, type) Giá trị p Giá trị trung bình nhóm ≤ 0,05 Chênh lệch CÓ ý nghĩa > 0,05 Chênh lệch KHÔNG có ý nghĩa Khi sử dụng công thức tính giá trị p phép kiểm chứng t-test độc lập: Array dãy điểm số Array dãy điểm số =ttest (array 1, array 2, tail, type) = 1: Giả thuyết có định hướng = 2: Giả thuyết định hướng 90% làm, giá trị = 2: Biến (độ lệch chuẩn nhau) = 3: Biến không a Phép kiểm chứng t-test độc lập Phép kiểm chứng t-test độc lập cho biết ý nghĩa Ví dụ: tập hợp điểm kiểm tra nhóm chênh lệch giá trị trung bình kết kiểm tra nhóm thực nghiệm với nhóm đối chứng có xảy ngẫu nhiên hay không ? =TTEST(H4:H18,Q4:Q18,2,3) P=0,012 Có ý nghĩa => Nghĩa kết kiểm tra nhóm thực nghiệm với nhóm đối chứng không xảy ngẫu nhiên Phép kiểm chứng t-test độc lập cho biết ý nghĩa chênh lệch giá trị trung bình kết kiểm tra nhóm thực nghiệm với nhóm đối chứng có xảy ngẫu nhiên hay không ? P=0,4568594 > 0,05 => Không ý nghĩa => Nghĩa kết kiểm tra nhóm thực nghiệm với nhóm đối chứng có xảy ngẫu nhiên P=0,0138827 < 0,05 => có ý nghĩa => Nghĩa kết kiểm tra nhóm thực nghiệm với nhóm đối chứng không xảy ngẫu nhiên =TTEST(B3:B12,F3:F12,1,3) =TTEST(C3:C12,G3:G12,1,3) So sánh liệu b Phép kiểm chứng t-test phụ thuộc (theo cặp) Phép kiểm chứng t-test phụ thuộc so sánh giá trị trung bình hai kiểm tra khác nhóm có ý nghĩa hay không p=ttest (array 1, array 2, tail, type) Giá trị p Giá trị trung bình nhóm ≤ 0,05 Chênh lệch CÓ ý nghĩa > 0,05 Chênh lệch KHÔNG có ý nghĩa 10 c Mức độ ảnh hưởng (ES) SMD = Giá trị TB Nhóm thực nghiệm – Giá trị TB nhóm đối chứng Độ lệch chuẩn Nhóm đối chứng Giá trị SMD > 1,00 0,80 – 1,00 0,50 – 0,79 0,20 – 0,49 < 0,20 Mức độ ảnh hưởng Rất lớn Lớn Trung bình Nhỏ Rất nhỏ SMD KT sau tác động = 23.87 – 18.33 6.90 = 0.801 Kết luận: Mức độ ảnh hưởng lớn c Mức độ ảnh hưởng (ES) SMD KT sau tác động = 6.30 – 4.70 1.49 = 1.0706394 Kết luận: Mức độ ảnh hưởng lớn So sánh liệu d Phép kiểm chứng Khi bình phương (Chi-square test) Đối với liệu rời rạc Chúng ta sử dụng phép kiểm chứng Khi bình phương để đánh giá liệu chênh lệch có khả xảy ngẫu nhiên hay không Ví dụ : Nhóm thực nghiệm Đỗ 108 Trượt 42 Nhóm đối chứng 17 38 18 So sánh liệu d Phép kiểm chứng Khi bình phương (Chi-square test) Phép kiểm chứng Khi bình phương xem xét khác biệt kết thuộc “miền” khác có ý nghĩa hay không ? Đỗ Trượt Nhóm thực nghiệm 108 42 Nhóm đối chứng 17 38 Nhóm Miền Sự khác biệt KQ đỗ/trượt hai nhóm có ý nghĩa hay không? 19 So sánh liệu d Phép kiểm chứng Khi bình phương (Chi-square test) Chúng ta tính giá trị Khi bình phương giá trị p (xác suất xảy ngẫu nhiên) công cụ tính Khi bình phương theo địa chỉ: http://people.ku.edu/~preacher/chisq/chisq.htm Giá trị Khi bình phương Mức độ tự Giá trị p 20 So sánh liệu d Phép kiểm chứng Khi bình phương (Chi-square test) Nhập liệu ấn nút “Calculate” (Tính) Giá trị Khi bình phương Mức độ tự Giá trị p Các kết xuất hiện! 21 So sánh liệu d Phép kiểm chứng Khi bình phương (Chi-square test) Giải thích Khi bình phương Mức độ tự Giá trị p Đỗ Trượt Tổng Nhóm thực nghiệm 108 42 150 Nhóm đối chứng 17 38 55 Tổng 125 38 205 p = x 10-8 = 0,00000009 < 0,001 => Chênh lệch KQ đỗ/trượt có ý nghĩa => Các liệu không xảy ngẫu nhiên KQ thu tác động 22 Liên hệ liệu Để xem xét mối liên hệ liệu nhóm sử dụng hệ số tương quan Pearson (r) Khi nhóm đo với kiểm tra làm kiểm tra lần, cần xác định: + Mức độ tương quan kết kiểm tra nào? Hoặc + Kết kiểm tra sau tác động có phụ thuộc vào kết trước tác động hay không ? Hệ số tương quan r = correl(array1,array2) Giá trị r < 0,1 0,1 – 0,3 0,3 – 0,5 0,5 – 0,7 0,7 – 0,9 0,9 - Mức độ tương quan Rất nhỏ Nhỏ Trung bình Lớn Rất lớn Gần hoàn toàn 24 Trong nhóm đối chứng, kết KT trước tác động kết KT sau tác động có r=0.9409 => KL tương quan KT gần hoàn toàn Trong nhóm thực nghiệm, kết KT trước tác động kết KT sau tác động có r = 0.883769 => KL tương quan KT lớn => KL nhóm sau : HS có kết cao KT trước tác động đạt kết cao KT sau tác động =Correl(B3:B12,C3:C12) =Correl(F3:F12,G3:G12) 25 So sánh liệu: Bảng tổng hợp Công cụ thống kê Mục đích a Phép kiểm chứng t-test độc lập Xem xét khác biệt giá trị trung bình hai nhóm khác có ý nghĩa hay không b Phép kiểm chứng t-test phụ thuộc (theo cặp) Xem xét khác biệt giá trị trung bình nhóm có ý nghĩa hay không c Độ chênh lệch giá Đánh giá mức độ ảnh hưởng trị trung bình (ES) tác động thực chuẩn (SMD) nghiên cứu d Phép kiểm chứng Khi bình phương Xem xét khác biệt kết thuộc “miền” khác có ý nghĩa hay không 26 Thống kê thiết kế nghiên cứu Thiết kế nghiên cứu thống kê có liên quan mật thiết với Thiết kế nghiên cứu hàm chứa kỹ thuật thống kê sử dụng nghiên cứu 27 Thống kê Thiết kế nghiên cứu KT trước tác động Nhóm thực nghiệm: G1 Nhóm đối chứng: G2 O1 O2 Phép kiểm chứng t-test độc lập, Mức độ ảnh hưởng Tác động X - KT sau tác động O3 Phép kiểm chứng t-test phụ thuộc, Mức độ ảnh hưởng, Hệ số tương quan O4 Phép kiểm chứng t-test phụ thuộc, Hệ số tương quan Phép kiểm chứng t-test độc lập, Mức độ ảnh hưởng Không thể sử dụng hệ số tương quan (r) đây, sao? Bài tập Làm thực hành tính toán – Tổng hợp 29