Số liệu: Kết quả của việc thu thập có hệ thống các đại lượng và đặc tính của các đối tượng Thông tin: Số liệu đã được phân tích Kiến thức: thông tin được lí giải và được sử dụng để trả
Trang 1Phương pháp nghiên cứu khoa học
Mục tiêu:
- Mô tả được các đặc tính của một nghiên cứu khoa học
- Trình bày được các đặc tính của một nghiên cứu khoa học tốt
Nghiên cứu khoa học là gì:
Nghiên cứu là công việc tìm kiếm một cách có hệ thống các kiến thức mới, dựa trên sự tò
mò và nhu cầu được cảm nhận.1[1]
Như vậy đặc điểm của nghiên cứu là tìm ra kiến thức mới Có hai phương pháp chính để tìm kiếm kiến thức: hoặc là xem xét các tài liệu, kiến thức sẵn có để tìm ra các kiến thức mới (scholarship) hay dựa vào thực tế khách quan để phát hiện các kiến thức và hiểu biết mới (scientific research) Phương pháp dựa vào thực tế khách quan để tìm tòi các kiến thức mới được gọi là nghiên cứu khoa học.2[2]
Nghiên cứu khoa học là việc thu thập, phân tích và lí giải số liệu để giải quyết một vấn đề hay trả lời một câu hỏi (Theo Varkevisser và cộng sự, 1991)
Nói cách khác, nghiên cứu khoa học phải bao gồm các bước thu thập số liệu trên thực địa (hay từ các ca bệnh trong bệnh viện hay phòng thí nghiệm), phân tích số liệu để có thông tin và và trình bày các thông tin này trong phần kết quả và trong phần bàn luận và kiến nghị, lí giải các thông tin đó đề trả lời cho câu hỏi nghiên cứu hay đề xuất các biện pháp giải quyết vấn đề
Số liệu: Kết quả của việc thu thập có hệ thống các đại lượng và đặc tính của các đối tượng
Thông tin: Số liệu đã được phân tích
Kiến thức: thông tin được lí giải và được sử dụng để trả lời câu hỏi hay giải quyết một vấn đề nào đó
Nhưng để quá trình thu thập, phân tích và lí giải số liệu diễn ra tốt đẹp và giải quyết được vấn đề nghiên cứu, trước đó nhà nghiên cứu phải phân tích từ vấn đề, xem những kiến thức gì đã biết và còn chưa biết về vấn đề đó Quá trình này được gọi là đặt vấn đề, tổng quan y văn Sau đó nhà nghiên cứu phải xác định hỏi để có được kiến thức còn chưa biết
đó, cần những thông tin gì và để có những thông tin này cần thu thập những đại lượng và tính chất nào của đối tượng Đây là nội dung của phần phương pháp nghiên cứu trong đề cương nghiên cứu hay báo cáo khoa học Sau khi đã thu thập được số liệu (đại lượng hay tính chất của các đối tượng nghiên cứu), kết quả của phân tích số liệu (thông tin) được trình bày trong phần kết quả nghiên cứu Ở phần bàn luận, tác giả sẽ đánh giá xem các thông tin có trả lời được câu hỏi nghiên cứu hay không và câu trả lời của câu hỏi nghiên
1[1] Last JM A dictionary of Epidemiology NewYork: International epidemiology association 1997; 146
2[2] Varkevisser C, Pathmanathan I, Brownlee A Designing and conductiong health system
research projects IDRC, Ottawa 1991
Trang 2cứu chính nhằm giúp giải quyết vấn đề nghiên cứu là kiến thức mới được tạo ra
Như vậy, một báo cáo khoa học sẽ gồm các phần chính: 1) Đặt vấn đề và mục tiêu nghiên cứu 2) Tổng quan tài liệu 3) Phương pháp và đối tượng 4) Kết quả nghiên cứu 5) Bàn luận và 6) Kết luận
Các đặc điểm của một nghiên cứu khoa học tốt
Một nghiên cứu khoa học tốt có các đặc điếm sau:
- Phải tập trung vào các vấn đề ưu tiên trong chăm sóc y tế
- Phải có tính định hướng vào hành động và đề ra các giải pháp
- Phải có tính thời sự: kết quả phải có kịp thời để đưa ra các quyết định đúng đắn
- Thiết kế nghiên cứu đơn giản và thực hiện trong thời gian ngắn
- Nên có tính chất chi phí - hiệu quả Tốt nhất nếu nghiên cứu được tiến hành với chi phí thấp và do các nhân viên, cán bộ y tế thực hiện cùng với công việc hàng ngày
- Kết quả phải được trình bày theo hình thức hữu dụng cho các nhà quản lí, nhà hoạch định chính sách và cộng đồng: Cần có tóm tắt những kết quả chủ yếu của nghiên cứu và nêu bật những điểm lí thú cho đối tượng của bản báo cáo Dựa theo kết quả có thể trình bày giải pháp để giải quyết một vấn đề và so sánh ưu khuyết điểm của việc tiến hành giải pháp và không tiến hành giải pháp
- Nghiên cứu cần phải được đánh giá không chỉ dựa vào số các bài báo được xuất bản mà cần phải xem xét sự ảnh hưởng của nó đến chính sách y tế hay thay đổi cung cách phục vụ và cuối cùng là tác động lên sức khoẻ người dân
Đối với nghiên cứu y tế công cộng cần phải đặt them hai đặc điểm sau:
- Sẽ tốt hơn nếu có sự tham gia của nhiều ngành, nhiều khoa
- Nghiên cứu cần có tính chất tham gia của mọi thành viên có liên quan trong tất
cả các bước của quá trình tiến hành nghiên cứu
Trang 3Ðại cương về thống kê và thống kê mô tả
Thí dụ: Khi tôi quan sát giới tính của các học viên trong lớp, tôi có số liệu là:
Nam, nam, nữ, nữ, nữ, nam, nữ, v.v
Thí dụ: Một nhà nghiên cứu đo nồng độ hemoglobin của 70 thai phụ có kết quả như sau:
và những con số này được gọi là số liệu
Cần lưu ý số liệu phải liên kết với một biến số nhất định Nếu tôi quan sát giới tính ở người này, tuổi của người khác, quần áo của một người khác nữa thì kết quả quan sát được không phải là số liệu
Biến số và các loại biến số
Biến số là những đại lượng hay những đặc tính có thể thay đổi từ người này sang người khác hay từ thời điểm này sang thời điểm khác
Như vậy biến số có thể thể hiện đại lượng hay đặc tính
- Nếu biến số thể hiện một đại lượng nó được gọi là biến số định lượng (quantitative variable) Biến số định lượng có thể còn được chia thành biến số tỉ số - ratio variable(có giá trị không tuyệt đối) và biến số khoảng – interval variable (không có giá trị không tuyệt đố)
- Nếu biến số nhằm thể hiện một đặc tính, biến số được gọi là biến số định tính Biến số định tính còn được chia làm 3 loại:
- Biến số nhị giá – binary variable (khi chỉ có 2 giá trị)
- Biến số danh định – nominal variable (khi có 3 hay nhiều hơn các giá trị
và các bản thân các giá trị không có tính chất thứ tụ)
- Biến số thứ tự - ordinal variable (khi có 3 hay nhiều hơn các giá trị và các bản thân các giá trị có tính chất thứ tự
- Ngoài ra có khi biến cố không chỉ được quan tâm về phương diện nó có xảy ra hay chưa xảy ra mà còn được quan tâm về phương diện biến cố xảy ra vào lúc nào Thí
dụ sau khi điều trị bệnh nhân ung thư chúng ta không chỉ quan tâm bệnh nhân có tử vong hay không mà còn quan tâm bệnh nhân bệnh nhân tử vong bao nhiêu lâu sau khi điều trị
và nếu bệnh nhân chưa tử vong, bệnh nhân đã sống được bao lâu
Trang 4Phương pháp mô tả tóm tắt và trình bày số liệu
-Tỉ lệ cho từng giá trị nếu
là biến thứ tự hay danh định
-Tỉ lệ cho giá trị tiêu biểu nếu là biến nhị giá
-Tỉ lệ cho từng giá trị nếu
là biến thứ tự hay danh định
-Tỉ lệ cho giá trị tiêu biểu nếu là biến nhị giá
Các số thống kê mô tả
Có hai loại thống kê mô tả: thống kê mô tả khuynh hướng tập trung và thống kê mô tả tính phân tán
Thống kê mô tả khuynh hướng tập trung
Thống kê mô tả khuynh hướng tập trung có thể là trung bình (mean), trung vị (median)
và yếu vị (mode) Những thống kê này cho biết giá trị tiêu biểu cho số liệu
Thí dụ: có hai loại thuốc hạ áp A và B Giả sử có 5 đối tượng sau khi sử dụng thuốc hạ áp A sẽ có huyết áp 110 - 115 -120 - 125 -130 và ở 5 đối tượng khác sau khi sử dụng thuốc hạ áp B sẽ có huyết áp 120 - 125 - 130 - 135 - 140 Con số tiêu biểu nhất để cho biết tác dụng của thuốc A là huyết áp trung bình sau khi sử dụng thuốc A và là 120 Con số huyết áp trung bình này thấp hơn huyết áp trung bình sau khi sử dụng thuốc B cho biết thuốc A có tác dụng mạnh hơn
Trung bình của số liệu, được kí hiệu là (x (đọc là x gạch) là tổng các giá trị của số liệu chia cho số lần quan sát (N)
Trang 5150125130125
Do bản chất của biến số danh định không thể sắp được theo thứ tự, chúng ta chỉ có thể tính trung vị của số liệu định lượng và số liệu của biến số thứ tự
Ngoài ra yếu vị (mode) cũng được sử dụng làm con số thống kê tiêu biểu Yếu vị là giá trị xuất hiện phổ biến nhất (có tần suất cao nhất)
Thí dụ: Số liệu về huyết áp tâm thu (mmHg) của 5 đối tượng là 120, 125, 130, 135, 150 Trong trường hợp này không có yếu vị
Ðiểm số của 5 học sinh là 5, 5, 6, 7, 9 Yếu vị của điểm số là 5
Trong một ấp có 361 gia đình người Kinh, 120 gia đình người Khmer và 27 gia đình người Hoa Yếu vị của biên số dân tộc là dân tộc Kinh
Trong một số liệu cụ thể, có thể không có yếu vị, có thể có một yếu vị hoặc hai hay nhiều yếu vị Ðây là khuyết điểm chính của số thống kê này Do vậy người ta thường chỉ dùng yếu vị cho biến số danh định hay trong các trường hợp đặc biệt
Có thể sử dụng trung bình, trung vị hay yếu vị cho biến số định lượng Khi biến số định lượng có phân phối bình thường (hình chuông) thì ba con số này xấp xỉ bằng nhau và khi
đó người ta thường tính trung bình bởi vì trung bình có những đặc tính toán học mạnh Tuy nhiên nếu số liệu bị lệch thì con số trung vị phản ánh giá trị tiêu biểu một cách chính xác hơn
Thí dụ: Bệnh nhân bị loét dạ dày - tá tràng được điều trị theo một phác đồ diệt vi khuẩn Helicobacter Sau điều trị, bệnh nhân được theo dõi và ghi nhận thời gian kể từ khi sử dụng thuốc đến lúc bắt đầu cải thiện triệu chứng đau Ở 10 bệnh nhân thời gian này (ngày ) là như sau: 1, 2, 2, 2, 2, 2, 3, 3, 3, 30 Bệnh nhân có thời gian từ lúc điều trị đến lúc giảm triệu chứng là 30 ngày trên thực chất là bệnh nhân không đáp ứng với điều trị Trung vị và trung bình của số liệu là 2 và 5 ngày Con số trung vị phản ánh chân thực hơn bởi vì với tư cách là một bác sĩ lâm sàng từ số liệu trên có thể nhận xét rằng một bệnh nhân tiêu biểu sẽ giảm đau sau 2 ngày dùng thuốc Con sôs 30 trong thí dụ trên được gọi
là số ngoại lai (outlier) và làm số liệu bị lệch Nhìn chung, khi số liệu bị lệch thì con số trung bình sẽ bị ảnh hưởng rất nhiều và không phản ánh giá trị tiêu biểu như con số trung vị.
Thống kê mô tả tính phân tán:
Có 3 thống kê mô tả tính phân tán: độ lệch chuẩn, khoảng tứ phân vị và phạm vi của số liệu Việc lựa chọn thống kê mô tả tính phân tán được trình bày trong bảng 2
Thống kê mô tả tính phân tán có tầm quan trọng thứ hai sau con số mô tả khuynh hướng tập trung
Thí dụ: Thuốc hạ áp A được sử dụng trên 5 bệnh nhân và huyết áp tâm thu sau khi dùng thuốc là
110, 115, 120, 125 và 130 Thuốc hạ áp B được sử dụng trên 5 bệnh nhân và có huyết áp sau sử
Trang 6dụng thuốc là 100, 110, 120, 130, 140 Như vậy hai thuốc hạ áp này có hiệu quả hạ áp là tương đương (bởi vì trung bình của hai số liệu là bằng nhau) nhưng kết quả của thuốc B phân tán hơn và điều này làm thuốc B trở nên kém an toàn
Ðộ lệch chuẩn (standard deviation - viết tắt là SD hay s) là con số đánh giá mức độ phân tán và được tính theo công thức:
Như vậy độ lệch chuẩn phản ánh khoảng cách trung bình của số liệu so với giá trị tiêu biểu Khái niệm độ lệch chuẩn chỉ có thể áp dụng cho biến số định lượng bởi vì chúng ta
có thể thực hiện các phép toán số học trên các đại lượng nhưng không thể thực hiện trên các giá trị của biến số định tính là các đặc tính
Thí dụ: Số liệu về huyết áp tâm thu (mmHg) của 5 đối tượng là 120, 125, 130, 135, 150 Trung bình của huyết áp là 132 và độ lệch chuẩn bằng
5,115,1324
5304
3249449144
15
)132150()132135()130132()132125()132120(
1
)(
2 2
2 2
2 1
2
=
=
=++++
=
−
−+
−+
−+
−+
Phương sai về mặt từ nguyên là bình phương của độ lệch chuẩn Phương sai (variance) có thể được kí hiệu và Var hay s2 và được tính theo công thức sau:
x x s
1
2 2
1
)(
Phạm vi của số liệu là tất cả các giá trị của số liệu từ giá trị nhỏ nhất đến giá trị lớn nhất
Thí dụ: Số liệu về huyết áp tâm thu (mmHg) của 5 đối tượng là 120, 125, 130, 135, 150 Phạm vi của biến số huyết áp là 120 đến 150
Thí dụ: Thuốc hạ áp A được sử dụng trên 5 bệnh nhân và huyết áp tâm thu sau khi dùng thuốc là
110, 115, 120, 125 và 130 Thuốc hạ áp B được sử dụng trên 5 bệnh nhân và có huyết áp sau sử dụng thuốc là 100, 110, 120, 130, 140 Số liệu của thuốc B có tính phân tán cao hơn do phạm vi thay đổi từ 100-140 trong khi đó phạm vị của số liệu thuốc A chỉ từ 110-130
Khoảng tứ phân vị (inter-quartile): Nếu chúng ta chia số liệu sắp theo thứ tự làm 2 phần đều nhau, khoảng tứ phân vị là khoảng cách của trung vị phần trên và trung vị phần dưới
Thí dụ: Số liệu về huyết áp tâm thu (mmHg) của 5 đối tượng là 120, 125, 130, 135, 150 Số liệu này được chia làm 2 phần: phần 1 gồm 120, 125, 130 và phần 2 gồm 130, 135, và 150 Trung vị của phần trên là 125 - trung vị của phần dưới là 135, do đó phạm tứ phân vị là 125-135
Do bản chất của khoảng tứ phân vị là trung vị của phần số liệu trên và phần số liệu dưới, cũng giống như trung vị, khoảng tứ phân vị không bị ảnh hưởng bởi các giá trị ngoại lai như trong trường hợp của độ lệch chuẩn Cũng như trung vị, khoảng tứ phân vị chỉ có thể
áp dụng cho biến số định lượng hay thứ tự
Câu hỏi: Phân tích trên máy tính về biến số hemoglobin cho kết quả sau Hãy thử đọc và
x x s
1
21)(
Trang 7Variable | Obs Mean Std Dev Min Max
-+ -
hemoglobin | 70 11.98429 1.416122 8.8 15.1
Phương pháp trình bày số liệu
Số liệu có thể được trình bày thành bảng hoặc các đồ thị
Trình bày bảng:
Phân phối tần suất của biến số định tính
Số liệu của biến số rời rạc có thể được trình bày dưới dạng một phân phối tần suất Phân phối tần suất là một bảng chỉ ra tần suất xuất hiện của từng giá trị rời rạc của biến số (Bảng 1) Như vậy bảng phân phối tần suất gồm 2 cột, một cột liệt kê các giá trị của biến
số và một cột trình bày tần suất tương ứng của các giá trị đó
Table 1 Phân phối giới tính của 69 học sinh lớp cơm thường trường mầm non 23 tháng 11, Huyện Hóc môn
Table 2 Phương pháp đỡ đẻ của 600 trẻ trong bệnh viện
Phân phối tần suất của biến số định lượng
Nếu biến số là biến số liên tục chúng ta không thể liệt kê tất cả các giá trị của biến số Trong trường hợp này chúng ta có thể nhóm (làm tròn) giá trị của biến số lại
Cụ thể các bước xây dựng bảng phân phối tần suất cho biến số định lượng như sau:
Trang 81- Tìm phạm vi (giá trị cực tiểu và giá trị cực đại) của số liệu Trong thí dụ về hemoglobin của 70 phụ nữ phạm vi là 8,8 đến 15,1
2 Chia phạm vi số liệu ra làm n khoảng với độ rộng của mỗi khoảng là d Cần lưu ý độ rộng mỗi khoảng d nên là đại lượng chẵn như 1, 2, 5, 10 hay 0,5, 0,2 và số các khoảng n nên từ 5-12 (trung bình là 7-8) Trong thí dụ trên ta có thể chia phạm vi ra làm 8khoảng với chiều rộng khoảng bằng 1 đơn vị Khi đó các khoảng là: 8-8,9; 9-9,9; 10-10,9; 11-11,9; 12-12,9; 13-13,9; 14-14,9; 15-15,9
3 Ðếm các giá trị thích hợp vào khoảng đã định trước
và cột phần trăm tích lũy (nếu thích hợp)
Table 3 Hemoglobin của 70 phụ nữ
Hemoglobin Tần suất Phần trăm Phần trăm tích lũy
Trang 9bảng phân phối tần suất của biến số (bảng 2)
Table 4 Phân phối số đo vòng cánh tay của 69 trẻ lớp cơm thường nhà trẻ 23 tháng 11, Hóc môn
Vòng cánh tay Tần suất Phần trăm Phần trăm tích lũy
13- <14 2 2.78 2.78
14- <15 31 43.06 45.83
15- <16 27 37.50 83.33
16- <17 9 12.50 95.83
17- <18 0 12.50 95.83
18- <19 2 2.78 98.61
19- <20 1 1.39 100.00
Biểu đồ và đồ thị
Số liệu cũng có thể được trình bày dưới dạng đồ thị hoặc biểu đồ Mặc dù không có ranh giới tuyệt đối hoàn toàn rõ rệt, nói chung đồ thị (graph) có tính chất toán học nhiều hơn, trong đó có trục hoành và trục tung còn biểu đồ (chart) là hình ảnh mang tính chất tượng trưng
Nếu biến số là biến rời rạc, có thể trình bày dưới dạng biểu đồ hình thanh (bar chart - hình 1) hoặc biểu đồ hình bánh (pie chart) Nếu biến số là biến liên tục, thì phân phối của biến số có thể trình bày dưới dạng tổ chức đồ (histogram - hình 2) hoặc đa giác tần suất
Hình thức của bảng
-Có tựa ngắn gọn và rõ ràng
-Ðặt tên cho các hàng và cột
-Trình bày tổng số của hàng và cột
-Ðịnh nghĩa các kí hiệu và chữ viết tắt ở dưới bảng
-Ghi nguồn số liệu ở dưới bảng
Biểu đồ hình thanh
Biểu đồ hình thang là biểu đồ nhằm mô tả sự phân bố của biến số rời rạc Biểu đồ hình thanh gồm có trục hoành trên đó xác định những giá trị của biến số Ứng với từng giá trị của biến số người ta vẽ các thanh có chiều cao tỉ lệ với tần suất của giá trị đó Cần lưu ý luôn luôn có khoảng trống giữa các thanh
Trang 10Hình 2 Phương pháp sinh của 600 trẻ sanh tại bệnh viện X trong năm 1998
Ðối với biến số thứ tự, điều cần lưu ý là các giá trị của biến số phải được sẵp xếp thứ tự theo trục hoành
Trang 11Đường âm đạo Mổ lấy thai
Hình 4 Tỉ suất lây truyền từ mẹ sang con ở những người mẹ bị nhiễm HIV theo điều trị hĩa dự phịng và phương pháp sinh (Nguồn: The European Mode of Delivery Collaboration, Lancet, 27/3/1999)
Trang 12Nữ 35%
Nam 65%
Hình 5 Biểu đồ hình bánh (pie chart) mơ tả phân bố giới tính của những học sinh trong trường mầm non 23/11, Hĩc mơn
Sinh thường
Sinh mổ Sinh
forceps
Hình 6 Biểu đồ hình bánh thể hiện phương pháp sinh của 600 đứa trẻ sinh tại bệnh viện X
Tổ chức đồ và đa giác tần suất
Tổ chức đồ (histogram) và đa giác tần suất (polyline) được dùng trong mơ tả phân bố của biến số liên tục Ðể vẽ tổ chức đồ, người ta chia biên độ của giá trị làm nhiều khoảng giá trị và tính tần suất của những khoảng giá trị đĩ Những khoảng giá trị này được biểu thị ở trên trục hồnh Ứng với mỗi khoảng giá trị người ta vẽ những hình chữ nhật cĩ diện tích
tỉ lệ với tần suất của khoảng giá trị đĩ Bởi vì các khoảng giá trị này nằm sát nhau trên trục hồnh, các hình chữ nhật của tổ chức đồ cũng thường nằm sát nhau
Trang 13Hình 8 Ða giác tần suất của hemoglobin của 70 phụ nữ
Ðể vẽ đa giác tần suất, người ta thường vẽ tổ chức đồ và nối các trung điểm của các cạnh trên của các hình chữ nhật Ða giác tần suất thường không đẹp như các tổ chức đồ nhưng
nó có ưu điểm là có thể vẽ nhiều đa giác tần suất trên cùng một đồ thị để dễ so sánh các phân phối của chúng
Trang 15Ðại cương về phân tích số liệu Phép ước lượng
Dân số và mẫu
Thông thường chúng ta không thể nghiên cứu toàn bộ dân số mà chúng ta quan tâm Chúng ta thường chỉ có thể nghiên cứu chỉ một phần dân số đó, phần này được gọi là mẫu (sample) và từ đó ước đoán về những đặc tính của dân số
Trong nghiên cứu khoa học, chúng ta đi từ đặc trưng của cá thể (biến số - variable) để có được đặc trưng của mẫu (được gọi là thống kê - statistics) và từ đặc trưng của mẫu chúng
ta sử dụng phương pháp suy luận thống kê và lí giải để có được đặc trưng của dân số (được gọi là tham số - parameter)
Một loại mẫu thường được gặp trong nghiên cứu là mẫu ngẫu nhiên đơn Khi lấy mẫu ngẫu nhiên đơn, chúng ta có thể tính được giá trị trung bình và độ lệch chuẩn của mẫu
Rõ ràng là giá trị trung bình và độ lệch chuẩn sẽ khác nhau với những mẫu khác nhau Tuy vậy các nhà thống kê đã chứng minh rằng giá trị trung bình của mẫu sẽ có phân phối bình thường và các giá trị trung bình này sẽ tập trung tại trung bình của dân số Do đó nếu chúng ta tính trung bình của mẫu thì chúng ta hi vọng trung bình của dân số sẽ nằm ngay tại hay ở lân cận trung bình của mẫu Ðộ phân tán của trung bình mẫu xung quanh chung bình dân số được gọi là sai số chuẩn (standard error) và sẽ giảm đi khi cỡ mẫu càng lớn:
n
s n
s e
s
2
Ước lượng khoảng tin cậy của trung bình
Như chúng ta đã trình bày, trung bình của mẫu sẽ dao động nhưng tập trung tại giá trị trung bình của dân số, nên chúng ta có thể ước lượng trung bình dân số bằng cách tính trung bình của mẫu
Nhưng do trung bình mẫu có dao động, chúng ta không chắc là trung bình mẫu sẽ chính xác bằng trung bình của dân số mà chỉ có thể tin là trung bình dân số nằm ở vị trí đâu đó chung quanh trung bình của dân số Các nhà thống kê cho rằng 95% các trường hợp trung bình dân số không nằm xa quá 1,96 x SE so với trung bình mẫu: phạm vi này được gọi là khoảng tin cậy 95% Như vậy khoảng tin cậy 95% của trung bình của biến sô định lượng Khoảng tin cậy 95% (95% CI) : ⎯x ± 1,96s/√n
Trong trường hợp cỡ mẫu nhỏ (n < 30), chúng ta không thể sử dụng giá trị 1,96 như trong công thức trên mà cần phải sử dụng các giá trị hơi lớn hơn (và càng lớn nếu cỡ mẫu càng nhỏ), giá trị này được gọi là giá trị của phân phối t với (cỡ mẫu – 1) độ tự do
Trang 16Khoảng tin cậy 95% (95% CI) : ⎯x ± t(1-α/2) × s/√n
Bài tập:
1 Một nghiên cứu ghi nhận trên cỡ mẫu 1235 trẻ sơ sinh ở tỉnh Đồng Tháp cho thấy trọng lượng trung bình của trẻ sơ sinh là 3121 gram và độ lệch chuẩn là 435 gram Hãy ước lượng khoảng tin cậy 95% của trọng lượng trung bình của trẻ sơ sinh tỉnh Đồng Tháp
Sử dụng công thức trên ta tính được:
95%CI=164.87 - 164.87
Ước lượng khoảng tin cậy của tỉ lệ
Để ước lượng khoảng tin cậy của một tỉ lệ, chúng ta cần xác định tỉ lệ p sau đó dựa vào p
để ước lượng khoảng tin cậy 95% của p
n
)-
Một cách tổng quan hơn, khi chúng ta đưa ra giả thuyết chẩn đoán (thí dụ như chẩn đoán tắc ruột), chúng ta thường sẽ xem xét các hệ quả phổ biến giả thuyết này (Bệnh nhân tắc ruột thường bị đau bụng,nôn ói, bí trung tiện và chướng bụng) Việc không có một trong
Trang 17các hậu quả phổ biến của giả thuyết này (thí dụ như bệnh nhân không có đau bụng, không
có nôn ói, không bị bí trung tiện hay không có chướng bụng) thì chúng ta có thể bác bỏ chẩn đoán Các biến cố nằm ngoài các hệ quả phổ biến của giả thuyết (biến cố không có đau bụng, không có nôn ói, không bị bí trung tiện hay không có chướng bụng) được gọi
là miền bác bỏ của chẩn đoán
Trong kiểm định thống kê người ta cũng sử dụng các lập luận tương tự Để kiểm định một giả thuyết thống kê (được gọi là giả thuyết Ho) cần phải xác định miền xảy ra phổ biến của các con số thống kê (như trung bình, tỉ lệ, thống kê t, thống kê z, thống kê chi bình phương, v.v.) và nếu con số thống kê này nằm ngoài miền xảy ra phổ biến thì chúng
ta sẽ bác bỏ giả thuyết Ho Miền nằm ngoài miền xảy ra phổ biến của số thống kê được gọi miền bác bỏ
Hình Error! Bookmark not defined Nguyên tắc kiểm định ý nghĩa theo Fisher Đường cong phân phối hình chuông thể hiện phân phối của thống kê của z khi µ=0 (giả thuyết Ho) Vùng diện tích dưới đường cong màu trắng thể hiện miền các thống kê z thường xảy ra nếu giả thuyết Ho là đúng Vùng diện tích dưới đường cong màu sẫm là miền bác bỏ giả thuyết
Ho và có diện tích là xác suất sai lầm loại 1 (5%)
Khi sử dụng kiểm định ý nghĩa chúng ta cần lưu ý các điểm sau:
- Kiểm định dựa trên nguyên tắc phản chứng nghĩa là chúng ta chỉ có thể bác bỏ chứ không thể chứng minh được giả thuyết Ho Vì vậy nếu chúng ta muốn chứng minh hút thuốc lá là yếu tố nguy cơ của ung thư phổi thì phải đặt ra giả th.uyết thống kê Ho là hút thuốc lá không phải là yếu tố nguy cơ của ung thư phổi và sử dụng phương pháp kiểm định để bác bỏ điều này
- Giả thuyết Ho phải thể hiện bằng đẳng thức (thí dụ như giả thuyết Ho: RR=1 hay Ho: điểm trung bình về bệnh lây truyền qua đường tình dục ở nam thanh niên = điểm trung bình về bệnh lây truyền qua đường tình dục ở nữ thanh niên ) thì mới
có thể tính được phân phối của thống kê Giả thuyết Ho không thể thể hiện bằng
Trang 18bất đẳng thức (Ho: RR>1 là sai)
- Do diện tích miền bác bỏ là một con số cố định (thường là 0,05), để xác định con
số thống kê T cĩ nằm trong miền bác bỏ hay khơng người ta tính xác suất xảy ra thống kê cực đoan hơn giá trị T nếu giả thuyết Ho là đúng (được thể hiện bằng cơng thức: P (>T |Ho) ) Xác suất này được gọi là giá trị p Và nếu giá trị p nhỏ hơn ngưỡng bác bỏ nghĩa là thống kê T nằm trong vùng bác bỏ và chúng ta cĩ thể bác bỏ giả thuyết Ho
Giá trị p được kí hiệu khác nhau trên các phần mềm thống kê Thí dụ ở phần mềm Info, giá trị p được kí hiệu là p-value, ở phần mềm SPSS, giá trị p được kí hiệu là Sig Ở phần mềm Stata, các giá trị p thường được kí hiệu khác nhau tùy theo thống kê được sử dụng là thống kê gì Cụ thể, trong phần mềm Stata, giá trị p được kí hiệu như sau:
Epi-P > |T| (nếu kiểm định t)
P > |z| (nếu kiểm định z)
Prob > chi2 (kiểm định chi bình phương)
Prob > F (Kiểm định F; Kiểm định ANOVA)
Kiểm định giả thuyết
Khuyết điểm của phương pháp kiểm định ý nghĩa khi khơng bác bỏ được giả thuyết H0chúng ta khơng biết được xác suất H0 đúng là bao nhiêu Một nhà thống kê học khác tên
là Neyman đã đề ra phương pháp kiểm định giả thuyết trong đĩ cĩ xét đến sai lầm loại 2
Bác bỏ giả thuyết
Xác suất sai lầm loại 2 Không nhỏ
Nhỏ
Chấp nhận giả thuyết
Thực hiện nghiên cứu với cỡ mẫu lớn hơn
Không nhỏ tra bảng tính p
Sai lầm loại một và sai lầm loại hai
Sai lầm loại một: bác bỏ giả thuyết H0 trong khi giả thuyết H0 là đúng
Sai lầm loại hai: Khơng bác bỏ giả thuyết H0 trong khi giả thuyết H0 sai
Trong nghiên cứu thống kê người ta khơng bao giờ cĩ thể chắc chắn Do vậy, khi nhà nghiên cứu đi đến kết luận bác bỏ giả thuyết H0, người nghiên cứu cĩ thể bị sai lầm (sai lầm loại một - với một xác suất nào đĩ) Khi nhà nghiên cứu khơng bác bỏ giả thuyết H0,
Trang 19nhà nghiên cứu cũng có thể bị sai lầm (sai lầm loại hai - cũng với một xác suất nào đó) Một điều nên nhớ là bằng kiểm định thống kê người ta có thể xác định được xác suất sai lầm loại một nhưng không thể tính được xác suất sai lầm loại hai mà chỉ có thể tính được dựa vào đối thuyết Ha và cỡ mẫu của nghiên cứu
Ðôi khi người ta còn sử dụng khái niệm năng lực (power) của kiểm định thống kê Năng lực của kiểm định thống kê = 1 - xác suất sai lầm loại 2 Khái niệm năng lực của thống kê hay được dùng trong tính cỡ mẫu
Bảng Error! Bookmark not defined Tóm tắt về sai lầm loại 1, sai lầm loại 2 và giá trị
ngưỡng của nó
Chân lí là Ho đúng (Không có sự khác biệt)
Chân lí là Ha đúng (Không có sự khác biệt)
(Xác suất = α)
(Xác suất = 1-β =Power của nghiên cứu) Không bác bỏ giả thuyết H0 Kết luận đúng
(Xác suất = 1-α) Sai lầm loại II(Xác suất = β)
Chọn lựa kiểm định phù hợp
Như vậy nguyên lí của kiểm định ý nghĩa (hay kiểm định giả thuyết là như nhau) Các kiểm định chỉ khác nhau việc lựa chọn thống kê xuất phát từ giả thuyết H0. Việc lựa chọn này phụ thuộc vào biến số của vấn đề quan tâm và thiết kế của nghiên cứu
Bảng 10 Chọn lựa kiểm định phù hợp theo thiết kế nghiên cứu
Loại thiết kế nghiên cứu
Thang đo của biến số
phụ thuộc
Hai nhóm điều trị gồm các cá nhân khác nhau
Ba (hay nhiêù) nhóm điều trị gồm các
cá nhân khác nhau
Trước và sau một điều trị (hoặc 2 điều trị) ở trên cùng các đối tượng
Nhiều điều trị trên cùng các đối tượng
Liên hệ giữa hai biến số
Phân tích phương sai
t-test bắt cặp
Phân tích phương sai
đo lường lập lại
Hồi quy tuyến tính
và tương quan pearson Ðịnh tính - Danh định χ 2 bảng 2 x
n
χ 2 bảng 3 x
n
test McNemar
Cochrance
Q
Hệ số của bảng n x m (phi, OR, RR)
Trang 20Ðịnh tính -Thứ tự
(hay biến định lượng
không bình thường)
Kiểm định tổng sắp hạng Mann- Whitney
Wallis
Kruskal-Kiểm định sắp hạng có dấu Wilcoxon
Friedman hệ số tương
quan Spearman
Bảng 11 Chọn lựa kiểm định phù hợp để tìm sự liên hệ giữa biến độc lập và biến
phụ thuộc
Biến độc lập Biến phụ thuộc
Nhị giá Danh định (hoặc thứ
tự)
Định lượng, đa biến (hoặc thứ tự)Định lượng phân phối bình
thường
Biến định lượng phân phối
không bình thường – Biến thứ tự
Mann-Whitney Kruskal-Wallis TQ Spearman
Nhị giá Chi bình phương Chi bình phương Hồi quy logistic
Sống còn Wilcoxon tổng quát
Logrank
Wilcoxon tổng quát Logrank
Hồi quy Cox
Phép kiểm t bắt cặp
Tiên lượng của bệnh nhân suy hô hấp mãn tính tăng carbonic thường kém (tỉ lệ tử vong
trong 3 năm thay đổi từ 30% đến 100%) và hiện tại chưa có phương pháp điều trị hữu
hiệu Tilapur và Mir (Am J Med 1984; 77:987) cho rằng chế độ ăn giảm carbonhydrate
có thể cải thiện tình trạng hô hấp Các nhà nghiên cứu này tiến hành thực nghiệm trên 8
người suy hô hấp mãn tính (có dấu hiệu của tim lớn, gan lớn, phù và tăng áp phổi) với
chế độ điều trị bằng chế độ ăn 600 Kcal và ghi nhận PaO2 (phân áp oxy động mạch) và
PaCO2 (phân áp carbon dioxide động mạch) trước và sau điều trị Kết quả nghiên cứu
được trình bày trong Bảng 1 Hãy so sánh trung bình của phân áp oxy động mạch trước
và sau khi điều trị
Bảng 1 Phân áp Oxy động mạch và phân áp CO2 động mạch trên 8 đối tượng
trước và sau chế độ điều trị với chế độ ăn giảm carbonhydrate
Đối tượng Pa0 2 trước Pa0 2 sau Hiệu số PaC0 2 trước PaC0 2 sau Hiệu số
1 70 82 12 49 45 -4
Trang 21Bước 1: Xây dựng giả thuyết Ho:
Ho: Phân áp oxy động mạch trước và sau điều trị không thay đổi
;2,8
d t s
Bước 4: tính xác suất của giá trị thống kê t
Để tính xác suất của giá trị thống kê t ta sử dụng hàm tdist(giá trị t, độ tự do, 2) Cụ thể
để tính p tương ứng với giá trị t = 4.63 ở 7 độ tự do chúng ta đánh công thức "=tdist(4.63,
7, 2) vào một ô Kết quả ta được giá trị p= 0.002397687
Bước 5: Kết luận
Vì giá trị p= 0.002397687 nhỏ hơn 0.05 nên chúng ta bác bỏ giả thuyết Ho nghĩa là phân
áp oxy động mạch có cải thiện sau khi điều trị
Bảng Error! Bookmark not defined Trung bình và độ lệch chuẩn của Luợng catecholamine huyết thanh, nhịp tim, huyết áp tâm thu và huyết áp tâm trung ở 13 bệnh nhân tăng huyết
áp tăng catecholamine và 9 bệnh nhân tăng huyết áp không tăng catecholamine
Tăng catecholamine Không tăng
catecholamine huyết thanh (ug/mL) ⎯x=0.484 s=0.133 ⎯x=0.206 s=0.060
Trang 22Huyết áp tâm thu ⎯x=171.3 s=13.7 ⎯x=147.4 s=9.9
Huyết áp tâm trương ⎯x=103.0 s=8.3 ⎯x=95.6 s=12.9
Thực hành:
Bước 1: Xây dựng giả thuyết Ho:
Ho: Trung bình nhịp tim ở nhóm bệnh nhân có tăng catecholamine = nhịp tim trung bình
ở nhóm bệnh nhân không tăng catecholamine
1()1(
)1()
1
(
2 1
2 2 2
2 1
−+
−
−+
−
=
n n
s n s
/
1
)(
2 1
s
x
x
t
Bước 4: tính xác suất của giá trị thống kê t
Sử dụng máy vi tính chúng ta tính được giá trị p= 0,024123071 (nếu sử dụng bảng số thống kê chúng ta sẽ tìm được p <0,05)
Bước 5: Kết luận
Vì giá trị p= 0,024123071 nhỏ hơn 0,05 nên chúng ta bác bỏ giả thuyết Ho nghĩa là giữa hai nhóm bệnh nhân có sự khá biệt về nhịp tim trung bình
Phân tích phương sai
Anionwo et al (1981, BMJ; 282:283) muốn tìm hiểu xem mức hemoglobin trong 3 nhóm bệnh hồng càu liềm có khác nhau hay không bằng cách ghi nhận mức hemoglobin ở 3 nhóm bệnh nhân
Bảng 7 Phân tích phương sai một chiều: sự khác biệt trong nồng độ hemoglobin giữa các bệnh nhân bị các loại bệnh hồng cầu liềm khác nhau Số liệu từ Anionwo et al (1981) British Medical Journal, 282, 283-6
(a) Số liệu
Loại bệnh hồng cầu
liềm
Số bệnh nhân (ni)
(x)
Trang 23Hb SS 16 8,712 0,844 7,2; 7,7; 8,0; 8,1; 8,3; 8,4;
8,4; 8,5; 8,6; 8,7; 9,1; 9,1; 9,1; 9,8; 10,1; 10,3
Thực hành:
Bước 1: Xây dựng giả thuyết Ho:
Ho: Trung bình Nồng độ hemoglobin ở 3 nhóm bệnh HC liềm bằng nhau
Bước 2: Chọn kiểm định phù hợp
Kiểm định phù hợp là phương pháp phân tích phương sai (ANOVA) với thống kê F với (số nhóm, số quan sát - số nhóm) = (2,38) độ tự do ; F tới hạn= 3,32
Bước 3: Lập bảng ANOVA và Tính thống kê F
Chúng ta lập thành bảng phân tích phương sai như sau:
Nguồn biến thiên SS d.f MS=SS/d.f MS giữa các nhóm
F= -
MS bên trong nhóm Giữa các nhóm 99,92 2 49,96 50.03 , P<0,001
Trang 24Bước 4: tính xác suất của giá trị thống kê F
Dựa vào máy tính chúng ta tính được giá trị p= 2.26 x 10-11 Chúng ta cũng cĩ thể dựa vào bảng thống kê F để tìm được p <0,001
Bước 5: Kết luận
Vì giá trị rất nhỏ nên chúng ta bác bỏ giả thuyết Ho nghĩa là ba nhĩm bệnh nhân bệnh hồng cầu liềm cĩ giá trị hemoglobin trung bình khác nhau cĩ ý nghĩa thống kê
Phép kiểm chi bình phương
Cĩ 240 người được tiêm vaccine phịng bệnh cúm và 220 người được tiêm placebo Trong nhĩm tiêm vaccine cĩ 20 người bị cúm và trong nhĩm tiêm placebo cĩ 80 người bị cúm Hãy so sánh tỉ lệ mắc cúm giữa 2 nhĩm: nhĩm tiêm vaccine và nhĩm tiêm placebo? Hãy cho biết mức độ liên hệ giữa vaccine cúm và bệnh cúm?
Thực hành
Bước 1: Xây dựng giả thuyết Ho:
Ho: Tỉ lệ mắc cúm ở nhĩm tiêm vaccine = tỉ lệ mắc cúm ở nhĩm khơng tiêm vaccine
Bước 2: Chọn kiểm định phù hợp
Kiểm định phù hợp là kiểm định chi bình phương với 1 độ tự do
Bước 3: Lập bảng 2 x 2 và Tính thống kê chi bình phương
- Tính giá trị chi bình phương theo cơng thức
1)-cột (số1)
- hàng
=
−Σ
2 2
f d E
E O
χ
Trong thí dụ này
09,5302,652,569,2186,19
2,172
)2,172140(8
,187
)8,187220(8
,47
)8,4780(2
,52
)2,5220
2
=+++
=
−+
−+
−+
−
=
χ
Trang 25Công thức tính tắt cho bảng 2 × 2
))(
N bc ad
++++
−
=
χ
Bước 4: tính xác suất của giá trị thống kê χ2
Sử dụng máy vi tính chúng ta được giá trị p= 3,31 x 10-13 nghĩa là giá trị của p rất nhỏ Sử dụng bảng số chúng ta biết được p < 0,001
Bước 5: Kết luận
Vì giá trị rất nhỏ nên chúng ta bác bỏ giả thuyết Ho Chúng ta có thể kết luận tỉ lệ mắc cúm ở nhóm tiêm vaccine thấp hơn có ý nghĩa thống kê so với nhóm tiêm placebo
Sự tương quan của hai biến số định tính
Mức độ liên hệ giữa tiêm chủng vaccine và mắc bệnh cúm
Mức độ liên hệ giữa hai biến số định tính được ước lượng bằng cách sử dụng RR (hoặc
OR nếu trong nghiên cứu bệnh chứng) Giả sử số liệu của bảng 2 x2 nằm ở vùng C2:D3 chúng ta có thể tính RR bằng cách nhập công thức "=MHRR(C2:D3)" ta được RR=0,23 với khoảng tin cậy 95% của RR từ 0,15 đến 0,36
So sánh tỉ lệ của biến số nhị giá : Kiểm định chi-bình phương
Khi hai biến số là biến số nhị giá người ta sử dụng giá trị RR hay OR để đo lường mức độ liên hệ (xem lại phần các số đo dịch tễ)
1 1 1 1
96
,
1
N a N a
e
RR
− +
±
RR (test-based CI)
Tỉ số số chênh (OR) là tỉ số của số chênh mắc bệnh của nhóm phơi nhiễm trên số chênh mắc bệnh ở nhóm không phơi nhiễm Trong trường hợp nghiên cứu bệnh chứng tỉ số số chênh là tỉ số của số chênh phơi nhiễm của nhóm bệnh trên số chênh phơi nhiễm ở nhóm không chứng
RR = (a1/b1)/(a0/b0)
Trang 26Khoảng tin cậy 95% của tỉ số số chênh:
0 0 1 1
1 1 1 1
96
,
1
b a b a
e
OR
+ + +
×
÷
Bài tập
Một nghiên cứu bệnh chứng nhằm tìm mối liên hệ giữa sự ăn thịt và viêm ruột hoại tử đã
tìm được 61 trường hợp viêm ruột hoại tử và 57 trường hợp chứng Trong nhóm bị viêm
ruột hoại tử có 50 trường hợp có tiền căn ăn thịt (gần đây) và trong nhóm chứng có 16
trường hợp có tiền căn ăn thịt Hãy tìm ước lượng số đo liên hệ giữa ăn thịt và viêm ruột
Nếu tỉ lệ ăn thịt ở nhóm bệnh (50/61) cao hơn tỉ lệ ăn thịt trong nhóm chứng (16/57) có ý
nghĩa thống kê thì chúng ta có thể kết luận rằng có sự liên quan giữa ăn thịt và viêm ruột
hoại tử Đây là bài toán so sánh tỉ lệ của một biến số định tính ở hai nhóm và được giải
quyết bằng kiểm định chi bình phương
Tuy nhiên bằng việc kiểm định giả thuyết chúng ta chỉ xác định có mối liên hệ mà không
biết độ lớn của sự liên hệ Bởi vì đây là nghiên cứu bệnh chứng chúng ta không tính được
RR mà phải sử dụng OR để đo lường sức mạnh liên hệ Sử dụng công thức tính OR và
khoảng tin cậy của OR ta được:
OR = (a1/b1)/(a0/b0) = (a1 × b0)/(a0 × b1) = 11.65 và
khoảng tin cậy 95% của OR = 4.87 đến 27.85
Bài tập
Có 240 người được tiêm vaccine phòng bệnh cúm và 220 người được tiêm placebo
Trong nhóm tiêm vaccine có 20 người bị cúm và trong nhóm tiêm placebo có 80 người bị
cúm Hãy so sánh tỉ lệ mắc cúm giữa 2 nhóm: nhóm tiêm vaccine và nhóm tiêm placebo?
Hãy cho biết mức độ liên hệ giữa vaccine cúm và bệnh cúm?
Trang 27Ta tính được RR = (a1/N1)/(a0/N0) = (20/240)/(80/220) = 0.23
Khoảng tin cậy 95% của tỉ số nguy cơ:
0 0 1 1
1 1 1 1
96
,
1
N a N a
e
RR
− +
số có liên hệ chặt với nhau và vai trò của sai số ngẫu nhiên sẽ ít hơn Khi trị tuyệt đối của
hệ số tương quan bằng một có nghĩa là hoàn toàn không có sai số ngẫu nhiên
Loại hệ số tương quan được sử dụng phổ biến nhất là hệ số tương quan Pearson r:
1
/)()()(
))(
y x
x
y y x x r
y x i
i
i i
σσ
Lí giải ý nghĩa của hệ số tương quan Pearson
- Hệ số tương quan luôn luôn nằm trong đoạn [-1,1]
- Hệ số tương quan r dương chứng tỏ hai biến số là đồng biến; hệ số tương quan r âm chứng tỏ hai biến số là nghịch biến
- Trị số tuyệt đối của hệ số tương quan r nói lên mức độ liên quan giữa hai biến số Nếu trị tuyệt đối của r bằng 1 (r=1 hay r=-1), quan hệ hoàn toàn tuyến tính nghĩa là tất cả các điểm nằm trên đường hồi quy (Hình 9.2 d và 9.2f) Nếu trị tuyệt đối của r nhỏ hơn 1 sẽ có các điểm số liệu phân tán chung quanh đường hồi quy (hình 9.2 c và 9.2e)
- Bình phương của hệ số tương quan (r2) thể hiện tỉ lệ biến thiên của biến số phụ thuộc được giải thích bằng sự biến thiên của biến số độc lập (nếu mối liên hệ này là nhân quả)
- Nếu r=0, không có mối liên hệ tuyến tính giữa hai biến số Ðiều này có nghĩa là (1) không có mối liên hệ gì giữa hai biến số hoặc (hình 9.2a) (2) mối liên hệ giữa hai biến số không phải là tuyến tính (hình 9.2b)
- Theo quy ước, quan hệ với r từ 0,1 đến 0,3 là quan hệ yếu, từ 0,3 đến 0,5 quan hệ trung bình và trên 0,5 là quan hệ mạnh
(phương trình hồi quy tính cân nặng của trẻ từ 9 đến 40 tháng tuổi theo tháng tuổi)
theo phương trình này người ta gọi:
Trang 28cân nặng: biến số phụ thuộc
tháng tuổi: biến số độc lập
6,85: hệ số của hằng số, hay còn gọi là điểm chặn (intercept)
0,18: hệ số của biến số tháng tuổi
Một cách tổng quát phương trình hồi quy sẽ có dạng:
Chúng ta cũng tìm được phương trình của huyết áp theo lượng muối tiêu thụ sẽ là:
Huyết áp tâm thu = 99,8 mmHg + 1,55 x Lượng muối
Giá trị 99,8 được gọi là điểm chặn của phương trình hồi quy và 1,55 là hệ số góc của biến
số lượng muối tiêu thụ Điều này có nghĩa là nếu lượng muối ăn tăng thêm 1 gram/ngày thì huyết áp tâm thu sẽ tăng trung bình 1,55 mmHg
2 Lý giải ý nghĩa của phân tán đồ sau
Figure 8 Trọng lượng sơ sinh theo tuổi thai (tuần) của 641 trẻ sinh do thụ thai trong ống nghiệm ở Anh quốc
Trang 29trong luong tre
Trang 30Xác định và chọn ưu tiên nghiên cứu
Mục tiêu
Sau buổi thảo luận các hội thảo viên có thể:
- Xác định các tiêu chuẩn để chọn lựa các vấn đề y tế ưu tiên để nghiên cứu
- Làm việc theo nhóm nhỏ, dùng các tiêu chuẩn đã chọn để xác lập ưu tiên nghiên cứu
- Sử dụng các phương pháp đồng thuận nhóm để chọn một chủ đề thích hợp để thực hiện đề cương nghiên cứu và đề cương này sẽ được sử dụng trong suốt khoá đào tạo
Vấn đề có thể xảy ra do thiếu hụt trang thiết bị, do cơ cấu tổ chức thì vấn đề được gọi là vấn đề quản lí Thí dụ việc điều trị cho bệnh nhân sốt rét không tốt do trạm y tế không có
đủ thuốc sốt rét để điều trị sốt rét cho bệnh nhân thì vấn đề này được gọi là vấn đề quản lí
và cần được giải quyết bằng cách làm việc với chương trình sốt rét để cung cấp thêm thuốc Đôi khi vấn đề xảy ra do chúng ta không có đủ kiến thức về vấn đề đó Thí dụ, nếu chúng ta không thể điều trị tốt bệnh nhân sốt rét do chúng ta không biết được kí sinh trùng sốt rét đã kháng với loại thuốc nào và còn nhạy cảm với thuốc chống sốt rét nào nghiên cứu Khi đó vấn đề này là vấn đề nghiên cứu và câu hỏi mà chúng ta cần phải trả lời để giải quyết vấn đề nghiên cứu được gọi là câu hỏi nghiên cứu
Các câu hỏi nghiên cứu có thể được phân thành ba loại tuỳ theo loại kiến thức cần tìm: 1- Mô tả vấn đề y tế để nhằm xây dựng kế hoạch can thiệp: mô tả có thể bao gồm các thông tin về độ lớn và phân bố của nhu cầu sức khoẻ hoặc thông tin về nguồn lực nhằm xây dựng kế hoạch can thiệp
2 Kiến thức để đánh giá một chương trình can thiệp hay một phác đồ điều trị về các phương diện: độ bảo phủ của nhu cầu sức khoẻ, độ bao phủ của dân số mục tiêu, chất lượng, hiệu quả, chi phí, v.v
3 Kiến thức đề xác định các vấn đề y tế hay phân tích nguyên nhân của vấn đề để tìm giải pháp
Một vấn đề cần được nghiên cứu phụ thuộc và ba điều kiện:
1 Phải có sự bất cập, khoảng cách giữa điều đang tồn tại và điều chúng ta mong muốn
2 Lí do của vấn đề đó (khoảng cách) là chưa rõ
3 Phải có nhiều hơn một câu trả lời cho vấn đề nghiên cứu đó
Trang 31Tiêu chuẩn chọn ưu tiên cho vấn đề nghiên cứu
Có 7 tiêu chuẩn được sử dụng để hướng dẫn chọn ưu tiên cho các vấn đề nghiên cứu:
1 Tính xác hợp: Tính xác hợp của vấn đề nghiên cứu phụ thuộc vào quy mô và mức độ trầm trọng của vấn đề Cần lưu ý tính xác hợp của vấn đề phụ thuộc vào quan điểm của các bên
2 Tránh trùng lắp: Cần phải kiểm tra xem nghiên cứu đã được thực hiện ở tại địa phương hay không hay tại một địa phương có điều kiện tương tự hay không
3 Tính khả thi: Cần xem xét mức độ phực tạp của đề tài và nguồn lực cần thiết để tiến hành nghiên cứu: nhân sự, thời gian, trang thiết bị và tiền bạc Nếu vấn đề là quan trọng
mà nguồn lực không đủ có thể xem xét việc xin tài trợ từ các nguồn ở bên ngoài
4 Tính được chấp nhận từ các nhà quản lí: Nói chung một nghiên cứu cần được sự quan tâm và ủng hộ của các cấp có thẩm quyền Khi đó nghiên cứu được tiến hành một cách thuận lợi hơn và kết quả có thể được ứng dụng để đưa vào thực tiễn Nếu một nghiên cứu được tiến hành nhằm thay đổi một chính sách thì cần phải tranh thủ sự ủng hộ và sự tham gia của các nhà hoặch định chính sách
5 Tính ứng dụng của kết quả và các kiến nghị Các kiến nghị có thể được áp dựng hay không? Điều này không chỉ phụ thuộc vào sự quan tâm của các cấp lãnh đạo mà còn phụ thuộc vào nguồn lực hiện có tại địa phương
6 Tính cấp thiết của đề tài: Kết quả của nghiên cứu có cần thiết để ra một quyết định khẩn cấp hay không? Nghiên cứu nào cần phải làm trước và nghiên cứu nào có thể thực hiện sau
7 Tính chấp nhận về đạo đức: Bao gồm sự chấp nhận của cộng đồng kể cả về mặt lợi ích
và văn hoá Nghiên cứu này có sử dụng thư mời chấp nhận tham gia nghiên cứu hay không? Nếu kết quả phát hiện bệnh tật ở người dân có cung cấp điều trị cho họ hay không?
Thang điểm đánh giá các chủ đề nghiên cứu
1 Đã đủ thông tin về vấn đề nghiên cứu
2 Có thông tin về vấn đề nghiên cứu nhưng chưa bao phủ vấn đề chính
3 Không có thông tin để giải quyết vấn đề
Tính khả thi
1 Nghiên cứu không khả thi với tài nguyên sẵn có
2 Nghiên cứu khả thi với nguồn lực sẵn có
3 Nghiên cứu rất khả thi với nguồn lực sẵn có
Trang 321 Khuyến cáo ít cơ hội được thực hiện
2 Khuyến cáo có ít nhiều cơ hội được thực hiện
3 Khuyến cáo có nhiều cơ hội được thực hiện
Tính cấp thiết
1 Thông tin không cấp thiết cần thiết
2 Thông tin cần thiết ngay nhưng có thể trì hoãn
3 Thông tin rất cần thiết để ra quyết định
Trang 33Phương pháp phân tích và khẳng định vấn đề nghiên cứu
Mục tiêu
Sau khi hoàn tất buổi tập huấn các hội thảo viên có thể:
1 Phân tích một vấn đề và các yếu tố ảnh hưởng đến nó
2 Viết phần đặt vấn đề cho đề cương nghiên cứu mà mình sẽ phải xây dựng
Bước này có thể đơn giản hay phức tạp tùy theo mức độ hiểu biết về vấn đề nghiên cứu của nhà nghiên cứu Việc phân tích vấn đề nhằm các mục đích:
1 Cho phép các thành viên nghiên cứu chia xẻ kiến thức về vấn đề nghiên cứu
2 Làm rõ vấn đề nghiên cứu và các yếu tố ảnh hưởng đến nó
3 Làm thuận lợi hơn việc quyết định về phạm vi và trọng tâm của nghiên cứu
Các bước để phân tích vấn đề
Bước 1: Làm rõ các quan điểm của các nhà quản lí, nhân viên y tế và nhà nghiên cứu có liên quan đến vấn đề Điều này là cần thiết bởi vì đôi khi quan điểm của nhà quản lí không thể hiện một cách rõ ràng mà chỉ có thể là "Vấn đề chăm có bệnh nhân tiểu đường cần phải xem lại" Do vậy nó cần được làm rõ
Bước 2: Chuyên biệt và mô tả vấn đề cốt lõi, bao gồm bản chất của vấn đề, phân
bố của vấn đề và quy mô và mức độ trầm trọng của vấn đề cốt lõi
Bước 3: Phân tích vấn đề: các yếu tố góp phần vào vấn đề và cần làm sáng tỏ mối quan hệ giữa vấn đề và yếu tố góp phần Bước này được chia làm 4 bước nhỏ:
- Viết ra vấn đề cốt lõi ở giữa tờ giấy
- Động não để tìm ra các yếu tố có ảnh hưởng đến vấn đề
- Xác định thêm các yếu tố góp phần vào vấn đề
- Phân các yếu tố có liên quan thành các nhóm: kinh tế xã hội, dịch vụ y tế và các yếu tố bệnh tật
Bước 1: Làm rõ quan điểm của nhà nghiên cứu, nhân viên y tế và nhà lãnh đạo
- Đôi khi quan điểm của nhà lãnh đạo được phát biểu chưa rõ ràng thí dụ như : “Cần xem xét lại việc chăm sóc bệnh nhân tiểu đường”; “Cần nghiên cứu vấn đề bỏ tuyến”, “Khảo sát vấn đề điều trị DOTS” Khi đó chúng ta cần thảo luận và khẳng định dưới dạng vấn
Trang 34đề là khoảng cách giữa “hiện tại” và “điều mong muốn”
- khi vấn đề dưới dạng trình bày rõ ràng, vấn đề trở thành nhiều vấn đề nhỏ:
Tỉ lệ chữa khỏi ở bệnh nhân điều trị bằng DOTS thấp
Nhân viên y tế khơng đảm bảo đúng chức năng giám sát
Bệnh nhân khơng tuân thủ lịch điều trị
Bệnh nhân tiểu đường và thân nhân khơng cĩ nhận thức đủ về tiểu đường và tự chăm sĩc trong tiểu đường
Bệnh nhân tiểu đường cĩ biến chứng cao
Bệnh nhân tiểu đường ít dung nạp với điều trị
Tỉ lệ tái nhập viện cao trong những bệnh nhân tiểu đường
Bước 2:
- chọn vấn đề cốt lõi từ các vấn đề nhỏ
Bệnh nhân tiểu đường cĩ biến chứng cao
Tỉ lệ tái nhập viện cao trong những bệnh nhân tiểu đường
- Mơ tả vấn đề cốt lõi theo:
Bản chất: sự khác biệt về “hiện tại” và “mong muốn”
Phân bố của vấn đề: Con người, thời gian, nơi chốn
Tầm cỡ và độ trầm trọng của vấn đề: quy mơ của vấn đề, độ trầm trọng của vấn
đề, hậu quả vấn đề
Bước 3:
- Xác định yếu tố gĩp phần tạo ra vấn đề và mối quan hệ giữa vấn đề và vấn đề gĩp phần
Sử dụng sơ đồ cây vấn đề, trong đĩ vấn đề được đặt ở giữa và các yếu tố ảnh hưởng và gĩp phần được đặt chung quanh và hướng mũi tên thể hiện sự tác động Vấn đề thường được vẽ với 2 đường viền để phân biệt với các yếu tố ảnh hưởng
Yếu tố
Yếu tố
Vấn đề
\ Quá trình này bao gồm các bước sau:
Bước 3.1: Viết vấn đề cốt lõi ở giữa
Bước 3.2: tìm ra các yếu tố ảnh hưởng
Trang 35Bệnh nhân
không dung
nạp điều trị
Không có điều trị tại
cơ sở
Tỉ lệ tái nhập viện do bệnh tiểu đường cao
Tỉ lệ biến chứng cao
Tỉ lệ biến
chứng cao
Bước 3.3: Tiếp tục tìm ra các yếu tố ảnh hưởng và gĩp phần sao cho các yếu tố này là yếu tố cĩ thể thay đổi Ở dưới là một số cây vấn đề của vấn đề lao phổi và tăng huyết áp
Những yếu tố
dịch vụ khác
Tỉ lệ bỏ trị ở bệnh nhân lao phổi cao
BN không hiểu sự cần thiết
Những yếu
tố cá nhân
và xã hội
Không đủ nhân viên
Không tư vấn cho BN
Nhân viên không huấn luyện
Không đủ tài liệu để GDSK Lao
Thiếu hiểu biết
về cảm nhận
của BN Lao về
lao phổi
Trang 36Chất lượng dịch vụ kém
Độ nặng của bệnh
Tỉ lệ bỏ trị ở bệnh nhân lao phổi cao BN không hiểu
sự cần thiết phải điều trị
Tham vấn không đủ
Thiếu sự hỗ trợ từ gia đìnhï
Đáp ứng với điều trị
Điều trị thuốc nam
Kiến thức kém về nguyên nhân và hậu quả bệnh
Tuổi; Giới;
Giáo dục
Thiếu sự hỗ trợ chủ lao động
Cấu trúc gia đình
Nghề nghiệp
Phòng khám xa
Tính phục vụ:
- Giờ mở cửa
- Đợi lâu
- Không đủ nhân viên
- Không đủ huấn luyện
- Thiếu hiểu biết về bệnh nhân
lao
- Không đủ tài liệu
- Thiếu giám sát
- Phác đồ không thích hợp
- Hướng dẫn không thích hợp
Tai biến mạch máu não
Dị dạng mạch
Bệnh tim
Tăng huyết áp
Vận động
hàng ngày
Lượng muối tiêu thụ Béo phì
Chế độ ăn
Không hiểu biết về CHA
Không tuân thủ điều trị
Không có giáo dục sức khoẻ
Dịch vụ y tế chưa tốt
Bệnh nhân không biết số đo HA
Tăng huyết áp
Hút thuốc lá Uống rượu
Rối loạn lipid máu
Rối loạn
đường huyết
Bước 3.4: Sắp xếp các yếu tố thành các nhĩm lớn và xây dựng sơ đồ:
Trang 37Yếu tố kinh tế xã hội: Gồm tuổi, giới, học vấn, nghề nghiệp, kiến thức cộng đồng, các
loại hình điều trị ở cộng đồng, thái độ với các loại hình điều trị
Yếu tố dịch vụ y tế: tính có được và tiếp cận được của dịch vụ, quản lí dịch vụ y tế, chất
– Những yếu tố KAP gây nên bệnh giun sán
– Những yếu tố góp phần vào sự phát triển KAP ở thanh thiếu niên
Xác định phạm vi và trọng tâm của nghiên cứu
Sau khi phân tích vấn đề, cần phải xem xét lại trọng tâm và phạm vi của đề tài Việc xác định phạm vi và trọng tâm của đề tài phụ thuộc vào
1 Tính hữu dụng thông tin (thông tin về các yếu tố góp phần): Thông tin nào khi được thu thập để giải quyết vấn đề sẽ giúp giải quyết vấn đề y tế và cải thiện chăm sóc y tế? Thông tin này cần thiết cho ai? Thông tin sẽ giải quyết đến các yếu
- Để rõ mối liên hệ và tầm quan trọng của các yếu tố góp phần, sử dụng nghiên cứu thăm
dò nhằm phát hiện tối đa những yếu tố có liên quan bằng cách nghiên cứu một số ít đối tượng
Xây dựng phần đặt vấn đề
Phần đầu tiên trong một đề cương nghiên cứu là phần đặt vấn đề Phần này hết sức quan trọng bởi vì nó đặt nền tảng cho sự xây dựng tiếp theo của đề cương nghiên cứu, giúp tìm kiếm thông tin và báo cáo từ các nghiên cứu khác để có thể tham khảo và cho phép chỉ ra một cách có hệ thống tại sao vấn đề này được nghiên cứu và chúng ta có thể gặt hái
gì từ kết quả nghiên cứu Điều này là rất quan trọng khi chúng ta trình bày nghiên cứu của chúng ta cho các thành viên của cộng đồng và các nhân viên, cán bộ và lãnh đạo ngành y tế
Trang 38Các thông tin cần thiết trong phần đặt vấn đề
1 Mô tả ngắn gọn về đặc điểm kinh tế xã hội, văn hoá , tình trạng sức khoẻ và y tế của địa phương có liên quan đến vấn đề nghiên cứu
2 Mô tả về bản chất của vấn đề (sự khác biệt giữa thực tiễn và điều mong muốn) nếu vấn
đề còn chưa rõ
3 Phân tích các yếu tố chính ảnh hưởng đến vấn đề
4 Mô tả các giải pháp đã được sử dụng trước đây hoặc kết quả các nghiên cứu trước và nêu rõ lí do tại sao cần giải pháp mới hay cần một nghiên cứu mới
5 Mô tả loại thông tin hi vọng sẽ có được từ nghiên cứu và thông tin này sẽ giúp giải quyết vấn đề này như thế nào hay giúp trả lời câu hỏi nghiên cứu như thế nào?
6 Nếu cần thiết cần nêu ra định nghĩa của những khái niệm quan trọng của nghiên cứu
Trang 39Tổng quan y văn
Mục tiêu
Sau khi nghiên cứu phần này, học viên có khả năng
1 Trình bày những lí do để tham khảo các y văn có sẵn và các thông tin khác trong khi chuẩn bị đề cương nghiên cứu
2 Trình bày các nguồn tài liệu có thể tham khảo
3 Chuẩn bị tổng quan y văn và những thông tin khác có liên quan đến đề cương nghiên cứu, những thông tin này trình bày các số liệu nền tảng và những thông tin
hỗ trợ cho chủ đích nghiên cứu
Tại sao cần phải tham khảo y văn khi chuẩn bị đề cương nghiên cứu
Việc tham khảo y văn sẽ giúp chúng ta tránh việc lập lại các công trình đã làm từ trước
Tham khảo y văn sẽ giúp bạn tìm hiểu các nhà nghiên cứu khác đã phát hiện và báo cáo những gì về vấn đề bạn muốn nghiên cứu Điều này giúp bạn hoàn thiện phần đặt vấn đề
Tham khảo y văn gúp bạn quen thuộc hơn với những loại thiết kế nghiên cứu đã được sử dụng trong chủ đề nghiên cứu này
Tham khảo y văn cho bạn những lí lẽ thuyết phục tại sao đề tài nghiên cứu của bạn là cần thiết
Những nguồn thông tin có thể tham khảo
Chúng ta có thể tham khảo các nguồn thông tin khác nhau Các nguồn thông tin này có thể là các cá nhân, các nhóm người hay các tổ chức Nguồn thông tin cũng có thể là từ những tài liệu đã xuất bản như sách vở, tạp chí, bài báo, các thư mục hoặc những tài liệu chưa xuất bản như đề cương nghiên cứu, báo cáo, hồ sơ, cơ sở dữ liệu trong máy tính Hiện nay các website trên internet là một nguồn thông tin quan trọng để có được các
ý kiến của cá nhân, của các nhóm, các tổ chức, các tài liệu đã xuất bản hoặc tài liệu chưa xuất bản
Các nguồn thông tin có thể có ở nhiều cấp khác nhau, cấp độ địa phương, cấp độ quốc gia hay cấp độ
Cấp độ Thí dụ về nguồn thông tin
Địa phương - Số liệu của bệnh viện hay phòng khám từ các thống kê định kì
- Ý kiến, niềm tin của các nhân vật chủ chốt
- Quan sát lâm sàng, báo cáo các tai biến
- Điều tra hay báo cáo hàng năm
- Niên giám thống kê của địa phương
- Sách, bài báo khoa học, báo chí, v.v Quốc gia - Bài báo từ các tạp chí khoa học quốc gia, sách vở tìm kiếm được
Trang 40trong thư viện của trường đại học, thư viện của WHO, UNICEF
- Văn bản, báo cáo, số liệu thô từ
- Bộ y tế
- Tổng cục thống kê
- Các tổ chức phi chính phủ Quốc tế - Các tạp chí khoa học, tạp chí chuyên ngành
- Các ấn bản của WHO, UNICEF, UNFPA, v.v
- Các sách, tài liệu khoa học kinh điển
Cách viết phần tổng quan
Có một số bước phải thực hiện để chuẩn bị cho việc tổng quan y văn và các thông tin
1 Đầu tiên phải tổ chức các thẻ thư mục theo nhóm của các chủ đề tuỳ theo nó có liên quan đến khía cạnh nào của vấn đề
2 Sau đó, quyết định trình tự trình bày các chủ đề Nếu phát hiện rằng bạn đã không tìm được y văn cho thông tin về một khía cạnh của vấn đề của bạn mà bạn cảm thấy rằng nó quan trọng, cần phải nỗ lực để tìm kiếm y văn đó
3 Cuối cùng, trình bày ý tưởng theo ngôn từ một cách mạch lạc trong vòng từ một đến hai trang nhưng cần phải có tài liệu tham khảo.Có hai cách trích dẫn tài liệu tham khảo:
- Bạn có thể đánh số thứ tự trên văn bản để tham chiếu đến các tài liệu tham khảo Sau đó liệt kê các tài liệu tham khảo theo thứ tự và sử dụng các thông tin được mô tả trong thẻ thư mục và phần liệt kê các tài liệu tham khảo này phải được đưa vào sau đề cương để làm phụ lục (cách trích dẫn này thường được gọi là trích dẫn theo hệ thống Vancouver)
- Một cách khác là bạn có thể viết họ của tác giả nước ngoài (toàn bộ tên và họ nếu là tác giả trong nước), năm xuất bản và số trang được trích dẫn để tham chiếu đến tài liệu tham khảo Trong trường hợp này liệt kê các tài liệu tham khảo theo thứ tự bảng chữ cái và phần liệt kê cũng được đưa vào sau đề cương để làm phụ lục (cách trính dẫn này được gọi là trích dẫn theo hệ thống Havard)
4 Quy tắc liệt kê tài liệu tham khảo:
Tạp chí:
Altman Cho DG Statistics in medical journals Stat Med 1983;1:59-71
[Họ - tên tắt].[Tên bài báo].[Tên tờ báo] [năm XB];[số]:[trg đầu]-[trg cuối]