Một số bất cập khi ứng dụng thống kê và tin học trong nghiên cứu y học
1 MỘT SỐ BẤT CẬP KHI ỨNG DỤNG THỐNG KÊ VÀ TIN HỌC TRONG NGHIÊN CỨU Y HỌC Lưu Ngọc Hoạt MỞ ĐẦU Ngày nay với sự bùng nổ của khoa học, kỹ thuật và công nghệ trong khám chữa bệnh, người thày thuốc trước khi ra quyết định chẩn đoán hoặc điều trị một bệnh nào đó cần phải tổng hợp và cân nhắc các thông tin liên quan từ các nguồn khác nhau, đặc biệt là từ các xét nghiệm, kết quả chẩn đoàn hình ảnh, thăm do chức năng, từ các nghiên cứu, thử nghiệm lâm sàng, chứ không chỉ đơn thuần là các triệu chứng lâm sàng như trước đây, do vậy khái niệm y học dựa vào kinh nghiệm lâm sàng của người thày thuốc đã được thay thế bởi khái niệm y học dựa vào bằng chứng. Với các nhà quản lý và hoạch định chính thì khái niệm lập kế hoạch, quản lý và hoạch định chính sách dựa vào bằng chứng cũng đã trở nên rất phổ biến và ngày nay ở các nước phát triển hầu hết các quyết định, chính sách đều phải xây dựng, triển khai và đánh giá dựa theo một quy trình nghiêm ngặt, trong đó bằng chứng được cung cấp từ nhiều nguồn khác nhau như trình bày trong sơ đồ dưới đây Sơ đồ 1: Vai trò của các nguồn thông tin khác nhau trong lập kế hoạch, quản lý và hoạch định chính sách Do vậy với xu thế phát triển của y học dựa vào bằng chứng, lập kế hoạch, quản lý và hoạch định chính sách dựa vào bằng chứng hiện nay và trong tương lai, vai trò của Các thông tin mà nhà quản lý cần khi lập kế hoạch, quản lý hoặc hoạch định chính sách: o Thông tin y tế, sức khỏe o Thông tin tài chính, kinh tế o Thông tin về chính sách, văn hóa, xã hội . o Các thông tin khác Các thông tin thiếu hụt cần thu thập thêm: o Từ thư viện, Internet o Từ điều tra, nghiên cứu bổ sung So sánh Bằng chứng cho LKH và QL Các thông tin có sẵn tại địa phương Tiêu chuẩn của thông tin cho các nhà quản lý: • Hấp dẫn, ngắn gọn, chính xác • Phải trình bày dưới dạng các bằng chứng 2 thống kê, tin học ứng dụng ngày càng được mở rộng, không chỉ trong nghiên cứu khoa học mà còn cả trong tìm kiếm, tham khảo tổng hợp, phân tích số liệu có sẵn và các thông tin trên mạng. Bảng dưới đây có thể cho thấy thống kê và tin học ngày nay khác gì với thống kê và tin học khi mà máy vi tính và phần mềm chưa được phổ cập: Bảng 1: Các thao tác và kỹ năng mà người nghiên cứu cần học về thống kê và tin học trước đây và ngày nay Giai đoạn Thao tác của cán bộ làm nghiên cứu Kỹ năng sinh viên cần có sau khi học môn thống kê-tin học 1. Trước khi có máy vi tính (computer) Thiết kế công cụ thu thập số liệu, nhập liệu • Thủ công bằng viết tay hay đánh máy; • Cách thiết kế công cụ và lập bảng tổng hợp nhập số liệu Tính cỡ mẫu, tổng hợp số liệu, tính toán các test thống kê • Thủ công hoặc có sự hỗ trợ của bàn tính, máy tính tay (calculator); • Chọn đúng công thức và tính toán theo các công thức • Cách dùng bàn tính và máy tính tay để tính toán Tham khảo thông tin: • Chủ yếu từ sách, tạp chí, báo cáo được in ấn và lưu dưới dạng ấn phẩm (hard copy); • Cách đọc, ghi chép, lưu giữ và sử dụng các tài liệu tham khảo từ các ấn phẩm; Trích dẫn và sắp xếp tài liệu tham khảo • Theo cách thủ công • Cách trích dẫn và sắp xếp tài liệu tham khảo theo quy định 2. Khi máy vi tính và các phần mềm đã phổ biến Thiết kế công cụ thu thập số liệu, nhập liệu • Sử dụng các phần mềm thích hợp (EPI Info, EPI Table .) • Cách thiết kế, mã hóa công cụ, xử lý và nhập liệu bằng phần mềm máy vi tính; Tính cỡ mẫu, tổng hợp số liệu, tính toán các test thống kê • Thông qua các phần mềm như EPI Info, STATA, SPSS . • Cách chuyển dạng số liệu, tính cỡ mẫu, tổng hợp, tính toán số liệu, các test bằng phần mềm Tham khảo thông tin: • Từ các ấn phẩm trong thư viện, • Từ thư viện điện tử, đĩa và đặc biệt là từ Internet • Cách tìm và lưu giữ thông tin từ ấn phẩm vào máy tính hoặc phần mềm • Cách tra cứu tài liệu trên Internet • Tổng hợp số liệu có hệ thống (Systermatic review, Meta-analysis) Trích dẫn và sắp xếp tài liệu tham khảo • Sử dụng các phần mềm như Reference Manager, Endnote . • Cách sắp xếp tài liệu tham khảo; • Cách sử dụng phần mềm để tìm kiếm, lưu giữ và sắp xếp tài liệu tham khảo 3 Với những lý do nêu trên, giảng dạy thống kê và tin học ứng dụng trong y sinh học hiện nay trong các trường đại học y cần phải cập nhật và thay đổi. Ngoài ra, do các cán bộ y tế và nhiều nhà nghiên cứu trong lĩnh vực y tế cũng chưa được đào tạo, cập nhật về thống kê và tin học y học nên họ còn gặp nhiều khó khăn và sai sót trong việc ứng dụng các kiến thức và kỹ năng về thống kê và tin học trong nghiên cứu khoa học, đó cũng là một trong những lý do làm cho chất lượng của nhiều nghiên cứu còn thấp và chưa có nhiều bài báo khoa học được đăng tải trên các tạp chí thế giới. Để tìm hiểu thực trạng của những bất cập trong ứng dụng thống kê và tin học y học trong nghiên cứu khoa học, nhóm cán bộ giảng dạy của Bộ môn Thống kê, Tin học Y học của Viện Đào tạo Y học Dự phòng và Y tế công cộng, Trường Đại học Y Hà Nội đã triển khai một số nghiên cứu tìm hiểu các lỗi thường gặp khi cán bộ y tế áp dụng thống kê, tin học trong nghiên cứu khoa học thông qua việc rà soát hàng trăm bài báo đăng tải trong một số tạp chí có uy tín của Việt Nam (350 bài năm 2003 và 201 bài năm 2009) và thông qua xem xét các báo cáo thống kê, các luận văn, luận án tốt nghiệp của sinh viên và học viên, các đề tài nghiên cứu các cấp. Kết quả nghiên cứu cho thất các cán bộ y tế và nhà nghiên cứu y học Việt Nam thường gặp phải một số lỗi sau đây: 1. Lỗi liên quan đến phần đại cương thống kê và biến số: Không phân biệt được thống kê mô tả và thống kê suy luận Không phân biệt được mối liên quan giữa tên đề tài, mục tiêu nghiên cứu và biến số Xác định thừa hoặc thiếu biến số trong nghiên cứu Chuyển biến định lượng sang dạng định tính khi thiết kế công cụ thu thập số liệu không đúng Không hiểu rõ về phân bố chuẩn và vai trò của phân bố chuẩn trong thống kê Chưa phân biệt được loại nghiên cứu độc lập và ghép cặp Những thông tin nào cần phải đề cập trong phần đối tượng và phương pháp nghiên cứu? 2. Lỗi liên quan đến loại thiết kế nghiên cứu Chưa phân biệt được loại thiết kế nghiên cứu như nghiên cứu ngang và dọc; hồi cứu hay tiến cứu; mô tả, phân tích hay can thiệp; định tính hay định lượng; Chưa phân biệt được nghiên cứu ngang (cross-sectional study) và điều tra cắt ngang (cross-sectional survey); Chưa biết cách trình bày mục thiết kế nghiên cứu trong phần đối tượng và phương pháp của một báo cáo nghiên cứu 3. Lỗi liên quan đến chọn mẫu và tính toán cỡ mẫu Chọn không đúng công thức tính cỡ mẫu và các thành phần trong công thức tính cỡ mẫu 4 Không biết cách tính cỡ mẫu từ kết quả của các nghiên cứu thử Không biết rõ ưu, nhược điểm của từng phương pháp chọn mẫu để chọn đúng cách chọn mẫu cho một nghiên cứu cụ thể Điều chỉnh cỡ mẫu với hệ số thiết kế không đúng Không biết áp dụng công thức tính cỡ mẫu thích hợp với các loại thiết kế nghiên cứu; Không biết cách tính toán cỡ mẫu trong nghiên cứu định tính 4. Thống kê mô tả Không phân biệt được khi nào có thể đo lường độ tập trung của bộ số liệu định lượng bằng dùng giá trị trung bình, khi nào phải dùng trung vị, khi nào có thể đo lường độ phân tán của bộ số liệu bằng độ lệch chuẩn, khi nào phải dùng khoảng phần trăm, phần mười, phần tư Không biết chuyển bộ số liệu từ dạng không chuẩn sang phân bố chuẩn để có thể áp dụng cách tổng hợp và phân tích với bộ số liệu chuẩn Không chọn đúng bảng, biểu đồ thị để trình bày bộ số liệu 5. Thống kê suy luận Không nhận thức đúng được vai trò của thống kê suy luận trong nghiên cứu khoa học Không phân biệt được chỉ định và giá trị của ước lượng điểm, ước lượng khoảng và kiểm định giả thuyết Không phân biệt được giá trị Alpha (sai lầm loại 1), Beta (sai lầm loại 2), giá trị p trong thống kê suy luận; Không phân biệt được sự khác biệt trong kiểm định sự khác nhau và sự tương quan Không phân biệt được các test trong nghiên cứu ghép cặp, không ghép cặp, test tham số và phi tham số Chưa hiểu đúng khái niệm sai số, nhiễu và sự cần thiết phải khống chế sai số và nhiễu trong nghiên cứu Không đánh giá đúng tính cần thiết và giá trị của phân tích đa biến trong khống chế nhiễu Phân tích hồi quy khi chưa quan sát tương quan So sánh trước sau can thiệp khi có nhóm chứng nhưng nhóm chứng và nhóm can thiệp chưa tương thích 6. Bất cập liên quan đến việc tìm kiếm, tham khảo, lưu giữ tài liệu tham khảo trên Internet Chưa biết cách tìm các trang web chứa những thông tin cần thiết để tham khảo trong nghiên cứu, đặc biệt là các trang web mà các nước đang phát triển có thể truy cập miễn phí; 5 Chưa biết cách sử dụng các phần mềm tìm kiếm, tham khảo, lưu giữ và sắp xếp tài liệu tham khảo; Chưa biết triển khai những loại hình nghiên cứu mới sử dụng số liệu có sẵn trên Internet như việc tổng hợp số liệu có hệ thống (systermatic review) và phân tích Meta (meta-analysis); 7. Bất cập trong ứng dụng tin học trong thu thập, xử lý và phân tích số liệu Chưa biết sử dụng phần mềm thống kê trong chọn mẫu, thiết kế công cụ thu thập số liệu, nhập liệu, làm sạch số liệu và phân tích số liệu; Chưa phân biệt được điểm mạnh, yếu của từng phần mềm thống kê; Chưa sử dụng được các phần mềm chuyển bộ số liệu đầu vào để có thể áp dụng với nhiều phần mềm khác nhau hoặc chuyển dạng số liệu từ phân bố không chuẩn sang phân bố chuẩn để sử dụng các test tham số thay thế cho các test phi tham số. Chưa tiếp cận được với một số loại hình nghiên cứu mới như nghiên cứu không gian, nghiên cứu theo Hệ thông tin địa lý (Geographic Information System – GIS) . NỘI DUNG Thực trạng nêu trên về nhu cầu học tập môn thống kê, tin học y học cũng như các bất cập trong ứng dụng môn học này trong nghiên cứu khoa học đã đặt ra một yêu cầu cấp bách cho việc phải đổi mới nội dung giảng dạy môn thống kê và tin học y học trong các trường đại học y. Vấn đề này sẽ được thảo luận chi tiết trong một cuộc hội thảo vào tháng 4/2011 với sự tham gia của các giảng viên tham gia giảng dạy môn thống kê, tin học y học trong tám Trường Đại học Y trong khuôn khổ hỗ trợ của Dự án Tăng cường năng lực giảng dạy bác sỹ y học dự phòng trong tám Trường Đại học Y Việt Nam, do Tổ chức Nuffic, Hà Lan hỗ trợ. Về các bất cập mà cán bộ y tế thường gặp khi áp dụng thống kê và tin học y học trong nghiên cứu khoa học thì với phạm vi tài liệu này, chúng tôi chỉ cung cấp được những kiến thức chung nhất liên quan đến những bất cập này, chi tiết sẽ được trình bày trong bộ tài liệu mà hiện Bộ môn Thống kê và Tin học Y học Trường Đại học Y Hà Nội đang biên soạn. Dưới đây là một số kiến thức cơ bản về thống kê và tin học y học được tổng hợp, sơ đồ hóa và được trình bày dưới dạng trả lời các câu hỏi để giúp cho các nhà nghiên cứu có thể giải đáp các vướng mắc của mình khi tiến hành một đề tài nghiên cứu khoa học cụ thể. 1. Mối liên quan giữa quần thể và mẫu nghiên cứu, giữa thống kê mô tả và thống kê suy luận trong nghiên cứu như thế nào? Trong nghiên cứu, đặc biệt là với các nghiên cứu cộng đồng trên một diện rộng thì người nghiên cứu thường không thể nào điều tra được tất cả các cá thể trong một quần thể nghiên cứu mà thường chỉ điều qua thông qua một mẫu nghiên cứu được rút ra từ quần thể theo các cách khác nhau (xác suất hoặc không xác suất). Sơ đồ dưới đây trình bày mối liên quan giữa nhiều yếu tố trong một quá trình nghiên cứu: 6 Sơ đồ 2: Mối liên quan giữa quần thể, mẫu, thống kê mô tả và thống kê suy luận trong nghiên cứu Rõ ràng rằng khi nghiên cứu theo mẫu, người nghiên cứu không muốn kết luận của mình chỉ áp dụng với mẫu nghiên cứu (thống kê mô tả) mà muốn kết luận cho cả quần thể nghiên cứu và quần thể đích. Để làm được điều này thì họ phải áp dụng thống kê suy luận với 2 phương pháp ước lượng hoặc kiểm định với các test thống kê thích hợp. Tuy nhiên quá trình ngoại suy này chỉ có thể được thực hiện khi mẫu được chọn theo phương pháp xác suất (tức là chọn ngẫu nhiên có tính đại diện cao) với cỡ mẫu đủ lớn. 2. Mối liên quan giữa tên đề tài, mục tiêu chung và mục tiêu cụ thể của nghiên cứu như thế nào? Nhiều người nghiên cứu thường không để ý đến mối liên quan của 3 yếu tố này nên khi đề xuất chúng thường phạm phải sai lầm khó có thể chấp nhận được. Hai ví dụ dưới đây thể hiện rõ sự bất cập này Tham số mẫu ( s, p .) QUẦN THỂ ĐÍCH QUẦN THỂ NGHIÊN CỨU Mẫu Tham số quần thể (, , P .) Mẫu xác suất - Ngẫu nhiên đơn - Ngẫu nhiên hệ thống - Mẫu phân tầng - Mẫu chùm - Mẫu nhiều bậc Mẫu không xác suất - Mẫu kinh nghiệm - Mẫu thuận tiện - Mẫu chỉ tiêu - Mẫu có mục đích. Chọn loại thiết kế và chọn mẫu nghiên cứu Ước lượng - điểm - khoảng Kiểm định giả thuyết Suy luận thông kê (Chỉ áp dụng cho mẫu xác suất với cỡ mẫu đủ lớn) (Thống kê suy luận) Kết luận ngoại suy Các khái niệm: - Khung chọn mẫu - Đơn vị quan sát - Đơn vị mẫu - Biến nghiên cứu - Các chỉ số Các test thống kê Giá trị p Lựa chọn Mô tả các tham số mẫu (trình bày kết quả nghiên cứu) (Thống kê mô tả) Biến số 7 Ví dụ 1: • Tên đề tài: Cao huyết áp của người cao tuổi tại huyện A năm 2010 và một số yếu tố ảnh hưởng • Mục tiêu chung: Xác định tỷ lệ cao huyết áp của người cao tuổi tại huyện A năm 2010 và một số yếu tố ảnh hưởng • Mục tiêu cụ thể: 1. Xác định tỷ lệ cao huyết áp của người cao tuổi tại huyện A. 2. Xác định một số yếu tố liên quan đến tình trạng cao huyết áp. 3. Đề xuất (và thăm dò) một số giải pháp can thiệp cộng đồng làm giảm tỷ lệ tăng huyết áp. Ví dụ 2: • Tên đề tài: Huyết áp của người dân tại huyện A năm 2010 và một số yếu tố ảnh hưởng • Mục tiêu chung: Xác định tỷ lệ cao huyết áp của người cao tuổi tại huyện A năm 2010 và một số yếu tố ảnh hưởng • Mục tiêu cụ thể: 1. Xác định tỷ lệ cao huyết áp của người cao tuổi tại huyện A. 2. Xác định một số yếu tố liên quan đến tình trạng cao huyết áp. 3. Đánh giá hiệu quả của một số giải pháp can thiệp cộng đồng làm giảm tỷ lệ tăng huyết áp. Rõ ràng là ví dụ 1 thể hiện rõ tên đề tài bao trùm mục tiêu chung, còn mục tiêu chung lại bao trùm mục tiêu cụ thể và đều tập trung vào cùng một vấn đề nghiên cứu là cao huyết áp, cùng một đối tượng nghiên cứu là người cao tuổi, cùng một địa dư (không gian) là huyện A và trong cùng một thời điểm nghiên cứu là năm 2010. Trong khi đó ở ví dụ 2 thì vấn đề nghiên cứu (huyết áp) và đối tượng nghiên cứu (người dân) nêu trong tên đề tài quá rộng so với mục tiêu chung (cao huyết áp và người cao tuổi), và 1 trong 3 mục tiêu cụ thể (mục tiêu 3) lại không hề được đề cập trong mục tiêu chung và tên đề tài, do vậy nếu ta hình tượng hóa tên đề tài như mái nhà, mục tiêu chung như trần nhà, các mục tiêu cụ thể như các cột nhà thì với ví dụ 1 ta sẽ có được hình một ngôi nhà hợp lý (hình 1) còn với ví dụ 2 ta sẽ có hình một ngôi nhà có mái quá to, trần quá nhỏ và có một cột nhà nằm ngoài cả trần lẫn mái nhà (hình 2) Hình 1: Hình tượng ngôi nhà ứng với ví dụ 1 Mục tiêu 3 Mục tiêu 2 Mục tiêu 1 Mục tiêu chung Tên đề tài 8 Hình 2: Hình tượng ngôi nhà ứng với ví dụ 2 3. Mối liên quan giữa mục tiêu cụ thể và biến số như thế nào? Làm thế nào để chọn đúng và đủ biến số cho một nghiên cứu? Như ta đã biết, biến số quyết định bản chất và nội dung của mỗi nghiên cứu và với mỗi mục tiêu nghiên cứu cụ thể thì cần các biến số khác nhau. Nếu ta đã coi các mục tiêu cụ thể như những cái cột của ngôi nhà (hình 1 và 2) thì biến số chính là các vật liệu giúp ta hình thành được từng cái cột nhà đó. Sơ đồ 2 ở phần trên đã chỉ rõ sau khi chọn mẫu xong thì người nghiên cứu sẽ tiến hành thu thập số liệu trên các đối tương nghiên cứu dựa vào các biến số và sau đó quá trình phân tích số liệu, viết báo cáo cũng chỉ dựa vào các biến số này. Việc xác định đúng và đủ biến số trước khi triển khai nghiên cứu là vô cùng quan trọng vì nếu thiếu biến số thì sẽ không có đủ dữ liệu để phân tích và như vậy mục tiêu nghiên cứu có thể không đạt được (như một cái cột nhà thiếu nguyên vật liệu để tạo ra nó). Tuy nhiên nếu xác định thừa biến số thì cũng sẽ rất lãng phí thời gian, công sức và kinh phí để thu thập số liệu cho các biến số thừa đó vì nó sẽ không được sử dụng trong nghiên cứu. Vì vậy người ta khuyên rằng khi xác định và chọn biến số người nghiên cứu cần trả lời các câu hỏi sau: - Những biến số nào là cần phải thu thập để khi phân tích ta có đủ số liệu kết luận cho từng mục tiêu cụ thể? - Những biến số nào được đề cập đến trong phần dự kiến trình bày kết quả nghiên cứu của đề cương nghiên cứu đã được phê duyệt? Bằng việc trả lời 2 câu hỏi này, người nghiên cứu sẽ biết được những biến số nào đã được chọn thừa và biến số nào còn thiếu (so sánh biến có trong trong bộ công cụ thu thập số liệu với những biến có trong phần dự kiến kết quả nghiên cứu). 4. Khi nào thì biến định lượng không nên (hoặc nên) chuyển sang dạng định tính để thu thập? Rất nhiều người đều biết rằng biến định lượng là những biến có giá trị là các con số (như số đo huyết áp của biến huyết áp) còn biến định tính có giá trị là các chữ viết hay ký hiệu (như tên tỉnh, huyện, xã của một biến địa dư) và biến định lượng có thể được chuyển sang dạng định tính để thu thập số liệu (biến tuổi nghề tính bằng năm được chuyển thành các nhóm tuổi nghề < 5 năm, từ 5-10 năm, từ 11-15 năm, từ 16-Mục tiêu 3 Mục tiêu 2 Mục tiêu chung Tên đề tài Mục tiêu 1 9 20 năm và > 20 năm, nhưng có nhiều người không hiểu rõ khi một biến định lượng chuyển sang dạng định tính để thu thập số liệu, tính giá trị của chúng bị giảm đi đáng kể. Hình 3 và 4 dưới đây minh họa cho nhận xét này: Hình 3: Hai nhóm trẻ có tỷ lệ suy dinh dưỡng bào thai như nhau nhưng cân nặng khi đẻ trung bình lại rất khác nhau Nếu những đứa trẻ có cân nặng khi đẻ < 2.500 gram được coi là suy dinh dưỡng bào thai thì nhóm trẻ A và B đều có tỷ lệ trẻ suy dinh dưỡng bào thai như nhau và đều là 10% (50 trẻ có cân nặng < 2.500 gram trên tổng số 500 trẻ được điều tra). Tuy nhiên nếu nhìn sự phân bố cân nặng của từng trẻ trên trục số thì hai nhóm trẻ này có sự khác biệt rất đáng kể và chắc chắn là cân nặng trung bình của nhóm trẻ A sẽ lớn hơn nhiều so với nhóm trẻ B. Cũng tương tự như vậy, tình trạng cao huyết áp của đối tượng nghiên cứu thuộc hai nhóm C và D biểu thị trong hình dưới đây cho thấy hai nhóm này có tỷ lệ đối tượng bị cao huyết áp tối đa là như nhau (40%) và huyết áp trung bình của hai nhóm này có thể khác biệt không đáng kể, nhưng nếu xét về mức độ phân tán huyết áp của từng cá thể thì nhóm D có độ phân tán cao hơn nhiều so với nhóm C và như vậy độ lệch chuẩn của huyết áp tối đa của nhóm D sẽ cao hơn nhóm C. Hình 4: Hai nhóm đối tượng nghiên cứu có tỷ lệ cao huyết áp như nhau, giá trị huyết áp trung bình không khác biệt nhưng độ lệch chuẩn lại rất khác nhau Như vậy, nếu các bộ số liệu trên được chuyển ngay sang dạng biến nhị phân để phân tích thì ta không thể phát hiện được sự khác biệt khi chúng ở dưới dạng định lượng. Chính vì những lý do nêu trên, người ta khuyên là khi thu thập số liệu, ta cố gắng thu thập chúng ở dưới dạng định lượng. Ví dụ: Câu hỏi thu thập tuổi nghề của công nhân: + Dạng biến định lượng (nên): Anh/Chị đã làm bao nhiêu năm trong nghề này: . . . . . . . (năm) 2500 gr 50 trẻ 450 trẻ B 2500 gr 50 trẻ 450 trẻ A 140 mmHg 300 người 200 người C 140 mmHg 300 người 200 người D 10 + Dạng biến định tính (không nên): Anh/Chị đã làm bao nhiêu năm trong nghề này (đánh dấu vào ô thích hợp) [ ] < 5 năm [ ] 5 - 10 năm [ ] 11 - 15 năm [ ] > 15 năm Tuy nhiên trong một số trường hợp, người ta lại khuyên nên chuyển số liệu định lượng sang dạng định tính để thu thập khi ta không thể hoặc không cần thu thập chúng dưới dạng định lượng. Ví dụ: Hỏi số điếu thuốc lá một người hút trung bình/ngày, ta chỉ nên thu thập dưới dạng định tính: + Dạng biến định lượng (không nên): Anh/Chị hút trung bình bao nhiêu điếu thuốc lá trong một ngày?: . . . . (điếu) + Dạng biến định tính (nên): Anh/Chị hút trung bình bao nhiêu điếu thuốc lá/ngày?(chọn ô thích hợp) [ ] < 5 điếu [ ] 5 - 10 điếu [ ] 11 - 15 điếu [ ] > 15 điếu 5. Có các loại thiết kế nghiên cứu nào và phân biệt chúng như thế nào? Thiết kế nghiên cứu thực chất không phải là bài học mà thuộc môn học thống kê, nhưng nó lại rất liên quan đến thống kê vì việc chọn mẫu, tính toán cỡ mẫu và phân tích số liệu đều bị ảnh hưởng bởi loại thiết kế nghiên cứu. Do vậy trong tài liệu này, chúng tôi xin được trình bày một số sơ đồ phân loại một số loại thiết kế nghiên cứu phổ biến có liên quan nhiều đến thống kê. Hiện có nhiều cách phân loại thiết kế nghiên cứu nhưng có thể chia làm 3 nhóm chính theo cách sau: Sơ đồ 3: Phân loại các nhóm thiết kế nghiên cứu NC khoa học cơ bản NC ứng dụng 1. Theo loại hình nghiên cứu NC hành động NC định lượng NC định tính 2. Theo bản chất nghiên cứu 3. Theo cách thiết kế nghiên cứu dịch tễ học NC dọc NC ngang NC quan sát NC can thiệp Mô tả Phân tích Lâm sàng Cộng đồng NC Bệnh - Chứng NC Thuần tập [...]... Giang, Lê Văn Hợi Thống kê cơ bản trong y sinh học, Nhà xuất bản Y học, 2010 2 Lưu Ngọc Hoạt và cộng sự: Ứng dụng thống kê y sinh học trong các bài báo khoa học y học, Khóa luận tốt nghiệp cử nhân YTCC ĐH Y Hà Nội, năm 2009 3 Lưu Ngọc Hoạt Thống kê và tin học ứng dụng trong Nghiên cứu y học, Nhà xuất bản Y học, 2008 4 Pamela Wright, Peter Mason, Lưu Ngọc Hoạt Viết và xuất bản bài báo khoa học Quốc tế (bản... trên, tuy nhiên ở Việt Nam, việc giảng d y về thống kê, tin học trong y học chưa được đổi mới theo đúng tốc độ phát triển của hai môn học n y Với tài liệu n y, chúng tôi mong muốn nêu lên tính cần thiết và cấp bách trong việc phải đổi mới giảng d y thống kê và tin học y học trong các trường đại học y và tổng hợp những sai sót thường gặp của cán bộ y tế khi áp dụng thống kê trong nghiên cứu khoa học, cũng... research) là một loại nghiên cứu ứng dụng mà người nghiên cứu cũng chính là người sẽ ứng dụng các kết quả, kiến nghị từ nghiên cứu vào thực tế Như v y nghiên cứu hành động trong y học thường xuất phát từ nhu cầu thực tế của một vài cán bộ y tế nào đó có các khó khăn trong việc thực thi các công việc hàng ng y và họ muốn làm nghiên cứu, hoặc mời nhà nghiên cứu giúp họ triển khai nghiên cứu để tìm giải... quan mật thiết với thống kê và có thể hỗ trợ rất nhiều cho việc ứng dụng thống kê trong nghiên cứu khoa học Trước đ y khi tin học chưa phát triển, những người làm nghiên cứu khoa học đã gặp rất nhiều khó khăn trong thiết kế công cụ nghiên cứu, thu thập, xử lý, phân tích số liệu, tham khảo và sắp xếp các tài liệu nghiên cứu Ng y nay với sự bùng nổ của công nghệ thông tin, người nghiên cứu đã có rất nhiều... áp dụng phân tích hồi quy đa biến, còn nếu biến phụ thuộc là biến nhị phân thì người ta áp dụng phân tích hồi quy logistics 23 KẾT LUẬN: Thống kê là một môn học có lịch sử rất lâu đời nhưng khá khó và trừu tượng, nên nhiều nhà nghiên cứu luôn cảm th y khó khăn khi ứng dụng chúng trong nghiên cứu Trong khi đó, tin học lại là một lĩnh vực khá mới mẻ và mặc dù nó thuộc một phạm trù khác với thống kê. .. phân loại dựa vào y u tố thời gian (nghiên cứu ngang khi các đối tượng nghiên cứu chỉ được thu thập số liệu một lần và nghiên cứu dọc khi các đối tượng được thu thập số liệu nhiều lần tại các khoảng thời gian khác nhau) và phân loại theo bản chất tác động của người nghiên cứu đến đối tượng nghiên cứu (nghiên cứu quan sát hay can thiệp) như trong sơ đồ dưới đ y: Thiết kế nghiên cứu dịch tễ học NC can thiệp.. .Trong đó: - Nghiên cứu khoa học cơ bản là những nghiên cứu có tính phát minh thường được làm bởi những người được đào tạo cơ bản chuyên để làm nghiên cứu; - Nghiên cứu ứng dụng (applied research) là loại nghiên cứu mà người nghiên cứu thường ứng dụng những kết quả nghiên cứu hoặc phát minh của những nhà nghiên cứu khác vào địa phương hoặc lĩnh vực công tác của mình; Nghiên cứu hành động... chuyển dạng thành bộ số liệu chuẩn để tổng hợp và áp dụng các 15 test thống kê với phân bố chuẩn (test tham số) Quá trình n y có thể dễ dàng triển khai với một số phần mềm thống kê như STATA: 30 Frequency Frequency 34 0 0 14 45 1.83177 age Bộ số liệu trước khi chuyển dạng BC(age,-.2959) 2.28396 Bộ số liệu sau khi chuyển dạng Khi trình b y các kết quả nghiên cứu dưới dạng biểu đồ, đồ thị thì mỗi loại số. .. họ cải thiện những bất cập trong công việc hàng ng y Vì v y loại nghiên cứu n y thường có tính ứng dụng rất cao và thường được nhiều nhà tài trợ quan tâm hỗ trợ Loại nghiên cứu định tính và định lượng là hai loại nghiên cứu có cách tiếp cận rất khác nhau nhưng lại hỗ trợ nhau rất nhiều Bảng dưới đ y tổng hợp sự khác biệt giữa hai loại nghiên cứu n y và ý nghĩa của chúng trong nghiên cứu: - - Bảng 2:... được hay không cũng như chất lượng và tính chính xác của quá trình ngoại suy Dưới đ y là một số điểm cần lưu ý: 1 Chỉ những nghiên cứu với mẫu được rút ra từ quần thể nghiên cứu một cách ngẫu nhiên với cỡ mẫu đủ lớn mới có thể ngoại suy ra quần thể được (sơ đồ 2) Do v y không nên lạm dụng các test thống kê để ngoại suy nếu mẫu được chọn không đáp ứng hai y u cầu trên Khi đó chỉ nên áp dụng thống kê mô . bất cập trong ứng dụng thống kê và tin học y học trong nghiên cứu khoa học, nhóm cán bộ giảng d y của Bộ môn Thống kê, Tin học Y học của Viện Đào tạo Y. 1 MỘT SỐ BẤT CẬP KHI ỨNG DỤNG THỐNG KÊ VÀ TIN HỌC TRONG NGHIÊN CỨU Y HỌC Lưu Ngọc Hoạt MỞ ĐẦU Ng y nay với sự bùng nổ của khoa học, kỹ