CHƯƠNG 3 : PHƯƠNG PHÁP NGHIÊN CỨU
3.4. DỮ LIỆU NGHIÊN CỨU
3.4.1. Mẫu nghiên cứu
3.4.1.1. Kích thước mẫu nghiên cứu
Theo Nguyễn Đình Thọ (2011), kích thước mẫu trong nghiên cứu phụ thuộc vào nhiều yếu tố khác nhau như phương pháp ước lượng, độ tin cậy… và kích thước mẫu càng lớn càng tốt nhưng sẽ tốn thời gian, kinh phí. Hiện nay, các tác giả thường sử dụng công thức kinh nghiệm cho từng phương pháp xử lý để xác định cỡ mẫu nghiên cứu. Cụ thể, đề tài sử dụng phương pháp phân tích hồi quy để ước lượng nên sẽ vận dụng công thức của Green (1991) để xác định cỡ mẫu:
N ≥ 50 + 8*m
Trong đó, N là quy mơ mẫu và m là số biến trong mơ hình nghiên cứu. Với trường hợp của đề tài, mơ hình nghiên cứu có 13 biến độc lập nên mẫu nghiên cứu tối thiểu phải bằng 154 quan sát.
3.4.1.2. Phương pháp chọn mẫu
Đề tài sử dụng phương pháp chọn mẫu thuận tiện, tức là phương pháp chọn mẫu phi xác suất.
3.4.2. Thu thập dữ liệu
3.4.2.1. Đối tượng khảo sát
Đối tượng tham gia nghiên cứu là những người trưởng thành đang sinh sống ở TP. Hồ Chí Minh. Các đối tượng tham gia khảo sát đảm bảo đều tự nguyện và trên 18 tuổi.
3.4.2.2. Phương pháp khảo sát
Trong điều kiện thời gian, kinh phí có giới hạn, đề tài sử dụng phương pháp thu thập thông tin thông qua phiếu khảo sát đã được chuẩn bị trước.
Địa điểm tiến hành thu thập dữ liệu là những nơi đông người, dễ tiếp cận đối tượng khảo sát để đề nghị họ tham gia nghiên cứu, như: Công viên, khu vui chơi,
siêu thị, trường học… Người tham gia nghiên cứu sẽ được chọn theo phương pháp thuận tiện kết hợp với phát triển mầm. Tức là sau khi tiếp cận được người chấp nhận tham gia nghiên cứu, tác giả sẽ đề nghị những người này giới thiệu bạn bè, người thân của họ cùng tham gia nghiên cứu.
Mặc dù có được một số thuận lợi khi thực hiện thu thập thông tin bằng phương pháp này nhưng việc thu thập thông tin qua phiếu khảo sát cũng tiềm ẩn rủi ro là những người tham gia khảo sát sẽ không trả lời đầy đủ các thông tin trong phiếu khảo sát. Do đó, sẽ có nhiều phiếu khảo sát được phát ra với kỳ vọng sẽ đáp ứng được yêu cầu về số lượng mẫu khảo sát phục vụ cho nghiên cứu.
3.4.3. Phương pháp phân tích dữ liệu
Đề tài sử dụng phương pháp hồi quy Binary Logistic đa biến để nghiên cứu những yếu tố tác động đến việc tiêm vắc xin phòng viêm gan B. Phương pháp hồi quy Binary Logistic được sử dụng là bởi theo Hoàng Trọng và Chu Nguyễn Mộng Ngọc (2008), phương pháp này được sử dụng khi biến phụ thuộc trong nghiên cứu ở dạng nhị phân để ước lượng xác suất một sự kiện có thể xảy ra với những thông tin của biến độc lập trong mơ hình nghiên cứu.
Với hồi quy Binary Logistic, thông thường ta chỉ cần thu thập về biến phụ thuộc là một sự kiện nào đó có xảy ra hay không, cụ thể trong trường hợp này là người tham gia nghiên cứu có tiêm vắc xin phịng viêm gan B hay khơng tiêm vắc xin phòng viêm gan B; biến phụ thuộc Y trong mơ hình nghiên cứu lúc này có giá trị 0 hoặc 1, với 0 là khơng tiêm vắc xin phịng viêm gan B và 1 là có tiêm vắc xin phịng viêm gan B. Từ biến phụ thuộc nhị phân này, một thủ tục sẽ được dùng để tính xác suất sự kiện có thể xảy ra theo quy tắc đó là nếu xác suất được dự đốn lớn hơn 0,5 thì kết quả dự đốn sẽ là “có” tiêm vắc xin phịng viêm gan B, ngược lại kết quả dự đốn sẽ là “khơng” tiêm vắc xin phịng viêm gan B. Để đơn giản khi tiếp cận, ta tiến hành xem xét một trường hợp cụ thể của mơ hình Binary Logistic khi chỉ có một biến độc lập X như sau:
Pi = E (Y = 1/X) = 𝑒(𝛽0+𝛽1𝑋) 1+ 𝑒(𝛽0+𝛽1𝑋)
Trong công thức nêu trên, Pi = E (Y = 1/X) = P (Y = 1) gọi là xác suất để sự kiện xảy ra (Y = 1) khi biến độc lập X có giá trị cụ thể Xj. Ký hiệu biểu thức (β0 + β1X) là z, biểu thức được viết lại như sau:
P (Y = 1) = 𝑒 𝑧 1+ 𝑒𝑧 Xác suất không xảy ra sự kiện được xác định:
P (Y = 0) = 1 – P (Y = 1) = 1 - 𝑒 𝑧 1+ 𝑒𝑧
Khi so sánh xác suất xảy ra sự kiện với xác suất không xảy ra sự kiện, tỷ lệ chênh lệch được thể hiện như sau:
𝑃(𝑌=1) 𝑃(𝑦=0)=
𝑒𝑧 1+ 𝑒𝑧 1−1+ 𝑒𝑧𝑒𝑧 Lấy log cơ số e hai vế và thực hiện biến đổi:
𝑙𝑜𝑔𝑒 [𝑃(𝑌=1) 𝑃(𝑦=0) ] = 𝑙𝑜𝑔𝑒𝑒𝑧 Vì 𝑙𝑜𝑔𝑒𝑒𝑧 = z nên kết quả là: 𝑙𝑜𝑔𝑒 [𝑃(𝑌=1) 𝑃(𝑦=0) ] = β0 + β1X Hay có thể viết: 𝑙𝑜𝑔𝑒 [ 𝑃𝑖 1−𝑃𝑖 ] = β0 + β1X
Biểu thức nêu trên là dạng hàm hồi quy Binary Logistic và có thể mở rộng mơ hình Binary Logistic cho nhiều biến độc lập Xk.