liệu điều tra
Đỏnh giỏ chất lượng thụng tin thống kờ tại Việt Nam dựa trờn sỏu tiờu thức, gồm: tớnh phự hợp, tớnh chớnh xỏc, tớnh kịp thời, khả năng tiếp cận, khả năng giải thớch và tớnh chặt chẽ, logic (Bộ kế hoạch và đầu tư, 2015). Trong 6 tiờu thức này, cú tiờu thức mang tớnh chủ quan thuộc về người quản lý số liệu và thiết kế điều tra, cú những tiờu thức mang tớnh khỏch quan phụ thuộc vào những đối tượng điều tra, trong
đú những yếu tố khỏch quan cần được quan tõm nghiờn cứu kỹ trong thiết kế và đỏnh giỏ điều tra để giảm tỏc động của chỳng đến chất lượng số liệu điều trạ
Như đó giới hạn phạm vi nghiờn cứu, chất lượng số liệu điều tra trong luận ỏn này được xem xột thuần tỳy ở khớa cạnh tớnh chớnh xỏc của số liệu điều tra, tớnh chớnh xỏc của ước lượng tỷ lệ hành vi nguy cơ lõy nhiễm HIV trong cộng đồng dõn cư. Do vậy, luận ỏn nghiờn cứu mối quan hệ tỏc động của cỏc kỹ thuật thu thập thụng tin đối với ước lượng tỷ lệ hành vi nguy cơ lõy nhiễm HIV. Mục 1.1.3 đó trao đổi về việc sử
dụng cõu hỏi, bảng cõu hỏi và kỹ thuật thu thập thụng tin chủ đề nhạy cảm, việc sử
dụng cỏc cõu hỏi khỏc nhau và cỏc kỹ thuật thu thập thụng tin khỏc nhau sẽ tạo ra sự
khỏc biệt cú ý nghĩa thống kờ đối với cỏc ước lượng tỷ lệ về hành vi nguy cơ (Brener và cỏc cộng sự, 2004; Biemer và Lyberg, 2003).
Theo lý thuyết về chất lượng số liệu điều tra, cú hai xu hướng chớnh đỏnh giỏ chất lượng số liệu là Tổng sai số điều tra và Tổng quản lý chất lượng (Groves et al., 2004). Trong đú Tổng sai số điều tra bao gồm cỏc nguyờn nhõn như: Sai số phạm vi; Sai số mẫu; Sai số khụng trả lời; Sai số đo lường (liờn quan đến kỹ thuật thu thập thụng tin; ĐTV, đối tượng điều tra…); Sai số xử lý; Sai số hiệu chỉnh sau điều trạ Theo lý thuyết này, kỹ thuật thu thập thụng tin cú tỏc động đến sai số đo lường như
một khớa cạnh của vấn đề chất lượng số liệụ Trong một số nghiờn cứu đó thực hiện, tỷ
lệ khụng trả lời là một trong những tiờu thức được sử dụng phổ biến để đỏnh giỏ chất lượng số liệu (De Leeuw & van der Zouwen, 1988; Aigul Mavletova, 2013; Laura H. Lind và cỏc cộng sự, 2013…). Hai loại tỷ lệ khụng trả lời gồm tỷ lệ khụng trả lời toàn bộ/ tỷ lệ khụng tham gia điều tra (tiếng Anh là Unit non response) và tỷ lệ khụng trả
lời biến/tỷ lệ khụng trả lời cõu hỏi (tiếng Anh là Variable/item non response). Tỷ lệ
khụng trả lời toàn bộ là do đối tượng điều tra từ chối tham gia điều tra, do khụng liờn lạc được hay do đối tượng điều tra đó chuyển chỗở mới (đối với điều tra mẫu cốđịnh). Tỷ lệ khụng trả lời toàn bộ gõy ra sai số khụng trả lời và trong trường hợp này tương tự như sai số bao phủ, là một hàm của tỷ lệ khụng trả lời và sự khỏc biệt về đặc điểm nghiờn cứu giữa những người trả lời và khụng trả lờị Do vậy nếu tỷ lệ khụng trả lời cao nhưng sự khỏc biệt về đặc điểm của những người trả lời và khụng trả lời khụng
được đo lường thỡ người dựng tin sẽđặt ra cõu hỏi về chất lượng số liệu hoặc cú những nghi ngờ về chất lượng số liệu (Biemer và Lyberg, 2003). Tỷ lệ khụng trả lời cõu hỏi xảy ra do một số nguyờn nhõn như: bảng cõu hỏi, cỏch đặt cõu hỏi hoặc do tớnh “nhạy cảm” của cỏc thụng tin được hỏị Trong đú, một bảng cõu hỏi quỏ dài cũng gõy ra ỏp lực cho đối tượng điều tra làm cho họ bỏ cuộc khi chưa hoàn thành xong cuộc phỏng vấn. Giống như tỷ lệ khụng trả lời toàn bộ, tỷ lệ khụng trả lời cõu hỏi sẽ ảnh hưởng
đến kết quảước lượng của cuộc điều trạ Bờn cạnh đú, tiờu thức ước lượng “nhiều hơn là tốt hơn” cũng được cỏc nghiờn cứu sử dụng để đỏnh giỏ chất lượng số liệu điều tra (Lensvelt-Mulders et al., 2005; Tourangeau và Yan, 2007). Đối với những thụng tin nhạy cảm về cỏc hành vi khụng theo chuẩn mực xó hội như cỏc hành vi nguy cơ lõy nhiễm HIV, bạo lực gia đỡnh, ... người cung cấp thụng tin thường cú xu hướng dấu thụng tin theo hướng khụng bỏo cỏo hoặc bỏo cỏo khụng đỳng như thực tế (bỏo cỏo theo chuẩn mực xó hội). Kết quả là sẽ tạo ra những ước lượng chệch (bỏo cỏo ớt hơn thụng tin về vấn đề nhạy cảm). Do vậy, để so sỏnh cỏc kỹ thuật thu thập số liệu khỏc nhau trong điều tra về một chủđề nhạy cảm khụng theo chuẩn mực xó hội như hành vi nguy cơ lõy nhiễm HIV thỡ tiờu thức “nhiều hơn là tốt hơn” là một tiờu thức tốt để sử
dụng để so sỏnh, đỏnh giỏ kỹ thuật thu thập thụng tin.
Để thu thập thụng tin phục vụ đỏnh giỏ kỹ thuật thu thập thụng tin theo những tiờu thức như đó trỡnh bày, cỏc nghiờn cứu đó sử dụng cỏc phương phỏp điều tra: Phương phỏp điều tra mẫu ngẫu nhiờn (RS); Phương phỏp bỏn thực nghiệm; Đỏnh giỏ tỏc động vĩ mụ (Haughton Dominique, Haughton Jonathan, 2011; Paul J. Gertler và cỏc cộng sự, 2011).
(1) Phương phỏp điều tra ngẫu nhiờn phõn chia mẫu điều tra thành hai nhúm một cỏch ngẫu nhiờn: nhúm thứ nhất tham gia vào chương trỡnh (gọi là nhúm đối chứng), nhúm thứ hai khụng tham gia vào chương trỡnh (gọi là nhúm kiểm soỏt). Kết quả đỏnh giỏ tỏc động của chương trỡnh được đo lường bằng hệ số ước lượng bˆ trong mụ hỡnh hồi quy dưới đõy:
i i i a bT Y = + +ε Trong đú: Yi : tỏc động của chương trỡnh đối với biến kết quả nghiờn cứu; i: đơn vị nghiờn cứu (cỏ nhõn hoặc hộ gia đỡnh);
Ti: Nhúm đối chứng (Ti =1: cú tham gia chương trỡnh; Ti = 0: khụng tham gia chương trỡnh).
RS được coi là “tiờu chuẩn vàng” đối với một thực nghiệm khoa học (Murray, 2005; Rubin & Waterman, 2006). Phương phỏp này được thực hiện minh bạch và đảm bảo cơ hội tham gia chương trỡnh của cỏc đơn vị điều tra trong tổng thể là như nhau (cơ hội nhận được nguồn lực của chương trỡnh là như nhau) và được xem là phương phỏp tốt nhất vềđỏnh giỏ tỏc động chương trỡnh (Paul J. Gertler et al, 2011). Tuy nhiờn
trong thực tế RS cũn một số hạn chế (Haughton Dominique, Haughton Jonathan, 2011) như sau:
+ Tớnh cụng bằng trong đạo đức nghiờn cứu khụng đảm bảo, đặc biệt đối với cỏc điều tra cú phõn bổ nguồn lực hoặc nguồn tài trợ. Mặc dự cú xỏc suất chọn tham gia vào chương trỡnh như nhau, RS vẫn chỉ được được thực hiện trờn một nhúm đối tượng. Nhúm cũn lại mặc dự cú cựng đặc tớnh (vớ dụ như cựng là người nghốo hoặc người suy dinh dưỡng…) nhưng khụng được nhận hỗ trợ từ chương trỡnh. Điều này làm giảm tớnh cụng bằng trong đạo đức nghiờn cứụ Trong thực tế, đó cú trường hợp từ
chối thực hiện RS để đỏnh giỏ tỏc động của thu nhập đối với chi tiờu của hộ gia đỡnh Việt Nam với mức đề xuất hỗ trợ nhúm đối chứng $100.
+ Lựa chọn ngẫu nhiờn cỏc đối tượng điều tra trong thực tế là một cụng việc khú khăn do mẫu điều tra thường khụng được cập nhật thường xuyờn hoặc đối tượng điều tra từ chối tham gia nghiờn cứụ Do vậy, mẫu điều tra sẽ khụng hoàn toàn ngẫu nhiờn;
+ Cỏc ảnh hưởng của hiệu ứng tràn5 (thuật ngữ tiếng Anh là Spillover) trong quỏ trỡnh nghiờn cứu đỏnh giỏ tỏc động của sự can thiệp.
(2) Phương phỏp bỏn thực nghiệm: Cỏch thực hiện của phương phỏp này giống như RS, tuy nhiờn việc lựa chọn cỏc đơn vị điều tra vào cỏc nhúm đối chứng và kiểm soỏt khụng hoàn toàn ngẫu nhiờn do lựa chọn địa bàn khụng ngẫu nhiờn hoặc lựa chọn
đối tượng tham gia điều tra khụng ngẫu nhiờn (vớ dụ, lựa chọn những người khả năng
đến địa điểm phỏng vấn và sẵn sàng tham gia điều tra hơn là lựa chọn những người bận rộn hoặc cú vấn đề về sức khỏe khụng đến được nơi phỏng vấn). Phương phỏp này gõy ra một số vấn đề của tớnh ngẫu nhiờn và ảnh hưởng đến sai số chọn mẫụ Để khắc phục hạn chế này, phương phỏp bỏn thực nghiệm cần phải sử dụng thờm cỏc cụng cụ thống kờ
đểđiều chỉnh sai lệch chọn mẫu đối với kết quả phõn tớch số liệu như phương phỏp so sỏnh hài hũa (thuật ngữ tiếng Anh là Matching comparisions), nhõn đụi sự khỏc biệt (thuật ngữ tiếng Anh là Double differences) thụng qua việc thực hiện điều tra mẫu cố định (PS) ở cả hai mẫu đối chứng và kiểm soỏt, thực hiện điều tra hai giai đoạn: trước và sau khi cú tỏc động can thiệp của chương trỡnh.
(3) Đỏnh giỏ tỏc động vĩ mụ: Đỏnh giỏ tỏc động của cỏc cỳ sốc hoặc đỏnh giỏ những tỏc động khụng mong đợi hoặc khụng dự đoỏn trước. Cú một số kỹ thuật đó
được nghiờn cứu phục vụ cho loại đỏnh giỏ này, như:
5Hiệu ứng tràn là sự tỏc động của một phương phỏp hay kỹ thuật đến kết quả thực hiện của phương phỏp/kỹ thuật cũn lạị
+ Phõn tớch số liệu theo chuỗi thời gian đểđỏnh giỏ sự khỏc biệt theo xu hướng. + Mụ hỡnh cõn bằng tổng thể (thuật ngữ tiếng Anh là Computable General Equilibrium and Simulation Models).
+ Phõn tớch tỏc động sử dụng dữ liệu mảng (từ PS). Cũng giống nhưđỏnh giỏ tỏc động của chương trỡnh/dự ỏn, việc đỏnh giỏ tỏc động kinh tế vĩ mụ sử dụng dữ
liệu mảng là một phương phỏp mạnh cú thể được sử dụng nếu cú thụng tin về điều tra cơ sở trước khi cú can thiệp và sau khi cú can thiệp của chương trỡnh. Cả hai vũng
điều tra này cần đảm bảo tớnh so sỏnh về cõu hỏi sử dụng, kỹ thuật thu thập thụng tin và được thực hiện trờn cựng cỏc đơn vịđiều tra ở hai lần thu thập số liệụ
Đối với nghiờn cứu đỏnh giỏ tỏc động của kỹ thuật thu thập thụng tin, PS cho phộp đo lường tỏc động thuần tỳy của kỹ thuật thu thập thụng tin dựa trờn cơ sở so sỏnh kết quả của cựng một chỉ tiờu, với những đặc điểm của đối tượng như nhau do cựng một ĐTV thực hiện (De Leeuw và cỏc cộng sự, 2007; Biemer và Lyberg, 2003).
Đối tượng điều tra cú thể sẽ cảm thấy lạ khi một cõu hỏi được hỏi hai lần, tuy nhiờn sự
ngạc nhiờn này sẽ giảm đi nếu những cõu hỏi giống nhau này được hỏi ở hai loại bảng cõu hỏi khỏc nhau và được hỏi ở hai thời điểm khỏc.
Bờn cạnh những lợi thế của dữ liệu mảng trong đỏnh giỏ tỏc động, một số hạn chế của phương phỏp này như: thực hiện và duy trỡ điều tra mẫu cốđịnh cần cú những hiểu biết, kỹ năng và kinh nghiệm tổ chức thực hiện nhất định; duy trỡ mẫu (để giảm tỷ
lệ bỏ cuộc), giảm tỏc động của hiệu ứng tràn đối với kết quả điều tra, phõn tớch và
đỏnh giỏ dữ liệu mảng...
Trong phõn tớch đỏnh giỏ tỏc động của kỹ thuật thu thập thụng tin và cỏc yếu tố
về cỏc đặc điểm cỏ nhõn của đối tượng điều tra đối với cỏc cỏc thụng tin về chủ đề
nhạy cảm được nghiờn cứu, phõn tớch hồi quy đa nhõn tố thường được sử dụng trong
đỏnh giỏ. Mục tiờu của phõn tớch hồi quy đa nhõn tố trong nghiờn cứu về chủđề nhạy cảm là mụ tả tỏc động của một vộc tơ cỏc yếu tố cú thể tỏc động đến cõu trả lời về chủ đề nhạy cảm, cỏc yếu tố đú bao gồm kỹ thuật thu thập thụng tin được ỏp dụng, những
đặc điểm cỏ nhõn của người cung cấp thụng tin, mụi trường diwwnx ra cuộc phỏng vấn,… Mụ hỡnh hồi quy được sử dụng dưới dạng sau:
Pr(Y=1| Xi =x) = fβ(x)
Trong đú Pr(Y=1| Xi =x) xỏc suất ước lượng về thụng tin nhạy cảm (Y) trong
điều kiện của yếu tố tỏc động của cỏc biến độc lập- cỏc yếu tố cú thể tỏc động đến thụng tin nhạy cảm trong nghiờn cứu; β là tham số tổng thể mà chỳng ta khụng biết. Một mụ hỡnh phõn tớch hồi quy đa nhõn tố hay được sử dụng trong nghiờn cứu về thực
hiện hành vi mang tớnh nhạy cảm là mụ hỡnh hồi quy logistics (Graeme Blair, Kosuke Imai và Yang- Yang Zhou, 2015).
Mụ hỡnh hồi quy logistics dạng tổng quỏt như sau (Greene, W.H, 2013):
= 1| =
1 +
Trong mụ hỡnh này, Y là biến về chủđề nghiờn cứu (trong trường hợp của luận ỏn là hành vi nguy cơ lõy nhiễm HIV) và x là vộc tơ cỏc biến độc lập cú khả năng tỏc
động đến xỏc suất xảy ra của biến phụ thuộc.
Dựa trờn lý thuyết thống kờ, yờu cầu đỏnh giỏ tỏc động của cỏc kỹ thuật thu thập thụng tin nhạy cảm và nguồn lực thực hiện nghiờn cứu, PS cú thể là phương phỏp
điều tra phự hợp để thực hiện nghiờn cứu do dễ thực hiện, tiết kiệm kinh phớ và đảm bảo đỏnh giỏ tỏc động thuần tỳy của kỹ thuật thu thập thụng tin đối với chất lượng số
liệu điều tra thu thập được. Trong đú, cõn nhắc tiờu thức đỏnh giỏ về tỷ lệ khụng trả
lời, tỷ lệ cõu trả lời “Cú” hoặc ước lượng “nhiều hơn là tốt hơn” trong đỏnh giỏ tỏc
động của kỹ thuật thu thập thụng tin về chủ đề nhạy cảm đối với chất lượng số liệu
điều tra thu thập được.
1.2. Những vấn đề thực tiễn về nghiờn cứu và ứng dụng kỹ thuật thu thập thụng tin chủđề nhạy cảm nhằm nõng cao chất lượng số liệu điều tra