Bài viết đề cập các nội dung sau: (1) Hướng dẫn xác định các đơn vị chọn mẫu ban đầu (còn gọi là đơn vị chọn mẫu cấp 1, viết tắt là PSU) cho các cuộc điều tra hộ gia đình; (2) Thảo luận về sự phân tầng của điều tra như một công cụ để cải thiện độ chính xác của ước lượng điều tra; (3) Thảo luận về kế hoạch lựa chọn mẫu để có thể kiểm soát hiệu quả thiết kế của các cuộc điều tra phức tạp.
Kinh nghiệm thiết kế mẫu chủ… Thống kê Quốc tế Hội nhập Kinh nghiệm thiết kế mẫu chủ … cho điều tra hộ gia đình Bangladesh Cục Thống kê Bangladesh (BBS) quan phủ ủy quyền thực thu thập liệu phục vụ biên soạn số liệu thống kê thức cho Bangladesh Các điều tra hộ gia đình phạm vi tồn quốc cơng cụ thu thập liệu ban đầu BBS Trước tiến hành Khảo sát lực lượng lao động (LFS) năm 2009-2010 điều tra Điều tra lao động việc làm 2005, Điều tra thu nhập chi tiêu hộ gia đình (HIES) năm 2005 điều tra hộ gia đình cuối tiến hành BBS sử dụng thiết kế mẫu tích hợp nhiều mục đích (Integrated Multi-Purpose Sampling Design, viết tắt IMPS) Tuy nhiên, nghiên cứu trước Maligalig Barcenas (2008) xác định thiếu sót kỹ thuật IMPS, đặc biệt giá trị “hiệu thiết kế (deff)” Bằng chứng nghiên cứu tiêu thức quan trọng quan tâm điều tra, tiêu “tỷ lệ thất nghiệp” thấy giá trị hiệu thiết kế (deff) lớn Vùng thống kê đô thị (SMA) cho khu vực lớn Dhaka, Chittagong Rajshahi, nguyên nhân biện pháp phân tầng khơng hiệu Ngồi ra, quyền số điều tra sử dụng IMPS không phản ánh xác suất lựa chọn hộ gia đình lấy đưa vào mẫu áp dụng thời điểm điều tra Hơn nữa, Maligalig Barcenas (2008) lưu ý số lượng hộ gia đình lấy mẫu đơn vị chọn mẫu cấp (PSU) giảm số lượng PSU tăng để giảm thiểu hiệu thiết kế lớn Do vấn đề này, BBS yêu cầu hỗ trợ kỹ thuật từ Ngân hàng Phát 20 triển châu Á năm 2008 để phát triển thiết kế mẫu dàn mẫu chủ sử dụng cho Khảo sát lực lượng lao động giai đoạn 2009-2010 tới Hơn nữa, mục tiêu hoạt động chuẩn bị cho thiết kế chọn mẫu liệu từ Tổng điều tra Dân số năm 2011 có sẵn Ngồi ra, phiên cập nhật sử dụng thiết kế mẫu chủ cho điều tra hộ gia đình mà BBS tiến hành Bài viết giới thiệu quy trình thực để xây dựng thiết kế mẫu cho LFS năm 2009-2010 BBS, sở cho thiết kế mẫu chủ Mong muốn thông tin đưa cung cấp, hướng dẫn kinh nghiệm cho nhà điều tra thống kê từ nước phát triển việc xây dựng thiết kế mẫu chủ cho điều tra hộ gia đình Bài viết đề cập nội dung sau: (1) Hướng dẫn xác định đơn vị chọn mẫu ban đầu (còn gọi đơn vị chọn mẫu cấp 1, viết tắt PSU) cho điều tra hộ gia đình; (2) Thảo luận phân tầng điều tra cơng cụ để cải thiện độ xác ước lượng điều tra; (3) Thảo luận kế hoạch lựa chọn mẫu để kiểm sốt hiệu thiết kế điều tra phức tạp Hƣớng dẫn xác định đơn vị chọn mẫu ban đầu Đơn vị chọn mẫu ban đầu hay gọi đơn vị chọn mẫu cấp viết tắt PSU Đối với điều tra hộ gia đình phạm vi tồn quốc nước phát triển, chọn mẫu nhiều tầng thường phù hợp chi phí SỐ 03– 2016 20 Thống kê Quốc tế Hội nhập Kinh nghiệm thiết kế mẫu chủ… thiết kế kỹ thuật Các hộ gia đình (hoặc hộ dân cư) đơn vị chọn mẫu cuối đơn vị chọn mẫu cấp (PSU) thường cụm hộ liền kề Mặc dù chọn mẫu ngẫu nhiên đơn giản phân tầng có lẽ hiệu số thiết kế chọn mẫu thơng thường, khơng thiết thực khả thi cho hầu hết điều tra hộ gia đình nước phát triển danh sách cập nhật tất hộ gia đình nước thường khơng có sẵn Nói chung, cần thiết phải có dàn mẫu tốt để đảm bảo đơn vị chọn mẫu cuối có hội lựa chọn, đảm bảo việc suy rộng kết tổng thể từ giá trị tính tốn từ mẫu (unions) , mauza , thôn địa bàn điều tra theo quy định Tổng điều tra dân số năm 2001 (enumeration areas - EA) Tuy nhiên, phân tích sơ cho thấy “union” khác kích thước nói chung, chúng q lớn để quản lý phạm vi hoạt động Đối với “Thơn”, mặt gần giống với EA khu vực nơng thơn, ranh giới không rõ ràng khu vực đô thị Với thơng tin này, có “mauza” EA xem xét chọn làm đơn vị mẫu cấp thảo luận Sử dụng liệu từ Tổng điều tra Dân số năm 2001, Bảng Bảng tóm tắt phân bố số hộ theo mauza EA tương ứng Xây dựng dàn đơn vị chọn mẫu cấp bước việc xây dựng thiết kế chọn mẫu nhiều giai đoạn Điều quan trọng định cách cẩn thận chọn lựa đơn vị mẫu cấp 1, cần có số cân nhắc, đảm bảo tất đơn vị tổng thể mục tiêu thuộc đơn vị chọn mẫu cấp Để đạt mục đích này, đơn vị mẫu cấp phải có ranh giới rõ ràng Ngồi ra, thơng tin phụ “kích cỡ” PSU sử dụng để lựa chọn đơn vị chọn vào mẫu Nếu tổng số hộ gia đình sử dụng cách tính kích cỡ PSU, làm để PSU nhỏ tốt phải đảm bảo đủ số lượng mẫu cuối đặt Dàn mẫu phải thiết kế cho thuận lợi cho việc chọn mẫu quay vòng điều tra khác yêu cầu quan thiết kế dàn mẫu chủ Hơn nữa, thơng tin sẵn có sử dụng cho vấn đề phân tầng phân bổ mẫu, đưa cân nhắc việc tạo PSU Nhìn vào Bảng Bảng bên thấy rằng, phân theo “mauza” tổng số hộ gia đình tương đối chênh lệch nhau, nằm khoảng đến 22.366 (khu đô thị khác, Dhaka) Nếu mauza định đơn vị mẫu cấp 1, sau số mauza phải phân nhỏ để đảm bảo đơn vị mẫu cấp không lựa chọn nhiều lần Đồng thời, số mauza cần phải kết hợp với để đảm bảo có đủ số hộ gia đình rút từ đơn vị mẫu cấp Ngược lại, khoảng cách số hộ EA nhỏ lớn nhỏ hơn, chọn đơn vị chọn mẫu cấp đơn vị địa bàn (EA), nhiều địa bàn cần phải chia nhỏ tổng hộ gia đình địa Ở Bangladesh, đơn vị ngắm có khả để chọn làm PSU là: liên bang SỐ 03 – 2016 Union: Là đơn vị hành phủ địa phương nơng thơn nhỏ Bangladesh Mỗi liên bang tạo thành phường Thông thường, làng định phường Có 4.550 liên bang Bangladesh Mauza: Còn gọi mouza loại huyện hành chính, tương ứng với diện tích đất cụ thể có nhiều khu định cư Trước kỷ 20, thuật ngữ gọi đơn vị thu ngân pargana huyện Do dân số tăng thôn trở thành phổ biến phát triển, khái niệm mouza giảm tầm quan trọng Ngày nay, tương đương với khái niệm “gam” làng 21 21 Kinh nghiệm thiết kế mẫu chủ… Thống kê Quốc tế Hội nhập bàn lớn 497 (Bảng 2) Xem xét nhiều yếu tố khác, đơn vị mẫu cấp sử dụng địa bàn lựa chọn tốt so với chọn mauzas … làm đơn vị mẫu cấp Bảng 1: Số liệu tóm tắt số hộ gia đình Bangladesh phân theo làng Vùng Số lƣợng (làng) Nông thôn Khu đô thị Barisal 3,414 Chittagong 8,879 Dhaka 18,295 7,483 Rajshahi 18,887 Sylhet 5,708 Tổng số 2,896 1,411,766 Nhỏ Trung vị Trung bình Lớn Độ lệch chuẩn 321 487.49 5,126 481.19 419 144,911 11 249 345.85 3,196 333.86 Vùng đô thị lớn (SMA)4 99 91,408 26 718 923.31 4,342 794.92 Khu đô thị khác - - - - - - - Nông thôn 7,367 3,317,141 258 450.27 11,943 600.50 Khu đô thị 1,175 743,076 284 632.41 9,831 1,130.94 Vùng đô thị lớn 207 257,432 794 1,243.63 8,045 1,398.13 Khu đô thị khác 130 154,899 10 823 1,191.53 5,328 1,208.63 Nông thôn 14,660 5,399,312 219 368.30 8,820 473,40 Khu đô thị 2,616 1,824,745 303 697.53 9,218 1,175.43 Vùng đô thị lớn 289 254,248 576 879.75 5,325 952.55 Khu đô thị khác 730 758,382 316 1,038.88 22,366 2,283.58 6,300 2,472,098 264 392.04 5,119 422.51 Nông thôn Khulna Phân bổ số lƣợng hộ gia đình làng (hộ) Số lƣợng làng phân theo khu vực (làng) Khu đô thị 913 433,156 307 474.43 5,823 544.95 Vùng đô thị lớn 166 131,468 51 583 791.98 4,101 705.05 Khu đô thị khác 105 82,880 408 789.33 4,938 1,015.84 Nông thôn 16,423 5,643,537 221 343.64 5,758 382.17 Khu đô thị 1,951 645,620 232 330.92 2,597 304.51 Quận 340 280,392 588 824.68 4,042 703.76 Khu đô thị khác 173 58,248 278 336.69 2,026 301.33 Nông thôn 4,989 1,213,085 167 243.15 3,052 256.24 Khu đô thị 608 110,982 136 182.54 1,328 166.86 Vùng đô thị lớn 111 64,155 20 427 577.97 2,865 559.31 Khu đô thị khác - - - - - - - Nguồn: Tính tốn Author sử dụng liệu Tổng điều tra dân số năm 2001 tiến hành BBS SMA - Statistical metropolitan areas: Là Vùng đô thị lớn, với mật độ dân số tương đối cao có quan hệ kinh tế chặt chẽ tồn khu vực khơng tách riêng thành thành phố, bao gồm quận đơn vị tương đương quận 22 SỐ 03– 2016 22 Thống kê Quốc tế Hội nhập Kinh nghiệm thiết kế mẫu chủ… Bảng 2: Số liệu tóm tắt số hộ gia đình Bangladesh phân theo đơn vị địa bàn Vùng Nông thôn Barisal Hộ gia đình phân theo đơn vị địa bàn (hộ) Số lƣợng địa bàn (địa bàn) Khu đô thị Tổng 14,473 1,411,766 Nhỏ Trung vị Trung bình Lớn Độ lệch chuẩn 96 97.54 354 25.58 1,573 144,911 88 92.12 233 29.94 Vùng đô thị lớn 898 91,408 98 101.79 267 28.13 Khu đô thị khác - - - - - - - 36,172 3,317,141 94 91.70 321 34.25 Nông thôn Chittagong Khu đô thị Vùng đô thị lớn 7,943 743,076 92 93.55 339 31.73 2,997 257,432 87 85.90 237 39.46 Khu đô thị khác 1,428 154,899 107 108.47 310 35.52 Nông thôn 14,660 5,399,312 219 368.30 483 31.38 Khu đô thị 18,819 1,824,745 93 96.96 471 37.97 Dhaka Vùng đô thị lớn 2,418 254,248 102 105.15 404 36.49 Khu đô thị khác 7,030 758,382 100 107.88 478 43.49 23,530 2,472,098 104 105.06 320 30.28 Nông thôn Khulna Khu đô thị 3,998 433,156 103 108.34 344 35.53 Vùng đô thị lớn 1,187 131,468 108 110.76 239 31.07 Khu đô thị khác 744 82,880 106 111.40 305 34.66 55,004 5,643,537 101 102.60 463 29.94 Nông thôn Rajshahi Khu đô thị 6,707 645,620 93 96.26 497 35.07 Vùng đô thị lớn 2,639 280,392 103 106.25 286 33.12 Khu đô thị khác 546 58,248 104 106.68 295 34.59 14,875 1,213,085 84 81.55 258 36.29 Nông thôn Sylhet Khu đô thị 1,302 110,982 84.5 85.24 276 39.11 Vùng đô thị lớn 723 64,155 90 88.73 258 37.99 Khu đô thị khác - - - - - - - Nguồn: Tính tốn Author sử dụng liệu Tổng điều tra dân số năm 2001 tiến hành BBS Như đề cập trước đó, mong muốn PSU phải đủ lớn để có đủ số lượng đơn vị mẫu cuối để đảm bảo tính khả thi việc áp dụng thiết kế mẫu luân phiên cho điều tra khác nhau, áp dụng nhiều thiết kế mẫu chủ Trong trường hợp Bangladesh, nhóm chuyên gia thiết lập SỐ 03 – 2016 ngưỡng để có 40 hộ gia đình PSU Trong số 259.828 địa bàn, 12.273 địa bàn có 40 hộ gia đình Những địa bàn nhỏ nên xem xét sát nhập Khi kết hợp địa bàn nhỏ để tạo thành PSU, địa bàn điều tra kết hợp phải liền kề Tuy nhiên, đồ địa lý địa bàn thiếu tin cậy, nhóm chuyên 23 23 Kinh nghiệm thiết kế mẫu chủ… Thống kê Quốc tế Hội nhập gia định kết hợp địa bàn điều tra nhỏ dựa tiêu chí giới thiệu Ngoài ra, vấn đề khái niệm chuẩn bị việc phân loại Vùng thống kê đô thị (SMA) khu đô thị khác, định hai lĩnh vực phân loại theo khu vực đô thị thay Tiêu chuẩn để sát nhập địa bàn điều tra (EA) để tạo thành đơn vị chọn mẫu cấp 1 Một EA có 40 hộ gia đình PSU EA nhỏ gắn vào EA liền kề … thuộc việc phân loại thành thị/nông thôn mauza EA nhỏ mauza kết hợp với EA mauza khác miễn hai mauzas thuộc “union” hai EA kết hợp phải thuộc loại đô thị loại nông thôn Theo tiêu chuẩn này, có 248,904 PSU xây dựng từ 259,828 EA ban đầu Bảng cung cấp phân bố số lượng hộ gia đình PSU Bảng 3: Số lượng hộ gia đình Bangladesh theo đơn vị chọn mẫu cấp Vùng Barisal Chittagong Dhaka Khulna Rajshahi Sylhet Số lƣợng đơn vị chọn mẫu cấp phân theo Khu vực (đơn vị) Hộ gia đình phân theo đơn vị chọn mẫu cấp (hộ) Tổng Tối thiểu Trung vị Trung bình Tối đa Độ lệch chuẩn Nông thôn 14,280 1,411,766 41 97 98.86 354 24.30 Thành thị 2,414 236,319 42 94 97.90 267 27.36 Nông thôn 33,721 3,317,141 41 97 98.37 321 28.17 Thành thị* 11,810 1,155,407 23 95 97.84 339 30.98 Nông thôn 52,667 5,399,312 19 100 102.52 483 27.88 Thành thị* 27,317 2,837,375 21 98 103.88 478 36.93 Nông thôn 22,886 2,472,098 31 105 108.02 320 27.01 Thành thị 5,823 647,504 41 105 111.20 344 32.69 Nông thôn 53,554 5,643,537 41 102 105.38 463 27.28 Thành thị 9,614 984,260 13 98 102.38 497 32.20 Nông thôn 12,992 1,213,085 41 92 93.37 266 29.79 Thành thị 1,826 175,137 21 93 95.91 296 33.27 Ghi chú: * - Vùng có đơn vị chọn mẫu cấp (PSU) có số hộ gia đình, xác định sở liệu điều tra dân số Đặc biệt có PSU thuộc vùng Chittagong (thành thị) hai PSU thuộc vùng Dhaka (đơ thị) có 10 hộ gia đình Những đơn vị không đưa vào Bảng Như hiển thị bảng, có PSU nhỏ 40 hộ gia đình Những trường hợp “union” nhỏ số lượng hộ gia đình Có khoảng 11PSU vậy, nhóm chuyên gia định loại trừ PSU 24 khỏi dàn mẫu Như vậy, cần nghiên cứu lý luận phù hợp thực tiễn quốc gia để lựa chọn đơn vị chọn mẫu cấp 1, số lượng đơn vị mẫu cấp SỐ 03– 2016 24 Thống kê Quốc tế Hội nhập Kinh nghiệm thiết kế mẫu chủ… quan trọng định số lượng mẫu toàn điều tra Sự phân tầng điều tra, công cụ để cải thiện độ xác ƣớc lƣợng điều tra Tầng điều tra phận tổng thể mà việc chọn mẫu riêng biệt, lên kế hoạch, định lựa chọn cụ thể (Kish, 1987) Lựa chọn tầng điều tra phụ thuộc vào nhiều yếu tố như: Yêu cầu báo cáo, thiết kế chọn mẫu quan trọng hơn, ngân sách cấp khối lượng công việc được dự kiến làm (Kish, 1965; 1987) Cả phát sinh phương pháp luận thống kê phát sinh thực tế phải xem xét định tầng Nói chung, yêu cầu quan trọng cho giá trị thống kê phải mức độ “mịn” (Elbers, Lanjouw Lanjouw 2003) Muốn tăng độ mịn tầng yêu cầu tăng số lượng tầng Do cỡ mẫu thường xác định cấp độ tầng, tăng số lượng tầng thiết kéo theo việc tăng cỡ mẫu chung Cỡ mẫu điều chỉnh giá trị hiệu thiết kế Thông thường, thiết kế mẫu sử dụng phương pháp chọn mẫu chùm để xác định mẫu cuối Hiệu thiết kế trung bình cho mẫu chùm kỳ vọng lớn 3, đó, cỡ mẫu cuối phải tăng lên giá trị Tuy nhiên, điều xem xét bối cảnh ngân sách cấp cho thu thập liệu điều tra Một tầng quy định rõ ràng, cỡ mẫu cho tầng xác định cho ước lượng suy đủ tin cậy trọng phạm vi tầng Thông tin biến động đơn vị lấy mẫu tầng, sai số chấp nhận chi phí liên quan yếu tố cần thiết để xác định cỡ mẫu Ví dụ, giả sử tiêu thức quan tâm tiêu thức tỷ lệ SỐ 03 – 2016 Chọn mẫu ngẫu nhiên đơn giản (SRS), cỡ mẫu dự kiến cho tầng tính dựa vào cơng thức 𝑛𝑠𝑟𝑠 = 𝑡 2𝛼 ,𝑁 −1 𝑃(1−𝑃) 𝑡 𝛼 ,𝑁 −1 𝑃 1−𝑃 −1) 1+ 𝑁 ( 𝑑2 (1) Trong t(α, N-1) 𝑡(𝛼,𝑁−1) giá trị tới hạn phân phối t với độ tin cậy 1- 𝛼 , bậc tự N (cỡ tổng thể); P tỷ lệ thực tế tiêu thức quan tâm phạm vi sai số d (Cochran, 1977) Nếu P chưa biết, ta coi P = 0,5 sử dụng thơng tin có giá trị P dựa vào nghiên cứu trước Lưu ý xác định P = 0,5 cho ta cỡ mẫu bảo toàn lớn Các kết cỡ mẫu thu từ việc áp dụng (1) sau tăng lên giá trị hiệu thiết kế (deff), giả định biết trước giá trị deff 𝑛𝑐𝑜𝑚𝑝𝑙𝑒𝑥 = 𝐷𝑒𝑓𝑓 ∗ 𝑛𝑆𝑅𝑆 (2) Trong trường hợp Bangladesh, phân khu địa lý5 định tầng cụ thể Nếu 64 zilas6 (tỉnh) quy định 64 tầng, cỡ mẫu sau điều chỉnh deff vượt ngân sách BBS Hơn nữa, nhóm chuyên gia sử dụng số liệu tỷ lệ thất nghiệp ước tính qua điều tra LFS năm 2005 giá trị P cụ thể Bảng cho thấy cỡ mẫu dự kiến tính tốn với độ tin cậy (1- 𝛼 ) = 0.95 phạm vi sai số d Các hiệu thiết kế tương ứng với tỷ lệ thất nghiệp từ LFS năm 2005 thể Bảng Lưu ý với d = 0.01, cỡ mẫu 115.277 Trong đó, cỡ mẫu 100.000 hộ gia đình nhiều số hộ gia đình điều tra LFS Phân khu địa lý: Hay gọi Vùng, Bangladesh có phân khu là: Barisal, Chittagong, Dhaka, Khuha, Rajshahi, Sylhet Zilas: Tên tiếng Bangladesh, tương đương tỉnh 25 25 Kinh nghiệm thiết kế mẫu chủ… Thống kê Quốc tế Hội nhập 2009-2010 BBS phân bổ ngân sách để thu thập Nếu chọn d = 0,03 (có thể khơng phù hợp tỷ lệ thất nghiệp nhỏ) cỡ mẫu khoảng 12.814 hộ gia đình, nằm vòng ngân sách Đối với khu vực Dhaka Khulna, cỡ mẫu trở nên lớn ảnh hưởng hiệu thiết kế Các biến đổi lớn quan sát thấy khu vực khơng thực phản ánh khác lớn số hộ gia đình biến đổi lớn quyền số giả quy cho hộ gia đình Với thực trạng này, cỡ mẫu tính tốn Bảng sử dụng hướng dẫn để xác định cỡ mẫu Đặc biệt, nhóm chuyên gia đề xuất để lấy mẫu PSU 10 hộ gia đình theo Maligalig Barcenas (2008) thay cho 40 hộ gia đình PSU IMPS Điều cho phép tăng số lượng PSU lấy mẫu từ 1000 (trong IMPS) lên đến 1500 thiết kế mẫu Xét thấy tương quan chặt chẽ hộ gia đình nội PSU, tăng số lượng PSU giảm số lượng hộ gia đình PSU coi … hợp lý Nếu quyền số điều tra sử dụng để tính tốn kích thước mẫu Bảng xác, ước tính mức độ phân khu địa lý có sai số khoảng 0.03 Mức độ sai số lớn, không chấp nhận được, tỷ lệ thất nghiệp theo vùng thay đổi từ 0.01 (Sylhet) đến 0.06 (Barisal) Mặt khác, quyền số điều tra LFS năm 2005 có lỗi kĩ thuật sử dụng giải pháp phân tầng không hiệu việc kiểm soát hiệu thiết kế, kết ước lượng từ sử dụng thiết kế mẫu chủ LFS 2009-2010 làm cho hiệu thiết kế chấp nhận chí với tổng cỡ mẫu 15.000 hộ gia đình Kết thuận lợi phụ thuộc vào chất lượng việc xây dựng thiết kế mẫu chủ, tiêu chuẩn định rõ quyền số điều tra xác cách phân tầng tốt Bảng 4: Kích thước mẫu dự kiến Cỡ mẫu theo chọn mẫu ngẫu nhiên giản đơn d= d= d= 0.05 0.03 0.01 d= 0.05 5.12 8.38 89.57 67.51 248.77 2236.24 187.53 1687.17 460.31 567.31 1278.51 1575.81 8,236,687 27.00 69.37 192.70 1733.99 1878.49 5217.95 11492.75 14177.52 46952.74 3,119,602 6,627,797 1,388,222 18.58 3.41 2.66 79.18 46.26 27.53 219.92 1978.19 1475.64 128.51 1156.41 158.07 76.47 687.90 73.40 4098.83 439.08 203.88 36868.64 3951.07 1834.07 Tỷ lệ thất nghiệp (%) Số hộ gia đình (hộ) Barisal Chittagong 0.0622 0.0461 1,648,085 4,472,548 Dhaka 0.0474 Khuha Rajshahi Sylhet 0.0545 0.0311 0.0182 Vùng Giá trị Deff Tổng Cỡ mẫu sau hiệu chỉnh d = 0.03 d = 0.01 4613.22 12814.05 115276.79 Nguồn: Nghiên cứu Authors sử dụng liệu từ LFS năm 2005 tiến hành BBS Một số chiến lược phân bổ kiểm tra để phân bổ 15.000 hộ mẫu theo địa bàn như: phân bổ đều, phân bổ theo tỷ lệ, phân bổ tỷ lệ với bậc phân bổ Kish 𝑛𝑑 = Phân bổ theo tỷ lệ: 𝑛𝑑 = 𝑛 Phân bổ đều: 26 𝑛 𝑛 = 𝐷 𝑁𝑑 = 𝑛𝑊𝑑 𝑁 SỐ 03– 2016 26 Thống kê Quốc tế Hội nhập Kinh nghiệm thiết kế mẫu chủ… Phân bổ tỷ lệ bậc hai: 𝑁𝑑 𝑛𝑑 = 𝑚 𝑁𝑚 Phân bổ Kish: 𝐷 −2 + 𝐼𝑊𝑚2 𝑛𝑑 = 𝑛 𝑚 𝐷−2 + 𝐼𝑊𝑚2 36 + 𝐼𝑊𝑚 =𝑛 𝑚 36 + 𝐼𝑊𝑚 Trong đó: 𝑛𝑑 cỡ mẫu tầng, n tống số mẫu, D số lượng tầng, 𝑁𝑑 tổng số hộ gia đình tầng d, N tổng số hộ gia đình Bangladesh.Tổng điều tra dân số năm 2001 , 𝑊𝑑 tỷ lệ hộ gia đình tầng d, I số phân bổ Kish biểu thị liên quan ước lượng quốc gia phân nhóm cắt tầng (loại (i)), liên quan ước lượng cấp tầng (loại (ii)) Để minh họa, liên hệ loại (i) với tiêu thức quan tâm số lượng nông dân trồng trọt người lao động nữ không trả lương, tỷ lệ người nghèo Bangladesh, số người lực lượng lao động, người thất nghiệp, tỷ lệ hộ có điện, ước lượng khác phân nhóm Khi tính tốn cấp độ tầng, chúng trở thành tham số loại (ii) Nếu mối quan tâm để lấy ước lượng cho tiêu thức quan tâm loại (ii), phương pháp tốt để phân bổ tổng số mẫu sử dụng phân bổ mẫu tỷ lệ với quy mô dân số tầng Tuy nhiên, cách tiếp cận lý tưởng cho loại (ii) phân chia tổng số mẫu tầng (Kish, 1987) Hơn nữa, cần phải nhấn mạnh hai phương pháp mang lại phân bổ mẫu đa dạng đặc biệt vùng khác quy mơ Bên cạnh đó, có cách tiếp cận hiệu qua muốn ước lượng loại định đặc trưng quan tâm không thiết phải cho loại khác sử dụng phân bổ Kish, chất kết hợp phân bổ phân bổ tỷ lệ Với I = 0, làm giảm phân bổ có xu hướng tiếp cận phân bổ tỷ lệ với I -> ∞ Bảng cung cấp ước lượng cỡ mẫu cho tầng cách sử dụng phân bổ khác Phân bổ Kish I = lựa chọn để đảm bảo độ xác hai loại (i) loại (ii) tiêu thức quan tâm xấp xỉ Bảng 5: Phân bổ mẫu số lượng hộ gia đình cho tầng Vùng Tổng số hộ gia đình (hộ) 𝑊𝑑 Phân bổ (hộ) Phân bổ tỷ lệ (hộ) Phân bổ bậc (hộ) Phân bổ Kish (hộ) Barisal 1,648,085 0.064649 2,500 969.7 1,633.65 1,817.68 Chittagong 4,472,548 0.175443 2,500 2,631.6 2,691.21 2,460.51 Dhaka 8,236,687 0.323097 2,500 4,846.4 3,652.13 3,696.56 Khulna 3,119,602 0.122371 2,500 1,835.5 2,247.60 2,102.39 Rajshahi 6,627,797 0.259986 2,500 3,899.7 3,276.08 3,140.06 Sylhet 1,388,222 0.054455 2,500 816.8 1,499.34 1,782.81 25,492,941 1.000000 15,000 15,000.0 15,000.00 15,000.00 Bangladesh Nguồn: Tính tốn Authors sử dụng thủ tục phân bổ mẫu không đồng (Xem tiếp trang 7) SỐ 03 – 2016 27 27 Đơi dòng cảm nghĩ… nghiệp, thụ hưởng đặc sản Tình người thống kê mà khơng phải nghề nào, ngành có Sứ mệnh phía trước ngành Thống kê nặng nề, sau 70 năm xây dựng phát triển, đồ đủ lớn, kinh nghiệm tích lũy Trong thời đại bùng nổ thông tin nay, thông tin trở thành sức mạnh quyền lực cấu thành Nghiên cứu – Trao đổi lực lượng sản xuất xã hội thông tin thống kê lên Trong bối cảnh đó, ngành Thống kê lại quan tâm, hỗ trợ cấp, ngành toàn xã hội; hệ thống kê đương nhiệm tràn đầy nghị lực, có phẩm chất trị, có kiến thức tồn diện chuyên môn nghiệp vụ thống kê, tin học ngoại ngữ, chắn viết thêm trang sử vẻ vang Thống kê Việt Nam (Tiếp theo trang 27) Kinh nghiệm lựa chọn mẫu để kiểm sốt hiệu thiết kế điều tra phức tạp 3.1 Phân lớp ngầm PSU Sự phân lớp (ngầm) PSU quan trọng để đảm bảo (giới hạn) cỡ mẫu cấp BBS làm cho ước lượng đáng tin cậy cấp PSU cấp phân chia PSU Thông tin để tạo lớp PSU gọi đơn vị phân lớp ngầm Lý tưởng đơn vị phân lớp ngầm có sẵn đo lường thống cho tất PSU tầng Ví dụ, đơn vị phân lớp thông tin địa lý zila (tỉnh) khu vực thành thị/nơng thơn PSU mang mã tỉnh phân loại khu vực đô thị Phân lớp khác áp dụng để đảm bảo lớp cuối PSU đồng Các ứng cử cho đơn vị phân lớp sẵn có để sử dụng cho tất PSU biến có Tổng điều tra dân số năm 2001 Ngoài ra, đơn vị phân lớp xem hiệu đơn vị có quan hệ tương quan cao với tiêu chủ yếu quan tâm điều tra Ví dụ, tiêu coi có tương quan với thu nhập việc làm tiêu LFS bao gồm: Tỷ lệ hộ có nhà vật liệu tốt (PStrong), tỷ lệ hộ gia đình có sản xuất nơng nghiệp nguồn thu nhập (PAgri); tỷ lệ hộ gia đình sở hữu đất nơng nghiệp (POal) (Còn nữa) Vũ Vân Anh, Trần Thị Thu Hằng (lược dịch) Nguồn: Developing a Master Sample Design for Household Surveys in Developing Countries: A Case Study in Bangladesh; Dalisay S Maligalig and Arturo Martinez Jr; 12.07.2013 (http://surveyinsights.org/?p=2151) SỐ 03 – 2016 7 ... kê Quốc tế Hội nhập Kinh nghiệm thiết kế mẫu chủ thiết kế kỹ thuật Các hộ gia đình (hoặc hộ dân cư) đơn vị chọn mẫu cuối đơn vị chọn mẫu cấp (PSU) thường cụm hộ liền kề Mặc dù chọn mẫu ngẫu nhiên... Quốc tế Hội nhập Kinh nghiệm thiết kế mẫu chủ Bảng 2: Số liệu tóm tắt số hộ gia đình Bangladesh phân theo đơn vị địa bàn Vùng Nông thôn Barisal Hộ gia đình phân theo đơn vị địa bàn (hộ) Số lƣợng... vào mẫu Nếu tổng số hộ gia đình sử dụng cách tính kích cỡ PSU, làm để PSU nhỏ tốt phải đảm bảo đủ số lượng mẫu cuối đặt Dàn mẫu phải thiết kế cho thuận lợi cho việc chọn mẫu quay vòng điều tra