Nghiên cứu chỉ ra cách tích hợp dữ liệu này vào sổ đăng ký, từ đó cho phép khám phá những thông tin liên quan mới về dân số như: Các nhóm cá nhân được xác định bởi những mẫu nổi bật khi phân tích “hồ sơ sẵn có” ở nhiều nguồn khác nhau và theo thời gian có thể là mối quan tâm rất lớn đối với các nghiên cứu dân số.
SỬ DỤNG MƠ HÌNH LIÊN TỤC TRONG DỮ LIỆU HÀNH CHÍNH ĐỂ XÁC ĐỊNH DÂN THƯỜNG TRÚ TẠI Ý Tóm tắt: Những nỗ lực mạnh mẽ cấp độ vi mơ việc tích hợp nguồn số liệu thống kê khác với gia tăng số lượng kho lưu trữ hành dẫn đến thay đổi lớn quy trình mà Viện Thống kê quốc gia áp dụng để sản xuất số liệu thống kê dân số Viện Thống kê Quốc gia Ý (Istat) lên kế hoạch thiết kế cho Tổng điều tra dân số dựa kết hợp thuận tiện liệu hành điều tra Một sở liệu chuyên đề tạo để nghiên cứu cách sử dụng nguồn hành cải thiện chất lượng thông tin đăng ký dân số: Các nguồn tích hợp Sổ đăng ký dân số thức thành phố với tài liệu lưu trữ hành từ thị trường lao động, giáo dục, liệu thu nhập thuế Nghiên cứu cách tích hợp liệu vào sổ đăng ký, từ cho phép khám phá thông tin liên quan dân số như: Các nhóm cá nhân xác định mẫu bật phân tích “hồ sơ sẵn có” nhiều nguồn khác theo thời gian mối quan tâm lớn nghiên cứu dân số I Giới thiệu Trong nhiều năm, mặt số lượng dân số dựa điều tra nhân học Tổng điều tra dân số, mặt khác, số lượng dân số đô thị dựa Sổ đăng ký dân số Trong khứ, tích hợp nguồn số liệu thiết lập mức tổng hợp kết Tổng điều tra sử dụng để tăng tính xác Sổ đăng ký dân số đô thị Ngày nay, nỗ lực mạnh mẽ việc tích hợp cấp vi mô nguồn thống kê khác với sẵn có số lượng liệu hành ngày tăng đưa thay đổi lớn sản xuất số liệu dân số Tổng điều tra dân số sưu tập số liệu thống kê lớn quan trọng để cung cấp số liệu dân số đơn vị địa lý nhỏ Trong hầu tiên tiến thống kê sử dụng kế hoạch truyền thống thơng qua việc thống kê tồn đơn vị dân cư nhà (Mỹ Canada), có số lượng ngày tăng quốc gia dựa vào sổ đăng ký thống kê Điều tra dựa sở đăng ký sử dụng liệu đăng ký độc quyền, trường hợp khu vực Xcăng-đi-na-vi (Hà Lan, Thụy Điển, Đan Mạch, Phần Lan Na Uy) sử dụng kết hợp hai nguồn sổ đăng ký liệu điều tra mẫu Khung “Tổng điều tra dân số” (tức Tổng điều tra dân số năm 2011 Tây Ban Nha) Istat lên kế hoạch Tổng điều tra dân số cho vòng điều tra dân số tiếp theo, thuận tiện việc tích hợp liệu hành điều tra khai thác tiềm thông tin Thêm vấn đề quan trọng (sinh đẻ, tử vong, di cư nước quốc tế) vào số liệu thống kê Tổng điều tra dân số, Istat tính tốn sổ đăng ký thống kê, gọi 29 “ANagrafe VIrtuale Statistica” (ANVIS) Sổ đăng ký thống kê đảm bảo chất lượng cao Sổ đăng ký hành thành phố phần quan trọng cho khung sản xuất dựa sổ đăng ký Từ năm 2015, nhiều thử nghiệm thực Istat việc sử dụng nguồn hành để tuân thủ định nghĩa dân số thường trú Quy chế Liên minh châu Âu (số 1260/2013) Theo quy định này, “nhân thường trú” nơi người sống 12 tháng trước ngày tham chiếu Những người địa điểm 12 tháng trước điều tra có ý định lại 12 tháng coi nhân thường trú Mục đích nghiên cứu để đánh giá liệu hồ sơ từ nguồn hành đáp ứng yêu cầu định nghĩa quốc tế cho phép tính tốn dân số thường trú Ý hay khơng Mục tiêu đòi hỏi phải lựa chọn đánh giá liệu hành với mục đích để nhận diện mơ hình liên kết Một vấn đề khác có liên quan xác minh liệu việc tích hợp liệu vào sổ đăng ký thích hợp đánh giá nhóm người xác định mơ hình lên phân tích “hồ sơ sẵn có” nguồn khác II Hệ thống tích hợp hồ sơ hành Để quản lý số lượng liệu hành ngày tăng để tối đa hóa lợi ích, Istat xây dựng hệ thống tích hợp nguồn hành có sẵn, tên SIM (Integrated Microdata) Khi tập tin hành nhập vào hệ thống này, trình nhận dạng xác định cá thể đơn vị kinh tế có liệu định mã số nhận dạng vĩnh viễn 30 (ID): Nếu đơn vị có sở liệu Istat, ID đơn vị định khứ (diBella Ambroselli, 2014) Sau đó, sở này, xây dựng cấu trúc liệu cụ thể cho quy trình thống kê để tạo sở liệu theo chủ đề 10 Trong tất kho lưu trữ, SIM bao gồm liệu từ ANVIS, giấy phép lưu trú, liệu liên quan đến công nhân người lao động tự do, sinh viên có trình độ học vấn, sinh viên đại học, người hưu, hồ sơ không trợ cấp lương hưu liệu cá nhân thu nhập thuế Các liệu tổng hợp sử dụng để tạo sở liệu theo chủ đề để phân tích nguồn hành cải thiện chất lượng thơng tin Sổ đăng ký dân số (Chieppa et al, 2016) Mã số nhận dạng vĩnh viễn cho phép liên kết biến số xã hội kinh tế cá nhân, hộ gia đình đơn vị kinh tế đến nơi người thực hoạt động hay việc sử dụng thời gian 11 Liên kết Sổ đăng ký dân số thức với nguồn hành cụ thể (Sổ đăng ký lao động đăng ký kinh doanh, đăng ký thuế, sổ tiết kiệm thu nhập, nghỉ hưu không hưởng lương hưu, giấy phép lưu trú) giúp xác định nhóm tương ứng với định nghĩa quốc gia hay quốc tế “dân số thường trú” Các sai số thiếu phạm vi điều chỉnh cách sử dụng hồ sơ sẵn cócó cá nhân lãnh thổ Ý; vắng mặt hồ sơ cho người dân Sổ đăng ký số dân làm cho việc phạm vi 12 Để khai thác nguồn hành chính, Cơ quan Thống kê Ý sử dụng lược đồ Kiến thức khám phá từ Cơ sở liệu dựa kỹ thuật “học-từ-các ví dụ” (learning-fromexamples), bao gồm lưu trữ truy cập liệu, thuật toán mở rộng cho liệu lớn Quá trình dẫn đến xác định mẫu nhóm III Xác định mơ hình liên tục từ hồ sơ hành 13 Với mục tiêu khám phá hồ sơ sẵn có phù hợp với định nghĩa quốc tế dân số thường trú Ý, liệu hành lựa chọn đánh giá với mục đích để nhận mẫu kết hợp hồ sơ Trước phân tích ghi từ liệu hành chính, cần lựa chọn khoảng thời gian tham chiếu, diện cá nhân lãnh thổ liên kết chắn với khoảng thời gian Việc chọn thời kỳ tham chiếu điểm quan trọng xác định phân tích hồ sơ sẵn có Ý, khoảng thời gian dài việc đánh giá trọng lượng ghi dài, liên tục gián đoạn theo thời gian, số lượng lặp lại quy trình di cư, di chuyển việc làm, học tập, v.v… 14 Để đáp ứng yêu cầu định nghĩa dân số thường trú (thậm chí xem xét khía cạnh có ý định lại 12 tháng), Istat nghiên cứu khoảng thời gian 24 tháng Sau đó, xem xét ngày tham chiếu, ví dụ ngày 31/12/2012, phân tích hồ sơ thực vào 12 tháng trước 12 tháng sau ngày tham chiếu 15 Mỗi dấu hiệu quy cho cá nhân cụ thể đến khu vực địa lý định Trong thời gian tham chiếu, hồ sơ phát Sổ đăng ký lao động Sổ đăng ký giáo dục, hai đặt đô thị, chúng tơi có hồ sơ từ thị cụ thể Bản ghi gắn nhãn với thuộc tính cho phép theo dõi cá nhân hai nguồn ban đầu, thuộc tính liên quan đến thời gian diện thể dạng công việc hoạt động học tập 16 Hồ sơ liên quan đến lao động giáo dục xem đáng tin cậy nhất, bao gồm thời gian loại hình hoạt động Họ cho phép biết cá nhân, theo tháng, họ làm Gom cụm thành chuỗi ghi này, Bảng cho thấy mơ hình có hồ sơ liên tục người có diện khơng liên tục Ý Mơ hình “Sự sẵn có liên tục năm 2012 2013” (1) tương ứng với liên tục suốt thời kỳ 17 Sự sẵn có liên tục, chủ yếu vào năm 2012 2013 (mẫu 3), đặc trưng cho người có mặt 12 tháng, người thay đổi, bắt đầu, ngừng hoạt động, di chuyển Sự sẵn có liên tục tháng 12 năm 2012 nhóm lại người có 12 tháng có mặt liên tục từ năm 2012 đến năm 2013 (mẫu 4) Mẫu nhóm hồ sơ không liên tục kéo dài 12 tháng; mẫu bao gồm “hồ sơ theo mùa” xuất năm lần; mẫu kết hợp ghi rải rác 12 tháng Các hồ sơ từ mẫu 8-12 khơng thể khai thác, họ không thuộc phạm vi định nghĩa nơi thường trú Hồ sơ họ hiển thị tháng có mặt (mẫu 8), biến trước tháng 12/2012 (mẫu 9), xuất sau tháng 12/2012 (mẫu 11) lặp lại ngẫu nhiên vào năm 2012 năm 2013, có mặt 12 tháng (mẫu 10, 11 12) 18 Vì vậy, hồ sơ sử dụng để lấy biến có liên quan đến cá nhân có liên quan loại điều kiện sống họ Ý Cụ thể số lượng dân số, thơng tin xác định trường hợp có sẵn có thường trú tương ứng với định nghĩa dân số thường trú khái niệm theo quy định quốc tế, lúc tương ứng với nội dung ghi Sổ đăng ký số dân 31 19 Các biến số nhân học, đặc biệt giới tính, tuổi quốc gia quyền cơng dân vị trí hồ sơ lãnh thổ chứng tỏ biến số quan trọng việc xác định tiểu vùng phụ Bảng 1: Sơ đồ mơ hình liên tục hoạt động làm việc nghiên cứu Thời gian từ tháng 1/2012 đến tháng 12/2013 Loại sẵn có Sổ đăng ký lao động giáo dục J F M A M J J A S O N D J F M AM J J A S O N D liên tục năm 2012-2013 liên tục, chủ yếu năm 2012 liên tục, chủ yếu năm 2013 liên tục tháng 12 năm 2012 liên tục với tạm dừng theo mùa rải rác năm 2012 2013 tháng 12 năm 2012 khoảng thời gian ngắn năm 2012 10 rải rác năm 2012 khoảng thời gian ngắn năm 2013 12 rải rác năm 2013 Hồ sơ liên tục Hồ sơ gián đoạn Hồ sơ không sử dụng 11 IV Dân số phân loại tính qn sổ đăng ký 20 Chúng tơi phân loại trường hợp ghi sở liệu thử nghiệm dựa tính quán ghi (Bảng 2) Đầu tiên liên kết Sổ đăng ký dân số, hồ sơ hoạt động từ Sổ đăng ký lao động giáo dục giấy phép lưu trú, sau chúng tơi lập người hưu người hưởng quyền lợi khác từ Sổ đăng ký lao động giáo dục; thứ ba, tờ khai thuế trả người biện minh cho sẵn có họ Ý 32 21 Bước đầu tiên, liên kết cho phép chúng tơi mơ tả nhóm: Nhóm A gồm 36,6 triệu người ghi Sổ đăng ký dân số Sổ đăng ký lao động giáo dục Nhóm B gồm 24,5 triệu người ghi Sổ đăng ký dân số khơng có Sổ đăng ký lao động giáo dục Nhóm C gồm 1,1 triệu người khơng có Sổ đăng ký dân số lại ghi Sổ đăng ký lao động giáo dục Nhóm D gồm 351 nghìn người đăng ký giấy phép để lưu trữ Bảng 2: Quy trình thực số lượng dân số theo điều kiện cư trú hợp lệ Ý vào ngày 1/1/2013 Đơn vị tính: Nghìn người Bước Bước Bước Sổ Sổ đăng ký Giấy Đăng ký Sổ đăng đăng ký lao động phép nghỉ không ký thuế dân số giáo dục lưu trú lương Số Số Số Nhóm Nhóm Nhóm 61.068 37.704 3.378 20.764 lượng lượng 26.649 lượng Các loại Các loại Các loại hồ sơ hồ sơ hồ sơ Có Có A 36.618 Có E 14.485 Có Khơng B 24.450 Có G 6.939 Khơng F 9.965 Khơng H 3.026 Khơng Có C 1.086 Khơng Khơng Có D 351 Trong đó: số dân đủ điều kiện hợp lệ, 22 Trong Bước 2, chúng tơi liên kết nhóm B với Sổ đăng ký người nghỉ hưu, người nhận trợ cấp thai sản hay trợ cấp thất nghiệp Từ mối liên kết này, phân biệt liệu cá nhân có ghi hai sổ đăng ký (Nhóm E gồm 14,5 triệu người) hay khơng (Nhóm F gồm 10 triệu người) 23 Trong Bước 3, chúng tơi liên kết nhóm F với Sổ đăng ký thuế, nhằm xác định người có tài sản hỗ trợ cá nhân có thu nhập chịu thuế (Nhóm G gồm 6,9 triệu người) người ghi Sổ đăng ký dân số mà nguồn hồ sơ khác có sẵn (Nhóm H gồm triệu người) 24 Các thành viên thuộc nhóm A, E, G người thường trú, người thuộc nhóm C, D, H người “có tiềm năng” Ý Do đó, từ thời điểm này, chúng tơi tập trung vào nhóm C (1,1 triệu người), kết hợp khả bao phủ Sổ đăng ký dân số Bảng phân biệt nhóm C theo loại hồ sơ thời gian: số dân có tiềm 409.157 người (Nhóm C1, C2, C3) có hồ sơ liên tục, đa số người nước ngồi (90%), có hoạt động chun môn (78%), người khác trường (58.000 người) sinh viên (33.000 người) Bảng 3: Nhóm C - Những người khơng có Sổ đăng ký dân số có nguồn hành khác ngày 1/1/2013 Đơn vị tính: Người Nhóm Các nguồn hồ sơ Giá trị C1 Hồ sơ liên tục người lao động C2 Hồ sơ liên tục sinh viên đại học 32.671 C3 Hồ sơ liên tục học sinh tiểu học trung học 58.327 C4 Hồ sơ khơng liên tục sẵn có C5 Hồ sơ khơng có khả sử dụng khơng có thông tin hàng tháng Tổng 318.159 266.763 410.242 1.086.162 33 (khoảng 34% số người có khả bao phủ), 76.000 người khác có hồ sơ khơng liên tục; 25 Hồ sơ khơng liên tục khai thác (Nhóm C4) 266.763 người, chủ yếu người nước ngồi (90%) Hồ sơ khơng liên tục khai thác thiếu thông tin khoảng 410 nghìn người (Nhóm C5) (b) Những người có hồ sơ liên tục có mặt từ năm 2012 đến năm 2014 chưa ghi Sổ đăng ký dân số Nhóm gồm 180.000 người (khoảng 37%) với hồ sơ liên tục, khoảng 90.000 người với hồ sơ không liên tục Cả hai loại đại diện cho “cốt lõi” thiếu phạm vi Sổ đăng ký dân số; V Tiếp cận theo chiều dọc kết sơ 26 Một phân tích chi tiết nhóm có nguy thiếu phạm vi Sổ đăng ký dân số nêu bật số chủ đề quan trọng sử dụng cách tiếp cận theo chiều dọc Phân tích tất cá nhân không đăng ký Sổ đăng ký dân số vào năm 2012 phân tích họ ba năm tới, nhận thấy nhóm sau (Bảng 4)1 (c) Những người có hồ sơ có mặt vào năm 2012 2013 (khơng có năm 2014) mà khơng có Sổ đăng ký dân số 140.000 người (khoảng 29%) với hồ sơ liên tục 317.000 người khác (khoảng 66%) khơng có hồ sơ liên tục Cả hai loại chắn rời khỏi đất nước tình trạng bấp bênh việc làm (a) Những người có hồ sơ sẵn có vào năm 20122 ghi Sổ đăng ký dân số hai năm tới Nhóm bao gồm 165.000 người cho thấy hồ sơ có mặt liên tục Ý Bảng 4: Số lượng người phân tích theo chiều dọc có hồ sơ sẵn có Ý giai đoạn 2012-2014 Đơn vị tính: Nghìn người Hồ sơ Sổ đăng ký lao động giáo dục 1/1/2012 1/1/2013 1/1/2014 Có Có Có Có Có Có Có Có Khơng Hồ sơ Sổ đăng ký dân số Hồ sơ Hồ sơ liên tục gián đoạn 1/1/2012 1/1/2013 1/1/2014 Giá trị Giá trị 165,4 76,0 33,8% 15,7% 182,5 89,7 37,2% 18,6% 142,0 317,6 29,0% 65,7% 489,9 483,3 Khơng Có Khơng Khơng Khơng Khơng Có Khơng Khơng Thơng tin nhóm Những người có hồ sơ sẵn có vào năm 2012 ghi Sổ đăng ký dân số năm tới Những người có hồ sơ sẵn có từ năm 20122014 không ghi Sổ đăng ký dân số Những người có hồ sơ sẵn có năm 2012 2013 mà khơng có Sổ đăng ký dân số Tổng số Các cá nhân không khai thác bị loại khỏi phân tích theo chiều dọc (nhóm C5 Bảng 3) Nên xem xét năm (2012, 2013, 2014), quan sát hồ sơ liệu hành từ 12 tháng trước 12 tháng sau ngày tham chiếu 1/1 34 27 Khi xem xét thiếu phạm vi phương pháp tiếp cận theo chiều dọc, phân tích cho thấy kết có liên quan với Trước hết, tiêu chí quan sát nguồn hồ sơ hành khoảng thời gian 24 tháng để đáp ứng định nghĩa dân số thường trú thực Hơn nữa, việc phân cụm cá nhân theo mô hình liên tục gián đoạn cơng cụ phân loại hữu ích để xác định tồn ổn định lãnh thổ, đặc biệt người nước ngồi 28 Vị trí địa lý quốc tịch cụ thể điều cần thiết để xác định người làm việc nước ngồi, chấp nhận việc vắng mặt Sổ đăng ký dân số 29 Tuy nhiên, phân tích theo chiều dọc cho thấy số cá nhân khơng có hồ sơ liên tục liên quan đến sẵn có ổn định lãnh thổ (khoảng từ 15-18%) cần phải cải thiện hồ sơ 30 Hồ sơ Sổ đăng ký hành nâng cao nhận thức dân số cho thấy dân số đăng ký số liệu liên kết với nguồn hành khác, Istat đánh giá chất lượng tính xác nguồn Một số người nước ngồi người di cư không ghi vào Sổ đăng ký dân số, ghi Sổ đăng ký lao động Lan Phương (dịch) Nguồn: The Conference of European Statisticians,Group of Experts on Population and Housing Censuses, Nineteenth Meeting, Geneva, 4-6 October 2017; https://www.unece.org/fileadmin/DAM/stats/ documents/ece/ces/ge.41/2017/MeetingGenevaOct/ECE_CES_GE.41_2017_13Rev1_ENG.pdf Tiếp theo trang 39 Tài liệu tham khảo: Cục Thống kê Ninh Thuận (2018), Chuyên đề “Phân tích ảnh hưởng nhân tố đến tăng suất lao động tỉnh Ninh Thuận giai đoạn 2011 - 2017” thuộc nhiệm vụ khoa học “Thu thập, tính tốn phân tích suất nhân tố tổng hợp (TFP); Năng suất lao động mối quan hệ tăng suất với tăng trưởng kinh tế; Yêu cầu nâng cao suất trình độ khoa học cơng nghệ để đóng góp vào phát triển kinh tế xã hội giai đoạn 2016 - 2020 nhóm giải pháp để thúc đẩy tăng suất tỉnh Ninh Thuận”; Cục Thống kê Ninh Thuận, Niên giám Thống kê năm 2010, 2012, 2015 2017; PGS.TS Trần Thị Kim Thu (2012), Giáo trình Lý thuyết Thống kê, NXB Đại học Kinh tế Quốc dân, Hà Nội; PGS.TS Tăng Văn Khiên, TS Đặng Văn Lương (2019), „Thiết lập số phân tích biến động suất lao động chung tồn kinh tế‟, Tạp chí Con số kiện, kỳ tháng 4/2019; PGS.TS Tăng Văn Khiên (2015), Phân tích Thống kê - Lý thuyết Ứng dụng, NXB Thống kê 35 ... Quá trình dẫn đến xác định mẫu nhóm III Xác định mơ hình liên tục từ hồ sơ hành 13 Với mục tiêu khám phá hồ sơ sẵn có phù hợp với định nghĩa quốc tế dân số thường trú Ý, liệu hành lựa chọn đánh... sử dụng để lấy biến có liên quan đến cá nhân có liên quan loại điều kiện sống họ Ý Cụ thể số lượng dân số, thơng tin xác định trường hợp có sẵn có thường trú tương ứng với định nghĩa dân số thường. .. cụm thành chuỗi ghi này, Bảng cho thấy mơ hình có hồ sơ liên tục người có diện khơng liên tục Ý Mơ hình “Sự sẵn có liên tục năm 2012 2013” (1) tương ứng với liên tục suốt thời kỳ 17 Sự sẵn có liên