Phiếu điều tra chọn mẫu bao gồm một loạt các biến được thu thập ở cấp độ cá nhân. Phiếu điều tra chọn mẫu bắt đầu bằng các chỉ số nhân khẩu học tiêu chuẩn (liên quan đến chủ hộ, tuổi, giới, tình trạng hôn nhân, v.v.), chỉ số về vùng miền và xã hội (tỉnh, sinh sống ở nông thôn hay thành thị, tôn giáo, dân tộc, tình trạng di cư, v.v.) cũng như chỉ số về kinh tế - xã hội (giáo dục, việc làm, nghề nghiệp, v.v.). Thông tin quan trọng nhất là hai chỉ số đơn giản về tuổi và giới tính được sử dụng để ước tính TSGTKS trở về trước (xem nội dung dưới đây).
Dựa trên dữ liệu chọn mẫu về hộ gia đình, TCTK bổ sung thêm một chỉ số tổng hợp về nhà ở, tiện nghi và trang thiết bị trong hộ gia đình để đánh giá điều kiện kinh tế - xã hội của hộ (mức sống theo ngũ phân vị. Danh mục này cho phép phân loại các mẫu hộ gia đình thành 5 nhóm (nghèo nhất, nghèo, trung bình, giàu và giàu nhất), 5 nhóm này sẽ được sử dụng trong Báo cáo dưới dạng nhóm kinh tế xã hội hoặc chỉ số ở cấp độ hộ gia đình về điều kiện kinh tế - xã hội.
Trong quá trình nghiên cứu, chúng tôi đã tạo thêm một số biến ở cấp hộ gia đình, cụ thể liên quan đến chủ hộ như giới tính, tuổi hay học vấn của chủ hộ. Một số biến liên quan đến tất cả thành viên trong hộ gia đình như trình độ học vấn cao nhất của các thành viên trong hộ hay quy mô hộ. Chúng tôi cũng đã xác định các hộ đa thế hệ để phân biệt với các hộ một thành viên hoặc hộ gia đình hạt nhân. Hộ gia đình đa thế hệ là hộ có ba thế hệ cùng sinh sống, ví dụ ông bà sống chung cùng con và cháu trong cùng một hộ.
Ở đây, chúng tôi quan tâm đến một nhóm chỉ số liên quan đến lịch sử sinh đẻ của phụ nữ. Tất cả nữ giới trong độ tuổi 15-49 tham gia điều tra chọn mẫu được yêu cầu trả lời một số câu hỏi. Bởi đây là các biến phức tạp, chúng tôi có lẽ phải mô tả cụ thể như sau:
• Họ đã từng sinh con chưa (câu C34).
• Họ đã từng sinh bao nhiêu con trai và con gái (sống cùng hộ, khác hộ hoặc đã qua đời) (câu C35-37).
• Giới tính, thứ tự sinh và ngày sinh (tháng và năm) của lần sinh gần nhất (câu C38-39). • Giới tính, thứ tự sinh của lần sinh gần nhất trong vòng 12 tháng trở lại đây (kể từ ngày 1/4/2018) (câu C40).
Những câu hỏi này mô tả một phần lịch sử sinh đẻ của phụ nữ Việt Nam và cụ thể, cung cấp thông tin về những lần sinh con theo giới tính (số con có đến thời điểm hiện tại), tỷ lệ sống sót và lần sinh gần đây. Do đó, những thông tin này có thể được sử dụng để đánh giá mức độ hành vi sinh đẻ trong quá khứ và gần đây cũng như cơ cấu giới tính của các con - một chỉ số quan trọng cho thấy sự tồn tại của tình trạng lựa chọn giới tính trước khi sinh. Song, bởi phần lớn các câu hỏi này liên quan đến lần sinh gần đây nhất nên không đủ để tái hiện lại toàn bộ lịch sử sinh đẻ của phụ nữ (chẳng hạn, những lần sinh liền kề theo ngày tháng năm sinh và tỷ lệ sống sót). Các câu hỏi về lần sinh gần nhất có thể được sử dụng để ước tính TSGTKS trong thời gian gần đây nếu chỉ thu nhỏ phạm vi phân tích thành những lần sinh trong hai năm trở lại đây. Điều này cho phép tính TSGTKS trong những lần sinh gần đây nhất trong tương quan với đặc điểm của người mẹ (ví dụ: học vấn).