Chương 2: THU THẬP DỮ LIỆU (Collecting data) Đặt vấn đề:- Nghiệp vụ TK trong thực hành có thể chia thành 3 giai đoạn (3 bước nghiệp vụ) là thu thập, xử lý và phân tích dữ liệu. Song tổng hợp và phân tích dữ liệu trong thực tế cũng khó có thể phân biệt rạch ròi. Mặt khác, nội dung chủ yếu của 2 bước nghiệp vụ này chính là các phương pháp trình bày và suy diễn dữ liệu sẽ nghiên cứu ở các chương sau. - Từ đó, bắt đầu tiếp cận với các phương pháp TK, chương2 nghiên cứu nội dung thu thập dữ liệu. - Dữ liệu cần thu thập có thể là dữ liệu sơ cấp hoặc thứ cấp, song nội dung phong phú của hoạt động này là thu thập dữ liệu sơ cấp. Mục đích nghiên cứu: - Hình dung khái quát về bước thu thập dữ liệu thống kê. - Chú trọng nghiên cứu hình thức thu thập thông tin theo phương án điều tra. Tàiliệu tham khảo cho SV: - Thuật ngữ TK thông dụng- www.gso.gov.vn - Các phương án điều tra TK nhà nước -www.gso.gov.vn - Hệ thống Bảng câu hỏi trong thực tế điều tra nghiên cứu thị trường của các doanh nghiệp, điều tra xã hội học,… - Các giáo trình thống kê ứng dụng, Exel, SPSS. 1. MỘT SỐ VẤN ĐỀ CHUNG VỀ THU THẬP DỮ LIỆU (TTDL). 1.1. Phân loại: 1.1.1. Căn cứ vào tính chất thường xuyên, liên tục của việc TTDL: ▼Điều tra thường xuyên: TTDL thường xuyên theo sự phát sinh, phát triển của hiện tượng. TD: ghi chép hàng ngày ở các đơn vị. ▼Điều tra không thường xuyên: bao gồm: * Điều tra định kỳ: TTDL không thường xuyên nhưng có định kỳ. TD: tổng ĐT dân số (10 năm), kiểm kê kho định kỳ (hàng tháng , quí, cuối năm),… … * Điều tra không định kỳ. TD: ĐT nghiên cứu thị trường, ĐT tai nạn lao động,… 1.1.2. Căn cứ vào phạm vi của đối tượng điều tra : ▼Điều tra toàn bộ: TTDL trên toàn bộ đối tượng của tổng thể nghiên cứu. TD: tổng điều tra dân số, ghi chép hàng ngày ở các đơn vị, kiểm kê định kỳ hàng tồn kho định kỳ,…. ▼Điều tra không toàn bộ: TTDL trên một bộ phận của tổng thể cần nghiên cứu. Cần phân biệt 2 trường hợp: * Suy rộng được kết quả (ĐT chọn mẫu). TD: kiểm tra chất lượng đồ hộp xuất xưởng, ĐT nghiên cứu thị trường, ĐT năng suất lúa, ĐT mức sống dân cư,… * Không suy rộng được kết quả (ĐT chuyên đề, ĐT trọng điểm). TD: ĐT các vùng chuyên canh, các hiện tượng chuyên biệt,… 1.2. Các hình thức tổ chức TTDL. 1.2.1.Báo cáo thống kê (statistical report): hình thức thu thập thông tin theo chế độ báo cáo thống kê do cơ quan nhà nước có thẩm quyền ban hành. Báo cáo thống kê cũng là hình thức thu thập thông tin thống kê thường xuyên trong nội bộ của các đơn vị. Nội dung chủ yếu để xây dựng hệ thống báo cáo thống kê bao gồm: - Hướng dẫn ghi chép ban đầu. - Xây dựng hệ thống biểu mẫu báo cáo: danh mục, nội dung biểu; bản giải thích,… - Qui định về thiết kế và ban hành biểu mẫu báo cáo. - Qui định về chế độ báo cáo. 1.2.2.Điều tra thống kê (statistical survey): hình thức thu thập thông tin theo phương án điều tra. Như vậy, nghiên cứu về Điều tra thống kê chủ yếu là nghiên cứu Phương án điều tra đồng thời là Sai số trong điều tra thống kê. (mục 1.4) 1.3. Phương pháp TTDL. ▼Nhóm phương pháp trực tiếp: - Ghi chép ban đầu. - Kiểm kê trực tiếp. TD: kiểm kê hàng hóa tồn kho,…. - Phỏng vấn: gặp trực tiếp, qua điện thoại, qua e-mail. ▼Nhóm phương pháp gián tiếp: - Qua chứng từ, sổ sách có sẵn. - Qua internet, các kênh thông tin gián tiếp khác. - Tự ghi báo: phát phiếu điều tra; gửi bảng câu hỏi trên báo, tạp chí;… Theo cách tiếp cận khác, có thể phân biệt các phương pháp TTDL gồm: - Phỏng vấn. - Quan sát: trực diện, giấu mặt, - Phân tích dữ liệu có sẵn. - Thực nghiệm. 2. NỘI DUNG CƠ BẢN CỦA ĐIỀU TRA THỐNG KÊ. 2.1. Phương án điều tra (statistical survey design): văn bản được xây dựng trong giai đoạn chuẩn bị điều tra, qui định rõ những nội dung cần giải quyết hoặc cần hiểu thống nhất trong, trước và sau khi tiến hành điều tra. Nội dung cơ bản gồm: 2.1.1. Mục đích, yêu cầu điều tra. - Cần xác định mục đích chính. - Mục đích phải được xác định rõ ràng và số lượng mục đích không nhiều. - Là cơ sở để xác định các nội dung khác trong cuộc điều tra: đối tượng điều tra, nội dung điều tra,… Thí dụ: Mục đích điều tra của tổng điều tra dân số và nhà ở năm 2009 của VN (TĐT) là: ● Phục vụ công tác nghiên cứu, phân tích và dự báo quá trình phát triển dân số và nhà ở trên phạm vi cả nước và từng địa phương; ● Đáp ứng nhu cầu thông tin đánh giá tình hình thực hiện kế hoạch phát triển kinh tế-xã hội thời kỳ 2001-2010, xây dựng kế hoạch phát triển kinh tế-xã hội thời kỳ 2010-2020 và giám sát thực hiện mục tiêu phát triển thiên niên kỷ của liên hợp quốc mà chính phủ Việt nam đã cam kết; ● Cung cấp số liệu cơ bản về dân số và nhà ở của các đơn vị hành chính nhỏ nhất, bổ sung nguồn số liệu cho các cuộc điều tra thường xuyên, cung cấp dàn mẫu và cơ sở dữ liệu dân số và nhà ở cho các mục đích nghiên cứu khác trong 10 năm sau Tổng điều tra. 2.1.2. Đối tượng, đơn vị điều tra. *Đối tượng điều tra: tổng thể được thu thập thông tin trong cuộc điều tra. - Điều tra thống kê có thể là điều tra toàn bộ (tổng điều tra dân số), song đa phần là điều tra không toàn bộ (điều tra chọn mẫu) nên từ đối tượng điều tra được xác định, người ta chọn ra tổng thể mẫu để trực tiếp tiến hành thu thập thông tin. - Căn cứ để xác định đối tượng điều tra là mục đích điều tra. Thí dụ: Đối tượng điều tra của Tổng điều tra là: ● Tất cả người VN thường xuyên cư trú trên lãnh thổ nước CHXHCNVN có đến thời điểm điều tra, người VN được cơ quan có thẩm quyền cho phép xuất cảnh ra nước ngoài trong thời hạn qui định; ● Các trường hợp chết (của hộ) đã xảy ra từ ngày 01 tết Mậu Tý (ngày 7/2/2008 theo Dương Lịch) đến ngày 31/3/2009. ● Nhà ở của hộ dân cư. *Đơn vị điều tra : nơi phát sinh tàiliệu ban đầu mà điều tra viên cần đến và thu thập thông tin. Thí dụ: Đơn vị điều tra trong TĐT là hộ. Hộ bao gồm một người ăn ở riêng hoặc một nhóm người ở chung và ăn chung. Đối với hộ có từ 2 người trở lên, các thành viên trong hộ có thể có hay không có quĩ thu chi chung; có hoặc không mối quan hệ ruột thịt, hôn nhân hay nuôi dưỡng; hay kết hợp cả hai. 2.1.3. Nội dung điều tra. Nội dung điều tra là các đặc điểm của đối tượng điều tra (tiêu chí) cần thu thập thông tin trong cuộc điều tra. - Nội dung điều tra thường được thiết kế thành hệ thống câu hỏi trong Phiếu thu thập thông tin, có thể kèm Bản giải thích cách trả lời câu hỏi, cách ghi phiếu. - Hệ thống câu hỏi phải rõ ràng, dễ hiểu, có tính kiểm tra lẫn nhau và phù hợp với bước tổng hợp bằng các phầm mềm chuyên dùng (SPSS). - Nội dung điều tra phải nhằm đạt được mục đích điều tra đồng thời hệ thống câu hỏi phải sâu sắc theo đặc thù của đối tượng điều tra. Điều này đòi hỏi người thiết kế Bảng câu hỏi phải am tường đối tượng điều tra và nắm vững mục đích điều tra. Thí dụ: Nội dung điều tra trong TĐT trên phiếu điều tra toàn bộ gồm: các thông tin cá nhân (tên, giới tính,…), quan hệ với chủ hộ, tình hình đi học hiện nay, trình độ học vấn và trình độ chuyên môn nghiệp vụ,… . 2.1.4. Thời điểm điều tra (thời kỳ điều tra), thời gian thu thập thông tin. - Có những hiện tượng cần qui định cụ thể đến thời điểm (giờ) điều tra như tổng điều tra dân số hoặc ngày kê khai hiện tượng như điều tra chăn nuôi, có hiện tượng cần qui định thời kỳ ( tuần, tháng, quí,…) điều tra. - Qui định thời điểm, thời kỳ điều tra là nhằm tránh kê khai trùng lắp hay bỏ sót đối tượng điều tra trong thu thập tài liệu. - Cần chú ý chọn thời điểm điều tra vào lúc hiện tượng ổn định nhất và thuận tiện cho việc thu thập thông tin. * Thời điểm điều tra: mốc thời gian kê khai thống nhất thông tin của đối tượng điều tra. TD: + Thời điểm điều tra của TĐT là 0 giờ ngày 1/4/2009. + Thời gian thu thập thông tin tại địa bàn bắt đầu từ 7 giờ sáng 1/4/2009 đến ngày 20/4/2009. * Thời kỳ điều tra: khoảng thời gian ( tuần, tháng, quí,…) kê khai thông tin của đối tượng điều tra được tích lũy trong cả thời kỳ đó. TD: Thời kỳ điều tra để tính GDP thường kỳ là 1 năm,… Như vậy, khi qui định thời điểm điều tra thì không qui định thời kỳ điều tra và ngược lại. * Thời gian thu thập thông tin: khoảng thời gian qui định dành cho việc thu thập thông tin. 2.1.5. Phương pháp điều tra. - Xác định phương pháp điều tra cần phù hợp với mục đích, nội dung, qui mô , kinh phí của cuộc điều tra. - Nếu là Điều tra chọn mẫu cần xác định lược đồ điều tra, lược đồ chọn mẫu. Thí dụ: Phương pháp điều tra của TĐT là phỏng vấn trực tiếp. 2.1.6. Kế hoạch tổ chức và tiến hành cuộc điều tra. - Xây dựng phương án điều tra. - Lập kế hoạch thời gian: thời gian tập huấn điều tra viên (nếu cần); thời gian tiến hành điều tra, xử lý phiếu thu thập thông tin, phân tích báo cáo, - Xác định kế hoạch nhân sự: qui mô và nguồn nhân sự cần huy động. - Lập kế hoạch tài chính: ước tính tổng chi phí và nguồn kinh phí. Bao gồm: phí in ấn biểu mẫu, phí trả cho nhân viên điều tra theo số phiếu, phí quà tặng, phí tổng hợp, hội nghị,… - Các kế hoạch khác: phối hợp với các đơn vị khác( nều cần),… 2.2. Sai số trong điều tra thống kê (Survey Errors) Sai số trong điều tra thống kê là chênh lệch giữa trị số thực của hiện tượng nghiên cứu với trị số của hiện tượng thu thập được qua điều tra thống kê. Căn cứ vào nguyên nhân dẫn đến sai số, có thể phân biệt 2 loại sai số sau: 2.2.1. Sai số do kê khai (sai số phi chọn mẫu). Sai số do kê khai là sai số do cân, đong, đo, đếm, ghi chép, kê khai tàiliệu ban đầu. Nếu xét chi tiết theo các nguyên nhân, sai số do kê khai lại có thể phân biệt: * Sai số ngẫu nhiên: sai số hoàn toàn tình cờ, ngoài chủ ý của người thu thập thông tin hay người cung cấp thông tin. TD: vô tình công cụ cân đong đo đếm có sai lệch, do sự thiếu am tường hiện tượng của đáp viên; đơn cử như trong Tổng điều tra dân số, một số ít người dân không rõ năm sinh dương lịch của chính mình và buộc phải kê khai theo ước tính,… *Sai số có hệ thống: sai số do chủ ý của người thu thập thông tin, cung cấp thông tin sai lệch; hoặc do lỗi thiết kế nội dung điều tra, thang đo thiếu chuẩn xác, đặt câu hỏi không tốt,…. tạo sai số một cách có hệ thống. TD: Khi hỏi về tốc độ phục vụ của nhân viên 1 nhà hàng, các tình huống trả lời trong phiếu thu thập thông tin lệch về một phía như sau: Rất tốt, tốt, khá, trung bình, chậm chạp. Như vậy, thang đo trên ít chi tiết về phía của người không thích cung cách phục vụ ấy và sẽ tạo sai số hệ thống. Sai số do thang đo, do đặt câu hỏi không tốt,… được gọi là Sai số do thước đo (measurement error). Ngoài ra, khi xử lý phiếu thu thập thông tin phải tính cả những câu không có câu trả lời sẽ xuất hiện Sai số do không có câu trả lời (non reponse error) 2.2.2. Sai số chọn mẫu (sai số do tính chất đại biểu) (sampling error) Sai số chọn mẫu là sai số do tổng thể mẫu được chọn để điều tra thực tế không thể hoàn toàn đại diện cho tổng thể chung. Để hạn chế sai số do điều tra thống kê cần có những biện pháp về kỹ thuật thống kê lẫn các biện pháp về tổ chức điều tra. Một số biện pháp mang tính kỹ thuật thống kê như: chuẩn bị tốt Phương án điều tra trong đó đặc biệt là thiết kế tốt bảng câu hỏi, có phương pháp chọn mẫu thích hợp,….Một số biện pháp về tổ chức điều tra như: làm tốt khâu chuẩn bị điều tra, tập huấn điều tra viên; kiểm tra có hệ thống cuộc điều tra,… TÓM TẮT ĐT thường xuyên Định kỳ ĐT không thường xuyên Không định kỳ ĐT toàn bộ Phân loại ĐT chọn mẫu ĐT không toàn bộ ĐT chuyên đề,… Báo cáo TK ĐT thống kê Trực tiếp Phương pháp Gián tiếp Phỏng vấn Phương pháp Quan sát Phân tích DL có sẵn Thực nghiệm Sai số do kê khai Sai số do điều tra Sai số chọn mẫu BÀI TẬP 02.1. Hãy liên hệ thực tế để minh họa ĐT thường xuyên và ĐT không thường xuyên, ĐT toàn bộ và ĐT không toàn bộ. 02.2. Hãy biện luận so sánh 2 nhóm phương pháp điều tra trực tiếp và điều tra gián tiếp theo các mặt: mức độ chính xác, kinh phí, yêu cầu về đáp viên. Từ đó, nêu các trường hợp vận dụng từng nhóm phương pháp trên. 02.3. Hãy lập phương án điều tra của 1 cuộc ĐT nghiên cứu thị trường hay ĐT xã hội học về nội dung mà Anh (Chị) quan tâm. 02.4. Chọn câu trả lời đúng nhất: Câu 1: Tổng điều tra dân số là loại ĐT: a. Không thường xuyên. b. Toàn bộ. c. Báo cáo thống kê. d. a, b đúng. e. a, b, c đúng. Câu 2:Trong cuộc ĐT chăn nuôi heo, đối tượng điều tra là : a. Heo đang nuôi. b. Người nuôi heo. c. Hộ gia đình, XN, trạm trại, (cơ sở) nuôi heo. d. a, b, c sai. Câu 3:Phòng đào tạo một trường đại học lấy ý kiến của SV về chương trình đào tạo bằng cách phát phiếu điều tra đến SV thông qua lớp trưởng, như vậy đơn vị điều tra là: a. Phòng đào tạo nhà trường. b. Từng lớp học của nhà trường. c. Các cơ sở học tập, sinh hoạt của nhà trường. d. a, b, c sai. Câu 4: Một công ty sản xuất nước chấm tiến hành chọn mẫu một số người tiêu dùng và mời họ nếm 3 loại nước chấm mới sản xuất thử có 3 độ ngọt khác nhau để lấy ý kiến. Phương pháp điều tra thống kê công ty áp dụng là: a. Phỏng vấn. b. Quan sát. c. Thực nghiệm. d. Phân tích dữ liệu sẵn có. Câu 5: Loại sai số nào sau đây có thể giảm bằng cách tập huấn tốt cho phỏng vấn viên: a. Sai số chọn mẫu. b. Sai số do thước đo. c. a, b đúng. d. a, b sai. 02.5: Hãy trả lời đúng (Đ) , sai (S) cho các câu sau: a. __ Kiểm tra hàng hóa tồn kho thường là điều tra định kỳ. b. ___Chấm công ở các đơn vị là điều tra thống kê. c. _____ Đối tượng điều tra trong ĐT nghiên cứu thị trường thường là người tiêu dùng cuối cùng, người tiêu dùng trung gian (nhà phân phối). d. __ Câu hỏi “ Thu nhập 1 tháng của bạn là bao nhiêu ? ” trong phiếu thu thập thông tin thường sẽ dẫn đến sai số do không có câu trả lời. e. __ Báo cáo thống kê là hình thức thu thập và tổng hợp dữ liệu. . diễn dữ liệu sẽ nghiên cứu ở các chương sau. - Từ đó, bắt đầu tiếp cận với các phương pháp TK, chương 2 nghiên cứu nội dung thu thập dữ liệu. - Dữ liệu cần. hoạch phát triển kinh tế-xã hội thời kỳ 20 01 -20 10, xây dựng kế hoạch phát triển kinh tế-xã hội thời kỳ 20 10 -20 20 và giám sát thực hiện mục tiêu phát triển