Bài giảng cung cấp cho người học các kiến thức: Thu thập và xử lý số liệu, số liệu sơ cấp và số liệu thứ cấp, số liệu cắt ngang,... Hi vọng đây sẽ là một tài liệu hữu ích dành cho các bạn sinh viên đang theo học môn dùng làm tài liệu học tập và nghiên cứu. Mời các bạn cùng tham khảo chi tiết nội dung tài liệu.
1 Các loại số liệu Số liệu sơ cấp số liệu thứ cấp Số liệu sơ cấp: Những số liệu được quan sát hay thu thập lần đầu tiên bởi nhà nghiên cứu. Số liệu dạng này thường các nhà nghiên cứu tự thu thập từ: bản câu hỏi, phỏng vấn, quan sát, nghiên cứu tình huống, … Số liệu thứ cấp: Những số liệu đã được cơng bố hay thu thập trong q khứ hay do một nhóm thứ ba thu thập. Số liệu này thường được thu thập từ các cơ quan có liên quan, các nghiên cứu trước đó, cơ quan thống kê của chính phủ, Internet, … Nhà nghiên cứu cần tìm kiếm kỹ lưỡng các nguồn số liệu thứ cấp trước khi quyết định sử dụng số liệu sơ cấp do chi phí thấp hơn Số liệu thứ cấp thường được thu thập theo mục đích của người khác nên đơi khi khơng phù hợp với mục tiêu đang nghiên cứu Số liệu chuổi thời gian, cắt ngang, và hỗn hợp • Số liệu chuổi thời gian (Timeseries data): Số liệu chuổi thời gian là một tập hợp của những quan sát về những giá trị mà một biến số nhận được tại những thời điểm khác nhau. Số liệu này có thể được thu thập hàng ngày, tuần, tháng, q, năm, 5 năm, … • Số liệu chuổi thời gian thường được sử dụng trong phân tích kinh tế vĩ mơ để thấy được xu hướng phát triển của nền kinh tế Tốc độ tăng trưởng và lạm phát của Việt Nam 19892007 Năm Tốc độ tăng trưởng (%) Tỷ lệ lạm phát (%) 1999 4,77 2000 6,79 2001 6,89 2002 7,08 2003 7,34 3,2 2004 7,79 7,7 2005 8,44 8,3 2006 8,23 7,5 2007 8,48 8,3 1,6 Số liệu cắt ngang (Cross section data) Là số liệu về một hay nhiều biến số được thu thập tại cùng một thời điểm Ví dụ: như tổng điều tra dân số được Cục Tổng điều tra thực hiện mỗi 5 năm, Điều tra về chi tiêu tiêu dùng (VHLSS) Loại số liệu này thường có tính khơng đồng nhất: giá trị của các biến số biến động rất lớn giữa các quan sát Sản lượng trứng của các tiểu bang Hoa Kỳ Số liệu hỗn hợp (Panel data) là số liệu được kết hợp bởi cả số liệu chuổi thời gian và cắt ngang: cùng một đơn vị cắt ngang (chẳng hạn, một gia đình hay một cơng ty) được quan sát theo thời gian. Ví dụ về số liệu hỗn hợp Các phương pháp chọn mẫu Chọn mẫu phi xác suất: Chọn mẫu theo ý định chủ quan của người NC Chọn mẫu xác suất: Dựa vào lý thuyết xác suất để lấy mẫu ngẫu nhiên Các phương pháp chọn mẫu phi xác suất Chọn mẫu thuận tiện Chọn mẫu phán đoán Chọn mẫu chỉ định Chọn mẫu theo mạng quan hệ 10 Thiết kế bảng câu hỏi 1 MỤC TIÊU Giúp đáp viên hiểu đúng nội dung câu hỏi Động viên, tranh thủ sự cộng tác Hướng dẫn cách trả lời Tối thiểu các sai sót có thể xảy ra khi đáp viên trả lời 21 2 Nội dung BCH Phần giới thiệu Giới thiệu bản thân phỏng vấn viên Giới thiệu lý do, mục đích nghiên cứu Khoảng thời gian cần thiết để hồn thành Phần sàng lọc Chọn đúng đối tượng để thu dữ liệu Thường dùng BCH phân đơi Phần nội dung chính Đa số câu hỏi liên quan đến nội dung NC Phần quản lý: xác nhận, lời cam đoan, mẫu số 22 Ví dụ Phần giới thiệu Xin chào, tơi là thuộc nhóm nghiên cứu Chúng tơi đang thực hiện đề tài. Anh (chị) vui lịng dành chút thời gian khoảng để giúp chúng tơi trả lời một số câu hỏi dưới đây Chúng tơi rất hoan nghênh sự cộng tác và giúp đỡ của anh (chị). Các ý kiến trả lời của anh (chị) sẽ được đảm bảo giữ bí mật tuyệt đối. 23 Phần quản lý Nghiên cứu số Vùng, địa phương Bảng câu hỏi Phỏng vấn viên Phỏng vấn lúc Thời gian phỏng vấn Giám sát viên Kết luận của GSV Kiểm tra viên Kết quả kiểm tra Tên người trả lời Địa chỉ Điện thoại 24 Những việc cần làm khi thiết kế BCH 1 Xác định thông tin cần thiết Dự án nghiên cứu Danh mục các thơng tin cần có Bảng câu hỏi Nhóm người trả lời Các câu hỏi cần được chi tiết Các dữ liệu cần thu thập Vd: năng suất lúa Sản lượng từng vụ Sản lượng đã thu Diện tích từng vụ hoạch Diện tích gieo trồng 25 2. Xác định hình thức phỏng vấn Thư tín: tiện lợi, chi phí thấp nhưng tỷ lệ trả lời thấp, khó xác định độ tin cậy của thơng tin được thu thập Điện thoại: tốn kém, chỉ áp dụng khi thu thập ít thơng tin và thời gian phỏng vấn ngắn; thơng tin tương đối tin cậy Trực tiếp: thơng tin tin cậy, tỷ lệ trả lời cao nhưng tốn kém 26 3 Lựa chọn cấu trúc câu hỏi Câu hỏi mở: Phần trả lời không định trước, đáp viên tự trả lời theo suy nghĩ Khai thác ý kiến mới Tạo quan hệ mật thiết khi trả lời Khó tập hợp, mã hóa, phân tích Khơng phù hợp với phỏng vấn bằng thư tín Khó khăn khi đáp viên trả lời dài dịng, lạc đề 27 Câu hỏi đóng Câu trả lời được soạn sẵn, đáp viên chỉ chọn những trả lời sẵn có Ví dụ: Ơng (bà) trồng lúa theo mơ hình 3g3t 1. Có (tiếp tục) 2. Khơng (tạm dừng) Ơng (bà) gặp những khó khăn nào trong canh tác lúa? Vốn Lao động Công nghệ Thời tiết 28 4. Từ ngữ sử dụng trong BCH Câu hỏi phải diễn đạt vấn đề rõ ràng, dùng các từ: Who, What, Where, When, Why, How Sử dụng từ ngữ đơn giản, thơng dụng Tránh dùng từ ngữ trừu tượng. (Vd: đi sthị có thường khơng?) Tránh dùng câu hỏi có 2 vế song song (vừa vừa) Cẩn thận câu hỏi liên quan đến tự ái cá nhân. (hỏi về trình độ, ) Ý nghĩa từ ngữ được sử dụng? Có nghĩa nào khác khơng? Từ đồng âm khác nghĩa Từ địa phương (vd: lợnheo, tràchè,…) 29 5. Điều chỉnh BCH Tiến hành điều tra thử (pretest, pilot survey) Bổ sung, chỉnh sửa nếu có Những cuộc phỏng vấn mơ phỏng Câu trả lời khơng đầy đủ, lạc đề, sai nội dung, khơng đọc được Hiệu chỉnh sai sót thơng qua các BCH khác Dùng viết khác màu để chỉnh sửa Thống nhất nguyên tắc chỉnh lý chung 30 6. Nhập số liệu Mã hóa các câu hỏi và trả lời trước khi nhập, Soạn thảo các tập tin mơ tả việc mã hóa để phục vụ cho việc đọc số liệu trong tập tin dữ liệu Nhập số liệu vào máy tính, các phần mềm xử lý bảng tính: Excel, SPSS, Stata, Limdep, … Kiểm tra độ chính xác của việc nhập: so sánh ngẫu nhiên một số mẫu; tổ chức nhiều người nhập liệu song song, … 31 XỬ LÝ VÀ PHÂN TÍCH DỮ LIỆU i. Phân tích thống kê mơ tả Độ tập trung: mean, mode, median Độ phân tán:phương sai, độ lệch chuẩn, dãy biến động, hệ số biến động ii. Phân tích tần số: đếm tần số xuất hiện, đồ thị phân phối tần số iii. Phân tích phương sai: một chiều, nhiều chiều iv. Phân tích hồi quy tương quan, … 32 Các bước trong phân tích số liệu và viết báo cáo Những câu hỏi cần trả lời Các số liệu đã được thu thập cho mỗi mục tiêu NC là gì? Các bước cần thực hiện Chuẩn bị số liệu cho phân tích Số liệu có hồn chỉnh và chính xác khơng? Xem xét lại việc thu thập tại thực địa, Lập bảng kiểm kê các số liệu cho mỗi mục tiêu, Xếp thứ tự các số liệu và kiểm tra chất lượng, Kiểm tra output của máy tính Các số liệu trơng như thế nào? Tóm tắt số liệu và Các số liệu có thể được tóm mơ tả các biến/xác tắt như thế nào cho phân định biến mới tích đơn giản? Các cơng việc chính trong mỗi bước Bảng tần suất, biểu đồ, biểu đồ phát triển, tỷ trọng, tần suất chéo, hệ số tương quan, các thống kê mơ tả, … 33 Sự tương quan giữa các biến số được xác định như thế nào? Bảng tần suất chéo, Phân tích sự tương quan Chuẩn bị cho phân tích thống kê Có đo lường sự chênh Xác định loại của Đo lường sự tương quan, Xử lý các biến nhiễu Các đo lường sự phân tán, phân phối chuẩn và sự biến động mẫu lệch hay tương quan giữa phân tích thống kê các biến khơng? Lựa chọn các kiểm định về Làm thế nào sự khác biệt Phân tích các quan Ttest, chisquare test giữa các nhóm có thể được xác định? sát theo cặp và lẻ Làm thế nào sự tương Thực hiện các đo quan giữa các biến có thể được xác định? mức ý nghĩa paired ttest McNemar’s chisquare test lường về sự tương quan Biểu đồ phân tán, Đường hồi quy, và Hệ số tương quan 34 Chuẩn bị dàn ý của báo cáo, Báo cáo nên được viết Viết báo cáo và xây như thế nào? dựng các kiến nghị Trình bày và diễn dịch số liệu, Bản nháp và bản nháp lần 2 Thảo luận và tóm tắt kết luận Xây dựng kiến nghị Những kết quả và kiến Trình bày tóm tắt và nghị nên được cơng bố bản nháp cho việc và sử dụng như thế thực hiện các kiến nào? nghị Thảo luận những tóm tắt và kế hoạch thực hiện đối với những người liên quan 35 ...Các loại? ?số? ?liệu Số liệu sơ cấp số liệu thứ cấp ? ?Số? ?liệu? ?sơ cấp: Những? ?số? ?liệu? ?được quan sát hay? ?thu? ?thập? ?lần đầu tiên bởi nhà? ?nghiên? ?cứu. ? ?Số? ?liệu? ?dạng này thường các nhà? ?nghiên? ?cứu? ?tự? ?thu? ?thập? ?... từ: bản câu hỏi, phỏng vấn, quan sát,? ?nghiên? ?cứu? ?tình huống, … ? ?Số? ?liệu? ?thứ cấp: Những? ?số? ?liệu? ?đã được cơng bố hay? ?thu? ?thập? ?trong q khứ hay do một nhóm thứ ba? ?thu? ?thập. ? ?Số? ?liệu? ?này thường được? ?thu? ?thập? ?từ các cơ quan có liên quan, các? ?nghiên? ?cứu? ?trước đó, cơ quan thống kê của ... Lập bảng kiểm kê các? ?số? ?liệu? ? cho mỗi mục tiêu, Xếp thứ tự các? ?số? ?liệu? ?và? ?kiểm tra chất lượng, Kiểm tra output của máy tính Các? ?số? ?liệu? ?trơng như thế nào? Tóm tắt? ?số? ?liệu? ?và? ? Các? ?số? ?liệu? ?có thể được tóm