Chương 2: THU THẬP DỮ LIỆU Trần Minh Nguyệt Đại học THĂNG LONG Tháng năm 2014 Trần Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng kinh tế xã hội Tháng năm 2014 / 16 Nội dung Xác định liệu cần thu thập Dữ liệu thứ cấp liệu sơ cấp Một số cách chọn mẫu Trần Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng kinh tế xã hội Tháng năm 2014 / 16 Xác định liệu cần thu thập Xác định liệu cần thu thập Khi thu thập liệu cần xác định rõ: Dữ liệu cần thu thập; Thứ tự ưu tiên liệu; Phạm vi, giới hạn liệu cần thu thập Trần Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng kinh tế xã hội Tháng năm 2014 / 16 Dữ liệu thứ cấp liệu sơ cấp Dữ liệu thứ cấp Dữ liệu thứ cấp liệu thu thập từ nguồn sẵn có, thường liệu qua tổng hợp, xử lý Dữ liệu thứ cấp có ưu điểm thu thập nhanh, tốn chi phí Tuy nhiên, đơi liệu thức cấp chi tiết khơng đáp ứng nhu cầu nghiên cứu Nguồn cung cấp liệu thức cấp: Nội bộ, quan thống kê nhà nước, quan phủ, báo, tạp chí, Trần Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng kinh tế xã hội Tháng năm 2014 / 16 Dữ liệu thứ cấp liệu sơ cấp Dữ liệu sơ cấp Dữ liệu sơ cấp liệu thu thập trực tiếp, ban đầu từ đối tượng nghiên cứu Dữ liệu sơ cấp chi tiết đáp ứng tốt nhu cầu nghiên cứu Tuy nhiên, thu thập liệu sơ cấp phải tốn thời gian chi phí nhiều Nguồn cung cấp liệu sơ cấp: Trong nghiên cứu thử nghiệm, người nghiên cứu đo đạc thu thập liệu kết thử nghiệm Trong nghiên cứu quan sát, liệu thu thập từ nhiều nguồn: cá nhân, gia đình, quan, tổ chức, hình thức vấn trực tiếp, qua thư, điện thoại, Trần Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng kinh tế xã hội Tháng năm 2014 / 16 Một số cách chọn mẫu Mẫu ngẫu nhiên Chọn mẫu ngẫu nhiên trình lựa chọn cho đơn vị tổng thể có hội chọn vào mẫu Để mẫu đại diện cho tổng thể mẫu phải chọn ngẫu nhiên từ tổng thể Trong phần sau này, mẫu chọn giả sử có từ q trình chọn mẫu ngẫu nhiên Trần Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng kinh tế xã hội Tháng năm 2014 / 16 Một số cách chọn mẫu Chọn mẫu có hồn lại khơng hồn lại Chọn mẫu có hồn lại cách chọn mẫu mà đơn vị tổng thể chọn lại trả lại tổng thể Chọn mẫu khơng hồn lại cách chọn mẫu mà đơn vị tổng thể chọn không đặt trả lại tổng thể Trần Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng kinh tế xã hội Tháng năm 2014 / 16 Một số cách chọn mẫu Chọn mẫu có hồn lại khơng hồn lại Hãy xét xem ví dụ sau chọn mẫu có hồn lại hay khơng hòan lại: Chọn ngẫu nhiên sinh viên từ lớp học có 80 sinh viên Chọn bóng từ hộp chứa 10 bóng biết lần lấy bóng sau lại trả lại vào hộp Chọn người từ 10 người để làm công việc biết người làm nhiều việc Chọn ngẫu nhiên quân từ gồm 52 quân Trần Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng kinh tế xã hội Tháng năm 2014 / 16 Một số cách chọn mẫu Một số cách chọn mẫu ngẫu nhiên Chọn mẫu ngẫu nhiên đơn giản; Chọn mẫu hệ thống; Chọn mẫu theo khối/cụm chọn mẫu nhiều giai đoạn; Chọn mẫu phân tầng Trần Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng kinh tế xã hội Tháng năm 2014 / 16 Một số cách chọn mẫu Chọn mẫu ngẫu nhiên đơn giản Để chọn mẫu ngẫu nhiên đơn giản, ta phải tạo danh sách phần tử tổng thể đánh số từ đến N Nếu số phần tử tổng thể N nhỏ (vài chục vài trăm) ta dùng phương pháp bốc thăm Ghi số từ đến N vào mảnh giấy, gập lại, trộn đều, từ lấy số thăm số phần tử mẫu cần chọn ta mẫu ngẫu nhiên cần chọn Nếu số phần tử tổng thể lớn (vài trăm vài nghìn nữa) ta dùng bảng số ngẫu nhiên sinh số ngẫu nhiên từ phần mềm Trần Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng kinh tế xã hội Tháng năm 2014 10 / 16 Một số cách chọn mẫu Ví dụ Chọn ngẫu nhiên sinh viên đại diện cho lớp dự đại hội từ 10 sinh viên tiêu biểu sau: STT 10 Họ tên Tran Thi Mo Nguyen Van An Le Thu Ha Quach Thi Hong Dinh Thuy Quynh Tran Thu Trang Vu Manh Hai Le Quynh Anh Dang Thi Mai Nguyen Ngoc Anh Trần Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng kinh tế xã hội Tháng năm 2014 11 / 16 Một số cách chọn mẫu Chọn mẫu ngẫu nhiên đơn giản R Lệnh sample(x, size, replace = FALSE) để chọn mẫu ngẫu nhiên R Trong đó: x : véc tơ phần tử chọn, số nguyên dương; size : cỡ mẫu; replace= T/F : chọn mẫu có/khơng hoàn lại; ? Dùng phần mềm R chọn ngẫu nhiên sinh viên từ 10 bạn Trần Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng kinh tế xã hội Tháng năm 2014 12 / 16 Một số cách chọn mẫu Lấy mẫu hệ thống Trong trường hợp mẫu cần lấy có số phần tử lớn việc chọn mẫu ngẫu nhiên đơn giản trở nên nặng nề, thay vào người ta sử dụng cách lấy mẫu theo hệ thống Các bước thực sau: Lập danh sách phần tử tổng thể, đánh số từ đến N Xác định cỡ mẫu cần lấy, ví dụ gồm n quan sát N (nếu k khơng phải n số ngun dương làm tròn đến số nguyên dương gần nhất) Chia tổng thể thành k nhóm theo cơng thức k = Trong k đơn vị chọn phần tử, đơn vị mẫu đầu tiên, đơn vị mẫu lấy cách đơn vị khoảng k, 2k, 3k, Nếu hết danh sách N đơn vị mà chưa đủ n phần tử mẫu ta quay trở lại đầu danh sách với quy ước N + = 1, N + = 2, Trần Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng kinh tế xã hội Tháng năm 2014 13 / 16 Một số cách chọn mẫu Ví dụ: Với N = 57, n = 10, lấy k = Giả sử số chọn phần tử là: 8, 14, 20, 26, 32, 38, 44, 50, 56 Nếu số chọn phần tử mẫu là: 12, 18, 24, 30, 36, 42, 48, 52, 1(= 57 + 1) Trần Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng kinh tế xã hội Tháng năm 2014 14 / 16 Một số cách chọn mẫu Chọn mẫu theo khối/cụm chọn mẫu nhiều giai đoạn Chọn mẫu theo khối/cụm cách chọn mẫu cách chia tổng thể thành nhiều khối, khối xem tổng thể con, lấy ngẫu nhiên đơn giản m khối, sau khảo sát hết đối tượng khối mẫu lấy Khi khối chọn lớn phần tử khối có khuynh hướng giống nên không thiết phải khảo sát hết khối mà khảo sát số đơn vị khối mà Cách chọn mẫu gọi chọn mẫu theo nhiều giai đoạn Trần Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng kinh tế xã hội Tháng năm 2014 15 / 16 Một số cách chọn mẫu Chọn mẫu phân tầng Chọn mẫu phân tầng sử dụng đơn vị tổng thể khác tính chất liên quan đến vấn đề nghiên cứu khảo sát Theo phương pháp tổng thể nghiên cứu chia thành tầng lớp, cho đối tượng tổng thể ta quan tâm thuộc tầng khác tốt Sau đơn vị mẫu chọn từ tầng theo phương pháp lấy mẫu thông thường lấy mẫu ngẫu nhiên đơn giản hay lấy mẫu hệ thống Trần Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng kinh tế xã hội Tháng năm 2014 16 / 16 ... khơng đáp ứng nhu cầu nghiên cứu Nguồn cung cấp liệu thức cấp: Nội bộ, quan thống kê nhà nước, quan phủ, báo, tạp chí, Trần Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng kinh tế xã hội... chọn ngẫu nhiên từ tổng thể Trong phần sau này, mẫu chọn giả sử có từ q trình chọn mẫu ngẫu nhiên Trần Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng kinh tế xã hội Tháng năm 2014... suất thống kê ứng dụng kinh tế xã hội Tháng năm 2014 11 / 16 Một số cách chọn mẫu Chọn mẫu ngẫu nhiên đơn giản R Lệnh sample(x, size, replace = FALSE) để chọn mẫu ngẫu nhiên R Trong đó: x :