Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 99 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
99
Dung lượng
644,49 KB
Nội dung
ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN Mai Thị Hương CÁC PHƯƠNG PHÁP LẤY MẪU VÀ XỬ LÝ MẪU LUẬN VĂN THẠC SĨ KHOA HỌC Hà Nội - 2013 ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN Mai Thị Hương CÁC PHƯƠNG PHÁP LẤY MẪU VÀ XỬ LÝ MẪU Chuyên ngành: Lý thuyết xác suất thống kê toán học Mã số: 60.46.15 LUẬN VĂN THẠC SĨ KHOA HỌC Người hướng dẫn khoa học: PGS TS Đào Hữu Hồ Hà Nội - 2013 Mục lục Lời nói đầu Mẫu ngẫu nhiên đơn giản từ lô hữu hạn phần tử 1.1 Định nghĩa ký hiệu 1.2 Tính chất ước lượng 1.3 Phương sai ước lượng 1.4 Ước lượng sai số tiêu chuẩn từ mẫu 11 1.5 Giới hạn tin cậy 12 1.6 Mẫu ngẫu nhiên có hồn lại 13 1.7 Ước lượng tỷ số 13 1.8 Tỷ lệ mẫu 14 1.9 Ưu điểm nhược điểm lấy mẫu ngẫu nhiên đơn giản 16 Lấy mẫu ngẫu nhiên phân tầng lấy mẫu hệ thống 2.1 19 Lấy mẫu ngẫu nhiên phân tầng 19 2.1.1 Tính chất ước lượng 20 2.1.2 Phương sai ước lượng giới hạn tin cậy 25 2.1.3 Số lượng tối ưu 25 2.1.4 Độ xác tương đối mẫu ngẫu nhiên phân tầng mẫu ngẫu nhiên đơn giản 27 2.1.5 Ước lượng cỡ mẫu với số liệu liên tục 30 2.1.6 Ước lượng mẫu cho tỷ lệ mẫu phân tầng 32 2.1.7 Hiệu độ lệch từ số lượng tối ưu 33 2.1.8 Hiệu sai số theo cỡ tầng 35 2.1.9 2.2 Ưu điểm nhược điểm mẫu ngẫu nhiên phân tầng 37 Mẫu hệ thống 39 2.2.1 Mô tả 39 2.2.2 Phương sai trung bình ước lượng 41 Mẫu chùm 48 3.1 Mẫu chùm với chùm cỡ 49 3.2 Mẫu chùm với chùm không cỡ 52 3.2.1 Mẫu ngẫu nhiên đơn giản chùm: Ước lượng không chệch 3.2.2 3.2.3 Mẫu ngẫu nhiên đơn giản chùm: Ước lượng dạng tỷ số 52 Lấy mẫu với xác suất tỷ lệ theo cỡ chùm 53 Phương pháp lấy mẫu lấy mẫu cặp 4.1 4.2 4.3 52 62 Lấy mẫu với tập có cỡ 62 4.1.1 Lấy mẫu hai giai đoạn 62 4.1.2 Trung bình phương sai lấy mẫu hai giai đoạn 63 4.1.3 Phương sai trung bình ước lượng lấy mẫu hai giai đoạn 64 4.1.4 Ước lượng mẫu phương sai 66 4.1.5 Ước lượng tỷ lệ 67 4.1.6 Cỡ mẫu tối ưu mẫu 69 4.1.7 Ước lượng mopt từ khảo sát thí điểm 71 4.1.8 Kỹ thuật lấy mẫu ba giai đoạn 72 Lấy mẫu với tập không cỡ 74 4.2.1 Các phương pháp lấy mẫu n = 75 4.2.2 Phương pháp lấy mẫu n > 82 Kỹ thuật lấy mẫu cặp 87 4.3.1 Lấy mẫu cặp phân tầng 87 4.3.2 Số lượng tối ưu 90 4.3.3 Phương sai ước lượng lấy mẫu cặp phân tầng 91 4.3.4 Ước lượng hồi quy 92 4.3.5 Ước lượng phương sai lấy mẫu cặp hồi quy 93 Kết luận 95 Tài liệu tham khảo 96 LỜI NĨI ĐẦU Trong nghiên cứu thống kê tốn học, mẫu đại diện thông tin mà nhà thống kê có được, sở phân tích, xử lý, rút kết luận cần thiết Do việc lấy mẫu khơng thể thiếu nghiên cứu thống kê Các điểm lấy mẫu tạo nhóm nhỏ từ tổng thể mang đầy đủ thông tin tổng thể Tức là, muốn có nhóm nhỏ giống nhóm lớn Với ý nghĩ đó, tính tìm kiếm mẫu mức độ đại diện - rút mẫu đại diện cho tổng thể ? Mẫu cần có tính chất chặt chẽ để giống tổng thể? Lấy mẫu có ưu điểm bật Đó giảm chi phí số liệu thu thập nhanh - Giảm chi phí: Nó rõ ràng tốn nghiên cứu liệu tập tổng thể, khơng phải tồn tổng thể Hơn nữa, liệu thu thập mẫu lựa chọn cách cẩn thận có độ xác cao tồn tổng thể - Tốc độ: việc quan sát thu thập tóm tắt mẫu dễ dàng nhanh so với tổng thể Điều tra toàn tổng thể cách liệt kê không thực tế Như vậy, điều tra dựa mẫu có linh hoạt loại thơng tin đạt Lấy mẫu ứng dụng rộng rãi tất lĩnh vực khoa học xã hội mà có nghiên cứu ứng dụng thống kê toán học Ở Việt Nam, lấy mẫu sử dụng nhiều ngành Song tồn thực tế khơng trường hợp Việt Nam mẫu lấy không đại diện trung thực khách quan cho tổng thể, chẳng hạn vùng trồng rau Thanh Trì Hà Nội người ta lấy mẫu gồm quan sát để kiểm tra xem có dư thừa độc tố rau hay khơng, để kiểm tra an toàn thực phẩm hoa Trung Quốc nhập qua biên giới phía Bắc, phận kiểm tra lấy số hàng chục ngàn quả, v .; Do dẫn đến kết luận trái ngược quan khoa học thành phố kết luận trái ngược với thực tế xảy Bàn việc lấy mẫu đại diện nước ta việc làm vượt tầm khả tác vượt ngồi khn khổ luận văn Dựa chuyên khảo “Sampling techniques” William G Cochran số báo, số bình luận, nhận xét trang mạng Bách khoa toàn thư mở (Wikipedia), luận văn “Các phương pháp lấy mẫu xử lý mẫu” trình bày tổng quan phương pháp lấy mẫu lô (một tổng thể) gồm hữu hạn phần tử xử lý thống kê đại lượng liên quan lô Luận văn gồm chương: - Chương trình bày kết mẫu ngẫu nhiên đơn giản từ lô gồm hữu hạn phần tử Các ước lượng, tính chất phương sai ước lượng trung bình tổng thể, tổng thể, tỷ số Ở chương đưa khái niệm mà ta dùng chương như: khái niệm ước lượng khơng chệch, tính vững ước lượng - Chương đề cập đến lấy mẫu ngẫu nhiên phân tầng lấy mẫu hệ thống, trình bày theo mạch giống lấy mẫu ngẫu nhiên đơn giản Ngoài có so sánh mẫu ngẫu nhiên phân tầng mẫu ngẫu nhiên đơn giản, mẫu hệ thống với mẫu ngẫu nhiên phân tầng - Chương đề cập đến mẫu chùm với chùm cỡ, không cỡ kết hợp mẫu chùm mẫu đề cập hai chương trước - Chương 4: Lấy mẫu lấy mẫu cặp Lấy mẫu đưa kết cho mẫu hai giai đoạn mẫu ba giai đoạn Lấy mẫu cặp đề cập tới mẫu cặp phân tầng ước lượng hồi quy Qua đây, tác giả xin bày tỏ lời cảm ơn sâu sắc đến người thầy, người hướng dẫn luận văn mình, PGS.TS Đào Hữu Hồ, người đưa đề tài tận tình hướng dẫn suốt trình làm luận văn tác giả Đồng thời tác giả gửi lời cảm ơn tới đồng nghiệp, người bạn giúp đỡ tác giả q trình hồn thành luận văn Do thời gian trình độ hạn chế, chắn luận văn khơng thể tránh khỏi thiếu sót, tác giả mong bảo tận tình thầy cô, đồng nghiệp bạn, tác giả xin chân thành cảm ơn! Hà Nội, ngày tháng 01 năm 2013 Tác giả Mai Thị Hương Chương Mẫu ngẫu nhiên đơn giản từ lô hữu hạn phần tử 1.1 Định nghĩa ký hiệu Lấy mẫu ngẫu nhiên đơn giản phương pháp chọn n phần tử số n N phần tử cho mẫu CN mẫu phân biệt có khả chọn Các phần tử tổng thể đánh số từ đến N Khi dãy số ngẫu nhiên từ tới N rút từ bảng số ngẫu nhiên từ chương trình máy tính tạo bảng n Dễ dàng thấy tất CN mẫu phân biệt có khả chọn theo phương pháp Thực vậy, ta xét mẫu, tập gồm n phần tử ấn định Ở lần rút đầu tiên, xác suất để phần tử n n phần tử chọn Ở lần rút thứ hai xác suất để phần tử N n−1 (n − 1) phần tử ấn định lại rút , Do xác N −1 suất để tất n phần tử ấn định lựa chọn sau n lần rút n n−1 n−2 n! (N − n)! · · ···· = = n N N −1 N −2 N −n+1 N! CN Bởi phần tử rút không trả lại tổng thể nên phương pháp gọi lấy mẫu ngẫu nhiên không hồn lại Còn phần tử rút lại trả lại tổng thể trước thực lần rút tiếp theo, gọi lấy mẫu ngẫu nhiên có hồn lại Khi lần rút tất phần tử tổng thể có khả rút chúng rút hay chưa Các công thức phương sai ước lượng phương sai ước lượng thường đơn giản lấy mẫu hoàn lại so với lấy mẫu khơng hồn lại Với lý này, lấy mẫu hồn lại đơi sử dụng cách lấy mẫu phức tạp lấy mẫu khơng hồn lại Trong nghiên cứu mẫu ta quan tâm tính chất hay đặc trưng cố gắng đo, ghi lại phần tử chọn Các giá trị nhận đặc trưng xác định N phần tử tổng thể ký hiệu y1 , y2 , , yN Các giá trị tương ứng phần tử mẫu ký hiệu y1 , y2 , , yn Tổng thể Mẫu N Tổng: Y = n yi = y1 + y2 + + yN yi = y1 + y2 + + yn 1 N y1 + y2 + + yN Trung bình: Y¯ = = N n yi y1 + y2 + + yn y¯ = = n N yi n Trong mục ta quan tâm đến ước lượng ba đại lượng: trung bình tổng thể Y¯ , tổng tổng thể (Y ) tỷ số tổng trung bình ¯ tổng thể R = Y /X = Y X ¯ Để cho gọn đặc trưng tổng thể ta gọi đặc trưng lý thuyết Ta dùng ký hiệu “ˆ” để ước lượng đặc trưng tổng thể xây dựng từ mẫu Ước lượng ¯ = y¯ =Trung bình mẫu Yˆ Trung bình lý thuyết: Y¯ Yˆ = N y¯ = N Tổng lý thuyết: Y n yi n ˆ = y¯/¯ R x= Tỷ số lý thuyết: R n yi 1.2 n xi Tính chất ước lượng Trong luận văn này, phương pháp ước lượng gọi vững ước lượng giá trị tổng thể n = N , nghĩa mẫu bao gồm toàn tổng thể Với mẫu ngẫu nhiên đơn giản rõ ràng y¯ N y¯ tương ứng ước lượng vững trung bình lý thuyết tổng lý thuyết Một phương pháp ước lượng khơng chệch giá trị trung bình ước lượng lấy tồn mẫu có thể, xác giá trị tổng thể chân thực Dùng E để ký hiệu cho trung bình tất mẫu có Định lý 1.1 Trung bình mẫu y¯ ước lượng không chệch Y¯ Chứng minh Theo định nghĩa ta có: E y¯ = y¯ n CN = (y1 + y2 + + yn ) , n [N !/n! (N − n)!] (1.1) n tổng lấy tất CN mẫu Để ước lượng tổng này, ta phải có mẫu có xuất giá trị yi xác định Vì có (N − 1) phần tử khác chứa tất phần tử lại mẫu (n − 1) vị trí khác để lấp đầy mẫu, số mẫu chứa yi n−1 CN −1 = (N − 1)! (n − 1)! (N − n)! Do (y1 + y2 + + yn ) = (N − 1)! (y1 + y2 + + yN ) (n − 1)! (N − n)! Từ (1.1) suy n! (N − n)! (N − 1)! · (y1 + y2 + + yN ) (n − 1)! (N − n)! n.N ! (y1 + y2 + + yN ) = = Y¯ N E y¯ = Định lý chứng minh Hệ 1.2 Y = N y¯ ước lượng không chệch tổng lý thuyết Y 1.3 Phương sai ước lượng Phương sai yi tổng thể hữu hạn thường xác định sau: N σ2 = yi − Y¯ N , (1.2) ... chưa Các công thức phương sai ước lượng phương sai ước lượng thường đơn giản lấy mẫu hồn lại so với lấy mẫu khơng hoàn lại Với lý này, lấy mẫu hoàn lại sử dụng cách lấy mẫu phức tạp lấy mẫu khơng... đến mẫu chùm với chùm cỡ, không cỡ kết hợp mẫu chùm mẫu đề cập hai chương trước - Chương 4: Lấy mẫu lấy mẫu cặp Lấy mẫu đưa kết cho mẫu hai giai đoạn mẫu ba giai đoạn Lấy mẫu cặp đề cập tới mẫu. .. khoa toàn thư mở (Wikipedia), luận văn Các phương pháp lấy mẫu xử lý mẫu trình bày tổng quan phương pháp lấy mẫu lô (một tổng thể) gồm hữu hạn phần tử xử lý thống kê đại lượng liên quan lô Luận