1. Trang chủ
  2. » Luận Văn - Báo Cáo

Luận văn thạc sĩ các phương pháp lấy mẫu và xử lý mẫu

99 1 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Nội dung

ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN Mai Thị Hương CÁC PHƯƠNG PHÁP LẤY MẪU VÀ XỬ LÝ MẪU LUẬN VĂN THẠC SĨ KHOA HỌC Hà Nội - 2013 z ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN Mai Thị Hương CÁC PHƯƠNG PHÁP LẤY MẪU VÀ XỬ LÝ MẪU Chuyên ngành: Lý thuyết xác suất thống kê toán học Mã số: 60.46.15 LUẬN VĂN THẠC SĨ KHOA HỌC Người hướng dẫn khoa học: PGS TS Đào Hữu Hồ Hà Nội - 2013 z Mục lục Lời nói đầu Mẫu ngẫu nhiên đơn giản từ lô hữu hạn phần tử 1.1 Định nghĩa ký hiệu 1.2 Tính chất ước lượng 1.3 Phương sai ước lượng 1.4 Ước lượng sai số tiêu chuẩn từ mẫu 11 1.5 Giới hạn tin cậy 12 1.6 Mẫu ngẫu nhiên có hồn lại 13 1.7 Ước lượng tỷ số 13 1.8 Tỷ lệ mẫu 14 1.9 Ưu điểm nhược điểm lấy mẫu ngẫu nhiên đơn giản 16 Lấy mẫu ngẫu nhiên phân tầng lấy mẫu hệ thống 2.1 19 Lấy mẫu ngẫu nhiên phân tầng 19 2.1.1 Tính chất ước lượng 20 2.1.2 Phương sai ước lượng giới hạn tin cậy 25 2.1.3 Số lượng tối ưu 25 2.1.4 Độ xác tương đối mẫu ngẫu nhiên phân tầng mẫu ngẫu nhiên đơn giản 27 2.1.5 Ước lượng cỡ mẫu với số liệu liên tục 30 2.1.6 Ước lượng mẫu cho tỷ lệ mẫu phân tầng 32 2.1.7 Hiệu độ lệch từ số lượng tối ưu 33 2.1.8 Hiệu sai số theo cỡ tầng 35 z 2.1.9 2.2 Ưu điểm nhược điểm mẫu ngẫu nhiên phân tầng 37 Mẫu hệ thống 39 2.2.1 Mô tả 39 2.2.2 Phương sai trung bình ước lượng 41 Mẫu chùm 48 3.1 Mẫu chùm với chùm cỡ 49 3.2 Mẫu chùm với chùm không cỡ 52 3.2.1 Mẫu ngẫu nhiên đơn giản chùm: Ước lượng không chệch 3.2.2 3.2.3 Mẫu ngẫu nhiên đơn giản chùm: Ước lượng dạng tỷ số 52 Lấy mẫu với xác suất tỷ lệ theo cỡ chùm 53 Phương pháp lấy mẫu lấy mẫu cặp 4.1 4.2 4.3 52 62 Lấy mẫu với tập có cỡ 62 4.1.1 Lấy mẫu hai giai đoạn 62 4.1.2 Trung bình phương sai lấy mẫu hai giai đoạn 63 4.1.3 Phương sai trung bình ước lượng lấy mẫu hai giai đoạn 64 4.1.4 Ước lượng mẫu phương sai 66 4.1.5 Ước lượng tỷ lệ 67 4.1.6 Cỡ mẫu tối ưu mẫu 69 4.1.7 Ước lượng mopt từ khảo sát thí điểm 71 4.1.8 Kỹ thuật lấy mẫu ba giai đoạn 72 Lấy mẫu với tập không cỡ 74 4.2.1 Các phương pháp lấy mẫu n = 75 4.2.2 Phương pháp lấy mẫu n > 82 Kỹ thuật lấy mẫu cặp 87 4.3.1 Lấy mẫu cặp phân tầng 87 4.3.2 Số lượng tối ưu 90 4.3.3 Phương sai ước lượng lấy mẫu cặp phân tầng 91 4.3.4 Ước lượng hồi quy 92 4.3.5 Ước lượng phương sai lấy mẫu cặp hồi quy 93 z Kết luận 95 Tài liệu tham khảo 96 z LỜI NÓI ĐẦU Trong nghiên cứu thống kê tốn học, mẫu đại diện thơng tin mà nhà thống kê có được, sở phân tích, xử lý, rút kết luận cần thiết Do việc lấy mẫu thiếu nghiên cứu thống kê Các điểm lấy mẫu tạo nhóm nhỏ từ tổng thể mang đầy đủ thông tin tổng thể Tức là, muốn có nhóm nhỏ giống nhóm lớn Với ý nghĩ đó, tính tìm kiếm mẫu mức độ đại diện - rút mẫu đại diện cho tổng thể ? Mẫu cần có tính chất chặt chẽ để giống tổng thể? Lấy mẫu có ưu điểm bật Đó giảm chi phí số liệu thu thập nhanh - Giảm chi phí: Nó rõ ràng tốn nghiên cứu liệu tập tổng thể, toàn tổng thể Hơn nữa, liệu thu thập mẫu lựa chọn cách cẩn thận có độ xác cao tồn tổng thể - Tốc độ: việc quan sát thu thập tóm tắt mẫu dễ dàng nhanh so với tổng thể Điều tra tồn tổng thể cách liệt kê khơng thực tế Như vậy, điều tra dựa mẫu có linh hoạt loại thơng tin đạt Lấy mẫu ứng dụng rộng rãi tất lĩnh vực khoa học xã hội mà có nghiên cứu ứng dụng thống kê toán học Ở Việt Nam, lấy mẫu sử dụng nhiều ngành Song tồn thực tế không trường hợp Việt Nam mẫu lấy không đại diện trung thực khách quan cho tổng thể, chẳng hạn vùng trồng rau Thanh Trì Hà Nội người ta lấy mẫu gồm quan sát để kiểm tra xem có dư thừa độc tố rau hay khơng, để kiểm tra an tồn thực phẩm hoa Trung Quốc nhập qua biên giới phía Bắc, phận kiểm tra lấy số hàng chục ngàn quả, v .; Do dẫn đến kết luận trái ngược quan khoa học thành phố kết luận trái ngược với thực tế xảy Bàn việc lấy mẫu đại diện nước ta việc làm vượt tầm khả tác vượt ngồi khn khổ luận văn Dựa chuyên khảo “Sampling techniques” William G Cochran z 37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.C.33.44.55.54.78.655.43.22.2.4.55.2237.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.66 số báo, số bình luận, nhận xét trang mạng Bách khoa toàn thư mở (Wikipedia), luận văn “Các phương pháp lấy mẫu xử lý mẫu” trình bày tổng quan phương pháp lấy mẫu lô (một tổng thể) gồm hữu hạn phần tử xử lý thống kê đại lượng liên quan lô Luận văn gồm chương: - Chương trình bày kết mẫu ngẫu nhiên đơn giản từ lô gồm hữu hạn phần tử Các ước lượng, tính chất phương sai ước lượng trung bình tổng thể, tổng thể, tỷ số Ở chương đưa khái niệm mà ta dùng chương như: khái niệm ước lượng khơng chệch, tính vững ước lượng - Chương đề cập đến lấy mẫu ngẫu nhiên phân tầng lấy mẫu hệ thống, trình bày theo mạch giống lấy mẫu ngẫu nhiên đơn giản Ngồi cịn có so sánh mẫu ngẫu nhiên phân tầng mẫu ngẫu nhiên đơn giản, mẫu hệ thống với mẫu ngẫu nhiên phân tầng - Chương đề cập đến mẫu chùm với chùm cỡ, không cỡ kết hợp mẫu chùm mẫu đề cập hai chương trước - Chương 4: Lấy mẫu lấy mẫu cặp Lấy mẫu đưa kết cho mẫu hai giai đoạn mẫu ba giai đoạn Lấy mẫu cặp đề cập tới mẫu cặp phân tầng ước lượng hồi quy Qua đây, tác giả xin bày tỏ lời cảm ơn sâu sắc đến người thầy, người hướng dẫn luận văn mình, PGS.TS Đào Hữu Hồ, người đưa đề tài tận tình hướng dẫn suốt trình làm luận văn tác giả Đồng thời tác giả gửi lời cảm ơn tới đồng nghiệp, người bạn giúp đỡ tác giả trình hồn thành luận văn Do thời gian trình độ cịn hạn chế, chắn luận văn khơng thể tránh khỏi thiếu sót, tác giả mong bảo tận tình thầy cơ, đồng nghiệp bạn, tác giả xin chân thành cảm ơn! Hà Nội, ngày tháng 01 năm 2013 Tác giả Mai Thị Hương 37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.99 z 37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.C.33.44.55.54.78.655.43.22.2.4.55.2237.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.66 Chương Mẫu ngẫu nhiên đơn giản từ lô hữu hạn phần tử 1.1 Định nghĩa ký hiệu Lấy mẫu ngẫu nhiên đơn giản phương pháp chọn n phần tử số n N phần tử cho mẫu CN mẫu phân biệt có khả chọn Các phần tử tổng thể đánh số từ đến N Khi dãy số ngẫu nhiên từ tới N rút từ bảng số ngẫu nhiên từ chương trình máy tính tạo bảng n Dễ dàng thấy tất CN mẫu phân biệt có khả chọn theo phương pháp Thực vậy, ta xét mẫu, tập gồm n phần tử ấn định Ở lần rút đầu tiên, xác suất để phần tử n n phần tử chọn Ở lần rút thứ hai xác suất để phần tử N n−1 (n − 1) phần tử ấn định lại rút , Do xác N −1 suất để tất n phần tử ấn định lựa chọn sau n lần rút n n−1 n−2 n! (N − n)! · · ···· = = n N N −1 N −2 N −n+1 N! CN Bởi phần tử rút không trả lại tổng thể nên phương pháp gọi lấy mẫu ngẫu nhiên không hồn lại 37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.99 z 37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.C.33.44.55.54.78.655.43.22.2.4.55.2237.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.66 Cịn phần tử rút lại trả lại tổng thể trước thực lần rút tiếp theo, gọi lấy mẫu ngẫu nhiên có hồn lại Khi lần rút tất phần tử tổng thể có khả rút chúng rút hay chưa Các công thức phương sai ước lượng phương sai ước lượng thường đơn giản lấy mẫu hồn lại so với lấy mẫu khơng hồn lại Với lý này, lấy mẫu hồn lại đơi sử dụng cách lấy mẫu phức tạp lấy mẫu khơng hồn lại Trong nghiên cứu mẫu ta quan tâm tính chất hay đặc trưng cố gắng đo, ghi lại phần tử chọn Các giá trị nhận đặc trưng xác định N phần tử tổng thể ký hiệu y1 , y2 , , yN Các giá trị tương ứng phần tử mẫu ký hiệu y1 , y2 , , yn Tổng thể Tổng: Y = N P Mẫu n P yi = y1 + y2 + + yN yi = y1 + y2 + + yn N P y1 + y2 + + yN Trung bình: Y¯ = = N n P yi y1 + y2 + + yn y¯ = = n N yi n Trong mục ta quan tâm đến ước lượng ba đại lượng: trung bình  tổng thể Y¯ , tổng tổng thể (Y ) tỷ số tổng trung bình   ¯ tổng thể R = Y /X = Y X ¯ Để cho gọn đặc trưng tổng thể ta gọi đặc trưng lý thuyết Ta dùng ký hiệu “ˆ” để ước lượng đặc trưng tổng thể xây dựng từ mẫu Ước lượng Yˆ¯ = y¯ =Trung bình mẫu  n P ˆ Y = N y¯ = N yi n 1 n n P P ˆ = y¯/¯ R x = yi xi Trung bình lý thuyết: Y¯ Tổng lý thuyết: Y Tỷ số lý thuyết: R 1.2 Tính chất ước lượng Trong luận văn này, phương pháp ước lượng gọi vững ước lượng giá trị tổng thể n = N , nghĩa mẫu bao gồm 37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.99 z 37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.C.33.44.55.54.78.655.43.22.2.4.55.2237.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.66 toàn tổng thể Với mẫu ngẫu nhiên đơn giản rõ ràng y¯ N y¯ tương ứng ước lượng vững trung bình lý thuyết tổng lý thuyết Một phương pháp ước lượng không chệch giá trị trung bình ước lượng lấy tồn mẫu có thể, xác giá trị tổng thể chân thực Dùng E để ký hiệu cho trung bình tất mẫu có Định lý 1.1 Trung bình mẫu y¯ ước lượng không chệch Y¯ Chứng minh Theo định nghĩa ta có: P P (y1 + y2 + + yn ) y¯ , E y¯ = n = CN n [N !/n! (N − n)!] (1.1) n tổng lấy tất CN mẫu Để ước lượng tổng này, ta phải có mẫu có xuất giá trị yi xác định Vì có (N − 1) phần tử khác chứa tất phần tử lại mẫu (n − 1) vị trí khác để lấp đầy mẫu, số mẫu chứa yi n−1 CN −1 = (N − 1)! (n − 1)! (N − n)! Do X (y1 + y2 + + yn ) = (N − 1)! (y1 + y2 + + yN ) (n − 1)! (N − n)! Từ (1.1) suy n! (N − n)! (N − 1)! · (y1 + y2 + + yN ) (n − 1)! (N − n)! n.N ! (y1 + y2 + + yN ) = = Y¯ N E y¯ = Định lý chứng minh Hệ 1.2 Yb = N y¯ ước lượng không chệch tổng lý thuyết Y 1.3 Phương sai ước lượng Phương sai yi tổng thể hữu hạn thường xác định sau: N P σ2 = yi − Y¯ N 2 , 37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.99 z (1.2) 37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.C.33.44.55.54.78.655.43.22.2.4.55.2237.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.66 0 Xây dựng biến ngẫu nhiên wis sau: wis wis tập thứ i xuất mẫu ngược lại Khi Yˆ = N X ˆ wis Yi i=1 Ta có N X E(Yˆ ) = E1 E2 (Yˆ ) = E1 ! ˆ wis Yi =Y i=1 E1 (wis ) = với i Định lý 4.12 V (Yˆ ) = V n X ! wis Yˆi n X =V i=1 ! wis Yi i=1 + N X 02 E1 (wis )σ2i i=1 Chứng minh Sử dụng công thức ˆ = V1 [E2 (θ)] ˆ + E1 [V2 (θ)] ˆ V (θ) Ta có: V (Yˆ ) = V1 [E2 (Yˆ )] + E1 [V2 (Yˆ )] ! "N # n X X 02 =V wis Yi + E1 wis V2 (Yˆi ) i=1 i=1 Phương sai hai giai đoạn Yˆi Yˆj (i 6= j) lấy mẫu độc lập Do V (Yˆ ) = V n X ! wis Yi i=1 + N X 02 E1 (wis )σ2i (4.19) i=1 Ví dụ 4.13 Với bảng giai đoạn ước lượng Horvitz – Thompson, YˆHT = n P Yˆi /πi , trọng số wis = 1/πi tập thứ i mẫu ngược i=1 02 lại Do E1 (wis ) = πi /πi2 = 1/πi , πi xác suất tập ban đầu i lấy Hơn nữa, mi tập lấy từ Mi lấy mẫu ngẫu nhiên đơn giản tập thứ i lấy Mi (Mi − mi ) 2 σ2i = V2 (Yˆi ) = S2i mi 83 37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.99 z 37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.C.33.44.55.54.78.655.43.22.2.4.55.2237.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.66 Do áp dụng định lý 4.12 sử dụng công thức cho bảng giai đoạn cho V (YˆHT ), ta có: 2 X  N N X N X Y Mi (Mi − mi ) Y j i ˆ − + S2i V (YHT ) = (πi πj − πij ) πi πj mi πi i=1 i=1 j>i Định lý 4.14 Giả sử ước lượng không chệch σ ˆ2i phương của  sai giai  Nđoạn hai  n P P ˆ σ2i Yi , ước lượng mẫu không chệch V wis Yi = V wis Yi i=1 i=1 từ mẫu giai đoạn Hơn nữa, ! n n n X n X X X v wis Yi = ais Yi + bijs Yi Yj i=1 i=1 (4.20) i=1 j>i  Khi ước lượng mẫu khơng chệch V n P wis Yˆi  i=1 v n X ! wis Yˆi = i n X ais Yˆi2 + i n X n X i bijs Yˆi Yˆj + j>i n X wis σ ˆ2i (4.21) i n P wis Yˆi  Như quy tắc xây dựng ước lượng mẫu V là: ước i n  P lượng không chệch V wis Yi từ mẫu giai đoạn, thay Yˆi cho Yi i nơi đâu có Yi Và cộng thêm số hạng n n P P (wis σ ˆ2i ), wis Yˆi = Yˆ , i σ ˆ2i i ước lượng không chệch V2 (Yˆi ) Chứng minh Ta có ! N N N X N X X X 0 V wis Yi = Yi V (wis ) + Yi Yj cov(wis , wjs ) i i i (4.22) j>i Lại xây dựng biến ngẫu nhiên a0is sau: a0is ais tập thứ i xuất mẫu ngược lại, tương tự đặt b0ijs bijs tập i xuất mẫu ngược lại Từ (4.20) mẫu giai đoạn ! N N N X N X X X 0 v wis Yi = ais Yi + b0ijs Yi Yj i i i j>i 84 37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.99 z (4.23) 37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.C.33.44.55.54.78.655.43.22.2.4.55.2237.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.66 Nếu khơng chệch, so sánh (4.23) (4.22) ta phải có E1 (a0is ) = ) Bây ước lượng phương sai (4.21), ta có V (wis   ! N N X N N X X X E1 E2  a0is Yˆi2 + b0ijs Yˆi Yˆj  + E1 E2 wis σ ˆ2i i i j>i i   N N N N X XX X 0   = E1 ais Yi + bijs Yi Yj + [V (wis ) + E (wis )]σ2i i j>i i i 0 Sử dụng kết E(a0is ) = V (wis ) với i, E1 (wis ) = = E12 (wis ) ta có " E v n X !# wis Yˆ =V n X i ! wis Yi + i N X 02 E1 (wis )σ2i =V i n X ! wis Yˆi i Suy điều phải chứng minh Áp dụng định lý 4.12 4.14 ta tìm ước lượng cho tổng lý thuyết phương sai chúng, tập lựa chọn với xác suất Ta có mi tập mẫu tập thứ i chọn lấy mẫu ngẫu nhiên đơn giản Ước lượng không chệch tổng lý thuyết n n NX NXˆ ˆ Yu = Mi y i = Yi n i n i Áp dụng định lý 4.12 với wis = N nN n N2 N 02 , E(wis )= = 1, E(wis )= = , n N n N n n ta N2 V (Yˆu ) = (1 − f1 ) n P N (Yi − Y )2 N X Mi2 (1 − f2i )S2i + , N −1 n i mi f2i = mi /Mi Ước lượng trở thành trọng số riêng f2i số (ký hiệu f2 ) Khi m mi N XX Yˆu = yij nf2 i j Đại lượng nf2 /N xác suất để tập chọn giai đoạn hai 85 37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.99 z 37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.C.33.44.55.54.78.655.43.22.2.4.55.2237.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.66 Với ước lượng mẫu không chệch phương sai, từ (4.21), định lý 4.14 cho ta N (1 − f1 ) ˆ v(Yu ) = n 4.2.2.2 n P (Yˆi − Yˆ u )2 i n−1 n N X Mi2 (1 − f2i )s22i + n i mi (4.24) Các tập lựa chọn hồn lại với xác suất khơng Các tập ban đầu chọn hoàn lại với xác suất tỷ lệ với zi Kết zi = Mi /M0 (xác suất tỷ lệ với cỡ mẫu) trường hợp riêng Mẫu gồm mi tập từ tập ban đầu thứ i rút cách ngẫu nhiên khơng hồn lại Một ước lượng tổng lý thuyết là: n n X Mi y i X Yˆi Yˆppz = = n i zi n i zi Với n = 1, M0 y IV = YˆIV không chệch Phương sai thu từ cơng thức (4.16) sau nhân với M02 , sau: 2 X  N N X Mi (Mi − mi )S2i Y i ˆ V (YIV ) = zi −Y + zi zi mi i=1 i=1 Với phương pháp lấy mẫu này, ước lượng Yˆppz trung bình n ước lượng độc lập dạng YˆIV Do Yˆppz khơng chệch N 1X V (Yˆppz ) = V (YˆIV ) = zi n n i=1  Yi −Y zi 2 N X Mi (1 − f2i )S2i + (4.25) n i=1 mi zi Hơn nữa, với n ước lượng độc lập YˆIV = Yi /zi cho ước lượng mẫu khơng chệch V (YˆIV ) là, Yˆi − Yˆppz zi n P v(YˆIV ) = i=1 n−1 !2 Ước lượng mẫu khơng chệch V (Yˆppz ) có biểu diễn đơn giản sau: !2 n ˆ P Yi − Yˆppz zi i=1 v(Yˆppz ) = n(n − 1) 86 37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.99 z 37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.C.33.44.55.54.78.655.43.22.2.4.55.2237.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.66 4.3 Kỹ thuật lấy mẫu cặp Như thấy số kỹ thuật lấy mẫu phụ thuộc vào việc có thơng tin biến phụ xi Các ước lượng tỷ lệ hồi quy địi hỏi trung bình lý thuyết X biết trước Nếu ta muốn phân tầng tổng thể theo giá trị xi phân phối tần suất chúng phải biết trước Khi thơng tin khơng có, người ta đưa mẫu ban đầu lớn có xi đo đạc Mục đích mẫu để trang bị ước lượng tốt X phân phối tần suất xi Trong nghiên cứu mục đích ta để tạo ước lượng cho vài biến yi khác Kỹ thuật gọi lấy mẫu cặp hay lấy mẫu hai pha 4.3.1 Lấy mẫu cặp phân tầng Tổng thể phân tầng thành L lớp (tầng) Mẫu mẫu ngẫu nhiên đơn giản cỡ n0 Đặt Wh = Nh /N = tỷ lệ tổng thể tầng h wh = n0h /n0 = tỷ lệ mẫu tầng h Khi wh ước lượng khơng chệch Wh Mẫu thứ mẫu ngẫu nhiên phân tầng cỡ n yhi đo: nh phần tử rút từ tầng h Thông thường mẫu thứ tầng h mẫu ngẫu nhiên từ mẫu n0h tầng Mục đích mẫu ước lượng trọng số tầng, mẫu thứ ước lượng trung bình tầng Y h P Trung bình lý thuyết Y = Wh Y h Một ước lượng dùng là: y st = L X wh y h h=1 Vấn đề chọn n0 nh để cực tiểu V (y st ) với phí tổn cho trước Khi ta phải kiểm tra liệu phương sai cực tiểu có nhỏ phương sai mà nhận mẫu ngẫu nhiên đơn giản mà có yi đo hay khơng Giả sử mẫu nh mẫu ngẫu nhiên n0h Do đó, nh = vh n0h , < vh ≤ vh chọn trước, wh , nh y h biến ngẫu nhiên Do vấn đề phân tầng mà cỡ mẫu chưa biết xác 87 37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.99 z 37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.C.33.44.55.54.78.655.43.22.2.4.55.2237.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.66 Để đơn giản ta làm hai xấp xỉ sau: Thứ cỡ mẫu n0 giả thiết đủ lớn cho wh > Thứ hai bàn đến chiến thuật tối ưu, tối ưu vh , tìm thấy công thức, giả sử ≤ Định lý 4.15 Ước lượng y st không chệch Định lý 4.16 Nếu mẫu mẫu ngẫu nhiên cỡ n0 , mẫu thứ hai mẫu ngẫu nhiên mẫu đầu tiên, cỡ nh = vh n0h , < vh ≤ vh cố định, V (y st ) = S  1 − n N    L X Wh Sh2 + −1 , n0 vh (4.26) h S phương sai tổng thể Chứng minh Giả sử yhi đo tất n0h thành phần mẫu tầng h, không đo mẫu ngẫu nhiên nh Khi đó, wh = n0h /n0 nên, L X wh y 0h = y h trung bình mẫu ngẫu nhiên đơn giản cỡ n0 từ tổng thể Do đó, lấy trung bình lựa chọn lặp lại mẫu cỡ n0 , !   L X 1 V wh y h = S − n0 N (4.27) h Mà y st = L X wh y h = h L X wh y 0h + h L X wh (y h − y 0h ) (4.28) h Giả sử số để trung bình tất mẫu ngẫu nhiên nh phần tử mà rút từ n0h phần tử cho trước Rõ ràng, E2 (y h ) = y 0h Lập tức ta có: cov[y 0h , (y h − y 0h )] = cov(y 0h , y h ) = V (y 0h ) : V (y h − y 0h ) = V (y h ) − V (y 0h ) Do đó, với wh cố định, V2 [ X wh (y h − y 0h )] = X wh2 Sh2  1 − nh nh   X wh S  h = −1 n0 vh 88 37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.99 z (4.29) 37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.C.33.44.55.54.78.655.43.22.2.4.55.2237.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.66 nh = vh n0h = vh wh n0 Lấy trung bình phân phối wh ta thu lựa chọn lặp lại mẫu đầu tiên, ta có từ (4.27), (4.28) (4.29), V (y st ) = S  1 − n N    L X Wh Sh2 + −1 n0 vh h Kết V (y st ) thể số dạng khác Bằng phân tích phương sai, (N − 1)S = X (Nh − 1)Sh2 + X Nh (Y h − Y )2 Do đó, g = (N − n0 )/(N − 1), nhân với g /n0 N dẫn đến   (N − n0 )S g0 X g X −1 = S (W − N )S + Wh (Y h − Y )2 − = h h n0 N n0 N n0 n0 Từ (4.26) dẫn đến   L L L X Wh Sh2 g0 X g0 X −1 V (y st ) = −1 + (Wh − N )Sh + Wh (Y h − Y )2 n vh n n h h h (4.30) Hơn nữa, định nghĩa g = (N − n0 )/(N − 1), ta có − g0 g0 + = − + n0 n0 N n0 N Do (4.30) số hạng thứ hai thứ ba P Wh Sh2 , có hệ số −1/n0 g /n0 nên V (y st ) = L X Wh Sh2  h 1 − n vh N  + L L g0 X g0 X (W − 1)S + Wh (Y h − Y )2 h h 0 nN n h h (4.31) Với hầu hết ứng dụng, thành phần g /n0 N (4.31) bỏ qua, (4.31) trở thành V (y st ) ≈ L X h Wh Sh2  1 − n vh N  L g0 X + Wh (Y h − Y )2 n (4.32) h Kết định lý 4.15 đưa Rao năm 1973 (xem [15]) 89 37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.99 z 37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.C.33.44.55.54.78.655.43.22.2.4.55.2237.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.66 Hệ 4.17 Các kết trường hợp mẫu thứ rút độc lập với mẫu đầu tiên, nh không phụ thuộc vào n0h (ngoại trừ giả thiết nh ≤ n0h ), nh /Nh bỏ qua, phương sai ước lượng y st là: V (y st ) ≈ L X Wh S h nh h 4.3.2 L g0 X + Wh (Y h − Y )2 n h Số lượng tối ưu Mục đích chọn n0 vh để cực tiểu V (y st ) với phí tổn xác định Giả sử c0 phí tổn phân lớp ứng với mẫu ngẫu nhiên đơn giản cỡ n0 ch phí tổn đo đạc phần tử tầng h Với mẫu xác định, 0 C=cn + L X ch n h h Vì nh biến ngẫu nhiên, ta cực tiểu phí tổn trung bình cho n0 vh chọn E(C) = C ∗ = c0 n0 + n0 X ch vh Wh (4.33) Đặt V = V (y st ), công thức (4.26) dẫn đến n0 (V + S /N ) = (S − X Wh Sh2 ) + L X Wh S h h vh Tích C ∗ (V +S /N ) khơng chứa n0 Áp dụng bất đẳng thức Cauchy - Schwarz cho tích ta được: tích cực tiểu với h, ta có: vh2 ch c0 P = Sh2 (S − Wh Sh2 ) Suy ra: vh = Sh [c0 /ch (S − X Wh Sh2 )]1/2 Giá trị n0 thu từ phương trình phí tổn trung bình (4.33) Thay vh tối ưu công thức C ∗ (V + S /N ), phương sai cực tiểu X √ i2 S √ hX 2 1/2 Vmin (y st ) = ∗ Wh Sh ch + (S − Wh Sh ) c0 − C N 90 37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.99 z 37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.C.33.44.55.54.78.655.43.22.2.4.55.2237.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.66 4.3.3 Phương sai ước lượng lấy mẫu cặp phân tầng Nếu 1/n0 1/N không đáng kể so với (chẳng hạn < 0, 02) hầu hết ước lượng mẫu khơng chệch V (y st ) (4.32) đơn giản công thức v(y st ) = L X wh s2h  h = L X h 1 − n vh N wh2 s2h − nh L X  L g0 X + wh (y h − y st )2 n h L X g wh s2h + N n h (4.34) wh (y h − y st )2 , h g = (N − n0 )/(N − 1) Định lý 4.18 Ước lượng mẫu không chệch V (y st ) lấy mẫu cặp " L   n (N − 1) X 1 v(y st ) = wh sh − (n − 1)N n vh N h (4.35) #   L L X X g wh g s2h wh (y h − y st )2 + − + n N n vh n h h Chứng minh Từ (4.31) dạng tổng quát phương sai ước lượng V (y st ) = L X Wh Sh2  h 1 − n vh N  L L g0 X g0 X (Wh − 1)Sh + Wh (Y h − Y )2 + nN n h h Đầu tiên lấy trung bình với n0 wh cố định sau lấy trung bình biến thiên wh , trung bình wh s2h (4.35) Wh Sh2 , trung bình s2h Sh2 Số hạng cuối (4.35) X X wh y 2h − y 2st wh (y h − y st )2 = Đầu tiên lấy trung bình với wh cố định,  X  X X 2 E wh y h = wh Y h + wh Sh 1 − vh wh n0 wh N  Hơn nữa, Ew E L X ! wh y 2h = X h Wh Y + h X Sh2  1 − vh n N 91 37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.99 z  (4.36) 37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.C.33.44.55.54.78.655.43.22.2.4.55.2237.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.66 Cũng có E(y 2st ) = Y + V (y st ) (4.37) Lấy (4.37) trừ (4.36) nhân với g /n0 dẫn đến g0 X g hX − y ) = E w (y Wh (Y h − Y )2 + h h st n0 n0   X  1 + Sh − − V (y st ) vh n N (4.38) Thay (4.38) tìm (n0 − 1)N Ev(y st )/n0 (N − 1) từ (4.35), ta có   g0 (n0 − 1)N (n0 − 1)N Ev(y st ) = − V (y st ) = V (y st ) n0 (N − 1) n n (N − 1) Điều dẫn đến kết cần chứng minh Rao năm 1973 đưa kết (4.35) ngôn ngữ nh n0h sau   N − X n0h − nh − wh s2h (N − n0 ) X − wh (y h − y st )2 v(y st ) = + 0 N n −1 N −1 nh N (n − 1) h h Hệ 4.19 Để sử dụng (4.34) ước lượng tỷ lệ, đặt ph thay y h nh ph qh /(nh − 1) thay s2h 4.3.4 Ước lượng hồi quy Trong vài ứng dụng lấy mẫu cặp, biến phụ xi sử dụng để tạo nên ước lượng hồi quy Y Trong mẫu (mẫu lớn) cỡ n0 , ta đo xi , mẫu thứ 2, mẫu ngẫu nhiên cỡ n = vn0 = n0 /k, tỷ số v chọn trước, ta đo đạc xi yi Ước lượng Y là: y lr = y + b(x0 − x), x0 , x trung bình xi , mẫu thứ mẫu thứ hai b hệ số hồi quy bình phương tối thiểu yi theo xi tính tốn từ mẫu thứ hai Định lý 4.20 Nếu 1/n 1/n0 khơng đáng kể so với 1, ta có kết xấp xỉ cho V (y lr ) sau: Sy2 (1 − ρ2 ) ρ2 Sy2 Sy2 V (y lr ) ≈ + − n n0 N 92 37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.99 z (4.39) 37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.C.33.44.55.54.78.655.43.22.2.4.55.2237.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.66 Chứng minh Trong việc tìm sai số mẫu y lr lấy mẫu ngẫu nhiên đơn giản ta b y lr thay hệ số hồi quy tổng thể hữu hạn B = Syx /Sx2 Do ta kiểm tra phương sai xấp xỉ yelr = y + B(x0 − x) Chỉ số 1, ký hiệu biến thiên pha lấy mẫu thứ hay thứ hai Đặt ui = yi − Bxi Trong pha thứ hai, xem mẫu lớn tổng thể hữu hạn Khi đó, mẫu nhỏ rút cách ngẫu nhiên từ mẫu lớn,   1 E2 (e ylr ) = y : V2 (e ylr ) = − s02 u, n n s02 u phương sai u mẫu lớn Nó   1 − V (y lr ) ≈ V (e ylr ) = V1 (y ) + E1 s02 u n n0     1 1 = − Sy + − Sy2 (1 − ρ2 ), n0 N n n0 2 s02 u ước lượng không chệch Su = Sy (1 − ρ ) Do V (y lr ) ≈ 4.3.5 Sy2 (1 − ρ2 ) ρ2 Sy2 Sy2 + − n n0 N Ước lượng phương sai lấy mẫu cặp hồi quy Nếu số hạng 1/n không đáng kể, V (y lr ) cho (4.39): V (y lr ) ≈ Sy2 (1 − ρ2 ) ρ2 Sy2 Sy2 + − n n0 N Với mơ hình hồi quy tuyến tính, " n # n X X s2y.x = (yi − y)2 − b2 (xi − x)2 n − i=1 i=1 ước lượng không chệch Sy2 (1 − ρ2 ) Vì s2y = P (yi − y)2 n−1 93 37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.99 z 37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.C.33.44.55.54.78.655.43.22.2.4.55.2237.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.66 ước lượng không chệch Sy2 nên s2y − s2y.x ước lượng không chệch ρ2 Sy2 Do ước lượng mẫu V (y lr ) v(y lr ) = s2y s2y.x s2y − s2y.x − + n n0 N 94 37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.99 z 37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.C.33.44.55.54.78.655.43.22.2.4.55.2237.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.66 KẾT LUẬN Luận văn “Các phương pháp lấy mẫu xử lý mẫu” trình bày phương pháp lấy mẫu lô hữu hạn phần tử Đó lấy mẫu ngẫu nhiên đơn giản, lấy mẫu ngẫu nhiên phân tầng, lấy mẫu hệ thống, lấy mẫu chùm, lấy mẫu lấy mẫu cặp Ứng với phương pháp lấy mẫu luận văn đề cập đến ước lượng đại lượng trung bình, tổng lý thuyết, tỷ lệ Phương sai ước lượng Từ rút nhận xét để so sánh phương pháp lấy mẫu so sánh ước lượng nhận tương ứng 95 37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.99 z 37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.C.33.44.55.54.78.655.43.22.2.4.55.2237.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.66 TÀI LIỆU THAM KHẢO Tiếng Việt Đào Hữu Hồ (2008), “Xác suất thống kê”, in lần thứ 11, Nhà xuất Đại học Quốc Gia Hà Nội Đào Hữu Hồ, Nguyễn Văn Hữu, Hồng Hữu Như (2004), “Thống kê tốn học”, Nhà xuất Đại học Quốc Gia Hà Nội Nguyễn Viết Phú, Nguyễn Duy Tiến (2004), “Cơ sở lý thuyết xác suất”, Nhà xuất Đại học Quốc Gia Hà Nội Tiếng Anh Brooks, S (1955) The estimation of an optimum subsampling number Jour Amer Stat Assoc, 50, 398 – 415 Cochran, W G (1942) Sampling theory when the sampling units are of unequal sizes Jour Amer Stat Assoc Cornell, F G (1947) A stratified random sample of a small finite population Jour Amer Stat Assoc Dalenius, T., and Hodges, J L., Jr (1959) Minimum variance stratification Jour Amer Stat Assoc Das, A C (1950) Two-dimensional systematic sampling and the associated stratified and random sampling Sankhya Evans, W D (1951) On stratification and optimum allocations Jour Amer Stat Assoc, 46, 95 – 104 10 Finney, D J (1948) Random and systematic sampling in timber surveys Forestry 11 Hansen, M H., and Hurwitz, W N (1943) On the theory of sampling from finite populations Ann Math Stat 96 37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.99 z 37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.C.33.44.55.54.78.655.43.22.2.4.55.2237.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.66 37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.99

Ngày đăng: 05/09/2023, 01:01

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN