Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 33 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
33
Dung lượng
3,03 MB
Nội dung
Phương pháp chọn mẫu phân lớp Phương pháp chọn mẫu phân lớp Khi thông tin về tổng thể, chọn mẫu ngẫu nhiên là giải pháp tối ưu Thông tin bổ xung Nhóm các phần tử hoặc ô tiêu chuẩn giống Có thể chia tổng thể thành nhóm nhỏ o Gọi Lớp Nếu chọn mẫu ngẫu nhiên từ lớp này, độ chính xác sẽ tăng đáng kể Danh giới khu vực nghiên cứu Rừng Đồng cỏ Ô dạng tc Rừng Ví dụ Lấy mẫu phân lớp rât hữu ích ta chia khu vực nghiên cứu thành phần riêng biệt đồng Ví dụ, bạn quan tâm đến việc điều tra sinh khối của một loài LSGN 20 nghiên cứu Trong ví dụ này, đồng cỏ rừng lớp Sự phân lớp tăng độ xác ước lương sinh khối Danh giớ khu vực nghiên cứu Rừng Đồng cỏ Ô dạng bản Rừng Ví dụ khác? Phương pháp chọn mẫu phân lớp Tăng độ xác • Hiệu quả phụ thuộc nhiều vào kỹ chọn lớp Ví dụ Kích thước mẫu 4, số lớp Kích thước mẫu 4, chọn từ lớp Danh giới khu vực nghiên cứu ôtc Số Lớp A B C D 10 E 10 F 12 TB Rừng Đồng cỏ Ô dạng bản Rừng Ước lượng trung bình tổng thể Uớc lượng trung bình tổng thể Một công ty quang cáo định thực điều tra để ước lượng thời gian hộ gia đình khu vực xem ti vi trung bình tuần Khu vực có thị trấn, A B vùng nông thôn Thị trấn A xây dựng gần nhà máy, hầu hết gia đình có người làm công nhân nhà máy có trẻ em tuổi học Thị trấn B vùng ngoại ô thành phố gần đó, gia đình thường có người già chỉ có ít trẻ em ở nhà Có 155 gia đình ở thị trấn A, 62 gia đình ở thị trấn B, 93 gia đình ở khu vực nông thôn Thảo luận hiệu phương pháp lấy mẫu theo lớp ngẫu nhiên trường hợp Giả sử kế hoạch điều tra thực Công ty quảng cáo đủ kinh phí thời gian để vấn n=40 gia đình chọn mẫu ngẫu nhiên với kích thước n1=20 từ thị trấn A, n2=8 từ thị trấn B, n3=12 từ khu vực nông thôn Sau chọn mẫu ngẫu nhiên thực vấn Kết điều tra biểu thị bảng 5.1 Bảng 5.1 số xem ti vi vùng (giờ/tuần) thị trấn A Hình Đồ thị thời lượng xem ti vi Thị trấn B T.T A N Thôn Số thị trấn B k.vực nông thôn ví dụ: ví dụ Do đó, người điều tra nên lấy n=57, với: Như ví dụ 5.5, giả sử phương sai ví dụ 5.1 Ϭ12 = 25, Ϭ22 = 225, Ϭ32 = 100 Chúng ta muốn ước lượng T với sai số cận biên ước lượng 400 Chọn dung lượng mẫu cần thiết số lượng khảo sát chia cho lớp mẫu Sai số cận biên ước lượng 400 giờ, ta có, Để tính n công thức 5.6, ta cần tính giá trị sau: ví dụ 5.5 với n1=n2=n3= 35 Phân bổ mẫu Mục đích ta, xác định số phần tử phân bổ cho lớp bị ảnh hưởng yếu tố sau: Tổng số phần tử lớp tổng thể Mức độ biến động các giá trị quan sát lớp Chi phí thu thập/mẫu lớp Dung lượng mẫu gần để chi phí thu thập mẫu nhỏ ứng với giá tri V(ȳ st) cố định hoặc V(ȳ st) nhỏ ứng với một lượng kinh phí cố định xác định dựa vào công thức: Trong đó Ni biểu thị cho kích thước lớp thứ I, Ϭi biểu thị cho phương sai lớp thứ i, ci biểu thị cho chi phí thu thập một giá trị quan sát lớp thứ i ví dụ: Một cuộc khảo sát thăm dò cho thấy phương sai lớp là: Ϭ12 = 25, Ϭ22 = 225, Ϭ32 = 100 Chúng ta sử dụng Ӯst để ước lượnggiá trị trung bình tổng thể Xác định dung lượng mẫu cần thiết sai số cận biên mong muốn ước lượng là Chi phi để vấn người lần lượt là: c1= 10$, c2=15$, c3=20$ N1=155, N2=62, N3=93 sai số cận biên = 2h: đó Thay vào công thức 5.6 ta có: Ví dụ Một quan lâm nghiệp bang thực nghiên cứu người sử dụng công cụ cám trại Bang Bang có khu cắm trại, một núi và một chân núi Cơ quan này muốn ước lượng số người trung bình điểm cắm trại tỉ lệ điểm cắm trại sử dụng người cắm trại đến từ Bang khác Sai số cận biên ước lượng số người trung bình một điểm cắm trại là và tỉ lệ người ngoài bang là 0.1 Hai khu cắm trại có thể coi là lớp Với N1 = 120 N2 = 80 điểm cắm trại Ước lượng dung lượng mẫu cần thiết để đạt sai số ước lượng cận biên Giả sử mẫu phân phối theo cùng tỉ lệ cho các lớp Vì Từ công thức 5.6: Từ công thức 5.15 Vì vậy: Ước lượng tỉ lệ tổng thể: Công thức ước lượng tỉ lệ tổng thể p^: Ước lượng phương sai p^st : Ví dụ Một công ty quảng cáo muốn tính tỉ lệ số gia đình vùng xem chương trình X ví dụ 5.1 Vùng chia thành phần, thị trấn A, thị trấn B, khu vực nông thôn Coi vùng là một lớp Số lượng gia đình tương ứng thị trấn A, B vùng nông thôn lần lượt là N1 = 155, N2 = 62, N3 = 93 Lấy mẫu ngẫu nhiên phân lớp, với n=40 gia đình chọn theo tỉ lệ Cụ thể, kích thước mẫu sau n1 = 20, n2 = 8, n3 = 12 Kết quả vấn thể bảng sau Ứớc lượng tỉ lệ số gia đình xem chương trình X với độ tin cậy 95% Bảng 5.3 Số liệu ví dụ 5.12 Lớp ni Số gia đình xem chương trình X Kích thước mẫu cần thiết để ước lượng p với sai số cận biên B: Trong đó tỉ lệ mẫu phân bố cho lớp i, D=B2 /4 Phân bố gần để chi phí thu thập mẫu là nhỏ nhất: Ni biểu thị cho kích thước lớp thứ i, pi biểu thị cho tỉ lệ lớp thứ i, ci biểu thị cho chi phí thu thập mẫu cho lớp thứ i Số liệu bảng 5.3 có thực khảo sát từ năm trước Công ty quảng cáo muốn thực một khảo sát với vùng để ước lượng tỉ lể tổng thể số lượng gia đình xem chương trình X mặc dù tỉ lệ p1 , p2 , p3 xuất công thức 5.15 5.16 chưa biết, họ ước lượng xấp xỉ với khảo sát trước đó; p1 = 0.80, p2 = 0.25, p3 = 0.50 chi phí cần cho khảo sát đô la cho thị trấn 16 đô la cho vùng nông thôn, c1 = c2 =9 c3 = 16 số gia đình lớp N1 = 155, N2 = 62 N3 = 93 công ty muốn ước lượng tỉ lệ tổng thể p với sai số cận biên ước lượng la 0.1 Tìm kích thước mẫu n kích thước mẫu lớp n1 , n2 n3 mong muốn với chi phí tối thiểu [...]...Bảng Tổng hợp só liệu từ bảng 5 .1 Trung bình T.T A T.T B N thôn Trung vị Độ lệch chuẩn Ví dụ: 1 Những kết quả dưới đây có được sau khi thực hiện thu thập mẫu bằng phương pháp lấy mẫu ngẫu nhiên theo lớp: Lớp 1: N1= 10 0, n1= 50, 1= 10 , S12 = 2800 Lớp 2: N2= 50, n2= 50, Ӯ2= 20, S22 = 700 Lớp 3: N3= 300, n3= 50, Ӯ3= 30, S32 = 600 a) Ước... lớp là: 12 = 25, Ϭ22 = 225, Ϭ32 = 10 0 Chúng ta sử dụng Ӯst để ước lượnggiá trị trung bình của tổng thể Xác định dung lượng mẫu cần thiết khi sai số cận biên mong muốn của ước lượng là 2 giờ Chi phi để phỏng vấn mỗi người lần lượt là: c1= 10 $, c2 =15 $, c3=20$ N1 =15 5, N2=62, N3=93 sai số cận biên = 2h: do đó Thay thế ai vào công thức 5.6 ta có: Ví dụ Một cơ quan lâm nghiệp của 1 bang thực... đình trong 1 vùng xem chương trình X như ví dụ 5 .1 Vùng này được chia ra thành 3 phần, thị trấn A, thị trấn B, 1 khu vực nông thôn Coi mỗi vùng là một lớp Số lượng gia đình tương ứng của thị trấn A, B và vùng nông thôn lần lượt là N1 = 15 5, N2 = 62, N3 = 93 Lấy mẫu ngẫu nhiên phân lớp, với n=40 gia đình đã được chọn theo tỉ lệ Cụ thể, kích thước các mẫu như sau n1 = 20, n2 = 8, n3 = 12 Kết quả... 0.25, p3 = 0.50 chi phí cần cho khảo sát là 9 đô la cho từng thị trấn và 16 đô la cho vùng nông thôn, c1 = c2 =9 và c3 = 16 số gia đình trong các lớp là N1 = 15 5, N2 = 62 và N3 = 93 công ty muốn ước lượng tỉ lệ của tổng thể p với sai số cận biên của ước lượng la 0 .1 Tìm kích thước mẫu n và kích thước mẫu của các lớp n1 , n2 và n3 được mong muốn với chi phí tối thiểu ... trong bảng 5.3 có được khi thực hiện 1 khảo sát từ năm trước Công ty quảng cáo bây giờ muốn thực hiện một khảo sát mới với cùng 1 vùng đấy để ước lượng tỉ lể của tổng thể số lượng các gia đình xem chương trình X mặc dù các tỉ lệ p1 , p2 , p3 xuất hiện trong công thức 5 .15 và 5 .16 đều chưa biết, nhưng họ có thể ước lượng xấp xỉ với khảo sát trước đó; p1 = 0.80, p2 = 0.25, p3 = 0.50 chi phí... cuộc khảo sát về thời gian phỏng vấn và cho thấy phương sai của các lớp là: 12 = 25, Ϭ22 = 225, Ϭ32 = 10 0 Chúng ta sử dụng Ӯst để ước lượng trung bình của tổng thể Xác định dung lượng mẫu cần thiết khi sai số cận biên mong muốn của ước lượng là 2 giờ và tỉ lệ mẫu cho các lớp lần lượt là: a1= 1/ 3, a2 =1/ 3, a3 =1/ 3 (Lấy mẫu cùng tỉ lệ) sai số cận biên = 2h: do đó ví dụ: ví dụ Do đó,... một điểm cắm trại là 1 và tỉ lệ người ngoài bang là 0 .1 Hai khu cắm trại có thể được coi là 2 lớp Với N1 = 12 0 và N2 = 80 điểm cắm trại Ước lượng dung lượng mẫu cần thiết để đạt được các sai số ước lượng cận biên như trên Giả sử mẫu được phân phối theo cùng tỉ lệ cho các lớp Vì thế Từ công thức 5.6: Từ công thức 5 .15 Vì vậy: Ước lượng của tỉ lệ tổng thể: Công thức ước lượng... 5.5, giả sử phương sai trong ví dụ 5 .1 là 12 = 25, Ϭ22 = 225, Ϭ32 = 10 0 Chúng ta muốn ước lượng T với sai số cận biên của ước lượng là 400 giờ Chọn dung lượng mẫu cần thiết nếu số lượng khảo sát được chia đều cho từng lớp mẫu Sai số cận biên của ước lượng là 400 giờ, vì vậy ta có, Để tính n trong công thức 5.6, ta cần tính những giá trị sau: ví dụ 5.5 với n1=n2=n3= 35 Phân bổ mẫu Mục đích... với khoảng tin cậy 95% với số liệu trong bảng 5 .1: Phương sai của ước lượng NӮst : Ước lượng của tổng thể cùng với sai số cận biên: Ví dụ: với số liệu trong bảng 5 .1: Phương sai của ước lượng NӮst : Ước lượng của tổng thể với độ tin cậy 95%: Ví dụ: Một nhân viên kiểm lâm muốn ước lượng tổng diện tích rừng được trồng trong các trang trại của 1 bang Vì diện tích cây trồng thay đổi theo kích... bang thực hiện 1 nghiên cứu những người sử dụng công cụ cám trại của Bang Bang có 2 khu cắm trại, một ở trên núi và một ở dưới chân núi Cơ quan này muốn ước lượng số người trung bình trên 1 điểm cắm trại và tỉ lệ những điểm cắm trại được sử dụng bởi những người cắm trại đến từ những Bang khác Sai số cận biên trong ước lượng số người trung bình trên một điểm cắm trại là 1 và tỉ lệ ... bảng 5 .1 Trung bình T.T A T.T B N thôn Trung vị Độ lệch chuẩn Ví dụ: Những kết quả có sau thực thu thập mẫu phương pháp lấy mẫu ngẫu nhiên theo lớp: Lớp 1: N1= 10 0, n1= 50, 1= 10 , S12 = 2800... lượt là: a1= 1/ 3, a2 =1/ 3, a3 =1/ 3 (Lấy mẫu cùng tỉ lệ) sai số cận biên = 2h: đó ví dụ: ví dụ Do đó, người điều tra nên lấy n=57, với: Như ví dụ 5.5, giả sử phương sai ví dụ 5 .1 12 = 25,... thiết sai số cận biên mong muốn ước lượng là Chi phi để vấn người lần lượt là: c1= 10 $, c2 =15 $, c3=20$ N1 =15 5, N2=62, N3=93 sai số cận biên = 2h: đó Thay vào công thức 5.6 ta có: Ví dụ Một