"" Chương 8. Điều tra chọn mẫu Nói tóm lại, càng mở rộng phạm vi sai số, sức mạnh của ước lượng càng tăng, nhưng mặt khác cũng làm cho sai số lấy mẫu tăng theo (khoảng ước lượng rộng ra). Công thức tổng quát tính phạm vi sai số chọn mẫu là: M = t. Trong đó: t – Hệ số tin cậy với hàm xác suất t đã được Liapounov (Nhà toán học Nga, 1857 – 1918) lập bảng tính sẵn. d. Xác đònh số đơn vò mẫu điều tra: Việc xác đònh số đơn vò mẫu cần điều tra cho phù hợp cũng được coi như là một nghệ thuật. Nếu chúng ta tuân thủ qui trình tổng quát về xác đònh kích cỡ mẫu, chúng ta có thể tiếp nhận nhiệm vụ này một cách vừa khoa học, vừa kinh tế và sẽ mang lại những kết quả chấp nhận được. Nhiệm vụ của nhà nghiên cứu là chọn mẫu đủ lớn để có thể ước lượng một cách tương đối chính xác các tham số của tổng thể chung, nhưng đồng thời cũng không lãng phí quỹ nghiên cứu vào các mẫu quá lớn và không cần thiết. Vấn đề là phải lấy bao nhiêu đơn vò từ tổng thể chung để điều tra thực tế? Làm thế nào để các nhà nghiên cứu xác đònh được mẫu cở đúng? Qui trình xác đònh cở mẫu trải qua các bước sau: - Qui đònh phạm vi sai số cho phép: Yếu tố ảnh hưởng đầu tiên đến cỡ mẫu là độ lớn của sai số. Độ lớn của sai số phải nằm trong dung sai của mục đích nghiên cứu. Lựa chọn độ lớn (phạm vi cho phép) của sai số phụ thuộc vào độ nhạy của kết quả. Các nhà nghiên cứu phải rất thông thạo về mặt này. - Đònh rõ độ tin cậy để xác đònh hệ số tin cậy: Nếu chúng ta muốn có kết quả nghiên cứu với mức tin cậy là 100% thì phải điều tra toàn bộ các đơn vò trong tổng thể. Song điều này quá tốn kém và không thực tế. Do vậy, thường phải chấp nhận mức tin cậy dưới 100%. Trong thực tế mức thường được sử dụng là 99%, 95% và 90%. Mức tin cậy 95% được sử dụng phổ biến nhất. Mức tin cậy này cho phép kết quả nghiên cứu Trang 149 "" Chương 8. Điều tra chọn mẫu sai số 5% so với giá trò thực của tổng thể, và mức sai sót này thường được chấp nhận đối với phần lớn các quyết đònh trong nghiên cứu kinh tế, xã hội. Hệ số tin cậy được xác đònh thông qua bảng tính sẵn. - Ước tính độ lệch tiêu chuẩn: Có nhiều cách để ước tính độ lệch tiêu chuẩn: + Nếu trước đây đã tiến hành điều tra và được xem là tương tự với lần này thì có thể lấy độ lệch tiêu chuẩn của lần điều tra trước. + Tiến hành điều tra thí điểm để tính độ lệch tiêu chuẩn. +Có thể ước tính độ lệch tiêu chuẩn theo khoảng biến thiên (R) tùy theo đặc điểm phân phối của hiện tượng nghiên cứu. Nếu là phân phối chuẩn thì: = R/6 = (X max – X min )/6 - Các công thức tính cỡ mẫu thường dùng: Các công thức tính cỡ mẫu thường được rút ra từ công thức tính sai số trung bình chọn mẫu, nên cũng phân ra các trườnghợp: + Khi nhiệm vụ nghiên cứu là để ước lượng số trung bình theo một tiêu thức nào đó: Trường hợp chọn hoàn lại: n = t 2 2 / 2 x Trường hợp chọn không hoàn lại: n = t 2 2 N/ ( 2 xN + t 2 2 ) Trong đó: n: Số đơn vò cần điều tra (cỡ mẫu) t: Hệ số tin cậy. x : Phạm vi sai số cho phép. N: Số đơn vò tổng thể chung. - Khi nhiệm vụ nghiên cứu là để ước lượng tỷ lệ theo tiêu thức nào đó: Trường hợp chọn hoàn lại: Trang 150 "" Chương 8. Điều tra chọn mẫu n = t 2 pq / 2 p Trường hợp chọn không hoàn lại: n = t 2 pq N/ ( 2 pN + t 2 pq) Trong đó: p: tỷ lệ hay tần suất xuất hiện. : Phạm vi sai số cho phép. q = 1 – p Tính cỡ mẫu trong trường hợp ước lượng tỷ lệ cũng được tiến hành theo qui trình trên, chỉ khác là khi ước tính độ lệch tiêu chuẩn phải căn cứ vào tần suất xuất hiện p. Chú ý rằng với một độ chính xác cho trước, khi giá trò của tần suất xuất hiện gần tới 50% thì cở mẫu gia tăng vừa phải, và khi giá trò của tần suất xuất hiện tiến gần tới 100% hay 0% thì cở mẫu giảm dần. Có thể lập các bảng liệt kê các độ sai số tiêu chuẩn ở từng mức tin cậy và ứng với các tần suất xuất hiện khác nhau. e. Suy rộng các kết quả điều tra chọn mẫu: Suy rộng các kết quả điều tra chọn mẫu là ước tính các chỉ tiêu của tổng thể chung trên cơ sở các tài liệu thu thập được trong điều tra chọn mẫu. Có hai cách suy rộng sau đây: e.1. Phương pháp tính đổi trực tiếp: Phương pháp này được áp dụng khi người ta dùng các số trung bình mẫu và tỷ lệ mẫu để ước lượng ra các chỉ tiêu tương ứng của tổng thể chung. Cách tính như sau: x – x < X < x + x Và f – p < p < f + p Trong đó: X, p: Trung bình chung và tỷ lệ chung. x, p: Trung bình mẫu và tỷ lệ mẫu. x , p : Phạm vi sai số chọn mẫu. Trang 151 "" Chương 8. Điều tra chọn mẫu Ví dụ: Giả sử sau khi điều tra chọn 1000 chiếc điện thoại di động, tính được tỷ lệ những chiếc điện thoại di động gọi đi bò rè là 2,1%. Với độ tin cậy 95% tính ra phạm vi sai số p = 0,02. Như vậy, suy ra tỷ lệ những chiếc điện thoại không đạt tiêu chuẩn của cả đợt sản xuất sẽ nằm trong phạm vi: f – p < p < f + p 0,021 – 0,02 < p < 0,021 + 0,02 0,001 < p < 0,041 e.2. Phương pháp hệ số điều chỉnh: Phương pháp này thường được sử dụng để xác minh kết quả của điều tra toàn bộ. Nội dung của nó là: Dựa trên sự đối chiếu số liệu của điều tra toàn bộ và của điều tra chọn mẫu, tính ra tỷ lệ chênh lệch rồi dùng tỷ lệ này làm hệ số hiệu chỉnh số liệu điều tra toàn bộ. Ví dụ: Khi tổng điều tra dân số người ta có thể đồng thời tổ chức điều tra chọn mẫu trên 5% số đòa bàn điều tra. Mục đích của điều tra chọn mẫu là nghiên cứu thêm một số chỉ tiêu về sinh, tử và nhà ở, đồng thời còn có tác dụng kiểm tra số liệu của điều tra toàn bộ. Giả sử theo kết quả của tổng điều tra dân số của tỉnh X vào thời điểm 0 giờ ngày 1/4/1999 là 1.765.200 người, trong đó chỉ tính riêng 5% số đòa bàn điều tra (là những đòa bàn đònh điều tra chọn mẫu) là 95.260 người. Khi tiến hành điều tra chọn mẫu cũng trên 5% số đòa bàn đó tính ra được 95.300 người. Như vậy có nghóa là điều tra toàn bộ đã bỏ sót mất 40 người trong các đòa bàn đó. Tỷ lệ bỏ sót là : 40/95.260 = 0,00042 Có thể dùng hệ số này làm hệ số hiệu chỉnh nhằm hiệu chỉnh lại số liệu của điều tra toàn bộ. Như vậy, trong toàn tỉnh số người bò bỏ sót có thể lên tới: 0,00042 x 1.765.200 = 741 người. Số dân của tỉnh X được hiệu chỉnh lại là: 1.765.200 + 741 = 1.765.941 người. Trang 152 "" Chương 8. Điều tra chọn mẫu 8.2.2. Các phương thức tổ chức chọn mẫu Chọn các đơn vò mẫu từ tổng thể chung có thể tiến hành theo nhiều cách khác nhau. Thống kê thường dùng các phương pháp sau: - Chọn mẫu ngẫu nhiên đơn giản. - Chọn mẫu máy móc (chọn hệ thống) - Chọn mẫu phân loại (phân lớp) - Chọn mẫu cả khối (mẫu chùm). - Chọn mẫu nhiều bậc. a. Chọn mẫu ngẫu nhiên đơn giản: Là phương pháp tổ chức chọn mẫu từ tổng thể chung một cách hết sức ngẫu nhiên không qua một sự sắp xếp nào. Người ta sẽ lần lượt chọn ra từng đơn vò bằng cách rút thăm, quay số hoặc theo bảng số ngẫu nhiên. Mỗi đơn vò tổng thể chung có thể được chọn một lần (không hoàn lại) hoặc chọn nhiều lần (chọn hoàn lại). Khi tính toán sai số trung bình chọn mẫu có thể tính theo các công thức đã trình bày ở phần trên. Phương pháp chọn ngẫu nhiên đơn giản có thể cho kết quả tốt nếu giữa các đơn vò tổng thể chung không có gì khác biệt nhau nhiều. Nếu tổng thể chung có kết cấu phức tạp thì chọn theo phương pháp này sẽ khó đảm bảo tính đại diện. Mặt khác, đối với các tổng thể lớn có hàng ngàn đơn vò thì việc lập số rút thăm và đặt số hiệu cho từng đơn vò cũng gặp khó khăn. b. Chọn mẫu máy móc (chọn hệ thống) Trong chọn máy móc các đơn vò được lựa chọn từ tổng thể chung theo khoảng cách thời gian, không gian hoặc thứ hạng bằng nhau. Từ tổng thể chung N đơn vò, cần chọn ra n đơn vò mẫu. Như vậy khoảng cách chọn mẫu là k=N/n Tức là cứ cách k đơn vò thì chọn một đơn vò. Chọn mẫu theo hệ thống đường thẳng Trang 153 . đơn giản. - Chọn mẫu máy móc (chọn hệ thống) - Chọn mẫu phân loại (phân lớp) - Chọn mẫu cả khối (mẫu chùm). - Chọn mẫu nhiều bậc. a. Chọn mẫu ngẫu nhiên đơn giản: Là phương pháp. 8.2.2. Các phương thức tổ chức chọn mẫu Chọn các đơn vò mẫu từ tổng thể chung có thể tiến hành theo nhiều cách khác nhau. Thống kê thường dùng các phương pháp sau: - Chọn mẫu ngẫu. thu thập được trong điều tra chọn mẫu. Có hai cách suy rộng sau đây: e.1. Phương pháp tính đổi trực tiếp: Phương pháp này được áp dụng khi người ta dùng các số trung bình mẫu và tỷ lệ