"" Chương 8. Điều tra chọn mẫu Việc làm như vậy gọi là ước lượng. Khi ước lượng, để đảm bảo chất lượng cao phải lựa chọn hàm ước lượng theo các tiêu chuẩn: 1. Ước lượng không chệch: Tham số của mẫu được gọi là ước lượng không chệch của tham số của tổng thể chung (đại lượng ngẫu nhiên gốc X) nếu M(’’) = M(). 2. Ước lượng hiệu quả: Tham số ’ của mẫu được gọi là ước lượng hiệu quả của tham số của tổng thể chung nếu nó có phương sai nhỏ nhất so với mọi tham số khác xây dựng trên cùng mẫu đó. 3. Ước lượng vững: Tham số ’ của mẫu được gọi là ước lượng vững của tham số của tổng thể chung nếu ’ hội tụ theo xác suất đến khi n tiến tới . Tức là với mọi dương bé tùy ý ta luôn có: limP(| ’- | < ) = 1 n -> Thống kê toán đã chứng minh và rút ra một số kết luận sau: - Vì trung bình mẫu là ước lượng không chệch, hiệu quả và vững của trung bình tổng thể chung, do đó nếu chưa biết trung bình tổng thể chungcó thể dùng trung bình mẫu để ước lượng. - Vì tần suất mẫu f là ước lượng không chệch, hiệu quả, vững của tần suất tổng thể chung p, do đó nếu chưa biết p có thể dùng f để ước lượng. - Vì phương sai điều chỉnh mẫu S’ 2 là ước lượng không chệch, hiệu quả và vững của phương sai chung 2 , do đó nếu chương biết phương sai 2 có thể dùng S’ 2 để ước lượng. Chú ý rằng, phương sai mẫu S 2 và phương sai hiệu chỉnh mẫu chỉ khác nhau chút ít bởi hệ số n/(n-1), do đó khi n lớn thì sự khác biệt này là không đáng kể. Trong thực tế phương sai hiệu chỉnh mẫu được sử dụng khi n < 30. 8.2. ĐIỀU TRA CHỌN MẪU NGẪU NHIÊN. 8.2.1. Những vấn đề lý luận. a. Chọn hoàn lại và không hoàn lại: Trang 144 "" Chương 8. Điều tra chọn mẫu - Chọn hoàn lại: tức là trước khi chọn đơn vò thứ k vào mẫu nghiên cứu thì đã trả lại tổng thể chung đơn vò thứ (i-1) mà ta đã nghiên cứu xong (i= 2 - >n). Như vậy, số đơn vò trong tổng thể chung sẽ không thay đổi trong suốt quá trình lựa chọn. Gọi K là số khả năng thiết lập được tổng thể mẫu. Số khả năng này trong chọn hoàn lại được xác đònh theo công thức: K = N n - Chọn không hoàn lại: tức là khi mỗi đơn vò đã được chọn để nghiên cứu sẽ được xếp riêng ra, không trả về tổng thể chung nên không có khả năng được chọn lại. Số đơn vò tổng thể chung sẽ giảm dần trong quá trình chọn từng đơn vò. Trong chọn không hoàn lại, số khả năng thiết lập tổng thể mẫu tính bằng công thức: K = C n N = N!/[n!(N-n)!] Trong thực tế nếu qui mô của tổng thể chung khá lớn và qui mô của mẫu chọn ra chiếm một phần rất nhỏ trong tổng thể chung thì phương thức lấy mẫu hoàn lại hay không hoàn lại cho ta các kết quả sai lệch không đáng kể. Đặc biệt, khi qui mô của tổng thể chung là vô hạn, còn qui mô của mẫu lại hữu hạn thì hầu như không còn sự khác biệt giữa hai phương thức lấy mẫu trên nữa, lúc đó có thể chọn theo phương thức không hoàn lại mà vẫn có thể giả thiết mẫu được chọn theo phương thức hoàn lại. b. Chọn mẫu với xác suất đều và không đều: -Chọn mẫu với xác suất đều là đảm bảo mỗi đơn vò của hiện tượng nghiên cứu đều có cơ hội được chọn vào mẫu như nhau. Tính bình đẳng của các đơn vò còn thể hiện trong việc ước lượng kết quả bởi vì kết quả thu được trên mẫu không phân biệt thuộc đơn vò nào. Phương pháp chọn mẫu với xác suất đều nói chung không lưu ý đến sự khác biệt lẫn nhau giữa các đơn vò tổng thể. Nó thường được sử dụng trong các trường hợp: +Các đơn vò của hiện tượng tương đối đồng đều nhau theo tiêu thức nghiên cứu. +Không biết trước được sự khác biệt giữa các đơn vò. Trang 145 "" Chương 8. Điều tra chọn mẫu -Chọn mẫu với xác suất không đều là không cần đảm bảo khả năng được chọn vào mẫu của các đơn vò phải bằng nhau. Các đơn vò có thể được chọn theo xác suất tỷ lệ với vai trò của từng đơn vò. Xác suất ấn đònh cho mỗi đơn vò về khả năng được chọn vào mẫu gọi là xác suất bao hàm. Con số này đóng vai trò trọng số và sẽ tham gia vào các ước lượng tối ưu. Trường hợp xác suất bao hàm tỷ lệ với kích thước nào đó của đơn vò điều tra thì gọi là chọn mẫu với xác suất tỷ lệ kích thước. Chọn mẫu với xác suất không đều sẽ khó khăn phức tạp hơn vì cần phải có số liệu tiên nghiệm về qui mô, kích thước của hiện tượng nghiên cứu. c. Sai số chọn mẫu: Sai số chọn mẫu là sự khác biệt giữa trò số từ điều tra mẫu thu thập được với trò số thật của nó trong tổng thể chung. Độ chính xác và độ tin cậy của số liệu mẫu chòu ảnh hưởng của hai loại sai số khác nhau: sai số lấy mẫu và sai số không lấy mẫu. Có thể biểu thò bằng công thức tổng quát sau: = ’+ M + 0 Trong đó: : Tham số của tổng thể chung. ’: Tham số của tổng thể mẫu. M : Sai số lấy mẫu. 0 : Sai số không lấy mẫu. - Sai số lấy mẫu là sai số do sự lấy mẫu gây ra. Trong thực tế không thể có một mẫu nào có thể làm đại diện chính xác cho tổng thể, mặc dù người nghiên cứu có thể chọn rất khoa học và cẩn thận. Sai số lấy mẫu có thể giảm bằng cách tăng qui mô của mẫu, khi qui mô của mẫu tăng bằng qui mô của tổng thể chung thì sai số lấy mẫu sẽ biến mất. - Sai số không lấy mẫu: là sai số xảy ra ngoài việc lấy mẫu. Sai số không lấy mẫu có thể xâm nhập vào những số liệu ở mức tinh vi. Những sai số này xảy ra do nhiều nguyên nhân: Trang 146 "" Chương 8. Điều tra chọn mẫu + Do đơn vò điều tra trả lời sai vì hiểu không đúng nội dung, trí nhớ tồi, không chính xác, hoặc cố ý khai sai. + Do người nghiên cứu vô tình ghi chép sai. + Do đo lường sai. + Do mã hóa hoặc hiệu chỉnh dữ liệu có sai lầm… Ngược lại với sai số lấy mẫu, khi qui mô của mẫu tăng thì những sai số không lấy mẫu có thể tăng theo. Chúng ta không thể tính được cụ thể sai số không lấy mẫu và cũng không loại bỏ được hoàn toàn sai số này. Tuy nhiên, ta có thể giảm nó bằng cách chuẩn bò kỹ nội dung câu hỏi và kiểm tra một cách có hệ thống. Riêng đối với sai số lấy mẫu trong chọn ngẫu nhiên, thống kê toán đã chứng minh cách xác đònh sai số trung bình chọn mẫu theo các công thức: -Khi nhiệm vụ chọn mẫu là ước lượng số trung bình về một tiêu thức nào đó, sai số trung bình chọn mẫu sẽ là: + Trường hợp chọn hoàn lại: x = 2 /n Do 2 nhiều khi không tính được phải lấy phương sai mẫu hiệu chỉnh để thay thếS’ 2 . Ta có công thức: x = S 2 /(n – 1) + Trường hợp chọn không hoàn lại: x = 2 (1-n/N)/n hay x = S 2 (1-n/N)/(n – 1) Trong đó: x : Sai số trung bình chọn mẫu. 2 : Phương sai của tổng thể chung. S 2 : Phương sai của tổng thể mẫu. n: Số đơn vò tổng thể mẫu. N: Số đơn vò tổng thể chung. Trang 147 "" Chương 8. Điều tra chọn mẫu - Khi nhiệm vụ chọn mẫu là để ước lượng tỷ lệ theo một tiêu thức nào đó, sai số trung bình chọn mẫu sẽ là: + Trường hợp chọn hoàn lại: p = p(1-p)/n Hay p = f(1-f)/n + Trường hợp chọn không hoàn lại: p = p(1-p)(1-n/N)/n hay p = f(1-f)(1-n/N)/n Trong đó: p: Tỷ lệ của tổng thể chung. f: Tỷ lệ của tổng thể mẫu. Các công thức sai số trung bình chọn mẫu trên đây biểu thò trò số trung bình của các sai số chọn mẫu có thể gặp phải khi ước lượng. Song do tiến hành chọn ngẫu nhiên nên sai số này không phải là một trò số được xác đònh trước về dấu (+ hoặc -) mà phản ánh một phạm vi chênh lệch có thể nhiều hơn hoặc ít hơn so với tham số của tổng thể chung. Như vậy có nghóa là chênh lệch giữa x và X , giữa f và p không phải hoàn toàn bằng mà nằm trong phạm vò + . Cũng theo chứng minh của toán: Nếu đại lượng ngẫu nhiên phân phối theo qui luật chuẩn thì khi ước lượng tham số của tổng thể chung, cho phạm vi sai số đúng bằng + thì độ tin cậy của ước lượng mới chỉ bằng 0,6827. Có thể nâng cao độ tin cậy bằng cách mở rộng thêm phạm vi sai số chọn mẫu. Nếu như phạm vi này được mở rộng gấp đôi, tức là +2 thì độ tin cậy sẽ lên tới 0,9545. Nếu mở rộng phạm vi lên 3 lần (+3) thì độ tin cậy sẽ lên tới 0,9973 v.v… Trang 148 . phải lấy phương sai mẫu hiệu chỉnh để thay thếS’ 2 . Ta có công thức: x = S 2 /(n – 1) + Trường hợp chọn không hoàn lại: x = 2 (1-n/N)/n hay x = S 2 (1-n/N)/(n – 1) Trong. không chệch, hiệu quả và vững của phương sai chung 2 , do đó nếu chương biết phương sai 2 có thể dùng S’ 2 để ước lượng. Chú ý rằng, phương sai mẫu S 2 và phương sai hiệu chỉnh mẫu chỉ khác. Điều tra chọn mẫu - Chọn hoàn lại: tức là trước khi chọn đơn vò thứ k vào mẫu nghiên cứu thì đã trả lại tổng thể chung đơn vò thứ (i -1 ) mà ta đã nghiên cứu xong (i= 2 - >n). Như vậy, số