1. Trang chủ
  2. » Giáo Dục - Đào Tạo

Giáo trình nguyên lý thống kê - Bài 7 pdf

23 673 7

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 23
Dung lượng 1,26 MB

Nội dung

Trên cơ sở đó, đi sâu nghiên cứu điều tra chọn mẫu ngẫu nhiên qua đó giúp học viên có thể nắm bắt được cách suy rộng kết quả điều tra mẫu, xác định số đơn vị tiến hành điều tra và trình

Trang 1

GIÁO TRÌNH NGUYÊN LÝ

THỐNG KÊ Bài 7: Điều tra chọn mẫu

Trang 2

0

Nội dung Mục tiêu

 Những vấn đề chung về điều tra chọn mẫu

 Đi sâu nghiên cứu một số vấn đề của

điều tra chọn mẫu ngẫu nhiên

 Giới thiệu một số phương pháp chọn mẫu

 Tóm lược quy trình của một cuộc điều

tra chọn mẫu

Trang bị các kiến thức cơ bản về điều tra chọn mẫu Trên cơ sở đó, đi sâu nghiên cứu điều tra chọn mẫu ngẫu nhiên qua đó giúp học viên có thể nắm bắt được cách suy rộng kết quả điều tra mẫu, xác định số đơn

vị tiến hành điều tra và trình tự tiến hành một cuộc điều tra

Thời lượng học Hướng dẫn học

 Trả lời các câu hỏi ôn tập ở cuối bài và làm bài tập

BÀI 7: ĐIỀU TRA CHỌN MẪU

Trang 3

TÌNH HUỐNG DẪN NHẬP

Tên tình huống: Điều tra để thực hiện điều chỉnh tiền lương

Do ảnh hưởng của suy thoái kinh tế, trong năm vừa qua, doanh

nghiệp của bạn làm ăn thua lỗ, lợi nhuận âm Để đảm bảo việc

làm cho công nhân, doanh nghiệp phải thực hiện điều chỉnh tiền

lương Với tư cách là người tư vấn cho lãnh đạo doanh nghiệp

về mức điều chỉnh, bạn thực hiện một cuộc điều tra nhằm đánh

giá mức năng suất lao động bình quân của công nhân trong

doanh nghiệp Đây là cơ sở để bạn đưa ra mức giảm trừ tiền

lương là bao nhiêu cho phù hợp Nhưng để điều tra trên khoảng

3.000 công nhân của doanh nghiệp thì mất khá nhiều thời gian

và tốn kém, bạn quyết định thực hiện điều tra ngẫu nhiên trên

một mẫu gồm 300 lao động Với kết quả tính toán được từ mẫu điều tra này, bạn sẽ suy rộng kết quả cho toàn bộ doanh nghiệp

Câu hỏi

Bạn sẽ thực hiện trình tự cuộc điều tra đó thế nào? Làm thế nào để có thể suy rộng kết quả điều tra?

Bài học này sẽ cung cấp cho bạn những kiến thức cơ bản nhất về một cuộc điều tra chọn mẫu

và cách sử dụng kết quả điều tra để đánh giá, nhìn nhận toàn bộ hiện tượng

Trang 4

7.1 Một số khái niệm chung về điều tra chọn mẫu

7.1.1.1 Khái niệm

Điều tra chọn mẫu là một loại điều tra không toàn bộ

trong đó người ta chỉ chọn ra một số đơn vị thuộc đối

tượng nghiên cứu để tiến hành điều tra thực tế Các

đơn vị này được chọn theo những quy tắc nhất định để

đảm bảo tính đại biểu Kết quả của điều tra chọn mẫu

được dùng để suy rộng cho tổng thể chung

Tại sao chỉ điều tra một số đơn vị tổng thể mà suy ra

kết quả của cả tổng thể chung? Cơ sở khoa học của điều tra chọn mẫu là sử dụng quy luật số lớn và lý thuyết xác suất thống kê để tính toán trong thực tế Quy luật số lớn đã chỉ ra rằng, nếu chỉ nghiên cứu một số đủ lớn các đơn vị, phần tử cá biệt thì những biểu hiện ngẫu nhiên của các đơn vị này sẽ bù trừ và triệt tiêu lẫn nhau, tính quy luật

sẽ được thể hiện rõ Mặt khác, lý thuyết xác suất cũng chứng minh rằng sự sai lệch giữa số bình quân của một số rất lớn các đại lượng ngẫu nhiên với kỳ vọng toán của

nó là một đại lượng nhỏ tuỳ ý

Khi chọn đơn vị để điều tra mẫu, người ta có thể chọn theo những quy tắc khác nhau, ngẫu nhiên hoặc không ngẫu nhiên

Suy rộng (ước lượng): từ các tham số (mức độ) tính toán được trên các đơn vị điều tra suy ra các tham số tương ứng của toàn bộ hiện tượng, có hai loại:

 Suy rộng bình quân theo một tiêu thức

 Suy rộng tỷ lệ theo một tiêu thức

7.1.1.2 Ưu, nhược điểm của điều tra chọn mẫu

 Ưu điểm

o Tiết kiệm hơn cả về mặt thời gian lẫn chi phí so với điều tra toàn bộ

o Do điều tra ít đơn vị nên có thể mở rộng nội dung điều tra đi sâu nghiên cứu chi tiết nhiều mặt của hiện tượng

o Tài liệu thu được trong điều tra chọn mẫu có độ chính xác cao hơn do giảm được sai số phi chọn mẫu:

 Do phạm vi điều tra nhỏ hơn nên được chuẩn bị và kiểm tra kỹ lưỡng tỷ mỉ hơn cả trước, trong và sau cuộc điều tra;

 Do số đơn vị điều tra ít nên cần ít điều tra viên, do đó có điều kiện chọn được người có trình độ chuyên môn cao

 Dựa trên cơ sở khoa học của lý thuyết xác suất thống kê và quy luật số lớn nên có thể tính được sai số và độ tin cậy của tài liệu

o Tiến hành nhanh gọn, bảo đảm tính kịp thời của số liệu thống kê Mặt khác, điều tra chọn mẫu không đòi hỏi phải có tổ chức lớn, chỉ cần một cơ quan hoặc một nhóm người cũng có thể tiến hành điều tra được

Trang 5

 Nhược điểm

o Không cho biết thông tin đầy đủ, chi tiết về từng đơn vị tổng thể, không cho biết quy mô tổng thể

o Do chỉ tiến hành điều tra một số đơn vị rồi dùng kết quả để suy rộng cho toàn

bộ tổng thể nên chắc chắn không tránh khỏi sai số khi suy rộng

o Kết quả điều tra chọn mẫu không thể tiến hành phân nhỏ theo phạm vi và tiêu thức nghiên cứu như điều tra toàn bộ mà chỉ có thể thực hiện ở một mức độ nhất định tuỳ thuộc vào quy mô mẫu và cách rải mẫu

7.1.1.3 Trường hợp vận dụng điều tra chọn mẫu

 Sử dụng để thay thế điều tra toàn bộ trong trường

hợp đối tượng nghiên cứu cho phép vừa có thể điều tra toàn bộ vừa có thể điều tra chọn mẫu hoặc với những trường hợp không cho phép điều tra toàn bộ, hoặc do quy mô điều tra toàn bộ quá lớn, cần thu thập nhiều chỉ tiêu nhưng không đủ kinh phí và nhân lực để tiến hành điều tra toàn bộ

 Kết hợp với điều tra toàn bộ để mở rộng nội dung

điều tra và đánh giá kết quả của điều tra toàn bộ

Ví dụ: Tổng điều tra dân số năm 2009, chọn 15% tổng số hộ để tiến hành điều tra

chọn mẫu; trong đó mở rộng nội dung nghiên cứu về các mặt như đời sống, sức khoẻ, giáo dục, đồng thời cũng để đánh giá kết quả của điều tra toàn bộ

 Sử dụng để tổng hợp nhanh tài liệu của điều tra toàn bộ phục vụ kịp thời yêu cầu thông tin cho các đối tượng sử dụng

Ví dụ: Trong tổng điều tra dân số việc tổng hợp tài liệu đòi hỏi phải có thời gian

dài, vì vậy để kịp thời phục vụ cho công tác lãnh đạo và kế hoạch hoá có thể sử dụng điều tra chọn mẫu để có được tài liệu một cách nhanh chóng

 Sử dụng trong trường hợp muốn so sánh các hiện tượng với nhau hoặc muốn đưa

ra một nhận định nào đó mà chưa có tài liệu cụ thể (để kiểm tra giả thiết thống kê)

Ví dụ: Sau một thời gian thử nghiệm hai phương pháp đào tạo nghề mới, có ý kiến

cho rằng, phương pháp A tốt hơn phương pháp B Để kiểm tra giả thiết đó có đúng hay không, người ta tiến hành chọn hai mẫu gồm những người công nhân được đào tạo theo hai phương pháp trên Sau đó, sử dụng phương pháp thống kê phù hợp để kết luận xem liệu có cơ sở nào để bác bỏ giả thiết đặt ra ở trên hay không

Trong bất kỳ cuộc điều tra nào, khi tiến hành điều tra

ngoài việc xác định được mục đích, đối tượng và nội

dung điều tra còn phải xác định phạm vi tiến hành điều

tra Với điều tra chọn mẫu, phạm vi đó có thể là tổng

thể chung và tổng thể mẫu Trong đó:

 Tổng thể chung là tổng thể bao gồm toàn bộ các

đơn vị thuộc đối tượng điều tra

Trang 6

 Tổng thể mẫu là tổng thể bao gồm một số đơn vị nhất định được chọn ra từ tổng thể

chung để tiến hành điều tra thực tế

Khi đó, ta có một số ký hiệu thường dùng với tổng thể chung và tổng thể mẫu như sau:

Hiện nay, có hai phương pháp chọn mẫu cơ bản được sử dụng phổ biến trong các cuộc

điều tra là chọn mẫu ngẫu nhiên và chọn mẫu phi ngẫu nhiên

 Chọn ngẫu nhiên: là phương pháp chọn hoàn toàn ngẫu nhiên không phụ thuộc vào ý

muốn chủ quan của con người Khi đó, người ta gọi là điều tra chọn mẫu ngẫu nhiên

Ví dụ: Rút thăm, dùng bảng số ngẫu nhiên

 Chọn mẫu phi ngẫu nhiên: là phương pháp chọn đơn vị điều tra phụ thuộc vào ý

muốn chủ quan của người chọn Khi đó, ta có điều tra chọn mẫu phi ngẫu nhiên

Ví dụ: Chọn đơn vị trung bình, chọn chuyên gia

Chọn mẫu phi ngẫu nhiên được sử dụng trong trường hợp việc chọn mẫu ngẫu nhiên

gặp khó khăn như những cuộc điều tra mới hoàn toàn chưa có một thông tin tiên

nghiệm nào về đối tượng điều tra, hoặc có những hiện tượng kinh tế phức tạp, sự phân

tán không ổn định, biến động thất thường hoặc nhiều tầng lớp, Phương pháp này

không hoàn toàn dựa trên cơ sở toán học như điều tra chọn mẫu ngẫu nhiên mà đòi hỏi

phải kết hợp chặt chẽ giữa phân tích lý luận và thực tiễn xã hội Do đó, phần nhiều

mang tính chất cảm tính, chủ quan của người chọn thông qua kinh nghiệm và sự hiểu

biết về tổng thể nghiên cứu Chính vì vậy, trong phạm vi và nội dung bài giảng chỉ đề

cập đến các vấn đề thuộc điều tra chọn mẫu ngẫu nhiên

Có nhiều kỹ thuật chọn mẫu khác nhau dựa trên cơ sở tiêu

thức phân loại Thông thường trong thống kê căn cứ vào

sự thay đổi của tổng thể chung trong quá trình chọn và xác

suất lấy mẫu, người ta chia thành các loại sau đây:

 Chọn hoàn lại (chọn lặp, chọn nhiều lần): Mỗi khi

đơn vị được chọn ra để điều tra sau đó sẽ được trả lại

tổng thể chung và có cơ hội được chọn lại

Đặc điểm của phương pháp chọn này là quy mô của

tổng thể chung không thay đổi trong quá trình chọn và

số đơn vị trong tổng thể mẫu không hoàn toàn là các đơn vị khác nhau Chính vì

quy mô không thay đổi nên xác suất được chọn của mỗi đơn vị là như nhau

(đều bằng 1/N) Khi đó, số mẫu có thể hình thành là: k = Nn

Trang 7

 Chọn không hoàn lại (chọn một lần): Mỗi khi các đơn vị được chọn ra để điều tra

sau đó sẽ được xếp riêng ra không trả lại tổng thể chung và không có cơ hội được chọn lại

Chính vì vậy mà đặc điểm của phương pháp chọn này là quy mô tổng thể giảm trong quá trình chọn Số đơn vị trong tổng thể mẫu là hoàn toàn khác nhau và xác suất được chọn của các đơn vị là hoàn toàn khác nhau, xác suất này tăng dần trong quá trình chọn Khi đó, số mẫu có thể hình thành:

n N

đó Do đó, các mức độ được tính trên mẫu (như bình quân, tỷ lệ, phương sai ) là những biến ngẫu nhiên tuân theo những quy luật phân phối xác suất nhất định Với số lượng đơn vị tổng thể mẫu từ 30 đơn vị trở lên thì bình quân mẫu và tỷ lệ mẫu được xem như phân phối theo quy luật chuẩn

7.2.2.1 Khái niệm và các loại sai số trong điều tra chọn mẫu

Sai số thống kê là phần chênh lệch giữa kết quả thu được qua điều tra và giá trị thực tế của nó trong tổng thể chung, tức là:

 = ’  M  0MTrong đó:

: Tham số của tổng thể chung

’: Thống kê của tổng thể mẫu

M: Sai số chọn mẫu (sai số do tính đại biểu)

0M: Sai số phi chọn mẫu (sai số do ghi chép)

Như vậy, sai số chọn mẫu là chênh lệch giữa mức độ được tính ra từ tổng thể mẫu và mức độ tương ứng của tổng thể chung, tức là (x  và (f – p) )

Đây là vấn đề không thể tránh khỏi trong bất kỳ cuộc điều tra nào Sai số ảnh hưởng rất lớn đến kết quả điều tra, thậm chí trong trường hợp sai số quá lớn có thể dẫn đến huỷ bỏ kết quả của cuộc điều tra Vậy có những loại sai số nào? Trong một cuộc điều tra chọn mẫu, thường xuất hiện hai loại sai số chủ yếu sau:

 Sai số phi chọn mẫu: Sai số này xảy ra ở tất cả

các cuộc điều tra Nguyên nhân là do điều tra viên cân đong đo đếm sai, ghi chép sai, đơn vị điều tra cung cấp sai sự thật Sai số này không thể xoá bỏ được mà chỉ giảm bằng cách huấn luyện nhân viên điều tra cẩn thận hơn

 Sai số chọn mẫu: Sai số này chỉ xảy ra trong điều tra chọn mẫu, do chỉ điều tra

một số ít đơn vị nhưng kết quả lại ước lượng cho cả tổng thể Sai số chọn mẫu được biểu hiện dưới hai hình thức:

Trang 8

o Sai số hệ thống: xảy ra do vi phạm nguyên tắc chọn, chọn một số đơn vị không

đủ lớn để đảm bảo tính chất đại biểu, chọn mẫu không khách quan

o Sai số ngẫu nhiên: chỉ xuất hiện trong trường hợp các đơn vị của tổng thể chung được chọn theo nguyên tắc ngẫu nhiên, không lường trước được lệch về hướng nào, nhiều hơn hay ít hơn so với thực tế Sai số này được giảm dần khi điều tra một số đủ lớn các đơn vị

Sai số chọn mẫu không phải là một trị số cố định Với cùng một hiện tượng nhưng nếu tiến hành điều tra nhiều lần với các cách chọn mẫu khác nhau, kết cấu của tổng thể mẫu khác nhau thì sẽ có các sai số chọn mẫu khác nhau Do đó, để tính sai số nhằm đánh giá mức độ chính xác của ước lượng thì phải tính sai số bình quân chọn mẫu

7.2.2.2 Sai số bình quân chọn mẫu

 Khái niệm

Sai số bình quân chọn mẫu là một trị số sai số chọn mẫu đại diện cho các giá trị của sai số chọn mẫu, nói cách khác, đó là bình quân của tất cả các sai số chọn mẫu

do việc lựa chọn mẫu có kết cấu thay đổi

Trong thống kê, cùng một hiện tượng nghiên cứu nếu áp dụng các phương pháp tổ chức chọn mẫu khác nhau sẽ có sai số bình quân chọn mẫu khác nhau Thống kê toán đã xác định công thức tính sai số bình quân chọn mẫu trong các trường hợp như sau:

Cách chọn Suy rộng

Chọn hoàn lại (chọn nhiều lần)

Chọn không hoàn lại (chọn một lần)

Bình quân

n hoặc

 

2 0

 , σp: Các sai số bình quân chọn mẫu khi ước lượng số bình quân và tỷ lệ

2: Phương sai của tổng thể chung

σ02: Phương sai của tổng thể mẫu

p, f: Tỷ lệ theo một tiêu thức nào đó của tổng thể chung và tổng thể mẫu

Trang 9

Từ cách tính sai số bình quân chọn mẫu ở trên, có thể thấy có rất nhiều nhân tố ảnh hưởng đến độ lớn của sai số chọn mẫu Trong đó, ba nhân tố chủ yếu nhất, đó là:

o Số đơn vị tổng thể mẫu n: Khi số đơn vị điều tra tăng lên, tổng thể mẫu sẽ gần với tổng thể chung, sai số chọn mẫu sẽ giảm

Khi n  N thì   x 0, p f 0

o Phương pháp tổ chức chọn mẫu: Các phương pháp chọn mẫu khác nhau, tính đại diện của mẫu chọn ra khác nhau cũng sẽ dẫn đến những sai số chọn mẫu khác nhau

o Độ đồng đều của tổng thể chung: Nếu tổng thể có độ đồng đều cao tức phương sai tổng thể 2 tương đối nhỏ thì sai số chọn mẫu sẽ nhỏ

 Ý nghĩa của việc tính toán sai số chọn mẫu

o Dùng để ước lượng chỉ tiêu nghiên cứu theo khoảng

o Dùng để đánh giá tính đại diện của chỉ tiêu nghiên cứu qua tính toán tỷ lệ sai số chọn mẫu (H) như sau:

x

 

H càng nhỏ thì chỉ tiêu có tính đại diện càng cao và ngược lại

o Là cơ sở để xác định cỡ mẫu cho các cuộc điều tra được tiến hành về sau

Chú ý

 Sự khác biệt giữa hai phương pháp chọn hoàn lại và chọn không hoàn lại chính là (1 – n/N) Do đó, ta luôn có sai số bình quân chọn mẫu theo cách chọn hoàn lại lớn hơn sai số bình quân chọn mẫu theo cách chọn không hoàn lại

 Khi n nhỏ hơn rất nhiều so với N thì khi đó n/N nhỏ và (1– n/N) gần với 1 Do vậy,

có thể chọn theo cách không hoàn lại nhưng sử dụng công thức của chọn hoàn lại để tính sai số bình quân chọn mẫu cho đơn giản.

Sai số bình quân chọn mẫu không phải là một trị số xác định Khi ta tiến hành nhiều lần điều tra khác nhau với cùng một hiện tượng, ta sẽ nhận được các sai số khác nhau

và chúng đều dao động xung quanh μ Do đó, không thể xác định chính xác sai số chọn mẫu cho mỗi lần điều tra mà chỉ có thể dựa vào sai số bình quân chọn mẫu để ước lượng phạm vi sai số chọn mẫu

7.2.2.3 Phạm vi sai số chọn mẫu

 Khái niệm

Phạm vi sai số chọn mẫu hay độ chính xác của suy rộng là chênh lệch giữa các chỉ tiêu của tổng thể mẫu và các chỉ tiêu tương ứng của tổng thể chung với độ tin cậy nhất định

Nói cách khác, để ước lượng được tham số của tổng thể chung từ tham số của tổng thể mẫu thì phải xác định được phạm vi sai số chọn mẫu

Trang 10

Trong thống kê phạm vi sai số chọn mẫu được ký hiệu là  và được xác định bằng công thức:

 = z  σ Trong đó:

σ: Sai số bình quân chọn mẫu

z: Hệ số tin cậy

Theo chứng minh của toán học thì z tương ứng với hàm xác suất (z) đã được Liapunốp tính sẵn thành bảng riêng Ý nghĩa của hàm xác suất này được biểu hiện như sau:

x

P(     x (z) 1  

p

P( p f    (z) 1  

Với  là xác suất sai lầm; (1 – ) gọi là độ tin cậy ước lượng

Sau đây là một vài trị số tiêu biểu của z:

Dù chọn lặp hay không lặp thì số mẫu có thể hình thành

là một con số rất lớn Mẫu được chọn ra để tiến hành điều

tra thực tế chỉ là một trong số rất nhiều mẫu có thể hình

thành Qua điều tra chọn mẫu chúng ta tính toán được các

tham số x , f, σ02 của tổng thể mẫu Nhưng mục đích của

chúng ta là xác định các tham số của tổng thể chung μ, p,

2 Do đó, ta phải ước lượng, nghĩa là từ các tham số của

tổng thể mẫu suy ra các tham số của tổng thể chung

Trong thống kê có hai phương pháp ước lượng là ước lượng điểm và ước lượng khoảng Tuy nhiên, khi kích thước mẫu nhỏ ước lượng điểm cho sai số lớn và

Trang 11

thường không đánh giá được khả năng mắc sai lầm khi ước lượng Do đó, phương pháp được sử dụng phổ biến nhất để ước lượng kết quả điều tra là phương pháp ước lượng khoảng

Dựa vào tham số của tổng thể mẫu và phạm vi sai số chọn mẫu tính toán được, các tham số của tổng thể chung được thống kê toán ước lượng như sau:

Khi ước lượng số bình quân:

        hay x z         x x z x

Khi ước lượng tỷ lệ theo một tiêu thức nào đấy:

p = f  p = f  z  σp hay f – z  σp  p  f + z  σp

7.2.4.1 Yêu cầu

Chúng ta đã biết, sai số chọn mẫu tỷ lệ nghịch với số đơn vị mẫu chọn để điều tra Do

đó, để giảm sai số chọn mẫu người ta phải tăng số đơn vị mẫu đến mức tối đa có thể thực hiện được

Tuy nhiên, việc tăng số đơn vị điều tra lại liên quan đến vấn đề kinh phí Vì vậy, cũng phải chọn số đơn vị điều tra sao cho các chi phí là thấp nhất

Hai yêu cầu này luôn khó thực hiện cùng một lúc do đó người ta ưu tiên sai số nhỏ để xác định số đơn vị mẫu điều tra

7.2.4.2 Phương pháp xác định số đơn vị mẫu cần điều tra

Trên thực tế, có rất nhiều phương pháp xác định cỡ mẫu khác nhau tuỳ thuộc vào từng điều kiện cụ thể Xét về mặt lý thuyết, người ta thường căn cứ vào độ chính xác khi suy rộng kết quả điều tra chọn mẫu Biểu hiện tập trung nhất của độ chính xác là phạm

vi sai số chọn mẫu

Từ công thức tính phạm vi sai số chọn mẫu, suy ra công thức tính số đơn vị mẫu cần điều tra như sau:

Cách chọn Suy rộng

Chọn hoàn lại (chọn nhiều lần)

Chọn không hoàn lại (chọn một lần)

2 2 2 x

z

x

Nz n

 Lấy phương sai lớn nhất trong những lần điều tra trước (nếu có) hoặc chọn p nào gần với 0,5 nhất

 Lấy phương sai của các cuộc điều tra khác có tính chất tương tự

Ngày đăng: 14/08/2014, 21:21

HÌNH ẢNH LIÊN QUAN

Đồ thị thống kê và báo cáo phân tích. - Giáo trình nguyên lý thống kê - Bài 7 pdf
th ị thống kê và báo cáo phân tích (Trang 18)

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w