1. Trang chủ
  2. » Thể loại khác

Chương 7 Lấy mẫu và Phân phối Mẫu

70 186 1
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 70
Dung lượng 1,06 MB

Nội dung

THỐNG KÊ ỨNG DỤNGTRONG KINH TẾ VÀ KINH DOANHTHỐNG KÊ ỨNG DỤNGTRONG KINH TẾ VÀ KINH DOANHTHỐNG KÊ ỨNG DỤNGTRONG KINH TẾ VÀ KINH DOANHTHỐNG KÊ ỨNG DỤNGTRONG KINH TẾ VÀ KINH DOANHTHỐNG KÊ ỨNG DỤNGTRONG KINH TẾ VÀ KINH DOANHTHỐNG KÊ ỨNG DỤNGTRONG KINH TẾ VÀ KINH DOANHTHỐNG KÊ ỨNG DỤNGTRONG KINH TẾ VÀ KINH DOANHTHỐNG KÊ ỨNG DỤNGTRONG KINH TẾ VÀ KINH DOANH

Trang 2

Chương 7 Lấy mẫu và Phân phối Mẫu

x

 Phân phối mẫu

của

 Giới thiệu phân phối mẫu

 Ước lượng điểm

 Chọn một mẫu

 Các phương pháp lấy mẫu khác

p

 Phân phối mẫu của

 Các tính chất của ước lượng điểm

Trang 3

M ột mẫu là một tập con của tổng thể.

M ột phần tử là thực thể trên đó dữ liệu được thu thập

Trang 4

Các kết quả mẫu chỉ cung cấp các ước lượng về các giá trị của các đặc điểm tổng thể.

Các kết quả mẫu chỉ cung cấp các ước lượng về các giá trị của các đặc điểm tổng thể

Với các phương pháp lấy mẫu thích hợp, các kết quả mẫu có thể cung cấp các ước lượng “tốt” các đặc điểm

Với các phương pháp lấy mẫu thích hợp, các kết quả mẫu có thể cung cấp các ước lượng “tốt” các đặc điểm

Lý do chúng ta chọn một mẫu là thu thập dữ liệu để

trả lời một câu hỏi nghiên cứu về một tổng thể

Lý do chúng ta chọn một mẫu là thu thập dữ liệu để

trả lời một câu hỏi nghiên cứu về một tổng thể

Trang 5

Chọn mẫu

 Lấy mẫu từ một tổng thể hữu hạn

 Lấy mẫu từ một tổng thể vô hạn

Trang 6

Lấy mẫu từ một tổng thể hữu hạn

 Tổng thể hữu hạn thường được định nghĩa

được lựa chọn

Trang 7

 Trong các dự án lấy mẫu lớn, các số ngẫu nhiên do

máy tính tạo ra thường được sử dụng để tự động hóa quá trình chọn mẫu

 Lấy mẫu không hoàn lại là thủ tục thường được sử dụng

 Trả lại mỗi phần tử đã được lấy mẫu trước khi lựa chọn các phần tử sau được gọi là lấy mẫu có hoàn lại

Lấy mẫu từ một tổng thể hữu hạn

Trang 8

Đại học St Andrew’s đã nhận 900 đơn xin vào học

năm tới từ các sinh viên tương lai Các ứng viên đã được đánh số, từ 1 đến 900, khi đơn của họ nộp vào Trưởng ban tuyển sinh

muốn chọn một mẫu ngẫu nhiên đơn giản gồm 30 ứng viên

 Ví dụ : Đại học St Andrew’s

Lấy mẫu từ một tổng thể hữu hạn

Trang 9

Các số ngẫu nhiên được tạo bởi hàm ngẫu nhiên của Excel theo phân phối xác suất

đều giữa 0 and 1

Các số ngẫu nhiên được tạo bởi hàm ngẫu nhiên của Excel theo phân phối xác suất

đều giữa 0 and 1

Bước 1: Gắn một số ngẫu nhiên cho mỗi ứng viên trong 900 ứng viên nói trên

Bước 2: Chọn 30 ứng viên tương ứng với 30 số

ngẫu nhiên nhỏ nhất

Lấy mẫu từ một tổng thể hữu hạn

 Ví dụ : Đại học St Andrew’s

Trang 10

Lấy mẫu từ một tổng thể vô hạn

 Kết quả, chúng ta không thể xây dựng một dàn chọn mẫu cho tổng thể

 Đôi khi chúng ta muốn chọn một mẫu, nhưng nhận

thấy không thể có được một danh sách gồm tất cả các

Trang 11

 Tổng thể thường được tạo ra bằng một quá

trình xảy ra hiện thời ở đó không có giới hạn trên đối với số lượng đơn vị có thể được tạo ra

Lấy mẫu từ một tổng thể vô hạn

 Vài ví dụ về quá trình xảy ra hiện thời, với các tổng thể

vô hạn, là :

• các bộ phận đang được sản xuất trên một dây chuyền sản xuất

• các giao dịch đang xảy ra tại một ngân hàng

• các cuộc gọi điện thoại đang đến ở một tổ hỗ trợ

kỹ thuật

• các khách hàng đang đi vào một cửa hàng

Trang 12

Lấy mẫu từ một tổng thể vô hạn

 M ột mẫu ngẫu nhiên từ một tổng thể vô hạn là một mẫu được chọn sao cho các điều kiện sau đây thỏa mãn

• M ỗi phần tử được chọn đến từ tổng thể quan tâm

• M ỗi phần tử được chọn một cách độc lập

 trong trường hợp một tổng thể vô hạn, chúng ta phải

chọn một mẫu ngẫu nhiên để thực hiện các suy diễn

thống kê có căn cứ về tổng thể từ mẫu được lấy

Trang 13

s là ước lượng điểm của độ lệch chuẩn tổng thể .

s là ước lượng điểm của độ lệch chuẩn tổng thể .

Trong ước lượng điểm chúng ta sử dụng dữ liệu từ mẫu

để tính toán giá trị của một thống kê mẫu, rồi dùng nó như một ước lượng của tham số tổng thể

Trong ước lượng điểm chúng ta sử dụng dữ liệu từ mẫu

để tính toán giá trị của một thống kê mẫu, rồi dùng nó như một ước lượng của tham số tổng thể

Ước lượng điểm

Chúng ta xem như ước lượng điểm của trung bình

Trang 14

N hắc lại là Đại học St Andrew’s đã nhận

900 đơn của các sinh viên tương lai M ẫu đơn chứa nhiều thông

tin bao gồm điểm kiểm tra năng lực học tập (SAT)

và có hay không mong muốn ở ký túc xá

 Ví dụ : Đại học St Andrew’s

Ước lượng điểm

Tại một cuộc họp trong vài giờ, Trưởng ban tuyển

sinh muốn công bố điểm SAT trung bình và tỷ

lệ ứng

Trang 15

Ước lượng điểm

30 ứng viên được chọn bằng cách sử dụng các số ngẫu nhiên do máy tính tạo ra

Trang 16

 là Ước Lượng Điểm của x

 là Ước Lượng Điểm

Ước lượng điểm

Lưu ý: Các số ngẫu nhiên khác sẽ nhận dạng một mẫukhác mà sẽ dẫn đến các ước lượng điểm khác

s là Ước Lượng Điểm của

Trang 17

1090 900

số tổng thể quan tâm được tính toán

Ước lượng điểm

Trang 18

Tham sốTổng thể Tham sốGiá trị Ước lượng điểmTham số Ước lượngĐiểm

 = Điểm SAT trung

Trang 19

Lời khuyên thực hành

Tổng thể đích là tổng thể mà chúng ta muốn

thực hiện các suy diễn về nó

Tổng thể đích là tổng thể mà chúng ta muốn

thực hiện các suy diễn về nó

Bất kỳ khi nào một mẫu được sử dụng để suy diễn

một tổng thể, chúng ta nên chắc chắn tổng thể đích

và tổng thể lấy mẫu là gần giống nhau

Bất kỳ khi nào một mẫu được sử dụng để suy diễn

một tổng thể, chúng ta nên chắc chắn tổng thể đích

và tổng thể lấy mẫu là gần giống nhau

Tổng thể lấy mẫu là tổng thể mà từ đó mẫu được lấy

Trang 20

 Quá trình suy diễn thống kê

M ột mẫu ngẫu nhiên

Trang 21

Phân phối mẫu của là phân phối xác suất

của tất cả các giá trị có thể có của trung bình mẫu

Trang 22

Phân Phối M ẫu của x

Chúng ta sẽ sử dụng ký hiệu sau đây để định nghĩa

độ lệch chuẩn của phân phối mẫu của

Trang 23

Phân Phối M ẫu của x

(N n ) / (N  1 )

x

• Độ lệch chuẩn của

Trang 24

Khi tổng thể có phân phối chuẩn, thì phân phối

mẫu của có phân phối chuẩn với mọi

cỡ mẫu

x

Trong các trường hợp mà tổng thể bị lệch nhiều

hay các giá trị bất thường xuất hiện, các mẫu cỡ 50

có lẽ cần thiết

Trong đa số ứng dụng, phân phối mẫu của

có thể được xấp xỉ bằng một phân phối chuẩn

bất cứ khi nào cỡ mẫu từ 30 trở lên

x

Phân Phối M ẫu của x

Trang 25

Phân Phối M ẫu của x

Phân phối mẫu của có thể được sử dụng để cung cấp thông tin xác suất về trung bình mẫu gần như thế nào với trung bình tổng thể 

x

x

Trang 26

Định Lý Giới Hạn Trung Tâm

Khi tổng thể mà từ đó chúng ta chọn ra một mẫungẫu nhiên không có phân phối chuẩn, định lý giớihạn trung tâm là hữu ích trong việc nhận biết hìnhdạng của phân phối mẫu của x

ĐỊN H LÝ GIỚI H ẠN TRUN G TÂM

Khi chọn các mẫu ngẫu nhiên cỡ n từ một

tổng thể, phân phối mẫu của trung bình mẫu có

thể xấp xỉ một phân phối chuẩn khi cỡ mẫu đủ lớn

x

Trang 27

14.6 30

x

 Ví dụ : Đại học St Andrew’s

Phân Phối M ẫu của x

Trang 28

Xác suất mà một mẫu ngẫu nhiên đơn giản gồm 30

ứng viên sẽ cho một ước lượng của điểm SAT trung

bình tổng thể ở trong vòng +/10 so với trung bình

tổng thể thực sự  là bao nhiêu ?

 Ví dụ : Đại học St Andrew’s

Phân Phối M ẫu của x

N ói cách khác, xác suất nằm giữa 1080 và 1100

là bao nhiêu?

x

Trang 29

Bước 1: Tính giá trị z tại điểm trên của khoảng

Trang 30

Xác suất tích lũy đối với Phân Phối Chuẩn chuẩn hóa

z .00 01 02 03 04 05 06 07 08 09

.5 6915 6950 6985 7019 7054 7088 7123 7157 7190 7224 6 7257 7291 7324 7357 7389 7422 7454 7486 7517 7549 7 7580 7611 7642 7673 7704 7734 7764 7794 7823 7852 8 7881 7910 7939 7967 7995 8023 8051 8078 8106 8133 9 8159 8186 8212 8238 8264 8289 8315 8340 8365 8389

Phân Phối M ẫu của x

 Ví dụ : Đại học St Andrew’s

Trang 31

x

Trang 32

Bước 3 : Tính giá trị z tại điểm dưới của khoảng

Bước 4: Tìm diện tích dưới đường cong về bên trái của

Trang 33

Phân Phối M ẫu của đối với các điểm

SAT x

x

1080 1090

Diện tích = 0.2483

Trang 34

Phân Phối M ẫu của đối với các điểm

SAT x

Bước 5: Tính diện tích dưới đường cong giữa các điểm

trên và dưới của khoảng

Trang 35

110010801090

Phân Phối M ẫu của đối với các điểm

SAT x

Diện tích = 0.5034

x

Trang 36

M ối Quan H ệ Giữa Cỡ M ẫu

và Phân Phối M ẫu của x

• Giả sử chúng ta chọn một mẫu ngẫu nhiên đơn giản gồm 100 ứng viên thay vì 30 như ban đầu

E( ) =  bất chấp cỡ mẫu Trong ví dụ của chúng ta,

E( ) vẫn là 1090.

x x

• Bất cứ khi nào cỡ mẫu tăng lên, sai số chuẩn của

trung bình giảm xuống Với mẫu tăng lên thành

n = 100, sai số chuẩn của trung bình giảm xuống

Trang 37

M ối Quan H ệ Giữa Cỡ M ẫu

và Phân Phối M ẫu của x

Trang 38

N hắc lại là khi n = 30, P(1080 < < 1100) = 0.5034.x

M ối Quan H ệ Giữa Cỡ M ẫu

và Phân Phối M ẫu của x

Chúng ta theo các bước giống hệt khi n = 30

để giải tìm P(1080 < < 1100) khi n = 100.x

Giờ đây, với n = 100, P(1080 < < 1100) = 0.7888.x

Vì phân phối mẫu với n = 100 có sai số chuẩn nhỏ hơn nên các giá trị của có ít biến thiên hơn và có khuynh hướng gần với trung bình tổng thể hơn

các giá trị của với n = 30.

x x

 Ví dụ : Đại học St Andrew’s

Trang 39

M ối Quan H ệ Giữa Cỡ M ẫu

và Phân Phối M ẫu của x

x

Diện tích = 0.7888

x

Trang 40

p = ?

 Thực hiện các suy diễn về Tỷ Lệ Tổng Thể

Dữ liệu mẫu Cung cấp một giá trị cho tỷ lệ mẫup

Giá trị của được dùng

Trang 42

p

p N

n

N

p

) 1

( 1

(N n ) / (N  1 )

Trang 43

Dạng Phân Phối M ẫu của p

Phân phối mẫu của có thể xấp xỉ một phân phối chuẩn bất cứ khi nào cỡ mẫu đủ lớn để thỏa mãn

hai điều kiện:

Vì khi các điều kiện này thỏa mãn, phân phối

xác suất của x trong tỷ lệ mẫu, = x/n, có thể xấp xỉ phân phối chuẩn (và vì n là một hằng số).

Phân phối mẫu của có thể xấp xỉ một phân phối chuẩn bất cứ khi nào cỡ mẫu đủ lớn để thỏa mãn

hai điều kiện:

Vì khi các điều kiện này thỏa mãn, phân phối

xác suất của x trong tỷ lệ mẫu, = x/n, có thể xấp xỉ phân phối chuẩn (và vì n là một hằng số).

p

np > 5n(1 – p) > 5

p

Trang 44

N hắc lại là 72% sinh viên tương lai nộp đơn vào đại

H ọc St Andrew’s muốn ở ký túc xá

 Ví dụ : Đại học St Andrew’s

Phân Phối M ẫu của p

Xác suất để một mẫu ngẫu nhiên đơn giản gồm

30 ứng viên sẽ cho một ước lượng của tỷ lệ tổng thểứng viên muốn ở ký túc xá nằm trong vòng cộng

trừ 0.05 so với tỷ lệ tổng thể thực sự là bao nhiêu?

Trang 45

Ví dụ của chúng ta, với n = 30 và p = 0.72,

phân phối chuẩn là một xấp xỉ có thể chấp nhận được vì:

Trang 46

Phân Phối M ẫu của p

 Ví dụ : Đại học St Andrew’s

Trang 47

Bước 1: Tính giá trị z tại điểm trên của khoảng.

Trang 48

Xác suất tích lũy với Phân Phối Chuẩn chuẩn hóa

Phân Phối M ẫu của p

z .00 01 02 03 04 05 06 07 08 09

.5 6915 6950 6985 7019 7054 7088 7123 7157 7190 7224 6 7257 7291 7324 7357 7389 7422 7454 7486 7517 7549 7 7580 7611 7642 7673 7704 7734 7764 7794 7823 7852 8 7881 7910 7939 7967 7995 8023 8051 8078 8106 8133 9 8159 8186 8212 8238 8264 8289 8315 8340 8365 8389

 Ví dụ : Đại học St Andrew’s

Trang 49

0.770.72

Diện tích = 0.7291

p

Phân Phối

M ẫucủa p

Trang 50

Bước 3: Tính giá trị z tại điểm dưới của khoảng.

Bước 4: Tìm diện tích dưới đường cong về bên trái

Trang 51

Diện tích = 0.2709

p

Phân Phối

M ẫucủa p

.082

p

 Phân Phối M ẫu của p

 Ví dụ : Đại học St Andrew’s

Trang 52

P(0.67 < < 0.77) = 0.4582p

Bước 5: Tính diện tích dưới đường cong giữa các điểm

trên và dưới của khoảng

P(-0.61 < z < 0.61) = P(z < 0.61) - P(z < -0.61)

= 0.7291 - 0.2709

= 0.4582Xác suất tỷ lệ mẫu của các ứng viên muốn ở ký túc xá sẽnằm trong vòng +/- 0.05 so với tỷ lệ tổng thể thực sự :

Phân Phối M ẫu của p

 Ví dụ : Đại học St Andrew’s

Trang 53

.77.67 72

Diện tích = 0.4582

p

Phân Phối

M ẫucủa p

.082

p

 Phân Phối M ẫu của p

 Ví dụ : Đại học St Andrew’s

Trang 54

Các Tính Chất của các Ước Lượng Điểm

 Trước khi sử dụng một thống kê mẫu như một tham số ước lượng điểm, các nhà thống kê cần kiểm tra để biết thống kê mẫu có các tính chất sau đây gắn liền với các tham số ước lượng

điểm tốt hay không

• Tính không chệch

• Tính hiệu quả

• Tính vững

Trang 55

Các Tính Chất của các Ước Lượng Điểm

 Không chệch

Nếu giá trị kỳ vọng của thống kê mẫu bằng với tham số tổng thể đang được ước lượng, thống kê mẫu được gọi là một tham số ước lượng không chệch của tham số tổng thể

Trang 56

Các Tính Chất của các Ước Lượng Điểm

 Tính hiệu quả

Giả sử cần lựa chọn hai tham số ước lượng điểm không chệch của cùng tham số tổng thể, chúng ta sẽ thích sử dụng tham số ước lương điểm có độ lệch chuẩn nhỏ hơn, vì

nó có xu hướng cho ra các ước lượng gần với tham số tổng thể hơn

Tham số ước lương điểm có độ lệch chuẩn nhỏ hơn được gọi là có tính hiệu quả tương đối lớn hơn tham số còn lại

Trang 57

Các Tính Chất của các Ước Lượng Điểm

 Tính vững

Một tham số ước lượng điểm là vững nếu các giá trị của ước lượng điểm có xu hướng trở nên gần hơn tham số tổng thể khi cỡ mẫu trở nên lớn hơn

Nói cách khác, cỡ mẫu lớn có xu hướng cho một ước lượng điểm tốt hơn một cỡ mẫu nhỏ

Trang 58

Các Phương Pháp Lấy Mẫu Khác

 Lấy mẫu phân tầng

 Lấy mẫu cụm (cả khối)

 Lấy mẫu hệ thống

 Lấy mẫu thuận tiện

 Lấy mẫu phán đoán

Trang 59

Đầu tiên tổng thể được chia thành các nhóm phần tử gọi là các tầng.

Đầu tiên tổng thể được chia thành các nhóm phần tử gọi là các tầng

Lấy M ẫu N gẫu N hiên Phân Tầng

M ỗi phần tử trong tổng thể thuộc một và chỉ một tầng

Các kết quả tốt nhất đạt được khi các phần tử trong

mỗi tầng tương tự càng nhiều càng tốt

(nghĩa là, phần tử trong cùng nhóm thì thuần nhất)

Các kết quả tốt nhất đạt được khi các phần tử trong

mỗi tầng tương tự càng nhiều càng tốt

(nghĩa là, phần tử trong cùng nhóm thì thuần nhất)

Trang 60

Lấy M ẫu N gẫu N hiên Phân Lớp

M ột mẫu ngẫu nhiên đơn giản được lấy từ mỗi tầng

Các công thức có sẵn kết hợp các kết quả mẫu tầng

thành một ước lượng tham số tổng thể

Các công thức có sẵn kết hợp các kết quả mẫu tầng

thành một ước lượng tham số tổng thể

Thuận lợi : N ếu các tầng thuần nhất, phương pháp này “chính xác ” như lấy mẫu ngẫu nhiên đơn giản nhưng với cỡ mẫu nhỏ hơn

Thuận lợi : N ếu các tầng thuần nhất, phương pháp này “chính xác ” như lấy mẫu ngẫu nhiên đơn giản nhưng

với cỡ mẫu nhỏ hơn

Ví dụ : Cơ sở để thành lập tầng có thể là bộ phận, vị trí,

Ví dụ : Cơ sở để thành lập tầng có thể là bộ phận, vị trí,

Trang 61

M ột mẫu nhiên đơn giản gồm các cụm được lấy.

Tất cả các phần tử nằm trong mỗi cụm được chọn

tạo nên mẫu

Tất cả các phần tử nằm trong mỗi cụm được chọn

tạo nên mẫu

Trang 62

M ẫu Cụm (khối)

Ưu điểm: Các phần tử ờ gần nhau có thể là hiệu quả

về chi phí (nghĩa là, nhiều quan sát trong mẫu có thể

có được trong thời gian ngắn)

Ưu điểm: Các phần tử ờ gần nhau có thể là hiệu quả

về chi phí (nghĩa là, nhiều quan sát trong mẫu có thể

có được trong thời gian ngắn)

N hược điểm: Phương pháp này nói chung yêu cầu cỡ mẫu lớn hơn mẫu ngẫu nhiên đơn giản hay phân tầng

N hược điểm: Phương pháp này nói chung yêu cầu cỡ mẫu lớn hơn mẫu ngẫu nhiên đơn giản hay phân tầng

Ví dụ: M ột ứng dụng cơ bản là lấy mẫu theo vùng,

Trang 63

Lấy M ẫu H ệ Thống

N ếu một mẫu cỡ n được yêu cầu từ một tổng thể chứa

N phần tử, chúng ta có thể lấy mẫu một phần tử cho mỗi n/N phần tử trong tổng thể.

N ếu một mẫu cỡ n được yêu cầu từ một tổng thể chứa

N phần tử, chúng ta có thể lấy mẫu một phần tử cho mỗi n/N phần tử trong tổng thể.

Chúng ta chọn ngẫu nhiên một phần tử trong N /n

phần tử đầu tiên từ danh sách tổng thể

Chúng ta chọn ngẫu nhiên một phần tử trong N /n

phần tử đầu tiên từ danh sách tổng thể

Trang 64

Lấy M ẫu H ệ Thống

Phương pháp này có các tính chất của một mẫu ngẫu nhiên đơn giản, đặc biệt nếu danh sách các phần tử tổng thể là một sự sắp xếp ngẫu nhiên

Phương pháp này có các tính chất của một mẫu ngẫu nhiên đơn giản, đặc biệt nếu danh sách các phần tử tổng thể là một sự sắp xếp ngẫu nhiên

Ưu điểm: M ẫu này thường dễ xác định hơn mẫu sử dụng phương pháp lấy mẫu ngẫu nhiên

Ưu điểm: M ẫu này thường dễ xác định hơn mẫu sử dụng phương pháp lấy mẫu ngẫu nhiên

Ví dụ: Chọn mỗi số điện thoại thứ 100 trong danh

bạ điện thoại sau khi số điện thoại ngẫu nhiên

đầu tiên được chọn

Ví dụ: Chọn mỗi số điện thoại thứ 100 trong danh

bạ điện thoại sau khi số điện thoại ngẫu nhiên

đầu tiên được chọn

Ngày đăng: 03/08/2018, 19:30

TỪ KHÓA LIÊN QUAN

w