THỐNG KÊ ỨNG DỤNGTRONG KINH TẾ VÀ KINH DOANHTHỐNG KÊ ỨNG DỤNGTRONG KINH TẾ VÀ KINH DOANHTHỐNG KÊ ỨNG DỤNGTRONG KINH TẾ VÀ KINH DOANHTHỐNG KÊ ỨNG DỤNGTRONG KINH TẾ VÀ KINH DOANHTHỐNG KÊ ỨNG DỤNGTRONG KINH TẾ VÀ KINH DOANHTHỐNG KÊ ỨNG DỤNGTRONG KINH TẾ VÀ KINH DOANHTHỐNG KÊ ỨNG DỤNGTRONG KINH TẾ VÀ KINH DOANHTHỐNG KÊ ỨNG DỤNGTRONG KINH TẾ VÀ KINH DOANH
Trang 2Chương 7 Lấy mẫu và Phân phối Mẫu
x
Phân phối mẫu
của
Giới thiệu phân phối mẫu
Ước lượng điểm
Chọn một mẫu
Các phương pháp lấy mẫu khác
p
Phân phối mẫu của
Các tính chất của ước lượng điểm
Trang 3M ột mẫu là một tập con của tổng thể.
M ột phần tử là thực thể trên đó dữ liệu được thu thập
Trang 4Các kết quả mẫu chỉ cung cấp các ước lượng về các giá trị của các đặc điểm tổng thể.
Các kết quả mẫu chỉ cung cấp các ước lượng về các giá trị của các đặc điểm tổng thể
Với các phương pháp lấy mẫu thích hợp, các kết quả mẫu có thể cung cấp các ước lượng “tốt” các đặc điểm
Với các phương pháp lấy mẫu thích hợp, các kết quả mẫu có thể cung cấp các ước lượng “tốt” các đặc điểm
Lý do chúng ta chọn một mẫu là thu thập dữ liệu để
trả lời một câu hỏi nghiên cứu về một tổng thể
Lý do chúng ta chọn một mẫu là thu thập dữ liệu để
trả lời một câu hỏi nghiên cứu về một tổng thể
Trang 5Chọn mẫu
Lấy mẫu từ một tổng thể hữu hạn
Lấy mẫu từ một tổng thể vô hạn
Trang 6Lấy mẫu từ một tổng thể hữu hạn
Tổng thể hữu hạn thường được định nghĩa
được lựa chọn
Trang 7 Trong các dự án lấy mẫu lớn, các số ngẫu nhiên do
máy tính tạo ra thường được sử dụng để tự động hóa quá trình chọn mẫu
Lấy mẫu không hoàn lại là thủ tục thường được sử dụng
Trả lại mỗi phần tử đã được lấy mẫu trước khi lựa chọn các phần tử sau được gọi là lấy mẫu có hoàn lại
Lấy mẫu từ một tổng thể hữu hạn
Trang 8Đại học St Andrew’s đã nhận 900 đơn xin vào học
năm tới từ các sinh viên tương lai Các ứng viên đã được đánh số, từ 1 đến 900, khi đơn của họ nộp vào Trưởng ban tuyển sinh
muốn chọn một mẫu ngẫu nhiên đơn giản gồm 30 ứng viên
Ví dụ : Đại học St Andrew’s
Lấy mẫu từ một tổng thể hữu hạn
Trang 9Các số ngẫu nhiên được tạo bởi hàm ngẫu nhiên của Excel theo phân phối xác suất
đều giữa 0 and 1
Các số ngẫu nhiên được tạo bởi hàm ngẫu nhiên của Excel theo phân phối xác suất
đều giữa 0 and 1
Bước 1: Gắn một số ngẫu nhiên cho mỗi ứng viên trong 900 ứng viên nói trên
Bước 2: Chọn 30 ứng viên tương ứng với 30 số
ngẫu nhiên nhỏ nhất
Lấy mẫu từ một tổng thể hữu hạn
Ví dụ : Đại học St Andrew’s
Trang 10Lấy mẫu từ một tổng thể vô hạn
Kết quả, chúng ta không thể xây dựng một dàn chọn mẫu cho tổng thể
Đôi khi chúng ta muốn chọn một mẫu, nhưng nhận
thấy không thể có được một danh sách gồm tất cả các
Trang 11 Tổng thể thường được tạo ra bằng một quá
trình xảy ra hiện thời ở đó không có giới hạn trên đối với số lượng đơn vị có thể được tạo ra
Lấy mẫu từ một tổng thể vô hạn
Vài ví dụ về quá trình xảy ra hiện thời, với các tổng thể
vô hạn, là :
• các bộ phận đang được sản xuất trên một dây chuyền sản xuất
• các giao dịch đang xảy ra tại một ngân hàng
• các cuộc gọi điện thoại đang đến ở một tổ hỗ trợ
kỹ thuật
• các khách hàng đang đi vào một cửa hàng
Trang 12Lấy mẫu từ một tổng thể vô hạn
M ột mẫu ngẫu nhiên từ một tổng thể vô hạn là một mẫu được chọn sao cho các điều kiện sau đây thỏa mãn
• M ỗi phần tử được chọn đến từ tổng thể quan tâm
• M ỗi phần tử được chọn một cách độc lập
trong trường hợp một tổng thể vô hạn, chúng ta phải
chọn một mẫu ngẫu nhiên để thực hiện các suy diễn
thống kê có căn cứ về tổng thể từ mẫu được lấy
Trang 13s là ước lượng điểm của độ lệch chuẩn tổng thể .
s là ước lượng điểm của độ lệch chuẩn tổng thể .
Trong ước lượng điểm chúng ta sử dụng dữ liệu từ mẫu
để tính toán giá trị của một thống kê mẫu, rồi dùng nó như một ước lượng của tham số tổng thể
Trong ước lượng điểm chúng ta sử dụng dữ liệu từ mẫu
để tính toán giá trị của một thống kê mẫu, rồi dùng nó như một ước lượng của tham số tổng thể
Ước lượng điểm
Chúng ta xem như ước lượng điểm của trung bình
Trang 14N hắc lại là Đại học St Andrew’s đã nhận
900 đơn của các sinh viên tương lai M ẫu đơn chứa nhiều thông
tin bao gồm điểm kiểm tra năng lực học tập (SAT)
và có hay không mong muốn ở ký túc xá
Ví dụ : Đại học St Andrew’s
Ước lượng điểm
Tại một cuộc họp trong vài giờ, Trưởng ban tuyển
sinh muốn công bố điểm SAT trung bình và tỷ
lệ ứng
Trang 15Ước lượng điểm
30 ứng viên được chọn bằng cách sử dụng các số ngẫu nhiên do máy tính tạo ra
Trang 16 là Ước Lượng Điểm của x
là Ước Lượng Điểm
Ước lượng điểm
Lưu ý: Các số ngẫu nhiên khác sẽ nhận dạng một mẫukhác mà sẽ dẫn đến các ước lượng điểm khác
s là Ước Lượng Điểm của
Trang 171090 900
số tổng thể quan tâm được tính toán
Ước lượng điểm
Trang 18Tham sốTổng thể Tham sốGiá trị Ước lượng điểmTham số Ước lượngĐiểm
= Điểm SAT trung
Trang 19Lời khuyên thực hành
Tổng thể đích là tổng thể mà chúng ta muốn
thực hiện các suy diễn về nó
Tổng thể đích là tổng thể mà chúng ta muốn
thực hiện các suy diễn về nó
Bất kỳ khi nào một mẫu được sử dụng để suy diễn
một tổng thể, chúng ta nên chắc chắn tổng thể đích
và tổng thể lấy mẫu là gần giống nhau
Bất kỳ khi nào một mẫu được sử dụng để suy diễn
một tổng thể, chúng ta nên chắc chắn tổng thể đích
và tổng thể lấy mẫu là gần giống nhau
Tổng thể lấy mẫu là tổng thể mà từ đó mẫu được lấy
Trang 20 Quá trình suy diễn thống kê
M ột mẫu ngẫu nhiên
Trang 21Phân phối mẫu của là phân phối xác suất
của tất cả các giá trị có thể có của trung bình mẫu
Trang 22Phân Phối M ẫu của x
Chúng ta sẽ sử dụng ký hiệu sau đây để định nghĩa
độ lệch chuẩn của phân phối mẫu của
Trang 23Phân Phối M ẫu của x
(N n ) / (N 1 )
x
• Độ lệch chuẩn của
Trang 24Khi tổng thể có phân phối chuẩn, thì phân phối
mẫu của có phân phối chuẩn với mọi
cỡ mẫu
x
Trong các trường hợp mà tổng thể bị lệch nhiều
hay các giá trị bất thường xuất hiện, các mẫu cỡ 50
có lẽ cần thiết
Trong đa số ứng dụng, phân phối mẫu của
có thể được xấp xỉ bằng một phân phối chuẩn
bất cứ khi nào cỡ mẫu từ 30 trở lên
x
Phân Phối M ẫu của x
Trang 25Phân Phối M ẫu của x
Phân phối mẫu của có thể được sử dụng để cung cấp thông tin xác suất về trung bình mẫu gần như thế nào với trung bình tổng thể
x
x
Trang 26Định Lý Giới Hạn Trung Tâm
Khi tổng thể mà từ đó chúng ta chọn ra một mẫungẫu nhiên không có phân phối chuẩn, định lý giớihạn trung tâm là hữu ích trong việc nhận biết hìnhdạng của phân phối mẫu của x
ĐỊN H LÝ GIỚI H ẠN TRUN G TÂM
Khi chọn các mẫu ngẫu nhiên cỡ n từ một
tổng thể, phân phối mẫu của trung bình mẫu có
thể xấp xỉ một phân phối chuẩn khi cỡ mẫu đủ lớn
x
Trang 2714.6 30
x
Ví dụ : Đại học St Andrew’s
Phân Phối M ẫu của x
Trang 28Xác suất mà một mẫu ngẫu nhiên đơn giản gồm 30
ứng viên sẽ cho một ước lượng của điểm SAT trung
bình tổng thể ở trong vòng +/10 so với trung bình
tổng thể thực sự là bao nhiêu ?
Ví dụ : Đại học St Andrew’s
Phân Phối M ẫu của x
N ói cách khác, xác suất nằm giữa 1080 và 1100
là bao nhiêu?
x
Trang 29Bước 1: Tính giá trị z tại điểm trên của khoảng
Trang 30Xác suất tích lũy đối với Phân Phối Chuẩn chuẩn hóa
z .00 01 02 03 04 05 06 07 08 09
.5 6915 6950 6985 7019 7054 7088 7123 7157 7190 7224 6 7257 7291 7324 7357 7389 7422 7454 7486 7517 7549 7 7580 7611 7642 7673 7704 7734 7764 7794 7823 7852 8 7881 7910 7939 7967 7995 8023 8051 8078 8106 8133 9 8159 8186 8212 8238 8264 8289 8315 8340 8365 8389
Phân Phối M ẫu của x
Ví dụ : Đại học St Andrew’s
Trang 31x
Trang 32Bước 3 : Tính giá trị z tại điểm dưới của khoảng
Bước 4: Tìm diện tích dưới đường cong về bên trái của
Trang 33Phân Phối M ẫu của đối với các điểm
SAT x
x
1080 1090
Diện tích = 0.2483
Trang 34Phân Phối M ẫu của đối với các điểm
SAT x
Bước 5: Tính diện tích dưới đường cong giữa các điểm
trên và dưới của khoảng
Trang 35110010801090
Phân Phối M ẫu của đối với các điểm
SAT x
Diện tích = 0.5034
x
Trang 36M ối Quan H ệ Giữa Cỡ M ẫu
và Phân Phối M ẫu của x
• Giả sử chúng ta chọn một mẫu ngẫu nhiên đơn giản gồm 100 ứng viên thay vì 30 như ban đầu
• E( ) = bất chấp cỡ mẫu Trong ví dụ của chúng ta,
E( ) vẫn là 1090.
x x
• Bất cứ khi nào cỡ mẫu tăng lên, sai số chuẩn của
trung bình giảm xuống Với mẫu tăng lên thành
n = 100, sai số chuẩn của trung bình giảm xuống
Trang 37M ối Quan H ệ Giữa Cỡ M ẫu
và Phân Phối M ẫu của x
Trang 38• N hắc lại là khi n = 30, P(1080 < < 1100) = 0.5034.x
M ối Quan H ệ Giữa Cỡ M ẫu
và Phân Phối M ẫu của x
• Chúng ta theo các bước giống hệt khi n = 30
để giải tìm P(1080 < < 1100) khi n = 100.x
• Giờ đây, với n = 100, P(1080 < < 1100) = 0.7888.x
• Vì phân phối mẫu với n = 100 có sai số chuẩn nhỏ hơn nên các giá trị của có ít biến thiên hơn và có khuynh hướng gần với trung bình tổng thể hơn
các giá trị của với n = 30.
x x
Ví dụ : Đại học St Andrew’s
Trang 39M ối Quan H ệ Giữa Cỡ M ẫu
và Phân Phối M ẫu của x
x
Diện tích = 0.7888
x
Trang 40p = ?
Thực hiện các suy diễn về Tỷ Lệ Tổng Thể
Dữ liệu mẫu Cung cấp một giá trị cho tỷ lệ mẫup
Giá trị của được dùng
Trang 42p
p N
n
N
p
) 1
( 1
(N n ) / (N 1 )
Trang 43Dạng Phân Phối M ẫu của p
Phân phối mẫu của có thể xấp xỉ một phân phối chuẩn bất cứ khi nào cỡ mẫu đủ lớn để thỏa mãn
hai điều kiện:
Vì khi các điều kiện này thỏa mãn, phân phối
xác suất của x trong tỷ lệ mẫu, = x/n, có thể xấp xỉ phân phối chuẩn (và vì n là một hằng số).
Phân phối mẫu của có thể xấp xỉ một phân phối chuẩn bất cứ khi nào cỡ mẫu đủ lớn để thỏa mãn
hai điều kiện:
Vì khi các điều kiện này thỏa mãn, phân phối
xác suất của x trong tỷ lệ mẫu, = x/n, có thể xấp xỉ phân phối chuẩn (và vì n là một hằng số).
p
np > 5 và n(1 – p) > 5
p
Trang 44N hắc lại là 72% sinh viên tương lai nộp đơn vào đại
H ọc St Andrew’s muốn ở ký túc xá
Ví dụ : Đại học St Andrew’s
Phân Phối M ẫu của p
Xác suất để một mẫu ngẫu nhiên đơn giản gồm
30 ứng viên sẽ cho một ước lượng của tỷ lệ tổng thểứng viên muốn ở ký túc xá nằm trong vòng cộng
trừ 0.05 so với tỷ lệ tổng thể thực sự là bao nhiêu?
Trang 45Ví dụ của chúng ta, với n = 30 và p = 0.72,
phân phối chuẩn là một xấp xỉ có thể chấp nhận được vì:
Trang 46Phân Phối M ẫu của p
Ví dụ : Đại học St Andrew’s
Trang 47Bước 1: Tính giá trị z tại điểm trên của khoảng.
Trang 48Xác suất tích lũy với Phân Phối Chuẩn chuẩn hóa
Phân Phối M ẫu của p
z .00 01 02 03 04 05 06 07 08 09
.5 6915 6950 6985 7019 7054 7088 7123 7157 7190 7224 6 7257 7291 7324 7357 7389 7422 7454 7486 7517 7549 7 7580 7611 7642 7673 7704 7734 7764 7794 7823 7852 8 7881 7910 7939 7967 7995 8023 8051 8078 8106 8133 9 8159 8186 8212 8238 8264 8289 8315 8340 8365 8389
Ví dụ : Đại học St Andrew’s
Trang 490.770.72
Diện tích = 0.7291
p
Phân Phối
M ẫucủa p
Trang 50Bước 3: Tính giá trị z tại điểm dưới của khoảng.
Bước 4: Tìm diện tích dưới đường cong về bên trái
Trang 51Diện tích = 0.2709
p
Phân Phối
M ẫucủa p
.082
p
Phân Phối M ẫu của p
Ví dụ : Đại học St Andrew’s
Trang 52P(0.67 < < 0.77) = 0.4582p
Bước 5: Tính diện tích dưới đường cong giữa các điểm
trên và dưới của khoảng
P(-0.61 < z < 0.61) = P(z < 0.61) - P(z < -0.61)
= 0.7291 - 0.2709
= 0.4582Xác suất tỷ lệ mẫu của các ứng viên muốn ở ký túc xá sẽnằm trong vòng +/- 0.05 so với tỷ lệ tổng thể thực sự :
Phân Phối M ẫu của p
Ví dụ : Đại học St Andrew’s
Trang 53.77.67 72
Diện tích = 0.4582
p
Phân Phối
M ẫucủa p
.082
p
Phân Phối M ẫu của p
Ví dụ : Đại học St Andrew’s
Trang 54Các Tính Chất của các Ước Lượng Điểm
Trước khi sử dụng một thống kê mẫu như một tham số ước lượng điểm, các nhà thống kê cần kiểm tra để biết thống kê mẫu có các tính chất sau đây gắn liền với các tham số ước lượng
điểm tốt hay không
• Tính không chệch
• Tính hiệu quả
• Tính vững
Trang 55Các Tính Chất của các Ước Lượng Điểm
Không chệch
Nếu giá trị kỳ vọng của thống kê mẫu bằng với tham số tổng thể đang được ước lượng, thống kê mẫu được gọi là một tham số ước lượng không chệch của tham số tổng thể
Trang 56Các Tính Chất của các Ước Lượng Điểm
Tính hiệu quả
Giả sử cần lựa chọn hai tham số ước lượng điểm không chệch của cùng tham số tổng thể, chúng ta sẽ thích sử dụng tham số ước lương điểm có độ lệch chuẩn nhỏ hơn, vì
nó có xu hướng cho ra các ước lượng gần với tham số tổng thể hơn
Tham số ước lương điểm có độ lệch chuẩn nhỏ hơn được gọi là có tính hiệu quả tương đối lớn hơn tham số còn lại
Trang 57Các Tính Chất của các Ước Lượng Điểm
Tính vững
Một tham số ước lượng điểm là vững nếu các giá trị của ước lượng điểm có xu hướng trở nên gần hơn tham số tổng thể khi cỡ mẫu trở nên lớn hơn
Nói cách khác, cỡ mẫu lớn có xu hướng cho một ước lượng điểm tốt hơn một cỡ mẫu nhỏ
Trang 58Các Phương Pháp Lấy Mẫu Khác
Lấy mẫu phân tầng
Lấy mẫu cụm (cả khối)
Lấy mẫu hệ thống
Lấy mẫu thuận tiện
Lấy mẫu phán đoán
Trang 59Đầu tiên tổng thể được chia thành các nhóm phần tử gọi là các tầng.
Đầu tiên tổng thể được chia thành các nhóm phần tử gọi là các tầng
Lấy M ẫu N gẫu N hiên Phân Tầng
M ỗi phần tử trong tổng thể thuộc một và chỉ một tầng
Các kết quả tốt nhất đạt được khi các phần tử trong
mỗi tầng tương tự càng nhiều càng tốt
(nghĩa là, phần tử trong cùng nhóm thì thuần nhất)
Các kết quả tốt nhất đạt được khi các phần tử trong
mỗi tầng tương tự càng nhiều càng tốt
(nghĩa là, phần tử trong cùng nhóm thì thuần nhất)
Trang 60Lấy M ẫu N gẫu N hiên Phân Lớp
M ột mẫu ngẫu nhiên đơn giản được lấy từ mỗi tầng
Các công thức có sẵn kết hợp các kết quả mẫu tầng
thành một ước lượng tham số tổng thể
Các công thức có sẵn kết hợp các kết quả mẫu tầng
thành một ước lượng tham số tổng thể
Thuận lợi : N ếu các tầng thuần nhất, phương pháp này “chính xác ” như lấy mẫu ngẫu nhiên đơn giản nhưng với cỡ mẫu nhỏ hơn
Thuận lợi : N ếu các tầng thuần nhất, phương pháp này “chính xác ” như lấy mẫu ngẫu nhiên đơn giản nhưng
với cỡ mẫu nhỏ hơn
Ví dụ : Cơ sở để thành lập tầng có thể là bộ phận, vị trí,
Ví dụ : Cơ sở để thành lập tầng có thể là bộ phận, vị trí,
Trang 61M ột mẫu nhiên đơn giản gồm các cụm được lấy.
Tất cả các phần tử nằm trong mỗi cụm được chọn
tạo nên mẫu
Tất cả các phần tử nằm trong mỗi cụm được chọn
tạo nên mẫu
Trang 62M ẫu Cụm (khối)
Ưu điểm: Các phần tử ờ gần nhau có thể là hiệu quả
về chi phí (nghĩa là, nhiều quan sát trong mẫu có thể
có được trong thời gian ngắn)
Ưu điểm: Các phần tử ờ gần nhau có thể là hiệu quả
về chi phí (nghĩa là, nhiều quan sát trong mẫu có thể
có được trong thời gian ngắn)
N hược điểm: Phương pháp này nói chung yêu cầu cỡ mẫu lớn hơn mẫu ngẫu nhiên đơn giản hay phân tầng
N hược điểm: Phương pháp này nói chung yêu cầu cỡ mẫu lớn hơn mẫu ngẫu nhiên đơn giản hay phân tầng
Ví dụ: M ột ứng dụng cơ bản là lấy mẫu theo vùng,
Trang 63Lấy M ẫu H ệ Thống
N ếu một mẫu cỡ n được yêu cầu từ một tổng thể chứa
N phần tử, chúng ta có thể lấy mẫu một phần tử cho mỗi n/N phần tử trong tổng thể.
N ếu một mẫu cỡ n được yêu cầu từ một tổng thể chứa
N phần tử, chúng ta có thể lấy mẫu một phần tử cho mỗi n/N phần tử trong tổng thể.
Chúng ta chọn ngẫu nhiên một phần tử trong N /n
phần tử đầu tiên từ danh sách tổng thể
Chúng ta chọn ngẫu nhiên một phần tử trong N /n
phần tử đầu tiên từ danh sách tổng thể
Trang 64Lấy M ẫu H ệ Thống
Phương pháp này có các tính chất của một mẫu ngẫu nhiên đơn giản, đặc biệt nếu danh sách các phần tử tổng thể là một sự sắp xếp ngẫu nhiên
Phương pháp này có các tính chất của một mẫu ngẫu nhiên đơn giản, đặc biệt nếu danh sách các phần tử tổng thể là một sự sắp xếp ngẫu nhiên
Ưu điểm: M ẫu này thường dễ xác định hơn mẫu sử dụng phương pháp lấy mẫu ngẫu nhiên
Ưu điểm: M ẫu này thường dễ xác định hơn mẫu sử dụng phương pháp lấy mẫu ngẫu nhiên
Ví dụ: Chọn mỗi số điện thoại thứ 100 trong danh
bạ điện thoại sau khi số điện thoại ngẫu nhiên
đầu tiên được chọn
Ví dụ: Chọn mỗi số điện thoại thứ 100 trong danh
bạ điện thoại sau khi số điện thoại ngẫu nhiên
đầu tiên được chọn