Trong tình huoáng naøy thì toång theå chính laø nhöõng ngöôøi bò nhieãm HIV, nhöng ta khoâng theå xaùc ñònh chính xaùc taát caû nhöõng ngöôøi bò nhieãm HIV vì chæ coù nhöõng ngöôøi töï n[r]
(1)1
PHẦN 2: THỐNG KÊ
Bản 2019 có số điều chỉnh choTHỐNG NHẤTvới sách THỐNG KÊ ỨNG DỤNG TRONG KINH TẾ VAØ KINH DOANH Tác giả ANDERSON & SWEENEY & WILLIAMS Nhà xuất HỒNG ĐỨC 2016.
Khoa Toán-Thống kê, trường đại học Kinh tế TP.HCM biên dịch.
2
CHƯƠNG 5: LÝ THUYẾT MẪU
3
1 MẪU VÀ PHƯƠNG PHÁP MẪU
Giả sử ta cần nghiên cứu tập hợp có nhiều phần tử, số lý mà ta khảo sát toàn
bộ tập lớnnày (khảo sát tất phần tử), ta
lại muốn có kết tập lớn Ta giải quyết sau: từ tập hợp lớn lấy tập hợp nhỏ để nghiên cứu, ta thu kết tập nhỏ, từ kết tập nhỏ ta suy kết cho tập lớn Phương pháp làm việc gọi phương pháp mẫu Tập lớn gọi tổng thể hay đám đông, số phần tử tập lớn gọi kích thước tổng thể/đám đơng, ký hiệu N. Tập nhỏ gọi mẫu, số phần tử mẫu gọi kích
thước mẫuhay cỡ mẫu, ký hiệu n. 4
Một số lý khơng thể nghiên cứu tồn tổng thể: Giới hạn thời gian, tài chính…
Thí dụ muốn khảo sát xem chiều cao trung bình niên Việt Nam có tăng lên so với trước khơng, ta phải đo chiều cao tồn niên Việt nam (giả sử xấp xỉ N= 40 triệu người), điều làm rõ ràng tốn nhiều thời gian, tiền bạc, công sức…
(2)Một số lý khơng thể nghiên cứu tồn tổng thể:
Phá vỡ tổng thể nghiên cứu
Thí dụ ta cất vào kho N= 10000 hộp sản phẩm, muốn biết tỷ lệ hộp hư kho sau thời gian bảo quản Ta phải kiểm tra hộp để xác định số hộp hư M= 300, tỷ lệ hộp hư kho M/N
Một sản phẩm sau kiểm tra bị phẩm chất, ta kiểm tra xong kho “tiêu” ln cái kho!
Ta lấy ngẫu nhiên n= 100 hộp kiểm tra, giả sử có m= hộp hư Từ tỷ lệ hộp hư 9% ta suy tỷ lệ
hộp hư kho 5 6
Một số lý khơng thể nghiên cứu tồn tổng thể:
Khơng xác định xác tổng thể
Thí dụ muốn khảo sát xem tỷ lệ người bị nhiễm HIV qua đường tiêm chích ma túy bao nhiêu phần trăm Trong tình tổng thể những người bị nhiễm HIV, ta xác định xác tất người bị nhiễm HIV chỉ có người tự nguyện đến trung tâm xét nghiệm, bệnh viện biết được, cịn người khơng xét nghiệm khơng biết
Do ta biết phần tổng thể, những người xét nghiệm Ngoài số người bị nhiễm HIV bị chết HIV thay đổi giây nên số phần tử tổng thể thay đổi giây.
7 Muốn từ kết mẫu suy kết cho tổng thể tốt
mẫu phải đại diện cho tổng thể, muốn mẫu phải được lấy cách ngẫu nhiên Trong phạm vi giảng này không đề cập đến kỹ thuật lấy mẫu (mẫu giản đơn, mẫu hệ thống, mẫu chùm, mẫu phân tổ, mẫu nhiều cấp …)
Có cách lấy mẫu thông dụng:
C1: Lấy ngẫu nhiên n phần tử: phân phối siêu bội C2: Lấy n phần tử
C3: Lấy có hồn lại n phần tử: phân phối nhị thức * Về mặt xác suất: c1 = c2
* Khi n << N c1 xấp xỉ c3
Ta quy ước mẫu lấy theo cách có hồn lại.
Mẫu gồm có: mẫu ngẫu nhiên mẫu cụ thể Cần phân biệt
rõ mẫu ngẫu nhiên mẫu cụ thể 8
Tổng thể đặc trưng dấu hiệu nghiên cứu X, là
một đại lượng ngẫu nhiên Do nói X tức là nói tổng thể
Mẫu ngẫu nhiên (có cỡ mẫu n) ký hiệu WX=(X1,…,Xn) véctơ có n thành phần,mỗi thành phần Xilà ĐLNN Các ĐLNN độc lập và có quy luật phân phối giống với X.
Mẫu cụ thể(có cỡ mẫu n) ký hiệu Wx= (x1,…,xn)
một véctơ có n thành phần, mỗi thành phần xilà giá trị(con số) cụ thể.
Ứng với mẫu ngẫu nhiên có nhiều mẫu cụ thể
(3)9 VD1: Một kệ chứa 100 đĩa nhạc với sau:
Giá (ngàn đ) 20 25 30 34 40 Số đĩa 35 10 25 17 13 Xét tổng thể mặt định lượng:
Laáy ngẫu nhiên đóa nhạc kệ Gọi X= giá đóa nhạc Ta thấy X có quy luật ppxs sau:
X 20 25 30 34 40
P 0,35 0,10 0,25 0,17 0,13 10
VD1: (Xét tổng thể mặt định lượng) Lấy ngẫu nhiên (có hồn lại) đĩa nhạc từ kệ
Gọi Xi= giá đĩa nhạc thứ i lấy được, i= 1,4
Ta thấy Xi độc lập có quy luật ppxs
giống X
Lập WX= (X1,X2,X3,X4), gọi mẫu ngẫu nhiên
VD1: (Xét tổng thể mặt định lượng)
Bây ta xem giá cụ thể đĩa lấy ra, thấy
như sau:
Đóa 1: giá 20 ngàn đ Đóa 2: giá 30 ngàn đ Đóa 3: giá 20 ngàn đ Đóa 4: giá 40 ngàn đ
Lập Wx= (x1,x2,x3,x4) = (20,30,20,40), gọi mẫu
cụ thể
11 12
VD1: Bây ta xét tổng thể mặt định tính: Đĩa có giá 25 ngàn đ đĩa “dỏm” Lấy ngẫu nhiên đĩa từ kệ Gọi X= số đĩa dỏm lấy
X 1 P 0,65 0,35
Lấy ngẫu nhiên (có hồn lại) đĩa nhạc từ kệ Gọi Xi= số đĩa dỏm lấy lấy đĩa lần lấy thứ i, i= 1,4
(4)VD1: (xét tổng thể mặt định tính)
Bây ta xem giá cụ thể đĩa lấy ra, thấy
nhö sau:
Đóa 1: giá 20 ngàn đ x1= Đóa 2: giá 30 ngàn đ x1= Đóa 3: giá 20 ngàn đ x1= Đóa 4: giá 40 ngàn đ x1=
Lập Wx= (x1,x2,x3,x4) = (1,0,1,0), gọi mẫu cụ
thể
13 14
II Các đặc trưng số tổng thể mẫu: Ta xét tổng thể mặt định lượng:Tổng thể đặc
trưng dấu hiệu nghiên cứu X, X ĐLNN
Ta có E(X)=µ trung bình tổng thể Var(X)=2 là phương sai tổng thể, độ lệch chuẩn tổng thể. Ta xét tổng thể mặt định tính: tổng thể có kích
thước N, có M phần tử có tính chất A quan
tâm Ta có p= M/N gọi tỷ lệ tổng thể.
Tương tự, ta có trung bình mẫu , phương sai
mẫu (đã hiệu chỉnh) s2, tỷ lệ mẫu f. x
15 Các đặc trưng số mẫu (dạng ngẫu nhiên):
Định lượng:
Trung bình mẫu:
i X n X 1
Phương sai mẫu (chưa hiệu chỉnh): Sˆ2 1 (X X)2
i
n
Phương sai mẫu (đã hiệu chỉnh): S2 1 (X X)2
i
n - 1
Độ lệch chuẩn mẫu (chưa hiệu chỉnh): S ˆ Sˆ2
Độ lệch chuẩn mẫu (đã hiệu chỉnh): S S2
Ta coù:
1 ˆ
n n S S
Sai số chuẩn mẫu (đã hiệu chỉnh): S
n 16
Các đặc trưng số mẫu (dạng ngẫu nhiên):
Định tính:
Tỷ lệ mẫu: F =
n
i i
X n 1
1
Với Xi có quy luật phân phối xác suất (không-một):
(5)17
Các đặc trưng số mẫu (dạng cụ thể): Định lượng:
Trung bình mẫu:
i x n x 1
Phương sai mẫu (chưa hiệu chỉnh): ˆ21 ( x)2
i x n s
Phương sai mẫu (đã hiệu chỉnh): ( )2 1
1
2
x
i x n s
Độ lệch chuẩn mẫu (chưa hiệu chỉnh): sˆ sˆ2
Độ lệch chuẩn mẫu (đã hiệu chỉnh): s s2
Ta coù:
1 ˆ
nn s s
Sai số chuẩn mẫu (đã hiệu chỉnh): s
n 18
Caùc đặc trưng số mẫu (dạng cụ thể):
Định tính:
Tỷ lệ maãu: f =
n i i
x n 1
1
Với xi có giá trị là Trong thực hành ta xác định tỷ lệ mẫu:
f = m/n
Với: n: cỡ mẫu
m: số phần tử có tính chất A quan tâm mẫu
19
Trong thực hành: Xác định trung bình mẫu, phương sai mẫu (đã hiệu chỉnh) sau:
xi ni x1 n1
xi ni
xk nk
n=n1+ +nk
1
x n xi i n
; 2 1 2 ( )2 1
s n x n x
i i n
Mẫu dạng điểm
* xi giá trị thu thập
được
* ni số lần xuất
hiện xi mẫu
20
VD2: Điều tra suất lúa diện tích 100
hecta trồng lúa vùng, ta thu bảng số liệu sau:
Năng suất (tạ / ha) 41 44 45 46 48 52 54 Số có suất
tương ứng 10 20 30 15 10 10 1) Tính trung bình mẫu, phương sai mẫu hiệu chỉnh,
độ lệch chuẩn mẫu hiệu chỉnh
2) Những ruộng có suất từ 48 tạ trở lên ruộng có suất cao Tính tỷ lệ ruộng có suất cao
(6)21 Giải:
1) Ta lập bảng sau
xi ni nixi nixi2
41 44 45 46 48 52 54 10 20 30 15 10 10 410 880 1350 690 480 520 270 16.810 38.720 60.750 31.740 23.040 27.040 14.580
Toång n = 100 4600 212680 22
Lưu ý: Máy tính Casio fx-570VN Plus có chức tính trung bình mẫu, độ lệch chuẩn mẫu (hiệu chỉnh) Xem file hướng dẫn trang web Phạm Trí Cao
Trung bình mẫu suất:
1 4600
46 100
n xi i n
x taï/ha
Phương sai mẫu (đã h/chỉnh) suất:
2 1 ( )2
1 i i
s n x n x
n 909 , 10 46 * 100 212680 1001
2
s
Độ lệch chuẩn mẫu (đã hiệu chỉnh):
2 10,909 3,303
s s
23
2) Tỷ lệ mẫu f = 0,25 10010 5
10
3) Lập bảng sau
xi ni ni.xi ni.xi2
48 10 480 23040 52 10 520 27040 54 5 270 14580
Toång n = 25 1270 64660
8 , 50 25 1270 x
s2 = [64660 25*(50,8)2] 6
1
251 24
VD3: Quan sát tuổi thọ số người ta có
bảng số liệu sau :
Tuổi (năm) Số người 20 – 30
30 – 40 40 – 50 50 – 60
5 14 25 6
1) Tính trung bình mẫu x, phương sai maãu s2
2) Những người sống 40 tuổi "chết trẻ" Tìm tỷ lệ người chết trẻ
(7)25
Giaûi:
Đưa dạng điểm, lập bảng tính VD2 xi ni
25 35 45 55
5 14 25 6
1) n= 50 ; x = 41,40 ; s2= 68,4082 2) Tỷ lệ mẫu f = (5+14)/ 50 = 0,38
VD4:
Khảo sát 500.000 người nước, người ta thấy có
75000 người có biểu tâm thần
Tìm tỷ lệ mẫu người có biểu tâm thần? Giải:
Tỷ lệ mẫu f = 75000 / 500000 = 0,15 VD5:
Lơ hàng có nhiều sản phẩm, sản phẩm đóng
vào hộp Mỗi hộp có 10 sản phẩm
Lấy 20 hộp từ lơ hàng thấy có 60 sản phẩm loại A Tìm tỷ lệ mẫu sản phẩm loại A?
Giải:
Tỷ lệ mẫu f= 60/ 20*10 = 60/ 200
26
VD6:
Máy tự động sản xuất sản phẩm, 10 sản phẩm
đóng thành hộp Lấy ngẫu nhiên 100 hộp để kiểm tra, ta có bảng số liệu sau:
Xác định tỷ lệ mẫu sản phẩm loại A? Giải:
Tỷ lệ mẫu f = (1/1000).{7(5)+8(25)+9(30+10(40)}
= 0,905
27
Số sp loại A hộp 7 8 9 10
Số hộp 25 30 40
VD 7: Bảng số liệu chiều cao số người sau:
a) Những người có chiều cao khoảng từ 1,7m đến 1,8m
những người có chiều cao mê ly Xác định tỷ lệ người mê ly?
b) Những người có chiều cao từ 1,5m trở xuống người mi nhon Xác định tỷ lệ người mi nhon?
c) Những người có chiều cao từ 1,5m đến 1,8m người có chiều cao lý tưởng Xác định tỷ lệ người cao lý tưởng? Giải:
a) Tỷ lệ mẫu f= 60/200 b) f= 30/200
c) f= 130/200
28 Chieàu cao (m) 1,3-1,5 1,5-1,7 1,7-1,8 1,8-2,0