Chiều cao của thanh niên ở một địa phương là biến ngẫu nhiên phân phối chuẩn với trung bình 170 cm và độ lệch chuẩn 10cm. Chọn ngẫu nhiên 31 thanh niên ở vùng đó. a) Tìm xác suất để ch[r]
(1)THỐNG KÊ
PHẦN 2
(2)Tổng thể Mẫu
Tổng thể (population) Mẫu (Sample)
(3)Ví dụ tổng thể
Số cử tri đăng ký bầu cử
(4)Tổng thể Mẫu
Ta khơng nghiên cứu tồn phần tử tổng thể vì:
(5)-Chọn mẫu ngẫu nhiên
Mẫu ngẫu nhiên (random sample)
- Mỗi phần tử chọn ngẫu nhiên độc lập
- Mỗi phần tử có khả chọn nhau - Mọi mẫu cỡ n có khả chọn
Phương pháp chọn mẫu đơn giản
- Đánh số
(6)Thống kê mô tả & suy luận
TK mô tả (descriptive statistics) : thu thập, tổng hợp, xử lý liệu để biến đổi liệu thành thông tin
- Thu thập liệu: khảo sát, đo đạc … - Biểu diễn liệu: dùng bảng, đồ thị …
- Tổng hợp liệu: trung bình mẫu, phương sai mẫu,
(7)Thống kê mô tả & suy luận
Suy luận: rút kết luận đưa định tổng thể dựa nghiên cứu mẫu
TK suy luận (inferential statistics): xử lý thơng tin có từ thống kê mơ tả, từ đưa sở để dự đoán, dự báo, ước lượng…
- Ước lượng:…
(8)Mô tả liệu đồ thị
• Bảng • Đồ thị
• Tùy thuộc vào loại biến quan sát
• Hay dùng: biểu đồ đường, tần số, nhánh lá, phân
(9)Phân phối tần số
• Mỗi nhóm có bề rộng nhau
• Tối thiểu khoảng, tối đa 20 (thường từ đến 15)
• Các khoảng khơng trùng nhau
max
X X
h
k
3 2 1 3,322lg
(10)Ví dụ
• Chọn ngẫu nhiên 20 ngày mùa đơng có nhiệt độ (F) cao
ta có:
• Xây dựng phân phối tần số?
24 35 17 21 24
37 26 46 58 30
32 13 12 38 41
(11)Ví dụ
• Sắp xếp liệu:
• Xác định miền liệu: 58-12=46 • Số khoảng cần chia:
• Độ rộng khoảng: • Biên khoảng:
(12)Ví dụ
• Sắp xếp liệu:
12,13,17, 21, 24, 24, 26, 27, 27,30, 32,35,37,38, 41, 43, 44, 46,53,58
Khoảng [10;20) [20;30) [30;40) [40;50) [50;60)
(13)Ví dụ
• Vẽ đồ thị:
• Mục tiêu phân phối tần số:
– Tạo phân phối không lởm chởm, nhiều đỉnh khơng có dạng khối
– Chỉ biến thiên liệu
(14)Hình dạng phân phối
• Đối xứng
(15)Đồ thị Stem and Leaf
• Sắp xếp số liệu tăng dần • Gồm phần:
(16)Đồ thị Stem and Leaf
• Ví dụ 1:
21, 24, 24, 26, 27, 27,30,32,38, 41 Stem Leaves
2
1 4 7
(17)Đồ thị Stem and Leaf
• Ví dụ 2:
613,632,658,717,722, 750,776,827,841,859, 863,891,894,906,928, 933,955,982,1034,1047, 1056,1140,1169,1224 Stem Leaves 10 11 12
1 2
3 6 9 3
(18)Đồ thị phân tán (tham khảo) • Scatter plot
(19)Mơ tả liệu số • Độ đo trung tâm:
– Trung bình – Trung vị – Mode
• Sự biến thiên – Miền giá trị – Miền phân vị – Phương sai
(20)Trung bình
• Trung bình tổng thể:
• Trung bình mẫu:
1
N i
i N
x
x x x
E X
N N
1
n
i
i N
X
X X X
X
n n
(21)Trung vị
• Là giá trị tập liệu tăng dần. • Không bị ảnh hưởng giá trị outliers
• Gọi i vị trí trung vị
• Nếu i chẵn
• Nếu i lẻ
1
n i
i
median X
i i
X X
(22)Mode
• Đo xu hướng trung tâm liệu • Khơng bị ảnh hưởng outliers
• Là giá trị thường xảy nhất
(23)Độ đo tốt nhất
• Trung bình ln dùng outlier khơng tồn tại.
• Trung vị thường dùng khơng bị ảnh hưởng outlier • Vị trí trung vị trung bình ảnh hưởng hình dạng
(24)Độ đo biến thiên
• Cho biết thơng tin phân tán hay
(25)Miền giá trị (range)
• Độ đo biến thiên đơn giản nhất
• Là chênh lệch giá trị lớn
nhỏ nhất
• Miền giá trị=Xmax-Xmin
(26)Miền phân vị
• Có thể loại bỏ outlier cách sử
dụng miền phân vị
• Miền phân vị: (interquatile range) 25% 25% 25% 25%
1
Q Q2 Q3
(27)Đồ thị boxplot
• Biểu diễn miền phân vị điểm outliers
• Cơng thức:
• Q1=0,25(n+1)
(28)Đồ thị boxplot
(29)Phương sai
• Phương sai tổng thể • Phương sai mẫu
(30)Phương sai
• Phương sai tổng thể
• Phương sai mẫu
2 1 N i i x V X N
2
1
1 n 1 n
i i
i i
S X X X X
n n
(31)Phương sai
• Phương sai mẫu hiệu chỉnh:
• Phương sai mẫu: (đã biết trung bình tổng thể )
2 1 1 1 n i i n
S X X S
n n
*2 1 i n i S X n
S*2 X 2 X
(32)Tính thống kê mẫu
• Cho mẫu định lượng cụ thể thu gọn:
• Trung bình mẫu:
1
1 k
i i i
x n x
n
(33)Tính thống kê mẫu
• Phương sai mẫu:
• Phương sai mẫu hiệu chỉnh:
2
2 2
1
1 k 1 k
i i i i
i i
s n x x n x x
n n
2
2 1 1 1 k i i i n
s n x x s
n n
(34)Các thống kê mẫu_cụ thể
• Độ lệch chuẩn mẫu:
• Độ lệch chuẩn mẫu hiệu chỉnh:
2
s s
(35)Tỷ lệ mẫu_tổng quát
• Xét tổng thể định tính, dấu hiệu nghiên cứu tính
chất A, tỉ lệ tổng thể p
• Lấy mẫu ngẫu nhiên kích thước n: (X1, , Xn)
• Tỉ lệ mẫu tổng quát:
• Xi biến ngẫu nhiên có phân phối A(p)
• Tỷ lệ mẫu = trung bình n biến ngẫu nhiên n
X X X
k
F X
n n
(36)Tỷ lệ mẫu_cụ thể
• Xét tổng thể định tính, dấu hiệu nghiên cứu tính chất
A, tỉ lệ tổng thể p
• Lấy mẫu cụ thể kích thước n: (x1, x2 , , xn)
• Tỉ lệ mẫu cụ thể:
• k: số phần tử mẫu có tính chất A. • n: cỡ mẫu
1 n
x x x
k f
n n
(37)Tính thống kê mẫu
Điều tra thời gian sử dụng internet tuần 90 sinh viên trường ta bảng số liệu sau:
Hãy tính thống kê mẫu sau:
a) Trung bình mẫu, phương sai mẫu, phương sai mẫu hiệu chỉnh?
b) Tỷ lệ sinh viên mẫu có thời gian sử dụng Thời gian (giờ)
(38)Cách 1_Lập bảng
xi ni xini (xi)2n i … … … … … … … … Tổng i n
x ni i
2 i i x n i i x n x n 2 2 i i x n
s x
s2 n s
i
(39)Cách 1_Lập bảng
xi ni xini (xi)2n i
3 21 63
4 32 128
5 17 85 425
6 24 144 864 20 140 980 14 112 896
(40)Cách 1_Lập bảng
• Cỡ mẫu:
• Trung bình mẫu:
• Phương sai mẫu:
• Phương sai mẫu hiệu chỉnh:
90
i
n n
534 5,9333 90 i i x n x n 2 2 2,0844
x ni i
s x
n
2 n 2,1078
s s
(41)Cách dùng máy tính 570ES
1 Shift + + + = + =: Reset máy
2 Shift + Mode + + + 1: bật tần số
3 Mode + + 1: vào tính thống kê biến Khi ta có bảng sau:
X FREQ
(42)Cách dùng máy tính 570ES • Ta nhập vào sau:
• Nhấn AC để thốt.
X FREQ
1
2
3 17
4 24
5 20
(43)Cách 2_dùng máy tính 570ES
6 Lấy số liệu thống kê: Shift + + 5. Ta có bảng sau:
Tương ứng:
1: cỡ mẫu 2: trung bình mẫu
3 Độ lệch chuẩn mẫu.
4 Độ lệch chuẩn mẫu hiệu chỉnh.
1: n 2:
3: x 4: sx
x
(44)Đối với FX 500MS 570MS
1 Reset máy: Shift + Mode + + = + = Vào hệ SD:
• Máy 500MS: Mode + 2
• Máy 570MS: Mode + Mode + 1
3 Nhập liệu: “Giá trịShift , Tần sốM+”
• 3Shift , 7M+
• Nhập đến hết Nhấn AC
4 Lấy số liệu:
(45)Ví dụ 1
Đường kính (mm) 100 chi tiết máy sản xuất kết cho bảng sau:
a) Tính thống kê mẫu? b) Tính tỷ lệ chi tiết từ
20mm trở lên mẫu?
Đường kính Số chi tiết
(46)Ví dụ 1
•Ta viết lại mẫu:
•Từ mẫu ta có: •Cỡ mẫu: n=100
•Trung bình mẫu: x=20,0015 •
xi 19,825 19.875 19.925 19.975 20.025
ni 16 28 23
20.075 20.125 20.175
(47)Định lí Giới hạn trung tâm (CLT)
1 Cho X1, X2, …, Xn n đại lượng ngẫu nhiên độc lập
tồn phần
2 Nếu: thì:
Với n đủ lớn
Trong thống kê ta coi n>30 đủ lớn
i ; i E X V X
2 n ~ ,
X X X
X N
n n
(48)Phân phối Khi bình phương
• Bnn X gọi có phân phối Khi bình
phương với n bậc tự hàm mật độ có dạng:
• Ký hiệu:
2 1 , 0 2 2
0 , 0
n x
n x e x
n f x x ~
(49)Phân phối Khi bình phương
• Nếu X~χ2(n)
• Đồ thị:
; ar 2
(50)Đồ thị hàm mật độ
4
n
5
(51)Đồ thị hàm mật độ Khi BP
(52)Đồ thị hàm mật độ
• Khi n=30, vẽ đoạn từ đến 53
(trong khoảng độ lệch chuẩn)
30 2 60 7 74
,
E X n
(53)Tính chất X~2(n)
2
1 2
2
1 2
) ~ ; ~
~
Nếu và độc lập thì:
X
a X n X n
X n n
2
) ~ 0,1
2
Nếu thì F
n
X n
b X n N
n
(54)(55)Quan hệ với pp N(0,1)
• Cho n biến ngẫu nhiên độc lập có
phân phối N(0,1).
• Khi đó:
2
1
~
n
i i
X n
~ 0,1
i
(56)Quan hệ với pp N(0,1)
• Cho n biến ngẫu nhiên độc lập có
cùng phân phối chuẩn.
• Khi đó:
2 ~ n i i X n
~ ,
i
(57)Quan hệ với pp N(0,1)
• Cho n biến ngẫu nhiên độc lập có
cùng phân phối chuẩn.
• Khi đó:
2 ~ 1 n i X X n 2 ~ , 1 i n X N
X X X X
n
(58)Phân phối Student t(n)
• Kí hiệu: X ~ t(n)
• Bnn X gọi có phân phối Student với
n bậc tự hàm mật độ có dạng:
1
(59)Quan hệ với Chuẩn Khi BP
• Cho X, Y hai biến ngẫu nhiên độc
lập.
• Khi đó:
~ 0,1 ; ~
X N Y n
~
X X n
T t n
Y Y
(60)(61)(62)(63)Tính chất ~
) 0 1 ;
) 2
2
) 0,1
Nếu thì:
F n
T t n
a E T n
n
b V T n
n
c T N
(64)Dị bảng xác suất Khi BP
• Ký hiệu:
• Là giá trị cho:
n
, với ~
P Z n Z n
n
Đưa dạng
Lấy giao hàng
cột tương ứng
(65)Dò bảng xác suất Student
• Ký hiệu:
• Là giá trị cho:
t n
, với ~
P Z t n Z t n
(66)Ví dụ
• Cho
• Tìm xác suất sau:
2 20
Z
) 0,95
) 8,2604 ?
) 10,8508 31,4104 ?
a P Z a
b P Z
c P X
(67)Ví dụ
• Cho
• Tìm xác suất sau:
15
Z T
) 0,025
) 2,4899 ?
) 2,0343 2,9467 ?
a P Z a
b P Z
c P X
(68)Ví dụ 2
• Cho
• Tìm xác suất sau:
48
Z T
) 2,7045 ?
) 1,7232 2,2990 ?
) 0,025
a P Z
b P X
d P Z b
(69)Phân phối Fisher - Snedecor
• Ta định nghĩa thơng qua phân phối Khi
bình phương.
• Xét hai biến ngẫu nhiên độc lập.
• Đặt:
2
~ ; ~
X n Y m
/ /
X n mX
F
Y m nY
(70)Phân phối Fisher - Snedecor
• Khi ta nói F có phân phối Fisher –
Snedecor với (n,m) bậc tự
2 , 2 0 1 2 2 n n n m n m n x
f x x
n m m
(71)Đồ thị hàm mật độ
• Gần giống
(72)(73)Đồ thị hàm mật độ
, mF 1,0
n
F n m N
(74)Tính chất
• Cho X~F(n,m) thì:
2 , 2 2 2 2 , 4 2 4 m
E X m
m
m n m
V X m
n m m
, mF 1,0
n
F n m N
(75)Tổng thể Mẫu TQ Mẫu cụ thể
Kích thước N n n
Trung bình Phương sai Độ lệch chuẩn
Tỷ lệ A
Tổng thể mẫu
E X
2 V X
V X
p P A
X
S ; ;S2 S*
; ; *
S S S
F
x
s ; ;s2 s*
*
; ;
(76)Các tham số tổng thể Trung bình cộng tổng thể:
Phương sai tổng thể:
(77)Các tham số tổng thể
• Xét tổng thể định tính, dấu hiệu A. • Tỉ lệ tổng thể:
• N: kích thước tổng thể.
• M: số phần tử tổng thể có dấu hiệu A.
M p
N
(78)Ví dụ
• Tổng thể nghiên cứu là xí nghiệp có 40 cơng nhân
với dấu hiệu nghiên cứu suất lao động (sản phẩm/ đơn vị thời gian)
• Tính trung bình, phương sai tổng thể
• Tính tỉ lệ cơng nhân có suất cao 65sp.
(79)Nhắc lại thống kê mẫu
• Thống kê mẫu: hàm bnn thành phần
mẫu
• Cho mẫu ngẫu nhiên: W=(X1;X2;…Xn), thống kê mẫu
có dạng:
• T=f(X1;X2;…;Xn) • Thống kê T bnn.
• Các thống kê mẫu khảo sát: trung bình, phương sai, tỷ
(80)Định lí Giới hạn trung tâm (CLT)
1 Cho n biến ngẫu nhiên độc lập Cùng kỳ vọng, phương sai
3 Số lượng biến ngẫu nhiên đủ lớn (>30)
4 Trung bình n biến ngẫu nhiên có phân phối
xấp xỉ phân phối chuẩn
(81)PHÂN PHỐI MẪU
• Trung bình mẫu • Tỷ lệ mẫu
(82)Tính chất trung bình mẫu
• Cho tổng thể có kì vọng phương sai 2
• Lấy mẫu ngẫu nhiên cỡ n.
• Gọi trung bình mẫu Ta có:
2
) )
i E X
ii V X
n
(83)Phân phối trung bình mẫu
Tổng thể Trung bình mẫu Kích thước mẫu
Tùy ý
Không chuẩn n>30 Không chuẩn
nhưng đối xứng
Có thể với n nhỏ
~ ;
X N X ~ N ;
(84)Chuẩn hóa ppxs
Tổng thể TB mẫu Chuẩn hóa Chuẩn,
đã biết
n>30, biết
n>30, chưa biết
Chuẩn, n<30 chưa biết
2 ~ ; X N n ; X N n ; X N n ~ 0;1 X n
Z N
~ X n
Z t n
S ~ 0;1 X n
Z N
2
~ ;
(85)Ví dụ 1
• Giả sử bạn lấy mẫu 100 giá trị từ tổng
(86)Ví dụ 2
Một mẫu kích thước n rút từ tổng thể phân phối chuẩn với trung bình μ độ lệch chuẩn 10 Hãy xác định n cho:
) 10 10 0,9544
) 2 2 0,9544
a P X
(87)Ví dụ 3
Trọng lượng loại sản phẩm biến ngẫu nhiên phân phối chuẩn với trung bình 20,5 độ lệch chuẩn
(88)Tính chất PS mẫu
• Cho tổng thể có kì vọng phương sai 2
• Lấy mẫu ngẫu nhiên cỡ n. • Ta có:
(89)Phân phối phương sai mẫu
Tổng thể Phương sai mẫu Kích thước mẫu
Phân phối
chuẩn Không biết Tùy ý
Không
(90)Phân phối hàm PS mẫu
Tổng thể PS mẫu Hàm PS mẫu Chuẩn,
đã biết
Không chuẩn biết
Chuẩn chưa biết
Không chuẩn
S*
*2 2 ~ n i i X nS Z Z n
2, 30
S n
2 2 ~ n i i
n S X X
Z Z n S
(91)Ví dụ
• Chiều dài loại sản phẩm bnn pp
chuẩn với trung bình 20 m độ lệch chuẩn 0,2 m Lấy mẫu ngẫu nhiên 25 sp.
a) Cho biết ppxs trung bình mẫu Tính kỳ vọng phương sai nó.
b) Xs để trung bình mẫu tối thiểu 30,06m
(92)• Giả sử X suất lúa vùng A có pp
chuẩn với phương sai (tạ/ha)2
Lấy mẫu ngẫu nhiên kích thước 100 Tính xác suất để:
100 2
1
270
i i
P X X
(93)Tính chất tỷ lệ mẫu
• Cho tổng thể có tỷ lệ p tính chất A. • Lấy mẫu ngẫu nhiên cỡ n.
• Gọi F tỷ lệ mẫu Ta có:
)
) 1
i E F p
ii V F p p n
(94)Phân phối tỷ lệ mẫu
Tổng thể Tỷ lệ mẫu Kích thước mẫu
Phân phối
B(1,p) F N p ; p1n p n>30
~ 0,1 (1 )
F p n
Z N
p p
(95)Ví dụ
• Tỷ lệ người hút thuốc vùng
(96)Câu hỏi ơn tập
1 Mẫu ngẫu nhiên kích thước n dấu hiệu nghiên cứu X dãy gồm n biến ngẫu nhiên X1, X2,…,Xn độc lập có phân bố với X?
2 Trung bình mẫu tổng thể có dấu hiệu nghiên cứu có phân phối chuẩn có phân phối chuẩn?
(97)Bài 3
Chiều cao niên địa phương biến ngẫu nhiên phân phối chuẩn với trung bình 170 cm độ lệch chuẩn 10cm Chọn ngẫu nhiên 31 niên vùng a) Tìm xác suất để chiều cao trung bình số niên nói không vượt 172 cm?