[r]
(1)1
Nguyên lý th
ố
ng kê KT
Ch
ươ
ng 4
Th
ố
ng kê m
ứ
c
đ
ộ
hi
ệ
n t
ượ
ng KT-XH
Hồ NgọcNinh
Dept of Quantitative Analysis
2
N
ộ
i dung ch
ươ
ng
• Chỉtiêu sốtuyệtđối • Chỉtiêu sốtươngđối
• Các chỉtiêu thểhiện xu hướng hội tụ – Trung bình, trung vị, mốt
• Chỉtiêu thểhiệnđộphân tán - Tứphân vị
-Đolường sựbiếnđộng
+ Khoảng cách, khoảng cách phần tư, phương sai vàđộlệch chuẩn, hệsốbiếnđộng
- Hệsốtương quan
3
4.1 S
ố
tuy
ệ
t
đ
ố
i
• Khái niệm • Đơn vịtính
• Một sốvấn đềchú ý với sốtuyệt đối
• Sốtuyệt đối thống kê tốn học • Sốtuyệt đối vềmặt thời gian
• Sốtuyệt đối vềmặt chất lượng
4
Ư
u đi
ể
m, nh
ượ
c đi
ể
m?
5
4.2 S
ố
t
ươ
ng
đ
ố
i
• Khái ni
ệ
m
• So sánh s
ố
tuy
ệ
t đ
ố
i
• Khơng ph
ụ
thu
ộ
c vào giá tr
ị
c
ủ
a t
ử
s
ố
và
m
ẫ
u s
ố
• S
ố
t
ươ
ng đ
ố
i có g
ố
c so sánh
• Nguyên t
ắ
c s
ử
d
ụ
ng s
ố
t
ươ
ng đ
ố
i
6
(2)7
Các lo
ạ
i s
ố
t
ươ
ng
đ
ố
i
• K
ế
ho
ạ
ch
•
Đ
ộ
ng thái
• K
ế
t c
ấ
u
• So sánh
• C
ườ
ng đ
ộ
8
4.3 Các giá tr
ị
th
ể
hi
ệ
n xu h
ướ
ng h
ộ
i t
ụ
Xuhướng hội tụ
Trung bình Trung vị Mốt
1
1
n i i
N i i
X X
n X N
9
4.3.1 Trung bình
• Các giá trịtrung bình
– Trung bình mẫu
– Trung bình tổng thể
1
n i
i n
X
X
X
X
X
n
n
1
N i
i N
X
X
X
X
N
N
Sample Size
Population Size
10
Trung bình
• Được sửdụng nhiều đểthểhiện xu hướng hội tụ
• Bị ảnh hưởng giá trịđầu mút (outliers)
(tiếp)
0 10 0 10 12 14
Mean = 5 Mean = 6
11
Các lo
ạ
i s
ố
bình qn
• Sốbình qn sốhọc - Giảnđơn - Gia quyền • Sốbình qnđiều hịa • Sốtrung bình nhân
12
4.3.2 Trung v
ị
(Median)
• Thểhiển giá trịtrung tâm
• Khơng bị ảnh hưởng giá trịđầu mút
• Khi sốliệuđược xếp theo trật tự, giá trị ởvịtrí
– Nếu n or N lẻ, trung vịlà giá trịcủa số ởchính
– Nếu n or N chẵn, trung vịlà trung bình cộng số ởchính
0 10 0 10 12 14
(3)13
Cách xác
đ
ị
nh trung v
ị
• Tài liệu phân tổcó khoảng cách tổ
Me: Trung vị
xe: Giới hạn đầu tổ chứa trung vị he: Khoảng cách tổ chứa trung vị fe: Tần số tổ chứa trung vị
f: Tổng tần số
Se-1: Tng cỏc tn số tổ đứng tổ chứa trung vị e
e e e e
f S f h x M
1
2
14
Vớ dụ: cú tài liệu phõn tổtheo mức lượng 380 cụng nhõn nhưsau
Mức lương (ngàn đồng)
Số người
500 - 600
35
600 - 700
70
700 - 800
95
800 - 900
100
900 - 1.000
60
1.000 - 1.100
20
Tæng céng
380
Me =789,5
15
4.3.3 M
ố
t (Mode)
• Cũng giá trịđoxu hướng hội tụ
• Là giá trịxuất nhiều (f max) • Khơng bị ảnh hưởng giá trịtrung tâm • Sửdụng cảcho tài liệu chất lượng sốlượng • Có thểkhơng, có một, vài giá trịmốt
0 10 11 12 13 14
Mode = 9
0 6
No Mode
16
Các xác
đ
ị
nh M
ố
t
• Tài liệu phân tổcó khoảng cách tổkhơngđều
• Mo: Mốt
• xo: Giới hạn tổchứa mốt • ho: Khoảng cách tổchứa mốt • 1 = (fo - fo-1) (do - do-1) • 2 = (fo - fo+1) (do - do+1) • fo Tần sốcủa tổchứa Mốt
• fo-1 Tần sốcủa tổđứng trước tổchứa Mốt • fo+1 Tần sốcủa tổđứng sau tổchứa Mốt
2
1
o oo
x
h
M
17
4.3.4 T
ứ
phân v
ị
(Qi)
• Chia sốliệu thành phần
• Vịtrí Qi
• khơng phải giá trịtrung tâm • = Me, Là giá trịtrung tâm
25% 25% 25% 25%
Q1
Q2
Q3Data in Ordered Array: 11 12 13 16 16 17 18 21 22
1
1 12 13
Position of 2.5 12.5
4
Q Q
1
Q Q3
2
Q
1
4
i
i n
Q
18
4.4
Đo
l
ườ
ng s
ự
bi
ế
n
đ
ộ
ng
(Đo đ
ộ
phân tán)
Sự biến động/phân tánP.Sai Độ lệch chuẩn Hệ số biến
động PS
tổng thể
PS mẫu
ĐLC Tổng thể
(4)19
S
ự
c
ầ
n thi
ế
t
củ
a
đo đ
ô
̣
phân tán
T
ầ
n
sô
́
XA
B
Nếu tính Mo, Me,TB phân phối A B cho KQ
20
Tạ
i sao
phả
i
sử dụ
ng
độ
phân tán?
+
Để
th
ẩ
m
đị
nh
độ
tin c
ậ
y
củ
a các
số đo
xu
h
ướ
ng h
ộ
i
tụ
(M
ố
t, Trung
vị
, TB)
+ Nh
ậ
n bi
ế
t
đượ
c
đặ
c
trưng
riêng
củ
a t
ừ
ng
phân ph
ố
i
để
có h
ướ
ng
giả
i quy
ế
t phù h
ợ
p
+ Giúp l
ự
a
chọ
n phân ph
ố
i m
ẫ
u, t
ổ
ng
thể
t
ố
t
hơn
(tránh nh
ữ
ng phân
phối
có
độ
phân
tán r
ộ
ng)
21
4.4.1 Kho
ả
ng bi
ế
n thiên (Range)
• Đolường sựbiếnđộng
• Là khoảng cách quan sát lớn quan sát nhỏnhất:
• Bỏqua sựphân bốcủa lượng biến bên
Largest Smallest
Range
X
X
7 10 11 12
Range = 12 - = 5
7 10 11 12
Range = 12 - = 5
22
4.4.2
Đ
ộ
l
ệ
ch tuy
ệ
t
đ
ố
i trung bình
• Khái niệm • Ưu, nhược điểm
x
i-
x
x
i-
x
f
i
d = - hay
d = -
n
f
i23
22 N
i i
X N
• Là giá trịquan trọng đo lường sựbiến động • Biểu sựbiến động xung quanh giá trịTB
– Phương sai mẫu:
– Phương sai tổng thể:
22
1
ni i
X
X
S
n
4.4.3 Ph
ươ
ng sai (Variance)
24
4.4.4 Đ
ộ
l
ệ
ch chu
ẩ
n (Standard Deviation)
• Là chỉtiêu quan trọng “nhất” đo lường sựbiến động • Biểu sựbiến động xung quanh giá trịTB • Có đơn vịgiống đơn vịgốc
–Độlệch chuẩn mẫu:
–Độlệch chuẩn tổng thể:
21
n i i
X X
S
n
21 N
i i
X N
(5)25
So sánh
đ
ộ
l
ệ
ch chu
ẩ
n
Mean = 15.5
s = 3.338
11 12 13 14 15 16 17 18 19 20 21
11 12 13 14 15 16 17 18 19 20 21
Data B Data A
Mean = 15.5
s = 0.9258
11 12 13 14 15 16 17 18 19 20 21
Mean = 15.5
s = 4.57 Data C
26
4.4.5 H
ệ
s
ố
bi
ế
n
đ
ộ
ng tiêu th
ứ
c
• Đolường sựthayđổi tươngđối • Ln cóđơn vịlà phần trăm(%) • Biểu sựbiếnđộng “so với” sốTB • Thường dùng so sánh sựphân bốcủa hai hay
nhiều data cóđơn vịtính khác •
100%
S
CV
X
27
So sánh h
ệ
s
ố
bi
ế
n
đ
ộ
ng
• Cổphiếu A:
–Giá bán bq năm trước = $50 –Độlệch chuẩn = $5
• Cổphiếu B:
–Giá bán bq năm trước = $100 –Độlệch chuẩn = $5
• Hệsốbiến động tiêu thức:
– Cổphiếu A: – Cổphiếu B:
$5
100% 100% 10% $50
S CV
X
$5
100% 100% 5%
$100 S
CV X
28
Câu
hỏ
i
thả
o lu
ậ
n
=>
Tạ
i nhà phân tích tài chính
lạ
i
quan tâm t
ớ
i
đ
ơ
̣
phân tán thu nh
ậ
p
củ
a
các
cơ
s
ở sả
n xu
ấ
t?
=>
Tạ
i nhà
quả
n lý ch
ấ
t l
ượ
ng
sả
n ph
ẩ
m
lạ
i quan tâm t
ớ
i
đ
ô
̣
phân tán
củ
a các
đặ
c
trưng củ
a
sả
n ph
ẩ
m?
29
D
ạ
ng phân ph
ố
i
• Mơ tảsựphân bốcủa sốliệu • Đặc trưng phân phối
–Đối xứng or độnghiêng
Mean = Median =Mode
Mean < Median < Mode Mode < Median < Mean Lệch phải Lệch trái Đối xứng
30
Hê
̣
sơ
́
khơng
đ
ơ
́
i x
ứ
ng
• Khái niệm: • Cơng thức tính:
+ Nếu KA < phân phối lệch trái + Nếu KA >0 thì phân phối lệch phải
+ KA càng lớn thì phân phối càng không đối xứng
(6)31
H
ệ
s
ố
đo đ
ộ
d
ố
c c
ủ
a phân ph
ố
i (kurtosis)
4
)
(
n
X
Xi
A
- A =
Đ
ườ
ng phân ph
ố
i có đ
ộ
d
ố
c g
ầ
n
gi
ố
ng phân ph
ố
i chu
ẩ
n
- A>3
Đ
ườ
ng phân ph
ố
i có đ
ộ
d
ố
c cao
h
ơ
n phân ph
ố
i chu
ẩ
n
- A<3
Đ
ườ
ng phân ph
ố
i có đ
ộ
d
ố
c th
ấ
p
h
ơ
n phân ph
ố
i chu
ẩ
n
32
Đô
nghiêng c
ủ
a m
ộ
t t
ổ
ng th
ể
(Skewness)
3