Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 17 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
17
Dung lượng
1,57 MB
Nội dung
Applied Statistics
Một số
CƠ SỞ THỐNG KÊ
Beer expert Training
Một số cơ sở thống kê
1
Beer expert Training
Một số cơ sở thống kê
2
1
Tình huống
Phomat của ngoại nhập và của Việt Nam: Chất lượng và thị hiếu
?
Phương pháp:
1. Lấy mẫu
2. Đo đạc
3. Thu thập kết quả *
4. Phân tích và biểu diễn kết quả
*
Thí nghiệm cảm quan
Beer expert Training
Một số cơ sở thống kê
Một số cơ sở thống kê
3
1
Applied Statistics
1-1. Mẫu và Tập hợp
Một tập hợp: bao gồm các biến đo lường mà
người điều tra quan tâm.
Một mẫu: là tập hợp con được lấy ra từ tập
hợp.
Điều tra dân số?
Beer expert Training
Một số cơ sở thống kê
4
Mẫu ngẫu nhiên đơn giản
Sampling lấy ra từ tập hợp một cách ngẫu nhiên, và
các mẫu có kích thước n bằng nhau có khả năng
lựa chọn như nhau.
Một mẫu được lựa chọn theo cách này gọi là mẫu
ngẫu nhiên đơn giản hoặc gọi là mẫu ngẫu nhiên.
nhiên.
Một mẫu ngâu nhiên tuân theo xác suất xác định các
yếu tố của mẫu đó.
Beer expert Training
Một số cơ sở thống kê
5
Mẫu và tập hợp
Tập hợp (N)
Beer expert Training
Một số cơ sở thống kê
Mẫu (n)
Một số cơ sở thống kê
6
2
Applied Statistics
Vì sao phải lấy mẫu ?
Một cuộc điều tra dân số có thể::
• Kh
Không
ông thể
• Phi thực
thực tế
• Qu
Quá
á tốn kém
Beer expert Training
Một số cơ sở thống kê
7
Kích thước mẫu ?
Vừa đủ ?:
• Sai sót mà nhà nghiên cứu chấp nhận, cụ thể là sai sót loại I và II;
• Về xác suất sai sót, thông thường một nghiên cứu chấp nhận sai sót loại I khoảng
1% hay 5% (tức a = 0.01 hay 0.05), và xác suất sai sót loại II khoảng b = 0.1 đến
b = 0.2 (tức power phải từ 0.8 đến 0.9).
• Độ dao động (variability) của đo lường, mà cụ thể là độ lệch chuẩn
Độ dao động chính là độ lệch chuẩn (standard deviation) của đo lường mà công
trình nghiên cứu dựa vào để phân tích. Chẳng hạn như nếu nghiên cứu về tính chất
sản phẩm, thì nhà nghiên cứu cần phải có độ lệch chuẩn của cường độ các chỉ tiêu.
Chúng ta tạm gọi độ dao động là s.
• Mức độ khác biệt hay ảnh hưởng mà nhà nghiên cứu muốn phát hiện.
Độ ảnh hưởng, nếu là công trình nghiên cứu so sánh hai nhóm, là độ khác biệt
trung bình giữa hai nhóm mà nhà nghiên cứu muốn phát hiện. Chẳng hạn như nhà
nghiên cứu có thể giả thiết rằng sản phẩm khi qua xử lý nhiệt có cường độ mùi
giảm 10% so với sản phẩm placebo. Ở đây, 10% được xem là độ ảnh hưởng.
Chúng ta tạm gọi độ ảnh hưởng là D.
Beer expert Training
Một số cơ sở thống kê
8
Kích thước mẫu ?
Một nghiên cứu có thể có một nhóm đối tượng hay hai (và có khi hơn 2)
nhóm đối tượng.
Trong trường hợp một nhóm đối tượng, số lượng đối tượng (n) cần thiết
cho nghiên cứu có thể tính toán một cách “thủ công” như sau [1]:
n
C
/
2
Trong trường hợp có hai nhóm đối tượng, số lượng đối tượng (n) cần thiết
cho nghiên cứu có thể tính toán như sau: [2]
n 2
Beer expert Training
Một số cơ sở thống kê
C
/
2
Một số cơ sở thống kê
9
3
Applied Statistics
Kích thước mẫu ?
• Bảng số « C magique »....
a=
b = 0.20
(Power =
0.80)
b = 0.10
(Power =
0.90)
b = 0.05
(Power =
0.95)
0.10
6.15
8.53
10.79
0.05
7.85
10.51
13.00
0.01
13.33
16.74
19.84
Beer expert Training
Một số cơ sở thống kê
10
Kích thước mẫu ?
Ước tính cỡ mẫu cho một giá trị trung bình
Chúng ta muốn ước tính chiều cao ở đàn ông người Việt, và chấp nhận sai số trong vòng
1 cm (D= 1) với khoảng tin cậy 0.95 (tức a=0.05) và power = 0.8 (hay b = 0.2).
Các nghiên cứu trước cho biết độ lệch chuẩn chiều cao ở người Việt khoảng 4.6 cm.
Chúng ta có thể áp dụng công thức [1] để ước tính cỡ mẫu cần thiết cho nghiên cứu:
n
C
/
2
7.85
1/ 4.6
2
166
Nếu D = 0.5cm, n= 664; nếu D=0.1cm thì n= 16610
Kích thước mẫu phụ thuộc rất lớn vào sai số chấp nhận !
Beer expert Training
Một số cơ sở thống kê
11
Kích thước mẫu ?
Ước tính cỡ mẫu cho hai giá trị trung bình:
Trong thực tế, rất nhiều nghiên cứu nhằm so sánh hai nhóm với nhau. Cách ước tính cỡ
mẫu cho các nghiên cứu này chủ yếu dựa vào công thức [2]
Ví dụ: một nhà sản xuất muốn thay đổi phương pháp thanh trùng sản phẩm
bia nhằm nâng cao năng suất của nhà máy, có hai nhóm sản phẩm cần so
sánh, sản phẩm với phương pháp thanh trùng mới và sản phẩm với phương
pháp thanh trùng cũ. Nhà sản xuất không muốn thị hiếu của sản phẩm giảm.
Một trong những tiêu chí để đánh giá hiệu quả của phương pháp là mức độ ưa
thích của người tiêu dùng đối với mùi của sản phẩm. Số liệu thực nghiệm
trước đó cho thấy mức độ ưa thích trung bình của sản phẩm là 8.5, với độ lệch
chuẩn là 1.2. Vấn đề đặt ra là chúng ta phải nghiên cứu trên bao nhiêu đối
tượng để chứng minh rằng, khi thay đổi phương pháp thanh trùng, thị hiếu đối
với sản phẩm mới tăng khoảng 5% so với sản phẩm cũ.
Beer expert Training
Một số cơ sở thống kê
Một số cơ sở thống kê
12
4
Applied Statistics
Kích thước mẫu ?
• Trong ví dụ trên, tạm gọi trị số trung bình của sp nhóm 2 là m2 và
nhóm 1 là m1, chúng ta có: m1 = 8*1.05 = 8.4 (tức tăng 5% so với
nhóm 1), và do đó, D = 8.4 – 8.0 = 0.4. Độ lệch chuẩn là s = 1.2.
Với power = 0.90 và a = 0.05, cỡ mẫu cần thiết là:
n
2C
2 *10.51
/ 2 0.4 / 1.2 2
Beer expert Training
Một số cơ sở thống kê
189
13
Tình huống
Phomat của ngoại nhập và của Việt Nam: Chất lượng và thị hiếu
?
Phương pháp:
1. Lấy mẫu
2. Đo đạc
3. Thu thập kết quả *
4. Phân tích và biểu diễn kết quả
*
Thí nghiệm cảm quan
Beer expert Training
Một số cơ sở thống kê
14
Một số khái niệm quan trọng : Số liệu - Biến –Thang đo
Định tínhtính- Tần sốsố- Định danh:
danh:
Ví dụ:
• Màu sắc
• Gi
Giới
ới tính
• Qu
Quốc
ốc gia
Beer expert Training
Một số cơ sở thống kê
Định lượng – Đo lường hoặc
đếm được:
Ví dụ
• Nhi
Nhiệt
ệt độ
• Độ ẩm
• Th
Thành
ành phần hóa học
• Điểm ưa thích trên
thang 100 điểm
Một số cơ sở thống kê
15
5
Applied Statistics
THÔNG TIN CHUNG
1.1 Mô tả người trả lời phỏng vấn
1.1.1
Giới tính của người được phỏng vấn?
vấn?1
1. Nam
Tình trạng hôn nhân:
nhân:
1. Độc thân
2. Nữ
2. Có gia đình
1.1.2
Tuổi của người được phỏng vấn?
Dưới 25 tuổi
25 – 30 tuổi
31 – 54 tuổi
>55 tuổi
1.1.3 Xin Ông/Bà cho biết nghề nghiệp hiện nay ?
Học sinh, sinh viên
Bác sĩ/giáo viên
Công nhân/ lao động làm thuê/bán hàng
Hưu trí
1.1.4 Ông/Bà cho biết thu nhập của gia đình Ông/Bà ở mức nào sau đây
1 . Thấp ( 2 triệu đồng và < 5 triệu)
2 . Trung bình (
( 5 triệu và 3 lần/tuần
1 – 2 lần/tuần
1-3 lần/tháng
1.2.6. Xin Ông/Bà cho biết lượng phó mát bán cứng sử dụng trong tuần
của Ông/Bà
< 100g
100 – 300g
> 300g
Beer expert Training
Một số cơ sở thống kê
23
1.2.7. Theo Ông/Bà phó mát cứng ăn với sản phẩm nào?
Bánh mì
Bánh sandwich
Salad
Bánh biscuit
Rượu vang
Khác (ghi
(ghi rõ tên)………………………………
tên)………………………………
1.2.8. Khi chọn mua sản phẩm phó mát cứng, Ông/Bà cho biết mức độ quan tâm đối với
những yếu tố sau đây (1=rất không quan tâm, 2=không quan tâm, 3=không ý kiến,
4=quan tâm, 5=rất quan tâm)
Giá cả
1
2
3
4
5
Tính chất cảm quan của sản phẩm 1
2
3
4
5
Mức độ quen thuộc
1
2
3
4
5
Thuận lợi khi sử dụng
1
2
3
4
5
Có lợi cho sức khoẻ
1
2
3
4
5
Khối lượng sản phẩm
1
2
3
4
5
Beer expert Training
Một số cơ sở thống kê
Một số cơ sở thống kê
24
8
Applied Statistics
Trong một tháng, bạn sử dụng fromage bao nhiêu lần ? một câu hỏi
được xem là một variable (biến số)
1 lần
2 lần
4 lần
Mỗi ngày
Mỗi
lựa chọn được
xem là một phương
thức (modality)
Beer expert Training
Một số cơ sở thống kê
25
Beer expert Training
Một số cơ sở thống kê
26
•8 phomat (EdamF, EdamH, GoudaH, m1, m2, m3, m4,
m5)
•11 người thử (chuyên gia)
•3 lần lặp lại
•15 thuật ngữ mô tả: sour bitterness umami salty greasiness
butter_odor milk_odor acrid rancid lactic cheese_flavor acetic full
flavor yellow hard
•Thang điểm không cấu trúc từ 0-100 mm
Beer expert Training
Một số cơ sở thống kê
Một số cơ sở thống kê
27
9
Applied Statistics
judge
session
product
sour
bitterness
umami
S1
1
m1
50
18
0
40
S2
1
m1
100
65
40
100
S3
1
m1
32
11
35
4
S4
1
m1
30
10
25
1
S5
1
m1
60
23
30
29
S6
1
m1
30
35
25
50
S7
1
m1
50
32
45
64
S8
1
m1
32
23
40
40
S9
1
m1
78
27
45
21
S10
1
m1
55
30
34
18
S11
1
m1
62
21
43
32
Beer expert Training
Một số cơ sở thống kê
salty
28
Tóm tắt các thông số thống kê Tập hợp – mẫu
Đo lường xu hướng tại tâm
• Median
• Mode
• Mean
Đo lường độ biến thiên
• Range
• Phương sai
• Độ lệch chuẩn
1,2,5,9,6,7
1,2,5,6,7,9
Beer expert Training
Một số cơ sở thống kê
29
1-3. Đo lường khuynh hướng tập trung tại tâm
Median
Giá trị ở giữa khi
sắp xếp theo thứ tự
tăng dần về độ lớn
50th percentile
Mode
Giá trị có tần số
xuất hiện nhiều nhất
Mean
Trung bình
Beer expert Training
Một số cơ sở thống kê
Một số cơ sở thống kê
30
10
Applied Statistics
Trung bình số học - Average
Giá trị mean của một dãy quan sát là giá trị trung bình
của dãy số đó – tổng của các giá trị quan sát chia cho
tổng số quan sát.
Trung bình mẫu
Trung bình tập hợp
N
n
x
x
i 1
x
N
Beer expert Training
i 1
Một số cơ sở thống kê
n
31
Trung bình số học - Average
Ảnh hưởng bởi yếu tố bên ngoài
0 1 2 3 4 5 6 7 8 9 10
0 1 2 3 4 5 6 7 8 9 10 12 14
Means = 5
Beer expert Training
Means = 6
Một số cơ sở thống kê
32
Trung vị - Median
Thông số mạnh không ảnh hưởng bởi các yếu tố bên ngoài
0 1 2 3 4 5 6 7 8 9 10
0 1 2 3 4 5 6 7 8 9 10 12 14
Median = 5
Beer expert Training
Một số cơ sở thống kê
Một số cơ sở thống kê
Median = 5
33
11
Applied Statistics
Số Mode
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14
0 1 2 3 4 5 6
Mode = 9
Beer expert Training
Không có Mode
Một số cơ sở thống kê
34
Đo lường khuynh hướng tập trung tại tâm
x
Mean :
x
1
n
1
n
n
x
i
i 1
i
i 1
k
nx
i
x1 x 2 x n
n
n1 x1 n2 x 2 nk x k
n
Kích thước mẫu
Median :
med ( x ) x ( p 1)
Beer expert Training
x ( p ) x ( p 1)
2
Một số cơ sở thống kê
si
n 2p 1
si
n 2p
35
Mean or Median ?
Khác về phân phối đối xứng
Yếu tố bên ngoài ảnh hưởng : median
Tính gián đoạn của số liệu : mean
Beer expert Training
Một số cơ sở thống kê
Một số cơ sở thống kê
36
12
Applied Statistics
Các phần tưtư- Quartiles
Giá trị ở tại các vị trí 25%, 50%, 75% của phân phối chia làm 4 phần chứa vị trí
¼ của tập hợp
25%
25%
Q1
25%
Q2
Vị trí của phần thư thứ i
25%
Q3
i n 1
Qi
4
1 9 1
Position
of Q1
2.5
Vị trí của
4
Q1
12 13 12.5
2
Data classified in increasing order : 11 12 13 16 16 17 18 21 22
Beer expert Training
Một số cơ sở thống kê
37
Độ biến thiênthiên- Variation
Giá trị trung bình không phải như số liệu mô tả. Chúng ta cần
biết độ dao động trong số liệu đó
Đo lường hiển nhiên là tính tổng sự khác biệt đó từ giá
trị trung bình::
Ví dụ, dãy số có các số liệu sau: 6, 7, 8, 4, 5 và 6,
Ta có:
(6-6) + (7-6) + (8-6) + (4-6) + (5-6) + (6-6)
=0+1+2–2–1+0
=0
KHÔNG THOẢ MÃN!
Beer expert Training
Một số cơ sở thống kê
38
Tổng bình phương
Ta cần có sự khác biệt dương bằng cách bình phương sự
khác biệt đó. Gọ
Gọi là “Tổng bình phương” (SS)
Ví dụ 1 : 6, 7, 8, 4, 5, 6, ta có:
SS = (6(6-6)2 + (7(7-6)2 + (8(8-6)2 + (4(4-6)2 + (5(5-6)2 + (6(6-6)2 = 10
Ví dụ 2: 10, 2, 3, 9, ta có:
SS= (10(10-6)2 + (2(2-6)2 + (3(3-6)2 + (9(9-6)2 = 50
Cách này thể hiện tốt hơn!
Nhưng chú ý kích thước mẫu n.
Beer expert Training
Một số cơ sở thống kê
Một số cơ sở thống kê
39
13
Applied Statistics
Phương saisai- Variance
Chúng ta lấy SS chia cho kích thước mẫu n. Nhưng trong mỗi
bình phương ta sử dụng giá trị trung bình để tính bình phương,
vì thế giảm đi 1 bậc tự do. Vì thế mẫu số đúng là n-1. Đây gọi
là phương sai (kí hiệu là s2)
s2
x1 x 2 x2 x 2 ... xn x 2
n 1
Hoặc:
s2
Beer expert Training
1 n
2
x i x
n 1 i 1
Một số cơ sở thống kê
40
1-5. Phương sai và độ lệch chuẩn
Phương sai tập hợp
Phương sai mẫu
n
N
(x )
2
s
(x x)
n 1
2
( x)
x
( x)
i 1
N
i 1
2
n
N
N
2
i1
N
N
2
i 1
x
2
2
n
i 1
2
n
i1
n 1
2
Beer expert Training
s
s
2
Một số cơ sở thống kê
41
Ví dụ về phương sai
Ví dụ 1: 6, 7, 8, 4, 5 và 6, phương sai là:
s2
6 6 2 7 6 2 8 6 2 5 6 2 6 6 2
6 1
10
2
5
Ví dụ 2: 10, 2, 3, 9, phương sai là:
s2
10 6 2 2 6 2 3 6 2 9 6 2
4 1
50
16 .7
3
Giá trị trong ví dụ 2 sai lệch nhiều hơn giá trị
trong ví dụ 1.
Beer expert Training
Một số cơ sở thống kê
Một số cơ sở thống kê
42
14
Applied Statistics
Độ lệch chuẩn
Vấn đề là phương sai thể hiện giá trị của một đơn vị bình
phương, trong khi đó giá trị trung bình thể hiện giá trị thực.
Ta cần một cách đổi phương sai trở lại giá trị thực.
Ta lấy căn bậc 2 của phương sai– gọi là “sđộ lệch chuẩn”
(kí hiệu là s)
Trong ví dụ 1, s = sqrt(2) = 1.41
Trong ví dụ 2, s = sqrt(16.7) = 4.1
Beer expert Training
Một số cơ sở thống kê
43
Độ lệch chuẩn
Data A
11 12
13 14
Mean = 15.5
s = 3.338
15
16 17
18 19
20 21
15
16 17
18 19
20 21
Mean = 15.5
s = .9258
15
16 17
18 19
20 21
Mean = 15.5
s = 4.57
Data B
11 12
13 14
Data C
11 12
13 14
Beer expert Training
Một số cơ sở thống kê
44
Ý nghĩa của giá trị trung bình và SD
“Dân số Việt Nam trên 30 tuổi, nặng trung bình 55.0 kg và độ
lệch chuẩn là 8,2 kg.”
Điều này có ý nghĩa gì?
68% dân số trên có cân nặng khoảng từ 55 +/+/- 8.2*1 = 46.8
đến 63.2 kg
95% dân số trên có cân nặng khoảng từ 55 +/+/- 8.2*1.96 = 38.9
đến 71.1 kg
Beer expert Training
Một số cơ sở thống kê
Một số cơ sở thống kê
45
15
Applied Statistics
Độ lệch chuẩn
0.45
normal(x)
0.4
0.35
0.3
0.25
68 %
0.2
0.15
95 %
0.1
0.05
99.7 %
0
-3
-2
-
Beer expert Training
+
Một số cơ sở thống kê
+2
+3
46
Ý nghĩa của giá trị trung bình và SD
Percent (%)
Phân phối về khối lượng của toàn bộ dân số có thể được thể hiện như sau:
6
1.96SD
5
1SD
4
3
2
1
0
22 25 28 31 34 37 40 43 46 49 52 55 58 61 64 67 70 73 76 79 82 85 88 92
Weight (kg)
Beer expert Training
Một số cơ sở thống kê
47
Biến định lượng : đồ thị boxplot
x
x
Giá trị lớn nhất nhỏ hơn
q 0.75 +1.5(q 0.75 - q 0.25)
q 0.75
Median
q 0.25
Giá trị bé nhất lớn hơn
q 0.25 -1.5(q 0.75 - q 0.25)
x
Boxplot
Beer expert Training
Một số cơ sở thống kê
Một số cơ sở thống kê
48
16
Applied Statistics
Form indicators
1 0
1 0
Không đối xứng Đối xứng
Q1
Q1 Q 2Q3
Q2 Q3
Beer expert Training
Không đối xứng
Q1 Q 2
Một số cơ sở thống kê
Q3
49
Thống kê cho các cặp biến
Dự đoán
Nominal level Ordinal Level Interval Level
Ration Level
Tiêu chuẩn
Ratio Level
ANOVA
Spearman
Correlation
Pearson
Correlation or
Spearman Corr.
Interval Level
ANOVA
Spearman
Correlation
Pearson
Correlation or
Spearman Corr.
Ordinal Level
KruskalWallis Test
Spearman
Correlation
Nominal
Level
Chi-Quare
Test
Beer expert Training
Một số cơ sở thống kê
Pearson
Correlation or
Spearman Corr.
50
Phân tích đa biến
• Kỹ thuật dùng phân tích đám mây các điểm
• Chứa thông tin đại diện cho đám mây điểm là chính xác nhưng đơn
giản và dễ tiếp cần trong không gian có ít chiều không gian hơn
Phân tích thành phần chính
- Bảng số liệu định lượng
- Khoảng cách hình học Euclid
Phân tích nhân tố (FA)
- Bảng số ngẫu nhiên hoặc bảng số định lượng
- Chi
Chi--bình phương
Phân nhóm Hierarchical Classification analysis
- Bảng giá trị khoảng cách
Beer expert Training
Một số cơ sở thống kê
Một số cơ sở thống kê
51
17
[...]... Nominal level Ordinal Level Interval Level Ration Level Tiêu chuẩn Ratio Level ANOVA Spearman Correlation Pearson Correlation or Spearman Corr Interval Level ANOVA Spearman Correlation Pearson Correlation or Spearman Corr Ordinal Level KruskalWallis Test Spearman Correlation Nominal Level Chi-Quare Test Beer expert Training Một số cơ sở thống kê Pearson Correlation or Spearman Corr 50 Phân tích đa biến... 22 Beer expert Training Một số cơ sở thống kê 37 Độ biến thiênthiên- Variation Giá trị trung bình không phải như số liệu mô tả Chúng ta cần biết độ dao động trong số liệu đó Đo lường hiển nhiên là tính tổng sự khác biệt đó từ giá trị trung bình:: Ví dụ, dãy số có các số liệu sau: 6, 7, 8, 4, 5 và 6, Ta có: (6-6) + (7- 6) + (8-6) + (4-6) + (5-6) + (6-6) =0+1+2–2–1+0 =0 KHÔNG THOẢ MÃN! Beer expert Training... Trung bình số học - Average Giá trị mean của một dãy quan sát là giá trị trung bình của dãy số đó – tổng của các giá trị quan sát chia cho tổng số quan sát Trung bình mẫu Trung bình tập hợp N n x x i 1 x N Beer expert Training i 1 Một số cơ sở thống kê n 31 Trung bình số học - Average Ảnh hưởng bởi yếu tố bên ngoài 0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10 12 14 Means = 5 Beer expert Training... 0.15 95 % 0.1 0.05 99 .7 % 0 -3 -2 - Beer expert Training + Một số cơ sở thống kê +2 +3 46 Ý nghĩa của giá trị trung bình và SD Percent (%) Phân phối về khối lượng của toàn bộ dân số có thể được thể hiện như sau: 6 1.96SD 5 1SD 4 3 2 1 0 22 25 28 31 34 37 40 43 46 49 52 55 58 61 64 67 70 73 76 79 82 85 88 92 Weight (kg) Beer expert Training Một số cơ sở thống kê 47 Biến định lượng :... hiệu là s) Trong ví dụ 1, s = sqrt(2) = 1.41 Trong ví dụ 2, s = sqrt(16 .7) = 4.1 Beer expert Training Một số cơ sở thống kê 43 Độ lệch chuẩn Data A 11 12 13 14 Mean = 15.5 s = 3.338 15 16 17 18 19 20 21 15 16 17 18 19 20 21 Mean = 15.5 s = 9258 15 16 17 18 19 20 21 Mean = 15.5 s = 4. 57 Data B 11 12 13 14 Data C 11 12 13 14 Beer expert Training Một số cơ sở thống kê 44 Ý nghĩa của giá trị trung bình và... 6 2 9 6 2 4 1 50 16 7 3 Giá trị trong ví dụ 2 sai lệch nhiều hơn giá trị trong ví dụ 1 Beer expert Training Một số cơ sở thống kê Một số cơ sở thống kê 42 14 Applied Statistics Độ lệch chuẩn Vấn đề là phương sai thể hiện giá trị của một đơn vị bình phương, trong khi đó giá trị trung bình thể hiện giá trị thực Ta cần một cách đổi phương sai trở lại giá trị thực Ta lấy căn bậc 2 của phương... lượng : đồ thị boxplot x x Giá trị lớn nhất nhỏ hơn q 0 .75 +1.5(q 0 .75 - q 0.25) q 0 .75 Median q 0.25 Giá trị bé nhất lớn hơn q 0.25 -1.5(q 0 .75 - q 0.25) x Boxplot Beer expert Training Một số cơ sở thống kê Một số cơ sở thống kê 48 16 Applied Statistics Form indicators 1 0 1 0 Không đối xứng Đối xứng Q1 Q1 Q 2Q3 Q2 Q3 Beer expert Training Không đối xứng Q1 Q 2 Một số cơ sở thống kê Q3 49 Thống... Một số cơ sở thống kê Một số cơ sở thống kê 36 12 Applied Statistics Các phần tưtư- Quartiles Giá trị ở tại các vị trí 25%, 50%, 75 % của phân phối chia làm 4 phần chứa vị trí ¼ của tập hợp 25% 25% Q1 25% Q2 Vị trí của phần thư thứ i 25% Q3 i n 1 Qi 4 1 9 1 Position of Q1 2.5 Vị trí của 4 Q1 12 13 12.5 2 Data classified in increasing order : 11 12 13 16 16 17 18... Training Means = 6 Một số cơ sở thống kê 32 Trung vị - Median Thông số mạnh không ảnh hưởng bởi các yếu tố bên ngoài 0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10 12 14 Median = 5 Beer expert Training Một số cơ sở thống kê Một số cơ sở thống kê Median = 5 33 11 Applied Statistics Số Mode 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 0 1 2 3 4 5 6 Mode = 9 Beer expert Training Không có Mode Một số cơ sở thống kê 34... thuật dùng phân tích đám mây các điểm • Chứa thông tin đại diện cho đám mây điểm là chính xác nhưng đơn giản và dễ tiếp cần trong không gian có ít chiều không gian hơn Phân tích thành phần chính - Bảng số liệu định lượng - Khoảng cách hình học Euclid Phân tích nhân tố (FA) - Bảng số ngẫu nhiên hoặc bảng số định lượng - Chi Chi bình phương Phân nhóm Hierarchical Classification analysis - Bảng giá trị khoảng ... Interval Level Ration Level Tiêu chuẩn Ratio Level ANOVA Spearman Correlation Pearson Correlation or Spearman Corr Interval Level ANOVA Spearman Correlation Pearson Correlation or Spearman Corr... Spearman Corr Ordinal Level KruskalWallis Test Spearman Correlation Nominal Level Chi-Quare Test Beer expert Training Một số sở thống kê Pearson Correlation or Spearman Corr 50 Phân tích đa biến... sour bitterness umami salty greasiness butter_odor milk_odor acrid rancid lactic cheese_flavor acetic full flavor yellow hard •Thang điểm không cấu trúc từ 0 0-1 00 mm Beer expert Training Một số