Biểu đồ phân phối tần số gồm các cột đứng dùng để miêu tả phân phối tần số của tập dữ liệu định lượng... Thông tin thu được từ biểu đồ phân phối tần số.[r]
(1)XÁC SUẤT THỐNG KÊ ỨNG DỤNG TRONG KINH TẾ XÃ HỘI
Bài 3:
Tóm tắt trình bày liệu bằng biểu đồ đại lượng
thống kê mô tả
Thống kê ứng dụng KTXH
(2)NỢI DUNG CHÍNH
Biểu đồ mơ tả liệu định lượng
Biểu đồ mô tả liệu định tính
Các đại lượng thống kê mơ tả
(3)Mục tiêu
Sinh viên có thể:
Biết số biểu đồ cho liệu định lượng, định lượng
Biết cách tính số đại lượng thống kê mơ tả
Biết cách vẽ biểu đồ tán xạ, tính hệ số tương quan
Hiểu thông tin thu từ biểu đồ từ đại
lượng thống kê mơ tả
(4)Nhóm khách hàng tiềm năng
(5)5
Phân loại biểu đồ
Dữ liệu
Phân phối tần số
Dữ liệu định lượng
Dữ liệu định tính
Thân
Đa giác
(6)Biểu đồ phân phối tần số
(7)7
Cách vẽ biểu đồ phân phối tần số
Phân chia tập liệu thành tổ
Phân chia tập liệu
thành tổ (10,20] (20,30] (30,40] (40,50] (50,60] (60,70]
Xác định tần số tổ
Xác định tần số tổ
Vẽ cột đặt cạnh với độ rộng khoảng cách tổ, độ cao tần số tổ
Vẽ cột đặt cạnh với độ rộng khoảng cách tổ, độ cao tần số tổ
(8)Thông tin thu từ biểu đồ phân phối tần số
- Hình dáng tập liệu đối xứng hay tập trung bên trái bên phải
(9)9
Nêu nhận xét phân phối tuổi nhóm
(10)Đa giác tần số
(11)11
Cách vẽ đa giác tần số
Phân tổ liệu với điểm chia
tần số
Phân tổ liệu với điểm chia
tần số
Xác định điểm đồ thị
Xác định điểm đồ thị
Nối điểm lại với
Nối điểm lại với
Hồnh độ Tung độ
(12)Thơng tin thu từ đa giác tần số
- Hình dáng tập liệu đối xứng hay tập trung bên trái bên phải
(13)13
Nêu nhận xét phân phối tuổi nhóm
(14)(15)15
Định nghĩa biểu đồ thân lá
(16)Cách vẽ biểu đồ Stem and Leaf
Sắp xếp số liệu tăng dần
Sắp xếp số liệu tăng dần 10 52 24 34 51 61
10 24 34 51 52 61
Chia hình vẽ làm hai cột
Chia hình vẽ làm hai cột
Xác định xếp phần thân
Xác định xếp phần thân stem leaf
1 2 3 5 6 0 4 4 1 2 1
Xác định xếp phần lá
(17)17
Chú ý: Xác định phần thân
- Số liệu có hai chữ số, phần thân: hàng chục, phần lá: hàng đơn vị
- Số liệu có chữ số thập phân, phần thân: số nguyên, phần lá: số thập phân
(18)Thông tin thu từ biểu đồ thân
- Hình dáng tập liệu đối xứng hay tập trung bên trái bên phải
(19)19
Ví dụ
Bảng sau cho ta số vụ vi phạm giao thông vào buổi sáng buổi chiều Vẽ biểu đồ thân cho số vụ vi phạm giao thông vào buổi sáng/chiều.
(20) Sắp xếp số liệu tăng dần
Sắp xếp số liệu tăng dần
15, 12, 34, 45, 38, 22, 27, 29, 17, 45, 37, 14, 15, 37, 51, 18
12, 14, 15, 15, 17, 18, 22, 27, 29, 34, 37, 37, 38, 45, 45, 51
Xác định phần thân
Xác định phần thân
stem leaf
Là chữ số hàng chục:
1, 2, 3, 4, 5 1 2 3 4 5
Xác định phần lá
Xác định phần lá Là chữ số hàng đơn vị:
2, 4, 5, 5, 7, 8
2 5 8 2 9
4 7 8 5 5
(21)21
(22)Biểu đồ thân back-to-back
Lá Thân Lá
2 5 6 8 2 7 2 4 9
2 5 8 2 9
4 7 8 5 5
1 1
(23)(24)Biểu đồ tròn
(25)25
Cách vẽ biểu đồ tròn
Xác định giá trị tập liệu
Xác định giá trị tập liệu
Xác định tỷ lệ giá trị tính góc hình quạt tương ứng
Xác định tỷ lệ giá trị tính góc hình quạt tương ứng
Vẽ hình quạt cho giá trị
Vẽ hình quạt cho giá trị
Nghề Tần số Tỷ lệ(%) Góc(ᵒ)
CNVC 146 29.2 105.1
HSSV 102 20.4 73.4
Khác 48 9.6 34.6
NVVP 204 40.8 146.9
(26)Thơng tin thu từ biểu đồ trịn
- Giá trị chiếm nhiều nhất,
- Mức phân phối tương đối giá trị so với toàn
(27)27
(28)Biểu đồ thanh
(29)29
Cách vẽ biểu đồ thanh
Xác định giá trị tập liệu
Xác định giá trị tập liệu
Xác định tần số tương ứng với giá trị
Xác định tần số tương ứng với giá trị
Vẽ đứng cho giá trị với độ cao tần số tương ứng
Vẽ đứng cho
giá trị với độ cao tần số tương ứng
Nghề Tần số
CNVC 146
HSSV 102
Khác 48
NVVP 204
(30)Thông tin thu từ biểu đồ
- Giá trị chiếm nhiều nhất, - So sánh giá trị với
(31)31
(32)(33)Questions
33
• What is average of purchases for each occupation?
• What is value of purchases that half the customers are
below and half the customers are above?
• What is the lowest value of purchases of the top 10%
highest ones?
• Which occupations that have the largest and the smallest
(34)• Trung bình cộng
Trung vị
o Mode
• Tứ phân vị
Phân vị
• Khoảng biến thiên
Độ trải giữa
(35)35
Trung bình cộng
Trung bình cộng tính cộng tất
giá trị chia cho số giá trị tập liệu
Cơng thức tính:
Số phần tử Các giá trị liệu
Giá trị thứ i
Đọc X-ngang
n X X X n X
X n
(36)Tính chất trung bình cộng
Trung bình cộng số đo hướng tâm phổ biến
Trung bình cộng bị ảnh hưởng giá trị ngoại biên
1
Mean = 3.5
45
Mean = 10
1 5+6 21
3.5
6
5+45 60 10
6
(37)Chap 3-37
Trung vị
Trung vị giá trị tập liệu
thứ tự, có khoảng 50% số quan sát nhỏ trung vị khoảng 50% số quan sát lớn trung vị
50%
Median
(38)Cách tính trung vị
Sắp xếp tập liệu theo thứ tự tăng dần
Nếu số quan sát lẻ trung vị vị trí (n+1)/2
Nếu số quan sát chẵn trung vị trung bình cộng quan sát vị trí n/2 (n+2)/2
(39)39
Tính chất trung vị
Trung bình cộng khơng bị ảnh hưởng giá trị ngoại
biên
1
Median = 3.5
45
(40)Mode
Mode tập liệu giá trị xuất
nhiều tập liệu
(41)Chap 3-41
Cách tìm Mode
Lập bảng tần số cho tập liệu
Tìm tần số lớn bảng
Giá trị ứng với tần số lớn mode tập liệu
Ví dụ: Tìm mode tập liệu sau cho nhận xét:
0, 1, 3, 1, 5, 2, 6, 2, 9, 2, 3, 2, 5, 7, 8, 7, 15
(42)Tính chất mode
Khơng ảnh hưởng giá trị ngoại biên
Là số đo hướng tâm sử dụng cho liệu
định tính
Tập liệu có nhiều mode Tập liệu khơng có mode
0 10 11 12 13 14 0 6
(43)43
Mean, Median, Mode:
(44)Chọn số đo hướng tâm nào?
Trung bình thường sử dụng nhiều nhất, trừ
trường hợp tập liệu có giá trị ngoại biên
Trung vị hay sử dụng không bị ảnh
hưởng giá trị ngoại biên
Trong nhiều tình huống, việc tính trung bình
(45)45
Tổng kết số đo hướng tâm
Số đo hướng tâm
Trung bình cộng
Trung vị Mode
Giá trị tập liệu thứ tự
Giá trị
quan sát xuất nhiều
(46)Số đo phân tán
Số đo phân tán cho ta thông tin biến thiên hay mức độ đồng giá trị tập liệu
Độ phân tán
Phương sai
Độ lệch chuẩn Khoảng
biến thiên
(47)Discussing Situation
47
Suppose you and your classmates have written a statistics test and the instructor is returning the graded tests
What piece of information is most important to you? The
answer, of course, is your mark
What is the next important bit of information? The answer
is how well you performed relative to the class
(48)Questions
Why?
(49)49
Khoảng biến thiên
Khoảng biến thiên tập liệu hiệu giá trị lớn
nhất giá trị nhỏ
0 10 11 12 13 14
Range = 13 - = 12
Ví dụ:
(50)Đặc điểm khoảng biến thiên
Bỏ qua phân bố bên tập liệu
Nhạy cảm với giá trị ngoại biên
7 10 11 12
RQ = 12 - = 5
7 10 11 12
RQ = 12 - = 5
1,1,1,1,1,1,1,1,1,1,1,2,2,2,2,2,2,2,2,3,3,3,3,4,5
1,1,1,1,1,1,1,1,1,1,1,2,2,2,2,2,2,2,2,3,3,3,3,4,120
RQ = - = 4
(51)51 Trung bình (xấp xỉ) bình phương độ
lệch giá trị đến trung bình
Phương sai mẫu:
Phương sai mẫu
Ở = trung bình cộng
n = cỡ mẫu
Xi = giá trị quan sát thứ i
1 -n ) X (X S n i i
2
(52)Độ lệch chuẩn mẫu
Độ lệch chuẩn mẫu:
Là bậc hai phương sai mẫu Có đơn vị với giá trị tập liệu
Là số đo phân tán sử dụng nhiều
Độ lệch chuẩn mẫu:
(53)53
Ví dụ tính độ lệch chuẩn mẫu
Dữ liệu
mẫu (Xi) : 10 12 14 15 17 18 18 24
n = Mean = X = 16
“Trung bình” độ phân tán xung quanh trung bình
(54)So sánh độ lệch chuẩn
Mean = 15.5
S = 3.338
11 12 13 14 15 16 17 18 19 20 21
11 12 13 14 15 16 17 18 19 20 21
Data B Data A
Mean = 15.5
S = 0.926
11 12 13 14 15 16 17 18 19 20 21
Mean = 15.5
(55)55
So sánh độ lệch chuẩn
Độ lệch chuẩn nhỏ
(56)Tính chất số đo phân tán
Nếu khoảng biến thiên, phương sai độ lệch chuẩn
càng lớn tập liệu trải rộng
Nếu khoảng biến thiên, phương sai độ lệch chuẩn
càng nhỏ lớn tập liệu tập trung
Nếu giá trị tập liệu số đo
phân tán (không phân tán)
(57)57
Hệ số tương quan tuyến tính
Đo mối quan hệ tuyến tính hai biến định
lượng
Hệ số tương quan tuyến tính mẫu:
Trong đó,
1
2
X Y 2
1
cov (X ,Y) r S S ( )( ) n i i i n n i i i i
X Y nX Y
X nX Y nY
(58)Tính chất hệ số tương quan
Hệ số tương quan tuyến tính có số tính chất sau:
-1 ≤ r ≤
r gần với 1, hai biến có mối liên hệ tuyến tính dương mạnh
r gần với -1, hai biến có mối liên hệ tuyến tính âm mạnh
(59)59
Biểu đồ tán xạ
(60)Cách vẽ biểu đồ tán xạ
Xác định giá trị biến thứ
Xác định giá trị biến thứ
Xác định giá trị biến thứ hai
Xác định giá trị biến thứ hai
Xác định điểm
vẽ điểm mặt phẳng
Xác định điểm
vẽ điểm mặt phẳng
(61)
61
Biểu đồ tán xạ hệ số tương quan
Y
X
Y
X
Y
X Y
X
r = -1 r = -.6
r = +.3 r = +1
Y
X
(62)Ví dụ tính hệ số tương quan
Quảng cáo ( ) Doanh thu ( )
4.2 125.7 1.6 87.3 6.3 135.6 2.7 99.0 10.4 168.2 7.1 136.9 5.5 115.4 8.3 158.2 i
X Yi
1 6458.23 n i i i X Y 324.89 n i i X 136987.4 n i i Y 5.76
X Y 128.29
1 r 0.97 n i i i n n
X Y nX Y
(63)63
(64)Tổng kết
Trong này, đã:
Mô tả số biểu đồ cho liệu định tính
định lượng
Trình bày số đại lượng thống kê mô tả
Giới thiệu biểu đồ tán xạ, hệ số tương quan
(65)Tự học: Tứ phân vị (Quartile)
Đọc phần tứ phân vị theo tài liệu sau: https://en.wikipedia.org/wiki/Quartile
Và trả lời câu hỏi sau:
1 Tứ phân vị gì?
2 Cách tính tứ phân vị (Method 2)
3 Tính tứ phân vị tập liệu sau nêu
nhận xét
3, 9, 16, 5, 7, 8, 19, 20, 25, 30
(66)Tự học: Độ trải (Interquartile range)
Đọc phần độ trải theo tài liệu sau:
https://en.wikipedia.org/wiki/Interquartile_range
Và trả lời câu hỏi sau:
1 Độ trải gì?
2 Tính độ trải tập liệu sau:
(67)Tự học: Phân vị (Quantile)
Định nghĩa: Phân vị thứ p tập liệu
xếp định nghĩa giá trị chia tập liệu làm hai phần: phần có khoảng p% số quan sát có giá trị nhỏ phần cịn lại có khoảng (100-p)% số quan sát có giá trị lớn
Cho biết phân vị thứ 60 tập liệu sau 17.2:
3, 5, 7, 8, 9, 16, 19, 20, 25, 30
Hãy nêu ý nghĩa giá trị
(68)Tự học: Biểu đồ hộp râu (Box plot)
Đọc phần biểu đồ hộp râu theo tài liệu sau:
https://hcmftu.wordpress.com/2015/03/07/bieu-do-hop/
https://www.khanacademy.org/math/probability/data-dist
ributions-a1#box whisker-plots-a1
Và trả lời câu hỏi sau:
1 Nêu cách vẽ biểu đồ hộp râu
2 Từ biểu đồ hộp râu ta thơng
tin tập liệu
3 Vẽ biểu đồ hộp râu cho tập liệu sau:
(69)(70)(71)(72)The Five-Number Summary
The five numbers that help describe the center, spread and shape of data are:
Xsmallest
First Quartile (Q1)
Median (Q2)
Third Quartile (Q3)
Xlargest
(73)Chap 3-73 Copyright ©2013 Pearson Education, Inc publishing as Prentice Hall
Five-Number Summary and The Boxplot
The Boxplot: A Graphical display of the data
based on the five-number summary:
Example:
Xsmallest Q1 Median Q3 Xlargest
25% of data 25% 25% 25% of data of data of data
Xsmallest Q1 Median Q3 Xlargest
(74)Five-Number Summary: Shape of Boxplots
If data are symmetric around the median then the box
and central line are centered between the endpoints
A Boxplot can be shown in either a vertical or horizontal
orientation
Xsmallest Q1 Median Q3 Xlargest
(75)Chap 3-75 Copyright ©2013 Pearson Education, Inc publishing as Prentice Hall
Distribution Shape and The Boxplot
Right-Skewed
Left-Skewed Symmetric
Q1 Q2 Q3 Q1 Q2 Q3 Q1 Q2 Q3
https://en.wikipedia.org/wiki/Quartile https://en.wikipedia.org/wiki/Interquartile_range https://hcmftu.wordpress.com/2015/03/07/bieu-do-hop/ https://www.khanacademy.org/math/probability/data-distributions-a1#box whisker-plots-a1