1. Trang chủ
  2. » Nghệ sĩ và thiết kế

ď

20 6 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Biểu đồ phân phối tần số gồm các cột đứng dùng để miêu tả phân phối tần số của tập dữ liệu định lượng... Thông tin thu được từ biểu đồ phân phối tần số.[r]

(1)

XÁC SUẤT THỐNG KÊ ỨNG DỤNG TRONG KINH TẾ XÃ HỘI

Bài 3:

Tóm tắt trình bày liệu bằng biểu đồ đại lượng

thống kê mô tả

Thống kê ứng dụng KTXH

(2)

NỢI DUNG CHÍNH

Biểu đồ mơ tả liệu định lượng

Biểu đồ mô tả liệu định tính

Các đại lượng thống kê mơ tả

(3)

Mục tiêu

Sinh viên có thể:

 Biết số biểu đồ cho liệu định lượng, định lượng

 Biết cách tính số đại lượng thống kê mơ tả

 Biết cách vẽ biểu đồ tán xạ, tính hệ số tương quan

 Hiểu thông tin thu từ biểu đồ từ đại

lượng thống kê mơ tả

(4)

Nhóm khách hàng tiềm năng

(5)

5

Phân loại biểu đồ

Dữ liệu

Phân phối tần số

Dữ liệu định lượng

Dữ liệu định tính

Thân

Đa giác

(6)

Biểu đồ phân phối tần số

(7)

7

Cách vẽ biểu đồ phân phối tần số

 Phân chia tập liệu thành tổ

 Phân chia tập liệu

thành tổ (10,20] (20,30] (30,40] (40,50] (50,60] (60,70]

 Xác định tần số tổ

 Xác định tần số tổ

 Vẽ cột đặt cạnh với độ rộng khoảng cách tổ, độ cao tần số tổ

 Vẽ cột đặt cạnh với độ rộng khoảng cách tổ, độ cao tần số tổ

(8)

Thông tin thu từ biểu đồ phân phối tần số

- Hình dáng tập liệu đối xứng hay tập trung bên trái bên phải

(9)

9

Nêu nhận xét phân phối tuổi nhóm

(10)

Đa giác tần số

(11)

11

Cách vẽ đa giác tần số

Phân tổ liệu với điểm chia

tần số

Phân tổ liệu với điểm chia

tần số

 Xác định điểm đồ thị

 Xác định điểm đồ thị

 Nối điểm lại với

 Nối điểm lại với

Hồnh độ Tung độ

(12)

Thơng tin thu từ đa giác tần số

- Hình dáng tập liệu đối xứng hay tập trung bên trái bên phải

(13)

13

Nêu nhận xét phân phối tuổi nhóm

(14)(15)

15

Định nghĩa biểu đồ thân lá

(16)

Cách vẽ biểu đồ Stem and Leaf

 Sắp xếp số liệu tăng dần

 Sắp xếp số liệu tăng dần 10 52 24 34 51 61

10 24 34 51 52 61

 Chia hình vẽ làm hai cột

 Chia hình vẽ làm hai cột

 Xác định xếp phần thân

 Xác định xếp phần thân stem leaf

1 2 3 5 6 0 4 4 1 2 1

 Xác định xếp phần lá

(17)

17

Chú ý: Xác định phần thân

- Số liệu có hai chữ số, phần thân: hàng chục, phần lá: hàng đơn vị

- Số liệu có chữ số thập phân, phần thân: số nguyên, phần lá: số thập phân

(18)

Thông tin thu từ biểu đồ thân

- Hình dáng tập liệu đối xứng hay tập trung bên trái bên phải

(19)

19

Ví dụ

Bảng sau cho ta số vụ vi phạm giao thông vào buổi sáng buổi chiều Vẽ biểu đồ thân cho số vụ vi phạm giao thông vào buổi sáng/chiều.

(20)

 Sắp xếp số liệu tăng dần

 Sắp xếp số liệu tăng dần

15, 12, 34, 45, 38, 22, 27, 29, 17, 45, 37, 14, 15, 37, 51, 18

12, 14, 15, 15, 17, 18, 22, 27, 29, 34, 37, 37, 38, 45, 45, 51

 Xác định phần thân

 Xác định phần thân

stem leaf

Là chữ số hàng chục:

1, 2, 3, 4, 5 1 2 3 4 5

 Xác định phần lá

 Xác định phần lá Là chữ số hàng đơn vị:

2, 4, 5, 5, 7, 8

2 5 8 2 9

4 7 8 5 5

(21)

21

(22)

Biểu đồ thân back-to-back

Lá Thân Lá

2 5 6 8 2 7 2 4 9

2 5 8 2 9

4 7 8 5 5

1 1

(23)(24)

Biểu đồ tròn

(25)

25

Cách vẽ biểu đồ tròn

 Xác định giá trị tập liệu

 Xác định giá trị tập liệu

 Xác định tỷ lệ giá trị tính góc hình quạt tương ứng

 Xác định tỷ lệ giá trị tính góc hình quạt tương ứng

 Vẽ hình quạt cho giá trị

 Vẽ hình quạt cho giá trị

Nghề Tần số Tỷ lệ(%) Góc(ᵒ)

CNVC 146 29.2 105.1

HSSV 102 20.4 73.4

Khác 48 9.6 34.6

NVVP 204 40.8 146.9

(26)

Thơng tin thu từ biểu đồ trịn

- Giá trị chiếm nhiều nhất,

- Mức phân phối tương đối giá trị so với toàn

(27)

27

(28)

Biểu đồ thanh

(29)

29

Cách vẽ biểu đồ thanh

 Xác định giá trị tập liệu

 Xác định giá trị tập liệu

 Xác định tần số tương ứng với giá trị

 Xác định tần số tương ứng với giá trị

 Vẽ đứng cho giá trị với độ cao tần số tương ứng

 Vẽ đứng cho

giá trị với độ cao tần số tương ứng

Nghề Tần số

CNVC 146

HSSV 102

Khác 48

NVVP 204

(30)

Thông tin thu từ biểu đồ

- Giá trị chiếm nhiều nhất, - So sánh giá trị với

(31)

31

(32)(33)

Questions

33

• What is average of purchases for each occupation?

• What is value of purchases that half the customers are

below and half the customers are above?

• What is the lowest value of purchases of the top 10%

highest ones?

• Which occupations that have the largest and the smallest

(34)

• Trung bình cộng

 Trung vị

o Mode

• Tứ phân vị

 Phân vị

• Khoảng biến thiên

 Độ trải giữa

(35)

35

Trung bình cộng

 Trung bình cộng tính cộng tất

giá trị chia cho số giá trị tập liệu

 Cơng thức tính:

Số phần tử Các giá trị liệu

Giá trị thứ i

Đọc X-ngang

n X X X n X

X n

(36)

Tính chất trung bình cộng

 Trung bình cộng số đo hướng tâm phổ biến

 Trung bình cộng bị ảnh hưởng giá trị ngoại biên

1

Mean = 3.5

45

Mean = 10

1 5+6 21

3.5

6

   

  5+45 60 10

6

   

(37)

Chap 3-37

Trung vị

 Trung vị giá trị tập liệu

thứ tự, có khoảng 50% số quan sát nhỏ trung vị khoảng 50% số quan sát lớn trung vị

50%

Median

(38)

Cách tính trung vị

 Sắp xếp tập liệu theo thứ tự tăng dần

 Nếu số quan sát lẻ trung vị vị trí (n+1)/2

 Nếu số quan sát chẵn trung vị trung bình cộng quan sát vị trí n/2 (n+2)/2

(39)

39

Tính chất trung vị

 Trung bình cộng khơng bị ảnh hưởng giá trị ngoại

biên

1

Median = 3.5

45

(40)

Mode

 Mode tập liệu giá trị xuất

nhiều tập liệu

(41)

Chap 3-41

Cách tìm Mode

 Lập bảng tần số cho tập liệu

 Tìm tần số lớn bảng

 Giá trị ứng với tần số lớn mode tập liệu

Ví dụ: Tìm mode tập liệu sau cho nhận xét:

 0, 1, 3, 1, 5, 2, 6, 2, 9,  2, 3, 2, 5, 7, 8, 7, 15

(42)

Tính chất mode

 Khơng ảnh hưởng giá trị ngoại biên

 Là số đo hướng tâm sử dụng cho liệu

định tính

 Tập liệu có nhiều mode  Tập liệu khơng có mode

0 10 11 12 13 14 0 6

(43)

43

Mean, Median, Mode:

(44)

Chọn số đo hướng tâm nào?

 Trung bình thường sử dụng nhiều nhất, trừ

trường hợp tập liệu có giá trị ngoại biên

 Trung vị hay sử dụng không bị ảnh

hưởng giá trị ngoại biên

 Trong nhiều tình huống, việc tính trung bình

(45)

45

Tổng kết số đo hướng tâm

Số đo hướng tâm

Trung bình cộng

Trung vị Mode

Giá trị tập liệu thứ tự

Giá trị

quan sát xuất nhiều

(46)

Số đo phân tán

Số đo phân tán cho ta thông tin biến thiên hay mức độ đồng giá trị tập liệu

Độ phân tán

Phương sai

Độ lệch chuẩn Khoảng

biến thiên

(47)

Discussing Situation

47

Suppose you and your classmates have written a statistics test and the instructor is returning the graded tests

 What piece of information is most important to you? The

answer, of course, is your mark

 What is the next important bit of information? The answer

is how well you performed relative to the class

(48)

Questions

Why?

(49)

49

Khoảng biến thiên

Khoảng biến thiên tập liệu hiệu giá trị lớn

nhất giá trị nhỏ

0 10 11 12 13 14

Range = 13 - = 12

Ví dụ:

(50)

Đặc điểm khoảng biến thiên

 Bỏ qua phân bố bên tập liệu

 Nhạy cảm với giá trị ngoại biên

7 10 11 12

RQ = 12 - = 5

7 10 11 12

RQ = 12 - = 5

1,1,1,1,1,1,1,1,1,1,1,2,2,2,2,2,2,2,2,3,3,3,3,4,5

1,1,1,1,1,1,1,1,1,1,1,2,2,2,2,2,2,2,2,3,3,3,3,4,120

RQ = - = 4

(51)

51  Trung bình (xấp xỉ) bình phương độ

lệch giá trị đến trung bình

 Phương sai mẫu:

Phương sai mẫu

Ở = trung bình cộng

n = cỡ mẫu

Xi = giá trị quan sát thứ i

1 -n ) X (X S n i i

2 

 

(52)

Độ lệch chuẩn mẫu

Độ lệch chuẩn mẫu:

 Là bậc hai phương sai mẫu  Có đơn vị với giá trị tập liệu

 Là số đo phân tán sử dụng nhiều

 Độ lệch chuẩn mẫu:

(53)

53

Ví dụ tính độ lệch chuẩn mẫu

Dữ liệu

mẫu (Xi) : 10 12 14 15 17 18 18 24

n = Mean = X = 16

“Trung bình” độ phân tán xung quanh trung bình

(54)

So sánh độ lệch chuẩn

Mean = 15.5

S = 3.338

11 12 13 14 15 16 17 18 19 20 21

11 12 13 14 15 16 17 18 19 20 21

Data B Data A

Mean = 15.5

S = 0.926

11 12 13 14 15 16 17 18 19 20 21

Mean = 15.5

(55)

55

So sánh độ lệch chuẩn

Độ lệch chuẩn nhỏ

(56)

Tính chất số đo phân tán

 Nếu khoảng biến thiên, phương sai độ lệch chuẩn

càng lớn tập liệu trải rộng

 Nếu khoảng biến thiên, phương sai độ lệch chuẩn

càng nhỏ lớn tập liệu tập trung

 Nếu giá trị tập liệu số đo

phân tán (không phân tán)

(57)

57

Hệ số tương quan tuyến tính

 Đo mối quan hệ tuyến tính hai biến định

lượng

 Hệ số tương quan tuyến tính mẫu:

Trong đó,

1

2

X Y 2

1

cov (X ,Y) r S S ( )( ) n i i i n n i i i i

X Y nX Y

X nX Y nY

(58)

Tính chất hệ số tương quan

 Hệ số tương quan tuyến tính có số tính chất sau:

 -1 ≤ r ≤

 r gần với 1, hai biến có mối liên hệ tuyến tính dương mạnh

 r gần với -1, hai biến có mối liên hệ tuyến tính âm mạnh

(59)

59

Biểu đồ tán xạ

(60)

Cách vẽ biểu đồ tán xạ

 Xác định giá trị biến thứ

 Xác định giá trị biến thứ

 Xác định giá trị biến thứ hai

 Xác định giá trị biến thứ hai

 Xác định điểm

vẽ điểm mặt phẳng

 Xác định điểm

vẽ điểm mặt phẳng

(61)

61

Biểu đồ tán xạ hệ số tương quan

Y

X

Y

X

Y

X Y

X

r = -1 r = -.6

r = +.3 r = +1

Y

X

(62)

Ví dụ tính hệ số tương quan

Quảng cáo ( ) Doanh thu ( )

4.2 125.7 1.6 87.3 6.3 135.6 2.7 99.0 10.4 168.2 7.1 136.9 5.5 115.4 8.3 158.2 i

X Yi

1 6458.23 n i i i X Y    324.89 n i i X    136987.4 n i i Y    5.76

X  Y 128.29

1 r 0.97 n i i i n n

X Y nX Y

 

(63)

63

(64)

Tổng kết

Trong này, đã:

 Mô tả số biểu đồ cho liệu định tính

định lượng

 Trình bày số đại lượng thống kê mô tả

 Giới thiệu biểu đồ tán xạ, hệ số tương quan

(65)

Tự học: Tứ phân vị (Quartile)

 Đọc phần tứ phân vị theo tài liệu sau:  https://en.wikipedia.org/wiki/Quartile

Và trả lời câu hỏi sau:

1 Tứ phân vị gì?

2 Cách tính tứ phân vị (Method 2)

3 Tính tứ phân vị tập liệu sau nêu

nhận xét

3, 9, 16, 5, 7, 8, 19, 20, 25, 30

(66)

Tự học: Độ trải (Interquartile range)

 Đọc phần độ trải theo tài liệu sau:

 https://en.wikipedia.org/wiki/Interquartile_range

Và trả lời câu hỏi sau:

1 Độ trải gì?

2 Tính độ trải tập liệu sau:

(67)

Tự học: Phân vị (Quantile)

 Định nghĩa: Phân vị thứ p tập liệu

xếp định nghĩa giá trị chia tập liệu làm hai phần: phần có khoảng p% số quan sát có giá trị nhỏ phần cịn lại có khoảng (100-p)% số quan sát có giá trị lớn

 Cho biết phân vị thứ 60 tập liệu sau 17.2:

3, 5, 7, 8, 9, 16, 19, 20, 25, 30

Hãy nêu ý nghĩa giá trị

(68)

Tự học: Biểu đồ hộp râu (Box plot)

 Đọc phần biểu đồ hộp râu theo tài liệu sau:

 https://hcmftu.wordpress.com/2015/03/07/bieu-do-hop/

 https://www.khanacademy.org/math/probability/data-dist

ributions-a1#box whisker-plots-a1

Và trả lời câu hỏi sau:

1 Nêu cách vẽ biểu đồ hộp râu

2 Từ biểu đồ hộp râu ta thơng

tin tập liệu

3 Vẽ biểu đồ hộp râu cho tập liệu sau:

(69)(70)(71)(72)

The Five-Number Summary

The five numbers that help describe the center, spread and shape of data are:

 Xsmallest

 First Quartile (Q1)

 Median (Q2)

 Third Quartile (Q3)

 Xlargest

(73)

Chap 3-73 Copyright ©2013 Pearson Education, Inc publishing as Prentice Hall

Five-Number Summary and The Boxplot

 The Boxplot: A Graphical display of the data

based on the five-number summary:

Example:

Xsmallest Q1 Median Q3 Xlargest

25% of data 25% 25% 25% of data of data of data

Xsmallest Q1 Median Q3 Xlargest

(74)

Five-Number Summary: Shape of Boxplots

 If data are symmetric around the median then the box

and central line are centered between the endpoints

 A Boxplot can be shown in either a vertical or horizontal

orientation

Xsmallest Q1 Median Q3 Xlargest

(75)

Chap 3-75 Copyright ©2013 Pearson Education, Inc publishing as Prentice Hall

Distribution Shape and The Boxplot

Right-Skewed

Left-Skewed Symmetric

Q1 Q2 Q3 Q1 Q2 Q3 Q1 Q2 Q3

https://en.wikipedia.org/wiki/Quartile https://en.wikipedia.org/wiki/Interquartile_range https://hcmftu.wordpress.com/2015/03/07/bieu-do-hop/ https://www.khanacademy.org/math/probability/data-distributions-a1#box whisker-plots-a1

Ngày đăng: 11/12/2020, 10:41

Xem thêm:

w