1. Trang chủ
  2. » Trung học cơ sở - phổ thông

slide phần thống kê mới nguyenvantien0405

97 4 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Chiều cao của thanh niên ở một địa phương là biến ngẫu nhiên phân phối chuẩn với trung bình 170 cm và độ lệch chuẩn 10cm. Chọn ngẫu nhiên 31 thanh niên ở vùng đó. a) Tìm xác suất để ch[r]

(1)

THỐNG KÊ

PHẦN 2

(2)

Tổng thể Mẫu

Tổng thể (population) Mẫu (Sample)

(3)

Ví dụ tổng thể

Số cử tri đăng ký bầu cử

(4)

Tổng thể Mẫu

Ta khơng nghiên cứu tồn phần tử tổng thể vì:

(5)

-Chọn mẫu ngẫu nhiên

Mẫu ngẫu nhiên (random sample)

- Mỗi phần tử chọn ngẫu nhiên độc lập

- Mỗi phần tử có khả chọn nhau - Mọi mẫu cỡ n có khả chọn

Phương pháp chọn mẫu đơn giản

- Đánh số

(6)

Thống kê mô tả & suy luận

TK mô tả (descriptive statistics) : thu thập, tổng hợp, xử lý liệu để biến đổi liệu thành thông tin

- Thu thập liệu: khảo sát, đo đạc … - Biểu diễn liệu: dùng bảng, đồ thị …

- Tổng hợp liệu: trung bình mẫu, phương sai mẫu,

(7)

Thống kê mô tả & suy luận

Suy luận: rút kết luận đưa định tổng thể dựa nghiên cứu mẫu

TK suy luận (inferential statistics): xử lý thơng tin có từ thống kê mơ tả, từ đưa sở để dự đoán, dự báo, ước lượng…

- Ước lượng:…

(8)

Mô tả liệu đồ thị

• Bảng • Đồ thị

• Tùy thuộc vào loại biến quan sát

• Hay dùng: biểu đồ đường, tần số, nhánh lá, phân

(9)

Phân phối tần số

• Mỗi nhóm có bề rộng nhau

• Tối thiểu khoảng, tối đa 20 (thường từ đến 15)

• Các khoảng khơng trùng nhau

max

X X

h

k

 

3 2 1 3,322lg

  

(10)

Ví dụ

• Chọn ngẫu nhiên 20 ngày mùa đơng có nhiệt độ (F) cao

ta có:

• Xây dựng phân phối tần số?

24 35 17 21 24

37 26 46 58 30

32 13 12 38 41

(11)

Ví dụ

• Sắp xếp liệu:

• Xác định miền liệu: 58-12=46 • Số khoảng cần chia:

• Độ rộng khoảng: • Biên khoảng:

(12)

Ví dụ

• Sắp xếp liệu:

12,13,17, 21, 24, 24, 26, 27, 27,30, 32,35,37,38, 41, 43, 44, 46,53,58

Khoảng [10;20) [20;30) [30;40) [40;50) [50;60)

(13)

Ví dụ

• Vẽ đồ thị:

Mục tiêu phân phối tần số:

– Tạo phân phối không lởm chởm, nhiều đỉnh khơng có dạng khối

– Chỉ biến thiên liệu

(14)

Hình dạng phân phối

• Đối xứng

(15)

Đồ thị Stem and Leaf

• Sắp xếp số liệu tăng dần • Gồm phần:

(16)

Đồ thị Stem and Leaf

• Ví dụ 1:

21, 24, 24, 26, 27, 27,30,32,38, 41 Stem Leaves

2

1 4 7

(17)

Đồ thị Stem and Leaf

• Ví dụ 2:

613,632,658,717,722, 750,776,827,841,859, 863,891,894,906,928, 933,955,982,1034,1047, 1056,1140,1169,1224 Stem Leaves 10 11 12

1 2

3 6 9 3

(18)

Đồ thị phân tán (tham khảo) • Scatter plot

(19)

Mơ tả liệu số • Độ đo trung tâm:

– Trung bình – Trung vị – Mode

Sự biến thiên – Miền giá trị – Miền phân vị – Phương sai

(20)

Trung bình

Trung bình tổng thể:

Trung bình mẫu:

 

1

N i

i N

x

x x x

E X

N N

       

1

n

i

i N

X

X X X

X

n n

   

 

(21)

Trung vị

Là giá trị tập liệu tăng dần. • Không bị ảnh hưởng giá trị outliers

• Gọi i vị trí trung vị

• Nếu i chẵn

• Nếu i lẻ

1

n i  

i

median X

 i  i

X X

(22)

Mode

Đo xu hướng trung tâm liệu • Khơng bị ảnh hưởng outliers

• Là giá trị thường xảy nhất

(23)

Độ đo tốt nhất

• Trung bình ln dùng outlier khơng tồn tại.

• Trung vị thường dùng khơng bị ảnh hưởng outlier • Vị trí trung vị trung bình ảnh hưởng hình dạng

(24)

Độ đo biến thiên

• Cho biết thơng tin phân tán hay

(25)

Miền giá trị (range)

• Độ đo biến thiên đơn giản nhất

• Là chênh lệch giá trị lớn

nhỏ nhất

• Miền giá trị=Xmax-Xmin

(26)

Miền phân vị

• Có thể loại bỏ outlier cách sử

dụng miền phân vị

• Miền phân vị: (interquatile range) 25% 25% 25% 25%

1

Q Q2 Q3

(27)

Đồ thị boxplot

• Biểu diễn miền phân vị điểm outliers

• Cơng thức:

• Q1=0,25(n+1)

(28)

Đồ thị boxplot

(29)

Phương sai

• Phương sai tổng thể • Phương sai mẫu

(30)

Phương sai

• Phương sai tổng thể

• Phương sai mẫu

    2 1 N i i x V X N       

   2  

1

1 n 1 n

i i

i i

S X X X X

nn

(31)

Phương sai

• Phương sai mẫu hiệu chỉnh:

• Phương sai mẫu: (đã biết trung bình tổng thể )

  

2 1 1 1 n i i n

S X X S

nn

        *2 1 i n i S X n

    S*2 X 2 X

(32)

Tính thống kê mẫu

• Cho mẫu định lượng cụ thể thu gọn:

• Trung bình mẫu:

1

1 k

i i i

x n x

n

 

(33)

Tính thống kê mẫu

• Phương sai mẫu:

• Phương sai mẫu hiệu chỉnh:

   2

2 2

1

1 k 1 k

i i i i

i i

s n x x n x x

nn

     

  2

2 1 1 1 k i i i n

s n x x s

nn

  

  

(34)

Các thống kê mẫu_cụ thể

• Độ lệch chuẩn mẫu:

• Độ lệch chuẩn mẫu hiệu chỉnh:

2

s  s

(35)

Tỷ lệ mẫu_tổng quát

• Xét tổng thể định tính, dấu hiệu nghiên cứu tính

chất A, tỉ lệ tổng thể p

• Lấy mẫu ngẫu nhiên kích thước n: (X1, , Xn)

• Tỉ lệ mẫu tổng quát:

• Xi biến ngẫu nhiên có phân phối A(p)

• Tỷ lệ mẫu = trung bình n biến ngẫu nhiên n

X X X

k

F X

n n

  

(36)

Tỷ lệ mẫu_cụ thể

• Xét tổng thể định tính, dấu hiệu nghiên cứu tính chất

A, tỉ lệ tổng thể p

• Lấy mẫu cụ thể kích thước n: (x1, x2 , , xn)

• Tỉ lệ mẫu cụ thể:

• k: số phần tử mẫu có tính chất A. • n: cỡ mẫu

1 n

x x x

k f

n n

(37)

Tính thống kê mẫu

Điều tra thời gian sử dụng internet tuần 90 sinh viên trường ta bảng số liệu sau:

Hãy tính thống kê mẫu sau:

a) Trung bình mẫu, phương sai mẫu, phương sai mẫu hiệu chỉnh?

b) Tỷ lệ sinh viên mẫu có thời gian sử dụng Thời gian (giờ)

(38)

Cách 1_Lập bảng

xi ni xini (xi)2n i … … … … … … … … Tổng i n

  x ni i

2 i i x ni i x n x n      2 2 i i x n

sx

s2  n  s

i

(39)

Cách 1_Lập bảng

xi ni xini (xi)2n i

3 21 63

4 32 128

5 17 85 425

6 24 144 864 20 140 980 14 112 896

(40)

Cách 1_Lập bảng

• Cỡ mẫu:

• Trung bình mẫu:

• Phương sai mẫu:

• Phương sai mẫu hiệu chỉnh:

90

i

n  n

534 5,9333 90 i i x n x n        2 2 2,0844    

x ni i

s x

n

 

2 n  2,1078

s s

(41)

Cách dùng máy tính 570ES

1 Shift + + + = + =: Reset máy

2 Shift + Mode +  + + 1: bật tần số

3 Mode + + 1: vào tính thống kê biến Khi ta có bảng sau:

X FREQ

(42)

Cách dùng máy tính 570ES • Ta nhập vào sau:

• Nhấn AC để thốt.

X FREQ

1

2

3 17

4 24

5 20

(43)

Cách 2_dùng máy tính 570ES

6 Lấy số liệu thống kê: Shift + + 5. Ta có bảng sau:

Tương ứng:

1: cỡ mẫu 2: trung bình mẫu

3 Độ lệch chuẩn mẫu.

4 Độ lệch chuẩn mẫu hiệu chỉnh.

1: n 2:

3: x 4: sx

x

(44)

Đối với FX 500MS 570MS

1 Reset máy: Shift + Mode + + = + = Vào hệ SD:

• Máy 500MS: Mode + 2

• Máy 570MS: Mode + Mode + 1

3 Nhập liệu: “Giá trịShift , Tần sốM+”

• 3Shift , 7M+

• Nhập đến hết Nhấn AC

4 Lấy số liệu:

(45)

Ví dụ 1

Đường kính (mm) 100 chi tiết máy sản xuất kết cho bảng sau:

a) Tính thống kê mẫu? b) Tính tỷ lệ chi tiết từ

20mm trở lên mẫu?

Đường kính Số chi tiết

(46)

Ví dụ 1

•Ta viết lại mẫu:

•Từ mẫu ta có: •Cỡ mẫu: n=100

•Trung bình mẫu: x=20,0015 •

xi 19,825 19.875 19.925 19.975 20.025

ni 16 28 23

20.075 20.125 20.175

(47)

Định lí Giới hạn trung tâm (CLT)

1 Cho X1, X2, …, Xn n đại lượng ngẫu nhiên độc lập

tồn phần

2 Nếu: thì:

Với n đủ lớn

Trong thống kê ta coi n>30 đủ lớn

i  ;  iE X  V X 

2 n ~ ,

X X X

X N

n n

 

  

  

 

(48)

Phân phối Khi bình phương

• Bnn X gọi có phân phối Khi bình

phương với n bậc tự hàm mật độ có dạng:

• Ký hiệu:

  2 1 , 0 2 2

0 , 0

n x

n x e x

n f x x                     ~

(49)

Phân phối Khi bình phương

• Nếu X~χ2(n)

• Đồ thị:

   ; ar  2

(50)

Đồ thị hàm mật độ

4

n

5

(51)

Đồ thị hàm mật độ Khi BP

(52)

Đồ thị hàm mật độ

• Khi n=30, vẽ đoạn từ đến 53

(trong khoảng độ lệch chuẩn)

   

30 2 60 7 74

 

 

  ,

E X n

(53)

Tính chất X~2(n)

   

 

2

1 2

2

1 2

) ~ ; ~

~

Nếu và độc lập thì:

X

a X n X n

X n n

 

 

   

2

) ~ 0,1

2

Nếu thì F

n

X n

b X n N

n

(54)(55)

Quan hệ với pp N(0,1)

• Cho n biến ngẫu nhiên độc lập có

phân phối N(0,1).

• Khi đó:

 

2

1

~

n

i i

Xn

 

~ 0,1

i

(56)

Quan hệ với pp N(0,1)

• Cho n biến ngẫu nhiên độc lập có

cùng phân phối chuẩn.

• Khi đó:

  2 ~ n i i X n            

 

~ ,

i

(57)

Quan hệ với pp N(0,1)

• Cho n biến ngẫu nhiên độc lập có

cùng phân phối chuẩn.

• Khi đó:

  2 ~ 1 n i X X n              2 ~ , 1 i n X N

X X X X

n

 

(58)

Phân phối Student t(n)

• Kí hiệu: X ~ t(n)

• Bnn X gọi có phân phối Student với

n bậc tự hàm mật độ có dạng:

 

 1

(59)

Quan hệ với Chuẩn Khi BP

• Cho X, Y hai biến ngẫu nhiên độc

lập.

• Khi đó:

   

~ 0,1 ; ~

X N Yn

 

~

XX n

T t n

Y Y

(60)(61)(62)(63)

Tính chất             ~

) 0 1 ;

) 2

2

) 0,1

Nếu thì:

F n

T t n

a E T n

n

b V T n

n

c T   N

 

 

(64)

Dị bảng xác suất Khi BP

• Ký hiệu:

• Là giá trị cho:

 n

 

  , với ~  

P Z   n  Zn

 n

 

 Đưa dạng

 Lấy giao hàng

cột tương ứng

(65)

Dò bảng xác suất Student

• Ký hiệu:

• Là giá trị cho:

 

t n

 

  , với ~  

P Z t n   Z t n

 

(66)

Ví dụ

• Cho

• Tìm xác suất sau:

 

2 20

Z

 

 

 

) 0,95

) 8,2604 ?

) 10,8508 31,4104 ?

a P Z a

b P Z

c P X

 

 

(67)

Ví dụ

• Cho

• Tìm xác suất sau:

 15

Z T

 

 

 

) 0,025

) 2,4899 ?

) 2,0343 2,9467 ?

a P Z a

b P Z

c P X

 

 

(68)

Ví dụ 2

• Cho

• Tìm xác suất sau:

 48

Z T

 

 

 

) 2,7045 ?

) 1,7232 2,2990 ?

) 0,025

a P Z

b P X

d P Z b

 

  

(69)

Phân phối Fisher - Snedecor

• Ta định nghĩa thơng qua phân phối Khi

bình phương.

• Xét hai biến ngẫu nhiên độc lập.

• Đặt:

   

2

~ ; ~

Xn Ym

/ /

X n mX

F

Y m nY

(70)

Phân phối Fisher - Snedecor

• Khi ta nói F có phân phối Fisher –

Snedecor với (n,m) bậc tự

  2 , 2 0 1 2 2 n n n m n m n x

f x x

n m m

(71)

Đồ thị hàm mật độ

• Gần giống

(72)(73)

Đồ thị hàm mật độ

 ,  mF 1,0

n

F n m   N

 

(74)

Tính chất

• Cho X~F(n,m) thì:

              2 , 2 2 2 2 , 4 2 4 m

E X m

m

m n m

V X m

n m m

 

 

 

 

 ,  mF 1,0

n

F n m   N

 

(75)

Tổng thể Mẫu TQ Mẫu cụ thể

Kích thước N n n

Trung bình Phương sai Độ lệch chuẩn

Tỷ lệ A

Tổng thể mẫu

 

E X

 

 

2 V X

 

 

V X

 

 

p P A

X

 S ; ;S2  S*

 ; ; *

S S S

F

x

 s ; ;s2  s*

*

; ;

(76)

Các tham số tổng thể  Trung bình cộng tổng thể:

 Phương sai tổng thể:

(77)

Các tham số tổng thể

• Xét tổng thể định tính, dấu hiệu A. • Tỉ lệ tổng thể:

• N: kích thước tổng thể.

• M: số phần tử tổng thể có dấu hiệu A.

M p

N

(78)

Ví dụ

Tổng thể nghiên cứu là xí nghiệp có 40 cơng nhân

với dấu hiệu nghiên cứu suất lao động (sản phẩm/ đơn vị thời gian)

• Tính trung bình, phương sai tổng thể

• Tính tỉ lệ cơng nhân có suất cao 65sp.

(79)

Nhắc lại thống kê mẫu

• Thống kê mẫu: hàm bnn thành phần

mẫu

• Cho mẫu ngẫu nhiên: W=(X1;X2;…Xn), thống kê mẫu

có dạng:

• T=f(X1;X2;…;Xn) • Thống kê T bnn.

• Các thống kê mẫu khảo sát: trung bình, phương sai, tỷ

(80)

Định lí Giới hạn trung tâm (CLT)

1 Cho n biến ngẫu nhiên độc lập Cùng kỳ vọng, phương sai

3 Số lượng biến ngẫu nhiên đủ lớn (>30)

4 Trung bình n biến ngẫu nhiên có phân phối

xấp xỉ phân phối chuẩn

(81)

PHÂN PHỐI MẪU

• Trung bình mẫu • Tỷ lệ mẫu

(82)

Tính chất trung bình mẫu

• Cho tổng thể có kì vọng  phương sai 2

• Lấy mẫu ngẫu nhiên cỡ n.

• Gọi trung bình mẫu Ta có:

   

2

) )

i E X

ii V X

n

 

 

(83)

Phân phối trung bình mẫu

Tổng thể Trung bình mẫu Kích thước mẫu

Tùy ý

Không chuẩn n>30 Không chuẩn

nhưng đối xứng

Có thể với n nhỏ

 

~ ;

X N   X ~ N ;

(84)

Chuẩn hóa ppxs

Tổng thể TB mẫu Chuẩn hóa Chuẩn,

đã biết 

n>30, biết 

n>30, chưa biết 

Chuẩn, n<30 chưa biết 

2 ~ ; X N n         ; X N n          ; X N n              ~ 0;1 X n

ZN

       ~ X n

Z t n

S         ~ 0;1 X n

ZN

 

2

~ ;

(85)

Ví dụ 1

• Giả sử bạn lấy mẫu 100 giá trị từ tổng

(86)

Ví dụ 2

Một mẫu kích thước n rút từ tổng thể phân phối chuẩn với trung bình μ độ lệch chuẩn 10 Hãy xác định n cho:

 

 

) 10 10 0,9544

) 2 2 0,9544

 

 

    

    

a P X

(87)

Ví dụ 3

Trọng lượng loại sản phẩm biến ngẫu nhiên phân phối chuẩn với trung bình 20,5 độ lệch chuẩn

(88)

Tính chất PS mẫu

• Cho tổng thể có kì vọng  phương sai 2

• Lấy mẫu ngẫu nhiên cỡ n. • Ta có:

(89)

Phân phối phương sai mẫu

Tổng thể Phương sai mẫu Kích thước mẫu

Phân phối

chuẩn Không biết Tùy ý

Không

(90)

Phân phối hàm PS mẫu

Tổng thể PS mẫu Hàm PS mẫu Chuẩn,

đã biết 

Không chuẩn biết 

Chuẩn chưa biết 

Không chuẩn

 S*

  *2 2 ~ n i i X nS Z Z n                 

2, 30

S n

    2 2 ~ n i i

n S X X

Z Z n                 S

(91)

Ví dụ

• Chiều dài loại sản phẩm bnn pp

chuẩn với trung bình 20 m độ lệch chuẩn 0,2 m Lấy mẫu ngẫu nhiên 25 sp.

a) Cho biết ppxs trung bình mẫu Tính kỳ vọng phương sai nó.

b) Xs để trung bình mẫu tối thiểu 30,06m

(92)

• Giả sử X suất lúa vùng A có pp

chuẩn với phương sai (tạ/ha)2

Lấy mẫu ngẫu nhiên kích thước 100 Tính xác suất để:

 

100 2

1

270

i i

P X X

 

 

 

(93)

Tính chất tỷ lệ mẫu

• Cho tổng thể có tỷ lệ p tính chất A. • Lấy mẫu ngẫu nhiên cỡ n.

• Gọi F tỷ lệ mẫu Ta có:

 

   

)

) 1

i E F p

ii V F p p n

 

(94)

Phân phối tỷ lệ mẫu

Tổng thể Tỷ lệ mẫu Kích thước mẫu

Phân phối

B(1,p) F N p ; p1np  n>30

 

 

 

~ 0,1 (1 )

F p n

Z N

pp

(95)

Ví dụ

• Tỷ lệ người hút thuốc vùng

(96)

Câu hỏi ơn tập

1 Mẫu ngẫu nhiên kích thước n dấu hiệu nghiên cứu X dãy gồm n biến ngẫu nhiên X1, X2,…,Xn độc lập có phân bố với X?

2 Trung bình mẫu tổng thể có dấu hiệu nghiên cứu có phân phối chuẩn có phân phối chuẩn?

(97)

Bài 3

Chiều cao niên địa phương biến ngẫu nhiên phân phối chuẩn với trung bình 170 cm độ lệch chuẩn 10cm Chọn ngẫu nhiên 31 niên vùng a) Tìm xác suất để chiều cao trung bình số niên nói không vượt 172 cm?

Ngày đăng: 01/04/2021, 19:46

Xem thêm:

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w