ước lượng chiều cao và kiểm định chiều cao trung bình.doc

ước lượng chiều cao và kiểm định chiều cao trung bình

Trang 1

BÀI THẢO LUẬN MÔN LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN

A LÝ THUYẾT

I Ước lượng các tham số của ĐLNN

Xét một ĐLNN X thể hiện trên một đám đông nào đó Các số đặc trưng của X được gọi là các tham số lý thuyết (hay tham số của đám đông) Ký hiệu chung tham số lý thuyết cần ước lượng là  Có hai phương pháp ước lượng  là:

 Ước lượng điểm

 Ước lượng bằng khoảng tin cậy

1 Ước lượng bằng khoảng tin cậy

Để ước lượng tham số θ của ĐLNN X, trước hết từ đám đông ta lấy ra mẫu ngẫu nhiên W=(X1,X2, … , Xn) Tiếp đến ta xây dựng thống kê G=f(X1,X2, … , Xn, θ), sao cho quy luật phân phối xác suất của G hoàn toàn xác định (không phụ thuộc vào tham số θ) Với xác suất γ = 1 – α cho trước, ta xác định cặp giá trị α1, α2 thỏa mãn các điều kiện α1 ≥ 0, α2 ≥ 0 và

α1 + α2 = α Vì quy luật phân phối xác suất của G ta đã biết, ta tìm được các phân vị g1-α1 α1 và

gα2 sao cho P(G > g1-α1 α1) = 1 – α1 và P(G > ga2)= α2

Khi đó: P(g1-α1 α1 < G < ga2) = 1 -α1 α1 -α1 α2 = 1 – α = γ

Cuối cùng bằng cách biến đổi tương đương ta có:

P(θ*

1 < θ < θ*

2) = 1 – α = γ Trong đó: γ = 1 – α* được gọi là là độ tin cậy,

(θ*

1, θ*

2) được gọi là độ tin cậy,

I = θ*

2 – θ*

1 được gọi là độ dài của khoảng tin cậy

Người ta thường chọn α1 = α2 = α/2 Nếu chọn α1 = 0 và α2 = α hoặc chọn α1 = α và α2

= 0 thì ta sẽ có khoảng tin cậy một phía (dùng để ước lượng giá trị tối thiểu hoặc giá trị tối

đa của θ)

2 Ước lượng các tham số của ĐLNN

2.1 Ước lượng kỳ vọng toán của ĐLNN

Để ước lượng kỳ vọng toán E(X) = µ của ĐLNN X, từ đám đông ta lấy mẫu W=(X1,X2,…,Xn) Từ mẫu này ta tìm được trung bình mẫu X và phương sai mẫu điều chỉnh S’² Ta sẽ ước lượng µ thông qua X Xét các trường hợp sau:

a) ĐLNN X trên đám đông có phân phối chuẩn đã biết.

b) ĐLNN X trên đám đông có phân phối chuẩn chưa biết.

c) Chưa biết quy luật phân phối xác suất của X nhưng n>30.

Trang 2

Khi n lớn, X có phân phối xấp xỉ chuẩn Mặt khác ta luôn có E X     và  

2

Var X

n





,

Ta xây dựng thống kê: U=~ N(0,1)

 Khoảng tin cậy đối xứng ( lấy α1 = α2 = α/2)

Với độ tin cậy γ= 1 – α cho trước ta tìm được phân vị chuẩn u2 sao cho:

P(|U| < u 2) = 1 – α =γ

Thay biểu thức của U vào công thức trên ta có:

P(|X -α1 µ| < u 2) = 1 – α =γ

 P(X – ε < µ < X + ε ) = 1 – α =γ

Trong đó :

ε = u 2 là sai số của ước lượng

γ = 1 – α là độ tin cậy

(X – ε; X + ε) là khoảng tin cậy ngẫu nhiên của µ Ở đây ta cần chú ý rằng : Với xác suất bằng γ = 1 – α khoảng tin cậy ngẫu nhiên này chụp đúng µ (µ là 1 số xác định )

Trong 1 lần lấy mẫu ta tìm được 1 giá trị cụ thể x của X Khi đó ta có 1 khoảng tin cậy

cụ thể của µ là (x – ε; x + ε)

Ta có những bài toán sau:

Bài toán 1: Biết kích thước mẫu n, biết độ tin cậy γ = 1 – α, tìm sai số ε ( hoặc khoảng tin

cậy ) Vì biết γ = 1 – α tra bảng ta tìm được u 2 , từ đó ta tìm được sai số ε = u 2 và

khoảng tin cậy của µ

Bài toán 2: Biết kích thước mẫu n và sai số ε, cần tìm độ tin cậy γ Biết n và ε, ta tìm được

2

u .tra bảng tìm được α/2 từ đó tìm được độ tin cậy γ = 1 – α

Từ công thức tìm khoảng tin cậy ta thấy rằng sai số của ước lượng bằng 1 nửa độ dài của khoảng tin cậy Vì vậy nếu biết khoảng tin cậy đối xứng (a,b) thì ta có thể tính được sai

số của ước lượng theo công thức

ε=

Bài toán 3: Biết độ tin cậy γ, biết sai số ε, cần tìm kích thước mẫu n Biết γ = 1 – α, ta tìm

được u 2 Ta tìm được 2 2 2

2

u



 Đó chính là kích thước mẫu tối thiểu cần tìm

Trang 3

Chú ý 1 : Nếu chưa biết σ, nhưng kích thước mẫu lớn (n>30) Ta có thể thay σ bằng ước lượng không chệch tốt nhất của nó là s’

Chú ý 2 : Trong trường hợp biết µ cần ước lượng X biến đổi tương đương công thức ta có:

P( µ -α1 ε < X < µ + ε ) = 1 – α = γ

Vậy khoảng tin cậy của X là ( µ -α1 ε, µ + ε )

 Khoảng tin cậy phải (lấy 1  0, 2  ; dùng để ước lượng giá trị tối thiểu của µ)

Ta vẫn dùng thống kê U X N  0;1 

n







Với độ tin cậy γ = 1-α1 α cho trước ta tìm được phân vị chuẩn u sao cho:

P(U< u )=1-α1 α=γ

Thay vào biểu thức của U vào công thức trên ta có:

P ( X

u







 ) = 1 – α = γ

P X u 1



Như vậy, khoảng tin cậy phải đối với độ tin cậy γ = 1 – α của µ là:

X ;

n



 Khoảng tin cậy trái (lấy α2 = 0 ; α1 = α, dùng để ước lượng giá trị tối đa của µ)

Ta cũng dùng thống kê : U X N  0;1 

n







Với độ tin cậy γ = 1 – α cho trước ta tìm được u sao cho:

P(-α1 u <U) = 1 – α = γ

P X u 1



Ta có khoảng tin cậy trái với độ tin cậy γ = 1 – α của µ là

Trang 4

; X u



2.2 Ước lượng tỷ lệ.

2.3 Ước lượng phương sai của ĐLNN phân phối chuẩn.

II Kiểm định giả thuyết thống kê

1.Một số khái niệm và định nghĩa

1.1 Giả thuyết thống kê

Giả thuyết về quy luât phân phối xác suất của ĐLNN về tham số đặc trưng của đại

lựơng ngẫu nhiên hoặc tính độc lập của các ĐLNN được gọi là giả thuyết thống kê,kí hiệu

là Ho

Mọi giả thuyết khác với giả thuyết H đươc gọi là đối thuyết,kí hiêu là H1.Ho và H1

lập thành một cặp giả thuyết thống kê Ta quy định: khi đã chọn cặp giả thuyết Ho và H1 thì nếu bác bỏ Ho sẽ chấp nhận H1

1.2 Tiêu chuẩn kiểm định

Để kiểm đinh cặp giả thuyết thống kê Ho và H1,từ đám đông ta chọn mẫu ngẫu nhiên:W=(X1,…,Xn).dựa vào mẫu trên ta xây dưng thống kê

 1, , n, 0

Trong đó 0 là một số tham số liên quan đến Ho sao cho nếu đúng Ho thì quy luật

phân phối xác suất của G hoàn toàn xác định Khi đó thống kê G được gọi là tiêu chuẩn kiểm định.

1.3 Miền bác bỏ

Để xây dựng miền bác bỏ ta sử dụng nguyên lý xác suất nhỏ:Nếu một biến cố có xác suất nhỏ ta có thể coi nó không xảy ra trong một lần thực hiện phép thử.

Vì đã biết quy luật phân phối xác suất của G, nên với một số α khá bé cho trước ta có thể

tìm được miền Wα gọi là miền bác bỏ, sao cho nếu giả thuyết Ho đúng thì xác suất để G

nhận giá trị thuộc miền Wα bằng α:

P(G  Wα/Ho)=α

Vì α khá bé theo nguyên lý xác suất nhỏ ta có thể coi biến cố (G  Wα/Ho) không xảy ra trong một lần thưc hiện phép thử.Nên nếu từ một mẫu cụ thể w=(x1, , xn) ta tìm được giá trị thực nghiệm gtn  f x  1, , , x n 0 mà gtn W (Nghĩa là vừa thực hiện phếp thử thấy biến cố (G  Wα/Ho) xảy ra)ta có cơ sở bác bỏ giả thuyết Ho

Kí hiêu W là miền bù của Wα Khi đó ta có P G W W    0   1  Vì α khá bé nên 1-α1 α khá gần 1 Theo nguyên lý xác suất lớn: Nếu một biến cố có xác suất rất gần 1 ta có thể coi nó sẽ xảy ra trong một lần thực hiện phép thử, nếu trong một lần lấy mẫu ta thấy

Trang 5

g  W thì giả thuyết Ho tỏ ra hợp lí,chưa có cơ sở bác bỏ Ho Vì vậy ta có quy tắc kiểm định sau:

Từ đám đông ta lấy ra một mẫu cụ thể kích thước n: w=(x1,…,xn) và tính gtn

 Nếu gtn W thì bác bỏ Ho chấp nhận H1

 Nếu gtn W thì chưa có cơ sở bác bỏ Ho

1.4 Các loại sai lầm

Theo quy tắc kiểm định trên ta có thể mắc hai loại sai lầm như sau:

 Sai lầm loại một là loại sai lầm bác bỏ giả thuyết Ho khí chính Ho đúng Ta có xác suất mắc sai lầm loại một bằng α Giá tri α được gọi là mức ý nghĩa.

 Sai lầm loai hai là sai lầm chấp nhận Ho khi chính nó sai.Nếu ký hiệu xác suất mắc

sai lầm loại hai là ß thì ta có

P G W H    / 1  

2 Các trường hợp kiểm định

2.1.Kiểm định giả thuyết về kỳ vọng toán của một ĐLNN

Giả sử cần nghiên cứu một dấu hiệu X thể hiện trên một đám đông Kí hiệu E(X)

= µ, Var(X) = σ2 , trong đó µ chưa biết, từ một cơ sở nào đó người ta tìm được µ = µ0, nhưng nghi ngờ về điều này Với mức ý nghĩa α cho trước ta cần kiểm định giả thuyết H0: µ

= µ0

Từ đám đông ta lấy ra mẫu : W=( ,……, ) và tính được các đặc trưng mẫu:

=

S’2 =

a) ĐLNN X trên đám đông có phân phối chuẩn đã biết.

b) ĐLNN X trên đám đông có phân phối chuẩn chưa biết.

c) Chưa biết quy luật phân phối xác suất của X nhưng n>30.

Khi n lớn, X có phân phối xấp xỉ chuẩn Mặt khác ta luôn có E X     và

 

2

Var X

n



,

* Xây dựng tiêu chuẩn kiểm định (XDTCKĐ):

Trang 6

U=

Nếu H0 đúng thì U~N(0,1) Xét những bài toán cụ thể sau:

 Bài toán 1:

Với α cho trước ta có thể tìm được sao cho P(|U|> ) = α Ta có miền bác bỏ:

= { trong đó

=

 Bài toán 2 :

Với α cho trước, ta có thể tìm được sao cho P(U > ) = α Từ đó ta có miền bác bỏ:

= {

 Bài toán 3:

Với α cho trước ta có thể tìm được phân vị chuẩn sao cho P(U< -α1 ) = α Do đó ta có miền bác bỏ:

= {

* Phương pháp P-giá trị (P-Value)

1 Công thức tìm P-giá trị:

+ Đối với bài toán:

Trang 7

Ta có P-α1 giá trị = P(U> )

Trong đó U~N(0,1) và =

+ Đối với bài toán:

Ta có P-α1 giá trị = P(U< )

+ đối với bài toán:

Ta có P-α1 giá trị = 2P(U>| |)

2 Kết luận sau khi tìm được P-giá trị

+ Cách thứ nhất

_ Nếu P-α1 giá trị ≥ 0.05: chưa có cơ sở để bác bỏ

_ Nếu 0.01 ≤ P-α1 giá trị <0.05: có cơ sở để bác bỏ

_ Nếu P-α1 giá trị <0.01: có cơ sở chắc chắn để bác bỏ

+ Cách thứ hai: quy định trước mức ý nghĩa α Tính P-α1 giá trị rồi so sánh với α:

Nếu P-α1 giá trị < α thì bác bỏ

Nếu P-α1 giá trị ≥ α chưa có cơ sở bác bỏ

Chú ý: Các công thức tìm P-α1 giá trị trên còn được dùng cho các bài toán kiểm định giả

thuyết thống kê khác, trong đó có dùng tiêu chuẩn U

2.2.Kiểm định giả thuyết về phương sai của ĐLNN phân phối chuẩn

B BÀI TẬP

I Đề bài

1

Ước lượng chiều cao trung bình của nam sinh viên Đại học Thương mại với độ tin cậy 95%

2

Trang 8

Theo báo cáo của Viện Khoa học Thể dục thể thao năm 2004, chiều cao trung bình của nam thanh niên Việt Nam là 163,14 cm với mức ý nghĩa 5% Kiểm định giả thuyết cho rằng chiều cao nam sinh viên Đại học Thương mại cao hơn 163,14 cm

II Giải bài tập

Câu 1.

Gọi X là chiều cao của nam sinh viên ĐH thương mại

X là chiều cao trung bình của nam sinh viên ĐH thương mại trên mẫu

 là chiều cao trung bình của nam sinh viên ĐH thương mại trên đám đông

a) Mẫu số liệu

_ Bảng điều tra chiều cao 150 nam sinh viên Đại học Thương mại

CHIỀU CAO (cm)

Trang 9

29 Nguyễn Mạnh Dũng 08D140188 K44I4 185

Trang 10

73 Khuất Đình Hùng 08D140252 K44I5 171

Trang 11

117 Lê Xuân Đô 09D130328 K45E5 173

_ Bảng thống kê

Trang 12

170 5 1/30 850 144500

b) Giải quyết bài toán

Ta có :

 Trung bình mẫu:

1

170,34

n i i

Phương sai mẫu điều chỉnh:

1

n i i

 Độ lệch tiêu chuẩn mẫu điều chỉnh:

 s '  s '2  4.34

2

;

n





Ta xây dựng thống kê:

U X N  0;1 

n







Với độ tin cậy 0,95 ta tìm được phân vị u 2 sao cho

174,67

17,11184564

4,14

150>30

Trang 13

P u    2  U u   2   

Thay U vào ta được:

P u  2  X  n u  2 



P X u 2 X u 2

Đặt u 2

n







 , ta được:

P X       X     

Theo nguyên lý xác súât lớn, vì 0,95 là khá lớn nên khoảng tin cậy đối xứng của là

 X   ; X   

Ta có:

0,95 1    0,05 u 2 u 0,025 1,96



Vì n=150 là khá lớn, nên ta lấy:   s' 4,34

Vậy 1,96. 4,34 0,85

100

Kết luận: với độ tin cậy 95%, chiều cao trung bình của nam sinh viên trường ĐH Thương

Mại nằm trong khoảng(174,67 – 0,66; 174,67 + 0,66)

=(174,01; 175,33).cm.

Câu 2.

Gọi X là chiều cao của nam sinh viên ĐH thương mại

X là chiều cao trung bình của nam sinh viên ĐH thương mại trên mẫu

 là chiều cao trung bình của nam sinh viên ĐH thương mại trên đám đông

Với mức ý nghĩa  0,05 ta cần kiểm định giả thuyết 0 0

1

H H











Vì n=100>30 X  N    ; 2 

2

;

n





4,14 4,14

Trang 14

Ta xây dựng tiêu chuẩn kiểm định: U X 0

n







Nếu H 0đúng thì U  N  0;1 

Với mức ý nghĩa  0,05 ta tìm đước phân vị chuẩn u sao cho

P U u      

Vì  0,05 là khá bé nên theo nguyên lý xác suất nhỏ, ta có được miền bác bỏ:

W    u tn tn : u  u  

Ta có: utn   x   n 0 170,34

' 4,34

x s



Ta có:  0,05 u u0,051,65

W

utn



Bác bỏ H0 chấp nhận H1.

Kết luận: Với mức ý nghĩa  0,05 ta có thể nói rằng chiều cao trung bình của nam sinh viên trường ĐH Thương Mại cao hơn 163,14 cm.

174,67 4,14

Tiêu đề	Ước lượng chiều cao và kiểm định chiều cao trung bình
Trường học	Trường Đại Học Quốc Gia Hà Nội
Chuyên ngành	Lý thuyết xác suất và thống kê
Thể loại	Bài thảo luận
Thành phố	Hà Nội

Định dạng
Số trang	14
Dung lượng	904 KB