ước lượng chiều cao và kiểm định chiều cao trung bình
Trang 1BÀI THẢO LUẬN MÔN LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN
A LÝ THUYẾT
I Ước lượng các tham số của ĐLNN
Xét một ĐLNN X thể hiện trên một đám đông nào đó Các số đặc trưng của X được gọi là các tham số lý thuyết (hay tham số của đám đông) Ký hiệu chung tham số lý thuyết cần ước lượng là Có hai phương pháp ước lượng là:
Ước lượng điểm
Ước lượng bằng khoảng tin cậy
1 Ước lượng bằng khoảng tin cậy
Để ước lượng tham số θ của ĐLNN X, trước hết từ đám đông ta lấy ra mẫu ngẫu nhiên W=(X1,X2, … , Xn) Tiếp đến ta xây dựng thống kê G=f(X1,X2, … , Xn, θ), sao cho quy luật phân phối xác suất của G hoàn toàn xác định (không phụ thuộc vào tham số θ) Với xác suất γ = 1 – α cho trước, ta xác định cặp giá trị α1, α2 thỏa mãn các điều kiện α1 ≥ 0, α2 ≥ 0 và
α1 + α2 = α Vì quy luật phân phối xác suất của G ta đã biết, ta tìm được các phân vị g1-α1 α1 và
gα2 sao cho P(G > g1-α1 α1) = 1 – α1 và P(G > ga2)= α2
Khi đó: P(g1-α1 α1 < G < ga2) = 1 -α1 α1 -α1 α2 = 1 – α = γ
Cuối cùng bằng cách biến đổi tương đương ta có:
P(θ*
1 < θ < θ*
2) = 1 – α = γ Trong đó: γ = 1 – α* được gọi là là độ tin cậy,
(θ*
1, θ*
2) được gọi là độ tin cậy,
I = θ*
2 – θ*
1 được gọi là độ dài của khoảng tin cậy
Người ta thường chọn α1 = α2 = α/2 Nếu chọn α1 = 0 và α2 = α hoặc chọn α1 = α và α2
= 0 thì ta sẽ có khoảng tin cậy một phía (dùng để ước lượng giá trị tối thiểu hoặc giá trị tối
đa của θ)
2 Ước lượng các tham số của ĐLNN
2.1 Ước lượng kỳ vọng toán của ĐLNN
Để ước lượng kỳ vọng toán E(X) = µ của ĐLNN X, từ đám đông ta lấy mẫu W=(X1,X2,…,Xn) Từ mẫu này ta tìm được trung bình mẫu X và phương sai mẫu điều chỉnh S’² Ta sẽ ước lượng µ thông qua X Xét các trường hợp sau:
a) ĐLNN X trên đám đông có phân phối chuẩn đã biết.
b) ĐLNN X trên đám đông có phân phối chuẩn chưa biết.
c) Chưa biết quy luật phân phối xác suất của X nhưng n>30.
Trang 2Khi n lớn, X có phân phối xấp xỉ chuẩn Mặt khác ta luôn có E X và
2
Var X
n
,
Ta xây dựng thống kê: U=~ N(0,1)
Khoảng tin cậy đối xứng ( lấy α1 = α2 = α/2)
Với độ tin cậy γ= 1 – α cho trước ta tìm được phân vị chuẩn u2 sao cho:
P(|U| < u 2) = 1 – α =γ
Thay biểu thức của U vào công thức trên ta có:
P(|X -α1 µ| < u 2) = 1 – α =γ
P(X – ε < µ < X + ε ) = 1 – α =γ
Trong đó :
ε = u 2 là sai số của ước lượng
γ = 1 – α là độ tin cậy
(X – ε; X + ε) là khoảng tin cậy ngẫu nhiên của µ Ở đây ta cần chú ý rằng : Với xác suất bằng γ = 1 – α khoảng tin cậy ngẫu nhiên này chụp đúng µ (µ là 1 số xác định )
Trong 1 lần lấy mẫu ta tìm được 1 giá trị cụ thể x của X Khi đó ta có 1 khoảng tin cậy
cụ thể của µ là (x – ε; x + ε)
Ta có những bài toán sau:
Bài toán 1: Biết kích thước mẫu n, biết độ tin cậy γ = 1 – α, tìm sai số ε ( hoặc khoảng tin
cậy ) Vì biết γ = 1 – α tra bảng ta tìm được u 2 , từ đó ta tìm được sai số ε = u 2 và
khoảng tin cậy của µ
Bài toán 2: Biết kích thước mẫu n và sai số ε, cần tìm độ tin cậy γ Biết n và ε, ta tìm được
2
u .tra bảng tìm được α/2 từ đó tìm được độ tin cậy γ = 1 – α
Từ công thức tìm khoảng tin cậy ta thấy rằng sai số của ước lượng bằng 1 nửa độ dài của khoảng tin cậy Vì vậy nếu biết khoảng tin cậy đối xứng (a,b) thì ta có thể tính được sai
số của ước lượng theo công thức
ε=
Bài toán 3: Biết độ tin cậy γ, biết sai số ε, cần tìm kích thước mẫu n Biết γ = 1 – α, ta tìm
được u 2 Ta tìm được 2 2 2
2
u
Đó chính là kích thước mẫu tối thiểu cần tìm
Trang 3Chú ý 1 : Nếu chưa biết σ, nhưng kích thước mẫu lớn (n>30) Ta có thể thay σ bằng ước lượng không chệch tốt nhất của nó là s’
Chú ý 2 : Trong trường hợp biết µ cần ước lượng X biến đổi tương đương công thức ta có:
P( µ -α1 ε < X < µ + ε ) = 1 – α = γ
Vậy khoảng tin cậy của X là ( µ -α1 ε, µ + ε )
Khoảng tin cậy phải (lấy 1 0, 2 ; dùng để ước lượng giá trị tối thiểu của µ)
Ta vẫn dùng thống kê U X N 0;1
n
Với độ tin cậy γ = 1-α1 α cho trước ta tìm được phân vị chuẩn u sao cho:
P(U< u )=1-α1 α=γ
Thay vào biểu thức của U vào công thức trên ta có:
P ( X
u
) = 1 – α = γ
P X u 1
Như vậy, khoảng tin cậy phải đối với độ tin cậy γ = 1 – α của µ là:
X ;
n
Khoảng tin cậy trái (lấy α2 = 0 ; α1 = α, dùng để ước lượng giá trị tối đa của µ)
Ta cũng dùng thống kê : U X N 0;1
n
Với độ tin cậy γ = 1 – α cho trước ta tìm được u sao cho:
P(-α1 u <U) = 1 – α = γ
P X u 1
Ta có khoảng tin cậy trái với độ tin cậy γ = 1 – α của µ là
Trang 4; X u
2.2 Ước lượng tỷ lệ.
2.3 Ước lượng phương sai của ĐLNN phân phối chuẩn.
II Kiểm định giả thuyết thống kê
1.Một số khái niệm và định nghĩa
1.1 Giả thuyết thống kê
Giả thuyết về quy luât phân phối xác suất của ĐLNN về tham số đặc trưng của đại
lựơng ngẫu nhiên hoặc tính độc lập của các ĐLNN được gọi là giả thuyết thống kê,kí hiệu
là Ho
Mọi giả thuyết khác với giả thuyết H đươc gọi là đối thuyết,kí hiêu là H1.Ho và H1
lập thành một cặp giả thuyết thống kê Ta quy định: khi đã chọn cặp giả thuyết Ho và H1 thì nếu bác bỏ Ho sẽ chấp nhận H1
1.2 Tiêu chuẩn kiểm định
Để kiểm đinh cặp giả thuyết thống kê Ho và H1,từ đám đông ta chọn mẫu ngẫu nhiên:W=(X1,…,Xn).dựa vào mẫu trên ta xây dưng thống kê
1, , n, 0
Trong đó 0 là một số tham số liên quan đến Ho sao cho nếu đúng Ho thì quy luật
phân phối xác suất của G hoàn toàn xác định Khi đó thống kê G được gọi là tiêu chuẩn kiểm định.
1.3 Miền bác bỏ
Để xây dựng miền bác bỏ ta sử dụng nguyên lý xác suất nhỏ:Nếu một biến cố có xác suất nhỏ ta có thể coi nó không xảy ra trong một lần thực hiện phép thử.
Vì đã biết quy luật phân phối xác suất của G, nên với một số α khá bé cho trước ta có thể
tìm được miền Wα gọi là miền bác bỏ, sao cho nếu giả thuyết Ho đúng thì xác suất để G
nhận giá trị thuộc miền Wα bằng α:
P(G Wα/Ho)=α
Vì α khá bé theo nguyên lý xác suất nhỏ ta có thể coi biến cố (G Wα/Ho) không xảy ra trong một lần thưc hiện phép thử.Nên nếu từ một mẫu cụ thể w=(x1, , xn) ta tìm được giá trị thực nghiệm gtn f x 1, , , x n 0 mà gtn W (Nghĩa là vừa thực hiện phếp thử thấy biến cố (G Wα/Ho) xảy ra)ta có cơ sở bác bỏ giả thuyết Ho
Kí hiêu W là miền bù của Wα Khi đó ta có P G W W 0 1 Vì α khá bé nên 1-α1 α khá gần 1 Theo nguyên lý xác suất lớn: Nếu một biến cố có xác suất rất gần 1 ta có thể coi nó sẽ xảy ra trong một lần thực hiện phép thử, nếu trong một lần lấy mẫu ta thấy
Trang 5g W thì giả thuyết Ho tỏ ra hợp lí,chưa có cơ sở bác bỏ Ho Vì vậy ta có quy tắc kiểm định sau:
Từ đám đông ta lấy ra một mẫu cụ thể kích thước n: w=(x1,…,xn) và tính gtn
Nếu gtn W thì bác bỏ Ho chấp nhận H1
Nếu gtn W thì chưa có cơ sở bác bỏ Ho
1.4 Các loại sai lầm
Theo quy tắc kiểm định trên ta có thể mắc hai loại sai lầm như sau:
Sai lầm loại một là loại sai lầm bác bỏ giả thuyết Ho khí chính Ho đúng Ta có xác suất mắc sai lầm loại một bằng α Giá tri α được gọi là mức ý nghĩa.
Sai lầm loai hai là sai lầm chấp nhận Ho khi chính nó sai.Nếu ký hiệu xác suất mắc
sai lầm loại hai là ß thì ta có
P G W H / 1
2 Các trường hợp kiểm định
2.1.Kiểm định giả thuyết về kỳ vọng toán của một ĐLNN
Giả sử cần nghiên cứu một dấu hiệu X thể hiện trên một đám đông Kí hiệu E(X)
= µ, Var(X) = σ2 , trong đó µ chưa biết, từ một cơ sở nào đó người ta tìm được µ = µ0, nhưng nghi ngờ về điều này Với mức ý nghĩa α cho trước ta cần kiểm định giả thuyết H0: µ
= µ0
Từ đám đông ta lấy ra mẫu : W=( ,……, ) và tính được các đặc trưng mẫu:
=
S’2 =
a) ĐLNN X trên đám đông có phân phối chuẩn đã biết.
b) ĐLNN X trên đám đông có phân phối chuẩn chưa biết.
c) Chưa biết quy luật phân phối xác suất của X nhưng n>30.
Khi n lớn, X có phân phối xấp xỉ chuẩn Mặt khác ta luôn có E X và
2
Var X
n
,
* Xây dựng tiêu chuẩn kiểm định (XDTCKĐ):
Trang 6U=
Nếu H0 đúng thì U~N(0,1) Xét những bài toán cụ thể sau:
Bài toán 1:
Với α cho trước ta có thể tìm được sao cho P(|U|> ) = α Ta có miền bác bỏ:
= { trong đó
=
Bài toán 2 :
Với α cho trước, ta có thể tìm được sao cho P(U > ) = α Từ đó ta có miền bác bỏ:
= {
Bài toán 3:
Với α cho trước ta có thể tìm được phân vị chuẩn sao cho P(U< -α1 ) = α Do đó ta có miền bác bỏ:
= {
* Phương pháp P-giá trị (P-Value)
1 Công thức tìm P-giá trị:
+ Đối với bài toán:
Trang 7Ta có P-α1 giá trị = P(U> )
Trong đó U~N(0,1) và =
+ Đối với bài toán:
Ta có P-α1 giá trị = P(U< )
+ đối với bài toán:
Ta có P-α1 giá trị = 2P(U>| |)
2 Kết luận sau khi tìm được P-giá trị
+ Cách thứ nhất
_ Nếu P-α1 giá trị ≥ 0.05: chưa có cơ sở để bác bỏ
_ Nếu 0.01 ≤ P-α1 giá trị <0.05: có cơ sở để bác bỏ
_ Nếu P-α1 giá trị <0.01: có cơ sở chắc chắn để bác bỏ
+ Cách thứ hai: quy định trước mức ý nghĩa α Tính P-α1 giá trị rồi so sánh với α:
Nếu P-α1 giá trị < α thì bác bỏ
Nếu P-α1 giá trị ≥ α chưa có cơ sở bác bỏ
Chú ý: Các công thức tìm P-α1 giá trị trên còn được dùng cho các bài toán kiểm định giả
thuyết thống kê khác, trong đó có dùng tiêu chuẩn U
2.2.Kiểm định giả thuyết về phương sai của ĐLNN phân phối chuẩn
B BÀI TẬP
I Đề bài
1
Ước lượng chiều cao trung bình của nam sinh viên Đại học Thương mại với độ tin cậy 95%
2
Trang 8Theo báo cáo của Viện Khoa học Thể dục thể thao năm 2004, chiều cao trung bình của nam thanh niên Việt Nam là 163,14 cm với mức ý nghĩa 5% Kiểm định giả thuyết cho rằng chiều cao nam sinh viên Đại học Thương mại cao hơn 163,14 cm
II Giải bài tập
Câu 1.
Gọi X là chiều cao của nam sinh viên ĐH thương mại
X là chiều cao trung bình của nam sinh viên ĐH thương mại trên mẫu
là chiều cao trung bình của nam sinh viên ĐH thương mại trên đám đông
a) Mẫu số liệu
_ Bảng điều tra chiều cao 150 nam sinh viên Đại học Thương mại
CHIỀU CAO (cm)
Trang 929 Nguyễn Mạnh Dũng 08D140188 K44I4 185
Trang 1073 Khuất Đình Hùng 08D140252 K44I5 171
Trang 11117 Lê Xuân Đô 09D130328 K45E5 173
_ Bảng thống kê
Trang 12170 5 1/30 850 144500
b) Giải quyết bài toán
Ta có :
Trung bình mẫu:
1
1
170,34
n i i
Phương sai mẫu điều chỉnh:
1
1
1
n i i
Độ lệch tiêu chuẩn mẫu điều chỉnh:
s ' s '2 4.34
2
;
n
Ta xây dựng thống kê:
U X N 0;1
n
Với độ tin cậy 0,95 ta tìm được phân vị u 2 sao cho
174,67
17,11184564
4,14
150>30
Trang 13P u 2 U u 2
Thay U vào ta được:
P u 2 X n u 2
P X u 2 X u 2
Đặt u 2
n
, ta được:
P X X
Theo nguyên lý xác súât lớn, vì 0,95 là khá lớn nên khoảng tin cậy đối xứng của là
X ; X
Ta có:
0,95 1 0,05 u 2 u 0,025 1,96
Vì n=150 là khá lớn, nên ta lấy: s' 4,34
Vậy 1,96. 4,34 0,85
100
Kết luận: với độ tin cậy 95%, chiều cao trung bình của nam sinh viên trường ĐH Thương
Mại nằm trong khoảng(174,67 – 0,66; 174,67 + 0,66)
=(174,01; 175,33).cm.
Câu 2.
Gọi X là chiều cao của nam sinh viên ĐH thương mại
X là chiều cao trung bình của nam sinh viên ĐH thương mại trên mẫu
là chiều cao trung bình của nam sinh viên ĐH thương mại trên đám đông
Với mức ý nghĩa 0,05 ta cần kiểm định giả thuyết 0 0
1
H H
Vì n=100>30 X N ; 2
2
;
n
4,14 4,14
Trang 14Ta xây dựng tiêu chuẩn kiểm định: U X 0
n
Nếu H 0đúng thì U N 0;1
Với mức ý nghĩa 0,05 ta tìm đước phân vị chuẩn u sao cho
P U u
Vì 0,05 là khá bé nên theo nguyên lý xác suất nhỏ, ta có được miền bác bỏ:
W u tn tn : u u
Ta có: utn x n 0 170,34
' 4,34
x s
Ta có: 0,05 u u0,051,65
W
utn
Bác bỏ H0 chấp nhận H1.
Kết luận: Với mức ý nghĩa 0,05 ta có thể nói rằng chiều cao trung bình của nam sinh viên trường ĐH Thương Mại cao hơn 163,14 cm.
174,67 4,14