BÀI THẢO LUẬNLÝ THUYẾT XÁC SUẤT THỐNG KÊ TOÁNĐề bài: 1. Với độ tin cậy 95%, hãy ước lượng mức chi tiêu trung bình hàng tháng của sv ngoại tỉnh trường ĐHTM. 2. Có thông tin cho rằng hiện nay tỉ lệ sinh viên ngoại tỉnh trường Đại học Thương Mại có mức chi tiêu hàng tháng từ 2,0 triệu đồng trở lên chiếm khoảng 60%. Với mức ý nghĩa 5% hãy kiểm định lại khẳng định trên.
Trang 1KHOA THƯƠNG MẠI ĐIỆN TỬ
BÀI THẢO LUẬN
LÝ THUYẾT XÁC SUẤT THỐNG KÊ TOÁN
Đề bài:
1. Với độ tin cậy 95%, hãy ước lượng mức chi tiêu trung bình hàng tháng của
sv ngoại tỉnh trường ĐHTM
2 Có thông tin cho rằng hiện nay tỉ lệ sinh viên ngoại tỉnh trường Đại học Thương Mại có mức chi tiêu hàng tháng từ 2,0 triệu đồng trở lên chiếm khoảng 60% Với mức ý nghĩa 5% hãy kiểm định lại khẳng định trên
Hà Nội, 2013
Trang 2LỜI NÓI ĐẦU
Lý thuyết ước lượng, lý thuyết kiểm định các giả thuyết thống kê là những bộ phận quan trọng của thống kê toán Nó là phương tiện giúp ta giải quyết những bài toán nhìn từ góc độ khác liên quan đến dấu hiệu cần nghiên cứu trong tổng thể
Để ước lượng kì vọng toán của ĐLNN X, người ta giả sử trên một đám đông
có E(X)= µ và Var(X) Trong đó µ chưa biết, cần ước lượng Từ đám đông ta lấy ra kích thước mẫu n: Từ mẫu này ta tìm được trung bình mẫu X và phương sai mẫu điều chỉnh S′ 2 Dựa vào những đặc trưng mẫu này ta sẽ xây dựng thống kê G thích hợp.Với đề tài thảo luận
“ước lượng mức chi tiêu trung bình hàng tháng của sinh viên ngoại tỉnh trường ĐH Thương Mại”, nhóm chúng tôi đã xác định dùng phương pháp
ước lượng µ khi chưa biết quy luật phân phối của ĐLNN , kích thước mẫu n
đủ lớn
Kiểm định giả thuyết thống kê về tỉ lệ của đám đông, thông thường ta thường giả sử dấu hiệu X cần nghiên cứu trên đám đông có E(X) µ, Var(X) ,
trong đó µ chưa biết từ một cơ sở nào đó người ta tìm được p=po , nhưng
nghi ngờ về điều này Với mức ý nghĩa cho trước ta cần kiểm định giả thuyết : p=po Từ đám đông lấy ra mẫu: và tính được các đặc trưng mẫu:
Từ mẫu này ta tính được , rồi so sánh với để bác
bỏ hay không bác bỏ , chấp nhận hay không chấp nhận Đó là phương pháp làm của nhóm tôi trong phần 2 của vấn đề thảo luận: “Có thông tin cho
Trang 3chi tiêu hàng tháng từ 2,0 triệu đồng trở lên chiếm khoảng 60% Với mức ý nghĩa 5% hãy kiểm định lại khẳng định trên.”
Bài thảo luận này được xây dựng dựa trên cơ sở của: giáo trình Lý thuyết xác suất và thống kê toán của trường Đại học Thương Mại, giáo trình Lý thuyết xác suất và thống kê toán của trường Đại học Kinh Tế Quốc Dân cùng với các kiến thức đã tiếp thu được từ các bài giảng của giảng viên bộ môn trường Đại học Thương Mại
Do thời gian, điều kiện và khả năng có hạn, bài thảo luận nhóm chúng tôi không tránh khỏi những khiếm khuyết Chúng tôi rất mong nhận được sự cảm thông, chia sẻ và góp ý từ phía các giảng viên, các bạn sinh viên và những ai quan tâm để bài thảo luận nhóm được hoàn thiện hơn!
Tập thể nhóm 7!
Phần I: CƠ SỞ LÝ THUYẾT I.Ước lượng kỳ vọng toán của ĐLNN
Giả sử một đám đông ĐLNN có E (X) = µ và Trong đó µchưa biết, cần ước lượng Từ đám đông ta lấy ra mẫu kích thước n:
Từ đám đông ta lấy mẫu này ta tìm được trung bình mẫu và phương sai mẫu điều chỉnh Dựa vào những đặc trưng mẫu này
ta sẽ xây dựng thống kê G thích hợp Có 3 trường hợp cần xét là:
Trường hợp 1: ĐLNN X phân phối theo quy luật chuẩn, đã biết.
Trường hợp 2: ĐLNN gốc X phân phối theo quy luật chuẩn, phương sai
chưa biết
Trường hợp 3: Chưa biết quy luật phân phối xác suất của X trên đám đông,
Trang 4Theo yêu cầu thảo luận sau đây chúng ta sẽ đi xét trường hợp 3.
Vì là ngẫu nhiên và n khá lớn, theo định lý giới hạn trung
tâm thì có phân phối xấp xỉ chuẩn: nên:
U =
n
X
(U có phân phối chuẩn xấp xỉ chuẩn hóa) Khi đó ta có thể tìm được phân vị sao cho:
(2) Thay biểu thức U ở (1) vào (2)và biến đổi ta được:
α
σ
µ < α ≈ −
n X
Từ (4) ta có độ tin cậy của ước lượng là 1 − α
Khoảng tin cậy đối xứng của là:
(6)
Độ dài của khoảng tin cậy là 2
Sai số của ước lượng là , được tính bằng công thức (5)
Trang 5Từ đó ta có sai số của ước lượng bằng một nửa độ dài của khoảng tin cậy Vì vậy nếu biết khoảng tin cậy đối xứng (a, b) thì sai số được tính theo công thức:
2
a
b−
=
Ở đây ta có 3 bài toán cần giải quyết:
Bài toán 1: Biết kích thước mẫu n, biết độ tin cậy 1 − α , cần tìm sai số hoặc khoảng tin cậy.
Nếu biết độ tin cậy 1 − α ta tìm được
2
α , tra bảng ta tìm được uα 2 từ đó ta tính được theo công thức (5) và cuối cùng nếu cần, ta có thể tìm được khoảng tin cậy (6) của μ
• Chú ý :
Khoảng tin cậy (6) là khoảng tin cậy ngẫu nhiên, trong khi là một số xác định Đối với mẫu ngẫu nhiên W=(X1,X2,…,Xn), vì độ tin cậy 1 − α khá gần
1 nên theo nguyên lý xác suất lớn có thể coi biến cố (X − ε < µ < X + ε)sẽ xảy
ra trong một lần thực hiện phép thử Nói một cách chính xác, với xác suất α
−
1 khoảng tin cậy ngẫu nhiên (6) sẽ chụp đúng E( )X = µ
Trong một lần lấy mẫu ta được mẫu cụ thể w=(x1,x2,…,xn) Từ mẫu cụ thể này ta tìm được một giá trị cụ thể x của ĐLNN trung bình mẫu Khi đó với
độ tin cậy 1 − α, ta tìm được một khoảng tin cậy cụ thể của là
Bài toán 2: Biết kích thước mẫu n và sai số cần tìm độ tin cậy (nếu biết
khoảng tin cậy đối xứng (a, b) thì ta có thể tính được sai số theo công thức (7))
Từ (5) ta tìm được σ
ε
α
n
u =
2
, tra bảng tìm được
2
α từ đó tìm được độ tin cậy α
−
1
Trang 6Bài toán 3: Biết độ tin cậy 1 − α , biết sai số cần tìm kích thước mẫu n.
Do ta chưa biết quy luật phân phối xác suất của X, kích thước mẫu cũng chưa biết(đang cần tìm) nên ta phải giả thiết X có phân phối chuẩn.(nếu σ chưa biết, vì n> 30 nên ta có thể lấy σ ≈s′)
2
2 2 2
ε
σ uε
n= hoặc
ε
ε2 2
2u s
n ′
=
Đó chính là kích thước mẫu tối thiểu cần tìm
• Chú ý: Từ biểu thức trên ta thấy:
Nếu giữ nguyên kích thước mẫu n và giảm sai số thì uα 2cũng giảm, có nghĩa là giảm độ tin cậy Ngược lại nếu giữ kích thước mẫu n không đổi và tăng độ tin cậy 1 − α thì sẽ làm tăng uα 2 dẫn đến sai số cũng tăng theo Tương tự như vậy nếu giữ nguyên sai số đồng thời giảm kích thước mẫu n thì uα 2 cũng giảm, tức là độ tin cậy giảm Nếu giữ nguyên độ tin cậy 1 − α và tăng kích thước mẫu n thì sai số giảm
Ví dụ: Theo dõi 36 công nhân cùng sản xuất ra một loại sản phẩm và thu
được bảng số liệu thống kê về thời gian cần thiết (đơn vị là phút)sản xuất ra sản phẩm như sau:
Thời gian sản xuất một sản phẩm 9 10 11 12
Với độ tin cậy 99% hãy ước lượng thời gian trung bình cần thiết để sản xuất
ra một loại sản phẩm
Giải
Gọi X là thời gian sản xuất ra 1 loại sản phẩm
là thời gian trunh bình sản xuất ra 1 loại sản phẩm trên mẫu
Trang 7là thời gian trung bình sản xuất ra 1 loại sản phẩm trên đám đông
Ta có n=36>30 nên có phân phối xấp xỉ chuẩn
Do đó N(0,1)
n
X
U = σ−µ ≅
Vì σ chưa biết, n=100 khá lớn nên ta lấy σ ≈s′ được: U=
Tìm được thõa mãn
(1)
1
=
= ∑i=n n i x i
n X
1
1
1
2 2
−
=
S X
X n n
i
i i
Thay tìm được khoảng tin cậy:
(X − ε < µ < X + ε)≈ 1 − α
P
Ta có
Kết luận: Với độ tin cậy là 99% thì thời gian trung bình cần thiết để
sản xuất ra một loại sản phẩm là (10,3564; 11,0324)
II.Kiểm định giả thuyết về tỷ lệ đám đông
Trang 8Xét một đám đông kích thước N, trong đó có M phần tử mang dấu hiệu A Khi đó là tỷ lệ phần tử mang dấu hiệu A trên đám đông Từ
một cơ sở nào đó người ta tìm được p = p0 nhưng nghi ngờ về điều này Với
mức ý nghĩa α ta cần kiểm định giả thuyết Ho: p= p0
Để kiểm định giả thuyết trên, từ đám đông ta lấy ra một mẫu kích thước n Gọi f là tỷ lệ phần tử mang dấu hiệu A trên mẫu Theo quy luật phân phối xác suất của tần suất mẫu, khi n khá lớn thì ( , )
n
pq p N
f ≅ Ta xây dựng tiêu chuẩn kiểm định:
n
p f U
q
p0 0 0
−
=
, trong đó q0 =1 p− 0.
Nếu Ho đúng thì U ≅N( 0 , 1 )
Vì α khá bé, theo nguyên lý xác suất nhỏ và tùy thuộc vào từng đối thuyết H1
ta có miền bác bỏ Wα như sau:
Loại giả
2 α
W = tn tn > Phải P(U >uα) = α Wα = {U tn :Uα >Uα}
Trái P(U < −uα) = α Wα = {U t n:Uα < −Uα }
• Các bước giải bài toán:
Xây dựng tiêu chuẩn kiểm định:
U= f −pq p n ( q0= 1-p0 )
Nếu H0 đúng thì U N(0;1)
Bài toán 1
Với mức ý nghĩa α, xác định uα/2
P( U| uα/2) = α
Trang 9Vì α khá bé nên theo nguyên tắc xác suất nhỏ biến cố (|U| uα/2) nhất định không xảy ra trong một lần lấy mẫu Nếu trong một lần thực hiện phép thử utn:
|utn uα/2 thì H0 tỏ ra không đúng Vậy miền bác bỏ là: Wα={utn: |utn| uα/2} Tính utn :
Trong đó : utn = f −pq p n
So sánh utnvới Wα đưa ra kết luận
Ví dụ:
Bài toán: tỉ lệ sản phẩm loại 2 của một nhà máy theo quy định là 10% Kiểm tra mẫu ngẫu nhiên 100 sản phẩm của nhà máy thấy có 18 sản phẩm loại 2 Với mức ý nghĩa 0,05 hãy cho kết luận xem tỉ lệ quy định trên có phù hợp không?
Tóm tắt bài toán:
A: “sản phẩm loại 2 của một nhà máy”
n=100 ;nA=18; α=0,05; p0=10%=0.1
≠
=
0
1
0
0
:
:
p
p
H
p
p
H
Lời giải
Gọi p là tỉ lệ sản phẩm loại 2 của một nhà máy trên đám đông
f là tỉ lệ sản phẩm loại 2 của một nhà máy trên mẫu
Chọn tiêu chuẩn kiểm định:
U= f −pq p n
H0 đúng U N(0,1)
Với mức ý nghĩa α=0,05 uα/2=1,96
P (|U| uα/2)= P (|U| 1,96) = 0,05
Với mức ý nghĩa α khá bé nên theo nguyên lý xác suất nhỏ thì biến cố (|U| 1,96) nhất định không thể xảy ra trong một lần chọn mẫu Nếu trong một lần ,thực hiện phép thử utn 1,96 thì H0 tỏ ra không đúng Vậy ta có miền bác bỏ:
Wα utn:| utn| 1,96}
Trên mẫu ta có:
n=100, nA=18
Trang 10100
18
=0,18
Tính utn: utn= 00,,181(1−−00,1,1) 100 = 2 , 6667
3
8 ≈
utn Wα⇔ H0 tỏ ra không đúng ⇔ Bác bỏ H0
Vậy với mức ý nghĩa α=0,05 thì tỉ lệ sản phẩm loại 2 theo quy định của nhà máy không còn phù hợp
Bài toán 2
Với mức ý nghĩa α, xác định uα
P (U uα)= α
Với mức ý nghĩa α khá bé nên theo nguyên lý xác suất nhỏ thì biến cố (U u ) nhất định không xảy ra trong một lần chọn mẫu Nếu trong một lần thực hiện phép thử: utn: utn uα thì H0 tỏ ra không đúng Ta có miền bác bỏ:
Wα = { utn: utn uα}
Trong đó: utn= f −pq p n
Trên mẫu ta tính utn, so sánh utnvới Wαrồi đưa ra kết luận
Ví dụ:
Theo công bố gần đây thì tỷ lệ cử nhân đại học ra trường không có việc làm
là 26%.Người ta cho rằng tỷ lệ đó có khả năng cao hơn.để kiểm tra lại người
ta điều tra từ 1000 cử nhân vừa ra trường có 410 người không tìm được việc làm Với mức ý nghĩa 5% hãy cho kết luận về ý kiến trên
Tóm tắt bài toán :
A : “cử nhân đại học ra trường chưa có việc làm”
n =1000 ; nA =360 ;α =0,05 ; p =26%=0,26
>
=
=
0
1
0
0
:
26 , 0 :
p
p
H
p
p
H
Lời giải :
f là tỉ lệ cử nhân đại học ra trường không có việc làm trên mẫu
p là tỉ lệ cử nhân đại học không có việc làm trên đám đông
Vì n =1000 khá lớn nên f ≈ (p; ).
Với mức ý nghĩa α = 0,05 cần kiểm định:
>
=
=
0 1
0 0
:
26 , 0 :
p p H
p p H
Trang 11XDTCKĐ: U = f p q p n
0 0 0
−
Nếu H0 đúng thì U ≈ N(0,1) Ta tìm được phân vị chuẩn Uα/2 sao cho P(U>uα ) =α
Vì α khá bé nên theo nguyên lí xác xuất nhỏ ta có miền bác bỏ Wα = , trong đó: Utn = f p q p n
0 0 0
−
Ta có uα = u0,05 = 1,65
Theo bài ra ta có f=360/1000 = 0,41→Utn = 00,36,26−.00,74,26 =7,2 →Utn ∈
Wα
→ Bác bỏ H0 thừa nhận H1
Kết luận :với mức ý nghĩa α =0,05 ý kiến trên là đúng
Bài toán 3:
Với mức ý nghĩa α xác định uα
P(u <-uα) =α
Vì α khá bé nên theo nguyên lí xác suất nhỏ biến cố (U< -uα ) nhất định không xảy ra trong một lần lấy mẫu Nếu trong một lần thực hện phép thử utn thỏa mãn utn >-uα thì giả thuyết H0 tỏ ra không đúng.miền bác bỏ H0 :Wα =
{U tn :U tn < −uα}
So sánh utn với Wα đưa ra kết luận
Ví dụ :
Điều tra chiều cao của 100 sinh viên trường đại học thương mại có 45 sinh viên cao trên 1m60 Với mức ý nghĩa 1% có thể nói tỉ lệ sinh viên trường đại học thương mại cao trên 1m60 nhỏ hơn 40% hay không?
Tóm tắt bài toán :
A : “chiều cao của sinh viên trường đại học Thương mại”
n =100 ;nA =45 ;α =1%=0,01 ;
<
=
=
0
1
0
0
:
4 , 0 :
p
p
H
p
p
H
Lời giải :
Gọi f là tỷ lệ sinh viên đạt chiều cao trên 1m60 trên mẫu
p là tỉ lệ cử sinh viên đạt chiều cao trên 1m60 trên đám đông
Vì n =100 khá lớn nên f ≃
n pq p;
Trang 12Với mức ý nghĩa α = 0,01 cần kiểm định:
<
=
=
0 1
0 0
:
4 , 0 :
p p H
p p H
q p
p f
0 0 0
−
.Nếu H0 đúng thì U ≃ N(0,1) ta tìm được phân vị chuẩn Uα sao cho P(U<-uα) =α Vì α khá bé nên theo nguyên lí xác xuất nhỏ ta
có miền bác bỏ Wα = {U tn :U tn < −uα}, trong đó: n
q p
p f
U tn
0 0 0
−
Ta có -uα = -u0,01 = -2,33
Theo bài ra ta có f=45/100 = 0,45→Utn = 100
6 , 0 4 , 0
4 , 0 45 ,
=1,02 →Utn ∉Wα → không đủ cơ sở để bác bỏ H0 ( Thừa nhận H0)
Kết luận : Với mức ý nghĩa α =1% có thể nói tỉ lệ sinh viên trường đại học thương mại cao trên 1m60 nhỏ hơn 40%
Phần II: BÀI TẬP
Đề bài:
1 Với độ tin cậy 95%, hãy ước lượng mức chi tiêu trung bình hàng tháng của sv ngoại tỉnh trường ĐHTM
2 Có thông tin cho rằng hiện nay tỉ lệ sinh viên ngoại tỉnh trường Đại học Thương Mại có mức chi tiêu hàng tháng từ 2,0 triệu đồng trở lên chiếm khoảng 60% Với mức ý nghĩa 5% hãy kiểm định lại khẳng định trên.
Bảng phân phối thực nghiệm
Mức
Chi
tiêu
1,0 1,2 1,3 1,5 1,7 1,8 2,0 2,1 2,2 2,5 2,8 3,0 3,5
Số
lượng
7
Kích thước mẫu n=300 Giải quyết bài toán:
Trang 131 Bài toán 1 : Hãy ước lượng mức chi tiêu trung bình của sinh viên ngoại tỉnh trường Đại học Thương mại.
Gọi: X là mức chi tiêu trung bình hàng tháng của sinh viên ngoại tỉnh
trường ĐHTM trên mẫu.
μ là mức chi tiêu trung bình hàng tháng của sinh viên ngoại tỉnh trường ĐHTM trên đám đông.
Vì n = 300 > 30 nên X có phân phối xấp xỉ chuẩn:
Do đó N(0,1)
n
X
U = σ−µ ≅
Với độ tin cậy γ ta có thể tìm được phân vị uα2 sao cho:
(P(U <uα2)≈ 1 − α = γ Thay biểu thức của U vào công thức trên ta và biến đổi ta có:
γ
σ
µ < α =
n X
P
⇔ P(X − ε < µ < X + ε ) = γ
Trong đó ε σ uα 2
n
= Khoảng tin cậy: (X − ε < µ <X + ε)
Vì σ chưa biết, kích thước mẫu lớn nên ta lấy σ ≈s'
1
1 '
'
1
2
−
=
=
n
i i
n n
s s
45919 , 0
≈
⇒ σ
Với α = 0,05 ⇒
2
α
=0,025 ⇒ u0,025=1,96
1,9193
1
1
=
= ∑n X i
n X
Trang 148673 1 96 , 1 300
45919 , 0 9193 , 1
− σ uα
n X
9713 , 1 96 , 1 300
45919 , 0 9193 , 1
+ σ uα
n X
Vậy mức chi tiêu trung bình hàng tháng của sinh viên ngoại tỉnh trường ĐHTM nằm trong khoảng (1,8673; 1,9713)
(đơn vị: triệu VNĐ)
2 Bài toán 2: Có thông tin cho rằng hiện nay tỉ lệ sinh viên ngoại tỉnh trường Đại học Thương Mại có mức chi tiêu hàng tháng từ 2,0 triệu đồng trở lên chiếm khoảng 60% Với mức ý nghĩa 5% hãy kiểm định lại khẳng định trên.
Bài làm
Thống kê cho thấy số sinh viên có mức chi tiêu từ 2,0 trđ /tháng trở lên là 164 sinh viên
Tóm tắt:
A: “sinh viên ngoại tỉnh của trường đại học thương mại có mức chi tiêu trung bình 2,0 trđ/tháng.”
( )
≠
=
=
=
=
=
0
1
0
0
0
:
:
6
,
0
05
,
0
164
300
p
p
H
p
p
H
p
A
n
n
α
Bài giải:
Gọi: p là tỷ lệ sinh viên có mức chi tiêu trung bình 2,0trđ/tháng trở lên trên đám đông
f là tỷ lệ sinh viên có mức chi tiêu trung bình 2,0trđ/tháng trở lên trên mẫu
Chọn tiêu chuẩn kiểm định: U f p q p n
0 0 0
−
= Nếu H0 đúng thì P≈ N( )0 ; 1
96 , 1 05
,
2
=
=
⇒
α
Trang 15(U > 1 , 96)= α
P
Vì 0,05 khá bé nên theo nguyên lý xác suất nhỏ biến cố (U > 1 , 96) nhất định không xảy ra trong 1 lần lấy mẫu Nếu trong 1 lần thực hiện phép thử màU tn
thỏa mãn U tn > 1 , 96 thì giả thuyết tỏ ra không đúng Do đó miền bác bỏH0:
} 96 , 1 :
= U tn U tn
Wα
n q
p
p
f
tn
0 0
0
−
( )
=
−
=
−
=
=
=
=
4 , 0 6 , 0 1 1
6 , 0
300 164
0 0
0
p q
p
n
A n
f tn
8856 , 1 300 4 , 0 6
,
0
6 , 0 300
164
−
=
⋅
−
=
⇒U tn
⇒
∉
⇒U tn Wα chưa đủ cơ sở để bác bỏ H0
Vậy với mức ý nghĩa α = 0 , 05có thể nói con số báo cáo trên là hợp lý.
Tức là “tỉ lệ sinh viên ngoại tỉnh trường Đại học Thương Mại có mức chi tiêu hàng tháng từ 2,0 triệu đồng trở lên chiếm khoảng 60%”
III Làm trên phần mền R.