1. Trang chủ
  2. » Giáo án - Bài giảng

thảo luận xác suất thống kê

16 7,9K 33

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 16
Dung lượng 1,32 MB

Nội dung

BÀI THẢO LUẬNLÝ THUYẾT XÁC SUẤT THỐNG KÊ TOÁNĐề bài: 1. Với độ tin cậy 95%, hãy ước lượng mức chi tiêu trung bình hàng tháng của sv ngoại tỉnh trường ĐHTM. 2. Có thông tin cho rằng hiện nay tỉ lệ sinh viên ngoại tỉnh trường Đại học Thương Mại có mức chi tiêu hàng tháng từ 2,0 triệu đồng trở lên chiếm khoảng 60%. Với mức ý nghĩa 5% hãy kiểm định lại khẳng định trên.

Trang 1

KHOA THƯƠNG MẠI ĐIỆN TỬ

 BÀI THẢO LUẬN

LÝ THUYẾT XÁC SUẤT THỐNG KÊ TOÁN

Đề bài:

1. Với độ tin cậy 95%, hãy ước lượng mức chi tiêu trung bình hàng tháng của

sv ngoại tỉnh trường ĐHTM

2 Có thông tin cho rằng hiện nay tỉ lệ sinh viên ngoại tỉnh trường Đại học Thương Mại có mức chi tiêu hàng tháng từ 2,0 triệu đồng trở lên chiếm khoảng 60% Với mức ý nghĩa 5% hãy kiểm định lại khẳng định trên

Hà Nội, 2013

Trang 2

LỜI NÓI ĐẦU

Lý thuyết ước lượng, lý thuyết kiểm định các giả thuyết thống kê là những bộ phận quan trọng của thống kê toán Nó là phương tiện giúp ta giải quyết những bài toán nhìn từ góc độ khác liên quan đến dấu hiệu cần nghiên cứu trong tổng thể

Để ước lượng kì vọng toán của ĐLNN X, người ta giả sử trên một đám đông

có E(X)= µ và Var(X) Trong đó µ chưa biết, cần ước lượng Từ đám đông ta lấy ra kích thước mẫu n: Từ mẫu này ta tìm được trung bình mẫu X và phương sai mẫu điều chỉnh S′ 2 Dựa vào những đặc trưng mẫu này ta sẽ xây dựng thống kê G thích hợp.Với đề tài thảo luận

“ước lượng mức chi tiêu trung bình hàng tháng của sinh viên ngoại tỉnh trường ĐH Thương Mại”, nhóm chúng tôi đã xác định dùng phương pháp

ước lượng µ khi chưa biết quy luật phân phối của ĐLNN , kích thước mẫu n

đủ lớn

Kiểm định giả thuyết thống kê về tỉ lệ của đám đông, thông thường ta thường giả sử dấu hiệu X cần nghiên cứu trên đám đông có E(X) µ, Var(X) ,

trong đó µ chưa biết từ một cơ sở nào đó người ta tìm được p=po , nhưng

nghi ngờ về điều này Với mức ý nghĩa cho trước ta cần kiểm định giả thuyết : p=po Từ đám đông lấy ra mẫu: và tính được các đặc trưng mẫu:

Từ mẫu này ta tính được , rồi so sánh với để bác

bỏ hay không bác bỏ , chấp nhận hay không chấp nhận Đó là phương pháp làm của nhóm tôi trong phần 2 của vấn đề thảo luận: “Có thông tin cho

Trang 3

chi tiêu hàng tháng từ 2,0 triệu đồng trở lên chiếm khoảng 60% Với mức ý nghĩa 5% hãy kiểm định lại khẳng định trên.”

Bài thảo luận này được xây dựng dựa trên cơ sở của: giáo trình Lý thuyết xác suất và thống kê toán của trường Đại học Thương Mại, giáo trình Lý thuyết xác suất và thống kê toán của trường Đại học Kinh Tế Quốc Dân cùng với các kiến thức đã tiếp thu được từ các bài giảng của giảng viên bộ môn trường Đại học Thương Mại

Do thời gian, điều kiện và khả năng có hạn, bài thảo luận nhóm chúng tôi không tránh khỏi những khiếm khuyết Chúng tôi rất mong nhận được sự cảm thông, chia sẻ và góp ý từ phía các giảng viên, các bạn sinh viên và những ai quan tâm để bài thảo luận nhóm được hoàn thiện hơn!

Tập thể nhóm 7!

Phần I: CƠ SỞ LÝ THUYẾT I.Ước lượng kỳ vọng toán của ĐLNN

Giả sử một đám đông ĐLNN có E (X) = µ và Trong đó µchưa biết, cần ước lượng Từ đám đông ta lấy ra mẫu kích thước n:

Từ đám đông ta lấy mẫu này ta tìm được trung bình mẫu và phương sai mẫu điều chỉnh Dựa vào những đặc trưng mẫu này

ta sẽ xây dựng thống kê G thích hợp Có 3 trường hợp cần xét là:

Trường hợp 1: ĐLNN X phân phối theo quy luật chuẩn, đã biết.

Trường hợp 2: ĐLNN gốc X phân phối theo quy luật chuẩn, phương sai

chưa biết

Trường hợp 3: Chưa biết quy luật phân phối xác suất của X trên đám đông,

Trang 4

Theo yêu cầu thảo luận sau đây chúng ta sẽ đi xét trường hợp 3.

Vì là ngẫu nhiên và n khá lớn, theo định lý giới hạn trung

tâm thì có phân phối xấp xỉ chuẩn: nên:

U =

n

X

(U có phân phối chuẩn xấp xỉ chuẩn hóa) Khi đó ta có thể tìm được phân vị sao cho:

(2) Thay biểu thức U ở (1) vào (2)và biến đổi ta được:

α

σ

µ < α ≈ −

n X

Từ (4) ta có độ tin cậy của ước lượng là 1 − α

Khoảng tin cậy đối xứng của là:

(6)

Độ dài của khoảng tin cậy là 2

Sai số của ước lượng là , được tính bằng công thức (5)

Trang 5

Từ đó ta có sai số của ước lượng bằng một nửa độ dài của khoảng tin cậy Vì vậy nếu biết khoảng tin cậy đối xứng (a, b) thì sai số được tính theo công thức:

2

a

b

=

Ở đây ta có 3 bài toán cần giải quyết:

Bài toán 1: Biết kích thước mẫu n, biết độ tin cậy 1 − α , cần tìm sai số hoặc khoảng tin cậy.

Nếu biết độ tin cậy 1 − α ta tìm được

2

α , tra bảng ta tìm được uα 2 từ đó ta tính được theo công thức (5) và cuối cùng nếu cần, ta có thể tìm được khoảng tin cậy (6) của μ

Chú ý :

Khoảng tin cậy (6) là khoảng tin cậy ngẫu nhiên, trong khi là một số xác định Đối với mẫu ngẫu nhiên W=(X1,X2,…,Xn), vì độ tin cậy 1 − α khá gần

1 nên theo nguyên lý xác suất lớn có thể coi biến cố (X − ε < µ < X + ε)sẽ xảy

ra trong một lần thực hiện phép thử Nói một cách chính xác, với xác suất α

1 khoảng tin cậy ngẫu nhiên (6) sẽ chụp đúng E( )X = µ

Trong một lần lấy mẫu ta được mẫu cụ thể w=(x1,x2,…,xn) Từ mẫu cụ thể này ta tìm được một giá trị cụ thể x của ĐLNN trung bình mẫu Khi đó với

độ tin cậy 1 − α, ta tìm được một khoảng tin cậy cụ thể của là

Bài toán 2: Biết kích thước mẫu n và sai số cần tìm độ tin cậy (nếu biết

khoảng tin cậy đối xứng (a, b) thì ta có thể tính được sai số theo công thức (7))

Từ (5) ta tìm được σ

ε

α

n

u =

2

, tra bảng tìm được

2

α từ đó tìm được độ tin cậy α

1

Trang 6

Bài toán 3: Biết độ tin cậy 1 − α , biết sai số cần tìm kích thước mẫu n.

Do ta chưa biết quy luật phân phối xác suất của X, kích thước mẫu cũng chưa biết(đang cần tìm) nên ta phải giả thiết X có phân phối chuẩn.(nếu σ chưa biết, vì n> 30 nên ta có thể lấy σ ≈s′)

2

2 2 2

ε

σ uε

n= hoặc

ε

ε2 2

2u s

n

=

Đó chính là kích thước mẫu tối thiểu cần tìm

Chú ý: Từ biểu thức trên ta thấy:

Nếu giữ nguyên kích thước mẫu n và giảm sai số thì uα 2cũng giảm, có nghĩa là giảm độ tin cậy Ngược lại nếu giữ kích thước mẫu n không đổi và tăng độ tin cậy 1 − α thì sẽ làm tăng uα 2 dẫn đến sai số cũng tăng theo Tương tự như vậy nếu giữ nguyên sai số đồng thời giảm kích thước mẫu n thì uα 2 cũng giảm, tức là độ tin cậy giảm Nếu giữ nguyên độ tin cậy 1 − α và tăng kích thước mẫu n thì sai số giảm

Ví dụ: Theo dõi 36 công nhân cùng sản xuất ra một loại sản phẩm và thu

được bảng số liệu thống kê về thời gian cần thiết (đơn vị là phút)sản xuất ra sản phẩm như sau:

Thời gian sản xuất một sản phẩm 9 10 11 12

Với độ tin cậy 99% hãy ước lượng thời gian trung bình cần thiết để sản xuất

ra một loại sản phẩm

Giải

Gọi X là thời gian sản xuất ra 1 loại sản phẩm

là thời gian trunh bình sản xuất ra 1 loại sản phẩm trên mẫu

Trang 7

là thời gian trung bình sản xuất ra 1 loại sản phẩm trên đám đông

Ta có n=36>30 nên có phân phối xấp xỉ chuẩn

Do đó N(0,1)

n

X

U = σ−µ ≅

Vì σ chưa biết, n=100 khá lớn nên ta lấy σ ≈s′ được: U=

Tìm được thõa mãn

(1)

1

=

= ∑i=n n i x i

n X

1

1

1

2 2

=

S X

X n n

i

i i

Thay tìm được khoảng tin cậy:

(X − ε < µ < X + ε)≈ 1 − α

P

Ta có

Kết luận: Với độ tin cậy là 99% thì thời gian trung bình cần thiết để

sản xuất ra một loại sản phẩm là (10,3564; 11,0324)

II.Kiểm định giả thuyết về tỷ lệ đám đông

Trang 8

Xét một đám đông kích thước N, trong đó có M phần tử mang dấu hiệu A Khi đó là tỷ lệ phần tử mang dấu hiệu A trên đám đông Từ

một cơ sở nào đó người ta tìm được p = p0 nhưng nghi ngờ về điều này Với

mức ý nghĩa α ta cần kiểm định giả thuyết Ho: p= p0

Để kiểm định giả thuyết trên, từ đám đông ta lấy ra một mẫu kích thước n Gọi f là tỷ lệ phần tử mang dấu hiệu A trên mẫu Theo quy luật phân phối xác suất của tần suất mẫu, khi n khá lớn thì ( , )

n

pq p N

f ≅ Ta xây dựng tiêu chuẩn kiểm định:

n

p f U

q

p0 0 0

=

, trong đó q0 =1 p− 0.

Nếu Ho đúng thì UN( 0 , 1 )

Vì α khá bé, theo nguyên lý xác suất nhỏ và tùy thuộc vào từng đối thuyết H1

ta có miền bác bỏ Wα như sau:

Loại giả

2 α

W = tn tn > Phải P(U >uα) = α Wα = {U tn :Uα >Uα}

Trái P(U < −uα) = α Wα = {U t n:Uα < −Uα }

Các bước giải bài toán:

Xây dựng tiêu chuẩn kiểm định:

U= fpq p n ( q0= 1-p0 )

Nếu H0 đúng thì U N(0;1)

 Bài toán 1

Với mức ý nghĩa α, xác định uα/2

P( U| uα/2) = α

Trang 9

Vì α khá bé nên theo nguyên tắc xác suất nhỏ biến cố (|U| uα/2) nhất định không xảy ra trong một lần lấy mẫu Nếu trong một lần thực hiện phép thử utn:

|utn uα/2 thì H0 tỏ ra không đúng Vậy miền bác bỏ là: Wα={utn: |utn| uα/2} Tính utn :

Trong đó : utn = fpq p n

So sánh utnvới Wα đưa ra kết luận

 Ví dụ:

Bài toán: tỉ lệ sản phẩm loại 2 của một nhà máy theo quy định là 10% Kiểm tra mẫu ngẫu nhiên 100 sản phẩm của nhà máy thấy có 18 sản phẩm loại 2 Với mức ý nghĩa 0,05 hãy cho kết luận xem tỉ lệ quy định trên có phù hợp không?

 Tóm tắt bài toán:

A: “sản phẩm loại 2 của một nhà máy”

n=100 ;nA=18; α=0,05; p0=10%=0.1

=

0

1

0

0

:

:

p

p

H

p

p

H

 Lời giải

Gọi p là tỉ lệ sản phẩm loại 2 của một nhà máy trên đám đông

f là tỉ lệ sản phẩm loại 2 của một nhà máy trên mẫu

Chọn tiêu chuẩn kiểm định:

U= fpq p n

H0 đúng U N(0,1)

Với mức ý nghĩa α=0,05 uα/2=1,96

P (|U| uα/2)= P (|U| 1,96) = 0,05

Với mức ý nghĩa α khá bé nên theo nguyên lý xác suất nhỏ thì biến cố (|U| 1,96) nhất định không thể xảy ra trong một lần chọn mẫu Nếu trong một lần ,thực hiện phép thử utn 1,96 thì H0 tỏ ra không đúng Vậy ta có miền bác bỏ:

Wα utn:| utn| 1,96}

Trên mẫu ta có:

n=100, nA=18

Trang 10

100

18

=0,18

Tính utn: utn= 00,,181(1−−00,1,1) 100 = 2 , 6667

3

8 ≈

utn Wα⇔ H0 tỏ ra không đúng ⇔ Bác bỏ H0

Vậy với mức ý nghĩa α=0,05 thì tỉ lệ sản phẩm loại 2 theo quy định của nhà máy không còn phù hợp

 Bài toán 2

Với mức ý nghĩa α, xác định uα

P (U uα)= α

Với mức ý nghĩa α khá bé nên theo nguyên lý xác suất nhỏ thì biến cố (U u ) nhất định không xảy ra trong một lần chọn mẫu Nếu trong một lần thực hiện phép thử: utn: utn uα thì H0 tỏ ra không đúng Ta có miền bác bỏ:

Wα = { utn: utn uα}

Trong đó: utn= fpq p n

Trên mẫu ta tính utn, so sánh utnvới Wαrồi đưa ra kết luận

 Ví dụ:

Theo công bố gần đây thì tỷ lệ cử nhân đại học ra trường không có việc làm

là 26%.Người ta cho rằng tỷ lệ đó có khả năng cao hơn.để kiểm tra lại người

ta điều tra từ 1000 cử nhân vừa ra trường có 410 người không tìm được việc làm Với mức ý nghĩa 5% hãy cho kết luận về ý kiến trên

 Tóm tắt bài toán :

A : “cử nhân đại học ra trường chưa có việc làm”

n =1000 ; nA =360 ;α =0,05 ; p =26%=0,26

>

=

=

0

1

0

0

:

26 , 0 :

p

p

H

p

p

H

 Lời giải :

f là tỉ lệ cử nhân đại học ra trường không có việc làm trên mẫu

p là tỉ lệ cử nhân đại học không có việc làm trên đám đông

Vì n =1000 khá lớn nên f ≈ (p; ).

Với mức ý nghĩa α = 0,05 cần kiểm định:

>

=

=

0 1

0 0

:

26 , 0 :

p p H

p p H

Trang 11

XDTCKĐ: U = f p q p n

0 0 0

Nếu H0 đúng thì U ≈ N(0,1) Ta tìm được phân vị chuẩn Uα/2 sao cho P(U>uα ) =α

Vì α khá bé nên theo nguyên lí xác xuất nhỏ ta có miền bác bỏ Wα = , trong đó: Utn = f p q p n

0 0 0

Ta có uα = u0,05 = 1,65

Theo bài ra ta có f=360/1000 = 0,41→Utn = 00,36,26−.00,74,26 =7,2 →Utn ∈

→ Bác bỏ H0 thừa nhận H1

Kết luận :với mức ý nghĩa α =0,05 ý kiến trên là đúng

 Bài toán 3:

Với mức ý nghĩa α xác định uα

P(u <-uα) =α

Vì α khá bé nên theo nguyên lí xác suất nhỏ biến cố (U< -uα ) nhất định không xảy ra trong một lần lấy mẫu Nếu trong một lần thực hện phép thử utn thỏa mãn utn >-uα thì giả thuyết H0 tỏ ra không đúng.miền bác bỏ H0 :Wα =

{U tn :U tn < −uα}

So sánh utn với Wα đưa ra kết luận

 Ví dụ :

Điều tra chiều cao của 100 sinh viên trường đại học thương mại có 45 sinh viên cao trên 1m60 Với mức ý nghĩa 1% có thể nói tỉ lệ sinh viên trường đại học thương mại cao trên 1m60 nhỏ hơn 40% hay không?

 Tóm tắt bài toán :

A : “chiều cao của sinh viên trường đại học Thương mại”

n =100 ;nA =45 ;α =1%=0,01 ;

<

=

=

0

1

0

0

:

4 , 0 :

p

p

H

p

p

H

 Lời giải :

Gọi f là tỷ lệ sinh viên đạt chiều cao trên 1m60 trên mẫu

p là tỉ lệ cử sinh viên đạt chiều cao trên 1m60 trên đám đông

Vì n =100 khá lớn nên f ≃ 

n pq p;

Trang 12

Với mức ý nghĩa α = 0,01 cần kiểm định:

<

=

=

0 1

0 0

:

4 , 0 :

p p H

p p H

q p

p f

0 0 0

.Nếu H0 đúng thì U ≃ N(0,1) ta tìm được phân vị chuẩn Uα sao cho P(U<-uα) =α Vì α khá bé nên theo nguyên lí xác xuất nhỏ ta

có miền bác bỏ Wα = {U tn :U tn < −uα}, trong đó: n

q p

p f

U tn

0 0 0

Ta có -uα = -u0,01 = -2,33

Theo bài ra ta có f=45/100 = 0,45→Utn = 100

6 , 0 4 , 0

4 , 0 45 ,

=1,02 →Utn ∉Wα → không đủ cơ sở để bác bỏ H0 ( Thừa nhận H0)

Kết luận : Với mức ý nghĩa α =1% có thể nói tỉ lệ sinh viên trường đại học thương mại cao trên 1m60 nhỏ hơn 40%

Phần II: BÀI TẬP

Đề bài:

1 Với độ tin cậy 95%, hãy ước lượng mức chi tiêu trung bình hàng tháng của sv ngoại tỉnh trường ĐHTM

2 Có thông tin cho rằng hiện nay tỉ lệ sinh viên ngoại tỉnh trường Đại học Thương Mại có mức chi tiêu hàng tháng từ 2,0 triệu đồng trở lên chiếm khoảng 60% Với mức ý nghĩa 5% hãy kiểm định lại khẳng định trên.

Bảng phân phối thực nghiệm

Mức

Chi

tiêu

1,0 1,2 1,3 1,5 1,7 1,8 2,0 2,1 2,2 2,5 2,8 3,0 3,5

Số

lượng

7

Kích thước mẫu n=300 Giải quyết bài toán:

Trang 13

1 Bài toán 1 : Hãy ước lượng mức chi tiêu trung bình của sinh viên ngoại tỉnh trường Đại học Thương mại.

Gọi: X là mức chi tiêu trung bình hàng tháng của sinh viên ngoại tỉnh

trường ĐHTM trên mẫu.

μ là mức chi tiêu trung bình hàng tháng của sinh viên ngoại tỉnh trường ĐHTM trên đám đông.

Vì n = 300 > 30 nên X có phân phối xấp xỉ chuẩn:

Do đó N(0,1)

n

X

U = σ−µ ≅

Với độ tin cậy γ ta có thể tìm được phân vị uα2 sao cho:

(P(U <uα2)≈ 1 − α = γ Thay biểu thức của U vào công thức trên ta và biến đổi ta có:

γ

σ

µ < α =

n X

P

P(X − ε < µ < X + ε ) = γ

Trong đó ε σ uα 2

n

= Khoảng tin cậy: (X − ε < µ <X + ε)

Vì σ chưa biết, kích thước mẫu lớn nên ta lấy σ ≈s'

1

1 '

'

1

2

=

=

n

i i

n n

s s

45919 , 0

⇒ σ

Với α = 0,05 ⇒

2

α

=0,025 ⇒ u0,025=1,96

1,9193

1

1

=

= ∑n X i

n X

Trang 14

8673 1 96 , 1 300

45919 , 0 9193 , 1

− σ uα

n X

9713 , 1 96 , 1 300

45919 , 0 9193 , 1

+ σ uα

n X

Vậy mức chi tiêu trung bình hàng tháng của sinh viên ngoại tỉnh trường ĐHTM nằm trong khoảng (1,8673; 1,9713)

(đơn vị: triệu VNĐ)

2 Bài toán 2: Có thông tin cho rằng hiện nay tỉ lệ sinh viên ngoại tỉnh trường Đại học Thương Mại có mức chi tiêu hàng tháng từ 2,0 triệu đồng trở lên chiếm khoảng 60% Với mức ý nghĩa 5% hãy kiểm định lại khẳng định trên.

Bài làm

Thống kê cho thấy số sinh viên có mức chi tiêu từ 2,0 trđ /tháng trở lên là 164 sinh viên

 Tóm tắt:

A: “sinh viên ngoại tỉnh của trường đại học thương mại có mức chi tiêu trung bình 2,0 trđ/tháng.”

( )

=

=

=

=

=

0

1

0

0

0

:

:

6

,

0

05

,

0

164

300

p

p

H

p

p

H

p

A

n

n

α

 Bài giải:

Gọi: p là tỷ lệ sinh viên có mức chi tiêu trung bình 2,0trđ/tháng trở lên trên đám đông

f là tỷ lệ sinh viên có mức chi tiêu trung bình 2,0trđ/tháng trở lên trên mẫu

Chọn tiêu chuẩn kiểm định: U f p q p n

0 0 0

= Nếu H0 đúng thì PN( )0 ; 1

96 , 1 05

,

2

=

=

α

Trang 15

(U > 1 , 96)= α

P

Vì 0,05 khá bé nên theo nguyên lý xác suất nhỏ biến cố (U > 1 , 96) nhất định không xảy ra trong 1 lần lấy mẫu Nếu trong 1 lần thực hiện phép thử màU tn

thỏa mãn U tn > 1 , 96 thì giả thuyết tỏ ra không đúng Do đó miền bác bỏH0:

} 96 , 1 :

= U tn U tn

Wα

n q

p

p

f

tn

0 0

0

( )

=

=

=

=

=

=

4 , 0 6 , 0 1 1

6 , 0

300 164

0 0

0

p q

p

n

A n

f tn

8856 , 1 300 4 , 0 6

,

0

6 , 0 300

164

=

=

U tn

U tn Wα chưa đủ cơ sở để bác bỏ H0

Vậy với mức ý nghĩa α = 0 , 05có thể nói con số báo cáo trên là hợp lý.

Tức là “tỉ lệ sinh viên ngoại tỉnh trường Đại học Thương Mại có mức chi tiêu hàng tháng từ 2,0 triệu đồng trở lên chiếm khoảng 60%

III Làm trên phần mền R.

Ngày đăng: 19/04/2014, 22:00

HÌNH ẢNH LIÊN QUAN

Bảng phân phối thực nghiệm - thảo luận xác suất thống kê
Bảng ph ân phối thực nghiệm (Trang 12)

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w