1. Trang chủ
  2. » Luận Văn - Báo Cáo

thảo luận lý thuyết xác suất thống kê toán

15 708 3

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 15
Dung lượng 1,5 MB

Nội dung

thảo luận lý thuyết xác suất thống kê toán

Trang 1

KHOA THƯƠNG MẠI ĐIỆN TỬ

 BÀI THẢO LUẬN

LÝ THUYẾT XÁC SUẤT THỐNG KÊ TOÁN

Đề bài:

1.Ước lượng mức chi tiêu trung bình của sinh viên ngoại tỉnh trường ĐH TM

2 Hiện nay, tỷ lệ sinh viên ngoại tỉnh của trường Thương mại chi tiêu hàng

tháng đến 1,4triệu là 60% Hãy kiểm tra lại khẳng định trên.

(α = 0,05;   0 , 95)

GVHD : Thầy Đức Minh

Hà Nội, 2010

Trang 2

LỜI NÓI ĐẦU

Lý thuyết ước lượng, lý thuyết kiểm định các giả thuyết thống kê là những bộ phận quan trọng của thống kê toán Nó là phương tiện giúp ta giải quyết những bài toán nhìn từ góc độ khác liên quan đến dấu hiệu cần nghiên cứu trong tổng thể

Để ước lượng kì vọng toán của ĐLNN X, người ta giả sử trên một đám đông

có E(X)= µ và Var(X) Trong đó µ chưa biết, cần ước lượng Từ đám

được trung bình mẫu X và phương sai mẫu điều chỉnh S 2 Dựa vào những đặc trưng mẫu này ta sẽ xây dựng thống kê G thích hợp.Với vấn đề 2 của đề

tài thảo luận, đó là “ước lượng mức chi tiêu trung bình hàng tháng của sinh

viên ngoại tỉnh trường ĐH Thương Mại”, nhóm chúng tôi đã xác định dùng

phương pháp ước lượng µ khi chưa biết quy luật phân phối của ĐLNN , kích thước mẫu n đủ lớn

Kiểm định giả thuyết thống kê về tỉ lệ của đám đông, thông thường ta thường giả sử dấu hiệu X cần nghiên cứu trên đám đông có E(X) µ, Var(X) ,

trong đó µ chưa biết từ một cơ sở nào đó người ta tìm được p=po , nhưng

nghi ngờ về điều này Với mức ý nghĩa cho trước ta cần kiểm định giả

thuyết : p=po Từ đám đông lấy ra mẫu: và tính được các đặc trưng mẫu:

Từ mẫu này ta tính được , rồi so sánh với để bác

bỏ hay không bác bỏ , chấp nhận hay không chấp nhận Đó là phương

pháp làm của nhóm tôi trong phần 2 của vấn đề thảo luận: “Hiện nay, tỷ lệ

sinh viên ngoại tỉnh của trường Thương mại chi tiêu hàng tháng đến 1,4triệu

là 60% Hãy kiểm tra lại khẳng định trên.”

Trang 3

Bài thảo luận này được xây dựng dựa trên cơ sở của: giáo trình Lý thuyết xác suất và thống kê toán của trường Đại học Thương Mại, giáo trình Lý thuyết xác suất và thống kê toán của trường Đại học Kinh Tế Quốc Dân cùng với các kiến thức đã tiếp thu được từ các bài giảng của giảng viên bộ môn trường Đại học Thương Mại

Do thời gian, điều kiện và khả năng có hạn, bài thảo luận nhóm chúng tôi không tránh khỏi những khiếm khuyết Chúng tôi rất mong nhận được sự cảm thông, chia sẻ và góp ý từ phía các giảng viên, các bạn sinh viên và những ai quan tâm để bài thảo luận nhóm được hoàn thiện hơn!

Tập thể nhóm 7!

Phần I: CƠ SỞ LÝ THUYẾT

I.Ước lượng kỳ vọng toán của ĐLNN

Giả sử một đám đông ĐLNN có E ( X)   và Trong đó chưa biết, cần ước lượng Từ đám đông ta lấy ra mẫu kích thước n:

Từ đám đông ta lấy mẫu này ta tìm được trung bình

mẫu và phương sai mẫu điều chỉnh Dựa vào những đặc trưng mẫu này

ta sẽ xây dựng thống kê G thích hợp Có 3 trường hợp cần xét là:

Trường hợp 1: ĐLNN X phân phối theo quy luật chuẩn, đã biết.

Trường hợp 2: ĐLNN gốc X phân phối theo quy luật chuẩn, phương sai

chưa biết

Trường hợp 3: Chưa biết quy luật phân phối xác suất của X trên đám đông,

nhưng kích thước mẫu n>30.

Theo yêu cầu thảo luận sau đây chúng ta sẽ đi xét trường hợp 3

Trang 4

Vì là ngẫu nhiên và n khá lớn, theo định lý giới hạn trung

tâm thì có phân phối xấp xỉ chuẩn: nên:

U =

n

X

(U có phân phối chuẩn xấp xỉ chuẩn hóa)

Khi đó ta có thể tìm được phân vị sao cho:

(2)

Thay biểu thức U ở (1) vào (2)và biến đổi ta được:

n X

Từ (4) ta có độ tin cậy của ước lượng là 1  

Khoảng tin cậy đối xứng của là:

(6)

Độ dài của khoảng tin cậy là 2

Sai số của ước lượng là , được tính bằng công thức (5)

Từ đó ta có sai số của ước lượng bằng một nửa độ dài của khoảng tin cậy Vì vậy nếu biết khoảng tin cậy đối xứng (a, b) thì sai số được tính theo công thức:

Trang 5

a

b 

Ở đây ta có 3 bài toán cần giải quyết:

Bài toán 1: Biết kích thước mẫu n, biết độ tin cậy 1   , cần tìm sai số hoặc khoảng tin cậy.

Nếu biết độ tin cậy 1   ta tìm được 2 , tra bảng ta tìm được u 2 từ đó ta

tính được theo công thức (5) và cuối cùng nếu cần, ta có thể tìm được khoảng tin cậy (6) của μ

Chú ý :

Khoảng tin cậy (6) là khoảng tin cậy ngẫu nhiên, trong khi là một số xác định Đối với mẫu ngẫu nhiên W=(X1,X2,…,Xn ), vì độ tin cậy 1   khá gần 1 nên theo nguyên lý xác suất lớn có thể coi biến cố X     X sẽ xảy

ra trong một lần thực hiện phép thử Nói một cách chính xác, với xác suất

1 khoảng tin cậy ngẫu nhiên (6) sẽ chụp đúng E X  

Trong một lần lấy mẫu ta được mẫu cụ thể w=(x1,x2,…,xn ) Từ mẫu cụ thể này ta tìm được một giá trị cụ thể x của ĐLNN trung bình mẫu Khi đó với độ tin cậy 1   , ta tìm được một khoảng tin cậy cụ thể của là

Bài toán 2: Biết kích thước mẫu n và sai số cần tìm độ tin cậy (nếu biết

khoảng tin cậy đối xứng (a, b) thì ta có thể tính được sai số theo công thức (7))

Từ (5) ta tìm được  

n

u 

2

, tra bảng tìm được 2 từ đó tìm được độ tin cậy

1

Bài toán 3: Biết độ tin cậy 1   , biết sai số cần tìm kích thước mẫu n.

Trang 6

Do ta chưa biết quy luật phân phối xác suất của X, kích thước mẫu cũng chưa biết(đang cần tìm) nên ta phải giả thiết X có phân phối chuẩn.(nếu  chưa biết, vì n> 30 nên ta có thể lấy  s)

2

2 2 2

u

 2 2

2u

s n

Đó chính là kích thước mẫu tối thiểu cần tìm

Chú ý: Từ biểu thức trên ta thấy:

Nếu giữ nguyên kích thước mẫu n và giảm sai số thì u 2cũng giảm, có nghĩa là giảm độ tin cậy Ngược lại nếu giữ kích thước mẫu n không đổi và tăng độ tin cậy 1   thì sẽ làm tăng u 2 dẫn đến sai số cũng tăng theo

Tương tự như vậy nếu giữ nguyên sai số đồng thời giảm kích thước mẫu n thì u 2 cũng giảm, tức là độ tin cậy giảm Nếu giữ nguyên độ tin cậy 1  

và tăng kích thước mẫu n thì sai số giảm

Ví dụ: Theo dõi 36 công nhân cùng sản xuất ra một loại sản phẩm và thu

được bảng số liệu thống kê về thời gian cần thiết (đơn vị là phút)sản xuất ra sản phẩm như sau:

Với độ tin cậy 99% hãy ước lượng thời gian trung bình cần thiết để sản xuất

ra một loại sản phẩm

Giải

Gọi X là thời gian sản xuất ra 1 loại sản phẩm

là thời gian trunh bình sản xuất ra 1 loại sản phẩm trên mẫu

Trang 7

là thời gian trung bình sản xuất ra 1 loại sản phẩm trên đám đông

Ta có n=36>30 nên có phân phối xấp xỉ chuẩn

n

X

U   

Vì  chưa biết, n=100 khá lớn nên ta lấy  s được: U=

Tìm được thõa mãn

(1)

Ta có :

36

385 1

1

 

n

x n n X

  0 , 618 0 , 786 1

1

1

2 2

S X

X n n

i

i i

Thay tìm được khoảng tin cậy:

X    X   1  

P

Ta có

Kết luận: Với độ tin cậy là 99% thì thời gian trung bình cần thiết để

sản xuất ra một loại sản phẩm là (10,3564; 11,0324)

II.Kiểm định giả thuyết về tỷ lệ đám đông

Trang 8

Xét một đám đông kích thước N, trong đó có M phần tử mang dấu hiệu A.

Khi đó là tỷ lệ phần tử mang dấu hiệu A trên đám đông Từ

một cơ sở nào đó người ta tìm được p = p0 nhưng nghi ngờ về điều này Với

mức ý nghĩa α ta cần kiểm định giả thuyết Ho: p= p0

Để kiểm định giả thuyết trên, từ đám đông ta lấy ra một mẫu kích thước n Gọi f là tỷ lệ phần tử mang dấu hiệu A trên mẫu Theo quy luật phân phối xác suất của tần suất mẫu, khi n khá lớn thì ( , )

n

pq p N

f  Ta xây dựng tiêu chuẩn kiểm định:

n

p f U

q

p0 0

0

, trong đó q0  1  p0

Nếu Ho đúng thì U  N( 0 , 1 )

Vì α khá bé, theo nguyên lý xác suất nhỏ và tùy thuộc vào từng đối thuyết H1

ta có miền bác bỏ Wα như sau:như như sau:sau:

Loại giả

2

Wtn tn

Trái P(U  u)   W  {U t n:U  U }

Trường hợp 1:

o p p

o p p H H

: :

1 0

Với mức ý nghĩa  cho trước ta tìm được U / 2 sao cho (   )  

2

u U

Vì α khá bé, theo nguyên lý xác suất nhỏ ta có miền bác bỏ:

} :

{ 2

Wtn tn

Ví dụ : Ở một địa phương tỷ lệ mắc bệnh gan đã được xác định nhiều lần là

34% Sau một đợt điều trị bằng một loại thuốc, người ta kiểm tra lại 120 người thấy 24 người còn mắc bệnh gan Hỏi với mức ý nghĩa 5% tỷ lệ người mắc bệnh gan ở địa phương đó có thay đổi không?

Trang 9

Giải :

Gọi f là tỷ lệ người mắc bệnh gan trên mẫu

p là tỷ lệ người mắc bệnh gan trên đám đông

Vì n=120 khá lớn nên ( , )

n

pq p N

Với mức ý nghĩa α= 0,05 cần kiểm định: 

0 1

0 0

:

) 34 , 0 ( :

p p H

p p H

XDTCKD:

n

q p

p f U

0 0

0

Nếu H 0 đúng thì U  N( 0 , 1 )

Với α cho trước ta xác định được U / 2 sao cho: P(Uu/2)  

Vì α khá bé, theo nguyên lý xác suất nhỏ ta có miền bác bỏ:

} :

Wt n tn

Ta có U / 2=U0 , 025=1,96

Theo đề bài: f    U tn   3,237W

120

66 , 0 34 , 0

34 , 0 2 , 0

2 , 0 120 24

Bác bỏ H 0

Vậy với mức ý nghĩa 5% thì tỷ lệ người mắc bệnh gan ở địa phương đó có thay đổi.

* Trường hợp 2:

0 1

0 0

: :

p p H

p p H

Với mức ý nghĩa  cho trước ta tìm được U / 2 sao cho P(Uu)   Lập luận như trong trường hợp 1 ta thu được miền bác bỏ W  {U t n:U U }

Ví dụ :

Ngày 15/ 01/ 2002 tác giả của một bài báo viết: Ở Việt Nam có tới 90% các doanh nghiệp chưa quan tâm tới thương mại điện tử Có ý kiến cho rằng tỉ lệ trên thấp hơn so với thực tế Để kiểm tra lại, người ta điều tra 120 doanh nghiệp thấy có 115 doanh nghiệp chưa quan tâm tới lĩnh vực này Với mức ý nghĩa 0,05 hãy cho nhận định về vấn đề trên

Trang 10

Gọi X là số doanh nghiệp chưa quan tâm tới thương mại điện tử

f là tỉ lệ doanh nghiệp chưa quan tâm tới thương mại điện tử trên mẫu

p là tỉ lệ doanh nghiệp chưa quan tâm tới thương mại điện tử trên đám đông.

Vì n=120 khá lớn nên ( , )

n

pq p N

Với mức ý nghĩa α= 0,05 cần kiểm định: 

0 1

0 0

:

) 90 , 0 ( :

p p H

p p H

XDTCKD:

n

q p

p f U

0 0 0

Nếu H0 đúng thì U  N( 0 , 1 )

Với α cho trước ta xác định được U sao cho: P(Uu )  

Vì α khá bé, theo nguyên lý xác suất nhỏ ta có miền bác bỏ:

} :

Wtn tn

Ta có U U0,05  1 , 65

120

10 , 0 90 , 0

90 , 0 9583 , 0 9583

, 0 120 115

Bác bỏ H0

Vậy với mức ý nghĩa 0,05 thì ta nói rằng tỉ lệ các doanh nghiệp chưa quan tâm tới thương mại điện tử lớn hơn 90%

* Trường hợp 3:

0 1

0 0

: :

p p H

p p H

Với α cho trước ta xác định được U sao cho: P(U  u)  

Vì α khá bé, theo nguyên lý xác suất nhỏ ta có miền bác bỏ:

} :

Wtn tn 

Ví dụ: Điều tra 300 học sinh trung học ở Hà Nội thấy có 66 em bị cận thị Với

mức ý nghĩa 1% có thể nói rằng tỉ lệ học sinh trung học ở Hà Nội bị cận thị nhỏ hơn 25% hay không?

Trang 11

Gọi X là số học sinh trung học ở Hà Nội bị cận thị

f là tỉ lệ học sinh bị cận thị trên mẫu

p là tỉ lệ học sinh bị cận thị trên đám đông

Vì n=300 khá lớn nên ( , )

n

pq p N

f 

Với mức ý nghĩa α= 0,01 cần kiểm định: 

0 1

0 0

:

) 25 , 0 ( :

p p H

p p H

XDTCKD:

n

q p

p f U

0 0 0

Nếu H 0 đúng thì U  N( 0 , 1 )

Với α cho trước ta xác định được U sao cho: P(U  u)  

Vì α khá bé, theo nguyên lý xác suất nhỏ ta có miền bác bỏ:

} :

Wtn tn  

Ta có U U0,01  2 , 33

300

25 , 0 75 , 0

25 , 0 22 , 0 22

, 0 300 66

Chưa có cơ sở bác bỏ H0

Vậy với mức ý nghĩa 0,01 ta có thể nói rằng tỉ lệ học sinh trung học bị cận nhỏ hơn 25%

Trang 12

Phần II: BÀI TẬP

Đề bài:

1.Ước lượng mức chi tiêu trung bình của sinh viên ngoại tỉnh trường ĐH TM.

2 Hiện nay, tỷ lệ sinh viên ngoại tỉnh của trường Thương mại chi tiêu hàng

tháng đến 1,4triệu là 60% Hãy kiểm tra lại khẳng định trên.

(α = 0,05;   0 , 95)

Bảng như sau:phân như sau:phối như sau:thực như sau:nghiệm

Mức chi tiêu

(triệu VNĐ) 1 1,2 1,3 1,4 1,5 1,6 1,7 1,8 1,9 2,0 2,5

Số SV 2 13 11 21 29 20 19 15 2 16 3

Kích thước mẫu n=150 Giải quyết bài toán:

1 Ước lượng mức chi tiêu trung bình của sinh viên ngoại tỉnh trường Đại học Thương mại.

Gọi: X là mức chi tiêu trung bình hàng tháng của sinh viên ngoại tỉnh

trường ĐHTM trên mẫu.

μ là mức chi tiêu trung bình hàng tháng của sinh viên ngoại tỉnh trường ĐHTM trên đám đông.

Vì n = 100 > 30 nên X có phân phối xấp xỉ chuẩn:

Do đó N(0,1)

n

X

U   

Với độ tin cậy  ta có thể tìm được phân vị u 2 sao cho:

(PUu 2 1     Thay biểu thức của U vào công thức trên ta và biến đổi ta có:

n X

P

Trang 13

P(X    X   )  

n

Khoảng tin cậy: X    X 

Vì  chưa biết, kích thước mẫu lớn nên ta lấy  s'

1

1 '

'

1

2 2

n i i

n n

s s

35 , 5

 

Với =0,95   = 0,05 

2

=0,025  u0,025=1,96

Thay vào khoảng tin cậy ta được

5141 , 1 96 , 1 150

35 , 5 584 , 1

  

u X

6539 , 1 96 , 1 150

35 , 5 584 , 1

  

u X

Vậy mức chi tiêu trung bình hàng tháng của sinh viên ngoại tỉnh trường ĐHTM nằmvtrong khoảng (1,5141; 1,6539)

(đơn vị: triệu VNĐ)

2 Hiện nay, tỷ lệ sinh viên ngoại tỉnh của trường Thương mại chi tiêu hàng tháng đến 1,4triệu là 60% Hãy kiểm tra lại khẳng định trên.

Tóm tắt:

n = 150, nA = 47 (từ bảng số liệu)

p0 = 60% = 0,6

α = 0,05

Kiểm định giả thuyết:

Trang 14

Gọi f là tỷ lệ sinh viên trường ĐHTM chi tiêu hàng tháng đến 1,4 triệu trên

mẫu

p là tỷ lệ sinh viên trường ĐHTM chi tiêu hàng tháng đến 1,4 triệu trên đám đông

Vì n = 100 là khá lớn nên f có phân phối xấp xỉ chuẩn:

Với mức ý nghĩa =0,05 ta cần kiểm định giả thuyết:

Xây dựng tiêu chuẩn thống kê: =

n

q p

p f

0 0

0

Vì khá bé nên theo nguyên lý xác suất nhỏ ta có miền bác bỏ:

Trong đó

Ta có

Vậy miền bác bỏ:

Trang 15

Kết luận: Vậy với mức ý nghĩa ta có cơ sở bác bỏ giả thuyết H0

Tức là “Tỷ lệ sinh viên ngoại tỉnh của trường Thương mại chi tiêu hàng

tháng đến 1,4 triệu khác 60%”.

Ngày đăng: 19/12/2014, 17:30

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w