Trường hợp ước lượng cho tỷ lệ

Một phần của tài liệu Bài giảng xác suất thống kê đh lâm nghiệp (Trang 95)

Cỡ mẫu tối thiểu n là số nguyờn nhỏ nhất thỏa món điều kiện:

2 /2 /2 f(1 f) u (1 ) u n f f n              

với f là ước lượng điểm cho p. Hoặc nếu f chưa biết, ta sử dụng bất đẳng thức: 2 /2 (1 ) 1 2 2 u f f n n         

Chỳ ý: Nếu p gần 0,5 thỡ hai phương phỏp cho kết quả gần như nhaụ Nếu p gần 0 hoặc 1 thỡ hai phương phỏp cho kết quả rất khỏc nhaụ Nờn sử dụng theo cỏch thứ nhất.

Vớ dụ 7: Một nhà nụng học muốn ước lượng tỷ lệ nảy mầm của một loại hạt giống với độ tin cậy 99%, sai số khụng quỏ 0,02.

a) Hỏi cần phải lấy mẫu với kớch thước tối thiểu là bao nhiờủ

b) Nếu nhà nụng học đú lấy mẫu với kớch thước 1000, thấy cú 640 hạt nảy mầm. Hỏi với yờu cầu như trờn thỡ cần phải lấy mẫu với kớch thước tối thiểu là bao nhiờủ Giải: a) α = 1 – 0,99 = 0,01  u0,005 = 2,38. 2 2 /2 2,58 4160,25 2 2.0,02 u n                b) 640 0,64 1000 f   2 2 /2 (1 ) 2,58 0,64.0,36 3834,08 0,02 u nf f                BÀI TẬP

Bài 1: Điều tra 200 mảnh ruộng, mỗi mảnh 4m2 ta được:

Sản lượng (kg) 1,02 1,08 1,14 1,20 1,26 1,32

Số mảnh 10 15 35 75 55 10 a) Hóy tớnh năng suất trung bỡnh (tạ/ha).

b) Ước lượng khoảng tin cậy của năng suất toàn vựng với độ tin cậy 95%. Giả thiết sản lượng là biến ngẫu nhiờn cú phõn phối chuẩn.

Bài2: Cỏc kết quả đo độ dài một đoạn thẳng (theo m) khụng chứa sai số hệ thống được cho trong bảng:

Kết quả 114 115 116 117 118

Số lần đo 2 5 8 4 3 Với độ tin cậy 95%.

a) Hóy tỡm khoảng tin cậy của độ dài đoạn thẳng cần đọ

b) Nếu muốn ước lượng với độ chớnh xỏc khụng quỏ 0,3 thỡ cần phải đo ớt nhất bao nhiờu đoạn thẳng?

Bài3: Hóy ước lượng kỳ vọng và phương sai của một tổng thể cú quy luật phõn phối chuẩn với độ tin cậy 98% dựa theo kết quả của mẫu:

3,1 3,3 2,9 3,0 3,2 2,8 2,7 3,2 3,2 2,9 3,0 2,9 3,1 2,8 2,9 3,1 3,3 2,9 3,1 3,2 3,0 3,1

Bài4: Để xỏc định tỷ lệ phế phẩm trong một lụ sản phẩm người ta rỳt ra một mẫu gồm 500 sản phẩm đem kiểm tra và thấy cú 50 phế phẩm. Hóy ước lượng tỷ lệ phế phẩm trong lụ với độ tin cậy =99%.

Bài5: Trờn cơ sở 100 lần thực nghiệm, người ta thấy rằng thời gian trung bỡnh để sản xuất 1 chi tiết mỏy là 5,5 giõy và sai tiờu chuẩn là 1,7 giõỵ Giả sử thời gian để sản xuất xong 1 chi tiết mỏy là biến ngẫu nhiờn cú phõn phối chuẩn

2 ( , )

N   . Hóy tỡm khoảng tin cậy của và 2với độ tin cậy 90%.

Bài6: Điều tra ngẫu nhiờn 180 người ta thấy cú 162 người hoàn thành định mức cụng việc. Với độ tin cậy 95%.

a) Hóy ước lượng tỷ lệ hoàn thành định mức chung của toàn nhà mỏỵ b) Nếu muốn ước lượng với độ chớnh xỏc khụng quỏ 0,03 thỡ cần phải điều tra ớt nhất bao nhiờu ngườỉ

Bài7: Một phương phỏp điều trị mới đang được xem xột để đỏnh giỏ tớnh hiệu quả của nú. Một chỉ tiờu đỏnh giỏ là số ngày trung bỡnh từ lỳc điều trị cho đến lỳc bệnh nhõn khỏi bệnh. Một mẫu ngẫu nhiờn gồm 11 bệnh nhõn được theo dừi và đỏnh số ngày điều trị cho tới khi khỏi bệnh được ghi lại như sau:

4 4 3 8 5 6 7 12 5 3 8

Bài8:Tỡm cỏc khoảng tin cậy 90%, 95% và 98% cho giỏ trị trung bỡnh dựa trờn cỏc mẫu sau: ) 100, 250, 80. a nXS  ) 64, 250, 80. b nXS

Bài9:Một cụng ty lớn muốn ước lượng trung bỡnh một ngày một thư ký phải đỏnh mỏy bao nhiờu trang giấỵ Một mẫu gồm 50 thư ký được chọn ngẫu nhiờn cho thấy số trang trung bỡnh mà họ đỏnh mỏy là 32 với độ lệch tiờu chuẩn là 6. Tỡm khoảng tin cậy 99% cho số trang trung bỡnh mà một thư ký của cụng ty đỏnh mỏy trong một ngàỵ

Bài10:Một nhà sưu tập tem khảo giỏ chiếc tem A trong 9 cửa hàng thỡ thấy giỏ trung bỡnh là 17 (nghỡn đồng) với độ lệch tiờu chuẩn là 3 (nghỡn đồng). Tỡm khoảng tin cậy 90% cho giỏ của chiếc tem này trong tất cả cỏc cửa hàng bỏn tem.

Bài11:Cơ quan cảnh sỏt giao thụng kiểm tra hệ thống phanh của 40 chiếc xe tải trờn quốc lộ. Họ phỏt hiện 14 xe tải cú phanh chưa đảm bảo an toàn.

a) Tỡm khoảng tin cậy 95% cho tỷ lệ xe tải cú phanh chưa đảm bảo an toàn. b) Tỡm khoảng tin cậy 98% cho tỷ lệ xe tải cú phanh đảm bảo an toàn.

Bài12:Từ một tập hợp chớnh cú quy luật chuẩn N(à; 2)kết quả lấy mẫu n=10 thu được như sau:

51 48 56 57 44 52 54 60 46 47 Tỡm khoảng tin cậy cho à và 2 với độ tin cậy 90%.

Chương 5

KIỂM ĐỊNH GIẢ THUYẾT THỐNG Kấ 5.1. Đặt vấn đề

Trong cỏc hoạt động thực tiễn, ta thường đặt ra và giải quyết nhiều bài toỏn mà ta sẽ gọi là bài toỏn kiểm định giải thuyết. Sau đõy là một số vớ dụ.

Trờn truyền thụng, ta bắt gặp nhiều tuyờn bố của cỏc nhà quản lớ. Chẳng hạn, một trường đại học tuyờn bố tỉ lệ sinh viờn cú việc làm đỳng ngành được đào tạo của trường này sau khi tốt nghiệp là trờn 80%. Một người nghi ngờ thụng tin trờn và muốn kiểm chứng lại khẳng định đú. Cõu hỏi là phương phỏp nào giải quyết được vấn đề trờn?

Trong nụng nghiệp, khi đưa vào trồng thử nghiệm một giống lỳa mới trờn một địa phương. Biết rằng năng suất trung bỡnh sau khi thu hoạch của giống lỳa mới trờn cỏc thửa ruộng được trồng thử nghiệm là 6,0 tấn/hạ Năng suất lỳa trung bỡnh của giống lỳa truyền thống là 5,5 tấn/hạ Cõu hỏi đặt ra là năng suất trung bỡnh của giống lỳa mới cú cao hơn giống lỳa truyền thống hay khụng? Từ thụng tin thu được (từ mẫu), cú phương phỏp nào trả lời cõu hỏi trờn khụng và nếu cú thỡ cỏch thức giải quyết như thế nàỏ

Trong lõm nghiệp, người ta nhận thấy rằng sinh trưởng của cõy rừng cú vẻ như chịu ảnh hưởng của yếu tố vị trớ cõy mọc (được trồng). Giả sử, ta xột trờn một quả đồi và ta chia vị trớ mà cõy mọc (được trồng) thành ba mức: chõn đồi, sườn đồi và đỉnh đồị Sinh trưởng của cõy được xếp hạng: sinh trưởng kộm, sinh trưởng trung bỡnh và sinh trưởng tốt. Cú thể cú một số cõu hỏi được đặt ra như sau:

Cõu hỏi 1: Cú ảnh hưởng thực sự của yếu tố vị trớ đối với sinh trưởng của cõy hay khụng?

Cõu hỏi 2: Cú sự khỏc biệt nào về sinh trưởng khi vị trớ cõy ở cỏc mức khỏc nhau khụng? Núi nụm na, khi cỏc điều kiện khỏc xấp xỉ nhau thỡ cõy mọc hoặc được trồng ở cỏc vị trớ đỉnh đồi, sườn đồi và chõn đồi sinh trưởng núi chung của nú cú khỏc biệt khụng?

Phương phỏp thống kờ giỳp ta trả lời một cỏch “hợp lớ” cỏc cõu hỏi ở dạng trờn từ dữ liệu cú được. Khi đú, cỏc yếu tố mà thực tế đang quan tõm được xột như là cỏc biến ngẫu nhiờn với phõn phối, tham số chưa biết.

5.2. Bài toỏn và phương phỏp chung giải quyết kiểm định giả thuyết

Cho X là một biến ngẫu nhiờn cú phõn phối ( , ), ( , , … , ) là mẫu về X.

Định nghĩa 1: Giả thuyết là một khẳng định về phõn phối hay về tham số chưa biết của biến ngẫu nhiờn, thụng thường ta kớ hiệu là H hoặc .

Định nghĩa 2: Đối thuyết là khẳng định về phõn phối hay tham số của biến ngẫu nhiờn nhưng trỏi ngược với giả thuyết được nờu, kớ hiệu là K hoặc .

Vớ dụ 1:

Giả thuyết H: Biến ngẫu nhiờn X cú phõn phối chuẩn tắc.

Đối thuyết K: Biến ngẫu nhiờn X khụng cú phõn phối chuẩn tắc.

Đõy là giả thuyết đặt ra đối với phõn phối chưa biết của biến, tức là ta đang ngờ rằng biến cú phõn phối chuẩn tắc.

Vớ dụ 2: Giả sử ~ ( , 4), biến X cú phõn phối chuẩn và phương sai

= 4 đó biết, kỡ vọng = là tham số chưa biết. Ta cú thể đặt ra cỏc giả thuyết và đối thuyết tương ứng với như sau:

Giả thuyết : =

Đối thuyết : ≠

Đối thuyết cú thể được thay bằng cỏc đối thuyết : > hoặc

: < .

Bài toỏn đặt ra như sau: Ta quan tõm tới biến ngẫu nhiờn X cú phõn phối chưa biết. Cú hai khẳng định trỏi ngược nhau về biến X là giả thuyết và đối thuyết. Với dữ liệu thu được về X (mẫu ngẫu nhiờn), ta phải quyết định lựa chọn một trong hai khẳng định đú theo một cỏch “hợp lớ nhất”.

Phương phỏp chung giải bài toỏn kiểm định giả thuyết:

Để giải bài toỏn kiểm định giả thuyết, người ta làm như sau:

Dựa trờn mẫu ngẫu nhiờn ( , , … , )thu được về X, người ta xõy dựng tiờu chuẩn kiểm định (test thống kờ) T là hàm của mẫu, tức là = ( , , … , ). Núi đơn giản, tiờu chuẩn T đo sự sai khỏc giữa giả thuyết đặt ra và thực tế quan sỏt được về X.

Ta sẽ đưa ra quyết định chấp nhận hay bỏc bỏ giả thuyết dựa vào tiờu chuẩn T một cỏch “hợp lớ”. Thụng thường, nếu cú sự khỏc biệt lớn hay T nhận giỏ trị lớn ta sẽ bỏc bỏ giả thuyết. Nếu T nhận giỏ trị nhỏ thỡ ta sẽ chấp nhận giả thuyết, tức là, sự sai khỏc khụng đỏng kể (sai do yếu tố ngẫu nhiờn- lấy mẫu).

Vỡ ta khụng cú toàn bộ thụng tin về biến X nờn quyết định mà ta đưa ra dựa trờn tiờu chuẩn T hoàn toàn cú thể dẫn tới sai lầm. Cú hai sai lầm cú thể mắc phải như sau:

a) Sai lầm loại 1: Giả thuyết sai nhưng ta lại chấp nhận nú. b) Sai lầm loại 2: Giả thuyết đỳng nhưng ta lại bỏc bỏ nú.

Một cỏch tự nhiờn, ta cố gắng tỡm một tiờu chuẩn sao cho khi đưa ra quyết định dựa trờn nú thỡ khả năng mắc hai sai lầm trờn là nhỏ nhất. Tuy nhiờn, người ta chứng minh được rằng một tiờu chuẩn như vậy là khụng tồn tạị Trong tỡnh huống này, người ta xử lớ như sau:

Ta khống chế xỏc suất mắc sai lầm loại 1 nhỏ hơn một mức đó ấn định trước (thường nhỏ) và tỡm một tiờu chuẩn cực tiểu xỏc suất mắc sai lầm loại 2. May mắn thay, một tiờu chuẩn như vậy luụn tồn tạị

Nguyờn tắc đưa ra quyết định: Người ta đưa ra quyết định dựa trờn “nguyờn lớ xỏc suất nhỏ”.

Nguyờn lớ xỏc suất nhỏ: Nếu một biến cố cú xỏc suất nhỏ thỡ nú sẽ khụng xảy ra trong một hoặc một vài lần thực hiện phộp thử.

Đến đõy, bài toỏn kiểm định giả thuyết được giải quyết bằng phương phỏp phản chứng như sau:

Giả sử, giả thuyết đặt ra là đỳng, khi ấy tiờu chuẩn T cú một phõn phối hoàn toàn xỏc định. Dựa vào phõn phối này, ta tỡm một miền S thỏa món

( ∈ | ) = . Miền S được gọi là miền tiờu chuẩn hay miền bỏc bỏ giả thuyết. Từ dữ liệu thực tế cú được, ta tớnh ra giỏ trị của T và đối chiếu giỏ trị của T với miền tiờu chuẩn. Nếu ∈ thỡ ta sẽ bỏc bỏ giả thuyết. Nếu ngược lại, ta chấp nhận giả thuyết. Đú là lời giải của bài toỏn kiểm định giả thuyết.

Cơ sở của quyết định trờn được giải thớch: Nếu giả thuyết là đỳng đắn thỡ S là miền cú xỏc suất nhỏ (vỡ được chọn nhỏ). Do đú, biến cố ∈ cú xỏc suất nhỏ. Một biến cố cú xỏc suất nhỏ phải khụng xảy ra trong một hoặc một vài lần lấy mẫu mới là hợp lớ. Do đú, nếu trong lần đầu lấy mẫu, ta thấy rằng T rơi vào miền S, điều này mõu thuẫn với nguyờn lớ xỏc suất nhỏ và quyết định ta đưa ra là bỏc bỏ giả thuyết. Khả năng phạm sai lầm loại 1 khi chọn quyết định này nhỏ hơn hoặc bằng .

Chỳ ý:

Phương phỏp giải trờn được gọi là phương phỏp kiểm định truyền thống. Một phương phỏp khỏc thường được dựng trong cỏc phần mềm thống kờ là phương phỏp P-value (P- giỏ trị).

Tiờu chuẩn T là một biến ngẫu nhiờn. Ta đưa ra quyết định dựa trờn T hay chớnh dựa trờn mẫu (những bằng chứng thu thập được). Nếu hai mẫu khỏc nhau cú thể dẫn tới hai quyết định trỏi ngược nhaụ

Xỏc suất mắc sai lầm loại 1 được ưu tiờn khống chế vỡ người ta cho rằng sai lầm này nghiờm trọng hơn nếu phạm phảị

Xỏc suất mắc sai lầm loại 2 chưa được xỏc định. Do vậy, quyết định bỏc bỏ giả thuyết núi chung “an toàn” hơn quyết định chấp nhận giả thuyết vỡ nhỏ và đó biết.

5.3 Cỏc bài toỏn kiểm định giả thuyết thường gặp

5.3.1. Bài toỏn kiểm định giả thuyết cho kỡ vọng

Cho X là biến ngẫu nhiờn và( , , … , )là mẫu ngẫu nhiờn thu được về biến X.

Bài toỏn kiểm định: Với mức cho trước, kiểm định cỏc giả thuyết sau:

Bài toỏn 1: Giả thuyết : = / Đối thuyết : ≠ .

Bài toỏn 2: Giả thuyết : = / Đối thuyết : > .

Bài toỏn 3: Giả thuyết : = / Đối thuyết : < .

Bài toỏn 1 được gọi là bài toỏn kiểm định hai phớa, bài toỏn 2 và bài toỏn 3 được gọi là bài toỏn kiểm định một phớạ

Ta giải cỏc bài toỏn trờn trong ba trường hợp sau:

Trường hợp 1: ~ ( , ) và đó biết, là tham số chưa biết.

Lời giải bài toỏn 1:

: =

: ≠ ( )

Tiờu chuẩn kiểm định: = √

Giả sử, đỳng, tức là = .Người ta chứng minh được rằng tiờu chuẩn T cú phõn phối chuẩn tắc.

Ta cú:

| | > / = ⟺ 1 − | | < / = ⟺ − / < < /

= 1 −

Vỡ tiờu chuẩn U cú phõn phối chuẩn tắc nờn:

− / < < / = Φ / − Φ − / = 2Φ / − 1 = 1 −

Do đú, ta cú Φ / = 1 − . Từ đõy, tra bảng phõn phối chuẩn tắc ta sẽ tỡm được giỏ trị cụ thể của / .

Đặt = | | > / . Đõy chớnh là miền cú xỏc suất nhỏ hơn hoặc bằng . Như vậy, với việc xỏc định được phõn phối của U và mức ý nghĩa cho trước, ta luụn xỏc định được miền tiờu chuẩn hay bỏc bỏ giả thuyết.

Từ mẫu ngẫu nhiờn thu được về biến X, tớnh giỏ trị của tiờu chuẩn Ụ Sau đú, ta so sỏnh | | với / .

Kết luận:Nếu | | > / thỡ ta bỏc bỏ giả thuyết.Ngược lại, ta chấp nhận giả thuyết.

Vớ dụ 1: Một người khẳng định năng suất trung bỡnh của giống lỳa A là 6,0 tấn/hạ Tuy nhiờn, khi trồng loại lỳa này trờn 100 thửa ruộng thỡ thấy rằngnăng suất trung bỡnh 6,5tấn/hạ Giả sử, năng suất lỳaA cú phõn phối chuẩn với phương sai là 4. Với mức ý nghĩa 5%, khẳng định đưa ra cú đỏng tin khụng?

Giải:

Gọi X là năng suất của lỳa Ạ Theo giả thiết, ~ ( , 4).

Bài toỏn đặt ra: với mức ý nghĩa = 5%, kiểm định giả thuyết:

: = 6,0 : ≠ 6,0

Với = 5%, tra ngược bảng phõn phối chuẩn tắc tại mức 0,975 ta tỡm được giỏ trị / = 1,96.

Từ mẫu và giả thiết, ta cú = 6,5; = 4. Do đú, giỏ trị của tiờu chuẩn kiểm định là:

= − √ =6,5 − 6,02 √100 = 2,5

Ta cú | | = 2,5 > 1,96. Như vậy, mẫu điều tra được rơi vào miền bỏc bỏ giả thuyết. Kết luận đưa ra là bỏc bỏ giả thuyết, tức là năng suất trung bỡnh của lỳa A khỏc 6,0 tấn/ha hay khẳng định đưa ra chưa hợp lớ.

Lời giải bài toỏn 2:

Với cỏch làm hoàn toàn tương tự, bài toỏn 2 được giải như sau: Tiờu chuẩn kiểm định:

= − √

Với mức cho trước, ta tỡm một số ( ) thỏa món: ( > ) = .

Nếu giả thuyết đỳng người ta chứng minh được tiờu chuẩn U cú phõn phối chuẩn tắc. Do đú, ta cú:

( > ) = 1 − ( < ) = 1 − Φ( )

Mặt khỏc, ( > ) = = 1 − Φ( ). Tra bảng phõn phối chuẩn tắc ta nhận được giỏ trị của .

Đặt = { > } đõy chớnh là miền bỏc bỏ giả thuyết của bài toỏn 2. Từ mẫu quan sỏt được, tớnh giỏ trị của tiờu chuẩn Ụ

Kết luận: Nếu giỏ trị của tiờu chuẩn U rơi vào miền ta sẽ bỏc bỏ .

Một phần của tài liệu Bài giảng xác suất thống kê đh lâm nghiệp (Trang 95)

Tải bản đầy đủ (PDF)

(163 trang)