Bài tập chương 1

Một phần của tài liệu bài giảng thống kê nâng cao (Trang 26)

1. Trong 1 ca làm việc một máy tự động sản xuất được 100 sản phẩm. Xác suất để 1 sản phẩm được sản xuất ra bị hư là 0,1. Giả thiết rằng quá trình máy sản xuất ra các sản phẩm là độc lập với nhau.

a) Tìm quy luật phân phối xác suất của số phế phẩm trong ca.

b) Tìm số phế phẩm trung bình, số phế phẩm tin chắc nhất và độ lệch chuẩn của số phế phẩm trong ca.

2. Một xạ thủ bắn vào bia với xác suất trúng là 0,6. Tìm xác suất sao cho trong 100 phát bắn vào bia có:

a) 50 phát trúng bia.

b) Không quả 50 phát trúng bia.

3. Xác suất sinh con trai ở 1 nhà hộ sinh là 0,51. Tìm xác suất sao cho trong 1000 ca đến sinh số bé trai bé hơn số bé gái.

4. Trong một kho chứa bóng đèn tỷ lệ bóng hoỏng là 50/00 . Xếp các bóng đèn thành từng lô 1000 bóng.

a) Tính xác suất sao cho trong mỗi lô có không quá 1 bóng đèn bị hỏng.

b) Tìm số bóng hỏng tin chắc nhất trong lô.

5. Từ 1 lô hàng gồm 400 sản phẩm, trong đó có 100 sản phẩm loại A, lấy ngẫu nhiên 80 sản phẩm. Tính số sản phẩm loại A trung bình và độ lệch chuẩn của số sản phẩm loại A có trong 80 sản phẩm lấy ra.

6. Trong 1 lô hàng gồm 10000 sản phẩm (trong đó có 4000 sản phẩm loại 1). Lấy ngẫu nhiên không hoàn lại từ lô ra 10 sản phẩm. Tìm các xác suất sau đây:

a) Có 3 sản phẩm loại 1 trong 10 sản phẩm lấy ra.

b) Có ít nhất 1 sản phẩm loại 1 trong 10 sản phẩm lấy ra.

7. Trọng lượng của 1 loại trái cây là đại lượng ngẫu nhiên phân phối theo quy luật chuẩn với trung bình là 250g và phương sai là 25. Quả được gọi là loại 1 nếu có trọng lượng từ 255g trở lên. Tìm tỷ lệ quả loại 1 của loại trái cây đó.

8. Chiều cao nam giới đã trưởng thành là một đại lượng ngẫu nhiên phân phối theo quy luật chuẩn N(160;36). Tìm xác suất để khi chọn ngẫu nhiên 4 nam thì có ít nhất 1 người có chiều cao nằm trong khoảng (158;162).

1.5. Bài tập chương 1 23

9. Một chi tiết máy được gọi là đạt tiêu chuẩn kỹ thuật nếu như đường kính của nó sai lệch so với đường kính thiết kế (đường kính trung bình) không quá 0,33 cm về giá trị tuyệt đối. Cho biết đường kính của loại chi tiết máy đó là đại lượng ngẫu nhiên phân phối xác suất theo quy luật chuẩn với độ lệch tiêu chuẩn là 0,3.

Tìm số chi tiết máy đạt tiêu chuẩn trung bình khi sản xuất 100 chi tiết máy.

10. Biết trọng lượng của một loại sản phẩm là biến ngẫu nhiên ξ(kg)phân phối theo luật chuẩn có phương sai V ar(ξ) = σ2. Để ước lượng trọng lượng trung bình µ = E(ξ) của các sản phẩm, người ta kiểm tra một mẫu gồm n sản phẩm và tính được trọng lượng trung bình trong mẫu này là X¯. Hãy xây dựng khoảng tin cậy (µ1, µ2) của trọng lượng trung bình µvới mức ý nghĩa α.

Áp dụng với σ2 = 0,01kg2; n= 25;X¯ = 5,2kg và α= 0,01.

11. Trọng lượng của các gói mì ăn liền là biến ngẫu nhiênξ(g)có trung bình

µ=E(ξ). Dựa vào một mẫu kiểm tra ngẫu nhiên gồm n sản phẩm với trung bình X¯, hãy xây dựng khoảng tin cậy (µ1, µ2) của µ với mức ý nghĩa α.

Áp dụng với α= 0,02 và mẫu kiểm tra cụ thể như sau:

Khoảng trọng lượng (g) [70;75) [75;80) [80;85) [85;90)

Số gói mì 11 32 44 13

12. Cho biết đường kính của các viên bi là biến ngẫu nhiên ξ(mm) phân phối theo luật chuẩn không đánh giá được phương sai. Để ước lượng đường kính trung bìnhµ=E(ξ)của các viên bi, người ta kiểm tra một mẫu gồm n viên bi và tính được đường kính trung bình trong mẫu này làX¯. Hãy xây dựng khoảng tin cậy(µ1, µ2)của trọng lượng trung bình

µvới mức ý nghĩa α.

Áp dụng với α= 0,05 và mẫu kiểm tra cụ thể như sau: Đường kính xi (mm) 6,5 7,0 7,5 8,0 8,5

Số bi ni 1 7 12 3 2

13. Tỷ lệpcác sản phẩm bị hư trong kho đồ hộp là một tham số chưa biết. Lấy mẫu kiểm tran sản phẩm, số bị hư đếm được trong mẫu làm. Dựa vào thông tin mẫu này, xây dựng khoảng tin cậy (p1;p2) để ước lượng cho tỷ lệ pvới mức ý nghĩa α.

14. Để tham khảo độ chính xác của một dụng cụ đo chiều dài người ta đo trên cùng một mục tiêu n lần bằng dụng cụ ấy, tính được phương sai của mẫu khảo sát là S2. Kết quả nhận được sˆ2 = 0,05. Hãy xây dựng khoảng ước lượng cho độ phân tán sai số (σ21;σ22) của dụng cụ đó với mức ý nghĩa α. Cho biết đại lượng đo cho sai số ngẫu nhiên có dạng phân phối chuẩn.

Áp dụng với n = 30; S2 = 0,05và độ tin cậy là 1−α = 0,95.

15. Cho biết khối lượng của một loại sản phẩm là đại lượng ξ phân phối theo luật chuẩn với kỳ vọngE(ξ) =µ. Cân thử từng sản phẩm của một mẫu ngẫu nhiên gồmn đơn vị sản phẩm, ta có kết quả ở dạng dưới đây:

Trọng lượng xi(kg) x1 x2 . . . xk Số sản phẩmni n1 n2 . . . nk Trong đó k P i=1 ni =n.

Với độ tin cậy1−αhãy tìm khoảng tin cậy cho phương saiV ar(ξ) =σ2. Áp dụng với độ tin cậy 95%; µ= 30 và mẫu khảo sát như sau:

Trọng lượng xi(kg) 29,3 29,7 30 30,5 30,7

Chương 2

Lý thuyết ước lượng

Mục lục

2.1 Các dạng ước lượng . . . 26

2.1.1 Ước lượng vững . . . 26

2.1.2 Ước lượng không chệch . . . 26

2.1.3 Ước lượng hiệu quả. . . 26

2.2 Các phương pháp ước lượng . . . 27

2.2.1 Ước lượng hợp lý tối đa . . . 27

2.2.2 Phương pháp ước lượng momen. . . 27

2.1 Các dạng ước lượng2.1.1 Ước lượng vững 2.1.1 Ước lượng vững

Định nghĩa 2.1. Một hàm n biến Y =θb(X1, X2, . . . , Xn) phụ thuộc vào tập giá trị của mẫu ngẫu nhiên Mξ

n= (X1, X2, . . . , Xn) được gọi là một thống kê.

Định nghĩa 2.2. Thống kê θbđược gọi là ước lượng vững của tham số θ nếu

lim

n→∞P θb−θ

< ε= 1, ∀ε >0.

Trong đó,θ là một tham số nào đó của biến ngẫu nhiên gốc ξ.

2.1.2 Ước lượng không chệch

Định nghĩa 2.3. Thống kê θbđược gọi là ước lượng không chệch của tham số

θ nếu E(θb) =θ.

Định nghĩa 2.4. Cho θblà một ước lượng của tham số θ.

• θb−θ được gọi là sai số hệ thống nếu E(θb−θ)6= 0.

• θb−θ được gọi là sai số ngẫu nghiên nếu E(θb−θ) = 0.

2.1.3 Ước lượng hiệu quả

Định nghĩa 2.5. Thống kê bθ được gọi là ước lượng hiệu quả của tham số θ

nếu nó là ước lượng không chệch có phương sai bé nhất.

Định lý 2.1. (Định lý về nghịch đảo của lượng thông tin Fischer) θblà ước lượng hiệu quả của θ ⇐⇒ V ar(bθ) = I1

n(θ). Trong đó: • In(θ) =nE h ∂lnf(x,θ) ∂θ i2

được gọi là lượng thông tin Fischer về tham số θ chứa trong mẫu kích thước n.

2.2. Các phương pháp ước lượng 27

2.2 Các phương pháp ước lượng

2.2.1 Ước lượng hợp lý tối đa

Định nghĩa 2.6. Thống kê θblà ước lượng hợp lý tối đa của tham số θ nếu θb làm cực đại hàm mật độ đồng thời của mẫu ngẫu nhiênMξ

n= (X1, X2, . . . , XN): L(Mξ n, θ) = n Y i=1 f(Xi, θ).

Trong đó, f(X, θ) là hàm mật độ xác suất của biến ngẫu nhiên gốc ξ.

Chú ý 2.1. L(Mξ

n, θ) đạt cực đại tại θb⇐⇒ lnL(Mξ

n, θ) đạt cực đại tại θb.

Chú ý 2.2. Các bước tìm ước lượng hợp lý tối đa:

1. Tìm biểu thức hàm mật độ f(X, θ) của biến ngẫu nhiên gốc ξ. 2. Lập hàm hợp lý (hàm mật độ đồng thời): L(Mn, θ) = n Q i=1 f(Xi, θ).

3. Tính các đạo hàm cấp 1 và cấp 2 theoθ của L(Mξ

n, θ)hoặclnL(Mξ n, θ):

∂L

∂θ, ∂∂θ2L2 (hoặc ∂∂θlnL, ∂2∂θln2L).

4. Điều kiện cần: giải phương trình ∂L∂θ = 0 (hoặc ∂∂θlnL = 0) tìm nghiệmθb, giá trị có khả năng làm cực đại hàm hợp lý.

5. Kiểm tra điều kiện đủ:

∂2L ∂θ2 θ=θb<0 hoặc ∂ 2lnL ∂θ2 θ=bθ <0

−→θblà ước lượng hợp lý của θ.

Chú ý 2.3. Nếu phương trình ∂∂θlnL = 0 có duy nhất nghiệm thì không cần kiểm tra điều kiện đủ.

2.2.2 Phương pháp ước lượng momen

2.2.2.1 Phương pháp

Ước lượng momen nhận được bằng cách sử dụng momen mẫu để ước lượng cho momen lý thuyết:

αk(θ) =α∗k

Trong đó: Lý thuyết Mẫu Momen bậc k αk =E(Xk) αk∗ = 1n n P i=1 Xk i

Momen trung tâm µk =En[X−E(X)]ko mk = 1n

n

P

i=1

(Xi−X)k

2.2.2.2 Các momen lý thuyết cơ bản (kỳ vọng, phương sai)

Chú ý 2.4. Momen cấp 1 là kỳ vọng(α1 =E(X)) và Momen trung tâm cấp 2 là phương sai µ2 =E[X−E(X)]2 của biến ngẫu nhiên.

Phân phối Kỳ vọng Phương sai

Nhị thứcB(n, p) np np(1−p) Poisson P(a) a a Hình học G(p) 1−pp 1p−2p Chuẩn N(µ, σ2) µ σ2 χ2(n) n 2n StudentT(n) 0 nn−2 Gammaγ(r, λ) λr λr2 MũE(β) β1 β12 ĐềuU(a, b) a+2b (b−12a)2

2.3. Bài tập chương 2 29

2.3 Bài tập chương 2

1. Cho mẫu ngẫu nhiênMξ

n= (X1, X2, . . . , Xn)được lấy từ tập giá trị của biến ngẫu nhiên gốc ξ, chứng minh các trường hợp ước lượng vững sau đây:

(a) Trung bình mẫu X¯ là ước lượng vững của kỳ vọng E(ξ) = µ của BNN gốc ξ.

(b) Phương sai mẫu S2 là ước lượng vững của phương saiV ar(ξ) = σ2

của BNN gốcξ.

(c) Tần suất mẫu fn là ước lượng vững của xác suất p tương ứng (tỷ lệ tổng thể).

2. Kiểm tra các trường hợp ước lượng chệch/không chệch sau đây:

(a) Trung bình mẫuX¯ là ước lượng không chệch của kỳ vọngE(ξ) =µ

của BNN gốcξ.

(b) Phương sai mẫu điều chỉnhS˜2là ước lượng không chệch của phương saiV ar(ξ) = σ2 của BNN gốc ξ.

(c) Tần suất mẫu fn là ước lượng không chệch của xác suất p (tỷ lệ tổng thể) tương ứng.

(d) Phương sai mẫu chưa điều chỉnhS2 là ước lượng chệch của phương sai BNN gốcσ2 =V ar(ξ).

(e) Phương sai mẫu tính theo công thức S2

µ = 1 n n P i=1 (Xi −µ)2 là ước lượng không chệch của phương saiV ar(ξ) = σ2 của BNN gốcξ với

µ=E(ξ).

3. Chứng minh các trường hợp ước lượng hiệu quả sau đây

(a) Chứng minh trung bình mẫuX¯ là ước lượng hiệu quả của kỳ vọng

E(ξ) =µ của BNN gốcξ ∼N(µ;σ2).

(b) Chứng minh tần suất mẫu là ước lượng hiệu quả của xác suất p

trong BNN gốc ξ tuân theo luật Bernoulli B(1;p) (tỷ lệ p trong tổng thể tương ứng).

4. Từ mẫu ngẫu nhiênMξ

n= (X1, X2, . . . , Xn)được lấy từ biến ngẫu nhiên gốc ξ, tìm ước lượng hợp lý tối đa của các tham số tương ứng.

(a) ξ∼ P(a), tìm ước lượng cho tham sốa. (b) ξ∼ G(p), tìm ước lượng cho tham số p.

(c) ξ∼B(1;p), tìm ước lượng cho tham sốp.

(d) ξ∼N(µ;σ2), tìm ước lượng cho các tham số µ, σ. (e) ξ∼γ(2;θ), tìm ước lượng cho tham số θ.

Chương 3

Kiểm định phi tham số

Mục lục

3.1 Bài toán kiểm định và các khái niệm cơ bản . . . 32

3.1.1 Giới thiệu bài toán kiểm định . . . 32

3.1.2 Sai lầm loại I và sai lầm loại II . . . 32

3.1 Bài toán kiểm địnhvà các khái niệm cơ bản và các khái niệm cơ bản 3.1.1 Giới thiệu bài toán kiểm định

Giả sử ta có mẫu ngẫu nhiên X = (X1, X2, . . . , Xn) các quan sát độc lập về biến ngẫu nhiênξ, cònF là lớp các hàm phân bố nào đó. Ta chiaF thành hai lớp con FH và FK =F \FH. Biết rằng hàm phân bố F của biến ngẫu nhiên

X đang xét thuộc vào lớp F nhưng chưa biết F ∈ FH hay F ∈ FK. Ta chọn mệnh đề “Hàm phân bố F thuộc lớp FH” là giả thiết H, còn mệnh đề “Hàm phân bố F thuộc lớp FK” là giả thiết K. Bài toán đặt ra là: Hãy kiểm tra xem giả thiết H đúng hay đối thiết K đúng?

Nếu lớp F được tham sos hóa, tức F = {F(x, θ), θ ∈ Θ}, trong đó dạng toán học của hàm F đã biết, θ là tham số chưa biết. KHi đó ta sẽ đồng nhất lớpF với không gian tham sốΘvà giả thiếtH : “F ∈ FH” sẽ là “θ∈ΘH”, còn đối thiếtK : “F ∈ FK” sẽ là “θ ∈ΘK”, trong đóΘH∩ΘK =∅,ΘH∪ΘK = Θ. Nếu ΘH chỉ gồm 1 điểm thì giả thiếtH được gọi là giả thiết đơn. NếuΘH có nhiều hơn 1 điểm thì giả thiết H được gọi là giả thiết hợp. Ta cũng có những khái niệm tương tự với đối thiết K.

Phương pháp chung để giải bài toán kiểm định giả thiếtH và đối thiếtK

là:

Giả sử Xlà không gian giá trị của biến ngẫu nhiên ξ. Ta tìm cách chia X

ra làm 2 phần: S và S = X\S. Sau đó ta chọn quyết định theo quy tắc sau: Nếu mẫu ngẫu nhiên (X1, X2, . . . , Xn)∈ S thì ta bác bỏ giả thiết H và bác bỏ đối thiết K. Nếu mẫu ngẫu nhiên (X1, X2, . . . , Xn) ∈S thì ta chấp nhận giả thiết H, hay nói chính xác hơn là chưa có cơ sở để bác bỏ H và do đó ta có khuynh hướng nhận H cho đến khi có thông tin mới. Miền S tìm được trên được gọi là miền tiêu chuẩn (hoặc miền tới hạn).

Vấn đề đặt ra là: Chia không gian mẫu X thành hai phần như thế nào, tức là chọn miện S như thế nào?

3.1.2 Sai lầm loại I và sai lầm loại II

Khi chọn một trong hai quyết định theo quy tắc như nêu trong Mục 3.1.1sẽ nảy sinh ra hai loại sai lầm:

Sai lầm loại I: Bác bỏ giả thiếtH khi H đúng. Sai lầm loại II: Chấp nhận giả thiết H khi H sai.

Ký hiệu P(S|H) và P(S|K) là các xác suất mắc sai lầm loại I và loại II, tương ứng. Lẽ tự nhiên là ta chọn miền tiêu chuẩn S sao chocwcj tiểu hóa cả hai xác suất mắc sai lầm, tức là chọn S sao cho có thể loại trừ khả năng mắc cả hai loại sai lầm càng nhiều càng tốt. Song không thể cực tiểu đồng thời cả

3.1. Bài toán kiểm định và các khái niệm cơ bản 33

hai loại sai lầm khi cỡ mẫu cố định, bở vì hai xác suất trên liên hệ với nhau bởi hệ thức:

P(S|K) +P(S|K) = 1; P(S|H) +P(S|H) = 1.

Do đó nếu miền tiêu chuẩn S làm cực tiểu P(S|H) chưa chắc cũng làm cực tiểu P(S|K)và ngược lại. Hơn nữa miền tiêu chuẩn S =∅sẽ có xác suất mắc sai lầm loại I bằng không, tức là bé nhất, nhưng miền tiêu chuẩn như vậy lại không có ý nghĩa gì. Vậy ta hiểu cực tiểu đồng thời hai xác suất mắc sai lầm theo nghĩa tổng của chúng là nhỏ nhất. Do vậy có hai phương pháp chọn miền tiêu chuẩn S:

Phương pháp I:Cố định hai xác suất mắc sai lầm, chọn miềnS sao cho cỡ mẫun là cực tiểu.

Phương pháp II: Ta cố định một loại xác suất mắc sai lầm và tìm miền

S sao cho xác suất mắc sai lầm kia là cực tiểu. Thông thường ta cố định xác suất mắc sai lầm loại I: P(S|H) ≤ α, tức là cho giới hạn trên của xác suất mắc sai lầm loại I, ta sẽ chọn miền tiêu chuẩnS sao cho xác suất mắc sai lầm loại IIP(S|K)đạt cực tiểu hayP(S|K)đạt cực đại. Phương pháp II được sử dụng rộng rãi hơn, do vậy ta sẽ tiếp cận theo phương pháp này.

Cho trước 0≤α ≤1, ta chọn miền tiêu chuẩn S sao cho:

Một phần của tài liệu bài giảng thống kê nâng cao (Trang 26)

Tải bản đầy đủ (PDF)

(47 trang)