1. Trang chủ
  2. » Giáo án - Bài giảng

Giaso trình Thống kê

97 461 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 97
Dung lượng 2,08 MB

Nội dung

CÔNG THỨC XÁC SUẤT CƠ BẢN Công thức tính xác suất Công thức tính xác suất theo Định nghĩa cổ điển: ỚC LƯỢNG THAM SỐ Ước lượng không chệch của tham số ...................................................

Trang 1

MỘT SỐ PHÂN PHỐI XÁC SUẤT QUAN TRỌNG

1.0.1 Phân phối Bernoulli

1 nếu sinh viên đó hút thuốc lá

0 nếu sinh viên đó không hút thuốc láNếu có 20% sinh viên hút thuốc lá thì hàm mật độ xác suất của X là

Trang 2

Ví dụ 1.3 Trong một quần thể heo tính mẫn cảm đối với một bệnh được xácđịnh bởi một locus gene gồm hai alen: B và b Heo có kiểu gen bb sẽ có bệnh,

Bb và BB không bệnh Tần số của alen B = b = 0.5 Nếu một heo đực và mộtheo nái đều có kiểu gen Bb giao phối với nhau và sinh ra một lứa 10 heo con.Hãy tính: a) Số heo con có khả năng mang bệnh

b) Xác xuất để không có heo con nào bệnh

c) Xác suất để ít nhất có một heo con bị bệnh

d) Xác suất để có đúng một nửa đàn heo bị bệnh

(i) Nếu X1, X2, , Xn là các biến ngẫu nhiên độc lập và có cùng phân phối

Ber(p), thì

S = X1+ X2+ + Xn ∼ Bin(n, p).

(ii) Cho X ∼ Bin(n, p), khi đó E(X) = np và V ar(X) = np(1 − p)

Ví dụ 1.4 Giả sử ở một siêu thị có đến 75% khách hàng thanh toán bằng thẻtín dụng Chọn ngẫu nhiên 10 khách hàng của siêu thị đó, gọi X là số kháchhàng thanh toán bằng thẻ tín dụng, khi đó X ∼ Bin(10; 0.75) Do đó ta có

E(X) = np = 7.5, V ar(X) = np(1 − p) = 1.875

Ví dụ 1.5 Một sinh viên cần hoàn thành một bài kiểm tra gồm 5 câu hỏi trắcnghiệm Xác suất trả lời đúng mỗi câu hỏi của sinh viên đó là như nhau và bằng

0.65 Mỗi câu trả lời đúng được 4 điểm và mỗi câu trả lời sai bị trừ 2 điểm Tính

số điểm trung bình sinh viên đó đạt được

Đặt X = số câu hỏi sinh viên đó trả lời đúng, X ∼ Bin(5; 0.65)

Đặt Y = số điểm sinh viên đó đạt được, Y = 4X − 2(5 − X) = 6X − 10

Số điểm trung bình sinh viên đó đạt được là

E(Y ) = 6E(X) − 10 = 6(5.0.65) − 10 = 9.5.

1.0.3 Phân phối chuẩn

Định nghĩa 1.6 Biến ngẫu nhiên liên tụcX được gọi là có phân phối chuẩnvới tham số µvà σ2 (−∞ < µ < ∞ and σ > 0) nếu X có hàm mật độ xác suất

f (x; µ, σ) = 1

σ √ 2πe

−(x−µ)22σ2 , x ∈R.

Kí hiệu: X ∼ N (µ; σ2)

Trang 3

Phân phối chuẩn tắc

Biến ngẫu nhiên chuẩn có tham số µ = 0 và σ = 1 được gọi là phân phốichuẩn tắc Một biến ngẫu nhiên có phân phối chuẩn tắc được kí hiệu bởi Z.Hàm mật độ xác suất của Z là

- Vào Mode tìm 1-Var: Mode→3 (Stat)→1 (1-Var)→ AC

- Shift→ 1(Stat)→ 7 (Distr) →1;

- Nhập x

Ví dụ 1.7 Tính Φ(1, 96), Φ(−1, 65)

Trang 4

Giải Đặt Xk là chiều cao của nam thanh niên thứ kth (k = 1, 2, , 100) Khi đó,

Trang 5

Khi đó, với mọi ε > 0,

lim n→∞ P (|1

1.2.2 Định lí giới hạn trung tâm

Định lý 1.12 (Law of Large numbers) Cho {Xn, n ≥ 1} là dãy biến ngẫu nhiênđộc lập, cùng phân phối xác suất với kì vọng chung = µ và phương sai chung σ2.Khi đó

lim n→∞ P (S − nµ√

µ = 205 kg và độ lệch chuẩn σ = 15 kg Tính xác suất thang máy có thể vẫnchuyển được một lô hàng được chọn ngẫu nhiên gồm 49 thùng hàng như trên?Giải ĐặtXi=trọng lượng thùng hàng thứ i Ta cóE(Xi) = µ = 205, V ar(Xi) =

σ2 = 152 với i = 1, 2, , 49 Vì vậy

P (S = X1+ + X49< 9800) ≈ Φ(9800 − 49.205√

49.15 ) = Φ(−2.33) = 0.0099.

Trang 6

THỐNG KÊ MÔ TẢ

2.1 Khái niệm mẫu và tổng thể

Trước hết ta xét ví dụ sau: để điều tra chiều cao của thanh niên Việt Nam

từ 18 tuổi đến 25 tuổi, người điều tra phải lập danh sách tất cả thanh niên ViệtNam có độ tuổi từ 18 đến 25 Ứng với mỗi thanh niên, ghi chiều cao của thanhniên đó Khi đó:

- Tập hợp toàn bộ thanh niên Việt Nam có độ tuổi từ 18 đến 25 được gọi là tổngthể (population)

- Mỗi thanh niên được điều tra được gọi là phần tử của tổng thể

- Vì số lượng thanh niên có độ tuổi từ 18 đến 25 trên cả nước là rất lớn nên takhông thể điều tra hết được mà chỉ chọn ra 1 tập hợp con để điều tra Tập hợpcon được chọn ra đó được gọi là một mẫu (sample), số phần tử của mẫu đượcgọi là kích thước mẫu, tập tất cả các giá trị chiều cao của các cá thể trong mẫuđược gọi là mẫu số liệu(sample data)

a)Tổng thể là tập hợp tất cả các phần tử có chung một tính chất X nào đó

mà chúng ta đang quan tâm nghiên cứu

b) Mẫu là một tập con của tổng thể được chọn ra đề nghiên cứu Số phần tửcủa mẫu được gọi là kích thước mẫu

c) Nếu mỗi phần tử của tổng thể có tính chất X là một số thực thìX được gọi

là biến số, tập các giá trị X của mẫu được gọi là mẫu số liệu

Trang 7

2.2 Các số đặc trưng của một mẫu số liệu

2.2.1 Trung bình mẫu, phương sai mẫu và độ lệch chuẩn mẫu

Cho {x1, x2, , xn} là mẫu số liệu của biến số X

1) Trung bình mẫu, kí hiệu là x, được tính theo công thức:

x = x1+ x2+ + xn

1 n

Trang 8

2.3.1 Biểu đồ phân bố tần số (Histogram)

Cho (x1, x2, , xn) là mẫu số liệu của biến số X

1 Trường hợp 1: X là biến số rời rạc

Lập bảng phân bố tần số rời rạc của số liệu đã cho như sau:

Trang 9

qua màn

Sốgame thủ

Tần sốtương đối

Vượtqua màn

Sốgame thủ

Tần sốtương đối

Trong đó, số khoảng cần chia tốt nhất là từ 5 đến 20 khoảng, có thể chọn xấp

xỉ bằng √n (hoặc 1 + log2(n)) Nếu ta chia dữ liệu thành m khoảng thì độ dàimỗi khoảng xấp xỉ (max{xk} − min{xk})/m.

Sử dụng hệ trục tọa độ Descartes vuông góc với trục hoành là các khoảnggiá trị [ak−1; ak), trục tung là tần số (hoặc tần số tương đối)

Ví dụ 2.5 Nghiên cứu sức chịu nén của mẫu hợp kim Nhôm-Liti mới sản xuất(hợp kim sử dụng làm vật liệu chế tao máy bay) người ta thử nghiệm 80 mẫu

và thu được số liệu sau (đơn vị pound/inch2)

Trang 10

Do đó, biểu đồ histogram như sau:

2.3.2 Biểu đồ thân-lá(Stem-and-Leaf Plots)

Biểu đồ này tương tự histogram, chỉ khác ở chỗ chúng trình bày giá trị dữliệu thay vì dùng các cột Biểu đồ thân - lá gồm 3 thành phần là phần thân(gồm một hoặc 2 chữ số đầu của một số liệu) và phần lá (gồm những chữ số cònlại) và tần số, thường chỉ dùng cho các nhóm dữ liệu nhỏ Để tạo biểu đồ thân

- lá ta làm như sau:

(1) Chia mỗi số liệu xk thành 2 phần: phần thân gồm một hoặc 2 chữ số đầu,phần lá là những chữ số còn lại;

Trang 11

(2) Ghi phần thân thành một cột;

(3) Mỗi số liệu xk ghi lại phần lá ứng với phần thân trên cùng một hàng;

(4) Với mỗi xk ghi lại phần lá trên hàng của cột 2 ứng với phần thân;

(5) Ghi tần số trên cột thứ 3 (số phần lá ứng với phần thân)

(Tốt nhất chia số liệu từ 5 đến 20 thân)

Ví dụ 2.6 Vẽ biểu đồ thân - lá trong ví dụ 2.5

Lấy phần thân là các số 7, 8, 9, , 24, khi đó ta được biểu đồ Thân - Lá nhưsau:

2.4 Biểu đồ xác suất chuẩn (Normal probability plots)

Giả sử mẫu số liệu của biến số X đã sắp thứ tự tăng dần:

x1≤ x2 ≤ x3≤ ≤ xn.

Hàm phân phối tần số thực nghiệm của X được xác định như sau

F (x) = số phần tử của mẫu số liệu <x

Trang 12

Nếu biến số X có phân bố chuẩn N (µ; σ2) thì

P (X < xj) = Φ(xj− µ

j − 0, 5 n

Biểu đồ xác suất chuẩn là tập hợp các điểm có tọa độ (xi; zi) for i = 1, 2, , n

trên hệ trục tọa độ Descartes vuông góc Ozx Trong đó

Φ(zj) = j − 0, 5

Ví dụ 2.7 Xây dựng biểu đồ xác suất chuẩn của số liệu sau

176 183 185 190 191 192 201 205 214 220

Trang 13

2.5 Chọn mẫu ngẫu nhiên

2.5.1 Chọn mẫu từ tổng thể hữu hạn

Giả sử tổng thể cần nghiên cứu có kích thước N, ta cần chọn ra 1 mẫu cókích thước n

Định nghĩa 2.8 Một mẫu ngẫu nhiên đơn giản kích thước n được chọn ra từ

1 tổng thể kích thước N là mẫu được chọn sao cho mỗi mẫu kích thược n đượcchọn có xác suất như nhau

Mẫu ngẫu nhiên đơn giản kích thước n sẽ được kí hiệu là (X1, X2, , Xn) Docác phần tử được chọn vào mẫu là ngẫu nhiên nênX1, X2, , Xn là các biến ngẫunhiên

Có hai phương phương pháp chọn mẫu ngẫu nhiên cơ bản: chọn mẫu ngẫu nhiên

có hoàn lại và chọn mẫu ngẫu nhiên không hoàn lại

a) Chọn mẫu ngẫu nhiên có hoàn lại: mỗi phần tử được chọn ngẫu nhiên vàomẫu sau khi ghi lại thông tin cần nghiên cứu được trả lại tổng thể Như vậy mỗiphần tử có thể được chọn nhiều hơn 1 lần vào mẫu Các phần tử được chọn vàomẫu là độc lập

Để minh họa ta xét ví dụ: tổng thể Ω = {a, b, c}, ta cần chọn 1 mẫu có kíchthước n = 2 theo phương pháp chọn mẫu có hoàn lại

Trang 14

b) Chọn mẫu ngẫu nhiên không hoàn lại: mỗi phần tử được chọn vào mẫu sẽkhông trả lại tổng thể Như vậy mỗi phần tử sẽ được chọn không quá 1 lần Cácphần tử được chọn vào mẫu là không độc lập.

Ví dụ: tổng thểΩ = {a, b, c}, ta cần chọn 1 mẫu có kích thước n = 2theo phươngpháp chọn mẫu không hoàn lại

Nếu (X 1 , X2, , X n ) là mẫu được chọn theo phương pháp không hoàn lại thì

X 1 , X 2 , , X n là các biến ngẫu nhiên không độc lập và có cùng phân bố với tổngthể Tuy nhiên trong trường hợp tổng thể có kích thước N lớn hơn rất nhiều sovới kích thước mẫu n, thường được giả thiết n/N ≤ 0, 05, thì X1, X2, , Xn gầnnhư độc lập

Nói chung, khi tổng thể có kích thước N rất lớn thì không có khác biệt đáng

kể giữa hai phương pháp chọn mẫu trên Và trên thực tế phương pháp chọn mẫukhông hoàn lại được áp dụng nhiều hơn Trong phạm vi giáo trình này chúngtôi luôn giả thiết n/N ≤ 0, 05

Để áp dụng phương pháp chọn mẫu ngẫu nhiên không hoàn lại ta có thể sửdụng bảng số ngẫu nhiên hoặc sử dụng phần mềm máy tính

Trang 15

2.5.2 Chọn mẫu từ tổng thể vô hạn

Trong một số trường hợp ta cần chọn mẫu kích thước n từ 1 tổng thể có

vô hạn phần tử (N = ∞) Chẳng hạn chọn một mẫu các sản phẩm được sảnxuất bởi một nhà máy; chọn một mẫu là khách hàng vào một cửa hàng; Đốivới trường hợp tổng thể có vô hạn phần tử, một mẫu ngẫu nhiên (X1, X2, , Xn)

được chọn phải thỏa mãn các điều kiện sau:

1) Các phần tử được chọn vào mẫu là ngẫu nhiên

2) Mỗi phần tử phải được chọn độc lập nhau

Với cách chọn mẫu thỏa mãn 2 điều kiện trên thì mẫu ngẫu nhiên(X 1 , X 2 , , X n )

là các đại lượng ngẫu nhiên độc lập và có cùng phân bố với tổng thể

2.6 Mẫu ngẫu nhiên

Cho X là một biến số của 1 tổng thể cần nghiên cứu Vì việc chọn các phần

tử từ tổng thể vào mấu là ngẫu nhiên nên X là biến ngẫu nhiên Từ các nhậnxét trong phương pháp chọn mẫu ngẫu nhiên ta đưa ra định nghĩa mẫu ngẫunhiên như sau

Định nghĩa 2.9 Cho X là một biến số của một tổng thể Một mẫu ngẫu nhiênkích thước n là n biến ngẫu nhiên (X1, X2, , Xn) thỏa mãn 2 điều kiện sau:

1 X1, X2, , Xn là các biến ngẫu nhiên độc lập

2 Xk có cùng phân bố xác suất với X với mọi k = 1, 2, , n

Hiểu một cách đơn giản thì mẫu ngẫu nhiên là mẫu được chọn ngẫu nhiên

2.7 Phân bố của trung bình mẫu

Trong mục này ta sẽ nghiên cứu phân bố của trung bình mẫu Trước hết taxét ví dụ sau:

Ví dụ 2.10 Cho tổng thểΩ = {1, 2, 3, 4, 5, 6} Tìm phân bố của trung bình mẫu

có kích thước n = 2 chọn theo phương pháp có hoàn lại

Kí hiệu (X1, X2) là mẫu ngẫu nhiên Ta có bảng các giá trị của (X1, X2)

Trang 16

Biểu đồ tần số của trung bình mẫu:

Nhận xét: Trung bình mẫu X có hình dáng phân bố chuẩn

Định lý 2.11 Nếu (X1, X2, , Xn) là mẫu ngẫu nhiên lấy từ tổng thể có phân

bố chuẩn với kì vọng µ và độ lệch chuẩn σ/ √

n.Định lý 2.12 Nếu (X1, X2, , Xn) là mẫu ngẫu nhiên lấy từ tổng thể có phân

bố chuẩn N (µ; σ2) thì biến ngẫu nhiên

X − µ S/ √ n

Trang 17

có phân phối Student n − 1 bậc tự do (Tn−1).

Trang 18

BÀI TẬP

. 2.1 Công ty bao bì Hải Pack đang nhập lô hàng 20.000 bao hạt nhựa của mộtnhà cung cấp quen Dữ liệu quá khứ cho thấy khối lượng của các bao hạt nhựanày tuân theo luật phân phối chuẩn với phương sai 36(kg2) Chọn ngẫu nhiên

25 bao hạt nhựa để cân thu được giá trị trung bình là 96 Kg/bao Với độ tin cậy95% hãy ước lượng khoảng tin cậy đối xứng khối lượng trung bình của 20.000bao hạt nhựa này

. 2.2 Doanh số của một cửa hàng là đại lượng ngẫu nhiên phân phối chuẩn với

độ lệch chuẩn là 2 triệu đồng/tháng Điều tra ngẫu nhiên doanh số của 600 cửahàng có quy mô tương tự nhau tìm được doanh số trung bình là 8,5 triệu V ới

độ tin cậy 95% hãy ước lượng doanh số trung bình của các cửa hàng thuộc quy

mô đó

. 2.3 Để nghiên cứu nhiệt độ trung bình trong tháng 4 ở thành phố A, người

ta theo dõi trong 10 địa điểm và thu được số liệu sau:

Với độ tin cậy 95% hãy ước lượng khoảng nhiệt độ trung bình trong tháng 4 củathành phố trên Biết nhiệt độ trung bình trong 1 tháng là đại lượng ngẫu nhiênphân phối chuẩn

. 2.4 Với độ tin cậy 95%, hãy ước lượng khoảng lượng xăng hao phí trung bìnhcho một ô tô chạy từ A đến B nếu chạy thử 30 lần trên đoạn đường này người

ta ghi nhận được lượng xăng hao phí như sau:

Lượng xăng hao phí (lít) Tần số

Biết rằng lượng xăng hao phí là đại lượng ngẫu nhiên tuân theo quy luật chuẩn

. 2.5 Để định mức thời gian gia công một chi tiết máy, người ta theo dõi ngẫunhiên quá trình gia công 25 chi tiết và thu được số liệu sau:

Trang 19

Thời gian gia công (phút) Tần số

. 2.6 Kiểm tra ngẫu nhiên 16 viên thuốc từ một lô thuốc mới nhập về tìmđược độ phân tán thực nghiệm của thành phần chính trong mỗi viên thuốc là

s2 = 0, 0075gr2 Với độ tin cậy 95% hãy ước lượng khoảng đối xứng độ phân táncủa thành phần chính trong mỗi viên thuốc của cả lô thuốc đó Biết trọng lượngthành phần chính trong mỗi viên thuốc có phân phối theo quy luật chuẩn

. 2.7 Để nghiên cứu độ ổn định của một máy gia công, người ta lấy ngẫu nhiên

25 chi tiết do máy đó gia công, đem đo và thu được các kích thước như sau:

. 2.8 Hãy ước lượng tỷ lệ chính phẩm của một nhà máy bằng khoảng tin cậyđối xứng với độ tin cậy 0,95 biết rằng kiểm tra 100 sản phẩm của nhà máy thìthấy có 10 phế phẩm

. 2.9 Mở 200 hộp của một kho đồ hộp, người ta thấy có 28 hộp bị biến chất.Với độ tin cậy 0,95, bằng khoảng tin cậy đối xứng, hãy ước lượng tỷ lệ đồ hộpbiến chất ở trong kho

Trang 20

. 2.10 Trong đợt vận động bầu cử tổng thống người ta phỏng vấn ngẫu nhiên

1600 cử tri thì được biết 960 người trong số đó sẽ bỏ phiếu cho ứng cử viên A.Với độ tin cậy 90%, ứng cử viên A sẽ chiếm được tỷ lệ phiếu bầu trong khoảngnào?

. 2.11 Nhà máy A sản xuất 1 loại sản phẩm Để ước lượng tỉ lệ thành phẩmngười ta chọn ngẫu nhiên 400 sản phẩm và chia thành 40 nhóm để kiểm tra.Kết quả thu được như sau

Số thành phẩm trong nhóm 1 2 3 4 5 6 7 8 9 10

Với độ tin cậy 90% hãy ước lượng khoảng tỉ lệ thành phẩm của nhà máy

Trang 21

ƯỚC LƯỢNG THAM SỐ

3.1 Ước lượng điểm

3.1.1 Ước lượng điểm và hàm ước lượng

Một biến số X của một tổng thể có các số đặc trưng của nó như kì vọng,phương sai, Các số đặc trưng này sẽ được gọi chung là tham số Nói chung, các

số đặc trưng của một biến số thường khó biết được chính xác giá trị của nó làbao nhiêu Giả sử ta có một mẫu số liệu của X là (x1, x2, , xn) Khi đó để ướclượng kì vọng µ của X ta có thể sử dụng trung bình mẫu Tuy nhiên ta có thể

3.1.2 Ước lượng không chệch

Giả sử(X1, X2, , Xn)là mẫu ngẫu nhiên Hàm ước lượngθ = ˆˆ θ(X1, X2, , Xn)

được gọi là ước lượng không chệch đối với tham số θ nếuE(ˆ θ) = θ Ngược lạị, tagọi θˆlà ước lượng chệch và E(ˆ θ) − θ gọi là độ chệch của ước lượng

Trang 22

3.1.3 Ước lượng không chệch của kì vọng và phương sai

Cho biến số X của 1 tổng thể có E(X) = µ, V ar(X) = σ2 Với (X 1 , X 2 , , X n )

là mẫu ngẫu nhiên lấy từ tổng thể trên Khi đó

(Xi− X) 2 là ước lượng không chệch của σ2

3.1.4 Ước lượng không chệch tỉ lệ

Giả sử p là tỉ lệ phần tử có tính chất A nào đó trong 1 tổng thể (chẳng hạn

tỉ lệ phế phẩm do 1 dây chuyền sản xuất, ) Ta sẽ sử dụng phân bố Bernoulli

để mô tả bằng cách mỗi phần tử của của tổng thể được gán bởi 1 nếu có tínhchất A và được gán bởi 0 nếu không có tính chất A Chọn ngẫu nhiên 1 phần

Khi đó X có phân bố Bernoulli với tham số p

Cho biến số X của 1 tổng thể có phân phối Bernoulli với tham số p Gọi

(X1, X2, , Xn) là mẫu ngẫu nhiên lấy từ tổng thể này Khi đó

ˆ

P = X1+ X2+ + Xn

n

là một ước lượng không chệch của tham số p

3.2 Ước lượng khoảng kì vọng

Cho biến số X của một tổng thể có E(X) = µ chưa biết, ước lượng khoảngcủa µ có dạng l < µ < u Đề tìm l và u ta tiến hành các bước như sau:

(1) Cho trước một số α ∈ (0; 1) gọi là mức ý nghĩa;

(2) Với mẫu ngẫu nhiên (X1, X2, , Xn), tìm hai hàm n biến

L = L(X1, X2, , Xn)

Trang 23

u = U (x1, x2, , xn) Khi đó ước lượng khoảng cần tìm là l < µ < u.

1 − α gọi là độ tin cậy của ước lượng

3.2.1 X ∼ N (µ; σ2) với σ2 đã biết

Bài toán: Cho biến số X của một tổng thể có phân bố chuẩn N (µ; σ2) với µ

chưa biết và σ2 đã biết Tìm ước lượng khoảng của µ

Hình 3.1

Nếu (X1, X2, , Xn) là mẫu ngẫu

nhiên lấy từ tổng thể trên thì

Z ∞

z α 2

σ

n < µ < X + z

α 2

σ

√ n



= 1 − α.

Từ đó ta có định nghĩa:

Trang 24

Định nghĩa 3.1 Cho biến số X của một tổng thể có phân bố chuẩn N (µ; σ2)

với µ chưa biết và σ2 đã biết Nếu x là trung bình mẫu của một mẫu ngẫunhiên kích thước n lấy từ tổng thể thì với độ tin cậy 1 − α, ước lượng khoảngcủa µ là

x − z α 2

σ

n < µ < x + z

α 2

Ví dụ 3.2 Trọng lượng (kg) sản phẩm của công ty A có phân phối chuẩn

N (µ; σ2) với σ = 1 (kg) Chọn ngẫu nhiên 25 sản phẩm người ta tính được trungbình mẫu x = 50, 1 (kg) Với độ tin cậy 95% hãy ước lượng khoảng trọng lượngtrung bình của sản phẩm công ty A

Giải α = 0, 05 suy ra z α

2 = z0,025 = 1, 96

z α 2

n Do đó với độ tin cậy 1 − α, nếu muốn có ước lượng µ

có sai số không vượt quá ∆ cho trước thì ta cần chọn cỡ mẫu n thỏa mãn

z α 2

Khoảng tin cậy một phía

Khoảng tin cậy đối xứng trong trường hợp l = ∞ hoặc u = ∞, thay z α

2 bởi

z α ta thu được khoảng tin cậy một phía như sau:

Trang 25

Với độ tin cậy 1 − α ước lượng khoảng tối đa của µ là

3.2.2 X ∼ N (µ; σ2) với σ2 chưa biết

Bài toán: Cho biến số X của một tổng thể có phân bố chuẩn N (µ; σ2) với µ

chưa biết và σ2 chưa biết Tìm ước lượng khoảng của µ

Hình 3.2

Nếu (X1, X2, , Xn) là mẫu ngẫu

nhiên lấy từ tổng thể trên thì theo

Định lí 2.12 ta có biến ngẫu nhiên

S/ √ n

có phân bố Student n − 1 bậc tự do

Với mức ý nghĩaα lấy giá trị tn−1;α

n < tn−1;

α 2



= 1 − α.

Vì vậy ta định nghĩa ước lượng khoảng của µcho trường hợp chưa biết phươngsai như sau:

Trang 26

Định nghĩa 3.3 Cho biến số X của một tổng thể có phân bố chuẩn N (µ; σ2)

với µ chưa biết và σ2 chưa biết Nếu x và s lần lượt là trung bình mẫu và độlệch chuẩn mẫu của một mẫu ngẫu nhiên kích thước n lấy từ tổng thể thì với

độ tin cậy 1 − α, ước lượng khoảng của µ là

Ví dụ 3.4 Một bài báo trong tạp chí Materials Engineering (1989, Vol II, No

4, pp 275–281) mô tả kết quả kiểm tra độ bền của 22 mẫu hợp kim U-700 (đơnvị: MPa) như sau:

Trang 27

Từ biểu đồ xác suất chuẩn có thể kết luận độ bền hợp kim có phân bố chuẩn.

x = 13, 71; s = 3, 55 tn−1;α

2 = t21;0,025 = 2, 080

tn−1;α 2

Ước lượng khoảng độ bền của loại hợp kim đó là: 12, 14 < µ < 15, 28

Ví dụ 3.5 Một bài báo trong năm 1993 của Hiệp hội Thủy sản Mỹ báo cáo kếtquả của một nghiên cứu để điều tra về ô nhiễm thủy ngân trong loài cá vượcmiệng rộng Một mẫu cá đã được lựa chọn từ 53 hồ ở Florida, kết quả nồng độthủy ngân được như sau (đơn vị: 10−4%)

1,23 0,49 0,49 1,08 0,59 0,28 0,18 0,10 0,941,33 0,19 1,16 0,98 0,34 0,34 0,19 0,21 0,400,04 0,83 0,05 0,63 0,34 0,75 0,04 0,86 0,430,04 0,81 0,15 0,56 0,84 0,87 0,49 0,52 0,251,20 0,71 0,19 0,41 0,50 0,56 1,10 0,65 0,270,27 0,50 0,77 0,73 0,34 0,17 0,16 0,27

Với độ tin cậy 95% hãy ước lượng khoảng nồng độ thủy ngân trung bình cótrong loài cá trên

Giải

Biểu đồ xác suất chuẩn cho thấy nồng độ thủy ngân có trong cá không có phân

bố chuẩn, tuy nhiên do cỡ mẫu n = 53 > 30 nên áp dụng Định lí giới hạn trungtâm ta vẫn có thể tiến hành ước lượng

Trang 28

Khoảng tin cậy một phía

Với độ tin cậy 1 − α, ước lượng khoảng tối đa của kì vọng µ là

3.3 Ước lượng khoảng tỉ lệ

Giả sử biến số X của một tổng thể có phân bố Bernoulli với tham số p là tỉ

lệ phần tử trong tổng thể có tính chất A nào đó Trong phần này ta sẽ xây dựngcông thức ước lượng khoảng của p

Gọi (X1, X2, , Xn) mẫu ngẫu nhiên lấy từ tổng thể trên Đặt

có xấp xỉ phân phối chuẩn tắc N (0; 1) Nên với α ∈ (0; 1) cho trước, lấy z α

r

ˆ

P (1 − ˆ P ) n

!

≈ 1 − α.

Vì vậy ta định nghĩa ước lượng khoảng của p như sau

Trang 29

Định nghĩa 3.6 Nếu p = k/n ˆ là một ước lượng của tỉ lệ p từ 1 mẫu ngẫunhiên kích thước n thì với độ tin cậy 1 − α, ước lượng khoảng của p là

ˆ

p − z α 2

r

ˆ p(1 − ˆ p)

n < p < ˆp − zα2

r

ˆ p(1 − ˆ p)

Ước lượng trên tốt nhất khi k ≥ 10 và n − k ≥ 10

Ví dụ 3.7 Với độ tin cậy 95% hãy ước lượng tỷ lệ phế phẩm của một nhà máybiết rằng kiểm tra 100 sản phẩm của nhà máy thì thấy có 10 phế phẩm

Khoảng tin cậy một phía

Cho p = k/n ˆ là một ước lượng của tỉ lệ p từ 1 mẫu ngẫu nhiên kích thước n.với độ tin cậy 1 − α ước lượng khoảng tối đa của p là

p < ˆ p + zα

r

ˆ p(1 − ˆ p)

Trang 30

BÀI TẬP

. 3.1 Công ty bao bì Hải Pack đang nhập lô hàng 20.000 bao hạt nhựa của mộtnhà cung cấp quen Dữ liệu quá khứ cho thấy khối lượng của các bao hạt nhựanày tuân theo luật phân phối chuẩn với phương sai 36(kg2) Chọn ngẫu nhiên

25 bao hạt nhựa để cân thu được giá trị trung bình là 96 Kg/bao Với độ tin cậy95% hãy ước lượng khoảng tin cậy đối xứng khối lượng trung bình của 20.000bao hạt nhựa này

. 3.2 Doanh số của một cửa hàng là biến ngẫu nhiên phân phối chuẩn với độlệch chuẩn là 2 triệu đồng/tháng Điều tra ngẫu nhiên doanh số của 600 cửahàng có quy mô tương tự nhau tìm được doanh số trung bình là 8,5 triệu V ới

độ tin cậy 95% hãy ước lượng doanh số trung bình của các cửa hàng thuộc quy

mô đó

. 3.3 Để nghiên cứu nhiệt độ trung bình trong tháng 4 ở thành phố A, người

ta theo dõi trong 10 địa điểm và thu được số liệu sau:

Với độ tin cậy 95% hãy ước lượng khoảng nhiệt độ trung bình trong tháng 4của thành phố trên Biết nhiệt độ trung bình trong 1 tháng là biến ngẫu nhiênphân phối chuẩn

. 3.4 Với độ tin cậy 95%, hãy ước lượng khoảng lượng xăng hao phí trung bìnhcho một ô tô chạy từ A đến B nếu chạy thử 30 lần trên đoạn đường này người

ta ghi nhận được lượng xăng hao phí như sau:

Lượng xăng hao phí (lít) Tần số

Biết rằng lượng xăng hao phí là biến ngẫu nhiên tuân theo quy luật chuẩn

. 3.5 Để định mức thời gian gia công một chi tiết máy, người ta theo dõi ngẫunhiên quá trình gia công 25 chi tiết và thu được số liệu sau:

Trang 31

Thời gian gia công (phút) Tần số

. 3.6 Kiểm tra ngẫu nhiên 16 viên thuốc từ một lô thuốc mới nhập về tìmđược độ phân tán thực nghiệm của thành phần chính trong mỗi viên thuốc là

s2 = 0, 0075gr2 Với độ tin cậy 95% hãy ước lượng khoảng đối xứng độ phân táncủa thành phần chính trong mỗi viên thuốc của cả lô thuốc đó Biết trọng lượngthành phần chính trong mỗi viên thuốc có phân phối theo quy luật chuẩn

. 3.7 Để nghiên cứu độ ổn định của một máy gia công, người ta lấy ngẫu nhiên

25 chi tiết do máy đó gia công, đem đo và thu được các kích thước như sau:

. 3.8 Hãy ước lượng tỷ lệ chính phẩm của một nhà máy bằng khoảng tin cậyđối xứng với độ tin cậy 0,95 biết rằng kiểm tra 100 sản phẩm của nhà máy thìthấy có 10 phế phẩm

. 3.9 Mở 200 hộp của một kho đồ hộp, người ta thấy có 28 hộp bị biến chất.Với độ tin cậy 0,95, bằng khoảng tin cậy đối xứng, hãy ước lượng tỷ lệ đồ hộpbiến chất ở trong kho

Trang 32

. 3.10 Trong đợt vận động bầu cử tổng thống người ta phỏng vấn ngẫu nhiên

1600 cử tri thì được biết 960 người trong số đó sẽ bỏ phiếu cho ứng cử viên A.Với độ tin cậy 90%, ứng cử viên A sẽ chiếm được tỷ lệ phiếu bầu trong khoảngnào?

. 3.11 Nhà máy A sản xuất 1 loại sản phẩm Để ước lượng tỉ lệ thành phẩmngười ta chọn ngẫu nhiên 400 sản phẩm và chia thành 40 nhóm để kiểm tra.Kết quả thu được như sau

Số thành phẩm trong nhóm 1 2 3 4 5 6 7 8 9 10

Với độ tin cậy 90% hãy ước lượng khoảng tỉ lệ thành phẩm của nhà máy

Trang 33

KIỂM ĐỊNH GIẢ THUYẾT

4.1 Khái niệm chung

4.1.1 Giả thuyết thống kê và kiểm định giả thuyết thống kêGiả thuyết thống kê là một khẳng định về giá trị tham số đặc trưng nào

đó của một tổng thể (kì vọng, phương sai, tỉ lệ, ), hoặc khẳng định về phân bốcủa X trong một tổng thể,

là giả thuyết gốc được kí hiệu là H0 và giả thuyết còn lại gọi là đối thuyếtđược kí hiệu là H1 Thông thường giả thuyết gốc H0 là giả thuyêt mà ta đang

kì vọng là giả thuyết sai còn đối thuyết H1 là giả thuyết mà ta đang kì vọng làgiả thuyết đúng

Trang 34

Thủ tục kiểm định giả thuyết (test of hypotheses) Sau khi lập bài toánkiểm định giả thuyết để giải bài toán kiểm định giả thuyết ta thực hiện các bướcnhư sau:

- Giả sử H0 là giả thuyết đúng

- Tiến hành thu thập dữ liệu để chứng minh H0 là giả thuyết sai

- Nếu từ dữ liệu thu thập được có đủ cơ sở chứng tỏ H0 sai thì bác bỏ H0 vàchấp nhận H 1 là giả thuyết đúng Ngược lại, nếu từ dữ liệu thu thập được chưa

đủ cơ sở để cho rằng H 0 sai thì phải chấp nhận H 0 là giả thuyết đúng Việccông nhậnH0 đúng ở đây cần hiểu là dữ liệu thu thập được chưa thể bác bỏH0,cần phải nghiên cứu tiếp

Ví dụ 4.1 Chiều cao trung bình của nam thanh niên từ 18 tuổi đến 25 mườinăm về trước là 1, 55 (m) Cho rằng chiều cao trung bình sau mười năm sẽ caohơn, lúc đó ta lập bài toán kiểm định giả thuyết:

Ở đây x là một hàm đối của mẫu ngẫu nhiên (x1, x2, , xn) Một hàm như vậyđược gọi là kiểm định thống kê (test statistics)

Kiểm định thống kê là một hàm của mẫu ngẫu nhiên được sử dụng đểđưa ra quyết định bác bỏ hay chấp nhận H 0

Ví dụ 4.2 Tỉ lệ sản phẩm loại I của một dây chuyền sản xuất là 85% Sau khitiến hành cải tiến kĩ thuật hy vọng rằng tỉ lệ sản phẩm loại I sẽ tăng lên Ta lậpbài toán kiểm định giả thuyết:

Trang 35

Giả sử rằng H0 đúng Tiến hành kiểm tra ngẫu nhiênn sản phẩm, gọi số sảnphẩm loại I trong n sản phẩm là k Khi đó p = k/n ˆ càng lớn thì càng có cơ sởbác bỏ H0 Trong trường hợp này p = k/n ˆ là kiểm định thống kê

4.1.2 Sai lầm loại I và sai lầm loại II

Khi tiến hành kiểm định giả thuyết thông kê ta phải đưa ra quyết định hoặc

là bác bỏ H0 hoặc là chấp nhận H0 Có 1 trong 4 trường hợp sau xảy ra:

- Bác bỏH0 và trên thực tế H0 cũng là giả thuyết sai Khi đó quyết định bác bỏ

H0 là quyết định đúng

- Bác bỏ H0 trong khi thực tế là H0 là giả thuyết đúng Khi đó quyết định bác

bỏ H0 là quyết định sai, sai lầm này gọi là sai lầm loại I

- Chấp nhận H0 và trên thực tế H0 cũng là giả thuyết đúng Khi đó quyết địnhchấp nhận H0 là quyết định đúng

- Chấp nhận H 0 trong khi thực tế là H 0 là giả thuyết sai Khi đó quyết địnhchấp nhận H 0 là quyết định sai, sai lầm này gọi là sai lầm loại II

Như vậy khi quyết định bác bỏ H0 thì có thể mắc sai lầm loại I, còn khi quyếtđịnh chấp nhận H0 thì có thể phạm phải sai lầm loại II

ta thực hiện một hoặc hai lần phép thử Vì vậy các nhà thống kê thừa nhận mộtnguyên lý sau đây và gọi là "nguyên lí xác suất nhỏ": Một biến cố có xác suấtrất nhỏ gần bằng 0 thì biến cố đó không xảy ra khi thực hiện phép thử một lần.Chẳng hạn khi mua một vé xổ số thì xác suất trúng giải đặc biệt rất nhỏ nên

có thể xem biến cố trúng giải đặc biệt sẽ không xảy ra khi mua 1 vé xổ số.Tương tự như vậy ta có thể đưa ra nguyên lí xác suất lớn: Một biến cố cóxác suất gần bằng 1 thì biến cố đó sẽ xảy ra khi thực hiện phép thử 1 lần

Trang 36

Ví dụ 4.3 Đại học A có khoảng 5000 nam sinh viên Chiều cao của nam sinhviên của một trường đại học A có phân bố chuẩn với chiều cao trung bình

µ = 1, 65 (m) và độ lệch chuẩn σ = 0, 1 (m)

Hình 4.1

Gọi (X1, X2, , X36) là mẫu ngẫu nhiên

kích thướcn = 36lấy từ tổng thể trên Khi

Đại học A có 5000 nam sinh viên nên sẽ có C500036 = 344774.1086 mẫu kích thước

n = 36khác nhau, trong đó có99, 87% mẫu có trung bình mẫu nằm trong khoảng

(1, 6; 1, 7) và 0, 13% mẫu có trung bình mẫu nằm ngoài khoảng (1, 6; 1, 7)

Theo nguyên lí xác suất lớn và nguyên lí xác suất nhỏ thì biến cố chọn ngẫunhiên được một mẫu 36 nam sinh viên có trung bình mẫu X ∈ (1, 6; 1, 7) sẽ xảy

ra, còn biến cố chọn ngẫu nhiên được một mẫu 36 nam sinh viên có trung bìnhmẫu X 6∈ (1, 6; 1, 7) sẽ không xảy ra

4.3 Kiểm định kì vọng của phân phối chuẩn

4.3.1 Đã biết phương sai

Cho biến số X của một tổng thể có phân bố chuẩn N (µ; σ2) với kì vọng µ

chưa biết và phương sai σ2 đã biết Xét bài toán kiểm định giả thuyết:



H0 : µ = µ0

H1 : µ 6= µ0,

trong đó µ0 là một số thực đã cho

Trang 37

Hình 4.2

Giả sử rằngH0 đúng, tức lൠ= µ0

Gọi(X1, X2, , Xn) là mẫu ngẫu nhiên

lấy từ tổng thể trên Khi đó

Z = X − µ0σ/ √

Trang 38

bò có phân phối chuẩn với độ lệch chuẩn σ = 25, 2 kg.

Giải Gọi µ là trọng lượng trung bình của bò áp dụng chế độ ăn mới Bài toánkiểm định giả thuyết H0 : µ = 380, H1 : µ > 380

Miền bác bỏ H0 là W = [z0,05; +∞) = [1, 645; +∞).

z = x − µ0

σ

n ≈ 2, 8 ∈ W nên có cơ sở bác bỏH0 Tức là với mức ý nghĩaα = 0, 05

có thể cho rằng trọng lượng trung bình của bò xuất chuồng đã tăng lên

Trang 39

Ví dụ 4.5 Tốc độ đốt cháy một loại nhiên liệu máy bay là biến ngẫu nhiênchuẩn với σ = 2cm/s Với mức ý nghĩa α = 0, 05 hãy kiểm định giả thuyết

H0 : µ = 50cm/s với đối thiết H1 : µ 6= 50cm/s biết rằng lấy n = 25 mẫu ngẫunhiên thu được x = 51, 3cm/s

2 Nếu P-giá trị ≤ α thì bác bỏ H0, nếu P-giá trị> α thì chấp nhận H0

Tương tự như vậy,

- Đối với bài toán kiểm định giả thuyết

Trang 40

(a) P-giá trị = 1 − Φ(z) (b) P-giá trị = Φ(z)

Hình 4.5

4.3.2 Chưa biết phương sai

Cho biến số X của một tổng thể có phân bố chuẩn N (µ; σ2) với kì vọng µ

chưa biết và phương sai σ2 chưa biết

Xét bài toán kiểm định giả thuyết:

Giả sử H 0 đúng, khi đó µ = µ 0 Với

(X 1 , X 2 , , X n ) là mẫu ngẫu nhiên lấy từ

tổng thể trên Khi đó

T = X − µ0S/ √ n

có phân bố student n − 1 bậc tự do

Với một số α ∈ (0; 1) cho trước, lấy

n ∈ (−∞; −tn−1;α

2 ] ∪ [tn−1;α

2 ; +∞)

Ngày đăng: 17/06/2016, 08:17

TỪ KHÓA LIÊN QUAN

w