Phân bố nhị thức

Một phần của tài liệu Các số tổ hợp và một số ứng dụng trong thống kê (Trang 35 - 42)

Thí nghiệm điển hình trong đó xuất hiện phân bố nhị thức là một dãy n lần tung đồng tiền. Chọn một trong những khả năng xuất hiện của một lần

tung, chẳng hạn, mặt trước, là "thành công", thì số lần xuất hiện mặt trước có phân bố nhị thức. Chúng ta áp dụng các đồng nhất thức của các số nhị thức của chương 1 để tính giá trị trung bình và phương sai của phân bố nhị thức.

Định nghĩa 2.2.1. Biến ngẫu nhiên rời rạc X có phân phối nhị thức B(n, p) nếu X biểu thị số lần xuất hiện sự kiện A nào đó trong dãy n phép thử độc lập Becnuli với xác suất để xuất hiện A trong mỗi phép thử đều bằng p. Khi đó:

Pr(X = j) = n

j

pj(1−p)n−j. (2.5) Mệnh đề 2.2.2. Giá trị kỳ vọng của biến ngẫu nhiên nhị thức X trên n phép thử, mỗi phép thử có xác suất thành công p

E(X) =np

Chứng minh. Phương trình (2.1) xác định giá trị kỳ vọng E(X) =

n

∑j=0

jãPr(X = j)

Chúng ta thay xác suất của biến ngẫu nhiên nhị thức như đã được cho bởi phương trình (2.5)

=

n

∑j=0

j n

j

pj(1−p)n−j

Sự hấp thu loại trừ 1 trong 4 lần xuất hiện chỉ số j của tổng

=

n j=0∑

n

n−1 j−1

pj(1−p)n−j

=np

n

∑j=0

n−1 j−1

pj−1(1−p)n−j. Thayi= j−1đưa đến tổng

=np

n−1 i=0∑

n−1 i

pi(1−p)n−1−i

mà ta nhận ra là một khai triển nhị thức, và rút gọn

=np[p+ (1−p)]n−1

=np.

Mệnh đề 2.2.3. Phương sai của biến ngẫu nhiên nhị thức X trong n phép thử với xác suất thành công p là:

V(X) =np(1−p)

Chứng minh. Một lần nữa ta bắt đầu từ phương trình (2.1) E(X2) =

n

j=0

j2ãPr(X = j)

=

n j=0∑

j2 n

j

pj(1−p)n−j.

Một lần nữa chỉ số j của tổng xuất hiện 4 lần. Áp dụng sự hấp thu làm giảm số mũ của j trong một lần xuất hiện là một bước hợp lý.

=

n j=0∑

jn

n−1 j−1

pj(1−p)n−j

=np

n

∑j=0

j

n−1 j−1

pj−1(1−p)n−j.

Thay i = j−1 để sắp xếp các chỉ số của các hệ số nhị thức với giới hạn trên và dưới của tổng là một bước hợp lý khác.

=np

n−1 i=0∑

(1+i)

n−1 i

pi(1−p)n−1−i Chia tổng này giống như ở đây

=np

n−1 i=0∑

n−1 i

pi(1−p)n−1−i+np

n−1 i=0∑

i

n−1 i

pi(1−p)n−1−i

Vì tổng trong phần thứ nhất đã được nhận thấy như là một khai triển nhị thức

=np+np

n−1 i=0∑

i

n−1 i

pi(1−p)n−1−i

Áp dụng sự hấp thu một lần nữa để loại trừ sự xuất hiện của chỉ số tổng

=np+np

n i=0∑

(n−1)

n−2 i−1

pi(1−p)n−1−i

Thay k=i−1 rồi sắp xếp lại chỉ số dưới của hệ số nhị thức với giới hạn dưới của tổng.

=np+n(n−1)p2

n k=0∑

n−2 k

pk(1−p)n−2−k

=np+n(n−1)p2 =np+n2p2−np2

=n2p2+np(1−p).

Theo mệnh đề 2.1.7 và 2.2.2

σX2 =E(X2)−E(X)2

=h

n2p2+np(1−p)i

−n2p2

=np(1−p).

Ước lượng không chệch của giá trị trung bình

Một phương pháp thống kê trực quan để ước lượng tỷ lệ cá thể trong một tập hợp có kích thước lớn N có đặc điểm đặc trưng ( chẳng hạn như có sở thích về toán học) là lấy một mẫu ngẫu nhiên và sử dụng tỷ lệ trong mẫu đó để ước lượng tỷ lệ trong tập hợp tổng quát. Chúng ta sẽ sử dụng đồng nhất thức của các số nhị thức để khẳng định tính đúng đắn của cách tiếp cận này.

Định nghĩa 2.2.4. Ước lượngθbcủa đặc trưng thống kêθ của một tập hợp được gọi là ước lượng không chệch nếu giá trị kỳ vọngE(θb)của mẫu ngẫu nhiên bằngθ.

Mệnh đề 2.2.5. Tỷ lệ mẫu là một ước lượng không chệch của tỷ lệ các cá thể có đặc trưng cho trước và tập hợp đầy đủ các đối tượng.

Chứng minh. Giả sử rằng trong một tập hợp đối tượng kích thước N có đúng M cá thể có đặc điểm đang xét. Một mẫu cỡ n được lấy. Biến ngẫu nhiên được quan tâm là số m các cá thể với đặc điểm đang xét và tỷ lệ

X = m n

của những cá thể với đặc điểm đang xét. Tổng số các cách để chọn một mẫu kích thước n là

N n

.

Số cách chọn một mẫu kích thước n sao cho có thể có đúng j cá thể với đặc điểm quy định là tích

M j

N−M n− j

của số cách chọn j cá thể từ tập độ lớn M với đặc điểm đang xét và số cách chọnn− jcá thể còn lại từ tập N−M cá thể không có đặc điểm đang xét.

Vì vậy

Pr(m= j) =

M j

N−M

n−j

N n

Theo đó,

E(X) =

n j=0∑

j

nãPr(m= j)

= 1 n

n

∑j=0

M j

N−M

n−j

N n

= 1 n

N

n ∑

j=0

jã M j

N−M n− j

Áp dụng đồng nhất thức hấp thu để loại bỏ một lần xuất hiện của chỉ số tổng

= 1 n

N n

−1 n j=0∑

M−1 j−1

N−M n− j

= M n

N n

−1 n j=0∑

M−1 j−1

N−M n− j

Bây giờ sử dụng phép nhân chập Vandermonde

= M n

N n

−1 N−1

n−1

= M n ã n!

Nn ã(N−1)n−1 (n−1)! = M

N

Như vậy, phương pháp trực quan ước lượng giá trị trung bình là không chệch.

Ước lượng không chệch của phương sai

Giả sử X là một biến ngẫu nhiên trên không gian mẫu Ω. Các biến ngẫu nhiên phân bố đồng nhất

X1 X2 ã ã ã Xn

là các giá trị của X trên n mẫu từΩ, với giá trị trung bình mẫuX. Các nhà thống kê sử dụng các ước lượng

σc2= ∑(Xi−X)2

n−1 = ∑Xi2−n−1(∑Xi)2 n−1

vớin−1ở mẫu số (chứ không phải n) cho phương sai. Điều này được giải thích ở mệnh đề tiếp theo.

Mệnh đề 2.2.6. Thống kê mẫu

σc2= ∑(Xi−X)2

n−1 = ∑Xi2−n−1(∑Xi)2

n−1 (2.6)

là một ước lượng không chệch của phương sai của biến ngẫu nhiên X.

Chứng minh.

E(σc2) = E(∑Xi2)

n−1 −E

(∑Xi)2 n(n−1)

= 1 n−1

n i=1∑

E(Xi2)− 1 n(n−1)

n i=1∑

n

∑j=1

E(XiXj) Chia tổng kép thành hai phần

= 1 n−1

n i=1∑

E(Xi2)− 1 n(n−1)

n i=1∑

E(Xi2)− 1 n(n−1)

n i=1∑

n j=1∑

E(XiXj)ã(j6=i)

= 1

n−1− 1 n(n−1)

ã

n i=1∑

E(X2)− 1 n(n−1)

n i=1∑

n

∑j=1

E(X)E(X)ã(j6=i)

= 1 nã

n

i=1

E(X2)− 1 n(n−1)

n

i=1 n

j=1

E(X)E(X)ã(j6=i) cả hai tổng đều giải được

= 1

nãnE(X2)−n(n−1)

n(n−1) ãE(X)2

=E(X2)−E(X)2

=V(X)

Do đó, phép chia chon−1dẫn tới ước lượng không chệch.

Một phần của tài liệu Các số tổ hợp và một số ứng dụng trong thống kê (Trang 35 - 42)

Tải bản đầy đủ (PDF)

(54 trang)