Sơ lược về qui luật phân bố nhị thức

Một phần của tài liệu mô hình phân bố xác suất thông dụng của biến ngẫu nhiên trong dạy học toán ở lớp 11 (Trang 25 - 28)

5. C ấu trúc luận văn

1.3.1. Sơ lược về qui luật phân bố nhị thức

Trong nhiều cuộc thăm dò ý kiến, điều tra xã hội như : hỏi ý kiến về việc ủng hộ hay không cho một vị lãnh đạo nào đó, điều tra xác định số sản phẩm bị lỗi, hay điều tra số trẻ em sinh ra mà chết trước 1 tuổi của bộ y tế, … thì kết cục cuối cùng người ta quan tâm là tỉ lệ hay số phần tử thỏa hay không thỏa dấu hiệu đang điều tra. Như vậy, số lượng trong mẫu và tỉ lệ mẫu là các TK thông dụng. Các tình huống như trên đều có đặc điểm chung đó là :

- Có n phép thử (n lần quan sát) độc lập

- Kết cục của mỗi phép thử chỉ rơi vào một trong hai nhóm là “xảy ra biến cố 𝐴” hoặc “không xảy ra biến cố 𝐴”

- XS xảy ra biến cố 𝐴 trong mỗi phép thử là p và không thay đổi qua các lần thử khác. Một dãy các phép thử thỏa 3 điều kiện trên được gọi là một lược đồ Bernoulli với 2 tham số 𝑛và 𝑝. Giải quyết vấn đề này Bernoulli đã chứng minh công thức mang tên ông :

𝑝𝑛(𝑘) = 𝑐𝑛𝑘𝑝𝑘𝑞𝑛−𝑘. Trong đó, 𝑝𝑛(𝑘) là XS để biến cố 𝐴 cần xét sẽ xuất hiện k lần trong n lần thử. Việc chứng minh công thức Bernoulli hoàn toàn có thể sử dụng các kiến thức về đại số tổ hợp, sự độc lập của các biến cố và công thức nhân XS, công thức cộng XS.

Giả sử biến cố A xuất hiện trong k phép thử đầu tiên và biến cố 𝐴̅ xảy ra trong 𝑛 − 𝑘 phép thử sau. Vì các phép thử là độc lập nên ta có :

𝑝(𝐴.𝐴… .𝐴𝐴̅…𝐴̅) = [𝑝(𝐴)]𝑘[𝑝(𝐴�)]𝑛−𝑘 =𝑝𝑘𝑞𝑛−𝑘.

Tuy nhiên ta chỉ quan tâm biến cố 𝐴 xuất hiện k lần trong 𝑛 phép thử, vì vậy sẽ có 𝑐𝑛𝑘 trường hợp khác nhau và XS mỗi trong trường hợp đều bằng trường hợp trên. Vậy 𝑝𝑛(𝑘) =𝑐𝑛𝑘𝑝𝑘𝑞𝑛−𝑘

Gọi 𝑋 là số lần xảy ra biến cố 𝐴 trong n phép thử, khi đó 𝑋 là biến ngẫu nhiên có phân bố nhị thức. Từ đó, ta có định nghĩa :

Một đại lượng ngẫu nhiên rời rạc Xđược gọi là tuân theo qui luật phân bố XS dạng nhị thức nếu:

-Các giá trị có thể có của nó là những số nguyên không âm 0, 1, 2, … , n

-XS để nó nhận ra mỗi giá trị này được tính theo công thức Bernoulli tức là p(X = k) = cnkpkpn−k

Kí hiệu : X≈B(n, p) với tham số (n, p). (Lê Văn Phong (1982), tr. 199)

Khi đó bảng phân bố XS của biến 𝑋 có dạng :

𝑋 0 1 … 𝑘 … 𝑛

𝑝 𝑐𝑛0𝑝0𝑞𝑛 𝑐𝑛1𝑝1𝑞𝑛−1 … 𝑐𝑛𝑘𝑝𝑘𝑝𝑛−𝑘 … 𝑐𝑛𝑛𝑝𝑛𝑞0

Dễ thấy XS để 𝑋 nhận giá trị 𝑘 (𝑘 = 0;�����𝑛) tương ứng chính là số hạng thứ 𝑘+ 1

trong khai triển nhị thức Newton, một giải thích thú vị cho tên của qui luật này. Hơn nữa, nhờ khai triển nhị thức Newton nên ta dễ dàng chứng minh được điều kiện của bảng phân bố là tổng các XS ở hàng thứ 2 là bằng 1 :

1 = (𝑝+𝑞)𝑛 = � 𝑐𝑛𝑘𝑝𝑘𝑝𝑛−𝑘 𝑛

𝑘=0

Các chỉ số đặc trưng : biến ngẫu nhiên 𝑋 ≈ 𝐵(𝑛,𝑝) thì :

Kỳ vọng : 𝐸(𝑋) =𝑛𝑝

Phương sai : V(X) = 𝑛𝑝𝑞. Độ lệch chuẩn : 𝛿(𝑋) = �𝑛𝑝𝑞.

Có thể chứng minh các công thức trên bằng cách sử dụng khai trển nhị thức Newton :

𝐸(𝑋) =∑ 𝑥𝑛 𝑖𝑝𝑖 𝑖=0 =∑𝑛 𝑘𝐶𝑛𝑘𝑝𝑘𝑞𝑛−𝑘 𝑘=0 =∑𝑛 𝑘(𝑛−𝑘𝑛!)!𝑘! 𝑘=0 𝑝𝑘 =𝑛 �(𝑛 − 𝑘(𝑛 −)! (1)!𝑘 −1)! 𝑛 𝑘=1 𝑝𝑘𝑞𝑛−𝑘 =𝑛𝑝 � 𝐶𝑛−1𝑘−1 𝑛 𝑘=1 𝑝𝑘−1𝑞𝑛−𝑘 =𝑛𝑝(𝑝+𝑞)𝑛−1 =𝑛𝑝

Chứng minh tương tự đối với phương sai.

Nhiều giáo trình bậc đại học lựa chọn cách chứng minh bằng cách sử dụng tính độc lập của các biến ngẫu nhiên tuy ngắn gọn hơn nhưng cách chứng minh trên phù hợp với chương trình ở trường PT.

Rõ ràng, các chỉ số đặc trưng của mô hình phân bố này rất đơn giản, dễ nhớ và gắn liền với các tham số. Việc áp dụng các công thức này sẽ nhanh gọn và chính xác hơn so với tính trực tiếp qua bảng phân bố. Điều này rất cần thiết đối với tất cả mọi người học về XS – TK. Bởi vì khi số lượng 𝑥𝑖 lớn, việc tính các XS 𝑝𝑖 để lập bảng phân bố XS và áp dụng các công thức tính chỉ số đặc trưng là rất khó khăn, tốn kém thời gian, công sức. Thay vào đó,

người học chỉ cần nhận biết xem biến ngẫu nhiên đang xét tuân theo qui luật phân bố nào để áp dụng các công thức riêng biệt một cách nhanh gọn.

Ví dụ tung đồng xu rất quen thuộc và xa rời với những suy luận TK, nhưng nó lại là ví dụ cho một phân bố nhị thức. Nếu đồng xu là cân đối và thực hiện tung n lần, 𝑋 là số lần xuất hiện mặt ngửa thì 𝑋 ≈ 𝐵(𝑛, 0.5).

Nếu tham số n trong phân bố nhị thức là số lượng của tổng thể thì phân bố của 𝑋

cũng là phân bố của tổng thể. Tuy nhiên, trong chọn mẫu TK người ta cũng chứng minh được :

Trong một tổng thể có tỉ lệ p các lần xảy ra biến cố A. Nếu tổng thể lớn hơn nhiều lần so với mẫu thì số lượng X các lần xảy ra biến cố A trong mẫu ngẫu nhiên có n phần tử được chọn ra từ tổng thể gần đúng với phân bố nhị thức B(n, p). Độ chính xác của sự gần đúng này tăng lên khi qui mô của tổng thể tăng tương ứng với cỡ mẫu. Như một qui tắc thực hành, chúng ta sẽ sử dụng phân bố mẫu nhị thức khi tổng thể lớn gấp ít nhất 20 lần mẫu.

(David S. Moore, George P. McCabe, Bruce A. Craig (2010), tr. 304)

Mô hình phân bố nhị thức như là mô hình TK cho 1 con số đếm (đếm số lần xảy ra biến cố 𝐴). Phân bố nhị thức có vai trò quan trọng trong một lớp các bài toán liên quan tới suy luận về tỉ lệ trong TK, đó là những bài toán thông dụng trong nhiều ngành khoa học, kinh tế, xã hội. Tuy nhiên, biến ngẫu nhiên 𝑋 nói trên là biến cho số lượng, biến ngẫu nhiên về tỉ lệ thì không phải phân bố nhị thức, nhưng ta hoàn toàn có thể chuyển đổi bất kì bài toán tỉ lệ nào về bài toán số lượng. Hơn nữa, từ trung bình và độ lệch chuẩn của số lượng ta cũng có trung bình và độ lệch chuẩn của tỉ lệ là : 𝜇𝑝�=𝑝, 𝜎𝑝� =�𝑝(1−𝑝𝑛 )

Xấp xỉ phân bố nhị thức trong TK :

- Khi n lớn và p khá bé thì phân bố nhị thức với tham số (n, p) có thể xấp xỉ bởi phân bố poisson với tham số 𝜆 =𝑛𝑝. Xấp xỉ là tốt khi 𝑛> 50 và 𝑝< 0,1. Xấp xỉ này giúp đơn giản trong tính XS của các biến cố.

- Nếu kích thước tổng thể 𝑝 > 10𝑛 thì ta có thể coi qui luật siêu bội và qui luật nhị thức xấp xỉ nhau.

Hai trường hợp trên nhằm giảm thiểu những sai số trong tính toán.

- Xấp xỉ phân bố nhị thức bởi phân bố chuẩn là quan trọng trong TK suy diễn, cho phép xây dựng các quy tắc suy luận cho tỉ lệ. Xấp xỉ này được chứng minh bởi định lý giới hạn Moivre – Laplace (hệ quả của định lý giới hạn trung tâm) :

Đặt Zn=Xn−np

�npq, khi đó: limn→+∞P(Zn<𝑥) =√2π1 ∫−∞x e−t22dt

Hay nói cách khác Znhội tụ theo luật tới phân bố chuẩn tắc.

(Tô Văn Ban (2010), tr. 120)

Từ đó, ta có xấp xỉ cho cả số lượng và tỉ lệ trong mẫu : biến ngẫu nhiên 𝑋 có phân bố nhị thức B(n, p). Khi n lớn, 𝑋 có phân bố gần đúng với phân bố chuẩn 𝑝(𝑛𝑝,�𝑛𝑝𝑞), tỉ lệ

𝑝̂ =𝑋𝑛 có phân bố gần đúng với phân bố chuẩn 𝑝(𝑝,�𝑝𝑞𝑛). Và trong thực hành TK, phép gần đúng này sẽ được đảm bảo khi số n thỏa 𝑛𝑝 ≥10 hay 𝑛𝑞 ≥ 10.

Một kỹ năng quan trọng trong thực hành TK là việc lựa chọn mô hình XS phù hợp cho biến ngẫu nhiên. Nghĩa là lựa chọn mô hình phù hợp với các dữ liệu đã biết về biến ngẫu nhiên và cho phép chúng ta thực hiện những suy luận có thể có tốt nhất qua việc sử dụng mô hình này. Với biến ngẫu nhiên rời rạc có một hình cây quyết định.

Một phần của tài liệu mô hình phân bố xác suất thông dụng của biến ngẫu nhiên trong dạy học toán ở lớp 11 (Trang 25 - 28)

Tải bản đầy đủ (PDF)

(89 trang)