Một vài kiểu nhiệm vụ suy luận cho tỉ lệ

Một phần của tài liệu mô hình phân bố xác suất thông dụng của biến ngẫu nhiên trong dạy học toán ở lớp 11 (Trang 28 - 32)

5. C ấu trúc luận văn

1.3.2.Một vài kiểu nhiệm vụ suy luận cho tỉ lệ

T1: Ước lượng điểm cho tỉ lệ (XS)

Giả sử tổng thể có N phần tử, trong đó mỗi phần tử có thể mang hoặc không mang một dấu hiệu A nào đó. Trong trường hợp tổng thể là chưa biết, yêu cầu ước lượng tỉ lệ p các phần tử mang dấu hiệu A trong tổng thể.

Kích thước của tổng thể có giới hạn?

không có

Sử dụng phân bố siêu bội với

𝑘=𝑝𝑝 và 𝑝 − 𝑘=𝑞𝑝 có không 𝑛/𝑝 ≥0.05? Sử dụng ước lượng xấp xỉ phân bố nhị thức cho phân bố siêu

khôn có không n np < 7 hay nq <7? nhị thức có Sử dụng ước lượng xấp xỉ Poisson Sử dụng ước lượng xấp xỉ

 Kĩ thuật giải :

 Lấy 1 mẫu ngẫu nhiên gồm n phần tử theo phương pháp hoàn lại.

 Xác định số m các phần tử mang dấu hiệu A trong mẫu. Tính tần suất 𝑓𝐴 =𝑚𝑛

 Ước lượng 𝑓𝐴 ≈ 𝑝

Chú ý :

• Nếu N ≥10n thì có thể lấy mẫu không hoàn lại

• Tần suất 𝑓𝐴 là ước lượng không chệch, vững, hiệu quả của p

T2: Kiểu nhiệm vụ “ước lượng khoảng tin cậy cho tỉ lệ (XS)”

Giả sử cần ước lượng XS p của biến cố A. Gọi 𝑋 là biến ngẫu nhiên có phân bố nhị thức B(1, p) (hay phân bố Bernoulli) liên kết với biến cố A. Ta tìm khoảng giá trị (𝜃1,𝜃2)

sao cho 𝑃(𝜃1 <𝑋 <𝜃2) = 1− 𝛼=𝛽.

Trường hợp n lớn : 𝑋 ≈ 𝐵(1,𝑝) nên 𝐸(𝑋) = 𝑝,𝑉(𝑋) =𝑝𝑞. Như vậy, ước lượng tỉ lệ p như là ước lượng giá trị trung bình của biến ngẫu nhiên 𝑋. Mặt khác, n lớn, nên phân bố của 𝑋� xấp xỉ 𝑝 �𝑝,𝑝𝑞𝑛� và trong mẫu (𝑋1,𝑋2, … ,𝑋𝑛) thì 𝑋�=𝑓 =𝑚/𝑛.

 Kĩ thuật giải :

 Lập một mẫu ngẫu nhiên gồm n phần tử, tính tần suất xuất hiện biến cố A trong mẫu : 𝑓=𝑚𝑛

 Trên mẫu đã lập 𝑋� =𝑓=𝑚𝑛, tính �𝑓(1−𝑓𝑛 )

 Với 𝛽 cho trước, tính 𝛼 = 1− 𝛽 và tìm giá trị 𝑧𝛼/2 bằng cách tra bảng hàm Laplace dựa vào công thức Ф0�𝑧𝛼

2�= 0,5−𝛼2.

 Xác định khoảng tin cậy cho xác suất p từ công thức : 𝑓±𝑧𝛼/2�𝑓(1−𝑓𝑛 )

Trường hợp cỡ mẫu nhỏ : tần suất của mẫu f là biểu hiện của biến ngẫu nhiên có phân bố nhị thức B(n, f). Do n nhỏ nên xấp xỉ chuẩn cho những tính toán thiếu chính xác nên không áp dụng công thức trên.

 Kĩ thuật giải :

 Lập một mẫu ngẫu nhiên gồm n phần tử, tính 𝑓 =𝑚𝑛

 Gọi Y là biến ngẫu nhiên có phân bố nhị thức 𝐵(𝑛,𝑓). Tính toán trực tiếp để tìm 2 số a, b sao cho 𝑃(𝑎 ≤ 𝑌 ≤ 𝑏)≥ 𝛽

Trường hợp p nhỏ : Biến ngẫu nhiên 𝑌 =𝑛𝑋� có phân bố xấp xỉ phân bố poisson với tham số 𝜆 =𝑛𝑝 ≈ 𝑛𝑓

 Kĩ thuật giải :

 Lập một mẫu ngẫu nhiên gồm n phần tử, tính 𝑓 =𝑚𝑛 (adsbygoogle = window.adsbygoogle || []).push({});

 Gọi Y là biến ngẫu nhiên có phân bố poisson P(nf). Tính toán trực tiếp để tìm 2 số a, b sao cho 𝑃(𝑎 ≤ 𝑌 ≤ 𝑏) ≥ 𝛽= 1− 𝛼

 Khoảng ước lượng cho np là (a, b) nên khoảng ước lượng cho p là (𝑎𝑛, 𝑏𝑛).

Một vài nhận xét :

Trong bài toán ước lượng điểm cho kết quả là một con số duy nhất, nhưng con số này sẽ có sự thay đổi khi mẫu thay đổi. Ước lượng điểm không thể hiện mức độ sai số giữa con số được ước lượng với giá trị đúng của tham số, khi cỡ mẫu n nhỏ thì sai số có thể lớn.

Đối với bài toán ước lượng khoảng, khoảng tin cậy là đối xứng quanh giá trị trung bình, trên thực tế ta luôn mong muốn độ rộng khoảng ước lượng bé, độ tin cậy lớn, và n bé. Nhưng rất khó có thể đạt được mong muốn vì sự mâu thuẫn. Do đó, cần phải có sự tính toán một độ tin cậy để có sự hài hòa giữa các giá trị.

Tỉ lệ cá thể mang dấu hiệu A trong tổng thể là 𝑝 =𝑁𝑘, nếu biết khoảng ước lượng của p và biết số lượng tổng thể N thì sẽ ước lượng được số cá thể mang dấu hiệu A trong tổng thể.

T3 : Kiểu nhiệm vụ “tìm kích thước mẫu cần thiết”

Bề rộng của khoảng tin cậy đối xứng của p là 2𝑙, 𝑙 tỉ lệ thuận với độ tin cậy 𝛽 và tỉ lệ nghịch với n. Cố định một độ tin cậy 𝛽, tìm cỡ mẫu cần thiết để 𝑙 ≤ 𝜀.

 Kĩ thuật giải:

 Ước lượng khoảng của tỉ lệ :

𝑓±𝑧𝛼/2�𝑓(1−𝑓𝑛 )⇒2𝑙 =𝑧𝛼/2�𝑓(1−𝑓𝑛 )≤𝑧𝛼/2

√𝑛 do 𝑓(1− 𝑓) ≤14

Xét 𝑧𝛼/2

√𝑛 ≤2𝜀 ⇒ 𝑛 ≥𝑧4𝜀𝛼2/22 (*)

 Vậy cỡ mẫu n cần thiết là số n thỏa (*).

T4 : Kiểm định giả thuyết cho tỉ lệ

Giả sử XS xảy ra biến cố A trong tổng thể là p. Vì những tác động chủ quan hoặc khách qua này mà tỉ lệ này có thể bị biến đổi. Người ta đặt ra một giả thuyết (H0), sử dụng phương pháp chọ mẫu và các quy tắc kiểm định để kiểm tra xem giả thuyết đặt ra là là đúng

hay sai. Tuy nhiên, suy luận từ 1 mẫu cho tổng thể nên không thể tuyệt đối chính xác, và do đó vẫn có những sai lầm :

Sai lầm loại 1 : H0đúng nhưng lại bác bỏ H0

Sai lầm loại 2 : H0sai nhưng lại chấp nhận H0

Trong kiểm định, người ta luôn mong muốn hạn chế tối thiểu cả hai loại sai lầm nhưng điều này bị mâu thuẫn. XS xảy ra sai lầm loại 1 là 𝛼 gọi là mức ý nghĩa của kiểm định. Tùy từng trường hợp cụ thể để đưa ra mức ý nghĩa này.

T41 : kiểm định hai phía : H0 : 𝑝=𝑝0, H1 : 𝑝 ≠ 𝑝0

T42 : kiểm định một phía : H0 : 𝑝 =𝑝0, H1 : 𝑝>𝑝0

T43 : kiểm định một phía : H0 : 𝑝 =𝑝0, H1 : 𝑝<𝑝0

 Kĩ thuật giải

 Đặt các giả thuyết và đối thuyết

 Từ mẫu cụ thể tính tỉ lệ 𝑓=𝑚𝑛 và tính trị số TK 𝑧 = 𝑓−𝑝0

�𝑝0(1−𝑝0)√𝑛

 Với 𝛼cho trước tra bảng hàm laplace tìm 𝑧𝛼/2 hoặc 𝑧𝛼

 Kết luận : (adsbygoogle = window.adsbygoogle || []).push({});

Với T41, nếu |𝑧| > 𝑧𝛼/2 thì bác bỏ H0, ngược lại thì chấp nhận H0

Với T42, nếu 𝑧 >𝑧𝛼 thì bác bỏ H0, ngược lại thì chấp nhận H0

Với T43, nếu 𝑧 <−𝑧𝛼 thì bác bỏ H0, 𝑧 ≥ 𝑧𝛼 ngược lại thì chấp nhận H0

Nhận xét :

• Qui tắc kiểm định trên được dùng cho mẫu lớn, trong đó đã ngầm ước lượng tỉ lệ p của tổng thể bằng tỉ lệ trên mẫu.

• Ta thấy 𝑧 = 𝑚−𝑛𝑝0

�𝑛𝑝0𝑞0=𝑚−𝐸𝑉(𝑋()𝑋)⇒ trị TK z cho ta một sự so sánh giữa độ lệch của tần số trong mẫu và kỳ vọng (tần số lý thuyết) với độ lệch chuẩn trong lý thuyết, mặt khác với mức ý nghĩa 𝛼 ∊[0.01; 0.05] thì 𝑧𝛼/2 nằm trong khoảng (1.96; 2.6) và 𝑧𝛼

nằm trong khoảng (1.65, 2.3). Và như vậy :

Với T41, chấp nhận H0 nếu độ lệch giữa tần số thực nghiệm với tần số lý thuyết (𝑚 − 𝐸(𝑋)) rơi vào khoảng từ 2 đến 2,6 lần độ lệch chuẩn.

Với T42, chấp nhận H0 nếu độ lệch giữa tần số thực nghiệm với tần số lý thuyết (𝑚 − 𝐸(𝑋)) rơi vào khoảng từ 1.65 đến 2.3 lần độ lệch chuẩn.

Do n lớn, phân bố nhị thức xấp xỉ chuẩn nên những nhận xét trên cũng gần gũi với qui tắc 2𝛿, 3𝛿 trong phân bố chuẩn.

Kết luận :

Các qui luật phân bố XS đặc biệt của biến ngẫu nhiên đóng một vai trò quan trọng trong XS – TK. Ưu điểm của các mô hình này là các công thức tính các chỉ số đặc trưng ngắn gọn, cho phép ta tính toán nhanh chóng mà không nhất thiết phải lập bảng phân bố XS. Hơn nữa, các mô hình này còn quyết định việc ứng dụng Lý thuyết XS vào suy luận TK, cho phép thiết lập nên các qui tắc ước lượng, kiểm định có ứng dụng rộng rãi trong nhiều ngành khoa học. Kĩ năng lựa chọn mô hình phân bố XS thích hợp cũng là một kĩ năng cần thiết trong thực hành TK.

Các bài toán suy luận TK về tỉ lệ là một trong những bài toán thông dụng nhất của TK. Trong đó, các mô hình phân bố đặc biệt của biến ngẫu nhiên rời rạc có vai trò rất quan trọng. Đặc biệt mô hình phân bố nhị thức là mô hình tốt nhất cho tổng thể lớn. Từ mô hình phân bố cho tổng thể, người ta xây dựng mô hình hợp lí cho những mẫu rút ra từ tổng thể. Việc lựa chọn các qui luật phân bố phù hợp có ảnh hưởng trực tiếp tới các qui tắc trong thực hành TK.

Một phần của tài liệu mô hình phân bố xác suất thông dụng của biến ngẫu nhiên trong dạy học toán ở lớp 11 (Trang 28 - 32)