BÀI 13.4: ĐỊNH LÝ GIỚI HẠN TRUNG TÂM

Một phần của tài liệu Tìm hiểu các ứng dụng của số liệu thống kê theo cuốn sách Discovering Advanced Algebra (Trang 31)

II. Khoảng tin cậy

BÀI 13.4: ĐỊNH LÝ GIỚI HẠN TRUNG TÂM

Trong bài trước, bạn đã thấy cách sử dụng mẫu số kiệu để ước lượng một số thông số của phân phối tổng thể chuẩn. Nhưng nếu bạn không thể biết được tổng thể có phân phối chuẩn hay không?Bạn vẫn có thể tìm hiểu về các thông số từ mẫu hay không? Trong bài học này, bạn sẽ kiểm định điều này.

Có lẽ nó sẽ làm bạn ngạc nhiên khi biết rằng bạn có thể kiểm định tốt một mẫu độc lập về tham số thống kê của tổng thể bằng cách giả sử những gì sẽ xảy ra nếu bạn lấy nhiều mẫu. Ví dụ, để xác định năng suất của giống ngô mới, một công ty hạt giống thử nghiệm với một nhóm nông dân. Thu thập một mẫu ngẫu nhiên của ngô từ các trang trại và tìm lượng trung bình của hạt trên mỗi mẫu.Lượng trung bình ở đây giúp xác định giá trị trung bình và độ lệch chuẩn toàn bộ tổng thể của giống ngô,không quan trọng khi tổng thể bị sai lệch.

I. Kiểm định

1. Gía trị trung bình của mẫu

Trong điều tra này, bạn sẽ kiểm định sự khác biệt giữa giá tri trung bình của mẫu với giá trị trung bình của tổng thể.

Bước 1

Mỗi người trong nhóm của bạn sẽ tạo ra một tổng thể. Mỗi tổng thể là một loại khác nhau của phân phối, như liệt kê dưới đây.Làm một biểu đồ tổng thể của bạn để kiểm tra xem nó có được phân bố hợp lý.[Xem tính Lưu ý 13D để tạo ra một danh sách của 200 giá trị, từ 20 đến 50, cho tổng thể của bạn.

a. thống nhất b. bình thường c. lệch trái d. lệch phải

Bước 3 Nghĩ ra một cách để lựa chọn các giá trị ngẫu nhiên từ danh sách của bạn. Chọn ba giá trị từ tổng thể của bạn, và tính toán giá trị trung bình của mẫu nhỏ này. Sau đó chọn hơn hai giá trị, thêm chúng vào mẫu và tính lai giá tri trung bình. Thêm hai giá trị khác và tính toán lại. Làm thế nào để so sánh giá trị trung bình mẫu với giá trị trung bình thực tế?

Bước 4 đồ thị các phương trình y= µ ,y = µ- , và y = µ+ ,trong đó µ và σ là giá trị trung bình của tổng thể và độ lệch chuẩn.. Sử dụng cửa sổ đồ họa [0, 50, 5, - 2 + 2, 5]. Các đồ thị sẽ giúp bạn nhìn thấy xu hướng của giá trị trng bình của mẫu từ bước 3.

Bước 5 Tạo một đệ quy quen thuộc đẻ chon một giá trị ngẫu nhiên tại một thời

điểm cho một mẫu từ tổng thể của bạn và đồ thị các giá trị trung bình của các mẫu mới. Mỗi điểm của đồ thị có cùng hình thức (số mẫu,giá trị trung bình). [Xem lưu ý 13E nó sẽ giúp đỡ bạn trong việc này. ] Hãy phát thảo những gì bạn nhìn thấy.

Bước 6 Xóa đồ thị, thiết lập lại từ N và T đến 0, và lặp lại bước 5 thêm ba lần nữa. Bạn nhận thấy điều gì?

Bước 7: So sánh kết quả của bạn với những thành viên trong nhóm đã sử dụng

khác loại phân phối tổng thể. Khái quát,bạn hãy giải thích sự khác nhau của giá trị trung bình của mẫu và giá trị trung bình của tổng thể.

Công việc của bạn trong kiểm định này cho thấy, mặc dù số lượng trung bình của hạt cây ngô là khác nhau trên mỗi trang trại, giá trị trung bình của một mẫu xấp xỉ giá trị trung bình tổng thể, và xấp xỉ càng nhỏ với kích thước mẫu lớn càng lớn.. Trong thực tế, với các mẫu khác nhau từ một tổng thể,giá trị trung bình của mẩu được phân phối chuẩn, ngay cả khi tổng thể không phải là phân phối chẩn. Hơn nữa, từ giá trị trung bình của mẩu, bạn thậm chí có thể dự đoán độ lệch chuẩn của tổng thể. những quan sát này được thể hiện trong Định lý giới hạn trung tâm.

II. Định lý giới hạn trung tâm

Nếu một vài mẫu, mỗi mẫu có chứa giá trị dữ liệu n, được lấy từ một tổng thể (với bất kỳ phân phối):

1. Định lý

1.Gía trị trung bình của mẫu phân phối gần chuẩn

2. Gía trị trung bình tổng thể xấp xỉ giá trị trung bình của phân phối giá trị trung bình mẫu.

3. Độ lệch chuẩn của giá trị trung bình mẫu là xấp xỉ độ lệch chuẩn tổng thể chia cho căn bậc hai của n,hoặc

Mỗi xấp xỉ càng nhỏ với giá trị n càng lớn.

2. Ví dụ:

VÍ DỤ A:

Một công ty dược phẩm tuyên bố rằng thuốc kháng kháng sinh của họ chứa trung bình 324 mg thành phần trong mỗi viên thuốc. Học sinh lớp hóa học phân tích 25 viên thuốc để xác địnhphần trong mỗi viên thuốc. Kết quả của họ nằm ở bảng bên phải,đơn vị mg.. Nếu tuyên bố của công ti là chính xác thì xác suất có thể là bao nhiêu?

Giải:

Giá trị trung bình mẫu của học sinh là 319,96 mg. Bạn muốn biết xác suất mà mộtmẫu có giá trị trung bình là 319.96hay nhỏ hơn giá trị trung bình tổng thể là324 mg.

Phần đầu tiên của Định lý giới hạn trung tâm nói rằng, nếu bạn lấy nhiều mẫu, thì phân bố trung bình lấy từ nhiều mẫu sẽ tuân theo luật phân bố chuẩn. Vì vậy, nếu ban biết giá trị trung bình và đôl lệch chuẩn của phân phối giá trị

trung bình,thì bạn có thể sử dụng tính chất của phân phối chuẩn để xác định xác suất trong phạm vi của giá trị trung bình, chẳng hạn như 319,96 mg hoặc ít hơn.

Phần thứ hai của Định lý giới hạn trung tâm cho biết giá trị trung bình đó cũng tương tự như giá trị trung bình tổng thể, trong đó công ty cho biết là 324 mg.Và phần thứ ba của Định lý giới hạn trung tâm nói rằng độ lệch chuẩn của phân phối giá trị trung bình bằng độ lệch chuẩn tổng thể chia cho căn bậc hai của kích thước mẫu,hoặc. Bạn không biết tiêu chuẩnđộ lệch của tổng thể, nhưng bạn có thể cho rằng đó là độ lệch chuẩn của mẫu, là 12,75 mg. Sau đóphép phân phối giá tri trung bình là , hoặc 2,55 mg. (adsbygoogle = window.adsbygoogle || []).push({});

Tổng hợp tất cả lại với nhau, bạn sẽ thấy rằng xác suất giá trị trung bình của 319,96 mg hoặc ít hơn là N (0, 319,96, 324, 2,55), hoặc 0,057.Chỉ có 5,7% cơ hội cho giá trị trung bình của mẩu là 319,96 mg hoặc ít hơn. Vì vậy, trên thực tế giá trị trung bình của mẩu là 319,96 mg là khá hiếm, và công ti sẽ bị yêu cầu bồi thường.Ví dụ A suy luận minh họa. Suy luận liên quan đến việc tạo ra một giả thuyết về một hoặc nhiều thông số tổng thể ("Giá trị trung bình là 324 mg"), quyết định những gì sẽ làm cho các giả thuyết"không thể xảy ra," thu thập dữ liệu, và một trong hai bác bỏ giả thuyết hoặc để cho nó đứng, dựa trên xác suất. Kiểm định giả thuyết này là cơ sở nghiên cứu trong nhiều lĩnh vực, bao gồm cả lĩnh vực y tế.

VÍ DỤ B:

Một công ty kiểm tra sức khỏe thường xuyên thực hiện trên một công nhân cho thấy rằng một sản phẩm mới được sử dụng cho làm sạch có thể gây ra giảm số lượng tế bào bạch cầu trong máu.Công ty phải tiến hành ra sao?

Đây là hình ảnh phóng đại của các tế bào máu sử dụng màu quét cho thấy các tế bào máu trắng (màu xanh), các tế bào máu đỏ (màu đỏ), và tiểu cầu(màu hồng). Các tế bào bạch cầu hoạt động trong cáchệ thống miễn dịch, các tế bào hồng cầu mang ôxy thông qua cơ thể, và tiểu cầu giúp chữa lành vết thương. Giải pháp:

Công ty có thể làm theo các bước sau để quyết định liệu họ có nên được quan tâm về tác động của sản phẩm làm sạch

Bước 1 Với thống kê này bạn không thể quyết định chắc chắn liệu các sản phẩm

làm sạch có tác dụng trênsố lượng tế bào máu trắng. Bạn chỉ có thể khẳng định nó có thể có tác dụng hay không.Trên thực tế, bạn muốn quyết định có hay không một thống kê mẫu kết quả là "không thể xảy ra."Với việc làmđó, bạn đặt giả thuyết rằng sản phẩm làm sạch không có tác dụng, điều này được gọi là giả thuyết. Sau đó, bạn quyết định những gì sẽ làm cho giả thuyết "không thể xảy ra." giả sử bạnquyết định rằng nếu con số trung bình của các tế bào máu trắng bạn nhận được từ dữ liệu mẫu là ít hơn 5%có thể xảy ra, sau đó bạn sẽ bác bỏ giả thuyết.

Bước 2 Bạn lấy một mẫu ngẫu nhiên gồm 36 công nhân và tìm thấy họ có một

số lượng bạch cầu trung bình của7075 tế bào mỗi milimét khối (tế bào/mm3). Bạn tìm kiếm thông tin y tế và thấy rằng một tổng thể người lớn khỏe mạnh có số lượng bạch cầu trung bình của 7500 tế bào/mm3 vàđộ lệch chuẩn của 1250 tế bào/mm3

Bước 3: bởi định lý giới hạn trung tâm, giá tri trung bình của nhiều mẫu sẽ là 7500 tế bào/mm3 với độ lệch chuẩn , hoặc 208 tế bào/mm3. Xác suất mà một mẫu sẽ có giá trị trung bình 7075 hoặc ít hơn là N (0, 7075, 7500, 208), hoặc 0,0205. Điều này có nghĩa rằng có 2%cơ hội cho điều đó, nếu giá trị trung bình tổng thể là 7500 tế bào, một mẫu sẽ có giá trị trung bình 7075 tế bào hoặc ít hơn.

Bước 4: Bởi vì xác suất của giả thuyết của bạn dưới 5%, nên giả thuyết rằng các sản phẩm làm sạch không có tác dụng, là không thể xảy ra và bạn bác bỏ nó. Công ty nên dừng lạisử dụng sản phẩm làm sạch và cân nhắc việc thử nghiệm .

Nếu bạn đã quyết định trước rằng bạn sẽ bác bỏ giả thuyết thống kê ít hơn 1% có thể xảy ra, bạn không thể bác bỏ giả thiết đấy.Không thể bác bỏ giả thuyết không có nghĩa là giả thuyết là đúng,chỉ rằng nó không phải những gì bạn quyết định gọi sai. Kiểm định giả thiết bằng cách bác bỏ sẽ không thực hiện được nếu thống kê mẫu có một xác suất ít hơn 5% hoặc 10%.Khi giả thuyết bị bác bỏ, thống kê gọi đó là một "biến cố chắc chắn."

Như bạn đã đọc trên trang 748, 90% dữ liệu trong một đường cong chuẩn nằm trong 1.645σ của giá trị trung bình. Vì vậy, 5% là ít hơn 1.645σ dưới giá trị trung bình và 5% là nhiều hơn1.645 trên giá trị trung bình.

III. Bài tập

Một phần của tài liệu Tìm hiểu các ứng dụng của số liệu thống kê theo cuốn sách Discovering Advanced Algebra (Trang 31)