Các đặc trưng của tổng thể có thể là giá trị trung bình, phương sai hoặc tỷ lệ các đơn vị của tổng thể có một tính chất nào đó.. Phương sai Do các tham số đặc trưng của tổng thể được ước
Trang 1Chương 5 ƯỚC LƯỢNG VÀ KIỂM ĐỊNH GIẢ THUYẾT
5 1 Bài toán ước lượng
Trong phần này sẽ đề cập đến việc suy luận các đặc trưng của tổng thể dựa trên các đặc trưng của mẫu Các đặc trưng của tổng thể có thể là giá trị trung bình, phương sai hoặc tỷ lệ các đơn vị của tổng thể có một tính chất nào đó
Vấn đề đặt ra là ước lượng các đặc trưng của tổng thể (chưa biết) từ các đặc trưng của mẫu dữ liệu thu thập được
1 Các vấn đề liên quan đến bài toán ước lượng
Có hai loại ước lượng là ước lượng điểm và ước lượng khoảng
Ước lượng điểm là phương pháp dùng một tham số thống kê mẫu đơn lẻ để ước lượng
về giá trị thật của tham số tổng thể
Phương sai
Do các tham số đặc trưng của tổng thể được ước lượng thông qua một mẫu được chọn nên khi thay đổi từ mẫu này sang mẫu khác sẽ dẫn đến các tham số đặc trưng của tổng thể cũng thay đổi
Vì vậy, trong trường hợp trung bình của tổng thể nếu dùng một giá trị trung bình mẫu của một mẫu cụ thể để ước lượng điểm về trung bình tổng thể sẽ kém tin cậy hơn so với khi vận dụng quy luật phân phối của trung bình mẫu vào quá trình ước lượng trung bình tổng thể qua phương pháp ước lượng khoảng
Ước lượng khoảng là phương pháp dựa vào dữ liệu của mẫu, với một độ tin cậy cho
trước, xác định khoảng giá trị mà đặc trưng của tổng thể có thể rơi vào
Một cách tổng quát, gọi là đặc trưng của tổng thể cần ước lượng Giả sử, dựa vào mẫu quan sát tìm được hai biến ngẫu nhiên và sao cho ( < < ) = 1 −
Gọi , lần lượt là các giá trị cụ thể của và Khoảng ( , ) được gọi là khoảng ước lượng với độ tin cậy(1 − ) ∗ 100% của , hay nói một cách ngắn gọn là khoảng tin cậy (1 − ) ∗ 100% của
2 Ước lượng trung bình tổng thể
A Ước lượng trung bình một tổng thể
a Biết phương sai của tổng thể
Giả sử có mẫu quan sát được chọn ngẫu nhiên từ tổng thể phân phối chuẩn có phương sai
đã biết
Gọi là trung bình mẫu, khoảng tin cậy(1 − ) ∗ 100% của trung bình tổng thể được xác
Trang 2− / ∗
√ < < + / ∗√ Với có phân phối chuẩn
Ví dụ: Một công ty muốn ước lượng số tài liệu (trang) được chuyển bằng fax trong một ngày.
Kết quả thu thập từ 15 ngày cho thấy trung bình một ngày có 267 trang tài liệu được chuyển bằng fax Theo kinh nghiệm từ các văn phòng tương tự thì độ lệch chuẩn là 32 trang Giả sử số trang tài liệu chuyển bằng fax trong một ngày có phân phối chuẩn với độ tin cậy 95%, ta ước lượng
− / ∗
√ < < + / ∗√ Với = 267, = 32, = 15, / = . = 1.96 ta có 250.8055 < < 283.1945
Như vậy với độ tin cậy 95%, số lượng tài liệu chuyển trung bình một ngày được ước lượng từ
251 đến 284 trang
Nhận xét:
Với một độ tin cậy và kích thước mẫu không đổi, nếu độ lệch chuẩn càng lớn thì khoảng ước lượng càng rộng, tức là độ chính xác của ước lượng càng thấp
Với một độ tin cậy và độ lệch chuẩn không đổi, nếu kích thước mẫu càng lớn thì khoảng ước lượng càng hẹp, tức là độ chính xác của ước lượng càng cao
Với độ lệch chuẩn và kích thước mẫu không đổi, nếu độ tin cậy càng cao thì khoảng ước lượng càng rộng, tức là độ chính xác của ước lượng càng thấp
b Chưa biết phương sai của tổng thể
Trong thực tế, ta thường không biết phương sai của tổng thể
Trong trường hợp này ta vẫn giả định tổng thể có phân phối chuẩn, khoảng tin cậy (1 − )100% trung bình tổng thể được xác định như sau:
− , / ∗
√ < < + , / ∗√ Với có phân phối Student với bậc tự do( − 1)
Ví dụ: Công ty điện thoại ở một thành phố muốn ước lượng thời giant rung bình của các cuộc
điện đàm đường dài vào những ngày cuối tuần Mẫu ngẫu nhiên 20 cuộc gọi đường dài vào những ngày cuối tuần cho thấy thời gian điện đàm trung bình là 14.8 phút, độ lệch chuẩn là 5.6 phút Như vậy với độ tin cậy 95%, thời gian trung bình của cuộc điện đàm đường dài được xác định như sau:
− , / ∗
√ < < + , / ∗√
Trang 3Với = 14.8; = 5.6; = 20, , / = , = 2.093 ta có
12.1792 < < 17.4208 Nghĩa là với độ tin cậy 95%, thời gian trung bình của một cuộc điện đàm đường dài vào cuối tuần được ước lượng khoảng từ 12.1792 đến 17.4208 phút
Lưu ý: Trong trường hợp mẫu lớn ( ≥ 30), ta có thể dùng phân phối chuẩn thay cho phân phối Student, kể cả trong trường hợp tổng thể có phân phối chuẩn
Ví dụ: Một trường đại học thực hiện nghiên cứu về số giờ tự học của sinh viên trong một tuần.
Chọn ngẫu nhiên 200 sinh viên cho thấy số giờ tự học trong tuần tính trung bình là 18.36 giờ, độ lệch chuẩn là 3.92 giờ Như vậy với độ tin cậy 95%, số giờ tự học trung bình của sinh viên ở trường này được ước lượng là:
− / ∗
√ < < + / ∗√ Với = 18.36; = 3.92; = 200; / = . = 1.96 ta có
17.8168 < < 18.9032 Nghĩa là với độ tin cậy 95%, số giờ tự học trung bình trong tuần của sinh viên được ước lượng từ 17.8168 đến 18.9032 giờ
B Ước lượng sự khác biệt giữa hai trung bình tổng thể
Trong nhiều trường hợp, ta có thể quan tâm đến khác biệt giữa trung bình hai tổng thể, chẳng hạn như khác biệt về doanh số trung bình trong tuần từ hai phương pháp trưng bày hàng hóa, chào hàng hóa khác nhau, hoặc sự khác biệt giữa năng suất cây trồng do sử dụng hai loại phân bón khác nhau… Phương pháp so sánh trung bình hai tổng thể phụ thuộc vào cách thức lấy mẫu: mẫu phối hợp từng cặp (mẫu phụ thuộc) hoặc mẫu độc lập
a Mẫu phối hợp từng cặp
Ở phương pháp này, các đơn vị mẫu được chọn từng cặp, từ hai tổng thể Thông thường mẫu phối hợp từng cặp thường bao gồm các trường hợp sau đây:
- So sánh trước và sau, chẳng hạn mẫu thứ nhất là doanh số bán trước khi thực hiện khuyến mãi, mẫu thứ hai là doanh số sau khi thực hiện khuyến mãi Ở đây mẫu phối hợp từng cặp theo nghĩa là doanh số trước và sau khi khuyến mãi được thu thập từ cùng một cửa hàng
- So sánh các đơn vị ở cùng một đặc điểm nào đó, chẳng hạn mẫu thứ nhất là tiền lương của nhân viên nam ở công ty Y, mẫu thứ hai là tiền lương của nhân viên nữ ở công ty Y, hai nhân viên nam và nữ được xem là giống nhau về năng lực và kinh nghiệm Ở đây, mẫu phối hợp từng cặp theo nghĩa là cả hai nhân viên nam và nữ được xem là có nang lực
Trang 4- So sánh giữa các đơn vị phối hợp từng cặp theo không gian, chẳng hạn mẫu thứ nhất là doanh số của loại nước giải khát nhãn hiệu A ở cửa hàng; ở mẫu thứ hai là doanh số bán hàng của loại nước giải khát nhãn hiệu B ở cửa hàng đó Ở đây, mẫu phối hợp từng cặp theo nghĩa là cả hai doanh số của hai nhãn hiệu A và B đều được thu thập từ cùng một cửa hàng
- So sánh giữa các đơn vị phối hợp từng cặp theo thời gian, chẳng hạn mẫu thứ nhất là doanh số của nhà hàng X ở một tuần lễ nào đó, mẫu thứ hai là doanh số của nhà hàng Y trong cùng một tuần lễ đó Ở đây mẫu phối hợp từng cặp theo nghĩa từng cặp doanh số được thu thập trong cùng một tuần lễ
Giả sử có các cặp quan sát( , ) lấy ngẫu nhiên từ hai tổng thể và
Gọi , lần lượt là trung bình của tổng thể , ;
̅ là trung bình của khác biệt;
là độ lệch tiêu chuẩn của khác biệt
Với khoảng tin cậy(1 − )100% của − được xác định như sau:
̅ − , / ∗
√ < − < ̅ + , / ∗√ Với có phân phối Student với bậc tự do( − 1)
Ví dụ: Công ty điện lực thực hiện các biện pháp khuyến khích tiết kiệm điện Lượng điện tiêu
thụ ghi nhận ở 12 hộ gia đình trước và sau khi có các biện pháp khuyến khích tiết kiệm ddieemnj như sau:
Hộ gia đình Lượng điện tiêu thụ trước và sau khi
khuyến khích tiết kiệm điện (KWh)
Độ lệch
= −
Bình phương độ lệch
− ̅
Vậy ta có ̅ = = 3.4167; = . =30.08333↔ = 5.4848
Trang 5Giả sử rằng các khác biệt giữa lượng điện trước và sau khi khuyến khích tiết kiệm điện có phân phối chuẩn, khoảng itn cậy 95% của − là
̅ − , / ∗
√ < − < ̅ + , / ∗√ Với = 12; ̅ = 3.4167; = 5.4848; , / = , = 2.201 ta có
−0.0682 < − < 6.9016 Như vậy, khoảng tin cậy 95% của khác biệt giữa lượng điện tiêu thụ trung bình trước và sau khi khuyến khích tiết kiệm được ước lượng từ -0.0682 KWh đến 6.9016 KWh Khoảng ước lượng này bao gồm trị số 0, do vậy có thể tin rằng lượng điện tiêu thụ trung bình trước và sau khi thực hiện các biện pháp khuyến khích tiết kiệm là bằng nhau
b Mẫu độc lập
Gọi , là các mẫu được chọn ngẫu nhiên độc lập từ hai tổng thể phân phối chuẩn và ;
, là trung bình của hai tổng thể và ;
, là phương sai của hai tổng thể và ;
, là trung bình của hai mẫu
Khoảng tin cậy(1 − )100% của − được xác định như sau:
( − ) − / ∗ + < − < ( − ) + / ∗ +
Với có phân phối chuẩn
Ví dụ: Một công ty đang xem xét kế hoạch tiết giảm chi phí sản xuất thông qua việc xây dựng
một dây chuyền sản xuất mới nhằm rút ngắn thời gian sản xuất sản phẩm Ở dây chuyền sản xuất mới 40 sản phẩm được sản xuất với thời gian trung bình 46.5 phút/sản phẩm, độ lệch tiêu chuẩn là 8 phút Với dây chuyền sản xuất, 38 sản phẩm được sản xuất với thời gian trung bình 51.2 phút/sản phẩm, độ lệch chuẩn 9.5 phút Hãy ước lượng khoảng tin cậy 95% cho khác biệt về thời gian sản xuất giữa dây chuyền sản xuất mới và cũ
Ta có
Ta có khoảng tin cậy 95% sự khác biệt về thời gian sản xuất trung bình giữa dây chuyền sản xuất mới và cũ là
Trang 6(46.5 − 51.2) − 1.96 ∗ 40 +8 9.538 < − < (46.5 − 51.2) + 1.96 ∗ 40 +8 9.538
−8.6077 < − < −0.7923 Khoảng tin cậy 95% tính được chỉ là các giá trị âm, không bao gồm giá trị 0 Do vậy có thể nói rằng dây chuyền sản xuất mới có thời gian sản xuất ngắn hơn Với độ tin cậy 95%, ta ước lượng dây chuyền sản xuất mới rút ngắn thời giant rung bình sản xuất một sản phẩm trong khoảng từ 0.7923 phút đến 8.6077 phút
3 Ước lượng tỷ lệ tổng thể
Trong nghiên cứu, ta quan tâm đến tỷ lệ các đơn vị có một tính chất nào đó trong tổng thể, như tỷ
lệ khách hàng sử dụng một loại sản phẩm nào đó, tỷ lệ phế phẩm trong sản xuất…
Khi đó ta thực hiện ước lượng cho kiểm định của tổng thể
A Ước lượng tỷ lệ
Giả sử mẫu ngẫu nhiên có quan sát;
̂ là tỷ lệ các quan sát có tính chất nào đó
Với mẫu lớn ≥ 40, khoảng tin cậy (1 − ) ∗ 100% của tỷ lệ các quan sát có tính chất trong tổng thể được xác định bởi:
̂ − / ̂(1 − ̂)< < ̂ + / ̂(1 − ̂) Với là phân phối chuẩn
Nhận xét: Khi càng lớn thì khoảng ước lượng càng hẹp, tức độ chính xác của ước lượng càng cao
Ví dụ: Một nghiên cứu được thực hiện nhằm ước lượng thị phần của sản phẩm nội địa (do các
công ty trong nước sản xuất) đối với mặt hàng bánh kẹo Kết quả điều tra ngẫu nhiên 100 khách hàng cho thấy có 34 người dùng sản phẩm nội địa Như vậy với độ tin cậy 95%, tỷ lệ khách hàng
sử dụng sản phẩm bánh kẹo nội địa được ước lượng là:
̂ − / ̂(1 − ̂)
< < ̂ + / ̂(1 − ̂) Với ̂ = 0.34; = 100; / = . =1.96 ta có:
0.2472 < < 0.4328
Trang 7Nghĩa là với độ tin cậy 95%, thị phần bánh kẹo nội địa được ước lượng từ 24.72% đến 43.28%.
B Ước lượng sự khác biệt giữa tỷ lệ hai tổng thể.
Giả sử ta có hai mẫu , được chọn ngẫu nhiên độc lập từ hai tổng thể và ;
, lần lượt là tỷ lệ các đơn vị có tính chất trong tổng thể;
̂ , ̂ lần lượt là tỷ lệ các đơn vị có tính chất trong mẫu
Với mẫu lớn , ≥ 40, khoảng tin cậy (1 − ) ∗ 100% của − được xác định như sau:
̂ − ̂ − / ̂ (1 − ̂ )
+ ̂ (1 − ̂ ) < −
< ̂ − ̂ + / ̂ (1 − ̂ )
+ ̂ (1 − ̂ )
Ví dụ: Kết quả điều tra từ mẫu ngẫu nhiên 1000 người ở mỗi thành phố cho thấy năm 2008 Tỷ
lệ thất nghiệp ở thành phố H là 7.5%, ở thành phố K là 7.2% Hãy ước lượng khoảng tin cậy 99% cho sự khác biệt về tỷ lệ thất nghiệp giữa hai thành phố
Ta có ̂ = 0.075; ̂ = 0.072; = = 1000; / = . = 2.575 thay vào công thức
̂ − ̂ − / ̂ (1 − ̂ )+ ̂ (1 − ̂ )< −
< ̂ − ̂ + / ̂ (1 − ̂ )+ ̂ (1 − ̂ )
→ −0.027 < − < 0.033 Với độ tin cậy 99%, có thể nói rằng tỷ lệ thất nghiệp ở thành phố H ở trong khoảng thấp hơn 2.7% đến cao hơn 3.3% so với thành phố K Với khoảng tin cậy này ta có thể tin rằng tỷ lệ thất nghiệp ở hai thành phố là bằng nhau (khoảng tin cậy chứa trị số 0 cho thấy dấu hiệu về sự bằng nhau giữa hai tỷ lệ tổng thể)
Lưu ý: Đôi khi ta quan tâm đến việc ước lượng khoảng tin cậy chỉ một bên, chẳng hạn muốn
ước lượng giới hạn trên mà với độ tin cậy 95% thì trung bình tổng thể không lớn hơn giới hạn đó; nghĩa là ta muốn ước lượng khoảng tin cậy bên phải, giới hạn dưới của khoảng tin cậy trong trường hợp này xem như−∞
Tương tự, có thể t among muốn ước lượng giới hạn dưới với độ tin cậy 99% thì trung bình tổng thể không thể nhỏ hơn giới hạn đó; nghĩa là, ta mong muốn ước lượng khoảng tin cậy bên trái và giới hạn trên của khoảng tin cậy xem như+∞
Trang 8Vì đây là ước lượng một bên nên thay những giá trị / , , / lần lượt bằng các giá trị , , .
Ví dụ: Với độ tin cậy 95% một công ty muốn ước lượng giới hạn trên cho lượng sản phẩm sản
xuất trung bình hàng ngày Mẫu ngẫu nhiên 48 ngày cho thấy = 1260 sản phẩm, độ lệch chuẩn = 325 sản phẩm
Khoảng tin cậy bên phải của ước lượng sản phẩm sản xuất trung bình hàng ngày được ước lượng như sau:
−∞ < < + ∗
√ → −∞ < < 1260 + 1.645 ∗
325
√48→ −∞ < < 1337.17 Như vậy, với độ tin cậy 95% ta ước lượng mức sản xuất trung bình hàng ngày không vượt quá
1338 sản phẩm
4 Xác định cỡ mẫu cho bài toán ước lượng
a Đối với trung bình tổng thể
Giả sử ta có mẫu quan sát được chọn ngẫu nhiên tư tổng thể phân phối chuẩn có phương sai Khoảng tin cậy(1 − ) ∗ 100% của trung bình tổng thể được xác định bởi
− / ∗
√ < < + / ∗√ Gọi là sai số ước lượng được xác định bằng nửa chiều rộng của khoảng tin cậy nên
= / ∗
/ ∗
Ví dụ: Sử dụng các số liệu của ví dụ ước lượng trung bình tổng thể trong trường hợp đã biết
phương sai ở trên Ước lượng số lượng tài liệu chuyển bằng fax trong một ngày với độ tin cậy 99%, = 10 trang Kích thước mẫu phải là bao nhiêu để thỏa mãn điều kiện này?
Ta có / = . = 2.575; = 10; = 32 thì = / ∗
= 67.89 Như vậy cần phải thu thập số liệu ít nhất trong 68 ngày
b Đối với tỷ lệ tổng thể
Tương tự, ta xác định kích thước mẫu tối thiểu như sau:
= / ∗ ̂ ∗ (1 − ̂)
Do ̂ ∗ (1 − ̂) ≤ nên ta có thể sử dụng công thức
Trang 9= 4/
Ví dụ: Sử dụng các số liệu của ví dụ ước lượng tỷ lệ của tổng thể Ước lượng thị phần của sản
phẩm bánh kẹo nội địa với độ tin cậy 99% với sai số ước lượng là 3% Kích thước mẫu phải là bao nhiêu để thỏa mãn điều kiện này?
Ta có / = . = 2.575; = 0.03 nên
= 4/ = 1841.84 Như vậy cần phải điều tra 1842 người
5.2 Bài toán kiểm định
Bên cạnh việc ước lượng, các đặc trưng của tổng thể còn có thể được suy diễn từ dữ liệu mẫu thông qua phương pháp kiểm định giả thuyết Kiểm định giả thuyết là dựa vào mẫu dữ liệu thu thập được để đưa ra các kết luận “bác bỏ” hay “chưa có cơ sở để bác bỏ” về các giả thuyết của tổng thể
Ví dụ: Những chi tiết về sản phẩm (trọng lượng, đường kính…) đã biết trước hoặc được quy định theo tiêu chuẩn kỹ thuật Lấy mẫu sản phẩm để kết luận xem, những chi tiết hoặc tiêu chuẩn kỹ thuật này được thực hiện trong toàn bộ sản phẩm sản xuất hay không
Hay sau một thời gian thực hiện các biện pháp marketing (quảng cáo, khuyến mãi…) công ty muốn đánh giá xem thị phần, doanh số có gì thay đổi so với trước hay có đạt được mục tiêu đã đặt ra hay không
1 Các vấn đề liên quan đến bài toán kiểm định
a Đặt giả thuyết
Giả sử dấu hiệu nghiên cứu trong tổng thể có thể xem như biến ngẫu nhiên Nếu chưa biết dạng phân phối xác suất của nó, song cơ sở để giả thuyết rằng phân phối theo một quy luật nào đó, người ta đưa ra giả thuyết: “biến ngẫu nhiên phân phối theo quy luật ”
Cũng có trường hợp dạng phân phối xác suất của đã biết song tham số đặc trưng của nó lại chưa biết, nếu có cơ sở để giả thuyết rằng giá trị của tham số bằng ( là hằng số đã biết), người ta đưa ra giả thuyết =
Khi nghiên cứu hai hay nhiều biến ngẫu nhiên độc lập thuộc các tổng thể khác nhau hay thuộc cùng một tổng thể, thường phải xét xem chúng độc lập hay phụ thuộc nhau, các tham số đặc trưng của chúng có bằng nhau hay không… Nếu chưa biết một cách chắc chắn song có cơ sở để nhận định về các vấn đề đó cũng có thể đưa ra các giả thuyết tương ứng
Từ đó có thể đưa ra định nghĩa sau:
Định nghĩa: Giả thuyết thống kê là giả thuyết về dạng phân phối xác suất của biến ngẫu nhiên,
về các tham số đặc trưng của biến ngẫu nhiên hoặc về tính độc lập của các biến ngẫu nhiên
Trang 10Giả thuyết thống kê đưa ra được ký hiệu là và được gọi là giả thuyết gốc.
Khi đưa ra một giả thuyết thống kê, người ta còn nghiên cứu kèm theo nó mệnh đề mâu thuẫn
với nó, gọi là giả thuyết đối và ký hiệu là Để khi giả thuyết bị bác bỏ thì thừa nhận giả thuyết đối Khi đó và tạo nên cặp giả thuyết thống kê
Chẳng hạn, ta nghiên cứu nhu cầu thị trường về một loại hàng hóa nào đó Ta có thể đưa ra các cặp giả thuyết thống kê sau:
: Nhu cầu của thị trường phân phối theo quy luật chuẩn;
: Nhu cầu của thị trường không phân phối theo quy luật chuẩn
: Nhu cầu trung bình về loại hàng hóa này là = 1000 đơn vị/ tháng;
Lúc đó các giả thuyết đối tương ứng của nó có thể là: : > 1000; : < 1000; : ≠ 1000
: Nhu cầu của thị trường và thu nhập của khách hàng độc lập với nhau;
: Nhu cầu của thị trường và thu nhập của khách hàng phụ thuộc nhau…
Trong thực tế, người ta còn phân biệt các giả thuyết chứa đựng một mệnh đề hoặc nhiều mệnh đề
luật chuẩn và ta đưa ra giả thuyết : = 5 thì đó là giả thuyết đơn
Giả thuyết kép là giả thuyết chứa đựng một số hữu hạn hoặc vô hạn các giả thuyết đơn Chẳng
hạn giả thuyết : > 5 bao gồm một số vô hạn các giả thuyết đơn dạng : = , trong đó
là mọi số lớn hơn 5
Việc kiểm định giả thuyết kép thường khá phức tạp, do đó ở đây ta chỉ hạn chế ở việc nghiên cứu trường hợp giả thuyết gốc là giả thuyết đơn
Vì các giả thuyết thống kê có thể đúng hoặc sai nên cần kiểm định, tức là tìm ra kết luận về tính
thừa nhận được hay không thừa nhận được của giả thuyết đó Việc kiểm định này gọi là kiểm định thống kê, vì nó dựa vào thông tin thực nghiệm của mẫu để kết luận.
Phương pháp chung để kiểm định một giả thuyết thống kê như sau:
Trước hết giả sử đúng, từ đó dựa vào thông tin của mẫu rút ra từ tổng thể tìm được một biến
cố nào đó, sao cho xác suất xảy ra biến cố bằng bé đến mức có thể, tức là có thể coi không xảy ra trong một phép thử về biến cố này Lúc đó trên một mẫu cụ thể thực hiện một phép thử đối với biến cố , nếu xảy ra, điều đó chứng tỏ sai và bác bỏ nó; còn nếu không xảy
ra thì ta chưa có cơ sở để bác bỏ
Khi một mẫu được chọn ra từ một tổng thể, các thông tin của mẫu có thể nói lên đặc điểm của tổng thể đó hoặc cũng có thể dùng để đánh giá sự phỏng đoán hoặc một giả thuyết đã được giả định
Ví dụ:
- Một nhà sản xuất kẹo cho rằng trung bình mỗi hộp (0,5kg) có khoảng 82 viên kẹo Ðể kiểm tra điều này, ngẫu nhiên những hộp kẹo được chọn ra để kiểm tra, đếm và tính toán