Chương 3: Kiểm định giả thuyết thống kê với các cơng cụ phân tích dữ liệu
3.1.2. Khoảng tin cậy cho số trung bình.
Khoảng tin cậy trên trung bình
Sử dụng tính tốn phân bố chuẩn để tìm giá trị z để việc sử dụng cho một khoảng tin cậy
Tính một khoảng tin cậy trên trung bình khi σ được biết
Tính một khoảng tin cậy trên trung bình khi ước lượng σ
Khi bạn tính khoảng tin cậy trên trung bình, bạn tính trung bình của một mẫu để ước tính trung bình của quần thể. Rõ ràng, nếu bạn đã biết ý nghĩa của quần thể, sẽ không cần khoảng tin cậy.
Trong một số trường hợp, bạn có thể muốn có mức độ tin cậy cao hơn trong việc đưa trung bình quần thể vào khoảng (99%). Trong các trường hợp khác, bạn có thể chấp nhận sự
tin cậy ít hơn (chẳng hạn như 90%) về ước tính chính xác mức độ trung bình quần thể. Nói
chung, mức độ tin cậy được biểu trưng bởi , trong đó là tỷ lệ trong đoạn
dưới phân bố nằm ngoài khoảng tin cậy. Tỷ lệ phần trên của phân bố là 2, và tỷ lệ phần
dưới của phân bố là 2. Bạn sử dụng phương trình (8.1) để xây dựng zzz, ước tính khoảng
tin cậy cho trung bình với được biết đến.
Với là giá trị tương ứng với xác suất trên 2 từ phân bố chuẩn (tức là một diện
tích tích lũy từ 1- 2). Giá trị của cần thiết để xây dựng một khoảng tin cậy được gọi
là giá trị quan trọng cho việc phân phối. Độ tin cậy 95% tương ứng với giá trị 0,05. Giá trị Z giới hạn tương ứng với diện tích tích lũy của 0,975 là 1,96 vì có 0,025 ở phần đi trên của sự phân bố, và diện tích tích lũy nhỏ hơn Z = 1,96 là 0,975. Để biết giá trị Z giới hạn cho từng độ tin cậy, các bạn có thể trang bảng thống kê để biết. Ví dụ :
Với độ tin cậy 99% thì giá trị Z giới hạn của 0,005 là 2.58
Ví dụ : Nhà sản xuất giấy có quy trình sản xuất hoạt động liên tục trong suốt quá trình
chuyển đổi sản xuất. Giấy này dự kiến có chiều dài trung bình là 11 inch, và độ lệch tiêu chuẩn của chiều dài là 0,02 inch. Trong khoảng thời gian định kỳ, một mẫu được chọn để xác
57 | P a g e
định xem chiều dài giấy trung bình vẫn cịn 11 inch hay cái gì đó đã sai trong quy trình sản xuất để thay đổi chiều dài của giấy được sản xuất. Bạn chọn một mẫu ngẫu nhiên là 100 tờ, và chiều dài giấy trung bình là 10.998 inch. Xây dựng ước tính khoảng tin cậy 95% đối với trung bình quần thể là chiều dài của giấy. Ta sử dụng cơng thức trên với độ tin cậy là 95% thì giá trị Z giới hạn là 1.96, ta có :
Như vậy, với độ tin cậy 95%, bạn kết luận rằng trung bình quần thể là giữa 10.9941 và 11.0019 inch. Bởi vì khoảng bao gồm 11, giá trị chỉ ra rằng quá trình sản xuất đang hoạt động đúng, bạn khơng có lý do để tin rằng có bất cứ điều gì là sai trái với quá trình sản xuất.
Trong phần trước, ta được biết rằng trong hầu hết các tình huống kinh doanh, bạn khơng
biết , độ lệch tiêu chuẩn quần thể. Phần này thảo luận về một phương pháp xây dựng ước
tính khoảng tin cậy của μ sử dụng thống kê mẫu S như một ước tính của tham số của quần
thể. Vào đầu thế kỷ XX, William S. Gosset đang làm việc tại Guinness ở Ireland, cố gắng giúp sản xuất bia tốt hơn ít tốn kém hơn. Vì ơng chỉ có một mẫu nhỏ để nghiên cứu, anh ta
cần phải tìm ra cách để suy luận về mean mà không cần phải biết . Viết dưới cái tên
"Student", 1 Gosset giải quyết vấn đề này bằng cách phát triển cái mà ngày nay được gọi là
Sự phân bố t của Student, hoặc sự phân bố t. Nếu biến ngẫu nhiên X phân bố chuẩn thì thống kê sau đây:
Vậy ước tính khoảng tin cậy cho trung bình với khơng được biết đến sẽ được tính theo
phương trình sau đây :
58 | P a g e
Bảng 3.1.2A
Như ta biết nếu độ tin cậy là 95% thì ta có diện tích tích lũy (Cummalative Prob) là
0.975. Ví dụ : Mục tiêu kinh doanh của bạn là ước tính số trung bình bằng $. Sau đó, bạn thu
thập dữ liệu bằng cách chọn một mẫu của 100 hóa đơn bán hàng từ số lượng hóa đơn bán hàng trong tháng. Một khi bạn đã thu thập dữ liệu, bạn sắp xếp dữ liệu trong một bảng tính. Bạn có thể xây dựng các đồ thị khác nhau để hình dung tốt hơn về sự phân bố của số tiền đơ la. Để phân tích dữ liệu, bạn tính trung bình mẫu của 100 hố đơn bán hàng bằng 110,27 đơ la và độ lệch tiêu chuẩn mẫu là 28,95 đô la. Với độ tin cậy 95%, giá trị quan trọng của phân bố t (như trong hình trên) là 1,9842 với bậc tự do là n -1 = 100 – 1 = 99. Ta có kết quả sau :
Do đó, với độ tin cậy 95%, bạn kết luận rằng số tiền trung bình của tất cả hóa đơn bán hàng là từ 104,53 USD đến 116,01 USD. Mức độ tin cậy 95% cho thấy nếu bạn chọn tất cả
các mẫu có thể là 100, 95% khoảng được phát triển sẽ bao gồm quần thể có nghĩa là một nơi
nào đó trong khoảng đó. Hiệu lực của ước tính khoảng tin cậy này phụ thuộc vào giả định về tính chuẩn cho việc phân phối của số lượng hoá đơn bán hàng. Với một mẫu là 100, giả thiết bình thường khơng quá hạn chế, và việc sử dụng phân phối t có thể là thích hợp.
Ví dụ : Giả sử bạn muốn ước tính, với độ tin cậy 95% của quần thể có nghĩa là thời gian
xử lý đơn nộp trong +/-5 ngày. Trên cơ sở một nghiên cứu tiến hành trước đó, bạn tin rằng độ
lệch tiêu chuẩn là 25 ngày. Xác định cỡ mẫu cần thiết với e = 5, s = 25, và = 1,96 với
59 | P a g e
Vì vậy, bạn nên chọn một mẫu gồm 151 đơn nộp vì quy tắc chung để xác định kích thước mẫu là ln ln trịn trị giá trị số ngun tiếp theo để chuẩn mong muốn. Lỗi lấy mẫu thực tế lớn hơn 4 sẽ có kết quả nếu độ lệch tiêu chuẩn mẫu được tính trong mẫu 151 lớn hơn 25 và nhỏ hơn một chút nếu độ lệch tiêu chuẩn mẫu nhỏ hơn 25.