0

Bài đọc 8. Khhóa học ngắn về thống kê kinh doanh - 2nd ed. Chương 7: Ước lượng các số trung bình và tỉ lệ

51 11 0
  • Bài đọc 8. Khhóa học ngắn về thống kê kinh doanh - 2nd ed. Chương 7: Ước lượng các số trung bình và tỉ lệ

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Tài liệu liên quan

Thông tin tài liệu

Ngày đăng: 14/01/2021, 13:09

Trong Chƣơng 6, chúng ta đã lƣu ý rằng các trị thống kê, những con số định lƣợng đƣợc tính từ các đại lƣợng mẫu, đƣợc sử dụng để tạo ra những suy luận về các tham số tổng thể, và chúng[r] (1)William Mendenhall cộng Biên dịch: Hải Đăng C H Ƣ Ơ N G Ư ƯCC LLƯƯNNGG CCÁÁCC SS TTRRUUNNGG BBÌÌNNHH VVÀÀ TT LL Về chương này: Nhƣ phát biểu Chƣơng 3, xác suất suy luận từ tổng thể đến mẫu Sự suy luận thống kê, đảo ngƣợc qui trình này, luận chất tổng thể dựa thông tin chứa mẫu Chƣơng đến Chƣơng trình bày khái niệm xác suất, phân phối xác suất, phân phối xác suất (chọn mẫu) trị thống kê Mục đích chƣơng để chứng minh cho bạn thấy cách thức mà phân phối xác suất đƣợc sử dụng để tạo suy luận tổng thể từ giá trị quan sát đƣợc trị thống kê mẫu Vì chúng tơi trình bày hai phƣơng pháp nhằm rút suy luận tham số tổng thể - ƣớc lƣợng thống kê NGHIÊN CỨU ĐIỂN HÌNH ● (2)CHỌN MẪU: IRS SẼ CHO PHÉP ĐIỀU GÌ Sở Thuế Nội Địa (IRS) không sử dụng việc chọn mẫu thống kê để khảo sát khối lƣợng khổng lồ liệu kế tốn mà cịn cho phép sử dụng việc chọn mẫu thống kê suy luận doanh nghiệp để ƣớc lƣợng số chi phí hạng mục định việc có đƣợc liệu xác khơng thực tế Viết chủ đề này, W.L.Fell Jr R.S.Roussey trích dẫn ví dụ doanh nghiệp mà yêu sách $6 triệu năm $3.8 năm cho khoản mục chi phí thay sửa chữa chi phí khác (Fell 1985) Những yêu sách đƣợc mẫu gồm 350 khoản mục cho năm 520 khoản mục cho năm thứ hai IRS không tranh cãi việc sử dụng chọn mẫu, qui trình chọn mẫu hay qui mô mẫu, nhƣng họ thực phản đối thiếu thơng tin “sai số mẫu” Phân tích liệu mẫu doanh nghiệp này, IRS kết luận chi phí thực thấp khoảng $3.5 triệu $2.8 triệu lần lƣợt cho năm thứ thứ hai, khơng đồng ý $3.4 triệu tổng số $9.8 triệu nhƣ doanh nghiệp địi hỏi Ví dụ minh chứng nhiều cách thức mà việc chọn mẫu suy luận thống kê có giá trị việc hạch toán Trong chƣơng này, nghiên cứu ƣớc lƣợng cho nhiều tham số tổng thể hữu ích, sử dụng phân phối xác suất cho ƣớc lƣợng để định liệu ƣớc lƣợng gần đến mức với tham số tổng thể Sau Phần 7.10, khảo sát tính hợp lý khơng công nhận khoản yêu sách $3.4 triệu IRS 7.1 TÓM LƢỢC Sáu chƣơng trƣớc làm cho mục đích chƣơng này: hiểu biết suy luận thống kê cách mà suy luận đƣợc áp dụng cho lời giải vấn đề thực tiễn Trong Chƣơng 1, phát biểu nhà thống kê học quan tâm đến việc tạo suy luận tổng thể đại lƣợng dựa thông tin chứa đựng mẫu Chúng chứng tỏ cho bạn thấy cách thức để thực suy luận - nghĩa là, cách thức mô tả tập hợp đại lƣợng - Chƣơng Trong Chƣơng 3, thảo luận xác suất chế để tạo suy luận, việc với thảo luận chung phân phối xác suất - phân phối xác suất rời rạc Chƣơng phân phối xác suất liên tục Chƣơng Trong Chƣơng 6, lƣu ý trị thống kê, số định lƣợng đƣợc tính từ đại lƣợng mẫu, đƣợc sử dụng để tạo suy luận tham số tổng thể, tìm cách sử dụng quan trọng phân phối xác suất Chƣơng Đặc biệt là, bạn biết số trị thống kê quan trọng - trung bình tỷ lệ mẫu - có phân phối xác suất mà đƣợc ƣớc lƣợng xấp xỉ phân phối chuẩn cỡ mẫu lớn, nhờ vào Định lý Giới hạn Trung tâm Những trị thống kê đƣợc sử dụng để tạo suy luận tham số tổng thể, phân phối xác suất chúng cung cấp phƣơng tiện để đánh giá độ tin cậy suy luận (3)Biên dịch: Hải Đăng 7.2 CÁC LOẠI ƢỚC LƢỢNG Các qui trình ước lượng chia thành hai loại, ước lượng điểm ước lượng khoảng Giả sử đại lý xe Oldsmobile muốn ƣớc lƣợng lợi nhuận trung bình thƣơng vụ bán xe Sự ƣớc lƣợng có kết số nhất, ví dụ nhƣ $935, ƣớc lƣợng lợi nhuận trung bình thƣơng vụ bán hàng rơi vào khoảng từ $835 đến $1035 Loại hình ƣớc lƣợng thứ đƣợc gọi ước lượng điểm số đại diện cho số ƣớc lƣợng mà với điểm đƣờng thẳng Loại hình thứ hai, có liên quan đến hai điểm xác định khoảng đƣờng thẳng, đƣợc gọi ước lượng khoảng Chúng ta nghiên cứu phƣơng pháp ƣớc lƣợng Nhằm xây dựng ƣớc lƣợng điểm hay ƣớc lƣợng khoảng, sử dụng thơng tin từ mẫu dƣới hình thức số ƣớc lƣợng Các số ƣớc lƣợng hàm số quan sát mẫu thế, theo định nghĩa, trị thống kê ĐỊNH NGHĨA Một ước lượng qui luật mà cho biết cách thức tính tốn ƣớc lƣợng dựa thơng tin mẫu thƣờng đƣợc thể nhƣ cơng thức Ví dụ, số trung bình mẫu n x x n i i    là ƣớc lƣợng số trung bình tổng thể μ giải thích xác cách thức mà giá trị số thực sự ƣớc lƣợng đạt đƣợc giá trị mẫu x1.x2, ,xn đƣợc biết Số trung bình mẫu đƣợc sử dụng để đến số nhằm ƣớc lƣợng μ hay xây dựng khoảng, hai điểm mà đƣợc dự định dùng để bao quanh giá trị đúng μ ĐỊNH NGHĨA Một ước lượng điểm tham số tổng thể qui luật mà cho biết cách thức tính tốn số dựa liệu mẫu Con số tạo đƣợc gọi một ước lượng điểm ĐỊNH NGHĨA Một ước lượng khoảng tham số tổng thể qui luật mà cho biết cách thức tính tốn hai số dựa liệu mẫu Cặp số đƣợc gọi ước lượng khoảng hay khoảng tin cậy. Cả hai qui trình ƣớc lƣợng điểm khoảng đƣợc phát triển cách sử dụng phân phối mẫu số ƣớc lƣợng tốt tham số tổng thể đƣợc xác định Ngoài ra, nhiều trị thống kê khác đƣợc xây dựng để ƣớc lƣợng tham số Ví dụ, lấy mẫu n = đại lƣợng, 2, 7, 0, 1, 4, từ tổng thể đối xứng, ƣớc lƣợng số trung bình tổng thể cách sử dụng số trung bình mẫu 8 14 1    n x x n i i (4)thể đánh giá đặc trƣng số ƣớc lƣợng này, so sánh số với số khác, cuối định số “tốt nhất”? Mức độ tốt số ƣớc lƣợng đƣợc đánh giá cách quan sát hành vi chọn mẫu lặp lại Chúng ta xem xét giống sau Trên nhiều khía cạnh, ƣớc lƣợng điểm tƣơng tự với việc bắn súng ngắn ổ quay vào mục tiêu Số ƣớc lƣợng, mà tạo ƣớc lƣợng, tƣơng tự với súng ngắn ổ quay; ƣớc lƣợng cụ thể giống với viên đạn; tham số quan tâm tƣơng tự nhƣ điểm đen Chọn mẫu từ tổng thể ƣớc tính giá trị tham số tƣơng tự với việc bắn phát súng vào mục tiêu Giả sử ngƣời đàn ông bắn phát súng vào mục tiêu phát súng trúng điểm đen Trong kỳ tích đáng ngƣỡng mộ, liệu kết luận ông ta xạ thủ cừ khôi? Câu trả lời không - không số lịng giữ mục tiêu phát súng thứ hai đƣợc bắn Đến mà xác ơng ta đƣợc quan sát thấy lần bắn lặp lặp lại, với tất phát súng trúng vào gần điểm đen, tun bố ơng ta tay súng giỏi Giả sử xem xét số ƣớc lƣợng tham số tổng thể ví dụ nhƣ μ, σ, hay p Một số đặc trƣng đáng mong muốn số ƣớc lƣợng gì? Về bản, có hai đặc trƣng, chúng đƣợc thấy cách quan sát phân phối mẫu đƣợc cho Hình 7.1 7.2 Thứ nhất, muốn phân phối mẫu đƣợc tập trung trung tâm qua giá trị thật tham số Như thế, muốn số trung bình phân phối mẫu này với giá trị tham số Một số ƣớc lƣợng nhƣ đƣợc gọi không bị lệch HÌNH 7.1 Những phân phối cho ƣớc lƣợng bị lệch không bị lệch Số ƣớc lƣợng không bị lệch Số ƣớc lƣợng bị lệch (5)Biên dịch: Hải Đăng HÌNH 7.2 So sánh biến đổi ƣớc lƣợng ĐỊNH NGHĨA Một ƣớc lƣợng tham số đƣợc cho khơng bị lệch số trung bình phân phối ƣớc lƣợng với giá trị tham số Nếu khơng ƣớc lƣợng đó đƣợc cho bị lệch. Các phân phối mẫu cho số ƣớc lƣợng không bị lệch số ƣớc lƣợng bị lệch đƣợc trình bày Hình 7.1 Phân phối mẫu cho ƣớc lƣợng bị lệch Hình 7.1 bị dịch chuyển sang phía bên phải giá trị tham số Ƣớc lƣợng bị lệch có khả xảy nhiều ƣớc lƣợng không bị lệch việc ƣớc tính mức giá trị tham số Đặc trƣng thứ hai đáng mong ƣớc ƣớc lƣợng khoảng rộng (được đo bằng phương sai) phân phối mẫu phải nhỏ tốt Điều đảm bảo rằng, với xác suất cao, ƣớc lƣợng riêng lẻ rơi gần vào giá trị tham số Các phân phối mẫu cho hai ƣớc lƣợng không bị lệch, với phƣơng sai nhỏ ƣớc lƣợng với phƣơng sai lớn hơn, đƣợc trình bày Hình 7.2 Đƣơng nhiên thích ƣớc lƣợng với phƣơng sai nhỏ ƣớc lƣợng có xu hƣớng nằm gần với giá trị tham số với phƣơng sai lớn Trong tình trạng chọn mẫu sống thật, bạn biết phân phối mẫu ƣớc lƣợng điểm tập trung quanh tham số mà bạn cố gắng ƣớc lƣợng, nhƣng tất thứ mà bạn có ƣớc lƣợng đƣợc tính từ n đại lƣợng đƣợc chứa mẫu Sự ƣớc lƣợng bạn nằm cách giá trị tham số xa chừng nào? Khoảng cách số ƣớc lƣợng giá trị tham số đƣợc gọi sai số ước lượng cung cấp đại lƣợng mức độ tốt ƣớc lƣợng điểm ĐỊNH NGHĨA Khoảng cách số ƣớc lƣợng tham số đƣợc ƣớc lƣợng đƣợc gọi sai số ước lượng. Các nhà thống kê thƣờng sử dụng thuật ngữ phương sai số ước lượng thực tế họ ám phƣơng sai của phân phối mẫu số ƣớc lƣợng Thành ngữ rút gọn đƣợc sử dụng hầu nhƣ phổ biến Ƣớc lƣợng với phƣơng sai nhỏ hơn Ƣớc lƣợng với phƣơng sai lớn hơn (6)Mức độ tốt ước lượng khoảng đƣợc phân tích giống phần lớn cách thức mà ngƣời ta phân tích số ƣớc lƣợng điểm Những mẫu có cỡ đƣợc chọn lặp lặp lại từ tổng thể, ƣớc lƣợng khoảng đƣợc tính tốn cho lần chọn mẫu Qui trình tạo số lƣợng lớn khoảng điểm Một ước lượng điểm tốt bao quanh cách thành công giá trị tham số phần lớn thời gian “Tỷ lệ thành công” đƣợc xem nhƣ hệ số tin cậy cung cấp đại lƣợng mức độ tốt số ƣớc lƣợng khoảng ĐỊNH NGHĨA Xác suất mà khoảng tin cậy bao quanh tham số đƣợc ƣớc lƣợng đƣợc gọi hệ số tin cậy. Sự chọn lựa ƣớc lƣợng “tốt nhất” - cơng thức phù hợp để sử dụng việc tính tốn ƣớc lƣợng - có liên quan đến so sánh phƣơng pháp ƣớc lƣợng khác Đây nhiệm vụ nhà thống kê lý thuyết vƣợt khỏi phạm vi chƣơng Xuyên suốt phần lại chƣơng chƣơng tiếp theo, tổng thể tham số quan tâm đƣợc định nghĩa ƣớc lƣợng thích hợp đƣợc trình bày với đại lƣợng mức độ tốt 7.3 SỰ ƢỚC LƢỢNG CHO MẪU LỚN Ƣớc lƣợng Điểm Giả định có ƣớc lƣợng khơng bị lệch mà phân phối mẫu chuẩn hay đƣợc ƣớc lƣợng xấp xỉ phân phối chuẩn Chúng ta biết 95% giá trị số ƣớc lƣợng rơi vào bên 1.96 lần độ lệch chuẩn số trung bình nó, tham số mà ta quan tâm Nhƣ thế, sai số ước lượng, đƣợc định nghĩa khác biệt ƣớc lƣợng điểm cụ thể với tham số mà ƣớc lƣợng đƣợc, phải nhỏ 1.96 lần độ lệch chuẩn số ƣớc lƣợng với xác xuất xấp xỉ với 0.95 (Tham khảo Hình 7.3) Đại lƣợng tạo giới hạn sai số ƣớc lƣợng mà thƣờng đƣợc gọi biên sai số ước lượng Mặc dù có 5% may sai số ƣớc lƣợng vƣợt q biên sai số, điều có khả xảy HÌNH 7.3 Phân phối mẫu ƣớc lƣợng không bị lệch Số ƣớc lƣợng mẫu Giá trị Một ƣớc lƣợng cụ thể Sai số của ƣớc lƣợng (7)Biên dịch: Hải Đăng Ước lượng Điểm cho Tham số Tổng thể ƣớc lƣợng điểm: trị thống kê tính tốn đƣợc cách sử dụng đại lƣợng mẫu Biên sai số: 1.96 x độ lệch chuẩn số ƣớc lƣợng Ƣớc lƣợng Khoảng Khi xây dựng ƣớc lƣợng khoảng cho tham số, xác định hai điểm mà bên khoảng mong đợi giá trị tham số chƣa biết rơi vào Những ƣớc lƣợng khoảng đƣợc xây dựng chọn mẫu lặp lại tỷ lệ lớn (gần với 1) khoảng bao quanh tham số quan tâm Tỷ lệ đƣợc gọi hệ số tin cậy, khoảng tạo đƣợc gọi khoảng tin cậy Ví dụ, ƣớc tính số trung bình tổng thể với khoảng tin cậy, nói “xác suất mà khoảng bao quanh μ,” khơng phải “xác suất mà μ rơi vào khoảng đó,” giá trị μ đƣợc cố định nhƣng khoảng chứa điểm cuối ngẫu nhiên Một khoảng tin cậy mẫu lớn dựa số ƣớc lƣợng không bị lệch đƣợc phân phối chuẩn hay xấp xỉ chuẩn có đƣợc cách đo 1.96 x (độ lệch chuẩn số ƣớc lƣợng này) phía số ƣớc lƣợng điểm Bởi biết 95% ƣớc lƣợng điểm nằm 1.96 lần độ lệch chuẩn số trung bình tổng thể, 95% khoảng đƣợc lập nên theo cách phải bao quanh số trung bình tổng thể Một khoảng thất bại việc bao quanh số trung bình số ƣớc lƣợng điểm nằm xa 1.96 lần độ lệch chuẩn tính từ số trung bình, điều xảy với xác suất 0.05 Hình 7.4 cho thấy cách thức mà điều vận hành xđƣợc sử dụng nhƣ số ƣớc lƣợng μ HÌNH 7.4 Các giới hạn độ tin cậy 95% số trung bình tổng thể Nói chung, thay đổi hệ số tin cậy cách thay đổi giá trị 96 25  z Nếu mong muốn có hệ số tin cậy với 1,thì chọn giá trị z/2mà có /2 đoạn phân phối chuẩn chuẩn hóa Giá trị đƣợc tìm thấy Bảng Phụ lục II Một giá trị cụ thể x LCL  UCL x x  96 (8)Khi cỡ mẫu lớn số ƣớc lƣợng đƣợc phân phối chuẩn hay phân phối xấp xỉ chuẩn, ƣớc lƣợng khoảng tin cậy (1 - ) 100% cho tham số tổng thể chƣa biết đƣợc thể phần trình bày sau Một Khoảng Tin cậy Mẫu Lớn (1 - ) 100% (Số ƣớc lƣợng điểm) ± z/2x (Sai số chuẩn số ƣớc lƣợng) trong z/2là giá trị z tƣơng ứng với diện tích /2 đoạn phân phối chuẩn chuẩn hóa Công thức tạo hai giá trị, giới hạn tin cậy thấp (LCL) giới hạn tin cậy cao (UCL). Một số khoảng tin cậy phổ biến, hệ số tin cậy, giá trị z chúng đƣợc cho Bảng 7.1 BẢNG 7.1 Các giới hạn tin cậy cho ƣớc lƣợng khoảng cho mẫu lớn Khoảng Tin cậy z/2 0.90 0.10 1.645 0.95 0.05 1.96 0.99 0.01 2.58 Xuyên suốt phần lại chƣơng này, bạn thấy cách thức mà công thức chung cho ƣớc lƣợng điểm khoảng cho mẫu lớn áp dụng cho tổng thể tham số cụ thể đƣợc quan tâm Các bạn học hỏi cách thức điều chỉnh công thức chung cỡ mẫu không lớn 7.4 SỰ ƢỚC LƢỢNG CHO MẪU LỚN VỀ SỐ TRUNG BÌNH TỔNG THỂ Những vấn đề thực tiễn thƣờng dẫn đến ƣớc lƣợng số trung bình tổng thể μ Chúng ta có lẽ quan tâm đến điểm số trung bình sinh viên theo học Thạc sĩ Quản trị Kinh doanh (MBA) trƣờng đại học cụ thể, đến sức chịu lực trung bình loại thép mới, đến số trung bình số ngƣời chết bình quân đầu ngƣời giai cấp xã hội biết, hay đến nhu cầu trung bình sản phẩm Nhiều số ƣớc lƣợng sẵn có cho việc ƣớc lƣợng số trung bình tổng thể μ, bao gồm số trung vị mẫu, số trung bình đại lƣợng lớn nhỏ mẫu, số trung bình mẫu x Mỗi số ƣớc lƣợng sẽ có phân phối mẫu và, tùy thuộc vào tổng thể vấn đề thực tiễn có liên quan, mà có ƣu hay bất lợi định Mặc dù số trung vị mẫu trung bình giá trị cao thấp mẫu dễ tính tốn hơn, số trung bình mẫu xthƣờng ƣu việt chổ, đối với số tổng thể, phƣơng sai tối thiểu và, khơng quan tâm đến tổng thể, luôn không bị lệch Phân phối mẫu số trung bình mẫu x, mà đƣợc thảo luận Phần 6.3, có bốn đặc trƣng quan trọng:  Phân phối mẫu x xấp xỉ chuẩn mà không quan tâm đến phân phối xác suất tổng thể đƣợc chọn mẫu n lớn (9)Biên dịch: Hải Đăng  Số trung bình phân phối mẫu xsẽ ln ln với μ Vì x số ƣớc lƣợng không bị lệch μ  Độ lệch chuẩn phân phối mẫu x, đƣợc gọi độ lệch chuẩn số trung bình, x / n Số ƣớc lƣợng x thỏa mãn tất điều kiện đƣợc trình bày Phần 6.3, cơng thức chung đƣợc áp dụng cho ƣớc lƣợng điểm khoảng Số Ước lượng Điểm số Trung bình Tổng thể μ Số ƣớc lƣợng điểm: x Biên sai số: 1.96x 1.96/ n Một Khoảng Tin cậy (1 - ) 100% cho Mẫu Lớn số Trung bình Tổng thể μ n z x /2  trong z/2là giá trị z tƣơng ứng với diện tích nằm đoạn phân phối z chuẩn chuẩn hóa n = cỡ mẫu σ = độ lệch chuẩn tổng thể đƣợc chọn mẫu Nếu σ chƣa đƣợc biết, đại lƣợng đƣợc ƣớc lƣợng xấp xỉ độ lệch chuẩn của mẫu s cỡ mẫu lớn.Giả định: n ≥ 30 VÍ DỤ 7.1 Một tổ chức nghiên cứu tiếp thị đƣợc thuê để ƣớc lƣợng số trung bình lãi suất cho vay bản ngân hàng đặt vùng phía tây Hoa Kỳ Một mẫu ngẫu nhiên gồm n = 50 ngân hàng đƣợc chọn nội vùng này, lãi suất đƣợc ghi nhận cho ngân hàng Trung bình độ lệch chuẩn cho 50 lãi suất %  x s = 0.24 Hãy ƣớc lƣợng số trung bình lãi suất cho tồn khu vực, tìm biên sai số với ƣớc lƣơng Lời giải Ƣớc lƣợng số trung bình lãi suất x8.1% Biên sai số 50 96 96 96 1      n x Mặc dù σ chƣa đƣợc biết, cỡ mẫu lớn, ƣớc lƣợng xấp xỉ giá trị σ cách sử dụng s Nhƣ vậy, biên sai số xấp xỉ 07 0665 50 24 96 96 1    n s  (10)Chúng ta cảm thấy tin tƣởng ƣớc lƣợng 8.1% nằm 0.07% số trung bình lãi suất VÍ DỤ 7.2 Tìm khoảng tin cậy 90% cho số trung bình tỷ lệ cho vay đƣợc thảo luận Ví dụ 7.1 Lời giải Khoảng tin cậy 90% số trung bình tỷ lệ cho vay μ x z x 0.05 hoặc n x1.645  Thay x 8.1% n = 50 sử dụng s = 0.24% để ƣớc lƣợng xấp xỉ σ, có đƣợc 50 24 ) 645 (  hay 0558 8  Nhƣ vậy, ƣớc lƣợng số trung bình lãi suất cho vay nhằm 8.0442% 8.1558% Liệu nói khoảng cụ thể bao quanh μ không? Không, nhƣng chúng ta tin tƣởng việc này, khoảng đƣợc lập nên theo cách bao quanh μ 90% thời gian Đối với cỡ mẫu cố định, bề rộng khoảng tin cậy tăng lên hệ số tin cậy gia tăng, kết mà đồng ý với trực giác Chắc mong muốn tin tƣởng khoảng bao quanh μ, tăng bề rộng khoảng Bởi ƣa thích khoảng tin cậy hẹp hệ số tin cậy lớn hơn, nên phải đạt đƣợc thỏa hiệp việc lựa chọn hệ số tin cậy Lựa chọn hệ số tin cậy đƣợc sử dụng tình cho trƣớc đƣợc thực ngƣời làm thí nghiệm tùy thuộc vào mức độ tin cậy mà ngƣời làm thí nghiệm mong muốn đặt ƣớc lƣợng Phần lớn khoảng tin cậy đƣợc lập nên cách sử dụng ba hệ số tin cậy đƣợc trình bày Bảng 7.1 Hệ số tin cậy phổ biến có lẽ khoảng tin cậy 95% Việc sử dụng khoảng tin cậy 99% phổ biến bề rộng khoảng lớn đƣợc tạo Dĩ nhiên, lúc bạn giảm bớt bề rộng cách gia tăng cỡ mẫu n Ngồi khoảng tin cậy hai phía (mà đơn giản gọi khoảng tin cậy), chúng ta xây dựng khoảng tin cậy phía cho tham số Một khoảng tin cậy phía thấp cho tham số cho giới hạn tin cậy thấp (LCL) nằm phía mức mà tham số đƣợc kỳ vọng nằm Một khoảng tin cậy phía cao ƣớc lƣợng tham số thấp giới hạn tin cậy cao (UCL) Giá trị z đƣợc sử dụng cho khoảng tin cậy phía (1 - ) 100%, z, đặt  vào đầu phân phối chuẩn Các giới hạn tin cậy phía cao thấp (1 - ) 100% tham số tổng thể cỡ mẫu lớn (11)Biên dịch: Hải Đăng UCL = (số ƣớc lƣợng điểm) + z x (độ lệch chuẩn số ƣớc lƣợng) VÍ DỤ 7.3 Một cơng ty lên kế hoạch cho việc phát hành kỳ phiếu ngắn hạn hy vọng lãi suất mà công ty phải trả khơng vƣợt q 11.5% Để có đƣợc số thơng tin lãi suất trung bình mà cơng ty kỳ vọng chi trả, doanh nghiệp đƣa thị trƣờng 40 kỳ phiếu, kỳ phiếu thông qua 40 công ty môi giới Số trung bình độ lệch chuẩn cho 40 lãi suất % 10  x s = 0.31% Bởi cơng ty quan tâm đến giới hạn cao lãi suất mà công ty trả, tìm khoảng tin cậy 95% phía cho lãi suất trung bình mà cơng ty trả cho kỳ phiếu Lời giải Bởi hệ số tin cậy 0.95,  = 0.05 z0.05 1.645.Do vậy, khoảng tin cậy 95% phía cho μ x z x 0.05 n x1.645  Thay x= 10.3, n = 40, s = 0.31 để ƣớc lƣợng σ, có đƣợc khoảng tin cậy phía UCL = 40 31 ) 645 ( 10  hay UCL = 10.3 + 0.0806 = 10.3806 Vì thế, ƣớc lƣợng lãi suất trung bình mà doanh nghiệp trả cho kỳ phiếu thấp 10.3806% Chúng ta tin tƣởng kết luận này? Chúng ta tin tƣởng, ta biết khoảng đƣợc lập theo cách bao quanh μ 95% thời gian Bài tập Các Kỹ thuật Cơ 7.1 Giải thích “biên sai số ƣớc lƣợng” nghĩa 7.2 Tìm biên sai số ƣớc lƣợng số trung bình tổng thể μ cho: a n40,2 4 b n100,2 0.9 c n50,2 12 7.3 Tìm biên sai số ƣớc lƣợng số trung bình tổng thể μ cho: a n50, 0.1 b n100, 0.9 (12)7.4 Tìm khoảng tin cậy 95% cho trung bình tổng thể μ cho: a n36,x 13.1,s23.42 b n64,x2.73,s20.1047 c n41,x28.6,s2 1.09 7.5 Tìm khoảng tin cậy 90% cho trung bình tổng thể μ cho: a n125,x0.84,s20.086 b n50,x21.9,s23.44 c n46,x907,s2128 7.6 Tìm khoảng tin cậy (1 - ) 100% cho trung bình tổng thể μ cho: a 0.1,n38,x34,s2 12 b 0.10,n65,x 1049,s251 c 0.05,n89,x66.3,s22.48 7.7 Một mẫu ngẫu nhiên gồm n đại lƣợng đƣợc chọn từ tổng thể với số trung bình chƣa đƣợc biết μ độ lệch chuẩn biết σ = 10 Hãy tính bề rộng khoảng tin cậy 95% cho μ cho các giá trị sau n a n100 b n200 c n400 7.8 So sánh khoảng tin cậy Bài tập 7.7 Ảnh hƣởng lên bề rộng khoảng tin cậy điều kiện dƣới nhƣ a Bạn nhân đôi cỡ mẫu b Bạn nhân bốn cỡ mẫu 7.9 Tham chiếu lại Bài tập 7.7 a Tính tốn bề rộng khoảng tin cậy 90% cho μ n = 100 b Tính tốn bề rộng khoảng tin cậy 99% cho μ n = 100 c So sánh bề rộng khoảng tin cậy 90%, 95% 99% cho μ Việc gia tăng hệ số tin cậy có tác động đến bề rộng khoảng tin cậy? Các Ứng dụng 7.10 Một gia tăng tỷ lệ tiết kiệm ngƣời tiêu dùng thƣờng đƣợc gắn chặt với thiếu tin tƣởng vào kinh tế đƣợc cho báo xu hƣớng suy thoái kinh tế Chọn mẫu ngẫu nhiên n = 200 tài khoản tiết kiệm cộng đồng địa phƣơng cho thấy gia tăng trung bình tài khoản tiết kiệm 7.2% vòng 12 tháng qua độ lệch chuẩn 5.65 Ƣớc lƣợng gia tăng tỷ lệ phần trăm trung bình giá trị tài khoản tiết kiệm 12 tháng qua ngƣời gởi tiền cộng đồng Hãy tính biên sai số ƣớc lƣợng 7.11 Phần lớn yêu cầu toán bảo hiểm y tế công ty nhỏ nằm khoảng $800, nhƣng số yêu cầu lớn Kết là, phân phối yêu cầu tốn là lệch nhiều sang phía bên phải có độ lệch chuẩn σ với $2000 40 yêu cầu thanh toán nhận đƣợc tháng có số trung bình x với $930 Giả sử phải xem nhóm 40 u cầu tốn nhƣ mẫu ngẫu nhiên từ tổng thể tất u cầu tốn có, sử dụng xđể ƣớc tính số trung bình (13)Biên dịch: Hải Đăng a Biên sai số ƣớc lƣợng bao nhiêu? b Liệu bạn thực phát biểu xác xác suất biên sai số thấp biên phần (a) hay không? Hãy giải thích 7.12 Trong báo lựa chọn chuyên ngành đại học, Jake Batsell (1994) báo cáo phần lớn nhà tƣ vấn học thuật khuyến khích sinh viên thực định khoảng năm thứ hai đại học Một nhân tố mà thƣờng xuất định mức lƣơng khởi đầu cho công việc với chuyên ngành khác Các lĩnh vực nóng đƣợc ghi nhận Khoa học Máy tính Kỹ sƣ Hóa, với tiền lƣơng bình qn lần lƣợt $41,800 $39,400 Tiền lƣơng bình quân cho chuyên ngành khác đƣợc quan tâm đƣợc liệt kê dƣới Chuyên ngành Tiền lương Khởi đầu Bình quân Quản trị Nhân $32,600 Kế tốn 28,600 Quản trị Tài 26,700 Tiếp thị/Bán hàng 24,100 Truyền thông 22,909 Bán lẻ 22,500 Quảng cáo 21,400 Chúng ta giả định mức tiền lƣơng bình quân đƣợc dựa mẫu có cỡ 100 a Nếu độ lệch chuẩn cho Quản trị Nhân $1000, tìm ƣớc lƣợng khoảng tin cậy 95% cho tiền lƣơng khởi đầu bình quân thực tế cho chuyên ngành Quản trị Nhân b Tìm ƣớc lƣợng điểm cho tiền lƣơng khởi đầu bình quân thực tế cho chuyên ngành Tiếp thị/Bán hàng độ lệch chuẩn $800 Biên sai số với ƣớc lƣợng bao nhiêu? c Xây dựng khoảng tin cậy 98% cho tiền lƣơng khởi đầu bình quân thực tế chuyên ngành Truyền thông độ lệch chuẩn σ = $800 7.13 Nếu bạn thuê hộ bạn nghĩ tiền thuê cao, phần tiền thuê nhà mà bạn trả lãi suất cao tiền vay Lãi suất vào ngày tháng Chín tới bao nhiêu? Một mẫu ngẫu nhiên gồm n = 32 nhà dự báo kinh tế cho số trung bình x 11.7%và độ lệch chuẩn s = 2.1% Nếu nhƣ dự báo nhà dự báo “không bị lệch” - nghĩa là, số trung bình tổng thể dự báo tất nhà dự báo kinh tế với lãi suất thực tế vào mùa thu - tìm khoảng tin cậy 90% cho lãi suất vào ngày tháng Chín 7.14 Một nhân viên nhân công ty muốn ƣớc lƣợng thời gian trung bình lần xảy tai nạn nhân mà tạo tiềm cho vụ kiện tụng pháp lý Một mẫu ngẫu nhiên gồm n = 30 nạn từ hồ sơ lƣu trữ cơng ty vào thời gian x tai nạn tai nạn trƣớc cho số trung bình mẫu x 42.1ngày độ lệch chuẩn s = 19.6 ngày Hãy tìm khoảng tin cậy 90% cho thời gian trung bình lần xảy tai nạn nhân mà có tiềm gây vụ kiện tụng pháp lý (14)7.5 SỰ ƢỚC LƢỢNG CHO MẪU NHỎ VỀ SỐ TRUNG BÌNH TỔNG THỂ Qui trình cho mẫu lớn việc ƣớc lƣợng số trung bình tổng thể mà thảo luận Phần 7.4 đƣợc dựa hai kiện Thứ nhất, cỡ mẫu lớn, phân phối số trung bình mẫu có phân phối chuẩn với số trung bình μ độ lệch chuẩn / n, hay xấp xỉ nhƣ Định lý Giới hạn Trung tâm Thứ hai, giá trị độ lệch chuẩn tổng thể σ chƣa đƣợc biết cỡ mẫu lớn, độ lệch chuẩn mẫu s đƣợc sử dụng nhƣ số ƣớc lƣợng đáng tin cậy cho σ công thức x / n Tuy nhiên, giới hạn chi phí, hạn chế thời gian, nhân tố khác thƣờng làm hạn chế cỡ mẫu mà đƣợc lựa chọn qui trình mẫu lớn khơng áp dụng đƣợc Khi cỡ mẫu nhỏ, phân phối mẫu xlà biến thiên lớn nhiều so với số ƣớc lƣợng / n Khi tổng thể đƣợc chọn mẫu có phân phối chuẩn σ biết, số trung bình mẫu x có phân phối chuẩn với số trung bình μ độ lệch chuẩn / n,và trị thống kê: n x /    có phân phối chuẩn chuẩn hóa cho tất cỡ mẫu Bây ta nói điều phân phối trị thống kê n s x /   khi σ chƣa đƣợc biết n nhỏ? Phân phối trị thống kê n s x t /    cho mẫu đƣợc chọn từ tổng thể phân phối chuẩn đƣợc phát W S Gosset và xuất (1908) dƣới bút danh Student Ông ám đại lƣợng nghiên cứu t từ đó đại lƣợng đƣợc gọi t Student Chúng ta bỏ qua biểu thức toán học phức tạp hàm mật độ t nhƣng mô tả số đặc trƣng Phân phối mẫu trị thống kê kiểm định t, đƣợc gọi phân phối t, giống nhƣ z, có hình dạng gị hồn toàn đối xứng qua t = Tuy nhiên, đại lƣợng biến thiên lớn nhiều so với z, nhỏ dần cách nhanh chóng phía bên phải bên trái, tƣợng mà đƣợc giải thích cách sẵn sàng Độ biến thiên z việc chọn mẫu lặp lại chỉ x ; đại lƣợng khác xuất z (n, μ, σ) ngẫu nhiên Trái lại, độ biến thiên t đƣợc đóng góp hai đại lƣợng ngẫu nhiên, xvà s, mà đƣợc chứng minh độc lập với Vì xlà lớn, s nhỏ, ngƣợc lại Kết quả là, t biến thiên nhiều so với z việc chọn mẫu lặp lại (xem Hình 7.5) Cuối cùng, nhƣ có lẽ đoán, độ biến thiên t giảm n tăng lên s, ƣớc lƣợng σ, đƣợc ngày nhiều thơng tin Khi n vơ lớn, phân phối t z đồng Vì Gosset phát phân phối t phụ thuộc vào cỡ mẫu n Ƣớc số tổng bình phƣơng độ lệch, (n - 1) mà xuất công thức cho 2 s đƣợc gọi số bậc tự (d.f) với s với trị thống kê t Thuật ngữ bậc tự 2 đƣợc liên tƣởng với lý thuyết thống kê tảng phân phối xác suất s liên quan đến số lƣợng độ lệch bình phƣơng độc lập sẵn có cho việc ƣớc lƣợng 2 (15)Biên dịch: Hải Đăng HÌNH 7.5 z chuẩn chuẩn hóa phân phối t dựa n = đại lƣợng (5 d.f) Các giá trị t có diện tích đƣợc định rõ phía bên phải chúng đƣợc trình bày Bảng Phụ lục II Bảng đƣợc chép phần Bảng 7.2 Giá trị bảng ta ghi lại giá trị t diện tích a nằm phía bên phải nó, nhƣ thấy trong Hình 7.6 Bậc tự với t, d.f., đƣợc thể cột cuối của bảng (xem Bảng 7.2), ta tƣơng ứng với giá trị khác a xuất dòng đầu tiên Vì thế, muốn tìm giá trị t 5% diện tích nằm phía bên phải nó, sử dụng cột có nhãn t0.05 Ví dụ, giá trị t0.05 n = 6, đƣợc tìm thấy cột t0.05 đối qua bậc tự d.f = (n - 1) = (6 - 1) = 5, t = 2.015 (đƣợc đóng khung Bảng 7.2) Lƣu ý diện tích có đoạn cuối cố định, giá trị đoạn cuối phía bên phải của t ln ln lớn giá trị tƣơng ứng đoạn cuối phía bên phải z Ví dụ, = 0.05, giá trị đoạn cuối phía bên phải t cho n = (d.f = n -1 = 1) 6.314, lớn so với giá trị tƣơng ứng z0.05 = 1.645 Dò xuống cột t0.05, lƣu ý giá trị t giảm đi, qua phản ảnh tác động cỡ mẫu lớn (nhiều bậc tự hơn) lên ƣớc lƣợng σ Cuối cùng, n vô lớn, giá trị t0.05 với z0.05 = 1.645 Lý chọn n = 30 (một chọn lựa tùy ý) làm đƣờng phân chia mẫu lớn nhỏ bây rõ ràng Khi n = 30 (d.f = 29), giá trị đoạn cuối phía bên phải t0.05 = 1.699 mặt số học gần với z0.05 1.645 Với a = 0.035 đoạn cuối bên phải n = 30, thì giá trị đoạn cuối phía bên phải t 2.045, mà gần với giá trị z0.025= 1.96 HÌNH 7.6 Các giá trị bảng t Student t f(t) f(t) Phân phối chuẩn Phân phối t Diện tích = a f(t) t (16)BẢNG 7.2 Định dạng bảng t Student, Bảng Phụ lục II d.f t0.100 t0.050 t0.025 t0.010 t0.005 d.f 1 3.078 6.314 12.706 31.821 63.657 1.886 2.920 4.303 6.965 9.925 1.638 2.353 3.182 4.541 5.841 1.533 2.132 2.776 3.747 4,604 5 1.476 2.015 2.571 3.365 4,032 1.440 1,943 2.447 3.143 3,707 1.415 1.895 2.365 2.998 3.499 1.397 1.860 2.306 2.896 3.355 1.383 1.833 2.262 2.821 3.250 26 1.315 1.706 2.056 2.479 2.779 26 27 1.314 1.703 2.052 2.473 2.771 27 28 1.313 1.701 2.048 2.467 2.763 28 29 1.311 1.699 2.045 2.462 2.756 29 inf 1.282 1.645 1.960 2.326 2.576 inf Lƣu ý t Student giá trị bảng tƣơng ứng đƣợc giả định tổng thể chọn mẫu có phân phối xác suất chuẩn Điều dƣờng nhƣ giả định nghiêm ngặt, nhiều tình chọn mẫu, đặc trƣng tổng thể hoàn toàn chƣa đƣợc biết khơng chuẩn Nếu tính khơng chuẩn tổng thể ảnh hƣởng nghiêm trọng đến phân phối trị thống kê t, việc áp dụng số kiểm tra t sẽ hạn chế May mắn ngƣời ta chứng minh phân phối trị thống kê t gần nhƣ có hình dạng với phân phối theo lý thuyết t cho tổng thể mà không chuẩn nhƣng sở hữu phân phối xác suất có hình dạng gị Đặc trƣng trị thống kê t xảy phổ biến phân phối có hình dạng gị liệu tự nhiên làm gia tăng giá trị t Student sử dụng cho việc suy luận thống kê Khi xây dựng số ƣớc lƣợng khoảng tin cậy μ dựa phân phối t, đơn giản thay giá trị bảng z giá trị bảng tƣơng ứng t Tính hợp lý đƣợc sử dụng để lập nên số ƣớc lƣợng khoảng cho mẫu lớn μ áp dụng đƣợc, ngoại trừ rằng phân phối đƣợc ám t thay z Trong Hình 7.7(a), (1 - ) 100% giá trị t nằm bên khoảng (t/2,t/2); tƣơng tự nhƣ vậy, Hình 7.7(b), (1 - ) 100% giá trị biến số ngẫu nhiên x nằm bên t/2, độ lệch chuẩn đƣợc ƣớc lƣợng giá trị μ Vì vậy, có xác suất (1 - ) ƣớc lƣợng khoảng n s t x /2 (17)Biên dịch: Hải Đăng HÌNH 7.7 Các phân phối mẫu (a) n s x t /    (b) x Ước lượng Khoảng Tin cậy (1 - ) 100% số Trung bình μ n s t x /2 trong s độ lệch chuẩn mẫu, s / nlà độ lệch chuẩn ước lượng x, t có (n - 1) d.f Giả định: Mẫu chọn ngẫu nhiên từ tổng thể mà có phân phối chuẩn (hay xấp xỉ nhƣ vậy) VÍ DỤ 7.4 Một thí nghiệm đƣợc tiến hành nhằm đánh giá qui trính cho việc sản xuất kim cƣơng tổng hợp Sáu viên kim cƣơng đƣợc tạo từ qui trình này, với trọng lƣợng đƣợc ghi nhận 0.46, 0.61, 0.52, 0.48, 0.57, 0.54 cara Hãy tìm ƣớc lƣợng khoảng tin cậy 95% cho μ, trọng lƣợng trung bình thực tế viên kim cƣơng đƣợc sản xuất qui trình Lời giải Sử dụng phƣơng pháp Chƣơng 2, bạn kiểm định số trung bình độ lệch chuẩn mẫu cho sáu trọng lƣợng 53  x s = 0.0559 Giá trị bảng t với 0.025 đoạn cuối phía bên phải, dựa n - = - = bậc tự do, đƣợc tìm thấy Bảng Phụ lục II 571 025  t 0 ) 1 (  ) (  2 /  2 /  2 /  /2 2 /  tt/2 n s t/2  n s t/2   a (18)Thay giá trị vào cơng thức tính số ƣớc lƣợng khoảng tin cậy cho 6 0559 ) 571 ( 53 025 0    n s t x hay 59 53 0  Ƣớc lƣợng khoảng cho μ từ 0.471 đến 0.589 với hệ số tin cậy với 0.95 Nếu ngƣời làm thí nghiệm muốn phát gia tăng nhỏ trọng lƣợng trung bình kim cƣơng vƣợt 0.5 cara, bề rộng khoảng phải đƣợc giảm bớt cách có đƣợc nhiều đại lƣợng trọng lƣợng kim cƣơng Gia tăng cỡ mẫu làm giảm 1/ n lẫn t/2 làm giảm bề rộng khoảng Bài tập Các Kỹ thuật Cơ 7.16 Tìm giá trị t a t0.05 cho bậc tự (d.f.) b t0.025 cho d.f. c t0.10 cho 18 d.f. d t0.025 cho 30 d.f. 7.17 Tìm ta biết P(tta)a a a = 0.10, 12 d.f b a = 0.01, 25 d.f c a = 0.05, 16 d.f 7.18 Một mẫu ngẫu nhiên gồm n = quan sát từ tổng thể có phân phối chuẩn tạo liệu sau đây: 6.2, 5.8, 7.1, 6.3, 6.9, 5.7 a Tính x s cho liệu b Tìm khoảng tin cậy 90% cho trung bình tổng thể μ c Tìm khoảng tin cậy 95% cho trung bình tổng thể μ So sánh bề rộng khoảng với khoảng đƣợc tính câu (b) 7.19 Mƣời hai quan sát đƣợc chọn ngẫu nhiên từ tổng thể chuẩn, tạo x 125.12 s = 12.3 a Tìm khoảng tin cậy 98% cho trung bình tổng thể μ b Tìm khoảng tin cậy 99% cho trung bình tổng thể μ c Giải thích khoảng tìm câu (a) (b) Các Ứng dụng (19)Biên dịch: Hải Đăng a Nếu phân phối lãi suất chấp nhà cửa đƣợc giả định xấp xỉ phân phối chuẩn tắc, tìm khoảng tin cậy 90% cho kỳ vọng lãi suất trung bình ngƣời nộp hồ sơ vay chấp nhà ngân hàng Giải thích khoảng b Liệu khoảng đƣợc tạo câu (a) có chứa lãi suất trung bình 8.7% mà phổ biến khu vực thị trƣờng ngân hàng này? Liệu điều dẫn bạn đến việc tin kỳ vọng lãi suất chấp trung bình ngƣời nộp hồ sơ vay chấp ngân hàng thấp lãi suất trung bình phổ biến 8.7% hay khơng? Giải thích 7.21 Các biến phí, chủ yếu lao động, khiến cho lợi nhuận việc xây nhà thay đổi từ đơn vị nhà sang đơn vị nhà khác Một công ty xây dựng nhà ống tiêu chuẩn cần làm mức lợi nhuận bình quân vƣợt $8500 nhà nhằm đạt đƣợc mục tiêu lợi nhuận hàng năm Các khoản lợi nhuận tính nhà cho năm đơn vị nhà gần công ty xây dựng $8760, $6370, $9620, $8200, $10,350 a Tìm khoảng tin cậy 95% cho lợi nhuận trung bình đơn vị nhà cơng ty xây dựng Giải thích khoảng b Liệu khoảng đƣợc tạo câu (a) có chứa $8500 hay khơng? Liệu bạn có kết luận công ty xây dựng hoạt động mức lợi nhuận mong muốn? 7.22 Giá trung bình tính đơla cho số n = 21 tivi 27 inch đƣợc đề cập Bài tập 6.41 (“Xếp hạng: tivi 27 inch”, 1994) đƣợc cho bảng sau: 380 590 585 670 699 530 560 430 610 565 705 475 565 580 405 385 465 425 390 450 390 a Tìm trung bình độ lệch chuẩn giá b Xây dựng khoảng tin cậy 99% cho giá bình quân chung 21 nhãn hiệu/mẫu tivi 27 inch này, không bao gồm mẫu Sony KV-27XBR26 c Nếu giá bình quân tivi Sony, $1085, đƣợc thêm vào, bạn ƣớc lƣợng bạn câu (b) thay đổi sao? d Liệu giá bình qn tivi Sony đƣợc xem nhƣ quan sát nằm ngoài? 7.23 Bảng sau liệt kê tăng trƣởng tỷ lệ phần trăm thu nhập cá nhân bình quân đầu ngƣời cho 11 vùng đô thị từ năm 1988 đến 2000, nhƣ dự báo Bộ Thƣơng mại Hoa Kỳ Vùng đô thị Tăng trưởng Tỷ lệ Phần trăm Thu nhập Bình quân Đầu người Anaheim 13.6 Atlanta 14.2 Cleveland 17.2 Detroit 15.3 Fort Lauderdale, FL 16.0 Jacksonville, FL 16.2 New Orleans 18.7 New York 15.3 Pittsburgh 15.8 San Diego 13.8 (20)Nguồn: Bộ Thƣơng mại Hoa Kỳ, The Press Enterprise, 12 tháng Mƣời, 1990, trang a Nếu dự báo tƣợng trƣng cho mẫu ngẫu nhiên dự báo tăng trƣởng cho tất vùng thị Hoa Kỳ, tìm khoảng tin cậy 98% cho tăng trƣởng phần trăm trung bình đƣợc dự báo thu nhập cá nhân bình quân đầu ngƣời cho tất vùng đô thị Hoa Kỳ giai đoạn 1988-2000 (Tổng thể tăng trƣởng phần trăm thu nhập cá nhân bình quân đầu ngƣời đƣợc giả định có phân phối xấp xỉ chuẩn.) b Liệu có khả xảy tăng trƣởng phần trăm trung bình dự báo câu (a) với tăng trƣởng phần trăm trung bình thực tế năm 2000 hay khơng? Giải thích 7.6 ƢỚC LƢỢNG SỰ KHÁC BIỆT GIỮA HAI SỐ TRUNG BÌNH Một vấn đề có tầm quan trọng khơng cho việc ƣớc lƣợng số trung bình tổng thể so sánh hai số trung bình tổng thể Ví dụ, có lẽ mong muốn ƣớc lƣợng khác biệt hai tiểu bang qui mơ trung bình u cầu tốn loại hình bảo hiểm xe cộ Ƣớc lƣợng đƣợc mẫu ngẫu nhiên độc lập yêu cầu toán đƣợc chọn lựa số yêu cầu đƣợc lƣu hồ sơ hai tiểu bang Hoặc có lẽ mong muốn so sánh suất sinh lợi bình qn nhà máy hóa chất sử dụng nguyên vật liệu thô đƣợc cung cấp hai nhà cung ứng, A B Các mẫu suất sinh lợi hàng ngày, cho số hai nhà cung ứng này, đƣợc ghi nhận sử dụng để tạo suy luận có liên quan đến khác biệt suất sinh lợi trung bình Đối với số mẫu có hai tổng thể, tổng thể thứ với trung bình phƣơng sai 1và 2  tổng thể thứ hai với trung bình phƣơng sai 2và 2  Một mẫu ngẫu nhiên gồm n1 đại lƣợng đƣợc chọn từ tổng thể n2 từ tổng thể 2, mà mẫu đƣợc giả định đƣợc rút cách độc lập với Cuối cùng, ƣớc lƣợng tham số tổng thể đƣợc tính toán từ liệu mẫu cách sử dụng số ƣớc lƣợng , , 2, 2 1 s x x s 22 Một cách trực quan, khác biệt hai số trung bình mẫu tạo thông tin tối đa khác biệt thực hai số trung bình tổng thể, thực tế điều xảy nhƣ Ứớc lƣợng điểm tốt chênh lệch (12)giữa số trung bình tổng thể (x1x2) Phân phối mẫu ƣớc lƣợng khơng khó để suy ra, nhƣng khẳng định việc mà khơng có chứng Các Đặc trưng Phân phối Mẫu (x1x2), Khác biệt Hai số Trung bình Mẫu Khi mẫu ngẫu nhiên độc lập gồm n1 n2 quan sát đƣợc chọn lựa từ tổng thể với số trung bình 1và 2 phƣơng sai 2  22, phân phối mẫu chênh lệch (x1x2)sẽ có đặc trƣng sau: 1 Trung bình độ lệch chuẩn (x1x2)sẽ là: 2 ) (1   xx   và  Các nhân tố hiệu chỉnh tổng thể hữu hạn đƣợc địi hỏi 1 (21)Biên dịch: Hải Đăng 2 2 2 ) (1 2 n n x x       2 Nếu tổng thể đƣợc chọn mẫu có phân phối chuẩn, phân phối mẫu ) (x1x2 được phân phối xác chuẩn, mà khơng quan tâm đến cỡ mẫu. 3 Nếu tổng thể đƣợc chọn mẫu khơng đƣợc phân phối chuẩn, phân phối mẫu (x1x2) phân phối xấp xỉ chuẩn n 1 n lớn, 2 Định lý Giới hạn Trung tâm Do (12) số trung bình phân phối mẫu, (x1x2)là số ƣớc lƣợng không bị lệch (12) Nhƣ thế, cỡ mẫu lớn, cơng thức chung Phần 7.3 đƣợc sử dụng để lập nên ƣớc lƣợng điểm khoảng Ước lượng Điểm (12) Trị ƣớc lƣợng: (x1x2) Biên sai số: 2 2 2 ) ( 1.96 96 2 1 x n n x       Một Khoảng Tin cậy (1 - ) 100% cho (12) 2 2 2 / ) ( n n z x x      Nếu  22là chƣa đƣợc biết, hai đại lƣợng đƣợc ƣớc lƣợng xấp xỉ phƣơng sai mẫu 1 s s22 Giả định: Cả n1lẫn n2đều lớn hay với 30 VÍ DỤ 7.5 Nhận thức đƣợc phần thƣởng cho việc thi hành nghĩa vụ pháp lý tịa án thay đổi theo thời gian, cơng ty bảo hiểm muốn so sánh mức trung bình phần thƣởng cho việc thi hành nghĩa vụ pháp lý cá nhân hành với mức năm trƣớc Một mẫu ngẫu nhiên gồm n = 30 vụ kiện đƣợc chọn lựa số vụ kiện đƣợc phân xử năm số hai thời kỳ hàng năm Các số trung bình phƣơng sai mẫu phần thƣởng cho việc thi hành nghĩa vụ pháp lý (tính triệu đơla Mỹ) cho số hai năm đƣợc cho Bảng 7.4 a Hãy tìm ƣớc lƣợng điểm cho chênh lệch mức trung bình phần thƣởng cho việc thi hành nghĩa vụ pháp lý năm năm trƣớc Cho biết biên sai số (22)BẢNG 7.3 Các số trung bình phƣơng sai mẫu cho Ví dụ 7.5 Năm Cỡ Mẫu Trung bình Mẫu (triệu $) Phương sai Mẫu (triệu $)2 Hiện n1 30 x1 1.32 s12 0.9734 Trƣớc n2 30 x2 1.04 s22 0.7291 Lời giải a Ƣớc lƣợng điểm cho 12là 28 04 32 1x    x với biên sai số đƣợc cho 47 ) 2382 ( 96 30 7291 30 9734 96 96 2 2 1      n n   b Bởi mong muốn tìm khoảng tin cậy 90% cho (12), (1 - ) = 0.90  = 0.10 /2 = 0.05 z0.05 = 1.645 Khoảng tin cậy là: 2 2 2 / ) ( n n z x x      30 7291 30 9734 645 ) 04 32 (    392 28  Làm tròn hai số thập phân, ƣớc lƣợng chênh lệch phần thƣởng cho việc thi hành nghĩa vụ pháp lý rơi vào khoảng -$110,000 đến $670,000 Bạn thấy khoảng tin cậy rộng, qua cho phép xác suất phần thƣởng trung bình năm lớn $670,000 hay thấp $110,000 so với năm trƣớc Nếu công ty bảo hiểm muốn ƣớc lƣợng chênh lệch phần thƣởng trung bình với khoảng tin cậy hẹp hơn, cơng ty phải có đƣợc nhiều thơng tin cách gia tăng cỡ mẫu n 1 n 2 Sự suy luận cho mẫu nhỏ chênh lệch số trung bình tổng thể đƣợc vào giả định hai tổng thể phân phối chuẩn và, nữa, chúng sở hữu phương sai - nghĩa là, 2 2 1      Với trƣờng hợp đặc biệt này, ƣớc lƣợng khoảng tin cậy cho mẫu lớn đƣợc trị thống kê 2 2 2 1 ) ( ) ( n n x x z          mà với 2 2 1      đƣợc giản lƣợc thành (23)Biên dịch: Hải Đăng Đối với suy luận cho mẫu nhỏ, việc sử dụng trị thống kê sau tỏ hợp lý 2 2 1 ) ( ) ( n n s x x t        trong thay độ lệch chuẩn mẫu s cho độ lệch chuẩn tổng thể σ Đủ làm ta ngạc nhiên, trị thống kê có phân phối t Student giả định nói rõ đƣợc thỏa mãn Ƣớc lƣợng s đƣợc sử dụng trị thống kê t s 1 s , độ lệch 2 chuẩn cho hai mẫu, sử dụng đại lƣợng hay đại lƣợng lãng phí cả hai ƣớc lƣợng s Bởi muốn có đƣợc ƣớc lƣợng tốt có, việc sử dụng số ƣớc lƣợng mà tổng hợp đƣợc thông tin từ hai mẫu tỏ hợp lý Số ước lượng chung σ2 , sử dụng tổng bình phƣơng độ lệch chuẩn số trung bình hai mẫu, đƣợc thể phần trình bày sau Ước lượng Chung σ2 2 ) ( ) ( 1 2 1 2        n n x x x x s n i i n i i hay ) ( ) ( ) ( ) ( 2 2 1        n n s n s n s với ) ( 1 1 1    n x x s n i i ) ( 2 2 2     n x x s n i i Mẫu số công thức cho s2,(n1n2 2),đƣợc gọi số bậc tự với s2 Ngƣời ta chứng minh tốn học hay thực nghiệm giá trị kỳ vọng của số ƣớc lƣợng chung s2 với σ2 s2 số ƣớc lƣợng không bị lệch phƣơng sai tổng thể chung Cuối cùng, nhắc lại số chia tổng bình phƣơng độ lệch chuẩn lần lƣợt 1 s s22,(n11)và (n2 1)là số bậc tự cùng với hai ƣớc lƣợng độc lập σ2 Lƣu ý s2 số bình quân gia quyền s 12 2 s , với bậc tự trọng số, số ƣớc lƣợng mà sử dụng thông tin chung cho hai mẫu sở hữu (n11)(n21), hay (n1n2 2),các bậc tự Ƣớc lƣợng khoảng tin cậy cho mẫu nhỏ (12)với hệ số tin cậy (1)đƣợc cho phần trình bày sau Một Khoảng Tin cậy (1 - ) 100% cho Mẫu Nhỏ (12) 2 / 1 ) ( n n s t x (24)trong s có đƣợc từ ƣớc lƣợng chung 2, đƣợc trình bày Các giả định: Các mẫu đƣợc chọn lựa ngẫu nhiên độc lập từ tổng thể có phân phối chuẩn Những phƣơng sai tổng thể,  22, Lƣu ý tính tƣơng đồng qui trình lập nên khoảng tin cậy cho số trung bình (Phần 7.5) khác biệt hai số trung bình Trong hai trƣờng hợp, khoảng đƣợc xây dựng cách sử dụng ƣớc lƣợng điểm thích hợp sau thêm vào trừ lƣợng với t/2lần độ lệch chuẩn ước lượng ƣớc lƣợng điểm VÍ DỤ 7.6 Một hoạt động lắp ráp nhà máy chế tạo đòi hỏi xấp xỉ giai đoạn huấn luyện tháng cho nhân viên để đạt đƣợc hiệu suất tối đa Một phƣơng pháp huấn luyện đƣợc đề xuất kiểm tra đƣợc tiến hành nhằm so sánh phƣơng pháp với qui trình tiêu chuẩn Hai nhóm gồm chín nhân viên đƣợc huấn luyện thời gian ba tuần, nhóm sử dụng phƣơng pháp nhóm theo qui trình huấn luyện tiêu chuẩn Độ dài thời gian tính phút đòi hỏi cho nhân viên để lắp ráp thiết bị đƣợc ghi nhận vào lúc cuối thời kỳ ba tuần Những đại lƣợng xuất Bảng 7.4 Xây dựng ƣớc lƣợng khoảng tin cậy 95% cho khác biệt thời gian trung bình để lắp ráp sau thời kỳ huấn luyện kéo dài ba tuần qui trình tiêu chuẩn qui trình BẢNG 7.4 Dữ liệu thời gian lắp ráp cho Ví dụ 7.6 Qui trình Tiêu chuẩn Qui trình Mới 32 35 37 31 35 29 28 25 41 34 44 40 35 27 31 32 34 31 Lời giải Đặt 1và 2lần lƣợt với thời gian trung bình để lắp ráp cho qui trình lắp ráp tiêu chuẩn Ngoài ra, giả định độ biến thiên thời gian trung bình để lắp ráp chất hàm số khác biệt riêng lẻ độ biến thiên cho hai tổng thể đại lƣợng xấp xỉ Các số trung bình độ lệch chuẩn mẫu đƣợc tìm thấy cách sử dụng máy tính có chức thống kê: 4752 56 31 9441 22 35 2 1     s x s x Sau ƣớc lƣợng chung phƣơng sai chung 24 22 9 22 160 55 195 ) ( ) ( 2 2 1            n n s n s n s (25)Biên dịch: Hải Đăng Tham chiếu lại Bảng Phụ lục II, tìm thấy giá trị t với diện tích 025 /   phía bên phải (n1n22)99216bậc tự 120 025  t Thay vào công thức 2 / 1 ) ( n n s t x x     chúng ta tìm ƣớc lƣợng khoảng (hay khoảng tin cậy 95%) 9 ) 72 )( 120 ( ) 56 31 22 35 (    hay 72 66 3  Nhƣ vậy, ƣớc lƣợng khác biệt thời gian trung bình để lắp ráp, (12),rơi vào khoảng - 1.06 đến 8.38 Lƣu ý bề rộng khoảng đáng kể việc gia tăng cỡ mẫu ƣớc lƣợng lại điều nên làm Trƣớc kết luận thảo luận chúng ta, chúng tơi bình luận hai giả định mà qua qui trình suy luận đƣợc vào Những chệch hƣớng vừa phải so với giả định tổng thể sở hữu phân phối xác suất chuẩn không ảnh hƣởng nghiêm trọng đến đặc trƣng số ƣớc lƣợng hay hệ số tin cậy cho khoảng tin cậy tƣơng ứng Trái lại, phƣơng sai tổng thể phải gần qui trình đề cập có giá trị Một qui trình đƣợc trình bày Phần 8.9 việc kiểm tra giả thuyết có liên quan đến hai phƣơng sai tổng thể Một qui trình khác cho việc ƣớc lƣợng 2    tổng thể chuẩn nhƣng có phƣơng sai khơng (12 22)sẽ đƣợc trình bày Chƣơng Bài tập Các Kỹ thuật Cơ 7.24 Các mẫu ngẫu nhiên độc lập đƣợc chọn từ hai tổng thể, Các cỡ mẫu, trung bình, phƣơng sai đƣợc cho bảng kèm dƣới Tìm biên sai số cho việc ƣớc lƣợng khác biệt số trung bình tổng thể (12) Tổng thể 1 2 Cỡ mẫu 35 49 Trung bình mẫu 12.7 7.4 Phƣơng sai mẫu 1.38 4.14 (26)Tổng thể 1 2 Cỡ mẫu 64 64 Trung bình mẫu 2.9 5.1 Phƣơng sai mẫu 0.83 1.67 7.26 Tìm số bậc tự cho s2, số ƣớc lƣợng chung 2,cho cỡ mẫu sau a n1 16,n2 8 b n1 10,n2 12 c n1 15,n2 3 7.27 Tính s số ƣớc lƣợng chung cho 2, 2,cho mẫu liệu sau a 10, 4, 3.4, 22 4.9 2 1  nssn b 12, 21, 18, 22 23 2 1  nssn 7.28 Bạn đƣợc cho hai mẫu ngẫu nhiên độc lập sau đƣợc rút từ số hai tổng thể chuẩn Mẫu 12 Mẫu 14 7 Tính tốn s số ƣớc lƣợng chung 2, 2 7.29 Tìm khoảng tin cậy 95% cho (12) Bài tập 7.28 7.30 Các mẫu ngẫu nhiên độc lập gồm n1 16và n2 13quan sát đƣợc chọn từ hai tổng thể chuẩn có phƣơng sai Các số trung bình phƣơng sai mẫu đƣợc thể bảng kèm sau Tìm khoảng tin cậy 99% cho(12) Giải thích khoảng Tổng thể 1 2 Cỡ mẫu 16 13 Trung bình mẫu 34.6 32.2 Phƣơng sai mẫu 4.8 5.9 Các Ứng dụng 7.31 Một nghiên cứu đƣợc thực nhằm so sánh số trung bình gọi khẩn cấp cho cảnh sát ca làm việc tám tiếng hai quận thành phố lớn Các mẫy gồm 100 ca làm việc tám tiếng đƣợc chọn ngẫu nhiên từ hồ sơ lƣu trữ cảnh sát cho số hai khu vực đó, số gọi khẩn cấp cho cảnh sát đƣợc ghi nhận cho ca Các trị thống kê mẫu đƣợc cho bảng kèm sau Tìm khoảng tin cậy 90% cho khác biệt số trung bình gọi khẩn cấp cho cảnh sát ca làm việc hai quận thành phố Giải thích khoảng Tổng thể (27)Biên dịch: Hải Đăng 7.32 Một phƣơng pháp đƣợc đề xuất nhiều năm trƣớc cho việc giải thiếu hụt lƣợng điện sử dụng nhà máy điện hạt nhân đƣợc định vị vài dặm ngồi khơi bờ biển Bởi có quan ngại khả va chạm tàu với nhà máy (nhƣng đƣợc neo) này, ƣớc lƣợng mật độ lƣu thơng tàu khu vực cần thiết Số lƣợng tàu qua vòng 10 dặm cách vị trí nhà máy điện đƣợc đề xuất ngày, đƣợc ghi nhận cho n = 60 ngày suốt tháng Bảy tháng Tám, sở hữu trung bình phƣơng sai mẫu với: 8 7   s x a Tìm khoảng tin cậy 95% cho số trung bình tàu qua vịng 10 dặm cách vị trí nhà máy điện đƣợc đề xuất suốt thời gian ngày b Mật độ lƣu thông tàu đƣợc kỳ vọng giảm tháng mùa đông Một mẫu gồm n = 90 ghi nhận hàng ngày việc quan sát thấy tàu cho tháng Mƣời Hai, tháng Giêng tháng Hai cho ta số trung bình phƣơng sai nhƣ sau: 9 4   s x Hãy tìm khoảng tin cậy 90% cho khác biệt mật độ lƣu thơng tàu trung bình tháng mùa hè mùa đông c Tổng thể với ƣớc lƣợng bạn câu (b) nhƣ nào? Điều sai với qui trình chọn mẫu câu (a) (b)? 7.33 Một công ty chế tạo xe gần định nhân tố chủ yếu làm hạn chế doanh số bán hàng xe hay dịch vụ họ mà cách tiếp cận bán hàng mà nhân viên bán hàng áp dụng Trong kiểm tra ý kiến này, 16 nhân viên bán hàng đại lý bán hàng lớn đƣợc dịnh ngẫu nhiên vào hai nhóm gồm nhân viên nhóm Mỗi nhóm sử dụng cách tiếp cận bán hàng cứng nhắc khách hàng thời gian tháng; nhóm áp dụng cách tiếp cận bán hàng mềm dẻo, chậm thời gian Các số trung bình độ lệch chuẩn doanh số bán hàng tính đơla nhân viên bán hàng tháng cho hai nhóm đƣợc cho bảng kèm dƣới Dữ liệu Mẫu Bán hàng Cứng nhắc Bán hàng Mềm dẻo Cỡ mẫu 8 Trung bình mẫu 106,200 111,900 Độ lệch chuẩn mẫu 24,400 28,600 a Tìm khoảng tin cậy 99% cho (12), khác biệt mức doanh số bán hàng trung bình cho hai cách tiếp cận Giải thích khoảng b Liệu khoảng tin cậy đƣợc xây dựng câu (a) có chứa giá trị (12)= hay khơng? Liệu khoảng tin cậy có có khác biệt mức doanh số bán hàng trung bình cho hai cách tiếp cận khơng? Giải thích 7.34 Một phận cho vay ngân hàng tìm thấy 57 khoản cho vay mua nhà tháng Tƣ có giá trị trung bình $78,100 độ lệch chuẩn $6300 Một phân tích khoản cho vay tháng Năm, với tổng cộng 66 khoản, cho thấy giá trị trung bình $82,700 độ lệch chuẩn $7100 Giả định khoản cho vay mua nhà đại diện cho mẫu ngẫu nhiên giá trị hồ sơ xin vay mua nhà đƣợc phận dịch vụ ngân hàng chấp thuận Tìm khoảng tin cậy 98% cho khác biệt mức trung bình hồ sơ xin vay mua nhà đƣợc chấp thuận từ tháng Tƣ đến tháng Năm (28)quốc gia (GNP) cho năm tới? Những dự báo (tính tỷ lệ phần trăm) từ năm giám đốc doanh nghiệp năm chuyên gia phân tích thị trƣờng đƣợc chọn ngẫu nhiên đƣợc cho bảng sau Giám đốc doanh nghiệp 3.4 2.8 3.9 3.7 3.4 Chuyên gia phân tích thị trƣờng 3.3 3.9 3.4 3.8 4.0 Tìm khoảng tin cậy 90% cho khác biệt dự báo GNP trung bình nhà giám đốc doanh nghiệp chuyên gia phân tích thị trƣờng chứng khốn Giải thích khoảng 7.7 ƢỚC LƢỢNG MỘT TỶ LỆ NHỊ THỨC Nhiều điều tra có mục tiêu ƣớc lƣợng tỷ lệ ngƣời hay vật thể nhóm lớn mà sở hữu thuộc tính cụ thể Một điều tra nhƣ ví dụ thực tiễn cho thí nghiệm nhị thức đƣợc thảo luận Chƣơng Việc ƣớc lƣợng tỷ lệ thƣơng vụ bán hàng mà đƣợc kỳ vọng số lƣợng lớn tiếp xúc với khách hàng vấn đề thực tiễn đòi hỏi ƣớc lƣợng tham số nhị thức p Ƣớc lƣợng điểm tốt cho tham số nhị thức p số ƣớc lƣợng mà đƣợc chọn về mặt trực giác Nghĩa là, số ƣớc lƣợng p, đƣợc biểu thị ký hiệu pˆ, tổng số x những lần thành công chia cho tổng số n lần thử: n x pˆ  trong x số lƣợng lần thành công n lần thử [Dấu mũ (^) bên tham số ký hiệu đƣợc sử dụng để biểu thị ƣớc lƣợng tham số đó.] Khi nói đến “Tốt nhất”, ám là khơng bị lệch sở hữu phƣơng sai nhỏ so với số ƣớc lƣợng có khác Nhƣ lƣu ý Chƣơng 6, số ƣớc lƣợng sở hữu phân phối xác suất mà đƣợc ƣớc lƣợng xấp xỉ phân phối chuẩn Định lý Giới hạn Trung tâm Đây số ƣớc lƣợng không bị lệch cho tỷ lệ tổng thể p, với trung bình độ lệch chuẩn đƣợc thể phần trình bày sau Trung bình Độ lệch Chuẩn n pq p p E p   ˆ ) ˆ (  Sau đó, từ Phần 7,3, qui trình ƣớc lƣợng điểm khoảng cho p đƣợc cho phần trình bày sau: Ước lượng Điểm cho p Trị ƣớc lƣợng: n x pˆ  Biên sai số: n pq p 1.96 96 (29)Biên dịch: Hải Đăng Biên sai số ƣớc lƣợng đƣợc: n q p ˆˆ 96 Một Khoảng Tin cậy (1 - ) 100% cho p n q p z pˆ  /2 ˆˆ Giả định: n phải đủ lớn phân phối mẫu pˆcó thể đƣợc ƣớc lƣợng xấp xỉ một phân phối chuẩn Khoảng p2pˆ phải đƣợc chứa khoảng từ đến Khó khăn mà ta gặp phải qui trình việc tính tốn , mà có liên quan đến giá trị chƣa đƣợc biết p (và q = - p) Các bạn lƣu ý thay pˆcho tham số p độ lệch chuẩn pq /n Khi n lớn, sai số nhỏ đƣợc áp dụng thay Thực tế độ lệch chuẩn thay đổi p thay đổi Tính chất quan sát thấy Bảng 7.5, pqđƣợc ghi nhận cho nhiều giá trị p Lƣu ý pq thay đổi p thay đổi, đặc biệt p tiến gần đến 0.5 BẢNG 7.5 Một số giá trị tính tốn pq p pq 0.5 0.50 0.4 0.49 0.3 0.46 0.2 0.46 0.1 0.40 VÍ DỤ 7.7 Một mẫu ngẫu nhiên gồm n = 100 nhà bán buôn mua ống nhựa polyvinyl cho thấy 59 ngƣời có kế hoạch gia tăng việc mua hàng năm tới Hãy ƣớc lƣợng tỷ lệ p nhà bán buôn tổng thể tất nhà bán bn ống nhựa polyvinyl mà có kế hoạch gia tăng việc mua hàng năm tới, tìm biên sai số ƣớc lƣợng Tìm khoảng tin cậy 95% cho p Lời giải Ƣớc lƣợng điểm pˆ x/n59/1000.59,và biên sai số ƣớc lƣợng 096 100 ) 41 )( 59 ( 96 96 96 1 ˆ    n pq pMột khoảng tin cậy 95% cho p n q p pˆ 1.96 ˆˆ Thay vào công thức này, có đƣợc ) 049 ( 96 59 0  hay 096 59 (30)Nhƣ vậy, ƣớc lƣợng tỷ lệ p nhà bán bn mà có kế hoạch gia tăng việc mua hàng nằm khoảng 0.494 đến 0.686, với hệ số tin cậy 0.95 Bài tập Các Kỹ thuật Cơ 7.36 Một mẫu ngẫu nhiên gồm n = 900 quan sát từ tổng thể nhị thức tạo x = 655 lần thành công Hãy tìm khoảng tin cậy 99% cho p, giải thích khoảng 7.37 Một mẫu ngẫu nhiên gồm n = 300 quan sát từ tổng thể nhị thức tạo x = 263 lần thành cơng Hãy tìm khoảng tin cậy 90% cho p, giải thích khoảng 7.38 Một mẫu ngẫu nhiên gồm n = 500 quan sát từ tổng thể nhị thức tạo x = 140 lần thành cơng Hãy tìm khoảng tin cậy 95% cho p, giải thích khoảng 7.39 Giả định số lần thành công quan sát đƣợc n = 500 lần thử thí nghiệm nhị thức 27 Tìm khoảng tin cậy 95% cho p Tại khoảng tin cậy hẹp so với khoảng tin cậy Bài tập 7.38? Các Ứng dụng 7.40 Ngày có nhiều đàn ơng phụ nữ thực lựa chọn mua hàng mà có thời đƣợc nhƣờng cho ngƣời khác phái mình, hầu hết hộ gia đình có nhân, ngƣời chồng ngƣời vợ có tiếng nói ngang việc thực lần mua sắm lớn Trong báo đăng tạp chí American Demographics (Nhân học Hoa Kỳ),Shannon Dorch (1994) đề xuất cơng ty quảng cáo có lẽ phải thay đổi nơi mà họ quảng cáo số mặt hàng định mức độ quảng cáo nên Rõ ràng là, việc quảng cáo xe cần đến đƣợc với phụ nữ Xấp xỉ khoảng 80% ông chồng bà vợ đồng ý họ có tiếng nói ngang việc mua nhà mới, 58% đàn ơng 56% phụ nữ đồng tình họ có tiếng nói ngang việc mua xe Giả định tỷ lệ phần trăm đƣợc cỡ mẫu 3000 a Tìm ƣớc lƣợng khoảng tin cậy 95% cho tỷ lệ ơng chồng mà trí họ lẫn bà vợ có tiếng nói ngang việc mua nhà (Cũng ƣớc lƣợng số cho tỷ lệ phần trăm bà vợ mà đồn ý họ lẫn ơng chồng có tiếng nói ngang việc mua nhà.) b Tìm khoảng tin cậy 95% cho tỷ lệ phần trăm ông chồng mà đồng ý vợ họ có tiếng nói ngang với họ việc mua sắm xe cho gia đình c Ƣớc lƣợng tỷ lệ phần trăm bà vợ mà đồng tình chồng họ có tiếng nói ngang việc mua xe cho gia đình 7.41 Cơng ty Ford Motor đặt hàng nghiên cứu để xác định lĩnh vực nơi mà nhà lãnh đạo chun nghiệp u cầu vấn đề sách mơi trƣờng Trong số 7000 nhà lãnh đạo kinh doanh, giáo dục, báo chí, phủ ủng hộ mơi trƣờng tham gia, 80% nghĩ công nghiệp phải chịu trách nhiệm phá hủy dọn dẹp môi trƣờng hành động của ngành (Opinions ’90, tháng Sáu năm 1990, trang 64.) a Xác định ƣớc lƣợng điểm giá trị p với biên sai số 95% Liệu sai số có nhỏ ba điểm phần trăm khơng? (31)Biên dịch: Hải Đăng 7.42 Trong điều tra gần 1600 hộ gia đình thu nhập cao năm vùng đô thị, 24% ngƣời đàn ơng tự xem ngƣời mua sắm hàng tạp hóa cho hộ gia đình mình, áo quần cho cá nhân (Dholakia, 1994) Mặc dù ngƣời đàn ông mua hàng điều tra ngƣời có trình độ hiểu biết máy tính cao (87% có máy tính nhà), có 22% nói việc mua hàng đƣợc vi tính hóa mang lại thỏa mãn a Tìm ƣớc lƣợng khoảng tin cậy 90% cho tỷ lệ phần trăm ngƣời đàn ông mà tự xem ngƣời mua sắm hàng tạp hóa cho hộ gia đình mình, áo quần cho cá nhân b Tìm biên sai số việc ƣớc lƣợng tỷ lệ ngƣời đàn ơng mua hàng có trình độ hiểu biết cao máy tính mà nhận thấy việc mua hàng đƣợc vi tính hóa mang lại thỏa mãn 7.43 Trong điều tra năm 1993 Hiệp hội Dinh dƣỡng Hoa Kỳ công ty Kraft General Food liên quan đến dinh dƣỡng thói quen ăn uống, 54% ngƣời trả lời xem dinh dƣỡng quan trọng, 52% thói quen ăn uống thay đổi, 44% nói họ làm tất để có chế độ ăn uống lành mạnh (“Crunching Numbers”, 1994) Nếu 1000 ngƣời trả lời tham gia vào điều tra này, ƣớc lƣợng tỷ lệ phần trăm tổng thể tƣơng ứng xác đến đâu? Tìm biên sai số cho ƣớc lƣợng 7.44 Ngành công nghiệp quảng cáo cố gắng bán sản phẩm cách tự thể tình với ý định thu hút phân khúc thị trƣờng khác Trừ phi đƣợc dự định nhắm cách cụ thể đến cơng dân lớn tuổi, hầu hết chƣơng trình quảng cáo đề cao đến ngƣời trƣởng thành trẻ tuổi, động (Darnay, 1994) Trong điều tra 1002 ngƣời Mỹ độ tuổi từ 18 trở lên, câu trả lời cho câu hỏi “Bạn nghĩ ngƣời sau đƣợc đại diện cách công nhƣ chƣơng trình quảng cáo?” đƣợc tóm tắt bảng sau Bộ phận Dân chúng Chưa đại diện mức Ngƣời khuyết tật 0.57 Ngƣời gốc Tây Ban Nha Bồ Đào Nha 0.41 Ngƣời từ 50 tuổi trở lên 0.37 Ngƣời da đen 0.29 Thiếu niên/ngƣời trƣởng thành trẻ tuổi 0.09 a Tìm biên sai số cho ƣớc lƣợng tỷ lệ ngƣời Mỹ mà cảm thấy ngƣời khuyết tật chƣa đƣợc đại diện mức quảng cáo b Biên sai số với tỷ lệ ngƣời Mỹ mà cảm thấy thiếu niên ngƣời trƣởng thành trẻ tuổi chƣa đƣợc đại diện mức quảng cáo bao nhiêu? Tại biên sai số trƣờng hợp khác với biên sai số câu (a)? c Tính ƣớc lƣợng khoảng tin cậy 95% cho tỷ lệ ngƣời Mỹ mà cảm thấy ngƣời từ 50 tuổi trở lên chƣa đƣợc đại diện mức chƣơng trình quảng cáo 7.8 ƢỚC LƢỢNG SỰ KHÁC BIỆT GIỮA HAI TỶ LỆ NHỊ THỨC (32)dẫn đầu cho chức thị trƣởng Một cách trực giác, khác biệt hai tỷ lệ mẫu cung cấp thông tin tối đa tỷ lệ tổng thể tƣơng ứng Giả định hai tổng thể nhị thức có tham số lần lƣợt p 1 p Những 2 mẫu ngẫu nhiên độc lập bao gồm n 1 n lần thử đƣợc rút từ tổng thể tƣơng ứng, 2 ƣớc lƣợng ˆp 1 ˆp đƣợc tính tốn Phân phối mẫu chênh lệch 2 ˆp -1 ˆp đƣợc làm 2 rõ mà khơng có chứng phần trình bày sau Các Đặc trưng Phân phối Mẫu Chênh lệch ( ˆp -1 ˆp2) Giữa Hai Tỷ lệ Mẫu Giả định mẫu độc lập ngẫu nhiên gồm n1và n2 quan sát đƣợc chọn lựa từ tổng thể nhị thức với tham số lần lƣợt làp1và p2 Phân phối mẫu khác biệt giữa tỷ lệ mẫu          2 1 ˆ ) ˆ ( n x n x p p sẽ có đặc trƣng sau đây: 1 Trung bình độ lệch chuẩn (pˆ1pˆ2)sẽ 2 ) ˆ ˆ (p1p2  pp  2 1 ) ˆ ˆ ( n q p n q p p p     2 Phân phối xác suất (pˆ1pˆ2)có thể đƣợc ƣớc lƣợng xấp xỉ phân phối chuẩn n1và n2là lớn, Định lý Giới hạn Trung tâm Khi sử dụng phân phối chuẩn để ƣớc lƣợng xấp xỉ xác suất nhị thức , khoảng 1 2 (ˆ ˆ ) 2 ) ˆ ˆ (pp   pp phải đƣợc chứa bên khoảng (pˆ1pˆ2), mà thay đổi từ -1 đến từ đến 1, nhƣ trƣờng hợp tỷ lệ Bởi (pˆ1pˆ2)là số ƣớc lƣợng không bị lệch (p1 p2), số ƣớc lƣợng điểm 2 p p  đƣợc thể phần trình bày sau Ước lượng Điểm (p1 - p2) Trị ƣớc lƣợng: (pˆ1pˆ2) Biên sai số: 2 2 1 ) ˆ ˆ ( 1.96 96 n q p n q p p p   [Lưu ý: Các ƣớc lƣợng ˆp1và ˆp2phải đƣợc thay cho p1và p2để ƣớc lƣợng biên sai số.] (33)Biên dịch: Hải Đăng Một Khoảng Tin cậy (1 - ) 100% cho Mẫu Lớn (p1 - p2) 2 2 1 / ˆ ˆ ˆ ˆ ) ˆ ˆ ( n q p n q p z p p     Giả định: n1và n2phải đủ lớn phân phối mẫu (pˆ1pˆ2)có thể đƣợc ƣớc lƣợng xấp xỉ phân phối chuẩn Khoảng 1 2 (ˆ ˆ ) 2 ) ˆ ˆ (pp   pp phải đƣợc chứa khoảng -1 đến VÍ DỤ 7.8 Một công ty lớn bán lẻ quần áo tiến hành nghiên cứu nhằm so sánh tính hiệu quảng cáo báo số hai thành phố lớn Một trang quảng cáo lớn rộ đƣợc thực tờ báo số hai thành phố lớn Ngay sau đó, tổ chức nghiên cứu tiếp thị tiến hành điều tra qua điện thoại 1000 ngƣời lớn đƣợc chọn ngẫu nhiên sống khu vực ngoại có thu nhập trung bình cao số thành phố nhằm xác định tỷ lệ mà đọc trang quảng cáo cơng ty bán lẻ Các tỷ lệ mẫu pˆ10.18và pˆ2 0.14 Hãy tìm khoảng tin cậy 95% cho chênh lệch tỷ lệ ngƣời lớn hai tổng thể mà đọc trang quảng cáo Lời giải Một khoảng tin cậy 95% cho chênh lệch (p1 p2)trong tỷ lệ ngƣời lớn mà đọc trang quảng cáo công ty bán lẻ 2 2 1 / ˆ ˆ ˆ ˆ ) ˆ ˆ ( n q p n q p z p p     trong  0.5và z/2 z0.0251.96 Thay giá trị này, với ƣớc lƣợng 18 ˆ1 p pˆ2 0.14, vào cơng thức tính khoảng tin cậy, tìm khoảng tin cậy 1000 ) 86 )( 14 ( 1000 ) 82 )( 18 ( 96 ) 14 18 (    hay 321 04  Nhƣ vậy, ƣớc lƣợng khác biệt tỷ lệ độc giả trang quảng cáo nằm khoảng từ 0.0079 đến 0.0721 Nếu mong muốn thể khác biệt tỷ lệ phần trăm, nhân tỷ lệ cho 100 Sau nói ƣớc lƣợng khác biệt tỷ lệ phần trăm ngƣời lớn đọc trang quảng cáo hai khu vực tiếp thị nằm khoảng 0.79% 7.21% Bài tập Các Kỹ thuật Cơ 7.45 Các mẫu gồm n1 500và n2 500 quan sát đƣợc chọn từ tổng thể nhị thức 2, 120 1 (34)7.46 Các mẫu gồm n1 800và n2 640 quan sát đƣợc chọn từ tổng thể nhị thức 2, 337 1 x x2 374đƣợc quan sát a Tìm khoảng tin cậy 90% cho chênh lệch (p1p2)trong hai tham số tổng thể Giải thích khoảng b Các giả định mà bạn cần đặt khoảng tin cậy có ý nghĩa? 7.47 Các mẫu gồm n11265và n2 1688 quan sát đƣợc chọn từ tổng thể nhị thức 2, x1 849và x2 910đƣợc quan sát a Tìm khoảng tin cậy 99% cho chênh lệch (p1p2)trong hai tham số tổng thể Giải thích khoảng b Các giả định mà bạn cần đặt khoảng tin cậy có ý nghĩa? 7.48 Các mẫu gồm n1314và n2 207 quan sát đƣợc chọn từ tổng thể nhị thức 2, 108 1 x x2 102đƣợc quan sát a Tìm khoảng tin cậy 95% cho chênh lệch (p1p2)trong hai tham số tổng thể Giải thích khoảng b Các giả định mà bạn cần đặt khoảng tin cậy có ý nghĩa? Các Ứng dụng 7.49 Một điều tra ngân hàng khoản chi trả thẻ tín dụng trễ hạn tìm thấy tỷ lệ trễ hạn tháng cho trƣớc 414 chủ doanh nghiệp nhỏ 5.8% so với 3.6% 1029 nhà hoạt động chuyên nghiệp Giả định liệu cho hai loại hình ngƣời dùng thẻ đƣợc xem nhƣ mẫu ngẫu nhiên độc lập tài khoản hàng tháng qua khoảng thời gian tƣơng đối dài, ví dụ, hai năm Tìm khoảng tin cậy 95% tỷ lệ trễ hạn cho hai loại hình ngƣời sử dụng thẻ tín dụng 7.50 Trong suốt phục hồi từ thời kỳ đình trệ kinh tế vào năm đầu thập niên 1990, điều tra Conference Board tiến hành đƣợc sử dụng để đo kiểu hình hành vi tiêu dùng sức khỏe dài hạn kinh tế, với câu hỏi chủ đề dàn trải từ kế hoạch mua sắm hộ gia đình đến điều kiện việc làm địa phƣơng (“Consumer Confidence (Niềm tin Người tiêu dùng)”, 1994) Một thăm dò ý kiến vào tháng Bảy năm 1994 cho thấy 10% số 5000 hộ gia đình tồn quốc kỳ vọng điều kiện kinh doanh trở nên tồi tệ hơn, thay đổi có chiều hƣớng gia tăng từ số 8% 5000 hộ gia đình tháng trƣớc a Xây dựng ƣớc lƣợng khoảng tin cậy 95% khác biệt tỷ lệ ngƣời trả lời mà kỳ vọng điều kiện kinh doanh trở nên tồi tệ b Giả định làm tảng cho giá trị khoảng tin cậy đƣợc xây dựng câu (a)? (35)Biên dịch: Hải Đăng 7.52 Những ảnh hƣởng theo độ tuổi không xảy điều mà bạn xem thấy tivi mà nơi mà bạn xem tivi Một nghiên cứu (Darnay, 1994, trang 784) cho thấy ngƣời Mỹ lớn tuổi xem tivi giƣờng ngủ so với ngƣời trẻ tuổi thƣờng xem tivi phòng ăn nhiều Với liệu cho bảng, giả định cỡ mẫu cho nhóm tuổi 100 Khu vực 25 đến 44 45 đến 69 60 trở lên Phòng khách/phòng sinh hoạt chung/phòng làm việc 95% 95% 93% Phòng ngủ 58% 57% 45% Nhà bếp 12% 20% 20% Phịng ăn 10% 10% 10% a Tìm ƣớc lƣợng khoảng tin cậy 95% khác biệt tỷ lệ ngƣời Mỹ độ tuổi từ 45 đến 69 ngƣời từ 60 tuổi trở lên mà xem tivi phòng ăn b Ƣớc lƣợng khác biệt tỷ lệ ngƣời Mỹ nhóm tuổi từ 25 đến 59 ngƣời nhóm độ tuổi từ 60 trở lên mà xem tivi phòng khách, phòng sinh hoạt chung hay phịng riêng làm việc tìm biên sai số ƣớc lƣợng [Gợi ý:Tỷ lệ cho nhóm tuổi từ 25 đến 59 bình quân giản đơn tỷ lệ riêng lẻ dựa cỡ mẫu 2000.] 7.9 CHỌN CỠ MẪU Sự thiết kế thí nghiệm chất kế hoạch nhằm mua sắm lƣợng thông tin Thông tin này, giống nhƣ hàng hóa khác, có đƣợc với giá khác tùy thuộc vào cách thức mà qua có đƣợc liệu Một số đại lƣợng chứa đựng lƣợng thông tin lớn liên quan đến tham số mà ta quan tâm: đại lƣợng khác chứa đƣng thơng tin hay hồn tồn khơng có thơng tin Bởi sản phẩm việc nghiên cứu thông tin, phải cố gắng mua đƣợc thơng tin với phí tổn thấp Qui trình chọn mẫu, hay thiết kế thí nghiệm (nhƣ thƣờng đƣợc gọi), ảnh hƣởng đến số lƣợng thơng tin đại lƣợng Qui trình này, với cỡ mẫu n, kiểm soát tổng khối lƣợng thông tin liên quan mẫu Với số ngoại lệ, quan tâm đến tình chọn mẫu đơn giản - chọn mẫu ngẫu nhiên từ tổng thể tƣơng đối lớn - tập trung ý vào việc chọn lựa cỡ mẫu n Nhà nghiên cứu tạo đƣợc tiến triển việc hoạt định thí nghiệm trƣớc gặp phải vấn đề chọn cỡ mẫu Thật vậy, có lẽ câu hỏi đƣợc đặt thƣờng xuyên nhất nhà thống kê Có đại lượng nên đưa vào mẫu? Thật không may, nhà thống kê trả lời câu hỏi đƣợc khơng biết có thơng tin mà ngƣời làm thí nghiệm mong muốn mua đƣợc Chắc chắn tổng khối lƣợng thông tin mẫu ảnh hƣởng đến mức độ tốt phƣơng pháp suy luận phải đƣợc ngƣời làm thí nghiệm xác định cụ thể Đặc biệt liên quan đến ƣớc lƣợng, muốn biết mức độ xác mà ngƣời làm thí nghiệm mong muốn số ƣớc lƣợng Sự xác đƣợc định rõ cách xác định cụ thể mức giới hạn biên sai số ƣớc lƣợng (36)vì xấp xỉ 95% trung bình mẫu nằm khoảng 1.96trong chọn mẫu lặp lại, nên yêu cầu 1.96 với 0.06 (xem Hình 7.8) Sau 06 96 ˆx hay 06 96 1  nGiải n, có đƣợc 2 06 96 1         n hay 111 1067   n HÌNH 7.8 Phân phối mẫu xấp xỉ xcho mẫu lớn Nếu biết σ, thay giá trị vào cơng thức tìm n Nếu σ chƣa đƣợc biết, sử dụng ƣớc lƣợng xấp xỉ tốt sẵn có, ƣớc lƣợng s có đƣợc từ mẫu trƣớc hay từ kiến thức dãy mà đại lƣợng rơi vào Bởi dãy xấp xỉ với 4σ (Qui tắc Thực chứng), phần tƣ dãy cung cấp giá trị xấp xỉ cho σ Trong ví dụ chúng ta, sử dụng độ lệch chuẩn mẫu Ví dụ 7.1, mà cung cấp ƣớc lƣợng xác mức chấp nhận đƣợc của σ với s = 0.24 Vậy 5 61 ) 24 , )( 111 1067 ( 111 1067 2     n hay n = 62 Sử dụng cỡ mẫu n = 62, chắn mức chấp nhận đƣợc (với xác suất xấp xỉ với 0.95) ƣớc lƣợng nằm khoảng 1.96ˆx0.06 lãi suất cho vay thực tế ngân hàng Lời giải n = 62 xấp xỉ phải sử dụng giá trị xấp xỉ cho σ tính tốn giá trị n Mặc dù việc làm phiền bạn, phƣơng pháp tốt có thể có việc lựa chọn cỡ mẫu, điều chắn tốt việc ƣớc đoán x  96 ) (x f xx  96 (37)Biên dịch: Hải Đăng Ƣớc lƣợng μ với khoảng tin cậy (1 - )100% mà bề rộng phải nhỏ W = 2B, B giới hạn tƣơng đƣơng biên sai số ƣớc lƣợng, yêu cầu n z B /2  mà đến lƣợt đòi hỏi cỡ mẫu lớn hay với 2 2 / B z n   Khi cỡ mẫu tạo ra, n nhỏ 30 ƣớc lƣợng s σ đƣợc sử dụng tính tốn, phƣơng trình phải đƣợc giải cách sử dụng giá trị ghi bảng t/2thay 2 /  z Bậc tự với t/2đƣợc qui định n0 - Qui trình đƣợc lặp lặp lại nhiều lần cách sử dụng giá trị trƣớc n, lời giải cỡ mẫu khơng cịn thay đổi Ví dụ, giới hạn đƣợc thay đổi thành 0.1, cỡ mẫu yêu cầu lớn hay với 13 22 ) 24 ( 96 1         n hay n = 23, nhỏ 30 Sử dụng t0.025với 23 - = 22 bậc tự do, giá trị phù hợp t 2.074 78 24 ) 24 ( 074 2         n Bây n = 25, d.f = 24, t0.025= 2.064, 54 24 ) 24 ( 064 2         n Bởi cỡ mẫu giống với cỡ tìm lần lặp lại trƣớc, nên lấy n lớn hay với 25 Phƣơng pháp chọn cỡ mẫu cho qui trình ƣớc lƣợng đƣợc thảo luận phần trƣớc quán với phƣơng pháp đƣợc mô tả Qui trình Chọn lựa Cỡ mẫu Xác định tham số đƣợc ƣớc lƣợng độ lệch chuẩn số ƣớc lƣợng điểm Sau thực nhƣ sau: 1 Chọn B, giới hạn biên sai số, hệ số tin cậy (1) 2 Giải phƣơng trình sau cho cỡ mẫu n 2 /  z x (độ lệch chuẩn số ƣớc lƣợng) = B trong z/2là giá trị z có diện tích /2 phía bên phải 3 Nếu giá trị tạo n nhỏ 30 ƣớc lƣợng đƣợc sử dụng, giá trị z/2đƣợc thay t/2và qui trình đƣợc lặp lặp lại cỡ mẫu không thay đổi (38)Chúng ta minh họa ví dụ VÍ DỤ 7.9 Trong Ví dụ 7.7, điều tra 100 đại lý mua hàng tạo ƣớc lƣợng tỷ lệ ngƣời bán buôn ống nƣớc polyvinyl mà có kế hoạch gia tăng mua hàng năm tới Biên sai số, 0.096, tƣơng đối lớn Giả định tổ chức tiếp thị tiến hành điều tra đƣợc yêu cầu phải thực điều tra đạt đƣợc ƣớc lƣợng xác giới hạn 0.04 với xác suất với 0.90 Xấp xỉ có nhà bán bn phải tính đến điều tra này? Lời giải Đối với ví dụ cụ thể này, giới hạn B biên sai số 0.04 Bởi hệ số tin cậy  ) 0.90, (   phải với 0.10 /2 0.05 Giá trị z tƣơng ứng với diện tích bằng với 0.05 đoạn cuối phân phối z z0.05 1.645.Sau yêu cầu 04 645 1 pˆ  hay 04 645 1  n pq Để giải tốn tìm n, phải thay giá trị xấp xỉ p vào phƣơng trình Chúng ta sử dụng ƣớc lƣợng pˆ 0.59dựa vào mẫu gồm n = 100; chúng ta muốn chắn mẫu đủ lớn, sử dụng p0.5 (thay 5  p sẽ tạo lời giải lớn có cho n, giá trị tối đa pq xảy p = q = 5) Chúng ta thay p0.5 Sau 04 ) )( ( 645 1  n hay 56 20 04 ) )( 645 (   n và 7 422 ) 56 20 (   n Vì thế, tổ chức tiếp thị phải đƣa xấp xỉ 423 nhà bán bn vào điều tra muốn ƣớc lƣợng tỷ lệ p xác giới hạn 0.04 VÍ DỤ 7.10 Một giám đốc nhân mong muốn so sánh tính hiệu hai phƣơng pháp huấn luyện nhân viên công nghiệp nhằm thực hoạt động lắp ráp Một số lƣợng nhân viên đƣợc chia thành hai nhóm nhau, nhóm thứ nhận đƣợc phƣơng pháp huấn luyện nhóm thứ hai đƣợc huấn luyện phƣơng pháp Mỗi nhóm thực hoạt động lắp ráp này, độ dài thời gian lắp ráp đƣợc ghi nhận Ngƣời ta kỳ vọng đại lƣợng cho hai nhóm có khoảng xấp xỉ phút Để cho ƣớc lƣợng khác biệt thời gian trung bình để lắp ráp xác giới hạn phút với xác suất với 0.95, cần phải đƣa cơng nhân vào nhóm huấn luyện? (39)Biên dịch: Hải Đăng 96 2 2 2 1   n n   Bởi mong muốn n với 1 n , đặt 2 n1n2 n có đƣợc phƣơng trình 1 96 2 2 1   n n   Nhƣ đƣợc lƣu ý trên, độ biến thiên (dãy = range = max - min) phƣơng pháp lắp ráp xấp xỉ nhƣ nhau, 12 22 2.Bởi dãy này, với phút, xấp xỉ với 4 , 8 4  và 2   Thay giá trị cho 1và 2trong phƣơng trình trên, có đƣợc 1 ) ( ) ( 96 2   n n hay 1 96 1  n và 8 96  n Giải ra, có n = 31 Nhƣ nhóm nên có xấp xỉ n = 31 công nhân Bảng 7.6 cung cấp tóm tắt cơng thức đƣợc sử dụng để xác định cỡ mẫu cần thiết cho ƣớc lƣợng với giới hạn cho trƣớc biên sai số B hay bề rộng khoảng tin cậy W(W = 2B) Lƣu ý ƣớc lƣợng p cơng thức cỡ mẫu sử dụng 2  pq,trong khi ƣớc lƣợng p1p2,thì cơng thức cỡ mẫu sử dụng 1222  p1q1 p2q2 BẢNG 7.6 Các cơng thức tính cỡ mẫu Tham số Trị Ước lượng Cỡ Mẫu Giả định x 2 2 2 / B z n   2    x1x2 2 2 2 2 / ( ) B z (40)p           2 / 2 / ) 25 ( B z n hay B pq z n    p p ppˆ1 pˆ2            2 / 2 1 2 / ) 25 ( ) ( B z n hay B q p q p z n   2       p p n n n n n n Bài tập Các Kỹ thuật Cơ 7.53 Giả định bạn mong muốn ƣớc lƣợng số trung bình tổng thể từ mẫu ngẫu nhiên gồm n quan sát, thí nghiệm trƣớc cho  12.7 Nếu mong muốn ƣớc lƣợng  đƣợc điều chỉnh nằm giới hạn sai số 1.6 với xác suất với 0.95, có quan sát nên đƣợc đƣa vào mẫu bạn? 7.54 Giả định bạn mong muốn ƣớc lƣợng tham số nhị thức p xác giới hạn 0.04 với xác suất với 0.95 Nếu bạn nghi ngờ p với giá trị khoảng từ 0.1 đến 0.3 bạn muốn chắn mẫu đủ lớn, n phải lớn bao nhiêu? [Gợi ý: Khi tính tốn pˆ, sử dụng giá trị p khoảng 0.1 < p < 0.3 mà cho ra cỡ mẫu lớn nhất.] 7.55 Các mẫu ngẫu nhiên độc lập gồm n1 n2 n quan sát đƣợc chọn từ số hai tổng thể, Nếu bạn mong muốn ƣớc lƣợng khác biệt hai số trung bình tổng thể xác giới hạn 0.17 với xác suất với 0.90, n 1 n nên lớn bao nhiêu? Giả định 2 rằng bạn biết 22 27.8 2 1    7.56 Các mẫu ngẫu nhiên độc lập gồm n1 n2 n quan sát đƣợc chọn từ số hai tổng thể, Nếu bạn mong muốn ƣớc lƣợng khác biệt hai số trung bình tổng thể xác giới hạn 0.05 với xác suất với 0.98, n nên lớn bao nhiêu? (Giả định bạn khơng có thông tin trƣớc giá trị p 1 p , nhƣng bạn muốn chắn bạn 2 có số phù hợp quan sát mẫu.) Các Ứng dụng (41)Biên dịch: Hải Đăng kỳ vọng vào khoảng $100,000 Nếu nhà điều tra mong muốn ƣớc lƣợng giá trị tài sản chấp xác giới hạn $5000, mẫu họ phải lớn bao nhiêu? 7.58 Trong Bài tập 7.34, ƣớc lƣợng khác biệt giá trị trung bình khoản cho vay mua nhà ngân hàng đƣợc xử lý tháng Tƣ so với tháng Năm Giả định ngân hàng mong muốn có ƣớc lƣợng xác khác biệt này, ví dụ, ƣớc lƣợng xác giới hạn $1000 với xác suất 0.95 Có khoản cho vay mua nhà phải đƣợc đƣa vào mẫu? (Giả định cỡ mẫu cho hai tháng nhau.) 7.59 Một cơng ty kiểm tốn mong muốn ƣớc lƣợng sai số trung bình tài khoản khoản phải thu cho công ty cung cấp hệ thống ống nƣớc xác giới hạn $20 với xác suất 0.99 Một mẫu nhỏ trƣớc gợi ý sai số tài khoản sở hữu độ lệch chuẩn xấp xỉ với $58 Nếu cơng ty kiểm tốn mong muốn ƣớc lƣợng sai số trung bình tài khoản xác giới hạn $20, có tài khoản phải đƣợc chọn mẫu? Mẫu phải sở hữu (các) thuộc tính nào? 7.60 Một doanh nghiệp sản xuất sản phẩm thực phẩm thuê công ty nghiên cứu thị trƣờng để chọn mẫu hai thị trƣờng, I II, nhằm so sánh tỷ lệ ngƣời tiêu dùng mà ƣa thích đồ ăn tối đông lạnh doanh nghiệp sản phẩm đối thủ cạnh tranh Thông tin trƣớc khơng sẵn có độ lớn tỷ lệ p 1 p Nếu công ty sản xuất sản phẩm thực 2 phẩm mong muốn ƣớc lƣợng khác biệt tỷ lệ ngƣời tiêu dùng mà ƣa thích sản phẩm họ mức xác giới hạn 0.04 với xác suất với 0.95, có khách hàng phải đƣợc chọn mẫu thị trƣờng? Các mẫu phải đƣợc thu thập cách nào? 7.61 Quay lại Bài tập 7.41 Nếu Công ty Ford Motor mong muốn ƣớc lƣợng tỷ lệ phần trăm ngƣời lãnh đạo chuyên nghiệp mà cảm thấy ngành công nghiệp phải chịu trách nhiệm cho phá hủy dọn dẹp môi trƣờng gây hành động họ xác giới hạn 0.01 với xác suất 0.99, cơng ty cần thực mẫu lớn bao nhiêu? Giả định khơng có kiến thức trƣớc giá trị p 7.62 Quay lại Bài tập 7.61 a Tìm cỡ mẫu phù hợp ta biết p nằm khoảng từ 0.7 đến 0.9 b Liệu cỡ mẫu tìm đƣợc câu (a) lớn hay nhỏ cỡ mẫu tìm thấy Bài tập 7.61? Bạn giải thích khác biệt này? 7.63 Các nhóm sắc tộc Hoa Kỳ mua lƣợng khác nhiều loại sản phẩm thực phẩm ăn sắc tộc (Rickard, 1994) Những ngƣời châu Á mua rau đóng hộp nhóm khác, ngƣời gốc Tây Ban Nha Bồ Đào Nha mua dầu ăn nhiều Một nhà nghiên cứu quan tâm đến phân khúc thị trƣờng cho hai nhóm muốn ƣớc lƣợng tỷ lệ hộ gia đình chọn lựa số nhãn hiệu sản phẩm khác Nếu nhà nghiên cứu mong muốn ƣớc lƣợng nằm giới hạn 0.03 với xác suất 0.95, ta phải đƣa hộ gia đình vào mẫu? QUAY LẠI NGHIÊN CỨU ĐIỂN HÌNH 7.10 TÍNH HỢP LÝ PHÍA SAU SỰ KHƠNG THỪA NHẬN KHOẢN $3.4 TRIỆU CỦA IRS (42)Thuế Nội Địa (IRS) Trong phần thảo luận sau đây, giải thích sở cho không thừa nhận IRS phần yêu sách Cả nghiên cứu điển hình lẫn giải thích phần đƣợc thông tin chứa báo W L Felix, Jr., R S Roussey (“Statistical Inference and the IRS (Sự Suy luận Thống kê Sở Thuế Nội Địa)”, Journal of Accountancy, tháng Sáu năm 1985) Để nhớ lại chi tiết trƣờng hợp này: doanh nghiệp yêu cầu thừa nhận $6 triệu năm $3.8 triệu năm tới cho thay chi phí sửa chữa Những số liệu đƣợc “các kỹ thuật chọn mẫu ngẫu nhiên”, cụ thể là, mẫu gồm 350 khoản mục năm 520 năm IRS khơng phản đối qui trình chọn mẫu này, cỡ mẫu, hay việc sử dụng suy luận thống kê để ƣớc lƣợng tổng yêu cầu thừa nhận thay Tuy nhiên, IRS “tham khảo tiêu chuẩn đƣợc viết thành sách cho việc chọn mẫu thống kê mà cho phép biểu thức toán học biên sai số với mẫu (sự tính tốn sai số mẫu)” Hơn nữa, IRS giữ quan điểm cơng ty “ắt nên áp dụng sai số mẫu để tính tốn giới hạn thấp thừa nhận chi phí sửa chữa đƣợc qui định cho phép phận quản lý nói, ví dụ, „Chúng tơi chắn 95% thừa nhận chi phí sửa chữa đƣợc qui định cho phép tối thiểu X đôla.‟ ” Trên thực tế, IRS tính tốn giới hạn thấp sử dụng nhƣ thay cho chi phí sửa chữa mà quan cho phép Để hiểu quan điểm IRS liên quan đến không thừa nhận này, cần chuyển dịch hai câu trích dẫn sang cách diễn đạt chƣơng Trong câu trích dẫn thứ nhất, IRS khẳng định doanh nghiệp phải cung cấp thông tin “sai số mẫu” Nói sai số mẫu, giả định quan ám sai số ƣớc lƣợng Giải thích câu trích dẫn thứ hai, giả định IRS có ý muốn nói phận quản lý phải đặt giới hạn tin cậy thấp 95% tổng chi phí sửa chữa IRS thực tính tốn sau chọn LCL chi phí sửa chữa tối đa mà cơ quan cho phép Mặc dù Felix Roussey khơng giải thích chi tiết qui trình chọn mẫu ƣớc lƣợng đƣợc sử dụng nghiên cứu điển hình này, giải thích cách thức mà IRS đến giới hạn tin cậy thấp cho thừa nhận phí tổn sửa chữa dựa việc chọn mẫu ngẫu nhiên Chúng ta giả định tổng số lƣợng chi phí sửa chữa cho năm N, cho mục đích minh họa giả định N = 100,000 Một mẫu ngẫu nhiên n = 500 chi phí sửa chữa đƣợc chọn từ số 100,000 tổng thể, chi phí bình qn phí tổn sửa chữa cho n = 500 đƣợc tính tốn 65 $  x , ƣớc lƣợng tổng chi phí phí tổn sửa chữa cho 100,000 phí tổn sửa chữa xảy ra năm (100,000)($65) = $6,500,000 Nghĩa là, để ˆtƣợng trƣng cho tổng chi phí phí tổn sửa chữa, có Ƣớc lƣợng tổng chi phí phí tổn sửa chữa = ˆ= Nx = (100,000)(65) = $6,500,000 Để tìm khoảng tin cậy phía thấp cho tổng chi phí phí tổn sửa chữa, cần xác định đặc trƣng phân phối mẫu ˆ= Nx Chúng ta biết rằng, từ Định lý Giới hạn Trung tâm, phân phối mẫu xsẽ đƣợc phân phối xấp xỉ chuẩn Sau đó, N một số, phân phối mẫu ˆ= Nxcó phân phối xấp xỉ chuẩn với trung bình  (43)Biên dịch: Hải Đăng n N N x   ˆ   Bởi ˆlà số ƣớc lƣợng khơng bị lệch tổng chi phí phí tổn sửa chữa đƣợc phân phối xấp xỉ chuẩn, nên đại lƣợng thỏa mãn tất đặc trƣng cần có khoảng tin cậy 95% phía thấp đƣợc trình bày Phần 7.4 Nghĩa là, n N z      645 ˆ ˆ LCL 0.05 ˆ     Để minh họa cho tính tốn LCL này, giả định độ lệch chuẩn s cho mẫu gồm 500 phí tổn sửa chữa $342 Vậy khoảng tin cậy 95% phía thấp cho năm 021 , 984 , $ 979 , 515 , 000 , 500 , 500 ) 342 ( ) 000 , 100 )( 645 ( 000 , 500 , ˆ LCL 0.05        n N z   Vì vậy, từ họa IRS cho phép thay phí tổn sửa chữa $3,984,021 IRS rõ ràng không tiền qua việc chọn giới hạn tin cậy thấp tổng phí tổn sửa chữa làm thayy tế phí tổn sửa chữa tối đa mà quan cho phép Nhƣ bạn thấy từ Hình 7.9, số ƣớc lƣợng điểm khơng bị lệch ˆƣớc lƣợng tổng chi phí phí tổn sửa chữa $6,500.500 Qua việc cho phép LCL (trong trƣờng hợp $3,984,021), IRS cho phép tổng chi phí phí tổn sửa chữa thực 95% thời gian Chỉ có 5% thời gian quan lừa dối phủ Hoa Kỳ Khi quan thực làm vậy, với khoản nhỏ HÌNH 7.9 Vị trí LCL liên quan đến ˆ 7.11 TĨM TẮT Chƣơng trình bày khái niệm ƣớc lƣợng thống kê chứng minh cách mà khái niệm đƣợc áp dụng cho việc tìm lời giải cho số vấn đề thực tiễn Các ƣớc lƣợng qui tắc (thƣờng cơng thức) mà nói với cách thức để tính tốn ƣớc lƣợng tham số dựa liệu mẫu Các ƣớc lƣợng điểm tạo số (điểm) mà ƣớc lƣợng giá trị tham số tổng thể Các đặc trƣng ƣớc lƣợng điểm đƣợc chứa đựng phân phối mẫu Nhƣ ƣa thích ƣớc lƣợng điểm mà khơng bị lệch - nghĩa là, trung bình phân phối mẫu (44)bằng với tham số ƣớc lƣợng đƣợc Ƣớc lƣợng điểm phải sở hữu phƣơng sai nhỏ, tốt tối thiểu Độ tin cậy ƣớc lƣợng điểm thƣờng đƣợc đo 1.96 lần độ lệch chuẩn (của phân phối mẫu ƣớc lƣợng đó) biên sai số ƣớc lƣợng Khi sử dụng liệu mẫu để tính tốn ƣớc lƣợng cụ thể, xác suất sai số ƣớc lƣợng thấp biên sai số xấp xỉ 0.95 Một ƣớc lƣợng khoảng sử dụng liệu mẫu để tính toán hai điểm - khoảng tin cậy - mà hy vọng bao quanh tham số ƣớc lƣợng đƣợc Bởi muốn biết xác suất mà khoảng bao quanh tham số, nên cần biết phân phối xác suất trị thống kê đƣợc sử dụng để tính tốn khoảng Bốn số ƣớc lƣợng - trung bình mẫu, tỷ lệ nhị thức, khác biệt cặp trị thống kê - đƣợc sử dụng để ƣớc lƣợng đại lƣợng tƣơng đƣơng tổng thể chúng để chứng minh khái niệm ƣớc lƣợng đƣợc phát triển chƣơng Những số ƣớc lƣợng đƣợc chọn lựa cho lý cụ thể Nói chung, chúng số ƣớc lƣợng “tốt” cho tham số tổng thể có liên quan nhiều ứng dụng May mắn tất ƣớc lƣợng sở hữu, mẫu lớn, phân phối xác suất mà xấp xỉ chuẩn Sự kiện cho phép sử dụng qui trình giống để lập nên khoảng tin cậy cho bốn tham số tổng thể ,p,(12),và(p1 p2) Vì chứng minh vai trò quan trọng mà Định lý Giới hạn Trung tâm (Chƣơng 6) đóng suy luận thống kê Khi tổng thể đƣợc chọn mẫu chuẩn cỡ mẫu khơng lớn, số ƣớc lƣợng và 12đƣợc vào phân phối t Student Những Gợi ý Giải Toán Khi giải tập chƣơng này, bạn đƣợc yêu cầu trả lời câu hỏi thực tế mà doanh nhân, ngƣời hoạt động chuyên nghiệp, nhà khoa học, hay ngƣời tình quan tâm Để tìm câu trả lời cho câu hỏi này, bạn cần phải suy luận hay nhiều tham số tổng thể Do vậy, bƣớc việc giải toán xác định mục tiêu tập Tham số mà bạn mong muốn để thực suy luận? Việc trả lời hai câu hỏi sau giúp bạn xác định (các) tham số 1 Loại hình liệu có liên quan? Câu hỏi giúp bạn định loại tham số nào bạn muốn có để thực suy luận: tỷ lệ nhị thức (các p) hay trung bình tổng thể (các μ) Hãy kiểm tra để xem liệu thuộc dạng có/khơng (hai-khả-năng) Nếu vậy, dự liệu nhị thức, bạn quan tâm đến tỷ lệ Nếu không, dự liệu hẳn đại diện cho đại lƣợng hay nhiều biến số ngẫu nhiên định lƣợng, bạn quan tâm đến số trung bình Hãy tìm từ khóa nhƣ “tỷ lệ”, “tỷ phần” vân vân mà liệu nhị thức Dữ liệu nhị thức thƣờng (nhƣng luôn) phát triển từ “cuộc điều tra mẫu” hay trƣng cầu ý kiến 2 Bạn có mong muốn thực suy luận tham số p hay μ, hay về khác biệt hai tham số (p1 p2)hay(12)?Đây câu hỏi dễ trả lời Kiểm tra số lƣợng mẫu có liên quan Một mẫu hàm ý suy luận tham số nhất, hai mẫu hàm ý so sánh hai tham số (45)Biên dịch: Hải Đăng mẫu” Mục đích (b) rõ ràng tập hƣớng dẫn cụ thể bạn vào việc tìm kiếm ƣớc lƣợng tham số (hay khác biệt hai tham số) 4 Kiểm tra điều kiện đƣợc yêu cầu cho phân phối mẫu tham số đƣợc ƣớc lƣợng xấp xỉ phân phối chuẩn Đối với liệu lƣợng hóa, cỡ hay cỡ mẫu phải 30 hay nhiều Đối với liệu nhị thức, cỡ mẫu lớn đảm bảo (ˆ ˆ ) 2 2 p p p   đƣợc chứa đựng khoảng đến [hay ) ˆ ˆ ( 1 ) 1 2 (pp   pp đƣợc chứa khoảng -1 đến cho trƣờng hợp hai mẫu.] Để tóm tắt mẹo này, trình tƣ bạn nên theo định đƣợc trình bày Hình 7.10 HÌNH 7.10 Cây định Bài tập Thêm 7.64 Phát biểu Định lý Giới hạn Trung tâm Định lý Giới hạn Trung tâm có giá trị nhƣ suy luận thống kê? 7.65 Các giả định đƣợc thực sử dụng kiểm tra t Student để xây dựng khoảng tin cậy cho số trung bình tổng thể nhất? 7.66 Các giả định đƣợc thực sử dụng kiểm tra t Student để xây dựng khoảng tin cậy cho khác biệt hai số trung bình tổng thể? 7.67 Một mẫu ngẫu nhiên gồm n = 64 quan sát sở hữu trung bình x29.1và độ lệch chuẩn s = 3.9 Tìm ƣớc lƣợng điểm cho trung bình tổng thể , tìm biên sai số ƣớc lƣợng Loại liệu? Một mẫu hay hai mẫu? Một mẫu hay hai mẫu? Một mẫu (một p nhất) Hai mẫu (p1 - p2 ) Một mẫu (một μ nhất) Hai mẫu 1 - μ2) Nhị thức (quan tâm đến p) Định lƣợng (quan tâm đến μ) Cỡ mẫu Cỡ mẫu Ƣớc lƣợng p Các cỡ mẫu Ƣớc lƣợng μ Các cỡ mẫu Ƣớc lƣợng (p1 - p2 ) Ƣớc lƣợng 1 - μ ) Mẫu lớn (z) Các mẫu lớn (z) Các mẫu nhỏ (t) Mẫu (46)7.68 Xem lại Bài tập 7.67, tìm khoảng tin cậy 90% cho 7.69 Xem lại Bài tập 7.67 Có quan sát cần có bạn muốn ƣớc lƣợng với biên sai số ƣớc lƣợng với 0.5 với xác suất 0.95? 7.70 Các mẫu ngẫu nhiên độc lập gồm n150và n2 60quan sát đƣợc chọn từ tổng thể lần lƣợt Các cỡ mẫu trị thống kê mẫu tính đƣợc đƣợc cho bảng kèm Tìm khoảng tin cậy 90% cho khác biệt số tổng thể, giải thích khoảng Tổng thể 1 2 Cỡ mẫu 50 60 Trung bình mẫu 100.4 96.2 Độ lệch chuẩn mẫu 0.8 1.3 7.71 Xem lại Bài tập 7.70 Giả định bạn muốn ƣớc lƣợng (12)chính xác giới hạn 0.2 với xác suất 0.95 Nếu bạn muốn sử dụng cỡ mẫu, n 1 n phải lớn 2 bao nhiêu? 7.72 Một mẫu ngẫu nhiên gồm n = 500 quan sát từ tổng thể nhị thức tạo x = 240 lần thành cơng a Tìm ƣớc lƣợng điểm cho p, tìm biên sai số b Tìm khoảng tin cậy 90% p 7.73 Xem lại Bài tập 7.72 Một mẫu lớn đƣợc yêu cầu bạn muốn ƣớc lƣợng p xác giới hạn 0.025 với xác suất với 0.90? 7.74 Các mẫu ngẫu nhiên độc lập gồm n1 40và n2 80quan sát đƣợc chọn từ tổng thể lần lƣợt Số lần thành công hai mẫu x117vàx223 Tìm khoảng tin cậy 90% cho khác biệt hai tỷ lệ tổng thể nhị thức 7.75 Xem lại Bài tập 7.74 Giả định bạn muốn ƣớc lƣợng (p1p2) xác giới hạn 0.06 với xác suất 0.90 bạn có kế hoạch sử dụng cỡ mẫu nhau, nghĩa là, n1 n2.Vậy n 1 n phải lớn bao nhiêu? 2 7.76 Một chọn mẫu ngẫu nhiên séc chi trội cho khách hàng ngân hàng ngân hàng địa phƣơng tạo liệu sau (tính đơla đƣợc làm trịn số) 302 512 97 316 69 16 133 701 107 156 401 14 465 72 128 68 Giả định mức chung khoản chi trội ngân hàng đƣợc kỳ vọng ổn định tƣơng lai trƣớc mắt Hãy sử dụng liệu mẫu để tìm khoảng tin cậy 90% cho qui mơ trung bình séc chi trội ngân hàng (47)Biên dịch: Hải Đăng 7.78 Hai mẫu ngẫu nhiên, mẫu chứa 11 đại lƣợng, đƣợc rút từ tổng thể khơng chuẩn sở hữu số trung bình lần lƣợt 1và 2,và phƣơng sai chung  Các số trung bình phƣơng sai mẫu nhƣ sau: Tổng thể I Tổng thể II 4 60 1  x x2 65.3 40 31 2  s s22 44.82 Tìm khoảng tin cậy 90% cho khác biệt số trung bình mẫu 7.79 “Các khoản đầu tƣ lớn vào tự động hóa cơng nghệ khơng mang lại hạnh phúc cho ngành công nghiệp chế tạo Chính cải thiện nhỏ bé, đơn giản làm cho Toyota trở thành công ty dẫn đầu giới tính hiệu quả.”, theo Trung tâm Hỗ trợ Cung ứng Toyota Lexington, Kentucky (Chappell, 1994) Nhóm xuyên nƣớc Mỹ để thảo luận nguyên lý Hệ thống Sản xuất Toyota với mà lắng nghe Trong số hàng ngàn công ty cung ứng Hoa Kỳ, có 22 số 391 cơng ty mà Toyota liên hệ có yêu cầu trợ giúp Nếu 391 công ty cung ứng đƣợc xem nhƣ đại diện cho mẫu ngẫu nhiên công ty cung ứng, tìm ƣớc lƣợng tỷ lệ tất công ty cung ứng Hoa Kỳ mà có lẽ yêu cầu trợ giúp từ nhóm Biên sai số bao nhiêu? 7.80 Mặc dù hầu hết ngƣời Mỹ nói họ thích bữa ăn nấu nhà hơn, 56% cho họ ăn tối nhà hàng hay nơi bán thức ăn nhanh vào cuối tuần Một điều tra gần bộc lộ cho thấy có 45% ngƣời từ 60 tuổi trở lên ăn tối tuần trƣớc đó, so với tỷ lệ 66% ngƣời trƣởng thành dƣới 30 tuổi (“Most Restaurant Meals (Phần lớn bữa ăn nhà hàng)”, 1994) Giả định tỷ lệ phần trăm đƣợc hai mẫu mà mẫu có cỡ 1200 a Các biên sai số với ƣớc lƣợng tỷ lệ ngƣời từ 60 tuổi trở lên ngƣời độ tuổi dƣới 30 mà ăn tối tuần trƣớc đó? b Tìm ƣớc lƣợng điểm biên sai số cho khác biệt tỷ lệ ngƣời từ 60 tuổi trở lên ngƣời dƣới 30 tuổi mà ngồi ăn tối tuần trƣớc 7.81 Một mẫu ngẫu nhiên gồm 400 đèn đêm đƣợc kiểm tra, 40 đèn đƣợc tìm thấy có lỗi Với hệ số tin cậy với 0.90, ƣớc lƣợng khoảng mà giới hạn tỷ lệ thực đèn bị lỗi rơi vào 7.82 Kinh nghiệm khứ cho thấy độ lệch chuẩn thu nhập hàng năm công nhân dệt tiểu bang cụ thể $1000 Một mẫu công nhân dệt lớn mà ngƣời cần để chọn ngƣời muốn ƣớc lƣợng số trung bình tổng thể xác giới hạn $100.00 với xác suất với 0.95? Biết số trung bình mẫu toán $14,800, xác định giới hạn tin cậy 95% cho số trung bình tổng thể 7.83 Một ngƣời làm thí nghiệm muốn sử dụng số trung bình mẫu xđể ƣớc lƣợng trung bình một tổng thể có phân phối chuẩn với sai số thấp 0.5 với xác suất với 0.9 Nếu phƣơng sai tổng thể với 4, mẫu phải lớn để đạt đƣợc xác này? 7.84 Một nghiên cứu thời gian đƣợc lên kế hoạch nhằm ƣớc lƣợng, xác giới hạn giây với xác suất 0.90, thời gian trung bình cho cơng nhân hồn tất cơng việc lắp ráp Nếu kinh nghiệm từ khứ gợi ý  16giây đo lƣờng thay đổi từ công nhân sang công nhân khác thời gian lắp ráp, có cơng nhân, ngƣời thực hoạt động lắp ráp nhất, phải đƣợc đƣa vào mẫu này? (48)a Ƣớc lƣợng tỷ lệ thực cơng nhân thất nghiệp, tìm biên sai số ƣớc lƣợng b Có ngƣời phải đƣợc chọn mẫu nhằm giảm biên sai số xuống 0.02? 7.86 Sáu mƣơi số 87 ngƣời nội trợ ƣa thích bột giặt A Nếu 87 ngƣời nội trợ đại diện cho mẫu ngẫu nhiên từ tổng thể tất ngƣời mua sắm tiềm năng, ƣớc lƣợng tỷ lệ tổng số ngƣời nội trợ ƣa thích bột giặt A Sử dụng khoảng tin cậy 90% 7.87 Một chủ nhiệm khoa sinh viên mong muốn ƣớc lƣợng chi phí bình qn năm đại học trƣờng đại học cụ thể xác giới hạn $500.00 với xác suất 0.95 Nếu mẫu ngẫu nhiên sinh viên năm thứ đƣợc chọn lựa yêu cầu giữ lại liệu tài chính, có sinh viên phải đƣợc đƣa vào mẫu này? Giả định ông chủ nhiệm khoa biết dãy chi tiêu thay đổi từ xấp xỉ $4800 đến $13,000 7.88 Tỷ lệ phần trăm số điểm D F ban cho sinh viên hai giáo sƣ sử học đại học đƣợc ông chủ nhiệm khoa lƣu ý Giáo sƣ I đạt đƣợc tỷ lệ 32% so với tỷ lệ 21% giáo sƣ II, lần lƣợt vào 200 180 sinh viên Hãy ƣớc lƣợng chênh lệch tỷ lệ phần trăm số điểm D F ban cho sinh viên hai giáo sƣ Biên sai số bao nhiêu? 7.89 Giả định bạn mong muốn ƣớc lƣợng sản lƣợng trung bình hàng qui trình sản xuất loại kháng sinh Qui trình đƣợc quan sát cho 100 giai đoạn hàng đƣợc chọn lựa ngẫu nhiên, với kết nhƣ sau: 34  x aoxơ s = Hãy ƣớc lƣợng sản lƣợng trung bình hàng cho qui trình này, sử dụng khoảng tin cậy 95% 7.90 Một kỹ sƣ kiểm soát chất lƣợng muốn ƣớc lƣợng tỷ lệ có lỗi lơ lớn bóng đèn Từ kinh nghiệm trƣớc đó, ông ta cảm thấy tỷ lệ thực sản phẩm bị lỗi phải nằm quanh 0.2 Một mẫu lớn mà ông ta phải chọn ông ta muốn ƣớc lƣợng tỷ lệ thực rơi vào 0.01, sử dụng khoảng tin cậy 95%? 7.91 Các mẫu gồm 400 pin AA đƣợc chọn từ số hai dây chuyền sản xuất, A B Số lƣợng sản phẩm có lỗi mẫu đƣợc cho bảng kèm Hãy ƣớc lƣợng khác biệt tỷ lệ thực tế sản phẩm có lỗi cho hai dây chuyền với khoảng tin cậy 0.90 Dây chuyền Số lượng Sản phẩm có lỗi A 40 B 80 7.92 Hiệu đốt cháy mà ngƣời nội trợ kỳ vọng từ lò sƣởi chạy dầu? EPA xác định mức 80% hay cao tuyệt vời, 755 đến 79% tốt, 70% đến 74% khá, dƣới 70% Một nhà thầu sƣởi ấm cho nhà mà bán hai loại lò sƣởi chạy dầu (ta gọi chúng A B) định so sánh mức độ hiệu trung bình chúng Một phân tích đƣợc thực mức độ hiệu cho lò sƣởi loại A lị loại B Xếp hạng mức độ hiệu quả, tính tỷ lệ phần trăm, cho 14 lò sƣởi đƣợc cho bảng sau Loại A 72 78 73 69 75 74 69 75 Loại B 78 76 81 74 82 75 a Tìm khoảng tin cậy 90% cho (AB)và giải thích kết (49)Biên dịch: Hải Đăng 7.93 Một kiểm tra sổ sách đƣợc tiến hành nhằm ƣớc lƣợng khác biệt hao hụt (mất mát cắp, hƣ hỏng, v.v) trung bình tính theo tỷ lệ phần trăm hàng tồn kho hai cửa hàng bách hóa tổng hợp Một trăm mặt hàng đƣợc chọn lựa ngẫu nhiên nội cửa hàng, tỷ lệ phần trăm mặt hàng có tay, để so sánh với tổng số đƣợc ghi vào hồ sơ hàng tồn kho, đƣợc ghi nhận Trung bình độ lệch chuẩn hao hụt tính theo tỷ lệ phần trăm hai cửa hàng bách hóa tổng hợp này, sử dụng khoảng tin cậy 95% Căn vào khoảng này, liệu bạn kết luận có khác biệt hao hụt trung bình tính theo tỷ lệ phần trăm hai cửa hàng không? Cửa hàng Bách hóa 1 2 Cỡ mẫu 100 100 Trung bình mẫu 5.3 6.4 Độ lệch chuẩn mẫu 2.7 2.9 7.94 Tiêu chuẩn liên bang có hiệu lực yêu cầu phận đỡ va chạm xe phải giữ cho thân xe không bị hƣ hỏng chịu tác động va chạm phía trƣớc phía sau vào chƣớng ngại vật phẳng chạy với tốc độ 2.5 mph Tuy nhiên, khơng có tiêu chuẩn liên bang tối thiểu cho xe gia đình, mặc cho kiện vào năm 1992 có nhiều số mƣời ngƣời mua chọn mua xe gia đình (“Passenger Van Bumpers (Các phân đỡ va chạm xe gia đình”, 1994) Trong kiểm tra ngƣời tiêu dùng bảy nhãn hiệu/mẫu xe gia đình phổ biến, chi phí sửa chữa sau phản ảnh tổng chi phí sửa chữa hƣ hỏng gây từ va chạm phía trƣớc phía sau vào chƣớng ngại vật, va chạm từ phía trƣớc vào chƣớng ngại vật nghiêng, va chạm từ phía sau vào cột: $1862 2554 3693 4082 4505 4601 7643 a Tìm trung bình độ lệch chuẩn n = chi phí sửa chữa b Tính toán ƣớc lƣợng khoảng tin cậy 95% chi phí sửa chữa tổng thể cho xe gia đình đƣợc đại diện mẫu c Sử dụng in Minitab đƣợc cho dƣới để khẳng định kết câu (a) (b) N Trung bình Độ lệch chuẩn Trung bình sai số chuẩn 95.0 Phần trăm C.I Phí tổn 4173 1842 696 ( 2469, 5877) 7.95 Biết bảo toàn lƣợng quan trọng, nên số nhà khoa học nghĩ chúng ta phải có xem xét kỹ lƣỡng chi phí (về lƣợng) việc sản xuất số loại hình thực phẩm khác Một nghiên cứu gần so sánh lƣợng dầu mỏ trung bình cần thiết để sản xuất mẫu Anh loại hình trồng khác Ví dụ, giả định muốn so sánh khối lƣợng dầu mỏ trung bình để sản xuất mẫu Anh bắp so với mẫu Anh súp lơ Số đo thùng (khoảng 150 lít) dầu mỏ mẫu Anh, dựa đất 20 mẫu Anh, bảy cho trồng, đƣợc cho bảng sau Sử dụng liệu để tìm khoảng tin cậy 90% cho khác biệt số khối lƣợng dầu mỏ trung bình cần thiết để sản xuất hai loại trồng Bắp 5.6 7.1 4.5 6.0 7.9 4.8 5.7 Súp lơ 15.9 13.4 17.6 15.8 15.8 16.3 17.1 (50)của mẫu cho 100 khách hàng lần lƣợt 39.1 ngày 17.3 ngày Tìm khoảng tin cậy 90% cho thời gian trung bình từ lúc ghi hóa đơn đến nhận đƣợc khoản chi trả cho tất khách hàng cơng ty kiểm tốn Giải thích khoảng 7.97 Xem lại Bài tập 7.96 Một so sánh thời gian trung bình từ lúc ghi hóa đơn đến nhận đƣợc khoản chi trả đƣợc thực cách chọn lựa mẫu ngẫu nhiên gồm 30 khách hàng, mẫu từ tổng thể gồm tất khách hàng cá nhân từ tổng thể khách hàng doanh nghiệp Các cỡ mẫu, số trung bình, độ lệch chuẩn cho hai mẫu đƣợc cho bảng kèm sau Tìm khoảng tin cậy 95% cho khác biệt thời gian trung bình để chi trả khách hàng cá nhân doanh nghiệp Khách hàng Cá nhân Khách hàng Doanh nghiệp Cỡ mẫu 100 100 x 5.3 6.4 s 2.7 2.9 7.98 Xem lại Bài tập 7.97 Có khách hàng loại phải đƣợc chọn mẫu (với cỡ mẫu nhau) bạn muốn ƣớc lƣợng khác biệt thời gian trung bình để chi trả xác giới hạn ngày với xác suất xấp xỉ với 0.95? 7.99 Những cơng ty quảng cáo truyền hình có lẽ tin tƣởng cách sai lầm hầu hết ngƣời xem hiểu phần lớn mẫu quảng cáo mà học xem nghe đƣợc Một điều tra nghiên cứu gần sử dụng 2300 ngƣời xem độ tuổi 13 Mỗi ngƣời xem nhìn trích đoạn quảng cáo truyền hình dài 30 giây Trong số này, 1914 ngƣời xem hiểu sai tất hay phần trích đoạn Hãy tìm khoảng tin cậy 95% cho tỷ lệ tất ngƣời xem (mà mẫu có tính đại diện) mà hiểu sai tồn hay phần trích đoạn quảng cáo truyền hình đƣợc sử dụng nghiên cứu 7.100 Xe điện Tropica đƣợc đo Ủy ban Tài ngun Khơng khí California để có kết một quãng đƣờng trung bình 44.7 dặm (“Thinking Cheaper (Suy nghĩ Rẻ hơn), 1994) Trong Bài tập 2.13, kiểm tra độc lập gồm 30 lần thử tạo quãng đƣờng trung bình nhƣ sau: 45.4 45.9 45.3 42.9 45.8 44.6 55.7 46.4 45.7 45.9 44.1 47.1 46.4 44.3 47.3 46.8 44.2 45.5 45.0 46.4 43.5 46.6 44.5 44.8 44.3 47.0 44.6 43.3 46.1 43.8 Dựa vào in Minitab sau đây, sử dụng qui trình ƣớc lƣợng thích hợp để kiểm tra hay tranh luận quãng đƣờng trung bình 44.7 dặm đƣợc báo cáo Ủy ban Tài ngun Khơng khí California N Trung bình Trung vị bình TR Trung Độ lệch chuẩn bình sai Trung số chuẩn Các quãng đường 30 45.273 45.350 45.292 1.199 0.219 Tối thiểu Tối đa Q1 Q3 Các quãng đường 42.900 47.300 44.300 46.400 (51)Biên dịch: Hải Đăng cho tảng mà hỗ trợ chƣơng trình ứng dụng Dữ liệu sau phản ảnh thời gian (tính giây) để tải chƣơng trình Ami Pro 2.0 máy tính cá nhân IBM PS/2 Model 90 486 DX/33 sử dụng chƣơng trình Standard Windows Enhanced Windows Sử dụng qui trình ƣớc lƣợng phù hợp để xác định liệu thật có khác biệt thời gian trung bình để tải chƣơng trình Ami Pro 2.0 sử dụng chƣơng trình Standard Windows Enhanced Windows Standard Enhanced 1.56 1.20 1.59 0.96 1.41 1.38 1.68 1.09 1.48 1.54 1.17 1.26 1.37 1.41 0.94 1.23 1.39 1.16 1.56 1.30 Sử dụng Bộ Dữ liệu http://swlearning.com 7.102 Tham khảo liệu A Đối với loại khoa cố định, chọn hai mẫu ngẫu nhiên tiền lƣơng với cỡ mẫu n = 50, từ khoa nam từ khoa nữ a Ƣớc lƣợng khác biệt tiền lƣơng trung bình giảng viên nam so với giảng viên nữ cách sử dụng khoảng tin cậy 95% dựa cách tiếp cận mẫu lớn (Định lý Giới hạn Trung tâm) b Chọn loại khoa khác lặp lại câu (a) với cỡ mẫu n = 30 cho giảng viên nam lẫn giảng viên nữ cách sử dụng cách tiếp cận mẫu lớn 7.103 Tham khảo liệu B Chọn mẫu ngẫu nhiên gồm n110quan sát trọng lƣơng tƣơi thuộc loại (mã hóa 0) n2 10 quan sát trọng lƣợng tƣơi thuộc loại (mã hóa 1) a Sử dụng cách tiếp cận mẫu nhỏ dựa phân phối t để tìm ƣớc lƣợng khoảng tin cậy 99% 12,sự khác biệt thực trọng lƣợng tƣơi trung bình búp bơng cải xanh b Lựa chọn biến khác trọng lƣợng thị trƣờng, trọng lƣợng khô, đƣờng kính búp lặp lại câu (a) 7.104 Tham khảo liệu C Trung bình độ lệch chuẩn thực tế kỳ hạn chi trả bình quân tính ngày 38.56  14.224 a Xem xét kỳ hạn chi trả bình quân cho 694 quỹ đầu tƣ thị trƣờng tiền tệ tổng thể cần quan tâm chọn mẫu ngẫu nhiên có cỡ 30 từ tổng thể (sử dụng bảng số ngẫu nhiên, Bảng 13, Phụ lục II) b Sử dụng mẫu từ câu (a) để xây dựng khoảng tin cậy 99% cho  Liệu khoảng tin cậy có bao quanh giá trị đúng, 38.56không? c Chọn mẫu ngẫu nhiên khác có cỡ 30 xây dựng khoảng tin cậy 99% khác cho  Liệu khoảng có bao quanh khơng?
- Xem thêm -

Xem thêm: Bài đọc 8. Khhóa học ngắn về thống kê kinh doanh - 2nd ed. Chương 7: Ước lượng các số trung bình và tỉ lệ, Bài đọc 8. Khhóa học ngắn về thống kê kinh doanh - 2nd ed. Chương 7: Ước lượng các số trung bình và tỉ lệ

Hình ảnh liên quan

GV đa I1 số biểu đồ các dạng (dạng cộ, (Bảng phụ) - Bài đọc 8. Khhóa học ngắn về thống kê kinh doanh - 2nd ed. Chương 7: Ước lượng các số trung bình và tỉ lệ

a.

I1 số biểu đồ các dạng (dạng cộ, (Bảng phụ) Xem tại trang 2 của tài liệu.
GV đa lên màn hình “Tính chất cơ bản của  phân  số”  tr.10  SGK  - Bài đọc 8. Khhóa học ngắn về thống kê kinh doanh - 2nd ed. Chương 7: Ước lượng các số trung bình và tỉ lệ

a.

lên màn hình “Tính chất cơ bản của phân số” tr.10 SGK Xem tại trang 5 của tài liệu.