Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 40 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
40
Dung lượng
2,01 MB
Nội dung
TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI VIỆN TOÁN ỨNG DỤNG VÀ TIN HỌC BÁO CÁO CUỐI KÌ HỆ HỖ TRỢ QUYẾT ĐỊNH BUSINESS ANATLYTICS, SAMPLING AND ESTIMATION Giảng viên hướng dẫn: LÊ CHÍ NGỌC Contents Mục tiêu học tập Kế hoạch lấy mẫu cho nghiên cứu thị trường Lấy mẫu ngẫu nhiên đơn giản với Excel .6 Một thí nghiệm lấy mẫu 12 Ước lượng lỗi lấy mẫu cách sử dụng quy tắc thực nghiệm .15 Tính tốn sai số chuẩn giá trị trung bình .16 Sử dụng lỗi tiêu chuẩn tính tốn xác suất 18 Ước lượng khoảng thời gian Tin tức 19 Tính toán khoảng tin cậy với độ lệch chuẩn biết 22 Tính tốn khoảng tin cậy với độ lệch chuẩn không xác định 25 10 Tính tốn khoảng tin cậy cho tỷ lệ 27 11 Vẽ kết luận dân số, có nghĩa sử dụng khoảng tin cậy 28 12 Sử dụng khoảng tin cậy để dự đoán kết bầu cử .29 13 Tính tốn khoảng dự đốn 30 14 Xác định cỡ mẫu cho giá trị trung bình 32 15 Xác định cỡ mẫu cho tỷ lệ 33 Từ khóa 34 Luyện tập 35 Tài liệu tham khảo .41 BUSINESS ANATLYTICS, CHAP 6- SAMPLING AND ESTIMATION Lời mở đầu Nôi dung báo cáo tham khảo từ tài liệu Business analytics, Chap 6: Sampling and Estimation Sau nghiên cứu chương này, bạn có thể: Mô tả yếu tố kế hoạch lấy mẫu - Giải thích khác biệt lấy mẫu chủ quan lấy mẫu xác suất - Nêu hai loại lấy mẫu chủ quan - Giải thích cách tiến hành lấy mẫu ngẫu nhiên đơn giản sử dụng Excel để tìm mẫu ngẫu nhiên đơn giản từ sở liệu Excel - Giải thích việc lấy mẫu có hệ thống, phân tầng cụm, lấy mẫu từ trình liên tục - Giải thích tầm quan trọng cơng cụ ước lượng không chệch - Mô tả khác biệt lỗi lấy mẫu lỗi khơng lấy mẫu - Giải thích cách trung bình, độ lệch chuẩn trung vị mẫu thay đổi kích cớ lấy mẫu - Xác định phân phối lấy mẫu giá trị trung bình - Tính sai số chuẩn giá trị trung bình - Giải thích tầm quan trọng thực tế định lý giới hạn trung tâm - Sử dụng sai số chuẩn tính tốn xác suất - Giải thích cách tính khác ước lượng khoảng với ước lượng điểm điểm - Xác định đưa ví dụ khoảng tin cậy - Tính khoảng tin cậy cho mẫu dân số tỷ lệ sử dụng cơng thức chương hàm Excel thích hợp - Giải thích cách khoảng tin cậy thay đổi theo cấp độ niềm tin tăng hay giảm - Mô tả khác biệt phân phối t phân phối bình thường - Sử dụng khoảng tin cậy để rút kết luận thông số dân số - Tính tốn khoảng dự đốn giải thích khác từ khoảng tin cậy - Tính kích thước mẫu cần thiết để đảm bảo độ tin cậy khoảng cho phương tiện tỷ lệ với định lề lỗi Bước lấy mẫu thiết kế kế hoạch lấy mẫu hiệu mang lại đại diện mẫu quần thể nghiên cứu Một kế hoạch lấy mẫu mô tả cách tiếp cận sử dụng để lấy mẫu từ dân số trước thu thập liệu hoạt động Một kế hoạch lấy mẫu nêu rõ: - mục tiêu hoạt động lấy mẫu, - dân số mục tiêu, - khung dân số (danh sách mà mẫu chọn), - phương pháp lấy mẫu, - quy trình hoạt động để thu thập liệu - công cụ thống kê sử dụng để phân tích liệu Kế hoạch lấy mẫu cho nghiên cứu thị trường Giả sử công ty muốn hiểu người chơi golf phản hồi chương trình thành viên cung cấp giảm giá sân golf địa phương golf toàn quốc Mục tiêu mẫu nghiên cứu để ước lượng tỷ lệ người chơi golf đăng ký chương trình Dân số mục tiêu tất người chơi golf 25 tuổi Tuy nhiên, xác định tất người chơi golf Mỹ khơng thể Một khung dân số thực tế danh sách người chơi golf mua thiết bị từ golf quốc gia thể thao cơng ty hàng hóa thơng qua thẻ giảm giá bán Các thủ tục hoạt động để thu thập liệu liên kết email đến trang khảo sát thư trực tiếp bảng câu hỏi Dữ liệu lưu trữ sở liệu Excel; công cụ thống kê PivotTables đơn giản thống kê mô tả sử dụng để phân khúc người trả lời vào nhóm nhân học ước lượng khác khả đáp ứng tích cực họ Phương pháp lấy mẫu Nhiều loại phương pháp lấy mẫu tồn Phương pháp lấy mẫu chủ quan xác suất Phương pháp chủ quan bao gồm lấy mẫu phán đốn, đánh giá chuyên gia sử dụng để chọn mẫu (khảo sát khách hàng tốt EDT) lấy mẫu thuận tiện, mẫu chọn dựa mức độ dễ dàng thu thập liệu (khảo sát tất khách hàng đến thăm tháng này) Lấy mẫu xác suất liên quan đến việc chọn mục mẫu cách sử dụng số thủ tục ngẫu nhiên Lấy mẫu xác suất cần thiết để rút kết luận thống kê hợp lệ Phương pháp lấy mẫu xác suất phổ biến lấy mẫu ngẫu nhiên đơn giản Đơn giản lấy mẫu ngẫu nhiên liên quan đến việc chọn mục từ dân số cho tập hợp kích thước định có hội bình đẳng lựa chọn Nếu liệu dân số lưu trữ sở liệu, mẫu ngẫu nhiên đơn giản thường dễ dàng thu Lấy mẫu ngẫu nhiên đơn giản với Excel Giả sử muốn lấy mẫu từ sở liệu Excel Giao dịch bán hàng Excel cung cấp công cụ để tạobộ giá trị ngẫu nhiên từ kích thước dân số định Nhấp chuột Phân tích liệu nhóm Phân tích tab Dữ liệu chọn Lấy mẫu Điều xuất hộp thoại hiển thị Hình 6.1 Trong hộp Phạm vi đầu vào, chúng tơi định liệu phạm vi mà từ mẫu thực Công cụ yêu cầu liệu lấy mẫu số, ví dụ chúng tơi lấy mẫu từ cột tập liệu, tương ứng với số ID khách hàng Có hai tùy chọn để lấy mẫu: i Lấy mẫu định kỳ chúng tơi nhắc khoảng thời gian, khoảng thời gian mẫu quan sát từ đầu tập liệu Chẳng hạn, sử dụng khoảng thời gian 5, quan sát 5, 10, 15, v.v., chọn làm mẫu ii Lấy mẫu ngẫu nhiên, nhắc cho số lượng mẫu Excel ngẫu nhiên chọn số lượng mẫu từ liệu định Tuy nhiên, công cụ tạo mẫu ngẫu nhiên với thay thế, chúng tơi phải cẩn thận để kiểm tra trùng lặp quan sát mẫu tạo Hình 6.2 cho thấy 20 mẫu tạo công cụ Chúng xếp chúng theo thứ tự tăng dần để dễ dàng xác định trùng lặp Như bạn thấy, hai số khách hàng nhân đôi công cụ Các phương pháp lấy mẫu khác bao gồm: - Lấy mẫu có hệ thống (định kỳ) Lấy mẫu có hệ thống định kỳ lấy mẫu kế hoạch (một tùy chọn công cụ Lấy mẫu Excel) chọn mục thứ n từ dân cư Ví dụ: để lấy mẫu 250 tên từ danh sách 400.000, tên chọn ngẫu nhiên từ 1.600 đầu tiên, sau tên thứ 1.600 chọn Cách tiếp cận sử dụng cho điện thoại lấy mẫu hỗ trợ trình quay số tự động lập trình để quay số số cách có hệ thống Tuy nhiên, lấy mẫu hệ thống không giống lấy mẫu ngẫu nhiên đơn giản mẫu nào, mẫu có kích thước định dân số khơng có hội lựa chọn Trong số tình huống, cách tiếp cận gây thiên vị đáng kể dân số có số mơ hình Chẳng hạn, đơn đặt hàng lấy mẫu nhận sau ngày khơng mang lại mẫu đại diện khách hàng có xu hướng gửi đơn đặt hàng định ngày tuần - Lấy mẫu phân tầng Lấy mẫu phân tầng áp dụng cho quần thể chia vào tập tự nhiên (gọi tầng lớp) phân bổ tỷ lệ thích hợp mẫu cho tầng Ví dụ, thành phố lớn chia thành quận trị gọi phường Mỗi phường có số lượng công dân khác nhau.Một mẫu phân tầng chọn mẫu cá nhân phường theo tỷ lệ đến kích thước Cách tiếp cận đảm bảo tầng cân kích thước so với dân số cung cấp kết tốt đơn giản lấy mẫu ngẫu nhiên mục tầng không đồng Tuy nhiên, vấn đề chi phí tầm quan trọng tầng lớp định làm cho khơng cân xứng mẫu hữu ích Ví dụ, pha trộn sắc tộc chủng tộc phường khác biệt đáng kể, gây khó khăn cho mẫu phân tầng thơng tin mong muốn - Lấy mẫu cụm Lấy mẫu cụm dựa việc chia dân số thành nhóm nhỏ (cụm), lấy mẫu nhóm cụm (thường) tiến hành hoàn thành điều tra dân số cụm lấy mẫu Chẳng hạn, cơng ty phân khúc khách hàng vào khu vực địa lý nhỏ Một mẫu cụm bao gồm mẫu ngẫu nhiên khu vực địa lý tất khách hàng số khu vực khảo sát (có thể dễ dàng danh sách khu vực dễ dàng để sản xuất gửi thư) - Lấy mẫu từ trình liên tục Chọn mẫu từ sản xuất liên tục trình thực theo hai cách Đầu tiên, chọn thời gian ngẫu nhiên; sau chọn n mục sản xuất sau thời gian Thứ hai, chọn n lần ngẫu nhiên; sau chọn mục sản xuất sau lần Cách tiếp cận thường đảm bảo quan sát đến từ đồng dân số; nhiên, cách tiếp cận thứ hai bao gồm mục từ quần thể khác đặc điểm trình thay đổi thời gian, nên thận trọng sử Phân tích thực tế: Sử dụng kỹ thuật lấy mẫu để cải thiện phân phối Các nhà máy bia Hoa Kỳ dựa hệ thống phân phối ba tầng để cung cấp sản phẩm cho cửa hàng bán lẻ, chẳng hạn siêu thị cửa hàng tiện lợi, tài khoản chỗ, chẳng hạn quán bar nhà hàng Ba tầng nhà sản xuất, nhà bán buôn (nhà phân phối) nhà bán lẻ Một mạng lưới phân phối phải hiệu chi phí hiệu để cung cấp cho thị trường sản phẩm không bị hư hại giao nơi, thời điểm Để hiểu hiệu suất nhà phân phối liên quan đến hiệu tổng thể, nhà máy bia MillerCoors xác định bảy thuộc tính phân phối thích hợp liệu thu thập từ 500 nhà phân phối Một chuyên gia chất lượng lĩnh vực (FQS) kiểm toán nhà phân phối khu vực phân công quốc gia thu thập liệu thuộc tính FQS sử dụng thiết bị cầm tay để quét sản phẩm phổ thông mã gói để xác định loại sản phẩm số lượng Khi kiểm tốn hồn tất, liệu tóm tắt tải lên từ thiết bị cầm tay vào sở liệu chủ Kiểm toán phân phối sử dụng phân tầng ngẫu nhiên lấy mẫu với phân bổ mẫu theo tỷ lệ dựa thị phần nhà phân phối Ngoài để cung cấp mẫu đại diện tốt kiểm soát hậu cần lấy mẫu, phân tầng ngẫu nhiên lấy mẫu tăng cường độ xác thống kê liệu tổng hợp theo khu vực thị trường phục vụ nhà phân phối Độ xác nâng cao kết nhỏ điển hình khu vực thị trường đồng nhất, cung cấp ước lượng thực tế tính biến đổi, đặc biệt so sánh với khu vực thị trường khác khác biệt rõ rệt Lấy ngẫu nhiên tài khoản bán lẻ thông qua chương trình thiết kế đặc biệt dựa Vị trí GPS nhà phân phối bán lẻ dịch vụ tài khoản Chiến lược lấy mẫu cuối giải nhà phân phối cụ thể hiệu suất liên quan đến hết mã sản phẩm, sản phẩm bị hư hỏng, ngồi vịng quay sản phẩm cấp độ bán lẻ Tổng cộng, 6.000 tài khoản bán lẻ quốc gia bia bia kiểm toán năm lấy mẫu Dữ liệu thu thập FQS năm sử dụng để phát triển bảng xếp hạng hiệu suất nhà phân phối xác định hội để cải thiện Ước lượng thông số dân số Dữ liệu mẫu cung cấp sở cho nhiều phân tích hữu ích để hỗ trợ cho việc định Ước lượng liên quan đến việc đánh giá giá trị tham số dân số chưa biết, chẳng hạn dân số trung bình, tỷ lệ dân số phương sai dân số sử dụng liệu mẫu Ước lượng biện pháp sử dụng để ước lượng thông số dân số; ví dụ: chúng tơi sử dụng mẫu trung bình x để ước lượng dân số có nghĩa μ Phương sai mẫu s2 ước lượng phương sai dân số σ 2, tỷ lệ mẫu p ước lượng tỷ lệ dân số π Ước lượng điểm số xuất phát từ liệu mẫu sử dụng để ước lượng giá trị tham số dân số - Ước lượng khơng chệch Có vẻ trực quan ý nghĩa mẫu cung cấp ước lượng điểm tốt cho ý nghĩa dân số Tuy nhiên, khơng rõ cơng thức cho phương sai mẫu mà giới thiệu Chương có mẫu số n - 1, đặc biệt khác từ cơng thức cho phương sai dân số (xem công thức (4.4) (4.5) Chương 4) Trong công thức này, phương sai dân số tính tốn ... .41 BUSINESS ANATLYTICS, CHAP 6- SAMPLING AND ESTIMATION Lời mở đầu Nôi dung báo cáo tham khảo từ tài liệu Business analytics, Chap 6: Sampling and Estimation Sau nghiên cứu chương này,... dần để dễ dàng xác định trùng lặp Như bạn thấy, hai số khách hàng nhân đôi công cụ Các phương pháp lấy mẫu khác bao gồm: - Lấy mẫu có hệ thống (định kỳ) Lấy mẫu có hệ thống định kỳ lấy mẫu kế... thoại lấy mẫu hỗ trợ trình quay số tự động lập trình để quay số số cách có hệ thống Tuy nhiên, lấy mẫu hệ thống không giống lấy mẫu ngẫu nhiên đơn giản mẫu nào, mẫu có kích thước định dân số khơng