( ) TRƯỜNG ĐẠI HỌC THƯƠNG MẠI BÀI THẢO LUẬN ƯỚC LƯỢNG – KIỂM ĐỊNH Môn Lí thuyết xác suất và thống kê toán Hà Nội 2022 Mục lục PHẦN I ĐẶT VẤN ĐỀ 4 I Khái quát chung 4 1 Nguồn gốc của thống kê 4 2 Tầm quan trọng của thống kê 5 3 Ứng dụng của thống kê 5 4 Vai trò của xác suất và thống kê 6 II Lý thuyết thống kê toán 7 1 Ước lượng kỳ vọng toán của ĐLNN 8 2 Kiểm định giả thuyết thống kê 9 PHẦN II TỔNG QUAN 12 1 Ước lượng 12 2 Kiểm định 13 PHẦN III BÀI TOÁN 15 1 Ước lượng 15 2 Kiểm định.
TRƯỜNG ĐẠI HỌC THƯƠNG MẠI BÀI THẢO LUẬN ƯỚC LƯỢNG – KIỂM ĐỊNH Mơn: Lí thuyết xác suất thống kê toán Hà Nội - 2022 Mục lục PHẦN I: ĐẶT VẤN ĐỀ I Khái quát chung Nguồn gốc thống kê Nếu thống kê hiểu theo nghĩa thơng thường từ thời cổ đại người ý đến việc thông qua việc ghi chép đơn giản Cuối kỷ XVII, lực lượng sản xuất phát triển mạnh mẽ làm cho phương thức sản xuất chủ nghĩa tư đời Kinh tế hàng hóa phát triển dẫn đến ngành sản xuất riêng biệt tăng thêm, phân công lao động xã hội ngày phát triển Tính chất xã hội sản xuất ngày cao, thị trường mở rộng khơng nước mà tồn giới Để phục vụ cho mục đích kinh tế, trị quân nhà nước tư chủ tư cần nhiều thông tin thường xuyên thị trường, giá cả, sản xuất, nguyên liệu, dân số Do đó, cơng tác thống kê phát triển nhanh chóng • nhóm tác giả gọi người khai sáng cho ngành khoa học thống kê: - Những người đưa ngành khoa học thống kê vào thực tiễn, đại diện cho tác giả nhà kinh tế học người Đức H.Conhring (1606 - 1681), năm 1660 ông giảng dạy trường đại học Halmsted phương pháp nghiên cứu tượng xã hội dựa vào số liệu điều tra cụ thể - Với thành người trước, bổ sung hồn chỉnh mơn học thống, đại diện William Petty, nhà kinh tế học người Anh, tác giả "Số học trị" xuất năm 1682, tác phẩm có tính chất thống kê đời - Thống kê gọi với nhiều tên khác thời giờ, sau năm 1759 giáo sư người Đức, Achenwall (1719 - 1772) lần dùng danh từ "Statistics" (một thuật ngữ gốc Latinh "Status", có nghĩa Nhà nước trạng thái tượng - sau người ta dịch "Thống kê") Kể từ đó, thống kê có phát triển mạnh mẽ ngày hoàn thiện -Trong thống kê, ước lượng giá trị tính tốn từ mẫu thử người ta hy vọng giá trị tiêu biểu cho giá trị cần xác định dân số Người ta ln tìm ước lượng cho ước lượng "không chệch, hội tụ, hiệu vững" - Kiểm định giả thuyết thống phương pháp định sử dụng liệu, từ thí nghiệm từ nghiên cứu quan sát (khơng có kiểm sốt) Trong thống kê (statistics), kết gọi đủ độ tin cậy mang tính thống kê có khả diễn theo ngưỡng xác suất cho trước (ví dụ 5% hay 10%) Cụm từ kiểm định độ tin cậy đưa Ronald Fisher Tầm quan trọng thống kê Ngày nay, phương pháp thống kê áp dụng tất lĩnh vực liên quan đến việc định, để đưa suy luận xác từ lượng liệu đối chiếu để đưa định đối mặt với không chắn dựa phương pháp thống kê Ngành Thống kê có tính hội nhập cao, gắn kết hội nhập thống kê nước thể qua tiêu thống kê, tiêu có phương pháp luận thống toàn giới VD: Trên thực tế: - Để so sánh phát triển quốc gia phải so sánh tiêu - Để phản ánh phát triển kinh tế – xã hội khu vực hay giới phải tính tốn dựa tiêu quốc gia thành viên - Thống kê ứng dụng vào hầu hết lĩnh vực khoa học khác từ khoa học xã hội đến kinh tế, sinh học, y học, thời tiết hay nông nghiệp - Thống kê hữu đời sống hàng ngày người dân: từ hộ kinh doanh, buôn bán nhỏ lẻ, từ thành thị đến nông thôn, họ tự thống kê hay ghi nhớ doanh thu cao, doanh thu thấp theo mùa, theo ngày để xác định lượng hàng hóa mua vào, bán chu kỳ sau cho phù hợp với nhu cầu ước lượng dựa thống kê trước nhằm tránh tình trạng dư thừa, gây lỗ vốn - Trong lĩnh vực kinh tế: giúp ta nắm nhu cầu khơng nước mà cịn nắm thị hiếu, nhu cầu tiêu dùng nước giới giúp đẩy mạnh sản xuất, tăng tính cạnh tranh - Trong giáo dục: giúp ta nắm số liệu tiêu, kết giảng dạy sở giáo dục, nắm tiến độ, kết người học, từ đưa kế hoạch tăng cường, giải pháp khắc phục vấn đề tồn đọng giáo dục Con số thống kê gương phản ánh toàn diện, trung thực, nói lên hiệu kinh tế việc làm Số liệu thống kê xác giúp lãnh đạo Đảng, nhà nước định hướng, ban hành sách phù hợp nhằm điều hành kinh tế – xã hội tốt hơn, thúc đầy kinh tế - xã hội phát triển Ứng dụng thống kê - Áp dụng chức thống kê vào đời sống, nhà phân tích, nghiên cứu tạo bảng biểu bao gồm số liệu, liệu, biểu đồ thể tất thông tin quan trọng cách ngắn gọn dễ hiểu đến cho người, từ giúp đưa giải pháp, định đắn đa dạng ngành nghề - Trong số tình cụ thể, người muốn biết xác số liệu khơng thể tính được, lúc người ta dùng phương pháp ước lượng khoảng tin cậy để tìm giá trị gần số liệu nằm khoảng định VD: Ngân hàng từ phân tích liệu khách hàng, họ muốn biết số tiền gửi trung bình tối thiểu hay tối đa khách, để từ đưa chiến lược phát triển cho ngân hàng Hay nhà máy, người ta muốn biết thời gian làm việc trung bình cơng nhân để làm lượng sản phẩm định áp dụng phương pháp ước lượng khoảng tin cậy, tính số liệu, giúp nhà máy đưa định đắn việc tối thiểu hóa chi phí th nhân cơng - Để đảm bảo bình ổn dân số, người ta điều tra sau ước lượng tỉ lệ sinh đẻ người dân vùng núi, người dân vùng đồng bằng, người dân miền Bắc, miền Trung so với nước để kịp thời đưa giải pháp dân số, kế hoạch hóa gia đình, - Người ta áp dụng phương pháp kiểm định giả thuyết tỉ lệ đám đông nhận báo cáo, kết điều tra, báo, để kiểm tra kết quả, số liệu hay sai, thấp hay cao so với thực tế VD: Cơ quan Y tế báo cáo tỷ lệ người mắc bệnh mắt địa phương Để kiểm tra lại, người ta điều tra ngẫu nhiên nhóm người địa phương áp dụng phương pháp thống kê để khẳng định số đưa quan Y tế xác hay khơng - Trong lĩnh vực kinh tế, nhờ có thống kê nên số, liệu tình hình kinh tế, kinh doanh doanh nghiệp nhiều vùng miền, nhiều ngành nghề ln ln có mặt kịp thời cho doanh nghiệp người dân nói chung Từ đó, thơng tin tình hình kinh tế ln ln cập nhật kịp thời, theo tiến độ phát triển thực tế thị trường - Kết trình thống kê cứ, sở cho nhà lãnh đạo doanh nghiệp, lãnh đạo nhà nước đưa nhiều định trọng đại, ảnh hưởng đến tình hình chung đời sống người - Trong lao động, thống kê thường sử dụng lĩnh vực khác lĩnh vực lao động Kế hoạch chiến lược tổ chức chủ yếu dựa vào nghiên cứu dự báo ngân sách Các chế kiểm soát, phụ trách phận tuân thủ, áp dụng dựa kết lịch sử thu từ nghiên cứu thống kê VD: sách phòng ngừa tai nạn nơi làm việc chuẩn bị dựa liệu tổng hợp liên quan đến yếu tố rủi ro có hoạt động kinh doanh - Trong bán hàng, giới bán hàng lên kế hoạch theo phân tích chi tiết nhu cầu người tiêu dùng, thị hiếu sở thích họ Việc đo lường chất lượng dịch vụ, mức độ hài lòng khách hàng từ xác định chiến lược bán hàng việc áp dụng kỹ thuật thống kê Đội ngũ bán hàng đánh giá dựa bảng tần số, kết đánh giá chuyển đổi thành tham số xác định mức độ hiệu làm việc nhân viên - Những số thống kê mang thông điệp thông tin sống cách vô khách quan, không bị ảnh hưởng yếu tố bất định người Vì thế, cơng cụ đắc lực để dẫn dắt đến hành động đắn, sáng suốt cho Vai trò xác suất thống kê - Chúng ta biết khoa học nghiên cứu hay sống có biến cố xảy cách ngẫu nhiên đến với Đó mà khơng thể dự đốn chắn có xảy với hay khơng, khơng biết có lợi hay có hại đến với Và thường gọi xác suất nghĩa khả xảy việc, vấn đề Trong sống biết xác xác suất nhiên tượng ngẫu nhiên có quy luật mà nghiên cứu tốn học phát Lý thuyết xác suất ngành khoa học nghiên cứu tính quy luật tượng ngẫu nhiên qua tính quy luật chúng Để từ giúp đánh giá nguy may rủi việc ngẫu nhiên - Cùng với thống kê tốn học có vai trò tầm quan trọng lớn sống xã hội.Thống kê toán học phương pháp khoa học phân tích xử lý liệu có nhờ thí nghiệm điều tra nghiên cứu vấn đề tự nhiên xã hội để từ liệu thu thập dựa vào quy luật xác suất để đưa định đánh giá dự báo tượng, vấn đề quan sát nghiên cứu - Thống kê bao gồm thống kê mô tả thống kê suy luận Mỗi loại có đặc điểm chức riêng biệt - Thống kê mô tả phương pháp thu thập, tóm tắt, trình bày, tính tốn, mơ tả đặc trưng khác giá trị trung bình, độ lệch chuẩn, để phản ánh cách tổng quan đối tượng nghiên cứu - Thống kê suy luận phương pháp ước lượng đặc trưng tổng thể, phân tích mối liên hệ tượng nghiên cứu, dự đoán đưa định sở thu thập thông tin từ kết quan sát mẫu II Lý thuyết thống kê toán Giả sử cần ước lượng tham số θ ĐLNN X Lấy mẫu ngẫu nhiên W = (X1,X2 , ,Xn) Từ ước lượng điểm tốt θ xây dựng TK: G = f (X1,X2,…,Xn, θ) Sao cho G có luật PPXS hoàn toàn xác định Với =1− cho trước, xác định ≥ 0, ≥ thỏa mãn + = Từ xác định phân vị P ( < G < ) = 1−− = 1− P(∗ 30 nên ≃N ( ) U = ≃ N(0,1) Phần lại tiến hành tương tự tường hợp có phân phối chuẩn với biết: Với đủ lớn, ta lấy ≈ Kiểm định giả thuyết thống kê - Giả thuyết quy luật phân phối xác suất, tham số đặc trưng, tính độc lập ĐLNN gọi giả thuyết thống kê, kí hiệu - Một giả thuyết trái với H0 gọi đối thuyết, kí hiệu - Giả sử ĐLNN X có tham số θ Từ sở ta tìm θ = coi giả thuyết : θ = Nghi ngờ tính đắn , ta xây dựng đối thuyết sau: • • • - Tiêu chuẩn kiểm định Từ mẫu W=(,, ,), ta xây dựng thống kê G = (,, ,) thống kê G chứa H0 đúng, thống kê G có quy luật phân phối xác suất hồn tồn xác định Khi đó, G gọi tiêu chuẩn kiểm định - Miền bác bỏ, quy tắc kiểm định Với mức ý nghĩa ∈ (0;1) bé, ta tìm miền , gọi miền bác bỏ, cho: P (G ∈ |) = a Nếu lần lấy mẫu, G nhận giá trị cụ thể cho: + ∈ ,bác bỏ chấp nhận + , chưa đủ sở bác bỏ - Có hai loại sai lầm sau: • Sai lầm loại 1: sai lầm bác bỏ Xác suất mắc sai lầm loại α • Sai lầm loại 2: sai lầm chấp nhận sai - Để kiểm định cặp giả thuyết thống kê ta tiến hành sau + Xác định toán kiểm định , + Xây dựng tiêu chuẩn kiểm định G + Tìm miền bác bỏ + Tính giá trị kết luận - Kiểm định giả thuyết kỳ vọng toán ĐLNN Giả sử ĐLNNX đám đơng có E(X•) = Var(X•) = μ chưa biết Từ sở đó, người ta cho rằng: = • Với mức ý nghĩa α cho trước, ta kiểm định giả thuyết : = TH1: ĐLNN X có phân phối chuẩn, σ2 đã biết Do X ∼ N (μ; σ2) ~ N (μ; ) Xây dựng tiêu chuẩn kiểm định: U = Nếu U ∼ N (0;1) Từ mẫu cụ thể ta tính được: = Quy tắc kiểm định: - Nếu : bác bỏ , chấp nhận - Nếu : chưa có sở bác bỏ H0 nên tạm thời chấp nhận H0 TH2: ĐLNN gốc X phân phối chuẩn, chưa biết, n< 30 Vì Do X ∼ N (μ; σ2) nên ta xây dựng thống kê T= Nếu H0 T ~ T(n-1) Từ mẫu cụ thể tính TH3: ĐLNN gốc X chưa biết luật phân phối xác suất hoặc X có phân phối chuẩn, n > 30 Vì n>30 nên ≃ N(μ; ) Ta xây dựng tiêu chuẩn kiểm định U= Nếu H0 U ≃ N (0,1) Nếu σ2 chưa biết, n >30 nên lấy σ ≈ s’ Ước lượng tỉ lệ 10 - Trên đám đơng kích thước N, có M phần tử mang dấu hiệu A, kí hiệu tỉ lệ phần tử mang dấu hiệu A đám đông P (A•) = M/N = p Bài tốn đặt ra: từ mẫu ngẫu nhiên thu được, ước lượng p - Để ước lượng p, từ đám đông ta lấy mẫu ngẫu nhiên kích thước n Kí hiệu nA số phần tử mang dấu hiệu A mẫu Khi ta tính tần suất f = hay tỉ lệ phần tử mang dấu hiệu A mẫu Vì n đủ lớn nên ≃ N ( p; ) U = ≃ N(0,1) PHẦN II: TỔNG QUAN Ước lượng Dạng tập 1: Ước lượng tham số của đại lượng ngẫu nhiên khoảng tin cậy Trường hợp: Ước lượng kỳ vọng toán Chưa biết luật phân phối xác suất X X có phân phối chuẩn, n>30: Vì n > 30 nên : X ≃ N (µ, ) U = Phần lại tiến hành tương tự trường hợp X có phân phối chuẩn với biết Dạng tập 2: Ước lượng tham số của đại lượng ngẫu nhiên khoảng tin cậy Trường hợp: Ước lượng tỷ lệ Vì n đủ lớn nên: f ≃ N (p,) Khi : U= 11 Dạng tập 3: Ước lượng tham số của đại lượng ngẫu nhiên khoảng tin cậy Trường hợp: Ước lượng phương sai Vì X~N(µ; Ta xây dựng tiêu chuẩn kiểm định: =~ Với độ tin cậy 1-ta tìm phân vị ; Khi đó: P= 1-a Kiểm định Dạng tập 1: Kiểm định kỳ vọng toán Trường hợp: ĐLNN X có phân phối chuẩn, σ2 biết Do X ∼ N (µ; a ) ⇒ X¯ ~ N (µ;) Xây dựng tiêu chuẩn kiểm định: U = Nếu H0 U ∼ N (0; 1) Từ mẫu cụ thể ta tính được: = 12 Dạng tập 2: Kiểm định tỷ lệ Trường hợp: ĐLNN gốc X phân phối chuẩn, σ2 chưa biết, n < 30 Do X ∼ N (μ; σ2) Xây dựng tiêu chuẩn kiểm định: T= Nếu H0 T ∼ T (n -1) Từ mẫu cụ thể ta tính được: Dạng tập 3: Kiểm định phương sai ĐLNN gốc X chưa biết luật phân phối xác suất X có phân phối chuẩn, n > 30 Vì n > 30 nên X¯ ≃ N (μ;) Ta xây dựng tiêu chuẩn kiểm định: U= Nếu H0 U ≃ N (0,1) Nếu σ2 chưa biết, n >30 nên lấy σ ≈ s’ 13 PHẦN III: BÀI TOÁN A Ước lượng Đề bài: Với độ tin cậy 95% Điều tra ngẫu nhiên 70 ngày số ca Covid-19 Austria, thấy số ca Covid-19 trung bình ngày 8000 ca Giả sử số ca mắc đại lượng ngẫu nhiên có phân phối chuẩn Hãy: Ước lượng vọng tốn: a, Ước lượng số ca Covid-19 trung bình ngày? b, Ước lượng số ca Covid-19 trung bình tối thiểu ngày? c, Ước lượng số ca Covid-19 trung bình tối đa ngày? Ước lượng tỉ lệ: a, Ước lượng tỉ lệ ngày có số ca Covid-19 ngày không 100 người? b, Ước lượng tỉ lệ tối thiểu ngày có số ca Covid-19 nhỏ 6000 ca? c, Ước lượng tỉ lệ tối đa ngày có số ca Covid-19 nhỏ 8000 ca? Ước lượng phương sai: a, Ước lượng phương sai số ca Covid-19 ngày? b, Ước lượng phương sai tối thiểu số ca Covid-19 ngày? c, Ước lượng phương sai tối đa số ca Covid-19 ngày? Bài làm Câu 1: Gọi X số ca mắc covid ngày Austria (đơn vị ca) số ca mắc trung bình ngày Austria mẫu (đơn vị ca) Gọi µ số ca mắc trung bình ngày Austria đám đông ( đơn vị ca) Với n = 70, độ tin cậy 95%, ta chọn thống kê U= N(0,1) a Khoảng ước lượng số ca mắc covid vòng ngày : ()=( - , ) = ( 8000 – 1,96 , 8000 + 1,96) = (6500,7; 9499,3) b, Khoảng ước lượng số ca covid trung bình tối thiểu: (, ) = ( - , +) = (8000 - 1,64.) = ( 6745,5 ; +) c, Khoảng ước lượng tối đa cho số ca covid ngày: (, )=( + ) = ( ; 8000 + ) =( Câu a, Gọi tỉ lệ ngày có số ca covid 100 (người) 14 = 0,1857 Với n= 70, độ tin cậy 95% ta chọn thống kê U = N(0,1) Khoảng ước lượng cho tỉ lệ ngày có số ca covid 100 ( ; ) = ; ) = (0,0946 ; 0,2768) b, Gọi là tỉ lệ ngày có số ca mắc covid nhỏ 6000 = 0,4286 Trong tự phần a, ta chọn thống kê U = N(0,1) Khoảng ước lượng tối thiểu cho tỉ lệ ngày có số ca covid nhỏ 6000 ( ;1) = (0,4286 – 1,64 ; 1) = (0,3316 ; 1) c, Gọi tỉ lệ ngày có số ca covid = 2,33 Ta có: = = 1,19 Dễ thấy nên với mức ý nghĩa α = 0,01 ta khơng có sở bác bỏ giả thuyết Nghĩa tỉ lệ mắc covid 19 ngày có số ca lớn 14500 0,2 c, Gọi f tỉ lệ mắc covid ngày nhỏ 10000 (ca) 17 => f = 0,5 Gọi P tỉ lệ mắc covid ngày nhỏ 10000 đám đông với mức ý nghĩa S’² = 0,01 ta cần kiểm định: H0: P = P0 = 0,1 H1: P < P0 Chọn thống kê U = ~ N (0,1) Theo nguyên lý xác suất nhỏ ta có miền bác bỏ: = {Utn: Utn < Uα} Với α = 0,01 => U0,01 = 2,33 Ta có Utn = Dễ thấy Utn Wα nên với mức ý nghĩa S’² = 0,01 ta sở bác bỏ giả thuyết H0 Nghĩa tỉ lệ mắc covid 19 ngày có số ca nhỏ 10000 10% Câu 3: Gọi X số ca mắc covid 19 ngày Có phương sai hiệu chỉnh là: S’² = 41832456 (ca²) a, Với mức ý nghĩa α = 0,01 ta chọn kiểm định: H0: = = 42000000 (ca²) H1: Chọn thống kê ² = ~ Áp dụng nguyên lí xác suất nhỏ có miền bác bỏ: Wα = { > } Với n = f0 , α = 0,01 => = 103,21 = = 68,725 Dễ thấy Wα => Khơng có sở bác bỏ giả thuyết H0 Có nghĩa độ phân tán số ca mắc covid 42000000 (ca²) b, Với mức ý nghĩa α = 0,01 ta chọn kiểm định H0: = = 43000000 (ca²) H1: S’² Chọn thống kê ² = ~ Áp dụng nguyên lí xác suất nhỏ có miền bác bỏ: Wα = { : < ;1-} Với n = f0 ; α = 0,01 => = 44,54 = Dễ thấy Wα => khơng có sở bác bỏ giả thuyết H0 Có nghĩa độ phân tán số ca mắc covid 19 ngày 43000000 (ca²) c, Với mức ý nghĩa α = 0,01 ta chọn kiểm định: H0: = = 40000000 (ca²) H1: S’² 18 Chọn thống kê ² = ~ Áp dụng ngun lí xác suất nhỏ có miền bác bỏ: Wα = {: > } Với n=f0 ; α = 0,01 => = 99,43 = Dễ thấy Wα Có sở bác bỏ giả thuyết H0 Có nghĩa độ phân tán số ca mắc covid 19 ngày 40000000 (ca²) 19 ... Tiêu chuẩn kiểm định Từ mẫu W=(,, ,), ta xây dựng thống kê G = (,, ,) thống kê G chứa H0 đúng, thống kê G có quy luật phân phối xác suất hồn tồn xác định Khi đó, G gọi tiêu chuẩn kiểm định - Miền... vào quy luật xác suất để đưa định đánh giá dự báo tượng, vấn đề quan sát nghiên cứu - Thống kê bao gồm thống kê mơ tả thống kê suy luận Mỗi loại có đặc điểm chức riêng biệt - Thống kê mơ tả phương... bác bỏ Xác suất mắc sai lầm loại α • Sai lầm loại 2: sai lầm chấp nhận sai - Để kiểm định cặp giả thuyết thống kê ta tiến hành sau + Xác định toán kiểm định , + Xây dựng tiêu chuẩn kiểm định G