Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 131 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
131
Dung lượng
7,51 MB
Nội dung
Chương iV MẪU THÔNG KÊ VÀ ước LƯỢNG THAM số m Từ chương ta bắt đầu nghiên cứu thốhg kê, lĩnh vực rộng tới mức khó đưa định nghĩa chung Mặc dù tóm tắt thơhg kê khoa học phân tích liệu (bao gồm thu nhập xử lý) nhằm thu nhận thông tin chân thực vê đôi tượng nghiên cứu vối độ tin cậy định rút kết luận hỢp lý Những định thống kê có ứng dụng to lớn như: dự báo, chẩn đoán, điều khiển ngẫu nhiên, kiểm tra chất lượng sản phẩm, thăm dò dư luận Cũng cần lưu ý vấn đề thông kê xuất có hai điều kiện; (i) có nhiều tình hVig cần phải lựa chọn (chọn một sơ); (ii) có thơng tin tình thông qua liệu thông kê Trong giáo trình chủ yếu nghiên cứu việc xử lý liệu sô mà ta hay gọi xử lý sơ'liệu §1 MẪU VÀ THỐNG KÊ MƠ TẢ 1.1 Mầu tập đám đông Trong công việc hàng ngày ta phải làm việc vói dãy sơ' liệu Chúng kết việc đếm quan sát, đo đạc nhờ thiết bị đo, tính tốn trước cần đưỢc thu thập, lưu trữ phản tích Để làm điều ta cần xếp lại sô', tổng hỢp xử lý bước đầu nhằm tìm kiếm thơng tin quan trọng tập sô" liệu Phần công việc vấn đề thu thập sô" liệu mang tên gọi thống kê mô tả 113 Dãy số liệu thốhg kê thường gọi mẫu Nó có nguồn gốc từ tập lớn mà ta gọi tập đám đơng hay tập Chính th ế mẫu mang thơng tin tập nền, thơng tin khác mẫu khác Sau xác định, ta giả sử tập lẫn mẫu tập số chất, đặc trưng cho sơ" khía cạnh đối tượng quan tâm Các sơ giá trị khác biến sô" Nếu tập giá trị có biến số có sơ" lượng hữu hạn, ta có biến rời rạc Đối vối biến liên tục, sô" lượng giá trị vô hạn không đếm tập số liệu phản ánh tập vối độ xác định Muốn có đầy đủ thơng tin đốì tượng đó, ta phải làm việc với tập Tuy nhiên việc nghiên cứu tập vơ khó khăn vì: - q lớn dẫn đến địi hỏi q nhiều chi phí vật chất thịi gian; - trình độ tổ chức nghiên cứu hạn chê đội ngũ làm việc với quy mô lớn, khơng nắm bắt kiểm sốt q trình nghiên cứu; — nhiều làm tập biến động nhanh, phần tử thay đổi thường xuyên, v.v ■Như việc nghiên cứu tập nền, trừ tập đủ bé, thường thực Từ đặt vấn đê' chọn mẫu nghiên cứu tập mẫu Nếu mẫu chọn ngẫu nhiên với số lượng đủ, hy vọng việc xử lý chúng cho ta kết vừa nhanh vừa đỡ tổh ir.à đạt độ xác tin cậy cần thiết 1.2 Vấn đề chọn mẫu Ta mong muốn mẫu có tính đại diện tốt cho tập việc nghiên cứu với mẫu cho ta độ tin cậy cao Hiẻn 114 có nhiều phương pháp khác để chọn mẫu, khó nói phương pháp tốt Việc chọn phương pháp lấy mẫu phù hỢp phụ thuộc vào tập đối tượng cụ thể vào thói quen sở trưịng nhà nghiên cứu ĩ Chọn mẫu ngẫu nhiên Trong phương pháp chọn mẫu ngẫu nhiên, phần tử tập có xác suất chọn xác định từ trước chọn mẫu Mẫu ngẫu nhiên cho phép đánh giá khách quan đặc trưng tập Có cách chọn sau: a) Chọn mẫu ngẫu nhiên đơn giản phương pháp chọn mẫu có tính chất: mẫu có kích cõ (cùng sơ" phần tử) có xác suất chọn phần tử tập có đồng khả lọt vào mẫu Đe việc chọn hoàn toàn ngẫu nhiên, ta tiến hành theo kiểu bốc thăm dùng bảng số ngẫu nhiên, để ý có hai phương thức chọn khơng hồn lại (mỗi phần tử chọn lần) có hồn lại Nếu sô" lượng phần tử mẫu bé so vối tập kết lấy mẫu theo hai phương thức sai lệch khơng đáng kể Do tính ngẫu nhiên nên mẫu có tính đại diện cao tin cậy Tuy nhiên phương pháp địi hỏi phải biết tồn tập th ế chi phí chọn mẫu lớn b) Chọn mẫu phân nhóm: Đầu tiên ta chia tập thành nhóm tương đốì nhất, sau từ nhóm trích mẫu ngẫu nhiên; tập hỢp tất mẫu cho ta mẫu (ngẫu nhiên) phân nhóm Ngưịi ta dùng phương pháp nội tập có sai khác lốn Nhà nghiên cứu phải có hiểu biết định cấu trúc tập để phân chia nhóm hỢp lý Sau nhóm có vai trò khác phụ thuộc vào độ quan trọng chúng tập Hạn chế phương pháp tính chủ quan phân chia nhóm Nhưng hay dùng cách thức đơn giản làm việc vối nhóm bé 115 c) Chọn mẩu chùm chọn mẫu ngẫu nhiên tập tập nền, đưỢc gọi chùm Ta giả sử phần tử chùm man^ tính đại diện cho tập Ngoài ta cố gắng cho chùm có độ phân tán cao tập đồng quy mô Chẳng hạn ta muốn nghiên cứu nhu cầu tiêu thụ mặt hàng phương pháp chọn mẫu chùm: ta chia thành phô' thành khu dân cư, sau chọn số khu làm phần tử mẫu, cuối ta nghiên cứu tất gia đình sống khu dân đưỢc chọn Phương pháp cho ta tiết kiệm kinh phí thịi gian (vì khơng phải di chuyển tồn thành phố), sai sơ" lớn hai phvíờng pháp Chọn mẩu có suy luận Phương pháp chọn mẫu dựa ý kiến chuyên gia đôl tưỢng nghiên cứu Như việc chọn mẫu dựa hiểu biết kinh nghiệm vài nhà chuyên mơn Tuy nhiên phương pháp có hạn chế bản; Khi khơng có tham gia cịng cụ thống kê vào việc chọn mẫu tính khách quan khó bảo đảm, từ kéo theo kết luận mang nặng tính chủ quan Tất nhiên điều khơng có nghĩa khơng nên dùng phvíơng pháp chuyên gia Rất rõ ràng chất lượng mẫu phụ thuộc nhiều vào trình độ nhà nghiên cứu kinh nghiệm họ hy vọng trỏ thành cơng cụ hữu hiệu 1.3 Phân loại mị tả sô liệu mẫu Phân loại Giả sử từ tập có N phần tử, ta chọn mẫu có kích thưóc n, phần tử mẫu ký hiệu X ị, i = l , n Tập n giá trị Xi, tạo mẫu đơn Nhiều mẫu có nhiều giá trị giông nhau: chẳng hạn giá trị a:i xuất lần, X2 xuất Uo lần, x^ xuất iXỵ lần; Ồ.Ĩ ìij + ÌI2 + + Uị,- n Trong thực hành có nhiều sơ’ liệu cho dưối dạng khoảng: 116 Thí dụ 1.1 Chiều cao 300 học sinh 12 tuổi cho bảng sô" liệu: Ta đê ý số liệu khoảng có độ dài (tuy nhiên nói chung độ dài khơng ■đều) Trong trường hỢp ta có mẫu lớp (mẫu cho dạng nhiều lớp khoảng không cắt nhau) C hiểu c a o (cm ) S ố lư ộn g 1 ,5 -1 2 ,5 2 ,5 - 127,5 ,5 - 132,5 ,5 - 137,5 ,5 - 142,5 142,5 - 147,5 ,5 - 152,5 33 74 93 64 21 ,6 Tần s ố bảng tần sô' S ố lầ n xuất Xi lớp th ứ i đó, ký hiệu Hi, gọi tần sô' Sau xếp sô" liệu theo thứ tự tăng giá trị mẫu, ta xây dựng bảng tần số Bảng sơ" thí dụ 1.1 bảng tần sơ" (hay cịn gọi phân phối tần sơ) Bảng bao gồm lốp, lớp có độ dài cm tồn có 300 số liệu đo chia thành tần sô” lốp Thông thường người ta hay chia sô' liệu vào từ đến 15 lốp phụ thuộc vào nhiều yếu tô’ số lượng sơ' liệu, mục đích xử lý Để ý số lốp nhiều hơn, làm tơ"t hđn phân tích, việc cải thiện khơng nhiều, ngưỢc lại sơ" ỉớp q, có khả bị mát nhiều thông tin Mỗi sơ" liệu có mặt lớp, độ dài lốp hiệu giá trị lốn nhâ't bé Thông thường người ta hay biểu diễn phân phôi tần sô" đồ thị để quan sát nghiên cứu trực giác Có hai dạng biểu diễn đồ thị hay dùng biểu đồ đa giác tần số a) Biểu đồ Biểu đồ bao gồm hình chữ nhật cạnh có đáy độ dài chiều cao số quan sát lớp sơ' liệu tương ứng 117 Trên hình 1.1 cho ta biểu đồ ứng với bảng tần suất thí dụ 1.1 Sô" lượng h/s n 90 -■ 60 -30 117,5 122,5 127,5 132,5 137,5 142,5 147,5 152,5 X, (chiều cao) Hình 1.1 Biểu đ tẩn s ố Rõ ràng diện tích hình chữ nhật tỷ lệ vói tần sơ" lớp tương ứng b) Đa giác tần sơ' Đa giác tổn sơ'ìằ đường gâp khúc nốĩ điểm có hồnh độ Xị tung độ rii (hoặc điểm có hồnh độ lốp sô" liệu thứ i tung độ Đa giác tần sơ"của thí dụ 1.1 vẽ hình 1.2 n, 90 60 l /\ r~ ^ 1 Ị 1 1 1 1 1 ! / 30 + / /j \ 1 1 "õ Hình 1.2 Đa giác tẩn s ổ llb r ^ Ta thấy đa giác tần số dễ xây dựng dễ dùng biểu đồ Ngoài hiệu hai hoành độ liên tiếp bé, đường gấp khúc ngày trơn dần tiến tới tíạng hàm mật độ xác suất Tần suất phân phối thực nghiệm Từ bảng tần số rii Xi Xz «1 «2 Xk n rik ta đặt fị tần suất xuất giá trị X ị n mẫu ta mơ tả bảng tần suất tương ứng Rõ ràng từ định nghĩa /] ta có + /"2 + + /"^ = bảng tần suất 0:2 X,A h o:,- Xk f fk giông với bảng phân phơi xác st biến ngẫu nhiên rịi rạc Nếu đặt i - ly k y \ ằ tần số tích lũy Xị F^{xỊ) tần suất tích lũy Xị, ta có hàm X, gọi hàm phân phối thực nghiệm mẫu hàm phân phối mẫu Chú ý theo luật số* lốn (định lý Béc-nu-li) = p [ x < x), X biến ngẫu nhiên gốc cảm sinh tập đám đông (và tập mẫu) Như hàm phân phối mẫu dùng để xấp xỉ luật phân phơi tập Thí dụ 1.2 Ta xây dựng bảng tần suất tần suất tích lũy ứng với sơ^ liệu thí dụ 1.1 119 Tần sơ" Tần suất Lớp Tần sô" 1 ,5 -1 2 ,5 9 0,030 0,030 2 ,5 - 127,5 33 42 0,110 0,140 ,5 - 132,5 74 116 0,247 0,387 ,5 - 137,5 93 209 0,310 0,697 ,5 - 142,5 64 273 0,213 0,910 ,5 - 147,5 21 294 0,070 0,980 ,5 - 152.5 300 0,020 1,000 tích lũy Tần suất tích lũy Tương tự ta xây dựng biểu đồ tần suất đa giác tần suất tương ứng Ngồi vẽ đồ thị đa giác tần suất tích lũy tần sơ" tích lũy (xem hình 1.3) Hình 1.3 Đa giác tẩn suất tích lũy 120 §2 MẪU NGẪU NHIÊN VÀ CÁC ĐẶC TRƯNG MẪU 2.1 Mầu ngẫu nhiên từ tập Mẫu ngẫu nhiên Trong phân tích thơng kê cổ điển người ta chấp nhận giả thiết phần tử tập đám đơng cảm sinh biến ngẫu nhiên gốc Trong thực hành biến ngẫu nhiên gốc thường tuân theo luật phân phối chuẩn c4^a, ơ^), chưa biết rõ dạng, chưa biết tham số Việc phân tích để xác định phân phôi tập dựa sô" liệu mẫu Giả sử bây giồ ta tiến hành n phép thử độc lập để xác định giá trị m ẫu (biến ngẫu nhiên g ố c tập ký hiệu X) Gọi X, biến ngẫu nhiên giá trị thu phép thử thứ ỉ, ỉ = 1, n; rõ ràng X, tạo nên tập biến ngẫu nhiên độc lập có phân phơi vối X Sau thử nghiệm, Xi có giá trị xác định X,, đưỢc gọi giá trị quan sát hay th ể mẫu Để đảm bảo tính đại diện tập a:„}cho tập nền, ta cần dựa khái niệm mẫu ngẫu nhiên Đ ịnh n g h ĩa Ta gọi mẫu ngẫu nhiên kích thước n từ tập có biến ngẫu nhiên gốc X tập biến Xị, X 2, x„ thỏa mãn điều kiện: (i) độc lập thống kê, (ii) có phân phôi xác suất vối biến X Các Xi thỏa mãn hai tính chất gọi biến ngẫu nhiên độc lập đồng phân phôi Như khái niệm mẫu mà ta đưa vào tiết trưốc hiểu thể mẫu ngẫu nhiên Để ý giả, thiết độc lập cho phép làm đơn giản nhiều tính toán sau Chẳng hạn biến gốc X rời rạc, có hàm xác suất p{x), hàm xác suất đồng thời (Xi, X 2, 121 p^{x„ ,x,^)^P{X, = x^, ,X^ =x„) = Ị ^ p (x ,) (2 la) í-1 Tương tự biến X liên tục có mật độ f{x) -.^ J = (2 -lb) 1=1 Như từ (2.1) phân phối đồng thòi biểu diễn đơn giản qua phân phơ'i biến th àn h phần Ngồi luật phân phơi đồng thịi cịn phụ thuộc vào tham sô” chưa biết Thống kê Đ ịn h n gh ĩa Một hàm y = gỌíi, X 2, x„) phụ thuộc vào tập giá trị mẫu ngẫu nhiên gọi thống kẽ Chú ý thống kê hàm đo (khái niệm 15" thuyết hàm) không phụ thuộc vào tham số chưa biêt Do X, n h ậ n giá trị tương ứng X,, nên hàm x„) gọi thơng kê Thí dụ 2.1 Xét tập hỢp giá trị mẫu (Xi, x-2 , X,x hàm sau gọi thống kê: a) g{x„ ,x,,) = - Ỳ ^ X i = X; b) = - x f ; ^ 1=1 c) = o:(i, coi ệ{x) = 0,5 Chú ý 0) P(| z I < Xo) = P(-Xo < X < Xo) = ộ {x q ) , P ( X < Xo) = (p(xq) + 0,5 = Fixo), P ( X < -Xo) = 0,5 P ( X > X q) = 0,5 - ệ{xo), ộ{Xo) Nếu X ~ oV{a, ơ^), nên làm phép biến đổi Y - —— — việc tra bảng đốì với biến X chuyển thành đốì với biến Y ~ l ỉ (0, 1) Nếu biết giá trị ệ(xo), mn tìm lại Xo, q trình tra bảng ngược lại với bên Để tìm giá trị „ cho P{X < a) - oc biết rằn g X ~ t{n) việc tra bảng đơn giản; dóng hàng "n" cột "a" tương ứng (chẳng hạn í(8; 0,95) = 1,860) Việc tìm ớị, > cho P{X > Oị,) = a với X ~ t{n) tương đương với việc tra bảng tìm - K i-n ■Do tính đơi xứng, mn tìm ớ* < cho P{X > Oị,) = a, ta tra bảng tìm , sau = -í„ 1_ a ■ 237 Trong ba tham sô" n, a vầ tna nê\i biết hai ta tìm tham sơ"thứ Ci cùng, n > 30, thay tìm 9b = 1- a ta tìm 6(j ^ cho ^(ớj) = từ bảng Láp-la-xơ Để tìm giá trị xl^ cho P(X