1. Trang chủ
  2. » Giáo án - Bài giảng

Giao an thong ke

55 25 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 55
Dung lượng 0,96 MB

Nội dung

học viện khoa học quân Khoa K18 giáo án môn: Xác suất Thống kê Bài: Thống kê Chuyên nghành: TSKT Đối tợng: Dùng cho đào tạo CN TSKTVTĐ Giảng viên : Thng tỏ, ths Phm Hong Anh Hà nội, tháng năm 2013 kế hoạch giảng phê duyệt ngày tháng năm 200 CH NHIM KHOA Môn: Xác suất Thống kê Bài : Thống kê Đối tợng : Đào tạo CNTSKT ý định giảng I Mục đích Cung cấp cho học viên kiến thức về: - Lý thuyết mẫu, cách mô tả mẫu đặc trng mẫu - Phơng pháp ớc lợng tham số ĐLNN - Cách kiểm định giả thuyết thống kê II Yêu cầu Học viên nắm vững kiến thức học, hiểu sâu sắc khái niƯm, tÝnh chÊt, c¸c phÐp to¸n vỊ lý thut mÉu, ớc lợng tham số cách kiểm định giả thuyết thống Trên sở học viên biết vận dụng vào làm tập liên quan III Nội dung chính, trọng tâm, trọng điểm - cách mô tả mẫu đặc trng mẫu - Phơng pháp ớc lợng tham số ĐLNN khoảng tin cậy - Cách kiểm định giả thuyết thống kª IV Thêi gian - Tỉng sè 22 tiÕt - lªn líp…………tiÕt - lun tËp……… V Tỉ chøc: - lªn lớp 22 tiết - Thảo luận - thực hành VI Địa điểm: Lớp học VII Vật chất , tài liệu: - Giảng viên: Giáo án, giáo trình - Học viên: giáo trình trình tự giảng st t Néi dung Ch¬ng Lý thuyÕt mÉu Bài Khái niệm đám đông mẫu Bài Các phơng pháp mô tả mẫu Bài Các đặc trng mẫu quan trọng Bài Quy luật phân phối xác suất số thống kê quan trọng tổ ng 22 tiế t ngà y đê m Phơng Vật pháp ch GV HV ất Thuy ết trìn h kết hợp gợi mở vấn đáp Bài (tiếp theo) Chơng ớc lợng tham số ĐLNN Bài Ước lợng điểm Bài 2.Ước lợng khoảng tin cËy Bµi ( tiÕp ) Bài ( tiếp ) Chơng Kiểm định giả thuyết thống kê Bài Khái niệm kiểm định giả thuyết thống kê thời gian Bài Kiểm định giả thuyết tham số Bài2 ( tiếp) ôn tập thi học phần Ngày thángnăm 2013 Ngời làm kế hoạch Thng tỏ, ths Phm Hong Anh Nội dung huấn luyện Phần II Thống kê toán Chơng Lý thuyết mẫu Bài khái niệm đám đông mẫu 1.1 Đám đông Giả sử ta cần nghiªn cøu mét hay nhiỊu dÊu hiƯu thĨ hiƯn trªn tập hợp gồm N phần tử, tập hợp N phần tử đợc gọi đám đông (còn đợc gọi tổng thể hay tập nền), N đợc gọi kích thớc đám đông Dấu hiêu cần nghiên cứu định lợng định tính Chẳng hạn công nhân ngành kinh tế dấu hiệu định lợng mức lơng hàng tháng công nhân bậc thợ dấu hiệu định tính giới tính công nhân khu vực kinh tế công nhân làm Tuy nhiên dấu hiệu định tính chuyển dấu hiệu định lợng phơng pháp biến giả (xem chơng (10) Thông thờng kích thớc N đám đông hữu hạn, song trờng hợp số lợng phần tử đám đông lớn nắm bắt đợc toàn phần tử đám đông ta coi kích thớc đám đông vô hạn Ví dụ 1: Cần nghiên cứu mức tiêu thụ X loại thực phẩm gia đình quận nội thành Hà Nội tháng đám đông tập hợp tất gia đình quận kích thớc đám đông số gia đình quận Ví dụ 2: Cần nghiên cứu trọng lợng X gói hàng máy tự động đóng đám đông tất gói hàng máy đóng Vì máy đóng, đóng đóng nên ta coi kích thớc đám đông N = + Giả sử đám đông kích thớc N, dấu hiệu định lợng cần nghiên cứu X nhận giá trị x 1, , x2,, xk với tần số tơng ứng N1, Ni,, Nk TÊt nhiªn ta cã k  N i N , i 1 ®ã  Ni  N với i Theo định nghĩa suất, ta có P(X=xi) = Ni/N = pi, (i = 1,…, k) r»ng X lµ ĐLNN điều tra tất đám đông luật phân phối xác suất định với bảng phân phối xác suất: cổ điển xác Điều phần tử X hoàn toàn xác X x1 xi xk P p1 pi pk Đại lợng ngẫu nhiên X đợc gọi ĐLNN gốc, phân phối xác suất X đợc gọi phân phối lý thuyết số đặc trng X đợc gọi tham số đám đông (hay tham số lý thuyết) 1.2 Mẫu Để nghiên cứu dấu hiệu X thể đám đông kích thớc N, ta phải điều tra tất phần tử đám đông, nhng điều thờng thực đợc lý do: - Khi N = + , rõ ràng ta điều tra đợc tất phần tử đám đông - Trong số trờng hợp phần tử sau nghiên cứu bị phá huỷ, lúc việc nghiên cứu toàn đám đông vô nghĩa - Điều chủ yếu N lớn việc nghiên cứu toàn đám đông đòi hỏi nhiều chi phí vật chất thời gian Vì từ đám đông ngời ta lấy tập hợp nhỏ gồm n phần tử để nghiên cứu dựa vào mà đa kết luận dấu hiệu X toàn đám đông Tập hợp n phần tử đợc gọi mẫu, n đợc gọi kích thớc mẫu 1.3 Các phơng pháp chọn mẫu Vì từ thông tin cđa mÉu ta sÏ ®a kÕt ln vỊ dấu hiệu cần nghiên cứu toàn đám đông nên ta phải lấy mẫu cách khoa học cho mẫu đại diện cách khách quan, trung thực cho đám đông theo dấu hiệu cần nghiên cứu Nếu mẫu không đại diện trung thực cho đám đông từ thông tin thu đợc mẫu, ta có kết luận sai lệch dấu hiệu cần nghiên cứu Tuỳ trờng hợp cụ thể ta áp dụng cách chọn mẫu thông dụng sau: - Chọn ngẫu nhiên đơn giản có hoàn lại - Chọn ngẫu nhiên đơn giản không hoàn lại - Chọn điển hình - Chọn máy móc Ngoài cách chọn mẫu trên, có nhiều cách lấy mẫu khác (xem [8]) Để hiểu đợc chọn ngẫu nhiên đơn giản có hoàn lại, chọn ngẫu nhiên đơn giản không hoàn lại, trớc hết ta nghiên cứu xem chọn ngẫu nhiên đơn giản, chọn ngẫu nhiên đơn giản cách chọn phần tử mẫu đợc chọn cách ngẫu nhiên phần tử từ đám đông Ví dụ để đợc mẫu kích thớc n từ đám đông kích thớc N ta tiến hành nh sau: Đánh số phần tử đám đông từ đến N Sau viết số tự nhiên từ đến N lên N thẻ giống Xáo trộn N thẻ rút ngẫu nhiên thẻ một, rút n thẻ Khi phần tử có số trùng với số n thẻ rút phần tử mẫu Tuy nhiên thực tế để chọn mẫu ngẫu nhiên đơn giản ngời ta k hông dùng thẻ mà thờng dùng bảng số ngẫu nhiên, dùng phần mềm máy tính Sau ta nghiên cứu kỹ cách chọn a Chọn ngẫu nhiên đơn giản có hoàn lại chọn ngẫu nhiên đơn giản phần tử một, nhng phần tử thứ hai đợc chọn sau trả phần tử thứ vào đám đông, phần tử thứ ba đợc chọn sau trả phần tử thứ hai vào đám đông Mẫu đợc chọn nh đợc gọi mẫu lặp b Chọn ngẫu nhiên đơn giản không hoàn lại chọn ngẫu nhiên đơn giản phần tử một, nhng không trả lại đám đông phần tử đợc chọn (hoặc chọn ngẫu nhiên liền lúc n phần tử) Mẫu đợc chọn nh gọi mẫu không lặp lại Nh mẫu lặp, phần tử đợc chọn nhiều lần, mẫu không lặp, phần tử đợc chọn nhiều lần c Chọn điển hình cách chọn mẫu đợc chọn từ toàn đám đông mà từ phận "điển hình" Ví dụ: để kiểm tra chất lợng sản phẩm đợc sản xuất từ nhiều máy khác nhau, ngời ta không chọn mẫu từ kho sản phẩm nói chung, mà chọn từ lô sản phẩm máy d Chọn máy móc cách chọn đám đông đợc chia ngẫu nhiên số nhóm số phần tử mẫu Sau từ nhóm ta chọn ngẫu nhiên phần tử Trong thực tế ngời ta thờng phối hợp cách chọn mẫu nói Ngời ta chứng minh đợc (xem s3 chơng III) kích thớc đám đông lớn kích thớc mẫu nhỏ so với kích thớc đám đông cách chọn mẫu có hoàn lại k hông hoàn lại cho kết xấp xỉ nh Đặc biệt kích thớc đám đông N = + khác biệt hai cách chọn mẫu không Do đó, thực tế ngời ta thờng dùng cách chọn mẫu không lặp, nhng lại áp dụng công thức mẫu lặp Trong giáo trình này, ta giả thiết mẫu đợc lấy theo cách chọn ngẫu nhiên đơn giản có hoàn lại, trờng hợp khác ta sÏ nãi thĨ sau 1.4 MÉu ngÉu nhiªn Gi¶ sư ta cã mÉu kÝch thíc n Gäi Xi giá trị quan sát dấu hiệu cần nghiên cứu X thể phần tử thứ i mÉu, i = 1,…, n V× mÉu lÊy tõ đám đông theo phơng pháp ngẫu nhiên đơn giản có hoàn lại nên X i (i = 1,2., n) ĐLNN độc lập có luật phân phối xác suất với ĐLNN gốc X Định nghĩa: Mẫu ngẫu nhiên kích thớc n tập hợp n ĐLNN độc lập X1, X2, Xn đợc rút từ đại lợng ngẫu nhiên gốc X có luật phân phối xác suất với X Mẫu ngẫu nhiên kích thớc n đợc ký hiệu là: W = (X1, X2, Xn) Trong lần lấy mẫu ĐLNN Xi nhận giá trị xi (i = 1, 2,, n) Tập hợp n giá trị x1, .x2 tạo nên giá trị mẫu ngẫu nhiên W = (X1, X2, Xn) đợc gọi mẫu cụ thể, ký hiệu là: w = (x1, x2, xn) Bài phơng pháp mô tả mẫu 2.1 Dãy số liệu thống kê Giả sử lần lấy mẫu kích thớc n ta đợc mẫu cụ thể nh sau: w = (x1, x2, xn) Trong xi giá trị quan sát dấu hiệu X thể phần tư thø i cđa mÉu (i = 1,2,….n) D·y c¸c giá trị quan sát x 1, x2, xn đợc gọi dãy số liệu thống kê Ví dụ: Theo dâi doanh thu cđa mét cưa hµng 10 ngµy ta đợc dãy số liệu thống kê (đơn vị triƯu ®ång): 10, 15, 9, 12, 8, 11, 14, 13, 16, 11 2.2 Bảng phân phối thực nghiệm Dãy số liệu thống kê thu thập đợc nhiều cha đợc trình bày theo trật tự định nên gây khó khăn cho việc nghiên cứu Vì sau có dãy số liệu thống kê , ngời ta thờng xếp hệ thống chúng lại theo thứ tự tăng dần giảm dần trình bày chúng dới dạng bảng phân phối tần số thực nghiệm bảng phân phối tần suất thực nghiệm a) Bảng phân phối tần số thực nghiệm tổng quát có dạng: xi (hc X) x1 x2 … xi … xk ni n1 n2 … ni … nk Trong ®ã ni(i = 1,2,,k) tần số giá trị quan sát x i TÊt nhiªn ta cã k  ni n i b) Bảng phân phối tần suất thực nghiệm tổng quát có dạng: xi (hoặc X) x1 x2 xi … xk fi f1 f2 … fi … fk Trong ®ã fi = ni / n (i = 1,2,…,k) tần suất giá trị quan sát xi Tất nhiªn ta còng cã: *  fi  , (i = 1,2,….,k) * k  fi 1 i 1 VÝ dơ: KiĨm tra ®êng kÝnh cđa 10 trơc máy máy tự động sản xuất ta cã d·y sè liƯu thèng kª (tÝnh theo cm): 19,9; 20,1; 20; 19,9; 20; 19,8; 20; 19,9; 20 Gäi X đờng kính trục máy, ta có: - Bảng phân phối tần số thực nghiệm: X 19,8 19,9 20 20,1 ni B¶ng 1.1 - Bảng phân phối tần suất thực nghiệm: X 19,8 19,9 20 fi 0,1 0,3 0,4 20,1 0,2 B¶ng 1.2 Các bảng phân phối thực nghiệm đợc gọi bảng phân phối thực nghiệm rời rạc c) Trong trờng hợp ĐLNN X liên tục nÕu X rêi r¹c nhng kÝch thíc mÉu n lín, giá trị X sai khác ngời ta chia giá trị X thành lớp Khi bảng phân phối thực nghiệm có dạng: Lớp Trung tâm lớp xi Tần số ni Tần suÊt fi x’1 - x2’ x1 n1 f1 … … … … xi’- xi+1’ xi ni fi … … … … xk’ - xk+1’ xk nk fk Trong ®ã líp (xi’-xi+1’) lµ líp thø i: i = 1,2,…, k xi trung tâm lớp thứ i ni tần số lớp thứ i fi tần suất lớp thứ i Ví dụ 2: Để theo dõi trình làm việc máy tự động ngời ta kiểm tra ngẫu nhiên 100 sản phẩm máy sản xuất có bảng phân phối thực nghiệm chiều dài sản phẩm nh sau (đơn vị tính cm) Lớp Trung tâm lớp xi Tần số ni TÇn suÊt fi 5,78 - 5,80 5,79 14 0,14 5,80 5,82 5,84 5,86 - 5,82 5,84 5,86 5,88 5,81 5,83 5,85 5,87 23 29 25 0,23 0,29 0,25 0,09 Bảng 1.3 2.3 Hàm phân phối thực nghiệm Cho X với bảng phân phối tần số thực nghiệm: X x1 x2 … xi … xk ni n1 n2 … ni nk Giả sử x số thực Gọi nx số quan sát có giá trị nhỏ x, n kích thớc mẫu Ta thấy nx/n tần suất biến cố (X xk VÝ dơ: LËp vµ vÏ đồ thị hàm phân phối thực nghiệm X cho bảng 2.1 Ta có: Với x 19,8 nx =0 giá trị quan sát X bé x, F*(x) = nx/n =0/10 = Víi 19,8 < x  19,9 th× nx =1, ®ã F*(x) = nx/n = 1/10 =0,1 Víi 19,9 < x  20 th× nx = + 3, ®ã F *(x) = nx/n = 4/10 = 0,4 Víi 20 < x  20,1 th× nx = 1+3+4 = 8, ®ã F*(x) = nx/n = 8/10=0,8 Víi x > 20,1 th× nx = + + + = 10, ®ã F *(x) = nx/n =10/10=1 Nh vËy ta cã: F*(x) = x  19,8 0,1 19,8u) = Vì bé, nên thực hành coi biến cố (U>u) biến cố có Nên lần lấy mẫu x mà utn>u giả thiết H0 tỏ không / n ta tìm đợc utn đúng, ta có sở để bác bỏ H0 Do ta có miỊn b¸c bá W =  utn;utn  u  Quy tắc kiểm định: Từ mẫu cụ thể w= (x1xn) ta tính đợc utn 47 + Nếu utn W( tức utn> u) ta bác bỏ H0 chấp nhận H1 + NÕu utn W (tøc lµ utn �u) ta chấp nhận H0 Ví dụ: Theo quy định, 1kg đỗ đem ủ giá thu đợc 5kg giá Có ý kiến cho lợng giá thu từ kg đỗ có khả cao Để kiểm tra lại, ngời ta đem 49kg đỗ ủ riêng kg tính đợc lợng giá trung bình thu đợc từ 1kg đỗ 5,8kg Giả sử lợng giá thu đợc từ 1kg đỗ ph©n phèi theo quy lt chn víi  = 0,4kg Víi møc ý nghÜa  = 0,05 h·y cho ý kiến điều nghi ngờ Giải: Gọi X lợng giá thu đợc từ 1kg đỗ Gọi X lợng giá trung bình thu đợc từ 1kg đỗ mẫu Gọi lợng giá trung bình thu đợc từ 1kg đỗ đám đông Với mức ý nghĩa = 0,05 cần kiểm định H0 : = H1 :  > X / n Xây dựng tiêu chuẩn kiểm định U Tra bảng ta cã u = u0,05 = 1,65 VËy ta cã miỊn b¸c bá W =  utn;utn  1,65 5,8 5,0 14 1,64utn W nên ta bác bỏ H0 0,4/ 49 Ta cã utn  VËy víi møc ý nghÜa  = 0,05 ta cã thĨ nãi r»ng lỵng giá trung bình thu đợc từ 1kg đỗ lớn 5kg H0 : Bài toán 3: Với mức ý nghĩa cần kiểm định H1 :    � Ta vÉn dïng tiêu chuẩn kiểm định (3.2) Nếu H0 : U N(0,1) Víi  cho tríc ta cã thĨ t×m đợc phân vị chuẩn u cho P (U 30 ta sử dụng tiêu chuẩn (3.2) tiến hành nh mục 2.1.1, nhng đến tìm utn ta thay ớc lợng không chệch tốt nhÊt cđa nã lµ s' 2.1.3 Cha biÕt quy lt phân phối xác suất X nhng n>30 Theo (1.9) n > 30 Đ LNN trung bình mẫu X có phân phối xấp xỉ chuẩn N(, 2/n) Khi giả thuyết H0 X thống kê U có phân phối xấp xỉ chuẩn N(0,1) / n Phần lại tiến hành nh mục 2.1.1 Ví dụ: Điều tra giá gạo tẻ 36 điểm bán lẻ ngày thành phố Hà Nội tính đợc giá gạo trung bình 3100đồng/kg độ lệch chuẩn mẫu điều chỉnh 400 ®ång Víi møc ý nghÜa  = 0,001 cã thĨ nói giá gạo tẻ trung bình lớn 3000 đồng kg hay không? Giải: Gọi X giá gạo tẻ Hà Nội Gọi X giá gạo tẻ trung bình Hà Nội mẫu Gọi giá gạo tẻ trung bình Hà Nội đám đông Với mức ý nghĩa = 0,001cần kiểm định H0 :  = 3000 H1 :  > 3000 Xây dựng tiêu chuẩn kiểm định ttn 53 X 3000 U / n Vì n>30 nên X N(, 2/n) Nếu H0 Đ LNN U có ph©n phèi xÊp xØ N(0,1) Víi  = 0,001 cho trớc ta tìm đợc phân vị chuẩn u cho P(U>u) =  VËy ta cã miỊn b¸c bá W = utn ; utn> u Ta cã u = u0,001 = 3,09 Vậy miền bác bỏ W  = utn ; utn> 3,09 3100 3000 1,5  3,09 utn W Theo đầu ta có: utn 400 36 nên ta cha có sở b¸c bá H0 VËy víi møc ý nghÜa  = 0,001 ta nói giá gạo tẻ trung bình 3000 đồng kg 2.2 Kiểm định giả thuyết phơng sai Đ LNN phân phối chuẩn Xét Đ LNN X, giả sử X ~ N(, 2), cha biết Với mức ý nghĩa cần kiểm định giả thuyết H 0: = 02 Từ đám đông lấy mẫu ngẫu nhiên kích thíc n: W=(X1,… n n X  X ; S '  (X i  X )2 Xn) Từ mẫu ta tính đợc i n i 1 n  i 1 X©y dùng tiêu chuẩn kiểm định (n 1)S'2 20 Theo (1.7) H0 ~ (n-1) Ta có toán nh sau: H : 20 Bài toán 1:  2  H1 :    Ta tìm đợc phân vị 2(/n2 1)  12(n/12) cho 1) 1) P[(2  12(n  2(n  / )  (  / )] Vì bé nên thùc hµnh biÕn cè 1) 2(n1) cã thĨ coi lµ biÕn cè [(2  12(n )  (     /  / )] kh«ng thể có Nên lần lấy mẫu, ta tìm đợc (n 1)s'2 tn 20   12(n/12) hc 2tn   2(/n2 1) giả thuyết H0 tỏ không Ta có sở bác bỏ H0 Vậy ta có miền bác bá 54 W =  2 tn ;  tn  12(n/12) hc  2tn   2(/n2 1)   H :   20 Bài toán 2: 2 H1 : Ta tìm đợc phân vị 2(n 1) cho P(   2(n 1) ) Lập luận tơng tự nh to¸n ta cã miỊn b¸c bá W =  2 tn ;  tn   2(n 1)   H :   20 Bµi to¸n 3:  2  H1 :   Ta tìm đợc phân vị 12(n 1) cho P(  12(n 1) )  Vậy miền bác bỏ giả thuyết H0 W =  2 tn ;  tn  12(n 1) Công thức tìm P - giá trị ( HV tự đọc tài liệu) H : 20 Đối với toán 1: 2  H1 :    P - giá trị = 2P(2 > tn2) P(2 > tn2) 0,05 P - giá trị = 2P(2 < tn2) nÕu P(2 < tn2) < 0,5 §èi víi toán 2: P - giá trị = P(2 > tn2) P - giá trị = P(2 > tn2) H : 20 Đối với toán 3: P - giá trị = P(2 < tn2) 2  H1 :    Trong cá công thức tìm P - giá trị ta ®Ịu cã 2 ~ 2 (n-1) VÝ dơ: Gi¶ sư kích thớc loại chi tiết máy tự động sản xuất phân phối theo quy luật chuẩn Sản phẩm đợc gọi đạt tiêu chuẩn phơng sai kích thớc sản phẩm không vợt 0,04 (mm)2 Kiểm tra ngẫu nhiên 11 chi tiết thấy kích thớc chi tiết nh sau (đơn vÞ mm) 100,3; 99,6; 100,0; 100,1; 100,3; 100,0 ; 99,9; 100,2; 100,4; 100,6 ; 100,5 Víi møc ý nghÜa  = 5% cã thĨ nãi r»ng c¸c chi tiÕt máy sản xuất bảo đảm chất lợng hay không? Giải: Gọi X kích thớc chi tiết máy sản xuất Với mức ý nghĩa = 0,05 cần kiểm định 55 H0 :  20 ( 0,04) � 2 � H1 : Xây dựng tiêu chuẩn kiểm định   Ta cã W = (n  1)S'2  20 10)  2(n 1)   20(,05  18,307  2 tn ;  tn 18,307 Tõ mÉu ®· cho ta tÝnh ®ỵc s'2 = 0,10 10.0,10  25  18,307   2tn  W VËy víi møc ý nghÜa  0,04 = 0,05 ta b¸c bá gi¶ thuyÕt H0  2tn  ... x2, … xn) Trong xi giá trị quan sát dấu hiệu X thể phần tử thứ i mẫu (i = 1,2,.n) Dãy giá trị quan sát x 1, x2, xn đợc gọi dãy số liƯu thèng kª VÝ dơ: Theo dâi doanh thu cđa cửa hàng 10 ngày... quan sát nhỏ x k giá trị quan sát lớn biến X mẫu F*(x) = víi xx1 vµ F*(x) = víi x > xk Ví dụ: Lập vẽ đồ thị hàm phân phèi thùc nghiƯm cđa X cho bëi b¶ng 2.1 Ta có: Với x 19,8 nx =0 giá trị quan... đông gồm N phần tử, có M phần tử mang dấu hiệu A Gọi p xác suất để rút ngẫu nhiên từ đám đông đợc phần tư mang dÊu hiƯu A th× P(A) = M/N = p tỷ lệ phần tử mang dấu hiệu A đám đông Vì không điều

Ngày đăng: 27/09/2019, 19:01

w