1. Trang chủ
  2. » Giáo Dục - Đào Tạo

Hoan thien va bo sung phan thong ke toan nam 2013

44 113 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

LỜI NĨI ĐẦU Mơn Xác suất Thống kê ngày ứng dụng rộng rãi lĩnh vực nghiên cứu thực tế Vì vậy, đưa vào giảng dạy nhiều trường đại học, nhiều sở đào tạo với trình độ khác Trong năm gần đây, với đổi giáo dục, đòi hỏi người học phải chủ động tự học, tự nghiên cứu Để giúp người học có sở lý luận, kết nối với môn học khác áp dụng vào thực tế, đưa nghiên cứu đề tài “Hoàn thiện bổ sung phần Thống kê Tốn cho phù hợp với hình thức giảng dạy theo tín Học viện Tài chính” Với nghiên cứu này, hy vọng giúp cho việc giảng dạy, học tập nghiên cứu phần Thống kê Tốn mơn học Học viện Tài thuận lợi hơn, đồng thời tạo điều kiện cho người học tiếp cận với số toán thực tế Đề tài đề cập tới chương Thống kê Tốn mơn học - Chương 1: Lý thuyết mẫu Trong chương này, nhắc lại bổ sung quy luật phân phối xác suất số thống kê đặc trưng mẫu Trên sở đó, mở rộng phương pháp suy diễn thống kê phương pháp ước lượng - Chương 2: Kiểm định giả thuyết thống kê Trong chương này, bổ sung thêm số toán kiểm định tham số kiểm định phi tham số Đề tài thực thành viên sau đây: - Gvc.ThS Nguyễn Văn Tiện: Chủ nhiệm đề tài; - ThS Phan Thị Phương Thanh, ThS Đỗ Thị Lan Hương, ThS Nguyễn Thu Thuỷ: Chương 1; - ThS Đàm Thanh Tú, ThS Khuất Quang Thành: Chương Chúng xin cảm ơn Ban Giám đốc, Ban Khoa học - Học viện Tài tạo điều kiện thuận lợi cho thực đề tài Trong q trình nghiên cứu, chúng tơi cố gắng để hồn thành đề tài Nhưng tính ứng dụng đa dạng phong phú phần Thống kê Tốn, nên khơng tránh khỏi hạn chế Vì mong muốn đồng nghiệp, quan tâm đóng góp ý kiến để đề tài nghiên cứu chúng tơi có chất lượng tốt Hà Nội, tháng 10 năm 2013 Các tác giả Chương LÝ THUYẾT MẪU Phần 1: Quy luật phân phối xác suất số thống kê đặc trưng mẫu Trong thực tế sống ta cần phải nghiên cứu nhiều xu hướng, đặc tính, đặc trưng đám đông, chẳng hạn: chiều cao dân cư vùng, tuổi thọ loại thiết bị điện tử, tỷ lệ phế phẩm lô hàng,… Tuy nhiên, việc nghiên cứu thực toàn với đám đơng có kích thước nhỏ dễ nắm bắt tất phần tử đám đơng Với đám đơng có kích thước lớn việc nghiên cứu nhiều thời gian, chi phí tốn kém, đơi khơng nắm tồn phần tử đám đơng,… dẫn tới kết thu bị sai lệch Do người ta dựa vào việc chọn mẫu sử dụng phương pháp xác suất để nghiên cứu đặc trưng mẫu, sở đưa kết luận cho đám đông Để nghiên cứu mẫu, sau đề cập tới quy luật phân phối xác suất số thống kê đặc trưng mẫu I Trường hợp biến ngẫu nhiên gốc có phân phối chuẩn Giả sử dấu hiệu nghiên cứu đám đông biến ngẫu nhiên X ~ N(a; 2 ) Từ đám đơng lấy ngẫu nhiên mẫu lặp kích thước n: (X1 ,X , ,X n ) X1 , X , , X n biến ngẫu nhiên độc lập, có phân phối với X Ta có: � 2 � n a; �; X  �X i ~ N � n i1 � n � G   X  a   X  a   X n ~ N(0;1) ; n n �X  a �   �(Xi  a) �� i �~  (n) ;  i 1 i 1 �  � 2 (n  1)S nS2    ~ 2 (n  1) ; 2   2 T G  n 1 2  X  a   n  Xa S :  2 S  n   X  a S n 1 ~ T(n  1) II Trường hợp hai biến ngẫu nhiên gốc có phân phối chuẩn Ta xét hai đám đơng với hai dấu hiệu cần nghiên cứu hai đại lượng ngẫu nhiên X1 X Giả sử X1 ~ N(a1 ; 12 ) ; X ~ N(a ; 22 ) Từ hai đám đơng lấy hai mẫu lặp, độc lập có kích thước tương ứng n1 n : (X11 ,X12 , ,X1n1 ) ; (X 21 ,X 22 , ,X 2n ) Ta có: G X   X  (a1  a ) 12 22  n1 n ~ N(0;1) ; 2 (n  1)S1 (n  1)S2 Do   ~ 2 (n1  1) 22  2 ~  (n  1) nên 1 2 n1S12 n 2S22        ~  (n1  n  2) ; 1 2 2 2 Trong trường hợp 12  22  2 thì: G T T X  2 n1  n   X  (a1  a ) 2 S S  n1 n  X   X  (a1  a ) n1S12  n 2S22 n1  n  ~ T(k) 1  n1 n ~ T(n1  n  2) ; ; (n1  1)(n  1) S1 n1 ; C k  ; 2 (n  1)C  (n1  1)(1  C) S1 n1  S2 n 2 (n  1)S1 (n  1)S2 ~ 2 (n1  1) 22  2 ~  (n  1) nên Do   1 2 2 12 (n1  1) S1  22 F  ~ F(n1  1;n  1)  (n  1) S2212 Chú ý: Với thống kê T có phân phối Student với n – bậc tự do, n  30 T có phân phối xấp xỉ phân phối chuẩn tắc III Trường hợp biến ngẫu nhiên gốc có phân phối không – Giả sử dấu hiệu nghiên cứu đám đông biến ngẫu nhiên X  A(p) Từ đám đơng lấy ngẫu nhiên mẫu lặp kích thước n: (X1 ,X , ,X n ) ta tần xuất mẫu f Với nf (1  f ) �20 thì: Q f  p (f  p) n  ~ N(0;1) (f ) p(1  p) IV Trường hợp hai biến ngẫu nhiên gốc có phân phối không – Ta xét hai đám đông với hai dấu hiệu cần nghiên cứu hai đại lượng ngẫu nhiên X1 X , giả sử X1 ~ A(p1 ) ; X ~ A(p2 ) Từ hai đám đông lấy hai mẫu lặp, độc lập có kích thước tương ứng n1 n : (X11 ,X12 , ,X1n1 ) ; (X 21 ,X 22 , ,X 2n ) Từ hai mẫu ta có tần xuất mẫu tương ứng f1, f2 Với n1  30 n2  30 thì: (f1  f )  (p1  p ) Q ~ N(0;1) p1 (1  p1 ) p2 (1  p )  n1 n2 Phần 2: Suy diễn thống kê I Suy đoán hai biến ngẫu nhiên có phân phối chuẩn Suy đốn hiệu hai trung bình mẫu Giả sử có hai đám đơng, dấu hiệu nghiên cứu biến ngẫu nhiên X1 , X phân phối chuẩn với vọng toán tương ứng a1 , a phương sai tương ứng 12 ,  22 biết Nếu từ hai đám đông rút hai mẫu lặp, độc lập kích thước tương ứng n1 , n tiến hành suy đốn sau hiệu hai trung bình mẫu hai biến ngẫu nhiên Chúng ta xét trường hợp mẫu lấy có kích thước đủ lớn (n � 30 n2 �30) Khi đại lượng thống kê:  X X   a U  a2  Sa 12  22  � : N  0,1 , Sa  n1 n Sử dụng công thức P  1  U            1  , ta thu công thức sau khoảng giá trị X1  X :   P  a1  a   1Sa  X1  X   a1  a    2Sa         1  � � �Sa � � � �Sa � P   a1  a   1  X1  X   a1  a       � �  � � a Khoảng hai phía đối xứng:   P  a1  a   Sa  X1  X   a1  a   Sa  2    � � �Sa � P   a1  a     X1  X   a1  a      2 � � b Khoảng phía bên phải:   P  a1  a   Sa  X1  X  0,5      � � �Sa � P   a1  a     X1  X   0,5   � � c Khoảng phía bên trái:   P X1  X   a1  a   Sa       0,5 � � �Sa � P  X1  X   a1  a       � � 0,5 Ví dụ: Hai công ty A B sản xuất loại bóng đèn có tuổi thọ biến ngẫu nhiên có phân phối chuẩn với tuổi thọ trung bình tương ứng 12000 11000 độ lệch tiêu chuẩn tương ứng 200 150 Nếu kiểm tra ngẫu nhiên 50 bóng đèn cơng ty A 75 bóng đèn cơng ty B xác suất để tuổi thọ trung bình bóng đèn kiểm tra A lớn tuổi thọ trung bình bóng đèn kiểm tra B 950 bao nhiêu? Giải: Gọi X1 , X tuổi thọ bóng đèn cơng ty A B 2 Ta có X1 : N  12000;200  , X : N  11000;150  Với mẫu lấy đủ lớn ( n1  50  30;n  75  30 ), xem mẫu lặp  X X  a U Sa Ta có Sa   a2  12  22  � : N  0,1 , Sa  n1 n 2002 1502  �33,1662 50 75 � 50 � P 950 �X1  X  P  12000  11000   50 �X1  X �0,5   � � �33,1662 �      0,5    1,51  0,5    1,51 �0,5  0, 43348  0,93348 Như vậy, 93,348% trường hợp kiểm tra tương tự tuổi thọ trung bình bóng đèn cơng ty A sản xuất lớn tuổi thọ trung bình bóng đèn cơng ty B sản xuất 950 Suy đoán tỷ số hai phương sai mẫu điều chỉnh Giả sử phương sai mẫu điều chỉnh X1 , X2 S12 S22 S12 22 Ta có đại lượng thống kê: F  � : F  n1  1, n  1 S2 1 Do với xác suất 1  , tìm cặp giá trị 1 ,  dương cho 1      n 1;n giá trị tới hạn Fisher-Snedecor tương ứng f1  n 1;n P f1  1  F  f  n 1;n  1  1 ,f  n 1;n  1 thỏa mãn   1  Từ thay biểu thức F vào chuyển vế ta thu công thức: � n 1;n P � 12 f1 �  1  S12 12  n 1;n  f S22  22  1 � �   S12 Tiến hành suy đoán tỷ số : S2 �12  n 1;n a Khoảng hai phía: P � f1 �  1 S12 12  n 1;n   f S2  2  1 � �   b Khoảng phía bên phải: � n 1;n P � 12 f1 �  1  S12 � �   S22 c Khoảng phía bên trái: �S12 12  n 1;n P �  f �S2   1 � �   Ví dụ: Trở lại ví dụ mục Tính xác suất để phương sai mẫu điều chỉnh tuổi thọ bóng đèn kiểm tra công ty A lớn phương sai mẫu điều chỉnh tuổi thọ bóng đèn kiểm tra cơng ty B lần S12 22 Giải: Ta có F  : F  n1  1, n  1 S2 1 Theo công thức khoảng phía bên phải: �S  n 1;n P �12 � 12 f1 �S2   1 � 2002  49;74  49;74     � f  � f1  1,125 �   �0,313 � 1 150 Vậy xác suất cần tìm 0,313 II Suy đốn hai biến ngẫu nhiên có phân phối khơng – (hiệu hai tần xuất) Giả sử có hai đám đơng, biến ngẫu nhiên X1 , X có phân phối khơng - với tham số p1 , p ,  p1  1,  p  Từ hai đám đông rút hai mẫu lặp, độc lập kích thước tương ứng n1 , n Từ hai mẫu ta có tần xuất mẫu tương ứng f 1, f2 Chúng ta xét trường hợp mẫu lấy có kích thước đủ lớn (n1 �30, n �30) Khi đại lượng thống kê: U  f1  f    p1  p2  Sf : N  0,1 , Sf  p1   p1  p   p   � n1 n2 Sử dụng công thức P  1  U            1  , ta thu công thức sau khoảng giá trị f1  f : P   p1  p   1Sf  f1  f   p1  p    2Sf          1  � � �Sf � � � �Sf � P   p1  p   1  f1  f   p1  p2       � �  � � Khoảng hai phía đối xứng: P   p1  p   Sf  f1  f   p1  p   Sf   2    � � �Sf � P   p1  p     f1  f   p1  p      2 � � Khoảng phía bên phải: P   p1  p   Sf  f1  f   0,5      � � �Sf � P   p1  p     f1  f   0,5   � � Khoảng phía bên trái: P  f1  f   p1  p   Sf        0,5 � � �Sf � P  f1  f   p1  p       � � 0,5 Ví dụ: Tỷ lệ khách hàng ưa thích dầu gội mác X hai tỉnh A B tương ứng 50% 40% Trong lần đầu vấn ngẫu nhiên 100 khách hàng tỉnh tỉnh A có 52 người tỉnh B có 38 người ưa thích dùng sản phẩm Tìm xác suất để lần vấn thứ hai, tỷ lệ khách hàng ưa thích sản phẩm mác X điều tra tỉnh A cao tỷ lệ khách hàng ưa thích sản phẩm mác X điều tra tỉnh B lượng lớn mức chênh lệch tỷ lệ khách hàng ưa thích sản phẩm mác X điều tra tỉnh A tỷ lệ khách hàng ưa thích sản phẩm mác X điều tra tỉnh B vấn thứ Giải: Gọi p1 , p tỷ lệ ưa thích sản phẩm mác X hai tỉnh A B Gọi f1 ,f tỷ lệ khách hàng ưa thích sản phẩm mác X hai mẫu khách hàng Ta có p1 = 0,5; p2 = 0,4 Với hai mẫu thỏa mãn n1  n  100  30 nên ta có: U  f1  f    p1  p  Sf : N  0,1 , Sf  p1   p1  p   p   � n1 n2 Ta phải tìm xác suất để f1  f  0,52  0,38  0,14 Sf  p1   p1  p   p  0,5   0,5  0,   0,      0,07 n1 n2 100 100 Theo cơng thức khoảng phía bên phải, ta có: P  0,14  f1  f   P � 0,14   0,5  0,   f1  f   0,5  0,  � � � �0,04 �  P  0,04  f1  f  0,1  0,5   � � 0,5    0,57  �0,5  0, 21566  0, 28434 �0,07 � Vậy xác suất cần tìm 0,28434 III Bài tập Điều tra hai mẫu ngẫu nhiên độc lập có kích thước 100 rút từ hai đám đơng hai dấu hiệu nghiên cứu hai đại lượng ngẫu nhiên độc lập có phân phối chuẩn có trung bình, cịn phương sai tương ứng 50 40 Tìm xác suất để: a Hai trung bình mẫu hai đại lượng ngẫu nhiên điều tra sai lệch b Phương sai mẫu đại lượng ngẫu nhiên điều tra mẫu thứ lớn phương sai mẫu đại lượng ngẫu nhiên điều tra mẫu thứ hai lần Đ/S: a 0,03486 b 0,01 Hai mẫu ngẫu nhiên độc lập có kích thước 40 50 rút từ hai đám đơng dấu hiệu nghiên cứu có phân phối chuẩn với trung bình 70 68; phương sai 120 150 Tìm xác suất để: a Trung bình mẫu đại lượng ngẫu nhiên nghiên cứu mẫu thứ lớn trung bình mẫu đại lượng ngẫu nhiên nghiên cứu mẫu thứ hai b Phương sai mẫu đại lượng ngẫu nhiên mẫu thứ hai lớn phương sai mẫu đại lượng ngẫu nhiên mẫu thứ không 1,5 lần Đ/S: a 0,11123 b 0,72 Tỷ lệ đàn ông phụ nữ ủng hộ quan điểm bình đẳng giới 0,52 0,65 Vậy vấn ngẫu nhiên cách độc lập 400 đàn ông 400 phụ nữ vấn đề xác suất để tỷ lệ đàn ông ủng hộ quan điểm bình đẳng giới mẫu điều tra lớn tỷ lệ phụ nữ ủng hộ quan điểm bình đẳng giới mẫu điều tra lượng vượt 16% bao nhiêu? Đ/S: 0,19215 Một nhà máy sản xuất hai loại gioăng cao su A B Giả sử độ dày hai loại gioăng hai đại lượng ngẫu nhiên độc lập có phân phối chuẩn với độ dày trung bình 0,118cm 0,122cm; độ lệch tiêu chuẩn 0,01cm 0,015cm Kiểm tra 800 gioăng cao su A 900 gioăng cao su B cách độc lập Tính xác suất để: a Chiều dày trung bình gioăng cao su B kiểm tra lớn chiều dày trung bình gioăng cao su A kiểm tra lượng nằm 0,001cm 0,002cm b Phương sai mẫu độ dày gioăng cao su B không vượt 2,5 lần phương sai mẫu độ dày gioăng cao su A Đ/S: a 0,00048 b 0,063185 Hai lô hàng A B nhà máy C có tỷ lệ phẩm 90% 80% Kiểm tra lơ hàng 80 sản phẩm Tính xác suất: a Tỷ lệ phẩm hai mẫu điều tra sai lệch khơng q 10% b Tỷ lệ phẩm sản phẩm lô A kiểm tra lớn tỷ lệ phẩm sản phẩm lơ B kiểm tra 20% Đ/S: a 0,49984 b 0,06372 Điều tra ý kiến người dân nước hai nghị A B Chính phủ thấy tỷ lệ người dân nước ủng hộ hai nghị 70% 80% Nếu lấy ý kiến 1000 người dân huyện Từ Liêm hai nghị A B, tính khả để tỷ lệ người dân huyện Từ Liêm ủng hộ nghị A thấp tỷ lệ người dân huyện Từ Liêm ủng hộ nghị B tối thiểu 5% Đ/S: 0,99534 Tỷ lệ bảo hành hai loại máy A B 3% 2% Nếu cửa hàng bán thị trường loại 500 máy Tính xác suất: a Sai lệch tỷ lệ động phải bảo hành hai loại máy bán 1% b Tỷ lệ động A bán phải bảo hành thấp tỷ lệ động B bán phải bảo hành Đ/S: a 0,52118 b 0,15625 Việc tiêu dùng điện hàng tháng hộ gia đình Hà Nội Hải Phịng đại lượng ngẫu nhiên độc lập có phân phối chuẩn với trung bình 200KWh 180KWh; độ lệch tiêu chuẩn 40KWh 35KWh Tính xác suất để điều tra 100 hộ gia đình Hà Nội 80 hộ gia đình Hải Phịng thì: a Mức tiêu dùng điện trung bình hộ gia đình điều tra Hà Nội lớn 10KWh so với mức tiêu dùng điện trung bình hộ gia đình điều tra Hải Phịng b Mức tiêu dùng điện trung bình hộ gia đình điều tra Hà Nội lớn từ 5KWh đến 15KWh mức tiêu dùng điện trung bình hộ gia đình điều tra Hải Phòng c Phương sai mẫu mức tiêu dùng điện hàng tháng hộ gia đình điều tra Hà Nội lớn phương sai mẫu mức tiêu dùng điện hàng tháng hộ gia đình điều tra Hải Phòng từ 1,2 đến 1,5 lần Đ/S: a 0,96328 b 0,18305 c 0,395 Tỷ lệ thất nghiệp người lao động nam tỉnh A 5% người lao động nữ tỉnh A 3% Vậy điều tra ngẫu nhiên cách độc lập 500 đàn ông 400 phụ nữ tỉnh A xác suất để tỷ lệ thất nghiệp đàn ông điều tra lớn tỷ lệ thất nghiệp phụ nữ điều tra không 1% bao nhiêu? Đ/S: 0,22065 Phần 3: Phương pháp ước lượng I Ước lượng điểm Khái niệm tham số lý thuyết tham số mẫu - Giả sử nghiên cứu đại lượng ngẫu nhiên X đám đơng có E  X   a ; D  X    Các đại lượng a 2 gọi tham số lý thuyết, chúng số Giả sử a 2 chưa biết, từ đám đông lấy mẫu kích thước n :  X1 ,X , ,X n  10 Sử dụng thống kê F  S1 22 2 S  � Nếu giả thuyết H0 F  S1 S2 : F(40; 29) Miền bác bỏ giả thuyết H0 � � � S1 � W� F  : F �f0,975(40;29) hay F �f0,025(40;29)� � S2 � Tra bảng giá trị tới hạn Fisher-Snedecor ta được: f0,025(40;29) = 2,03; f0,975(40;29) = 0,52 Với mẫu cho ta có: Fqs = 11,41 : 8,27 = 1,38 � Fqs �W Vậy với mức ý nghĩa  = 0,05 mẫu cho ta chưa có sở để bác bỏ giả thuyết H0 nên tạm thời chấp nhận giả thuyết H0, tức độ phân tán suất nho hai vùng Ví dụ 2: Người ta tiến hành lấy mẫu điều tra thu nhập hàng tháng công nhân hai khu công nghiệp thu kết sau: Khu công nghiệp A B Kích thước mẫu 61 91 Phương sai mẫu điều chỉnh 3518,93 2257,44 Với mức ý nghĩa 0,05 cho phương sai thu nhập hàng tháng công nhân khu công nghiệp A cao khu công nghiệp B hay không? Biết thu nhập hàng tháng công nhân hai khu công nghiệp tuân theo quy luật phân phối chuẩn Giải: Gọi X, Y tương ứng thu nhập hàng tháng công nhân hai khu công nghiệp A B Theo đề ta có X ~ N(a1; 12 ); Y ~ N(a ; 22 ) Kiểm định giả thuyết H0: 12 = 22 với đối thuyết H1: 12 > 22 Mức ý nghĩa  = 0,05 Sử dụng thống kê F  S1 22 S2 12 � 30 Nếu giả thuyết H0 F  S1 2 S : F(60; 90) Miền bác bỏ giả thuyết � � � S1 � W� F  : F �f0,05(60;90) � � � S2 Tra bảng giá trị tới hạn Fisher-Snedecor ta được: f0,05(60;90) = 1,46 Với mẫu cho ta có: Fqs = 1,559 > f0,05(60;90)  1,46 � Fqs �W Vậy với mức ý nghĩa  = 0,05 mẫu cho ta bác bỏ giả thuyết H 0, chấp nhận đối thuyết H1, tức phương sai thu nhập hàng tháng công nhân khu công nghiệp A cao khu công nghiệp B II Kiểm định giả thuyết k phương sai k biến ngẫu nhiên có phân phối chuẩn (Kiểm định Bartlett) Giả sử nghiên cứu k biến ngẫu nhiên X 1, X2,…, Xk k đám đơng, Xi ~ N(a i ; i2 ), i  1,k Từ đám đông ta rút k mẫu lặp, độc lập có kích thước tương ứng n1, n2,…, nk (trong ni > 3; i  1,k có mẫu kích thước khác nhau) Ta cần tiến hành giải toán sau: Kiểm định giả thuyết H0: 12  22   2k với đối thuyết H1: Trong giá trị 12 , 22 , , k2 có giá trị khác Mức ý nghĩa  cho trước Sử dụng thống kê Bartlett: k B 2 (N  k).ln(S2P )  �(n i  1).ln(Si ) i 1 , � 1 � 1  � � � 3(k  1) �i 1 n i  N  k � k S1 ,S2 , ,Sk phương sai mẫu điều chỉnh tương ứng X1, X2,…, Xk; k N  �n i ; S  � �(n i  1).Si trung bình số học phương sai mẫu N  k i1 i 1 Nếu giả thuyết H0 thống kê B có quy luật phân phối xấp xỉ quy luật phân phối Khi bình phương với k – bậc tự Miền bác bỏ giả thuyết H0 k P 31 � � k 2 � (N  k).ln(SP )  �(n i  1).ln(Si ) � � � i 1 W� B : B � (k  1) � �k 1 � � � 1  � � � � � 3(k  1) �i1 n i  N  k � � Trong 2 (k  1) tra từ bảng giá trị tới hạn Khi bình phương Với mẫu cho ta tính giá trị quan sát B B qs So sánh Bqs với 2 (k  1) dựa vào miền bác bỏ giả thuyết H0 để kết luận - Nếu Bqs  2 (k  1) bác bỏ giả thuyết H0, chấp nhận đối thuyết H1 - Nếu Bqs < 2 (k  1) tạm thời chấp nhận giả thuyết H0 Ví dụ: Giả sử điểm tổng kết năm học học sinh lớp 12 tuân theo phân phối chuẩn Chọn ngẫu nhiên số học sinh lớp 12 trường khác để kiểm tra điểm tổng kết ta thu kết sau: Trường Số học sinh Phương sai mẫu điều chỉnh kiểm tra điểm tổng kết 10 0,25 13 0,40 15 0,36 16 0,46 Với mức ý nghĩa 0,05 cho phương sai điểm tổng kết học sinh lớp 12 trường hay không? Giải: Kiểm định giả thuyết H0: 12   22  32  42 với đối thuyết H1: Trong giá trị 12 , 22 , 32 , 42 có giá trị khác Mức ý nghĩa  = 0,05 Sử dụng thống kê Bartlett: k B (N  k).ln(S2P )  �(n i  1).ln(Si ) i 1 � 1 � 1  � � � 3(k  1) �i 1 n i  N  k � k 32 Nếu giả thuyết H0 thống kê B có quy luật phân phối xấp xỉ Khi binh phương với k – = bậc tự Miền bác bỏ giả thuyết H0 � � k � (N  k).ln(S2P )  �(n i  1).ln(Si ) � � � i 1 W� B : B � 0,05 (3) � �k 1 � � � 1  � � � � � 3(k  1) n  N  k �i1 i � � Tra bảng giá trị tới hạn Khi bình phương tìm 0,05 (3) = 7,815 Với mẫu cho ta tính Bqs Tiến hành lập bảng: Kích thước Số bậc tự 2 h S i S i i (hi = ni – 1) mẫu 10 0,25 2,25 13 12 0,4 4,8 15 14 0,36 5,04 16 15 0,46 6,9 Tổng 54 50 18,99 k 18,99 S2P  �(n i  1).Si   0,3798 N  k i1 50 50.ln(0,3798)  ( 49,4236) � Bqs   0,9846 1� � 1 � 0,326  � 9� 50 � Trường 2 ln(Si ) h i ln(Si ) - 1,3863 - 0,9163 - 1,0217 - 0,7765 - 12,4767 - 10,9956 - 14,3038 - 11,6475 - 49,4236 hi 0,111 0,077 0,071 0,067 0,326 � Bqs  0,9846   0,05 (3)  7,815 � Bqs �W Vậy với mức ý nghĩa 0,05 mẫu cho ta chưa có sở để bác bỏ giả thuyết H0 nên tạm thời chấp nhận giả thuyết H 0, tức phương sai điểm tổng kết học sinh lớp 12 trường III Bài tập Điều tra ngẫu nhiên mức điện tiêu thụ hàng tháng số hộ gia đình hai thành phố A B kết sau: Thành phố Kích thước mẫu Phương sai mẫu điều chỉnh A 30 188,57 B 41 210,33 33 Với mức ý nghĩa 0,05 cho độ phân tán mức điện tiêu thụ hàng tháng hộ gia đình hai thành phố khác hay không? Giả thiết mức điện tiêu thụ hàng tháng hộ gia đình hai thành phố A B có phân phối chuẩn Một xí nghiệp có hai máy tự động dùng để đánh bóng sản phẩm trước xuất xưởng Quan sát 31 sản phẩm đánh bóng máy thu phương sai mẫu thời gian đánh bóng sản phẩm máy 38 (giây 2) máy 45 (giây2) Với mức ý nghĩa 0,025 cho phương sai thời gian đánh bóng sản phẩm máy lớn máy hay không? Cho biết thời gian đánh bóng sản phẩm hai máy tuân theo quy luật phân phối chuẩn Có hai bệnh viện I II Thống kê số giường bệnh tải bệnh viện I (BV I) bệnh viện II (BV II) vài năm gần ta kết sau: Số giường bệnh tải hàng năm BV I 10 14 15 Số năm Số giường bệnh tải hàng năm BV II 10 11 13 17 Số năm Hãy xét xem với mức ý nghĩa 0,05 có đồng số giường bệnh q tải hàng năm hai bệnh viện hay không? Giả sử số giường bệnh qúa tải hàng năm hai bệnh viện tuân theo quy luật phân phối chuẩn Giả sử tuổi thọ người dân có phân phối chuẩn Điều tra ngẫu nhiên tuổi thọ tỉnh khác nước thu kết sau: Tỉnh A B C D E Kích thước mẫu Phương sai mẫu điều tra điều chỉnh 31 15,25 28 14,34 35 10,36 36 19,46 40 20,31 Với mức ý nghĩa 0,05 cho đồng tuổi thọ tỉnh nước hay khơng? 34 Phần 2: Kiểm định phi tham số I Kiểm định giả thuyết quy luật phân phối xác suất biến ngẫu nhiên Giả sử ta cần nghiên cứu biến ngẫu nhiên X chưa biết quy luật phân phối xác suất X Ta giải tốn: Kiểm định giả thuyết H0: X có phân phối A với đối thuyết H1: X khơng có phân phối A Mức ý nghĩa  cho trước Từ đám đơng, ta lấy mẫu lặp có kích thước n:  X1;X ; ;X n  - Nếu X biến ngẫu nhiên rời rạc số liệu có từ mẫu mơ tả dãy thống kê dạng điểm: X m x1 m1 x2 m2 xi mi … … k  mi  npi  Khi đó, ta sử dụng thống kê   � 2 npi i 1 xk mk … … , pi  P  X  x i  ,i  1, k xác định giả thuyết H - Nếu X biến ngẫu nhiên liên tục số liệu có từ mẫu mô tả dãy thống kê dạng khoảng: X m x  x1 m1 x1  x m2 … … k  mi  npi  Khi đó, ta sử dụng thống kê   � i 1 x i1  x i mi npi … … x k 1  x k mk , pi  P  x i1 �X  x i  ,i  1, k xác định giả thuyết H 2 Nếu giả thuyết H0  :   k  r  1 , r số tham số phân phối A tham số ước lượng phương pháp hợp lý tối đa Miền bác bỏ giả thuyết H0 � � � k  mi  npi  � W�  � : 2 �2  k  r  1 � npi i 1 � � Trong   k  r  1 tra từ bảng giá trị tới hạn Khi bình phương 2 Với mẫu cho ta tính giá trị quan sát 2 qs So sánh qs với 2 (k  r  1) dựa vào miền bác bỏ giả thuyết H0 để kết luận 35 2 + Nếu qs �  k  r  1 ta bác bỏ giả thuyết H0, chấp nhận đối thuyết H1 2 + Nếu qs    k  r  1 ta chưa có sở để bác bỏ giả thuyết H nên tạm thời chấp nhận giả thuyết H0 Chú ý: mi �5 (i  1,k); n �50 k �p i 1 i  Ví dụ 1: Để tìm hiểu số thiết bị hỏng tháng hệ thống thiết bị, người ta theo dõi 50 tháng liền số liệu sau: Số thiết bị hỏng Số tháng 10 12 Với mức ý nghĩa 5%, cho số thiết bị hỏng tháng tuân theo quy luật phân phối Poisson hay không? Giải: Gọi X số thiết bị bị hỏng tháng Kiểm định giả thuyết H0: X : P    với đối thuyết H1: X : P    Mức ý nghĩa   0,05 Do có giá trị tần số nhỏ nên ta xếp lại số liệu mẫu sau: �6 Số thiết bị hỏng - 4-5 Số tháng 14 12 Ta có ước lượng hợp lý tối đa tham số  là: n X  �x i   10.0  4.1  12.2  8.3  7.4  6.6  3.8   2,8 n i 1 50 Vì P  X  x   Ta có: e 2,8 2,8x ; x  0; 1; 2; x! p1  P  X    P  X  1  0,23108; p  P  X    0,23838; p3  P  X  3  0,22248; p  P  X    P  X    0,24295; p5  P  X �6    p1  p  p3  p  0,06511  mi  50pi  Sử dụng thống kê   � i 1 50pi 36 2 Nếu giả thuyết H0  :   3 Miền bác bỏ giả thuyết H0 � � �  mi  50pi  W�  � : 2 �0,05  3 � � 50p i  i � � Tra bảng giá trị tới hạn Khi bình phương tìm 0,05  3  7,815 Với mẫu cho, ta lập bảng để tính qs : pi 50pi mi  mi  50pi  50pi 0,23108 0,23838 0,22248 0,24295 11,554 11,919 11,124 12,1475 14 12 0,5178 Suy   13,71342   qs 0,0005 0,05 0,06511 3.2555 0,87733 2,18125 10,13647  3  7,815 qs 13,71342 Vậy với mẫu cho mức ý nghĩa   0,05 ta bác bỏ giả thuyết H0, chấp nhận đối thuyết H1, tức cho X có phân phối Poisson Ví dụ 2: Điều tra khối lượng 100 sản phẩm thu số liệu: Khối lượng (g) 20 – 22 22 – 24 24 – 26 26 – 28 28 – 30 Số sản phẩm 14 33 27 19 Với mức ý nghĩa 5% cho khối lượng loại sản phẩm tuân theo quy luật phân phối chuẩn hay không? Giải: Gọi X (g) khối lượng loại sản phẩm Kiểm định giả thuyết H0: X : N  a;  với đối thuyết H1: X : N  a;  Mức ý nghĩa   0,05 Ta có ước lượng hợp lý tối đa tham số a 2 X S2 Với mẫu cho thì: X  7.21  14.23  33.25  27.27  19.29   25,74 ; 100 S2  7.212  14.232  33.252  27.27  19.292   25,742  5,2524;S �2, 2918  100 �  25,74 � �  25,74 � Vì ta có P   �X      � Suy ra: �  � � �2,2918 � � 2,2918 � p1 �  1,63    �    �    1,63  0,5  0,44845  0,05155 ; 37 p �  0,76     1,63    1,63    0,76   0,44845  0,27638  0,17207 ; p3 �  0,11    0,76     0,11    0,76   0,04380  0,27638  0,32018 ; p �  0,99     0,11  0,33892  0,04380  0,29512 ; p5 �  �    0,99   0,5  0,33892  0,16108  mi  100pi  Sử dụng thống kê   � 2 100pi i 1 2 Nếu giả thuyết H0  :    Miền bác bỏ giả thuyết H0 � � �  mi  100pi  W�  � :  � 0,05  2 � � 100p i  i � � Tra bảng giá trị tới hạn Khi bình phương tìm 0,05    5,991 Với mẫu lấy ra, ta lập bảng để tính qs : 0,0515 5,155 pi 100pi mi  mi  100pi  100pi 0,66033 Suy   2,0212   qs 0,05 0,17207 0,32018 17,207 14 0,5977 32,018 33 0,2951 29,512 27 0,03012 0,21382    5,991 0,16108 16,108 19 0,5192 2 qs 2,0212 Với mẫu cho mức ý nghĩa   0,05 ta chưa có sở để bác bỏ giả thuyết H0 nên tạm thời chấp nhận giả thuyết H0, tức cho X có phân phối xác suất theo quy luật phân phối chuẩn với tham số a �25,74 g  �2,2918 g II Kiểm định giả thuyết k tham số k biến ngẫu nhiên có phân phối khơng - Ta xét toán kiểm định giả thuyết hai tham số hai biến ngẫu nhiên có phân phối khơng - Ở phần này, ta xét toán mở rộng kiểm định giả thuyết k tham số k biến ngẫu nhiên có phân phối không - (k  3) 38 Giả sử ta có k biến ngẫu nhiên X1 ,X , ,X k có phân phối khơng - với tham số p1 ,p , ,p k Trong pi tỉ lệ phần tử mang đặc tính A đám đơng ứng với biến ngẫu nhiên Xi (i  1,k ) Ta giải toán: Kiểm định giả thuyết H0: p1  p   p k với đối thuyết H1: Trong giá trị p1 , p , , p k có giá trị khác Mức ý nghĩa  cho trước Ta lấy k mẫu lặp, độc lập có kích thước n1 , n , , n k tương ứng với biến ngẫu nhiên X1 ,X , ,X k là:  X , X , , X  ;  X , X , , X  ; ;  X , X , , X  1 n1 2 2 n2 k k k nk Gọi mi số phần tử mang đặc tính A mẫu ứng với biến ngẫu nhiên Xi ( k k k i 1 i 1 i 1 i  1,k ); m  �mi Đặt n  �n i ; h i  n i  mi (i  1,k) Ta có h  �h i  n  m Ta có bảng số liệu: Mẫu … k m1 m2 mk M … h1 h2 hk H … Ở đó: M số phần tử mang đặc tính A, H số phần tử khơng mang đặc tính A  Nếu n1 , n , , n k lớn n i �0, i  1,k   m  n i pi  � i i 1 n i p i   pi  Do đó, H0 đúng, tức p1  p2   pk  p k : 2  k   m  nip  � i i 1 n i p   p  k : 2  k  Do chưa biết p nên ta xấp xỉ p f  m n (f tỉ lệ phần tử mang đặc tính A k mẫu) Khi ta có thống kê   m  nif  � i i 1 n i f   f  k :   k  1 � � � k  mi  n if  2 W    :  �  k  � Miền bác bỏ giả thuyết H0 � � �  i 1 n i f   f  � � Trong   k  1 tra từ bảng giá trị tới hạn Khi bình phương 2 Với mẫu cho ta tính giá trị quan sát 2 qs So sánh qs với 2  k  1 dựa vào miền bác bỏ giả thuyết H0 để kết luận 39 2 + Nếu qs �   k  1 ta bác bỏ giả thuyết H0, chấp nhận đối thuyết H1 2 + Nếu qs     k  1 ta chưa có sở để bác bỏ giả thuyết H nên tạm thời chấp nhận giả thuyết H0 Chú ý: Khi tính tốn, ta sử dụng cơng thức sau để tính giá trị 2 �1 k mi2 k h i2 � n k mi2 m   n � �  �  1�hoặc   n� � � mh i1 n i h �m i1 n i h i1 n i � Ví dụ: Điều tra hiệu chữa loại bệnh loại thuốc khác nhau, ta có bảng số liệu sau: Mẫu thuốc Khỏi bệnh 79 82 77 83 76 81 Không khỏi 21 18 23 17 24 19 Dựa vào kết thu so sánh hiệu chữa bệnh loại thuốc với mức ý nghĩa 5% Giải: Gọi pi tỉ lệ khỏi bệnh điều trị loại thuốc thứ i, i  1,6 Kiểm định giả thuyết H0: p1  p   p với đối thuyết H1: Trong giá trị p1 , p , , p6 có giá trị khác Mức ý nghĩa   0,05 �1 mi2 h i2 � Do n i  100  30,i  1,6 nên sử dụng thống kê   600 � �  �  � �m i 1 n i h i1 n i � 2 Nếu giả thuyết H0  :    Miền bác bỏ giả thuyết H �1 mi2 h i2 � �2 � W�   600 � �  �  � :  � 20,05   � � �m i1 n i h i 1 n i � � Tra bảng giá trị tới hạn Khi bình phương tìm 0,05    11,07 Với mẫu cho, ta có: �792  822  772  832  762  812 212  182  232  17  242  192 � qs  600 �   1� 478.100 122.100 � � 2 �2,428 Suy qs �2,428  0,05  5  11,07 40 Với mẫu cho mức ý nghĩa   0,05 , ta chưa có sở để bác bỏ giả thuyết H0 nên tạm thời chấp nhận giả thuyết H0, tức hiệu chữa bệnh loại thuốc III Kiểm định giả thuyết tính độc lập hai dấu hiệu định tính Giả sử ta quan tâm tới dấu hiệu phần tử đám đông Nếu dấu hiệu biểu thị số phần tử ta nói dấu hiệu dấu hiệu định lượng (Chẳng hạn, nghiên cứu người chiều cao, cân nặng, tuổi,…là dấu hiệu định lượng) Tuy nhiên, thực tế có dấu hiệu khơng thể định lượng (Chẳng hạn, dấu hiệu màu da, tính cách, sở thích,…) Ta gọi dấu hiệu dấu hiệu định tính Trong mục này, ta kiểm định tính độc lập hai dấu hiệu định tính Giả sử ta có hai dấu hiệu định tính X Y Dấu hiệu định tính X chia thành h mức độ A1 , A , , A h Dấu hiệu định tính Y chia thành k mức độ B1 , B2 , , Bk Ta giải toán: Kiểm định giả thuyết H0: X Y độc lập với đối thuyết H1: X Y phụ thuộc Mức ý nghĩa  cho trước Từ đám đông, ta lấy mẫu lặp có kích thước n Gọi m ij số phần tử mang dấu hiệu X mức độ Ai mang dấu hiệu Y mức độ B j Khi đó, ta ký hiệu: k + mi0  �m ij số phần tử mang dấu hiệu X mức độ Ai ,i  1, h j1 h + m0 j  �m ij số phần tử mang dấu hiệu Y mức độ B j , j  1, k i 1 Ta có bảng liên hợp dấu hiệu sau: Y B1 B2 X A1 m11 m12 A2 m 21 m 22 … … … Ah m h1 mh 41 … Bk … … … … m1k m 2k … m hk Gọi p ij tỉ lệ phần tử mang mang dấu hiệu X mức độ Ai , i  1, h mang dấu hiệu Y mức độ B j , j  1, k ; p i0 tỉ lệ phần tử mang mang dấu hiệu X mức độ Ai , i  1, h ; p 0j tỉ lệ phần tử mang dấu hiệu Y mức độ B j , j  1, k Khi đó, theo định nghĩa thống kê xác suất, ta có: m m p i0 � i0 , i  1, h; p 0j � 0j , j  1, k n n Nếu hai dấu hiệu X Y độc lập p ij  pi0 p j , i  1, h; j  1, k m m m m Do np ij  npi0 p0 j �n � i0 � j  i0 j Khi đó: n n n mi0 m j � � m  h k � ij �h k m 2ij � n � � �   ��  n�  � � � � � mi0 m j m m i 1 j1 i  j  i0 j � � n có phân phối Khi bình phương với hk  (h  k  2)   (h  1)(k  1) bậc tự Miền bác bỏ giả thuyết H0 � � �h k m 2ij � �2 � W�   n�  :  �  h  k        � � � �  �i1 j1 m m � i0 j � � � � Trong    h  1  k  1  tra từ bảng giá trị tới hạn Khi bình phương 2 Với mẫu cho, ta tính giá trị quan sát 2 qs So sánh qs với 2   h  1  k  1  dựa vào miền bác bỏ giả thuyết H0 để kết luận 2 + Nếu qs �    h  1  k  1  ta bác bỏ giả thuyết H , chấp nhận đối thuyết H1 2 + Nếu qs      h  1  k  1  ta chưa có sở để bác bỏ giả thuyết H nên tạm thời chấp nhận giả thuyết H0 Ví dụ: Ở Ngọc trâm, có hai dạng "lá phẳng" "lá nhăn", hoa có hai dạng "hoa bình thường" "hoa hoàng hậu" Quan sát mẫu gồm 560 Ngọc trâm, ta thu kết sau: Hoa Bình thường Hồng hậu 42 Lá Phẳng 328 122 Nhăn 77 33 Từ kết thu với mức ý nghĩa 5% cho hai đặc điểm hoa Ngọc trâm độc lập hay không? Giải: Gọi X đặc điểm Ngọc trâm Y đặc điểm hoa Ngọc trâm Kiểm định giả thuyết H0: X Y độc lập với đối thuyết H1: X Y phụ thuộc Mức ý nghĩa   0,05 �2 m 2ij �  1� Sử dụng thống kê:   560 � � � �i1 j1 m m � i0 j � � 2 Nếu giả thuyết H0  :   1 Miền bác bỏ giả thuyết H � � �2 m 2ij � �2 � W�   560 �  :  �    � � � �  �i1 j1 m m � i0 0j � � � � Tra bảng giá trị tới hạn Khi bình phương tìm 0,05  1  3,841 Với mẫu cho, ta có: � 3282 � 1222 77 332   560 �     1��0,3685 �450.405 450.155 110.405 110.155 � qs 2 Suy qs �0,3685  0,05  1  3,841 Vậy với mẫu cho mức ý nghĩa   0,05 , ta chưa có sở để bác bỏ giả thuyết H0 nên tạm thời chấp nhận giả thuyết H0, tức đặc điểm đặc điểm hoa Ngọc trâm độc lập IV Bài tập Kết điều tra số lần khách hàng gọi phục vụ ngày sở dịch vụ máy tính 500 ngày cho bảng số liệu sau đây: Số lần gọi Số ngày 160 175 86 41 18 12 Với mức ý nghĩa 1%, cho số lần khách hàng gọi phục vụ ngày sở dịch vụ máy tính có phân phối Poisson hay khơng? 43 Thời gian gọi 500 điện thoại đường dài (đơn vị: phút) cho bảng số liệu sau: Thời gian gọi - 5 - 10 10 - 15 15 - 20 20 - 25 25 - 30 Số gọi 48 84 164 126 50 28 Với mức ý nghĩa 1%, cho thời gian gọi điện thoại đường dài tuân theo quy luật phân phối chuẩn hay khơng? Có thầy giáo A, B, C, D dạy môn học Z Khảo sát chất lượng học sinh thầy này, người ta thu bảng số liệu sau: Chất lượng A B C D Đạt 60 75 150 125 Không đạt 40 75 50 75 Với mức ý nghĩa 1%, cho tỉ lệ học sinh thầy A, B, C, D đạt yêu cầu môn học Z hay không? Một hãng sản xuất ô tô tiến hành nghiên cứu nhằm xác định xem có khác nam giới nữ giới việc lựa chọn mua loại ô tô A, B, C hãng hay không Số liệu điều tra thu sau: Giới tính A B C Nam 40 60 100 Nữ 70 80 150 Với mức ý nghĩa 5% hãng sản xuất tơ kết luận nào? Chất lượng sản phẩm chia thành loại: tốt, xấu Có ca sản xuất là: sáng, chiều, tối Quan sát 100 sản phẩm ta thu số liệu: Loại Sáng Chiều Tối Tốt 25 32 28 Xấu Với mức ý nghĩa 5%, kết luận chất lượng sản phẩm phụ thuộc vào ca sản xuất hay không? Điều tra ngẫu nhiên thu nhập 400 công nhân thành phố A, B (đơn vị: triệu đồng/năm) ta thu kết sau: Thu nhập - 5 - 10 10 - 15 Trên 15 A 28 42 30 24 B 44 78 78 76 Với mức ý nghĩa 5%, kiểm định xem thu nhập công nhân có phụ thuộc vào thành phố mà họ làm việc hay không? 44 ... mức độ phân tán lãi suất đầu tư vào cổ phiếu A năm 2013 khoảng tin cậy 25 b) Ước lượng mức độ phân tán tối đa lãi suất đầu tư vào cổ phiếu A năm 2013 Để nắm tỷ lệ trẻ tuổi bị suy dinh dưỡng nước,... hành nghiên cứu nhằm xác định xem có khác nam giới nữ giới việc lựa chọn mua loại ô tô A, B, C hãng hay không Số liệu điều tra thu sau: Giới tính A B C Nam 40 60 100 Nữ 70 80 150 Với mức ý nghĩa... Hải Phòng từ 1,2 đến 1,5 lần Đ/S: a 0,96328 b 0,18305 c 0,395 Tỷ lệ thất nghiệp người lao động nam tỉnh A 5% người lao động nữ tỉnh A 3% Vậy điều tra ngẫu nhiên cách độc lập 500 đàn ông 400 phụ

Ngày đăng: 25/09/2018, 08:30

Xem thêm:

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

  • Đang cập nhật ...

TÀI LIỆU LIÊN QUAN

w