Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 14 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
14
Dung lượng
325,43 KB
Nội dung
MỘT SỐ KHÁI NIỆM VÀ KÍ HIỆU Khái niệm đám đông – mẫu Đám đông (tổng thể): tập hợp tất phần tử mà ta muốn nghiên cứu Mẫu: tập hợp phần tử lấy từ đám đơng để nghiên cứu Kích thước mẫu: số phần tử mẫu, kí hiệu n Dãy thống kê dạng điểm cho dạng tần số: x1 m1 X m k Chú ý: �m i 1 i x2 m2 xi mi … … xk mk … … n Tham số đám đông – Tham số mẫu Định nghĩa 1: Giả sử cần nghiên cứu dấu hiệu X đám đơng có: E X ;D X ; X Các tham số đám đông: Tham số 2 Tên gọi Kỳ vọng Phương sai Độ lệch tiêu chuẩn Ý nghĩa Giá trị trung bình X đám đơng Bình phương độ phân tán đám đông Độ phân tán đám đông Các tham số mẫu: Tham số X S Tên gọi Trung bình mẫu (Giá trị trung bình X mẫu) Phương sai mẫu Cách tính k X �mi x i n i1 S2 X X S$ Phương sai mẫu điều chỉnh n S$ S n 1 S Độ lệch tiêu chuẩn mẫu S S2 S$ Độ lệch tiêu chuẩn mẫu điều chỉnh S$ S$ k X �mi x i2 n i1 với Định nghĩa 2: Giả sử đám đông có loại đối tượng phần tử mang đặc tính A phần tử khơng mang đặc tính A Ta có: + Tham số p tỉ lệ phần tử mang đặc tính A đám đơng + Tham số f tỉ lệ phần tử mang đặc tính A mẫu f m n với m số phần tử mang đặc tính A mẫu BÀI TỐN ƯỚC LƯỢNG Phân biệt tốn ước lượng điểm tốn ước lượng khoảng: + Khơng có độ tin cậy: tốn ước lượng điểm + Có độ tin cậy: tốn ước lượng khoảng I Bài toán ước lượng điểm + Ước lượng giá trị trung bình (ước lượng kỳ vọng ): Tính X kết luận + Ước lượng tỉ lệ (ước lượng xác suất p): Tính f kết luận $2 + Ước lượng bình phương độ phân tán (ước lượng p/sai ): Tính S kết luận II Bài toán ước lượng khoảng Các bước làm: + Xác định toán: ước lượng kỳ vọng hay ước lượng xác suất? Nếu ước lượng kỳ vọng rơi vào trường hợp nào? + Viết biểu thức xác định khoảng tin cậy cơng thức tính � � � � u� � t n 1 � � �2 � + Biết độ tin cậy , ta tính suy �2 �hay $2 ;S;f $ X;S ;S;S + Tính tham số mẫu (nếu cần tham số tính tham số đó): tính + Tìm khoảng tin cậy kết luận Ước lượng giá trị trung bình (ước lượng kỳ vọng ): X ;X Khoảng tin cậy đối xứng với tính sau: Trường hợp biết, X có phân phối chuẩn mẫu lớn Cơng thức tính � � u� � �� n chưa biết, X có phân phối � � S$ � � S t n 1 � � t n 1 � � �2 � n �2 � n chuẩn chưa biết, X khơng có phân � � S$ � � S u� � u� � 2 n n � � � � phối chuẩn mẫu lớn Ước lượng tỉ lệ (ước lượng xác suất p): � � f f u� � f ;f n � � Khoảng tin cậy đối xứng p với BÀI TOÁN KIỂM ĐỊNH Phân biệt với toán ước lượng: + Bài tốn ước lượng: có từ ước lượng, có từ độ tin cậy + Bài tốn kiểm định: có từ kiểm định, có từ mức ý nghĩa Các bước làm: + Xác định toán: giả thuyết H, đối thuyết K, mức ý nghĩa + Nêu điều kiện (nếu có) để đưa thống kê + Xác định miền bác bỏ H (miền W) + Tính giá trị quan sát thống kê Kiểm tra xem giá trị quan sát thống kê có thuộc miền W hay khơng: Nếu thuộc ta bác bỏ H, chấp nhận K Nếu khơng thuộc chưa bác bỏ H nên tạm thời chấp nhận H, bác bỏ K Hai vấn đề tốn kiểm định: + Xác định thống kê sử dụng + Xác định miền W I Kiểm định giả thuyết giá trị trung bình (Kiểm định kỳ vọng) BT1: H : 0 � � K : 0 � BT2: H : 0 � � K : 0 � Trường hợp Sử dụng thống kê biết, X có phân phối X G chuẩn mẫu lớn BT3: H : 0 � � K : � � Miền W BT1: W G : G �u BT2 : W G : G �u n � � � � BT3: W � G : G �u � � � �2 � � chưa biết, X có phân BT1: W T : T �t n 1 phối chuẩn BT2 : W T : T � t n 1 T X � � � � BT3: W � T : T �t n 1 � � � �2 � � n 1 S X 0 n T X chưa biết, X khơng có S$0 n G S phân phối chuẩn X 0 n G mẫu lớn S$ BT1: W G : G �u BT2 : W G : G �u � � � � BT3: W � G : G �u � � � �2 � � II Kiểm định giả thuyết tỉ lệ (Kiểm định xác suất) Gọi p tỉ lệ phần tử mang đặc tính A tổng thể BT1: H : p p0 � � K : p p0 � BT2: H : p p0 � � K : p p0 � Trường hợp Sử dụng thống kê Mẫu lớn G BT3: H : p p0 � � K : p �p � Miền W BT1: W G : G �u f p0 n p0 p0 BT2 : W G : G �u � � � � BT3: W � G : G �u � � � �2 � � III So sánh hai tỉ lệ (So sánh hai xác suất) Giả sử ta cần so sánh tỉ lệ phần tử mang đặc tính A đám đông Gọi p1 ;p tỉ lệ phần tử mang đặc tính A đám đơng Ta có tốn so sánh: BT1: H : p1 p � � K : p1 p � Trường hợp Hai mẫu lớn BT2: H : p1 p � � K : p1 p � Sử dụng thống kê BT3: H : p1 p � � K : p1 �p � Miền W BT1: W G : G �u BT2 : W G : G �u � � � � BT3: W � G : G �u � � � �2 � � f1 f G �1 � f 1 f � � �n1 n � Ở đó: n1 kích thước mẫu thứ nhất, n kích thước mẫu thứ hai f1 m1 n1 tỉ lệ phần tử mang đặc tính A mẫu thứ f2 m2 n tỉ lệ phần tử mang đặc tính A mẫu thứ hai f m1 m n1 n tỉ lệ phần tử mang đặc tính A chung hai mẫu IV So sánh hai giá trị trung bình (So sánh kỳ vọng) Giả sử cần so sánh giá trị trung bình dấu hiệu nghiên cứu hai đám đơng khác Gọi X dấu hiệu cần nghiên cứu đám đông thứ nhất, Y dấu hiệu cần nghiên cứu đám đơng thứ hai 2 Kí hiệu E X 1;E Y D X 1 ;D Y Ta có tốn so sánh: BT1: H : 1 � � K : 1 � Trường hợp 12 ; 22 biết, X BT2: BT3: Sử dụng thống kê BT1: W G : G �u BT2 : W G : G �u n1 n 2 hai 2 � � � � BT3: W � G : G �u � � � �2 � � mẫu lớn H : 1 � � K : 1 � � Miền W XY Y có phân phối G chuẩn H : 1 � � K : 1 � 12 22 chưa biết, X Y n1n n1 n T n1 n n1SX2 n 2S2Y X Y có phân BT1: W T : T �t n1 n2 2 BT2 : W T : T � t n1 n2 2 � � � � BT3: W � T : T �t n1 n 2 � � � �2 � � phối chuẩn G ; chưa biết, X 2 Y khơng có phân phối chuẩn G hai mẫu lớn BT1: W G : G �u XY X Y S S n1 n BT2 : W G : G �u XY � � � � BT3: W � G : G �u � � � �2 � � 2 S$X S$Y n1 n 2 Trường hợp 1 ; 2 chưa biết, X Y khơng có phân phối chuẩn hai mẫu bé ta giải toán so sánh kỳ vọng (bài toán 3) tiêu chuẩn hạng Mann – Whitney tiêu chuẩn hạng Wilcoxon: + Nếu số liệu cho theo cặp sử dụng tiêu chuẩn Wilcoxon + Nếu số liệu không cho theo cặp sử dụng tiêu chuẩn Mann – Whitney Lưu ý: Hai tiêu chuẩn giải toán Các bước làm tiêu chuẩn Wilcoxon: + Tính d i ; d i đếm số giá trị d i �0 Gọi số giá trị d i �0 n + Sắp xếp + Tính + Đặt d i �0 theo thứ tự từ bé đến lớn rank d i T T G + Đặt + Tính G qs với d i tính E T T E T D T n n 1 T �rank di di 0 ;D T n n 1 2n 1 24 � � � � W� G : G �u � � � �2 � � miền bác bỏ H kết luận Các bước làm tiêu chuẩn Mann – Whitney: + Gộp chung dãy số liệu mẫu xếp theo thứ tự từ bé đến lớn + Tính hạng phần tử mẫu 1, tức tính rank x i ,i 1;n1 n1 + Tính + Tính R1 �rank x i i 1 U1 n1n + Đặt U U1 G G qs E U U E U D U + Đặt + Tính n1 n1 1 R1 n n n n 1 n1n ;D U 2 12 � � � � W� G : G �u � � � � � � miền bác bỏ H kết luận V Kiểm định phù hợp số liệu mẫu Bài toán: Gọi p1 ,p , , p k tỉ lệ phần tử mang đặc tính A1;A ; ;A k đám đông ( p1 p p k ) Từ đám đông, ta lấy mẫu có kích thước n Ta có tốn kiểm định: Giả thuyết H: Số liệu mẫu phù hợp với k tỉ lệ cho Đối thuyết K: Số liệu mẫu không phù hợp với k tỉ lệ cho Giải quyết: Ta sử dụng thống kê: k mi npi � i 1 npi Ở đó: m1;m ; ;m k số phần tử mang đặc tính A1;A ; ;A k mẫu Miền bác H: W : � k2 1 Chú ý: Điều kiện mi �5;i 1;k VI Kiểm định tính độc lập hai dấu hiệu Bài tốn: Giả sử ta có hai dấu hiệu X Y Ta có tốn kiểm định: Giả thuyết H: X Y độc lập nhau; Đối thuyết K: X Y phụ thuộc Giải quyết: Thành lập bảng số liệu: B1 B2 … Bs Tổng hàng A1 m11 m12 … m1s hg1 A2 m 21 m 22 … m 2s hg2 … … … … … … Ar m r1 mr … m rs hgr cot1 cot2 … cots n X Y Tổng cột �r s m 2ij � � � n� 1� � � �i 1 j1 hg i cot j � Ta sử dụng thống kê: Miền bác H: W : �2r 1 s 1 VII So sánh nhiều tỉ lệ (So sánh nhiều xác suất) Bài toán: Gọi tỉ lệ phần tử mang đặc tính A s đám đơng Ta có toán kiểm định: Giả thuyết H : p1 p ps Đối thuyết K: Các tỉ lệ p1 ;p ; ;ps không đồng thời Giải quyết: Thành lập bảng số liệu: B1 B2 … Bs Tổng A1 m11 m12 … m1s hg1 A2 m 21 m 22 … m 2s hg2 X Y 10 Tổng Ở đó, m1j cot1 … cot2 cots n số phần tử mang đặc tính A mẫu lấy từ đám đơng thứ j số phần tử khơng mang đặc tính A mẫu lấy từ đám đông thứ j, j 1;s � � �2 s m ij � n� 1� � � �i 1 j1 hg i cot j � Ta sử dụng thống kê: Miền bác H: W : �s21 11 m 2j TƯƠNG QUAN VÀ HỒI QUY I Tương quan Hệ số tương quan Ta có đánh giá mức độ phụ thuộc tuyến tính X Y dựa vào sau: Rất yếu Yếu Trung bình 0,5 Chặt Rất chặt 0,7 Khi ta nói X Y không tương quan với Nếu X, Y đồng biến X, Y nghịch biến Hệ số tương quan mẫu Hệ số tương quan mẫu biến ngẫu nhiên X, Y là: r X,Y XY X.Y SX SY Với bảng số liệu: y1 y2 … ys Tổng hàng x1 m11 m12 … m1s hg1 x2 m 21 m 22 … m 2s hg2 … … … … … … xr m r1 mr … m rs hgr cot1 cot2 … cots n X Y Tổng cột 12 Ta có: � �r s XY � m x y �� ij i j � n �i1 j1 � Ta có dãy thống kê X: X m Ta tính X;SX x1 hg1 x2 hg2 … … xr hgr y2 cot2 … … ys cots Ta có dãy thống kê Y: Y m Ta tính Y;SY y1 cot1 Với bảng số liệu: X,Y x1; y1 x ; y2 x k ; yk m2 … … m m1 x1 y1 m1 x2 y2 m2 … … … xk yk mk mk Hoặc: X Y m Ta có: XY k k m x y n mi �i i i � n i 1 i 1 với Ta lập dãy thống kê X Y tính X;SX ; Y;SY II Hồi quy Đường hồi quy bình phương trung bình tuyến tính thực nghiệm Y Y r SY XX SX Sai số bình phương trung bình thực nghiệm: 13 S2Y/X SY2 r Điều kiện áp dụng tốt: r �0,7 14 ... giả thuyết H, đối thuyết K, mức ý nghĩa + Nêu điều kiện (nếu có) để đưa thống kê + Xác định miền bác bỏ H (miền W) + Tính giá trị quan sát thống kê Kiểm tra xem giá trị quan sát thống kê có... định thống kê sử dụng + Xác định miền W I Kiểm định giả thuyết giá trị trung bình (Kiểm định kỳ vọng) BT1: H : 0 � � K : 0 � BT2: H : 0 � � K : 0 � Trường hợp Sử dụng thống kê. .. Kiểm định giả thuyết tỉ lệ (Kiểm định xác suất) Gọi p tỉ lệ phần tử mang đặc tính A tổng thể BT1: H : p p0 � � K : p p0 � BT2: H : p p0 � � K : p p0 � Trường hợp Sử dụng thống kê Mẫu lớn