Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 22 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
22
Dung lượng
1,02 MB
Nội dung
Câu 1: Đề : Một nghiên cứu tiến hành thành phố công nghiệp X để xác định tỉ lệ người làm xe máy, xe đạp xe buýt.Việc điều tra tiến hành nhóm Xe máy Buýt Xe Đạp Nữ 25 100 125 Nam 75 120 205 Với mức ý nghĩa 5% nhận định xem có khác tỉ lệ sử dụng phương tiện giao thơng làm nhóm cơng nhân nam cơng nhân nữ hay khơng ? Dạng tốn: Kiểm định giả thiết tỷ lệ Phương pháp giải Giả thiết H : Tỉ lệ sử dụng phương tiện giao thơng làm nhóm công nhân nam nữ khác Tính tổng hàng tổng cột Tính tần số lý thuyết = (tổng hàng * tổng cột)/tổng cộng Tính xác suất P( X > χ² ) cách sử dụng hàm CHITEST Kết luận: Nếu P( X > χ² ) < chấp nhận giả thiết Nếu P( X > χ² ) > bác bỏ giả thiết Cơng cụ giải Áp dụng “ CHIPTEST ” MS - Excel Giải Gọi H tỉ lệ sử dụng phương tiện giao thơng làm nhóm cơng nhân nam nữ khác Tính tổng hàng tổng cột Tính tần số lý thuyết = tổng hàng * tổng cột / tổng cộng - Phụ nữ chọn xe máy : chọn ô B6 nhập biểu thức ==$E2*B$4/$E4 - Phụ nữ chọn xe buýt xe đạp : chọn ô B6 kéo trỏ tự điền đến ô D6 - Nam giới chọn xe máy: chọn ô B7 nhập biểu thức ==$E3*B$4/$E$4 - Nam giới chọn xe buýt xe đạp: chọn ô B7 kéo trỏ tự điền đến ô D7 Tính xác suất P( X > χ² )=CHITEST (Bảng thực tế , Bản kỳ vọng) Chọn ô B nhập biểu thức =CHITEST(B2:D3,B6:D7) Kết luận: Vì P( X > χ² ) < chấp nhận giả thiết H Vậy tỉ lệ phụ nữ nam giới chọn sử dụng loại phương tiện giao thông khác Câu Đề : Để nghiên cứu chiều cao nam niên nước A B người ta lấy ngẫu nhiên nước 28 niên tiến hành đo chiều cao ( tính cm ) kết Nước A Chiều cao 163÷167 167÷171 171÷175 175÷179 179÷183 183÷187 Số người Chiều cao 163÷167 176÷171 171÷175 175÷179 179÷183 183÷187 Số người Nước B a Với độ tin cậy 95%,hãy ước lượng chiều cao trung bình nam niên nước b Có ý kiến cho độ đồng chiều cao nam niên hai quốc gia khác Với mức ý nghĩa 0,05 nhận xét ý kiến Giả sử chiều cao nam niên nước có quy luật phân phối chuẩn a Dạng Ước lượng khoảng trung bình tổng thể chưa biết phương sai với n < 30 Phương pháp giải x a n T n 1 S 1 , Chọn G T P t1 T t Xét T21 n 1 x a S 1 n T2 n 1 S S T2 n 1 a x T21 n 1 n n Công cụ giải : Áp dụng “Descriptive Statistics ” MS Excel x Giải - Từ bảng có đề chuyển bảng bảng sau - Tính cho nước A Mở hộp thoại Data Analysis, chọn Descriptive Statistics Nhập vào hộp thoại Descriptive Statistics giá trị: * Input Range: Phạm vi liệu nhập vào * Grouped By: nhóm liệu theo hàng cột (chọn hàng) * Tích vào Labels in first Row: nhãn cột * Output Range: Phạm vi xuất liệu * Tích vào Summary Statistics * Confidence Level for Mean (Độ tin cậy ): nhập 95% Ta kết Chiều cao trung bình niên nước A khoảng 172.0900402 a 176.4813884 - Làm tương tự cho nước B Mở hộp thoại Data Analysis, chọn Descriptive Statistics Nhập vào hộp thoại Descriptive Statistics giá trị: * Input Range: phạm vi liệu nhập vào * Grouped By: nhóm liệu theo hàng cột (chọn hàng) * Tích vào Labels in first Row: nhãn cột * Output Range: phạm vi xuất liệu * Tích vào Summary Statistics * Confidence Level for Mean (Độ tin cậy ): nhập 95% Ta có kết sau Kết luận Chiều cao trung bình niên nước A khoảng 172.0900402 a 176.4813884 Chiều cao trung bình niên nước B khoảng 172.9105181 a 177.0894819 b Dạng Đây dạng so sánh giá trị trung bình với phương sai khác Phương pháp giải Trắc nghiệm bên phải H : u1 u2 H1 : u1 u2 Trắc nghiệm bên trái H : u1 u2 H1 : u1 u2 Trắc nghiệm hai bên H : u1 u2 H1 : u1 u2 Giá trị thống kê: t X X 1 2 S12 S2 N1 N ;t X1 X S12 S2 N1 N Phân phối Student S12 S 2 N1 N S12 S 2 N1 N N1 N Biện luận Nếu t t hay t ( ước tính) chấp nhận giả thiết H Giả thiết H : u1 u2 : “Độ đồng chiều cao nam niên hai quốc gia giống nhau” H : u1 u2 : “Độ đồng chiều cao nam niên hai quốc gia khác nhau” Công cụ giải Áp dụng “ t-test:Two-Sample Assuming Unequal Variances” MS Excel 2013 Giải Mở hộp thoại Data → Data Analysis →t-test:Two-Sample Assuming Unequal Variances Nhập vào hộp thoại giá trị sau * Variable Range : liệu nước A * Variable Range : liệu nước B * Chọn Labels * Alpha :0,05 * Output Range : Chỗ xuất liệu Có kết Kết luận Vì tqs tstat -0.483535644785699 tnguong tCritical two-tail nên chấp nhận giả thiết H Vậy độ đồng chiều cao nam niên hai quốc gia A B Chú ý Trong số trường hợp so sánh với t Critical one-tail 10 Câu 3: Đề Tính tỉ số tương quan Y X, hệ số tương quan hệ số xác định tập số liệu sau Với mức ý nghĩa 5% ,có kết luận mối tương quan X Y (có phi tuyến khơng? Có tuyến tình khơng?) Tìm đường hồi quy Y X X Y 15 13 25 22 10 15 17 20 21 10 10 20 25 25 18 30 14 Dạng bài: Phân tích tương quan hồi quy Cơ sở lý thuyết: PHÂN TÍCH TƯƠNG QUAN Hai biến số ngẫu nhiên Y X có thể: liên quan tuyến tính (a b), có khuynh hướng tuyến tính (c) khơng có liên quan (d c) Hệ số tương quan Pearson: X ,Y cov( X , Y ) ; X N N X ; Yi Y i X Y N N i 1 i 1 XY Sự phân tích tương quan (correlation) khảo sát khuynh hướng mức độ liên quan, phân tích hồi quy(regrestion) xác định liên quan định lượng hai biến số ngẫu nhiên Y X Hệ số tương quan ước tính biểu thức: X n S XY R S XX SYY i 1 X X Yi Y i X n i 1 i Y Y 2 i 11 30 10 Phương pháp và công cụ giải: Phân tích tương quan tuyến tính: Giả thiết 𝐻0 : X Y có tương quan tuyến tính Áp dụng "Correlation" MS-Excel để tính hệ số tương quan hệ số xác định Ta tính t (n=10) Nếu t t ;n2 chấp nhận giả thiết H r n2 1 r2 t ;n 2 phân vị mức phân bố Student với n-2 bậc tự - Phân tích tương quan phi tuyến: Sắp xếp lại bảng số liệu Áp dụng "Anova Single Factor" MS-Excel để tính tỷ số tương quan Giả thiết: H X Y khơng có tương quan phi tuyến r n k Ta tính: F 1 k 2 Y X F phân bố Fisher bậc tự (k-2,n-k) Y X Nếu F F bác bỏ giả thiết H - Phân tích hồi quy : Áp dụng: "Regression" MS-Excel để tìm đường hồi quy Giải: Phân tích tương quan tuyến tính Giả thiết 𝐻0 : X Y có tương quan tuyến tính Nhập vào bảng sau 12 Áp dụng: "Correlation" để tính hệ số tương quan hế số xác định Vào Data -> Data Analysics -> Correlation -> OK * * * * Input Range: Phạm vi đầu vào Group by: Columns Chọn Label in first row Out range: Phạm vi đầu Hệ số tương quan r Chọn ô C4 nhập vào biểu thức = B3 Hệ số xác định r Chọn ô C4 nhập vào biểu thức = B3^2 Tính t r n2 1 r2 Chọn ô C6 nhập vào biểu thúc : =(C4*SQRT(10-2))/SQRT(1- C5) Dùng hàm TINV tính t ;n phân vị mức phân bố Student với n-2 bậc tự (n=10) Chọn ô C7 nhập vào =TINV(0.025,8) 13 Từ ta có kết t t ;n Chấp nhận giả thiết 𝐻0 Kết luận: Vậy X Y khơng có tương quan tuyến tính Phân tích tương quan phi tuyến: Sắp xếp lại bảng số liệu Áp dụng: "Anova Single Factor" để tính tỷ số tương quan Vào Data → Data Analysics → Anova: Single Factor → OK * * * * Input Range: Phạm vi đầu vào Group by: Columns Chọn Label in first row Output range: Phạm vi đầu 14 Ta có kết Các kết SSF Chọn ô L23 nhập vào biểu thức = L18 SSE Chọn ô L24 nhập vào biểu thức = L21 SSF Chọn ô L25 nhập vào biểu thức =L23/L24 Y X SSE Tỉ số tương quan Y X Chọn ô L26 nhập vào biểu thức = =SQRT(L25) 15 Giả thiết H : X Y có tương quan phi tuyến r n k Chọn ô O23 nhập vào biểu thức F 1 k 2 Tính Y X Y X =(L25-C5)*5/((1-L25)*3) Tính F phân vị mức 0,05 phân bố Fisher bậc tự (k-2,n-k) Với n = 10, k = Chọn ô O24 nhập vào biểu thức = FINV(0.05,3,5) F F nên bác bỏ giả thiết H Kết luận: Vậy X Y khơng có tương quan phi tuyến Phân tích hồi quy: Giả thiết 𝐻0 : đường hồi quy có ý nghĩa Nhập bảng liệu Áp dụng: "Regression" để tìm đường hồi quy Vào Data → Data Analysics → Regression → OK 16 * * * * Input Y range: Phạm vi đầu vào Y Input X Range: Phạm vi đầu vào X Chọn Labels Line Fit Plots Output range: Phạm vi đầu 17 Ta có p-value > 0,05 nên bác bỏ giả thiết 𝐻0 18 Kết luận : Vậy đường hồi quy Y X: Y = 10,4 + 0.26X Câu 4: Đề bài: Trên sở tập số liêụ sau phân tích xem tỉ lệ đổ loại giỏi có phụ thuộc vào trường trung học phổ thông ban hay không với mực ý nghĩa 0,05 Ở z tỉ lệ đổ loại giỏi (%); f trường trung học phổ thông 1,2,3,4; g ban (1 = ban A; = ban B) STT z 38 38 42 42 41 42 44 45 f 1 1 2 2 g 1 2 2 STT 10 11 12 13 14 15 16 z 35 32 33 34 31 33 33 35 f 3 3 4 4 g 1 1 2 Dạng bài: Phân tích phương sai hai yếu tố có lặp Sự phân tích nhằm đánh giá ảnh hưởng hai yếu tố giá trị quan sát Yij (i=1, 2…r: yếu tố A; j= ,2…c: yếu tố B) Phương pháp giải : Giải thiết H : µ1 µ2 µk "Các giá trị trung bình nhau” H1 : µ1 µ2 ”Ít hai giá trị trung bình khác nhau” Giá trị thống kê : MSB MSF Fr Fc MSE MSE Biện luận: Nếu Fr F b 1, k 1 b 1 chấp nhận H (yếu tố A) Nếu Fc F b 1, k 1 b 1 chấp nhận H (yếu tố B) Ta giả thiết H 01 : Yếu tố Ban ảnh hưởng đến tỷ lệ đỗ loại giỏi trường Ta giả thiết H 02 : Yếu tố trường phổ thông ảnh hưởng đến tỷ lệ đỗ loại giỏi trường Cơng cụ giải: Sử dụng cơng cụ "Anova : Two - Factor With Replication" MS-Excell Giải Sắp xếp lại bảng số liệu 19 Vào Data → Data Analysis → Anova: Two - Factor With Replication · * * * * Input range: quét chọn bảng số liệu bước Rows per sample: 0,05 Output Range: Phạm vi đầu 20 Kết hiển thị Biện luận: Fr F Bác bỏ giả thiết H 01 Fc F0,05 Bác bỏ giả thiết H 02 Kết luận: Vậy yếu tố trường phổ thông ban ảnh hưởng tới tỉ lệ đỗ loại giỏi trường 21 22