bài tập xác xuất thống kê

20 303 0
bài tập xác xuất thống kê

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Với mức ý nghĩa α = 5%, mức độ thỏa mãn cuộc sống có giống nhau trong 5 thành phố trên hay không? Bài làm Dạng bài: Kiểm định giả thiết về tỉ lệ. Phương pháp giải: Áp dụng kiểm định khi bình phương ꭓ 2 Cơ sở lý thuyết: Giả thiết: H0: P1 = P1,0, P2 = P2,0=... = Pk,0  “ Các cặp Pi và Pi,0 giống nhau” H1: Ít nhất có một cặp Pi và Pi,0 khác nhau” Trong trắc nghiệm khi bình phương cho phép so sánh không những hai mà nhiều tỷ số (tỷ lệ hay xác suất) một cách tiện lợi. Dạng thống kê hay sử dụng nhất là: ꭓ 2= ∑ (Oi−Ei ) 2 Ei h i=1 Với Oi – các tần số thực nghiệm (observed frequency) Ei – các tần số lý thuyết ( expected frequency) Biện luận: + Nếu ꭓ 2 > ꭓ 2 a ⇒ Bác bỏ giả thiết H0( DF= k1) Trong chương trình MSEXCELVới mức ý nghĩa α = 5%, mức độ thỏa mãn cuộc sống có giống nhau trong 5 thành phố trên hay không? Bài làm Dạng bài: Kiểm định giả thiết về tỉ lệ. Phương pháp giải: Áp dụng kiểm định khi bình phương ꭓ 2 Cơ sở lý thuyết: Giả thiết: H0: P1 = P1,0, P2 = P2,0=... = Pk,0  “ Các cặp Pi và Pi,0 giống nhau” H1: Ít nhất có một cặp Pi và Pi,0 khác nhau” Trong trắc nghiệm khi bình phương cho phép so sánh không những hai mà nhiều tỷ số (tỷ lệ hay xác suất) một cách tiện lợi. Dạng thống kê hay sử dụng nhất là: ꭓ 2= ∑ (Oi−Ei ) 2 Ei h i=1 Với Oi – các tần số thực nghiệm (observed frequency) Ei – các tần số lý thuyết ( expected frequency) Biện luận: + Nếu ꭓ 2 > ꭓ 2 a ⇒ Bác bỏ giả thiết H0( DF= k1) Trong chương trình MSEXCELVới mức ý nghĩa α = 5%, mức độ thỏa mãn cuộc sống có giống nhau trong 5 thành phố trên hay không? Bài làm Dạng bài: Kiểm định giả thiết về tỉ lệ. Phương pháp giải: Áp dụng kiểm định khi bình phương ꭓ 2 Cơ sở lý thuyết: Giả thiết: H0: P1 = P1,0, P2 = P2,0=... = Pk,0  “ Các cặp Pi và Pi,0 giống nhau” H1: Ít nhất có một cặp Pi và Pi,0 khác nhau” Trong trắc nghiệm khi bình phương cho phép so sánh không những hai mà nhiều tỷ số (tỷ lệ hay xác suất) một cách tiện lợi. Dạng thống kê hay sử dụng nhất là: ꭓ 2= ∑ (Oi−Ei ) 2 Ei h i=1 Với Oi – các tần số thực nghiệm (observed frequency) Ei – các tần số lý thuyết ( expected frequency) Biện luận: + Nếu ꭓ 2 > ꭓ 2 a ⇒ Bác bỏ giả thiết H0( DF= k1) Trong chương trình MSEXCEL

Mục lục Trang Bài 1……………………………………………………………… Bài 2……………………………………………………………… Bài 3……………………………………………………………… Bài 4……………………………………………………………….16 Bài 1: Một điều tra xã hội tiến hành thành phố A, B, C ,D E yêu cầu người hỏi diễn tả mức độ thỏa mãn thành phố mà họ sống Kết sau: Thành phố A B C D E Mức độ thỏa mãn Rất thỏa mãn Tương đối 220 121 130 207 84 54 156 95 122 164 Không 63 75 24 43 73 Với mức ý nghĩa α = 5%, mức độ thỏa mãn sống có giống thành phố hay không? Bài làm Dạng bài: Kiểm định giả thiết tỉ lệ Phương pháp giải: Áp dụng kiểm định bình phương ꭓ2 Cơ sở lý thuyết: - - Giả thiết: H0: P1 = P1,0, P2 = P2,0=… = Pk,0  “ Các cặp Pi Pi,0 giống nhau” H1: Ít có cặp Pi Pi,0 khác nhau” Trong trắc nghiệm bình phương cho phép so sánh hai mà nhiều tỷ số (tỷ lệ hay xác suất) cách tiện lợi Dạng thống hay sử dụng là: (𝑂𝑖 −𝐸𝑖 )2 ꭓ2 = ∑ℎ𝑖=1 [ - 𝐸𝑖 ] Với 𝑂𝑖 – tần số thực nghiệm (observed frequency) 𝐸𝑖 – tần số lý thuyết ( expected frequency) Biện luận: + Nếu ꭓ2 > ꭓ2 𝑎 ⇒ Bác bỏ giả thiết H0( DF= k-1) Trong chương trình MS-EXCEL có hàm số Chitest tính: Giá trị ꭓ2 theo biểu thức: 𝑟 𝑐 (𝑂𝑖𝑗 − 𝐸𝑖𝑗 ) ] ꭓ = ∑∑[ 𝐸𝑖𝑗 𝑖=1 𝑗=1 - - Với 𝑂𝑖𝑗 – tần số thực nghiệm ô thuộc hàng j cột j 𝐸𝑖𝑗 – tần số lý thuyết ô thuộc hàng j cột j 𝑟 số hàng, 𝑐 số cột Xác suất P(X> ꭓ2 ) với bậc tự DF = (𝑟 -1)( 𝑐 -1) 𝑟 số hàng, 𝑐 số cột bảng ngẫu nhiên ( Contingency table) Nếu P(X> ꭓ2 ) > α⇒ Chấp nhận giả thiết H0 ngược lại Công cụ giải: hàm CHITEST Excel Thực thuật tốn Excel • Nhập liệu vào bảng tính: Mức độ thỏa mãn Rất thỏa mãn Tương đối 220 121 130 207 84 54 156 95 122 164 Thành phố A B C D E Không 63 75 24 43 73 • Tính tổng hàng cột Mức độ thỏa mãn Thành phố A B C D E Tổng cột Rất thỏa mãn 220 130 84 156 122 712 Tương đối 121 207 54 95 164 641 Không 63 75 24 43 73 278 Tổng hàng 404 412 162 294 359 1631 • Tính tần số lý thuyết: tần số lý thuyết = (tổng hàng x tổng cột)/(tổng cộng) Rất thảo mãn 176.3629675 179.8553035 70.7198038 128.3433476 156.7185776 A B C D E Tương đối 158.7762109 161.9202943 63.66768853 115.5450644 141.0907419 Không 68.86082158 70.22440221 27.61250766 50.11158798 61.19068056 • Sử dụng hàm CHITEST để tính xác suất CHITEST 3.52990E-13 • Kết biện luận Giả thiết H0: Mức độ thỏa mãn sống thành phố H1: Mức độ thỏa mãn sống thành phố khác Ta có: P(X>ꭓ2) = 3.5299E-13 < α = 0.05 ⇒Ta bác bỏ giả thiết H0 , chấp nhận giả thiết H1 Vậy: Mức độ thỏa mãn sống thành phố khác Bài 2: Để đánh giá hiệu chiến dịch quảng cáo, người ta so sánh doanh số công ty khu vực thị trường trước sau chiến dịch quảng cáo thu số liệu sau ( đơn vị: triệu đồng/ tháng): Trước quảng cáo Sau quảng cáo 620 600 640 630 570 600 660 620 670 620 580 630 Với độ tin cậy 95% ước lượng doanh số trung bình trước sau chiến dịch quảng cáo Với mức ý nghĩa 5% cho ý kiến chiến dịch quảng cáo có thành cơng hay không? Biết doanh số công ty biến ngẫu nhiên phân phối chuẩn Bài làm Dạng bài: Kiểm định giá trị trung bình với phương sai ước lượng hai trung bình tổng thể Cơ sở lý thuyết: - Ước lượng giá trị trung bình: Ta tính khoảng ước lượng trung bình theo cơng thức sau: Với 𝑥̅ giá trị trung bình độ xác So sánh giá trị trung bình với phương sai  Giả thiết: Trường hợp hai mẫu có liệu tương ứng cặp: Ho: giả thuyết chiến dịch quảng cáo thành công H1: giả thuyết chiến dịch quảng cáo không thành công  Giá trị thống kê: t= ̅̅̅̅−𝑋2 ̅̅̅̅)−(𝜇1− 𝜇2) (𝑋1 1 √𝑆𝑝2 ( + ) 𝑁1 𝑁2 = ̅̅̅̅− 𝑋2 ̅̅̅̅) (𝑋1 1 + ) 𝑁1 𝑁2 √𝑆𝑝2 ( Có phân phối Student với 𝛾 = N1 + N2 – bậc tự (𝑁1 − 1) 𝑆12 + (𝑁2 − 1) 𝑆21 𝑆𝑝 = 𝑁1 + 𝑁2 −  Biện luận: Nếu | t | < t𝛼 hay 𝑡𝛼 (𝛾 = N1 + N2 – 2) => Chấp nhận giả thiết Ho Thực thuật toán Excel • Nhập liệu vào bảng tính: Trước quảng cáo Sau quảng cáo 620 660 600 620 640 670 630 620 570 580 600 630 Phần 1: Ước lượng doanh số trung bình trước sau chiến dịch quảng cáo Mở hộp thoại Data Analysis chọn Descriptive Statistics Nhập vào hộp thoại Desciptive Statistics ₒ Input Range: phạm vi liệu nhập vào ₒ Grouped By: nhóm liệu theo hàng cột (chọn hàng) ₒ Labels in first row: nhãn cột (chọn) ₒ Output Range: phạm vi liệu xuất ₒ Tích dấu chọn vào Summary statistics ₒ Confidence Level for Mean: Nhập 95 (%) Ta bảng kết Trước quảng cáo Mean Standard Error Median Mode Standard Deviation Sample Variance Kurtosis Skewness Range Minimum Maximum Sum Count Confidence Level(95.0%) 610 10.32795559 610 600 25.29822128 640 0.166015625 -0.55586912 70 570 640 3660 26.54885504 Kết luận: Doanh số trước quảng cáo là: 610 ± 26.5488550386206 Mở hộp thoại Data Analysis chọn Descriptive Statistics Nhập vào hộp thoại Desciptive Statistics ₒ Input Range: phạm vi liệu nhập vào ₒ Grouped By: nhóm liệu theo hàng cột (chọn hàng) ₒ Labels in first row: nhãn cột (chọn) ₒ Output Range: phạm vi liệu xuất ₒ Tích dấu chọn vào Summary statistics ₒ Confidence Level for Mean: Nhập 95 (%) Ta bảng kết Sau quảng cáo Mean Standard Error Median Mode Standard Deviation Sample Variance Kurtosis Skewness Range Minimum Maximum Sum Count Confidence Level(95.0%) 630 13.16561177 625 620 32.24903099 1040 0.011094675 0.322013253 90 580 670 3780 33.84328248 Kết luận: Doanh số sau quảng cáo là: 630 ± 33.8432824763682 Tổng kết: + Chiến dịch quảng cáo có tác dụng với doanh số + Doanh số trước quảng cáo là: 610 ± 26.5488550386206 + Doanh số sau quảng cáo là: 630 ± 33.8432824763682 Phần 2: Tìm kết luận tác dụng chiến dịch quảng cáo Mở hộp thoại Data Analysis chọn t-Test Two-Sample Assuming Equal Variances Nhập vào hộp thoại t-Test Two-Sample Assuming Equal Variances ₒ Input Range: phạm vi liệu nhập vào ₒ Grouped By: nhóm liệu theo hàng cột (chọn hàng) ₒ Labels in first row: nhãn cột (chọn) ₒ Output Range: phạm vi liệu xuất ₒ Tích dấu chọn vào Summary statistics ₒ Confidence Level for Mean: Nhập 95 (%) Ta bảng kết t-Test: Two-Sample Assuming Equal Variances Kết Trước quảng cáo Mean Variance Observations Pooled Variance Hypothesized Mean Difference df t Stat P(T α = 0,05 => Bác bỏ giả thiết H Suy ra, hệ số tự có ý nghĩa thống Giá trị P hệ số góc (P-value) =0.0742756317313767 > α = 0,05 => bác bỏ giả thiết H Suy ra, hệ số góc có ý nghĩa thống Giá trị F (Significance F) = 0.0742756317313767 > α = 0,05 => Bác bỏ giả thiết H ->Phương trình đường hồi quy thích hợp Kết luận: 18 Tỷ số tương quan ηY/X =0.870988341 Hệ số tương quan r = 0.533142623546057 Hệ số xác định r² = 0.284241057 X Y không tương quan tuyến tính với mức ý nghĩa 5% X Y không tương quan phi tuyến với mức ý nghĩa 5% Phương trình đường hồi quy Y X: Y =0.392523364485981X + -17.7102803738318 Bài 4: Hãy phân tích vai trò ngành nghề (chính, phụ) hoạt động kinh tế hộ gia đình vùng nông thôn sở bảng số liệu thu nhập hộ tươngứng với ngành nghề nói sau ( mức ý nghĩa 5%): Nghề Trông lúa (1) Trồng ăn (2) Chăn nuôi (3) Dịch vụ (4) (1) 3.5 5.6 4.1 7.2 Nghề phụ (2) (3) 7.4 4.1 6.1 2.5 1.8 3.2 2.2 (4) 3.5 9.6 2.1 1.5 Bài làm: Dạng bài: tốn phân tích phương sai hai yếu tố khơng lặp Cơ sở lý thuyết: Giả thiết 19 H0: 𝜇1 = 𝜇2 = = 𝜇k  “Các giá trị trung bình nhau” H1: 𝜇i ≠ 𝜇j  “Ít có hai giá trị trung bình khác nhau” Giá trị thống kê: 𝐹𝑅 = 𝑀𝑆𝐵 𝑀𝑆𝐸 𝐹𝐶 = 𝑀𝑆𝐹 𝑀𝑆𝐸 Biện luận: Nếu FR < Fα[r-1,(r-1)(c-1)] ⇒ chấp nhận H0 (yếu tố A) Nếu FC < Fα[r-1,(r-1)(c-1)] ⇒ chấp nhận H0 (yếu tố A) Công cụ giải: Two-Factor Without Replication Thực thuật toán Excel Giả thiết H: Các giá trị trung bình • Nhập liệu vào bảng tính: Nghề Trơng lúa (1) Trồng ăn (2) Chăn nuôi (3) Dịch vụ (4) (1) 3.5 5.6 4.1 7.2 Nghề phụ (2) (3) 7.4 4.1 6.1 2.5 1.8 3.2 2.2 (4) 3.5 9.6 2.1 1.5 Mở hộp thoại Data Analysis chọn Anova: Two-Factor Without Replication ₒ Input Range: phạm vi liệu nhập vào ₒ Grouped By: nhóm liệu theo hàng cột (chọn hàng) ₒ Labels in first row: nhãn cột (chọn) ₒ Output Range: phạm vi liệu xuất 20 Anova: Two-Factor Without Replication SUMMARY Trông lúa (1) Trồng ăn (2) Chăn nuôi (3) Dịch vụ (4) (1) (2) (3) (4) Count 4 4 Sum 22.4 25.4 10.5 14.1 Average 5.6 6.35 2.625 3.525 Variance 5.94 5.4167 1.0492 6.4892 4 4 20.4 17.2 18.1 16.7 5.1 4.3 4.525 4.175 2.74 4.7 9.1292 13.783 df MS 12.13 0.672 6.074 F P-value 1.9966 0.1851 0.1106 0.9517 ANOVA Source of Variation Rows Columns Error Total SS 36.385 2.015 54.67 93.07 3 F crit 3.862548358 3.862548358 15 Biện luận : Frows (Nghề chính)=1.99661605999634 < F0.05 = 3.86254835762476 nên chấp nhận giả thuyết H(nghề chính) Fcol (Nghề phụ)= 0.110572526065483 < F0.05 = 3.86254835762476 nên chấp nhận giả thuyết H(Nghề phụ) Kết luận : Vậy nghề nghề phụ ảnh hưởng đến thu nhập 21 ... tương quan hệ số xác định Y X Với mức ý nghĩa α = 5%, có kết luận mối tương quan X Y (Có phi tuyến hay khơng? Có tuyến tính hay khơng?) Tìm đường hồi quy Y X Bài làm Dạng bài: Bài toán kiểm định... −

Ngày đăng: 09/11/2018, 15:12

Từ khóa liên quan

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan