BÁO cáo bài tập lớn xác SUẤT THỐNG kê tìm các đặc trưng từ mẫu dữ liệu

32 9 0
BÁO cáo bài tập lớn xác SUẤT THỐNG kê tìm các đặc trưng từ mẫu dữ liệu

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

ĐẠI HỌC QUỐC GIA THÀNH PHỐ HỒ CHÍ MINH TRƯỜNG ĐẠI HỌC BÁCH KHOA THÀNH PHỐ HỒ CHÍ MINH -*** - BÁO CÁO BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ GVHD: Nguyễn Kiều Dung Nhóm: 07 Danh sách thành viên STT TP.HCM, ngày tháng 12 năm 2020 Câu 1: Chọn biến định lượng thực hiện: - Tìm đặc trưng từ mẫu liệu - Tìm khoảng tin cậy cho giá trị trung bình phương sai tổng thể A Lập toán cụ thể Khảo sát 100 sinh viên K19 trường đại học học Bách Khoa vấn đề chi tiêu cho việc ăn uống, ta bảng số liệu sau Khóa Số tiền a Tìm đặt trưng từ bảng số liệu b - Với độ tin cậy 95%, tìm khoảng tin cậy cho việc chi tiêu trung bình K19 - Với độ tin cậy 95%, tìm khoảng tin cậy cho phương sai tổng thể B Cơ sở lý thuyết • - Đặc trưng mẫu Trung bình mẫu: ̅= - Phương sai mẫu: =( 1− ̅)2 1+( 2− ̅)2 2+⋯+( = ( − ̅)2 +( − ̅)2 2 − ̅) + ⋯ + ( − ̅)2 Đặt: ̅ Theo tính chất phương sai ta có: ̅ ̅2 () = | − ̅ | - Phương sai mẫu hiệu chỉnh: =  Ước lượng mẫu - Ước lượng khoảng trung bình mẫu Trường hợp > 30 Ta có: Đặt: Tra bảng tìm Từ đó: = - ℎ ả ướ ượ ( ̅− ; + ̅ ) Ước lượng khoảng phương sai Phương pháp giải trường hợp tổng thể có phân phối chuẩn Với + = ta có: ( 1− Từ đó, với mẫu cụ thể ta có khoảng ước lượng phương sai ( 2 Để thuận tiện cho tra bảng, tốn tìm khoảng ước lượng phương sai ta xét là: 1= = Khi đó, khoảng ước lượng phương sai ( C Lời giải tính tay Bảng số liệu: 0.25 0.75 1.25 1.75 2.25 2.75 3.25 3.75 4.25 4.75 Tổng 160 ̅= 100 = 1.6 ̅ ̅2 301.25 = 100 × 0.4525 - 100 = 3.0125 = 3.0125 − 1.62 = 0.4525 = = 0.457071 Tính khoảng ước lượng trung bình Đặc trưng mẫu: = 100 ; ̅= 1.6 ; = 0.6761 Φ(  = 1.96×0.6761 = 0.1325 √100 Vậy khoảng ước lượng trung bình (1.6 − 0.1325; 1.6 + 0.1325) = (1.4675 ; 1.7325) - Tính khoảng ước lượng phương sai Ta có: = 0.457 Tra bảng phân phối chuẩn 2 025(99) Vì giá trị 025(99) 975(99) với − = 99,ta có: = 128.422 , 02.975(99) = 73.361 khơng có bảng tra nên ta sử dụng hàm CHIINV( ,n-1) Vậy khoảng ước lượng cần tìm là: ( Hay (0.3523; 0.6167) 99 × 0.457 99 × 0.457 ; ) 128.422 73.361 D Lời giải từ việc sử dụng exel Step1: Nhập số liệu: Step2: Sử dụng chức Data Analysis  Chọn Descriptive Statistics Step3: Sử dụng hàm CHIINV công thức để tính khoảng ước lượng phương sai Kết quả: Câu 2: Chọn liệu biến định lượng (hoặc xử lý số liệu theo nhóm cho phù hợp) để lập tốn kiểm định so sánh trung bình tổng thể A Lập toán cụ thể Khảo sát 100 sinh viên K19 200 sinh viên K20 mức chi tiêu cho việc ăn uống hàng tháng trường Đại Học Bách Khoa Tp.HCM bảng số liệu sau : Phải số tiền trung bình cho việc chi tiêu ăn uống hàng tháng sinh viên K19 K20 với mức ý nghĩa 5% ? B Cơ sở lý thuyết - Kiểm định so sánh trung bình tổng thể: Giả thiết điều kiện H0: a1=a2 Giả thiết đối điều kiện H1: a1≠a2 n1 n2 lớn 30 nên sử dụng bảng tra Laplace: ϕ(Zα)=(1-α)/2 => Zα Miền bác bỏ giả thiết đối : Wα=(-∞;-Zα) ∪ (Zα;+∞) Giá trị trung bình: = ∑ Phương sai mẫu hiệu chỉnh: Tiêu chuẩn kiểm định: =1 = = − ∑ =1( − )2 | 1− 2| √ 12+ 22 Nếu thuộc miền bác bỏ bác bỏ giả thuyết chất nhận giả thuyết điều kiện C Lời giải tính tay Gọi a1 a2 trung bình chi tiêu cho việc ăn uống khóa K19 K20 Giả thiết H0: a1=a2 Giả thiết đối H1: a1≠a2 - Mức ý nghĩa α=5% => ϕ(Zα)=(1-0.05)/2=0.475 => Zα=1.96 Miền bác bỏ: Wα=(-∞;-1.96) ∪ (1.96;+∞) Đặc trưng mẫu: K19: n1=100 Trung bình mẫu: Phương sai mẫu hiệu chỉnh: = 4.5707 × 10 Độ lệch chuẩn mẫu hiệu chỉnh: K20: n2=200 Trung bình mẫu: Phương sai mẫu hiệu chỉnh: = 5.3718 × 10 1= 1.600.000vnđ 11 = 676070.05 2= 1.397.500vnđ 2 11 Độ lệch chuẩn mẫu hiệu chỉnh: = 732925.6 Ta thấy thuộc miền bác bỏ nên bác bỏ giả thiết chấp nhận giả thiết H Kết luận chi tiêu cho việc ăn uống khóa K19 K20 khác D Lời giải từ việc sử dụng exel Giả sử a1 a2 trung bình số tiều chi tiêu cho việc ăn uống sinh viên K19, K20 đại học Bách Khoa Giải thuyết Ho: a1= a2 Giải thuyết đối H1: a1≠a2 Với mức ý nghĩa α = 5% n1 n2 lớn 30 => ϕ(Zα) = Zα=1.96 1−0 05 = 0.475 => Vậy miền bác bỏ wα = ( −∞; −1.96) ∪ (1.96; +∞) a Tìm thơng số cần tính exel Step 1: Nhập số liệu vào excel Step 2: Sử dụng Data Analysis  Descriptive statistics Step 3: Chọn vùng liệu vùng xuất Theo đề ta tính được trưng mẫu khóa K19: - Trung bình mẫu: 1=1.600.000 (vnđ) - Phương sai mẫu hiệu chỉnh : s =4.57x1011 - Độ lệch chuẩn mẫu hiệu chỉnh 1=676070.05 A Lập toán cụ thể Khảo sát số tiền sinh viên chi tiêu cho việc ăn uống hàng tháng sinh viên K19 K20 (Trường Đại học Bách Khoa Tp.HCM) Chọn ngẫu nhiên 200 sinh viên để khảo sát, kết thu cho bảng sau: Số tiền (VNĐ) Với mức ý nghĩa 5%, nêu kết luận đồng số tiền chi tiêu cho việc ăn uống hàng tháng sinh viên K19 sinh viên K20 B Cơ sở lý thuyết giải toán  Dạng bài: Kiểm định giả thuyết cho phương sai hai tổng thể  Công cụ giải: chức F-Test Two-Sample for Variances Excel  Phương pháp: Khi cần kiểm định hai tổng thể có mức độ đồng hay không dùng phương pháp kiểm định phương sai hai tổng thể độc lập dựa đại lượng F sau: phương sai mẫu thứ nhất, có kích cỡ đó: phương sai mẫu thứ nhất, có kích cỡ 2 2 Thơng thường, để xác định mẫu mẫu thứ mẫu mẫu thứ hai ta làm sau: Trong tính đại lượng F giá trị phương sai lớn đặt tử số, mẫu tương ứng với phương sai mẫu thứ 17 Giả thiết đặt kiểm định bên: 2 0: = 2 1: > Nếu tỉ số F lớn nhỏ ta suy diễn hai phương sai tổng thể khó mà được, ngược lại tỉ số gần đến ta có chứng ủng hộ giả thiết Nếu tổng thể lấy mẫu giả định có phân phối bình thường tỉ lệ có phân phối xác suất gọi tên phân phối Fisher Các giá trị tới hạn phân phối Fisher phụ thuộc vào hai giá trị bậc tự do, bậc tự tử số ( Miền bác bỏ bên phải: Quy tắc để bác bỏ = − 1) gắn liền với mẫu thứ bậc tự mẫu số ( 1; =( ( với kiểm định bên với mức ý nghĩa là: Giả thiết 2); = − 1) gắn liền với mẫu thứ hai +∞) bị bác bỏ giá trị kiểm định thuộc miền bác bỏ giá trị kiểm định lớn giá trị tới hạn ( 1; 2) Nếu không thuộc miền bác bỏ hay < ( 1; 2), chấp nhận giả thiết với xác suất (1 − ) C Lời giải tính tay nhận xét kết Gọi  2 phương sai số tiền chi tiêu cho việc ăn uống hàng tháng sinh viên K20 K19 Mức ý nghĩa 5% ⇒ = 0,05  Đặt giả thiết kiểm định: : khóa K19 K20 nhau.” : 1 lớn sinh viên K19.”  Tìm miền bác bỏ: ( 1; 2) = ( − 1; − 1) = 0.05(116; 82) = 1,4091 (vì khơng có giá =trị 0.05(116; 82) bảng nên kết lấy từ hàm FINV(0,05;116;82) Excel để tăng tính xác tính tốn) ⟹ Miền bác bỏ (1,4091; +∞)  Tiêu chuẩn kiểm định:  747,55 Biện luận: khơng thuộc miền bác bỏ nên chấp nhận 0, bác bỏ  Kết luận: Độ đồng chi phí ăn uống hàng tháng sinh viên K19 K20 18 D Lời giải từ việc sử dụng Excel  Nhập liệu vào Excel:  Chi tiêu cho việc ăn uống hàng tháng sinh viên K19: A2 ⟹ A84  Chi tiêu cho việc ăn uống hàng tháng sinh viên K20: C2 ⟹ C118  Chi tiêu cho việc ăn uống khoảng lấy giá trị trung bình:  < 500.000  500.000 – 1.000.000 ⟹ 750.000         1.000.000 – 1.500.000 ⟹ 1.250.000 1.500.000 – 2.000.000 ⟹ 1.750.000 2.000.000 – 2.500.000 ⟹ 2.250.000 2.500.000 – 3.000.000 ⟹ 2.750.000 3.000.000 – 3.500.000 ⟹ 3.250.000 3.500.000 – 4.000.000 ⟹ 3.750.000 4.000.000 – 4.500.000 ⟹ 4.250.000 4.500.000 – 5.000.000 ⟹ 4.750.000 19  Mở Data Analysis chọn F-Test Two-Sample for Variances  Hộp thoại F-Test Two-Sample for Variances  Input - Variable Range: Phạm vi liệu biến (Chi tiêu cho việc ăn uống sinh viên K20:C2⇒C118) - Variable Range: Phạm vi liệu biến (Chi tiêu cho việc ăn uống sinh viên K19: A2⇒A84) - Lable : Nhãn (“K19”, “K20”): tick chọn Alpha : Mức ý nghĩa (0,05)  Output options - - Output Range: Phạm vi xuất liệu (G2)  Kết thu được: 20 Tiêu chuẩn kiểm định: = 1,10774041 (H9) Giá trị tới hạn bên: − = 1,40913369 (H11) Miền bác bỏ: Từ bảng trên, ta thấy ∉ = (1,40913369; +∞) ⇒ Chấp nhận , bác bỏ  Kết luận: Độ đồng chi tiêu cho việc ăn uống hàng tháng sinh viên K19 sinh viên K20 Câu 5: Chọn liệu phù hợp để lập toán so sánh tỉ lệ ( toán kiểm định tính độc lập) Trình bày bước thực nhận xét kết A Lập toán cụ thể Khảo sát 100 sinh viên K19 200 sinh viên K20 trường đại học Bách Khoa Tp.HCM vấn đề chi tiêu cho việc ăn uống hàng tháng ta có bảng số liệu sau: Khóa Số tiền Dưới 200.000đ Trên 200.000đ Với mức ý nghĩa 5%, so sánh tỉ lệ sinh viên chi tiêu 200.000đ hai khóa có hay khơng? B Cơ sở lý thuyết Bài toán kiểm định giả thiết thống kê gồm cặp giả thiết giả thiết đối Dựa vào thông tin mẫu lấy từ tổng thể ta phải đưa định bác bỏ hay 21 chấp nhận giả thiết - 0, Điều kiện số quan sát mẫu việc chấp nhận giả thiết 1, 2≥ tương đương với bác bỏ đối thiết ngược lại 30 - Tóm tắt cơng thức: GT Kđ H0 BT mẫu n1≥30 P1=P2 n2≥30 mẫu gộp: = :Bác bỏ giả thuyết : Chưa bác bỏ ∈ 0, ̅ 1 + 2 1+ chấp nhận giả thuyết ∉ C Lời giải tính tay - Gtkđ : Gtkđ đối Gọi 1, tỉ lệ chi phí lại cao sinh viên K19, K20 1= = 0,05 => ( )= : 1−0,05 1≠ 2 = 0,475 => = 1,96 (tra bảng laplace)  Miền bác bỏ= ( −∞ ; −1,96 ) ∪ ( 1,96 ; +∞) 1=100; - Tiêu chuẩn kiểm định: Vì ∈ nên ta bác bỏ giả thuyết Mà Vậy tỉ lệ chi phí lại cao K19 cao K20 22 , chấp nhận giả th D Lời giải từ việc sử dụng excel So sánh tỉ lệ chi phí lại cao K19 K20 1, tỉ lệ chi phí lại cao SV K19,K20 - Giả thiết kiểm định Giả thiết đối : ≠ : = 2 Lấy từ số liệu chung cột chi phí lại K19 K20, tạo bảng số liệu chi phí lại Trong chi phí lại 200 nghìn đồng kí hiệu 1, 200 nghìn đồng kí hiệu Như hình dưới: - Thao tác Excel: Data/ Data Analysis/ t-Test: two-sample Assuming Equal Variances - Sau nhập số liệu theo ơ: 23 +Hai ô nhập cột số liệu K19 K20 +Dưới khác trung bình nhập + Nhập = 0.05: - Kết quả: - Bảng cụ thể: Mean Variance Observations Pooled Variance Hypothesized Mean Difference df t Stat P(T Zα nên nói chi tiêu cho lại K19 cao K20 > 2, hay * Nhận xét: chi phí lại K20 thấp K19 ta đưa vài lí do: - Năm nên chưa quen đường, nên hay xe buýt => tiết kiệm tiền - Ít bạn bè, đa số chưa có người yêu nên chơi - Năm học qn kì I nên tốn tiền lại Câu 6: Khảo sát hệ số tương quan biến định lượng cụ thể, dự đoán phương trình đường hồi quy tuyến tính chúng ( có hình vẽ minh họa) nhận xét mối tương quan tuyến tính biến A Lập toán cụ thể Khảo sát hệ số tương quan thời gian thí nghiệm mạch điện tử (X) với lượng tiêu thụ tải (Y) Dự đốn phương trình đường hồi qua tuyến tính nhận xét mối tương quan tuyến tính giữ chúng Bảng số liệu thời gian thí nghiệm mạch điện tử với cơng suất tiêu thụ tải lấy ngẫu nhiên thiết bị : Thời gian (phút) Năng lượng tiêu thụ (W) (Nguồn: Bộ môn kĩ thuật điện, trường Đại học Bách Khoa TP.HCM) B Cơ sở lý thuyết giải toán Dạng bài: : Khảo sát hệ số tương quan biến định lượng cụ thể, dự đoán phương trình đường hồi quy tuyến tính Tìm hệ số tương quan X Y: - Hệ số tương quan số đo lường số loại tương quan, nghĩa mối liên hệ thống kê hai biến số 25 Phương trình đường hồi quy tuyến tính: • Phương trình hồi quy tuyến tính: ̅= + , = , = − ̅  Kiểm định hệ số a,b : + Giả thiết 0: Hệ số hồi quy khơng có ý nghĩa (=0) + Giả thiết 1: Hệ số hồi quy có ý nghĩa (≠ 0) + Trắc nghiệm t < , −2: chấp nhận  Kiểm định phương trình hồi quy: Giả thiết 0: “Phương trình hồi quy tuyến tính khơng thích hợp.” Giả thiết 1: “Phương trình hồi quy tuyến tính thích hợp.” + Trắc nghiệm F < F ,1, −2: chấp nhận + + C Lời giải tính tay ̅=10(12+34+20+30+45+72+20+56+70+75)=43,2 ̅ = 10 (150 + 270 + 193 + 245 + 330 + 557 + 195 + 430 + 535 + 587) = 349,2 ̅ ̅ = (12 10 26 ̅ = 10 5872) = 146554,2 =2387 − 43,2 = 520,76 2 = 146554,2 − 349,2 = 24613,56 ̅ + = (12.150 + 10 56.430 + 70.535 + 75.587) = 18659,9  Hệ số tương quan là: = 18659,9 − 43,2.349,2 √520,76.24613,56 = 0.998399 Ta có hệ số tương quan 0.998399 ≈ cho thấy thời gian lượng tiêu thụ có quan hệ bậc  Phương trình đường hồi quy tuyến tính : Y = B.x + A Trong đó: B= ̅ ̅ − ̅ =6,869392 A = ̅ − = ̅ 52,67823 D Lời giải từ việc sử dụng excel - Dùng công cụ Data analysis => Regression (như hình dưới) : + Chọn liệu biến Y (thời gian) vào cột “INPUT Y RANGE” 27 + Chọn liệu biến X (Năng lượng tiêu thụ) vào cột “INPUT X RANGE” + Đánh dấu tick vào mục “Line Fit Plots”: vẽ đồ thị minh họa (hình dưới) -Kết quả: +Đồ thị: 28 “Multiple R “: 0.995588 = Hệ số tương quan ‘Intercept” = 47,07759 = hệ số A phương trình hồi quy tuyến tính “Thời gian( phút ) “= 6.961346 = hệ số B phương trình hồi quy tuyến tính 29 Số liệu thu thập: 30 31 ... Wα=(-∞;-1.96) ∪ (1.96;+∞) Đặc trưng mẫu: K19: n1=100 Trung bình mẫu: Phương sai mẫu hiệu chỉnh: = 4.5707 × 10 Độ lệch chuẩn mẫu hiệu chỉnh: K20: n2=200 Trung bình mẫu: Phương sai mẫu hiệu chỉnh: = 5.3718... phương sai mẫu thứ nhất, có kích cỡ đó: phương sai mẫu thứ nhất, có kích cỡ 2 2 Thông thường, để xác định mẫu mẫu thứ mẫu mẫu thứ hai ta làm sau: Trong tính đại lượng F giá trị phương sai lớn đặt...Câu 1: Chọn biến định lượng thực hiện: - Tìm đặc trưng từ mẫu liệu - Tìm khoảng tin cậy cho giá trị trung bình phương sai tổng thể A Lập toán cụ thể Khảo

Ngày đăng: 25/01/2022, 10:44

Từ khóa liên quan

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan