1. Trang chủ
  2. » Luận Văn - Báo Cáo

Báo cáo bài tập lớn xác suất thống kê

16 1,7K 9

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 16
Dung lượng 375,97 KB

Nội dung

Bài giải: Dạng bài: bài toán kiểm định giả thiết tỷ lệ.. Câu 2.Lượng sữa vắt được bởi 16 con bò cái khi cho nghe các loại nhạc khác nhau nhạc nhẹ, nhạc rốc, nhạc cổ điển, không có nhạc đ

Trang 1

TR ƯỜNG ĐẠI HỌC BÁCH KHOA NG Đ I H C BÁCH KHOA ẠI HỌC QUỐC GIA TP.HỒ CHÍ MINH ỌC QUỐC GIA TP.HỒ CHÍ MINH

…………oOo…………

BÁO

CÁO

BÀI

GVHD: Nguyễn Bá Thi

Sinh viên: Nguyễn Hoàng Minh

MSSV: 51001955

Lớp: A09

Trang 2

Thành phố Hồ Chí Minh, 05/2014

Trang 3

Mục lục

Mục lục 1

Câu 1 2

Câu 2 4

Câu 3 6

Câu 4 12

Trang 4

Câu 1.

Một xí nghiệp may sản xuất áo khoác với 4 màu: đỏ, xanh, vàng và tím than Số khách hàng nam và nữ mua áo khoác với các màu được ghi trong bảng sau:

Với mức ý nghĩa 1% hãy so sánh tỉ lệ khách hàng nam và nữ ưa chuộng các màu sắc nói trên

Bài giải:

Dạng bài: bài toán kiểm định giả thiết tỷ lệ

Giả thiết H0: Tỷ lệ khách hàng ưa chuộng các màu sắc nói trên là như nhau trong 2 nhóm

Thực hiện bài toán bằng Excel:

1 Nhập dữ liệu vào bảng tính:

2 Tính các tổng số:

 Tổng hàng: chọn ô F2 và nhập biểu thức = SUM(B2:E2)

 Dùng con trỏ kéo nút tự điền từ ô F2->F3

 Tổng cột: chọn ô B4 và nhập biểu thức =SUM(B2:B3)

 Dùng con trỏ kéo nút tự điền từ ô B4->E4

 Tổng cộng: chọn ô F4 và nhập biểu thức = SUM(B4:E4)

Trang 5

3 Tính các tần số lý thuyết:

 Nữ thích màu đỏ: chọn ô B7 và nhập biểu thức = B4*F2/F4

 Nữ thích màu xanh: chọn ô C7 và nhập biểu thức = C4*F2/F4

 Nữ thích màu vàng: chọn ô D7 và nhập biểu thức = D4*F2/F4

 Nữ thích màu tím than: chọn ô E7 và nhập biểu thức = E4*F2/F4

 Nam thích màu đỏ: chọn ô B8 và nhập biểu thức =B4*F3/F4

 Nam thích màu xanh: chọn ô C8 và nhập biểu thức =C4*F3/F4

 Nam thích màu vàng: chọn ô D8 và nhập biểu thức =D4*F3/F4

 Nam thích màu tím than: chọn ô E8 và nhập biểu thức =E4*F3/F4

Trang 6

4 Áp dụng hàm số CHITEST:

Chọn ô B10 và nhập vào =CHITEST(B2:E3,B7:E8)

Ta sẽ có được kết quả của P(X>X²):

Trang 7

Biện luận: Giá trị P = 0.0000000000000000017151444 < α = 0.01 => bác bỏ giả thiết H0.

Kết luận: Tỷ lệ khách hàng ưa chuộng các màu sắc nói trên là khác nhau trong 2 nhóm nam và nữ

Trang 8

Câu 2.

Lượng sữa vắt được bởi 16 con bò cái khi cho nghe các loại nhạc khác nhau (nhạc nhẹ, nhạc rốc, nhạc cổ điển, không có nhạc) được thống kê trong bảng sau đây:

nghĩa 5%, nhận định xem lượng sữa trung bình của mỗi nhóm trên như nhau hay khác nhau Liệu âm nhạc có ảnh hưởng đến lượng sữa của các con bò hay không?

Bài giải:

Dạng bài: bài toán kiểm định giả thiết giá trị trung bình

Giả thiết H0: Lượng sữa trung bình khi cho các con bò nghe các loại nhạc nói trên là như nhau

Thực hiện bài toán bằng Excel:

1 Nhập dữ liệu vào bảng tính:

2 Mở Data Analysis chọn Anova Single Factor

3 Hộp thoại Anova Single Factor xuất

hiện

Trang 9

 Input Range: phạm vi đầu vào (ô D20  ô H23)

 Grouped By: nhóm dữ liệu theo hàng hoặc cột (chọn hàng)

 Labels in first column: nhãn ở cột đầu tiên (chọn)

 Alpha: giá trị α (0,05)

 Output Range: phạm vi dữ liệu xuất ra (ô C26)

4 Ta nhận

được bảng kết quả:

Biện luận: F quan sát = 1,35468 < F

ngưỡng = 3,490295 => chấp nhận giả

thiết H0

Kết luận: Lượng sữa trung bình khi cho

các con bò nghe các loại nhạc nói trên là

như nhau

Câu 3

Từ 12 cặp quan sát (xi, yi) sau đây của cặp hai biến (X, Y), tính tỷ số tương quan, hệ số tương quan và hệ

số xác định của Y đối với X Với mức ý nghĩa α = 5%, có kết luận gì về mối tương quan giữa X và Y (Có phi tuyến không? Có tuyến tính không?) Tìm đường hồi quy của Y đối với X

X 123 356 111 118 123 356 111 118 123 356 111 118

Y 4,2 4,1 3,7 3,9 4,5 4,1 3 3,8 2 3,1 3,4 3

Bài giải:

Trang 10

Dạng bài: bài toán kiểm định tương quan và hồi quy.

Thực hiện bài toán bằng Excel:

 Phân tích tương quan tuyến tính

Giả thiết H0: X và Y không có tương quan tuyến tính.

1 Nhập dữ liệu vào bảng tính:

2 Mở Data Analysis chọn Correlation

3 Hộp thoại Correlation xuất hiện

 Input Range: phạm vi đầu vào (ô C15  ô O16)

 Grouped By: nhóm dữ liệu theo hàng hoặc cột (chọn hàng)

 Labels in first column: nhãn ở cột đầu tiên (chọn)

 Output Range: phạm vi dữ liệu xuất ra (ô C19)

4 Ta

nhận được bảng kết quả:

Biện luận:

 n = 12

Trang 11

 Từ bảng kết quả, ta tìm được hệ số tương quan r = 0,177098

 Hệ số xác định r² = 0,031364

 Giá trị T = 0,569028

 Phân phối Student mức α = 0,05 với bậc tự do n-2 = 10:

c = T.INV.2T(0,05;10) = 2,228139

 |T| < c nên chưa bác bỏ giả thiết HT|T| < c nên chưa bác bỏ giả thiết H < c nên chưa bác bỏ giả thiết H0 (chấp nhận giả thiết H0)

Kết luận:

Vậy X và Y không có tương quan tuyến tính

 Phân tích tương quan phi tuyến

Giả thiết H1: X và Y không có tương quan phi tuyến.

1 Nhập dữ liệu vào bảng tính sau khi đã sắp xếp lại:

2 Mở Data Analysis

chọn

Anova Single Factor

3 Hộp thoại Anova Single Factor xuất hiện

 Input Range: phạm vi đầu vào (ô D27  ô G30)

 Grouped By: nhóm dữ liệu theo hàng hoặc cột (chọn cột)

 Labels in first row: nhãn ở cột đầu tiên (chọn)

 Alpha: giá trị α (0,05)

 Output Range: phạm vi dữ liệu xuất ra (ô C33)

Trang 12

4 Ta

nhận được bảng kết quả:

Biện luận:

 n = 12 , k = 4

 Tổng bình phương giữa

các nhóm SSF = 0,24

 Tổng bình phương nhân

tố SST = 5,366667

 η2

Y/X = SSF/SST = 0,04472

 Tỷ số tương quan : ηY/

X = 0,211472

 Giá trị F = 0,055929

 Phân bố Fisher mức α =

0,05 với bậc tự do (k-2, n-k) = (2, 8)

c = F.INV.RT(0,05; 2; 8) = 4,45897

 F < c chấp nhận giả thiết H1

Kết luận:

X và Y không có tương quan phi tuyến

 Phân tích đường hồi quy

Giả thiết H: Hệ số không thích hợp

Trang 13

1 Nhập dữ liệu vào bảng tính theo cột dọc:

2 Mở Data Analysis chọn Regression

3 Hộp thoại Regression xuất

hiện

 Input Y Range: phạm vi đầu vào (ô D61  ô D73)

 Input X Range: phạm vi đầu vào (ô C61  ô C73)

 Labels: nhãn (chọn)

 Line Fit Plots: vẽ đồ thị (chọn)

 Output Range: phạm vi dữ liệu xuất ra (ô F61)

4 Ta

nhận được bảng kết

quả:

Trang 14

Biện luận:

 Hệ số góc = 0,001145

 Hệ số tự do = 3,363998

 Giá trị P của hệ số tự do (P-value) = 9,95x10-6 < α = 0,05 => Bác bỏ giả thiết H

 Hệ số tự do có ý nghĩa thống kê

 Giá trị P của hệ số góc (P-value) = 0,581892 > α = 0,05 => Chấp nhận giả thiết H

 Hệ số góc không có ý nghĩa thống kê

 Giá trị F (Significance F) = 0,581892 > α = 0,05 => Chấp nhận giả thiết H

 Phương trình đường hồi quy không thích hợp

Kết luận phân tích đường hồi quy:

Phương trình đường hồi quy không thích hợp

Kết luận:

Tỷ số tương quan ηY/X = 0,211472

Hệ số tương quan r = 0,177098

Hệ số xác định r² = 0,031364

Trang 15

X và Y không có tương quan tuyến tính với mức ý nghĩa 5%.

X và Y không có tương quan phi tuyến với mức ý nghĩa 5%

Phương trình đường hồi quy của Y đối với X: Y = 0,001145X + 3,363998 là không thích hợp

Câu 4

Với mức ý nghĩa 0,05 , hãy phân tích sự biến động của thu nhập ($/tháng/người) trên cơ sở số liệu điều tra về thu nhập trung bình của 4 loại ngành nghề ở 4 khu vực khác nhau sau đây:

Loại ngành

nghề

Nơi làm việc

Bài giải:

Dạng bài: bài toán phân tích phương sai hai yếu tố không lặp

Giả thiết H: Các giá trị trung bình bằng nhau

Thực hiện bài toán bằng Excel:

1 Nhập bảng dữ liệu

2 Áp dụng

chương trình

Anova : Two Factor Without Replication trong thẻ Data => Data Analysis

3 Nhấn OK

ta được bản kết quả

Trang 16

Biện luận:

=> Bác bỏ giả thiết H ( Ngành nghề )

=> Chấp nhận giả thiết H ( Nơi làm việc )

Kết luận:

Chỉ có Ngành nghề ảnh hưởng đến thu nhập trung bình

0.05

R

0.05

C

Ngày đăng: 14/05/2015, 11:45

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w