1. Trang chủ
  2. » Giáo Dục - Đào Tạo

BÁO CÁO BÀI TẬP XÁC SUẤT THỐNG KÊ docx

15 1,4K 30

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 15
Dung lượng 579 KB

Nội dung

Thực hiện bài toán bằng Excel Nhập dữ liệu vào bảng tính :< Vào Tools /Data analysis, chọn Anova: Single Factor... Trong hộp thoại Anova: Single Factor lần lượt ấn định : Phạm vi đầ

Trang 1

ĐẠI HỌC QUỐC GIA TP HỒ CHÍ MINH TRƯỜNG ĐẠI HỌC BÁCH KHOA

BÁO CÁO BÀI TẬP XÁC SUẤT THỐNG KÊ

GVHD: Thầy Nguyễn Bá Thi

Lớp: 13-B - Nhóm: 3

Trang 2

Bài 1

M t xí nghi p may s n xu t áo khoác v i 4 màu: đ , xanh, vàng và tím than S khách hàng ới 4 màu: đỏ, xanh, vàng và tím than Số khách hàng ỏ, xanh, vàng và tím than Số khách hàng ố khách hàng nam và n mua áo khoác v i các màu đ c ghi trong b ng sau: ữ mua áo khoác với các màu được ghi trong bảng sau: ới 4 màu: đỏ, xanh, vàng và tím than Số khách hàng ược ghi trong bảng sau:

Đỏ Xanh Vàng Tím than

Nam 125 223 52 54

Với mức ý nghĩa 1% hãy so sánh tỷ lệ khách hàng nam và nữ ưa chuộng các màu sắc nói trên

Bài làm

Nhận xét : Đây là bài toán kiểm định giả thiết về tỷ lệ.

Giả thiết Ho: Tỷ lệ khách hàng nam và nữ ưa chuộng các màu sắc là

như nhau.

Thực hiện bài toán bằng Excel

Nhập giá trị vào bảng tính :

Tính các tổng số :

Tổng hàng: chọn F4 và nhập =SUM(B4:E4),

dùng con trỏ kéo nút tự điền từ F4 đến F5.

Tổng cột: chọn B6 và nhập =SUM(B4:B5),

dùng con trỏ kéo nút tự điền từ B6 đến E6.

Tổng cộng: chọn F8 và nhập =SUM(F4:F5).

Tính các tần số lý thuyết :

Trang 3

dùng con trỏ kéo nút tự điền từ B12 đến E12.

Nam : chọn B13 và nhập =B6*$F$5/$F$8,

dùng con trỏ kéo nút tự điền từ B13 đến E13.

Áp dụng hàm số CHITEST :

Chọn B15 và nhập =CHITEST(B4:E5,B12:E13).

Ta sẽ có được kết quả của P(X> X²).

Biện luận : P(X>X²) = 1,71514e-18 < α = 0,01

=> Bác bỏ giả thiết Ho Kết luận : Tỉ lệ khách hàng nam và nữ ưa chuộng các màu sắc

là khác nhau.

Bài 2

Trang 4

Lượng sữa vắt được bởi 16 con bò cái khi cho nghe các loại nhạc khác nhau (nhạc nhẹ, nhạc rốc, nhạc cổ điển, không có nhạc) được thống

kê trong bảng sau đây:

Với mức ý nghĩa 5%, nhận định xem lượng sữa trung bình của mỗi nhóm trên như nhau hay khác nhau Liệu âm nhạc có ảnh hưởng đến lượng sữa của các con bò hay không?

Bài làm

Nhận xét: Đây là bài toán phân tích phương sai một nhân tố.

Giả thiết Ho: Lượng sữa trung bình của mỗi nhóm là như nhau.

Thực hiện bài toán bằng Excel

Nhập dữ liệu vào bảng tính :<

Vào Tools /Data analysis, chọn Anova: Single Factor.

Nhạc cổ điển 15 19 24 28

Không có nhạc 14 23 17 14

Trang 5

Trong hộp thoại Anova: Single Factor lần lượt ấn định :

Phạm vi đầu vào: Input Range, quét chọn vùng (A3:E6).

Cách nhóm theo hàng hay cột: Group By, chọn Rows

(nhóm theo hàng)

Chọn Labels in first column (nhãn dữ liệu nằm ở cột đầu).

Mức ý nghĩa α: Alpha (ấn định α=0,05).

Phạm vi đầu ra: Output Range, chọn ô A9.

Nhấn OK, ta sẽ có bảng kết quả sau:

Trang 6

Biện luận : F = 1.354679803 < F0.05 = 3.490295

 Chấp nhận giả thiết Ho

Kết luận : Lượng sữa trung bình của các nhóm là như nhau.

Hay âm nhạc không ảnh hưởng đến lượng sữa của các con bò.

Bài 3

Trang 7

Từ 12 cặp quan sát (xi,yi) sau đây từ cặp hai biến (X,Y), tính tỷ số

tương quan,hệ số tương quan và hệ số xác định của Y đối với X Với

mức ý nghĩa α = 5%, có kết luận gì về mối tương quan giữa X và Y (phi

tuyến hay tuyến tính )?

X 123,0 356,9 111,1 118,0 123,0 356,9 111,1 118,0 123,0 356,9 111,1 118,0

Bài làm

Nhận xét : đây là bài toán phân tích tương quan

Thực hiện bài toán bằng Excel

3.1 Phân tích tương quan tuyến tính.

Nhập giá trị vào bảng tính:

Thiết lập bảng Correlation.

Trang 8

Vào Tools /Data analysis , chọn Correlation.

Trong hộp thoại Correlation lần lượt ấn định:

Phạm vi đầu vào: Input Range, quét vùng (A3:B15).

Cách nhóm theo hang hay cột: Group By, chọn Columns

(nhóm theo cột)

Chọn Labels in first row (nhãn dữ liệu ở hàng đầu).

Phạm vi đầu ra: Output Range, chọn ô D6.

Trang 9

Nhấn OK, ta sẽ có bảng kết quả sau:

Ta tìm được hệ số tương quan r = 0.17875

Và hệ số xác định r 2 = 0.03195

* Giả thiết Ho : X và Y không có tương quan tuyến tính.

Ta có: T = 0.574506 với

Mà: c = 2,228

(c là phân vị mức α/2=0.025 của phân bố Student với n-2=10 bậc tự do).

Vì lTl < c nên chưa có cơ sở bác bỏ giả thiết H o

Vậy: Chưa kết luận được X và Y có tương quan tuyến tính.

3.2 Phân tích tương quan phi tuyến.

2

2 1

r n T

r

Trang 10

Sắp xếp lại các giá trị của X và Y theo bảng sau:

Thiết lập bảng Anova: Single Factor.

Vào Tools /Data analysis , chọn Anova: Single Factor.

Trong hộp thoại Anova: Single Factor lần lượt ấn định :

Phạm vi đầu vào: Input Range, quét vùng (B22:E25).

Cách nhóm theo hàng hay cột: Group By, chọn Columns (nhóm

theo cột)

Chọn Labels in first row (nhãn dữ liệu nằm ở hàng đầu).

Mức ý nghĩa α: Alpha (ấn định α=0,05).

Phạm vi đầu ra: Output Range, chọn ô G17.

Trang 11

Nhấn OK, ta sẽ có bảng kết quả sau:

Trang 12

Rút ra được từ bảng Anova:

SSF = 0,22537 SST = 5,3115

Tỷ số tương quan : η2

Y/X = SSF/SST = 0,04243

Suy ra : η2

Y/X - r² = 0,01048 ≠ 0

* Giả thiết Ho : X và Y không có tương quan phi tuyến.

Ta có: F = 0,04378 với

Mà: c = 4,46

(c là phân vị mức α=0,05 của phân bố Fisher bậc tự do (k-2,n-k)=(2,8)).

Vì: F < c nên chấp nhận giả thiết H o

Vậy: X và Y không có tương quan phi tuyến.

Kết luận :

 Hệ số tương quan: r = 0.178749

 Hệ số xác định: r²  0.03195

 Tỷ số tương quan: η 2

Y/X = 0.04243

 T = 0,574506 < c = 2,228

(c là phân vị mức 0.025 của phân bố Student bậc tự do 10).

=> Chưa kết luận được X và Y có tương quan tuyến tính.

F = 0,04378 < c = 4,46 (c là phân vị mức 0,05 của phân bố Fisher bậc tự do (2,8)).

=> X và Y không có tương quan phi tuyến với mức ý nghĩa 5%.

/ 2

Y X

Y X

F

k

  

Trang 13

Bài 4

Đo đường kính X và chiều cao Y của 20 cây ta thu được số liệu sau:

X 2,3 2,5 2,6 3,1 3,4 3,7 7,3 3,9 4 4,1

X 4,1 4,2 4,4 4,7 5,1 5,5 5,8 6,2 6,9 6,9

Y 7 8 7 9 10 13 7 11 11 16 a_Tìm đường hồi quy của Y đối với X

b_Kiểm định giả thiết có hồi quy tuyến tính giữa Y và X

Bài làm

Nhận xét : Đây là bài toán phân

tich hồi quy tuyến tính

Giả thiết Ho : X và Y khong co hồi quy

tuyến tính

Thực hiện bài toán bằng Excel

Thiết lập bảng tính Regression :

Nhập dữ liệu vào bảng tính :

Sau đó vào Tools /Data analysis, chọn Regression.

Trang 14

Trong hộp thoại Regression lần lượt ấn định:

Phạm vi đầu vào: Input Y Range, quét vùng (C3:C23).

Input X Range, quét vùng (B3:B23).

Chọn Labels (thêm nhãn dữ liệu).

Phạm vi đầu ra: Output Range, chọn ô E3.

Chọn Line Fit Plots trong Residuals để vẽ đường hồi quy.

Sau đó nhấn OK ta có kết quả :

Trang 15

Kết luận :

 Đường hồi quy của Y đối với X là : Y=1.67689X+1.045276

 Sai số tiêu chuẩn của đường hồi quy : 2,22

 Ta thấy: F = 24,3 > c = 4,41

=> Bác bỏ giả thiết H0

( Tra bảng phân tố Fisher với bậc tự do (1,18) ở mức 0,05)

Vậy: có hồi quy tuyến tính giữa Y với X.

Ngày đăng: 30/07/2014, 06:20

TỪ KHÓA LIÊN QUAN

w