1. Trang chủ
  2. » Giáo Dục - Đào Tạo

ĐHBK HCM-BÀI TẬP LỚN XÁC XUẤT THỐNG KÊ

13 553 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 13
Dung lượng 416,29 KB

Nội dung

Bài 1 : Một cuộc điều tra xã hội học được tiến hành ở 5 thành phố A, B, C, D, E yêu cầu những người được hỏi diễn tả mức độ thỏa mãn của mình đối với thành phố mà họ đang sống... Nhấp lầ

Trang 1

Trường Đại học Bách Khoa TPHCM

-BÀI TẬP LỚN XÁC XUẤT THỐNG KÊ

MSSV :50802688 Lớp :MT08KH05 – Tiết 1-3 ,thứ 2 Nhóm : 7

TPHCM Ngay 30 thang 05 năm 2011

Trang 2

Bài 1 : Một cuộc điều tra xã hội học được tiến hành ở 5 thành phố A, B, C, D, E

yêu cầu những người được hỏi diễn tả mức độ thỏa mãn của mình đối với thành phố mà họ đang sống Kết quả như sau :

Với mức ý nghĩa α =5%, kiểm định xem mức độ thỏa mãn cuộc sống có phân bố giống nhau trong 5 thành phố trên hay không ?

 Dạng bài :

- So sánh các phân số

 Lời giải :

Dữ liệu trong Excel :

Trang 3

Tính các tống số :

• Tổng hàng :Chọn ô E3 và nhập biểu thức = SUM(B3:D3) Dùng con trỏ để kéo nút tự điền từ ô E3 đến ô E7

• Tổng cột: Chọn ô B8 và nhập biểu thức = SUM(B3:B7) Dùng con trỏ để kéo nút tự điền từ ô B8 đến ô D8

• Tổng cộng :Chọn ô E8 và nhập biểu thức = SUM(E3:E7)

Tính các tần số lý thuyết :

Tần số lý thuyết = ( tổng hàng * tổng cột ) / tổng cộng

- Trạng thái rất thỏa mãn của TP A: Chọn ô B10 và nhập biểu thức = E3*B8/E8

- Trạng thái tương đối của TP A: Chọn ô C10 và nhập biểu thức = E3*C8/E8

- Trạng thái không của TP A: Chọn ô D10 và nhập biểu thức = E3*D8/E8

- Trạng thái rất thỏa mãn của TP B: Chọn ô B11 và nhập biểu thức = E4*B8/E8

- Trạng thái tương đối của TP B: Chọn ô C11 và nhập biểu thức = E4*C8/E8

- Trạng thái không của TP B: Chọn ô D11 và nhập biểu thức = E4*D8/E8

Trang 4

- Trạng thái rất thỏa mãn của TP C: Chọn ô B12 và nhập biểu thức = E5*B8/E8.

- Trạng thái tương đối của TP C: Chọn ô C12 và nhập biểu thức = E5*C8/E8

- Trạng thái không của TP C: Chọn ô D12 và nhập biểu thức = E5*D8/E8

- Trạng thái rất thỏa mãn của TP D: Chọn ô B13 và nhập biểu thức = E6*B8/E8

- Trạng thái tương đối của TP D: Chọn ô C13 và nhập biểu thức = E6*C8/E8

- Trạng thái không của TP D: Chọn ô D13 và nhập biểu thức = E6*D8/E8

- Trạng thái rất thỏa mãn của TP E: Chọn ô B14 và nhập biểu thức = E7*B8/E8

- Trạng thái tương đối của TP E: Chọn ô C14 và nhập biểu thức = E7*C8/E8

- Trạng thái không của TP E: Chọn ô D14 và nhập biểu thức = E7*D8/E8

Áp dụng hàm số “CHITEST” trong Excel :

Tính xác xuất P(X > x2) bằng cách chọn ô B15 và nhập biểu thức như sau:

=CHITEST(B3:D7,B10:D14)

Kết quả : P(X > x2) = 3.5299E-13 < α =0.05  bác bỏ giả thiết H0

Vậy mức độ thỏa mãn cuộc sống có phân bố Khác nhau trong 5 thành phố trên

Bài 2 :Ở một bệnh viện lớn, số ca cấp cứu trong 5 ngày chọn ngẫu nhiên được ghi

lại như sau:

Với mức ý nghĩa 5%, có thể cho rằng số ca cấp cứu trung bình trong 3 buổi sáng, chiều, tối là như nhau được không?

 Dạng bài :

- Phân tích phương sai một nhân tố

 Lời giải :

Nhập dữ liệu vào Excel :

Trang 5

A B C D E F

Dùng phần mềm “Anova: Single Factor”:

a Nhấp lần lượt đơn lệnh Tools và lệnh Data Analysis.(đối với office 2003, còn đối với office 2007 thì Nhấp lần lượt đơn lệnh Data và lệnh Data

Analysis )

b Chọn chương trình Anova: Single Factor trong hộp thoại Data Analysis rồi nhấp nút OK

c Trong hộp thoại Anova: Single Factor lần lượt ấn định :

 Phạm vi đầu vào (Input Rangle)

 Cách sắp xếp theo hàng hay cột (Group By)

 Nhãn dữ liệu (Label in First / Column)

 Ngưỡng tin cậy (Alpha)

 Chọn đầu ra (Output Option)

 Hình ảnh cách làm như sau (trong office 2007) :

Trang 6

Kết quả trong Excel :

Anova: Single

Factor

SUMMARY

ANOVA

Source of

6.26966292

1

0.01367450

8 3.885293835

74.1666666

7

Trang 7

Biện luận :

F = 6.269 > F0.05 = 3.885  bác bỏ giả thiết H0

Vậy số ca cấp cứu trung bình trong 3 buổi sáng, chiều, tối là khác nhau

Bài 3 :Một nghiên cứu đước tiến hành ở Mỹ để xác định mối quan hệ giữa chiều cao

của một người và cỡ giày của họ Nhà nghiên cứu đã thu được số liệu sau:

X 66 6

3

6 7

7 1

62

0 6

X 66 63 67 71 62

Trong đó X là chiều cao (đơn vị inches) còn Y là cỡ giày Tính tỷ số tương quan hệ số tương quan và hệ số xác định của Y đối với X Với mức ý nghĩa α = 5%,

có kết luận gì về mối tương quan giữa X, Y( phi tuyến hay tuyến tính) ? Tìm đường hồi quy của Y đối với X Tính sai số tiêu chuẩn của đường hồi quy

 Dạng bài :

- Xác định mối tương quan giữa X, Y

- Tìm đường hồi quy và sai số tiêu chuẩn

 Lời giải :

x

y

62 63 66 67 71

i

i

Trang 8

∑ =2.62+2.63+2.66+2.67+2.71 = 658

y T =

∑ =76

2

x

∑ = 662+632+672+712+622+662+632+672+712+622 = 43398

2

y

∑ =92 + 72 + 82 + 102 + 62 + 62 + 82 + 52 + 122 + 52 = 624

xy

∑ = 5050

• Hệ số tương quan r (1) :

n xy x y

r=0.7166

• Hệ số xác định :

r2

=0.5135

• Tổng bình phương chung SST =

2 2

ij

T y

n

∑ ∑

SST=46,4

• Tổng bình phương do nhân tố SSF =

1

k i

=

SSF=34,4

• Tỉ số tương quan : nY X$/ = SSF/SST

Trang 9

• Với α = 5%, ta dùng test thống kê sau :

$ 2

$

F

k

η

η

=

F=1.4687

Tra bảng phân phối Fisher với bậc tự do (3,5) ta được c=5.14

• F<c nên không có tương quan phi tuyến giữa X và Y, chỉ có tương quan tuyến tính

• Hàm hồi quy sẽ có dạng : y = ax+b, các hệ số a, b được xác định:

1 0 * 4 3 39 8 6 5 8

10

= -24.2638

Vậy phương trình đường hồi quy : y = 0.4843*X - 24.2638

• Tính sai số tiêu chuần của đường hồi quy:

s2

=> sY.X = 1.6798

sY.X chính là sai số tiêu chuẩn của đường hồi quy

( ) ( ) ( ) ( ) ( )

y a x N

∑ ∑

2 ( )

2

N

Trang 10

Bài 4 :Hãy phân tích vai trò ngành nghề (chính, phụ) trong hoạt động kinh tế của

các hộ gia đình ở vùng nông thôn trên cơ sở bảng số liệu về thu nhập trung bình của một hộ tương ứng với các ngành nghề nói trên như sau (mức ý nghĩa 5%) :

 Dạng bài :

- Phân tích phương sai hai nhân tố (không lặp)

 Lời giải :

Sử dụng phần mềm excel để giải:

Nhập bảng giá trị: như hình vẽ

Trang 11

a Tạo bảng anova:

- Nhấp lần lượt đơn lệnh Data và lệnh Data Analysis (đối với Office 2007, còn đối với Office 2003 thì Nhấp lần lượt đơn lệnh Tools và lệnh Data Analysis)

- Chọn chương trình Anova: Two-Factor Without Replication trong hộp thoại Data Analysis rồi nhấp nút OK

- Trong hộp thoại Anova: Two-Factor Without Replication lần lượt ấn định các chi tiết:

 Phạm vi đầu vào (Input Rangle)

 Nhãn dữ liệu (Labels in First Row / Column)

 Ngưỡng tin cậy (Alpha)

 Chọn đầu ra (Output Option)điền thông tin mong muốn hoặc check newWorksheet Ply

 Nhấp OK

Trang 12

b Bảng inova sau khi hoàn thành

Kết quả và biện luận :

Trang 13

• F(rows) = 1,99661<F crit=3,862548 => chấp nhận giả thiết H0 (các nghề chính tạo ra thu nhập trung bình như nhau.)

• F(columns) = 0,110573 < F crit => chấp nhận giả thiết H0 ( các nghề phụ tạo

ra thu nhập trung bình như nhau.)

Tài liệu tham khảo :

Ngày đăng: 18/05/2015, 18:35

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w