Bài 1 : Một cuộc điều tra xã hội học được tiến hành ở 5 thành phố A, B, C, D, E yêu cầu những người được hỏi diễn tả mức độ thỏa mãn của mình đối với thành phố mà họ đang sống... Nhấp lầ
Trang 1Trường Đại học Bách Khoa TPHCM
-BÀI TẬP LỚN XÁC XUẤT THỐNG KÊ
MSSV :50802688 Lớp :MT08KH05 – Tiết 1-3 ,thứ 2 Nhóm : 7
TPHCM Ngay 30 thang 05 năm 2011
Trang 2Bài 1 : Một cuộc điều tra xã hội học được tiến hành ở 5 thành phố A, B, C, D, E
yêu cầu những người được hỏi diễn tả mức độ thỏa mãn của mình đối với thành phố mà họ đang sống Kết quả như sau :
Với mức ý nghĩa α =5%, kiểm định xem mức độ thỏa mãn cuộc sống có phân bố giống nhau trong 5 thành phố trên hay không ?
Dạng bài :
- So sánh các phân số
Lời giải :
Dữ liệu trong Excel :
Trang 3Tính các tống số :
• Tổng hàng :Chọn ô E3 và nhập biểu thức = SUM(B3:D3) Dùng con trỏ để kéo nút tự điền từ ô E3 đến ô E7
• Tổng cột: Chọn ô B8 và nhập biểu thức = SUM(B3:B7) Dùng con trỏ để kéo nút tự điền từ ô B8 đến ô D8
• Tổng cộng :Chọn ô E8 và nhập biểu thức = SUM(E3:E7)
Tính các tần số lý thuyết :
Tần số lý thuyết = ( tổng hàng * tổng cột ) / tổng cộng
- Trạng thái rất thỏa mãn của TP A: Chọn ô B10 và nhập biểu thức = E3*B8/E8
- Trạng thái tương đối của TP A: Chọn ô C10 và nhập biểu thức = E3*C8/E8
- Trạng thái không của TP A: Chọn ô D10 và nhập biểu thức = E3*D8/E8
- Trạng thái rất thỏa mãn của TP B: Chọn ô B11 và nhập biểu thức = E4*B8/E8
- Trạng thái tương đối của TP B: Chọn ô C11 và nhập biểu thức = E4*C8/E8
- Trạng thái không của TP B: Chọn ô D11 và nhập biểu thức = E4*D8/E8
Trang 4- Trạng thái rất thỏa mãn của TP C: Chọn ô B12 và nhập biểu thức = E5*B8/E8.
- Trạng thái tương đối của TP C: Chọn ô C12 và nhập biểu thức = E5*C8/E8
- Trạng thái không của TP C: Chọn ô D12 và nhập biểu thức = E5*D8/E8
- Trạng thái rất thỏa mãn của TP D: Chọn ô B13 và nhập biểu thức = E6*B8/E8
- Trạng thái tương đối của TP D: Chọn ô C13 và nhập biểu thức = E6*C8/E8
- Trạng thái không của TP D: Chọn ô D13 và nhập biểu thức = E6*D8/E8
- Trạng thái rất thỏa mãn của TP E: Chọn ô B14 và nhập biểu thức = E7*B8/E8
- Trạng thái tương đối của TP E: Chọn ô C14 và nhập biểu thức = E7*C8/E8
- Trạng thái không của TP E: Chọn ô D14 và nhập biểu thức = E7*D8/E8
Áp dụng hàm số “CHITEST” trong Excel :
Tính xác xuất P(X > x2) bằng cách chọn ô B15 và nhập biểu thức như sau:
=CHITEST(B3:D7,B10:D14)
Kết quả : P(X > x2) = 3.5299E-13 < α =0.05 bác bỏ giả thiết H0
Vậy mức độ thỏa mãn cuộc sống có phân bố Khác nhau trong 5 thành phố trên
Bài 2 :Ở một bệnh viện lớn, số ca cấp cứu trong 5 ngày chọn ngẫu nhiên được ghi
lại như sau:
Với mức ý nghĩa 5%, có thể cho rằng số ca cấp cứu trung bình trong 3 buổi sáng, chiều, tối là như nhau được không?
Dạng bài :
- Phân tích phương sai một nhân tố
Lời giải :
Nhập dữ liệu vào Excel :
Trang 5A B C D E F
Dùng phần mềm “Anova: Single Factor”:
a Nhấp lần lượt đơn lệnh Tools và lệnh Data Analysis.(đối với office 2003, còn đối với office 2007 thì Nhấp lần lượt đơn lệnh Data và lệnh Data
Analysis )
b Chọn chương trình Anova: Single Factor trong hộp thoại Data Analysis rồi nhấp nút OK
c Trong hộp thoại Anova: Single Factor lần lượt ấn định :
Phạm vi đầu vào (Input Rangle)
Cách sắp xếp theo hàng hay cột (Group By)
Nhãn dữ liệu (Label in First / Column)
Ngưỡng tin cậy (Alpha)
Chọn đầu ra (Output Option)
Hình ảnh cách làm như sau (trong office 2007) :
Trang 6Kết quả trong Excel :
Anova: Single
Factor
SUMMARY
ANOVA
Source of
6.26966292
1
0.01367450
8 3.885293835
74.1666666
7
Trang 7Biện luận :
F = 6.269 > F0.05 = 3.885 bác bỏ giả thiết H0
Vậy số ca cấp cứu trung bình trong 3 buổi sáng, chiều, tối là khác nhau
Bài 3 :Một nghiên cứu đước tiến hành ở Mỹ để xác định mối quan hệ giữa chiều cao
của một người và cỡ giày của họ Nhà nghiên cứu đã thu được số liệu sau:
X 66 6
3
6 7
7 1
62
0 6
X 66 63 67 71 62
Trong đó X là chiều cao (đơn vị inches) còn Y là cỡ giày Tính tỷ số tương quan hệ số tương quan và hệ số xác định của Y đối với X Với mức ý nghĩa α = 5%,
có kết luận gì về mối tương quan giữa X, Y( phi tuyến hay tuyến tính) ? Tìm đường hồi quy của Y đối với X Tính sai số tiêu chuẩn của đường hồi quy
Dạng bài :
- Xác định mối tương quan giữa X, Y
- Tìm đường hồi quy và sai số tiêu chuẩn
Lời giải :
x
y
62 63 66 67 71
i
i
Trang 8∑ =2.62+2.63+2.66+2.67+2.71 = 658
y T =
∑ =76
2
x
∑ = 662+632+672+712+622+662+632+672+712+622 = 43398
2
y
∑ =92 + 72 + 82 + 102 + 62 + 62 + 82 + 52 + 122 + 52 = 624
xy
∑ = 5050
• Hệ số tương quan r (1) :
n xy x y
−
r=0.7166
• Hệ số xác định :
r2
=0.5135
• Tổng bình phương chung SST =
2 2
ij
T y
n
−
∑ ∑
SST=46,4
• Tổng bình phương do nhân tố SSF =
1
k i
=
−
∑
SSF=34,4
• Tỉ số tương quan : nY X$/ = SSF/SST
Trang 9• Với α = 5%, ta dùng test thống kê sau :
$ 2
$
F
k
η
η
=
F=1.4687
Tra bảng phân phối Fisher với bậc tự do (3,5) ta được c=5.14
• F<c nên không có tương quan phi tuyến giữa X và Y, chỉ có tương quan tuyến tính
• Hàm hồi quy sẽ có dạng : y = ax+b, các hệ số a, b được xác định:
1 0 * 4 3 39 8 6 5 8
−
10
−
= -24.2638
Vậy phương trình đường hồi quy : y = 0.4843*X - 24.2638
• Tính sai số tiêu chuần của đường hồi quy:
s2
=> sY.X = 1.6798
sY.X chính là sai số tiêu chuẩn của đường hồi quy
( ) ( ) ( ) ( ) ( )
−
−
y a x N
−
∑ ∑
2 ( )
2
N
−
Trang 10Bài 4 :Hãy phân tích vai trò ngành nghề (chính, phụ) trong hoạt động kinh tế của
các hộ gia đình ở vùng nông thôn trên cơ sở bảng số liệu về thu nhập trung bình của một hộ tương ứng với các ngành nghề nói trên như sau (mức ý nghĩa 5%) :
Dạng bài :
- Phân tích phương sai hai nhân tố (không lặp)
Lời giải :
Sử dụng phần mềm excel để giải:
Nhập bảng giá trị: như hình vẽ
Trang 11a Tạo bảng anova:
- Nhấp lần lượt đơn lệnh Data và lệnh Data Analysis (đối với Office 2007, còn đối với Office 2003 thì Nhấp lần lượt đơn lệnh Tools và lệnh Data Analysis)
- Chọn chương trình Anova: Two-Factor Without Replication trong hộp thoại Data Analysis rồi nhấp nút OK
- Trong hộp thoại Anova: Two-Factor Without Replication lần lượt ấn định các chi tiết:
Phạm vi đầu vào (Input Rangle)
Nhãn dữ liệu (Labels in First Row / Column)
Ngưỡng tin cậy (Alpha)
Chọn đầu ra (Output Option)điền thông tin mong muốn hoặc check newWorksheet Ply
Nhấp OK
Trang 12b Bảng inova sau khi hoàn thành
Kết quả và biện luận :
Trang 13• F(rows) = 1,99661<F crit=3,862548 => chấp nhận giả thiết H0 (các nghề chính tạo ra thu nhập trung bình như nhau.)
• F(columns) = 0,110573 < F crit => chấp nhận giả thiết H0 ( các nghề phụ tạo
ra thu nhập trung bình như nhau.)
Tài liệu tham khảo :