Bài tập lớn xác suất thống kê

ĐỀ BÀI Một cuộc điều tra xã hội học được tiến hành ở 5 thành phố A, B, C, D, E yêu cầu nhữngngười được hỏi diễn tả mức độ thỏa mãn của mình đối với thành phố mà họ đang sống, kếtquả như

Trang 1

ĐẠI HỌC QUỐC GIA THÀNH PHỐ HỒ CHÍ MINH

| 1

Trang 2

ĐẠI HỌC BÁCH KHOA

| 2

Trang 3

| 3

Trang 4

| 4

Trang 5

| 5

Trang 6

| 6

Trang 7

| 7

Trang 8

BÁO CÁO BÀI TẬP LỚN

| 8

Trang 9

MÔN: XÁC SUẤT THỐNG KÊ

| 9

Trang 10

CHỦ ĐỀ 7_L06

| 10

Trang 11

Người thực hiện: Nguyễn Thanh Phong_1512447

| 11

Trang 12

GVHD: TS Nguyễn Bá Thi

| 12

Trang 13

| 13

Trang 14

| 14

Trang 15

| 15

Trang 16

| 16

Trang 17

| 17

Trang 18

| 18

Trang 19

Thành phố Hồ Chí Minh, ngày 7 tháng 11 năm 2016

| 19

Trang 20

BÀI 1:

1.1 ĐỀ BÀI

Một cuộc điều tra xã hội học được tiến hành ở 5 thành phố A, B, C, D, E yêu cầu nhữngngười được hỏi diễn tả mức độ thỏa mãn của mình đối với thành phố mà họ đang sống, kếtquả như sau :

Đây là dạng bài kiểm định giả thuyết tỷ lệ.

1.3 GIẢ THUYẾT H 0: Mức độ thỏa mãn cuộc sống là như nhau trong 5 thành phố trên

1.4 PHƯƠNG PHÁP GIẢI

■ Áp dụng trắc nghiệm khi bình phương DF = − ( r 1 ) ( c − 1 ) .

■ Giả sử có một công trình nghiên cứu vớiN thử nghiệm độc lập, mỗi thử nghiệm cókkết

quả và mỗi kết quả mang một xác suất thực nghiệm làPi ( i = 1, 2,3, , k ) Nếu gọiPi,0

làcác giá trị lý thuyết tương ứng vớiPithì các tần số lý thuyết làEi = NPi,0 Điều kiện để áp

dụng trắc nghiệmχ2thành công là các tần số lý thuyếtEiphải≥ 5.

Trang 21

Nếuχ2 > χα2 ⇒Bác bỏ giả thuyếtH0.

: Tần số lý thuyết của ô thuộc hàngivà cột j

rvàc: Số hàng và số cột trong bảng ngẫu nhiên

Trang 22

■ Tính các tần số lý thuyết :

● Tần số lý thuyết = tổng hàng * tổng cột / tổng cộng

● Bảng tính các tần số lý thuyết :

A B10=E3*B8/E8 C10=E3*C8/E8 D10=E3*D8/E8

B B11=E4*B8/E8 C11=E4*C8/E8 D11=E4*D8/E8

C B12=E5*B8/E8 C12=E5*C8/E8 D12=E5*D8/E8

D B13=E6*B8/E8 C13=E6*C8/E8 D13=E6*D8/E8

E B14=E7*B8/E8 C14=E7*C8/E8 D14=E7*D8/E8

● Kết quả :

| 22

Trang 23

■ Tính xác suất P X ( > χ2)

:

● Cú pháp hàm CHITEST : CHITEST(Actual_range;Expected_range)

+ Actual_range : Phạm vi dữ liệu chứa các tần số thực nghiệm

+ Expected_range : Phạm vi dữ liệu chứa các tần số lý thuyết

Trang 24

Trước khi quảng cáo Sau khi quảng cáo

YÊU CẦU 1 Với độ tin cậy 95% hãy ước lượng doanh số trung bình trước và sau chiến dịch quảng cáo.

Trang 25

n α

⇒ =

: Độ chính xácKhoảng ước lượng củaalà( x − ε , x + ε )

2.5 1 CÔNG CỤ GIẢI

■ Sử dụng công cụ thống kê mô tả (Descriptive Statistics) trong chương trình Microsoft

Excel

■ Công cụ phân tích Descriptive Statistics có thể tính :

● Giá trị trung bình mẫu (Mean) :X

● Sai số chuẩn giá trị trung bình (Standard Error of the Mean – SEM) :

S SEM SD X S

với giá trịtαcho bởi hàm : TINV(α, bậc tự do)

hoặc tính độ chính xác thông qua hàm : CONFIDENCE.T(α;SEM;N)

■ Khoảng ước lượng củaa:( X − ε , X + ε )

■ Bảng số liệu nhập vào :

■ Mở chương trình Descriptive Statistics :

● Vào thẻ Data Chọn lệnh Data Analysis.

● Trong hộp thoại Data Analysis chọn chương trình Descriptive Statistics.

| 25

Trang 26

● Trong hộp thoại Descriptive Statistics, lần lượt ấn định các chi tiết :

+ Phạm vi đầu vào (Input Range) : $A$1:$B$13

+ Cách sắp xếp (Group by) : Theo cột (Columns)

+ Nhãn dữ liệu (Labels in first column)

+ Phạm vi đầu ra (Output Range) : $A$4

+ Tóm tắt kết quả (Summary statistics)

+ Mức tin cậy (Confident Level for Mean) : 95%

+ Kết quả :

| 26

Trang 27

■ Tính độ chính xác và khoảng ước lượng :

● Kết quả :

| 27

Trang 28

2.2 2 DẠNG BÀI

Đây là dạng bài so sánh giá trị trung bình dữ liệu tương ứng từng cặp

Trong trường hợp hai mẫu nhỏ( N < 30 ) , phụ thuộc và không giả định rằng phương sai hai

mẫu bằng nhau, ta có thể áp dụng trắc nghiệmtđể so sánh giá trị trung bình của hai mẫu dữ

Trang 29

H0 : µ µ1 = 2 H1: µ µ1 < 2

| 29

Trang 30

●Trắc nghiệm hai bên :

■ Sử dụng chương trình ''t-Test: Paired Two Sample for Means''

■ Chương trình t-Test: Paired Two Sample for Means có thể tính :

● Giá trịt(t Stat).

● Giá trịtα(t Critical one-tail) vàtα/2(t Critical two-tail).

■ Bảng số liệu nhập vào :

■ Mở chương trình Descriptive Statistics :

● Trong hộp thoại Data Analysis chọn chương trình t-Test: Paired Two Sample for Means.

Trang 31

● Trong hộp thoại t-Test: Paired Two Sample for Means, lần lượt ấn định các chi tiết :

+ Phạm vi của dữ liệu 1 (Variable 1 Range) : $A$1:$G$1

+ Phạm vi của dữ liệu 1 (Variable 1 Range) : $A$2:$G$2

+ Nhãn dữ liệu (Labels)

+ Ngưỡng tin cậy (Alpha) : 0,05

+ Phạm vi đầu ra (Output Range) : $A$3

● Kết quả :

Trang 32

trong đó X là chiều cao (đơn vị là inches), còn Y là cỡ giày Tính tỷ số tương quan và hệ số

xác định của Y đối với X Với mức ý nghĩa α = 5%, có kết luận gì về mối tương quan giữa

X và Y (Có phi tuyến không ? Có tuyến tính không ?) Tìm đường hồi quy của Y đối với X

YÊU CẦU 1 Tính tỷ số tương quan và hệ số xác định của Y đối với.

Với mức ý nghĩa α = 5%, có kết luận gì về mối tương quan giữa X và Y.

■ Đối với một phương trình hồi quy tuyến tính Y = + β β1X + ε , ý nghĩa thống kê của các

hệ số hồi quy được đánh giá bằng trắc nghiệmt.

● Giả thuyết :

H β = ⇔''Có tương quan tuyến tính.''

Trang 33

● Trong hộp thoại Data Analysis chọn chương trình Correlation.

Trang 34

● Trong hộp thoại Correlation, lần lượt ấn định các chi tiết :

+ Phạm vi đầu vào (Input Range) : $A$1:$B$13

+ Cách sắp xếp (Group by) : Theo hàng (Rows)

+ Nhãn dữ liệu (Labels in first column)

+ Phạm vi đầu ra (Output Range) : $D$2

● Kết quả :

0,533143

r =

■ Tính các giá trị thống kê t và c :

Trang 35

t < ⇒ c Chưa đủ cơ sở bác bỏ giả thuyếtH0.

Vậy X VÀ Y CÓ TƯƠNG QUAN PHI TUYẾN.

3.6 1 : CÔNG CỤ GIẢI:

Sử dụng chương trình Avona: Single- Factor:

 Bảng số liệu nhập vào:

 Mở chương trình Anova: Single- Factor:

 Vào thẻ Data Chọn thẻ Data Analysis:

YÊU CẦU 2:

Phân tích tương quan phi tuyến tính

Trang 36

 Trong hộp thoại Data Analysis chọn Anova: Single- Factor:

- Phạm vi đầu vào ( Input Range): $E$42:$J$44.

- Cách sắp xếp ( Grouped by): Columns

- Nhãn dữ liệu ( Labels in first row)

- Phạm vi đầu ra ( Output Range): $E$46

 Kết quả:

Trang 37

BÀI 4:

4.1 ĐỀ BÀI.

Hãy phân tích vai trò ngành nghề (chính, phụ) trong hoạt động kinh tế của các hộ gia đình ở một vùng nông thôn trên cơ sở bảng số liệu về thu nhập của một hộ tương ứng với các ngành nghề nói trên như sau (mức ý nghĩa 5%):

Phân tích phương sai hai yếu tố không lặp

4.3 GIẢ THUYẾT H 0: Các giá trị trung bình bằng nhau.

- Trung bình nhân tố cột bằng nhau

- Trung bình nhân tố hàng băng nhau

- Không có sự tương tác giữa nhân tố cột và hàng

Trang 38

 Mở chương trình Descriptive Statistics :

 Vào thẻ Data Chọn lệnh Data Analysis:

 Trong hộp thoại Data Analysis chọn chương trình Anova: Two-Factor Without Replication

Trang 39

 Trong hộp thoại Anova: Two- Factor Without Replication, lần lượt ấn định các chi tiết:

+ Phạm vi đầu vào ( Input Range): $A$1:$E$5

+ Phạm vi đầu ra ( Output Range): $A$10

 Kết quả:

 Kết luận:

Trang 40

- F A <F0.05⇒ Chấp nhận giả thiết H

0 của nhân tố A

- F B <F0.05⇒ Chấp nhận giả thiết H

0 của nhân tố B

Định dạng
Số trang	40
Dung lượng	1,37 MB