1. Trang chủ
  2. » Luận Văn - Báo Cáo

bài tập lớn xác suất thông kê

25 1,3K 6

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 25
Dung lượng 759,83 KB

Nội dung

Bài 1: Tìm một dữ liệu định lượng (A) và một dữ liệu định tính (B) thích hợp, sử dụng các dữ liệu đó cho các yêu cầu sau: 1)Thực hiện phương pháp phân tổ dữ liệu (A). 2)Vẽ đồ thị phân phối tần số và đa giác tần số (A). 3) Tính các đặc trưng mẫu và ước lượng giá trị trung bình của dấu hiệu quan sát với độ tin cậy 96% (A). 4)Trình bày dữ liệu định tính (B) dạng phân loại bằng các đồ thị. 5) Hãy kiểm định xem dữ liệu (A) hoặc (B) có phù hợp với 1 phân bố xác suất nào đó hay không. Bài 2: Một máy sơn tự động được thiết kế để phun sơn 1 xe ô tô với mức trung bình là 4 kg sơn. Dữ liệu dưới đây thể hiện lượng sơn thực tế đã sử dụng để sơn cùng một loại xe trong 2 ngày liên tiếp: Ngày 1: 3,8 4,2 3,6 4,1 3,9 4,3 4,1 3,8 3,954 Ngày 2: 4,5 3,8 4,1 3,9 4,5 3,8 4 4,2đơn vị: kg. Hãy kiểm định xem máy phun sơn có sử dụng lượng sơn trung bình khác nhau giữa 2 ngày hay không, với mức ý nghĩa 1%. Bài 3: Một nhà nghiên cứu muốn khảo sát thời gian phản ứng của nam giới và nữ giới đối với các loại tín hiệu khác nhau. Các đối tượng ( 15 nam, 15 nữ) tham gia thí nghiệm được yêu cầu nhấn nút ngay khi nhận biết có tín hiệu. Đây là bảng số liệu ghi lại thời gian (giây) từ khi tín hiệu được phát đi cho đến khi đối tượng khảo sát có tín hiệu trả lời.

Trang 1

BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC BÁCH KHOA TP HCM

ĐỀ TÀI : 10

Giảng viên hướng dẫn : Nguyễn Kiều Dung Sinh viên thực hiện :

Trang 2

Bài 1: Tìm một dữ liệu định lượng (A) và một dữ liệu định tính (B) thích hợp, sử dụng các dữ

liệu đó cho các yêu cầu sau:

1)Thực hiện phương pháp phân tổ dữ liệu (A)

2)Vẽ đồ thị phân phối tần số và đa giác tần số (A)

3) Tính các đặc trưng mẫu và ước lượng giá trị trung bình của dấu hiệu quan sát với độ tin cậy 96% (A)

4)Trình bày dữ liệu định tính (B) dạng phân loại bằng các đồ thị

5) Hãy kiểm định xem dữ liệu (A) hoặc (B) có phù hợp với 1 phân bố xác suất nào đó hay không

BÀI LÀM:

Dạng bài: Thống kê mô tả thời gian tiện phôi cho trước của 40 sinh viên ngành cơ kĩ thuật

Dữ liệu A: Khảo sát thời gian (phút) của

1 Thực hiện phương pháp phân tổ dữ liệu A:

 Nhập dữ liệu A vào excel

+Xác định số tổ cần chia : k=¿

=(2*COUNT(A1:E4))^(1/3)

Kết quả

Chọn k = 4

Trang 3

+ Xác định trị số khoảng cách h theo công thức: ℎ= xmax−xmin k

 Chọn chức năng Data/ Data Analysis/Histogram

+ Input Range: địa chỉ tuyệt đối chứa dư liệu

+ Bin Range: địa chỉ chứa bảng phân nhóm

+ Output options: vị trí xuất kết quả

+ Confidence Level for Mean: độ tin cậy cho trung bình

+ Chọn Cumulative Percentage để tính tần suất tích lũy nếu không Excel chỉtính tần số

Trang 5

 Vẽ đa giác tần số:

+ Sử dụng bảng phân phối tần số của dữ liệu (A):

+ Thêm giá trị 0 vào đầu và cuối bảng phân phối tần số:

+ Quét chọn B39:B43, dùng chức năng Insert Line Chart trên menu Insert

 Kết quả sau chỉnh sửa:

Trang 6

3) Tính các đặc trưng mẫu và ước lượng giá trị trung bình của dấu hiệu quan sát với độ tin cậy 96% (A).

 Nhập dữ liệu vào bảng tính:

 Chọn chức năng Data/Data Analysis/Descriptive Statistics

Trang 7

+ Input Range: địa chỉ tuyệt đối chứa dư liệu.

+ Output options: vị trí xuất kết quả

+ Confidence Level for Mean: độ tin cậy cho trung bình

 Kết quả nhận được:

Khoảng ước lượng p: (16.125-1.7666 ; 16.125+1.7666)

4)Trình bày dữ liệu định tính (B) dạng phân loại bằng các đồ thị.

 Nhập dữ liệu và bảng tính:

Trang 8

 Tính tỉ lệ sinh viên cho các ngành:

Nhập vào C3: =B2/$B$10, copy cho các ô còn lại

 Vẽ biểu đồ đứng thể hiện số lượng sinh viên ở các chuyên ngành

+ Quét chọn cột Số sinh viên (B2:B6)

+ Dùng chức năng Insert /Insert Column Chart/2-D Column trên menu Insert

 Kết quả thu được:

Trang 9

 Vẽ biểu đồ tròn thể hiện tỉ lệ sinh viên ở các chuyên ngành.

+ Quét chọn cột Số sinh viên (C2:C6)

+ Dùng chức năng Insert/Insert Pie/2-D Pie trên menu Insert

5) Hãy kiểm định xem dữ liệu (A) hoặc (B) có phù hợp với 1 phân bố xác suất nào

đó hay không.

Giả thiết kiểm định Ho : phù hợp phân phối chuẩn

Giả thiết đối H 1 : không phù hợp phân phối chuẩn

Ta có χ^2 0.04 (4-2-1) =CHIINV(0.04,1) = 4.2179 suy ra miền bác bỏ là WCHIINV(0.04,1) =CHIINV(0.04,1) = 4.2179 suy ra miền bác bỏ là W 4.2179 suy ra miền bác bỏ là W α =CHIINV(0.04,1) = 4.2179 suy ra miền bác bỏ là W (4.2179; +∞)

Trang 10

Kết luận : χ^2 =CHIINV(0.04,1) = 4.2179 suy ra miền bác bỏ là W 3.702592775 nằm ngoài miền bác bỏ nên chấp nhận H 0 , vậy số liệu trên là phù hợp phân phối chuẩn

Bài 2:

Một máy sơn tự động được thiết kế để phun sơn 1 xe ô tô với mức trung bình là 4 kg sơn Dữliệu dưới đây thể hiện lượng sơn thực tế đã sử dụng để sơn cùng một loại xe trong 2 ngày liêntiếp:

Dạng bài: Kiểm định trung bình

Phương pháp giải: So sánh 2 trung bình với phương sai bằng nhau

Công cụ giải: t-test:Two-Sample Assuming Equal Variances

Thực hành trên excel:

 Vào Data -> Data Analysis -> t-test:Two-Sample Assuming Equal Variances

Trang 11

 Kết quả:

GTKĐ : H0 :a1=CHIINV(0.04,1) = 4.2179 suy ra miền bác bỏ là Wa2: Máy phun sơn sử dụng lượng sơn trung bình giống nhau giữa 2 ngày

H1: a1 ≠ a2 : Máy phun sơn sử dụng lượng sơn trung bình khác nhau giữa 2 ngày

KL : |t|=CHIINV(0.04,1) = 4.2179 suy ra miền bác bỏ là W -0.409009273 < ta/2 =CHIINV(0.04,1) = 4.2179 suy ra miền bác bỏ là W 3.054539589 nên chấp nhận H 0

Vậy : Máy phun sơn sử dụng lượng sơn trung bình giống nhau giữa 2 ngày

Bài 3:

Một nhà nghiên cứu muốn khảo sát thời gian phản ứng của nam giới và nữ giới đối với cácloại tín hiệu khác nhau Các đối tượng ( 15 nam, 15 nữ) tham gia thí nghiệm được yêu cầu nhấnnút ngay khi nhận biết có tín hiệu Đây là bảng số liệu ghi lại thời gian (giây) từ khi tín hiệu

được phát đi cho đến khi đối tượng khảo sát có tín hiệu trả lời

Trang 12

Hãy áp dụng bài toán phân tích phương sai 2 yếu tố thích hợp với cơ sở số liệu trên và mức ýnghĩa  = 5%; trình bày các kết luận thu được.

Bài làm

Dạng bài: Kiểm định giá trị trung bình hai nhân tố.

Phương pháp giải: Phân tích phương sai 2 nhân tố có lặp

Công cụ giải: Anova: Two-Factor With Replication

Âm thanh Ánh sáng Xung

Nam

10,0 7,2 6,8 6,0 5,0

6,03,75,14,03,2

9,15,86,04,05,1

Nữ

10,5 8,8 9,2 8,113,4

6,64,92,54,21,8

7,36,15,22,53,9

Trang 14

 Thực hiện trên excel:

 Nhập dữ liệu :

Trang 15

 Kết quả

Trang 16

Ho1: thời gian trung bình phản ứng giữa nam và nữ với các loại tín hiệu là như nhau

 FA = 0.6410 < F =4.2597 suy ra bác bỏ H01: thời gian trung bình phản ứng giữa nam

và nữ với các loại tín hiệu là khác nhau

FB = 14.6119 > F = 3.4028 suy ra chấp nhận H02: thời giant rung bình các yếu tố âm thanh, ánh sang và xung có tác động như nhau

FAB = 3.4952 > F = 3.4028 chấp nhận H03 có sự tương tác giữa giới tính và các loại tín hiệu

Trang 17

Bài 4:

Một nghiên cứu được tiến hành ở thành phố công nghiệp X để xác định tỉ lệ những người đilàm bằng xe máy, xe đạp, xe buýt Việc điều tra được tiến hành trên 2 nhóm và có kết quả nhưsau:

Trang 18

 Tính tần số lý thuyết = Tổng hàng * tổng cột / tổng cộng

 Để tính ta dùng hàm CHITEST(B2:D3,B18:D19)

Tacó : P(X > χ2)=0.002189 < 0.05

Suy ra bác bỏ giả thiết Ho

Kết luận: Vậy tỷ lệ sử dụng phương tiện giao thông để đi làm của nhóm công nhân nam và nữ

là khác nhau

Bài 5

Tìm một dữ liệu ngẫu nhiên 2 chiều (X, Y) có kích thước n >10 để sử dụng mô hình hồi quy

tuyến tính đơn Thực hiện các yêu cầu:

1) Tìm hệ số tương quan giữa X,Y

2) Quan hệ giữa X,Y có được coi như quan hệ tuyến tính hay không? Hãy ước

lượng đường hồi quy tuyến tính Y theo X và biểu thị bằng hình vẽ

3) Tìm sai số chuẩn của ước lượng

Bài làm:

a) Bảng số liệu về thời gian thao tác trên máy tiện so với khối lượng phoi thải của gia

công tiện được lấy ngẫu nhiên ở một số máy bào của xưởng C1:

Trang 19

Cơ sở lý thuyết:

nx2−¿ ¿ ¿ ¿ ¿

 Nếu R > 0 thì X,Y tương quan thuận

 Nếu R < 0 thì X,Y tương quan nghịch

 Nếu R = 0 thì X,Y không tương quan

 Nếu |R |= 1 thì X,Y có quan hệ hàm bậc nhất

 Nếu |R |→ 1 thì X, Y có tương quan chặt (tương quan mạnh)

 Nếu |R |→ 0 thì X, Y có tương quan không chặt (tương quan yếu)

Thực hiện trên excel:

Ta có hệ số tương quan là R = 0.891520502 chứng tỏ giữa thời gian và khối

Trang 20

lương phoi thu được có quan hệ khá chặc chẻ và có tương quan thuận.

2)Quan hệ giữa X,Y có được coi như quan hệ tuyến tính hay không? Hãy ước lượng đường hồiquy tuyến tính Y theo X và biểu thị bằng hình vẽ

Giả thiết : H0: X và Y không có tương quan tuyến tính:

 Tính T : chọn ô B5 và nhập biểu thức =B7*SQRT(12-2)/SQRT(1-B7^2)

 Tính c: chọn ô B7 và nhập biểu thức =TINV(0.05,10) (c là phân vị mức

α/2=0.025 của phân bố Student với n-2=10 bậc tự do)

Vì |T| > c nên bác bỏ giả thiết H0

Vậy: X và Y có tương quan tuyến tính

Ước lượng đường hồi quy tuyến tính Y theo X

1−r2

Trang 21

Thực hiện trên Excel:

 Nhập số liệu vào bảng tính:

Dùng chức năng Data/Data Analysis/Regression

Phương trình đường hồi quy tuyến tính:

y¯x = a + bx , a=r , b = y¯− ax̅

s

Kiểm định hệ số a,b:

+++

Giả thiết H0: Hệ số hồi quy không có ý nghĩa (=CHIINV(0.04,1) = 4.2179 suy ra miền bác bỏ là W0)

H1: Hệ số hồi quy có ý nghĩa (≠0)

Kết luận: t < t , n-2n-2-2: n-2chấp nhận H p n-2n-2hấp nhận H n-2 n-2Hấp nhận H ận H 0

Kiểm định phương trình đường hồi quy:

+

+

Giả thiết H0: “Phương trình hồi quy tuyến tính không thích hợp”

H1: “Phương trình hồi quy tuyến tính thích hợp”

Kết luận: F < F ,1,n-2-2: n-2chấp nhận Hấp nhận Hp n-2n-2hấp nhận Hấp nhận Hn-2 n-2H0

Trang 22

 Kết quả:

Trang 23

Biện luận:

Phương trình hồi quy: y¯s¯ = 4.144811+ 24.21654x

Hệ số hồi quy: 0.970214 > 0.05 suy ra hệ số tự do có ý nghĩa

0.0000983573 < 0.05 suy ra hệ số của x không có ý nghĩa

Vậy phương trình hồi quy tuyến tính này không thích hợp vì 0.0000983573 < 0.05

3)Tìm sai số chuẩn của ước lượng:

Dùng kết quả từ bảng SUMMARY OUTPUT từ câu trên ta xác định được sai

số chuẩn của ước lượng:

Trang 24

- Đối với biến tự do: SE = 108.26234

- Đối với biến X: SE = 3.89099

Ngày đăng: 07/05/2016, 23:49

TỪ KHÓA LIÊN QUAN

w