Bài 1: Tìm một dữ liệu định lượng (A) và một dữ liệu định tính (B) thích hợp, sử dụng các dữ liệu đó cho các yêu cầu sau: 1)Thực hiện phương pháp phân tổ dữ liệu (A). 2)Vẽ đồ thị phân phối tần số và đa giác tần số (A). 3) Tính các đặc trưng mẫu và ước lượng giá trị trung bình của dấu hiệu quan sát với độ tin cậy 96% (A). 4)Trình bày dữ liệu định tính (B) dạng phân loại bằng các đồ thị. 5) Hãy kiểm định xem dữ liệu (A) hoặc (B) có phù hợp với 1 phân bố xác suất nào đó hay không. Bài 2: Một máy sơn tự động được thiết kế để phun sơn 1 xe ô tô với mức trung bình là 4 kg sơn. Dữ liệu dưới đây thể hiện lượng sơn thực tế đã sử dụng để sơn cùng một loại xe trong 2 ngày liên tiếp: Ngày 1: 3,8 4,2 3,6 4,1 3,9 4,3 4,1 3,8 3,954 Ngày 2: 4,5 3,8 4,1 3,9 4,5 3,8 4 4,2đơn vị: kg. Hãy kiểm định xem máy phun sơn có sử dụng lượng sơn trung bình khác nhau giữa 2 ngày hay không, với mức ý nghĩa 1%. Bài 3: Một nhà nghiên cứu muốn khảo sát thời gian phản ứng của nam giới và nữ giới đối với các loại tín hiệu khác nhau. Các đối tượng ( 15 nam, 15 nữ) tham gia thí nghiệm được yêu cầu nhấn nút ngay khi nhận biết có tín hiệu. Đây là bảng số liệu ghi lại thời gian (giây) từ khi tín hiệu được phát đi cho đến khi đối tượng khảo sát có tín hiệu trả lời.
Trang 1BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC BÁCH KHOA TP HCM
ĐỀ TÀI : 10
Giảng viên hướng dẫn : Nguyễn Kiều Dung Sinh viên thực hiện :
Trang 2
Bài 1: Tìm một dữ liệu định lượng (A) và một dữ liệu định tính (B) thích hợp, sử dụng các dữ
liệu đó cho các yêu cầu sau:
1)Thực hiện phương pháp phân tổ dữ liệu (A)
2)Vẽ đồ thị phân phối tần số và đa giác tần số (A)
3) Tính các đặc trưng mẫu và ước lượng giá trị trung bình của dấu hiệu quan sát với độ tin cậy 96% (A)
4)Trình bày dữ liệu định tính (B) dạng phân loại bằng các đồ thị
5) Hãy kiểm định xem dữ liệu (A) hoặc (B) có phù hợp với 1 phân bố xác suất nào đó hay không
BÀI LÀM:
Dạng bài: Thống kê mô tả thời gian tiện phôi cho trước của 40 sinh viên ngành cơ kĩ thuật
Dữ liệu A: Khảo sát thời gian (phút) của
1 Thực hiện phương pháp phân tổ dữ liệu A:
Nhập dữ liệu A vào excel
+Xác định số tổ cần chia : k=¿
=(2*COUNT(A1:E4))^(1/3)
Kết quả
Chọn k = 4
Trang 3+ Xác định trị số khoảng cách h theo công thức: ℎ= xmax−xmin k
Chọn chức năng Data/ Data Analysis/Histogram
+ Input Range: địa chỉ tuyệt đối chứa dư liệu
+ Bin Range: địa chỉ chứa bảng phân nhóm
+ Output options: vị trí xuất kết quả
+ Confidence Level for Mean: độ tin cậy cho trung bình
+ Chọn Cumulative Percentage để tính tần suất tích lũy nếu không Excel chỉtính tần số
Trang 5 Vẽ đa giác tần số:
+ Sử dụng bảng phân phối tần số của dữ liệu (A):
+ Thêm giá trị 0 vào đầu và cuối bảng phân phối tần số:
+ Quét chọn B39:B43, dùng chức năng Insert Line Chart trên menu Insert
Kết quả sau chỉnh sửa:
Trang 63) Tính các đặc trưng mẫu và ước lượng giá trị trung bình của dấu hiệu quan sát với độ tin cậy 96% (A).
Nhập dữ liệu vào bảng tính:
Chọn chức năng Data/Data Analysis/Descriptive Statistics
Trang 7+ Input Range: địa chỉ tuyệt đối chứa dư liệu.
+ Output options: vị trí xuất kết quả
+ Confidence Level for Mean: độ tin cậy cho trung bình
Kết quả nhận được:
Khoảng ước lượng p: (16.125-1.7666 ; 16.125+1.7666)
4)Trình bày dữ liệu định tính (B) dạng phân loại bằng các đồ thị.
Nhập dữ liệu và bảng tính:
Trang 8 Tính tỉ lệ sinh viên cho các ngành:
Nhập vào C3: =B2/$B$10, copy cho các ô còn lại
Vẽ biểu đồ đứng thể hiện số lượng sinh viên ở các chuyên ngành
+ Quét chọn cột Số sinh viên (B2:B6)
+ Dùng chức năng Insert /Insert Column Chart/2-D Column trên menu Insert
Kết quả thu được:
Trang 9 Vẽ biểu đồ tròn thể hiện tỉ lệ sinh viên ở các chuyên ngành.
+ Quét chọn cột Số sinh viên (C2:C6)
+ Dùng chức năng Insert/Insert Pie/2-D Pie trên menu Insert
5) Hãy kiểm định xem dữ liệu (A) hoặc (B) có phù hợp với 1 phân bố xác suất nào
đó hay không.
Giả thiết kiểm định Ho : phù hợp phân phối chuẩn
Giả thiết đối H 1 : không phù hợp phân phối chuẩn
Ta có χ^2 0.04 (4-2-1) =CHIINV(0.04,1) = 4.2179 suy ra miền bác bỏ là WCHIINV(0.04,1) =CHIINV(0.04,1) = 4.2179 suy ra miền bác bỏ là W 4.2179 suy ra miền bác bỏ là W α =CHIINV(0.04,1) = 4.2179 suy ra miền bác bỏ là W (4.2179; +∞)
Trang 10Kết luận : χ^2 =CHIINV(0.04,1) = 4.2179 suy ra miền bác bỏ là W 3.702592775 nằm ngoài miền bác bỏ nên chấp nhận H 0 , vậy số liệu trên là phù hợp phân phối chuẩn
Bài 2:
Một máy sơn tự động được thiết kế để phun sơn 1 xe ô tô với mức trung bình là 4 kg sơn Dữliệu dưới đây thể hiện lượng sơn thực tế đã sử dụng để sơn cùng một loại xe trong 2 ngày liêntiếp:
Dạng bài: Kiểm định trung bình
Phương pháp giải: So sánh 2 trung bình với phương sai bằng nhau
Công cụ giải: t-test:Two-Sample Assuming Equal Variances
Thực hành trên excel:
Vào Data -> Data Analysis -> t-test:Two-Sample Assuming Equal Variances
Trang 11 Kết quả:
GTKĐ : H0 :a1=CHIINV(0.04,1) = 4.2179 suy ra miền bác bỏ là Wa2: Máy phun sơn sử dụng lượng sơn trung bình giống nhau giữa 2 ngày
H1: a1 ≠ a2 : Máy phun sơn sử dụng lượng sơn trung bình khác nhau giữa 2 ngày
KL : |t|=CHIINV(0.04,1) = 4.2179 suy ra miền bác bỏ là W -0.409009273 < ta/2 =CHIINV(0.04,1) = 4.2179 suy ra miền bác bỏ là W 3.054539589 nên chấp nhận H 0
Vậy : Máy phun sơn sử dụng lượng sơn trung bình giống nhau giữa 2 ngày
Bài 3:
Một nhà nghiên cứu muốn khảo sát thời gian phản ứng của nam giới và nữ giới đối với cácloại tín hiệu khác nhau Các đối tượng ( 15 nam, 15 nữ) tham gia thí nghiệm được yêu cầu nhấnnút ngay khi nhận biết có tín hiệu Đây là bảng số liệu ghi lại thời gian (giây) từ khi tín hiệu
được phát đi cho đến khi đối tượng khảo sát có tín hiệu trả lời
Trang 12Hãy áp dụng bài toán phân tích phương sai 2 yếu tố thích hợp với cơ sở số liệu trên và mức ýnghĩa = 5%; trình bày các kết luận thu được.
Bài làm
Dạng bài: Kiểm định giá trị trung bình hai nhân tố.
Phương pháp giải: Phân tích phương sai 2 nhân tố có lặp
Công cụ giải: Anova: Two-Factor With Replication
Âm thanh Ánh sáng Xung
Nam
10,0 7,2 6,8 6,0 5,0
6,03,75,14,03,2
9,15,86,04,05,1
Nữ
10,5 8,8 9,2 8,113,4
6,64,92,54,21,8
7,36,15,22,53,9
Trang 14 Thực hiện trên excel:
Nhập dữ liệu :
Trang 15 Kết quả
Trang 16Ho1: thời gian trung bình phản ứng giữa nam và nữ với các loại tín hiệu là như nhau
FA = 0.6410 < F =4.2597 suy ra bác bỏ H01: thời gian trung bình phản ứng giữa nam
và nữ với các loại tín hiệu là khác nhau
FB = 14.6119 > F = 3.4028 suy ra chấp nhận H02: thời giant rung bình các yếu tố âm thanh, ánh sang và xung có tác động như nhau
FAB = 3.4952 > F = 3.4028 chấp nhận H03 có sự tương tác giữa giới tính và các loại tín hiệu
Trang 17Bài 4:
Một nghiên cứu được tiến hành ở thành phố công nghiệp X để xác định tỉ lệ những người đilàm bằng xe máy, xe đạp, xe buýt Việc điều tra được tiến hành trên 2 nhóm và có kết quả nhưsau:
Trang 18 Tính tần số lý thuyết = Tổng hàng * tổng cột / tổng cộng
Để tính ta dùng hàm CHITEST(B2:D3,B18:D19)
Tacó : P(X > χ2)=0.002189 < 0.05
Suy ra bác bỏ giả thiết Ho
Kết luận: Vậy tỷ lệ sử dụng phương tiện giao thông để đi làm của nhóm công nhân nam và nữ
là khác nhau
Bài 5
Tìm một dữ liệu ngẫu nhiên 2 chiều (X, Y) có kích thước n >10 để sử dụng mô hình hồi quy
tuyến tính đơn Thực hiện các yêu cầu:
1) Tìm hệ số tương quan giữa X,Y
2) Quan hệ giữa X,Y có được coi như quan hệ tuyến tính hay không? Hãy ước
lượng đường hồi quy tuyến tính Y theo X và biểu thị bằng hình vẽ
3) Tìm sai số chuẩn của ước lượng
Bài làm:
a) Bảng số liệu về thời gian thao tác trên máy tiện so với khối lượng phoi thải của gia
công tiện được lấy ngẫu nhiên ở một số máy bào của xưởng C1:
Trang 19Cơ sở lý thuyết:
√n∑x2−¿ ¿ ¿ ¿ ¿
Nếu R > 0 thì X,Y tương quan thuận
Nếu R < 0 thì X,Y tương quan nghịch
Nếu R = 0 thì X,Y không tương quan
Nếu |R |= 1 thì X,Y có quan hệ hàm bậc nhất
Nếu |R |→ 1 thì X, Y có tương quan chặt (tương quan mạnh)
Nếu |R |→ 0 thì X, Y có tương quan không chặt (tương quan yếu)
Thực hiện trên excel:
Ta có hệ số tương quan là R = 0.891520502 chứng tỏ giữa thời gian và khối
Trang 20lương phoi thu được có quan hệ khá chặc chẻ và có tương quan thuận.
2)Quan hệ giữa X,Y có được coi như quan hệ tuyến tính hay không? Hãy ước lượng đường hồiquy tuyến tính Y theo X và biểu thị bằng hình vẽ
Giả thiết : H0: X và Y không có tương quan tuyến tính:
Tính T : chọn ô B5 và nhập biểu thức =B7*SQRT(12-2)/SQRT(1-B7^2)
Tính c: chọn ô B7 và nhập biểu thức =TINV(0.05,10) (c là phân vị mức
α/2=0.025 của phân bố Student với n-2=10 bậc tự do)
Vì |T| > c nên bác bỏ giả thiết H0
Vậy: X và Y có tương quan tuyến tính
Ước lượng đường hồi quy tuyến tính Y theo X
√1−r2
Trang 21 Thực hiện trên Excel:
Nhập số liệu vào bảng tính:
Dùng chức năng Data/Data Analysis/Regression
Phương trình đường hồi quy tuyến tính:
y¯x = a + bx , a=r , b = y¯− ax̅
s
Kiểm định hệ số a,b:
+++
Giả thiết H0: Hệ số hồi quy không có ý nghĩa (=CHIINV(0.04,1) = 4.2179 suy ra miền bác bỏ là W0)
H1: Hệ số hồi quy có ý nghĩa (≠0)
Kết luận: t < t , n-2n-2-2: n-2chấp nhận H p n-2n-2hấp nhận H n-2 n-2Hấp nhận H ận H 0
Kiểm định phương trình đường hồi quy:
+
+
Giả thiết H0: “Phương trình hồi quy tuyến tính không thích hợp”
H1: “Phương trình hồi quy tuyến tính thích hợp”
Kết luận: F < F ,1,n-2-2: n-2chấp nhận Hấp nhận Hp n-2n-2hấp nhận Hấp nhận Hn-2 n-2H0
Trang 22 Kết quả:
Trang 23Biện luận:
Phương trình hồi quy: y¯s¯ = 4.144811+ 24.21654x
Hệ số hồi quy: 0.970214 > 0.05 suy ra hệ số tự do có ý nghĩa
0.0000983573 < 0.05 suy ra hệ số của x không có ý nghĩa
Vậy phương trình hồi quy tuyến tính này không thích hợp vì 0.0000983573 < 0.05
3)Tìm sai số chuẩn của ước lượng:
Dùng kết quả từ bảng SUMMARY OUTPUT từ câu trên ta xác định được sai
số chuẩn của ước lượng:
Trang 24- Đối với biến tự do: SE = 108.26234
- Đối với biến X: SE = 3.89099