(TIỂU LUẬN) báo cáo bài tập lớn xác SUẤT THỐNG kê tìm một dữ liệu định lượng (a) và một dữ liệu định tính (b) thích hợp, sử dụng các dữ liệu đó cho các yêu cầu sau
Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 54 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
54
Dung lượng
3 MB
Nội dung
TRƯỜNG ĐẠI HỌC BÁCH KHOA TPHCM Khoa Kỹ Thuật Xây Dựng BÁO CÁO BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ HK 182 Giáo viên hướng dẫn: Nguyễn Kiều Dung Nhóm 05 Đề tài 05 Danh sách thành viên nhóm 5, đề tài 05 STT Họ tên Huỳnh Thị Hoàng Hảo Nguyễn Dương Hiếu Trần Tuấn Kiệt Đàm Lê Thành Huỳnh Minh Trường Bài 1: Tìm liệu định lượng (A) liệu định tính (B) thích hợp, sử dụng liệu cho yêu cầu sau: 1) Thực phương pháp phân tổ liệu (A) 2) Vẽ biểu đồ histogram (biểu đồ phân bố tần số), biểu đồ tích lũy tần số, biểu đồ mật độ với liệu (A) 3) Tính đặc trưng mẫu ước lượng giá trị trung bình dấu hiệu quan sát với độ tin cậy 95% với liệu (A) 4) Trình bày liệu định tính (B) dạng phân loại đồ thị 5) Hãy kiểm định xem liệu (A) (B) có phù hợp với phân bố xác suất hay khơng (lưu ý phải sử dụng hàm thống kê excel) Tài liệu tham khảo cho yêu cầu từ 1) - 4) sách Thống kê ứng dụng, Chương số Số khoảng chia theo hướng dẫn sách công thức để tham khảo Khái niệm biểu đồ mật độ khơng trình bày sách Bài làm Dạng bài: Thống kê mô tả Dữ liệu (A): Khảo sát thời gian tự học 36 sinh viên ngày ta có bảng số liệu: Thời gian (phút) Dữ liệu (B): Phân ngành sinh viên khoa kỹ thuật xây dựng khóa 2017 trường Đại học Bách Khoa thành phố Hồ Chí Minh Ngành học Số sinh viên KSTN Kỹ thuật cơng trình xây dựng Kỹ thuật cơng trình xây dựng Xây dựng cơng trình giao thơng Kỹ thuật cơng trình biển Kỹ thuật sở hạ tầng Kỹ thuật cơng trình thủy Thực phương pháp phân tổ liệu (A) - Nhập liệu (A) vào Excel: - Xác định số tổ cần chia: k =(2× n)3 Chọn A8 nhập vào biểu thức =(2*Count(A1:F6))^(1/3) Kết 4.16017 Chọn k = (6) - ( Xmax −Xmin ) Xác định trị số khoảng cách h theo công thức: h= k Chọn ô A9 nhập vào biểu thức =(Max(A1:F6)-Min(A1:F6))/4 Kết 105 Chọn h =105 - Ta xác định cận cận tổ là: Tổ 1: 60 – 165 Tổ 2: 165 – 270 Tổ 3: 270 – 375 Tổ 4: 375 – 480 - Nhập vào ô từ A12 đến A16 giá trị - Chọn chức Data/ Data Analysis/Histogram Trong đó: + Input Range: Địa tuyệt đối chứa dư liệu + Bin Range: Địa chứa bảng phân nhóm + Output options: Vị trí xuất kết + Confidence Level for Mean: Độ tin cậy cho trung bình + Chọn Cumulative Percentage để tính tần suất tích lũy khơng Excel tính tần số - Ta kết quả: - Có thể chỉnh lại sau: Vẽ biểu đồ histogram (biểu đồ phân bố tần số), biểu đồ tích lũy tần số, biểu đồ mật độ với liệu (A) a Biểu đồ Histogram - Nhập liệu - Quét chọn vùng vừa nhập - Dùng chức Insert Histogram menu Insert - Kết quả: b Biểu đồ tích lũy tần số - Chọn quét bảng tần số từ C2 đến C5 - Dùng chức Insert Line menu Insert - Kết quả: c Biểu đồ mật độ Tính đặc trưng mẫu ước lượng giá trị trung bình dấu hiệu quan sát với độ tin cậy 95% với liệu (A) - Nhập liệu vào bảng tính - Chọn chức Data/Data Analysis/Descriptive Statistics Trong đó: + Input Range: địa tuyệt đối chứa dư liệu + Output options: vị trí xuất kết + Confidence Level for Mean: độ tin cậy cho trung bình - Kết quả: Trình bày liệu định tính (B) dạng phân loại đồ thị - Nhập liệu vào bảng tính - Tính tỉ lệ sinh viên ngành Nhập vào C2: =B2/sum(B2:B7) làm tương tự với ô khác cách thay giá trị B2 thành B3, B4, B5, B6, B7 Ta được: Phương trình hồi quy: y x = -1528.1791 + 23.4612x y´ =−1898347+17.3974 x x Hệ số hồi quy: 0.0029> Có ý nghĩa thống kê Giá trị thống kê: F=8.6655 F = 8.6655 > Fα (k −1 ,N −k )=F0.05 (3−1,30−3)=3.2519 Vậy bác bỏ giả thiết H0 Lượng galactose khác theo nhóm Giải tốn Công thức Với số liệu nghiên cứu trên, có tóm tắt thống kê sau Nhóm 1—Crohn 2—Viêm ruột 3—Đối chứng Toàn mẫu Với mức ý nghĩa ta kiểm định giả thiết Giả thiết: H 0: a1=a2=… ak “Các giá trị trung bình nhau” H 0: a1≠ ak “Ít có hai giá trị trung bình khác nhau” Bảng Anova Nguồn sai số Yếu tố Sai số Tổng cộng Đặt: Tổng quan sát: k n=∑ n j=9+11 +20=40 j=1 Trung bình nhóm j (j=1, …, k): ´x j= n j j=1 x´1=1910 x´2=2226 x´3=2804 Trung bình mẫu chung: n j=1 i=1 x´=2444 Phương sai hiệu chỉnh nhóm j: S2j= n j k nj ∑ ∑ xij= ´x= −1 i=1 S21=265944 S22=473387 ∑n ( xij−x´j )2 j T v ới S23=277500 Tổng bình phương độ lệch (cho tồn mẫu): k nj STT=∑∑ ( xij−x´)2 j=1 i=1 STT=(1343−2444)2+(1393−2444)2+….(3657−2444)2=17815090 Tổng bình phương độ lệch riêng nhóm (phản ánh độ khác nhóm): SSF=∑ ∑ (xi−´x )2=∑ nj (x´j−x´ )2 SSF=9(1910−2444)2+11(2226−2444)2 +20 (2804−2444)2=5681168 Tổng bình phương độ lệch phản ánh độ lệch nhóm (phản ánh độ khác nhóm): SSE=∑ ∑ (xij−x´ j )2=∑(nj −1)S2j SSE=(9−1) 265944+(11−1) 473387+(20−1)277500=12133922 Hoặc tính SSW theo quan hệ sau: SSE=STT −SSF SSE tính từ bệnh nhân nhóm, trung bình bình phương (độ lệch) cho nhóm (Mean square – MSE): MSE= SSE 12133922 n−k = 40−3 =327944 Trung bình bình phương (độ lệch) nhóm là: MSF= SSF 5681168 = k −1 3−1 =2840584 Giá trị thống kê F F= MSF MSE = 2840584 327944 =8.6618 Giá trị Fα F α (k −1 ,N −k )=F0.05 (3−1,30−3)=3.2519 F = 8.6618 > Fα (k −1 ,N −k )=3.2519 Vậy bác bỏ giả thiết H0 Lượng galactose khác theo nhóm (Nhóm hồn thiện bài) ... Kiệt Đàm Lê Thành Huỳnh Minh Trường Bài 1: Tìm liệu định lượng (A) liệu định tính (B) thích hợp, sử dụng liệu cho yêu cầu sau: 1) Thực phương pháp phân tổ liệu (A) 2) Vẽ biểu đồ histogram (biểu... kiểm định xem liệu (A) (B) có phù hợp với phân bố xác suất hay khơng (lưu ý phải sử dụng hàm thống kê excel) Tài liệu tham khảo cho yêu cầu từ 1) - 4) sách Thống kê ứng dụng, Chương số Số khoảng... liệu (A) 3) Tính đặc trưng mẫu ước lượng giá trị trung bình dấu hiệu quan sát với độ tin cậy 95% với liệu (A) 4) Trình bày liệu định tính (B) dạng phân loại đồ thị 5) Hãy kiểm định xem liệu (A)