Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 63 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
63
Dung lượng
2,25 MB
Nội dung
cĐẠI HỌC QUỐC GIA THÀNH PHỐ HỒ CHÍ MINH TRƯỜNG ĐẠI HỌC BÁCH KHOA BÁO CÁO BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ STT Giảng viên hướng dẫn: ThS Nguyễn Kiều Dung Nhóm sinh viên thực hiện: – L09 Họ tên SINH VIÊN MSSV Nhóm Ngành học /Tổ Huỳnh Gia Huy 1711482 L09 Cơ điện tử Võ Thế Nhân 1813353 L09 Xây dựng Nguyễn Hoàng Anh Vũ 1814814 L09 Điện – Điện tử Nguyễn Trương Giang 1810901 L09 Điện – Điện tử Lê Huỳnh Ái Trân 1814418 L09 Logistics Quản Trần Thị Tuyết 1814639 L09 lí chuỗi cung ứng Nguyễn Tiến Phát 1712572 L09 Khoa học máy tính Nguyễn Hồng Đào 1811831 L20 Dệt Ký tên tham dự MỤC LỤ C ĐỀ TÀI Câu 1: Vẽ biểu đồ histogram; biểu đồ mật độ tần số; biểu đồ tích lũy tần số biến định lượng Nêu nhận xét Câu 2: Vẽ biểu đồ Pie biến định tính Câu Chọn biến định lượng thực hiện: Tìm giá trị ngoại lại (outlier) có nêu đề xuất xử lý Tìm đặc trưng từ mẫu liệu .9 Câu 4: Kiểm định xem biến có phù hợp với dạng phân phối xác suất cụ thể hay không 14 Câu 5: Chọn liệu biến để lập toán kiểm định so sánh trung bình tổng thể Trình bày bước thực nhận xét kết 20 Câu Chọn liệu cho k biến (k 3) để lập tốn so sánh trung bình Trình bày bước thực nhận xét 25 Câu 7: Chọn liệu cho biến để lập toán kiểm định so sánh phân tán Trình bày bước thực nhận xét kết 30 Câu 8: Chọn liệu phù hợp để lập toán so sánh tỉ lệ ( toán kiểm định tính độc lập) Trình bày bước thực nhận xét kết 35 Câu 9: Khảo sát hệ số tương quan biến cụ thể, dự đốn phương trình đường hồi quy tuyến tính chúng (có hình vẽ minh họa) nhận xét mối tương quan biến 40 Câu 10: Chọn k biến ( k >= 3) xem xét lập mơ hình hồi quy tuyến tính đa biến chúng hay không 50 ĐỀ TÀI NGHIÊN CỨU MỐI LIÊN QUAN GIỮA MỘT SỐ THÔNG SỐ CỦA BỆNH NHÂN VỚI BỆNH TIM MẠCH Bệnh Tim mạch bệnh lý tim mạch máu bao gồm: tăng huyết áp, rối loạn nhịp tim, bệnh động mạch vành, bệnh van tim, suy tim, xơ vữa động mạch, đột quỵ… Bệnh Tim mạch nguyên nhân hàng đầu gây tử vong giới Mỗi năm, bệnh Tim mạch gây cho 17,5 triệu chết dự đoán có khoảng 25 triệu người bị bệnh Tim mạch tử vong vào năm 2020 Với mục đích tìm thấy xu hướng khác triệu chứng liệu tim bệnh nhân để dự đoán kiện tim mạch định tìm thấy dấu hiệu rõ ràng sức khỏe tim, đề tài “Nghiên cứu mối liên quan số thông số bệnh nhân với bệnh tim mạch” thực với sở liệu Cleveland Nghiên cứu thực 300 đối tượng từ độ tuổi 30 tới 80 với 14 loại thơng tin Để phù hợp với tập lớn, nhóm chúng em chọn loại 150 đối tượng (gồm có: độ tuổi, giới tính, loại đau ngực, huyết áp lúc nghĩ ngơi, số Cholesterol, số đường huyết, nhịp tim tối đa, đoạn ST giảm xuống gây tập thể dục tương lúc nghỉ điện tâm đồ) cho việc thống kê đánh giá https://www.kaggle.com/ronitf/heart-disease-uci Những người thực thí nghiệm: Viện Tim mạch Hungary Budapest: Andras Janosi, M.D Bệnh viện Đại học, Zurich, Thụy Sĩ: William Steinbrunn, M.D Bệnh viện Đại học, Basel, Thụy Sĩ: Matthias Pfisterer, M.D V.A Trung tâm y tế, Long Beach Tổ chức phòng khám Cleveland: Robert Detrano, M.D., Ph.D Câu 1: Vẽ biểu đồ histogram; biểu đồ mật độ tần số; biểu đồ tích lũy tần số biến định lượng Nêu nhận xét Bài làm Dạng bài: Thống kê mô tả Chọn liệu Bảng liệu bệnh tim (A) Thực phương pháp phân tổ liệu (A) Nhập liệu (A) vào Excel Chọn biến định lượng để vẽ biểu đồ: Chỉ số Cholesterol (E1-E151) Xác định số tổ cần chia: + Chọn ô A7 nhập vào biểu thức: =(2*COUNT(E2:E151))^(1/3) + Kết quả: k = 6.6943 + Chọn k = Xác định trị số khoảng cách h theo công thức: + Chọn ô A8 nhập vào biểu thức: =(MAX(E2:E151)-MIN(E2:E151))/7 + Kết quả: h = 73 Ta xác định cận cận tổ là: + Tổ 1: 126 + Tổ 2: 199 + Tổ 3: 272 + Tổ 4: 345 + Tổ 5: 418 + Tổ 6: 491 + Tổ 7: 564 Chọn chức Data → Data Analysis → Histogram Input Range: địa tuyệt đối chứa liệu Bin Range: địa chứa bảng phân nhóm Output Range: vị trí xuất kết Chọn Cumulative Percentage để tính tần suất tích lũy khơng Excel tính tần suất Kết quả: Vẽ biểu đồ histogram; biểu đồ mật độ tần số; biểu đồ tích lũy tần số Vẽ biểu đồ phân bố tần số Quét chọn bảng tần số: M4 – M10 Dùng chức Insert Column Chart menu Insert Kết quả: BIỂU ĐỒ TẦN SỐ 100 90 80 70 60 50 40 30 20 10 Vẽ biểu đồ tích lũy tần số Quét chọn cột tần số tích lũy: N4 – N10 Dùng chức Insert Column Chart menu Insert Kết quả: BIỂU ĐỒ TÍCH LŨY TẦN SỐ 120.00% 100.00% 80.00% 60.00% 40.00% 20.00% 0.00% Biểu đồ mật độ: hình chữ nhật cho tổ với đáy khoảng cách tổ chiều cao tính theo cơng thức: Trong đó : fi tỉ lệ tổ h là khoảng cách tổ Đối với liệu A: + i = 1,2,3,4 + h = 73 (khoảng cách tổ) + Ta có bảng số liệu: Vẽ biểu đồ mật độ; Quét chọn cột độ cao H(x) Dùng chức Insert Column Chart menu Insert Kết quả: