1. Trang chủ
  2. » Kinh Doanh - Tiếp Thị

Bài tập về xác suất thống kê ra quyết định quản lý

24 147 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 24
Dung lượng 667 KB

Nội dung

BÀI TẬP VỀ XÁC SUẤT THỐNG KÊ RA QUYẾT ĐỊNH QUẢN LÝ Đề tài: Để nghiên cứu tỷ lệ người dân tử vong bệnh liên quan đến tim mạch, nhóm nghiên cứu trường Đại học Mỹ thu thập số liệu Bang toàn nước Mỹ số người tử vong số số liệu kinh tế xã hội liên quan Bảng số liệu cho đây: State AL AK AZ AR CA CO CT DE FL GA HI ID IL IN IA KS KY LA ME MD MA MI MN MS MO MT NE Số người chết 307.1 90.9 226.0 325.9 217.0 158.3 278.1 266.9 340.4 225.9 203.3 202.3 275.3 280.4 303.2 262.8 305.4 274.6 272.8 233.6 257.0 280.8 199.6 337.2 328.7 232.1 269.9 Tuổi 65 13.0 5.7 13.0 14.0 10.6 9.7 13.8 13.0 17.6 9.6 13.3 11.3 12.1 12.4 14.9 13.3 12.5 11.6 14.4 11.3 13.5 12.3 12.1 12.1 13.5 13.4 13.6 Thu Tỷ lệ da nhập 23.471 30.064 25.578 22.257 32.275 32.949 40.640 31.255 28.145 27.940 28.221 24.180 32.259 27.011 26.723 27.816 24.294 23.334 25.623 33.872 37.992 29.612 32.101 20.993 27.445 22.569 27.829 màu 26.0 3.5 3.1 15.7 6.7 3.8 9.1 19.2 14.6 28.7 1.8 0.4 15.1 8.4 2.1 5.7 7.3 32.5 0.5 27.9 5.4 14.2 3.5 36.3 11.2 0.3 4.0 Vùng 1 1 1 1 1 1 1 1 1 1 1 1 1 NV NH NJ NM NY NC ND OH OK OR PA RI SC SD TN TX UT VT VA WA WV WI WY 233.9 229.0 288.5 198.4 324.2 250.8 289.3 294.9 335.4 219.0 347.7 303.6 256.9 276.1 296.9 216.6 130.8 226.0 223.0 200.0 377.5 263.3 210.4 11.0 12.0 13.2 11.7 12.9 12.0 14.7 13.3 13.2 12.8 15.6 14.5 12.1 14.3 12.4 9.9 8.5 12.7 11.2 11.2 15.3 13.1 11.7 30.529 33.332 36.983 22.203 34.547 27.194 25.068 28.400 23.517 28.350 29.539 29.685 24.321 26.115 26.239 27.871 23.907 26.901 31.162 31.528 21.915 28.232 27.230 6.8 0.7 13.6 1.9 15.9 21.6 0.6 11.5 7.6 1.6 10.0 4.5 29.5 0.6 16.4 11.5 0.8 0.5 19.6 3.2 3.2 5.7 0.8 2 2 2 2 2 2 2 2 2 2 2 Trong đó: - Số người chết: Số lượng người chết liên quan tới bệnh tim mạch 100.000 dân - Tuổi 65: Phần trăm dân số từ 65 tuổi trở lên - Thu nhập: Thu nhập bình qn tính nghìn la - Tỷ lệ da mầu: phần trăm dân số người da mầu - Vùng: Các bang chia thành vùng nghiên cứu Vùng Vùng Hãy sử dụng số liệu để trả lời câu hỏi sau: Sử dụng mô tả thống kê thích hợp để nhận xét biến số liệu Sử dụng đồ thị thích hợp hệ số tương quan để nhận xét mối quan hệ số lượng người chết bệnh liên quan đến tim mạch với biến lại Từ có nhận định thiết lập mơ hình hồi quy tuyến tính với biến phụ thuộc số người chết biến số biến lại ảnh hưởng đến biến phụ thuộc (không cần phân biệt vùng) Hãy ước lượng khoảng tin cậy cho số người chết trung bình cho bang vùng vùng Hãy so sánh số người chết trung bình cho bang vùng vùng (dùng kiểm định) Kết so sánh có tương đồng với so sánh thu nhập khơng? Ước lượng mơ hình hồi quy tuyến tính với biến phụ thuộc số người chết, biến độc lập biến lại (khơng phân theo vùng): a Giải thích ý nghĩa hệ số hồi quy hệ số R2 b Dùng kiểm định thích hợp cho biết biến độc lập có ảnh hưởng khơng ảnh hưởng đến biến phụ thuộc? Từ đưa nhận định yếu tố tác động đến tỷ lên người chết bệnh tim mạch Liệu có yếu tố khác ảnh hưởng đến tỷ lệ người chết này? c Dùng kiểm định F cho biết liệu mơ hình có ý nghĩa hay không? Nếu ý nghĩa kết nhận d Hãy dự báo tỷ lệ người chết bang có biến độc lập là: 15% từ 65 tuổi trở lên, 25000usd thu nhập trung bình, 4% da màu Giải thích ý nghĩa kết nhận Bài làm: Để trả lời câu hỏi, thành viên nhóm I sử dụng phần mền Megastat để phần tích số liệu, sau sử dụng kết từ phần mền tính tốn để trả lời câu hỏi Sử dụng mô tả thống kê thích hợp để nhận xét biến số liệu 1.1 Số lượng người chết bệnh liên quan đến tim mạch Từ phần mềm Megastat/Descriptive statistics, sau ta nhập số liệu số người chết vào bảng Ta có bảng số liệu sau Descriptive statistics Count Mean Số người chết 50 258.954 sample variance sample standard deviation Minimum Maximum Range 3,191.835 56.496 90.9 377.5 286.6 Skewness Kurtosis coefficient of variation (CV) -0.482 0.681 21.82% 1st quartile Median 3rd quartile interquartile range Mode 223.725 265.100 296.400 72.675 226.000 Nhận xét: Qua bảng ta thấy: - Số lượng bang nghiên cứu là: 50 bang - Số lượng người chết bệnh liên quan đến tim mạch bang Mỹ trung bình 259 người 100.000 dân Số lượng người chết bệnh liên quan đến tim mạch trung vị 265.100 Như vậy, có 50% số bang nghiên cứu có Số lượng người chết bệnh liên quan đến tim mạch thấp 265.1 người 50% số bang nghiên cứu có Số lượng người chết bệnh liên quan đến tim mạch lớn 265.1 người Số lượng người chết bệnh liên quan đến tim mạch trung bình bang xấp xỉ trung vị cho thấy mẫu nghiên cứu có phân phối cân xứng - Độ lệch chuẩn mẫu là: 56.496 cho thấy độ lệch phân phối - Một số bang có Số lượng người chết bệnh liên quan đến tim mạch Số lượng người chết bệnh liên quan đến tim mạch phổ biến (có tần số lớn nhất) 226 người 100.000 dân Số lượng người chết bệnh liên quan đến tim mạch bang thấp là: 90.9 người 100.000 dân Số lượng người chết bệnh liên quan đến tim mạch bang cao là: 377.5 100.000 dân Khoảng biến thiên thực tế 286.6 Biểu đồ thể tần suất Số lượng người chết bệnh liên quan đến tim mạch bang Mỹ Từ phần mền Megastat/Frequency Distribution/Quantitative, ta nhập số liệu số người chết vào bảng, từ ta có bảng số liệu sau: Frequency Distribution - Quantitative Số người chết uppe midpoin lowe r 50 100 150 200 250 300 350 < < < < < < < r 100 150 200 250 300 350 400 t 75 125 175 225 275 325 375 widt frequenc percen h 50 50 50 50 50 50 50 y 1 15 18 11 t 2.0 2.0 6.0 30.0 36.0 22.0 2.0 50 100.0 cumulative frequenc percen y 20 38 49 50 t 2.0 4.0 10.0 40.0 76.0 98.0 100.0 Căn vào bảng phân bố tần suất trên, ta thấy: Số lượng người chết bệnh liên quan đến tim mạch bang nước Mỹ phổ biến từ 200 – 350 người tổng số 100.000 dân (chiếm tỷ lệ 88%) Đồ thị phân bố tần số biến Số người chết cân đối, tập trung Tuy nhiên, độ lệch (Sknewness) biểu đồ -0.482 < phân phối có hướng lệch trái 1.2 Phần trăm dân số từ 65 tuổi trở lên Từ phần mềm Magastat/Descriptive Statistics Ta nhập số liệu phần dân số từ 65 tuổi trở lên, từ ta có bảng số liệu sau : Descriptive statistics Count Mean sample variance sample standard deviation Minimum Maximum Range Skewness Kurtosis coefficient Tuổi 65 50 12.538 3.628 1.905 5.7 17.6 11.9 -0.741 3.078 of variation (CV) 15.19% 1st quartile Median 3rd quartile interquartile range Mode 11.700 12.750 13.475 1.775 12.100 Nhận xét: Qua bảng ta thấy: - Số lượng bang nghiên cứu là: 50 bang - Phần trăm dân số từ 65 tuổi trở lên bang Mỹ trung bình 12.538% Phần trăm dân số từ 65 tuổi trở lên bang Mỹ trung vị 12.75% Như vậy, có 50% số bang nghiên cứu có Phần trăm dân số từ 65 tuổi trở lên bang Mỹ thấp 12.75% 50% số bang nghiên cứu có Phần trăm dân số từ 65 tuổi trở lên bang Mỹ lớn 12.75% Phần trăm dân số từ 65 tuổi trở lên bang Mỹ bang xấp xỉ trung vị cho thấy mẫu nghiên cứu có phân phối cân xứng - Độ lệch chuẩn mẫu là: 1.905% cho thấy độ lệch phân phối - Một số bang có Phần trăm dân số từ 65 tuổi trở lên Phần trăm dân số từ 65 tuổi trở lên bang Mỹ phổ biến (có tần số lớn nhất) 12.1% Phần trăm dân số từ 65 tuổi trở lên bang Mỹ thấp là: 5.7% Phần trăm dân số từ 65 tuổi trở lên bang Mỹ cao là: 17.6% Khoảng biến thiên thực tế 11.9% Biểu đồ thể tần suất Phần trăm dân số từ 65 tuổi trở lên bang Mỹ Frequency Distribution - Quantitative lowe Tuổi 65 uppe r 5.0 6.0 7.0 8.0 9.0 10.0 11.0 12.0 13.0 14.0 15.0 16.0 17.0 < < < < < < < < < < < < < r 6.0 7.0 8.0 9.0 10.0 11.0 12.0 13.0 14.0 15.0 16.0 17.0 18.0 midpoin widt frequenc percen t 5.5 6.5 7.5 8.5 9.5 10.5 11.5 12.5 13.5 14.5 15.5 16.5 17.5 h 1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0 y 0 13 14 t 2.0 0.0 0.0 2.0 6.0 2.0 16.0 26.0 28.0 12.0 4.0 0.0 2.0 50 100.0 cumulative frequenc percen y 1 14 27 41 47 49 49 50 t 2.0 2.0 2.0 4.0 10.0 12.0 28.0 54.0 82.0 94.0 98.0 98.0 100.0 Căn vào bảng phân bố tần suất trên, ta thấy: Phần trăm dân số từ 65 tuổi trở lên bang nước Mỹ phổ biến từ 11 – 15% (chiếm tỷ lệ 82%) Kết luận: Dựa vào kết điều tra, quyền xem xét xây dựng sách ưu đãi dành cho người già xây dựng thêm bệnh viện, viện dưỡng lão để đảm bảo người già chăm sóc sức khỏe tốt xây dựng mức phân bổ quỹ phúc lợi dành cho người già bang cho phù hợp với tỷ lệ người già … Đồ thị phân bố tần số biến Phần trăm dân số từ 65 tuổi trở lên cân đối, tập trung Tuy nhiên, độ lệch (Sknewness) biểu đồ -0.741 < phân phối có hướng lệch trái lệch phải 1.3 Thu nhập bình quân người dân tính nghìn USD Từ phần mền Megastat/Descriptive statistics Sau ta nhập liệu thu nhập vào bảng, từ ta có bảng số liệu sau Descriptive statistics Thu count mean sample variance sample standard deviation minimum maximum range skewness kurtosis coefficient (CV) nhập 50 28.82432 38.33179 6.19127 20.993 59.685 38.692 2.71490 11.83641 of variation 21.48% 1st quartile median 3rd quartile interquartile range mode 25.19550 27.85000 31.23175 6.03625 #N/A Nhận xét Qua bảng ta thấy: - Số lượng bang nghiên cứu là: 50 bang - Thu nhập bình quân người dân bang Mỹ trung bình 28.824 nghìn USD Thu nhập bình quân người dân bang Mỹ trung vị 27.85 nghìn USD Như vậy, có 50% số bang nghiên cứu có Thu nhập bình quân người dân thấp 27.85 nghìn USD 50% số bang nghiên cứu có Thu nhập bình quân người dân lớn 27.85 nghìn USD Thu nhập bình quân người dân trung bình bang xấp xỉ trung vị cho thấy mẫu nghiên cứu có phân phối cân xứng - Độ lệch chuẩn mẫu là: 6.19 cho thấy độ lệch phân phối - Thu nhập bình quân người dân bang Mỹ khác (khơng có giá trị phổ biến) Thu nhập bình quân người dân bang thấp là: 20.993 nghìn USD Thu nhập bình quân người dân bang cao là: 59.685 nghìn USD Khoảng biến thiên thực tế 38.692 nghìn USD Biểu đồ thể tần suất Thu nhập bình quân người dân bang Mỹ Frequency Distribution - Quantitative Thu nhập cumulative lowe uppe midpoin widt frequenc percen frequenc percen r 20.00 22.00 24.00 26.00 28.00 30.00 32.00 34.00 36.00 38.00 r 22.00 24.00 26.00 28.00 30.00 32.00 34.00 36.00 38.00 40.00 t 21.00 23.00 25.00 27.00 29.00 31.00 33.00 35.00 37.00 39.00 h 2.00 2.00 2.00 2.00 2.00 2.00 2.00 2.00 2.00 2.00 y 12 t 4.0 14.0 12.0 24.0 14.0 10.0 12.0 2.0 4.0 0.0 y 15 27 34 39 45 46 48 48 t 4.0 18.0 30.0 54.0 68.0 78.0 90.0 92.0 96.0 96.0 < < < < < < < < < < 40.00 42.00 44.00 46.00 48.00 50.00 52.00 54.00 56.00 58.00 < < < < < < < < < < 42.00 44.00 46.00 48.00 50.00 52.00 54.00 56.00 58.00 60.00 41.00 43.00 45.00 47.00 49.00 51.00 53.00 55.00 57.00 59.00 2.00 2.00 2.00 2.00 2.00 2.00 2.00 2.00 2.00 2.00 0 0 0 0 2.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 2.0 50 100.0 49 49 49 49 49 49 49 49 49 50 98.0 98.0 98.0 98.0 98.0 98.0 98.0 98.0 98.0 100.0 Căn vào bảng phân bố tần suất trên, ta thấy: Thu nhập bình quân người dân bang Mỹ phổ biến từ 22 – 34 nghìn USD (chiếm tỷ lệ 86%) Trong đó, mức thu nhập từ 26 – 28 nghìn USD chiếm tỷ lệ cao đạt 24% Kết luận: Dựa vào kết điều tra, quyền xem xét áp dụng mức phí dịch vụ cơng khác phù hợp với mức thu nhập bình quân bang đưa sách viện phí chi phí khác liên quan tới chữa bệnh phù hợp … Đồ thị phân bố tần số biến Thu nhập bình qn có xu hướng tập trung Tuy nhiên có số vùng có thu nhập cao hẳn vùng lại, mức thu nhập từ 56.000 – 60.000 USD 10 1.4 Phần trăm dân số người da màu Từ phần mềm Megastat/Descriptive statistics, sau ta nhập số liệu tỷ lệ da màu vào bảng, từ ta có bảng số liệu sau : Descriptive statistics Count Mean sample variance sample standard deviation Minimum Maximum Range Tỷ lệ da màu 50 9.902 91.779 9.580 0.3 36.3 36 Skewness Kurtosis coefficient of variation (CV) 1st quartile Median 3rd quartile interquartile range Mode 1.130 0.453 96.75% 2.350 6.750 14.975 12.625 3.500 Nhận xét: Qua bảng ta thấy: - Số lượng bang nghiên cứu là: 50 bang - Phần trăm dân số người da màu bang Mỹ trung bình 9.9% Phần trăm dân số người da màu bang Mỹ trung vị 6.75% Như vậy, có 50% số bang nghiên cứu có Phần trăm dân số người da màu thấp 6.75% 50% số bang nghiên cứu có Phần trăm dân số người da màu lớn 6.75% Phần trăm dân số từ 65 tuổi trở lên bang Mỹ bang lớn trung vị cho thấy mẫu nghiên cứu có phân phối lệch phải - Độ lệch chuẩn mẫu là: 9.58% cho thấy độ lệch phân phối - Một số bang có Phần trăm dân số người da màu Phần trăm dân số người da màu phổ biến (có tần số lớn nhất) 3.5% Phần trăm dân số người 11 da màu bang Mỹ thấp là: 0.3% Phần trăm dân số người da màu bang Mỹ cao là: 36.3% Khoảng biến thiên thực tế 36% Biểu đồ thể tần suất Thu nhập bình quân người dân bang Mỹ Frequency Distribution - Quantitative lowe r 10 15 20 25 30 35 Tỷ lệ da màu uppe midpoin < < < < < < < < r 10 15 20 25 30 35 40 t 13 18 23 28 33 37 widt frequenc percen Cumulative frequenc percen h 5 5 5 5 y 21 1 t 42.0 18.0 14.0 12.0 2.0 8.0 2.0 2.0 y 21 30 37 43 44 48 49 50 50 100.0 t 42.0 60.0 74.0 86.0 88.0 96.0 98.0 100.0 Căn vào bảng phân bố tần suất trên, ta thấy: Phần trăm dân số người da màu bang Mỹ phổ biến từ – 20% (chiếm tỷ lệ 86%) Trong đó, bang có Phần trăm dân số người da màu từ – 5% chiếm tỷ lệ cao đạt 42% Kết luận: Dựa vào kết điều tra, quyền xem xét áp dụng sách phúc lợi, ưu tiên cho người da màu 12 Đồ thị phân bố tần số biến Phần trăm dân số người da màu có dạng phân phối lệch trái Sử dụng đồ thị hệ số tương quan để nhận xét mối quan hệ số lượng người chết bệnh liên quan đến tim mạch với biến lại: 2.1 Đồ thị mối quan hệ Số lượng người chết bệnh liên quan đến tim mạch với Phần trăm dân số từ 65 tuổi trở lên Từ phần mền Megastat/ Correlation/ Regession/ Scatter Plot Sau ta nhập số liệu số người chết phần trăm dân số từ 65 tuổi trở lên vào bảng, ta có bảng số liệu sau 13 Căn vào đồ thị trên, ta thấy: Đồ thị phân tán có dạng tuyến tính Do đó, Giữa Số lượng người chết bệnh liên quan đến tim mạch với Phần trăm dân số từ 65 tuổi trở lên có mối quan hệ tỷ lệ thuận với 2.2 Đồ thị mối quan hệ Số lượng người chết bệnh liên quan đến tim mạch với Thu nhập bình quân người dân Từ phần mền Megastat/ Correlation/ Regession/ Scatter Plot Sau ta nhập số liệu số người chết thu nhập vào bảng, ta có bảng số liệu sau Căn vào đồ thị trên, ta thấy: Đồ thị phân tán dạng tuyến tính Do đó, Giữa Số lượng người chết bệnh liên quan đến tim mạch với Thu nhập bình qn khơng có mối quan hệ với 1.3 Đồ thị mối quan hệ Số lượng người chết bệnh liên quan đến tim mạch với Phần trăm dân số người da màu Từ phần mền Megastat/ Correlation/ Regession/ Scatter Plot Sau ta nhập số liệu số người chết phần trăm dân số người da màu vào bảng, ta có bảng số liệu sau 14 Căn vào đồ thị trên, ta thấy: Đồ thị phân tán có dạng tuyến tính -> Giữa Số lượng người chết bệnh liên quan đến tim mạch với Tỷ lệ da màu có mối quan hệ với Hệ số tương quan biến Từ phần mền Megastat/Correlation/Regresion/Correlation Matrix, sau ta đưa toàn liệu số người chết, tuổi 65, thu nhập, tỷ lệ da màu vào bảng, ta có bảng kết sau: Correlation Matrix Số người Số người chết Tuổi 65 Thu nhập Tỷ lệ da màu chết 1.000 788 -.044 312 Tuổi 65 1.000 040 -.095 Thu Tỷ lệ da nhập màu 1.000 -.093 1.000 Căn vào bảng ta thấy: - Tương quan Số người chết Phần trăm dân số từ 65 tuổi trở lên 0.788 - Tương quan Số người chết Thu nhập bình quân -0.044 - Tương quan Số người chết Phần trăm dân số người da màu 0.312 15 Như vậy, Phần trăm dân số từ 65 tuổi trở lên có ảnh hưởng lớn đến thay đổi Số lượng người chết bệnh liên quan đến tim mạch, sau đến Phần trăm dân số người da màu Thu nhập bình qn khơng ảnh hưởng đến Số lượng người chết bệnh liên quan đến tim mạch Ước lượng khoảng tin cậy cho Số người chết trung bình cho bang Vùng Vùng 3.1 Số người chết trung bình cho bang Vùng a Mô tả thống kê Số người chết bang Vùng Từ phần mền Megastat/Descriptive statistics Sau ta nhập số liệu, số người chết vùng vào bảng, từ ta có bảng số liệu sau: Descriptive statistics Count Mean sample variance sample standard deviation Minimum Maximum Range 1st quartile Median 3rd quartile interquartile range Mode Số người chết 26 257.138 3,361.783 57.981 90.9 340.4 249.5 225.925 269.850 297.600 71.675 #N/A b Ước lượng Số người chết trung bình cho bang Vùng Từ số liệu bảng trên, ta sử dụng Phần mền Megastat/Confidence interval – mean, nhập số liệu vào bảng, ta có bảng số liệu sau: Confidence interval - mean 95% 257.138 57.981 26 2.060 23.419 confidence level mean std dev n t (df = 25) half-width 16 280.557 upper confidence limit 233.719 lower confidence limit Căn vào kết trên, ước lượng khoảng tin cậy Số người chết bệnh liên quan đến tim mạch trung bình bang Vùng nằm khoảng (233.719; 280.557) Nói cách khác, ước đốn 95% số bang Vùng có Số người chết bệnh liên quan đến tim mạch nằm khoảng từ 233,7 đến 280,6 người số 100.000 dân 3.2 Số người chết trung bình cho bang Vùng Làm tương tự câu ta có a Mơ tả thống kê Số người chết bang Vùng Descriptive statistics Count Mean sample variance sample standard deviation Minimum Maximum Range 1st quartile Median 3rd quartile interquartile range Mode Số người chết 24 260.921 3,138.122 56.019 130.8 377.5 246.7 222.000 260.100 295.400 73.400 #N/A b Ước lượng Số người chết trung bình cho bang Vùng Confidence interval - mean 95% 260.921 56.019 24 2.069 23.655 284.576 confidence level mean std dev N t (df = 23) half-width upper confidence limit 17 237.266 lower confidence limit Khoảng tin cậy Số người chết bệnh liên quan đến tim mạch trung bình bang Vùng nằm khoảng (237.266; 284.576) Nói cách khác, ước đốn 95% số bang Vùng có Số người chết bệnh liên quan đến tim mạch nằm khoảng từ 237,3 đến 284,6 người số 100.000 dân 4.1 So sánh Số người chết trung bình cho bang Vùng Vùng Từ phần mền Megastat/Hypothesis tets/Compare Two Independent Groups Sau ta nhập số liệu số người chết vùng vùng vào bảng, sau ta có bảng số liệu sau: Hypothesis Test: Independent Groups (t-test, pooled variance) Số người chết: Group 257.138 57.981 26 Group 260.921 56.019 24 mean std dev n 48 -3.7824 3,254.6121 57.0492 16.1489 df difference (Số người chết - Group 2) pooled variance pooled std dev standard error of difference hypothesized difference -0.23 8158 t p-value (two-tailed) Căn vào kết trên, thấy: Với mức ý nghĩa α = 5%, Số người chết bệnh liên quan đến tim mạch trung bình bang Vùng Vùng (do pvalue > α) 4.2 So sánh Thu nhập bình quân người dân bang Vùng Vùng Ta làm tương tự phần 4.2 ta có kết sau: Hypothesis Test: Independent Groups (t-test, pooled variance) 18 Thu nhập Group 28.40842 4.82352 26 Group 29.27488 7.48108 24 Mean std dev N 48 -0.866452 38.935179 6.239806 1.766297 Df difference (Thu nhập - Group 2) pooled variance pooled std dev standard error of difference hypothesized difference -0.49 6260 T p-value (two-tailed) Căn vào kết trên, thấy: Với mức ý nghĩa α = 5%, Thu nhập bình quân người dân trung bình bang Vùng Vùng (do p-value > α -> chưa có sở bác bỏ giả thiết H0) Ước lượng mơ hình hồi quy tuyến tính với biến phụ thuộc Số người chết biến độc lập biến lại R² Adjusted R² R Std Error 0.774 0.759 0.880 27.731 SS 121,024.764 df n k Dep Var 50 Số người chết ANOVA table Source Regression Residual Total 35,375.1597 156,399.924 Regression output variables coefficients 46 MS 40,341.588 769.0252 F p-value 52.46 6.92E-15 49 std t (df=46) p-value confidence interval 95% 95% 19 error Intercept -60.1955 32.6430 -1.844 Tuổi 65 24.5202 2.0904 11.730 Thu nhập Tỷ lệ da -0.3757 0.6430 -0.584 2.2768 0.4171 5.459 màu 0716 2.01E15 5619 1.86E06 lower 125.9025 upper 5.5114 20.3124 28.7280 -1.6700 0.9186 1.4373 3.1163 5.1 Giải thích ý nghĩa hệ số hồi quy hệ số R2 Căn vào bảng ta thấy: Mơ hình thu là: = -60.2 + 24.5xTuổi 65 – 0.4xThu nhập + 2.3xTỷ lệ da màu - Ý nghĩa hệ số hồi quy: + 24.5: Nếu thu nhập tỷ lệ da màu giữ không đổi, phần trăm dân số từ 65 tuổi trở lên tăng 1% 100.00 dân, Số người chết bệnh liên quan đến tim mạch tăng thêm 24.5 người + (-0.4): Nếu phần trăm dân số từ 65 tuổi trở lên tỷ lệ da màu giữ khơng đổi, thu nhập bình qn tăng 1.000 USD 100.00 dân, Số người chết bệnh liên quan đến tim mạch giảm 0.4 người + 2.3: Nếu phần trăm dân số từ 65 tuổi trở lên thu nhập giữ không đổi, tỷ lệ người da màu tăng 1% 100.00 dân, Số người chết bệnh liên quan đến tim mạch tăng thêm 2.3 người - Ý nghĩa R2 = 0.774: Với 03 biến độc lập Phần trăm dân số từ 65 tuổi trở lên, Thu nhập bình quân người dân Phần trăm dân số người da màu, mơ hình giải thích 77,4% thay đổi Số lượng người chết bệnh liên quan đến tim mạch 5.2 Dùng kiểm định thích hợp cho biết biến độc lập có ảnh hưởng khơng ảnh hưởng đến biến phụ thuộc? Từ đưa nhận định yếu 20 tố tác động đến tỷ lên người chết bệnh tim mạch Liệu có yếu tố khác ảnh hưởng đến tỷ lệ người chết này? Căn vào bảng tính trên, để kiểm định biến độc lập có ảnh hưởng khơng ảnh hưởng đến biến phụ thuộc, ta xây dựng 03 cặp giả thiết sau: + Cặp giả thiết 1: H0: β1 = (Phần trăm dân số từ 65 tuổi trở lên không ảnh hưởng đến Số người chết) H1: β1 ≠ (Phần trăm dân số từ 65 tuổi trở lên có ảnh hưởng đến Số người chết) + Cặp giả thiết 2: H0: β2 = (Thu nhập bình qn khơng ảnh hưởng đến Số người chết) H1: β2 ≠ (Thu nhập bình qn có ảnh hưởng đến Số người chết) + Cặp giả thiết 3: H0: β3 = (Thu nhập bình qn khơng ảnh hưởng đến Số người chết) H1: β3 ≠ (Thu nhập bình qn có ảnh hưởng đến Số người chết) Để kiểm định cặp giả thiết trên, ta quan sát giá trị P – Value thu bảng tính ban đầu: + Với cặp giả thiết 1: P-Value = 2x10 -15 < α = 0.05 -> bác bỏ giả thiết H -> Phần trăm dân số từ 65 tuổi trở lên có ảnh hưởng đến Số người chết bệnh liên quan đến tim mạch + Với cặp giả thiết 2: P-Value = 0.56 > α = 0.05 -> chấp nhận giả thiết H -> Thu nhập bình quân người dân không ảnh hưởng đến Số người chết bệnh liên quan đến tim mạch + Với cặp giả thiết 3: P-Value = 1.86x10 -6 < α = 0.05 -> bác bỏ giả thiết H -> Phần trăm dân số người da màu có ảnh hưởng đến Số người chết bệnh liên quan đến tim mạch Kết luận: Với biến độc lập nghiên cứu, có biến Phần trăm dân số từ 65 tuổi trở lên Phần trăm dân số người da màu có ảnh hưởng đến Số người chết bệnh liên quan đến tim mạch Như vậy, có yếu tố khác ảnh hưởng đến Số 21 người chết bệnh liên quan đến tim mạch mà cần nghiên cứu thêm như: Số bác sĩ 100.000 dân, Tỷ lệ nam/nữ 100.000 dân, … 5.3 Dùng kiểm định F cho biết liệu mơ hình có ý nghĩa hay không? Nêu ý nghĩa kết nhận Căn vào kết kiểm định trên, ta xây dựng lại mơ hình hồi quy tuyến tính thể mối quan hệ Số người chết bệnh liên quan đến tim mạch (biến phụ thuộc) với Phần trăm dân số từ 65 tuổi trở lên Phần trăm dân số người da màu (biến độc lập) Regression Analysis R² Adjusted R² R Std Error 0.772 0.762 0.879 27.536 SS 120,762.185 df n k Dep Var 50 Số người chết ANOVA table Source Regression Residual Total 35,637.7388 156,399.924 2 47 MS 60,381.092 758.2498 F p-value 79.63 8.04E-16 49 Regression output variables coefficients Intercept -70.7553 Tuổi 65 Tỷ lệ da màu std t (df=47) p-value 26.9931 -2.621 0118 24.4814 2.0747 11.800 2.2987 0.4125 5.573 error 1.18E15 1.18E06 confidence interval 95% 95% lower 125.0585 upper -16.4522 20.3077 28.6551 1.4689 3.1285 Mơ hình thu là: = -70.7 + 24.5 x Tuổi 65 + 2.3 x Tỷ lệ da màu 22 Để kiểm định xem mô hình có ý nghĩa hay khơng, ta sử dụng kiểm định cặp giả thiết sau: H0: β1 = β2 = (Phần trăm dân số từ 65 tuổi trở lên Tỷ lệ da màu không ảnh hưởng đến Số người chết) H1: Có hệ số β ≠ (Có biến Phần trăm dân số từ 65 tuổi trở lên Tỷ lệ da màu có ảnh hưởng đến Số người chết) Căn vào kết kiểm định ANNOVA kiểm định F bảng ta có: - Ý nghĩa R2 = 0.772 -> Mơ hình có ý nghĩa việc giải thích biến thiên Số lượng người chết bệnh liên quan đến tim mạch: Với 02 biến độc lập Phần trăm dân số từ 65 tuổi trở lên Phần trăm dân số người da màu, mơ hình giải thích 77,2% thay đổi Số lượng người chết bệnh liên quan đến tim mạch - Các hệ số β > cho thấy biến phụ thuộc có quan hệ tỷ lệ thuận với biến độc lập - Giá trị P-Value kiểm định F 8.04x10-16 < α = 0.05 -> bác bỏ giả thiết H -> Có hai biến Phần trăm dân số từ 65 tuổi trở lên Tỷ lệ da màu có ảnh hưởng đến Số người chết Kết luận: Để giảm tỷ lệ người chết bệnh tim mạch, quyền cần có quan tâm đầu tư tới hệ thống y tế, chăm sóc sức khỏe cho người cao tuổi (trên 65 tuổi) 5.4 Hãy dự báo tỷ lệ người chết bang có biến độc lập là: 15% từ 65 tuổi trở lên, 25000usd thu nhập trung bình, 4% da màu Giải thích ý nghĩa kết nhận Predicted values for: Số người chết Tuổi Tỷ lệ da 65 màu Predicted 95% Confidence 95% Prediction Interval Interval lower upper lower upper Leverage 23 15 305.6603 292.1914 319.1291 248.6504 362.6701 0.059 Nếu bang có Phần trăm dân số từ 65 tuổi trở lên 15 Phần trăm dân số người da màu 4% thì: Số người chết bệnh liên quan đến tim mạch nằm khoảng từ 292 đến 319 người 100.000 dân 24 ... Mơ tả thống kê Số người chết bang Vùng Descriptive statistics Count Mean sample variance sample standard deviation Minimum Maximum Range 1st quartile Median 3rd quartile interquartile range Mode... kết nhận Bài làm: Để trả lời câu hỏi, thành viên nhóm I sử dụng phần mền Megastat để phần tích số liệu, sau sử dụng kết từ phần mền tính toán để trả lời câu hỏi Sử dụng mơ tả thống kê thích hợp... mơ tả thống kê thích hợp để nhận xét biến số liệu Sử dụng đồ thị thích hợp hệ số tương quan để nhận xét mối quan hệ số lượng người chết bệnh liên quan đến tim mạch với biến lại Từ có nhận định

Ngày đăng: 02/01/2018, 11:30

TỪ KHÓA LIÊN QUAN

w