MAS - COMPUTER PROJECTThống kê số ca nhiễm covid-19 Khu vực Đồng bằng sông Hồng - Đồng bằng sông Cửu Long Thành viên nhóm:Thành Hữu Ngân Giang - Leader 1 Nguyễn Bùi Trung Hiếu - Presente
Trang 1MAS - COMPUTER PROJECT
Thống kê số ca nhiễm covid-19
Khu vực Đồng bằng sông Hồng - Đồng bằng sông Cửu Long
Thành viên nhóm:Thành Hữu Ngân Giang - Leader 1
Nguyễn Bùi Trung Hiếu - Presenter Nguyễn Phúc Hưng - Culi 1 Nguyễn Văn Hùng - Culi 2 Trần Trung Đức - Culi 3 Trần Minh Trung - Culi 4
Hà nội, ngày 20 tháng 3 năm 2022
Trang 2I.Đặt Vấn đề
Hiện nay, tình hình dịch bệnh càng ngày càng căng thẳng Theo chỉ đạo của nhà nước cũng như bộ Y tế, mỗi người chúng ta cần phải có ý thức tuân theo khẩu hiện 5K đó là “không tụ tập, khẩu trang, khai báo y tế, khoảng cách và khử khuẩn” Nhưng cũng có rất nhiều người không tuân theo chỉ thị đấy và bị nhiễm covid vì vậy làm liên luỵ ảnh hưởng đến nhiều người khác Vì thế, số người bị nhiễm ngày càng tăng cao Chúng tôi hướng đến việc nghiên cứu 2 đồng bằng lớn nhất nước ta đó là đồng bằng sông Cửu Long và đồng bằng sông Hồng.
❖ Đặt vấn đề
➢ So với mặt bằng chung của cả nước, số ca nhiễm ở 2 khu vực này như thế nào?
➢ So với tỷ lệ nhiễm bệnh của cả 2 khu vực thì tỷ lệ số ca tử vong đáng ngại như thế nào?
➢
II.Thu thập số liệu và phân tích
Chúng tôi đã thu thập dữ liệu số ca nhiễm covid-19 ở 2 khu vực trên tính đến ngày 9/3/2022 dựa theo trang
Link……… https://covid19.gov.vn/
Trang 3Đồng bằng sông Cửu Long
Khu vực sông Cửu
Long
Số ca nhiễm đến ngày 9/3/2022 Tỉ lệ số ca nhiễmtrong tỉnh
Số ca tử vong đến ngày 9/3/2022
Median
Standard deviation
Confidence interval
alpha = 0.05
(Khoảng tin cậy)
44 054 7 699,04
36 355.06 - 51753.04
3.52% 0.82%
2.7% - 4.34%
712.62 219.50 497.12 - 928.12
Trang 4Đồng bằng sông Hồng
Khu vực sông Hồng Số ca nhiễm đến ngày
9/3/2022
Tỷ lệ ca nhiễm trong tỉnh
Số ca tử vong đến ngày 9/3/2022
Median
Standard deviation
Confidence interval
alpha = 0.05
(Khoảng tin cậy)
134 899.1 78 420.65
56 478.45 - 213 319.75
6.46 1.86 4.6% - 8.32%
177.5 202.73 -25.23 - 380.23
Theo thống kê cục dân số (link : https://danso.org/viet-nam/)
https://meta.vn/hotro/dien-tich-va-dan-so-cac-tinh-viet-nam-10058
Trang 5Tỷ lệ số ca nhiễm cả nước đến ngày 9/3/2022 là 5.52%
Trang 6III So sánh tỷ lệ ca nhiễm của đồng bằng sông Hồng và đồng bằng sông Cửu Long với tỷ lệ ca nhiễm trên cả nước 5.52%
Tỷ lệ ca nhiễm covid-19 trên phạm vi đồng bằng sông Hồng : 6.46%
Tỷ lệ ca nhiễm covid-19 trên phạm vi đồng bằng sông Cửu Long: 3.52%
Biểu đồ tỷ lệ số ca nhiễm covid-19 trên phạm vi khu vực và cả nước
Sông hồng Sông cửu long Cả nước
Từ biểu đồ trên, chúng ta có thể nhận thấy tỷ lệ số ca nhiễm covid-19 của đồng bằng sông Hồng khá là cao (khoảng 1%) so với cả nước Cùng với
đó, tỷ lệ số ca nhiễm của đồng bằng sông Cửu Long thấp hơn khá nhiều so với cả nước (khoảng 2%) Qua số liệu trên, ta có thể thấy được phương pháp phòng dịch và chống dịch của đồng bằng sông Cửu Long (Hùng bổ sung)
Trang 7IV Xây dựng các khoảng tin cậy hai phía 95% cho chênh lệch tỉ lệ
số ca nhiễm covid - 19 của đồng bằng sông Cửu Long.
Ta có: = 44 054
Standard deviation: σ = = 14162.90
=> Khoảng tin cậy 95%
Giới hạn sai số: Z * = 7 699.04a/2
Ta có khoảng tin cậy:
± Z
x a/2 * : 36 355.06 51 753.04
=> Khoảng tin cậy (36 355.06 ; 51 753.04)
V Xây dựng các khoảng tin cậy hai phía 95% cho chênh lệch tỉ lệ
số ca nhiễm covid - 19 của đồng bằng sông Hồng.
Ta có: = 134 899.10
Standard deviation: σ = = 126 524.43
=> Khoảng tin cậy 95%
Giới hạn sai số: Z * = 78 420.65a/2
Ta có khoảng tin cậy:
± Z
x a/2 * : 56 478.45 213 319.75
=> Khoảng tin cậy (56 478.45 - 213 319.75)
Trang 8VI Kiểm định giá trị trung bình tỷ lệ số ca nhiễm covid-19 của đồng bằng sông Hồng bằng tỷ lệ nhiễm covid-19 trên cả nước:
* Lấy = 0.05
Ta có:
Test claim: = 0.05, = 6.46 , = 5.52
+ = + 1.96
: =
:
= ( - )/() = (6.46 - 5.52)/( 3.00/) = 0.99
Nhận thấy: - < < (nằm trong khoảng màu trắng)
=> Chưa thể bác bỏ
=> Tỷ lệ nhiễm covid-19 tại đồng bằng sông Hồng bằng với tỷ lệ trong cả nước
● : >=
: <
- = -1.64
= ( - )/() = (6.46 - 5.52)/( 3.00/) = 0.99
Nhận thấy: > - (nằm trong khoảng màu trắng)
=> Chưa thể bác bỏ
=> Tỷ lệ nhiễm covid-19 tại đồng bằng sông Hồng lớn hơn tỷ lệ cả nước
VII Kiểm định giá trị trung bình tỷ lệ số ca nhiễm covid-19 của đồng bằng sông Cửu Long bằng tỷ lệ nhiễm covid-19 trên cả nước:
* Lấy = 0.05
Ta có:
Test claim: = 0.05, = 3.52, = 5.52
: =
:
+ = + 1.96
= ( - )/() = (3.52-5.52)/(1.51/) = - 4.78
Nhận thấy: < - (nằm trong khoảng màu đen)
Trang 9
=> Bác bỏ
=> Tỷ lệ nhiễm covid-19 tại đồng bằng sông Cửu Long khác với tỷ lệ trong cả nước
● : >=
: <
- = -1.64
= ( - )/() = (3.52-5.52)/(1.51/) = - 4.78
Nhận thấy: - < (nằm trong khoảng màu đen)
=> Bác bỏ
=>Tỷ lệ nhiễm covid-19 tại đồng bằng sông Cửu Long không lớn hơn với tỷ lệ trong cả nước
VIII Kiểm định giả thiết tỷ lệ ca nhiễm covid-19 ở Đồng bằng sông Hồng đạt hơn 5,52% bằng 50% (Test of hypotheses for population proportion p):
* Lấy = 0.01
: p =
:
Có: = 0.01
+ = + 2.58
Ta có :
= 0.5
n = 10
● Có 3 tỉnh tỷ lệ nhiễm hơn 5.52%
Trang 10=> = 7/10 = 0.7
Sử dụng công thức trên ta có : = 1.26
Nhận thấy: - < < (nằm trong khoảng màu trắng)
=> Không thể bác bỏ
=> Tỷ lệ ca nhiễm covid-19 (9/3/2022) tại đồng bằng sông Hồng đạt 5.52% không bằng 50%
IX Kiểm định giả thiết tỷ lệ ca nhiễm covid-19 ở Đồng bằng sông Cửu Long đạt hơn 5.52% bằng 50 % (Test of hypotheses for population proportion p):
* Lấy = 0.01
: p =
:
Có: = 0.01
+ = +2.58
Ta có:
= 0.5
n = 13
● Có 1 tỉnh tỷ lệ nhiễm hơn 5.52%
=> = 2/13
Sử dụng công thức trên ta có: = - 2.50
Nhận thấy: - < <
Trang 11=> Không thể bác bỏ (nằm trong khoảng màu trắng)
=> Tỷ lệ ca nhiễm covid-19 (9/3/2022) tại đồng bằng sông Cửu Long đạt 5,52% không bằng 50%
X Xét 2 tỷ lệ số ca nhiễm covid - 19 của đồng bằng sông Hồng và đồng bằng sông Cửu Long có sự khác nhau hay không ?
* Lấy = 0.01
Ta có :
: =
:
Có: = 0.01
+ = + 2.81
Sử dụng công thức có: = -2.71 (not equal variance)
Nhận thấy: - < <
=> Chưa thể bác bỏ (Thuộc vùng màu trắng)
=> Từ đây chúng ta có thể nhận thấy giữa 2 đồng bằng sông Hồng và đồng bằng sông Cửu Long về số ca nhiễm của covid-19 có thể có sự tương đồng trong cả hai vùng miền
Trang 12XI Nhận thấy một số tỉnh có số ca nhiễm hơn tỷ lệ số ca nhiễm trên cả nước là 5.52% Với số liệu bên trên ta có thể đưa ra kết luận tỷ lệ ca nhiễm của đồng bằng sông Hồng lớn hơn tỷ lệ ca nhiễm của đồng bằng Sông Cửu Long hay không ?
* Lấy = 0.05
: 0=
: 0
Có: = 0.05
+ = + 1.96
Ta có: = 0.7 ; = 2/13 ; = 9/23
= 10 ; = 13
Sử dụng công thức có: = 2.66
Nhận thấy: >
=> Bác bỏ (nằm trong khoảng màu đen)
=> Với sự tin cậy 95% Ta có thể kết luận tỷ lệ ca nhiễm của đồng bằng sông Hồng lớn hơn tỷ lệ ca nhiễm của đồng bằng Sông Cửu Long
Trang 13XII Liên hệ số ca nhiễm và số ca tử vong giữa 2 đồng bằng Sông Hồng và đồng bằng sông Cửu Long.
9/3/2022
Số ca tử vong đến ngày 9/3/2022
Trang 14Đồng Tháp 48 459 995
Biểu đồ:
Tiến hành kiểm định giả thuyết cho Regression Slope:
Giả thuyết: (Số ca nhiễm và tỷ lệ tử vong không có ảnh hưởng đến lấn
nhau)
: 0 =
: 0
Trang 15The regression line: y = 436.96 + 0.00051x
XIII Đánh giá, kết luận thông qua các số liệu.
Từ những dữ liệu đã thu được cũng như quá trình phân tích và đánh giá, chúng ta đưa được những kết luận như sau:
XIV Bài học nhận được sau khi làm dự án.
Sau khi làm việc cùng nhau trong dự án này, chúng tôi đã học hỏi được rất nhiều kiến thức mới cũng như củng cố kiến thức cũ.
- Ôn lại các kiến thức về xác suất và thống kê như xác suất, phân phối chọn mẫu, thống kê mô tả, khoảng tin cậy, kiểm định các giả thuyết, hồi quy tuyến tính
- Tính đơn giản, tương quan,
Trang 16- Tìm hiểu thêm về cách thu thập, làm sạch, xử lý dữ liệu và tính toán
- Nâng cao khả năng làm việc nhóm
- Hiểu được tình hình dịch bệnh ở Việt Nam