ĐẠI HỌC QUỐC GIA THÀNH PHỐ HỒ CHÍ MINH TRƯỜNG ĐẠI HỌC BÁCH KHOA KHOA KHOA HỌC KỸ THUẬT MÁY TÍNH CẤU TRÚC RỜI RẠC CHO KHMT (CO1007) Thống kê khảo sát kết quả Covid 19 môn Cấu trúc rời rạc GVHD Huỳnh Tường Nguyên Nguyễn Ngọc Lễ SV thực hiện Nguyễn Hoài Khang 2111453 Hà Văn Châu 2110054 Vũ Ngọc Thuận 2112394 Đỗ Nguyễn An Huy 2110193 Dương Trọng Khôi 2113786 Tp Hồ Chí Minh, Tháng 042022 Mục lục 1 Động cơ nghiên cứu 3 2 Mục tiêu 3 3 Cơ sở lý thuyết 3 3 1 Trung bình cộng (giá trị kì vọng) 3 3 1 1 Đ.
ĐẠI HỌC QUỐC GIA THÀNH PHỐ HỒ CHÍ MINH TRƯỜNG ĐẠI HỌC BÁCH KHOA KHOA KHOA HỌC & KỸ THUẬT MÁY TÍNH CẤU TRÚC RỜI RẠC CHO KHMT (CO1007) Thống kê khảo sát kết Covid-19 môn Cấu trúc rời rạc GVHD : SV thực : Huỳnh Tường Nguyên Nguyễn Ngọc Lễ Nguyễn Hoài Khang Hà Văn Châu Vũ Ngọc Thuận Đỗ Nguyễn An Huy Dương Trọng Khôi Tp Hồ Chí Minh, Tháng 04/2022 - 2111453 2110054 2112394 2110193 2113786 Mục lục Động nghiên cứu Mục tiêu 3 Cơ sở lý thuyết 3.1 3.2 3.3 3.4 3.5 3.6 3.7 Trung bình cộng (giá trị kì vọng) 3.1.1 Định nghĩa 3.1.2 Ý nghĩa Tứ phân vị 3.2.1 Định nghĩa 3.2.2 Phân loại 3.2.3 Ý nghĩa 3.2.4 Cách thức xác định Phương sai - Độ lệch chuẩn 3.3.1 Định nghĩa 3.3.2 Ý nghĩa Khoảng tứ phân vị 3.4.1 Định nghĩa 3.4.2 Ý nghĩa Outlier 3.5.1 Định nghĩa 3.5.2 Ý nghĩa Biểu đồ hộp (Box Plot) 3.6.1 Định nghĩa 3.6.2 Các thành phần 3.6.3 Ý nghĩa Tần số tích lũy - Biểu đồ tích lũy 3.7.1 Định nghĩa 3.7.2 Thiết lập bảng tần số tích lũy Trường Đại Học Bách Khoa Tp.Hồ Chí Minh Khoa Khoa Học & Kỹ Thuật Máy Tính 3.7.3 3.8 3.9 Ý nghĩa Đường trung bình động 3.8.1 Định nghĩa 3.8.2 Tính tốn giá trị trung bình động đơn giản 3.8.3 Ý nghĩa Hệ số tương quan 3.9.1 Hệ số tương quan Pearson 3.9.2 Hồi quy tuyến tính, phương pháp bình phương cực tiểu Phân tích liệu 11 4.1 Tập liệu mẫu 11 4.2 Tiền xử lí 11 4.2.1 Cài đặt packages (gói) source file chứa hàm tính tốn cần thiết 11 4.2.2 Đọc liệu từ file vào dataframe (khung liệu) 11 4.2.3 Kiểm tra cấu trúc tập liệu mẫu 12 Chuẩn hóa liệu 12 4.3.1 Chuẩn hóa kiểu liệu thuộc tính date (ngày-giờ) 12 4.3.2 Xử lí giá trị âm new_cases new_deaths 12 4.3.3 Lọc liệu quốc gia 13 4.4 Dữ liệu phân công riêng 13 4.5 Kết phân tích 13 4.3 Kết luận 82 Tài liệu 82 Bài tập lớn môn Cấu trúc Rời rạc cho KHMT (CO1007) - Niên khóa 2021-2022 Trang 2/83 Trường Đại Học Bách Khoa Tp.Hồ Chí Minh Khoa Khoa Học & Kỹ Thuật Máy Tính Động nghiên cứu Bệnh Corona virus gây gọi COVID-19 tạo tác động tiêu cực đến đời sống cư dân thề giới Các đợt bùng phát COVID19 hay biến thể virus mang đến thách thức chưa có dự báo có tác động đáng kể đến phát triển kinh tế Nhiều thơng tin, tin tức tình hình dịch bệnh liệu COVID-19 phổ biến rộng rải đời sống hay internet để giúp cho người quan sát, phân tích, nghiên cứu đươc cập nhật hàng ngày Phân tích & thống kê liệu COVID19 giúp cho ta thấy số ca nhiễm bệnh, tử vong quốc gia, so sánh tình trạng quốc gia khu vực hay diễn biến dịch giới Từ số liệu báo cáo mơi muốn biết ca nhiễm bệnh có xu hướng tăng lên hay giảm xuống quy mô đợt bùng phát quốc gia Dữ liệu dùng cho tập lớn có tham khào từ: https://github.com/owid/covid-19-data/blob/master/public/data/README.md Mục tiêu Trong tập lớn này, bắt đầu với toán thống kê đơn giản từ liệu cung cấp Qua đó, tìm số thú vị, có ý nghĩa liệu thực tế từ tình hình dịch corona Những kết tìm bước khởi đầu cho việc khai phá nguồn liệu hệ thống sau này, nhằm đạt tới mục tiêu nâng cao kỹ lập trình, kỹ giải vấn đề cho người học, kỹ làm việc nhóm hướng tới mục tiêu cao đam mê làm việc, học tập nghiên cứu Cơ sở lý thuyết Trong thống kê, liệu mà ta làm việc vô lớn nhìn vào liệu nói chung khó để rút ý nghĩa từ số Vì vậy, người ta thường tính tốn số giá trị để khái quát liệu Ta tìm hiểu vài giá trị có ý nghĩa thống kê 3.1 3.1.1 Trung bình cộng (giá trị kì vọng) Định nghĩa 3.1.2 Trung bình cộng (hay giá trị trung bình, giá trị kì vọng ) khái niệm vơ gần gũi khoa học đời sống hàng ngày Giả sử ta có tập D gồm k giá trị x1 , x2 , , xk : D = {x1 , x2 , , xk } Khi đó, trung bình cộng D là: k xi M ean(D)= i=0 (1) k Bài tập lớn môn Cấu trúc Rời rạc cho KHMT (CO1007) - Niên khóa 2021-2022 Ý nghĩa • Trong phân tích liệu: giúp ta hình dùng điểm trung tâm tập giá trị • Trong phân tích tình hình dịch Covid : giá trị kì vọng xem đại diện cho số lượng ca nhiễm tử vong quốc gia khoảng thời gian cụ thể Từ đánh giá mức độ nghiêm trọng, tình hình dịch Covid, so sánh khách quan tình hình dịch quốc gia, châu lục Trang 3/83 Trường Đại Học Bách Khoa Tp.Hồ Chí Minh Khoa Khoa Học & Kỹ Thuật Máy Tính 3.2 3.2.1 Tứ phân vị Định nghĩa 3.2.3 Trong thống kê mô tả, tứ phân vị loại tập lượng tử chia số lượng điểm liệu thành bốn phần có kích thước nhỏ Dữ liệu phải xếp theo thứ tự từ nhỏ đến lớn để tính tốn tứ phân vị 3.2.2 Phân loại Có tứ phân vị chính, là: • Tứ phân vị thứ (Q1 ): số giữa số nhỏ (minimun) số trung vị (median) tập liệu Nó cịn gọi phần tư thực nghiệm thấp thứ 25, 25% liệu nằm điểm Ý nghĩa • Trong tính tốn thống kê: ba tứ phân vị chia tập hợp liệu (đã xếp theo trật tự từ bé đến lớn) thành bốn phần có số lượng quan sát Nó cung cấp thơng tin trung tâm phân tán liệu Tứ phân vị thứ thứ ba cung cấp thông tin mức độ chênh lệch lớn liệu tập liệu có bị lệch phía hay khơng • Trong phân tích tình hình dịch Covid : tứ phân vị thứ hai (Q2 hay trung vị) sử dụng để thay cho giá trị kì vọng thành trung tâm tập liệu, trường hợp số liệu báo cáo có phân tán cao (độ lệch chuẩn lớn) để đánh giá trình hình dịch bệnh • Tứ phân vị thứ hai (Q2 ): giá trị trung vị tập liệu; 50% liệu nằm điểm • Tứ phân vị thứ ba (Q3 ): giá trị giữa giá trị trung vị (median) số lớn (maximun) tập liệu Nó gọi phần tư thực nghiệm thứ 75, 75% liệu nằm điểm 3.2.4 Hình 3.1 Tứ phân vị Cách thức xác định Có nhiều quy chuẩn, phương thức để tính tứ phân vị, phương thức cho kết khác nhau, chúng công nhận Một cách thức tính tốn tứ phân vị sau: giả sử có tập D gồm k giá trị đượ xếp: D = {x1 , x2 , , xk } • Tính tứ phân vi thứ hai: – Nếu k lẻ thì: Q2 (D) = M edian(D) = x k−1 – Nếu k chẵn thì: Q2 (D) = M edian(D) = (x k + x k +1 ) 2 • Tính tứ phân vị thứ thứ ba: Tìm trung vị (tứ phân vị thứ hai Q2 ) – Nếu k lẻ loại bỏ trung vị khoải tập liệu Chia tập liệu lại hai phần – Nếu k chẵn chia tập liệu gốc hai phần Tứ phân vị thứ Q1 trung vị phần liệu có giá trị thấp Tứ phân vị thứ ba Q3 trung vị phần liệu có giá trị cao Sử dụng kí hiệu tốn học, ta viết: Q1 (D)=M edian({x|x < M edian(D)}) (2) Q3 (D)=M edian({x|x > M edian(D)}) (3) Bài tập lớn môn Cấu trúc Rời rạc cho KHMT (CO1007) - Niên khóa 2021-2022 Trang 4/83 Trường Đại Học Bách Khoa Tp.Hồ Chí Minh Khoa Khoa Học & Kỹ Thuật Máy Tính Ví dụ 1: Cho tập xếp 6, 7, 15, 36, 39, 40, 41, 42, 43, 47, 49; có k = 11 Ví dụ 2: Cho tập xếp 7, 15, 36, 39, 40, 41; có k = • Tính tứ phân vị thứ 2: Q2 = x6 = 40 • Chia tập liệu hai phần sau loại trung vị + D1 = {6, 7, 15, 36, 39} Q1 = 15 + D3 = {41, 42, 43, 47, 49} Q3 = 43 3.3 3.3.1 • Tính tứ phân vị thứ 2: Q2 = x3 +x4 = 37.5 • Chia tập liệu hai phần nhau: + D1 = {7, 15, 36} Q1 = 15 + D3 = {39, 40, 41} Q3 = 40 Phương sai - Độ lệch chuẩn Định nghĩa Giá trị trung bình cộng cho ta biết giá trị tập liệu phân bố quanh điểm trung tâm nào, phương sai độ lệch chuẩn cho ta biết giá trị phân bố quanh điểm trung tâm Phương sai định nghĩa trung bình bình phương khoảng cách điểm liệu tới điểm trung bình (giá trị kỳ vọng- trung bình cộng) i=k (xi − M ean(D))2 V (D) = i=0 k Hình 3.1 Tập liệu có phương sai nhỏ, các điểm Độ lệch chuẩn định nghĩa bậc hai liệu phân bố gần giá trị kì vọng (mean) nên dùng giá phương sai trị kì vọng để mơ tả (đại diện) cho trung tâm tập liệu Std(D) = V (D) 3.3.2 Ý nghĩa • Trong tính tốn thống kê : phương sai lớn giá trị có xu hướng phân bố xa quanh điểm kì vọng, giá trị kì vọng mơ tả xác điểm trung tâm Ngược lai, phương sai nhỏ điểm liệu phân bố gần điểm kì vọng, giá trị kì vọng mơ tả xác điểm trung tâm tập liệu Hình 3.2 Tập liệu có phương sai lớn, các điểm liệu phân bố xa giá trị kì vọng nên dùng trung vị • Trong phân tích tình hình dịch bệnh: phương sai lớn, nên dùng trung vị (Q2 ) để làm (median) để mô tả (đại diện) cho trung tâm tập liệu điểm trung tâm, từ đánh giá xác tình hình dịch bệnh 3.4 Khoảng tứ phân vị Bài tập lớn môn Cấu trúc Rời rạc cho KHMT (CO1007) - Niên khóa 2021-2022 Trang 5/83 Trường Đại Học Bách Khoa Tp.Hồ Chí Minh Khoa Khoa Học & Kỹ Thuật Máy Tính 3.4.1 Định nghĩa Khoảng tứ phân vị tập liệu định nghĩa IQR(D) = Q3 (D) − Q1 (D) 3.5 3.5.1 3.4.2 Khoảng tứ phân vị khoảng chứa 50% giá trị với trung vị tập liệu giá trị trung tâm Outlier Định nghĩa 3.5.2 Outlier điểm liệu (data point) có khác biệt đáng kể so với liệu khác Outliers kết thay đổi vị trí (trung bình) quy mơ (sự thay đổi) q trình mà ta quan tâm Outliers chứng quần thể mẫu có phân bố khơng bình thường 3.6.1 Ý nghĩa • Đối với thống kê liệu: nhiều tham số thống kê giá trị trung bình, tương quan thống kê dựa giá trị nhạy cảm với giá trị ngoại lệ Vì thước đo độ tin cậy kết thống kê Với IQR khoảng tứ phân vị Outlier giá trị nằm đoạn [Q1 − 1.5 ∗ IQR; Q3 + 1.5 ∗ IQR] 3.6 Ý nghĩa • Đối với phân tích tình hình Covid : Outliers thước đo độ tin cậy giá trị kì vọng dùng để đánh giá tình hình dịch bệnh khu vực định Biểu đồ hộp (Box Plot) Định nghĩa Trong thống kê mô tả, biểu đồ hộp hay biểu đồ hình hộp (box plot) phương pháp để thể đồ thị nhóm liệu số tính theo vùng, độ lan truyền độ lệch thơng qua tứ phân vị chúng Ngồi phần ô biểu đồ, có đường kéo dài từ cho biết thay đổi bên ngồi tứ phân vị thứ thứ ba, boxplot gọi box-and-whisker 3.6.2 Các thành phần Tùy thuộc theo yêu cầu liệu mà thành phần hình dạng biểu đồ hộp khác Nhung nhìn chung có: • Tứ phân vị thứ (Q1 ) • Tứ phân vị thứ ba (Q3 ) • Tứ phân vị tứ hai (Q2 ) - trung vị • Khoảng tứ phân vị (IQR) • Outlier: Có thể loại bỏ thấy cần thiết • Giá trị lớn (Max) giá trị nhỏ (Min) Hình 3.3 Các thành phần tạo nên biểu đồ hộp • Ngồi cịn có: giá trị kì vọng, Bài tập lớn môn Cấu trúc Rời rạc cho KHMT (CO1007) - Niên khóa 2021-2022 Trang 6/83 Trường Đại Học Bách Khoa Tp.Hồ Chí Minh Khoa Khoa Học & Kỹ Thuật Máy Tính 3.6.3 Ý nghĩa - Cấu tạo đơn giản, cho phép nhà thống kê thực kiểm tra đồ họa nhanh chóng nhiều tập liệu - Dùng để so sánh với hàm mật độ xác suất (biểu đồ lý thuyết) cho phân phối N(0, σ ) chuẩn quan sát trực tiếp đặc điểm chúng - Giá trị kì vọng gần trung vị (Q2 ) đại diện tốt cho trung tâm tập liệu, phương sai tập liệu nhỏ ngược lại - Trung vị (Q2 ) lệch phía tập giá trị tập giá trị có số lần xuất lớn tập liệu mẫu 3.7 3.7.1 Hình 3.4 Biểu đồ hộp hàm mật độ xác suất phân phối N(0, σ ) Tần số tích lũy - Biểu đồ tích lũy Định nghĩa Trong thống kê, tần số khoảng lớp thứ thêm vào tần số lớp thứ hai, tổng thêm vào lớp thứ ba thế, tần số thu theo cách gọi tần số tích lũy Một bảng hiển thị tần số tích lũy phân phối lớp khác gọi bảng phân phối tần số tích lũy bảng tần suất tích lũy Biểu đồ tần số tích lũy (cumulative frequency plots) biểu thị thơng tin dạng tích lũy Nó thể số lượng hay tỉ lệ quan sát nhỏ giá trị cụ thể 3.7.2 Thiết lập bảng tần số tích lũy - Bước : Tính tốn thiết lập bảng tần số thông thường; - Bước : Phân hoạch độ dài khoảng giá trị tần số thành khoảng cho phù hợp; - Bước : Tìm số lượng tần số cho khoảng; - Bước : Tính tốn tần số tích lũy bằn cách cộng dồn số lượng tần số tần số - Bước : Từ bảng tần số vẽ biểu đồ tần số tích lũy 3.7.3 Ý nghĩa - Tần suất tích lũy sử dụng để biết số lượng quan sát nằm (hoặc thấp hơn) tần số cụ thể tập liệu định - Các cột biểu đồ ít, chiều cao cột gần số lượng quan sát gần Bài tập lớn môn Cấu trúc Rời rạc cho KHMT (CO1007) - Niên khóa 2021-2022 Trang 7/83 Trường Đại Học Bách Khoa Tp.Hồ Chí Minh Khoa Khoa Học & Kỹ Thuật Máy Tính Hình 3.5 Biểu đồ tần số bình thường 3.8 3.8.1 Hình 3.6 Biểu đồ tần số tích lũy tương ứng Đường trung bình động Định nghĩa Trong thống kê, đường trung bình động phép tính sử dụng để phân tích điểm liệu cách tạo loạt giá trị trung bình tập khác tập liệu đầy đủ 3.8.2 Tính tốn giá trị trung bình động đơn giản Giá trị trung bình động đơn giản (SMD) giá trị trung bình khơng trọng số k liệu trước Hình 3.7 Ứng dụng đường trung bình động việc làm "mịn" liệu dự đoán biến động i=n pi SM Dk = i=n−k+1 k (4) 3.8.3 Đặc điểm: với k nhỏ độ nhạy đường trung bình MA cao phụ thuộc vào liệu, khó làm mịn đường biểu đồ khó dự đốn chiều biến thiên Ý nghĩa • Làm "mịn" biểu đồ đường, làm phẳng biến động ngắn hạn,lọc nhiễu số liệu; • Xác định xu hướng liệu thời gian dài hạn; • Dữ đoán số lượng nhỏ số liệu bị khơng báo cáo thường xun • Trong việc phân tích tình hình dịch Covid: Đưa liệu số ca nhiễm/ tử vong gần với giá trị xác dai sai sót nhập liệu khơng báo cáo thường xun, dự đốn tình hình phát triển dịch bệnh thời gian tới Bài tập lớn môn Cấu trúc Rời rạc cho KHMT (CO1007) - Niên khóa 2021-2022 Trang 8/83 Trường Đại Học Bách Khoa Tp.Hồ Chí Minh Khoa Khoa Học & Kỹ Thuật Máy Tính 3.9 3.9.1 Hệ số tương quan Hệ số tương quan Pearson Hệ số tương quan Pearson (Pearson correlation coefficient, kí hiệu r ) đo lường mức độ tương quan tuyến tính hai biến Về nguyên tắc, tương quan Pearson tìm đường thẳng phù hợp với mối quan hệ tuyến tính biến Xét tập điểm giá trị P chứa n điểm (xi , yi ), hệ số tương quan Pearson tính bằng: n (xi − x ¯)(yi − y¯) rxy = i=1 n n (xi − x ¯ )2 i=1 (yi − y¯)2 i=1 Trong đó, x ¯ y¯ giá trị trung bình tập giá trị xi yi , σx σy độ lệch chuẩn tập giá trị xi yi Hệ số tương quan Pearson (r ) nhận giá trị từ +1 đến -1, cho biết mức độ tương quan hai biến: • Với r = 0, hai biến có khơng có tương quan; r =1 r = -1, hai biến có tương quan chặt chẽ • Với -1 < r < 0, hai biến có mối quan hệ tương quan nghịch, với < r < Hai biến có mối quan hệ tương quan thuận; • Với r tiến gần đến -1, hai biến có mối quan hệ tương quan chặt chẽ Ngược lại, hai biến có mối quan hệ tương quan Hình 3.8 Gía trị hệ số pearson vè tương quan hai biến số tiến gần 3.9.2 Hồi quy tuyến tính, phương pháp bình phương cực tiểu Hồi quy tuyến tính tốn phát biểu sau: Bài toán: Cho tập điểm liệu P gồm phần tử có dạng (xi , yi ) Tìm đường thẳng qua (hoặc gần qua) tất điểm Có nhiều phương pháp để hồi quy tuyến tính: dùng phân tích thành phần (PCA), phương pháp bình phương cực tiểu, Ở mục tìm hiểu phương pháp đơn giản bình phương cực tiểu Giả sử ta có tập liệu P với n điểm liệu mơ hình tuyến tính F(x) = w0 + w1 x • Tại điểm xi ta ký hiệu yˆi = F(xi ) n • Ta xét hàm số L(F) = (ˆ yi − yi )2 làm thước đo độ xác cho mơ hình tuyến tính F i=1 Bài tập lớn môn Cấu trúc Rời rạc cho KHMT (CO1007) - Niên khóa 2021-2022 Trang 9/83 Trường Đại Học Bách Khoa Tp.Hồ Chí Minh Khoa Khoa Học & Kỹ Thuật Máy Tính Biểu đồ đường tử vong (kết mục viii.2): Năm 2020: Năm 2021: Năm 2022: Nhận xét: - Ta rút nhận xét tương tự số ca nhiễm trung bình ngày gần - Có thể tham khảo số liệu thực tế số ca nhiễm tử vong thời điểm viết báo cáo phần Phụ lục để đối chiếu với nhận xét.) 3) Biểu đồ thể thu thập liệu nhiễm bệnh theo thời gian tháng năm tất quốc giaị theo trung bình ngày gần Thực vẽ biểu đồ hàm plot.line () liệu danh sách SUM.LAST.MONTH.DATA thể thu thập nhiễm bệnh theo ngày gần ma_new_cases cho hai tháng cuối tất quốc gia print ( SUM LAST MONTH DATA % >% lapply ( plot line , x = ' day ' , y = ' ma _ new _ cases ' , group = ' month ') ) Biểu đồ đường nhiễm bệnh: Năm 2020: Năm 2021: Nhận xét: Đường trung bình ngày gần hai tháng cuối năm cho ta dự đoán số ca nhiễm đầu năm sau: năm 2020, vào ngày cuối tháng 12 (đường màu xanh), số ca nhiễm có xu hướng lên Nên số ca nhiễm đầu năm 2021 tăng mạnh Điều tương tự xay cuối năm 2021 - đầu năm 2022 Bài tập lớn môn Cấu trúc Rời rạc cho KHMT (CO1007) - Niên khóa 2021-2022 Trang 69/83 Trường Đại Học Bách Khoa Tp.Hồ Chí Minh Khoa Khoa Học & Kỹ Thuật Máy Tính 4) Biểu đồ thể thu thập liệu tử vong theo thời gian tháng năm tất quốc gia theo trung bình ngày gần Thực vẽ biểu đồ đường plot.line () liệu danh sách SUM.LAST.MONTH.DATA thể thu thập tử vong theo ngày gần ma_new_deaths cho hai tháng cuối tất quốc gia print ( SUM LAST MONTH DATA % >% lapply ( plot line , x = ' day ' ,y = ' new _ deaths ' , group = ' month ') ) Biểu đồ đường tử vong: Năm 2020: Năm 2021: Nhận xét: Ta rút nhận xét tương tự số ca tử vong số ca nhiễm mơi Tuy nhiên, vào hai tháng cuối năm 2021, số ca tử vong có xu hướng xướng, dự báo số ca tử vong đầu năm 2022 giảm Có thể kiểm chứng nhận xét dựa vào liệu cuối phần Phụ lục 5) Biểu đồ thể thu thập liệu nhiễm bệnh tích lũy theo thời gian tháng cuối năm tất quốc gia theo trung bình ngày gần Thực vẽ biểu đồ đường nhiễm bệnh tích lũy theo ngày gần ma_new_cases cumsum.rel.line() liệu danh sách SUM.LAST.MONTH.DATA cho hai tháng cuối tất quốc gia print ( SUM LAST MONTH DATA % >% lapply ( cumsum line , x = ' day ' ,y = ' ma _ new _ cases ' , group = ' month ') ) Biểu đồ nhiễm bệnh tích lũy năm 2020: Biểu đồ nhiễm bệnh tích lũy năm 2021: 6) Biểu đồ thể thu thập liệu tử vong tích lũy theo thời gian tháng cuối năm tất quốc gia theo trung bình ngày gần Thực vẽ biểu đồ đường tử vong tích lũy theo ngày gần ma_new_deaths cumsum.rel.line() liệu danh sách SUM.LAST.MONTH.DATA cho hai tháng cuối tất quốc gia print ( SUM LAST MONTH DATA % >% lapply ( cumsum line , x = ' day ' ,y = ' ma _ new _ deaths ' , group = ' month ') ) Bài tập lớn môn Cấu trúc Rời rạc cho KHMT (CO1007) - Niên khóa 2021-2022 Trang 70/83 Trường Đại Học Bách Khoa Tp.Hồ Chí Minh Khoa Khoa Học & Kỹ Thuật Máy Tính Biểu đồ tử vong tích lũy năm 2020: Biểu đồ tử vong tích lũy năm 2021: ix) Nhóm câu hỏi liên quan đến tương quan nhiễm bệnh tử vong 1) Vẽ biểu đồ thể phần trăm nhiễm bệnh tích lũy tổng nhiễm bệnh phần trăm tử vong tích lũy tổng số tử vong cho quốc gia theo thời gian Vẽ đường biểu đồ • Xây dựng hàm vẽ biểu đồ : cumsum.rel.line.2(data, x, y1, y2): Vẽ biểu đồ đường tích lũy tương hai thuộc tính Hàm xây dựng dựa cusum.line() xây dựng mục vi cumsum rel line