Bản đồ tổng số người tử vong theo tiểu bang: Sử dụng file data từ trang Kaggle có tên “COVID- 19 in India”, file này bao gồm chín trường, nghĩa là có chín cột và 3063 hàng, bao gồm ngày,
Trang 1BỘ GIÁO DỤC & ĐÀO TẠO NGÂN HÀNG NHÀ NƯỚC VIỆT NAM
TRƯỜNG ĐẠI HỌC NGÂN HÀNG TP HỒ CHÍ MINH
NGÀNH HỆ THỐNG THÔNG TIN QUẢN LÝ
- -
BÀI BÁO CÁO
MÔN TRỰC QUAN HÓA DỮ LIỆU
Chủ đề: SỬ DỤNG CÔNG CỤ TABLUEAU TRỰC QUAN HÓA DỮ LIỆU VỀ
TỔNG QUAN TÌNH HÌNH COVID-19 CỦA ẤN ĐỘ
Giảng viên hướng dẫn: Lê Quang thái Lớp học phần: DAT713_231_1_D01 Nhóm: 04
Trang 2Bảng thành viên nhóm 3
Trang 3PHẦN I/ GIỚI THIỆU VỀ PHẦN MỀM TABLUEAU VÀ CHỦ ĐỀ BÁO CÁO:
1 Khai thác dữ liệu và quản lý dữ liệu là thách thức lớn mà các công ty phải đối mặt trong thế giới hiện đại Sự chuyển đổi từ dữ liệu thành thông tin trong quy trình kinh doanh giúp đạt được các mục tiêu của doanh nghiệp Tổ chức
và phân loại là những trở ngại lớn trong quy trình kinh doanh Sự ra đời của các phần mềm trực quan dữ liệu giúp vượt qua những trở ngại này, trong đó
có một phần mềm khá nổi tiếng và rất hữu ích trong lĩnh vực này chính là Tablueau
Tablueau là phần mềm hỗ trợ phân tích và trực quan hóa dữ liệu Tablueau giúp tổng hợp dữ liệu này từ các dãy số thành những hình ảnh, biểu đồ trực quan, xây dựng các dasboard và các phân tích
Trang 4
2 Áp dụng từ phần mềm Tablueau, nhóm chúng em đã thực hiện trực quan hóa tình hình COVID 19 của Ấn Độ Covid 19 diễn ra trong một thời gian dài và hiện tại vẫn còn tiếp diễn, đặc biệt bùng nổ ở giai đoạn những năm
2020-2021 Tablueau sẽ giúp chúng ta có cái nhìn tổng quan và bao quát về toàn cảnh tình hình Covid 19 của nước Ấn thông qua những biểu đồ đã được nhóm chúng em trực quan từ các file data
Trang 5PHẦN II/ NỘI DUNG
1 Bản đồ tổng số người tử vong theo tiểu bang:
Sử dụng file data từ trang Kaggle có tên “COVID- 19 in India”, file này bao gồm chín trường, nghĩa là có chín cột và 3063 hàng, bao gồm ngày, thời gian, tiểu bang… Nhờ việc chọn trạng thái dữ liệu là địa lý và trộn data về hình ảnh từ một file csv khác mang tên “India_state_boundary.shp”, tablueau đã trực quan những data đó thành một biểu đồ có dạng là bản đồ như trên Nhìn vào bản đồ trên ta có thể thấy rõ từng tiểu bang của Ấn Độ, và số lượng các ca tử vong cũng được biểu hiện theo những mức độ khác nhau thông qua màu sắc, cụ thể màu nổi bật nhất ở đây là màu đỏ thuộc về tiểu bang Maharashtra- nơi có số lượng người tử vong cao nhất nước Ấn (1,764,769 ca) Các tiểu bang nào có màu nhạt hơn thì tiểu bang đó
có số ca tử vong thấp hơn
Trang 62 Số ca nhiễm covid theo tiểu bang
Ở dữ liệu này, chúng em đã chọn dạng biểu đồ nhiều đường, dễ dàng thể hiện rõ sự chênh lệch về tổng số ca nhiễm của các tiểu bang, đồng thời cũng giúp chúng ta thấy rõ mức độ nguy hiểm của đại dịch Covid đã diễn ra như thể nào trong suốt năm 2020 Cũng từ file data “Covid 19 InIndia”, chúng em xây dựng biểu đồ bằng cách thêm trường thời gian vào cột và các trường như tử vong, bảo mật và xác nhận được xếp vào một hàng Kếp hợp với việc sử dụng trục kép - nó sẽ cung cấp cho ta hai hàng trong cùng một biểu đồ Từ đó chúng ta có được một biểu đồ dạng nhiều đường cho thấy rõ số ca nhiễm covid theo tiêu bang của Ấn Độ Theo đó, đường màu xanh ngọc biểu thị cho số ca dương tính Trong đó số ca dương tính xuất hiện đầu tiên vào ngày 3/2/2020 với con số là 3 ca và đỉnh điểm cao nhất là vào ngày 22/9/2020 (5.562.663 ca) Tương tự như vậy, đường màu cam dùng để biểu thị cho số ca đã tử vong, màu xanh dương biểu thị cho số ca đã được chữa khỏi Thông qua biểu đồ ta có thể thấy, cả ba trường hợp dương tính, tử vong và được chữa khỏi đều có xu hướng tăng dần vào cuối năm 2020, điều này cho thấy
Trang 7mức độ lây nhiễm rất nhanh và nguy hiểm của đại dịch này, cũng như khả năng chữa trị và ngăn chặn đại dịch ngày càng có hiệu quả của con người nói chung, các tiểu bang ở Ấn Độ nói riêng
Ngoài ra, ta còn có thể thấy được tình hình các số ca nhiễm covid-19 của mỗi tiểu bang khác nhau bằng việc sử dụng bộ lọc bên cạnh, qua đó, ta có thể dễ dàng thấy
sự tương quan số ca bệnh của những khu vực khác nhau để đưa ra các biện pháp giải quyết kịp thời
3 Số người được tiêm vacxin
Vì ở đây, chúng ta chỉ cần mô tả được số liều vacxin đã được tiêm chủng ở tiểu bang của Ấn, tiêu biểu là liều đầu tiên và liều thứ hai, nên chúng em dùng biểu đồ thanh ngang Biểu đồ dạng này vừa dễ hiểu, vừa dễ dàng cho chúng ta trong việc
so sánh số lượng liều vacxin đã được tiêm trong hai lần Ở biểu đồ này, chúng em
sử dụng file data có tên “covid_vaccine_statewise” để trực quan hóa Nhìn trên biểu đồ chúng ta có thể thấy sự chênh lệch giữa số lượng mũi vacxin đầu tiên được tiêm và mũi thứ hai là rất lớn, xấp xĩ hơn 43 triệu Từ đây có thể thấy tỷ lệ số
Trang 8người tiêm chủng đủ cả hai mũi với số người tiêm mũi thứ nhất và thứ hai là rất thấp, qua đó ta có thể biết them về tình hình miễn dịch trong cộng đồng của quốc gia này là rất thấp và tiến độ hoàn thành việc tiêm vacxin của quốc gia này là chưa thật sự hiệu quả
4 Thông tin về các loại vacxin được sử dụng:
Ở thông tin này chúng em tiếp tục sử dụng dạng biểu đồ thanh ngang, vì số lượng data hiển thị ít, cùng với việc dễ dàng biểu hiện sự chênh lệch giữa các dữ liệu với nhau Cụ thể ở đây có 3 loại vacxin được tiêm phổ biến là Covishield, covaxin và sputnik V Từ số liệu của file “covid_vaccine_statewise”, trực quan các cột data Covishield, covaxin, sputnik trong tablueau để có được biểu đồ dạng thanh ngang
Trang 9như trên Nhìn vào biểu đồ giúp chúng ta thấy rõ vacxin covishield là vacxin đạt số lượng tiêm chủng cao nhất trong ba loại, tiếp đó là covaxin và cuối cùng là sputnik V
Theo như nhóm chúng em tìm hiểu thì có một số lý do để vacxin covishield được tiêm chủng nhiều nhất ở các quốc gia Nam Á, bao gồm Ấn Độ đó là:
Sản xuất: Vaccine COVID Shield được sản xuất bởi công ty Bharat Biotech International Limited, một công ty dược phẩm của Ấn Độ Điều này giúp giảm chi phí và thời gian vận chuyển vaccin, khiến nó trở nên dễ tiếp cận hơn với nhiều người ở các quốc gia Nam Á
Vaccin có hiệu quả cao: Vaccin COVID Shield đã được chứng minh có hiệu quả trong việc ngăn ngừa bệnh nặng và tử vong do Covid-19 Trong một nghiên cứu lâm sàn, vaccin đã được chứng minh là có hiệu quả 78% trong việc ngăn ngừa nhập viện ở những người trưởng thành có nguy cơ cao
Vaccine được chấp thuân bởi WHO Tổ chức Y tế Thế giới (WHO) đã cấp phép sử dụng khẩn cấp cho vaccine COVID Shield Điều này đã giúp tang
uy tín của vaccin và khuyến khích nhiều người tiêm chủng
Với hiệu quả cao và khả năng tiếp cận rộng rãi, vaccin COVID Shield đã đóng một vai trò quan trọng trong việc bảo vệ người dân Ấn Độ khỏi COVID-19
Trang 105 Phân Loại Số Ca Nhiễm Theo Nhóm Tuổi.
Sử dụng file data “AgeGroupDetails” bao gồm 4 trường “nhóm tuổi, tổng số
ca, tỷ lệ phần trăm” để trực quan hóa biểu đồ thể hiện số ca nhiễm bệnh theo nhóm tuổi Theo như quan sát ta có thể thấy độ tuổi có số ca nhiễm chiếm tỷ
lệ cao nhất là từ 20-29 tuổi chiếm 24,86% được biểu hiện qua thang màu đỏ Tiếp đến là nhóm tuổi từ 30-39 tuổi, 40-49 tuổi…Tổng quát lên, tỷ lệ người nhiễm bệnh rơi vào độ tuổi thanh niên và giảm dần theo sự tăng lên của số tuổi Chính nhờ cách ghép trục kép giữa số nhóm tuổi và tỷ lệ phần trăm đã cho chúng ta cái nhìn tổng quan về số ca nhiễm theo nhóm, từ đó giúp việc phòng tránh và điều trị diễn ra hiệu quả hơn
Trang 116 Số ca nhiễm theo giới tính:
Tương tự như việc trực quan số ca nhiễm theo nhóm tuổi, ta sử dụng data trực quan biểu đồ thành dạng hình tròn để thể hiện tỷ lệ phần trăm số ca nhiễm theo từng giới tính Ở đây chúng ta sử dụng F viết tắt cho Female là giới tính nữ để mô tả tỷ lệ ca nhiễm bệnh của nữ giới ở nước Ấn Độ, tương
tự M viết tắt cho Male là giới tính nam dùng để mô tả tỷ lệ ca nhiễm bệnh của nam giới Ở đây, tỷ lệ nam giới nhiễm bệnh chiếm hơn 50% tổng doanh
số của đất nước và gần gấp 2 tỷ lệ nữ giới nhiễm bệnh Điều này được giải thích là do nam giới thường có thói quen hút thuốc lá, uống rượu bia và làm các việc nặng nhọc, khiến họ có nguy cơ mắc bệnh cao hơn Thông qua biểu
đồ so sánh này chúng ta có thể đưa ra các biện pháp phòng ngừa và điều trị phù hợp, góp phần bảo vệ sức khỏe của cộng đồng
Trang 127 Số phòng ICRM theo từng tiểu bang
ICMR là các phòng thí nghiệm được thành lập ở mỗi tiểu bang để kiểm tra COVID 19 Ở đây chúng ta sử dụng biểu đồ dạng thanh ngang để thể hiện và
so sánh số lượng phòng ICRM được thành lập ở các tiểu bang của nước Ấn Trong đó tiểu bang Maharashtra có số lượng phòng ICMR nhiều nhất – đây cũng là tiểu bang có tổng số ca nhiễm bệnh nhiều nhất của Ấn Độ Thông qua biểu đồ này có thể phản ánh mức độ quan tâm và sự chú trọng của chính phủ và cộng đồng đối với vấn đề y tế của tiểu bang này Sự phân bố đồng đều của các phòng ICMR cũng cho thấy một nỗ lực hợp tác giữa các tiểu bang để đảm bảo nghiên cứu y tế và xử lý dịch bệnh hiệu quả
Trang 138 Thông tin kiểm tra Covid-19 theo Từng Tiểu Bang
Tương tự như biểu đồ số phòng ICMR ở từng tiểu bang, chúng ta dùng biểu
đồ thanh ngang thể hiện mức độ kiểm tra covid 19 của từng tiểu bang ở Ấn
Độ Trục ngang thể hiện cho tổng số mẫu được kiểm tra, kết hợp với trục dọc là tên các tiểu bang ở Ấn Độ Qua biểu đồ dưới đây, chúng ta có thể thấy rằng tiểu bang Uttar Pradesh có số lượng mẫu xét nghiệm lớn nhất, vượt trội
so với các tiểu bang khác Đều này có thể cho thấy tiểu bang Karnataka đã đưa ra nỗ lực lớn trong việc xét nghiệm COVID-19 nhằm xác định đối tượng nhiễm bệnh một cách chính xác và đáng tin cậy Tiểu bang này có thể đã triển khai các chiến dịch xét nghiệm rộng rãi và tăng cường cơ sở hạ tầng xét nghiệm Số lượng mẫu âm tính và mẫu dương tính nên được kiểm tra để xem xét sự phổ biến của vi rút trong cộng đồng, hiệu quả của biện pháp kiểm soát và tình trạng lây nhiễm trong khu vực
Trang 14Đều này có thể cho thấy tiểu bang Uttar Pradesh đã đưa ra nỗ lực lớn trong việc xét nghiệm COVID-19 nhằm xác định đối tượng nhiễm bệnh một cách chính xác và đáng tin cậy Tiểu bang này có thể đã triển khai các chiến dịch xét nghiệm rộng rãi và tăng cường cơ sở hạ tầng xét nghiệm Số lượng mẫu
âm tính và mẫu dương tính nên được kiểm tra để xem xét sự phổ biến của vi rút trong cộng đồng, hiệu quả của biện pháp kiểm soát và tình trạng lây nhiễm trong khu vực
Bên cạnh đó, biểu đồ thanh ngang cũng cung cấp cái nhìn tổng quan về tình hình xét nghiệm của các tiểu bang khác Chúng ta có thể so sánh số lượng mẫu xét nghiệm giữa các tiểu bang và nhìn thấy sự đa dạng trong quy mô hoạt động xét nghiệm ở các khu vực khác nhau Điều này có thể phản ánh khả năng xét nghiệm và quy mô cơ sở hạ tầng y tế của từng tiểu bang
PHẦN 3 KẾT LUẬN
Trang 15Sử dụng Tableau trong việc trực quan hóa dữ liệu không chỉ đơn giản là biểu hiện thông tin một cách trực quan mà còn mang lại nhiều lợi ích cho việc phân tích và đưa ra quyết định
Tableau cung cấp một giao diện dễ sử dụng và linh hoạt, cho phép người dùng tạo
ra các biểu đồ, bản đồ và các loại trực quan khác nhau dựa trên dữ liệu số liệu cho trước Bằng cách kéo và thả, lọc dữ liệu và tạo các tính năng tương tác, Tableau giúp người dùng không chỉ đưa ra những thông tin phân tích một cách nhanh chóng mà còn tạo ra các hiểu biết sâu sắc về dữ liệu
Tầm quan trọng của Tableau nằm ở việc nó giúp truyền tải thông tin một cách rõ ràng và dễ hiểu cho mọi người Bằng cách sử dụng màu sắc, biểu đồ và hiệu ứng tương tác, Tableau tạo ra một trải nghiệm trực quan đáng chú ý, giúp người dùng tiếp cận dữ liệu và hiểu rõ hơn về các mẫu, xu hướng và liên hệ giữa các yếu tố Điều này rất hữu ích cho việc đưa ra các quyết định và giải pháp dựa trên dữ liệu Ngoài ra, Tableau cũng cung cấp khả năng chia sẻ báo cáo và trực quan hóa dữ liệu trực tuyến Người dùng có thể tạo và chia sẻ các bảng điều khiển trực quan với đồng nghiệp hoặc khách hàng, giúp mọi người thấy rõ và hiểu dữ liệu một cách dễ dàng
Tóm lại, Tableau có vai trò quan trọng trong việc trực quan hóa dữ liệu và mang lại nhiều lợi ích cho phân tích dữ liệu, đưa ra quyết định và chia sẻ thông tin Với khả năng linh hoạt, trực quan và dễ sử dụng, Tableau là công cụ mạnh mẽ để thể hiện
và đưa ra hiểu biết từ dữ liệu, đồng thời giúp tạo ra sự kết nối và giao tiếp hiệu quả trong cộng đồng người dùng