1. Trang chủ
  2. » Giáo Dục - Đào Tạo

Báo cáo bài tập lớn học phần kho dữ liệu (2) Đề tài phân tích tai nạn giao thông (accident us)

202 2 0
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Phân tích tai nạn giao thông (Accident US)
Tác giả Võ Đức Tuân, Doãn Bá Lực, Doãn Bá Min
Người hướng dẫn ThS. Trần Thanh Liêm
Trường học Trường Đại học Công nghệ Thông tin và Truyền thông Việt – Hàn
Chuyên ngành Khoa học máy tính
Thể loại Bài tập lớn
Năm xuất bản 2024
Thành phố Đà Nẵng
Định dạng
Số trang 202
Dung lượng 13,7 MB

Cấu trúc

  • I. TỔNG QUAN ĐỀ TÀ (7)
    • 1. Giới thiệu đề tài (7)
      • 1.1. Lý do chọn đề tài (7)
      • 1.2. Nội dung đề tài (7)
      • 1.3. Mô tả dữ liệu gốc (9)
      • 1.4. Giới thiệu công cụ sử dụng trong đồ án (13)
    • 2. Xử lý dữ liệu (15)
      • 2.1. Quá trình xử lý (15)
      • 2.2. Dữ liệu sau khi xử lí (19)
    • 3. Thiết kế kho dữ liệu (21)
      • 3.1. Lược đồ hình bông tuyết (snowflake schema) (21)
      • 3.2. Bảng FACT (21)
      • 3.3. Bảng DIM (22)
  • II. XÂY DỰNG KHO DỮ LIỆU (SSIS) (27)
    • 1. Mô tả chủ đề (27)
    • 2. Quá trình SSIS (27)
      • 2.1. Đổ dữ liệu từ file csv vào extenal source (27)
      • 2.2. Đổ dữ liệu từ extenal source vào stage (34)
      • 2.3. Quá trình đổ stage vào DWH (58)
  • III. PHÂN TÍCH KHO DỮ LIỆU (SSAS) (81)
    • 1. Tạo project SSAS (81)
    • 2. Tạo Data Source (81)
    • 3. Tạo Data Source View (83)
    • 4. Tạo Cube (85)
    • 5. Chỉnh sửa các bảng DIM (88)
    • 6. Chạy tiến trình để Deployment (90)
    • 7. Thực hiện các câu truy vấn sử dụng SSAS (91)
    • 8. Sử dụng Power BI để trực quan hóa dữ liệu (97)
  • IV. KẾT LUẬN (101)
    • 1. Kết quả đạt được (101)
    • 2. Những hạn chế (101)
    • 3. Bảng phân công nhiệm vụ (101)

Nội dung

và thay thế phương tiện và nhiều chi phí khác, đều ảnh hưởng đến tài chính cá nhân vàcủa quốc gia.Phân tích dữ liệu tai nạn giao thông cũng có thể cung cấp thông tin giá trị cho cácnhà l

TỔNG QUAN ĐỀ TÀ

Giới thiệu đề tài

1.1 Lý do chọn đề tài

Ngày nay xã hội phát triển thì nhu cầu về cơ sở vật chất của con người ngày càng tăng Đối với chuyện đi lại cũng thế, ngày nay nhu cầu đi lại ngày càng nhiều Chính vì thế mà tình trạng gia thông ngày nay khá phức tạp, nó là vấn đề nghiêm trọng ảnh hưởng đến sức khỏe và tính mạng của cá nhân Việc phân tích dữ liệu tai nạn giao thông có thể giúp chúng ta hiểu rõ hơn về tình hình tai nạn giao thông hiện tại, từ đó đề xuất các giải pháp cải thiện để giảm thiểu số vụ tai nạn và giảm thiểu tổn thất con người và tài sản. Tai nạn giao thông cũng ảnh hưởng đến kinh tế và tài chính của các quốc gia Các chi phí liên quan đến tai nạn giao thông, bao gồm chi phí y tế, bảo hiểm, chi phí sửa chữa và thay thế phương tiện và nhiều chi phí khác, đều ảnh hưởng đến tài chính cá nhân và của quốc gia.

Phân tích dữ liệu tai nạn giao thông cũng có thể cung cấp thông tin giá trị cho các nhà lãnh đạo và quyết định chính sách Dữ liệu có thể giúp các nhà quản lý địa phương và quốc gia hiểu rõ hơn về các nguyên nhân và mô hình tai nạn giao thông, từ đó đưa ra quyết định chính sách phù hợp để giảm thiểu số vụ tai nạn.

Cuối cùng, phân tích dữ liệu tai nạn giao thông cũng có thể giúp đưa ra các giải pháp và công nghệ mới để giảm thiểu số vụ tai nạn và tăng cường an toàn giao thông Các công nghệ như xe tự lái, các hệ thống cảnh báo động, v.v đều có thể được phát triển dựa trên dữ liệu tai nạn giao thông và các thông tin liên quan đến an toàn giao thông.

Nhóm chúng em sử dụng 2 tập dữ liệu để thực hiện

Một bộ dữ liệu mô tả về tai nạn xe hơi trên toàn quốc , bao gồm 49 tiểu bang của Hoa Kỳ được lấy trên trang web www.kaggle.com Tập dữ liệu US_Accidents (2016-

2021) là một tập dữ liệu lớn về các tai nạn giao thông xảy ra trên đường cao tốc và đường phố tại Hoa Kỳ Tập dữ liệu này bao gồm hơn 4 triệu bản ghi về các tai nạn giao thông

7 trên toàn quốc từ năm 2016 đến năm 2021, được thu thập từ nhiều nguồn khác nhau, bao gồm các cảnh sát, trạm thu phí, báo cáo của người dùng, và các nguồn thông tin khác. Mỗi bản ghi trong tập dữ liệu này chứa thông tin chi tiết về các tai nạn giao thông, bao gồm địa điểm, thời gian, điều kiện thời tiết, tình trạng đường, loại xe, số lượng và tính chất của các phương tiện tham gia, và mức độ nghiêm trọng của các thương vong Tập dữ liệu này cũng cung cấp thông tin về địa lý, bao gồm vị trí địa lý của các tai nạn, cũng như các thông tin về địa lý khác như tên tiểu bang, thành phố, mã bưu chính, v.v.

Link Dataset: https://www.kaggle.com/datasets/sobhanmoosavi/us-accidents

Bộ dữ liệu thứ hai chi tiết về tai nạn đường bộ và các phương tiện liên quan ở Vương quốc Anh (2005-2017).

Dataset này gồm 1488981 dòng và có 24 thuộc tính.

Link Dataset: https://www.kaggle.com/datasets/tsiaras/uk-road-safety-accidents- and-vehicles?select=Vehicle_Information.csv

1.3 Mô tả dữ liệu gốc

Tập dữ liệu Accident.csv

STT Tên thuộc tính Ý nghĩa

1 ID ID duy nhất của tai nạn giao thông.

2 Severity Mức độ nghiêm trọng của tai nạn, được đánh giá từ 1 đến 4, với 1 là mức độ nghiêm trọng thấp nhất và 4 là mức độ nghiêm trọng cao nhất.

3 Start_Time Thời gian bắt đầu của tai nạn.

4 End_Time Thời gian kết thúc của tai nạn.

5 Start_Lat Vĩ độ của vị trí bắt đầu của tai nạn.

6 Start_Lng Kinh độ của vị trí bắt đầu của tai nạn.

7 End_Lat Vĩ độ của vị trí kết thúc của tai nạn.

8 End_Lng Kinh độ của vị trí kết thúc của tai nạn.

9 Distance(mi) Khoảng cách của tai nạn tính bằng dặm.

10 Description Mô tả về vụ tai nạn.

11 Number Số nhà gần vị trí tai nạn.

12 Street Tên đường gần vị trí tai nạn.

13 Side Vị trí của tai nạn trên đường (trái, phải hoặc giữa).

14 City Tên thành phố gần vị trí tai nạn.

15 County Tên quận gần vị trí tai nạn.

16 State Tên tiểu bang gần vị trí tai nạn.

17 Zipcode Mã bưu chính gần vị trí tai nạn.

19 Timezone Múi giờ địa phương của vị trí tai nạn.

20 Airport_Code Mã sân bay gần vị trí tai nạn.

21 Weather_Timestamp Thời gian thu thập thông tin thời tiết.

22 Temperature(F) Nhiệt độ tính bằng độ Fahrenheit.

23 Wind_Chill(F) Nhiệt độ gió tính bằng độ Fahrenheit.

24 Humidity(%) Độ ẩm tính bằng phần trăm.

25 Pressure(in) Áp suất khí quyển tính bằng inches.

26 Visibility(mi) Tầm nhìn tính bằng dặm.

28 Wind_Speed(mph) Tốc độ gió tính bằng dặm/giờ.

29 Precipitation(in) Lượng mưa tính bằng inches.

30 Weather_Condition Điều kiện thời tiết.

31 Amenity Có đối tượng tiện ích (như cây cối, đèn đường, cây cầu ) đang gây cản trở trên đường không.

32 Bump Có chướng ngại vật trên đường không.

33 Crossing Có đường giao nhau không.

34 Give_Way Có phải đường ưu tiên hay không.

35 Junction Có đường giao nhau không.

36 No_Exit Có đường cụt không.

37 Railway Có đường sắt qua đường không.

38 Roundabout Có vòng xuyến không.

39 Station Có trạm xăng, trạm thu phí hay nhà ga trên đường không.

40 Stop Có dấu STOP trên đường không.

41 Traffic_Calming Có biện pháp hạn chế tốc độ trên đường không.

42 Traffic_Signal Có đèn giao thông không.

43 Turning_Loop Có lối rẽ hay không.

44 Sunrise_Sunset Tình trạng ánh sáng mặt trời (mặt trời mọc hoặc mặt trời lặn).

45 Civil_Twilight Tình trạng ánh sáng dân sự (hoàng hôn hoặc bình minh).

46 Nautical_Twilight Tình trạng ánh sáng hàng hải.

47 Astronomical_Twilight Tình trạng ánh sáng thiên văn học.

Tập dữ liệu Vehicle_Information.csv

STT Tên thuộc tính Ý nghĩa

1 Accident_Index Mã định danh duy nhất cho mỗi vụ tai nạn.

2 Age_Band_of_Driver Nhóm tuổi của tài xế.

3 Age_of_Vehicle Tuổi của phương tiện.

4 Driver_Home_Area_Type Loại khu vực sinh sống của tài xế.

5 Driver_IMD_Decile Hạng của tài xế trong chỉ số đa dạng và bình đẳng.

6 Engine_Capacity_.CC Dung tích động cơ của phương tiện.

7 Hit_Object_in_Carriageway Vật thể bị va chạm trên đường.

8 Hit_Object_off_Carriageway Vật thể bị va chạm ngoài đường.

9 Journey_Purpose_of_Driver Mục đích của chuyến đi của tài xế.

10 Junction_Location Vị trí của phương tiện tại điểm giao nhau

13 Propulsion_Code Mã động cơ của phương tiện

14 Sex_of_Driver Giới tính của tài xế.

15 Skidding_and_Overturning Tình trạng trượt hay lật của phương tiện.

16 Towing_and_Articulation Loại phương tiện được kéo hoặc có phần nối khác.

17 Vehicle_Leaving_Carriageway Phương tiện rời khỏi đường.

18 Vehicle_Location.Restricted_Lane Vị trí của phương tiện trên đường, nếu có.

19 Vehicle_Manoeuvre Hành động của phương tiện trước khi xảy ra tai nạn.

20 Vehicle_Reference Mã định danh cho mỗi phương tiện liên quan đến vụ tai nạn.

21 Vehicle_Type Loại phương tiện.

22 Was_Vehicle_Left_Hand_Drive Phương tiện có lái bên trái hay không.

23 X1st_Point_of_Impact Điểm đầu tiên của va chạm.

24 Year Năm xảy ra tai nạn

1.4 Giới thiệu công cụ sử dụng trong đồ án

 Tổng quan về Visual Studio 2019

Visual Studio 2019 là một môi trường phát triển tích hợp (IDE) được phát triển bởi Microsoft Nó cung cấp cho các nhà phát triển một công cụ để phát triển các ứng dụng trên nhiều nền tảng, bao gồm Windows, iOS, Android và các nền tảng web.

Visual Studio 2019 có nhiều tính năng và công cụ hỗ trợ cho việc phát triển phần mềm, bao gồm một trình biên tập mã, trình gỡ lỗi, hỗ trợ cho các ngôn ngữ lập trình khác nhau như C++, C#, Python, JavaScript, TypeScript và nhiều ngôn ngữ khác.

Ngoài ra, Visual Studio 2019 cung cấp các công cụ hỗ trợ cho quản lý mã nguồn, kiểm thử và triển khai ứng dụng Nó cũng hỗ trợ tích hợp với các công cụ quản lý dự án và hệ thống kiểm soát phiên bản, cho phép các nhà phát triển làm việc cùng nhau trên các dự án phức tạp.

Visual Studio 2019 cũng có một cộng đồng rộng lớn với các tài liệu hướng dẫn, các phần mở rộng và các bài đánh giá từ các nhà phát triển khác nhau, giúp các nhà phát triển tìm kiếm giải pháp và trao đổi kinh nghiệm một cách dễ dàng.

Tóm lại, Visual Studio 2019 là một nền tảng phát triển phần mềm đầy đủ tính năng và hỗ trợ nhiều nền tảng, giúp các nhà phát triển phát triển ứng dụng hiệu quả và dễ dàng quản lý các dự án phức tạp.

 Tổng quan về SQL Server 2019

SQL Server 2019 là một hệ quản trị cơ sở dữ liệu quan hệ được phát triển bởi Microsoft Nó cung cấp một nền tảng để lưu trữ, quản lý và truy xuất dữ liệu cho các ứng dụng và hệ thống thông tin doanh nghiệp.

SQL Server 2019 bao gồm nhiều tính năng mới và cải tiến, bao gồm hỗ trợ cho các tính năng AI (trí tuệ nhân tạo) và lưu trữ dữ liệu trên các nền tảng khác nhau, bao gồm Windows, Linux và các môi trường đám mây như Azure và AWS.

Nó cũng cung cấp các công cụ hỗ trợ cho quản lý cơ sở dữ liệu, bao gồm các công cụ quản lý và giám sát hiệu suất, công cụ sao lưu và phục hồi dữ liệu, và công cụ quản lý bảo mật.

SQL Server 2019 cũng cung cấp tính năng tăng cường an ninh, bao gồm mã hóa dữ liệu và cơ chế kiểm soát truy cập để bảo vệ dữ liệu quan trọng của doanh nghiệp.

Xử lý dữ liệu

Tập dữ liệu vehicle.csv

- Xử lí giá trị rỗng Age_Band_of_Driver

- Xử lí giá trị rỗng Age_of_Vehicle

- Xử lí giá trị rỗng Driver_Home_Area_Type

- Xử lí giá trị rỗng Sex_of_Driver

- Xử lí giá trị rỗng Junction_Location

Tập dữ liệu Accident.csv

- Thay thế các ngày có giá trị bị thiếu Ví dụ ngày chính xác “ 3/25/2016 16:36 ” thì ngày trong tập dữ liệu bị thiếu mất “3/25/2016” chỉ còn “16:36” Nhóm sử dụng random để lấy ra ngày bất kì phù hợp với dữ liệu.

- Thêm các cột Road_Surface_Conditions (điều kiện mặt đường), Road_Type (loại đường), Special_Conditions_at_Site (điều kiện ), Speed_limit,

- Thay thế các giá trị bị thiếu bằng phương pháp random với các cột Temperature, Wind_Chill, Humidity, Pressure, Wind_Speed, Precipitation

2.2 Dữ liệu sau khi xử lí

Thiết kế kho dữ liệu

3.1 Lược đồ hình bông tuyết (snowflake schema)

STT Tên thuộc tính Kiểu Ràng buộc

STT Tên thuộc tính Kiểu Ràng buộc

STT Tên thuộc tính Kiểu Ràng buộc

3 Age_Band_of_Driver Varchar

6 Driver_Home_Area_Type Varchar

7 Journey_Purpose_of_Driver Varchar

STT Tên thuộc tính Kiểu Ràng buộc

STT Tên thuộc tính Kiểu Ràng buộc

STT Tên thuộc tính Kiểu Ràng buộc

STT Tên thuộc tính Kiểu Ràng buộc

STT Tên thuộc tính Kiểu Ràng buộc

1 Primary key Int Primary key

STT Tên thuộc tính Kiểu Ràng buộc

STT Tên thuộc tính Kiểu Ràng buộc

10 X1st_Point_of_Impact Varchar

11 Was_Vehicle_Left_Hand_Drive Varchar

STT Tên thuộc tính Kiểu Ràng buộc

STT Tên thuộc tính Kiểu Ràng buộc

XÂY DỰNG KHO DỮ LIỆU (SSIS)

Mô tả chủ đề

Phân tích dữ liệu tai nạn giao thông dựa trên các chiều về địa điểm, thời gian, thời tiết, điều kiện ánh sáng, …

Quá trình SSIS

2.1 Đổ dữ liệu từ file csv vào extenal source

- Chuẩn bị dữ liệu: file Accident.csv và file Vehicle.csv

Sau đó, tạo CSDL ACCIDENT_SOURCE trong SQL Server

Chuột phải vào ACCIDENT_SOURCE Tasks Import Data

Click next, chọn đường dẫn chứa file Accident

Chuyển đổi các kiểu dữ liệu cho các thuộc tính (nếu cần)

Chuyển Destination thành SQL Server Native Client 11.0

Kết quả sau khi Run xong:

Import tương tự đối với file vehicle.csv

Kết quả sau khi Run xong:

2.2 Đổ dữ liệu từ extenal source vào stage

Tạo Project SSIS trong Visual Studio có tên là Final Project, sau đó tạo các kết nối với database

Kết nối đến CSDL ACCIDENT_DW

Tạo packages có tên là SRC_To_Stage để thực hiện đổ dữ liệu từ ACCIDENT_SOURCE vào ACCIDENT_STAGE và tạo control flow như hình:

Trong DF_StageLocation, tạo data flow như sau:

Thực hiện mapping các cột

Trong DF_StageDate tạo data flow như hình:

Trong Derived Column, dùng các function để tạo ra các giá trị cần thiết

Trong Aggregate, group by các giá trị để đảm bảo các giá trị đó là duy nhất

Cấu hình trong sort để hiển thị kết quả theo thứ tự tăng dần, bắt đầu từ DateKey

Trong DF_StageVehicle, tạo data flow như hình:

Trong DF_StageRoad tạo data flow như hình:

Cấu hình Convert chuyển đổi các kiểu dữ liệu cần thiết

Trong DF_StageTwilight, tạo data flow như hình:

Thực hiện Convert các kiểu dữ liệu cần thiết

Trong DF_StageWeather, tạo data flow như hình:

Thực hiện Convert các kiểu dữ liệu cần thiết

Trong DF_StageAccident, tạo data flow như hình:

Thực hiện Convert các kiểu dữ liệu cần thiết

Quá trình load vào Stage

Xem kết quả các bảng trong ACCIDENT_STAGE

2.3 Quá trình đổ stage vào DWH

Tạo SSIS Package có tên là Stage_To_DWH để đổ dữ liệu từ Stage vào DWH

Trong DF_DimDate tạo data flow như hình:

Trong DF_DimLocation tạo data flow như hình

Thực hiện Convert sang kiểu dữ liệu khác

Trong DF_DimTwilight, tạo data flow như hình

Trong DF_SpeedLimit, tạo data flow như hình

Trong DF_DimVehicle, tạo data flow như hình:

Trong DF_DimDriver, tạo data flow như hình:

Trong DF_DimRoadType, tạo data flow như hình:

Trong DF_DimRoadSurfaceConditions, tạo data flow như hình:

Trong DF_DimWeatherConditions, tạo data flow như hình:

Trong DF_DimRoadFeature, tạo data flow như hình

Trong DF_DimWeather, tạo data flow như hình:

Trong DF_FactAccident, tạo data flow như hình, ta thực hiện các Lookup để lấy các key trong các bảng Dim

Thực hiện mapping ID lại với nhau để lấy ra được LocationKey

Tương tự với các key còn lại, tiếp theo ta cấu hình FactAccident

Tại Execute SQL Task thực hiện Truncate để map các khóa trong Fact đến các bảng Dim

Kết quả đổ vào các bảng Dim

Kết quả đổ vào FactAccident

Xem kết quả trong CSDL ACCIDENT_DW

PHÂN TÍCH KHO DỮ LIỆU (SSAS)

Tạo Data Source

Chọn Data Source based on an existing or new connection và chọn data đã đổ ở quá trình SSIS

Chọn Use a specific Windows user name and password Đặt tên cho Data Source

Tạo Data Source View

Chọn Add Related Tables bảng FACT và các bảng DIM

Kết quả sau khi hoàn thành

Tạo Cube

Chọn độ đo cho bảng FACT

Chọn các bảng DIM Đặt tên cho Cube

Kết quả sau khi hoàn thành

Chỉnh sửa các bảng DIM

- DimLocation Chọn các trường Attributes và thuộc tính phân cấp Hierarchy

Chọn các trường Attributes và thuộc tính phân cấp Hierarchy

Chạy tiến trình để Deployment

Kết quả sau khi SSAS project xong

Thực hiện các câu truy vấn sử dụng SSAS

- Câu 1: Thống kê số vụ tai nạn ở nông thôn, thành thị

Ta có thể thấy Urban area (vùng thành thị) có số vụ tai nạn xảy ra nhiều hơn 2 vùng còn lại Nguyên nhân có thể là do số lượng phương tiện ở vùng thành thị nhiều và nhu cầu đi lại cao hơn.

- Câu 2: Top 3 khung giờ xảy ra tai nạn nhiều nhất

3 khung giờ xảy ra tai nạn nhiều nhất là lúc 0 giờ sáng, 4 giờ và 5 giờ chiều Có thể thấy chiều là lúc tan làm, phương tiện đông, lúc chạng vạng làm ảnh hưởng đến người lái xe

- Câu 3: Top 3 khung giờ xảy ra tai nạn ít nhất

Khung giờ xảy ra tai nạn ít nhất là vào lúc 1,2 giờ sáng Thời gian này tuy dễ gây ra tai nạn vì đây là lúc tối dễ gây mất tập trung cho người lái xe Nhưng số lượng phương tiện tham gia giao thông trong khoảng thời gian này là ít.

- Câu 4: Thống kê số người tử vong xảy ra từ năm 2016 – 2020 tại mỗi thành phố cùng điều kiện mặt đường

Nhìn vào bảng thống kê trên, ta có thể thống kê được tổng số lượng người tử vong theo từng thành phố và cùng với từng loại điều kiện mặt đường.

- Câu 5: Thống kê số vụ tai nạn và số người tử vong theo từng quý trong năm

Nhìn vào bảng thống kê trên, ta có thể thống kê được tổng số vụ tai nạn xảy ra và tổng số người tử vong trong từng quý của 1 năm Trong quý 3 năm 2016 có 39491 vụ tai nạn xảy ra ở US và số người tử vong là 54468 người.

- Câu 6: Thống kê số vụ tai nạn theo các hãng xe

Nhìn vào bảng thống kê trên, ta có thể tính được số vụ tai nạn gây ra cho từng loại hãng xe, từ đó ta có thể đánh giá mức độ an toàn đối với 1 loại xe nào đó.

- Câu 7: Thống kê số người tử vong theo 5 tiểu bang (CA, FL, LA, OH, NY) và tháng của năm 2019

Nhìn vào bảng thống kê trên, ta có thể tính được tổng số người tử vong theo từng tiểu bang và chi tiết hơn là từng tháng trong năm 2019.

- Câu 8: Thống kê theo năm, vùng (nông thôn hay thành thị) và 6 điều kiện thời tiết (Drizzle and Fog, Heavy Rain, Heavy Snow, Light Thnderstorms and Rain, Tornado, Volcanic Ash) gây ra số vụ tai nạn giao thông và số người tử vong

Thống kê chi tiết theo từng năm, theo vùng (nông thôn, thành thị) và theo từng loại điều kiện thời tiết (mưa phùn và sương mù, mưa lớn, tuyết, giông và mưa nhẹ, vòi rồng, tro núi lửa) thì gây ra bao nhiêu vụ tai nạn và số người tử vong

- Câu 9: Thống kê số vụ tai nạn từng loại đường ở thành phố và các điều kiện thời tiết

Thống kê số vụ tai nạn ứng với từng loại đường phố và từng loại điều kiện thời tiết khác nhau

- Câu 10: Thống kê số người tử vong, tổng số tai nạn theo năm, tháng, loại đường với tốc độ thuộc 30-70 mi/h

Thống kê số người tử vong, số vụ tai nạn xảy ra theo từng tháng của một năm, ứng với mỗi loại đường và tốc độ cho phép của đoạn đường đó, chỉ lấy ra tốc độ thuộc khoảng 30-70 mi/h.

Sử dụng Power BI để trực quan hóa dữ liệu

Chi tiết về dashboard thể hiện tai nạn theo địa điểm:

- Hiển thị tổng số ca tai nạn xảy ra và tổng số người tử vong tại Hoa Kỳ trong khoảng thời gian từ năm 2016-2023.

- Hiển thị khoảng cách dài nhất (đơn vị mi) mà vụ tai nạn gây ra ảnh hưởng đến phạm vi của khu vực đó (đoạn đường bị tắc nghẽn bởi tai nạn).

- Có 2 bộ lọc liên quan đến nhóm tuổi của người lái xe và năm trong khoảng 2016-2023, từ đó ta có thể chọn ra cụ thể từng nhóm tuổi cũng như từng năm mà ta muốn thống kê.

- Biểu đồ cột đôi thống kê số tai nạn và số người tử vong theo từng tiểu bang cụ thể ở Hoa Kỳ.

- Biểu đồ tròn thể hiện số ca tử vong theo từng khu vực (thành thị, nông thôn).

- Biểu đồ heatmap thể hiện số vụ tai nạn xảy ra theo từng khu vực.

- Bản đồ khu vực thể hiện số ca tai nạn Chấm tròn càng to thì số lượng tai nạn xảy ra càng nhiều.

- Biểu đồ miền thể hiện số vụ tai nạn và số ca tử vong theo từng thành phố.

Chi tiết về dashboard thể hiện tai nạn theo thời gian:

- Thể hiện số vụ tai nạn xảy ra, số ca tử vong và khoảng cách lớn nhất bị ảnh hưởng bởi vụ tai nạn.

- Biểu đồ thể hiện số vụ tai nạn, số ca tử vong theo mục đích di chuyển của người lái xe.

- Các biểu đồ thể hiện số vụ tai nạn và tử vong theo từng năm, theo số ngày trong tuần và chi tiết hơn là từng khung giờ.

- Map thể hiện các vị trí của các bang ở Hoa Kỳ.

Chi tiết về dashboard thể hiện tai nạn theo điều điện liên quan:

- Thể hiện số vụ tai nạn và số ca tử vong theo điều kiện tốc độ giới hạn cho phép.

- Thể hiện số vụ tai nạn theo từng loại điều kiện thời tiết.

- Thể hiện tỉ lệ giới tính gây ra tai nạn theo nam và nữ.

- Thể hiện số tai nạn và tổng số ca tử vong theo từng loại hãng xe.

- Thể hiện số vụ tai nạn theo ngày và đêm.

- Thể hiện số vụ tai nạn và tổng số ca tử vong theo từng loại mặt đường.

- Thể hiện số vụ tai nạn và tổng số ca tử vong theo tín hiệu đèn giao thông.

Chi tiết về dashboard thể hiện tai nạn theo giới tính và độ tuổi:

- Thể hiện số vụ tai nạn và số ca tử vong theo từng độ tuổi

- Thể hiện số vụ tai nạn và số ca tử vong theo tỉ lệ giữa hai giới tính: Nam, Nữ

- Bộ lọc liên quan đến người lái xe theo năm năm trong khoảng 2016-2023, từ đó ta có thể chọn ra cụ thể từng năm mà ta muốn thống kê.

Ngày đăng: 24/11/2024, 19:20

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w