6 3.2: Mô t Accident_data.csv: Degree of crash - detailed hu qu Reporting year năm bo co Year of crash năm xy ra Two-hour intervals gi xy ra Street of crash Đưng Street type l
Tổng quan đ án
Tổng quan đ ti
Giao thông hiện nay đang đối mặt với nhiều vấn đề nghiêm trọng như tắc nghẽn, tai nạn và ô nhiễm môi trường Việc nghiên cứu và tìm ra giải pháp cho những vấn đề này là rất cần thiết để cải thiện tình hình giao thông.
Định hướng chính sách giao thông hiệu quả là rất quan trọng, vì nó cung cấp thông tin và phân tích giúp xây dựng và thực hiện các chính sách này Những chính sách giao thông hợp lý sẽ góp phần vào sự phát triển bền vững của xã hội.
Dự án "Giao lộ không đèn đỏ" gần đây được Bộ Giao thông Vận tải đánh giá cao vì mang lại lợi ích lớn cho xã hội và cải thiện tình hình giao thông Chúng tôi hy vọng thông qua dự án này, sẽ có cơ hội phân tích và tìm kiếm các giải pháp hiệu quả nhằm nâng cao hiệu quả giao thông.
Mc tiêu
• Hiểu r thc trng giao thông: Nắm bắt tnh hnh giao thông hin ti, bao gồm lưu lưng, tn sut n tắc, tai nn giao thông, v cc vn đ khc liên quan
Để cải thiện tình hình giao thông, cần đưa ra các giải pháp hiệu quả như thay đổi cơ sở hạ tầng, áp dụng công nghệ mới và cải tiến quy định giao thông Những biện pháp này sẽ giúp nâng cao an toàn và hiệu quả trong việc di chuyển.
• Phát triển giao thông xanh: Xây dựng cc kế ch v chnh ho sch hỗ giao thông bn vững v thân thin với môi trưtr ng.
Cu trc đ ti
Đ ti: Phân tch dữ u giao thôngli
• Phân tch dữ liệu lung giao thông: Để ti ưu hóa h thng đn giao thông v gim tắc nghẽn giao thông
• Phát triển hệ ng định vị v bn đ thông minh:th Để giúp ngưi li xe di chuyển hiu qu hơn
• Phân tch dữ liệu tai nn giao thông: Để xc định nguyên nhân gây tai nn v pht triển cc bin php phòng ngừa
• Xây dng các mô hình d báo nhu cầu giao thông trong tương lai: Để hỗ tr vic quy hoch h tng giao thông.
Cơ s l thuyt
Các công c liên quan, chc năng v cách thc hot đng
• Chc năng: Python l một ngôn ngữ lp trnh đa năng, dễ hc, dễ đc với cú php rõ rng
• Ứng dng: Đưc sử dụng rộng rãi trong nhiu lnh vực như phân tch dữ u, pht triển web, tr tu nhân to, khoa hc dữ u, v li li tự động hóa
• Chc năng: Excel l một công cụ bng tnh mnh mẽ của
Microsoft, hỗ tr tnh ton, phân tch v trực quan hóa dữ liu
• Ứng dng: Sử dụng để n lý dữ u, to biểu đồ, lp bo co qu li ti chnh, phân tch dữ u v cc nhim vụ liên quan đến xử lý s li liu
• Chc năng: Pandas l một thư vin Python cung cp cc cu trúc dữ u v công cụ phân tch dữ u hiu qu.li li
• Ứng dng: Sử dụng để xử lý dữ u bng tnh, lm sch v biếli n đổi dữ u, phân tch thng kê, v to cc bo co chi tiếli t
• Chc năng: NumPy l một thư vin Python cung cp hỗ tr cho cc mng v ma trn lớn, cng với một bộ cc hm ton hc để thao tc trên cc mng ny
• Ứng dng: Sử dụng trong cc tnh ton khoa hc, phân tch s liu, xử lý tn hiu v hnh nh, v cc ng dụng đòi hi tnh ton hiu sut cao
• Chc năng: SciPy l một thư vin Python xây dựng trên nn tng của NumPy, cung cp cc thut ton v hm ton hc tiên tiến
• Ứng dng: Sử dụng trong cc tnh ton khoa hc, phân tch dữ liu, mô phng, ti ưu hóa, v gii quyết cc bi ton trong khoa hc kỹ thut
• Chc năng: Matplotlib l một thư vin Python dng để to cc đồ thị v hnh nh
• Ứng dng: Sử dụng để trực quan hóa dữ u, to biểu đồli , đồ thị, hnh nh, v cc bo co đồ ha trong phân tch dữ u v khoa li hc dữ liu
• Chc năng: Tkinter l một thư vin Python cung cp cc công cụ để to giao din đồ ha ngưi dng (GUI)
• Ứng dng: Sử dụng để pht triển cc ng dụng desktop với giao din ngưi dng thân thin, bao gồm cc công cụ p liu, hiểnh n thị dữ u, v tương tc ngưi dli
qu thc nghiệm đ ti
Giới thiệu
• Data diễn t giao thông của bang New South Wales, Úc Đưc công b bởi chnh phủ nước Úc v khong thi gian từ 2006 đến
• Với hơn 22000 bộ dữ u đưc ghi nhnli
Mô t
Degree of crash - detailed hu qu
Year of crash năm xy ra
Two-hour intervals gi xy ra
Street of crash Đưng
Street type loi đưng
Route no mã thị trn
School zone location khu vực trưng hc
Type of location loi khu vực
Urbanization đô thị/nông thôn
Road surface mặt đưng
Other traffic control biển bo giao thông
No of traffic units involved s lưng xe tai nn
No killed s lưng tử vong
No seriously injured s lưng bị thương nghiêm trng
No moderately injured s lưng bị thương nặng
No minor-other injured slưng bị thương nhẹ
School_holiday k nghỉ trưng hc
Daily_total tổng xe ghi nhn đưc trong ngy
Các bước thc hiện
3.3.1: Phân tch dữ u luồng giao thông để ti ưu hóa h ng đn li th giao thông v gim tắc nghẽn giao thông
Dataframe gồm 23 dòng mô t s xe trung bnh của từng gi trong ngy
Sử dụng thư vin Matplotlib.pyplot để vẽ biểu đồ plot thể hin data frame
Biểu đồ thể hiện số lượng phương tiện giao thông trung bình theo giờ trong ngày
• Trc honh: Thể hin cc gi trong ngy, từ 00:00 đến 23:00
• Trc tung: Thể hin s lưng phương tin giao thông trung bnh theo gi
• Đường cong: Thể hin s lưng phương tin giao thông trung bnh theo gi
• S lưng phương tin giao thông trung bnh cao nht vo gi cao điểm buổi sng (từ 7:00 đến 9:00) v buổi chiu (từ 16:00 đến 18:00)
• S lưng phương tin giao thông trung bnh thp nht vo ban đêm (từ 0:00 đến 5:00)
• Có sự thay đổi nhẹ v s lưng phương tin giao thông trung bnh trong ngy
Biểu đồ thể hiện sự biến đổi của số lượng phương tiện giao thông trung bình trong ngày theo từng giờ Số lượng phương tiện giao thông trung bình đạt đỉnh cao nhất vào giờ cao điểm buổi sáng và buổi chiều, trong khi đó, số lượng này thấp nhất vào ban đêm.
Dataframe gồm 35 dòng bao gồm Green_time, Red_time v Average_Waiting_time
To hm để tnh thi gian ch trung bnh dựa trên thi gian đn đ v thi gian đn xanh
Sử dụng thư vin Matplotlib.pyplot để vẽ biểu đồ plot.
Trung bình thời gian đợi của mỗi xe theo thời gian đèn xanh và đèn đỏ tương ứng
• Khi thi gian đn đ tăng từ 10 giây đến 60 giây, thi gian ch đi trung bnh tăng từ 0,15 giây đến 0,35 giây
Mối quan hệ giữa thời gian chờ đợi trung bình và thời gian đón đợi có thể được mô tả bằng phương trình tuyến tính y = mx + b, trong đó y là thời gian chờ đợi trung bình, x là thời gian đón đợi, m là độ dốc của đường cong, và b là giao điểm của đường cong với trục tung.
• Độ dc của đưng cong l khong 0,0025, cho thy rằng thi gian ch đi trung bnh tăng 0,0025 giây mỗi giây khi thi gian đn đ tăng
• Giao điểm của đưng cong với trục tung l khong 0,15 giây, cho thy rằng thi gian ch đi trung bnh l 0,15 giây khi thi gian đn đ l 0 giây
• Thi gian ch đi trung bnh tăng khi thi gian đn đ tăng
• Mi quan h giữa thi gian ch đi trung bnh v thi gian đn đ gn như tuyến tnh
Biểu đồ mô tả mối quan hệ giữa thời gian chờ đợi trung bình tại đèn giao thông và thời gian đèn đỏ là một công cụ hữu ích để hiểu rõ ảnh hưởng của thời gian đèn đỏ đối với thời gian chờ đợi Biểu đồ này có thể được áp dụng cho nhiều mục đích khác nhau, bao gồm tối ưu hóa thời gian đèn giao thông, thiết kế giao lộ và phân bổ tài nguyên giao thông hiệu quả.
Giải pháp: Lấy mốc giờ 16:00 PM, thời gian có nhiều lượng xe lưu thông nhất tỉnh, tỷ lệ xe đến (arrival_rate) cho ra được lượng xe 20s vẫy xanh 50s với thời gian chờ trung bình mỗi xe là 0.09s.
3.3.2: Phát triển hệ ng định vị v bn đ thông minh để gip th người lái xe điu hướng hiệu qu hơn
Xây dựng hệ thống định vị và dẫn đường trong giao thông là rất quan trọng Để tạo ra một bản đồ ngẫu nhiên, cần đặt hai điểm tương ứng với vị trí hiện tại và nơi muốn đến, từ đó tìm đường đi ngắn nhất.
V map trên 1 ma trận được đnh hình sẵn
Ta sử dụng lý thuyết đồ thị t t ton Dijkstra để tm đưng đi hu ngắn nht từ một điểm đến tt c cc điểm còn li trong một đồ thị
Tìm đường đi ngắn nhất
Bắt đu t 2 điểm bất kì và đường đi ngắn nhất
3.3.3: Phân tch dữ ệu tai nn giao thông để xác định nguyên nhân li tai nn v đưa ra các biện pháp ngăn chặn
Dataframe gồm 7 dòng mô t s ln tai nn tương ng với thi tiết khi xy ra tai nn
Sử dụng thư vin Matplotlib.pyplot để vẽ biểu đồ
Số lượng tai nn xy ra vào thời tit nắng là cao nhất
Biểu đồ cho thấy rằng tai nạn giao thông cao nhất xảy ra trong điều kiện thời tiết tốt (Fine), với hơn 70,000 vụ tai nạn Điều kiện thời tiết mưa (Raining) đứng thứ hai với khoảng 10,000 vụ tai nạn Các điều kiện thời tiết khác như u ám (Overcast), không xác định (Unknown), sương mù (Fog or mist), và tuyết rơi (Snowing) đều có số lượng tai nạn giao thông thấp hơn đáng kể.
Dataframe gồm 4 dòng mô t s ln tai nn tương ng với mặt đưng khi xy ra tai nn
S dử ụng thư vin Matplotlib.pyplot để vẽ biểu đồ
Tc độ cng cao th s lưng tai nn giao thông cng gim
Biểu đồ cho thấy rằng tai nạn giao thông cao nhất xảy ra trên bề mặt đường khô ráo, với khoảng 80,000 vụ tai nạn Bề mặt đường ướt đứng thứ hai với khoảng 15,000 vụ tai nạn Các bề mặt khác như không xác định hoặc tuyết, băng đều có số vụ tai nạn giao thông thấp hơn đáng kể.
Dataframe gồm 12 dòng, mô t s ln tai nn tương ng với tc độ ới hn khi xy ra tai nngi
S dử ụng thư vin Matplotlib.pyplot để vẽ biểu đồ
Biểu đồ cho thấy rằng tai nạn giao thông cao nhất xảy ra khi phương tiện di chuyển với tốc độ 50 km/h, với hơn 30,000 vụ tai nạn Tốc độ 60 km/h đứng thứ hai với khoảng 25,000 vụ tai nạn Các tốc độ khác như 100 km/h, 80 km/h, 70 km/h, 110 km/h, 40 km/h, 90 km/h, 30 km/h và 10 km/h đều có số vụ tai nạn giao thông thấp hơn, trong đó tốc độ 10 km/h ghi nhận số vụ tai nạn thấp nhất.
Dataframe gồm 6 dòng mô t s ln tai nn tương ng với khu vực khi xy ra tai nn
Sử dụng thư vin Matplotlib.pyplot để vẽ biểu đồ
Biểu đồ cho thấy số vụ tai nạn giao thông cao nhất xảy ra tại khu vực trung tâm thành phố Sydney, với hơn 50,000 vụ Trong khi đó, các khu đô thị xung quanh ghi nhận khoảng 23,000 vụ tai nạn Những vị trí khác như vùng nông thôn, trung tâm Newcastle và trung tâm Wollongong có số vụ tai nạn giao thông thấp hơn đáng kể.
Dataframe gồm 13 dòng mô t s ln tai nn tương ng với thi gian khi xy ra tai nn
S dử ụng thư vin Matplotlib.pyplot để ẽ biểu đồ v
Biểu đồ cho thấy rằng thời gian cao điểm giao thông xảy ra từ 16 giờ đến 18 giờ, với hơn 14,000 vụ tai nạn Trong khoảng thời gian từ 14 giờ đến 16 giờ, số vụ tai nạn cũng đáng kể, đạt khoảng 13,000 vụ Các khoảng thời gian khác như 12 giờ, 10 giờ, 8 giờ, 18 giờ, 6 giờ, 20 giờ và 22 giờ đều ghi nhận số vụ tai nạn giao thông thấp hơn, trong đó thời gian 4 giờ có số vụ tai nạn thấp nhất.
Giữa năm 2018 và 2022, chính phủ Úc đã chú trọng vào việc kiểm định lư s ng ngưi tử vong do tai nạn giao thông, nhằm giảm thiểu thiệt hại và nâng cao an toàn đường bộ.
H1: S ng tử vong t hơn sau năm 2020lư
H0: S ng tử vong nhiu hơn sau năm 2020lư
Kết qu cho ra p-value 0.11 > 0.05 chp nhn H1
S ng tử vong trong ti nn giao thông sau năm 2020 l t hơnlư
3.3.4: Phân tch dữ ệu tai nn giao thông để xác định nguyên nhân li tai nn v đưa ra các biện pháp ngăn chặn
- Dự đon mô hnh tương lai của giao thông nước Úc
Data frame gồm 9 dòng mô t s lưng xe trung bnh mỗi ngy từ năm 2006 - 2014
Dựa vo dữ u ta tnh đưc h s tương quan giữa Năm v mli t độ xe hằng ngy l 0.84499
S dử ụng thư vin Matplotlib.pyplot để vẽ biểu đồ
Nhn xt: S lưng ô tô theo từng ngy tăng qua cc năm
Dataframe gồ 5 dòng mô t tổng cc vụ tai nn giao thông từ m năm 2018 – 2022
Dựa vo dữ u ta tnh đưc h s tương quan giữli a năm v mt độ tai nn giao thông l -0.904618
S dử ụng thư vin Matplotlib.pyplot để vẽ biểu đồ
Nhn xt: Tổng s vụ tai nn gim mnh qua cc năm từ 2018-2022
Kt lun v tưng phát triển
Với điều kiện tự nhiên thuận lợi như ánh sáng, thời tiết và cơ sở hạ tầng tốt, nhưng vẫn xảy ra nhiều tai nạn giao thông Nguyên nhân chính dẫn đến tai nạn là mật độ xe quá cao tại các giờ cao điểm, đặc biệt từ 14h đến 18h, tại các khu vực trung tâm thành phố Sydney và khu vực đô thị lân cận.
- Tăng cưng h thng đn giao thông
- Xây dựng ln đưng ưu tiên cho phương tin công cộng
- Ci thin vch kẻ đưng v biển bo.
2 Thúc đẩy sử dụng giao thông công cộng:
- Ci thin cht lưng v tn sut dịch vụ giao thông công cộng
- Khuyến khch sử dụng phương tin công cộng qua cc chương trnh khuyến mãi.