Lựa chọn đặc tính để sinh dữ liệu

Một phần của tài liệu (LUẬN văn THẠC sĩ) áp dụng mô hình phân lớp vào dự đoán mật độ giao thông luận văn ths máy tính 60 48 01 (Trang 28 - 29)

Chƣơng 2 : Hệ thống giao thơng thơng minh

a. Lựa chọn đặc tính để sinh dữ liệu

Do số liệu cụ thể liên quan đến các đoạn đƣờng, thời điểm tắc đƣờng thƣờng khơng đƣợc cơng bố nên chúng ta khơng cĩ số liệu thật để kiểm thử chƣơng trình.

Tuy nhiên, nhƣ đã trình bày ở các chƣơng trƣớc đĩ, dữ liệu liên quan đến địa điểm tắc đƣờng thƣờng cĩ tính quy luật, nên dựa vào các quy luật này ta cĩ thể sinh ra bộ dữ liệu sát với số liệu thật.

Cụ thể các thơng tin đƣợc dựa vào để sinh số liệu bao gồm:

 Các trƣờng hợp tắc đƣờng thƣờng xuất hiện ở trên những cung đƣờng nhất định, vậy nên Tên đƣờng chính là 1 thơng tin để xác định tình hình mật độ giao thơng.

 Các trƣờng hợp tắc đƣờng thƣờng xuất hiện trong những ngày nhất định trong nằm (ngày lễ, ngày nghỉ, …) vậy nên thời gian Ngày/Tháng là 1 thơng tin để xác định mật độ giao thơng.

 Trong một ngày, mật độ giao thơng ở các khoảng thời gian là khác nhau, nhƣng tình trạng tắc đƣờng thƣờng chỉ xuất hiện ở những khung giờ nhất định, vậy nên Giờ là 1 thơng tin để xác định mật độ giao thơng.

 Trong một tuần, mật độ giao thơng ở các ngày trong tuần là khác nhau, thứ 2 đầu tuần sẽ đơng hơn và các ngày trong tuần sẽ cĩ mật độ giao thơng cao hơn các ngày thứ 7 và chủ nhật. Vậy nên Ngày trong tuần là 1 thơng tin để xác định mật độ giao thơng

 Mật độ giao thơng trên 1 cung đƣờng thƣờng giống nhau ở cùng khoảng thời gian, ví dụ khoảng 5h sáng ở cung đƣờng A mật độ giao thơng thƣờng ở mức thấp. Tuy nhiên trong một số trƣờng hợp đột biến phát sinh (do thời tiết, do sửa chữa, do tai nạn giao thơng,…) mà mật độ thỉnh thoảng sẽ cĩ sự đột biến khác với những ngày cịn lại. Tỉ lệ phát sinh đột biến đƣợc lựa chọn là 20%. Nhƣ vậy việc sinh mật độ giao thơng tại 1 thời điểm trên 1 cung đƣờng sẽ cĩ tỉ lệ 20% đột biến so với các ngày cịn lại.

Nhƣ vậy, các Đặc tính (Attribute) đƣợc lựa chọn để xây dựng bộ kiểm thử bao gồm:

 Tên cung đƣờng (RoadId)  Ngày (Date)

 Tháng (Month)  Giờ (Hour)

 Ngày trong tuần (Day)

Trong đĩ Trạng thái giao thơng (state) chính là mục tiêu phân lớp mà bài tốn Dự đốn mật độ giao thơng hƣớng đến.

Một phần của tài liệu (LUẬN văn THẠC sĩ) áp dụng mô hình phân lớp vào dự đoán mật độ giao thông luận văn ths máy tính 60 48 01 (Trang 28 - 29)

Tải bản đầy đủ (PDF)

(52 trang)