Hệ thống quản lý phương tiện giao thông

2.2.1. Cải thiện chất lượng ảnh

Ngày nay, những nước phát triển đang triển khai mạnh mẽ công nghệ xử lý

ảnh trong giao thông thông minh, y tế, sinh học và các lĩnh vực khác. Cải thiện

chất lượng ảnh là tiền đề của mọi vấn đề cần xử lý trong xử lý ảnh là mục tiêu

quan trọng đặc biệt là việc nâng cao độ phân giải của ảnh từ những điểm ảnh nội

suy mới. Trong các giải thuật: nội suy Linear; nội suy Bilinear; nội suy Nearest

Neighbor; nội suy Cubic; nội suy Bicubic [10] và phân tích trong [67] là cơ sở để

áp dụng trong luận án. Giải thuật nội suy ảnh Bicubic (Bicubic Interpolation -

BI) sử dụng một ma trận các điểm ảnh gốc xung quanh điểm ảnh nội suy, tuy

nhiên ảnh sau khi được nâng độ phân giải lại chưa có độ sâu tương phản giữa

các đối tượng như ảnh gốc đặc biệt là các vùng biên của các đối tượng vật thể

ở trong ảnh, các vùng biên này đã bị mờ đi. Mục đích của nghiên cứu này là

làm giảm hiệu ứng mờ từ các khối lân cận thông qua việc cải thiện giá trị điểm

ảnh nội suy dọc theo các điểm ảnh biên phân chia các đối tượng trong khung

hình. Phương pháp này chính là ứng dụng giải thuật BI cùng với phương pháp

xác định biên Canny [68] để điều chỉnh các điểm ảnh dọc theo biên của vật thể

trong khung hình. Kết quả của phương pháp này có thể được ứng dụng trong

hệ thống giám sát giao thông.

Đôi khi những điều xảy ra trên đường cần được xem xét và đánh giá lại, nên

việc nâng cao chất lượng độ phân giải của ảnh có thể ảnh hưởng tới việc theo

dõi các đối tượng cần quan tâm. Do đó, luận án đã nghiên cứu phương pháp

nâng cao chất lượng của ảnh để ứng dụng trong giao thông thông minh để cải

thiện khả năng theo dõi của người giám sát. Các nguồn dữ liệu hiện tại được

thu thập từ các loại camera có nhiệm vụ ghi lại thành các chuỗi dữ liệu từ các

hình ảnh hay khung hình đơn lẻ liên tiếp nhau. Các camera này được đặt tập

trung vào vùng cần quan tâm giám sát ở trên đường. Mục đích của nghiên cứu

này là nâng cao chất lượng của ảnh sau khi nội suy nâng cao độ phân giải của

ảnh. Giả định có một hình ảnh hay một khung hình có kích thước a b× điểm

ảnh sẽ được nâng cao lên thành độ phân giải c d× điểm ảnh. Ở đây, luận án chỉ

xét hệ số nội suy kích thước ảnh là 2i, điều đó có nghĩa là: c a= × 2 i; d= × 2b i.

Trên cơ sở giải thuật BI nhiều nhà nghiên cứu đã phát triển thêm các phương

pháp để nâng cao chất lượng ảnh sau khi nội suy như phương pháp sử dụng

chuyển đổi sóng con rời rạc (Discrete Wavelet Transform) ở trong [69] hoặc giải

thuật phát triển biên trực tiếp được sử dụng trong nghiên cứu [70] các giải thuật

này được mô tả phức tạp và sử dụng nhiều thời gian để tính toán.

Giải thuật nội suy Cubic (Cubic Interpolation) là cơ sở của giải thuật BI, các

điểm ảnh nội suy trong giải thuật được xác định bởi các phần tử điểm ảnh gốc

thuộc một ma trận vuông xung quanh nó. 2.2.2. Nhận diện phương tiện

Nhận diện đối tượng chuyển động là cơ sở để xử lý ảnh trong video, từ các đối

tượng nhận dạng được có thể ước lượng và dự đoán tình huống ảnh hưởng tới

khả năng lưu thông trên đường. Các phương pháp cơ bản nhận dạng đối tượng

trong xử lý ảnh được trình bày trong [71, 72, 73] được tóm tắt lại như sau.

a. Nhóm các phương pháp nhận diện đối tượng Optical Flow:

so với một điểm gốc, tiêu biểu là nghiên cứu của Lucas–Kanade trong [74]. Áp

sự chuyển động các điểm trên vị trí bề mặt của đối tượng vào không gian ba

chiều thì hình chiếu của các điểm chuyển động đó lên một mặt phẳng hai chiều

được gọi là motion field. Từ các motion field xác định được tập hợp từ một

chuỗi hình ảnh liên tiếp nhau sẽ có được Optical Flow, phương pháp này chủ

yếu được sử dụng trong việc nhận diện các đối tượng chuyển động trong khung

hình. Phương pháp này đòi hỏi tính toán lớn và có độ nhạy cao với nhiễu, khả

năng ứng dụng trong thời gian thực là khó.

Trừ nền:

Là phương pháp được sử dụng rộng rãi nhất cho việc phát hiện đối tượng.

Phương pháp này bao gồm 2 loại, trong đó nền của bức ảnh được xác định bởi

khung hình đầu tiên hoặc trung bình khung hình trong video. Ở phương phápn

trừ nền, mỗi điểm ảnh của khung hình liên tiếp loại bỏ đi điểm ảnh của nền.

Phương trình (2.1) và (2.2) trình bày phương pháp xóa nền khi coi khung hình đầu tiên làm nền.

B a, b( ) = (A a, b .) (2.1)

Trong đó,B a, b( ) biểu diễn nền của ảnh theo điểm ảnh. Trừ nền tách các khung

hình thành đối tượng tiền cảnh và nền, ở đó, các đối tượng tiền cảnh được khám

phá bằng việc so sánh khung hình hiện tại A a, b( ) với nền ảnh B a, b( ). Theo phương trình sau:

C a, b( ) = 1 nếu B a, b − A a, b >( ) ( ) ngưỡng

0 các trường hợp còn lại . (2.2)

C a, b( ) là điểm ảnh tiền cảnh, giá trị ngưỡng có thể được đặt một cách thủ

công hoặc lựa chọn một cách tự động theo video đầu vào. Phương pháp này tiêu

tốn ít bộ nhớ. Độ chính xác của quá trình phát hiện là vừa phải.

Vi sai khung hình:

Phương pháp này được biết tới là sự quan sát khác biệt theo thời gian. Trong

đó, mỗi điểm ảnh của khung hình hiện tại phải trừ đi điểm ảnh ở vị trí này ở

khung hình trước đó. Nếu sự thay đổi vượt quá mức ngưỡng được đặt một cách

thủ công thì điểm ảnh đó được coi như thuộc tiền cảnh, ngược lại điểm ảnh đó

F a, b( ) = 1 nếu In(a, b − I ) n+1 (a, b > T)

0 các trường hợp còn lại . (2.3)

Ở đó,In là điểm ảnh thuộc khung hình trước và In+1 là điểm ảnh thuộc khung

hình hiện tại. T là giá trị ngưỡng được định nghĩa một cách thủ công bởi người

dùng. Sự tính toán của tiến trình này vừa phải và dễ dàng. Đối với các môi

trường không tĩnh, rất nhiều thử thách để có được bản phác thảo của đối tượng

đang di chuyển. Vì vậy, rất khó để đạt độ chính xác mong muốn.

Vi sai khung hình kép:

Được biết đến như chỉ ra sự khác biệt theo thời gian, trong đó mỗi điểm ảnh

thuộc khung hình hiện tại bị trừ với điểm ảnh ở vị trí này thuộc khung hình

trước đó và khung hình ngay sau nó. Nếu sự phục hồi lớn hơn mức ngưỡng đã

định nghĩa trước đó, điểm ảnh này là một điểm ảnh tiền cảnh, ngược lại điểm

ảnh đó là một điểm ảnh thay thế của điểm ảnh nền.

Cn(a, b) =D n(a, b − D ) n+1(a, b , ) (2.4) Cn+1 (a, b) =D n+1(a, b − D ) n+2 (a, b , ) (2.5) DD a, b( ) =C n(a, b − C ) n+1(a, b . ) (2.6)

Ở đó, Cn(a, b ) là kết quả điểm ảnh tiền cảnh. D n biểu thị khung hiện tại của video. Dn+1 chỉ khung kế tiếp. Tương tự như trong phương trình 2.5 Dn+1 là

khung hình hiện tại, Dn+2 là khung kế tiếp. Cuối cùng, DD a, b( ) xác định kết

quả theo phương pháp vi sai kép.

R a, b( ) = 1 nếu DD a, b > T h( )

0 các trường hợp còn lại . (2.7)

T h là giá trị ngưỡng. Nếu điểm ảnh có trị tuyệt đối chênh lệch lớn hơn giá

trị ngưỡng thì điểm ảnh được phản ánh như màu đen, các trường hợp khác, nó

được phản ánh như màu trắng. Phương pháp này chỉ ra đối tượng chuyển động

b. Biểu diễn các đối tượng

Các đối tượng di chuyển có thể được phân loại như người, phương tiện, mây

trôi, chim và các đối tượng không tĩnh khác.

Biểu diễn hình khối cơ bản:

Dữ liệu hình dạng từ các bức ảnh khác nhau của các vùng chuyển động như

mô tả, Blob và các ô gần đạt được quá trình phân loại đối tượng chuyển động.

Sự pha tạp của hình ảnh và ràng buộc đối tượng với quang cảnh như khoảng

đốm của hình ảnh, tỉ lệ đặc trưng của phần diện tích hình chữ nhật blob sẽ tạo

thành các đặc điểm đầu vào cho mạng của ảnh. Yêu cầu trên được thực hiện

trên mỗi blob ở khung tương ứng và kết quả được lưu lại dưới dạng biểu đồ.

Phân loại chuyển động:

Các đối tượng chuyển động trong khung hình thu được phân loại dựa trên

hình dạng hình khối, dữ liệu từ dấu chuyển động, thậm chí còn dựa trên sự

linh hoạt của đối tượng. Dựa trên các đặc trưng này, có thể phân loại nhóm đối

tượng chuyển động trong dữ liệu thu được.

Biểu diễn màu cơ sở:

Không như một vài đặc trưng của một bức ảnh, đặc trưng ràng buộc một

cách tương đối là thông tin màu sắc nó không thay đối và dễ để phát triển. Mặc

dù, màu sắc không thể áp dụng như các tài nguyên riêng lẻ của việc đồng nhất

hóa và theo dõi đối các đối tượng, ngay cả những tiến trình mà chúng có chi

phí tính toán nhỏ khiến màu sắc như một đặc trưng đầy ý nghĩa để thực hành

khi phù hợp. Kĩ thuật quan trọng nhất là biểu diễn màu sắc cho việc phát hiện

và theo dõi những đối tượng không tĩnh trong thời gian thực. Mô hình trộn lẫn

gauss lại được sử dụng để minh họa sự tán xạ màu sắc được bao quanh bởi cấu

trúc của hình ảnh.

Biểu diễn ngữ cảnh cơ bản:

Hệ thống dựa vào kết cấu đếm sự tồn tại của đường dốc thẳng hàng trong

những phần đã giới hạn của một ảnh. Sau đó tính thông tin trong một lưới đã

tụ lại của sự lây lan một cách nhất quán ra các tế bào và sử dụng chuẩn hóa

sự chênh lệch hẹp chồng lấn để nâng cao độ chính xác. Đặc điểm kết cấu quan

trọng để đo sự chênh lệch cường độ của bề mặt và thấy rõ với sự biểu hiện mô

2.2.3. Phân loại phương tiện

Ngày nay, giao thông thông minh được ứng dụng và nâng tầm quan trọng

đúng với sự phát triển kinh tế xã hội của các nước đang phát triển. Giám sát

phương tiện là một trong những chức năng quan trọng của ITS, các phương tiện

được phân loại bởi hệ thống quản lý giao thông theo các làn đường xe chạy,

đặc biệt là trên các tuyến đường có đặc trưng là giao thông hỗn hợp bao gồm

nhiều phương tiện là xe máy và ô-tô cùng di chuyển với nhau như ở Việt Nam.

Nghiên cứu này đề xuất một phương pháp phân loại mới dựa trên cơ sở góc tới

của phương tiện được nhận dạng bởi hệ thống camera giám sát. Kết quả của

phương pháp này có thể được sử dụng để nâng cao độ chính xác trong việc phân

loại phương tiện giao thông, nhằm mục đích giám sát và thực thi luật giao thông

đường bộ đối với các phương tiện đang di chuyển trên đường. Đề xuất nghiên

cứu này có thể ứng dụng tại các nước có tính chất giao thông hỗn hợp và được

sử dụng để kiểm tra đối với các phương tiện đi sai làn, đi sai đường và luật lệ giao thông.

Ở những nước đang phát triển, đặc trưng giao thông là hỗn hợp bao gồm

nhiều loại phương tiện như: ô-tô, xe máy, xe đạp và các phương tiện khác cùng

di chuyển trên một làn đường như Việt Nam [75]. Hệ thống giám sát các phương

tiện giao thông gồm nhiều chức năng, trong đó việc phân loại phương tiện là

một chức năng quan trọng giúp nhà chức trách có khả năng thống kê và đánh

giá xu hướng phát triển của từng dòng phương tiện. Phân loại phương tiện giúp

cho việc giám sát lưu lượng mỗi loại phương tiện trên từng làn đường. Đã có

nhiều nghiên cứu về phương pháp phân loại phương tiện như phương pháp ứng

dụng từ trường và sóng radio để thu nhận kích thước của mỗi phương tiện, các

cảm biến này được đặt gần chỗ với camera giám sát từng làn xe để theo dõi quỹ

đạo di chuyển và phân loại phương tiện đồng thời [76]. Tuy nhiên, phương pháp

này tốn kém và độ chính xác chưa cao trong kịch bản giao thông hỗn hợp. Có

một phương pháp khác được nghiên cứu trong [77, 78] cũng giám sát kích cỡ

của phương tiện, tuy nhiên chỉ áp dụng cho xe ô tô hoặc không phải là xe ô tô

và không bao gồm xe máy.

Phương pháp phân loại phương tiện sử dụng cảm biến từ trường được giới

thiệu trong [79] cũng khá chính xác, nhưng bất lợi của cách tiếp cận này là

phương pháp này không thể phân loại phương tiện trên nhiều làn đường, phương

pháp này chỉ thích hợp cho các trạm kiểm soát thu phí nơi mà các phương tiện

dài xe từ góc quét vuông góc với hướng phương tiện di chuyển để phân loại xe

dựa theo chiều dài của phương tiện.

h=6. m25

30o

Hình 2.1: Sơ đồ thiết lập hệ thống camera để thu thập dữ liệu

Các nghiên cứu được đưa ra trong [80, 81] kết hợp K-Nearest Neighbour, đặc

trưng của đường định hướng và các hình cơ sở của giải thuật Support Vector

Machines (SVM) để kết hợp và phân tích dựa trên hình dạng và dựa trên độ dốc

hình cơ sở để phân loại xe ô tô trong đường cao tốc. Giải pháp này đạt hiệu quả

cao khi hệ thống đèn giao thông và camera giám sát được chuẩn hóa với nhau.

Vì dòng xe máy hỗn hợp và các phương tiện khác là điển hình trong bối cảnh

giao thông của Việt Nam, cần phải phân loại xe máy ra khỏi xe ô tô trong một

làn đường nhiều làn xe. Do đó, bài báo này sử dụng Góc Trực tiếp (Direction

Angle) của trục chính thứ nhất (First Primary Axis - FPA) cho mỗi chiếc xe

tới được phát hiện trong trình tự video chụp bằng camera giám sát, có thể tự

ý gắn trên một con đường nhất định. Phép trừ nền [30] lần đầu tiên được thực

hiện cho trình tự khung bắt và sau đó mỗi chiếc xe được đặt và DA của FPA

được đánh giá để đưa ra quyết định trong nhiệm vụ phân loại. Các kết quả thực

nghiệm cho thấy hiệu quả phân loại cao và ngụ ý rằng cách tiếp cận này có thể

áp dụng cho quản lý giao thông ở các nước đang phát triển có khả năng là Việt

Nam, nơi có nhiều xe máy tham gia giao thông nhiều làn xe cùng với ô-tô.

2.2.4. Đo tốc độ phương tiện giao thông

Ngày nay, tự động hóa trong quản lý và giám sát giao thông là công việc

hoàn toàn tự động. Giám sát các phương tiện giao thông nhằm thực thi các

điều khoản trong Luật Giao thông đường bộ và để giao thông diễn ra an toàn,

thông suốt. Do đó, việc ứng dụng phương pháp đo tốc độ ô tô dựa trên xử lý

ảnh là việc làm quan trọng và cần thiết. Phương pháp mới được luận án đề xuất

sử dụng một camera để mô hình hóa khoảng cách từ camera tới phương tiện.

Trong phương pháp này, vị trí của phương tiện có thể xác định ứng với từng

điểm ảnh thu được dựa vào thông số lắp đặt của camera. Phương pháp này có

thể tận dụng các camera giám sát hiện có mà không cần thay đổi hay lắp thêm

Hệ thống quản lý phương tiện giao thông

Hiện trạng xử lý ảnh trong ITS

Nhận dạng biển số phương tiện