a. Các vấn đề còn tồn tại
Các vấn đề còn tồn tại trong các hệ thống xử lý ảnh giao thông ở các nước
đang phát triển có nhược điểm chung là: do đặc thù dòng giao thông hỗn hợp
nên khó khăn trong việc nâng cao độ chính nhận diện phương tiện do khoảng
cách giữa các phương tiện với nhau do đó cũng ảnh hưởng tới việc phân loại phương tiện.
khả năng ứng dụng cho dòng phương tiện hỗn hợp tuy nhiên để có thể ứng dụng
công nghệ xử lý ảnh cho việc quản lý và điều hành dòng giao thông hỗn hợp
cũng vẫn còn cần cải tiến các công nghệ và phương pháp cho phù hợp hơn. Bởi
cho đến nay các công trình nghiên cứu của các nhà khoa học trên thế giới hầu
như chỉ tập trung cho bài toán giao thông ở nước họ với các đặc trưng: chỉ có
ô-tô được lưu thông trên các tuyến đường chính, các phương tiện đi trong một
làn cố định vừa với kích thước của từng phương tiện đảm bảo chỉ có một phương
tiện đi trong một làn đường, các phương tiện khác nhau có các làn đường riêng
khác nhau. Tuy các nghiên cứu phát triển công nghệ xử lý ảnh cho nước đang
phát triển như Việt Nam còn ít nhưng cũng hứa hẹn có thể thực hiện được.
Trong đó có thể kể tới các đề tài, dự án nghiên cứu được thực hiện mục đích là
ứng dụng khả năng quản lý trong giao thông hỗn hợp.
b. Các kết quả hướng tới
Để cải thiện việc phân loại phương tiện trong giao thông hỗn hợp. Đã có
nghiên cứu phân loại phương tiện chỉ dùng 1 camera được đặt có hướng quan
sát cùng với hướng đi của dòng phương tiện như [C1]. Phương pháp này có thể phân loại được nhiều loại phương tiện giao thông.
Ngoài ra, còn có các phương pháp giám sát lưu lượng phương tiện trong giao
thông hỗn hợp để điều khiển đèn tín hiệu giao thông được nói tới trong [C2].
Phương pháp này dựa vào tốc độ chiếm dụng mặt đường kể từ khi đèn đỏ để dự
đoán lưu lượng phương tiện giao thông trên luồng đường đi chuyển từ đó quyết
định thời gian hoạt động của đèn tín hiệu.
Tuy có nhiều yếu tố tác động, hệ thống xử lý ảnh trong giao thông tới nay
vẫn là một trong những hệ thống mạnh nhất vì khả năng ghi lại diễn biến trong
vùng quan sát để các nhà chức trách có thể xem lại video tại thời điểm mà
camera hoạt động. Chính vì các lý do như vậy, luận án nhận định phương pháp
xử lý ảnh trong giao thông là phương pháp phù hợp nhất cho việc giám sát giao
thông ở những nước đang phát triển có đặc trưng giao thông hỗn hợp nói chung
và Việt Nam nói riêng. 1.7. Kết luận chương
Một hệ thống Giao thông thông minh có sử dụng rất nhiều công nghệ để điều
khiển các phương tiện tham gia giao thông nhằm mục đích giúp cho các phương
dụng từ lâu, trong đó nổi bật lên là công nghệ xử lý ảnh.
Xử lý ảnh trong giao thông đã được nghiên cứu và áp dụng vào thực tiễn từ
các năm trước đây. Tuy nhiên, tuỳ theo đặc trưng giao thông của mỗi quốc gia
mà có nghiên cứu về xử lý ảnh của bài toán giao thông khác nhau. Ở các nước
phát triển, giao thông hiện đại bài toán giới hạn bởi các dòng phương tiện theo
làn cố định và cho từng loại phương tiện cố định. Mức ứng dụng công nghệ xử
lý ảnh ở các quốc gia khác hẳn với các nước đang phát triển có đặc trưng dòng
phương tiện giao thông hỗn hợp như Việt Nam. Do đó, nghiên cứu và phát triển
công nghệ xử lý ảnh để áp dụng vào các nước đang phát triển là một vấn đề cấp thiết.
Trong nội dung trình bày ở chương này, các công nghệ nhận diện phương tiện
đã được trình bày và phân tích ưu nhược điểm khả năng ứng dụng trong giao
thông đô thị có đặc trưng là dòng phương tiện giao thông hỗn hợp. Các phương
pháp này đã được ứng dụng và thống kê khả năng nhận diện phương tiện ở các
quốc gia có nền khoa học kỹ thuật phát triển. Phương pháp nhận diện phương
tiện bằng xử lý ảnh vượt trội so với các công nghệ khác về tính khả thi ở các
nước đang phát triển. Tuy còn một số các vấn đề cần được cải thiện như: phát
hiện phương tiện khi điều kiện ánh sáng kém, đường quá đông các phương tiện
đi sát gần với nhau, nhiều chủng loại phương tiện cùng tham gia giao thông.
Luận án sẽ đi vào giải quyết các vấn đề này mục tiêu cụ thể là ứng dụng công
nghệ xử lý ảnh tại Việt Nam trong quản lý và giám sát giao thông.
Chương tiếp theo sẽ trình bày về phương pháp nhận diện và đề xuất phương pháp phân loại phương tiện trong giao thông hỗn hợp. Các phương pháp sử
dụng công nghệ xử lý ảnh sẽ được phân tích và so sánh, cuối cùng là đề xuất
QUẢN LÝ PHƯƠNG TIỆN GIAO THÔNG
2.1. Giới thiệu
Dữ liệu phương tiện giao thông thu thập được từ các camera giám sát gắn
trên đường được truyền tải về trung tâm để xử lý mục đích là giám sát lượng
phương tiện và nhận dạng các bất thường trên đường như va chạm giao thông.
Dữ liệu là các đoạn videos ngắn nối tiếp nhau được đưa vào xử lý để nhận diện
các phương tiện giao thông trong đó. Từ việc nhận diện phương tiện giao thông,
cần thiết phải phân loại và thống kê được lượng phương tiện di chuyển qua một
tuyến đường trong một đơn vị thời gian để làm cơ sở tiền xử lý các chức năng
như điều khiển đèn tín hiệu giao thông, phát hiện phương tiện đi vào đường
cấm hoặc đường có làn riêng cho từng loại phương tiện. Trong nội dung chương
này, luận án tập trung vào giải pháp tiền xử lý dữ liệu là đề xuất cải thiện chất
lượng ảnh thu được và phân loại phương tiện.
2.2. Hệ thống quản lý phương tiện giao thông2.2.1. Cải thiện chất lượng ảnh 2.2.1. Cải thiện chất lượng ảnh
Ngày nay, những nước phát triển đang triển khai mạnh mẽ công nghệ xử lý
ảnh trong giao thông thông minh, y tế, sinh học và các lĩnh vực khác. Cải thiện
chất lượng ảnh là tiền đề của mọi vấn đề cần xử lý trong xử lý ảnh là mục tiêu
quan trọng đặc biệt là việc nâng cao độ phân giải của ảnh từ những điểm ảnh nội
suy mới. Trong các giải thuật: nội suy Linear; nội suy Bilinear; nội suy Nearest
Neighbor; nội suy Cubic; nội suy Bicubic [10] và phân tích trong [67] là cơ sở để
áp dụng trong luận án. Giải thuật nội suy ảnh Bicubic (Bicubic Interpolation -
BI) sử dụng một ma trận các điểm ảnh gốc xung quanh điểm ảnh nội suy, tuy
nhiên ảnh sau khi được nâng độ phân giải lại chưa có độ sâu tương phản giữa
các đối tượng như ảnh gốc đặc biệt là các vùng biên của các đối tượng vật thể
ở trong ảnh, các vùng biên này đã bị mờ đi. Mục đích của nghiên cứu này là
làm giảm hiệu ứng mờ từ các khối lân cận thông qua việc cải thiện giá trị điểm
ảnh nội suy dọc theo các điểm ảnh biên phân chia các đối tượng trong khung
hình. Phương pháp này chính là ứng dụng giải thuật BI cùng với phương pháp
xác định biên Canny [68] để điều chỉnh các điểm ảnh dọc theo biên của vật thể
trong khung hình. Kết quả của phương pháp này có thể được ứng dụng trong
hệ thống giám sát giao thông.
Đôi khi những điều xảy ra trên đường cần được xem xét và đánh giá lại, nên
việc nâng cao chất lượng độ phân giải của ảnh có thể ảnh hưởng tới việc theo
dõi các đối tượng cần quan tâm. Do đó, luận án đã nghiên cứu phương pháp
nâng cao chất lượng của ảnh để ứng dụng trong giao thông thông minh để cải
thiện khả năng theo dõi của người giám sát. Các nguồn dữ liệu hiện tại được
thu thập từ các loại camera có nhiệm vụ ghi lại thành các chuỗi dữ liệu từ các
hình ảnh hay khung hình đơn lẻ liên tiếp nhau. Các camera này được đặt tập
trung vào vùng cần quan tâm giám sát ở trên đường. Mục đích của nghiên cứu
này là nâng cao chất lượng của ảnh sau khi nội suy nâng cao độ phân giải của
ảnh. Giả định có một hình ảnh hay một khung hình có kích thước a b× điểm
ảnh sẽ được nâng cao lên thành độ phân giải c d× điểm ảnh. Ở đây, luận án chỉ
xét hệ số nội suy kích thước ảnh là 2i, điều đó có nghĩa là: c a= × 2 i; d= × 2b i.
Trên cơ sở giải thuật BI nhiều nhà nghiên cứu đã phát triển thêm các phương
pháp để nâng cao chất lượng ảnh sau khi nội suy như phương pháp sử dụng
chuyển đổi sóng con rời rạc (Discrete Wavelet Transform) ở trong [69] hoặc giải
thuật phát triển biên trực tiếp được sử dụng trong nghiên cứu [70] các giải thuật
này được mô tả phức tạp và sử dụng nhiều thời gian để tính toán.
Giải thuật nội suy Cubic (Cubic Interpolation) là cơ sở của giải thuật BI, các
điểm ảnh nội suy trong giải thuật được xác định bởi các phần tử điểm ảnh gốc
thuộc một ma trận vuông xung quanh nó. 2.2.2. Nhận diện phương tiện
Nhận diện đối tượng chuyển động là cơ sở để xử lý ảnh trong video, từ các đối
tượng nhận dạng được có thể ước lượng và dự đoán tình huống ảnh hưởng tới
khả năng lưu thông trên đường. Các phương pháp cơ bản nhận dạng đối tượng
trong xử lý ảnh được trình bày trong [71, 72, 73] được tóm tắt lại như sau.
a. Nhóm các phương pháp nhận diện đối tượng Optical Flow:
so với một điểm gốc, tiêu biểu là nghiên cứu của Lucas–Kanade trong [74]. Áp
sự chuyển động các điểm trên vị trí bề mặt của đối tượng vào không gian ba
chiều thì hình chiếu của các điểm chuyển động đó lên một mặt phẳng hai chiều
được gọi là motion field. Từ các motion field xác định được tập hợp từ một
chuỗi hình ảnh liên tiếp nhau sẽ có được Optical Flow, phương pháp này chủ
yếu được sử dụng trong việc nhận diện các đối tượng chuyển động trong khung
hình. Phương pháp này đòi hỏi tính toán lớn và có độ nhạy cao với nhiễu, khả
năng ứng dụng trong thời gian thực là khó.
Trừ nền:
Là phương pháp được sử dụng rộng rãi nhất cho việc phát hiện đối tượng.
Phương pháp này bao gồm 2 loại, trong đó nền của bức ảnh được xác định bởi
khung hình đầu tiên hoặc trung bình khung hình trong video. Ở phương phápn
trừ nền, mỗi điểm ảnh của khung hình liên tiếp loại bỏ đi điểm ảnh của nền.
Phương trình (2.1) và (2.2) trình bày phương pháp xóa nền khi coi khung hình đầu tiên làm nền.
B a, b( ) = (A a, b .) (2.1)
Trong đó,B a, b( ) biểu diễn nền của ảnh theo điểm ảnh. Trừ nền tách các khung
hình thành đối tượng tiền cảnh và nền, ở đó, các đối tượng tiền cảnh được khám
phá bằng việc so sánh khung hình hiện tại A a, b( ) với nền ảnh B a, b( ). Theo phương trình sau:
C a, b( ) = 1 nếu B a, b − A a, b >( ) ( ) ngưỡng
0 các trường hợp còn lại . (2.2)
C a, b( ) là điểm ảnh tiền cảnh, giá trị ngưỡng có thể được đặt một cách thủ
công hoặc lựa chọn một cách tự động theo video đầu vào. Phương pháp này tiêu
tốn ít bộ nhớ. Độ chính xác của quá trình phát hiện là vừa phải.
Vi sai khung hình:
Phương pháp này được biết tới là sự quan sát khác biệt theo thời gian. Trong
đó, mỗi điểm ảnh của khung hình hiện tại phải trừ đi điểm ảnh ở vị trí này ở
khung hình trước đó. Nếu sự thay đổi vượt quá mức ngưỡng được đặt một cách
thủ công thì điểm ảnh đó được coi như thuộc tiền cảnh, ngược lại điểm ảnh đó
F a, b( ) = 1 nếu In(a, b − I ) n+1 (a, b > T)
0 các trường hợp còn lại . (2.3)
Ở đó,In là điểm ảnh thuộc khung hình trước và In+1 là điểm ảnh thuộc khung
hình hiện tại. T là giá trị ngưỡng được định nghĩa một cách thủ công bởi người
dùng. Sự tính toán của tiến trình này vừa phải và dễ dàng. Đối với các môi
trường không tĩnh, rất nhiều thử thách để có được bản phác thảo của đối tượng
đang di chuyển. Vì vậy, rất khó để đạt độ chính xác mong muốn.
Vi sai khung hình kép:
Được biết đến như chỉ ra sự khác biệt theo thời gian, trong đó mỗi điểm ảnh
thuộc khung hình hiện tại bị trừ với điểm ảnh ở vị trí này thuộc khung hình
trước đó và khung hình ngay sau nó. Nếu sự phục hồi lớn hơn mức ngưỡng đã
định nghĩa trước đó, điểm ảnh này là một điểm ảnh tiền cảnh, ngược lại điểm
ảnh đó là một điểm ảnh thay thế của điểm ảnh nền.
Cn(a, b) =D n(a, b − D ) n+1(a, b , ) (2.4) Cn+1 (a, b) =D n+1(a, b − D ) n+2 (a, b , ) (2.5) DD a, b( ) =C n(a, b − C ) n+1(a, b . ) (2.6)
Ở đó, Cn(a, b ) là kết quả điểm ảnh tiền cảnh. D n biểu thị khung hiện tại của video. Dn+1 chỉ khung kế tiếp. Tương tự như trong phương trình 2.5 Dn+1 là
khung hình hiện tại, Dn+2 là khung kế tiếp. Cuối cùng, DD a, b( ) xác định kết
quả theo phương pháp vi sai kép.
R a, b( ) = 1 nếu DD a, b > T h( )
0 các trường hợp còn lại . (2.7)
T h là giá trị ngưỡng. Nếu điểm ảnh có trị tuyệt đối chênh lệch lớn hơn giá
trị ngưỡng thì điểm ảnh được phản ánh như màu đen, các trường hợp khác, nó
được phản ánh như màu trắng. Phương pháp này chỉ ra đối tượng chuyển động
b. Biểu diễn các đối tượng
Các đối tượng di chuyển có thể được phân loại như người, phương tiện, mây
trôi, chim và các đối tượng không tĩnh khác.
Biểu diễn hình khối cơ bản:
Dữ liệu hình dạng từ các bức ảnh khác nhau của các vùng chuyển động như
mô tả, Blob và các ô gần đạt được quá trình phân loại đối tượng chuyển động.
Sự pha tạp của hình ảnh và ràng buộc đối tượng với quang cảnh như khoảng
đốm của hình ảnh, tỉ lệ đặc trưng của phần diện tích hình chữ nhật blob sẽ tạo
thành các đặc điểm đầu vào cho mạng của ảnh. Yêu cầu trên được thực hiện
trên mỗi blob ở khung tương ứng và kết quả được lưu lại dưới dạng biểu đồ.
Phân loại chuyển động:
Các đối tượng chuyển động trong khung hình thu được phân loại dựa trên
hình dạng hình khối, dữ liệu từ dấu chuyển động, thậm chí còn dựa trên sự
linh hoạt của đối tượng. Dựa trên các đặc trưng này, có thể phân loại nhóm đối
tượng chuyển động trong dữ liệu thu được.
Biểu diễn màu cơ sở:
Không như một vài đặc trưng của một bức ảnh, đặc trưng ràng buộc một
cách tương đối là thông tin màu sắc nó không thay đối và dễ để phát triển. Mặc
dù, màu sắc không thể áp dụng như các tài nguyên riêng lẻ của việc đồng nhất
hóa và theo dõi đối các đối tượng, ngay cả những tiến trình mà chúng có chi