2.2.1. Cải thiện chất lượng ảnh
Ngày nay, những nước phát triển đang triển khai mạnh mẽ công nghệ xử lý
ảnh trong giao thông thông minh, y tế, sinh học và các lĩnh vực khác. Cải thiện
chất lượng ảnh là tiền đề của mọi vấn đề cần xử lý trong xử lý ảnh là mục tiêu
quan trọng đặc biệt là việc nâng cao độ phân giải của ảnh từ những điểm ảnh nội
suy mới. Trong các giải thuật: nội suy Linear; nội suy Bilinear; nội suy Nearest
Neighbor; nội suy Cubic; nội suy Bicubic [10] và phân tích trong [67] là cơ sở để
áp dụng trong luận án. Giải thuật nội suy ảnh Bicubic (Bicubic Interpolation -
BI) sử dụng một ma trận các điểm ảnh gốc xung quanh điểm ảnh nội suy, tuy
nhiên ảnh sau khi được nâng độ phân giải lại chưa có độ sâu tương phản giữa
các đối tượng như ảnh gốc đặc biệt là các vùng biên của các đối tượng vật thể
ở trong ảnh, các vùng biên này đã bị mờ đi. Mục đích của nghiên cứu này là
làm giảm hiệu ứng mờ từ các khối lân cận thông qua việc cải thiện giá trị điểm
ảnh nội suy dọc theo các điểm ảnh biên phân chia các đối tượng trong khung
hình. Phương pháp này chính là ứng dụng giải thuật BI cùng với phương pháp
xác định biên Canny [68] để điều chỉnh các điểm ảnh dọc theo biên của vật thể
trong khung hình. Kết quả của phương pháp này có thể được ứng dụng trong
hệ thống giám sát giao thông.
Đôi khi những điều xảy ra trên đường cần được xem xét và đánh giá lại, nên
việc nâng cao chất lượng độ phân giải của ảnh có thể ảnh hưởng tới việc theo
dõi các đối tượng cần quan tâm. Do đó, luận án đã nghiên cứu phương pháp
nâng cao chất lượng của ảnh để ứng dụng trong giao thông thông minh để cải
thiện khả năng theo dõi của người giám sát. Các nguồn dữ liệu hiện tại được
thu thập từ các loại camera có nhiệm vụ ghi lại thành các chuỗi dữ liệu từ các
hình ảnh hay khung hình đơn lẻ liên tiếp nhau. Các camera này được đặt tập
trung vào vùng cần quan tâm giám sát ở trên đường. Mục đích của nghiên cứu
này là nâng cao chất lượng của ảnh sau khi nội suy nâng cao độ phân giải của
ảnh. Giả định có một hình ảnh hay một khung hình có kích thước a b× điểm
ảnh sẽ được nâng cao lên thành độ phân giải c d× điểm ảnh. Ở đây, luận án chỉ
xét hệ số nội suy kích thước ảnh là 2i, điều đó có nghĩa là: c a= × 2 i; d= × 2b i.
Trên cơ sở giải thuật BI nhiều nhà nghiên cứu đã phát triển thêm các phương
pháp để nâng cao chất lượng ảnh sau khi nội suy như phương pháp sử dụng
chuyển đổi sóng con rời rạc (Discrete Wavelet Transform) ở trong [69] hoặc giải
thuật phát triển biên trực tiếp được sử dụng trong nghiên cứu [70] các giải thuật
này được mô tả phức tạp và sử dụng nhiều thời gian để tính toán.
Giải thuật nội suy Cubic (Cubic Interpolation) là cơ sở của giải thuật BI, các
điểm ảnh nội suy trong giải thuật được xác định bởi các phần tử điểm ảnh gốc
thuộc một ma trận vuông xung quanh nó. 2.2.2. Nhận diện phương tiện
Nhận diện đối tượng chuyển động là cơ sở để xử lý ảnh trong video, từ các đối
tượng nhận dạng được có thể ước lượng và dự đoán tình huống ảnh hưởng tới
khả năng lưu thông trên đường. Các phương pháp cơ bản nhận dạng đối tượng
trong xử lý ảnh được trình bày trong [71, 72, 73] được tóm tắt lại như sau.
a. Nhóm các phương pháp nhận diện đối tượng Optical Flow:
so với một điểm gốc, tiêu biểu là nghiên cứu của Lucas–Kanade trong [74]. Áp
sự chuyển động các điểm trên vị trí bề mặt của đối tượng vào không gian ba
chiều thì hình chiếu của các điểm chuyển động đó lên một mặt phẳng hai chiều
được gọi là motion field. Từ các motion field xác định được tập hợp từ một
chuỗi hình ảnh liên tiếp nhau sẽ có được Optical Flow, phương pháp này chủ
yếu được sử dụng trong việc nhận diện các đối tượng chuyển động trong khung
hình. Phương pháp này đòi hỏi tính toán lớn và có độ nhạy cao với nhiễu, khả
năng ứng dụng trong thời gian thực là khó.
Trừ nền:
Là phương pháp được sử dụng rộng rãi nhất cho việc phát hiện đối tượng.
Phương pháp này bao gồm 2 loại, trong đó nền của bức ảnh được xác định bởi
khung hình đầu tiên hoặc trung bình khung hình trong video. Ở phương phápn
trừ nền, mỗi điểm ảnh của khung hình liên tiếp loại bỏ đi điểm ảnh của nền.
Phương trình (2.1) và (2.2) trình bày phương pháp xóa nền khi coi khung hình đầu tiên làm nền.
B a, b( ) = (A a, b .) (2.1)
Trong đó,B a, b( ) biểu diễn nền của ảnh theo điểm ảnh. Trừ nền tách các khung
hình thành đối tượng tiền cảnh và nền, ở đó, các đối tượng tiền cảnh được khám
phá bằng việc so sánh khung hình hiện tại A a, b( ) với nền ảnh B a, b( ). Theo phương trình sau:
C a, b( ) = 1 nếu B a, b − A a, b >( ) ( ) ngưỡng
0 các trường hợp còn lại . (2.2)
C a, b( ) là điểm ảnh tiền cảnh, giá trị ngưỡng có thể được đặt một cách thủ
công hoặc lựa chọn một cách tự động theo video đầu vào. Phương pháp này tiêu
tốn ít bộ nhớ. Độ chính xác của quá trình phát hiện là vừa phải.
Vi sai khung hình:
Phương pháp này được biết tới là sự quan sát khác biệt theo thời gian. Trong
đó, mỗi điểm ảnh của khung hình hiện tại phải trừ đi điểm ảnh ở vị trí này ở
khung hình trước đó. Nếu sự thay đổi vượt quá mức ngưỡng được đặt một cách
thủ công thì điểm ảnh đó được coi như thuộc tiền cảnh, ngược lại điểm ảnh đó
F a, b( ) = 1 nếu In(a, b − I ) n+1 (a, b > T)
0 các trường hợp còn lại . (2.3)
Ở đó,In là điểm ảnh thuộc khung hình trước và In+1 là điểm ảnh thuộc khung
hình hiện tại. T là giá trị ngưỡng được định nghĩa một cách thủ công bởi người
dùng. Sự tính toán của tiến trình này vừa phải và dễ dàng. Đối với các môi
trường không tĩnh, rất nhiều thử thách để có được bản phác thảo của đối tượng
đang di chuyển. Vì vậy, rất khó để đạt độ chính xác mong muốn.
Vi sai khung hình kép:
Được biết đến như chỉ ra sự khác biệt theo thời gian, trong đó mỗi điểm ảnh
thuộc khung hình hiện tại bị trừ với điểm ảnh ở vị trí này thuộc khung hình
trước đó và khung hình ngay sau nó. Nếu sự phục hồi lớn hơn mức ngưỡng đã
định nghĩa trước đó, điểm ảnh này là một điểm ảnh tiền cảnh, ngược lại điểm
ảnh đó là một điểm ảnh thay thế của điểm ảnh nền.
Cn(a, b) =D n(a, b − D ) n+1(a, b , ) (2.4) Cn+1 (a, b) =D n+1(a, b − D ) n+2 (a, b , ) (2.5) DD a, b( ) =C n(a, b − C ) n+1(a, b . ) (2.6)
Ở đó, Cn(a, b ) là kết quả điểm ảnh tiền cảnh. D n biểu thị khung hiện tại của video. Dn+1 chỉ khung kế tiếp. Tương tự như trong phương trình 2.5 Dn+1 là
khung hình hiện tại, Dn+2 là khung kế tiếp. Cuối cùng, DD a, b( ) xác định kết
quả theo phương pháp vi sai kép.
R a, b( ) = 1 nếu DD a, b > T h( )
0 các trường hợp còn lại . (2.7)
T h là giá trị ngưỡng. Nếu điểm ảnh có trị tuyệt đối chênh lệch lớn hơn giá
trị ngưỡng thì điểm ảnh được phản ánh như màu đen, các trường hợp khác, nó
được phản ánh như màu trắng. Phương pháp này chỉ ra đối tượng chuyển động
b. Biểu diễn các đối tượng
Các đối tượng di chuyển có thể được phân loại như người, phương tiện, mây
trôi, chim và các đối tượng không tĩnh khác.
Biểu diễn hình khối cơ bản:
Dữ liệu hình dạng từ các bức ảnh khác nhau của các vùng chuyển động như
mô tả, Blob và các ô gần đạt được quá trình phân loại đối tượng chuyển động.
Sự pha tạp của hình ảnh và ràng buộc đối tượng với quang cảnh như khoảng
đốm của hình ảnh, tỉ lệ đặc trưng của phần diện tích hình chữ nhật blob sẽ tạo
thành các đặc điểm đầu vào cho mạng của ảnh. Yêu cầu trên được thực hiện
trên mỗi blob ở khung tương ứng và kết quả được lưu lại dưới dạng biểu đồ.
Phân loại chuyển động:
Các đối tượng chuyển động trong khung hình thu được phân loại dựa trên
hình dạng hình khối, dữ liệu từ dấu chuyển động, thậm chí còn dựa trên sự
linh hoạt của đối tượng. Dựa trên các đặc trưng này, có thể phân loại nhóm đối
tượng chuyển động trong dữ liệu thu được.
Biểu diễn màu cơ sở:
Không như một vài đặc trưng của một bức ảnh, đặc trưng ràng buộc một
cách tương đối là thông tin màu sắc nó không thay đối và dễ để phát triển. Mặc
dù, màu sắc không thể áp dụng như các tài nguyên riêng lẻ của việc đồng nhất
hóa và theo dõi đối các đối tượng, ngay cả những tiến trình mà chúng có chi
phí tính toán nhỏ khiến màu sắc như một đặc trưng đầy ý nghĩa để thực hành
khi phù hợp. Kĩ thuật quan trọng nhất là biểu diễn màu sắc cho việc phát hiện
và theo dõi những đối tượng không tĩnh trong thời gian thực. Mô hình trộn lẫn
gauss lại được sử dụng để minh họa sự tán xạ màu sắc được bao quanh bởi cấu
trúc của hình ảnh.
Biểu diễn ngữ cảnh cơ bản:
Hệ thống dựa vào kết cấu đếm sự tồn tại của đường dốc thẳng hàng trong
những phần đã giới hạn của một ảnh. Sau đó tính thông tin trong một lưới đã
tụ lại của sự lây lan một cách nhất quán ra các tế bào và sử dụng chuẩn hóa
sự chênh lệch hẹp chồng lấn để nâng cao độ chính xác. Đặc điểm kết cấu quan
trọng để đo sự chênh lệch cường độ của bề mặt và thấy rõ với sự biểu hiện mô
2.2.3. Phân loại phương tiện
Ngày nay, giao thông thông minh được ứng dụng và nâng tầm quan trọng
đúng với sự phát triển kinh tế xã hội của các nước đang phát triển. Giám sát
phương tiện là một trong những chức năng quan trọng của ITS, các phương tiện
được phân loại bởi hệ thống quản lý giao thông theo các làn đường xe chạy,
đặc biệt là trên các tuyến đường có đặc trưng là giao thông hỗn hợp bao gồm
nhiều phương tiện là xe máy và ô-tô cùng di chuyển với nhau như ở Việt Nam.
Nghiên cứu này đề xuất một phương pháp phân loại mới dựa trên cơ sở góc tới
của phương tiện được nhận dạng bởi hệ thống camera giám sát. Kết quả của
phương pháp này có thể được sử dụng để nâng cao độ chính xác trong việc phân
loại phương tiện giao thông, nhằm mục đích giám sát và thực thi luật giao thông
đường bộ đối với các phương tiện đang di chuyển trên đường. Đề xuất nghiên
cứu này có thể ứng dụng tại các nước có tính chất giao thông hỗn hợp và được
sử dụng để kiểm tra đối với các phương tiện đi sai làn, đi sai đường và luật lệ giao thông.
Ở những nước đang phát triển, đặc trưng giao thông là hỗn hợp bao gồm
nhiều loại phương tiện như: ô-tô, xe máy, xe đạp và các phương tiện khác cùng
di chuyển trên một làn đường như Việt Nam [75]. Hệ thống giám sát các phương
tiện giao thông gồm nhiều chức năng, trong đó việc phân loại phương tiện là
một chức năng quan trọng giúp nhà chức trách có khả năng thống kê và đánh
giá xu hướng phát triển của từng dòng phương tiện. Phân loại phương tiện giúp
cho việc giám sát lưu lượng mỗi loại phương tiện trên từng làn đường. Đã có
nhiều nghiên cứu về phương pháp phân loại phương tiện như phương pháp ứng
dụng từ trường và sóng radio để thu nhận kích thước của mỗi phương tiện, các
cảm biến này được đặt gần chỗ với camera giám sát từng làn xe để theo dõi quỹ
đạo di chuyển và phân loại phương tiện đồng thời [76]. Tuy nhiên, phương pháp
này tốn kém và độ chính xác chưa cao trong kịch bản giao thông hỗn hợp. Có
một phương pháp khác được nghiên cứu trong [77, 78] cũng giám sát kích cỡ
của phương tiện, tuy nhiên chỉ áp dụng cho xe ô tô hoặc không phải là xe ô tô
và không bao gồm xe máy.
Phương pháp phân loại phương tiện sử dụng cảm biến từ trường được giới
thiệu trong [79] cũng khá chính xác, nhưng bất lợi của cách tiếp cận này là
phương pháp này không thể phân loại phương tiện trên nhiều làn đường, phương
pháp này chỉ thích hợp cho các trạm kiểm soát thu phí nơi mà các phương tiện
dài xe từ góc quét vuông góc với hướng phương tiện di chuyển để phân loại xe
dựa theo chiều dài của phương tiện.
h=6. m25
30o
Hình 2.1: Sơ đồ thiết lập hệ thống camera để thu thập dữ liệu
Các nghiên cứu được đưa ra trong [80, 81] kết hợp K-Nearest Neighbour, đặc
trưng của đường định hướng và các hình cơ sở của giải thuật Support Vector
Machines (SVM) để kết hợp và phân tích dựa trên hình dạng và dựa trên độ dốc
hình cơ sở để phân loại xe ô tô trong đường cao tốc. Giải pháp này đạt hiệu quả
cao khi hệ thống đèn giao thông và camera giám sát được chuẩn hóa với nhau.
Vì dòng xe máy hỗn hợp và các phương tiện khác là điển hình trong bối cảnh
giao thông của Việt Nam, cần phải phân loại xe máy ra khỏi xe ô tô trong một
làn đường nhiều làn xe. Do đó, bài báo này sử dụng Góc Trực tiếp (Direction
Angle) của trục chính thứ nhất (First Primary Axis - FPA) cho mỗi chiếc xe
tới được phát hiện trong trình tự video chụp bằng camera giám sát, có thể tự
ý gắn trên một con đường nhất định. Phép trừ nền [30] lần đầu tiên được thực
hiện cho trình tự khung bắt và sau đó mỗi chiếc xe được đặt và DA của FPA
được đánh giá để đưa ra quyết định trong nhiệm vụ phân loại. Các kết quả thực
nghiệm cho thấy hiệu quả phân loại cao và ngụ ý rằng cách tiếp cận này có thể
áp dụng cho quản lý giao thông ở các nước đang phát triển có khả năng là Việt
Nam, nơi có nhiều xe máy tham gia giao thông nhiều làn xe cùng với ô-tô.
2.2.4. Đo tốc độ phương tiện giao thông
Ngày nay, tự động hóa trong quản lý và giám sát giao thông là công việc
hoàn toàn tự động. Giám sát các phương tiện giao thông nhằm thực thi các
điều khoản trong Luật Giao thông đường bộ và để giao thông diễn ra an toàn,
thông suốt. Do đó, việc ứng dụng phương pháp đo tốc độ ô tô dựa trên xử lý
ảnh là việc làm quan trọng và cần thiết. Phương pháp mới được luận án đề xuất
sử dụng một camera để mô hình hóa khoảng cách từ camera tới phương tiện.
Trong phương pháp này, vị trí của phương tiện có thể xác định ứng với từng
điểm ảnh thu được dựa vào thông số lắp đặt của camera. Phương pháp này có
thể tận dụng các camera giám sát hiện có mà không cần thay đổi hay lắp thêm