2.4.1. Thuật toán phân vùng, phân cụm
Việc phân vùng, phân cụm ảnh cũng cho phép ta bóc tách đƣợc vùng ảnh biển số xe vì các pixel nằm trên vùng biển số thƣờng có cấp xám gần nhau. Phân đoạn ảnh gồm 2 kỹ thuật chính là phân chia và hợp nhất. Quá trình diễn biến nhƣ sau:
- Bƣớc 1: Định nghĩa một mẫu thử tính đồng nhất. Ta phải định nghĩa một số đo tính đồng nhất, nó có thể tích hợp cả các thông tin độ sáng, màu, kết cấu, xác định một tiêu chuẩn về vùng và phải chuyển nó cho mẫu thử tính đồng nhất.
- Bƣớc 2: Phân chia ảnh thành các vùng có kích thƣớc đều nhau. - Bƣớc 3: Tính toán số đo đồng nhất cho mỗi vùng.
- Bƣớc 4: Nếu mẫu thử tính đồng nhất đƣợc chuyển vào cho một vùng, thì một phép hợp nhất sẽ đƣợc thử với các láng giềng lân cận của nó. Nếu tiêu chuẩn không thoả mãn, thì vùng sẽ đƣợc phân chia.
- Bƣớc 5: Tiếp tục quá trình này cho đến khi tất cả các vùng đều đƣợc thử với mẫu thử.
Quá trình phân cụm đƣợc thực hiện nhƣ sau:
- Bƣớc 1: Xét toàn bộ ảnh nhƣ là một vùng và tính toán các histogram (2.23)
45
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
cho ảnh đó.
- Bƣớc 2: Tìm kiếm đỉnh của histogram. Chọn ra đỉnh tốt nhất và đặt các ngƣỡng ở ngay một trong hai bên của đỉnh đó. Phân đoạn ảnh thành 2 vùng dựa vào đỉnh này.
- Bƣớc 3: Phân ngƣỡng nhị phân sao cho chỉ còn một vùng con kết nối (liên thông) đƣợc để lại.
- Bƣớc 4: Lặp lại các bƣớc 1-3 cho mỗi vùng cho đến khi không còn vùng con mới có thể thể tạo ra đƣợc, tức là, khi đó không còn histogram nào có các đỉnh có ý nghĩa.
Trong hình 2.8 là các hình ảnh kết quả xử lý qua các bƣớc trung gian có sử dụng các kỹ thuật trên để bóc tách vùng biển số của một ảnh ô tô:
a) Ảnh đầu vào b) Phân ngƣỡng tự động c) Kết quả bóc tách Hình 2.8. Minh họa kết quả xử lý trung gian để bóc tách ảnh biển số xe
2.4.2. Thể hiện đƣờng biên
Với các kỹ thuật dò biên ở trên, ta thu đƣợc đƣờng biên của đối tƣợng. Đƣờng biên là một chu tuyến (tuyến đóng) P = [g0, g1, … gn]. Giả sử P = [g0, g1, … gn] là đƣờng biên của đối tƣợng. Để mô tả P, trƣớc hết ta cần thể hiện P bằng một dãy số thực hoặc số phức uk, k = 0..n.
- Mô tả dạng tọa độ phức: Sử dụng các tọa độ của các điểm trên đƣờng biên.
46
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
uk = xk + iyk ; k = , i là đơn vị phức i2
= -1 (2.24)
- Mô tả dạng khoảng cách đến trọng tâm (bán kính-vectơ): sử dụng hàm
khoảng cách từ các điểm trên đƣờng biên đến trọng tâm.
(2.25)
Trong đó:
Ngoài ra còn một số dạng mô tả khác nhƣ hàm về diện tích, hàm về góc tích lũy, hàm tín hiệu độ cong…
a) Biểu diễn đƣờng biên b) Khoảng cách đến c) Thể hiện khoảng cách trọng tâm Hình 2.9. Minh họa một số cách biểu diễn đƣờng biên
2.4.2.1. Thuật toán nhị phân ảnh đầu vào
Nhị phân hoá ảnh đầu vào là chuyển ảnh đầu vào thành một ảnh đen trắng. Bằng cách này, ta hoàn toàn có thể trích rút ra đƣợc các thông tin cần thiết về các đối tƣợng có mặt trong ảnh nhƣ: diện tích, chu vi, hƣớng của đối tƣợng, toạ độ trọng
(2.26)
47
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
tâm, tỉ lệ dẹt,… Phép nhị phân hoá ảnh đầu vào đƣợc thực hiện bằng phép phân ngƣỡng.
Trong đó, I là ảnh đầu vào, BW là ảnh đen trắng đầu ra, là ngƣỡng đã đƣợc
chọn trƣớc. Ngƣỡng có thể chọn tự động sử dụng thuật toán Otsu. Trên hình
2.10 là kết quả phép tách cạnh ảnh đầu vào tự động, sử dụng thuật toán Otsu.
a) Ảnh đầu vào b) Ảnh sau khi đƣợc phân ngƣỡng Hình 2.10 minh họa kết quả ảnh sau khi phân ngƣỡng
2.4.2.2. Thuật toán tách cạnh, dò biên
Các điểm nằm trên biên (cạnh) của đối tƣợng trong ảnh có tính chất là tại đó biến thiên độ sáng lớn. Việc tìm ra biên của các đối tƣợng cho phép ta định hình đƣợc vùng đối tƣợng. Mặt khác, biên đối tƣợng có những đặc tính bất biến cho phép ta định hình đƣợc vùng biển số đối với các ảnh xe đƣợc chụp trong các điều kiện sáng khác nhau. Để tách cạnh, ta sử dụng các toán tử tách cạnh dựa trên xấp xỉ các toán tử vi phân. Sau đây là một số toán tử tách cạnh đƣợc nghiên cứu xây dựng phục vụ cho mục đích của bài toán:
a) Toán tử Sobel:
48
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
Thực hiện phép cuộn ảnh với mặt nạ tách cạnh Sobel cho phép tìm kiếm các cạnh theo cả các hƣớng ngang và dọc và sau đó tổ hợp thông tin này vào trong cùng một metric. Các mặt nạ Sobel nhƣ sau:
Mặt nạ hàng Mặt nạ cuộn
Các mặt nạ này đƣợc cuộn với ảnh. Tại mỗi vị trí pixel bây giờ ta có hai số: s1
tƣơng ứng với kết quả từ mặt nạ hàng, và s2 tƣơng ứng với kết quả từ mặt nạ cột. Ta sử dụng các số này để tính toán hai metrics, là cƣờng độ cạnh và hƣớng cạnh đƣợc định nghĩa nhƣ sau:
Cƣờng độ cạnh: (2.29)
Hƣớng cạnh: (2.30)
Hƣớng cạnh vuông góc với cạnh bởi vì hƣớng cạnh đã xác định là hƣớng của gradient, mà dọc theo đó các mức xám đang thay đổi.
b) Toán tử Prewitt:
Thực hiện tƣơng tự toán tử Sobel nhƣng sử dụng mặt nạ Prewitt. Các mặt nạ đƣợc định nghĩa nhƣ sau:
49
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
Sử dụng 2 ngƣỡng khác nhau (để dò tìm các cạnh mạnh và yếu), và gồm cả các cạnh yếu trong ảnh đầu ra chỉ khi chúng đƣợc nối liền với các cạnh mạnh. Toán tử này kém thích hợp hơn các toán tử trên khi ảnh bị “fooled” bởi nhiễu, và thích hợp hơn khi cần tìm ra cả các cạnh yếu.
a) ảnh gốc b) kết quả tách cạnh Sobel
c) Kết quả tách cạnh Prewitt d) Kết quả tách cạnh Canny Hình 2.11. Minh họa kết quả của các toán tử Sobel, Prewitt, Canny
2.4.3. Thể hiện đƣờng biên bằng hàm bán kính - vectơ
Thƣờng thì các đƣờng biên của hình đƣợc mô tả bởi các hàm bán kính –
vectơ đƣợc định nghĩa theo cách sau. Một điểm tham chiếu O nằm trong hình X
50
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
tâm của lực hấp dẫn, hoặc là trung tâm của đĩa nhỏ nhất mà chứa hoàn toàn hình hoặc một điểm vật lý quan trọng. Tiếp theo, chọn một trục tham chiếu thích hợp đi qua điểm O – điểm tham chiếu đƣợc chọn, thƣờng là song song với trục x
hoặc trục y. Hàm bán kính - vectơ rx( ), là hàm khoảng cách từ điểm O tới các
đƣờng biên theo hƣớng góc , trong đó .
Hình 2.12. Minh họa hàm bán kính - véc tơ
Đối với bất kỳ điểm biên p thì các đoạn thẳng từ O sẽ làm cho p nằm trong hình vẽ. trong trƣờng hợp này hàm bán kính – vectơ hoàn thành việc nối hình:
nếu rx( ) đƣợc cho, so với hình vẽ có thể đƣợc tái tạo lại hoàn toàn. Nếu hình
lồi nhỏ bị vi phạm chỉ bởi bất thƣờng nhỏ ở đƣờng biên của nó thì có thể phục hồi nó bằng cách làm mịn.
Đối với vấn đề phân tích hình dạng quan trọng là phải biết hàm bán kính -
vectơ rx( ) của một hình X phụ thuộc nhƣ thế nào vào các phép biến đổi hình
học cơ bản nhƣ: sự dịch chuyển, thay đổi kích cỡ, xoay và phản xạ và các tính năng khác nó có. Hàm bán kính - vectơ rx( ) của một hình lồi X có tính chất:
(1) Bất biến đối với sự dịch chuyển: ở đây X+v là X thay
đổi của vector v;
(2) Phụ thuộc tuyến tính vào những thay đổi kích thƣớc của hình X:
51
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
(3) Phụ thuộc vào hƣớng của hình X: ở đây Y chính là
hình X quay một góc.
(4) Không phải là bất biến theo sự phản xạ;
(5) Là tuần hoàn với chu kỳ 2 :
(6) Thực tế, hình lồi X là một tập hợp của các hình lồi Y (X ) do đó
Ánh xạ X biến đổi hình lồi thành các thành phần của hàm không gian;
hàm bán kính – vectơ của các hình lồi liên tục trong ; Do đó chúng có thể đƣợc
nhúng trong không gian Banach C của các hàm liên tục trong .
Khi hàm bán kính – vectơ của một hình lồi X có sẵn một số các thông
số hình học có thể thu đƣợc chu vi P(X), diện tích A(X) của và độ dài của
bán kính – vectơ sử dụng các công thức:
2.4.4. Mô tả và trích chọn đặc trƣng biên ảnh
Có nhiều cách để mô tả đƣờng biên (chu tuyến) theo các ứng dụng khác nhau, có thể kể đến nhƣ phƣơng pháp biển đổi Fourier, sử dụng phép biến đổi wavelet, sử dụng phép biến đổi khoảng cách, khoảng cách Hausdorff, dùng mô men biên… Phƣơng pháp sử dụng phép biến đổi Fourier trong mô tả đƣờng biên ảnh đối tƣợng là một trong những cách tiệp cận đủ mạnh cho phép giải quyết nhiều bài toán thực tế.
(2.31) (2.32)
52
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
Phép biến đổi Fourier sử dụng chain code để mô tả về đƣờng biên của đối tƣợng ảnh. Chain Code đầu tiên mô tả của Freeman là một đƣờng biên liên tục bằng một đoạn tuyến tính mà bao gồm tám đoạn đƣờng chuẩn hóa. Mã của một đƣờng biên là chuỗi V của độ dài K, V = a1a2….ak, nơi mà mỗi một liên kết ai là
một số nguyên giữa 0 và 7 định hƣớng /4 theo hƣớng chiều kim đồng hồ truy
cập từ trục X của một XY phối hợp hệ thống của chiều dài 1 hoặc 2 phụ thuộc, tƣơng ứng. Các đại diện của liên kết vector ai, bằng cách sử dụng ký hiệu
phasor, là i a a 4 ) ) 1 ( 1 ( 2 1 2 1 ( 1
. Tiếp theo, tôi lây thí dụ về chain code
trong hình 2.14 nhƣ sau: V1=0005676644422123
Hình 2.13. Minh họa về chain code mô tả đƣờng biên của đối tƣợng ảnh Để có thể mô tả một chu tuyến của đối tƣợng ảnh dƣới dạng số, ngƣời ta có thể lƣu trữ theo phối hợp của một chuỗi các điểm ảnh trong ảnh đó. Hay là ngƣời ta có thể chỉ lƣu trữ vị trí tƣơng đối giữa các điểm ảnh liên tiếp. Đó chính là ý tƣởng cơ bản của mã chuỗi. Mã chuỗi là một trong các kỹ thuật lâu nhất trong lĩnh vực thị giác máy tính (computer vision). Kỹ thuật này đƣợc giới thiệu từ năm đầu thập niên 60 của thế kỷ 20 bởi Freeman, và tiếp tục đƣợc ông phát triển và xem xét đến năm 1974. Với mã chuỗi, tập các điểm ảnh trong đƣờng biên một hình dạng của đối tƣợng ảnh đƣợc chuyển sang một tập các kết nối giữa chúng. Về cơ bản nguyên lý của mã chuỗi nhƣ sau: khi chúng ta thu đƣợc một đƣờng biên hoàn chỉnh thì đó là một tập các điểm ảnh đã đƣợc liên kết với
53
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
nhau, sau đó bắt đầu từ 1 trong các điểm ảnh đó chúng ta cần xác định chiều đến các điểm ảnh tiếp theo trong đƣờng biên đó. Cụ thể là, điểm tiếp theo là một trong những điểm liền kề theo chiều kim của đồng hồ. Do đó, các mã chuỗi đƣợc hình thành bởi sự móc nối một số chỉ rõ chiều của điểm ảnh tiếp theo. Với một điểm ảnh thu đƣợc thì chiều kế tiếp từ điểm ảnh đó tới điểm ảnh tiếp theo trở thành phần tử trong mã cuối. Quá trình này sẽ đƣợc lặp cho mỗi điểm ảnh đến tận khi tới điểm bắt đầu. Khi đó, hình dạng của đối tƣợng ảnh đƣợc phân tích hoàn toàn. Việc xác định những kết nối của mã chuỗi có thể đƣợc xuất phát từ nguyên lý của 4-láng giềng và 8-láng giềng nhƣ minh họa trong hình 2.15
a) b)
Hình 2.14. Minh họa sự kết nối của mã chuỗi theo nguyên lý 4-láng giềng, và 8-láng giềng; a)4-láng giềng; b) 8-láng giềng; c) sự kết nối của các mã chuỗi
theo cách 4-kết nối; d) sự kết nối các mã chuỗi theo cách 8-kết nối
Tƣơng ứng với chỉ số trong hình 2.15, mã code của điểm P sẽ đƣợc đánh số từ 0 đến 3 đối với 4-kết nối, và đánh số từ 0 đến 7 đối với 8-kết nối, chỉ số này tăng theo chiều kim đồng hồ.
54
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
a) b) c) Hình 2.15. Minh họa mã chuỗi bởi các kết nối khác nhau
a) Đối tƣợng ảnh; b) mã chuỗi với 4-kết nối; c) mã chuỗi với 8-kết nối Tiếp theo, tôi minh họa cách tính mã chuỗi của đối tƣợng ảnh nhƣ hình 2.16. Trong trƣờng hợp này, chúng tôi đã xác định chiều của điểm bắt đầu là từ hƣớng nam, nên thành phần đầu tiên của mã chuỗi là 2 đối với 4-kết nối, và là 3 đối với 8-kết nối. Chiều từ điểm P1 điểm tiếp theo, điểm P2 theo hƣớng đông, nên thành phần mã chuỗi tiếp theo là 1 đối với 4-kết nối, nhƣng đối với 8-kết nối hƣớng của P2 là nam, nên thành phần tiếp theo của mã chuỗi là 4.
Điểm tiếp theo sau P2 là P3 có hƣớng nam nên thành phần tiếp theo có mã là 2 đối với 4-kết nối, còn với 8-kết nối thì hƣớng của P3 là hƣớng đông nam, nên thành phần tiếp theo có mã là 3. Quá trình này đƣợc lặp đi lặp lại đến khi đến điểm P23 đƣợc kết nối về phía đông để tới điểm băt đầu, do đó thành phần mã cuối cùng sẽ là 1 đối với 4-kết nối, và là 2 đối với 8-kết nối. Do đó, mã chuỗi của ảnh trong hình 3.2(a) với 4-kết nối và 8-kết nối tƣơng ứng là nhƣ sau:
code4-kết nối = {2,1,2,2,12,2,3,2,2,3,0,3,0,3,0,0,1,0,1,0,1} code8-kết nối = {3,4,3,4,4,5,4,6,7,7,7,0,0,1,1,2}
Nhƣ vậy, chúng ta thấy rằng mã chuỗi sẽ khác nhau nếu nhƣ điểm bắt đầu khác nhau. Do đó, chúng ta cần phải có điểm bắt đầu xác định trƣớc và bất biến.
55
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
CHƢƠNG 3
CHƢƠNG TRÌNH THỬ NGHIỆM 3.1. BÀI TOÁN
Hiện nay ở Việt Nam cùng với sự phát triển kinh tế thì quy mô dân số và đời sống của nhân dân cũng phát triển không ngừng dẫn đến sự gia tăng của các phƣơng tiện giao thông đƣờng bộ. Bởi vậy, tình trạng giao thông tại các thành phố lớn ở nƣớc ta hiện nay rất phức tạp luôn xảy ra ùn tắc giao thông, vi phạm luật lệ giao thông và tai nạn. Theo số liệu thống kê của Cục đƣờng bộ Việt Nam, quốc lộ và đƣờng cao tốc là nơi có lƣu lƣợng giao thông lớn, các phƣơng tiện chạy ở vận tốc cao, việc chấp hành luật lệ giao thông của tài xế còn nhiều hạn chế, thƣờng xuyên phóng nhanh, vƣợt ẩu. Do đó tỷ lệ các vụ tai nạn thƣờng xảy ra trên đƣờng quốc lộ và cao tốc.
Ở các nƣớc trên thế giới việc ứng dụng xử lý ảnh và xây dựng hệ thống giám sát giao thông dùng camera sẽ tự động phát hiện và ghi nhận các tình huống vi phạm Luật Giao thông nhằm tăng cƣờng sự giám sát, phát hiện và xử lý kịp thời các vi phạm, chỉ huy điều khiển giao thông, hạn chế tai nạn và nâng cao ý thức chấp hành Luật Giao thông.
Hệ thống theo dõi hoạt động giao thông đƣờng bộ bằng camera đƣợc phân làm 2 loại: một loại camera thu hình liên tục hoạt động của các phƣơng tiện giao