Do vậy, vấn đề nhận dạng trong xử lý ảnh, đặc biệt là so khớp, phân loại, nhận dạng đối tượng ảnh chuyển động đang được quan tâm của nhiều nhà nghiên cứu bởi tính khoa học và ứng dụng đa
Trang 11
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
MỤC LỤC
MỤC LỤC 1
MỞ ĐẦU 4
CHƯƠNG 1 6
TỔNG QUAN VỀ XỬ LÝ ẢNH VÀ SO KHỚP ĐỐI TƯỢNG 6
1.1 TỔNG QUAN VỀ XỬ LÝ ẢNH 6
1.1.1 Xử lý ảnh 6
1.1.2 Quá trình thu nhận ảnh 7
1.1.3 Biểu diễn và thể hiện ảnh 7
1.1.4 Histogram của ảnh 10
1.1.5 Độ phân giải của ảnh 11
1.1.6 Biên của ảnh 12
1.1.6.1 Phương pháp phát hiện biên trực tiếp 13
1.1.6.2 Phương pháp phát hiện biên gián tiếp 16
1.1.7 Phân ngưỡng ảnh 19
1.1.8 Nhận dạng ảnh 20
1.1.9 Cấu trúc phân cấp của video 23
1.1.10 Một số thuộc tính đặc trưng của video 24
1.2 SO KHỚP ĐỐI TƯỢNG 26
1.2.1 Khái niệm so khớp 26
1.2.2 Khớp ảnh sử dụng phép đối sánh pixel-pixel 26
1.2.3 Khớp ảnh sử dụng tương quan chéo 26
CHƯƠNG 2 29
MỘT SỐ KỸ THUẬT TRONG BẮT BÁM VÀ SO KHỚP ĐỐI TƯỢNG CHUYỂN ĐỘNG 29
2.1 GIỚI THIỆU 29
2.2 KỸ THUẬT TRỪ ẢNH THEO KHUNG ẢNH 31
2.2.1 Trừ ảnh dựa vào điểm ảnh 33
2.2.2 Trừ ảnh phân khối 34
Trang 22
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
2.2.3 Phương pháp biểu đồ 35
2.2.4 Biểu đồ toàn cục 36
2.2.5 Biểu đồ cục bộ 37
2.3 KỸ THUẬT BẮT BÁN DỰA VÀO PHÉP TRỪ NỀN VÀ TRÍCH CHỌN ĐƯỜNG VIỀN CỦA ĐỐI TƯỢNG CHUYỂN ĐỘNG 38
2.3.1 Trừ nền 38
2.3.2 Trích chọn đường viền và gán nhãn 40
2.3.3 Bám đối tượng 40
2.4 ĐẶC TRƯNG BIÊN TRONG SO KHỚP ĐỐI TƯỢNG 44
2.4.1 Thuật toán phân vùng, phân cụm 44
2.4.2 Thể hiện đường biên 45
2.4.2.1 Thuật toán nhị phân ảnh đầu vào 46
2.4.2.2 Thuật toán tách cạnh, dò biên 47
2.4.3 Thể hiện đường biên bằng hàm bán kính - vectơ 49
2.4.4 Mô tả và trích chọn đặc trưng biên ảnh 51
CHƯƠNG 3 55
CHƯƠNG TRÌNH THỬ NGHIỆM 55
3.1 BÀI TOÁN 55
3.2 MÔ HÌNH HỆ THỐNG GIÁM SÁT GIAO THÔNG TỰ ĐỘNG BẰNG CAMERA 56
3.3 PHÂN LUỒNG GIAO THÔNG DỰA TRÊN NGUYÊN LÝ BÁM ĐỐI TƯỢNG 57
3.3.1 Đặt vấn đề 57
3.3.2 Hoạt động của hệ thống phân luồng giao thông 59
3.3.3 Thuật toán bắt bám đối tượng 61
3.3.4 Thuật toán tính vận tốc chuyển động của đối tượng 62
3.3.5 Thuật toán phân loại phương tiện dựa trên kích thước 63
3.3.6 Thuật toán tính toán mật độ làn đường 64
3.3.7 Thuật toán phát hiện phương tiện theo làn đường 65
3.3.8 Thuật toán phát hiện chiều chuyển động của đối tượng 66
3.3.9 Nhận dạng biển số xe 68
Trang 33
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
3.4 KẾT QUẢ CÀI ĐẶT 71
KẾT LUẬN 75
Trang 4Do vậy, vấn đề nhận dạng trong xử lý ảnh, đặc biệt là so khớp, phân loại, nhận dạng đối tượng ảnh chuyển động đang được quan tâm của nhiều nhà nghiên cứu bởi tính khoa học và ứng dụng đa dạng
Đồng thời, với sự phát triển không ngừng của khoa học và tốc độ xử lý của máy tính thì ứng dụng lĩnh vực thị giác máy tính và xử lý ảnh đang ngày càng được phát triển và nghiên cứu mạnh mẽ
Bên cạnh đó, các loại phương tiện giao thông đường bộ ở Việt Nam đã và đang phát triển mạnh mẽ cả về số lượng và chủng loại Bởi vậy, việc quản lý phân luồng, phân loại, xử lý vi phạm trong giao thông đường bộ đang trở thành một chủ đề thu hút được sự quan tâm của nhiều nhà quản lý và khoa học nhằm xây dựng được các hệ thống giám sát giao thông đường bộ tự động
Trên thế giới, hệ thống giám sát phương tiện giao thông tự động đã được phát triển và ứng dụng ở nhiều nước trên thế giới Những hệ thống này giúp chúng ta quản lý được vấn đề như phân luồng xe, đánh giá lưu lượng xe, phát hiện được
xe vi phạm Luật Giao thông nhằm tăng cường giám sát, phát hiện và xử lý kịp thời các vi phạm, hạn chế tai nạn và nâng cao ý thức chấp hành Luật Giao thông
Từ đó, nhà quản lý có thể đưa ra những giải pháp quản lý giao thông đường bộ phù hợp
Trang 55
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
Chính vì vậy, em chọn đề tài “Nghiên cứu một số kỹ thuật so khớp và nhận dạng ứng dụng vào hệ thống giám sát giao thông tự động” nhằm mục đích nghiên cứu kỹ thuật so khớp, kết hợp nhận dạng biên để phát hiện những phương tiện giao thông vi phạm luồng giao thông đường bộ Luận văn được bố cục như sau:
Chương 1: Tổng quan về xử lý ảnh và so khớp đối tượng
Chương 2: Một số kỹ thuật trong bắt bám và so khớp đối tượng
Chương 3: Chương trình thử nghiệm
Trang 6
6
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
CHƯƠNG 1 TỔNG QUAN VỀ XỬ LÝ ẢNH VÀ SO KHỚP ĐỐI TƯỢNG
1.1 TỔNG QUAN VỀ XỬ LÝ ẢNH
1.1.1 Xử lý ảnh
Xử lý ảnh(Image processing) là đối tượng nghiên cứu của lĩnh vực thị giác
máy, là quá trình biến đổi từ một ảnh ban đầu sang một ảnh mới với các đặc tính
mà tuân theo ý muốn cuả việc xử lý Xử lý ảnh có thể là quá trình phân tích, phân lớp các đối tượng, làm tăng chất lượng, phân đoạn và tìm biên, gán nhãn cho vùng hay quá trình biên dịch các thông tin hình ảnh của ảnh Hình dưới sẽ minh họa các giai đoạn chính trong quá trình xử lý ảnh
Hình 1.1 Các giai đoạn chính trong quá trình xử lý ảnh nhận dạng
Chúng ta có thể tóm lược quá trình xử lý nhận dạng ảnh được xem như là quá trình thao tác ảnh đầu vào nhằm cho ra kết quả mong muốn Kết quả đầu ra của một quá trình xử lý ảnh có thể là một ảnh “tốt hơn” hoặc đưa ra được kết luận về ảnh đó Hình 1.2 mô tả vắn tắt quá trình này
Trang 7là qúa trình số hoá Số hoá là quá trình rời rạc hoá về không gian và lượng tử hoá về giá trị.Quá trình rời rạc hoá về không gian là quá trình thu nhận những điểm rời rạc từ một ảnh liên tục, nhưng phải đảm bảo bằng mắt thường không phân biệt được hai điểm kề nhau Quá trình này cũng chính là việc tìm cách biểu diễn cả một ảnh lớn có vô số điểm, bởi một số hữu hạn điểm, sao cho không làm mất đi hay thay đổi tính chất của ảnh, để việc lưu trữ và xử lý ảnh được dễ dàng Còn quá trình lượng tử hoá về giá trị là quá trình rời rạc hoá về mặt giá trị để có thể đơn giản hoá việc tính toán và đưa vào máy để xử lý Tuỳ theo từng loại ảnh,
độ chính xác yêu cầu và khả năng xử lý của máy tính mà ta có các mức lượng tử thích hợp Ví dụ với ảnh 256 cấp xám, ta phải dùng 256 mức lượng tử và biểu diễn trong máy tính bằng 8 bits
1.1.3 Biểu diễn và thể hiện ảnh
1.1.3.1 Ảnh chỉ số
Một ảnh chỉ số gồm 1 ma trận dữ liệu X và một ma trận bảng màu Map Mỗi hàng của Map xác định các thành phần đỏ, xanh lá cây, xanh da trời của một màu đơn Một ảnh chỉ số sử dụng “ánh xạ trực tiếp” các giá trị pixel lên các giá
Trang 88
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
trị bảng màu (colormap) Màu của mỗi pixel của ảnh được xác định bằng cách
sử dụng giá trị tương ứng của X như là chỉ số vào trong Map Giá trị 1 trỏ đến hàng thứ nhất trong Map, giá trị 2 trỏ đến hàng thứ hai, v.v
Một bảng màu thông thường được chứa trong cùng một ảnh chỉ số Tuy nhiên, ta có thể sử dụng bất cứ bảng màu nào Hình vẽ dưới đây minh hoạ cấu trúc của một ảnh chỉ số Các pixel trong ảnh được thể hiện bằng các số nguyên
mà chúng trỏ đến các giá trị được lưu trong bảng màu
Hình 1.3 Minh họa ảnh chỉ số
1.1.3.2 Ảnh cường độ
Một ảnh cường độ là một ma trận dữ liệu I mà các giá trị của nó thể hiện các cường độ sáng trong phạm vi một vài khoảng nào đó Các phần tử trong ma trận cường độ thể hiện các cường độ sáng khác nhau hoặc là các cấp xám, trong đó cường độ 0 thông thường thể hiện màu đen và cường độ 1, 255, hoặc 65535 thể hiện cường độ lớn nhất có thể hoặc màu trắng
Trang 9Hình 1.5 Minh họa ảnh nhị phân
1.1.3.4 Ảnh RGB
Một ảnh RGB, đôi khi còn đƣợc gọi là ảnh “true-color”, là một mảng dữ liệu m*n*3 xác định các thành phần màu red, green, và blue cho mỗi pixel riêng biệt
Trang 1010
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
Các ảnh RGB không sử dụng bảng màu Màu của mỗi pixel được xác định bởi
tổ hợp các cường độ red, green và blue lưu trong một mặt phẳng màu tại vị trí của pixel Các khuôn dạng file đồ hoạ lưu các ảnh RGB như là các ảnh 24-bit, trong đó mỗi thành phần red, green, blue là 1byte Điều này cho phép có đến 16 triệu màu Độ chính xác tái tạo được với ảnh thực tế dẫn đến tên hiệu là “ Ảnh true color”
Hình 1.6 Minh họa ảnh RGB
Để xác định màu của pixel tại vị trí (2,3), ta sẽ nhìn vào bộ 3 RGB lưu trong (2,3,1:3) Giả sử (2,3,1) chứa giá trị 0.5176, (2,3,2) chứa 0.1608, và (2,3,3) chứa 0.0627 Khi đó màu của pixel (2,3) là: 0.5176 0.1608 0.0627
1.1.4 Histogram của ảnh
Như ta đã biết, mỗi điểm có một giá trị độ sáng nào đó Histogram của ảnh là
đồ thị cho biết tần suất hiện các điểm ảnh với các mức biến thiên độ sáng Lược
đồ histogram được biểu diễn trong một hệ toạ độ 2 chiều, trục hoành biểu diễn các mức xám từ 0 đến N, với N là số mức xám Trục tung biểu diễn số điểm ảnh cho một mức xám (tức là số điểm ảnh có cùng mức xám), hoặc biểu diễn tỉ lệ số điểm ảnh có cùng mức xám trên tổng số điểm ảnh
Lược đồ xám cung cấp rất nhiều thông tin về phân bố mức xám của ảnh Theo thuật ngữ của xử lí ảnh gọi là tính động của ảnh Tính động cho phép phân tích
Trang 1111
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
được mật độ phân bố của phần lớn các mức xám Nếu ảnh sáng thì lược đồ xám tập trung bên phải (mức xám cao), còn ảnh đậm thì lược đồ xám tập trung bên trái Từ kết quả histogram của ảnh, chỉ cho ta nhìn nhận tổng quát quá trình phân
bố giải độ sáng trên ảnh, chứ không cho ta biết kết cấu chi tiết của ảnh Ngoài ra, căn cứ vào số đỉnh trên histogram của ảnh sẽ có sự nhìn nhận ban đầu về số vùng của ảnh Đó là cơ sở cho việc phân vùng ảnh và tìm biên sau này, đặc biệt
là phương pháp tìm biên gián tiếp
Thí dụ: Có một ảnh 100 điểm , độ sáng của ảnh được phân thành 5 mức sáng: level1, level2, , level 5 Như vậy, số điểm ảnh của các mức tương ứng là
20, 25, 10, 30, 15 Như vậy tần suất hiện của các điểm ảnh ở mức tương ứng là 20% , 25%, 10%, 30%, 15% với ảnh này ta có histogram của ảnh như hình 1.7
Hình 1.7 Minh họa Histogram của ảnh
1.1.5 Độ phân giải của ảnh
Độ phân giải (Resolution) của ảnh là mật độ điểm ảnh được ấn định trên một ảnh số được hiển thị Trong đó, khoảng cách giữa các điểm ảnh phải được chọn sao cho mắt người vẫn thấy được sự liên tục của ảnh Việc lựa chọn khoảng cách thích hợp tạo nên một mật độ phân bố, đó chính là độ phân giải và được phân bố theo trục x và y trong không gian hai chiều
Trang 1212
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
Độ phân giải của ảnh trên màn hình CGA (Color Graphic Adaptor) là một lưới điểm theo chiều ngang màn hình: 300 điểm chiều dọc * 200 điểm ảnh (320*200) Rõ ràng, cùng màn hình CGA 12‟‟ ta nhận thấy mịn hơn màn hình CGA 17‟‟ độ phân giải 320*200 Điều mày do cùng một mật độ (độ phân giải) nhưng diện tích màn hình rộng hơn thì độ mịn (liên tục của các điểm) kém hơn
1.1.6 Biên của ảnh
Biên (hay đường biên) có thể hiểu đơn giản là các đường bao của các đối tượng trong ảnh Đường biên được tạo thành từ các điểm biên Về mặt toán học người ta gọi điểm biên của ảnh là điểm có sự biến đổi đột ngột về mức xám Trong ảnh nhị phân, một điểm có thể gọi là biên nếu nó là điểm đen và có ít nhất một điểm trắng lân cận Xuất phát từ đặc điểm sự biến thiên giữa các điểm ảnh thường là nhỏ trong khi sự biến thiên độ sáng của điểm biên (khi qua biên) lại khá lớn Hiện nay, để phát hiện biên người ta thường sử dụng một trong hai phương pháp:
Phương pháp phát hiện biên trực tiếp: phương pháp này làm nổi biên dựa
vào sự biên thiên về giá trị độ sáng của điểm ảnh Kỹ thuật chủ yếu dùng phát hiện biên ở đây là kỹ thuật đạo hàm Các kỹ thuật đạo hàm được sử dụng phổ biến bao gồm kỹ thuật Gradient (đạo hàm bậc nhất) và kỹ thuật Laplace (đạo hàm bậc hai)
Phương pháp phát hiện biên gián tiếp: bằng cách phân ảnh thành các
vùng thì đường phân ranh giữa các vùng đó được coi là biên Việc phân vùng này thường dựa vào kết cấu bề mặt của ảnh
Kỹ thuật dò biên và phân vùng ảnh là 2 bài toán đỗi ngẫu nhau Dò biên là để thực hiện phân lớp đối tượng, một khi đã phân lớp xong có nghĩa là đã phân vùng được ảnh Và ngược lại, khi đã phân vùng, ảnh được phân lập thành các
Trang 1313
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
đối tượng, ta có thể phát hiện được biên Điều này nói lên tầm quan trọng của việc tìm biên trong phân tích ảnh, vì để phân lớp các đối tượng thì hầu hết chúng
ta phải tìm biên hoặc phân vùng ảnh, tuy nhiên phân vùng ảnh lại cũng có thể thực hiện được thông qua việc tìm biên
1.1.6.1 Phương pháp phát hiện biên trực tiếp
a) Kỹ thuật phát hiện biên Gradient
Theo định nghĩa, gradient là một véctơ có các thành phần biểu thị tốc độ thay đổi giá trị của điểm ảnh, ta có:
(1.2)
Hay
dx
y x f y dx x f x
y x f
y x f
mô phỏng và xấp xỉ đạo hàm bằng các kỹ thuật nhân chập (phép cuộn) Trong
kỹ thuật Gradient người ta chia nhỏ thành hai kỹ thuật (do sử dụng các toán tử nhân chập khác nhau) là kỹ thuật Gradient và kỹ thuật la bàn Kỹ thuật Gradient dùng toán tử Gradient lấy đạo hàm theo một hướng, còn kỹ thuật la bàn dùng toán tử la bàn lấy đạo hàm theo 8 hướng của tất cả các điểm ảnh cạnh nó Hình 1.8 minh họa mô hình 8 hướng Có khá nhiều toán tử đạo hàm đã được áp dụng
dy
y x f dy y x f fy y
y x f
dx
y x f y dx x f fx x
y x f
),(),
()
,(
),(),(
),(
Trang 1414
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
Các toán tử sử dụng kỹ thuật Gradient đáng kể nhất là toán tử Robert, Sobel và Prewitt còn toán tử la bàn hay được sử dụng là toán tử Krish
Hình 1.8 Minh họa mô hình 8 hướng
b) Kỹ thuật phát hiện biên Laplace
Các phương pháp đánh giá gradient ở trên làm việc khá tốt khi mà độ sáng thay đổi rõ nét Khi mức xám thay đổi chậm, miền chuyển tiếp trải rộng, phương pháp cho hiệu quả hơn đó là phương pháp sử dụng đạo hàm bậc hai Laplace Toán tử Laplace được định nghĩa như sau:
(1.3) Tương tự
(1.4) Vậy:
(1.5)
Trang 15010H
c) Kỹ thuật Canny
Đây là một thuật toán tương đối tốt, có khả năng đưa ra đường biên mảnh,
và phát hiện chính xác điểm biên với điểm nhiễu Thuật toán được mô tả theo những bước sau:
491294
51215125
491294
24542
115
1
H
Gọi G là kết quả lọc nhiễu: G = I H
Bước 2: Tính gradient của ảnh bằng mặt nạ PreWitt, kết quả đặt vào Gx,Gy
Trang 1616
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
Gx = G Hx, Gy = G Hy
Bước 3: Tính gradient hướng tại mỗi điểm (i,j) của ảnh Hướng này sẽ được
nguyên hóa để nằm trong 8 hướng [0 7], tương đương với 8 lân cận của một điểm ảnh
Bước 4: Dùng ràng buộc “loại bỏ những điểm không phải là cực đại” để xóa
bỏ những điểm không là biên Xét (i,j), là gradient hướng tại (i, j) I1, I2 là hai điểm lân cận của (i,j) theo hướng Theo định nghĩa điểm biên cục bộ thì (i,j) là biên nếu I(i,j) cực đại địa phương theo hướng gradient Nếu I(i,j)
> I1 và I(i,j) > I2 thì mới giữ lại I(i,j), ngược lại xóa I(i,j) về điểm ảnh nền
Bước 5: Phân ngưỡng với các điểm được giữ lại, thực hiện lấy ngưỡng
gradient biên độ lần cuối để xác định các điểm biên thực sự
1.1.6.2 Phương pháp phát hiện biên gián tiếp
Biểu diễn đối tượng ảnh theo chu tuyến thường dựa trên các kỹ thuật dò biên Có hai kỹ thuật dò biên cơ bản Kỹ thuật thứ nhất xét ảnh biên thu được từ ảnh vùng sau một lần duyệt như một đồ thị, sau đó áp dụng các thuật toán duyệt cạnh đồ thị Kỹ thuật thứ hai dựa trên ảnh vùng, kết hợp đồng thời quá trình dò biên và tách biên Ở đây ta quan tâm cách tiếp cận thứ hai
được bao bọc bởi một vành đai các điểm nền Dễ thấy là một vùng 4 – liên thông chỉ là một trường riêng của trường hợp trên
Về cơ bản, các thuật toán dò biên trên một vùng đều bao gồm các bước sau:
Xác định điểm biên xuất phát
Dự báo và xác định điểm biên tiếp theo
Trang 1717
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
Lặp bước 2 cho đến khi gặp điểm xuất phát
Do xuất phát từ những tiêu chuẩn và định nghĩa khác nhau về điểm biên,
và quan hệ liên thông, các thuật toán dò biên cho ta các đường biên mang các sắc thái rất khác nhau
Kết quả tác động của toán tử dò biên lên một điểm biên ri là điểm biên ri+1
tử đều phụ thuộc vào định nghĩa quan hệ liên thông và điểm biên Do đó sẽ gây khó khăn cho việc khảo sát các tính chất của đường biên Ngoài ra, vì mỗi bước
dò biên đều phải kiểm tra tất cả các 8 – láng giềng của mỗi điểm nên thuật toán thường kém hiệu quả Để khắc phục các hạn chế trên, thay vì sử dụng một điểm biên ta sử dụng cặp điểm biên (một thuộc , một thuộc ), các cặp điểm này tạo nên tập nền vùng, kí hiệu là NV và phân tích toán tử dò biên thành 2 bước:
Xác định cặp điểm nền vùng tiếp theo
Lựa chọn điểm biên
Trong đó bước thứ nhất thực hiện chức năng của một ánh xạ trên tập NV lên NV và bước thứ hai thực hiện chức năng chọn điểm biên Các bước thực hiện thuật toán dò biên tổng quát như sau:
Bước 1: Xác định cặp nền – vùng xuất phát
Bước 2: Xác định cặp nền – vùng tiếp theo
Bước 3: Lựa chọn điểm biên vùng
Bước 4: Nếu gặp lại cặp xuất phát thì dừng, nếu không quay lại bước 2
Bước 1 : Xác định cặp nền - vùng xuất phát
Trang 1818
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
Việc xác định cặp nền - vùng xuất phát được thực hiện bằng cách duyệt ảnh lần lượt từ trên xuống dưới, từ trái sang phải rồi kiểm tra điều kiện lựa chọn cặp ảnh nền vùng
Bước 2 : Xác định cặp nền - vùng tiếp theo
Ta xác định cặp nền - vùng tiếp theo bằng toán tử dò biên Toán tử dò biên được định nghĩa như sau :
T là một ánh xạ : T : NV NV
(b,r) (b‟,r‟)
Ta gọi T là toán tử dò biên cơ sở nếu nó thỏa mãn điều kiện b‟, r‟ là các 8 - láng giềng của r
Bước 3 : Lựa họn điểm biên :
Giả sử (b, r) NV ; gọi K(b, r) là hàm chọn điểm biên Biên của một dạng
có thể định nghĩa thao một trong ba cách :
Tập những điểm thuộc có mặt trên NV, tức là K(b, r) = r
Tập những điểm thuộc phủ có trên NV, tức là K(b, r) = b
Tập những điểm ảo nằm giữa cặp nền-vùng, tức là K(b, r) là những điểm nằm giữa hai điểm b và r
Cách định nghĩa thứ ba tương ứng với mỗi cặp nền-vùng với một điểm biên Còn với cách thứ nhất và thứ hai , một số cặp nền - vùng có thể có chung một điểm biên Bởi vậy, quá trình chọn điểm biên được thực hiện như sau :
Trang 1919
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
Điều kiện dừng: Cặp nền-vùng thứ n trùng với cặp nền vùng xuất phát (bn,rn)= (b0,r0)
Hình 1.9 dưới đây minh họa kết quả của của 2 phép toán phân ngưỡng đều, phân ngưỡng thích nghi, kỹ thuật phân ngưỡng Otsu
Trang 2020
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
a) b)
c) d) Hình 1.9 Minh họa kết quả phân ngưỡng đều của phương pháp a) phân ngưỡng
đều, b) phân ngưỡng tự động, d) phân ngưỡng Otsu
1.1.8 Nhận dạng ảnh
Hình 1.10 Sơ đồ khối của một hệ thống nhận dạng
Trang 2121
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
Như trên hình 1.10, hệ thống nhận dạng gồm các khối chính là: Tiền xử lý, Trích chọn đặc trưng, Nhận dạng Dưới đây, tác giả trình bày tóm tắt từng khối này
Tiền xử lý: Tiền xử lý là giai đoạn đầu tiên trong xử lý ảnh số Tùy
thuộc vào quá trình xử lý tiếp theo trong giai đoạn này sẽ thực hiện các
công đoạn khác nhau như:
- Nắn chỉnh hình học: Những biến dạng hình học thường là do các
thiết bị điện tử và quang học gây ra Do đó, phương pháp hiệu chỉnh ảnh dựa vào mô hình được mô tả dưới dạng biến đổi ảnh dạng f(x, y) thành ảnh lý tưởng f(x‟, y‟)
- Khử nhiễu: Nhiễu được chia làm hai loại: nhiễu hệ thống và
nhiễu ngẫu nhiên Đặc trưng của nhiễu hệ thống là tính tuần hoàn Do vậy, có thể tách được loại nhiễu này bằng việc sử dụng biến đổi Fourier và loại bỏ các điểm đỉnh (peaks) Đối với nhiễu ngẫu nhiên, trường hợp đơn giản là các vết bẩn tương ứng với các điểm rất sáng hay rất tối, có thể khử bằng phương pháp nội suy, lọc trung bình và trung vị
- Chỉnh mức xám: Đây là kỹ thuật nhằm chỉnh sửa tính không
đồng đều của các thiết bị thu nhận hoặc tăng độ tương phản giữa các vùng ảnh
- Chỉnh tán xạ: Ảnh nhận được từ các thiết bị điện tử hay quang
học có thể bị nhòe.Phương pháp Fourier dựa trên tích chập của ảnh với hàm tán xạ cho phép giải quyết được bài toán hiệu chỉnh này
Trang 2222
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
Trích chọn đặc trưng: Các đặc điểm của đối tượng được trích chọn
tùy theo mục đích nhận dạng trong quá trình xử lý ảnh Việc trích chọn hiệu quả các đặc điểm giúp cho việc nhận dạng các đối tượng ảnh chính xác, với tốc độ tính toán cao và dung lượng nhớ lưu trữ giảm xuống
Tác giả có thể nêu ra một số đặc điểm của ảnh sau đây:
- Đặc điểm không gian: Phân bố mức xám, phân bố xác xuất, biên
độ, điểm uốn…
- Đặc điểm biên và vùng biên: Đặc trưng đường biên của đối
tượng, trích chọn các thuộc tính bất biến được dùng khi nhận dạng đối tượng
Nhận dạng: Nhận dạng tự động, mô tả đối tượng, phân loại và phân
nhóm mẫu là các vấn đề quan trọng trong thị giác máy tính, được ứng dụng trong nhiều ngành khoa học khác nhau Hệ thống nhận dạng tự động bao gồm ba module tương ứng với ba giai đoạn chủ yếu: Thu nhận dữ liệu và tiền xử lý, biểu diễn dữ liệu, nhận dạng, ra quyết định Bốn cách tiếp cận khác nhau trong lý thuyết nhận dạng là: So khớp mẫu dựa trên các đặc trưng được trích chọn, Phân loại thống kê, Đối sánh cấu trúc, cú pháp, Phân loại dựa trên mạng nơ-ron nhân tạo Bảng 1.1
mô tả bốn phương pháp này
Trong các ứng dụng không thể chỉ dùng một cách tiếp cận đơn lẻ để phân loại “tối ưu” Do vậy cần sử dụng một lúc nhiều phương pháp và cách tiếp cận khác nhau Các phương thức phân loại tổ hợp hay được được dùng khi nhận dạng và nay đã có những kết quả có triển vọng dựa trên thiết kế các hệ thống lai (hybird system) bao gồm nhiều mô hình kết hợp
Bảng 1.1 Mô tả các cách tiếp cận trong lý thuyết nhận dạng
Trang 2323
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
1.1.9 Cấu trúc phân cấp của video
Video là tập hợp các khung hình (frames), mỗi khung hình là một ảnh Shot (lia) là đơn vị cơ sở của video Một lia là một đơn vị vật lý của dòng video, gồm các chuỗi các khung hình liên tiếp, không thể chia nhỏ hơn, ứng với một thao tác camera đơn.
Scene (cảnh) là các đơn vị logic của dòng video, một cảnh gồm các lia liên quan về không gian và liền kề về thời gian, cùng mô tả một nội dung ngữ nghĩa hoặc một tình tiết Khi phim được chiếu, các khung hình lần lượt được hiển thị
ở tốc độ nhất định Tốc độ thường thấy ở các định dạng video khác nhau là 30
và 25 hình/s Như vậy, một giờ video sẽ có số khung hình tương ứng là 108000 hoặc là 90000 Cấu trúc phân cấp của video được minh họa trong hình 1.11 như sau:
Trang 2424
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
Hình 1.11 Cấu trúc phân cấp của video
1.1.10 Một số thuộc tính đặc trưng của video
Video có 4 đặc trưng chính là: Màu (color), Kết cấu (texture), Hình dáng (shape), Chuyển động (motion) Dưới đây chúng ta sẽ xem xét tới những đặc trưng này
a) Màu
Màu là một thuộc tính quan trọng của ảnh Biểu đồ màu, biểu diễn sự phân bố màu, là một đặc trưng màu phổ biến nhất hiện nay Biểu đồ màu không phụ thuộc vào sự quay, dịch chuyển ảnh cũng như chiều nhìn ảnh Tính hiệu quả của
nó lại phụ thuộc vào hệ màu và phương pháp định lượng được dùng Có một vấn
đề với biểu đồ màu là nó không biểu diễn thông tin về không gian phân bố các điểm ảnh, do đó hai ảnh có cùng biểu đồ màu có thể có nội dung rất khác nhau Hình 1.12 minh họa điều này
Hình 1.12 Các ảnh khác nhau nhưng có cùng biểu đồ mầu
Trang 2525
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
phân biệt tốt nhất Biểu diễn Tamura được thúc đẩy nhờ các nghiên cứu về tâm
lý trong việc thu nhận trực giác của con người và nó bao gồm các đại lượng đo tính thô, độ tương phản, hướng, tính trơn, tính cân đối và độ ráp Các đặc trưng Tamura rất hấp dẫn trong việc hiểu nội dung ảnh vì nó biểu đạt trực quan Ngoài
ra còn có một số các dạng biểu diễn khác như trường ngẫu nhiên Markov, biến đổi Gabor, biến đổi gợn sóng,…
d) Chuyển động
Motion là thuộc tính quan trọng của video Thông tin về chuyển động có thể được sinh ra bằng các kỹ thuật ghép khối hoặc luồng ánh sáng Các đặc trưng chuyển động như mô men của trường chuyển động, biểu đồ chuyển động hoặc là các tham số chuyển động toàn cục có thể được trích chọn từ vectơ chuyển động Các đặc trưng mức cao phản ánh di chuyển camera như quét camera, nghiêng, phóng to, thu nhỏ cũng có thể được trích chọn
Trang 261.2.2 Khớp ảnh sử dụng phép đối sánh pixel-pixel
Phương pháp khớp ảnh đơn giản nhất là sử dụng phép đối sánh pixel-pixel giữa hai ảnh Theo cách này độ đo khớp giữa 2 ảnh (ảnh con) có thể được tính theo công thức:
x y
y x B y x
Cách thức này thực tế thường cho kết quả khớp rất kém do tính chất ảnh thu nhận được thường có những biến đổi như nhiễu, thay đổi độ sáng, hoặc có sự xê dịch, quay…
1.2.3 Khớp ảnh sử dụng tương quan chéo
Tương quan chéo hoàn toàn có thể được mở rộng cho ảnh 2D và sử dụng cho vấn đề khớp ảnh Có thể xác định được mẫu trong ảnh sử dụng tương quan chéo giữa ảnh với một mặt nạ thích hợp Mặt nạ ở đây và mẫu cần xác định sẽ có độ tương quan cao
(1.2)
Trang 2727
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
Hình 1.13 Minh họa khớp ảnh tương quan chéo
Để khớp ảnh với mặt nạ, ta đặt mặt nạ lên ảnh và trượt trên ảnh Tại mỗi vị trí pixel trùng với tâm của mặt nạ (i, j) hệ số tương quan được tính như sau:
1 2 /
2 /
) , ( )
2
, 2 ( )
,
(
j
j i
i
N
N jj
N
N ii
j i
I jj j ii i I m
N jj
N ii m j
i
r
Trong đó, m là trung bình của các giá trị pixel trong mặt nạ, I là trung bình của các giá trị pixel trong vùng ảnh bị mặt nạ chồng lên Các đỉnh của “mặt” tương quan chéo thu được sẽ cho ta khớp mặt nạ phù hợp nhất trong ảnh Hình 1.14 minh hoạ một kết quả khớp ảnh cấp xám
(1.3)
Trang 2828
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
được chọn với kích thước bé Trong nhiều ảnh thực tế, còn đòi hỏi phải sử dụng đến phép quay và (hoặc) phép co giãn tại mỗi vị trí điểm ảnh
Trang 2929
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
CHƯƠNG 2 MỘT SỐ KỸ THUẬT TRONG BẮT BÁM
VÀ SO KHỚP ĐỐI TƯỢNG CHUYỂN ĐỘNG
2.1 GIỚI THIỆU
Hiện nay, bài toán phát hiện đối tượng chuyển động đang được quan tâm của các nhóm nghiên cứu trong và ngoài nước, bởi tính ứng dụng trong nhiều lĩnh vực khoa học, xã hội, và giải trí của con người Bài toán phát hiện, phân loại đối tượng chuyển động có rất nhiều hướng tiếp cận để dò tìm ra đối tượng chuyển động trong một cuốn, đoạn video liên tục Hầu hết các phương pháp đều thực hiện dựa trên việc so sánh frame video hiện thời với một frame từ các frames trước đó, hoặc thực hiện phép trừ nền để xác định được các đối tượng chuyển động từ một phần của frame trong video mà có đặc điểm khác nhau của một mô hình nền Cũng có phương pháp dựa theo hướng tiếp cận thành phần, dùng mạng Neural, phân loại, bộ lọc hình thái (morphological filters)
Ngày nay, nhu cầu đi lại ngày càng tăng số lượng phương tiện giao thông trên đường ngày càng xuất hiện nhiều, nên số lượng phương tiện giao thông lớn đã làm nảy sinh nhiều vấn đề trong việc kiểm soát cũng như quản lý các phương tiện Để giải quyết vấn đề này nhu cầu đặt ra là áp dụng các hệ thống tự động giám sát tự động có khả tự nhận dạng biển số xe là hệ thống có khả năng thu nhận hình ảnh cũng như là „đọc‟ và „hiểu‟ các biển số xe một cách tự động, bám đối tượng Hình 2.1 minh họa sơ đồ khối của một hệ thống bám
Trang 3030
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
Hình 2.1 Sơ đồ khối hệ thống bám ảnh đối tượng chuyển động
Chúng ta thấy rằng tín hiệu ảnh đầu tiên được thu về từ camera, đi qua bộ xử
lí ảnh để bóc tách ảnh đối tượng, định vị toạ độ đối tượng bao gồm toạ độ tương đối trong ảnh và ước lượng toạ độ tuyệt đối Toạ độ đó được đi qua một bộ lọc làm mịn các tín hiệu toạ độ này để điều khiển camera Từ các thông tin thu được, bộ điều khiển camera sẽ quyết định các tham số điều khiển camera như: hướng quay, góc quay,… Như vậy, tính chất đáp ứng thời gian thực của hệ thống là tuỳ thuộc vào tốc độ chuyển động của mục tiêu có tính đến khoảng cách tới camera, và khả năng của hệ thống được phản ảnh bởi khả năng bắt bám tốc
độ tối đa là bao nhiêu
Bài toán bắt bám ảnh đối tượng chuyển động là một bài toán có nhiều ứng dụng rất quan trọng từ các lĩnh vực xã hội cho đến an ninh quốc phòng Bắt bám ảnh đối tượng cho phép ta quản lý được đối tượng cần bám để ra các quyết định hợp lý Thông qua việc bắt bám ta có thể định vị được vị trí của đối tượng, xác định được hướng chuyển động, vận tốc… của đối tượng Có thể bắt gặp các hệ thống bám ảnh như trong các hệ giám sát giao thông, đo tốc độ xe hay các hệ thống bám ảnh đối tượng của các vũ khí, khí tài dùng trong quân sự… Cho đến nay, các phương pháp bám ảnh đều tập trung khai thác đến tính chuyển động của
Trang 3131
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
đối tượng thể hiện trong các frame ảnh liên tiếp Các phương pháp được sử dụng rất rộng rãi là phương pháp trừ nền, phát hiện chuyển động từ sai khác frame ảnh và khớp ảnh
Chính vì vậy, việc kết hợp giữa bài toán phát hiện chuyển động và bài toán nhận dạng đối tượng sẽ đem lại nhiều hiệu quả trong việc phân loại đối tượng trong việc giám sát giao thông Phân tiếp theo, tôi trình bày những kỹ thuật liên quan đến đề tài
2.2 KỸ THUẬT TRỪ ẢNH THEO KHUNG ẢNH
Video gồm dãy N khung hình (f1, f2, …, fN), mỗi khung hình là một ảnh Các khung hình này được hiển thị lần lượt, độ sáng của một điểm ảnh đã cho có thể coi là một hàm của thời gian f(x,y,t) Mục đích chính của kỹ thuật trừ ảnh để kiểm tra 2 ảnh có sai lệch với nhau không, và xác định được vị trí của vùng sai lệch Từ đó sẽ “bám” được vùng sai lệch giữa của đối tượng ở các khung hình trong video Điều cần phải lưu ý rằng: sai lệch ở đây đồng thời sai lệch về vị trí
có tính toán, và sai lệch về giá trị màu Bởi vì, thời tiết, độ tương phản có thể làm cho giá trị màu thay đổi tại những vị trí cố định, hoặc do đối tượng chuyển động cũng sẽ gây ra những hiệu ứng tương phản cho vùng lân cận dẫn đến thay đổi giá trị màu Hình 2.2 minh họa kết quả trừ 2 khung hình ảnh
a) Khung trước (f i) b) Khung sau (fi+1)
Trang 3232
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
c) Kết quả trừ khung hình fi + fi+1 Hình 2.2 Trừ khung hình fi với fi+1 với độ sai khác <20 Như trên chúng ta thấy: ngoài vùng chuyển động được đánh dấu đỏ, thì những vùng sáng bên ngoài là do sự tương phản, thời tiết mà giá trị điểm ảnh ở đó bị thay đổi Vì vậy, trong quá trình xử lý, tôi kết hợp xét vị trí nữa Ký hiệu D(f1,
f2) là sự sai khác giữa hai khung hình f1 và f2 Sự sai khác lớn hơn giá trị ngưỡng
sẽ xác định được có đối tượng chuyển động giữa 2 khung hình Sự thay đổi trên khung hình được tính toán trên một đặc trưng nhất định Người ta thường dùng đặc trưng là nội dung màu sắc, là biểu đồ (biểu đồ màu hoặc biểu đồ mức xám), hoặc đôi khi là cạnh, vectơ chuyển động, góc hay texture
Như vậy, khi thực hiện phát hiện có sự biến động giữa các khung hình, trước hết phải xác định đặc trưng đem ra so sánh, thứ hai là xác định công thức trừ ảnh
được xác định trước Đôi khi người ta cũng dùng ngưỡng thích ứng Chỉ những sai khác lớn hơn ngưỡng Tb sẽ được xem xét và xử lý
Hiện nay, có nhiều kỹ thuật trừ ảnh, và có thể chia làm 5 loại: dựa vào điểm ảnh, dựa vào khối, dựa vào biểu đồ, dựa vào thống kê, và dựa vào đặc trưng Giả
Trang 3333
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
sử xét hai ảnh I1 và I2 có cùng kích thước Trừ hai ảnh I1 và I2 là việc tính toán
sự sai khác giữa hai ảnh đó Tiếp theo, chúng ta sẽ lần lượt xét từng kỹ thuật
2.2.1 Trừ ảnh dựa vào điểm ảnh
Phương pháp đơn giản nhất để trừ hai khung hình là tính giá trị biểu diễn sự chênh lệch tổng cộng về cường độ của tất cả các điểm ảnh tương ứng trên hai khung hình
So sánh giá trị đó với ngưỡng chuyển cảnh Tb để xác định có chuyển cảnh hay không
1
0 2
f f D
Kỹ thuật trừ ảnh dựa vào điểm ảnh rất đơn giản Nhược điểm lớn nhất là kỹ thuật này không thể phân biệt được thay đổi lớn trong một vùng ảnh nhỏ và thay đổi nhỏ trong một vùng ảnh lớn Ví dụ, các cắt cảnh rất dễ bị bỏ sót khi một phần nhỏ của khung hình có thay đổi lớn và nhanh Nói chung tất cả các kỹ thuật trừ giá trị điểm ảnh rất nhạy với nhiễu và các di chuyển camera Một bước phát triển hơn là đi đếm tổng số điểm ảnh có thay đổi lớn hơn một ngưỡng và so sánh tổng đó với một ngưỡng khác để phát hiện chuyển cảnh
(2.1)
(2.2)
(2.3)
(2.4)
Trang 340 2
1, ) 1 ( , )(
Y
y X
x
y x DP Y
X f
f D
Nếu tỷ lệ số điểm ảnh thay đổi D(f1, f2) lớn hơn ngưỡng T1 thì đã có chuyển cảnh do cắt Tuy các thay đổi không liên quan trong khung hình đã được loại bớt nhưng hướng tiếp cận này vẫn nhạy với những di chuyển camera và đối tượng Chẳng hạn, khi camera quay hướng theo đối tượng, rất nhiều điểm ảnh được coi
là thay đổi, dù cho chỉ có ít điểm ảnh dịch chuyển Có thể giảm tác động này bằng cách áp dụng một bộ lọc trơn: trước khi so sánh, mỗi điểm ảnh được thay thế bằng giá trị trung bình của các điểm ảnh lân cận Để giải quyết tốt hơn vấn
đề này, người ta áp dụng kỹ thuật trừ ảnh phân khối, sẽ được trình bày bên dưới Một nhược điểm khác của kỹ thuật trừ ảnh dựa vào giá trị điểm ảnh là độ nhạy của điểm ảnh với việc chiếu sáng, một ví dụ là chiếu đèn flash Khi đó người ta điều chỉnh độ sai khác giá trị điểm ảnh bằng cách chia nó cho cường độ của điểm ảnh trên khung hình thứ hai
1 0 2
1
) , (
| ) , ( ) , (
| 1
) , (
Y
y X
y x f y x f Y
X f
f D
Phương pháp trừ giá trị điểm ảnh cơ bản là tính toán từ các giá trị cường độ, nhưng có thể mở rộng với các ảnh màu Ví dụ với ảnh màu RGB, ta tính tổng có trọng số các sai khác của ba giá trị Red, Green và Blue của các điểm ảnh
i Y
y
y x f y x f w f
f D
0 { , , }
2 1
0 2
1 , ) | ( , ) ( , ) | (
Trang 3535
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
lập với các di chuyển của camera và đối tượng Mỗi khung hình được chia thành
b khối Các khối trên khung hình f1 được so sánh với khối tương ứng trên khung hình f2 Về cơ bản, độ chênh lệch giữa hai khung hình được tính như sau:
f f D
1
2 1 2
1, ) ( , , )(
Trong đó Ck là hệ số cho trước, DP(f1,f2,k) là độ chênh lệch giữa hai khối thứ
k của hai khung hình f1 và f2 Một cắt cảnh xảy ra khi số các khối thay đổi đủ lớn, nghĩa là D(f1,f2) > T2 và Ck =1 cho tất cả các khối Phương pháp này chậm
đi theo độ phức tạp của hàm thống kê Phương pháp này có một bất lợi là các chuyển shot sẽ bị bỏ qua trong trường hợp hai khối rất khác nhau có thể có cùng hàm mật độ Tuy nhiên trường hợp đó cũng ít xảy ra
2.2.3 Phương pháp biểu đồ
Một bước xa hơn để giảm ảnh hưởng của sự di chuyển camera và đối tượng là thực hiện trừ ảnh dựa vào biểu đồ Biểu đồ mô tả sự phân bố giá trị điểm ảnh của khung hình Ý tưởng của hướng tiếp cận này là các ảnh có nền không đổi và đối tượng không đổi sẽ có chênh lệch ít trong biểu đồ Hơn nữa biểu đồ bất biến với việc quay ảnh và thay đổi ít khi thay đổi góc nhìn
Có thể dùng biểu đồ màu hoặc biểu đồ mức xám để tính toán sự sai khác giữa hai khung hình Biểu đồ màu (mức xám) của khung hình i là một vectơ G chiều
Hi = (Hi(1), Hi(2), … , Hi(G)) Trong đó G là số màu (mức xám), Hi(j) là số điểm ảnh của khung hình i có màu (mức xám) j Phương pháp trừ ảnh dựa trên biểu đồ có thể sử dụng biểu đồ toàn cục hoặc biểu đồ cục bộ Biểu đồ toàn cục là biểu đồ biểu diễn sự phân bố giá trị màu (mức xám) của toàn bộ khung hình Còn biểu đồ cục bộ chỉ mô tả sự phân bố của một phần nào đó của khung hình
(2.7)
Trang 36f D
0
2 1
H f
f D
0
2 1
2
1, ) | ( ) ( )|(
Có thể sử dụng thêm trọng số nếu có một số màu (mức xám) quan trọng hơn với mục tiêu so sánh
H k w f
f D
0
2 1
2
(
Trong đó w(k) là trọng số ứng với giá trị màu (mức xám) k
Cách thứ ba là sử dụng phần giao nhau của hai biểu đồ Vùng biểu đồ chung nhau, phần gạch chéo trong hình 2.3, cho biết độ tương tự về nội dung hai ảnh
có thể được định nghĩa như sau:
(2.8)
(2.9)
(2.10)
Trang 3737
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
Hình 2.3 So sánh biểu đồ giữa hai ảnh
Độ tương tự còn có thể được định nghĩa như sau:
k H k H f
f S
0
2 1
0
2 1
2 1
))(),(max(
))(),(min(
),(
Như vậy, dựa vào phần giao nhau của hai biểu đồ, có thể tính độ chênh lệch biểu đồ hai khung hình theo công thức:
k H k H f
f S f
f
D
0
2 1
0
2 1
2 1 2
1
)) ( ), ( max(
)) ( ), ( min(
1 ) , ( 1 ) , (
2.2.5 Biểu đồ cục bộ
Như đã đề cập, phương pháp trừ ảnh dựa vào biểu đồ là phương pháp ít chịu ảnh hưởng của nhiễu và sự di chuyển đối tượng Tuy vậy, cũng có một số trở ngại Đầu tiên, biểu đồ chỉ mô tả sự phân bổ các giá trị màu hay mức xám mà không bao hàm bất cứ thông tin nào về không gian Hai ảnh có cùng biểu đồ màu nhưng lại có thể có nội dung rất khác nhau Trở ngại khác là, rất có thể các vùng ảnh nhỏ khi thay đổi sẽ gây chú ý nhưng lại không có vai trò gì trong biểu
đồ và do đó có thể bị bỏ qua khi thực hiện trừ ảnh Để giải quyết vấn đề đó, chúng ta sẽ kết hợp trừ ảnh dựa vào biểu đồ với kỹ thuật trừ ảnh phân khối Trừ ảnh phân khối quan tâm đến thông tin về không gian Về cơ bản phương pháp
(2.11)
(2.12)
(2.13)
Trang 3838
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
này tốt hơn việc so sánh từng cặp điểm ảnh, nhưng nó vẫn chịu tác động của sự
di chuyển của camera và đối tượng và cũng tốn kém Bằng cách kết hợp hai ý tưởng, chúng ta vừa có thể giảm được tác động của sự di chuyển camera và đối tượng, vừa sử dụng thông tin về không gian ảnh, và cho kết quả phân đoạn tốt hơn
Ý tưởng là, ta sẽ chia khung hình thành b khối, đánh số từ 1 đến b So sánh biểu đồ của các khối tương ứng rồi tính tổng chênh lệch để có kết quả trừ ảnh cuối cùng
f D
1
2 1 2
1, ) ( , , )(
j H f
f DP
0
2 1
2
1, ) | ( , ) ( , )|(
2.3 KỸ THUẬT BẮT BÁN DỰA VÀ O PHÉP TRỪ NỀN VÀ TRÍCH CHỌN ĐƯỜNG VIỀN CỦA ĐỐI TƯỢNG CHUYỂN ĐỘNG
2.3.1 Trừ nền
Phép toán trừ nền cho phép loại bỏ tất cả các đối tượng đứng yên trong dãy frame ảnh, chỉ còn lại các đối tượng chuyển động Kết quả của phép trừ nền thường chịu ảnh hưởng của nhiễu do nhiều yếu tố: các điều kiện thời tiết như gió, dao động cây cối, bóng của đối tượng, mây mưa, ánh sáng thay đổi… Nền B(p) được tính toán bởi các giá trị trung bình từ cùng điểm ảnh chọn từ các frame ảnh nền
k
B n
p k I p