Việc phát hiện racác đối tượng chuyển động trong video nhờ các kỹ thuật xử lý ảnh, trên cơ sở đóđoán nhận một số hành vi của đối tượng dựa trên nên tản phần cứng là một việclàm có ý nghĩ
Trang 1ĐẠI HỌC QUOC GIA TP HO CHÍ MINH
TRƯỜNG ĐẠI HỌC BÁCH KHOA
TRINH VIET QUANG
THIET KE IP NHAN DANG CHUYEN DONG
TRONG VIDEO
Chuyén nganh: Ky thuat dién tir
Mã số: 60 52 02 03
TP HO CHI MINH, 2016
Trang 2CÔNG TRÌNH ĐƯỢC HOÀN THÀNH TẠITRUONG ĐẠI HỌC BACH KHOA —DHQG -HCM
Cán bộ hướng dẫn khoa hOC : + k1 8v xEvvv vvx gvvxged
Luận văn thạc sĩ được bảo vệ tại Trường Dai học Bách Khoa, DHQG Tp HCM
Thanh phan Hội đồng đánh giá luận văn thạc sĩ gồm:
(Ghi rõ họ, tên, học hàm, học vi của Hội đông châm bảo vệ luận văn thạc sĩ)
Xác nhận của Chủ tịch Hội đồng đánh giá LV và Trưởng Khoa quản lý chuyênngành sau khi luận văn đã được sửa chữa (nếu có)
CHỦ TỊCH HỘI ĐÔNG TRƯỞNG KHOA
Trang 3ĐẠI HỌC QUOC GIA TP.HCM CONG HÒA XÃ HOI CHỦ NGHĨA VIỆT NAMTRƯỜNG ĐẠI HỌC BÁCH KHOA Độc lập - Tự do - Hạnh phúc
NHIEM VỤ LUẬN VĂN THẠC SĨ
Họ tên học viên: Trịnh Viết Quang - Sàeveeeee MSHV:I3141123
Ngày, tháng, năm sinh: 7/068/1969 -SSSSSssssss Nơi sinh: Đồng Nai
Chuyên ngành: Kỹ thuật Điện tửỬ ĂĂẶSSS sa Mã số : 60 52 02 03
I TEN DE TÀI: Thiết kế IP nhận dạng chuyển động trong video
I NHIEM VỤ VÀ NOI DUNG: Luận văn tập trung nghiên cứu thiết kế lõi IP mềmthực hiện nhận dạng chuyền động trong video sử dụng giải thuật Delta SigmaBackgound Subtraction, có khả năng tích hợp vào các hệ thông SoC nhằm phục vụcho các ứng dụng giám sát trong thực tế Lõi IP thiết kế phải đáp ứng thời gian thựcvà hỗ trợ video có độ phân giải HD - ¿5252 2E 5151515121212121 2121212111111.Ill NGÀY GIAO NHIEM VU : (Ghi theo trong QD giao đề tài) 06/07/2015
IV NGÀY HOÀN THÀNH NHIỆM VỤ: (Ghi theo trong QD giao dé tài) 17/06/2016V CÁN BO HUONG DAN (Ghi rõ hoc ham, hoc vi, ho, tên): TS Truong Cong DungTp HCM, ngày .08 thang 07 năm 2016
CAN BO HUONG DAN CHU NHIEM BO MON DAO TAO(Họ tên và chữ ky) (Họ tên và chữ ký)TRUONG KHOA
(Họ tên và chữ ký)
Trang 4LỜI CÁM ƠN
Trong suốt quá trình học táp, thực hiện và hoàn thành luận văn này, em đã nhán
được sự hướng dan, giúp đỡ quý báu của các thay cô, các anh chị, các em và cácbạn Với lòng kính trọng và biết ơn sâu sắc em xin được bày tỏ lời cảm ơn chân
thành tới:
TS Trương Công Dung Nghi, người cô kính mén đã hết lòng giúp đỡ, dạy bao,
động viên và tao mọi điều kiện thuận lợi cho em trong suot qua trinh thuc hién
luận văn tốt nghiệp Cô là người định hướng, góp ý cũng như chi dạy phương pháplàm việc, giip em có thé hoàn thành luận văn một cách tốt nhất
Các quý thay cô trong khoa Điện — Điện tứ, ttuong Dai Hoc Bách Khoa thành phốHồ Chí Minh đã tận tình chỉ dạy và truyền đạt kiến thức giúp em có thé dat đượckết qua như ngày hôm nay
Bên cạnh đó, em xin chân thành cảm ơn bố mẹ và gia đình đã luôn hỗ trợ, động
viên vê mặt vat chát và tinh than, giúp em hoàn thành tôt được luận văn này.
Trang 5TÓM TAT LUẬN VAN
Luận văn này tập trung nghiên cứu thiết kế lõi IP mêm thực hiện nhận dangchuyển động trong video sử dụng giải thuật Delta Sigma Backgound Subtraction,có khả năng tích hợp vào các hệ thống SoC nhằm phục vụ cho các ứng dụng giámsát trong thực tế Lõi IP thiết kế phải đáp ứng được các yêu cau:
- Dap ứng thời gian thực
- H6 trợ video có độ phân giải HD
Trang 6ABSTRACTThis thesis focuses on designing an IP Core that implements the Delta SigmaBackground Subtraction algorithm for motion detection in The IP core designmust meet the following requirements:
- Real time processing.- Support HD resolution.
Trang 7LỜI CAM ĐOAN
Học viên cam đoan răng, ngoại trừ các kêt qua tham khảo từ các công trìnhkhác như đã ghi ro trong báo cáo dé tài, các công việc trình bày trong báo cáo nàylà do chính học viên thực hiện.
Trang 8MỤC LỤC
CHƯƠNG 1 TONG QUAN DE TÀI G56 S331 121 1115111E151111 11x |LL MỞ ĐẦU - CT1 1 12151511111111111121211111111111101211111 111121 |1.1.1 Bỗi cảnh hình thành dé tài ¿2 5- E+EE£ESEEEE2EeEEeEererkrkrsreee |1.1.2 Tính cấp thiẾt c- cSE SE 1E E1 2E212221212111 212111111111 cte 21.1.3 Mục tiêu của dé tài tt TT HT HT HH HT HH ng 3
CHƯƠNG2 NGHIÊN CỨU TONG QUAN VÀ KY THUAT THIẾT KE VI
MACH TOI UU CHO LOI IP NHẬN DẠNG CHUYEN ĐỘNG TRONG VIDEO
A
2.1 TONG QUAN NOI DUNG NGHIÊN CỨU - 25252 S2 c£+EvE+Esesezesed 4
2.1.1 Cách tiếp cận và phương pháp nghiên cứu - - 2 25s+s+sss2 42.1.2 Sơ lượt về nhận dạng chuyển động và các giải thuật nhận dangchuyển động - 5252211 E21 21115E521 211121121 111111111111111110111 0111111 e tk 8
2.1.3 Phương pháp Delta Sigma Background Subtraction 22
2.2 TONG QUAN THIET KE VL/SÌ - 2 5 St SE SE 2ESEESEEESEEEEEEeErkserereeee 29
2.2.1 Khái niệm vi mạch và lõi [P - - 2111111 3 1x2 29
2.2.2 Một số kỹ thuật tối ưu thiết kế cho VWLSI 5-5-5252 2 s+s+x+sz2 30CHUGNG 3 DAC TA THIẾT KE LOI IP NHAN DANG CHUYEN DONG
TRONG VIDEO 5-5-2 E1 1 12121511 12111115111111211111101211111101211111101 2111111 36
3.1 TINH NANG SAN PHẨM - Set 111 12121511112121511111111 2111111 xe 363.2 KIÊN TRÚC THIẾT KE HE THÓNG - (+ + SE ‡E+E+E+E+Ecececee 363.2.1 Sơ đồ hệ thống - E222 S223 1E 1211111111 01112E 11111 tk 363.2.2 — Sơ đồ chân CS s1 1E E11 E11111112121211111111111 re 37
3.2.3 Mô ta tín hiệu VàO/Ta - 0011110010101 2 111111111111 1 111g 37
3.2.4 _ Thông số cấu hình + <2 +s+E+ 2 EE2E2ESEEE2E2E5E1 21215122111 c 39
Trang 93.2.5 Nguyên tắc hoạt động khối top level - 2 2s+s+cezs+x+xeeecs2 403.2.6 Giao tiẾp NGG VÀO(Ta 5S 1 S3 111111 112111111 0111111111111 ccx 413.2.7 Gian đồ định thời chuẩn AST, c- 6xx EEvEvESESEeEekskekrererees 423.2.8 Gian đồ định thoi chuẩn AMM Street 423.3 CÁC KHÔI TRONG HE THNG SE SEEESE SE skekrkrrees 453.3.1 Khối RGB to gray - 5-5: c t 2S 111111 11111111 1121111111111 rrk 453.3.2 Khối Delta sigma background subtraction - 555552 473.3.3 Khối Morphological post-processing c.ccccccccesessescsessesesesesseseseeeees 50
CHUONG 4 MOI TRUONG KIEM TRA THIẾT KE LOI IP NHAN DANG
CHUYEN DONG TRONG VIDEO wu.c.cccccscscccsescescsesecscscsssecsescsessesescsssiesesssneneseeen 52"Am" ©) OF VN ằĂằĂằ ‹‹‡{is 524.2 MỖI TRƯỜNG KIEM TRRA 5-52 2522221221521 1215212151112 5342.1 Xây dựng môi trưởng kiỂm tra - ¿2 2+5 +2+E+EcEerzksrerereee 534.2.2 — Cấu trúc thư mụC - tk SS SE E11 1111 g genrkg 54
4.2.3 Sử dụng MOI tTƯỜng -.- -c SH SH HH hà 55
A3 KẾT QUÁ KIEM TRA ccccccccccesececcscscceceecevscececsevscececseeavscacecavecseeceavarecees 5543.1 Trường hợp kiém tra ccccccccccccccsecescscsessescsescsescsssecsessssssessseseeseaes 55A3.2 Kết quả Ki€m tra + c5 + S2 3EE5E1 12111511 1121111211 11T 56CHƯƠNG 5 HE THONG KIEM TRA THUC NGHIEM LOI IP NHẬN DANGCHUYEN DONG TRONG VIDEO TREN FPGA cccscsccsesssscsesecsescsescseseeeeseseeee 625.1 SƠ DO HE THONG KIEM TRA THIẾT KE TREN FPGA 62
5.1.1 Tich hop IP vào thư viện SOC, SH re 62
5.1.2 Sơ đồ hệ thông FPGA kiểm tra khả năng hoạt động của lõi IP 665.1.3 Chức nang các thành phan (IP) trong hệ thống - 685.2 PHƯƠNG ÁN KIEM TRA cieccocccccccsscssscsssssssesessescessesssscsscsscsssssssscsscsecsacsaees 71
Trang 105.2.1 Thiết bi và phần mềm 5-2 +2+E+E2EE+E£E+EE£E£E+ESEErkrkrrerrred 75.2.2 Nội dung kiểm tra - ©2222 2232152 12151111 1121112E1 11 re 72543 KET QUÁ KIEM TRA - ScScS 1 12t S5E 5151111 E111511511 11111511111 eeree 72CHƯƠNG 6 KẾT LUẬẬN G1111 9111 1E 1E E1 S111 11x ren reg 786.1.1 So sánh kết quả của thiết kế so với yêu cầu dé tài 786.1.2 Về nội dung -:-:- SE SESESEEE2E2EE121212111 2111111111 ce 786.1.3 Về sản phẩm demo + - 2 +2+E+EEE+E+E*EEE2EEEEEEEE2EEEEEEEErErkerrred 78GLA VỀ tiến đỘ kh SE T11 110111111111 TH HH ng 78CHUGNG 7 TÀI LIEU THAM KHẢO -c- St EềEvEvESESEEEekskeerererees 70
Trang 11MỤC LUC BANG
Bang 2-1 Giải thuật LA cơ bản 2 - LH TH ngà 23
Bảng 2-2 Giải thuật DA cải tiẾn cs 5 5G 2 22121112 12121111 112111111011111 1 x0 ve 25Bang 3-1 Bảng mô tả chân lõi IP nhận dạng chuyền động eee 37Bang 3-2 Bảng thông số cau hình lõi IP 5 2 <+E+E2££+E+E+E£E+E+EeErxrkrree 39Bang 3-3 Bảng mô tả tín hiệu vào ra khôi RGB To Gray 5555-55 45
Bang 3-4 Bảng mô tả tín hiệu vào/ ra khối XA Background subtraction 47
Bảng 3-5 Bảng mô tả tín hiệu vào/ ra khối Morphologieal - - 50
Bang 4-1 Bảng mô tả các trường hợp kiểm tra thiết kê 2- 5-5 525552 55Bang 5-1 Bảng mô tả các trường hợp kiểm tra thiết kế trên FPGA 72
Bảng 5-2 Bảng mô tả kết quả tông hợp lõi IP trên FPGA dong Cyclone HI 76
Bang 5-3 Bảng tong hợp lõi IP nhận dạng trên FPGA dong Cyclone IV 77
Bang 5-4 Bảng tong hợp lõi IP nhận dạng trên FPGA dòng Stratix II 77
Bang 5-5 Bảng tong hợp lõi IP nhận dạng trên FPGA dòng Stratix HII 77
Bảng 6-1 Bảng mô tả kết qua dat được của thiết kế so với yêu câu 78
Trang 12MỤC LỤC HÌNHHình 1-1 Phát hiện đối tượng di chuyỀn - ¿2 - 52 E+E+E££££E+E+E£EEE+ErEerrrrree 3Hình 2-1 Quy trình thiết kẾ ¿G5 - SE ESE2121215151511112121111117151111111 111 6Hình 2-2 Hình a, ảnh nên khi chưa cĩ đối tượng, hình b: hình ảnh khi cĩ đối tượngdi chuyên c-f: các bước tách cảnh nên ra khỏi khung hình, kết quả (hình f) ta táchđược đối tượng can xử lý ra khỏi hình b - ¿2+ +S+E+E+E£Ee£E£E+EeEerErkrrersreee 8Hình 2-3 Mơ tả giải thuật tách nền sử dụng phương pháp median (a) ảnh tại thờiđiểm t (b)ảnh nên với n = 10 (c) ảnh nền với n = 20 (c) ảnh nền với n = 50 II
Hình 2-4 : Mơ tính histogram - - 5 <0 S999 ng re 13
Hình 2-5 Cập nhật ảnh nên trong phương pháp histogram - 25-552: 15
Hình 2-6 (a) khung anh hiện tai I; ; (b) khung anh ước lượng ngố ra E; ; (c) khung
anh nên M, 1()89010 50 ậ Hi 24Hình 2-7 Mơ hình thuật tốn DA cải tiẾn - 5 1xx SE SE rrrkree 25
Hình 2-8 (a) khung ảnh hiện tại I; ; (b) khung anh ước lượng ngố ra E; ; (c) khung
ảnh nền M, ; (d) phương sai VỊ, - 5-5521 1 E323 1521232111111 11211111 010111110 cyee 26Hình 2-9 Ví dụ về phép co vùng ảnh - ¿2+2 223 E92 E22 SE 21221 xe cre 27Hình 2-10 Kết quả của phép co vùng ảnh— Erosion 5-5 252 cs+s+cezs+xzse 27Hình 2-11 Ví dụ về phép giãn vùng ảnh — Dilation 5- - 2 2cs+s+c+zszxzs 28Hình 2-12 Kết quả của phép giãn vùng ảnh - Dilation 2-5-5 +cscs5x+se 28
Hình 2-13 Phép co giãn vùng ảnh - - << 9S nu re 28Hình 2-14 KY thuật Register Packing - - - - -c c c9 HH ket 3l
Hình 2-15 Mach logic trước tối ƯU - + + 2 +%+E+EEE+E2E£EEEEEEEESEEEEEEEEEEEEErrrree, 32Hình 2-16 Mach logic sau khi áp dụng kỹ thuật retiming hướng tối ưu tài nguyên32Hình 2-17 Ví dụ mạch chưa tối Wu - ¿ ¿+ E318 EEEkEEEEEEESEEEEEskskeerkrerrree 33
Hình 2-18 Mach đã rebalance tài nguyÊn - - - Ăcn SH ng ke, 33
Trang 13Hình 2-19 Ví dụ về mạch chưa tối ưu tỐc đỘ - + xxx +E St EEeEsreeersrrxeered 34Hình 2-20 Mach đã được tối ưu vỀ tỐc đỘ ¿- ¿+ +sx 11v S121 EEEEeEsrekerskrkeered 34
Hình 2-21 Mach chưa chèn pIpeÌÏine - - - 5 11111192911 ng kg ky 35Hình 2-22 Mạch đã chèn pipeÌIrne - - - - c 113122111111 *2 1011 1n ng hà 35
Hình 3-1 Sơ đồ khối IP nhận dạng chuyển động 2-5-5 +52 c++s+£z£zzxzze 36Hình 3-2 Sơ d6 chân lõi IP nhận dạng chuyển động 2-2-5 + 22+ 2: 37Hình 3-3 Mô hình nguyên tắc hoạt động khối top level - =2 s55 2 41Hình 3-4 Giao diện giao tiếp của lõi IP nhận dang chuyên động 41Hình 3-5 Gian đồ thời gian theo chuẩn ASTT 222cc tt 2tr 42Hình 3-6 Giản đồ thời gian quá trình ghi theo chuẩn AMM - - 43Hình 3-7 Giản đồ thời gian quá trình đọc theo chuẩn AMM - 44Hình 3-8 Sơ đồ khối RGB To Gray wocccecccscccescccsesesscsssessscscseescsssesessescsnsaesesssneeeseeee 45Hình 3-9 Giản đồ định thì khối RGB To Gray 5-52 525525 222£+£z£czszzce 47Hình 3-10 So đồ khối A Background subtraction 5-5-5252 5s+s+cezscxzs 47Hình 3-11 Sơ đồ khối Morphological post processing - - + 2s 50Hình 4-1 Môi trường kiểm tra thiết kế trên công cụ VŒS -5- 7< sec 53Hình 4-2 Cau trúc thư mục chạy mô phOng c.c.ccccccsccsesscsesesessescsesesseseseseesessseeeeeen 55
Hình 4-3 Thư mục chạy mô phỏng - - - 5c S231 111 1133910111199 ng hà 55Hình 4-4 Chạy mô phỏng thông qua Make file - 55 55c S3 £ks 55
Hình 4-5 Dang sóng các tín hiệu vào ra khối DUT - 2 2s+s+c+zs+x+se 57
Hình 4-6 Môi trường thực hiện testcase Ì c2 xe 57
Hình 4-7 Kết quả PASS cho trường hop l - ¿+5 2 2+E+£z£e£+E+xzrezszrre 58Hình 4-8 Kết quả ngỏ ra DUT tại khung ảnh 50 2-5-5 252 2+£+£z£z+zzse 58Hình 4-9 Kết quả ngõ ra tại khung ảnh thứ 100 2 25 +c+22£s+x+£zzscxzse 59Hình 4-10 Kết qua thông báo “PASS” cho trường hợp 2 - - 225552: 59
Trang 14Hình 4-11 Kết quả ngõ ra tại khung ảnh thứ 50 - 2 2-5-5 +52 cs+s+£ezscxzse 60Hình 4-12 Kết quả ngõ ra DUT tại khung ảnh 100 5- 5252 55s+cz£s2zzSz 60Hình 4-13 Kết quả thông báo “PASS” cho trường hợp 4 - - 2 55s se 61Hình 4-14 Kết quả ngõ ra tại khung ảnh thứ 30 2-5-5 +52 s+s+£zzzcxzse 61Hình 4-15 Kết quả ngõ ra DUT tại khung ảnh 50 5-5 52 5s+s+£+£z+xzse 61
Hình 5-1 Đặt tên cho ÍP - -.- 1101110110111 111111111111 110 11 11111111 ng 62Hình 5-2 Thêm RTL source và systh€SIS - CS HH ket 63Hình 5-3 Dinh nghĩa interface và loại tín hiỆu 5-5555 s+*ssssseseesss 64
Hình 5-4 Kiểm tra timing các loại giao tiếp và đóng gói IP - 5: 65
Hình 5-5 Lõi IP đã được tích hợp vào thư viện SOC” cccSS Sa 66
Hình 5-6 Mô hình hệ thống kiểm tra lõi IP trên FPGA 5-7 2525552 67Hình 5-7 Các thành phan IP được xây dựng trong SoC - sex 67Hình 5-8 Sơ đồ khối Video in decode c csccttcrtitrrrrrirrrrerrrrrrirrrrriei 68Hình 5-9 Sơ đồ khối Chorma resampÏ€r + + 2 £+E2££+E+E+E££+E+E+E£xzxzree 69Hình 5-10 Sơ đồ khối Color Space COTIVeTI - + - + 22+ E£2+E+E£E£E£EEeErxrree 69Hình 5-11 Sơ đồ khối CliDper +: ¿2E +S 2212193 2321511 1212152111211 221 1y 70Hình 5-12 Sơ đồ khối RGB ResampIer - + 2< +2 £+E+E+E£EzE+Eerrxzxeree 70Hình 5-13 Sơ đô khôi Dual clock FIEO - ¿5c 5+‡cxc>cxrsxxrrrxrrrrrrrrrkerrrei 7IHình 5-14 Sơ đô khôi LCD Controller - c5: c++cxt>rxrsxxrrrxrtrrrrkrrrrerrrei 7I
Hinh 5-15 Kit FPGA 0 (:000)0h ti 72Hình 5-16 Dữ liệu ngõ vào tl Camera 2.0.0 eee eeeeecceeeeesensneeeeceeeesseseneeeeceeceseeseneaneees 73Hình 5-17 Dữ liệu ngố ra IP khi không dùng bộ loc Morphological 74Hình 5-18 Dữ liệu ngố ra IP khi có dùng bộ lọc Morphologtcal - - 74Hình 5-19 Dữ liệu video ngõ vào thu tỪ camera ĂĂS S3 1 ree 75
Hình 5-20 Kết quả ngõ ra thiết kế chưa bộ lọc Morphologieal - 75
Trang 15Hình 5-21 Kết quả ngõ ra khi có bộ Morphological
Trang 16CHUONG 1 TONG QUAN DE TÀI1.1 MO DAU
1.1.1 Bối cảnh hình thành đề tai
1.1.1.1 Tình hình nghiên cứu trên thé giới
Hiện nay trên thế giới đã có nhiều công trình nghiên cứu về xử lý Video vàcũng đã có nhiều ứng dụng đáng ké trong lĩnh vực này Tuy nhiên, các nghiên cứuvà ứng dụng thực tiên được phát triển trên thé giới hoàn toàn xử lý trên phan mềm
Trong khi đó các nghiên cứu, ứng dụng xử lý ảnh trong video nói chung và nhận
dạng chuyển động trong video nói riêng được thực hiện trên phan cứng còn rat hạnchế, so với yêu câu thực tế thì như thế vẫn là chưa đủ
1.1.1.2 Tình hình nghién CỨU trong Hước
Ở Việt Nam, xử lý video là một vấn dé còn khá mới mẻ Thực tế cho thấyrằng, khi xã hội phát triển càng mạnh, yêu cau về các thiết bị công nghệ càng cao.Như vậy, xử lý video là một mảnh đất màu mỡ cho các trung tâm nghiên cứu, cáccông ty đầu tư vào Nhất là trong giai đoạn hệ thống nhúng đang phát triển và mởra một kỷ nguyên với cho ngành công nghệ phan cứng như hiện nay Giám sát tựđộng là một hướng mới và có nhiều triển vọng trong sự phát triển tiếp theo của lĩnhvực nhận dạng và xử lý ảnh 2 chiều Đông thời, đó cũng là một hướng đi cho mảngphân cứng thiết kế chuyên dụng cho các thiết bị giám sát tự động Việc phát hiện racác đối tượng chuyển động trong video nhờ các kỹ thuật xử lý ảnh, trên cơ sở đóđoán nhận một số hành vi của đối tượng dựa trên nên tản phần cứng là một việclàm có ý nghĩa khoa học và thực tiễn, nhất là trong hoàn cảnh Việt Nam chưa cónhiều những nghiên cứu và ứng dụng theo hướng này
Trang 171.1.2 Tính cấp thiết
Trong kỷ nguyên công nghệ thông tin hiện nay, với sự phát triển nhanhchóng của các công nghệ chế tạo thiết bị phần cứng ngày càng hiện đại, tỉnh vi.Trong đó phải kế đến sự phát triển của các thiết bị thu nhận hình ảnh từ thé giớithực, chiang hạn như các hệ thống giám sát bằng camera, song hành với nó là cácvấn dé liên quan đến việc giám sát Thách thức chính cho công nghệ phan cứngtrong lĩnh vực này chính là việc xử lý các hình ảnh thu nhận được từ các hệ thốnggiám sát đó Giám sát là một vẫn dé được rất nhiều nhà nghiên cứu quan tâm đặcbiệt bởi những ứng dụng thiết thực của nó cho đời sống xã hội Chắng hạn như cáchệ thống giám sát các hành vi khả nghi của tội phạm, khủng bố ở các địa điểmnhạy cảm của các chính phủ Hệ thống giám sát trong các viện bảo tang, lưu trữ déchống trộm cắp các di vật đang được trưng bày Hệ thống giám sát các hiện tượngbất bình thường, vi phạm pháp luật, tai nạn ở các điểm giao thông Hệ thông giámsát phòng chống hỏa hoạn Các hệ thống giám sát trong các siêu thị, cửa hàng,công ty dé chống trộm cắp, Thách thức chính cho ngành công nghệ phan mém làđưa ra các giải pháp nhằm xây dựng một hệ thống giám sát tối ưu nhất nhằm giúpcon người phát hiện chính xác và kịp thời các hiện tượng bất thường để có biệnpháp xử lý nhanh chóng nhằm tránh các thiệt hại đáng tiếc cho xã hội
Trang 18Dữ liệu thu được từ hệ thông camera giám sát thường được lưu trữ dướidạng Video Như vậy công việc hiện nay của chúng ta là nghiên cứu các vẫn đềliên quan đến việc xử lý Video.
1.1.3 Mục tiêu của đề tài
Thiết kế lõi IP mềm thực hiện nhận dạng chuyển động trong video có khảnăng tích hợp vào các hệ thống SoC nhằm phục vụ cho các ứng dụng giám sáttrong thực tế :
- Nam vững kỷ thuật thiết kế lõi IP nhận dạng chuyên động
- Dap ứng thời gian thực.
- Str dung IP vào các hệ thong SoC:
> Cai thiện độ tin cậy trong quá trình giám sát.
> Tăng tốc độ xử lý
Trang 19CHƯƠNG2 NGHIÊN CỨU TỎNG QUAN VÀ KỸ THUẬTTHIẾT KE VI MẠCH TOI UU CHO LOI IP NHẬN DANGCHUYEN DONG TRONG VIDEO
2.1 TONG QUAN NOI DUNG NGHIEN CUU2.1.1 Cách tiếp cận va phương pháp nghiên cứu2.1.1.1 Phương pháp tiếp cận
Một thuật toán phát hiện chuyển động ồn định và hiệu quả có thê xử lý đượctốt trong những điều kiện thay đối ảnh sáng, nhiều đối tượng di chuyên trong mộtkhung ảnh và cảnh nên thay đổi thường xuyên Có thé đưa ra một số phương phápthường được sử dụng trong kỹ thuật này như phương pháp luông quang hoc
(Optical Flow), phương pháp khác biệt theo thời gian (Temporal Differencing), Mô
hình thống kê (Statistical Method) và phương pháp trừ nền (BackgroundSubtraction) Hạn chế của phương pháp khác biệt theo thời gian (TemporalDifferencing) là không xử lý tốt những khung ảnh có nhiều đối tượng chuyênđộng Phương pháp luông quang học (Optical Flow) khó áp dụng trong thời gianthực do tính toán phức tạp (đặc biệt khó khăn khi xây dựng trên FPGA) Dé khắcphục những nhược điểm của các phương pháp trên, học viên dé xuất phương pháptiếp cận giải quyết bài toán dựa trên phương pháp mô hình Delta Sigma
Trang 20Dựa trên các lý thuyết đã tìm hiểu và nắm vững, học viên sẽ phân tích, đánh giákhả năng và những khó khăn khi cài đặt thuật toán nhận dạng chuyển động lênphân cứng Những phân tích này là cơ sở để xây dựng nên các ràng buộc thiết kế.Bước tiếp theo, học viên sẽ xây dựng bản đặc tả kỹ thuật chỉ tiết cho thiết kế, vàphát triển mã nguồn Verilog HDL theo ban đặc tả kỹ thuật đó.
Đề đảm bảo chất lượng của thiết kế, học viên sẽ việc xây dựng môi trường kiểm trathiết kế, và thực hiện kiểm tra thiết kế đối với từng module và sau cùng là cả hệthống
Sau khi việc kiểm tra thiết kế thông qua môi trường đã xây dựng Học viên sẽ càiđặt và thử nghiệm thiết kế trên FPGA Trong quá trình chạy thực tế sẽ có nhữngvấn để phát sinh cần phải khắc phục ỏ thiết kế từ đó thiết kế sẽ hoàn thiện hơntrong các lần chạy thực nghiệm tiếp theo
2.1.1.2 Phương pháp nghiên cứu
Quy trình thiết kế lõi IP tuân thủ chặt chẽ theo quy trình thiết kế số sử dụnggói phan mém của công ty Synopsys:
Trang 22Trong phạm vi nghiên cứu của minh, học viên chỉ dừng lại ở bước Logic
Verification trong lưu đồ của synopsys Quá trình nghiên cứu gôm các bước sau:
s* Bước 1: System Specification
Từ yêu cau của dự án, bước dau tiên là phân tích nhằm thiết lập đặc tahệ thống (System Specification) Đặc tả hệ thống bao gôm luéng dữ liệu{Data Flow}; định thời ƒTiming}; sơ đồ chân; mô tả từng khối chứcnăng kết nỗi giữa các khối với nhau
s* Bước 2: Function design
Bước tiếp theo là lập trình chức năng cho từng khối chức năng, cònđược gọi là viết RTL code, sử dụng các ngôn ngữ mô tả phần cứng như là
Verilog, VHDL s* Bước 3: Logic design
Dùng phan mềm Leda dé kiểm tra cú pháp (Syntax) của RTL code vàcác luật (Rule) dé quá trình tổng hợp thiết kế (Synthesize Design) đượctối ưu Quá trình này gọi là “Logic Design” Đồng thời dùng VCS kiểmtra ở mức RTL Code chức năng của từng khối chức năng, nếu phát hiệnlỗi quay lại thực hiện bước 2
s* Bước 4: Logic verification
Kết nối các khối chức năng lai với nhau va dùng VCS mô phỏng kiểm
tra chức năng của toàn bộ chip (chip level) ở mức RTL Ngoài các bước
trên, bước cuối cùng để đánh giá được khả năng hoạt động thực tế, thiếtkế được cài đặt và kiểm tra trên FPGA
Trang 232.1.2 Sơ lược về nhận dạng chuyền động và các giải thuật nhận dạng chuyền
động
2.1.2.1 Giới thiệu về nhận dạng chuyển động
Mỗi ứng dụng được thừa hưởng từ việc xử lý Video thông minh những thứ nó cầnđể giải quyết những yêu cầu khác nhau Tuy nhiên, chúng có một số điểm chungsau: các đối tượng chuyển động Nhu vậy, việc phát hiện các đối tượng chuyềnđộng là bước dau tiên của bat kỳ hệ thống xử lý Video nào Khi tìm kiếm thấy cácđối tượng chuyên động mới bat đầu chuyển sang bước xử lý khác Thực tế thì cácVideo thu được từ camera có rất nhiều nhiễu, chang hạn như sự thay đối của ánhsáng, sự thay đôi của thời tiết, lá rung, Việc phát hiện đối tượng chuyển động gapvan dé khó khăn dé xử lý một cách chính xác Các công nghệ thường xuyên đượcsử dụng dé phát hiện đối tượng chuyên động là phép trừ nên, các phương pháptĩnh, sự khác biệt về thời gian và optical flow
Trang 242.1.2.2 Sơ lược các giải thuật nhận dạng chuyển động“+ Phương pháp trừ nên (Background Subtraction)
s* Giới thiệu
Nhận dạng đối tượng chuyển động từ một chuỗi ảnh là một nhiệm vụ cơ bảnvà cốt yéu trong giám sát video, giám sát và phân tích tình hình giao thông, nhận
dang và theo dõi người và nhận biệt cử chỉ trong giao tiép giữa người va máy.
Một phương pháp thường được sử dung để xác định đối tượng chuyên độnglà trừ nên (background subtraction) Đây là một phương pháp thường được sử dụngđể phân đoạn chuyền động trong hình ảnh tĩnh Mỗi khung ảnh sẽ được so sánh vớimột nên tham khảo Các điểm ảnh trong khung ảnh hiện tại có sự khác biệt đáng kếvới nền được xem là đối tượng chuyên động Các điểm ảnh tiền cảnh này sẽ được
xu lý ở bước định vi và theo dõi.
Phương pháp này sẽ cô gang phát hiện vung chuyển động bang cach laytừng điểm ảnh của hình ảnh hiện tại trừ đi cho một ảnh nền tham khảo (referencebackground image) được tạo ra bằng cách lấy trung bình các ảnh trong khoảng thờigian khởi tao ban dau Điểm ảnh nào có hiệu số trên mức ngưỡng được phân loạivào nhóm tiền cảnh (foreground) Sau khi tạo được ma trận các điểm ảnh tiền cảnh,các thao tác tiền xử lý hình thái hoc (morphological) ví dụ như co anh (erosion),giãn nở (dilation) và đóng ảnh (closing) được thực hiện nhằm làm giảm ảnh hưởngcủa nhiễu và cải thiện vùng được nhận dạng Ảnh nền được cập nhật với các ảnhmới theo thời gian dé thích nghỉ với sự thay đối của hình ảnh
Ké từ khi trừ nên trở thành bước dau tiên trong nhiều ứng dụng thị giác máytính, việc tách các điểm ảnh tiền cảnh tương ứng với đối tượng chuyển động một
cách chính xác là rat quan trọng Mặc dù đã có nhiêu giải thuật trừ nên đã được đê
Trang 25xuất trong các tài liệu, vấn đề nhận dạng đối tượng chuyển động trong môi trườngphức tạp vẫn sẽ chưa được giải quyết triệt dé.
“+ Các phương pháp trừ nênCác phương pháp tiếp cận xây dựng mô hình trừ nên dựa trên các phương
pháp cơ bản như trung bình, trung vị, so sánh sự khác nhau giữa hai khung hình
hoặc tính histogram Các phương pháp này có ưu điểm là cách tính nhanh và đơngiản, tuy nhiên không tách được cảnh nên tốt Và thường bị ảnh hưởng bởi nhiễu
môi trường.
“+ Trừ nên dựa trên phương pháp trung vị, trung bình
Trong trường hợp này, mô hình nền được tính bằng cách lấy trung bình hoặctrung vị của n khung hình trước đó, mô hình nền được mô tả bởi công thức:
Trong trường hợp trung vi:
Trong trường hợp trung bình:
B(x,y.t) =B(x,y,t-1) +1I(%.y.f) (2)
10
Trang 26Sau có mô hình nên, cảnh nên có thê được tách ra băng cách sử dụng mộtngưỡng TH cho toàn bộ ảnh:
| (x, yt) — B(x, y,/)| > Th (4)
Hình 2-3 Mô ta giải thuật tách nên sử dụng phương pháp median (a) ảnh tại thời
điểm t (b)anh nên với n = 10 (c) ảnh nên với n = 20 (c) ảnh nên với n = 50
Uu điểm của phương pháp này:- Dễ dàng thực hiện và sử dụng nhanh chóng- MG hình nên tương đương không phải là hăng số, có thé thay đôi theo thời
gian
II
Trang 27Nhược điểm:- Do chính xác phụ thuộc vào tốc độ di chuyển của đối tượng và tốc độ khung
hình
- _ Yêu cau bộ nhớ lớn- Giá trị ngưỡng được sử dụng cho tất cả các điểm anhDo đo phương pháp này sẽ cho kết quả không tốt trong một số điều kiện:
*» Nêu nên là hai mồ hìnhs* Cảnh nên bao gdm nhiêu đôi tượng di chuyên chậm
+ Điều kiện độ sáng thay đôi theo thời gian“+ Trừ nên dựa trên phương pháp histogram
Trong mô hình tách nên, histogram của môi điểm ảnh trong bức ảnh theomỗi khung hình được định nghĩa Dé đạt được độ chính xác thông tin của ảnh nên,việc chọn không gian màu tinh histogram là rất quan trọng Ảnh xám và RGBthường thường được sử dụng để tách và cập nhật ảnh nên Tuy nhiên các khônggian màu này rất dễ nhạy với sự thay đổi của ánh sáng Trong lĩnh vực xử lý anh,ngoài hai không gian màu trên, có một số không gian màu khác được sử dụng:HSV, HIS, YCbCr Đối với những điểm ảnh thuộc ảnh nên, histogram của điểmảnh đó theo thời gian sẽ không thay đổi Dựa vào đặc điểm nay ta có thé tách đượccảnh nền ra khỏi anh cần xử lý [5] dé xuất phương pháp trừ nén dựa trên tính
histogram trên không gian màu YCbCr Phương pháp sẽ tính histogram của các
điểm ảnh sau một số frame nhất định Giá trị histogram của các điểm ảnh lớn hơnmột gid trị ngưỡng nhất định sẽ được xem xét là điểm ảnh nền Ưu điểm củaphương pháp này là sử dụng không gian màu YCbCr, có thé giảm thiêu được sự
ảnh hưởng của điêu kiện ánh sáng môi trường Các bước thực hiện của thuật toán:
12
Trang 28- _ Trừ cảnh nền — Background subtractionBước 1: Biến đối ảnh sang không gian màu YCbCr, thông tin ảnh tại khung hình
thứ n được định nghĩa :
Trong đó fp@°(i,j), fa“"(i,j) biểu diễn thành phan Cb, Cr của điểm ảnh
(ij) tại khung hình thứ n
Bước 2: Đối với N khung ảnh trước đó, histogram Cb, Cr được tinh
theo công thức :
H;;()=>`ô|ƒ,”Œ,j)—k|H;/;(®)=Ð,õ[1„"(.j)—k]ô[p—al=| x7
A14Ci, 3) 1 ®
nm l 2
n-(a) Recent N frames at time n
125 10 36 500 24 eer
#,(, 7) HU z7] Hh 26)x[i 25]
(b) Index to maximum frequency pixel value
Hình 2-4 : Mô hình tinh histogram
13
⁄⁄
HÍ1E]
(6)
Trang 29Hình 2-4 mô tả bước tinh histogram cho [5] Dé giảm dung lượng bộ
nhớ sử dung, khi khung n+1 được sử dung, thì khung n-N sẽ bị xóa và lưukhung n+1 vào bộ nhớ.
Bước 3: Xác định cảnh nên Cảnh nền được xác định là những điểm cógiá trị histogram là lớn nhất:
B° (i,j) = max\H, ;° (k)}
ui (k)}
Trong đó: Bj), BŒ(j) biểu diễn thành phan Cb,Cr tại điểm anh
(7)B° (i, j)= max{H
(i,j) của nên tương ứng :- _ Cập nhật cảnh nên — Background updating
Do môi trường bên ngoài là không 6n đỉnh, phụ thuộc vào nhiều yếutố như điều kiện ánh sáng, đối tượng trong hình Do đó ảnh nền không côđịnh và cần phải được cập nhật thường xuyên [6] đề xuất phương pháp cập
Trang 30Bước 3: Nếu n=P, kết thúc Ngược lai, n=n+1, lặp lại bước 1 Nếu giátrị biến đếm năm trong khoảng thời gian thực thi điểm ảnh thì giá trị mới củađiểm ảnh đạt được bởi phương trình ở bước 2 và bước 3 trong khâu tách
cảnh nên Lúc này, ảnh nên được cập nhật.
Hình 2-5 Cập nhật ảnh nên trong phương pháp histogram“+ Mô hình trừ nền dựa trên phương pháp thong kê — Gaussian Mixture
Model (GMM)
Ban dau, mô hình Gaussian đơn (Single Gaussian) dé tìm kiếm phương sai củamức cường độ điểm ảnh (the pixel intensity level) của ảnh Tuy nhiên, điểm ảnh cóthé được thé hiện ở nhiều yếu tố, do đó điểm ảnh có thé được đại diện bởi một bộtrộn các Gaussian (GMM) thay thế cho mô hình đơn Mô hình GMM là một hàmtham số mật độ xác suất được biểu diễn như là một tong trong số của các mật độ
Gaussian thành phan GMM được su dụng rộng rãi như là một mô hình tham sỐ
của phân phối xác suất của các phép đo liên tục hay tính năng trong một hệ thốngsinh trắc học Các tham số GMM được đánh giá tu việc huấn luyện đữ liệu sử dụngthuật toán lặp cực đại hóa kỳ vọng (Expectation Maximization — EM) hoặc tôi đa
hậu nghiệm (Maximum A Posteriori — MAP) [8].
15
Trang 31Mô hình GMM: Một mô hình GMM là tong thành phan của k thành phan mật độ
Gaussian được cho bởi công thức:
Trong đó:
K: Số vùng, số thành phần
Pi: Trọng số với DS, Pi=1
Mỗi thành phần mật độ là một ham Gaussian:
cho bởi công thức :
ki=l
- Trong đó :
K: Số phân phối Gaussianit: Trọng số đánh giá của Gaussian thứ i trong mô hình hỗn hợp tạithời điểm t
16
Trang 32uit : Trung bình của Gaussian thứ i trong mô hình hỗn hợp tại thờiđiểm t.
2i: Ma trận hiệp phương sai của Gaussian thứ ¡ trong mô hình hỗ
hợp tại thời điểm t.n: Ham mật độ phân phối Gaussian :
thấy Một Match được định nghĩa là một giá trị điểm ảnh trong 2.5 độ
lệch chuẩn của một phân phối Ngưỡng này có thê xáo trộn với một íttác động đến hiệu suất Đây là một cách hiệu quả cho mỗi ngưỡng
17
Trang 33điểm ảnh/phân phối Điều này rất hữu ích đối với các vùng khác nhaucó độ sáng khác nhau Nếu không có phân phối nào match với giá trịđiểm ảnh hiện tại, phân phối có khả năng xảy ra ít nhất được thay thếvới một phân phối với giá trị hiện tại bằng với giá trị trung bình củanó, một khởi tạo một phương sai cao và hệ số tiên nghiệm thấp (low
- Dua vào các tham số cửa mô hình hỗn hợp của mỗi điểm anh thay đôi,ta có thé xác định Gaussian của mô hình hỗn hợp là giống nhất được
18
Trang 34tạo ra bởi cảnh nên Việc xếp hạng (rank) của một Gaussian được địnhnghĩa là w/o Giá trị này được lay lớn hơn nếu các phân phối có độlệch chuẩn thấp và nó matched trong nhiêu khoảng thời gian Khi cácGaussian được sắp xếp theo thứ thự xếp hạng giảm dân của hệ sốchuẩn hóa w/ o, giá trị trị dau tiên sẽ giống cảnh nên nhất Giả sử:
+ Mô hình trừ nên dựa trên phương pháp phân cum K-meansThuật toán k-means được sử dụng lần đầu tiên năm 1967 bởi James MacQueen,
dựa trên ý tưởng cua Hugo Steinhaus nam 1957 Đây là phương pháp của vector
quantization, phổ biến cho kỹ thuật phân tích cum trong cực tiêu hóa dữ liệu Phâncụm K-Means nhăm mục đích chia tập dữ liệu 6m n quan sát vào k cụm khácnhau, trong đó mỗi quan quan sát thuộc về cụm với trung bình gan nhất Giải thuật
K-Means được m6 tả như sau:
- Cho một tap ôm n quan sát (XI, X2, ,Xn), mỗi quan sát là một véc tơ
d chiều, phân cụm K-Means sẽ chia n quan sát trên vào tập s, k cụm (k
19
Trang 35means sử dụng kỹ thuật vòng lặp đi lặp lại cho đến khi hội tụ xay ra.Do tính phố biến của phương pháp này, thuật toán này thường được
gọi là thuật toán K-Means (K-Means algorithm) hoặc gọi là thuật toánLloyd’s [7]
Giải thuật K-Mean ứng dụng trong kỹ thuật phân vùng ảnh được thực hiện như
i x,eS,?Lap lại bước 1 và bước 2 đến khi hội tụ Hội tụ xảy ra khi không cóbất kỳ sự thay đôi vị trí của các điểm ảnh đến các cụm
+ Mô hình thống kê (Statistical Method)Những phương pháp tiên tiến hơn sử dụng các đặc trưng thống kê của các điểmảnh riêng lẻ đã được phát triển dé vượt qua những thiếu sót phương pháp trừ nên.Các phương pháp thong kê này có tiền đề phát triển từ phương pháp trừ nền xét vềmặt giữ và cập nhật thống kê điểm ảnh thuộc về ảnh nền Những điểm ảnh tiền
20
Trang 36cảnh được xác định băng cách so sánh các thống kê của mỗi điểm ảnh với điểmảnh đó trong của nên ảnh mẫu.
Cách tiếp cận này đang ngày càng thông dụng bởi vì tính hiệu quả của nó trong cácảnh chứa nhiễu, ánh sáng thay đôi và bóng
% Khác biệt theo thời gian (Temporal Differencing)
Phương pháp này nhận dạng vùng chuyên động bằng cách sự khác biệt của từngđiểm ảnh trong các hai hoặc ba khung ảnh liên tiếp trong một video
Phương pháp này có sự tương thích tốt với sự thay đổi cảnh liên tục, tuy nhiên nóthường thất bại trong việc nhận dạng toàn bộ các điểm ảnh thích hợp của một sốloại đối tượng chuyên động Ngoài ra, phương pháp cũng thất bại khi nhận dạngđối tượng không chuyển động trong hình Can bố sung thêm phương pháp dé nhậndạng đối tượng không chuyển động cho các xử lý ở mức cao hơn
+ Luong quang học (Optical Flow)Phương pháp Optical flow thực hiện bằng cách sử dụng các vector có hướng củacác đôi tượng chuyển động theo thời gian dé phát hiện các vùng chuyên động trongmột ảnh Chúng có thé phát hiện chuyển động trong các dãy Video ngay cả cácVideo thu được từ camera di chuyên
Optical flow là khái niệm chỉ sự chuyên động tương đối của các điểm trên bề mặtmột đối tượng, vật thé nào đó gây ra, dưới góc quan sát cua một điểm mốc (mắt,camera ) Su chuyén động của các vat thể (mà thực tế có thể coi là sự chuyểnđộng của các điểm trên bé mặt của vật thé ấy) trong không gian 3 chiều, khi đượcchiếu lên một mặt phẳng quan sát 2D được gọi là motion field Nói chung, mụcđích của các phương pháp optical flow estimation là dé xác định (xấp xỉ) motionfield từ một tập các frame ảnh thay đổi theo thời gian, chúng được sử dụng rộng rãi
trong các bài toán object segmentation, motion detection, tracking
21
Trang 37Nhược điểm chính của phương pháp dòng quang này là khó áp dụng trong thờigian thực do tính toán phức tap, tốn rất nhiêu thời gian cho việc tính toán.
2.1.3 Phương pháp Delta Sigma Background Subtraction
2.1.3.1 Tổng quanDé phát hiện các đôi tượng chuyển động trong một chuỗi hình ảnh là một nhiệm vụrất quan trọng đối với nhiều ứng dụng thị giác máy tính, chăng hạn như video giám
sát, giám sát giao thông Khi máy ảnh đứng yên, phương pháp thường được sử
dụng là nền trừ Nguyên tắc của phương pháp này là xây dựng một mô hình củacác cảnh tĩnh (tức là không can di chuyền các đối tượng) được gọi là nên, và sau đóso sánh từng khung hình của chuỗi dé nên tảng này để phân biệt các vùng chuyềnđộng bat thường, gọi là tiền cảnh (di chuyển các đối tượng)
Nhiều thuật toán đã được phát triển cho phép trừ nên, trong phan nay học viên giớithiệu một tập hợp các thuật toán phát hiện chuyển động được gọi la XA cơ bản [4]và thuật toán XA cải tiến [5] được thiết kế dé tối ưu các tính toán hiệu quả củathuật toán XA cơ bản, dé:
- Muc tiêu thực hiện thời gian thực.
- Thực hiện dé dàng trên phan cứng.- _ Có khả năng thực hiện trên bộ vi xử lý và hệ thong nhúng
2.1.3.2 Giới thiệu thuật toán Delta Sigma Subtractions* Giải thuật XA cơ bản
Các nguyên tac của thuật toán XA là ước tính hai tham số M và Vị của tín hiệu thờiI, trong mỗi điểm anh sử dụng điều chế XA Thuật toán gồm 4 bước:
- Bước |: Cập nhật hình nên hiện tại M; với một bộ lọc ZA- Bước 2: Tính toán sự khác biệt giữa hình nền M; va khung anh hién
tại I, Kết quả tính toán được lưu vào bién O,
22
Trang 38- _ Bước 3: Cập nhật mô hình nền V, từ O; với bộ lọc ZA
- Bước 4: Ước tính giá trị của E, thông qua phép so sánh V, và O,Quá trình thực hiện giải thuật được mô tả như bảng:
Cho mỗi pixel x thực hiện: [bước #1: cập nhật M,|- - Nếu M,¿(x)< L() thi M(x) =M,¡(x) + 1- - NếuM,¡(x)> I(x) thi M(x) =M,¡(x) - 1
- Truong hop khác: V(x) = V,¡(x)
Cho mỗi pixel x thực hiện: [ bước #4: ước tinh E, ]- E,=1 nếu V,(x) >O,(%)
- E,=O0néu V,(x) < O, (x)
Bang 2-1 Giải thuật XA cơ ban
Trong đó tham số N là hệ số khuếch dai của V; Giá trị của tham số N thường đượcchọn là 2 hoặc 4 Trong thực té, những chuyển động nhỏ của đối tượng có thé bị bỏqua, các giá trị của N là cách khắc phục tối ưu cho giải thuật này
23
Trang 39(c) Mt (d) Vt
Hình 2-6 (a) khung ảnh hiện tại I, ; (b) khung ảnh ước lượng ngõ ra EF, ; (c) khung
ảnh nên M, ; (d) phương sai V,
s* Cai thiện giải thuật XA Delta Sigma cơ ban: LA cải tiếnỞ giải thuật XA Delta Sigma cơ bản, việc loại nhiễu chưa thực sự hiệu quả Dékhắc phục điều này [4] giới thiệu phương pháp khắc phục bang cách hỏi tiếp giá trịkhung ảnh ước lượng E.¡ trước đó dé áp dụng cho khung ảnh hiện tại Mô hình giải
thuật:
24
Trang 40Cho mỗi pixel x thực hiện: [bước #1: cập nhật M ||
- Nếu E,¡ (x) = 0 thi:Nếu M,¡(%) < I(x) thi M(x) =M,¡(x) + 1Nếu M,¡(x)> L(x) thì M,(x) = Mz (x) — 1
Trường hợp khác: M,(x) = M,¡(x)
- Nếu E,¡ # 0 thì M(x) =M,¡(x)Cho mỗi pixel x thực hiện: [bước #2: tính toán O, |
- O.(x) =lM,(x)— V,(x)l
Cho mỗi pixel x thực hiên: [bước #3: cập nhật V, ]
- Nếu V.¡(x)<NÑ x O(x) thi V(x) = Vii(x) + 1- Nếu V,¡(x)> N x O((x) thi V(x) = Vui) — 1
- Trường hop khác: V(x) = Vi1(x)
Cho mỗi pixel x thực hiện: [ bước #4: ước tính E, ]
- E.= 1 nếu V,(x) >O,(%)- E, = 0 nêu V,(x) < O,(x)
Bang 2-2 Giải thuật DA cải tiến
25