Việc phát hiện xe ôtô được thực hiện bằng cách nhóm các đặc trưng hình ảnh được trích xuất từ dưới lên trên hoặc kết hợp mô hình từ trên xuống.. Phương pháp tiếp cận này chủ yếu dựa vào
Trang 1BỘ GIÁO DỤC VÀ ĐÀO ĐẠO
DAI HOC HUE
TRUONG DAI HOC KHOA HOC
NGUYEN VAN TU
PHAT HIEN DOI TUONG TRONG ANH KHONG GIAN SU DUNG PHUONG PHAP
ONLINE BOOSTING
CHUYEN NGANH: KHOA HOC MAY TINH MA SO: 8 48 01 01
LUAN VAN THAC SI KHOA HOC
ĐỊNH HƯỚNG NGHIÊN CỨU
Trang 2LỜI CAM ĐOAN
Tôi xin cam đoan luận văn: “Phát hiện đối tượng trong ảnh không gian sử dụng phương pháp Online Boosfing” là công trình nghiên cứu của riêng tôi Ngoại trừ các kết quả tham khảo từ các công trình nghiên cứu trên thế giới tôi đã ghi rõ trong
luận văn Các số liệu kết quả trong luận văn là trung thực Đó là một quá trình dai,
hai năm vừa học vừa nghiên cứu của bản thân
Người thực hiện luận văn
Trang 3LỜI CẢM ƠN
đầu tiên, tôi xin chân thành gửi lời cảm ơn sâu sắc đến thầy - Tiến sĩ
Nguyễn Dang Binh Thay đã tạo mọi điều kiện giúp đỡ, diu dắt tơi hồn thiện luận
văn này
Tôi trân trọng gửi đến Trường đại học Khoa học Huế, đặc biệt là quý thầy, cô
Khoa Công nghệ thông tin của nhà trường lời biết ơn to lớn Nhà trường và quý
thầy, cô đã dành sự quan tâm tuyệt đối cho chúng tôi Đã nhiệt tình dạy dỗ, chỉ bảo tận tâm tất cả những môn học của chương trình thạc sĩ Khoa học máy tính
Bên cạnh, tôi cũng xin gửi lời tri ân đến gia đình, anh, chị em đã luôn giúp đỡ
tôi về tinh thần, vật chất trong thời gian dài học tập
Cuối cùng, xin cảm ơn những người bạn cùng lớp, cùng khóa Chúng ta đã song hành cùng nhau Tích cực học tập, giúp đỡ lẫn nhau để chúng ta có được như ngày hôm nay
Tuy cố gắng rất nhiều, nhưng tôi tin chắc rằng luận văn vẫn còn thiếu sót Rất mong được sự góp ý của quý thầy, cô và các bạn đề giúp tôi hoàn thiện hơn
Huế, tháng 04 năm 2020 Người thực hiện luận văn
x
Trang 4MỤC LỤC
DANH MỤC CÁC BÁNG 22222 222221122112112211221121222122222212e i DANH MỤC CÁC CHỮ VIẾT TẮTT -2-22<222122212221221122121121122122 2 xe ii DANH MỤC CÁC HINH VE ooo oocooccocsssesssessesevseesesstetevetvteitesetettenteveteneesesseees iii MO DAU ooieoecccscccssssessssssossessssessssssssessssessseessiatssssssssessisassnsessisessiessiessiessseeseeeseeeen 1 1 Lý do chọn để tài 2 25 2222212211221121112111211211212222222re 1 VY 01090013) 8 .Ả 2 3 Đối tượng và phạm vi nghiên cứu -©22222222222522251213121312111211.222 2 xe 3 4 Phuong 80) 06130005 ibiaiiadiiầidiẳđđiảđáiiiađắa 3
5.Y nghĩa khoa học và thực tiễn của để tài S n n 2121 11211121 net erreg 3 6 Cấu trúc luận văn 5-2221 11112212712122 21101 1g grruee 4 Chuong 1 TONG QUAN VE PHAT HIEN DOI TUONG VA ANH KHONG
8 5 Lal, Gidijthigusdnh khOnesgian, scseccesemucem meme enseenerceenmnoceeevey ere meeuemmenes 5 1.1.1 Lịch sử phát triển của ảnh không gian 2-©2222222222222122ee 5 1.1.2 Giới thiệu ảnh không gian API (Aernial Photograph Interpretation) 8
1.1.3 Mô hình thành phố 3D 22 22222 225222112211271121112112112112112 e0 9
Trang 5Ta có thể kết luận: một phân loại được gọi là mạnh chính là một tổ hợp tuyến
tính có trọng số của các phân loại yếu, trong đó các trọng số œ„ được ước tính theo
weak
hy
các lỗi của giả thuyết yếu như đã để cập
2.2.3.3 Onhne Boosting cho lựa chọn đặc trưng
Boosting cho lựa chọn tính năng được miêu tả ở trên được dùng cho Offline Do đó, để huấn luyện một lớp, tất cả các mẫu đào tạo phải được đưa ra trước Ở đây
chúng ta sử đụng phương pháp huấn luyện Online Boosting cho thuật toán lựa chọn đặc trưng do Grabner và Bischof [9], dựa trên phiên bản Online AdaBoost [13, 12] Thuật toán cho phép huấn luyện thích nghi với máy phát hiện
Các bộ phân loại yếu tương ứng với các đặc trưng, việc dùng Online Boosting
để lựa chọn đặc trưng dựa trên việc đưa vào các bộ chọn và thực hiện Online
Boosting trên các bộ chọn này (không trực tiếp trên các quá trình phân loại yếu)
Mỗi bộ chọn h*°!(x) chứa một bộ phân loại yếu M {h¥e** (x), , hve? (x)} và
chọn một trong số chúng theo một tiêu chí tối ưu hóa
h°°t(x) = hw°4F(x) (2.15) Sử dụng e, lỗi ước tính của từng phân loại yếu h}⁄°%k sao cho m = argmin,e; Lưu ý rằng bộ chọn có thể được hiểu là một lớp khi nó chuyển đổi giữa các lớp yếu
Huấn luyện một bộ chọn có nghĩa là mỗi lớp yếu được cập nhật và cái tốt nhất có lỗi ước tính thấp nhất được chọn
Phiên bản huấn luyện Online của AdaBoost cho lựa chọn đặc trưng hoạt động như sau: đầu tiên, một bộ gồm có N bộ chọn, nse, we, DEP được khởi tao ngau
nhiên với các đặc trưng phân loại yếu Khi một mẫu huấn luyện mới (x,y) đến các
bộ chọn được cập nhật Bản cập nhật này được thực hiện liên quan đến trọng số quan trọng  của mẫu hiện tại Mọi thuật toán Online đều có thể loại bỏ các lớp yếu Phân loại yếu với sai số ước tính nhỏ nhất được chọn bởi bộ chọn
mï` =ag mẫn (6,„,) (2.16)
Trang 7DANH MUC CAC CHU VIET TAT
AdaBoost (Adaptive Boosting) Boosting thich tng API (Aerial Photograph Interpretation) Giai thich anh khéng gian NASA(National Aeromautics and
Space Administrator)
SVM (Support Vector Machine) RGB (Red — Green — Blue) HMM (Hidden Markov Model) NIR_ (Near-infrared reflectance) LBP (Local Binary Patterns) Pixel (Picture Element)
RPC (Recall — Precision Curve)
Cơ quan hang không, vũ trụ Mỹ Máy véc tơ hỗ trợ
Đỏ - Xanh lá — Xanh nước biển M6 hinh Markov 4n
Phan xa gan héng ngoai
Dac trung mẫu nhị phân cục bộ
Điểm ảnh
Đường cong chính xác thu hồi
Trang 8DANH MỤC CÁC HÌNH VẼ Số hiệu hình vẽ Tên hình vẽ Trang 1.1
a) Buc tranh biếm họa của Honoré Daunier năm 1862, “dé cao nhiếp ảnh là một nghệ thuật”
b) Bức ảnh đầu tiên của Nadar chụp tại Paris năm 1866
c) Bức ảnh Boston chụp từ khinh khí cầu vào năm 1860 bởi James Wallace Black
1:2
a) Ảnh chụp từ trên cao ở một vùng nông thôn Thụy Điển được chụp bởi Alfred Nobel từ máy ảnh gắn vào tên lửa b) Bức ảnh chụp bằng máy ảnh gắn vào tên lửa của Albert Maul, chụp vùng nông thôn Đức
c) Tên lửa của Albert dùng đề chụp ảnh không gian
1.3 Máy bay của Wilbur Wright nam 1909 tai Centocelli, Rome,
Ý
1.4 a) Nhiếp ảnh gia quân sự trong chiến tranh thế giớ thứ I b) Ảnh chụp từ máy bay, chụp chiến hào quân sự năm 1916
1.5
a) Máy ảnh của Fairchid đạt chuẩn đề chụp ảnh trên không
b) Đảo Manhatta được chụp từ 100 bức ảnh của Fairchild nam 1921 c) Thanh phé Ocean New Jersey ctia Fairchild nim 1920 1.6 Bộ cảm biên của định dạng máy ảnh kỹ thuật sô không gian lớn UltraCamD 17 Ứng dụng phát hiện xe ôtô a) Ảnh gốc
b) Các mặt nạ ôtô được phát hiện
©) Loại bỏ những ôtô được phát hiện, phục hồi ảnh kết cấu
đường giao thông 10
Trang 9
1.8 Gián nhãn lớp các đối tượng được ánh xạ 13
Hình ảnh được chụp từ trên không của thành phố Hồ Chí
kế Minh, Việt Nam dày đặc và chồng chéo lên nhau Đề
Hai hình ảnh chụp quang cảnh một đô thị, trong đó xe ôtô
?1 xuất hiện rất nhiều và vô cùng nhỏ 8
a) Trong hoc Offline tat cả các đữ liệu huấn luyện đều có
sẵn ngay từ đầu
32 b) Trong khi học Online, một giả thuyết đang có H,_¡ được 21
cập nhật bởi một mẫu huấn luyện mới z; để có được một giả
thuyết mới H,
Sử dụng kết hợp các giả thuyết H, (x), ., H_(x), mot gia
23 thuyết tổng thê H(+) được xây dựng, giúp cải thiện hiệu 24
suat
Cac dac trung hinh anh co ban duoc thé hién
a) Giá trị của đặc trưng Haar-like là sự thay đổi của các giá
z4 trị pixel giữa vùng đánh dấu màu trắng và màu xanh lá 3
b) Phiên bản đơn giản để có được mẫu nhị phân cục bộ
2.5 So đồ mô hình Online Boosting cho lựa chọn đặc trưng 32
Mô hình học máy Online Boosting có sự giám sát của
76 chuyén gia z
27 Cải thiện khả năng phân loại trong huấn luyện 35
2.8 So đồ mơ hình thuật tốn phát hiện xe ôtô 37 2.9 | Sơ đồ hệ thống phát hiện xe ôtô từ ảnh không gian 39 3.1 Một số ảnh trong tập ảnh được sử dụng dé thực nghiệm 41
Giao diện của chương trình khi mở lên a) Bảng giao diện điều khiển, hướng dẫn
3.2 b) Giao diện quá trình huấn luyện c) Giao diện kết quả sau cùng sau khi kết thúc quá trình 43
huấn luyện và xử lý
Trang 10
Vi du mẫu huấn luyện trực tuyến
3.3 |a) Các mẫu chứa xe ôtô 43
b) Các mẫu không chứa xe Ơtơ
Hình ảnh đâu tiên khi mở chương trình lên
3.4 |a) Ảnh gốc 44
b) Ảnh huấn luyện khi gán một mẫu chứa xe ôtô
Quá trình huấn luyện cải thiện hiệu suất của bộ phân loại
a) Ảnh gốc ban đầu
b) Kết quả sau khi huấn luyện chỉ với một mẫu chứa xe ôtô
` c) Két qua sau khi huấn luyện với 27 mẫu 5 d) Kết quả cuối cùng thu được sau khi kết hợp nhiều phát
hiện bằng cách phân cụm dựa trên thay đổi trung bình
3.6 Ảnh tiếp theo của quá trình thực nghiệm 45 3:7 Kết quả huấn luyện tiếp theo của quá trình huấn luyện 45
3.8 | Kết quả của phát hiện xe ôtô 46 3.9 | Hiệu suất cải thiện bộ phân loại 47
Trang 11MỞ ĐẦU
1 Lý do chọn đề tài
Nhận dạng đối tượng là một loại hình nghiên cứu thiên về định hướng ứng dụng Tuy nhiên, có nhiều cá nhân, tập thể, tổ chức nghiên cứu về nó.Vì thế đã có rất nhiều nghiên cứu liên quan đến nhận dạng đối tượng, nhằm phục vụ cho như cầu
phát triển kinh tế - xã hội, khoa học — công nghệ như: nhận dạng ký tự quang
học, nhận dạng khuôn mặt, nhận dạng biển số xe, Đặc biệt là phát hiện đối tượng
trong ảnh không gian Đây là một vấn đề đầy thách thức và thú vị
Thách thức ở chỗ đó là sự phức tạp của rất nhiều đối tượng trong không gian
rộng lớn Và đặc biệt với một kho dữ liệu (ảnh) không lồ như thế thì cần có phương
pháp tính toán, xử lý sao cho phù hợp Nhưng nó vô cùng thú vị Giúp chúng ta có
cái nhìn rõ hơn, thực tế hơn về con người, động thực vật, về những hình ảnh có tính
quy luật, đang tồn tại trong hành tinh của chúng ta
Ảnh không gian (aerial images) là ảnh được chụp trên không trung Ở đây ảnh không gian được chụp từ máy bay và camera chuyên dụng Thông thường các máy
ảnh không được hỗ trợ bởi một cấu trúc trên mặt đất Nền tảng cho chụp ảnh trên
không bao gồm máy bay có cánh cố định, trực thăng, máy bay không người
lai (UAV), bong bay, khi cầu, tên lửa, chim bổ câu, diều, dù, kính viễn vọng và các khí cụ, xe có thể điều khiển được Máy ảnh gắn kết có thể được kích hoạt từ xa hoặc tự động: hình ảnh cầm tay có thể được thực hiện bởi một nhiếp ảnh gia Ảnh
chụp được sẽ gọi là ảnh/hình chụp trên không, ảnh từ không trung hay là không ảnh Phát hiện đối tượng (object dectection) trong ảnh là bài toán quan trọng trong thị giác máy, trả lời cho câu hỏi có hay không có đối tượng trong ảnh, có bao nhiêu đối
tượng và nếu có thì xuất hiện ở tọa độ vị trí tương déi nao bang cách vẽ ra hình chữ nhật bao quanh đối tượng đó, là căn cứ tọa độ để trích xuất cho các bài toán khác
Trang 12Có rất nhiều phương pháp để phát hiện đối tượng trong ảnh không gian như:
SVM, Rừng ngẫu nhién (random fields), hoc tích cực (active learning), Mỗi
phương pháp có những ưu điểm và hạn chế ở chỗ phải chuẩn bị tập mẫu học rất lớn và mất nhiều thời gian, công sức kế cả tài chính để nâng cao bộ phát hiện đối tượng trong khi chi phí ảnh không gian rất đắt đỏ Vấn đề đặt ra là làm sao đề xuất được một phương pháp hay mô hình học phủ hợp đề có thể giảm thiểu số lượng mẫu học trong quá trình huấn luyện nhưng đồng thời cải thiện được bộ phân loại về độ chính
xác, tốc độ học và tương tác được với con người trực tiếp để có thể giúp cho việc lựa chọn mẫu huấn luyện tại thời điểm hiện hành trong quá trình học giúp cho bộ phân loại được huấn luyện có hiệu năng cao hơn Chính vì điều đó trong luận văn
này tôi chọn phương pháp học trực tuyến tăng cường (Online Boosting) cho phát hiện lớp đối tượng xuất hiện trong ảnh không gian Hầu như tất cả các phương pháp trên đều phải kết hợp với một mô hình học máy để cho chúng ta một kết quả tốt
hơn, hiệu quả hơn
Ảnh không gian có rất nhiều ứng dụng đã được sử dụng từ lâu: Ứng dụng
trong bản dé hoc, quy hoạch sử dụng đất, khảo cổ học, sản xuất phim, nghiên cứu môi trường, kiểm tra đường dây điện, chuyển tải các dự án nghệ thuật Đồng thời, nó đã tạo ra sự xuất hiện của hàng loạt ứng dụng mới ĐI đầu trong việc ứng dụng
ảnh không gian chúng ta phải nói đến phần mềm “Google Earth” Đây là sản phâm công nghệ cao Google Earth đã mang lại cho chúng ta một hình thức tìm kiếm thông tin mới, giúp chúng ta khám phá và hiểu rõ hơn về trái đất mà chúng ta đang sống Nó có ba chức năng chính: Ứng dụng trong quản lý, ứng dụng trong quản lý
thực địa, ứng dụng xác định tiêu điểm
Chính vì vậy tôi chọn để tài làm luận văn của mình: “PHÁT HIỆN ĐỐI
TƯỢNG TRONG ẢNH KHÔNG GIAN SỬ DỤNG PHƯƠNG PHÁP ONLINE
BOOSTING” Vì nó có nhiều thách thức và thú vị như đã nói ở trên
2 Mục đích nghiên cứu
Trang 13- Nghiên cứu Phương pháp Online Boosttng cho bài toán phát hiện xe ôtô tử ảnh chụp trên không
- Cải đặt và mô phỏng thực nghiệm phương pháp Online Boosting phát hiện xe ôtô từ ảnh chụp trên không
3 Đối tượng và phạm vi nghiên cứu Đối tượng nghiên cứu chính của đề tài là:
- Ảnh không gian được chụp từ máy bay chuyên dụng - Phương pháp học máy Online Boosting
Phạm vi nghiên cứu:
Nghiên cứu về phát hiện xe ôtô kết hợp phương pháp Online Boosting 4 Phương pháp nghiên cứu
Sử dụng cơ sở lý thuyết của phát hiện đối tượng Đọc và tham khảo nhiều
nguồn tài liệu, luận văn, luận án, những nghiên cứu của nhiều nhà khoa học, nhà
nghiên cứu ở trong nước cũng như nước ngoài
Phân tích mô hình giữa xe ôtô với phương pháp Online Boosting và kết hợp với nhau để nghiên cứu
5 Ý nghĩa khoa học và thực tiễn của đề tài
Đã có rất nhiều hội thảo khoa học, nghiên cứu về ảnh chụp từ không gian Đưa ra các thông tin quan trọng để quản lý hệ sinh thái của trái đất [30, 82] Phát hiện các thay đổi của môi trường do con người gây ra trong quá trình phát triển kinh tế
xã hội của mình [3] Và đặc biệt nhất là nghiên cứu mô hình thành phố 3D [21]; cụ
thé la phát hiện xe ôtô từ ảnh chụp trên không bằng các thiết bị chuyên đụng
Để có nhiều thành quả to lớn như vậy, các nhà khoa học, các học giả, nhà
nghiên cứu đã nghiên cứu rất nhiều, kỹ và sâu về các phương pháp học máy:
Học kích hoạt, học bán giám sát, học trực tuyến Nhằm nâng cao hiệu suất của việc
phát hiện đối tượng là ảnh chụp từ trên không Đề phục vụ cho nhu cầu phát triển
kinh tế, xã hội, khoa học của loài người Và việc nghiên cứu ay theo tôi là bat tận,
Trang 14Đề tài “Phát hiện đối tượng trong ảnh không gian sử đụng phương pháp Online Boosting” tôi dựa trên những công trình nghiên cứu của các nhà khoa học, nhà nghiên cứu khác nhau đề phát hiện xe ôtô từ ảnh chụp trên không bằng máy bay chuyên đụng với phương pháp Onilne Boosting Đồng thời cài đặt thử nghiệm bằng ví dụ cụ thê để biết rõ hơn về hiệu suất phát hiện của phương pháp Online Boosting
6 Cấu trúc luận văn
- Chương 1: Tổng quan về phát hiện đối tượng và ảnh không gian
Nội dung chủ yếu của chương này trình bày các kiến thức tổng quan về ảnh chụp từ không gian bằng thiết bị chuyên đụng Đồng thời, nêu các vấn đề chính về phát hiện đối tượng Và đặt vấn đề cho bài toán phát hiện ảnh không gian
- Chương 2: Tìm hiểu phương pháp Online Boosting cho bài tốn phát hiện xe ơtơ từ ảnh chụp trên không
Trong chương 2 tìm hiểu và trình bày thuật toán Online Boosting dé phát hiện xe ÔtÔ
- Chương 3: Cài đặt, mô phỏng thực nghiệm
Ở chương này chúng ta bước vào xây đựng ứng dụng phát hiện đối tượng trong ảnh được chụp từ không gian bằng máy bay chuyên dụng Sau đó mô phỏng để thống kê kết quả phát hiện xe ôtô từ ứng dụng Đồng thời đánh giá hiệu suất đạt được, khả năng ứng dụng của phương pháp đã cài đặt và mô phỏng trong bài toán phát hiện đối tượng trong ảnh không gian
Trang 15Chương 1 TÔNG QUAN VỀ PHÁT HIỆN ĐÓI TƯỢNG VÀ ẢNH
KHÔNG GIAN 1.1 Giới thiệu ảnh không gian
1.1.1 Lịch sử phát triên của ảnh không gian
Ảnh không gian chúng ta có thể hiểu đó là những bức ảnh được chụp từ trên không bởi nhiều phương tiện khác nhau gắn liền với sự phát triển của khoa học, công nghệ Nó có một lịch sử phát triển rất lâu đời Bức ảnh chụp tử trên không đầu tiên được chụp vào năm 1858, bởi nhiếp ảnh gia và khinh khí cầu người Pháp
Gaspard Felix Tournachon, được biết đến với cái tên Nadar
(a) (b) (©)
Hinh 1.1 a) Bic tranh biếm họa của Honoré Daunier năm 1862, “dé cao nhiếp ảnh là một nghệ thuật”; b) Bức ảnh đầu tiên của Nadar chụp tại Paris năm 1866; e) Bức
anh Boston chup từ khinh khí cầu vào năm 1860 bởi James Wallace Black
Với sự phát triển của khoa học công nghệ và sự sáng tạo của con người, công nghệ nhiếp ảnh đã phát triển rất mạnh ở giai đoạn đầu này Bên cạnh khinh khí cầu, con người còn đùng: chim bồ câu, diều và cả tên lửa để đem máy ảnh vào không gian nhằm chụp những bức ảnh về thiên nhiên, hoạt động quân sự, .phục
vụ cho nhiều mục đích khác nhau của con người Như vào năm 1889, Arthur Batut
chụp bức ảnh bằng diều đầu tiên của Labruguiere, Pháp; năm 1903, chim bổ câu
được sử dụng bởi quân đoàn Bồ câu Bavaria chụp ảnh không gian; đặc biệt vào
Trang 16
(a) (b) (c)
Hinh 1.2 a) Anh chup tir trén cao 6 mét ving néng thén Thuy Dién được chụp bởi Alfred Nobel tir may anh gan vao tén lửa; b) Bức ảnh chụp bằng máy ảnh gắn vào tên lửa của Albert Maul, chụp vùng nông thôn Đức; c) Tên lửa của Albert dùng để chụp ảnh không gian
Những năm đầu của thế ki XX, khoa học, công nghệ phát triển vượt bậc Và
ngành hàng không ra đời Đây chính là điều kiện đủ để ngành chụp ảnh hàng không ra đời Và các bức ảnh đó được gọi là ảnh không gian Con người sử dụng những bức ảnh không gian cho mục đích dân sự cũng như quân sự Bức ảnh đầu tiên chụp bằng máy bay được thực hiện bởi Wilbur Wright vào năm 1909 Ông ta chụp ảnh chuyển động một khu vực quân sự tại vùng Centocelli gần Rome
Trang 17
lĩnh vực chụp ảnh từ máy bay Và đặc biệt là tham gia vào ngành khoa học mới — đo
đạc ảnh
(a) (b)
Hình 1.4 a) Nhiếp ảnh gia quân sự trong chiến tranh thế giới thứ I; b) Ảnh chụp từ máy bay, chụp chiến hào quân sự năm 1916
Đặc biệt, sự phát triển của ảnh chụp từ năng lượng nhân tạo là radar và sử
dụng phổ hồng ngoại Đồng thời sự xuất hiện của ảnh màu (được chụp từ máy ảnh) Giai đoạn này đánh đấu sự phát triển vượt bậc của ngành chụp ảnh nói chung và ngành chụp ảnh khơng gian nói riêng Ngồi ra, ảnh chụp từ không gian cũng được sử dụng cho mục đích phi quan su trong giai doan nay Sherman Fairchild đã chụp
hàng loạt bức ảnh trên không Manhattan để phục vụ cho mục đích thương mại
(a) (b) (c)
Hình 1.5 a) Máy ảnh của Fairchid đạt chuẩn để chụp ảnh trên không: b) Đảo
Manhatta được chụp từ 100 bức ảnh của Fairchild năm 1921; c) Thành phố Ocean
Trang 18Sau khi kết thúc thế chiến I và II, hai cường quốc Liên Xô và Hoa Kỳ bước vào cuộc đua vào vũ trụ Hai cường quốc này bắt đầu nghiên cứu trái đất bằng
những bức ảnh được chụp từ những con tàu vũ trụ Nổi bật là chương trình vũ trụ
Mercury (1960) đã chụp được những bức ảnh màu của trái đất có chất lượng cao Với sự tiến bộ của khoa học công nghệ ngành nhiếp ảnh hàng không phát triển rực rỡ trong những năm cuối thế kỉ XX Nó phát triển về kỹ thuật chụp và phương tiện để chụp và trong đó hệ thống camera và hệ thống hình ảnh kỹ thuật số là một điển hình Nhiều công ty, tập đoàn phát triển chúng Nỗi bật là sản phẩm UltracamD
của Microsoft Vexcel Với thiết kế khác biệt của mình đã cho những bức ảnh độc
đáo có độ phân giải cao của các kênh toàn sắc cũng như độ phân giải thấp kênh RGB và NIR 41310 Pix Le ` PP) == 1 + 17310 Pix Hình 16 Bộ cảm biến của định dạng máy ảnh kỹ thuật số không gian lớn UltraCamD
Trong xu hướng chung, hình ảnh là một nghệ thuật Nhưng ở ảnh không gian
nó còn là sự kết hợp giữa nghệ thuật, khoa học, công nghệ là điều kiện đủ để rất
nhiều ứng dụng, phần mềm ra đời Với mục đích phục vụ cho sự phát triển chung
của xã hội, của thế gidi
Luận văn này, được thực hiện dựa trên các dữ liệu hình ảnh được cung cấp bởi máy chụp ảnh UltraCamD từ ảnh chụp không gian về trung tâm thành phố Graz của nước Áo
1.1.2 Giới thiệu ảnh không gian API (Aerial Photograph Interpretation) API là một công cụ dùng để giải đoán hay giải thích ảnh trên không Nó dùng
Trang 19Chúng ta có thể nói API là quá trình phân tích và hiểu các đối tượng có ý nghĩa xuất hiện trong hình ảnh Và đây, là van dé quan trọng nhất trong thị giác máy và trong chụp ảnh API có đặc tính trực quan Giúp †a nhận dạng được những điểm cơ bản của ảnh: màu sắc, kết cấu, hình dạng, bối cảnh Ở cấp độ thấp nó giúp
chúng ta nhận dạng được đối tượng nhất định ví dụ: nhà ở, xe ôtô, con người .và
từng vị trí của chúng trong ảnh Ở mức cao hơn, API giúp nhận dạng cho đối trong
là các ứng dụng thực tế khác nhau Bản đổ, mô hình thành phố 3D, , là những ví dụ
điển hình
Hơn 100 năm qua, nhiếp ảnh trên không và các ứng dụng đi liền với nó đã có những bước tiến rất mạnh mẽ Cùng với đó là công nghệ phát triển vượt bậc cả về chụp ảnh và phát hiện ảnh Nó đóng góp cho nhân loại những lợi ích to lớn về kinh
tế, an ninh quốc phòng, giáo dục Đặc biệt chương trình vệ tình Landsat của
NASA, cung cấp rất nhiều bộ sưu tập ảnh được chụp từ trên không cho các nhà
khoa học, nhà nghiên cứu ở mọi tầng lớp khác nhau Nhiều bản đỗ đã được lập ra để phục vụ cho việc học tập, nghiên cứu, giáo dục nhằm giúp cho nhân loại có cái nhìn
cụ thể, bao quát hơn về sự sống và những biến đổi của trái đất
1.1.3 Mô hình thành phố 3D
Mô hình thành phố 3D dùng để mô tả ngữ nghĩa và hình học các đối tượng ở trong đô thị Một mô hình thành phố 3D cần phải có: mạng lưới giao thông, các tòa
nhà và thảm thực vật Các đối tượng này được phát hiện và trích xuất Các kết quả
có được sẽ cung cấp mô tả hình ảnh phong phú, chỉ tiết ở mức cao cho các mô hình thành phố 3D Tuy nhiên, chỉ phí để làm được việc này rất lớn nếu thực hiện bằng thủ công Và nhận dạng, phát hiện tự động là một phương pháp hữu hiệu
Máy quét Focus3D sử dụng công nghệ lazer cao cấp cho chúng ta những bức
ảnh hoàn hảo, khó thiết bị nào có thể so sánh được Nhung chi phi rất cao, tốn kém Do vậy, hệ thống tự động hóa tạo ra mô hình thành phố 3D được sử dụng nhiều hơn
Trang 20(a) (b) (c) Hinh 1.7 Ung dụng phát hiện xe ôtô; a) Ảnh gốc; b) Các mặt nạ ôtô được phát hiện;
e) Loại bỏ những ôtô được phát hiện, phục hồi ảnh kết cấu đường giao thơng 1.2 Bài tốn phát hiện đối tượng từ ảnh không gian và những khó khăn
1.2.1 Bài toán phát hiện đôi tượng từ ảnh không gian
Phát hiện đối tượng là tìm kiếm sự hiện diện và vị trí của đối tượng trên ảnh
chụp Phát hiện đối tượng trên ảnh là phải chỉ ra chính xác vùng ảnh là nơi biểu
diễn đối tượng được phát hiện Ảnh được lưu trữ và biểu diễn bằng ma trận điểm ảnh, mà giá trị số trên ma trận chính là giá trị màu của điểm ảnh đó Hình dạng của đối tượng được biểu diễn trên một phần của ảnh thu được thông qua một hoặc một số cụm màu khác biệt so với nền ảnh Như vậy, việc phát hiện ra đối tượng trên hình ảnh chủ yếu dựa vào màu sắc của hình ảnh, các cách xác định biên của
một vùng ảnh
Hàng loạt công trình nghiên cứu của nhiều người và nhóm người về bài toán
phát hiện đối tượng xuất hiện trong nhiều năm qua Trên các diễn đàn, tạp chí, hội
thảo khoa học, các luận văn, luận án Làm giàu, phong phú nguồn kiến thức về phát
hiện đối tượng Các nghiên cứu đi từ đơn giản đến phức tạp, từ việc phát hiện một
đối tượng trong ảnh đen trắng đến những ảnh màu Đến nay, các bài toán phát hiện đối tượng đã phát triển với nhiều nghiên cứu như phát hiện các tòa nhà, phát hiện
các thảm thực vật, phát hiện xe ôtô, phát hiện hành động, cử chỉ con người
Phát hiện đối tượng là phần đầu tiên của một hệ thống phát hiện đối tượng
Các hệ thống phát hiện đối tượng được bắt đầu xây đựng từ những năm 1970, tuy
nhiên do còn hạn chế về các luật xác định đối tượng nên chỉ được áp dụng trong
Trang 21một số ứng dụng Nó chỉ được phát triển mạnh mẽ từ những năm 1990 khi có những tiến bộ trong công nghệ video và ngày nay thì các ứng đụng của phát hiện đối trợng
đã trở nên phổ biến trong cuộc sống
Phần lớn các đối tượng được phát hiện qua việc dựa vào những thông tin trong một khung hình ảnh Có rất nhiều hướng tiếp cận để giải quyết vấn đề này Theo nhom tac gia Alper Yilmaz, Omar Javed va Mubarak Shah, đã phân loại các hướng tiếp cận này thành các loại như sau:
Bảng 1.1 Bảng liệt kê các thuật toán phát hiện đối tượng
Các phương pháp
Những nghiên cứu liên quan
phát hiện đôi tượng
Moravec’s detector [Moravec 1979]
; Harris detector [Harris and Stephens 1988] Các bộ phát hiện dựa , Scale Invariant Feature Transform [Lowe 2004] trén diém ; ; ; ; Affine Invariant Point Detector [Mikolajczyk and Schmid 2002]
Mean-shift [Comaniciu and Meer 1999] Phan ving Graph-cut [Shi and Malik 2000]
Active contours [Caselles et al 1995]
Mixture of Gaussians [Stauffer and Grimson 2000] Eigenbackground [Oliver et al 2000]
Wall flower [Toyama et al 1999]
M6 hinh nén
Dynamic texture background [Monnet et al 2003]
Support Vector Machines [Papageorgiou et al 1998] Neural Networks [Rowley et al 1998]
Adaptive Boosting [Viola et al 2003] Bộ phân loại có giám
sát
Trang 22
Với rất nhiều thuật toán như vậy, việc sử dụng thuật toán của phương pháp nào tùy thuộc vào những tình huống cụ thê Để phát huy tối đa công năng và phù
hợp của việc phát hiện đối tượng
Đối với trường hợp có ảnh nền không thay đổi thì việc phát hiện đối tượng có thê được thực hiện bằng các phương pháp trừ nền Phương pháp thường gặp là xây dựng mô hình nên, sau đó sử dụng mô hình này cùng với các khung hình ảnh hiện tại để từ đó tìm ra được các vùng chứa đối tượng Ưu điểm của phương pháp này là đơn giản, để có thể tiếp cận theo hướng này thì ta cần phải xây dựng mô hình nền như: anurad mital đùng ước lượng mật độ nhân thích nghi xây đựng mô hình nên Phương pháp này cho kết quả tốt tuy nhiên gặp khó khăn về không gian lưu trữ, tính toán phức tạp, tốc độ không đáp ứng thời gian thực Hritaoglu dùng giải thuật W4, Stauffer sử dụng phương pháp Gauss hỗn hợp để xây dựng mô hình nên Sau khi
đã nhận dạng, phát hiện ra các đối tượng thi việc xác định xem những đối tượng này
có đúng là những đối tượng ta cần phát hiện hay không cũng là một khó khăn lớn
phải đối mặt
Các phương pháp học máy là sự lựa chọn thích hợp dé phát hiện đối tượng Trong học máy, rất nhiều phương pháp đã, đang và tương lai con người vẫn phải sử dụng đến để giải quyết bài toán phát hiện đối tượng của mình Trong đó, ta có thé kế đến một số phương pháp như sau: HMM, mạng nơ ron, SVM, Boosting Cac phương pháp này đều trải qua giai đoạn huấn luyện trên một tập dữ liệu Tập dữ liệu ấy phải đa dạng, đủ lớn để bao quát hết tất cả các trạng thái của đối tượng Và
những đặc trưng cơ bản, phù hợp nhất được lay ra từ bộ dữ liệu này Việc lựa chọn
đặc trưng sử dụng đóng vai trò quan trọng ảnh hưởng đến hiệu quả của các phương pháp học máy Một số đặc trưng thường được sử dụng như: đặc trưng về màu sắc,
đặc trưng về góc cạnh, đặc trưng biểu đổ Sau khi đã có được đặc tung, ta sé gan
nhãn lớp cụ thê cho các đặc trưng đó dé sử dụng trong việc huấn luyện Trong quá trình huấn luyện, các phương pháp học máy sẽ sinh ra một hàm để ánh xạ những đặc trưng đầu vào tương ứng với nhãn cụ thể Sau khi đã huấn luyện xong thì các phương pháp học máy trên sẽ được đùng để phân lớp cho những đặc trưng mới Đặc
Trang 23điểm của phương pháp này là độ chính xác cao Tuy nhiên nó gặp phải khó khăn trong việc thu thập đữ liệu huấn luyện ban đầu, tốn thời gian và chi phí cho quá trình này
1.2.2 Những khó khăn của phát hiện đối tượng từ ảnh không gian
1.2.2.1 Chất lượng hình ảnh thu được
Chất lượng hình ảnh thu được là một yếu tố cơ bản ảnh hưởng đến quá trình phát hiện đối tượng Trong một số trường hợp, chất lượng ảnh quá kém gây khó
khăn đối với việc phát hiện đối tượng Các vùng ảnh không thê tách biệt được khi
dựa trên các yếu tố màu sắc Các hình ảnh có độ phân giải thấp nên không thể nhìn
thấy rõ nhiều chi tiết Bên cạnh đó, các đối tượng thường bị che khuất bởi các cành
cây Các kích thước và các đặc tính kết cấu ảnh của đối tượng khác nhau quá nhiều và sự biến đổi của các đối tượng trong ảnh đòi hỏi phải tính toán nhiều đặc trưng
khác nhau
Chất lượng ảnh phụ thuộc rất nhiều vào thiết bị chụp ảnh Độ phân giải của
máy ảnh, cảm biến hình là yếu tố quyết định chất lượng ảnh Bên cạnh đó, yếu tố môi trường cũng ảnh hưởng đến chất lượng ảnh Môi trường có độ âm cao, sương mù, độ sáng, độ tương phản và độ sắc nét của hình ảnh thay đổi do yếu tố chiếu sáng của mặt trời và sự nhiễu loạn của khí quyên cũng làm chất lượng ảnh thu được kém hơn Để xử lý trường hợp này, cần có phương pháp làm tăng chất lượng ảnh
Cây cối Tòa nhà
Xe ôtô, bãi đậu xe
Hình 1.8 Gán nhãn lớp các đối tượng được ánh xạ
Trang 241.2.2.2 Lỗi chụp ảnh không gian
Với rất nhiều phương tiện ngày càng phát triển để phục vụ cho việc chụp ảnh từ không gian Tuy vậy, vẫn có những lỗi trong quá trình chụp ảnh và cũng có
những hạn chế nhất định như: Lỗi hình học (hay lỗi vị tr) do vị trí và kích thước của các đặc tính trên một bức ảnh thay đổi Lỗi hình học có thể xảy ra do các thiết
bị sử dụng để chụp những bức ảnh không gian (Wolf và Dewitt 2000)
Lỗi phóng xạ (các lỗi trong màu sắc và tôn ảnh) được gây ra bởi điều kiện, điểm chuân của máy ảnh cũng như các loại bộ lọc Môi trường làm biến đổi phóng xạ bao gồm giờ, mùa chụp ảnh Bóng tối, ánh sáng chói, đám mây và sương mù cũng có thể gây ra lỗi phóng xạ (Cohen et al, 1996)
Trong trường hợp khác, hai đối tượng có hình ảnh chồng lên nhau, hình của đối tượng này che khuất một phần hay toàn bộ hình của đối tượng kia Các phương
pháp xử lý nội dung ảnh (lọc màu, nhận dạng biên, ) sẽ phát hiện sai đối tượng khi gặp nhiễu Đây là vấn đề thách thức đối với bài toán phát hiện đối tượng
Hình 1.9 Hình ảnh được chụp từ trên không của thành phố Hồ Chí Minh, Việt Nam
dày đặc và chồng chéo lên nhau
1.3 Các vấn đề chính của phát hiện đối tượng
Các vấn đề của phát hiện đối tượng từ ảnh không gian liên quan đến việc xác định vị trí xuất hiện của các đối tượng trong ảnh không gian Đây là một trong những bài toán của lĩnh vực viễn thám và thị giác máy cũng như khai thác dữ liệu ảnh không gian và đóng vai trò quan trọng trong việc hiểu và giải thích ảnh không gian
Trang 25Trong những năm qua, vấn đề phát hiện đối tượng tự động từ ảnh không gian là một đề tai thu hút nhiều sự quan tâm và nghiên cứu của cộng đồng thị giác máy và viễn thám Ảnh không gian với nhiều đối tượng khác nhau tạo nhiều thách thức trong vấn để nhận đạng đối tượng
Các đối tượng quan tâm có thé chia làm hai loại chủ yếu: 1) Lớp đối tượng xuất hiện thường xuyên như xe ô tô, xe tải,
2) Lớp các đối tượng phức tạp bao gồm các tòa nhà, mạng lưới giao thông Các tòa nhà là các đối tượng phức tạp với nhiều kiến trúc chỉ tiết và nhiều biến đổi
về hình dạng Các tòa nhà được tọa lạc trong các cảnh đô thị với nhiều loại đối tượng khác nhau như cây, công viên đỗ xe, đường phố, phương tiện đi lại, cột
điện
Hai đối tượng này có mô hình và ý nghĩa khác nhau trong ảnh không gian, ví dụ như phát hiện tòa nhà là đối tượng quan trọng trong quá trình xây dựng mô hình 3D trong khi đó phát hiện xe ôtô giúp khôi phục kết cấu đường bộ
Vì không có máy phát hiện tổng quát cho tất cả các loại đối tượng nên chúng
ta cần phát triển các hệ thống khác nhau để phát hiện hai loại đối tượng Các đặc
trưng được sử đụng để phát hiện các lớp đối tượng chủ yếu là các đặc trưng thị giác chung Vì vậy, cần phải xây dựng mô hình phát triển để có thể mở rộng và áp dụng các loại đối tượng khác nhau từ ảnh không gian cũng như ảnh trên mặt đất
Trong luận văn này, chúng tôi tập trung vào đối tượng chính là xe ôtô Dé phat
hiện và xác định vị trí một chiếc xe ôtô trong ảnh chụp từ trên không bằng cách xác
định đường bao quanh đối tượng Do đó cách tiếp cận phù hợp là sử dụng cửa số
tìm kiếm, trượt trên ảnh và nhận dạng các đối tượng trong cửa số với bộ phân loại Mục tiêu chính của phát hiện đối tượng bằng cách sử dụng kỹ thuật huấn luyện hiệu
quả Sử dụng phương pháp Online Boosting và tính toán các đặc trưng của đối tượng trong ảnh không gian
Với kho đữ liệu ngày càng khổng lồ cần phải được xử lý và trước các khó khăn: mắt nhiều thời gian, tốn nhiều công sức và nhiều chi phi để gán nhãn cho một lượng
Trang 26lớn các dữ liệu huấn luyện Do đó, yêu cầu cần phải có nhiều dữ liệu huấn luyện đã
được gán nhãn để giải quyết bài toán phát hiện và phân loại đối tượng là trở ngại lớn, cản trở chính đối với nhiều phương pháp hiện nay
1.4 Một số ứng dụng của phát hiện đối tượng trong ảnh không gian
Phát hiện đối tượng từ ảnh không gian có rất nhiều ứng dụng, giúp con người chúng ta giải quyết rất nhiều van dé trong su phat triển không ngừng của trái đất,
của nhân loại Nó làm giàu thêm cho nhiều lĩnh vực từ vi mô đến vĩ mô Ở đây, tôi
giới thiệu một số ứng dụng tiêu biéu
> Mô hình thành phố 3D: Trong đô thị rất nhiều đối tượng: tòa nhà, xe Ơtơ,
thảm thực vật, mạng lưới giao thông, Chúng ta dùng những hình ảnh được chụp từ trên không để phát hiện những đối tượng ấy một cách rất nhanh chóng và đễ dàng Kết quả được phát hiện và trích xuất sẽ mô tả đầy đủ, phong phú và cho thấy được thành phố 3D một cách chỉ tiết ở mức độ cao Nếu chúng ta sử dụng bằng phương pháp thủ công thì việc tạo mô hình 3D cho thế giới thực rất tốn kém, mất thời gian và thậm chí không thê xây dựng được
> Làm giàu thêm về cơ sở lý thuyết khoa học, thúc đẩy và làm xuất hiện nhiều ngành khoa học mới, như ngành chụp ảnh trên không Một ví dụ chung như thế này: các hệ thống tự động hóa tạo mô hình thành phố 3D phát triển đã kéo theo sự phát triển của ngành máy ảnh, chụp ảnh trên không bằng máy ảnh kỹ thuật số đề phù hợp với yêu cầu ngày càng cao
> Phan loại, sử dụng các loại tài nguyên trên bể mặt trái đất Các loại tai
nguyên trên bể mặt trái đất bao gồm: nước, đất đùng cho canh tác, đất rừng, vật thê
nhân tạo Việc phân loại thông tin che phủ bề mặt trái đất từ hình ảnh được chụp từ
trên không vào các loại tài nguyên khác nhau được sử dụng cho quy hoạch đô thị, nông nghiệp, môi trường Và từ đó các bản đồ phân loại sử đụng trên bề mặt trái đất ra dot
> Trong nhiing thap kỷ trước, cơ sở dữ liệu về địa hình cơ bản đã được
hoàn thiện ở các nước phát triển Và hầu hết các thay đổi trong ban dé déu có những
bản cập nhật dữ liệu cho phù hợp với hiện tại Nhiệm vụ này thường được thực hiện
Trang 27bằng phương pháp thủ công, đùng mắt thường để phát hiện các đối tượng thay đổi và chỉnh sửa lại Điều ấy đồng nghĩa với tốn kém nhân lực, tốn thời gian, không khoa học và ít hiệu quả Và phát hiện đối tượng từ ảnh chụp trên không bằng những phương pháp tự động đã giải quyết vấn đề ấy
1.5 Tiểu kết chương 1
Phát hiện đối tượng là một nghiên cứu có ý nghĩa thiết thực trong cuộc sống
và rất khoa học Nó phục vụ cho nhiều mục đích khác nhau của con người Chúng
ta có thể phát hiện đối tượng bằng mắt thường, thủ công Tuy nhiên, điều ấy không đáp ứng được những yêu cầu ngày càng phát triển của nhân loại Và hiện nay, chúng ta phát hiện đối tượng bằng những máy tự động Nhưng hàng loạt câu hỏi được đặt ra: Dữ liệu để phát hiện là gì? Chúng ta lấy dữ liệu ấy ở đâu? Dùng phương pháp nào để phát hiện hiệu quả Những câu hỏi ấy được trả lời toàn bộ trong luận văn này Trong chương 1, chúng †a mới chỉ giới thiệu về nó Dữ liệu là những tắm ảnh, và những tấm ảnh ấy được chụp từ trên không bằng máy bay
chuyên dụng, để phục vụ cho việc phát hiện đối tượng là xe ôtô trong một cảnh
quang đô thị
Chương I tuy là chương mở đầu, nhưng đã giới thiệu rất cơ bản về nội dung mà luận văn sẽ trình bày Ở đó, đã khái quát được ở những chương sau chúng ta sẽ làm gì và kết quả sẽ như thế nào?
Trang 28Chương 2 PHƯƠNG PHÁP ONLINE BOOSTING PHÁT HIỆN XE
ÔTÔ TỪ ẢNH KHÔNG GIAN
2.1 Giới thiệu bài toán phát hiện xe ôtô từ ảnh không gian
Xây dựng một hệ thống đề phát hiện đối tượng từ ảnh không gian là một vấn dé quan trọng của thị giác máy Đã lôi cuốn nhiều cá nhân, tập thể, tổ chức quan tâm, nghiên cứu Tuy nhiên, đây là một vấn để đầy thách thức Vì với những hình ảnh không gian quy mô lớn, đối tượng của chúng ta là rất nhiều xe ôtô, sự biến đổi của nền và nhiều yếu tố khác đã gây những khó khăn nhất định Hình ảnh trên không vì được chụp từ trên xuống, do đó đối tượng xuất hiện trên ảnh theo hướng
dọc của khổ ảnh Trong một đô thị, thành phố với nhiều vật: tòa nhà, cây cối, con người, xe ôtô thì sự xuất hiện của những xe ôtô rất bé nhỏ và đa dang Đồng thời, cường độ xuất hiện và nhiều chi tiết cụ thể khác nhau, rất khó phân biệt Một số
hình ảnh nếu nhìn từ trên không rất giống với xe ôtô — đối tượng mà chúng †a cần phát hiện: như cửa số, cành cây, dáng người đang tập thể dục
Máy ảnh UltracamD của hãng Microsoft Vexcel được coi như một giải pháp để chụp ảnh trên khơng hồn hảo Nó cho chúng ta những bức ảnh chụp từ trên không với độ phân giải cực cao, dung lượng lớn Nhưng với những bộ dữ liệu ảnh quá lớn ấy chúng ta không thê dùng bằng mắt thường để phát hiện Và một đòi hỏi
thiết thực được để ra đó là xử lý phát hiện tự động hiệu quả Vấn đề này là hướng mở đê con người, các nhà nghiên cứu tìm ra được một thuật toán đủ mạnh và cho
kết quả tốt đề phát hiện xe ôtô từ ảnh trên không
Hình 2.1 Hai hình ảnh chụp quang cảnh một đô thị, trong đó xe ôtô xuất hiện rất
nhiêu và vô cùng nhỏ
Trang 29Đã có rất nhiều nghiên cứu thành công về phát hiện đối tượng bằng phương pháp học máy Đặc biệt là phát hiện xe ôtô, ở đây chúng ta có thể chia làm hai nhóm phương pháp tiếp cận theo mô hình: mô hình rõ ràng và mô hình ân Phương pháp tiếp cận theo mô hình rõ ràng Đó là sử đụng một mô hình xe ơtơ chung Ơtơ
đó được thể hiện dưới mô hình 2D hay 3D đại diện cho hình dạng của xe ôtô Các đặc trưng hình ảnh: hình chữ nhật, kính chắn gió của xe ôtô được trích xuất và nhóm lại để xây dựng các cầu trúc tương tự như mô hỉnh Ngoài ra, màu sắc, độ bóng cũng là những đặc trưng có thể được sử dụng Việc phát hiện xe ôtô được thực hiện bằng cách nhóm các đặc trưng hình ảnh được trích xuất từ dưới lên trên hoặc
kết hợp mô hình từ trên xuống Đối tượng xe ôtô được coi là phát hiện nếu có bằng chứng xác thực cho mô hình trong ảnh Phương pháp tiếp cận này chủ yếu dựa vào các đặc điểm hình học của xe ôtô, đo đó đối với những mô hình phức tạp như trong
đô thị nhiều đối tượng có hình đạng giống với xe ôtô rất khó để phát hiện Phương pháp tiếp cận mô hình ân hoặc dựa trên ngoại hình, mô hình xe ôtô được tạo ra bằng
hình ảnh mẫu của xe bao gồm các giá trị về màu sắc hoặc các đặc trưng kết cấu Các mô hình được tạo ra bằng cách thu thập số liệu thống kê về các đặc trưng này
Đề phát hiện xe ôtô trong các hình ảnh trên mặt đất được chụp từ trên không một số mô hình dựa trên một phan hoặc toàn bộ các số liệu đã thống kê Có nhiều kiểu
phân loại: phân loại đơn, phân loại kết hợp, hay mô hình phân cấp cho phân loại Và máy vectơ hỗ trợ được sử dụng rất rộng rãi đề phân loại Với phương pháp tiếp cận
có những ưu điểm nhất định dé phát hiện xe ôtô, tuy nhiên vẫn còn tổn tại nhiều nhược điểm Trước nhất, đó là tốn kém rất nhiều về kinh tế để đầu tư tính toán đặc
trưng và phân loại Đồng thời, tốn nhiều thời gian và sức lao động của con người để có tập huấn luyện có phạm vi bao phủ tốt về không gian của các biến thể có thể có
của dữ liệu, và cần một lượng lớn dữ liệu được gán nhãn để huấn luyện
Và để khắc phục những hạn chế ấy, một phương pháp học máy đã được các nhà nghiên cứu cho ra đời, được sử đụng rộng rãi, phố biến Đó là phương pháp Boosting Phương pháp này được sử dụng trong: nhận dạng chữ viết, chuẩn đoán
trong y khoa, phân đoạn Đặc biệt hai nhà khoa học Paul Viola và Michael Jones
Trang 30khuôn mặt Từ đó, kỹ thuật Boosting được đùng nhiều trong cộng đồng thị giác máy Với Boosting bài toán phát hiện đối tượng được xem là bài toán phân loại nhị phân, phân biệt giữa đối tượng với nền Kỹ thuật Boosting được áp dụng rất hiệu
quả với bộ dữ liệu ảnh cực lớn và thành công cho việc phát hiện nhiều đối tượng
khác nhau
Ở đây, tôi sử đụng Boosting để xây đựng một hệ thống học nhằm phát hiện xe ôtô bằng hình ảnh từ trên không Trước nhất, đùng Boosting và biểu diễn hình ảnh tích hợp để tính toán các đặc trưng của xe ôtô một cách nhanh chóng Bước sóng
Haar, biểu đồ định hướng cục bộ, các mẫu nhị phân cục bộ làm các đặc trưng Tiếp đến sử dụng Adaboost trực tuyến để huấn luyện máy phát hiện Nó thực hiện cập
nhật trực tuyến trên các nhóm đặc trưng trong quá trình huấn luyện Bằng cách này, chúng ta có thê cập nhật các lớp khi các mẫu mới đến Nhờ đó không cần phải xây dựng tập huấn luyện trước và việc ghi nhãn bằng thủ công
2.2 Phương pháp học máy Online Boosting
Trước khi đi vào nghiên cứu phương pháp Online Boosting chúng ta cần nắm những thành phần cơ bản và các phương pháp liên quan
2.2.1 Học máy Offline và học máy Online 2.2.1.1 Hoc may Offline
Trong quá trình học Offline, tất cả các mẫu huấn luyện phải được đưa ra trước Cụ thể, một tập huấn luyện Sf# = {(x¡,y\, ,(;,y,)} Với các mẫu có nhãn L
được đưa ra Các mẫu được rút ra từ một phân loại P, được định nghĩa trên toàn bộ
cac mau S = Xx Y
2.2.1.2 Hoc may Online
Chúng ta có những định nghĩa sau:
> Nhiệm vụ học Online: đây là một nhiệm vụ học trực tuyến, nếu chúng
ta lấy các mẫu cụ thể để huấn luyện thì nó không có sự sắp xếp ưu tiên nào cả, mà nó luôn có sự xuất hiện tất cả trong thời gian huấn luyện
Trang 31> Thuật toán học Online: một thuật toán được gọi là học trực tuyến nếu
cho bất kỳ mẫu huấn luyện nào (x¡,¡), , (r,yr) nó tạo ra một chuỗi các giả đặc điểm chính của học Online là: không cần xử lý lại các mẫu trước vì mỗi h, được xem là giá trị xấp xỉ tốt nhất cho đến hiện tại của quá trình học Trong quá
trình học bất cứ lúc nảo cũng tạo ra một câu truy vấn và câu trả lời được cải thiện
trong quá trình học Do đó không có sự tách biệt trong giai đoạn huấn luyện và sàng
lọc, nó chạy trong một vòng lặp
(a) Offline (b) Online
Hình 2.2 a) Trong học Offline tất cả các đữ liệu huấn luyện đều có sẵn ngay từ đầu;
b) Trong khi học Online, một giả thuyết đang có H;_; được cập nhật bởi một mẫu
huấn luyện mới x¿ để có được một giả thuyết mới H,
Ta thấy rằng: thuật toán học Online trái với Offline chỉ xem mẫu một lần Trong thuật toán học Online ta xử lý một chuỗi các mẫu được gán nhãn lấy theo sự
phân chia của phân loại P Thuật toán học Online lấy đầu vào là một giả thuyết H,_;: X — Y và một mẫu huấn luyện mới (x¿, y,) Thuật toán trả về một giải thuyết
được cập nhật
H, = update(H,_, (xu Ye) (2.1)
Bat cứ lúc nào, cũng có sẵn một mô hình vi giả thuyết mô hình hóa quá trình tạo dữ liệu (xem hình 2.2 (b)) Nói chung các lớp phân loại có xu hướng hoạt động tốt hơn vì có thể xây dựng số liệu thống kê dựa trên tất cả các mẫu cùng một lúc
Trang 32Thuật toán học Online không mắt dữ liệu là một thuật toán trả về giả thuyết chính
xác với những øì thuật toán Offline tương ứng sẽ trả về, cùng một dữ liệu huấn luyện Tuy nhiên, thuật toán Online tốt hơn trong các trường hợp sau:
v Dữ liệu huấn luyện lớn: vì toàn bộ dữ liệu không vào bộ nhớ cùng một lúc Do đó thuật toán Online ít tốn tài nguyên bộ nhớ hơn Thuật toán Online có
thê lấy mẫu từ phân phối tổng thể và không chỉ từ tập hợp con, đây là điểm khác
biệt với Offline Sự to lớn của dữ liệu và bùng nỗ thơng tin thì thuật tốn Online
ngày càng trở nên quan trọng hơn đối với các mô hình học quy mô lớn
v Tính khả dụng: không phải tất cả các dữ liệu có sẵn ở đầu vào Hơn
nữa, quá trình tạo dữ liệu tự nó có thể thay đổi theo thời gian Do đó, mục tiêu của
người học Online là bỏ qua thông tin không liên quan, chỉ chuyên sâu vào các tình huống đang xảy ra tuy nhiên phụ thuộc vào thời gian 2.2.2 Hệ thống nhận dạng mẫu Một hệ thống nhận dạng mẫu, chúng ta có thể chia nhỏ thành từng bước như sau: Bước 1: quan sat Bước 2: phân tích
Bước 3: trích xuất lựa chọn đặc trưng
Bước 4: phân loại Bước 5: xử lý hậu kỳ
2.2.2.1 Lựa chọn đặc trưng
Lựa chọn đặc trưng nhằm lựa chọn những đặc trưng tốt sau khi trích xuất đặc
trưng dựa trên các quy tắc phù hợp Lựa chọn đặc trưng làm giảm tính chiều của không gian và loại bỏ dữ liệu dư thừa, không liên quan Do đó tăng khả năng cải thiện chất lượng của dữ liệu và tăng độ chính xác của phát hiện Các phương pháp
lựa chọn đặc trưng tiêu chuẩn có thể chia thành ba phương thức được mô tả như
sau:
v Phương pháp lọc: chúng ta thường sử dụng một số kỹ thuật (heuristic) để ước tính tam quan trọng tương đối của các đặc trưng khác nhau Điều này có thé
được thực hiện bằng cách đánh giá từng đặc trưng một cách riêng biệt hoặc dưới
Trang 33dạng một tập hợp kết hợp các đặc trưng Thuật toán sau đó chọn một tập hợp con có n đặc trưng Tuy nhiên, có một nhược điểm đó là thuật toán sẽ chọn cả những đặc trưng dư thừa, bởi vì các đặc trưng tương tự sẽ có trọng số tương tự nhau Và
phương pháp lọc sẽ chọn một tập con tốt trước khi áp đụng thuật toán học máy v Phương pháp đóng gói: phương pháp này trực tiếp đánh giá hiệu suất
các đặc trưng của một tập hợp con bằng cách đo hiệu suất của một mô hình được huấn luyện trên tập con đó Do đó trường hợp đặc biệt là tìm kiếm toàn diện của tất
cả các tập hợp đặc trưng 2!Ï trong đó rất lớn Ưu điểm là nó cung cấp tập hợp con
tối ưu cho thuật toán học được sử dụng, nắm bắt được sự kết hợp của các đặc trưng và loại bỏ các đặc trưng dư thừa Nhưng có nhược điểm là hiệu quả kém
v Bo loc — Wrapper — Hybrid: các phương pháp nhúng thực hiện lựa chọn những thay đổi trong quá trình huấn luyện và thường được chỉ định cho các thuật toán học máy cụ thể Các phương pháp này, sau khi sau khi trích xuất đặc trưng bằng phương pháp nào đó kết hợp các bước lựa chọn đặc trưng và huấn luyện phân loại trong một khung Ở mỗi giai đoạn một hàm đánh giá được sử dụng để chọn một đặc trưng, có khả năng phân biệt tốt nhất giữa các lớp Trong mỗi lần lặp với một đặc trưng do người đùng cung cấp, thuật toán đánh giá các đặc trưng đã
được chọn và thêm đặc trưng đánh giá cao nhất vào tập hợp đặc trưng Mục tiêu là
tìm kiếm các phát hiện thay thế trong số các đặc trưng Một phân phối trên các đặc
trưng được giữ và cập nhật tại mỗi lần lặp
2.2.2.2 Phương pháp tập hợp và Boosting
Phương pháp tập hợp có thể cải thiện hiệu suất thuật tốn thơng qua các mô
hình cơ sở Tập hợp là một ánh xạ quyết định từ quyết định cục bộ đến quyết định
cuối cùng (xem hình: 2.3)
Trang 34(5) Hal)
Hình: 2.3 Sử dụng kết hợp các giả thuyết H;(%), , H„(x) một giả thuyết
tổng thể H(+) được xây dựng, giúp cải thiện hiệu suất
Xây dựng bộ tập hợp là một trong những lĩnh vực của học máy, đang nhận được sự quan tâm và nghiên cứu của rất nhiều học giả, nhà khoa học, nhà nghiên
cứu trong lĩnh vực thị giác máy Chủ yếu là do những cải tiến hiệu suất đáng kế so với các lớp đơn lẻ Các bước chính là tạo và kết hợp mô hình Các phân loại đơn lẻ phải chính xác nhất có thể, nhưng loại trừ tối đa những phân loại không chính xác Hai mục tiêu này bằng một phương pháp nào đó đề xác định Nếu các phương pháp
nào huấn luyện chính xác hơn, rõ ràng hon thi sé duoc sử dụng
Nhiều phương pháp đã được phát triển để thực thi tính đa dạng trên các lớp
Ví dụ: sử dụng lược đỗ kết hợp di động, các mô hình phân loại khác nhau, các tập hợp đặc trưng khác nhau hoặc các mẫu huấn luyện khác nhau Khi sử dụng các mẫu huấn luyện khác nhau (bộ dữ liệu huấn luyện), các thuật toán huấn luyện sẽ chạy
nhiều lần, mỗi lần với một phân vùng khác nhau của toàn bộ tập huấn luyện Đóng gói và tăng cường tương ứng với nhóm đó
Các phương pháp Boosting thay đổi một cách thích ứng sự phân phối của tập huấn luyện dựa trên hiệu suất của các lớp trước đó Không giống như đóng gói, phần lớn là phương pháp giảm phương sai, Boosting đường như làm cả sai số và phương sai
Trang 352.2.2.3 Một số loại đặc trưng
> Đặc trưng Haar-like: giá trị đặc trưng được tính bằng tổng giá tri pixel (điểm ảnh) trong các vùng hình chữ nhật có trọng số dương hoặc âm Những đặc trưng này được Viola và Jones công bố để phát hiện khuôn mặt và được sử đụng rộng rãi trong thị giác máy Ở đây, chỉ dùng bốn nguyên mẫu khác nhau của các đặc trưng, xem hình 2.4 Một đặc trưng hai hình chữ nhật bao gồm hai vùng có củng
kích thước, hình dạng và liền kể nhau theo chiều ngang hoặc chiều dọc Đối với đặc
trưng ba hình chữ nhật, hình chữ nhật trung tâm bằng hình chữ nhật bao quát trừ
tổng của hai hình chữ nhật bên ngoài Đối với đặc trưng bốn hình chữ nhật, sự thay
đổi giữa các hình chữ nhật chéo nhau được tính toán Đối với đặc trưng hình trung tâm được tính bằng cách trừ các pixel xung quanh Các đặc trưng này được tính toán ở các quy mô khác nhau Dime P mm ie I = L] a L—] — (a) (b)
Hinh 2.4 Cac dac trung hinh anh co ban duoc thé hién; a) Giá trị của đặc trưng
Haar-like là sự thay đổi của các giá tri pixel giữa vùng đánh đấu màu trắng và màu
cam b) Phiên bản đơn giản để có được mẫu nhị phân cục bộ
> Dac trung dua vao biểu đồ định hướng: đầu tiên một hình ảnh Gradient duoc tinh bang bộ lọc Sobel Biểu đỗ trọng số hướng GradIent có độ lớn
được xây dựng các vùng hình chữ nhật cơ bản Và biêu đồ định hướng 8 ngăn với
kích thước không thay đổi được dùng Với mục đích cơ bản là mô tả sự xuất hiện
của một phần đối tượng bằng các théng tin Gradient
Trang 36> Dac trung mau nhi phân cục b6 (LBP): mau nhi phân cục bộ sử dụng
4 vùng lân cận (láng giềng), với 16 mẫu (2'=l6), như đặc trưng của biểu đồ 16 ngăn Mô tả kết cầu của một bức ảnh các giá trị thống kê của điểm ảnh được chuẩn hóa trong vùng lân cận cục bộ Giá trị thống kê của vùng ảnh là 3x3 (xem hình 2.4 (b)) được tính toán như sau:
1 z>0
0 z<0 2.2)
LBP(x) = i=o S(X¡ — icemnar 2" VỚI sứ) = {
Biểu diễn cuối cùng, là biểu đồ của các giá trị LBP có được bằng cách đi chuyền
các mẫu 3x3 trong toàn vùng ảnh
Đề thu được một bộ phân loại yếu fee từ tính năng j, ta đánh giá mô hình
phân phối xác xuất của các đặc trưng này cho các mẫu đương (có đối tượng) và mẫu
âm (không có đối tượng) với f(x) phân tích đặc trưng nay trên ảnh x Ching ta ước
tính xác xuất P(1|ý(+)) giả sử phân bố Gauss N(¿,ơ') chẳng hạn gia tăng cập nhật ¿ và ø' cho các mẫu đã gán nhãn đối tượng và P(-I|f§(œ)) bởi M(Z,ơ_) cho các mẫu đã gán nhãn không phải đối tượng Đối với các đặc trưng Haar-like cổ điển, ta sử dụng tiêu chí ra quyết định Bayes dựa trên các xác suất ước tính Gauss
của hàm mật độ g(x | /,ø)
he (x)= sign(P(L| f(x) -P(l| J,(3)))* sigr(g(/7(xÌ #'.ø°)=g(/,(3)|.ø)) — (23)
Đối với các biểu đỗ dựa trên các kiểu đặc trưng như biểu đồ định hướng và LBP thì các thuật toán huấn luyện cục bộ gần nhất được sử dụng Các mẫu chứa đối tượng và các mẫu không chứa đối tượng được mô hình hóa bởi mỗi cụm Việc phân loại yếu được cho bởi:
hv (x) = sigi(DỢ,(3) p,)— DỨ,(3).n,)) (2.4)
Trong do D là độ đo khoảng cách, trong truong hop Euclide thi dung pj va nj la cac
tâm của cụm để học các mẫu đối tượng và các mẫu không phải đối tượng Nhiệm vụ
là ước tính hai phân phối Gauss (trung bình và phương sai) cho mỗi bin (một cho lớp đối tượng và một cho lớp không phải đối tượng) Trong khung Boosting trực
Trang 37tuyến cho lựa chọn đặc trưng, điều này được thực hiện một cách trực tuyến dựa trên
hai phương pháp tiếp cận đơn giản dựa trên kỹ thuật đệ quy: Lọc Kalman và trung vị xấp xỉ, đã chứng minh là có hiệu quả
Nhờ độ phân giải của hình ảnh, phát hiện xe ôtô ở những quy mô khác nhau là không cần thiết Tuy nhiên, chiếc xe có thể xuất hiện ở bất kỳ hướng nào Máy phát
hiện có thể thực hiện xoay bất biến bằng cách tính toán các đặc trưng tại các góc
khác nhau Lienhart giới thiệu thêm một bộ xoay các đặc trưng Haar-like bao gồm
một tập các đặc trưng cơ bản và được tính toán hiệu quả Một phân loại trước đây
được huấn luyện chuyển đổi đến bất kỳ góc nào để xoay các đối tượng được phát
hiện Một máy nhận dạng thời gian thực cho xoay bất biến được công bố bởi Viola-
Jones Một kỹ thuật tương tự được sử dụng trong hệ thống này: máy nhận dạng có thê xoay bằng cách tăng 100 Đối với các đặc trưng của biểu đồ định hướng, sự quay
có thể được thực hiện bằng cách chuyển các biểu đồ
2.2.3 Học máy Online Boosting
Các thuật toán học máy Online gắn liền với việc học từng ví dụ huấn luyện một lần khi đến và loại bỏ khi đã được cập nhật Một thuật toán hoc may Online Lo
lấy đầu vào là một giả thuyết đang có h và một mẫu huấn luyện mới (x, y) Sau khi
xử lý, thuật toán trả về một giả thuyết mới được cập nhật để phản ánh lại mẫu huấn luyện mới (%x, y) Vấn đề học Online là rất cần thiết cho dòng dữ liệu và tập dữ liệu
cần xử lý rất lớn Nó được áp dụng đề giảm tối thiêu việc ghi nhãn bằng tay cho các
mẫu huấn luyện và đồng thời cho những bản cập nhật được cải thiện rất hiệu quả
Cho một tập hợp các phân loại yếu (hị, , hạ) và các trọng số tương ứng
(ơi, , ơn), một giả thuyết mạnh hŠ?"(x) có thể được hình thành Theo nghiên
cứu và đề xuất của Oza [12] , điều quan trọng của Online Boosting là ước tính được tầm quan trọng hay độ khó của mẫu Điều này được thực hiện bằng cách lan truyền
thông qua một tập hợp bộ phân loại yếu Nó được xem như là một mô hình và được mã hóa đặc biệt với trọng số An (voi Ap = 1), để thực hiện cho việc cập nhật lớp yếu thứ n+1 Trong thuật toán „ còn được xem như là một tỉ lệ học với k lần cập
Trang 38nhật và k ~ A Để cập nhật các phân loại yếu, mọi thuật toán học Online đều có thể được sử dụng Lỗi bộ phân loại yếu thứ n được tính bởi công thức:
qwrong
— TL
Cn = grata gar (2.5)
Trong đó: „ 5, £?"* là tổng các trọng số của các mẫu phân loại chính xác hay
không chính xác được thấy ở thời điểm hiện tại Trong thực tế, trọng số quan trọng của bộ chọn thứ n được tính: xem - ger +4, h, (x) =y em _ ng HA, h, (x)#y (2.6) Trọng số tương ứng được tính liên quan đến lỗi: a, -j.4( =") 2 e n (2.7)
Việc cập nhật trọng số quan trọng 2 cho bộ phân loại yếu thi n+1 duoc tinh theo lỗi và đầu ra của bộ phân loại yếu:
1 h = _ 2q-e) ,(X,)=y
Ay = Aya 1
— 2.(2„) kêu
Oza [12] đã chứng minh rằng, nếu thực hiện Boosting ngoại tuyến và trực tuyến trên một tập huấn luyện đã cho thì kết quả của các bộ phân loại yếu sử đụng Boosting trực tuyến và Boosting ngoại tuyến khi sé lan lap No sé hội tụ Vì vậy, việc lặp lại của tập đữ liệu huấn luyện khi áp dụng hai phương pháp Boosting trực tuyến và ngoại tuyến đều cho cùng một kết quả Trong thuật toán Boosting trực tuyến yêu cầu số lượng các bộ phân loại yếu phải cố định
2.2.3.1 AdaBoost roi rac
AdaBoost là một thuật toán Boosting thích ứng Boosting rất phố biến và có
nhiều biến thể khác nhau đã phát triển: Real-Boost, LP-Boost AdaBoost đã được
Trang 39được sử dụng để nhận dạng văn bản, lọc văn bản, các van dé xép hang, cac van dé
về xử lý ngôn ngữ tự nhiên Nói chung Boosting là một phương pháp để cải thiện độ chính xác của bất kỳ thuật toán nào của quá trình huấn luyện Điều này được thực hiện bằng cách kết hợp (quá trình chọn lựa có trọng số) của các giả thuyết N đã
được tạo ra bằng cách lặp lại quá trình huấn luyện với các tập con khác nhau của dữ liệu huấn luyện
> Phan loai yếu: một phân loại yếu chỉ thực hiện tốt hơn rất ít so với đoán ngẫu nhiên Tức là với tìm kiếm nhị phân, tỉ lệ lỗi phải nhỏ hơn 50% Giả
thuyết h: X— {—1, +1} được tạo bởi một phân loại yếu có được bằng cách áp dụng
thuật toán huấn luyện
> Phân loại mạnh: cho một tập hợp N phân loại yếu, một phân loại
mạnh được tính là tổ hợp tuyến tính của các phân loại yếu Giá trị f(.) (có liên quan
đến lựa chọn) có thể được hiểu là thước đo liên tục
A(x) = sign(f (x)) với f(x) = dha, n(x) (2.9)
Ngoài ra, có thê dễ dàng thấy rằng việc tăng cường phát triển công cụ ước tính khả năng =1 PŒ = 1x) H(x) = Flog Gap) (2.10) exp (H(x))
Hoac tuong duong: P(y = 1|x) = exp(H())+exp (H()) (2.11)
Cho một tập huấn luyện S với các mẫu có nhãn dương và âm và trọng số ban đầu wạ = (Wor Woz): Wol = 7 qua vi du l = I, ,L Một lớp yếu h(+) được huấn luyện dựa trên tập huấn luyện S va trọng số w(%), có nghĩa là:
L
h, arg min SW, ovine I, TA (2.12)
Dựa trên lỗi trọng số e„ của lớp yếu, nó được chỉ định trọng số được chọn
Trang 40#„ = ~In (“*) 2 en (2.13) Cuối cùng phân phối trọng số exp(—øn) h@) =" 2.14 e€XP (an) h(x) #y ( ) Wn+1j — war|
Được cập nhật sao cho xác xuất các mẫu tăng, đó là phân loại sa1 Nếu mẫu được
phân loại chính xác, trọng số tương ứng sẽ giảm Do đó thuật toán tập trung vào các
mẫu đi chuyền Quá trình được lặp lại và ở mỗi lần lặp tăng cường, một phân loại
yếu mới được thêm vào cho đến khi một số lượng lớp yếu được huấn luyện
Đây là một sự thay đổi trong bộ nhớ Thay vì cố gắng thiết kế một thuật tốn huấn luyện trên tồn bộ không gian, thay vào đó có thê tập trung vào các thuật toán huấn luyện, chỉ cần tốt hơn đoán ngẫu nhiên và kết hợp chúng lại
Freund và Schapire [7] đã chứng minh các hạn chế rất lớn về lỗi huấn luyện và lỗ hỏng cơ bản của AdaBoost Đối với trường hợp phân loại nhị phân, huấn luyện lỗi giảm nhanh theo cấp số nhân liên quan đến vòng N tăng Khi vòng N tăng quá lớn thì sẽ dẫn đến tình trạng vượt quá giới hạn cho phép Và có một số hạn chế khác Vì thế, đã có những nghiên cứu để khắc phục vấn đề này
2.2.3.2 Boosting cho lựa chọn đặc trưng
Lựa chọn đặc trưng với mục đích để có được những đặc trưng hữu ích, giảm
tính năng chiều của không gian và loại bỏ dữ liệu nhiễu Tieu và Viola là hai nhà
nghiên cứu giới thiệu đầu tiên về Boosting cho lựa chọn đặc trưng [17] Với nội
dung cốt lõi là mỗi đặc trưng tương ứng với một lớp yếu duy nhất và Boosting chọn
một tập hợp con dữ liệu từ các đặc trưng này Tiến hành huấn luyện như một thuật
toán Boosting được mô tả Cho một tập hợp các đặc trưng E = {ƒ, , ƒ„} trong mỗi bước lặp n, thuật toán xây dựng một giả thuyết yếu đựa trên các mẫu huấn luyện có trọng số Cái tốt nhất hình thành nên giả thuyết yếu h*“ tương ứng với đặc trưng
được chọn ƒ„ Trọng số của các mẫu huấn luyện được cập nhật liên quan đến lỗi của
các giả thuyết được chọn