1. Trang chủ
  2. » Luận Văn - Báo Cáo

Phát hiện đối tượng trong ảnh không gian sử dụng phương pháp online boosting

63 2 0
Tài liệu được quét OCR, nội dung có thể không chính xác

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Nội dung

Trang 1

BỘ GIÁO DỤC VÀ ĐÀO ĐẠO

DAI HOC HUE

TRUONG DAI HOC KHOA HOC

NGUYEN VAN TU

PHAT HIEN DOI TUONG TRONG ANH KHONG GIAN SU DUNG PHUONG PHAP

ONLINE BOOSTING

CHUYEN NGANH: KHOA HOC MAY TINH MA SO: 8 48 01 01

LUAN VAN THAC SI KHOA HOC

ĐỊNH HƯỚNG NGHIÊN CỨU

Trang 2

LỜI CAM ĐOAN

Tôi xin cam đoan luận văn: “Phát hiện đối tượng trong ảnh không gian sử dụng phương pháp Online Boosfing” là công trình nghiên cứu của riêng tôi Ngoại trừ các kết quả tham khảo từ các công trình nghiên cứu trên thế giới tôi đã ghi rõ trong

luận văn Các số liệu kết quả trong luận văn là trung thực Đó là một quá trình dai,

hai năm vừa học vừa nghiên cứu của bản thân

Người thực hiện luận văn

Trang 3

LỜI CẢM ƠN

đầu tiên, tôi xin chân thành gửi lời cảm ơn sâu sắc đến thầy - Tiến sĩ

Nguyễn Dang Binh Thay đã tạo mọi điều kiện giúp đỡ, diu dắt tơi hồn thiện luận

văn này

Tôi trân trọng gửi đến Trường đại học Khoa học Huế, đặc biệt là quý thầy, cô

Khoa Công nghệ thông tin của nhà trường lời biết ơn to lớn Nhà trường và quý

thầy, cô đã dành sự quan tâm tuyệt đối cho chúng tôi Đã nhiệt tình dạy dỗ, chỉ bảo tận tâm tất cả những môn học của chương trình thạc sĩ Khoa học máy tính

Bên cạnh, tôi cũng xin gửi lời tri ân đến gia đình, anh, chị em đã luôn giúp đỡ

tôi về tinh thần, vật chất trong thời gian dài học tập

Cuối cùng, xin cảm ơn những người bạn cùng lớp, cùng khóa Chúng ta đã song hành cùng nhau Tích cực học tập, giúp đỡ lẫn nhau để chúng ta có được như ngày hôm nay

Tuy cố gắng rất nhiều, nhưng tôi tin chắc rằng luận văn vẫn còn thiếu sót Rất mong được sự góp ý của quý thầy, cô và các bạn đề giúp tôi hoàn thiện hơn

Huế, tháng 04 năm 2020 Người thực hiện luận văn

x

Trang 4

MỤC LỤC

DANH MỤC CÁC BÁNG 22222 222221122112112211221121222122222212e i DANH MỤC CÁC CHỮ VIẾT TẮTT -2-22<222122212221221122121121122122 2 xe ii DANH MỤC CÁC HINH VE ooo oocooccocsssesssessesevseesesstetevetvteitesetettenteveteneesesseees iii MO DAU ooieoecccscccssssessssssossessssessssssssessssessseessiatssssssssessisassnsessisessiessiessiessseeseeeseeeen 1 1 Lý do chọn để tài 2 25 2222212211221121112111211211212222222re 1 VY 01090013) 8 .Ả 2 3 Đối tượng và phạm vi nghiên cứu -©22222222222522251213121312111211.222 2 xe 3 4 Phuong 80) 06130005 ibiaiiadiiầidiẳđđiảđáiiiađắa 3

5.Y nghĩa khoa học và thực tiễn của để tài S n n 2121 11211121 net erreg 3 6 Cấu trúc luận văn 5-2221 11112212712122 21101 1g grruee 4 Chuong 1 TONG QUAN VE PHAT HIEN DOI TUONG VA ANH KHONG

8 5 Lal, Gidijthigusdnh khOnesgian, scseccesemucem meme enseenerceenmnoceeevey ere meeuemmenes 5 1.1.1 Lịch sử phát triển của ảnh không gian 2-©2222222222222122ee 5 1.1.2 Giới thiệu ảnh không gian API (Aernial Photograph Interpretation) 8

1.1.3 Mô hình thành phố 3D 22 22222 225222112211271121112112112112112 e0 9

Trang 5

Ta có thể kết luận: một phân loại được gọi là mạnh chính là một tổ hợp tuyến

tính có trọng số của các phân loại yếu, trong đó các trọng số œ„ được ước tính theo

weak

hy

các lỗi của giả thuyết yếu như đã để cập

2.2.3.3 Onhne Boosting cho lựa chọn đặc trưng

Boosting cho lựa chọn tính năng được miêu tả ở trên được dùng cho Offline Do đó, để huấn luyện một lớp, tất cả các mẫu đào tạo phải được đưa ra trước Ở đây

chúng ta sử đụng phương pháp huấn luyện Online Boosting cho thuật toán lựa chọn đặc trưng do Grabner và Bischof [9], dựa trên phiên bản Online AdaBoost [13, 12] Thuật toán cho phép huấn luyện thích nghi với máy phát hiện

Các bộ phân loại yếu tương ứng với các đặc trưng, việc dùng Online Boosting

để lựa chọn đặc trưng dựa trên việc đưa vào các bộ chọn và thực hiện Online

Boosting trên các bộ chọn này (không trực tiếp trên các quá trình phân loại yếu)

Mỗi bộ chọn h*°!(x) chứa một bộ phân loại yếu M {h¥e** (x), , hve? (x)} và

chọn một trong số chúng theo một tiêu chí tối ưu hóa

h°°t(x) = hw°4F(x) (2.15) Sử dụng e, lỗi ước tính của từng phân loại yếu h}⁄°%k sao cho m = argmin,e; Lưu ý rằng bộ chọn có thể được hiểu là một lớp khi nó chuyển đổi giữa các lớp yếu

Huấn luyện một bộ chọn có nghĩa là mỗi lớp yếu được cập nhật và cái tốt nhất có lỗi ước tính thấp nhất được chọn

Phiên bản huấn luyện Online của AdaBoost cho lựa chọn đặc trưng hoạt động như sau: đầu tiên, một bộ gồm có N bộ chọn, nse, we, DEP được khởi tao ngau

nhiên với các đặc trưng phân loại yếu Khi một mẫu huấn luyện mới (x,y) đến các

bộ chọn được cập nhật Bản cập nhật này được thực hiện liên quan đến trọng số quan trọng  của mẫu hiện tại Mọi thuật toán Online đều có thể loại bỏ các lớp yếu Phân loại yếu với sai số ước tính nhỏ nhất được chọn bởi bộ chọn

mï` =ag mẫn (6,„,) (2.16)

Trang 7

DANH MUC CAC CHU VIET TAT

AdaBoost (Adaptive Boosting) Boosting thich tng API (Aerial Photograph Interpretation) Giai thich anh khéng gian NASA(National Aeromautics and

Space Administrator)

SVM (Support Vector Machine) RGB (Red — Green — Blue) HMM (Hidden Markov Model) NIR_ (Near-infrared reflectance) LBP (Local Binary Patterns) Pixel (Picture Element)

RPC (Recall — Precision Curve)

Cơ quan hang không, vũ trụ Mỹ Máy véc tơ hỗ trợ

Đỏ - Xanh lá — Xanh nước biển M6 hinh Markov 4n

Phan xa gan héng ngoai

Dac trung mẫu nhị phân cục bộ

Điểm ảnh

Đường cong chính xác thu hồi

Trang 8

DANH MỤC CÁC HÌNH VẼ Số hiệu hình vẽ Tên hình vẽ Trang 1.1

a) Buc tranh biếm họa của Honoré Daunier năm 1862, “dé cao nhiếp ảnh là một nghệ thuật”

b) Bức ảnh đầu tiên của Nadar chụp tại Paris năm 1866

c) Bức ảnh Boston chụp từ khinh khí cầu vào năm 1860 bởi James Wallace Black

1:2

a) Ảnh chụp từ trên cao ở một vùng nông thôn Thụy Điển được chụp bởi Alfred Nobel từ máy ảnh gắn vào tên lửa b) Bức ảnh chụp bằng máy ảnh gắn vào tên lửa của Albert Maul, chụp vùng nông thôn Đức

c) Tên lửa của Albert dùng đề chụp ảnh không gian

1.3 Máy bay của Wilbur Wright nam 1909 tai Centocelli, Rome,

Ý

1.4 a) Nhiếp ảnh gia quân sự trong chiến tranh thế giớ thứ I b) Ảnh chụp từ máy bay, chụp chiến hào quân sự năm 1916

1.5

a) Máy ảnh của Fairchid đạt chuẩn đề chụp ảnh trên không

b) Đảo Manhatta được chụp từ 100 bức ảnh của Fairchild nam 1921 c) Thanh phé Ocean New Jersey ctia Fairchild nim 1920 1.6 Bộ cảm biên của định dạng máy ảnh kỹ thuật sô không gian lớn UltraCamD 17 Ứng dụng phát hiện xe ôtô a) Ảnh gốc

b) Các mặt nạ ôtô được phát hiện

©) Loại bỏ những ôtô được phát hiện, phục hồi ảnh kết cấu

đường giao thông 10

Trang 9

1.8 Gián nhãn lớp các đối tượng được ánh xạ 13

Hình ảnh được chụp từ trên không của thành phố Hồ Chí

kế Minh, Việt Nam dày đặc và chồng chéo lên nhau Đề

Hai hình ảnh chụp quang cảnh một đô thị, trong đó xe ôtô

?1 xuất hiện rất nhiều và vô cùng nhỏ 8

a) Trong hoc Offline tat cả các đữ liệu huấn luyện đều có

sẵn ngay từ đầu

32 b) Trong khi học Online, một giả thuyết đang có H,_¡ được 21

cập nhật bởi một mẫu huấn luyện mới z; để có được một giả

thuyết mới H,

Sử dụng kết hợp các giả thuyết H, (x), ., H_(x), mot gia

23 thuyết tổng thê H(+) được xây dựng, giúp cải thiện hiệu 24

suat

Cac dac trung hinh anh co ban duoc thé hién

a) Giá trị của đặc trưng Haar-like là sự thay đổi của các giá

z4 trị pixel giữa vùng đánh dấu màu trắng và màu xanh lá 3

b) Phiên bản đơn giản để có được mẫu nhị phân cục bộ

2.5 So đồ mô hình Online Boosting cho lựa chọn đặc trưng 32

Mô hình học máy Online Boosting có sự giám sát của

76 chuyén gia z

27 Cải thiện khả năng phân loại trong huấn luyện 35

2.8 So đồ mơ hình thuật tốn phát hiện xe ôtô 37 2.9 | Sơ đồ hệ thống phát hiện xe ôtô từ ảnh không gian 39 3.1 Một số ảnh trong tập ảnh được sử dụng dé thực nghiệm 41

Giao diện của chương trình khi mở lên a) Bảng giao diện điều khiển, hướng dẫn

3.2 b) Giao diện quá trình huấn luyện c) Giao diện kết quả sau cùng sau khi kết thúc quá trình 43

huấn luyện và xử lý

Trang 10

Vi du mẫu huấn luyện trực tuyến

3.3 |a) Các mẫu chứa xe ôtô 43

b) Các mẫu không chứa xe Ơtơ

Hình ảnh đâu tiên khi mở chương trình lên

3.4 |a) Ảnh gốc 44

b) Ảnh huấn luyện khi gán một mẫu chứa xe ôtô

Quá trình huấn luyện cải thiện hiệu suất của bộ phân loại

a) Ảnh gốc ban đầu

b) Kết quả sau khi huấn luyện chỉ với một mẫu chứa xe ôtô

` c) Két qua sau khi huấn luyện với 27 mẫu 5 d) Kết quả cuối cùng thu được sau khi kết hợp nhiều phát

hiện bằng cách phân cụm dựa trên thay đổi trung bình

3.6 Ảnh tiếp theo của quá trình thực nghiệm 45 3:7 Kết quả huấn luyện tiếp theo của quá trình huấn luyện 45

3.8 | Kết quả của phát hiện xe ôtô 46 3.9 | Hiệu suất cải thiện bộ phân loại 47

Trang 11

MỞ ĐẦU

1 Lý do chọn đề tài

Nhận dạng đối tượng là một loại hình nghiên cứu thiên về định hướng ứng dụng Tuy nhiên, có nhiều cá nhân, tập thể, tổ chức nghiên cứu về nó.Vì thế đã có rất nhiều nghiên cứu liên quan đến nhận dạng đối tượng, nhằm phục vụ cho như cầu

phát triển kinh tế - xã hội, khoa học — công nghệ như: nhận dạng ký tự quang

học, nhận dạng khuôn mặt, nhận dạng biển số xe, Đặc biệt là phát hiện đối tượng

trong ảnh không gian Đây là một vấn đề đầy thách thức và thú vị

Thách thức ở chỗ đó là sự phức tạp của rất nhiều đối tượng trong không gian

rộng lớn Và đặc biệt với một kho dữ liệu (ảnh) không lồ như thế thì cần có phương

pháp tính toán, xử lý sao cho phù hợp Nhưng nó vô cùng thú vị Giúp chúng ta có

cái nhìn rõ hơn, thực tế hơn về con người, động thực vật, về những hình ảnh có tính

quy luật, đang tồn tại trong hành tinh của chúng ta

Ảnh không gian (aerial images) là ảnh được chụp trên không trung Ở đây ảnh không gian được chụp từ máy bay và camera chuyên dụng Thông thường các máy

ảnh không được hỗ trợ bởi một cấu trúc trên mặt đất Nền tảng cho chụp ảnh trên

không bao gồm máy bay có cánh cố định, trực thăng, máy bay không người

lai (UAV), bong bay, khi cầu, tên lửa, chim bổ câu, diều, dù, kính viễn vọng và các khí cụ, xe có thể điều khiển được Máy ảnh gắn kết có thể được kích hoạt từ xa hoặc tự động: hình ảnh cầm tay có thể được thực hiện bởi một nhiếp ảnh gia Ảnh

chụp được sẽ gọi là ảnh/hình chụp trên không, ảnh từ không trung hay là không ảnh Phát hiện đối tượng (object dectection) trong ảnh là bài toán quan trọng trong thị giác máy, trả lời cho câu hỏi có hay không có đối tượng trong ảnh, có bao nhiêu đối

tượng và nếu có thì xuất hiện ở tọa độ vị trí tương déi nao bang cách vẽ ra hình chữ nhật bao quanh đối tượng đó, là căn cứ tọa độ để trích xuất cho các bài toán khác

Trang 12

Có rất nhiều phương pháp để phát hiện đối tượng trong ảnh không gian như:

SVM, Rừng ngẫu nhién (random fields), hoc tích cực (active learning), Mỗi

phương pháp có những ưu điểm và hạn chế ở chỗ phải chuẩn bị tập mẫu học rất lớn và mất nhiều thời gian, công sức kế cả tài chính để nâng cao bộ phát hiện đối tượng trong khi chi phí ảnh không gian rất đắt đỏ Vấn đề đặt ra là làm sao đề xuất được một phương pháp hay mô hình học phủ hợp đề có thể giảm thiểu số lượng mẫu học trong quá trình huấn luyện nhưng đồng thời cải thiện được bộ phân loại về độ chính

xác, tốc độ học và tương tác được với con người trực tiếp để có thể giúp cho việc lựa chọn mẫu huấn luyện tại thời điểm hiện hành trong quá trình học giúp cho bộ phân loại được huấn luyện có hiệu năng cao hơn Chính vì điều đó trong luận văn

này tôi chọn phương pháp học trực tuyến tăng cường (Online Boosting) cho phát hiện lớp đối tượng xuất hiện trong ảnh không gian Hầu như tất cả các phương pháp trên đều phải kết hợp với một mô hình học máy để cho chúng ta một kết quả tốt

hơn, hiệu quả hơn

Ảnh không gian có rất nhiều ứng dụng đã được sử dụng từ lâu: Ứng dụng

trong bản dé hoc, quy hoạch sử dụng đất, khảo cổ học, sản xuất phim, nghiên cứu môi trường, kiểm tra đường dây điện, chuyển tải các dự án nghệ thuật Đồng thời, nó đã tạo ra sự xuất hiện của hàng loạt ứng dụng mới ĐI đầu trong việc ứng dụng

ảnh không gian chúng ta phải nói đến phần mềm “Google Earth” Đây là sản phâm công nghệ cao Google Earth đã mang lại cho chúng ta một hình thức tìm kiếm thông tin mới, giúp chúng ta khám phá và hiểu rõ hơn về trái đất mà chúng ta đang sống Nó có ba chức năng chính: Ứng dụng trong quản lý, ứng dụng trong quản lý

thực địa, ứng dụng xác định tiêu điểm

Chính vì vậy tôi chọn để tài làm luận văn của mình: “PHÁT HIỆN ĐỐI

TƯỢNG TRONG ẢNH KHÔNG GIAN SỬ DỤNG PHƯƠNG PHÁP ONLINE

BOOSTING” Vì nó có nhiều thách thức và thú vị như đã nói ở trên

2 Mục đích nghiên cứu

Trang 13

- Nghiên cứu Phương pháp Online Boosttng cho bài toán phát hiện xe ôtô tử ảnh chụp trên không

- Cải đặt và mô phỏng thực nghiệm phương pháp Online Boosting phát hiện xe ôtô từ ảnh chụp trên không

3 Đối tượng và phạm vi nghiên cứu Đối tượng nghiên cứu chính của đề tài là:

- Ảnh không gian được chụp từ máy bay chuyên dụng - Phương pháp học máy Online Boosting

Phạm vi nghiên cứu:

Nghiên cứu về phát hiện xe ôtô kết hợp phương pháp Online Boosting 4 Phương pháp nghiên cứu

Sử dụng cơ sở lý thuyết của phát hiện đối tượng Đọc và tham khảo nhiều

nguồn tài liệu, luận văn, luận án, những nghiên cứu của nhiều nhà khoa học, nhà

nghiên cứu ở trong nước cũng như nước ngoài

Phân tích mô hình giữa xe ôtô với phương pháp Online Boosting và kết hợp với nhau để nghiên cứu

5 Ý nghĩa khoa học và thực tiễn của đề tài

Đã có rất nhiều hội thảo khoa học, nghiên cứu về ảnh chụp từ không gian Đưa ra các thông tin quan trọng để quản lý hệ sinh thái của trái đất [30, 82] Phát hiện các thay đổi của môi trường do con người gây ra trong quá trình phát triển kinh tế

xã hội của mình [3] Và đặc biệt nhất là nghiên cứu mô hình thành phố 3D [21]; cụ

thé la phát hiện xe ôtô từ ảnh chụp trên không bằng các thiết bị chuyên đụng

Để có nhiều thành quả to lớn như vậy, các nhà khoa học, các học giả, nhà

nghiên cứu đã nghiên cứu rất nhiều, kỹ và sâu về các phương pháp học máy:

Học kích hoạt, học bán giám sát, học trực tuyến Nhằm nâng cao hiệu suất của việc

phát hiện đối tượng là ảnh chụp từ trên không Đề phục vụ cho nhu cầu phát triển

kinh tế, xã hội, khoa học của loài người Và việc nghiên cứu ay theo tôi là bat tận,

Trang 14

Đề tài “Phát hiện đối tượng trong ảnh không gian sử đụng phương pháp Online Boosting” tôi dựa trên những công trình nghiên cứu của các nhà khoa học, nhà nghiên cứu khác nhau đề phát hiện xe ôtô từ ảnh chụp trên không bằng máy bay chuyên đụng với phương pháp Onilne Boosting Đồng thời cài đặt thử nghiệm bằng ví dụ cụ thê để biết rõ hơn về hiệu suất phát hiện của phương pháp Online Boosting

6 Cấu trúc luận văn

- Chương 1: Tổng quan về phát hiện đối tượng và ảnh không gian

Nội dung chủ yếu của chương này trình bày các kiến thức tổng quan về ảnh chụp từ không gian bằng thiết bị chuyên đụng Đồng thời, nêu các vấn đề chính về phát hiện đối tượng Và đặt vấn đề cho bài toán phát hiện ảnh không gian

- Chương 2: Tìm hiểu phương pháp Online Boosting cho bài tốn phát hiện xe ơtơ từ ảnh chụp trên không

Trong chương 2 tìm hiểu và trình bày thuật toán Online Boosting dé phát hiện xe ÔtÔ

- Chương 3: Cài đặt, mô phỏng thực nghiệm

Ở chương này chúng ta bước vào xây đựng ứng dụng phát hiện đối tượng trong ảnh được chụp từ không gian bằng máy bay chuyên dụng Sau đó mô phỏng để thống kê kết quả phát hiện xe ôtô từ ứng dụng Đồng thời đánh giá hiệu suất đạt được, khả năng ứng dụng của phương pháp đã cài đặt và mô phỏng trong bài toán phát hiện đối tượng trong ảnh không gian

Trang 15

Chương 1 TÔNG QUAN VỀ PHÁT HIỆN ĐÓI TƯỢNG VÀ ẢNH

KHÔNG GIAN 1.1 Giới thiệu ảnh không gian

1.1.1 Lịch sử phát triên của ảnh không gian

Ảnh không gian chúng ta có thể hiểu đó là những bức ảnh được chụp từ trên không bởi nhiều phương tiện khác nhau gắn liền với sự phát triển của khoa học, công nghệ Nó có một lịch sử phát triển rất lâu đời Bức ảnh chụp tử trên không đầu tiên được chụp vào năm 1858, bởi nhiếp ảnh gia và khinh khí cầu người Pháp

Gaspard Felix Tournachon, được biết đến với cái tên Nadar

(a) (b) (©)

Hinh 1.1 a) Bic tranh biếm họa của Honoré Daunier năm 1862, “dé cao nhiếp ảnh là một nghệ thuật”; b) Bức ảnh đầu tiên của Nadar chụp tại Paris năm 1866; e) Bức

anh Boston chup từ khinh khí cầu vào năm 1860 bởi James Wallace Black

Với sự phát triển của khoa học công nghệ và sự sáng tạo của con người, công nghệ nhiếp ảnh đã phát triển rất mạnh ở giai đoạn đầu này Bên cạnh khinh khí cầu, con người còn đùng: chim bồ câu, diều và cả tên lửa để đem máy ảnh vào không gian nhằm chụp những bức ảnh về thiên nhiên, hoạt động quân sự, .phục

vụ cho nhiều mục đích khác nhau của con người Như vào năm 1889, Arthur Batut

chụp bức ảnh bằng diều đầu tiên của Labruguiere, Pháp; năm 1903, chim bổ câu

được sử dụng bởi quân đoàn Bồ câu Bavaria chụp ảnh không gian; đặc biệt vào

Trang 16

(a) (b) (c)

Hinh 1.2 a) Anh chup tir trén cao 6 mét ving néng thén Thuy Dién được chụp bởi Alfred Nobel tir may anh gan vao tén lửa; b) Bức ảnh chụp bằng máy ảnh gắn vào tên lửa của Albert Maul, chụp vùng nông thôn Đức; c) Tên lửa của Albert dùng để chụp ảnh không gian

Những năm đầu của thế ki XX, khoa học, công nghệ phát triển vượt bậc Và

ngành hàng không ra đời Đây chính là điều kiện đủ để ngành chụp ảnh hàng không ra đời Và các bức ảnh đó được gọi là ảnh không gian Con người sử dụng những bức ảnh không gian cho mục đích dân sự cũng như quân sự Bức ảnh đầu tiên chụp bằng máy bay được thực hiện bởi Wilbur Wright vào năm 1909 Ông ta chụp ảnh chuyển động một khu vực quân sự tại vùng Centocelli gần Rome

Trang 17

lĩnh vực chụp ảnh từ máy bay Và đặc biệt là tham gia vào ngành khoa học mới — đo

đạc ảnh

(a) (b)

Hình 1.4 a) Nhiếp ảnh gia quân sự trong chiến tranh thế giới thứ I; b) Ảnh chụp từ máy bay, chụp chiến hào quân sự năm 1916

Đặc biệt, sự phát triển của ảnh chụp từ năng lượng nhân tạo là radar và sử

dụng phổ hồng ngoại Đồng thời sự xuất hiện của ảnh màu (được chụp từ máy ảnh) Giai đoạn này đánh đấu sự phát triển vượt bậc của ngành chụp ảnh nói chung và ngành chụp ảnh khơng gian nói riêng Ngồi ra, ảnh chụp từ không gian cũng được sử dụng cho mục đích phi quan su trong giai doan nay Sherman Fairchild đã chụp

hàng loạt bức ảnh trên không Manhattan để phục vụ cho mục đích thương mại

(a) (b) (c)

Hình 1.5 a) Máy ảnh của Fairchid đạt chuẩn để chụp ảnh trên không: b) Đảo

Manhatta được chụp từ 100 bức ảnh của Fairchild năm 1921; c) Thành phố Ocean

Trang 18

Sau khi kết thúc thế chiến I và II, hai cường quốc Liên Xô và Hoa Kỳ bước vào cuộc đua vào vũ trụ Hai cường quốc này bắt đầu nghiên cứu trái đất bằng

những bức ảnh được chụp từ những con tàu vũ trụ Nổi bật là chương trình vũ trụ

Mercury (1960) đã chụp được những bức ảnh màu của trái đất có chất lượng cao Với sự tiến bộ của khoa học công nghệ ngành nhiếp ảnh hàng không phát triển rực rỡ trong những năm cuối thế kỉ XX Nó phát triển về kỹ thuật chụp và phương tiện để chụp và trong đó hệ thống camera và hệ thống hình ảnh kỹ thuật số là một điển hình Nhiều công ty, tập đoàn phát triển chúng Nỗi bật là sản phẩm UltracamD

của Microsoft Vexcel Với thiết kế khác biệt của mình đã cho những bức ảnh độc

đáo có độ phân giải cao của các kênh toàn sắc cũng như độ phân giải thấp kênh RGB và NIR 41310 Pix Le ` PP) == 1 + 17310 Pix Hình 16 Bộ cảm biến của định dạng máy ảnh kỹ thuật số không gian lớn UltraCamD

Trong xu hướng chung, hình ảnh là một nghệ thuật Nhưng ở ảnh không gian

nó còn là sự kết hợp giữa nghệ thuật, khoa học, công nghệ là điều kiện đủ để rất

nhiều ứng dụng, phần mềm ra đời Với mục đích phục vụ cho sự phát triển chung

của xã hội, của thế gidi

Luận văn này, được thực hiện dựa trên các dữ liệu hình ảnh được cung cấp bởi máy chụp ảnh UltraCamD từ ảnh chụp không gian về trung tâm thành phố Graz của nước Áo

1.1.2 Giới thiệu ảnh không gian API (Aerial Photograph Interpretation) API là một công cụ dùng để giải đoán hay giải thích ảnh trên không Nó dùng

Trang 19

Chúng ta có thể nói API là quá trình phân tích và hiểu các đối tượng có ý nghĩa xuất hiện trong hình ảnh Và đây, là van dé quan trọng nhất trong thị giác máy và trong chụp ảnh API có đặc tính trực quan Giúp †a nhận dạng được những điểm cơ bản của ảnh: màu sắc, kết cấu, hình dạng, bối cảnh Ở cấp độ thấp nó giúp

chúng ta nhận dạng được đối tượng nhất định ví dụ: nhà ở, xe ôtô, con người .và

từng vị trí của chúng trong ảnh Ở mức cao hơn, API giúp nhận dạng cho đối trong

là các ứng dụng thực tế khác nhau Bản đổ, mô hình thành phố 3D, , là những ví dụ

điển hình

Hơn 100 năm qua, nhiếp ảnh trên không và các ứng dụng đi liền với nó đã có những bước tiến rất mạnh mẽ Cùng với đó là công nghệ phát triển vượt bậc cả về chụp ảnh và phát hiện ảnh Nó đóng góp cho nhân loại những lợi ích to lớn về kinh

tế, an ninh quốc phòng, giáo dục Đặc biệt chương trình vệ tình Landsat của

NASA, cung cấp rất nhiều bộ sưu tập ảnh được chụp từ trên không cho các nhà

khoa học, nhà nghiên cứu ở mọi tầng lớp khác nhau Nhiều bản đỗ đã được lập ra để phục vụ cho việc học tập, nghiên cứu, giáo dục nhằm giúp cho nhân loại có cái nhìn

cụ thể, bao quát hơn về sự sống và những biến đổi của trái đất

1.1.3 Mô hình thành phố 3D

Mô hình thành phố 3D dùng để mô tả ngữ nghĩa và hình học các đối tượng ở trong đô thị Một mô hình thành phố 3D cần phải có: mạng lưới giao thông, các tòa

nhà và thảm thực vật Các đối tượng này được phát hiện và trích xuất Các kết quả

có được sẽ cung cấp mô tả hình ảnh phong phú, chỉ tiết ở mức cao cho các mô hình thành phố 3D Tuy nhiên, chỉ phí để làm được việc này rất lớn nếu thực hiện bằng thủ công Và nhận dạng, phát hiện tự động là một phương pháp hữu hiệu

Máy quét Focus3D sử dụng công nghệ lazer cao cấp cho chúng ta những bức

ảnh hoàn hảo, khó thiết bị nào có thể so sánh được Nhung chi phi rất cao, tốn kém Do vậy, hệ thống tự động hóa tạo ra mô hình thành phố 3D được sử dụng nhiều hơn

Trang 20

(a) (b) (c) Hinh 1.7 Ung dụng phát hiện xe ôtô; a) Ảnh gốc; b) Các mặt nạ ôtô được phát hiện;

e) Loại bỏ những ôtô được phát hiện, phục hồi ảnh kết cấu đường giao thơng 1.2 Bài tốn phát hiện đối tượng từ ảnh không gian và những khó khăn

1.2.1 Bài toán phát hiện đôi tượng từ ảnh không gian

Phát hiện đối tượng là tìm kiếm sự hiện diện và vị trí của đối tượng trên ảnh

chụp Phát hiện đối tượng trên ảnh là phải chỉ ra chính xác vùng ảnh là nơi biểu

diễn đối tượng được phát hiện Ảnh được lưu trữ và biểu diễn bằng ma trận điểm ảnh, mà giá trị số trên ma trận chính là giá trị màu của điểm ảnh đó Hình dạng của đối tượng được biểu diễn trên một phần của ảnh thu được thông qua một hoặc một số cụm màu khác biệt so với nền ảnh Như vậy, việc phát hiện ra đối tượng trên hình ảnh chủ yếu dựa vào màu sắc của hình ảnh, các cách xác định biên của

một vùng ảnh

Hàng loạt công trình nghiên cứu của nhiều người và nhóm người về bài toán

phát hiện đối tượng xuất hiện trong nhiều năm qua Trên các diễn đàn, tạp chí, hội

thảo khoa học, các luận văn, luận án Làm giàu, phong phú nguồn kiến thức về phát

hiện đối tượng Các nghiên cứu đi từ đơn giản đến phức tạp, từ việc phát hiện một

đối tượng trong ảnh đen trắng đến những ảnh màu Đến nay, các bài toán phát hiện đối tượng đã phát triển với nhiều nghiên cứu như phát hiện các tòa nhà, phát hiện

các thảm thực vật, phát hiện xe ôtô, phát hiện hành động, cử chỉ con người

Phát hiện đối tượng là phần đầu tiên của một hệ thống phát hiện đối tượng

Các hệ thống phát hiện đối tượng được bắt đầu xây đựng từ những năm 1970, tuy

nhiên do còn hạn chế về các luật xác định đối tượng nên chỉ được áp dụng trong

Trang 21

một số ứng dụng Nó chỉ được phát triển mạnh mẽ từ những năm 1990 khi có những tiến bộ trong công nghệ video và ngày nay thì các ứng đụng của phát hiện đối trợng

đã trở nên phổ biến trong cuộc sống

Phần lớn các đối tượng được phát hiện qua việc dựa vào những thông tin trong một khung hình ảnh Có rất nhiều hướng tiếp cận để giải quyết vấn đề này Theo nhom tac gia Alper Yilmaz, Omar Javed va Mubarak Shah, đã phân loại các hướng tiếp cận này thành các loại như sau:

Bảng 1.1 Bảng liệt kê các thuật toán phát hiện đối tượng

Các phương pháp

Những nghiên cứu liên quan

phát hiện đôi tượng

Moravec’s detector [Moravec 1979]

; Harris detector [Harris and Stephens 1988] Các bộ phát hiện dựa , Scale Invariant Feature Transform [Lowe 2004] trén diém ; ; ; ; Affine Invariant Point Detector [Mikolajczyk and Schmid 2002]

Mean-shift [Comaniciu and Meer 1999] Phan ving Graph-cut [Shi and Malik 2000]

Active contours [Caselles et al 1995]

Mixture of Gaussians [Stauffer and Grimson 2000] Eigenbackground [Oliver et al 2000]

Wall flower [Toyama et al 1999]

M6 hinh nén

Dynamic texture background [Monnet et al 2003]

Support Vector Machines [Papageorgiou et al 1998] Neural Networks [Rowley et al 1998]

Adaptive Boosting [Viola et al 2003] Bộ phân loại có giám

sát

Trang 22

Với rất nhiều thuật toán như vậy, việc sử dụng thuật toán của phương pháp nào tùy thuộc vào những tình huống cụ thê Để phát huy tối đa công năng và phù

hợp của việc phát hiện đối tượng

Đối với trường hợp có ảnh nền không thay đổi thì việc phát hiện đối tượng có thê được thực hiện bằng các phương pháp trừ nền Phương pháp thường gặp là xây dựng mô hình nên, sau đó sử dụng mô hình này cùng với các khung hình ảnh hiện tại để từ đó tìm ra được các vùng chứa đối tượng Ưu điểm của phương pháp này là đơn giản, để có thể tiếp cận theo hướng này thì ta cần phải xây dựng mô hình nền như: anurad mital đùng ước lượng mật độ nhân thích nghi xây đựng mô hình nên Phương pháp này cho kết quả tốt tuy nhiên gặp khó khăn về không gian lưu trữ, tính toán phức tạp, tốc độ không đáp ứng thời gian thực Hritaoglu dùng giải thuật W4, Stauffer sử dụng phương pháp Gauss hỗn hợp để xây dựng mô hình nên Sau khi

đã nhận dạng, phát hiện ra các đối tượng thi việc xác định xem những đối tượng này

có đúng là những đối tượng ta cần phát hiện hay không cũng là một khó khăn lớn

phải đối mặt

Các phương pháp học máy là sự lựa chọn thích hợp dé phát hiện đối tượng Trong học máy, rất nhiều phương pháp đã, đang và tương lai con người vẫn phải sử dụng đến để giải quyết bài toán phát hiện đối tượng của mình Trong đó, ta có thé kế đến một số phương pháp như sau: HMM, mạng nơ ron, SVM, Boosting Cac phương pháp này đều trải qua giai đoạn huấn luyện trên một tập dữ liệu Tập dữ liệu ấy phải đa dạng, đủ lớn để bao quát hết tất cả các trạng thái của đối tượng Và

những đặc trưng cơ bản, phù hợp nhất được lay ra từ bộ dữ liệu này Việc lựa chọn

đặc trưng sử dụng đóng vai trò quan trọng ảnh hưởng đến hiệu quả của các phương pháp học máy Một số đặc trưng thường được sử dụng như: đặc trưng về màu sắc,

đặc trưng về góc cạnh, đặc trưng biểu đổ Sau khi đã có được đặc tung, ta sé gan

nhãn lớp cụ thê cho các đặc trưng đó dé sử dụng trong việc huấn luyện Trong quá trình huấn luyện, các phương pháp học máy sẽ sinh ra một hàm để ánh xạ những đặc trưng đầu vào tương ứng với nhãn cụ thể Sau khi đã huấn luyện xong thì các phương pháp học máy trên sẽ được đùng để phân lớp cho những đặc trưng mới Đặc

Trang 23

điểm của phương pháp này là độ chính xác cao Tuy nhiên nó gặp phải khó khăn trong việc thu thập đữ liệu huấn luyện ban đầu, tốn thời gian và chi phí cho quá trình này

1.2.2 Những khó khăn của phát hiện đối tượng từ ảnh không gian

1.2.2.1 Chất lượng hình ảnh thu được

Chất lượng hình ảnh thu được là một yếu tố cơ bản ảnh hưởng đến quá trình phát hiện đối tượng Trong một số trường hợp, chất lượng ảnh quá kém gây khó

khăn đối với việc phát hiện đối tượng Các vùng ảnh không thê tách biệt được khi

dựa trên các yếu tố màu sắc Các hình ảnh có độ phân giải thấp nên không thể nhìn

thấy rõ nhiều chi tiết Bên cạnh đó, các đối tượng thường bị che khuất bởi các cành

cây Các kích thước và các đặc tính kết cấu ảnh của đối tượng khác nhau quá nhiều và sự biến đổi của các đối tượng trong ảnh đòi hỏi phải tính toán nhiều đặc trưng

khác nhau

Chất lượng ảnh phụ thuộc rất nhiều vào thiết bị chụp ảnh Độ phân giải của

máy ảnh, cảm biến hình là yếu tố quyết định chất lượng ảnh Bên cạnh đó, yếu tố môi trường cũng ảnh hưởng đến chất lượng ảnh Môi trường có độ âm cao, sương mù, độ sáng, độ tương phản và độ sắc nét của hình ảnh thay đổi do yếu tố chiếu sáng của mặt trời và sự nhiễu loạn của khí quyên cũng làm chất lượng ảnh thu được kém hơn Để xử lý trường hợp này, cần có phương pháp làm tăng chất lượng ảnh

Cây cối Tòa nhà

Xe ôtô, bãi đậu xe

Hình 1.8 Gán nhãn lớp các đối tượng được ánh xạ

Trang 24

1.2.2.2 Lỗi chụp ảnh không gian

Với rất nhiều phương tiện ngày càng phát triển để phục vụ cho việc chụp ảnh từ không gian Tuy vậy, vẫn có những lỗi trong quá trình chụp ảnh và cũng có

những hạn chế nhất định như: Lỗi hình học (hay lỗi vị tr) do vị trí và kích thước của các đặc tính trên một bức ảnh thay đổi Lỗi hình học có thể xảy ra do các thiết

bị sử dụng để chụp những bức ảnh không gian (Wolf và Dewitt 2000)

Lỗi phóng xạ (các lỗi trong màu sắc và tôn ảnh) được gây ra bởi điều kiện, điểm chuân của máy ảnh cũng như các loại bộ lọc Môi trường làm biến đổi phóng xạ bao gồm giờ, mùa chụp ảnh Bóng tối, ánh sáng chói, đám mây và sương mù cũng có thể gây ra lỗi phóng xạ (Cohen et al, 1996)

Trong trường hợp khác, hai đối tượng có hình ảnh chồng lên nhau, hình của đối tượng này che khuất một phần hay toàn bộ hình của đối tượng kia Các phương

pháp xử lý nội dung ảnh (lọc màu, nhận dạng biên, ) sẽ phát hiện sai đối tượng khi gặp nhiễu Đây là vấn đề thách thức đối với bài toán phát hiện đối tượng

Hình 1.9 Hình ảnh được chụp từ trên không của thành phố Hồ Chí Minh, Việt Nam

dày đặc và chồng chéo lên nhau

1.3 Các vấn đề chính của phát hiện đối tượng

Các vấn đề của phát hiện đối tượng từ ảnh không gian liên quan đến việc xác định vị trí xuất hiện của các đối tượng trong ảnh không gian Đây là một trong những bài toán của lĩnh vực viễn thám và thị giác máy cũng như khai thác dữ liệu ảnh không gian và đóng vai trò quan trọng trong việc hiểu và giải thích ảnh không gian

Trang 25

Trong những năm qua, vấn đề phát hiện đối tượng tự động từ ảnh không gian là một đề tai thu hút nhiều sự quan tâm và nghiên cứu của cộng đồng thị giác máy và viễn thám Ảnh không gian với nhiều đối tượng khác nhau tạo nhiều thách thức trong vấn để nhận đạng đối tượng

Các đối tượng quan tâm có thé chia làm hai loại chủ yếu: 1) Lớp đối tượng xuất hiện thường xuyên như xe ô tô, xe tải,

2) Lớp các đối tượng phức tạp bao gồm các tòa nhà, mạng lưới giao thông Các tòa nhà là các đối tượng phức tạp với nhiều kiến trúc chỉ tiết và nhiều biến đổi

về hình dạng Các tòa nhà được tọa lạc trong các cảnh đô thị với nhiều loại đối tượng khác nhau như cây, công viên đỗ xe, đường phố, phương tiện đi lại, cột

điện

Hai đối tượng này có mô hình và ý nghĩa khác nhau trong ảnh không gian, ví dụ như phát hiện tòa nhà là đối tượng quan trọng trong quá trình xây dựng mô hình 3D trong khi đó phát hiện xe ôtô giúp khôi phục kết cấu đường bộ

Vì không có máy phát hiện tổng quát cho tất cả các loại đối tượng nên chúng

ta cần phát triển các hệ thống khác nhau để phát hiện hai loại đối tượng Các đặc

trưng được sử đụng để phát hiện các lớp đối tượng chủ yếu là các đặc trưng thị giác chung Vì vậy, cần phải xây dựng mô hình phát triển để có thể mở rộng và áp dụng các loại đối tượng khác nhau từ ảnh không gian cũng như ảnh trên mặt đất

Trong luận văn này, chúng tôi tập trung vào đối tượng chính là xe ôtô Dé phat

hiện và xác định vị trí một chiếc xe ôtô trong ảnh chụp từ trên không bằng cách xác

định đường bao quanh đối tượng Do đó cách tiếp cận phù hợp là sử dụng cửa số

tìm kiếm, trượt trên ảnh và nhận dạng các đối tượng trong cửa số với bộ phân loại Mục tiêu chính của phát hiện đối tượng bằng cách sử dụng kỹ thuật huấn luyện hiệu

quả Sử dụng phương pháp Online Boosting và tính toán các đặc trưng của đối tượng trong ảnh không gian

Với kho đữ liệu ngày càng khổng lồ cần phải được xử lý và trước các khó khăn: mắt nhiều thời gian, tốn nhiều công sức và nhiều chi phi để gán nhãn cho một lượng

Trang 26

lớn các dữ liệu huấn luyện Do đó, yêu cầu cần phải có nhiều dữ liệu huấn luyện đã

được gán nhãn để giải quyết bài toán phát hiện và phân loại đối tượng là trở ngại lớn, cản trở chính đối với nhiều phương pháp hiện nay

1.4 Một số ứng dụng của phát hiện đối tượng trong ảnh không gian

Phát hiện đối tượng từ ảnh không gian có rất nhiều ứng dụng, giúp con người chúng ta giải quyết rất nhiều van dé trong su phat triển không ngừng của trái đất,

của nhân loại Nó làm giàu thêm cho nhiều lĩnh vực từ vi mô đến vĩ mô Ở đây, tôi

giới thiệu một số ứng dụng tiêu biéu

> Mô hình thành phố 3D: Trong đô thị rất nhiều đối tượng: tòa nhà, xe Ơtơ,

thảm thực vật, mạng lưới giao thông, Chúng ta dùng những hình ảnh được chụp từ trên không để phát hiện những đối tượng ấy một cách rất nhanh chóng và đễ dàng Kết quả được phát hiện và trích xuất sẽ mô tả đầy đủ, phong phú và cho thấy được thành phố 3D một cách chỉ tiết ở mức độ cao Nếu chúng ta sử dụng bằng phương pháp thủ công thì việc tạo mô hình 3D cho thế giới thực rất tốn kém, mất thời gian và thậm chí không thê xây dựng được

> Làm giàu thêm về cơ sở lý thuyết khoa học, thúc đẩy và làm xuất hiện nhiều ngành khoa học mới, như ngành chụp ảnh trên không Một ví dụ chung như thế này: các hệ thống tự động hóa tạo mô hình thành phố 3D phát triển đã kéo theo sự phát triển của ngành máy ảnh, chụp ảnh trên không bằng máy ảnh kỹ thuật số đề phù hợp với yêu cầu ngày càng cao

> Phan loại, sử dụng các loại tài nguyên trên bể mặt trái đất Các loại tai

nguyên trên bể mặt trái đất bao gồm: nước, đất đùng cho canh tác, đất rừng, vật thê

nhân tạo Việc phân loại thông tin che phủ bề mặt trái đất từ hình ảnh được chụp từ

trên không vào các loại tài nguyên khác nhau được sử dụng cho quy hoạch đô thị, nông nghiệp, môi trường Và từ đó các bản đồ phân loại sử đụng trên bề mặt trái đất ra dot

> Trong nhiing thap kỷ trước, cơ sở dữ liệu về địa hình cơ bản đã được

hoàn thiện ở các nước phát triển Và hầu hết các thay đổi trong ban dé déu có những

bản cập nhật dữ liệu cho phù hợp với hiện tại Nhiệm vụ này thường được thực hiện

Trang 27

bằng phương pháp thủ công, đùng mắt thường để phát hiện các đối tượng thay đổi và chỉnh sửa lại Điều ấy đồng nghĩa với tốn kém nhân lực, tốn thời gian, không khoa học và ít hiệu quả Và phát hiện đối tượng từ ảnh chụp trên không bằng những phương pháp tự động đã giải quyết vấn đề ấy

1.5 Tiểu kết chương 1

Phát hiện đối tượng là một nghiên cứu có ý nghĩa thiết thực trong cuộc sống

và rất khoa học Nó phục vụ cho nhiều mục đích khác nhau của con người Chúng

ta có thể phát hiện đối tượng bằng mắt thường, thủ công Tuy nhiên, điều ấy không đáp ứng được những yêu cầu ngày càng phát triển của nhân loại Và hiện nay, chúng ta phát hiện đối tượng bằng những máy tự động Nhưng hàng loạt câu hỏi được đặt ra: Dữ liệu để phát hiện là gì? Chúng ta lấy dữ liệu ấy ở đâu? Dùng phương pháp nào để phát hiện hiệu quả Những câu hỏi ấy được trả lời toàn bộ trong luận văn này Trong chương 1, chúng †a mới chỉ giới thiệu về nó Dữ liệu là những tắm ảnh, và những tấm ảnh ấy được chụp từ trên không bằng máy bay

chuyên dụng, để phục vụ cho việc phát hiện đối tượng là xe ôtô trong một cảnh

quang đô thị

Chương I tuy là chương mở đầu, nhưng đã giới thiệu rất cơ bản về nội dung mà luận văn sẽ trình bày Ở đó, đã khái quát được ở những chương sau chúng ta sẽ làm gì và kết quả sẽ như thế nào?

Trang 28

Chương 2 PHƯƠNG PHÁP ONLINE BOOSTING PHÁT HIỆN XE

ÔTÔ TỪ ẢNH KHÔNG GIAN

2.1 Giới thiệu bài toán phát hiện xe ôtô từ ảnh không gian

Xây dựng một hệ thống đề phát hiện đối tượng từ ảnh không gian là một vấn dé quan trọng của thị giác máy Đã lôi cuốn nhiều cá nhân, tập thể, tổ chức quan tâm, nghiên cứu Tuy nhiên, đây là một vấn để đầy thách thức Vì với những hình ảnh không gian quy mô lớn, đối tượng của chúng ta là rất nhiều xe ôtô, sự biến đổi của nền và nhiều yếu tố khác đã gây những khó khăn nhất định Hình ảnh trên không vì được chụp từ trên xuống, do đó đối tượng xuất hiện trên ảnh theo hướng

dọc của khổ ảnh Trong một đô thị, thành phố với nhiều vật: tòa nhà, cây cối, con người, xe ôtô thì sự xuất hiện của những xe ôtô rất bé nhỏ và đa dang Đồng thời, cường độ xuất hiện và nhiều chi tiết cụ thể khác nhau, rất khó phân biệt Một số

hình ảnh nếu nhìn từ trên không rất giống với xe ôtô — đối tượng mà chúng †a cần phát hiện: như cửa số, cành cây, dáng người đang tập thể dục

Máy ảnh UltracamD của hãng Microsoft Vexcel được coi như một giải pháp để chụp ảnh trên khơng hồn hảo Nó cho chúng ta những bức ảnh chụp từ trên không với độ phân giải cực cao, dung lượng lớn Nhưng với những bộ dữ liệu ảnh quá lớn ấy chúng ta không thê dùng bằng mắt thường để phát hiện Và một đòi hỏi

thiết thực được để ra đó là xử lý phát hiện tự động hiệu quả Vấn đề này là hướng mở đê con người, các nhà nghiên cứu tìm ra được một thuật toán đủ mạnh và cho

kết quả tốt đề phát hiện xe ôtô từ ảnh trên không

Hình 2.1 Hai hình ảnh chụp quang cảnh một đô thị, trong đó xe ôtô xuất hiện rất

nhiêu và vô cùng nhỏ

Trang 29

Đã có rất nhiều nghiên cứu thành công về phát hiện đối tượng bằng phương pháp học máy Đặc biệt là phát hiện xe ôtô, ở đây chúng ta có thể chia làm hai nhóm phương pháp tiếp cận theo mô hình: mô hình rõ ràng và mô hình ân Phương pháp tiếp cận theo mô hình rõ ràng Đó là sử đụng một mô hình xe ơtơ chung Ơtơ

đó được thể hiện dưới mô hình 2D hay 3D đại diện cho hình dạng của xe ôtô Các đặc trưng hình ảnh: hình chữ nhật, kính chắn gió của xe ôtô được trích xuất và nhóm lại để xây dựng các cầu trúc tương tự như mô hỉnh Ngoài ra, màu sắc, độ bóng cũng là những đặc trưng có thể được sử dụng Việc phát hiện xe ôtô được thực hiện bằng cách nhóm các đặc trưng hình ảnh được trích xuất từ dưới lên trên hoặc

kết hợp mô hình từ trên xuống Đối tượng xe ôtô được coi là phát hiện nếu có bằng chứng xác thực cho mô hình trong ảnh Phương pháp tiếp cận này chủ yếu dựa vào các đặc điểm hình học của xe ôtô, đo đó đối với những mô hình phức tạp như trong

đô thị nhiều đối tượng có hình đạng giống với xe ôtô rất khó để phát hiện Phương pháp tiếp cận mô hình ân hoặc dựa trên ngoại hình, mô hình xe ôtô được tạo ra bằng

hình ảnh mẫu của xe bao gồm các giá trị về màu sắc hoặc các đặc trưng kết cấu Các mô hình được tạo ra bằng cách thu thập số liệu thống kê về các đặc trưng này

Đề phát hiện xe ôtô trong các hình ảnh trên mặt đất được chụp từ trên không một số mô hình dựa trên một phan hoặc toàn bộ các số liệu đã thống kê Có nhiều kiểu

phân loại: phân loại đơn, phân loại kết hợp, hay mô hình phân cấp cho phân loại Và máy vectơ hỗ trợ được sử dụng rất rộng rãi đề phân loại Với phương pháp tiếp cận

có những ưu điểm nhất định dé phát hiện xe ôtô, tuy nhiên vẫn còn tổn tại nhiều nhược điểm Trước nhất, đó là tốn kém rất nhiều về kinh tế để đầu tư tính toán đặc

trưng và phân loại Đồng thời, tốn nhiều thời gian và sức lao động của con người để có tập huấn luyện có phạm vi bao phủ tốt về không gian của các biến thể có thể có

của dữ liệu, và cần một lượng lớn dữ liệu được gán nhãn để huấn luyện

Và để khắc phục những hạn chế ấy, một phương pháp học máy đã được các nhà nghiên cứu cho ra đời, được sử đụng rộng rãi, phố biến Đó là phương pháp Boosting Phương pháp này được sử dụng trong: nhận dạng chữ viết, chuẩn đoán

trong y khoa, phân đoạn Đặc biệt hai nhà khoa học Paul Viola và Michael Jones

Trang 30

khuôn mặt Từ đó, kỹ thuật Boosting được đùng nhiều trong cộng đồng thị giác máy Với Boosting bài toán phát hiện đối tượng được xem là bài toán phân loại nhị phân, phân biệt giữa đối tượng với nền Kỹ thuật Boosting được áp dụng rất hiệu

quả với bộ dữ liệu ảnh cực lớn và thành công cho việc phát hiện nhiều đối tượng

khác nhau

Ở đây, tôi sử đụng Boosting để xây đựng một hệ thống học nhằm phát hiện xe ôtô bằng hình ảnh từ trên không Trước nhất, đùng Boosting và biểu diễn hình ảnh tích hợp để tính toán các đặc trưng của xe ôtô một cách nhanh chóng Bước sóng

Haar, biểu đồ định hướng cục bộ, các mẫu nhị phân cục bộ làm các đặc trưng Tiếp đến sử dụng Adaboost trực tuyến để huấn luyện máy phát hiện Nó thực hiện cập

nhật trực tuyến trên các nhóm đặc trưng trong quá trình huấn luyện Bằng cách này, chúng ta có thê cập nhật các lớp khi các mẫu mới đến Nhờ đó không cần phải xây dựng tập huấn luyện trước và việc ghi nhãn bằng thủ công

2.2 Phương pháp học máy Online Boosting

Trước khi đi vào nghiên cứu phương pháp Online Boosting chúng ta cần nắm những thành phần cơ bản và các phương pháp liên quan

2.2.1 Học máy Offline và học máy Online 2.2.1.1 Hoc may Offline

Trong quá trình học Offline, tất cả các mẫu huấn luyện phải được đưa ra trước Cụ thể, một tập huấn luyện Sf# = {(x¡,y\, ,(;,y,)} Với các mẫu có nhãn L

được đưa ra Các mẫu được rút ra từ một phân loại P, được định nghĩa trên toàn bộ

cac mau S = Xx Y

2.2.1.2 Hoc may Online

Chúng ta có những định nghĩa sau:

> Nhiệm vụ học Online: đây là một nhiệm vụ học trực tuyến, nếu chúng

ta lấy các mẫu cụ thể để huấn luyện thì nó không có sự sắp xếp ưu tiên nào cả, mà nó luôn có sự xuất hiện tất cả trong thời gian huấn luyện

Trang 31

> Thuật toán học Online: một thuật toán được gọi là học trực tuyến nếu

cho bất kỳ mẫu huấn luyện nào (x¡,¡), , (r,yr) nó tạo ra một chuỗi các giả đặc điểm chính của học Online là: không cần xử lý lại các mẫu trước vì mỗi h, được xem là giá trị xấp xỉ tốt nhất cho đến hiện tại của quá trình học Trong quá

trình học bất cứ lúc nảo cũng tạo ra một câu truy vấn và câu trả lời được cải thiện

trong quá trình học Do đó không có sự tách biệt trong giai đoạn huấn luyện và sàng

lọc, nó chạy trong một vòng lặp

(a) Offline (b) Online

Hình 2.2 a) Trong học Offline tất cả các đữ liệu huấn luyện đều có sẵn ngay từ đầu;

b) Trong khi học Online, một giả thuyết đang có H;_; được cập nhật bởi một mẫu

huấn luyện mới x¿ để có được một giả thuyết mới H,

Ta thấy rằng: thuật toán học Online trái với Offline chỉ xem mẫu một lần Trong thuật toán học Online ta xử lý một chuỗi các mẫu được gán nhãn lấy theo sự

phân chia của phân loại P Thuật toán học Online lấy đầu vào là một giả thuyết H,_;: X — Y và một mẫu huấn luyện mới (x¿, y,) Thuật toán trả về một giải thuyết

được cập nhật

H, = update(H,_, (xu Ye) (2.1)

Bat cứ lúc nào, cũng có sẵn một mô hình vi giả thuyết mô hình hóa quá trình tạo dữ liệu (xem hình 2.2 (b)) Nói chung các lớp phân loại có xu hướng hoạt động tốt hơn vì có thể xây dựng số liệu thống kê dựa trên tất cả các mẫu cùng một lúc

Trang 32

Thuật toán học Online không mắt dữ liệu là một thuật toán trả về giả thuyết chính

xác với những øì thuật toán Offline tương ứng sẽ trả về, cùng một dữ liệu huấn luyện Tuy nhiên, thuật toán Online tốt hơn trong các trường hợp sau:

v Dữ liệu huấn luyện lớn: vì toàn bộ dữ liệu không vào bộ nhớ cùng một lúc Do đó thuật toán Online ít tốn tài nguyên bộ nhớ hơn Thuật toán Online có

thê lấy mẫu từ phân phối tổng thể và không chỉ từ tập hợp con, đây là điểm khác

biệt với Offline Sự to lớn của dữ liệu và bùng nỗ thơng tin thì thuật tốn Online

ngày càng trở nên quan trọng hơn đối với các mô hình học quy mô lớn

v Tính khả dụng: không phải tất cả các dữ liệu có sẵn ở đầu vào Hơn

nữa, quá trình tạo dữ liệu tự nó có thể thay đổi theo thời gian Do đó, mục tiêu của

người học Online là bỏ qua thông tin không liên quan, chỉ chuyên sâu vào các tình huống đang xảy ra tuy nhiên phụ thuộc vào thời gian 2.2.2 Hệ thống nhận dạng mẫu Một hệ thống nhận dạng mẫu, chúng ta có thể chia nhỏ thành từng bước như sau: Bước 1: quan sat Bước 2: phân tích

Bước 3: trích xuất lựa chọn đặc trưng

Bước 4: phân loại Bước 5: xử lý hậu kỳ

2.2.2.1 Lựa chọn đặc trưng

Lựa chọn đặc trưng nhằm lựa chọn những đặc trưng tốt sau khi trích xuất đặc

trưng dựa trên các quy tắc phù hợp Lựa chọn đặc trưng làm giảm tính chiều của không gian và loại bỏ dữ liệu dư thừa, không liên quan Do đó tăng khả năng cải thiện chất lượng của dữ liệu và tăng độ chính xác của phát hiện Các phương pháp

lựa chọn đặc trưng tiêu chuẩn có thể chia thành ba phương thức được mô tả như

sau:

v Phương pháp lọc: chúng ta thường sử dụng một số kỹ thuật (heuristic) để ước tính tam quan trọng tương đối của các đặc trưng khác nhau Điều này có thé

được thực hiện bằng cách đánh giá từng đặc trưng một cách riêng biệt hoặc dưới

Trang 33

dạng một tập hợp kết hợp các đặc trưng Thuật toán sau đó chọn một tập hợp con có n đặc trưng Tuy nhiên, có một nhược điểm đó là thuật toán sẽ chọn cả những đặc trưng dư thừa, bởi vì các đặc trưng tương tự sẽ có trọng số tương tự nhau Và

phương pháp lọc sẽ chọn một tập con tốt trước khi áp đụng thuật toán học máy v Phương pháp đóng gói: phương pháp này trực tiếp đánh giá hiệu suất

các đặc trưng của một tập hợp con bằng cách đo hiệu suất của một mô hình được huấn luyện trên tập con đó Do đó trường hợp đặc biệt là tìm kiếm toàn diện của tất

cả các tập hợp đặc trưng 2!Ï trong đó rất lớn Ưu điểm là nó cung cấp tập hợp con

tối ưu cho thuật toán học được sử dụng, nắm bắt được sự kết hợp của các đặc trưng và loại bỏ các đặc trưng dư thừa Nhưng có nhược điểm là hiệu quả kém

v Bo loc — Wrapper — Hybrid: các phương pháp nhúng thực hiện lựa chọn những thay đổi trong quá trình huấn luyện và thường được chỉ định cho các thuật toán học máy cụ thể Các phương pháp này, sau khi sau khi trích xuất đặc trưng bằng phương pháp nào đó kết hợp các bước lựa chọn đặc trưng và huấn luyện phân loại trong một khung Ở mỗi giai đoạn một hàm đánh giá được sử dụng để chọn một đặc trưng, có khả năng phân biệt tốt nhất giữa các lớp Trong mỗi lần lặp với một đặc trưng do người đùng cung cấp, thuật toán đánh giá các đặc trưng đã

được chọn và thêm đặc trưng đánh giá cao nhất vào tập hợp đặc trưng Mục tiêu là

tìm kiếm các phát hiện thay thế trong số các đặc trưng Một phân phối trên các đặc

trưng được giữ và cập nhật tại mỗi lần lặp

2.2.2.2 Phương pháp tập hợp và Boosting

Phương pháp tập hợp có thể cải thiện hiệu suất thuật tốn thơng qua các mô

hình cơ sở Tập hợp là một ánh xạ quyết định từ quyết định cục bộ đến quyết định

cuối cùng (xem hình: 2.3)

Trang 34

(5) Hal)

Hình: 2.3 Sử dụng kết hợp các giả thuyết H;(%), , H„(x) một giả thuyết

tổng thể H(+) được xây dựng, giúp cải thiện hiệu suất

Xây dựng bộ tập hợp là một trong những lĩnh vực của học máy, đang nhận được sự quan tâm và nghiên cứu của rất nhiều học giả, nhà khoa học, nhà nghiên

cứu trong lĩnh vực thị giác máy Chủ yếu là do những cải tiến hiệu suất đáng kế so với các lớp đơn lẻ Các bước chính là tạo và kết hợp mô hình Các phân loại đơn lẻ phải chính xác nhất có thể, nhưng loại trừ tối đa những phân loại không chính xác Hai mục tiêu này bằng một phương pháp nào đó đề xác định Nếu các phương pháp

nào huấn luyện chính xác hơn, rõ ràng hon thi sé duoc sử dụng

Nhiều phương pháp đã được phát triển để thực thi tính đa dạng trên các lớp

Ví dụ: sử dụng lược đỗ kết hợp di động, các mô hình phân loại khác nhau, các tập hợp đặc trưng khác nhau hoặc các mẫu huấn luyện khác nhau Khi sử dụng các mẫu huấn luyện khác nhau (bộ dữ liệu huấn luyện), các thuật toán huấn luyện sẽ chạy

nhiều lần, mỗi lần với một phân vùng khác nhau của toàn bộ tập huấn luyện Đóng gói và tăng cường tương ứng với nhóm đó

Các phương pháp Boosting thay đổi một cách thích ứng sự phân phối của tập huấn luyện dựa trên hiệu suất của các lớp trước đó Không giống như đóng gói, phần lớn là phương pháp giảm phương sai, Boosting đường như làm cả sai số và phương sai

Trang 35

2.2.2.3 Một số loại đặc trưng

> Đặc trưng Haar-like: giá trị đặc trưng được tính bằng tổng giá tri pixel (điểm ảnh) trong các vùng hình chữ nhật có trọng số dương hoặc âm Những đặc trưng này được Viola và Jones công bố để phát hiện khuôn mặt và được sử đụng rộng rãi trong thị giác máy Ở đây, chỉ dùng bốn nguyên mẫu khác nhau của các đặc trưng, xem hình 2.4 Một đặc trưng hai hình chữ nhật bao gồm hai vùng có củng

kích thước, hình dạng và liền kể nhau theo chiều ngang hoặc chiều dọc Đối với đặc

trưng ba hình chữ nhật, hình chữ nhật trung tâm bằng hình chữ nhật bao quát trừ

tổng của hai hình chữ nhật bên ngoài Đối với đặc trưng bốn hình chữ nhật, sự thay

đổi giữa các hình chữ nhật chéo nhau được tính toán Đối với đặc trưng hình trung tâm được tính bằng cách trừ các pixel xung quanh Các đặc trưng này được tính toán ở các quy mô khác nhau Dime P mm ie I = L] a L—] — (a) (b)

Hinh 2.4 Cac dac trung hinh anh co ban duoc thé hién; a) Giá trị của đặc trưng

Haar-like là sự thay đổi của các giá tri pixel giữa vùng đánh đấu màu trắng và màu

cam b) Phiên bản đơn giản để có được mẫu nhị phân cục bộ

> Dac trung dua vao biểu đồ định hướng: đầu tiên một hình ảnh Gradient duoc tinh bang bộ lọc Sobel Biểu đỗ trọng số hướng GradIent có độ lớn

được xây dựng các vùng hình chữ nhật cơ bản Và biêu đồ định hướng 8 ngăn với

kích thước không thay đổi được dùng Với mục đích cơ bản là mô tả sự xuất hiện

của một phần đối tượng bằng các théng tin Gradient

Trang 36

> Dac trung mau nhi phân cục b6 (LBP): mau nhi phân cục bộ sử dụng

4 vùng lân cận (láng giềng), với 16 mẫu (2'=l6), như đặc trưng của biểu đồ 16 ngăn Mô tả kết cầu của một bức ảnh các giá trị thống kê của điểm ảnh được chuẩn hóa trong vùng lân cận cục bộ Giá trị thống kê của vùng ảnh là 3x3 (xem hình 2.4 (b)) được tính toán như sau:

1 z>0

0 z<0 2.2)

LBP(x) = i=o S(X¡ — icemnar 2" VỚI sứ) = {

Biểu diễn cuối cùng, là biểu đồ của các giá trị LBP có được bằng cách đi chuyền

các mẫu 3x3 trong toàn vùng ảnh

Đề thu được một bộ phân loại yếu fee từ tính năng j, ta đánh giá mô hình

phân phối xác xuất của các đặc trưng này cho các mẫu đương (có đối tượng) và mẫu

âm (không có đối tượng) với f(x) phân tích đặc trưng nay trên ảnh x Ching ta ước

tính xác xuất P(1|ý(+)) giả sử phân bố Gauss N(¿,ơ') chẳng hạn gia tăng cập nhật ¿ và ø' cho các mẫu đã gán nhãn đối tượng và P(-I|f§(œ)) bởi M(Z,ơ_) cho các mẫu đã gán nhãn không phải đối tượng Đối với các đặc trưng Haar-like cổ điển, ta sử dụng tiêu chí ra quyết định Bayes dựa trên các xác suất ước tính Gauss

của hàm mật độ g(x | /,ø)

he (x)= sign(P(L| f(x) -P(l| J,(3)))* sigr(g(/7(xÌ #'.ø°)=g(/,(3)|.ø)) — (23)

Đối với các biểu đỗ dựa trên các kiểu đặc trưng như biểu đồ định hướng và LBP thì các thuật toán huấn luyện cục bộ gần nhất được sử dụng Các mẫu chứa đối tượng và các mẫu không chứa đối tượng được mô hình hóa bởi mỗi cụm Việc phân loại yếu được cho bởi:

hv (x) = sigi(DỢ,(3) p,)— DỨ,(3).n,)) (2.4)

Trong do D là độ đo khoảng cách, trong truong hop Euclide thi dung pj va nj la cac

tâm của cụm để học các mẫu đối tượng và các mẫu không phải đối tượng Nhiệm vụ

là ước tính hai phân phối Gauss (trung bình và phương sai) cho mỗi bin (một cho lớp đối tượng và một cho lớp không phải đối tượng) Trong khung Boosting trực

Trang 37

tuyến cho lựa chọn đặc trưng, điều này được thực hiện một cách trực tuyến dựa trên

hai phương pháp tiếp cận đơn giản dựa trên kỹ thuật đệ quy: Lọc Kalman và trung vị xấp xỉ, đã chứng minh là có hiệu quả

Nhờ độ phân giải của hình ảnh, phát hiện xe ôtô ở những quy mô khác nhau là không cần thiết Tuy nhiên, chiếc xe có thể xuất hiện ở bất kỳ hướng nào Máy phát

hiện có thể thực hiện xoay bất biến bằng cách tính toán các đặc trưng tại các góc

khác nhau Lienhart giới thiệu thêm một bộ xoay các đặc trưng Haar-like bao gồm

một tập các đặc trưng cơ bản và được tính toán hiệu quả Một phân loại trước đây

được huấn luyện chuyển đổi đến bất kỳ góc nào để xoay các đối tượng được phát

hiện Một máy nhận dạng thời gian thực cho xoay bất biến được công bố bởi Viola-

Jones Một kỹ thuật tương tự được sử dụng trong hệ thống này: máy nhận dạng có thê xoay bằng cách tăng 100 Đối với các đặc trưng của biểu đồ định hướng, sự quay

có thể được thực hiện bằng cách chuyển các biểu đồ

2.2.3 Học máy Online Boosting

Các thuật toán học máy Online gắn liền với việc học từng ví dụ huấn luyện một lần khi đến và loại bỏ khi đã được cập nhật Một thuật toán hoc may Online Lo

lấy đầu vào là một giả thuyết đang có h và một mẫu huấn luyện mới (x, y) Sau khi

xử lý, thuật toán trả về một giả thuyết mới được cập nhật để phản ánh lại mẫu huấn luyện mới (%x, y) Vấn đề học Online là rất cần thiết cho dòng dữ liệu và tập dữ liệu

cần xử lý rất lớn Nó được áp dụng đề giảm tối thiêu việc ghi nhãn bằng tay cho các

mẫu huấn luyện và đồng thời cho những bản cập nhật được cải thiện rất hiệu quả

Cho một tập hợp các phân loại yếu (hị, , hạ) và các trọng số tương ứng

(ơi, , ơn), một giả thuyết mạnh hŠ?"(x) có thể được hình thành Theo nghiên

cứu và đề xuất của Oza [12] , điều quan trọng của Online Boosting là ước tính được tầm quan trọng hay độ khó của mẫu Điều này được thực hiện bằng cách lan truyền

thông qua một tập hợp bộ phân loại yếu Nó được xem như là một mô hình và được mã hóa đặc biệt với trọng số An (voi Ap = 1), để thực hiện cho việc cập nhật lớp yếu thứ n+1 Trong thuật toán „ còn được xem như là một tỉ lệ học với k lần cập

Trang 38

nhật và k ~ A Để cập nhật các phân loại yếu, mọi thuật toán học Online đều có thể được sử dụng Lỗi bộ phân loại yếu thứ n được tính bởi công thức:

qwrong

— TL

Cn = grata gar (2.5)

Trong đó: „ 5, £?"* là tổng các trọng số của các mẫu phân loại chính xác hay

không chính xác được thấy ở thời điểm hiện tại Trong thực tế, trọng số quan trọng của bộ chọn thứ n được tính: xem - ger +4, h, (x) =y em _ ng HA, h, (x)#y (2.6) Trọng số tương ứng được tính liên quan đến lỗi: a, -j.4( =") 2 e n (2.7)

Việc cập nhật trọng số quan trọng 2 cho bộ phân loại yếu thi n+1 duoc tinh theo lỗi và đầu ra của bộ phân loại yếu:

1 h = _ 2q-e) ,(X,)=y

Ay = Aya 1

— 2.(2„) kêu

Oza [12] đã chứng minh rằng, nếu thực hiện Boosting ngoại tuyến và trực tuyến trên một tập huấn luyện đã cho thì kết quả của các bộ phân loại yếu sử đụng Boosting trực tuyến và Boosting ngoại tuyến khi sé lan lap No sé hội tụ Vì vậy, việc lặp lại của tập đữ liệu huấn luyện khi áp dụng hai phương pháp Boosting trực tuyến và ngoại tuyến đều cho cùng một kết quả Trong thuật toán Boosting trực tuyến yêu cầu số lượng các bộ phân loại yếu phải cố định

2.2.3.1 AdaBoost roi rac

AdaBoost là một thuật toán Boosting thích ứng Boosting rất phố biến và có

nhiều biến thể khác nhau đã phát triển: Real-Boost, LP-Boost AdaBoost đã được

Trang 39

được sử dụng để nhận dạng văn bản, lọc văn bản, các van dé xép hang, cac van dé

về xử lý ngôn ngữ tự nhiên Nói chung Boosting là một phương pháp để cải thiện độ chính xác của bất kỳ thuật toán nào của quá trình huấn luyện Điều này được thực hiện bằng cách kết hợp (quá trình chọn lựa có trọng số) của các giả thuyết N đã

được tạo ra bằng cách lặp lại quá trình huấn luyện với các tập con khác nhau của dữ liệu huấn luyện

> Phan loai yếu: một phân loại yếu chỉ thực hiện tốt hơn rất ít so với đoán ngẫu nhiên Tức là với tìm kiếm nhị phân, tỉ lệ lỗi phải nhỏ hơn 50% Giả

thuyết h: X— {—1, +1} được tạo bởi một phân loại yếu có được bằng cách áp dụng

thuật toán huấn luyện

> Phân loại mạnh: cho một tập hợp N phân loại yếu, một phân loại

mạnh được tính là tổ hợp tuyến tính của các phân loại yếu Giá trị f(.) (có liên quan

đến lựa chọn) có thể được hiểu là thước đo liên tục

A(x) = sign(f (x)) với f(x) = dha, n(x) (2.9)

Ngoài ra, có thê dễ dàng thấy rằng việc tăng cường phát triển công cụ ước tính khả năng =1 PŒ = 1x) H(x) = Flog Gap) (2.10) exp (H(x))

Hoac tuong duong: P(y = 1|x) = exp(H())+exp (H()) (2.11)

Cho một tập huấn luyện S với các mẫu có nhãn dương và âm và trọng số ban đầu wạ = (Wor Woz): Wol = 7 qua vi du l = I, ,L Một lớp yếu h(+) được huấn luyện dựa trên tập huấn luyện S va trọng số w(%), có nghĩa là:

L

h, arg min SW, ovine I, TA (2.12)

Dựa trên lỗi trọng số e„ của lớp yếu, nó được chỉ định trọng số được chọn

Trang 40

#„ = ~In (“*) 2 en (2.13) Cuối cùng phân phối trọng số exp(—øn) h@) =" 2.14 e€XP (an) h(x) #y ( ) Wn+1j — war|

Được cập nhật sao cho xác xuất các mẫu tăng, đó là phân loại sa1 Nếu mẫu được

phân loại chính xác, trọng số tương ứng sẽ giảm Do đó thuật toán tập trung vào các

mẫu đi chuyền Quá trình được lặp lại và ở mỗi lần lặp tăng cường, một phân loại

yếu mới được thêm vào cho đến khi một số lượng lớp yếu được huấn luyện

Đây là một sự thay đổi trong bộ nhớ Thay vì cố gắng thiết kế một thuật tốn huấn luyện trên tồn bộ không gian, thay vào đó có thê tập trung vào các thuật toán huấn luyện, chỉ cần tốt hơn đoán ngẫu nhiên và kết hợp chúng lại

Freund và Schapire [7] đã chứng minh các hạn chế rất lớn về lỗi huấn luyện và lỗ hỏng cơ bản của AdaBoost Đối với trường hợp phân loại nhị phân, huấn luyện lỗi giảm nhanh theo cấp số nhân liên quan đến vòng N tăng Khi vòng N tăng quá lớn thì sẽ dẫn đến tình trạng vượt quá giới hạn cho phép Và có một số hạn chế khác Vì thế, đã có những nghiên cứu để khắc phục vấn đề này

2.2.3.2 Boosting cho lựa chọn đặc trưng

Lựa chọn đặc trưng với mục đích để có được những đặc trưng hữu ích, giảm

tính năng chiều của không gian và loại bỏ dữ liệu nhiễu Tieu và Viola là hai nhà

nghiên cứu giới thiệu đầu tiên về Boosting cho lựa chọn đặc trưng [17] Với nội

dung cốt lõi là mỗi đặc trưng tương ứng với một lớp yếu duy nhất và Boosting chọn

một tập hợp con dữ liệu từ các đặc trưng này Tiến hành huấn luyện như một thuật

toán Boosting được mô tả Cho một tập hợp các đặc trưng E = {ƒ, , ƒ„} trong mỗi bước lặp n, thuật toán xây dựng một giả thuyết yếu đựa trên các mẫu huấn luyện có trọng số Cái tốt nhất hình thành nên giả thuyết yếu h*“ tương ứng với đặc trưng

được chọn ƒ„ Trọng số của các mẫu huấn luyện được cập nhật liên quan đến lỗi của

các giả thuyết được chọn

Ngày đăng: 11/01/2024, 22:48

TÀI LIỆU CÙNG NGƯỜI DÙNG

  • Đang cập nhật ...

TÀI LIỆU LIÊN QUAN

w