Luận văn: Tìm hiểu các kỹ thuật áp dụng cho bài toán nhận dạng ký hiệu người câm pot

75 449 0
Luận văn: Tìm hiểu các kỹ thuật áp dụng cho bài toán nhận dạng ký hiệu người câm pot

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

TR NG I H C KHOA H C T NHIÊN KHOA CÔNG NGH THÔNG TIN B MÔN CÔNG NGH PH N M M INH BÁ TH NG – NG BÁC V N TÌM HI U CÁC K THU T ÁP D NG CHO BÀI TOÁN NH N D NG KÝ HI U NG KHÓA LU N C NHÂN TIN H C TP.HCM, N M 2005 I CÂM TR NG I H C KHOA H C T NHIÊN KHOA CÔNG NGH THÔNG TIN B MÔN CÔNG NGH PH N M M INH BÁ TH NG – 0112446 NG BÁC V N – 0112454 TÌM HI U CÁC K THU T ÁP D NG CHO BÀI TOÁN NH N D NG KÝ HI U NG KHÓA LU N C NHÂN TIN H C GIÁO VIÊN H T.S D NG D N NG ANH C Th.S NGUY N TRI TU N NIÊN KHÓA 2001 - 2005 I CÂM L I NH N XÉT C A GIÁO VIÊN H NG D N …………………………………………………………………………………………………… …………………………………………………………………………………………………… …………………………………………………………………………………………………… …………………………………………………………………………………………………… …………………………………………………………………………………………………… …………………………………………………………………………………………………… …………………………………………………………………………………………………… …………………………………………………………………………………………………… …………………………………………………………………………………………………… …………………………………………………………………………………………………… …………………………………………………………………………………………………… …………………………………………………………………………………………………… …………………………………………………………………………………………………… …………………………………………………………………………………………………… …………………………………………………………………………………………………… …………………………………………………………………………………………………… …………………………………………………………………………………………………… …………………………………………………………………………………………………… …………………………………………………………………………………………………… …………………………………………………………………………………………………… …………………………………………………………………………………………………… …………………………………………………………………………………………………… …………………………………………………………………………………………………… …………………………………………………………………………………………………… …………………………………………………………………………………………………… …………………………………………………………………………………………………… …………………………………………………………………………………………………… L I NH N XÉT C A GIÁO VIÊN PH N BI N …………………………………………………………………………………………………… …………………………………………………………………………………………………… …………………………………………………………………………………………………… …………………………………………………………………………………………………… …………………………………………………………………………………………………… …………………………………………………………………………………………………… …………………………………………………………………………………………………… …………………………………………………………………………………………………… …………………………………………………………………………………………………… …………………………………………………………………………………………………… …………………………………………………………………………………………………… …………………………………………………………………………………………………… …………………………………………………………………………………………………… …………………………………………………………………………………………………… …………………………………………………………………………………………………… …………………………………………………………………………………………………… …………………………………………………………………………………………………… …………………………………………………………………………………………………… …………………………………………………………………………………………………… …………………………………………………………………………………………………… …………………………………………………………………………………………………… …………………………………………………………………………………………………… …………………………………………………………………………………………………… …………………………………………………………………………………………………… …………………………………………………………………………………………………… …………………………………………………………………………………………………… …………………………………………………………………………………………………… L ic m n Chúng em xin chân thành c m n Khoa Công ngh Thông tin, tr ng Khoa h c T nhiên TP.HCM ã t o i u ki n cho chúng em th c hi n ih c tài lu n v n t t nghi p Chúng em xin g i l i c m n sâu s c n Ti n s D Nguy n Tri Tu n Th c s Lê ình Duy ã t n tình h th i gian th c hi n tài Qua th i gian ng Anh c, Th c s ng d n chúng em su t c th y h ng d n, chúng em ã bi t cách làm vi c khoa h c h n, bi t cách “Khi em vi t m t khơng ph i c a em em ph i cho ng i khác bi t ó c a ai”, c ng nh “Khi em nói k t qu em t c t t ph i rõ t t t t th nào” Chúng em xin chân thành c m n Th y Cô Khoa ã truy n t cho chúng em nh ng ki n th c quý báu nh ng n m h c v a qua, giúp chúng em có c m t n n t ng lý thuy t v ng ch c Chúng xin có th ti p t c theo h c hay i tìm vi c làm c bày t lịng bi t n sâu s c i v i Ông Bà, Cha M , ng i luôn quan tâm ch m sóc c v m t v t ch t l n tinh th n, t o i u ki n cho chúng chuyên tâm h c t p nghi n c u Cu i cùng, xin c nói l i c m n chân thành n anh ch b n ã giúp , khích l c ng nh phê bình, góp ý, giúp chúng em hồn thành cơng vi c m t cách t t nh t Tuy chúng em ã n l c h t s c hồn thành lu n v n, nh ng ch c ch n lu n v n v n nhi u thi u sót Chúng em r t mong nh n tình c a Th y Cô b n c s góp ý, ch b o t n chúng em có th ti p t c th c hi n nh ng chúng em vi t m c “h ng phát tri n” c a khóa lu n Thành ph H Chí Minh, Tháng 7/2005 Nhóm SV th c hi n inh Bá Th ng – ng Bác V n L i nói S ng k u i c a máy tính ã giúp ích r t nhi u cho cơng vi c cu c s ng c a i V i máy tính, ng i có th so n th o v n b n, nghe nh c, xem phim, thi t h a, x lý nh, biên t p phim Tuy nhiên, vi c giao ti p gi a ng tính ph thu c ch y u vào bàn phím chu t, h u nh ng tr c máy tính D n d n, nhà s n xu t th y i ph i ng i c s b t ti n ã t o bàn phím chu t không dây v i mong mu n mang l i s t h n cho ng bàn phím khơng dây v n bàn phím, ng tính thơng qua h th ng 104 phím Con ng t ng tác v i máy tính i máy i dùng Tuy nhiên, i c ng ch có th t i ch th t s ng tác v i máy c “gi i phóng” vi c c th c hi n thông qua c ch cu c s ng hàng ngày, t c máy tính ph i “hi u” c c ch c a ng cho toán nh n d ng phân lo i c ch Cho i ó v n t n th i i m hi n nay, dù ã có nhi u cách ti p c n khác cho toán này, nh ng d ng nh v n ch a có m t h th ng nh n d ng c ch th c s hi u qu Bên c nh ó, tốn nh n d ng m t ng i ang t c m t k t qu r t kh quan v i mơ hình Cascade of Boosted Classifiers Viola Jones [1] hình t hi u qu cao c v ngh Mô xác l n th i gian nh n d ng Eng Jon [14] ã áp d ng mơ hình lên toán nh n d ng bàn tay c ng t c k t qu t t M c tiêu c a khóa lu n th áp d ng mơ hình Cascade of Boosted Classifiers lên toán phân lo i c ch v i hi v ng c ng s nh toán nh n d ng m t ng ch Ch t c k t qu t t i nh n d ng bàn tay Lu n v n c trình bày ng v i b c c nh sau: ng 1-M u: Nêu lên t m quan tr ng c a toán phân lo i c ch mô t s b ph m vi tốn mà khóa lu n s gi i quy t ng th i gi i i m s qua cách ti p c n hi n có v i u khuy t i m c a chúng gi i thi u v mơ hình s d ng khóa lu n Ch ng 2-Gi i thi u toán phân lo i c ch : Phát bi u c th mô t chi ti t ph m vi toán s gi i quy t, gi i thích t i l i ch n mơ hình Cascade of Boosted Classifiers Ch ng 3-C s lý thuy t: Trình bày v AdaBoost, Haar Feature, mơ hình Cascade of Classifiers, khái ni m Integral Image, t ó hình thành nên c u trúc Cascade of Boosted Classifiers Ti p ó ph n gi i thi u ng d ng c a mô hình m t s nh n xét, ánh giá Ch ng 4-Áp d ng mơ hình Cascade of Boosted Classifiers: Trình bày chi ti t cách áp d ng mơ hình cascade lên tốn phân lo i c ch Ch ng 5-K t qu th nghi m: Gi i thi u v t p hu n luy n, cách thu th p m u, cách ti n hành k t qu hu n luy n, qu c a ng Ch ng th i so sánh i chi u v i k t i khác ng 6-T ng k t: Tóm t t k t qu nghiên c u, nh ng ã nh ng h n ch nêu h ng phát tri n t ng lai t c, M cL c Ch ng M u .6 Ch ng Gi i thi u v h th ng phân lo i c ch 12 Ch ng Các c s lý thuy t 15 3.1 Ti p c n Boosting 15 3.2 AdaBoost 16 3.3 Haar Feature 20 3.4 Cascade of Classifiers .24 3.5 Cascade of Boosted Classifiers .25 3.6 ánh giá 26 Ch ng 4.1 Phân lo i c ch v i Cascade of Boosted Classifiers .29 B nh n d ng c ch .29 4.1.1 T p hu n luy n .29 4.1.2 c tr ng 31 4.1.3 Xây d ng b nh n d ng v i AdaBoost 32 4.1.4 Cascade of Boosted Classifiers 36 4.1.5 Ho t 4.2 Ch ng c a b nh n d ng c ch 38 B phân lo i c ch 41 ng K t qu th nghi m 43 5.1 T p hu n luy n 43 5.2 Cách ti n hành hu n luy n 47 5.3 K t qu th nghi m 49 5.4 So sánh ánh giá 53 Ch ng T ng k t 56 6.1 K t lu n 56 6.2 H ng phát tri n 57 Ph l c A: Các thu t ng liên quan .59 Ph l c B: Các ch ng trình dùng cho hu n luy n .62 Ph l c C: Các ch ng trình ti n ích .66 Tài li u tham kh o 67 Danh sách hình Hình - H th ng 24 c ch .8 Hình - B phân lo i c ch Hình - B phân lo i c t o thành t s k t h p b nh n d ng 10 Hình - H th ng 24 c ch 13 Hình - Boosting 16 Hình - Strong classifier H(x) xây d ng b ng AdaBoost 17 Hình - Haar Feature c b n 21 Hình - Haar Feature cho m t ng i 21 Hình - SAT(x,y) cách tính t ng i m nh m t hình ch nh t b t kì 22 Hình 10 - Haar Feature xoay 45º Lienhart ngh 23 Hình 11 - RSAT(x,y) cách tính t ng i m nh m t hình ch nh t xoay góc 45º 23 Hình 12 - Cascade of Classifiers 25 Hình 13 - B nh n d ng c ch A 29 Hình 14 - Các m u positive cho b nh n d ng ch A 30 Hình 15 - Các m u negative (B, C, D) cho b nh n d ng ch A 30 Hình 16 - T p hu n luy n c a weak classifiers 31 Hình 17 - Các Haar Feature s d ng b nh n d ng c ch 31 Hình 18 - Cách ch n weak classifier c a AdaBoost 34 Hình 19 - Ch n ng ng d a vào detection rate 35 Hình 20 - Các vùng nh không liên quan (nét m nh) s b lo i t nh ng stages u tiên 39 Hình 21 - Kh c ph c tr ng h p nhi u vùng nh k c n b ng cách l y vùng nh trung bình .39 Hình 22 - i v i vùng nh l ng nhau, vùng nh bên s b lo i b 40 Ch ng K t qu th nghi m em ã hu n luy n ký hi u Victory vi t c a Kolsch (ch n false alarm m c 10-3) có th hi n qua bi u Hình 38 - Bi u sau: so sánh Hit Rate gi a ký hi u Victory v i c ch V Còn v i t l false alarm nh v y cho ký t L ký hi u Lpalm, ta s có k t qu nh sau: Hình 39 - Bi u so sánh Hit Rate gi a ký hi u LPalm v i c ch L Nh ng so sánh ây ch mang tính t ng i, cho th y hi u qu c a b nh n d ng cho t ng c ch xây d ng khóa lu n ch khơng th c s nói lên 54 c Ch t ng K t qu th nghi m ng quan gi a h th ng, b i s li u l y t t p hu n luy n t p test khác Hình 40 - Vài k t qu test c a b nh n d ng c ch A (c ch B m t tr 55 ng h p false alarm) Ch ng T ng k t Ch ng T ng k t 6.1 K t lu n Trên c s tìm hi u v thu t tốn AdaBoost, Haar Feature mơ hình Cascade of Classifiers, chúng em ã áp d ng c mơ hình Cascade of Boosted Classifers – v n c áp d ng l nh v c nh n d ng m t ng ã t nh ng nh ng k t qu b c i – lên toán nh n d ng c ch u Chúng em ã ti n hành t t c khâu b t u t vi c l y m u b ng cách ch p hình b n l p, Th y Cô cán b gi ng d y tr nh ng ng i thân gia ình chúng em; ti p này; sau ó b t tay vào ch nh s a ch n chu n hóa hình ng trình hu n luy n c th vi n OpenCV cung c p; cu i ti n hành hu n luy n th nghi m r t nhi u l n ch n c kích th c m u phù h p, có th ch n false alarm, hit rate cho h th ng em c ng ã xây d ng m t s ch có th c nh ng tham s v max t hi u qu t t nh t Bên c nh ó, chúng ng trình ti n ích ph c v cho vi c chu n hóa m u hu n luy n (xem ph n Ph l c C bi t thêm chi ti t), qua ó bi t cách s d ng hàm th vi n OpenCV 24 b nh n d ng cho 24 c ch mà chúng em xây d ng v i detection rate kho ng 96% Tuy false alarm t i u ch p nh n cv is l ch p t webcam v i ng ng m u gi i h n ch t l c ã cho k t qu t t i cao, nh ng ó c ng ng khơng cao (do c phân gi i ch 320x240) c a m i c ch mà chúng em ã thu th p Tuy nhiên, khóa lu n ch d ng l i ch mà ch a th k t h p chúng m c xây d ng c 24 b nh n d ng c t o thành m t b phân lo i c ch nh m c tiêu 56 Ch ng T ng k t ban u h n ch v th i gian, m t ph n th i gian th c hi n không , m t ph n khâu hu n luy n chi m nhi u th i gian 6.2 H ng phát tri n H ng phát tri n tr c m t xây d ng m t b phân lo i c ch d a s k t h p b nh n d ng c ch th c d a m t camera ã có T ó xây d ng m t h th ng phân lo i th i gian ghi nh n c ch mà ng c h th ng có kh n ng “hi u” i dùng d u M t có c c ch c a ng i, ta b t h th ng m t s tính n ng yêu c u chúng th c hi n nh n u có th gán cho c m t c ch ó – m t nh ng ng d ng d ng i u n robot H th ng hi n t i ch ho t ng c m góc quay c a bàn tay Trong t i v i hình ch p di n, cịn nh y ng lai, ta có th s d ng thêm khác ngồi Haar Feature, có th áp d ng thêm bi n Kolsch [7]) có th nh n d ng c c ch i Fourier (nh ti p c n c a m i góc quay hành xây d ng nhi u b nh n d ng cho m t c ch , m i b s c a c ch ó có th nh n d ng c ch t m i góc i v i tốn nh n d ng c ch v n s l c tr ng ng th i có th ti n m nhi m m t góc nhìn ng cịn nhi u h n ch h n ch l n nh t ng t v ng Mơ hình Cascade of Boosted Classifiers cho k t qu r t t t toán nh n d ng c ch t nh, ta có th áp d ng lên toán nh n d ng c ch ng b ng cách nh n d ng t ng khung hình c a trình chuy n gi a khung hình ó có th V i nh ng k t qu t ng tác v i ng t ng, s chuy n ti p c th c x lý b ng mơ hình Markov n c hi n này, có c m t h th ng th c s có th i thơng qua c ch v n m t ch ng ng dài ph i i Tuy nhiên, i u ó c ng khơng có ngh a khơng th N u có th v t qua v is l c nh ng tr ng i tr c m t, n u có th nh n d ng c c ch ng ng t v ng nhi u h n m t th gi i m i, m t th gi i mà máy ch c n có 57 Ch ng T ng k t h th ng camera có th t nh m n ng tác v i ng c 58 i, m t ích mà có th Ph l c A: Các thu t ng liên quan Ph l c A: Các thu t ng liên quan Pattern (M u) c chia lo i: Training Samples (M u hu n luy n ): M u hu n luy n m u dùng cho vi c h c c a m t h nh n d ng Trong trình hu n luy n, b nh n d ng s h c t m u này, thông qua c tr ng nh n it ng c n nh n d ng M u hu n luy n g m lo i: o Positive samples: m u ch a it ng c n nh n d ng o Negative samples: m u không ch a it ng c n nh n d ng Trong trình h c, b nh n d ng s c g ng tìm positive mà m u negative khơng có, t t ng c n nh n d ng Khi ng ó rút c tr ng c a m u c c tr ng c a i a m t m u m i vào nh n d ng, b nh n d ng s áp c tr ng lên m u, n u th a m u it ng c n nh n d ng, c l i khơng ph i Test Samples (M u ki m th ): M u ki m th m u dùng cho vi c ki m tra t l nh n d ng c a m t h nh n d ng Các m u ph i không n m t p hu n luy n T l nh n d ng úng m u t p ki m th nói lên tính hi u qu c a h nh n d ng, b i m u h nh n d ng ch a h v n nh n d ng úng ch ng t tr ng c a Feature ( it c tr ng mà rút th t s c ng c tr ng) Là thông tin giúp it ng t m t m u a vào có ch a ph i bi t c tr ng c a cá mú, c h c, n u c it nh danh it h nh n d ng có th bi t c ng c n nh n d ng hay không, b nh n d ng ng ó Ví d nh toán phân lo i cá h i c tr ng c a cá h i có th “ sáng không d 59 i 0.5 chi u dài v y không Ph l c A: Các thu t ng liên quan cm” Khi ó, n u m u a vào th a c tr ng cá h i, ng c l i cá mú Trong b t c tốn nh n d ng nào, thơng th có th giúp nh n d ng t t m tm u it ng (“ ng khơng t n t i m t sáng không d i 0.5” ch a a vào “cá h i”), mà ịi h i ph i k t h p nhi u ó chúng c g i khơng gian Threshold (Ng c tr ng n k t lu n c tr ng v i nhau, ng) Ng c tr ng ng giá tr “ranh gi i” gi a l p Trong ví d c g i ng ng Ng b ng th c nghi m (Ng ch n ng ng có th hi u ch nh trên, giá tr “0.5” “3” c, thơng th i ta th b nh n d ng v i giá tr ng ng c ch n ng khác ng cho t l nh n d ng úng t t nh t) Classifier (B phân lo i) M t h nh n d ng g m nhi u b phân lo i, m i b phân lo i ng v i m t l p, g m m t hay nhi u lu t d ng If…then… v i m u c c tr ng ng ng t ng ng Khi m t a vào b phân lo i, b phân lo i s ki m tra xem có th a lu t hay khơng, n u th a khơng s c c x p vào l p t ng ng v i b phân lo i này, n u a qua b phân lo i k ti p (n u có) Detector (B nh n d ng) Ch c n ng t ng t nh b nh n d ng nh ng có ph m vi h p h n, ch có nhi m v cho bi t m t m u có thu c v m t l p c th ó hay không Detector classifier ôi c dùng thay th cho nhau, detector có th c xem nh m t classifier cho l p “có” “không” Hit Rate (Detection Rate) Là t l nh n d ng úng object (các it ng c n nh n d ng) Ví d tốn nh n d ng m t ng i, Hit Rate = 0.95 có ngh a s 100 m u m t ng lo i ch nh n c 95 m u (5 m u l i False Positive (False Alarm) 60 i, b phân c b phân lo i cho background) Ph l c A: Các thu t ng liên quan Là t l nh n d ng sai background (các m u không ph i it ng c n nh n d ng) Ví d nh False Alarm = 0.01 có ngh a c 100 m u background có m u b b phân lo i l m t ng object Weak classifier Là classifier n gi n ch c n có xác 50% Strong classifier Là classifier có xác cao , c xây d ng t s k t h p weak classifier 61 Ph l c B: Các ch ng trình dùng cho hu n luy n Ph l c B: Các ch ng trình dùng cho hu n luy n T o sample Vi c t o samples c th c hi n b ng ch ng trình CreateSamples, m t ch ng trình i kèm th vi n Intel OpenCV có ch c n ng t o file d li u cho m u (positive l n negative) t file nh (bmp, jpg ), nh t m t hay nhi u nh ban dilate, erode lên nh Ch áp ng ng th i cho phép phát sinh thêm u b ng cách áp d ng phép x lý nh nh rotate, ng trình ã c chúng em s a c nhu c u xây d ng b nh n d ng c ch Các s a samples, thêm phép t nh ti n cho vi c phát sinh nh Ch i cho i bao g m cách t o ng trình sau ch nh s a có tên MyCreateSamples Ch ng trình có ch c n ng sau: Phát sinh hình t ng t t hay nhi u nh ban u Xác l p giá tr cho tham s sau: -info: t p tin ch a tên t p tin hình c n phát sinh -dir: tên th m c s ch a t p tin hình -w -h: kích th -num: s l c c a hình g c (m c ng hình s c phát sinh nh 24x24) c phát sinh t m i hình a vào (m c nh 10) T o d li u hu n luy n Xác l p giá tr cho tham s sau: -info: t p tin li t kê danh sách nh positive ( nh ch p c a c ch ã qua chu n hóa) -vec: t p tin d li u s phát sinh -nongen: ch dùng cho trình hu n luy n ng trình s ghi d li u c a nh vào th ng file vec -gen: v i m i nh file info, ch t ng trình s phát sinh num nh ng t , sau ó ghi d li u c a t t c nh vào file vec 62 Ph l c B: Các ch ng trình dùng cho hu n luy n -num: s nh s phát sinh cho t ng nh positive (ch s d ng kèm v i tham s -gen) -w -h: kích th c nh positive Ph kín nh n n b ng m t nh cho tr c Xác l p giá tr cho tham s sau: -info: t p tin nh s phát sinh -img: t p tin nh dùng ph -bg: t p tin ch a danh sách nh n n c n -w -h: kích th c ph c nh –img -ran: áp d ng phép bi n n n ( nh n n s i ng u nhiên lên nh tr c ph lên nh c ph b ng nhi u nh khác – nh ng nh c phát sinh t -img) -nonran: dùng nh –img ph kín t t c nh n n Ph kín nhi u nh n n b ng nhi u nh cho tr c Xác l p giá tr cho tham s sau: -info: t p tin li t kê danh sách nh dùng -bg: t p tin ch a danh sách nh n n c n -w -h: kích th ph c ph c nh –img -ran: áp d ng phép bi n n n ( nh n n s i ng u nhiên lên nh tr c ph lên nh c ph b ng nhi u nh khác – nh ng nh c phát sinh t nh -info) -nonran: dùng l n l t nh –info ph kín t t c nh n n Hu n luy n Haartraining ng d ng dùng xây d ng m t h nh n d ng theo mơ hình Cascade of Boosted Classifiers ây c ng m t ch ng trình mã ngu n m m t b ph n c a th vi n Intel OpenCV Ch ng trình c ng 63 c cung c p nh c chúng em s a Ph l c B: Các ch ng trình dùng cho hu n luy n i, s a c u trúc d li u bi u di n feature thêm vào ó feature s d ng toán nh n d ng c ch , ng th i thêm ch c n ng khác nh phát sinh file log, phát sinh file mô t feature c ch n, Ch ng trình sau s a i có tên Parsehaartraining Ch ng trình có nh ng tham s sau: -data: th m c s ch a c u trúc cascade -vec: t p tin d li u positive phát sinh b ng CreateSamples -bg: t p tin li t kê danh sách nh negative (các nh background nh c a c ch khác v i c ch c n nh n d ng) -subwnd: tên file log l t a feature tham s ch c n ng s không c ch n N u không xác l p c th c hi n -log: tên file log thông s c a trình hu n luy n N u khơng nh p vào ch ng trình s l y tên m c nh logxxx.txt b t u t 000 t ng d n file logxxx.txt ã t n t i -npos: s l ng positive samples dùng hu n luy n -nneg: s l ng negative samples dùng hu n luy n -nstages: s stage d ki n s train -nsplits: s feature s d ng m i weak classifier Bài toán nh n d ng c ch s d ng –nsplits -sym: dùng m u nh n d ng có tính ch t i x ng nh m gi m false alarm -minhitrate: t l nh n d ng úng t i thi u m u positve mà m i stage classifier ph i t minhitrate c a c c u trúc cascade s –nstages-minhitrate -maxfalsealarm: t l nh n dang sai t i a m u negative mà m i stage classifier c phép m c ph i maxfalsealarm c a c c u trúc cascade s –nstages-maxfalsealarm 64 Ph l c B: Các ch ng trình dùng cho hu n luy n -eqw -mode : lo i haar features s s d ng BASIC g m ki u feature không xoay, CORE bao g m c feature xoay, ALL bao g m thêm feature hình vu ng l ng (Xem 4.1.2 bi t thêm chi ti t) -w -h: kích th c c a m u positive -bt: thu t toán boost mu n s d ng: Discreate AdaBoost, Real AdaBoost, LogitBoost Gentle AdaBoost Bài toán nh n d ng c ch khóa lu n s d ng GAB Nh n d ng Chúng em t xây d ng ch ng trình Haardetecting (ph ng theo ch facedetect d a s h tr c a OpenCV) dùng s s d ng c u trúc cascade phát sinh dang m t m u a vào Ch ng trình ti n hành nh n d ng Ch ct ng trình có tham s ng d ng Haartraining ng trình nh n n gi n nh sau: -data: th m c ch a c u trúc cascade phát sinh t ng d ng Haartraining -img: nh c n nh n d ng -cam: webcam dùng ch p nh nh n d ng tr c n, không s d ng tham s n u nh n d ng nh t nh -w -h: kích th c m u positive ã ti n hành hu n luy n 65 Ph l c C: Các ch ng trình ti n ích Ph l c C: Các ch ng trình ti n ích có th ti n hành hu n luy n ịi h i nh ch p ph i hóa nh ch p n u th c hi n b ng tay hay b ng ch có s m t r t nhi u th i gian ch c chu n hóa Vi c chu n ng trình x lý h as n ng trình khơng sát v i nhu c u Do ó, chúng em ã xây d ng m t t p ng d ng h tr cho vi c chu n hóa H u h t ch ng trình u c vi t v i s h tr c a th vi n Open CV PathToTxt: v i input m t th m c, ch ng d n n t t c t p tin có th m c (các t p tin Output c a ch ng trình dùng cho ch ImageCropper: ch t ng trình s phát sinh m t t p tin ch a c p b t k ) ng trình MyCreateSamples ng trình giúp c t nhanh vùng nh (vùng ch a bàn tay) ng l u vào m t file m i v i tên v i nh mà x lý MakeGrayScaleImg: ch grayscale, ng trình giúp chuy n lúc nhi u hình v ng th i cho phép ch n có thay thành m t kích th MyDemHist: Dùng cc nh hay i kích th nh c nh hay không (thay i theo t l ) threshold, tô en vùng n n cho nh d a vào histogram 66 i Tài li u tham kh o Tài li u tham kh o [1] P Viola and M J Jones Robust real-time face detection International Journal of Computer Vision, 57(2):137 154, May 2004 [2] C Papageorgiou, M Oren, and T Poggio A general framework for Object Detection In International Conference on Computer Vision, 1998 [3] Paul Viola and Michael J Jones Rapid Object Detection using a Boosted Cascade of Simple Features IEEE CVPR, 2001 [4] Rainer Lienhart and Jochen Maydt An Extended Set of Haarlike Features for Rapid Object Detection IEEE ICIP 2002, Vol 1, pp 900-903, Sep 2002 [5] Y Freund and R Schapire A decision-theoretic generalization of on-line learning and an application to boosting Journal of Computer and System Sciences, 55(1):119– 139, 1997 [6] M Kolsch and M Turk Robust Hand Detection In Proc IEEE Intl Conference on Automatic Face and Gesture Recognition, May 2004 [7] M Kolsch and M Turk Analysis of Rotational Robustness of Hand Detection with a Viola-Jones Detector In Proc IEEE Intl Conference on Pattern Recognition, 2004 [8] Yoav Freund and Robert E Schapire Experiments with a new boosting algorithm In Machine Learning: Proceedings of the Thirteenth International Conference, pages 148–156, 1996 [9] Robert E Schapire and Yoram Singer Improved boosting algorithms using confidence-rated predictions Machine Learning, 37(3):297–336, December 1999 [10] Yoav Freund and Robert E Schapire A decision-theoretic generalization of online learning and an application to boosting Journal of Computer and System Sciences, 55(1):119–139, August 1997 [11] Rowley, H., Baluja, S., and Kanade, T 1998 Neural network-based face detection IEEE Patt Anal Mach Intell., 20:22–38 67 Tài li u tham kh o [12] Schneiderman, H and Kanade, T 2000 A statistical method for 3D object detection applied to faces and cars In InternationalConference on Computer Vision [13] Roth, D., Yang, M., and Ahuja, N 2000 A snowbased face detector In Neural Information Processing 12 [14] Eng-Jon Ong and Bowden, R A Boosted Classifier Tree for Hand Shape Detection In Proc IEEE Intl Conference on Automatic Face and Gesture Recognition, 2004 [15] William T Freeman, Michal Roth Orientation Histograms for Hand Gesture Recognition In Proc IEEE Intl Wkshp on Automatic Face and Gesture Recognition, Zurich, June, 1995 [16] R Bowden and M Sarhadi Building temporal models for gesture recognition In Proc BMVC., volume 1, pages 32–41, 2000 [17] X Zhu, J Yang, and A Waibel Segmenting Hands of Arbitrary Color In Proc IEEE Intl Conference on Automatic Face and Gesture Recognition, 2000 [18] Nolker, C Ritter, H.: Illumination Independent Recognition on Deictic Arm Postures, Proc 24th Annual Conf of the IEEE Industrial Electronics Society, Germany, pp 2006- 2011 (1998) [19] Duy-Dinh Le, Shin'ichi Satoh Feature Selection By AdaBoost For Efficient SVM-Based Face Detection, In Information Technology Letters, Vol.3, pp 183-186, Kyoto, Japan, Sep 2004 68 ... N – 0112454 TÌM HI U CÁC K THU T ÁP D NG CHO BÀI TOÁN NH N D NG KÝ HI U NG KHÓA LU N C NHÂN TIN H C GIÁO VIÊN H T.S D NG D N NG ANH C Th.S NGUY N TRI TU N NIÊN KHÓA 2001 - 2005 I CÂM L I NH N... ngày, t c máy tính ph i “hi u” c c ch c a ng cho toán nh n d ng phân lo i c ch Cho i ó v n t n th i i m hi n nay, dù ã có nhi u cách ti p c n khác cho toán này, nh ng d ng nh v n ch a có m t h... Hình 14 - Các m u positive cho b nh n d ng ch A 30 Hình 15 - Các m u negative (B, C, D) cho b nh n d ng ch A 30 Hình 16 - T p hu n luy n c a weak classifiers 31 Hình 17 - Các Haar

Ngày đăng: 29/07/2014, 13:21

Từ khóa liên quan

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan