1. Trang chủ
  2. » Giáo Dục - Đào Tạo

Nhận dҥng khuôn mặt sӱ dụng bag of words

52 6 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Nội dung

Đ I H C QU C GIA THÀNH PH H CHÍ MINH TR NGăĐ I H C KHOA H C T NHIÊN KHOA TOÁN ậ TIN H C H c ph n:ăSeminarăPh ơngăphápăToánătrongăTinăh c Mã h c ph n: TTH510 NH ND NGKHUÔNM TNGID M T PH N THÔNG TIN KHUÔN M GI NGăVIểNăH NG D N: PGS TS Ph m Th B o SINH VIÊN TH C HI N: Võ Hoàng Tr ng ậ 1311372 TP H CHÍ MINH, NGÀY 16 THÁNG 01 N ĔMă2017 ṂC ḶC DANH M C HÌNH L IM GI Đ U I THI UăĐ 1.1 Tổng Quan v 1.2 Yêu CuăĐ Tài CÁC CƠNG TRÌNH LIÊN QUAN 2.1 Nh n D ng Khn M t S 2.1.1 Tóm T 2.1.2 Chi Ti t Thu t Toán 2.1.3 K t Qu 2.1.4 uăvàăNh 2.1.5 2.2 Nh n Xét Thu t Toán Nh n D ng M t Ph n Khuôn M t Không C n Canh 2.2.1 Tóm T 2.2.2 Chi Ti t Thu t Toán 2.2.3 K t Qu 2.2.4 uăvàăNh 2.2.5 2.3 Nh n Xét Thu t Tốn Khoanh Vùng M t Ph n Khn M t S D ng Cá 2.3.1 Tóm T 2.3.2 Chi Ti t Thu t Toán 2.3.3 K t Qu 2.3.4 uăvàăNh 2.3.5 2.4 Nh n Xét Thu t Tốn Nh n D ng Khn M t S 2.4.1 Tóm T 2.4.2 Chi Ti t Thu t Toán 2.4.3 Th c Nghi m 2.4.4 uăvàăNh 2.4.5 2.5 Nh n Xét Thu t Tốn Nh n D ng Khn M t S 2.5.1 Tóm T 2.5.2 Chi Ti t Thu t Toán 2.5.3 Th c Nghi m 2.5.4 2.5.5 B H D LI 3.1 BD 3.2 BD 3.3 BD NG PHÁT TRI TÀI LI DANH ṂC HÌNH HH̀nhă1: nh ch p m t ph n khuôn m .t HH̀nhă2: V i m iăvĕnăb n,ătaăthuăđ c t khóaăđ cătr ngăt ơngăứng HH̀nhă3: V iăhH̀nhăcơăgái,ătaăcóăđ cătr ngălàămắt,ămũi,ămi ng, cằm, tóc .6 HH̀nhă4: V i m i v t th ,ătaăthuăđ căcácăđ cătr ngăt ơngăứng .7 HH̀nhă5: V i m i v t th , ta l yăđ cătr ngăt ơngăứng HH̀nhă6: Sơăđ thu t toán Kh i Bag of Word .8 HH̀nhă7: nh b d li u AR HH̀nhă8: K t qu th c nghi m b d li u AR .9 HH̀nhă9: Chia nh theoăl i vuông chia nh theo superpixel .9 HH̀nhă10: Vì d v nh m t ph n khuôn m t 10 HH̀nhă11: Mô t ýăt ng cho thu t tốn nhn d ng m t ph n khn m t 10 HH̀nhă12: Soăsánhăcáchăxácăđ nhăcácăđi m SIFT CanAff 11 HH̀nhă13: Chu năhóaăvùngăđi m mắt có d ng hình ellipse thành hình trịn 12 HH̀nhă14: Các thành ph n chủ y u phép Mô T GTP 12 HH̀nhă15: Ví d v nh khuôn mt dùng th c nghi m v i m t ph n m t 15 HH̀nhă16: Đ ng cong ROC nh n d ng khuôn m t v i m t ph n m t tùy ý 15 HH̀nhă17: nh b d li u AR 16 HH̀nhă18: Đ ng cong ROC nh n d ng nh di n b che, s d ng b d li u AR 16 HH̀nhă19: nh k t qu sau khoanh vùng 17 HH̀nhă20: Tóm t thu t tốn ủca nhóm tác gi [18] 18 HH̀nhă21: nh b d li u LFPW v iă35ăđi m m t .18 HH̀nhă22: Canh kh p m u v i nh input v iă2ăđi m 21 HH̀nhă23: nh th c nghi m v i b d li u LFPW 23 HH̀nhă24: Sai s trung bình k t qu xácăđ nhăđi m 23 HH̀nhă25: nh k t qu xácăđ nhăđi m b d li u LFPW v i m t s m l i 23 HH̀nhă26: nh k t qu t b d li u LFW v iă55ăđi m 23 HH̀nhă27: (a): nhăvào.ă(b)ăXácăđ nhăcácăđi m khn m t (c) T cácăđi m chính, chia thành ph n khn m t (d) T nh (a), l y superpixel, v i m i ph năđưăchiaăt (c), ch n superpixels nằm ph năđó 24 HH̀nhă28: Hình minh h a output kho ng cách s d ng FaceNet 25 HH̀nhă29: Tóm t quy trình nh n d ng khuôn m t s d ng FaceNet .25 HH̀nhă30: C u trúc mơ hình 26 HH̀nhă31: Ví d v b ba sai s .27 HH̀nhă32: B ba sai s 28 HH̀nhă33: nh vào sau hu n luy n,ăthuăđ c vector 128 chi u 29 HH̀nhă34: C u trúc m ngădoăZeilerăvàăFergusăđ xu t 30 HH̀nhă35: Module Inception d ng nguyên thủy ( nh trái) d ng gi m chi u ( nh ph i) 30 HH̀nhă36: FaceNet s d ng mơ hình Inception 31 HH̀nhă37: M t s c p nh nh n d ng sai b d li u LFW .31 HH̀nhă38: Quy trình canh chỉnh m t 33 HH̀nhă39: C u trúc hu n luy n DeepFace .34 HH̀nhă40: Ví d nh b d li u PIE g m: nh chân dung, nh sáng, nh c m xúc 37 HH̀nhă41: nh b d li u UMIST ch p t góc m t ph i sang m t di n 37 HH̀nhă42: nh b d li u CVL 38 Bài báo cáo trình bày v m t s d ng khn m t ng ph n: Gi i thi uăđ cũngănh khn m Các cơng trình liên quan: Trình bày thu tătốnăliênăq khn m vùng m t ph n khn m t s thu t tốn FaceNet nh n d ng khn m t s tốn bao g m ph n: a Tóm t ắt: Khái quát vthu t toán b Chi ti t thu t tốn: Phân tích chi ti t bên thut tốn c K t qu th li uăvàăđ uăvàănh d a ý ki n t báo quc t có trích d Nh n xét thu t tốn: Nhn xét b n thân v d e đ tài B PIE, UMIST CVL H vĕnăt d li u s ng phát trin ti pătheo:ăTrH̀nhăbàyă2ăh t nghi GI I THI 1.1 Tổng Quan v Nh n d ng khuôn m 30ănĕmătr khác Cácứng d ng liênăquanăđ n nh n d ng khuôn m hi n t nh, video d ví d nh khu n m nhăh ng không nh u này, h chi ti t nh trongăđóă4ăthu t tốn nh n d ng khuôn m m t, nh 1.2 Yêu Cu Đ l iăđây.ăBài tốn nh n d ng kh a n i dung, ầ Hi n ăh s d ng m t s kỹ thu hay s d ngăcácăph ng thu t tốn có th Tài T nh ch p m t ph n (hay m t góc) c ủ a khuôn m t, ta c năxácăđ nh xem m tăđóălàăcủa Yêu cu nh ph iăđ m b o th yăđ c nh t 50% di n tích khn m t nh t m t ph n chi ti t mắt,ămũi,ămi ng (xem HH̀nhă1) HH̀nh nh ch p m t ph n khuôn m t, ta c năxácăđ nh m tăđóălàăai CÁC CƠNG TRÌNH LIÊN QUAN 2.1 Nhận D ng Khuôn M ặt S Dụng Bag-of-Words 2.1.1 Tóm T Nhóm tác gi [1] đ xu t m t thu t toán kh iăBagăofăWordăđ nh n d ng khuôn m t cách chia khuôn m t thành nhi u kh iăđ cătr ngăSIFT,ăt đóătínhătốnăvàăl ng t hóa vector thành codeword khác Cui cùng, m i kh i ta tính t n s phân ph i m i codeword,ăsauăđóăn i dài t n s t kh iăđ bi u di n khuôn m t 2.1.2 Chi Ti t Thuật Tốn 2.1.2.1 Bag of Word MơăhH̀nhăBagăofăWordăđ c s d ngăđ u tiên vào tốnăphânătíchăvĕnăb n,ăsauăđóăápăd ng vào th giác máy tính [2].ăTrongăbàiătốnăphânătíchăvĕnăb n, Bag of Word s phânătíchăvĕnăb n đ thuăđ căcácă“t khóa”,ăhayăcodebook,ăt p h p codebook s b vào m tăcáiă“túi”ă(bag)ă ta xem túi chứaăđ ng t khóaăđ cătr ngăchoăvĕnăb năđó.ă HH̀nh V vào m i m iăvĕnăb t túi Ví d nh V i nhi uăvĕnăb n, t p h m tc mt khóa, v n u túi codebook có s v iăvĕnăb n củaătúiăcodebookăđó,ăvíăd nh ăHH̀nhă2, v i c m t có th tH̀măraăvĕnăb năt ơngăứng [3] Áp d ngăýăt ng Bag of Word vào th ta mu n máy tính có th t t ng Bag of Word,ătaătH̀măraăcácă“codebook”ătrongăm i v t th ,ăsauăđóăchoăvàoăcáiătúiăđ c tr ngăcủa v t th , ví d nh ăHH̀nhă3 HH̀nhă4 HH̀nh V i hình gáiăbênătrái,ătaăcóăđ cătr ngălàămắt,ămũi,ămi ng, cằm,ătócă ăsauăđóăchoăvàoăm tăcáiătúiăđ tr ngănh ăhH̀nhăbênăph i c HH̀nh V i m i v t th nh ăkhuônăm tă(trái),ăxeăđ p (gi a),ăđànăviolină(ph i),ătaăthuăđ căcácăđ cătr ngăt ơngă ứng Khi nh n d ng m t v t th ,ămáyătínhăxácăđ nhăcácăđ cătr ngăcủa v t th , ta tính t n s xu t hi n t ngăđ cătr ng v i codebook t n codeword, túi codebook có s l n xu t hi n nhi u nh t, ta s xácăđ nhăđ c v t th đóălàăgH̀ă(xem HH̀nhă5) HH̀nh V i m i v t th hình trên, ta l yăđ cătr ngăt ơngăứng,ăsauăđóăđ i chi u v i t n (hH̀nhăd i), t đóăxácăđ nhăđ codeword c v t th đóălàăgH̀ 2.1.2.2 Áp D ụng Khối Bag of Word vào Nh ận D ng Khn M ặt Nhóm tác gi [2] đánhăgiáărằng nh khuôn m t đ u m t lo i v t th , n u ta trính xu tăđ cătr ngăkhnăm t cách thành t p phn nh thH̀ăđi uănàyăkhôngăđ m b m rõ thơng tin c khn m t.ăDoăđó,ănhómăđ xu t thu tătốnărútătríchăđ cătr ngăkhnăm t nh HH̀nhă6 Ta chia Interest) V đ c vector SIFT 128 chi u, t luy n, s d ng thu t toán -means chuy năđổi vector SIFT m tăROI,ătaăphânăvùngăcácăđ i m iăROI,ătaătínhăđ × cătr đo codeword tâm c c m M t codebook bao g m li u hu n luy n, taăđ n dùng bi uăđ vector bi u di n i ng d b ngăcodebookăđưăhu c ki m tra,ătaăcũngăchiaă nh phân lo 2.1.3 K t Qu Nhóm tác gi [2] s nhăvàoăđ c nét xu ngăkíchăth 119ăđ iăt ng, hu n luy n b (43) = ng c chu n [29] [30] AdaGrad [31] Khi th c nghi m, nhóm ch , hu n luy n qua m t c m CPU 1000 gi đ n (tứcăđ chínhăxácătĕngăd n) sau 500 gi hu n luy n Sau hu n luy n m tr hơnăkho ng cách v i nh củaăng i khác HH̀nh 33 Nhóm tác gi s 34) Nhóm tác gi tri u tham s c HH̀nh 34 C u trúc m ngădoăZeilerăvàăFergusăđ out) có d ng , (d ki n trúc l i t Inception nhằm quan sát cách phb n có s đ aăph HH̀nhă35 Mơ hình có kho Chi ti t mơ hình xem t i HH̀nhă36 ơngă HH̀nh 35 Module Inception d ng nguyên thủy ( nh trái) d ng gi m chi u ( nh ph i) 30 LHH̀nh 36 FaceNet s d ngămơăhH̀nhăInceptionăt ơngăt v i [27] ×ăHaiăđi m khác bi tăchinhăđóălàăFaceNetăs d ng pooling thay max pooling Kíchăth c polling ln ln tính song song v i module tích ch p m i module Inception 2.4.3 Thực Nghi m Nhóm tác gi đánhăgiáătrênăb d Nh n d ng khuôn m t, ki m tra khuôn m t phân c cáo nói v m t s khn m m t,ănhómăthayăđổiăkíchăth d ng FaceNet Khi hu n luy n, nhóm tt V ta s d ng phân lo i k-NN Nhóm đánhăgiáătrênăb t 5749ă ng %± %t ± có ca nh ch ỉnh m t HH̀ nhă 37 m HH̀nh 37 M t s c p nh nh n d ng sai b d li u LFW Trong b d li u Youtube Face bao g m 3425 video v iă1595ăng i,ătrongă100ăframeăđ u tiên m i video, nhóm tác gi xácăđ nh khn m t, tính trungăbH̀nhăt ơngăđ ơngăchoăt t c c p 31 khn m xác 2.4.4 2.4.4.1 Tínhăđ n th khn m iă in tăd 2.4.4.2 Nh ợc Đi m FaceNet hu n l l n g p l n so v hi n phòng thi t b , h c thu tădoăđòiăh i ki n trúc máy ln [34] 2.4.5 Nhận Xét Thuật Toán Thu t toán FaceNet s d ng b ba sai s vàoăđ tài Tuy nhiên, v năđ FaceNet.ăDoăđó,ăthayăvH̀ăhu n luy n tồn b khn m t, ta có th khn m t d aătrênăýăt 2.5 Nhận DeepFace 2.5.1 Tóm T Nhóm tác gi đ xu t m t thu t tốn có tên DeepFace, s d ng ngu n Facebook làm b khuôn m t  Canh chỉnh khuôn m t  Bi u di n khuôn m tác gi bi u di n khuôn m bi u di n khuôn m t t hơnă120ăngànăthamăs Nhóm tác gi phát tri n m t c u trúc DNN hi u qu t n d ng đ bi u di n khuôn m tác gi trình bày cách canh chỉnh m t d a mơ hình 3D khn m 2.5.2 Chi Ti t Thuật Tốn 2.5.2.1 Canh Chỉnh Khn M ặt G năđâyăcóănhi u cơng th ức có th nàyăth ng phân tích mơ hình 3D c khn m t ho c tì t tpd li u ngồi ho m nh M c dù thu t toán canhchỉnhănàyăđ c s d ng r ngărưiănh pháp phù h p áp d ng cho m t t nhiên, mơ hình 3D khn m t g năđâyăkhơngănhi u ng i s d ng t i, nh tălàătrongămôiătr ng t nhiên Tuy nhiên, khuôn mt mô hình 3D nên nhóm tác gi quy tăđ nhăđiătheoăconăđ ng 32 Gi ngănh ăcácăthu tătốnătr c dó, nhóm tác gi xácăđ nhăcácăđi m cơăb n khn m tăđ canh chỉnh, l p nhi u l năđ làm m n k t qu output V i m i l n l p, s VectorăRegressoră(SVR)ăđưăquaăhu n luy năđ d m khn m t t c a sổ mô t mt d a bi uăđ LBP d ng Support đốnăđi HH̀nh 38 Quy trình canh chỉnh m t.ă(a)ăXácăđ nh khn m t nh (b) v biên nhằmătránhăđiătínhăkhơngăliênăt Các tam giác khp theo camera 30-2D, tam giác t i khó th dùngăđ chỉnhăh Canh chỉnh 2D Ta bắtăđ khuôn m t, canh gi [ | tỉ ]∗ l , xoay chuy s thayăđổi quan tr T p h p phép binăđổi t Canh chỉnh 3D Ta s 2D canh chỉnh vào m canh chỉnh (HH̀nhă38 (c)) s HH̀nhă38 (g) Trong mơ hình chung 3D, ta ch ỉ c n l y trung bình m u scan 3D t = , USF Human- ID [36], b d chỉnh t h i thi u tổng quát ủca h n tính ma tr =( × v − i ma tr n quy chi uăchoăđi cóăkíchăth c thànhăbàiătoánăbH̀nhăph nhi u nhi u ph iă dùng ma tr n hi păph hi păph ơngăsaiăt cácăđi TIEU LUAN MOI download : skknchat123@gmail.com doăđóă mang tính x p xỉ.ăĐ nhóm tác gi thêm ph hi u Cu ( nh ngu n)ăđ ̃ chínhăđ đ nhăh nh tr n v i nh b năsaoăđ 2.5.2.2 Bi u Di n 2.5.2.2.1 C u Trúc DNN Hu n Luy n HH̀nh 39 C u trúc hu n luy n DeepFace, t nh vào, l y khuôn m t,ăsauăđóăchỉnh di n d a vào mơ hình 3D (Frontalization), ti p theo l p l c Tích ch p (C1) ậ Pooling (M2) ậ Tích ch pă(C3),ăsauăđóălàă3ăl p Liên thơngăĐ aăph ơngă(L4ăậ L6) l păLiênăthơngăĐ yăđủ (F7 ậ F8) M ngăcóăhơnă120ăngànăthamăs v i 95% t p trung LiênăthôngăĐ aăph ơngăvàăLiênăthôngăĐ yăđủ C u trúc hu n luy n kíchăth c HH̀nhă ( 39 ký hi × vào × l p max pooling (M2) l y nh tr × × ngăv iăb th c ăcácăc nh hay k t c u nh, l nênărõăràngăhơnăchoăchuy năđổiăđ aăph ơng.ăKhiăápăd giúp cho m ng đủ chắnăđ nhi u mức pooling s n m ng b nh ng ph n c ch păđ u tiên l păđ u tiên có r t tham s , lp ch ỉ đơnăthu n m t păcácăđ cătr l tr Các l păsauăđóă(L4,ăL5ăvàăL6)ălàăl păLiênăthơngăĐ aăph pănàyăcũngăápăd ngăkhácănhau.ăDoăm × c s iălàă2.ăSauăđó,ătaăđ M ngăđ aăp khơngăđ m b o gi lông mày xu l păđ aăph h ngăđ thôngăĐ aăph h ng t ns kh t hi n kh ơngăkh ng th l ơng,ăng i input Ví d , output củ m i liên h th ng kê gi a hai kh i l 34 Cu i cùng, hai l p F7 F8 l n iv ittc khn m t, ví d output l m t Xét v m t bi u di n, vector khác v i bi u di n d thôngăĐ yăđủ cu nhãn l p Ta ký hi păLiênăthôngăĐ yăđ ủ M c tiêu ca trình hu n luy n nh m t iăđaăxácăsu ℎ cách ti thi u hàm sai s nh vào hàm sai s Ta t i thi u hàm sai s max , Tr t D c Ng u Nhiên (Stochastic Gradient Descentậ SGD) S Cho nh , ta tính bi u di n neuron truy n ti n v i thành v ={ ,…, i tham s 2.5.2.2.2 Chuẩn Hóa B nh y sáng: Chia m i ph n t c cu i cùng, ta chu năhóaăđ cătr hu n luy n, th c hi năđi u b ằng chu n hóa trongăđó giátr 2.5.2.3 Metric dùng đ Nhóm tác gi h c metric khơng giám sát nhằmăxácăđ nh mứcăđ m t cách ly tích củaă2ăvectorăđ cătr v i metric có giám sát kho ng cách 35 TIEU LUAN MOI download : skknchat123@gmail.com 2.5.2.3.1 Kho ng Cách có Tr ọng Số Vectorăđ đ nh tác gi s d ng kho ng cách v i d ng vào vector v i phn t că ăLBPăn 2.5.2.3.2 M ng Siamese Nhóm tác gi đ ng th i ki mătraătrênămetricăđ h c, l p l i m ng nh n d ng khuôn m input)ăvàăđ Ta th căt c hi năđ a) L y sai s tăđ i củaă2ăđ cătr ng, b) L păLiênăthôngăĐ yăđủ ánh xvàoăđơnăv logisticăđơnă(gi ng/không gi ng) Đ ngĕnăch n hi năt ng overfitting nh n d ng, ta hu n luy n l p Khong ủca m ng Siamese trongăđóă s tham s cross entropy tiêu chu n lan truy 2.5.3 Thực Nghi m Nhóm tác gi th c nghi m s B d li u LFW: G m 1332 B d li u YouTubeFace: g c nghi m LFW, s d ng metric không giám sát nhằm so sánh tr c Th c a c păvectorăđ cătr ủ h c nhân SVM dùng kho Th c nghi m YouTubeFace cách biu di n DeepFace 50 c p frame, m i ph n t s mơ hình t video dùng giá tr trung bình tr qu Cho c p ki m tra, nhóm đ xác trung bình 2.5.4 u Nh ợc Đi m Thuật Toán 2.5.4.1 u Đi m Đ n th iăđi m hi n t i, DeepFace m t nh ng thu t tốn nhn d ng khn m tăcóăđ xác thu c d ngă“topăperforming” 36 2.5.4.2 Nh ợc Đi m DeepFace hu n luy n v kíchăth cl năhơnăcácăb b d li u, ta có th 2.5.5 Nhận Xét Thuật Tốn DeepFaceăđưăđ giúp canh chỉnh khn m m t, t góc m t tùy ý, ta có th B D 3.1 B D B d li u PIE Vi năRobotics,ătr g m 41368 hình củaă68ăng nh c m xúc (xem HH̀nhă40) [39] HH̀nh 40 Ví d nh b d li u PIE g m: nh chân dung, nh sáng, nh c m xúc 3.2 B D g m B d m li u UMIST t tr ngăĐ i h c Sheffield nh (xem HH̀n h 41) [40] nh có góc ch HH̀nh 41 nh b d li u UMIST ch p t góc m t ph i sang m t di n 37 3.3 B D Li u CVL B d li u CVL t Phịng Thí nghi m Th giácăMáyătính,ătr ngăĐ i h c Ljubljana, Slovenia g mă114ăng i, m iăng i có nh ch× p t góc m t bên phi sang m t bên trái nh c mxúckhuônmtviăđphângiiđimnh(xemHH̀nhă42) HH̀nh 42 H nh b d NG PHÁT Sau tìm hi u báo chính, ta t măcóă2ăh H ng phát trin S superpixel, xácđ nhăđi m t m i ph n m t,ădùngăđ cătr ph n m tăđóă(víăd nh ăLBP), thi t l p m t M t ki m tra ta th c hi năt ph n m tăt ơngăứng b d nhi u nh t, ta s ph n ki mătraăt H ng phát trin S m t, nhiên ta s thayăđổi c u trúc l căkhácănh ăContourletă 38 TÀI LI U THAM KH O [1] Z Li, J.-i Imai and M Kaneko, "Robust face recognition using block-based bag of words.," Pattern Recognition (ICPR), 2010 20th International Conference on IEEE, pp 1285-1288, 2010 [2] C.-F Tsai, "Bag-of-words representation in image annotation: A review.," ISRN Artificial Intelligence 2012, 2012 [3] L Fei-Fei, "Stanford University, Computer Vision Lab," 2012 [Online] Available: http://vision.stanford.edu/teaching/cs231a_autumn1112/lecture/lecture14_intro_objrec og_bow_cs231a.pdf [4] L Fei-Fei and P Perona, "A bayesian hierarchical model for learning natural scene categories.," 2005 IEEE Computer Society Conference on Computer Vision and Pattern Recognition (CVPR'05), vol Vol 2, pp 524-531, 2005 [5] A Martinez and R Benavente, "The AR Face Database," CVC Technical Report #24, June 1998 [6] S Liao, A K Jain and S Z Li, "Partial face recognition: Alignment-free approach," IEEE Transactions on Pattern Analysis and Machine Intelligence 35.5 , pp 11931205, 2013 [7] R Achanta, A Shaji, K Smith, A Lucchi, P Fua and S Süsstrunk, "SLIC superpixels compared to state-of-the-art superpixel methods," IEEE transactions on pattern analysis and machine intelligence, vol 34.11, pp 2274-2282, 2012 [8] J Y Wright, G A Y., S S S A and Y Ma, "Robust face recognition via sparse representation," IEEE transactions on pattern analysis and machine intelligence, vol 31(2), pp 210-227, 2009 [9] D G Lowe, "Distinctive image features from scale-invariant keypoints," International journal of computer vision, vol 60.2, pp 91-110, 2004 [10] J Canny, "A computational approach to edge detection," IEEE Transactions on pattern analysis and machine intelligence, vol 6, pp 679-698, 1986 [11] K Mikolajczyk, A Zisserman and C Schmid, "Shape recognition with edge-based features," British Machine Vision Conference (BMVC'03), vol Vol 2, pp 779-788, 2003 [12] K Mikolajczyk and C Schmid, "Scale & affine invariant interest point detectors," International journal of computer vision, vol 60(1), pp 63-86, 2004 [13] T Lindeberg, "Feature detection with automatic scale selection," International journal of computer vision, vol 30.2, pp 79-116, 1998 39 [14] X Tan and B Triggs, "Enhanced local texture feature sets for face recognition under difficult lighting conditions," IEEE transactions on image processing, vol 19.6, pp 1635-1650, 2010 [15] D L Donoho and Y Tsaig, "Fast solution of-norm minimization problems when the solution may be sparse," IEEE Transactions on Information Theory, vol 54.11, pp 4789-4812, 2008 [16] C Ding and D Tao, "A comprehensive survey on pose-invariant face recognition," ACM Transactions on Intelligent Systems and Technology (TIST), vol 7.3, p 37, 2016 [17] R Weng, J Lu, J Hu, G Yang and Y P Tan, "Robust feature set matching for partial face recognition," Proceedings of the IEEE International Conference on Computer Vision , pp 601-608, 2013 [18] P N Belhumeur, D W Jacobs, D J Kriegman and N Kumar, "Localizing parts of faces using a consensus of exemplars," IEEE transactions on pattern analysis and machine intelligence, vol 35(12), pp 2930-2940, 2013 [19] Reinders, M JT, R W C Koch and J J Gerbrands, "Locating facial features in image sequences using neural networks," Automatic Face and Gesture Recognition, Proceedings of the Second International Conference on IEEE, pp 230-235, 1996 [20] P Campadelli, G Lipori and R Lanzarotti, Automatic facial feature extraction for face recognition, INTECH Open Access Publisher, 2007 [21] X Cao, Y Wei, F Wen and J Sun, "Face alignment by explicit shape regression," International Journal of Computer Vision , vol 107.2, pp 177-190, 2014 [22] M Dantone, J Gall, G Fanelli and L Van Gool, "Real-time facial feature detection using conditional regression forests," Computer Vision and Pattern Recognition (CVPR), pp 2578-2585, June, 2012 [23] F Schroff, D Kalenichenko and J Philbin, "Facenet: A unified embedding for face recognition and clustering," Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, pp 815-823, 2015 [24] B Amos, "OpenFace," [Online] Available: https://cmusatyalab.github.io/openface/ [25] K Q Weinberger and L K Saul, "Distance metric learning for large margin nearest neighbor classification," Journal of Machine Learning Research, vol 10, pp 207-244, 2009 [26] M D Zeiler and R Fergus, "Visualizing and understanding convolutional networks," European Conference on Computer Vision, Springer International Publishing, pp 818-833, 2014 [27] C Szegedy and e al, "Going deeper with convolutions," 2015 IEEE Conference on Computer Vision and Pattern Recognition (CVPR), pp 1-9, 2015 40 [28] D R Wilson and T R Martinez, "The general inefficiency of batch training for gradient descent learning," Neural Networks, vol 16.10, pp 1429-1451, 2003 [29] Y LeCun, B Boser, J S Denker, D Henderson, R E Howard, W Hubbard and L D Jackel, "Backpropagation applied to handwritten zip code recognition," Neural computation, vol (4), pp 541-551, 1989 [30] D E Rumelhart, G E Hinton and R J Williams, "Learning representations by backpropagating errors," Cognitive modeling, vol 5(3), 1988 [31] J Duchi, E Hazan and Y Singer, "Adaptive subgradient methods for online learning and stochastic optimization," Journal of Machine Learning Research, vol 12, pp 2121-2159, 2011 [32] A Geitgey, "medium.com," A Medium Corporation, [Online] Available: https://medium.com/@ageitgey/machine-learning-is-fun-part-4-modern-facerecognition-with-deep-learning-c3cffc121d78#.iyo9udyws [Accessed 24 July 2016] [33] I J Goodfellow, D Warde-Farley, M Mirza, A C Courville and Y & Bengio, "Maxout networks," ICML , vol 3, pp 1319-1327, 2013 [34] O M Parkhi, A Vedaldi and A Zisserman, "Deep face recognition," British Machine Vision Conference, vol 1, no 3, 2015 [35] Y Taigman, M Yang, Ranzato, M A and L Wolf, "Deepface: Closing the gap to human-level performance in face verification," Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, pp 1701-1708, 2014 [36] S Sarkar, "USF Human ID 3-D Database," [Online] Available: http://www.cse.usf.edu/~sarkar/SudeepSarkar/3D_Face_Data.html [37] S Chopra, R Hadsell and Y LeCun, "Learning a similarity metric discriminatively, with application to face verification," 2005 IEEE Computer Society Conference on Computer Vision and Pattern Recognition (CVPR'05), vol 1, pp 539-546, 2005 [38] B Amos, B Ludwiczuk and M Satyanarayanan, "OpenFace: A general-purpose face recognition library with mobile applications," CMU School of Computer Science, 2016 [39] T Sim, S Baker and M Bsat, "The CMU pose, illumination, and expression (PIE) database.," Automatic Face and Gesture Recognition, 2002 Proceedings, vol Fifth IEEE International Conference, pp 46-51, 2002 [40] I E Laboratory, the University of Sheffield, [Online] Available: https://www.sheffield.ac.uk/eee/research/iel/research/face 41 ... khuôn m t nh t m t ph n chi ti t mắt,ămũi,ămi ng (xem HH̀nhă1) HH̀nh nh ch p m t ph n khuôn m t, ta c năxácăđ nh m tăđóălàăai CÁC CƠNG TRÌNH LIÊN QUAN 2.1 Nhận D ng Khuôn M ặt S Dụng Bag- of- Words. .. recognition using block-based bag of words. ," Pattern Recognition (ICPR), 2010 20th International Conference on IEEE, pp 1285-1288, 2010 [2] C.-F Tsai, "Bag- of- words representation in image annotation:... c n hu n luy n b AR01) 2.1.4.2 Khuy t Đi m Bi u di n Bag of Word ch ỉ hi u qu bi uăđ ph n Vì lý nên Bag of Word không hi bi u di n nh 2.1.5 Nhận Xét Thuật Tốn T ýăt tứcănhómăcácăđi m nh có m ức

Ngày đăng: 17/08/2022, 16:48

w