1. Trang chủ
  2. » Giáo Dục - Đào Tạo

(TIỂU LUẬN) nhận dҥng khuôn mặt sӱ dụng bag of words

53 2 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 53
Dung lượng 1,56 MB

Nội dung

Đ I H C QU C GIA THÀNH PH H CHÍ MINH TR NGăĐ I H C KHOA H C T NHIÊN KHOA TOÁN ậ TIN H C H c ph n:ăSeminarăPh ơngăphápăToánătrongăTinăh c Mã h c ph n: TTH510 NH ND NGKHUÔNM TNGID M T PH N THÔNG TIN KHUÔN M GI NGăVIểNăH NG D N: PGS TS Ph m Th B o SINH VIÊN TH C HI N: Võ Hoàng Tr ng ậ 1311372 TP H CHÍ MINH, NGÀY 16 THÁNG 01 N ĔMă2017 ṂC ḶC DANH M C HÌNH L IM GI Đ U I THI UăĐ 1.1 Tổng Quan v 1.2 Yêu CuăĐ Tài CÁC CƠNG TRÌNH LIÊN QUAN 2.1 Nh n D ng Khn M t S 2.1.1 Tóm T 2.1.2 Chi Ti t Thu t Toán 2.1.3 K t Qu 2.1.4 uăvàăNh 2.1.5 2.2 Nh n Xét Thu t Toán Nh n D ng M t Ph n Khuôn M t Không C n Canh 2.2.1 Tóm T 2.2.2 Chi Ti t Thu t Toán 2.2.3 K t Qu 2.2.4 uăvàăNh 2.2.5 2.3 Nh n Xét Thu t Tốn Khoanh Vùng M t Ph n Khn M t S D ng Cá 2.3.1 Tóm T 2.3.2 Chi Ti t Thu t Toán 2.3.3 K t Qu 2.3.4 uăvàăNh 2.3.5 2.4 Nh n Xét Thu t Tốn Nh n D ng Khn M t S 2.4.1 Tóm T 2.4.2 Chi Ti t Thu t Toán 2.4.3 Th c Nghi m 2.4.4 uăvàăNh 2.4.5 2.5 Nh n Xét Thu t Tốn Nh n D ng Khn M t S 2.5.1 Tóm T 2.5.2 Chi Ti t Thu t Toán 2.5.3 Th c Nghi m 2.5.4 2.5.5 B H D LI 3.1 BD 3.2 BD 3.3 BD NG PHÁT TRI TÀI LI DANH ṂC HÌNH HH̀nhă1: nh ch p m t ph n khuôn m .t HH̀nhă2: V i m iăvĕnăb n,ătaăthuăđ c t khóaăđ cătr ngăt ơngăứng HH̀nhă3: V iăhH̀nhăcơăgái,ătaăcóăđ cătr ngălàămắt,ămũi,ămi ng, cằm, tóc .6 HH̀nhă4: V i m i v t th ,ătaăthuăđ căcácăđ cătr ngăt ơngăứng .7 HH̀nhă5: V i m i v t th , ta l yăđ cătr ngăt ơngăứng HH̀nhă6: Sơăđ thu t toán Kh i Bag of Word .8 HH̀nhă7: nh b d li u AR HH̀nhă8: K t qu th c nghi m b d li u AR .9 HH̀nhă9: Chia nh theoăl i vuông chia nh theo superpixel .9 HH̀nhă10: Vì d v nh m t ph n khuôn m t 10 HH̀nhă11: Mô t ýăt ng cho thu t tốn nhn d ng m t ph n khn m t 10 HH̀nhă12: Soăsánhăcáchăxácăđ nhăcácăđi m SIFT CanAff 11 HH̀nhă13: Chu năhóaăvùngăđi m mắt có d ng hình ellipse thành hình trịn 12 HH̀nhă14: Các thành ph n chủ y u phép Mô T GTP 12 HH̀nhă15: Ví d v nh khuôn mt dùng th c nghi m v i m t ph n m t 15 HH̀nhă16: Đ ng cong ROC nh n d ng khuôn m t v i m t ph n m t tùy ý 15 HH̀nhă17: nh b d li u AR 16 HH̀nhă18: Đ ng cong ROC nh n d ng nh di n b che, s d ng b d li u AR 16 HH̀nhă19: nh k t qu sau khoanh vùng 17 HH̀nhă20: Tóm t thu t tốn ủca nhóm tác gi [18] 18 HH̀nhă21: nh b d li u LFPW v iă35ăđi m m t .18 HH̀nhă22: Canh kh p m u v i nh input v iă2ăđi m 21 HH̀nhă23: nh th c nghi m v i b d li u LFPW 23 HH̀nhă24: Sai s trung bình k t qu xácăđ nhăđi m 23 HH̀nhă25: nh k t qu xácăđ nhăđi m b d li u LFPW v i m t s m l i 23 HH̀nhă26: nh k t qu t b d li u LFW v iă55ăđi m 23 HH̀nhă27: (a): nhăvào.ă(b)ăXácăđ nhăcácăđi m khn m t (c) T cácăđi m chính, chia thành ph n khn m t (d) T nh (a), l y superpixel, v i m i ph năđưăchiaăt (c), ch n superpixels nằm ph năđó 24 HH̀nhă28: Hình minh h a output kho ng cách s d ng FaceNet 25 HH̀nhă29: Tóm t quy trình nh n d ng khuôn m t s d ng FaceNet .25 HH̀nhă30: C u trúc mơ hình 26 HH̀nhă31: Ví d v b ba sai s .27 HH̀nhă32: B ba sai s 28 HH̀nhă33: nh vào sau hu n luy n,ăthuăđ c vector 128 chi u 29 HH̀nhă34: C u trúc m ngădoăZeilerăvàăFergusăđ xu t 30 HH̀nhă35: Module Inception d ng nguyên thủy ( nh trái) d ng gi m chi u ( nh ph i) 30 HH̀nhă36: FaceNet s d ng mơ hình Inception 31 HH̀nhă37: M t s c p nh nh n d ng sai b d li u LFW .31 HH̀nhă38: Quy trình canh chỉnh m t 33 HH̀nhă39: C u trúc hu n luy n DeepFace .34 HH̀nhă40: Ví d nh b d li u PIE g m: nh chân dung, nh sáng, nh c m xúc 37 HH̀nhă41: nh b d li u UMIST ch p t góc m t ph i sang m t di n 37 HH̀nhă42: nh b d li u CVL 38 Bài báo cáo trình bày v m t s d ng khn m t ng ph n: Gi i thi uăđ cũngănh khn m Các cơng trình liên quan: Trình bày thu tătốnăliênăq khn m vùng m t ph n khn m t s thu t tốn FaceNet nh n d ng khn m t s tốn bao g m ph n: a Tóm t ắt: Khái quát vthu t toán b Chi ti t thu t tốn: Phân tích chi ti t bên thut tốn c K t qu th li uăvàăđ uăvàănh d a ý ki n t báo quc t có trích d Nh n xét thu t tốn: Nhn xét b n thân v d e đ tài B PIE, UMIST CVL H vĕnăt d li u s ng phát trin ti pătheo:ăTrH̀nhăbàyă2ăh t nghi GI I THI 1.1 Tổng Quan v Nh n d ng khuôn m 30ănĕmătr khác Cácứng d ng liênăquanăđ n nh n d ng khuôn m hi n t nh, video d ví d nh khu n m nhăh ng không nh u này, h chi ti t nh trongăđóă4ăthu t tốn nh n d ng khuôn m m t, nh 1.2 Yêu Cu Đ l iăđây.ăBài tốn nh n d ng kh a n i dung, ầ Hi n ăh s d ng m t s kỹ thu hay s d ngăcácăph ng thu t tốn có th Tài T nh ch p m t ph n (hay m t góc) c ủ a khuôn m t, ta c năxácăđ nh xem m tăđóălàăcủa Yêu cu nh ph iăđ m b o th yăđ c nh t 50% di n tích khn m t nh t m t ph n chi ti t mắt,ămũi,ămi ng (xem HH̀nhă1) HH̀nh nh ch p m t ph n khuôn m t, ta c năxácăđ nh m tăđóălàăai CÁC CƠNG TRÌNH LIÊN QUAN 2.1 Nhận D ng Khuôn M ặt S Dụng Bag-of-Words 2.1.1 Tóm T Nhóm tác gi [1] đ xu t m t thu t toán kh iăBagăofăWordăđ nh n d ng khuôn m t cách chia khuôn m t thành nhi u kh iăđ cătr ngăSIFT,ăt đóătínhătốnăvàăl ng t hóa vector thành codeword khác Cui cùng, m i kh i ta tính t n s phân ph i m i codeword,ăsauăđóăn i dài t n s t kh iăđ bi u di n khuôn m t 2.1.2 Chi Ti t Thuật Tốn 2.1.2.1 Bag of Word MơăhH̀nhăBagăofăWordăđ c s d ngăđ u tiên vào tốnăphânătíchăvĕnăb n,ăsauăđóăápăd ng vào th giác máy tính [2].ăTrongăbàiătốnăphânătíchăvĕnăb n, Bag of Word s phânătíchăvĕnăb n đ thuăđ căcácă“t khóa”,ăhayăcodebook,ăt p h p codebook s b vào m tăcáiă“túi”ă(bag)ă ta xem túi chứaăđ ng t khóaăđ cătr ngăchoăvĕnăb năđó.ă HH̀nh V vào m i m iăvĕnăb t túi Ví d nh V i nhi uăvĕnăb n, t p h m tc mt khóa, v n u túi codebook có s v iăvĕnăb n củaătúiăcodebookăđó,ăvíăd nh ăHH̀nhă2, v i c m t có th tH̀măraăvĕnăb năt ơngăứng [3] Áp d ngăýăt ng Bag of Word vào th ta mu n máy tính có th t t ng Bag of Word,ătaătH̀măraăcácă“codebook”ătrongăm i v t th ,ăsauăđóăchoăvàoăcáiătúiăđ c tr ngăcủa v t th , ví d nh ăHH̀nhă3 HH̀nhă4 HH̀nh V i hình gáiăbênătrái,ătaăcóăđ cătr ngălàămắt,ămũi,ămi ng, cằm,ătócă ăsauăđóăchoăvàoăm tăcáiătúiăđ tr ngănh ăhH̀nhăbênăph i c HH̀nh V i m i v t th nh ăkhuônăm tă(trái),ăxeăđ p (gi a),ăđànăviolină(ph i),ătaăthuăđ căcácăđ cătr ngăt ơngă ứng Khi nh n d ng m t v t th ,ămáyătínhăxácăđ nhăcácăđ cătr ngăcủa v t th , ta tính t n s xu t hi n t ngăđ cătr ng v i codebook t n codeword, túi codebook có s l n xu t hi n nhi u nh t, ta s xácăđ nhăđ c v t th đóălàăgH̀ă(xem HH̀nhă5) HH̀nh V i m i v t th hình trên, ta l yăđ cătr ngăt ơngăứng,ăsauăđóăđ i chi u v i t n (hH̀nhăd i), t đóăxácăđ nhăđ codeword c v t th đóălàăgH̀ 2.1.2.2 Áp D ụng Khối Bag of Word vào Nh ận D ng Khn M ặt Nhóm tác gi [2] đánhăgiáărằng nh khuôn m t đ u m t lo i v t th , n u ta trính xu tăđ cătr ngăkhnăm t cách thành t p phn nh thH̀ăđi uănàyăkhôngăđ m b m rõ thơng tin c khn m t.ăDoăđó,ănhómăđ xu t thu tătốnărútătríchăđ cătr ngăkhnăm t nh HH̀nhă6 Ta chia Interest) V đ c vector SIFT 128 chi u, t luy n, s d ng thu t toán -means chuy năđổi vector SIFT m tăROI,ătaăphânăvùngăcácăđ i m iăROI,ătaătínhăđ × cătr đo codeword tâm c c m M t codebook bao g m li u hu n luy n, taăđ n dùng bi uăđ vector bi u di n i ng d b ngăcodebookăđưăhu c ki m tra,ătaăcũngăchiaă nh phân lo 2.1.3 K t Qu Nhóm tác gi [2] s nhăvàoăđ c nét xu ngăkíchăth 119ăđ iăt ng, hu n luy n b HH̀nh 34 C u trúc m ngădoăZeilerăvàăFergusăđ out) có d ng , (d ki n trúc l i t Inception nhằm quan sát cách phb n có s đ aăph HH̀nhă35 Mơ hình có kho Chi ti t mơ hình xem t i HH̀nhă36 ơngă HH̀nh 35 Module Inception d ng nguyên thủy ( nh trái) d ng gi m chi u ( nh ph i) 30 LHH̀nh 36 FaceNet s d ngămơăhH̀nhăInceptionăt ơngăt v i [27] ×ăHaiăđi m khác bi tăchinhăđóălàăFaceNetăs d ng pooling thay max pooling Kíchăth c polling ln ln tính song song v i module tích ch p m i module Inception 2.4.3 Thực Nghi m Nhóm tác gi đánhăgiáătrênăb d Nh n d ng khuôn m t, ki m tra khn m t phân c cáo nói v m t s khn m m t,ănhómăthayăđổiăkíchăth d ng FaceNet Khi hu n luy n, nhóm tt V ta s d ng phân lo i k-NN Nhóm đánhăgiáătrênăb t 5749ă ng %± %t ± có ca nh ch ỉnh m t HH̀ nhă 37 m HH̀nh 37 M t s c p nh nh n d ng sai b d li u LFW Trong b d li u Youtube Face bao g m 3425 video v iă1595ăng i,ătrongă100ăframeăđ u tiên m i video, nhóm tác gi xácăđ nh khn m t, tính trungăbH̀nhăt ơngăđ ơngăchoăt t c c p 31 khuôn m xác 2.4.4 2.4.4.1 Tínhăđ n th khn m iă in tăd 2.4.4.2 Nh ợc Đi m FaceNet hu n l l n g p l n so v hi n phòng thi t b , h c thu tădoăđòiăh i ki n trúc máy ln [34] 2.4.5 Nhận Xét Thuật Toán Thu t toán FaceNet s d ng b ba sai s vàoăđ tài Tuy nhiên, v năđ FaceNet.ăDoăđó,ăthayăvH̀ăhu n luy n tồn b khn m t, ta có th khn m t d aătrênăýăt 2.5 Nhận DeepFace 2.5.1 Tóm T Nhóm tác gi đ xu t m t thu t toán có tên DeepFace, s d ng ngu n Facebook làm b khuôn m t  Canh chỉnh khuôn m t  Bi u di n khuôn m tác gi bi u di n khuôn m bi u di n khn m t t hơnă120ăngànăthamăs Nhóm tác gi phát tri n m t c u trúc DNN hi u qu t n d ng đ bi u di n khn m tác gi trình bày cách canh chỉnh m t d a mơ hình 3D khn m 2.5.2 Chi Ti t Thuật Toán 2.5.2.1 Canh Chỉnh Khn M ặt G năđâyăcóănhi u cơng th ức có th nàyăth ng phân tích mơ hình 3D c khn m t ho c tì t tpd li u ho m nh M c dù thu t toán canhchỉnhănàyăđ c s d ng r ngărưiănh pháp phù h p áp d ng cho m t t nhiên, mơ hình 3D khn m t g năđâyăkhôngănhi u ng i s d ng t i, nh tălàătrongămôiătr ng t nhiên Tuy nhiên, khuôn mt mơ hình 3D nên nhóm tác gi quy tăđ nhăđiătheoăconăđ ng 32 Gi ngănh ăcácăthu tătốnătr c dó, nhóm tác gi xácăđ nhăcácăđi m cơăb n khuôn m tăđ canh chỉnh, l p nhi u l năđ làm m n k t qu output V i m i l n l p, s d ng Support VectorăRegressoră(SVR)ăđưăquaăhu n luy năđ d đốnăđi m khn m t t c a sổ mô t mt d a bi uăđ LBP HH̀nh 38 Quy trình canh chỉnh m t.ă(a)ăXácăđ nh khn m t nh (b) v biên nhằmătránhăđiătínhăkhơngăliênăt Các tam giác khp theo camera 30-2D, tam giác t i khó th dùngăđ chỉnhăh Canh chỉnh 2D Ta bắtăđ khuôn m t, canh gi [ | tỉ ]∗ l , xoay chuy khơng có s thayăđổi quan tr T p h p phép binăđổi t Canh chỉnh 3D Ta s 2D canh chỉnh vào m canh chỉnh (HH̀nhă38 (c)) s HH̀nhă38 (g) Trong mơ hình chung 3D, ta ch ỉ c n l y trung bình m u scan 3D t = , USF Human- ID [36], b d chỉnh t h i thi u tổng quát ủca h n tính ma tr =( × v − i ma tr n quy chi uăchoăđi cóăkíchăth c thànhăbàiătốnăbH̀nhăph nhi u nhi u ph iă dùng ma tr n hi păph hi păph ơngăsaiăt cácăđi doăđóă mang tính x p xỉ.ăĐ nhóm tác gi thêm ph hi u Cu ( nh ngu n)ăđ ̃ chínhăđ đ nhăh nh tr n v i nh b năsaoă 2.5.2.2 Bi u Di n 2.5.2.2.1 C u Trúc DNN Hu n Luy n HH̀nh 39 C u trúc hu n luy n DeepFace, t nh vào, l y khn m t,ăsauăđóăchỉnh di n d a vào mơ hình 3D (Frontalization), ti p theo l p l c Tích ch p (C1) ậ Pooling (M2) ậ Tích ch pă(C3),ăsauăđóălàă3ăl p Liên thơngăĐ aăph ơngă(L4ăậ L6) l păLiênăthôngăĐ yăđủ (F7 ậ F8) M ngăcóăhơnă120ăngànăthamăs v i 95% t p trung LiênăthơngăĐ aăph ơngăvàăLiênăthôngăĐ yăđủ C u trúc hu n luy n kíchăth c HH̀nhă ( 39 ký hi × vào × l p max pooling (M2) l y nh tr × × ngăv iăb th c ăcácăc nh hay k t c u nh, l nênărõăràngăhơnăchoăchuy năđổiăđ aăph ơng.ăKhiăápăd giúp cho m ng đủ chắnăđ nhi u mức pooling s n m ng b nh ng ph n c ch păđ u tiên l păđ u tiên có r t tham s , lp ch ỉ đơnăthu n m t păcácăđ cătr Các l păsauăđóă(L4,ăL5ăvàăL6)ălàăl păLiênăthơngăĐ aăph l pănàyăcũngăápăd tr ngăkhácănhau.ăDoăm khơngăđ m b o gi lông mày xu l păđ aăph h ngăđ ns thơngăĐ aăph h ng t kh × c s iălàă2.ăSauăđó,ătaăđ M ngăđ t hi n ơngă ng l ơng,ă i input Ví d , outpu m i liên h th ng kê gi a hai kh i l 34 Cu i cùng, hai l p F7 F8 l ittc n iv khuôn m t, ví d output l m t Xét v m t bi u di n, vector khác v i bi u di n d thôngăĐ yăđủ cu nhãn l p Ta ký hi păLiênăthôngăĐ yăđ ủ M c tiêu ca trình hu n luy n nh m t iăđaăxácăsu ℎ cách ti thi u hàm sai s nh vào hàm sai s Ta t i thi u hàm sai s max , Tr t D c Ng u Nhiên (Stochastic Gradient Descentậ SGD) S Cho nh neuron truy , ta tính bi u di n n ti n v i thành v i tham s 2.5.2.2.2 Chuẩn Hóa B c cu i cùng, ta chu năhóaăđ cătr nh y sáng: Chia m i ph n t hu n luy n, th c hi năđi u b ằng chu n hóa ={ ,…, trongăđó giátr 2.5.2.3 Metric dùng đ Nhóm tác gi h c metric khơng giám sát nhằmăxácăđ nh mứcăđ m t cách ly tích củaă2ăvectorăđ cătr v i metric có giám sát kho ng cách 35 2.5.2.3.1 Kho ng Cách có Tr ọng Số Vectorăđ đ nh tác gi s d ng kho ng cách v i d ng vào vector v i phn t ăLBP 2.5.2.3.2 M ng Siamese Nhóm tác gi đ ng th i ki mătraătrênămetricăđ h c, l p l i m ng nh n d ng khuôn m input)ăvàăđ Ta th c hi n a) L y sai s tăđ i củaă2ăđ cătr ng, b) L păLiênăthôngăĐ yăđủ ánh xvàoăđơnăv logisticăđơnă(gi ng/không gi ng) Đ ngĕnăch n hi năt ng overfitting nh n d ng, ta hu n luy n l p Khong ủca m ng Siamese trongăđóă s tham s cross entropy tiêu chu n lan truy 2.5.3 Thực Nghi m Nhóm tác gi th c nghi m s B d li u LFW: G m 13 B d li u YouTubeFace: c nghi m LFW, s d ng metric không giám sát nhằm so sánh t Th c a c păvectorăđ cătr ủ h c nhân SVM dùng kho Th c nghi m YouTubeFace cách biu di n DeepFace 50 c p frame, m i ph n t s mơ hình t video dùng giá tr trung bình tr qu Cho c p ki m tra, n đ xác trung bình 2.5.4 u Nh ợc Đi m Thuật Toán 2.5.4.1 u Đi m Đ n th iăđi m hi n t i, DeepFace m t nh ng thu t tốn nhn d ng khn m tăcóăđ xác thu c d ngă“topăperforming” 36 2.5.4.2 Nh ợc Đi m DeepFace hu n luy n v kíchăth cl năhơnăcácăb b d li u, ta có th 2.5.5 Nhận Xét Thuật Tốn DeepFaceăđưăđ giúp canh chỉnh khn m m t, t góc m t tùy ý, ta có th B D 3.1 B D B d li u PIE Vi năRobotics,ătr g m 41368 hình củaă68ăng nh c m xúc (xem HH̀nhă40) [39] HH̀nh 40 Ví d nh b d li u PIE g m: nh chân dung, nh sáng, nh c m xúc 3.2 B D g m B d m li u UMIST t tr ngăĐ i h c Sheffield nh (xem HH̀n h 41) [40] nh có góc ch HH̀nh 41 nh b d li u UMIST ch p t góc m t ph i sang m t di n 37 3.3 B D Li u CVL B d li u CVL t Phịng Thí nghi m Th giácăMáyătính,ătr ngăĐ i h c Ljubljana, Slovenia g mă114ăng i, m iăng i có nh ch× p t góc m t bên phi sang m t bên trái nh c mxúckhuônmtviăđphângiiđimnh(xemHH̀nhă42) HH̀nh 42 H nh b d NG PHÁT Sau tìm hi u báo chính, ta t măcóă2ăh H ng phát trin S superpixel, xácđ nhăđi m t m i ph n m t,ădùngăđ cătr ph n m tăđóă(víăd nh ăLBP), thi t l p m t M t ki m tra ta th c hi năt ph n m tăt ơngăứng b d nhi u nh t, ta s ph n ki mătraăt H ng phát trin S m t, nhiên ta s thayăđổi c u trúc l căkhácănh ăContourletă 38 TÀI LI U THAM KH O [1] Z Li, J.-i Imai and M Kaneko, "Robust face recognition using block-based bag of words.," Pattern Recognition (ICPR), 2010 20th International Conference on IEEE, pp 1285-1288, 2010 [2] C.-F Tsai, "Bag-of-words representation in image annotation: A review.," ISRN Artificial Intelligence 2012, 2012 [3] L Fei-Fei, "Stanford University, Computer Vision Lab," 2012 [Online] Available: http://vision.stanford.edu/teaching/cs231a_autumn1112/lecture/lecture14_intro_objrec og_bow_cs231a.pdf [4] L Fei-Fei and P Perona, "A bayesian hierarchical model for learning natural scene categories.," 2005 IEEE Computer Society Conference on Computer Vision and Pattern Recognition (CVPR'05), vol Vol 2, pp 524-531, 2005 [5] A Martinez and R Benavente, "The AR Face Database," CVC Technical Report #24, June 1998 [6] S Liao, A K Jain and S Z Li, "Partial face recognition: Alignment-free approach," IEEE Transactions on Pattern Analysis and Machine Intelligence 35.5 , pp 11931205, 2013 [7] R Achanta, A Shaji, K Smith, A Lucchi, P Fua and S Süsstrunk, "SLIC superpixels compared to state-of-the-art superpixel methods," IEEE transactions on pattern analysis and machine intelligence, vol 34.11, pp 2274-2282, 2012 [8] J Y Wright, G A Y., S S S A and Y Ma, "Robust face recognition via sparse representation," IEEE transactions on pattern analysis and machine intelligence, vol 31(2), pp 210-227, 2009 [9] D G Lowe, "Distinctive image features from scale-invariant keypoints," International journal of computer vision, vol 60.2, pp 91-110, 2004 [10] J Canny, "A computational approach to edge detection," IEEE Transactions on pattern analysis and machine intelligence, vol 6, pp 679-698, 1986 [11] K Mikolajczyk, A Zisserman and C Schmid, "Shape recognition with edge-based features," British Machine Vision Conference (BMVC'03), vol Vol 2, pp 779-788, 2003 [12] K Mikolajczyk and C Schmid, "Scale & affine invariant interest point detectors," International journal of computer vision, vol 60(1), pp 63-86, 2004 [13] T Lindeberg, "Feature detection with automatic scale selection," International journal of computer vision, vol 30.2, pp 79-116, 1998 39 [14] X Tan and B Triggs, "Enhanced local texture feature sets for face recognition under difficult lighting conditions," IEEE transactions on image processing, vol 19.6, pp 1635-1650, 2010 [15] D L Donoho and Y Tsaig, "Fast solution of-norm minimization problems when the solution may be sparse," IEEE Transactions on Information Theory, vol 54.11, pp 4789-4812, 2008 [16] C Ding and D Tao, "A comprehensive survey on pose-invariant face recognition," ACM Transactions on Intelligent Systems and Technology (TIST), vol 7.3, p 37, 2016 [17] R Weng, J Lu, J Hu, G Yang and Y P Tan, "Robust feature set matching for partial face recognition," Proceedings of the IEEE International Conference on Computer Vision , pp 601-608, 2013 [18] P N Belhumeur, D W Jacobs, D J Kriegman and N Kumar, "Localizing parts of faces using a consensus of exemplars," IEEE transactions on pattern analysis and machine intelligence, vol 35(12), pp 2930-2940, 2013 [19] Reinders, M JT, R W C Koch and J J Gerbrands, "Locating facial features in image sequences using neural networks," Automatic Face and Gesture Recognition, Proceedings of the Second International Conference on IEEE, pp 230-235, 1996 [20] P Campadelli, G Lipori and R Lanzarotti, Automatic facial feature extraction for face recognition, INTECH Open Access Publisher, 2007 [21] X Cao, Y Wei, F Wen and J Sun, "Face alignment by explicit shape regression," International Journal of Computer Vision , vol 107.2, pp 177-190, 2014 [22] M Dantone, J Gall, G Fanelli and L Van Gool, "Real-time facial feature detection using conditional regression forests," Computer Vision and Pattern Recognition (CVPR), pp 2578-2585, June, 2012 [23] F Schroff, D Kalenichenko and J Philbin, "Facenet: A unified embedding for face recognition and clustering," Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, pp 815-823, 2015 [24] B Amos, "OpenFace," [Online] Available: https://cmusatyalab.github.io/openface/ [25] K Q Weinberger and L K Saul, "Distance metric learning for large margin nearest neighbor classification," Journal of Machine Learning Research, vol 10, pp 207-244, 2009 [26] M D Zeiler and R Fergus, "Visualizing and understanding convolutional networks," European Conference on Computer Vision, Springer International Publishing, pp 818-833, 2014 [27] C Szegedy and e al, "Going deeper with convolutions," 2015 IEEE Conference on Computer Vision and Pattern Recognition (CVPR), pp 1-9, 2015 40 [28] D R Wilson and T R Martinez, "The general inefficiency of batch training for gradient descent learning," Neural Networks, vol 16.10, pp 1429-1451, 2003 [29] Y LeCun, B Boser, J S Denker, D Henderson, R E Howard, W Hubbard and L D Jackel, "Backpropagation applied to handwritten zip code recognition," Neural computation, vol (4), pp 541-551, 1989 [30] D E Rumelhart, G E Hinton and R J Williams, "Learning representations by backpropagating errors," Cognitive modeling, vol 5(3), 1988 [31] J Duchi, E Hazan and Y Singer, "Adaptive subgradient methods for online learning and stochastic optimization," Journal of Machine Learning Research, vol 12, pp 2121-2159, 2011 [32] A Geitgey, "medium.com," A Medium Corporation, [Online] Available: https://medium.com/@ageitgey/machine-learning-is-fun-part-4-modern-facerecognition-with-deep-learning-c3cffc121d78#.iyo9udyws [Accessed 24 July 2016] [33] I J Goodfellow, D Warde-Farley, M Mirza, A C Courville and Y & Bengio, "Maxout networks," ICML , vol 3, pp 1319-1327, 2013 [34] O M Parkhi, A Vedaldi and A Zisserman, "Deep face recognition," British Machine Vision Conference, vol 1, no 3, 2015 [35] Y Taigman, M Yang, Ranzato, M A and L Wolf, "Deepface: Closing the gap to human-level performance in face verification," Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, pp 1701-1708, 2014 [36] S Sarkar, "USF Human ID 3-D Database," [Online] Available: http://www.cse.usf.edu/~sarkar/SudeepSarkar/3D_Face_Data.html [37] S Chopra, R Hadsell and Y LeCun, "Learning a similarity metric discriminatively, with application to face verification," 2005 IEEE Computer Society Conference on Computer Vision and Pattern Recognition (CVPR'05), vol 1, pp 539-546, 2005 [38] B Amos, B Ludwiczuk and M Satyanarayanan, "OpenFace: A general-purpose face recognition library with mobile applications," CMU School of Computer Science, 2016 [39] T Sim, S Baker and M Bsat, "The CMU pose, illumination, and expression (PIE) database.," Automatic Face and Gesture Recognition, 2002 Proceedings, vol Fifth IEEE International Conference, pp 46-51, 2002 [40] I E Laboratory, the University of Sheffield, [Online] Available: https://www.sheffield.ac.uk/eee/research/iel/research/face 41 ... khuôn m t nh t m t ph n chi ti t mắt,ămũi,ămi ng (xem HH̀nhă1) HH̀nh nh ch p m t ph n khuôn m t, ta c năxácăđ nh m tăđóălàăai CÁC CƠNG TRÌNH LIÊN QUAN 2.1 Nhận D ng Khuôn M ặt S Dụng Bag- of- Words. .. recognition using block-based bag of words. ," Pattern Recognition (ICPR), 2010 20th International Conference on IEEE, pp 1285-1288, 2010 [2] C.-F Tsai, "Bag- of- words representation in image annotation:... c n hu n luy n b AR01) 2.1.4.2 Khuy t Đi m Bi u di n Bag of Word ch ỉ hi u qu bi uăđ ph n Vì lý nên Bag of Word không hi bi u di n nh 2.1.5 Nhận Xét Thuật Tốn T ýăt tứcănhómăcácăđi m nh có m ức

Ngày đăng: 12/12/2022, 06:53

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w