Nghiên cứu và phát triển các hệ thống tra cứu ảnh dựa trên nội dung (Đồ án tốt nghiệp)

46 249 0
Nghiên cứu và phát triển các hệ thống tra cứu ảnh dựa trên nội dung (Đồ án tốt nghiệp)

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Nghiên cứu và phát triển các hệ thống tra cứu ảnh dựa trên nội dung (Đồ án tốt nghiệp)Nghiên cứu và phát triển các hệ thống tra cứu ảnh dựa trên nội dung (Đồ án tốt nghiệp)Nghiên cứu và phát triển các hệ thống tra cứu ảnh dựa trên nội dung (Đồ án tốt nghiệp)Nghiên cứu và phát triển các hệ thống tra cứu ảnh dựa trên nội dung (Đồ án tốt nghiệp)Nghiên cứu và phát triển các hệ thống tra cứu ảnh dựa trên nội dung (Đồ án tốt nghiệp)Nghiên cứu và phát triển các hệ thống tra cứu ảnh dựa trên nội dung (Đồ án tốt nghiệp)Nghiên cứu và phát triển các hệ thống tra cứu ảnh dựa trên nội dung (Đồ án tốt nghiệp)

án t t nghi p i Phòng M CL C M C L C DANH M C HÌNH V DANH SÁCH CÁC T L IC M M VI T T T N U CH NG 1: CÁC KHÁI NI M C B N V TRA C U NH D A TRÊN N I DUNG 1.1 Gi i thi u 1.2 Nh ng thành ph n c a m t h th ng tra c u nh d a n i dung 1.2.1 Trích ch 1.2.2 c tr ng (Features Extraction): s (Indexing): 11 1.2.3 Giao di n truy v n (Query Interface): 12 1.3 Kho ng cách ng 1.4 Các ph u nh d a n i dung 12 ng pháp làm gi m kho ng cách ng 1.4.1 K thu t b n th it 13 ng 14 1.4.2 K thu t máy h c 16 1.4.3 K thu t ph n h i liên quan 22 1.4.4 M u ng 23 1.4.5 Tra c u nh web 25 1.5 c ng d ng c a tra c u nh d a n i dung 27 CH NG 2: TRA C U NH D A TRÊN N I DUNG V I PH N H I LIÊN QUAN 28 2.1 Gi i thi u ph ng pháp ph n h i liên quan 28 2.2 Ki n trúc t ng quan c a h th ng 29 2.2.1 Trích ch 2.2.2 t c tr ng 30 ng t 31 2.2.3 Ph n h i t ng 2.3 Các ph i dùng 32 ng pháp ph n h i liên quan 32 2.3.1 K thu t c p nh t truy v n 32 - CT1401 án t t nghi p i Phòng 2.3.2 Nh ng k thu t h c th ng kê 33 2.4 Nh ng thách th c ph n h i liên quan 35 2.5 CBIR v i ph n h i liên quan s d ng SVM 36 2.5.1 Support Vector Machine 36 2.5.2 Ph n h i b CH NG 3: 3.1 ng h c ch ÁP D ng 37 T TH NGHI M 38 t 38 3.1.1 C s d li u 38 3.1.2 Trích ch c tr i sánh 38 3.2 Các ch ng trình 38 3.2.1 M nh truy v n 38 3.2.2 Tra c u nh 38 3.2.3 Ph n h i liên quan 39 3.3 K t qu th nghi m 40 3.3.1 Giao di n ch ng trình 40 3.3.2 M t s k t qu th nghi m 41 3.4 M t s nh n xét v ch ng trình 44 K T LU N 45 TÀI LI U THAM KH O 46 - CT1401 án t t nghi p i Phòng DANH M C HÌNH V Hình 1-1: Ki n trúc t ng quan v h th ng tra c u nh Hình 1-2: S minh h a b n th i t ng 15 Hình 1-3: S mơ t k thu t SVM 17 Hình 1-4: L mơ t ph 20 Hình 1-5: S mơ t ph ng pháp RF 23 Hình 1-6: H th ng tra c u nh Worldnet s d ng Semantic template 25 Hình 2-1: Ki n trúc h th ng tra c u nh d a n i dung v i ph n h i liên quan 30 Hình 3-1: Giao di n ch ng trình 40 Hình 3-2: Ng i dùng ch n nh truy v n 41 Hình 3-3: K t qu tra c u 41 Hình 3-4: Ng i dùng ch n nh liên quan l n 42 Hình 3-5: K t qu sau vòng l p ph n h i th nh t 42 Hình 3-6: K t qu sau vòng l p ph n h i th hai 43 Hình 3-7: Ng i dùng ch n nh liên quan l n 43 Hình 3-8: K t qu sau vòng l p ph n h i th ba 44 - CT1401 án t t nghi p i Phòng DANH SÁCH CÁC T VI T T T STT T vi t t t Mô t APC Affinity Propagation Clustering ARE Augmented Relation Embedding CBIR Content-Based Image Retrieval CNS Color Naming System CRT Composite Region Template FSVM Fuzzy Support Vector Machine HSL Hue-Saturation-Luminance KL Karhunen-Loeve LGRM Local and Global Regressive Mapping 10 LPC Locality Preserving Clustering 11 MRBIR Manifold-Ranking Based Image Retrieval 12 MSRA Microsoft Research Asia 13 NCut Normalized Cut 14 PCA Principal Component Analysis 15 RF Relevance Feedback 16 RGB Red-Green-Blue 17 ST Semantic Template 18 SVM Support Vector Machine 19 SVT Semantic Visual Template - CT1401 án t t nghi p i Phòng L IC Em xin chân thành c y giáo, Th ng d n t n tình ch b o em r t nhi u su t trình tìm hi u nghiên c u án t lý thuy n ng d ng S ng d n c a th có thêm ki n th c v l p trình ki n th c v c x lý nh ng th tin c th y cô khoa Công ngh thông i H c Dân L p H trang b cho em nh ng ki n th em hoàn thành t n c n thi t su t th i gian h c t p t i án Em xin chân thành c m i h c Dân L p H i Phòng, ban giám hi n H u Ngh , Hi ng ng, khoa Công ngh thông tin, u ki n t t nh t su t th i gian em h c t p làm t t nghi p Trong trình h t th tránh kh i nh ng thi u sót, em r t c b k t qu c Sau cùng, em xin g i l i c em xây d án t t nghi p khơng c s góp ý q báu c a th y c hồn thi om i u ki án Em xin chân thành c H i Phòng, ngày tháng 12 2014 Sinh viên th c hi n - CT1401 án t t nghi p i Phòng M T m U c tồn c u hố kéo theo s m r ng c a n i dung n nh, âm nh c, video, ki m lo , n cho nhu u chia s tìm t cách nhanh chóng s ik n d li u hình nh M theo m t m , u tìm ki m hình nh i dùng mu n tìm ki m nh ng thơng tin kèm theo hình nh mà h c n ho c m t s khác l i tìm ki m hình nh xác nh n tính xác c a thơng tin h nh c Các d li u hình u ph c v cho nhi c quan tr ng cu c s th ng b o m t, an ninh, y t , hay h th ng phát hi n chuy vi c nghiên c u phát tri n h th ng tra c u nh ngày tr nên c p thi t án s trình bày k thu t ph n h d a n thu h p kho ng cách ng Các khái ni c ng d ng tra c u nh , c i thi n hi u n v tra c u nh d a n i dung Gi i thi u khái ni thành ph n n v h th ng tra c u nh d a n i dung Tra c u nh d a n i dung v i ph n h i liên quan Gi i thi n h i liên quan máy h c SVM Áp d t t th nghi m nghi m d a lý thuy t t - CT1401 án t t nghi p i Phòng CÁC KHÁI NI N V TRA C U NH D A TRÊN N I DUNG 1.1 Gi i thi u Trong th i bùng n v tìm ki m thơng tin hi n nay, ngồi vi c tìm ki m n n i dung vi c tìm ki m nh g có ng tr nên ph bi n V i ngu n tài nguyên nh vô to l n m ng internet, vi c tìm ki m xác m tb c tìm ki m m t b c hi n l i yêu c u c t t ng t m i dùng khó kh thi Chúng ta khó có th ng, vi c tìm ki c th c n tìm th nh có n i dung c n tìm V i l i ngu n tài nguyên nh m ng internet s ngày nhi phát tri n c a công ngh s , nhu c u th t s a theo s i ph i có m t cơng c h tr cho vi c tìm ki m nh s m t t Có hai ki u tìm ki m d li u m theo t khố tìm ki m theo n i dung nh Tìm ki m theo t khoá d tho c nhu c i dùng v i nhu c u tìm ki m hình nh m i theo mong mu n b n thân h thêm n a, tìm ki m theo t m theo n i dung b i ho ng vi c phân tích so sánh t ho c c m t ng v t qu Ki u d li u d ng cá n, t ng k t qu chóng, i dùng ph i có nh m u Tuy nhiên, m k t qu hình nh không ph i mong mu n c i dùng ch phù h p nh t v i vi ng nhu c u c i dùng thông qua mô t b ng t ng kh c ph m c a tìm ki m theo t khố, m i tìm ki m nh theo n i dung Ý ng c o s mơ t nh m t cách t ng tr c ti p t n i dung nh b ng s phân tích n i dung nh mà khơng có s can thi p th cơng mc a t khóa vi c trích ch c th c hi n m t cách t ng n i dung c a nh luôn nh t quán Trong th c t , ng s d c cao (khái ni m), ch ng h khóa, mơ t gi i thích hình t c a chúng Trong nh c trích ch n m t cách t ng b ng cách s d ng k thu t c a th giác máy ch y c th p (màu s c, k t c u, hình d ng, v c dù nhi u thu t toán ph c t c thi t k mô t màu s c, tc t tốn v n khơng th ph n ánh th nh - CT1401 án t t nghi p i Phòng Do v y, kho ng cách ng c th p khái ni m m c cao v n l n nên hi u su t c a CBIR v n xa v ic a i dùng thu h p kho ng cách ng , ph n h i liên quan (RF m t công c hi u qu c i thi n hi a h th ng CBIR Nói chung, RF nh m m i thi n hi u thông qua vi c h c nh u ch nh c a i dùng nh ng k t qu tra c u Theo cách này, h th ng c n ph i th c hi n thông qua m t s vòng l p Trong m i vòng l p, h th ng s tr l i m t danh sách nh t v i nh truy v n d a kho ng cách Euclidean Sau c i s d ng gán nhãn liên quan ho c không liên ng n , nh s quan v i nh truy v n S d ng nh ng gi ng, nh ng k thu t h c máy s c áp d ng h t xây d ng mơ hình phân l p t t c d li u thành hai l p liên quan không liên quan v i nh truy v n Hàm phân l cs d ph liên quan c a d li u 1.2 Nh ng thành ph n c a m t h th ng tra c u nh d a n i dung M t h th ng tra c u i thành ph -1 [5] Hình 1-1: Ki n trúc t ng quan v h th ng tra c u nh Trích ch , n quan tr ng nh t tra c u nh d a n i dung: s giao di n truy v i dùng - CT1401 án t t nghi p i Phòng 1.2.1 Trích ch tures Extraction): a nh bao g c tính c tính ng c tính c (color), hình d ng (shape), k t c u (texture), v trí khơng gian (spatial location) Chúng có th c trích xu t t ng ho c bán t ng c tính logic cung c p mơ t tr ng c a d li u hình nh c khác ho c bán t ng M t ho c nhi c tính logic c chi t xu t b ng tay c s d ng ng d ng c ng, th 1.2.1.1 c (color): c m t nh c s d ng ph bi n tra m t không gian màu l a ch n S ng c u nh Màu s c a khơng gian màu có s c th hi n g c dùng cho ng d ng khác i nh n th c c i c s d ng r ng rãi c ph bi n ho c mô t h th ng CBIR bao g m: ma tr n hi p bi n màu, bi màu, moment màu, véc- k t h p màu [5] ng s k t qu , m t t c xây d tính tốn t ng l y t m b t bi m quan sát khác s chi u sáng Theo c tính tốn Các b t bi n c hue c p hue-hue i x ng Vi c l a ch c thu c vào k t qu n Ví d , n u vi n cung c ng mà khơng có màu ng nh t, rõ ràng màu trung bình khơng ph i l a ch n t t V i ng d ng c bi d li u khuôn m i, mi n tri th c có th c khai thác gán tr ng s cho t m nh vi c tính tốn vùng màu 1.2.1.2 t c u (texture): K t c u khơng c, th mà m t s h th ng không s d t c u Tuy nhiên, k t c u cung c p thông tin quan tr ng vi c phân lo i nh, mơ t n i dung c a nhi u nh th trái cây, mây, cây, g ch, v t c u m quan tr ng vi c cao cho m u nh [5] tc c s d ng h th ng tra c u nh bao g m , ch ng h c bao g m s d ng l c Gabor ho c bi i wavelet, th tc t c u Tamura wold th ng kê c c b , xu t b i Liu c ng s - CT1401 án t t nghi p 1.2.1.3 i Phòng a hình d ng (shape): Hình d ng m t khái ni t ng c a ng d ng nói chung bao g m: t l aspect, tu n hồn, mơ t Fourier, b t bi n th ng bao liên ti nh quan tr ng, m c s d ng r ng rãi CBIR nhi u mi n t c u [5] c bi ng nhân t hi n tính h u ích iv i cs d ng h u h t lo i gi y t , nhiên, l áp d hình d ng so v i màu s c k t c u s thi u xác c g p khó k th y ti s d ng ch CBIR Ví d c s d ng m t s h th ng cho ng s n ch ng h l nh ng M t h th ng mà Wang c ng s quán tính c a th t t 1mơ t hình d ng khu v c 1.2.1.4 Các vùng ho n M c dù d ng tiêu chu n hoá (spatial location): ng v i thu c tính màu s c k t c u có th c nh n m t cách d dàng b i ràng bu c khơng gian [5] Ví d , vùng có b u tr i bi n màu xanh có th có bi , i có v trí khơng gian nh khác Vì th , v trí khơng gian c a vùng (ho i ng) ho c m i liên h không gian gi a nhi u vùng m t nh r t h u d ng cho vi c tra c u nh M t bi u di n c a m i liên h không gian c s d ng r ng rãi nh t 2D strings c Chang c ng s K thu t c xây d ng b ng cách chi u nh theo tr c x y Cho hai t p ký hi u V A, phép chi u C m i ký hi u V c bi u di n b im ng nh Còn m i ký hi u A c bi u di n b i m t lo i liên h không gian gi ng N u chúng khác nhau, k thu t 2D G-string s c t t t c ng d c theo ng bao h p nh nh t m r ng m i liên h không gian vào hai t p tốn t khơng gian M t t p toán t nh m i liên h không gian c c b t p l i nh m i liên h khơng gian toàn c c, ch r ng phép chi u c ng tách ra, n i li n ho nh v trí Ngồi ra, k thu 2D C-string xu t b i Lee c ng s c c ti u s t Còn k thu 2D B-string c gi i thi i Yang c ng s K thu t s bi u di n m ng b i hai ký hi u, thay th cho vi c m u k ng bao c ng - CT1401 10 án t t nghi p i Phòng metric khác Manhattan, weighted mean-variance, Euclidean, Chebychev, Mahanobis, kho ng cách cho tra c u k t c u nh v c nghi m H nh n th y r ng s li u kho ng cách Canberra and Bray-Curtis th c hi n t s li u kho ng cách khác 2.2.3 Ph n h i t i dùng Sau có k t qu tra c u, i dùng cung c p ph n h i v k t qu liên quan ho c không liên quan N u k t qu khơng liên quan vòng l p ph n h i s c l p l i nhi u l 2.3 Các i dùng hài lòng pháp ph n h i liên quan Trong h th ng CBIR v i ph n h quan tr ng Các thơng tin ph n h i xác t t vai trò i dùng s góp ph hi a h th ng tra c u Do v y, nhà nghiên c p trung áp d ng k thu t h c máy nh ng ph n h i c c i thi n hi u u K thu t c p nh t truy v n k thu t h c th ng kê nh ng k thu t c s d ng ph bi n h th ng CBIR v i ph n h i liên quan 2.3.1 K thu t c p nh t truy v n K thu t c p nh t truy v n c i thi n vi c bi u di n truy v n b ng cách s d c g n nhãn ch quan c i dùng Các ví d c a k thu t c p nh t truy v n bao g m c p nh t tr ng s truy v n di chuy n truy v n, m r ng truy v n C p nh t tr ng s truy v i tr ng s khác bi u di n truy v n K thu t c p nh t vécth ng h c s gi i thích c i dùng v hàm kho ic ng s cho phép h ng trung tâm c p nh t tr ng s r n tr c quan M i c i di n b i m t vécN chi u Nó có th m khơng gian N chi u Các chi giúp tra c u nh liên quan s c nâng c p t m quan tr ng chi u khác mà c n tr ti n trình s b gi m t m quan tr Kushki c ng s d ng k thu t c p nh t tr ng s h c ánh x t c quan m c th p khái ni m ng c cao c a nh K thu t ho ng b ng cách tinh ch nh tr ng s (ho c s quan tr ng) c a t ng thành ph c b m ng , Muneesawang c ng s ng k thu t di chuy n truy v cho phép i tr c ti a nh truy v n b ng cách ch nh - CT1401 32 án t t nghi p i Phòng thu c tính c a nh liên quan ho ng bi u di n ng trình tra c u m r ng truy v b ub a n i dung nh truy v i i theo c cung c p b Widyantoro c ng s i dùng su t ng k thu t thêm vào m t t p p cho s thi u h t nh ng dùng giúp h th ng n m b c g n nhãn c g n nhãn b i a nh truy v n m 2.3.2 Nh ng k thu t h c th ng kê K thu t h c th i thi n gi i h n phân lo i gi a nh ng nh liên quan không liên quan ho c d n nh ng c g n nhãn su t trình hu n luy n Các ví d c a k thu t h c th ng kê bao g m h c quy n p h c chuy i H c quy n t trình ti p thu tri th c b ng cách v suy lu n quy n p t giáo viên ho ng cung c p s ki m n ho ng khái quát, bi i, hi u ch nh, tinh ch nh bi u di n tri th c quy n c áp d ng h th ng CBIR nh m t o b phân l phân tách thành nh có liên quan (m u ) khơng có liên quan (m u âm), khái quát t ng gán nhãn ng nh có liên quan khơng có liên quan nhãn nh tra c u ng b i dùng su t phiên tra c u Các k thu t h c quy n n hình bao g m M ng neural, H c quy nh, h c Bayesian, Boosting, support vector machine (SVM), h c SVM m (FSVM) Vào , MacArthur c ng s d ng quy nh ng d ng CBIR Các ub c s d n t t c ví d m t phân vùng l p Su c ng s p ph n h i liên quan không liên quan t i dùng vào b Phân lo i Bayesian Nh ng nh liên cs d ng m t phân b Gaussian Phân b bi u di n nh ng i dùng mong mu n nh ng nh không liên quan l cs d t l i vi c x p h ng nh ng ng c c tra c u 2001, Tong c ng s xu t m t h th ng CBIR v i s tr giúp c a SVM h ng bao thích h p s d ng m p c t vòng l p tra c cs d phân tách d li u thành hai phân vùng liên quan không liên quan Wu c ng s ng FSVM h ng bao quy - CT1401 33 án t t nghi p i Phòng phân tách nh hu n luy bao quy a tr ng s m ng d li u nh thành nh liên quan không liên quan Nh ng nh liên quan v i kho ng cách l n nh t t bao quy ng nh t v i nh truy v n 2004, Tieu c ng s boosting sinh m t s ng xu t m t h th ng CBIR mà s d ng k thu t h c ng l n l c cao cho vi c n m b t nhi u d ng c a khái ni m tr c quan nh M t lo cy ud a m t s ng nh c hu n luy n su t th i gian truy v n B ng vi c k t h p phân lo i y u, h th ng cu lo i m i phân l ng c m t b phân K thu t h c truy n d n khai thác m i liên quan c a t t c x p h ng c a d li u c g n nhãn v i th tr ng s B ng cách này, thơng tin c a tồn b d li u c s d ng m t cách hi u qu t o thu n l i cho vi c h c He c ng s xu t thu t toán Tra c u nh d a x ph p bi u di n nh m i liên k t c t th H th ng lan truy n thông tin c gán nhãn thông qua c u trúc th c d li u nh khai thác s phân b c i thi xác tra c u Wang c ng s ng thu t toán phân c m lan truy n (APC) làm gi m s d th b o t n c ng c th làm lu m ng c a nh nhi u làm n i b t ng nh tin c y Tuy nhiên, hi u có th b suy gi m c m không gi ng v i khái ni m ng Lin c ng s xu Augmented Relation Embedding-ARE bi i m t không gian nh vào ng p B ng vi c áp d ng c này, h th ng có th c s thích truy v n c bi u di n nh m i d ng v c ARE p ng c tri t thích Wan c ng s xu d li u nh thành kh i có kích c b ng thu t tốn MRBIR t ng kh i m s tra c u c a t ng nh m t s h p nh m s x p h ng c a t t c kh i nh Liu c ng s xu t h th ng x p h Bidirectional-Isomorphic Manifold Learning c nhi u bi u di n ng kh c ph c s bi u di n n i dung ng u xác nhi a khía c n tr - CT1401 34 án t t nghi p i Phòng pháp t c hai không gian v i m t c u trúc tô-pô c H th u ch nh h p nh t c g i ánh x o t h p c thích xác tra c u cu i t framework phân l p nh s d ng Han c ng s ánh x quy c c b toàn c c (Local and Global Regressive MappingLGRM) h h c d li u vào hàm ánh x c a d li u m u th m Cu i cùng, d p cho m t m tra b ng cách áp d ng phân l 1995, Xu c ng s framework t p chi xu t chi u x p h Bregman b ng cách s d ng m t ma tr n kernel t a phát bi u c a h , hi u qu hi u qu m r ng c g i DMRE DMRC rút ng n th i gian tính tốn T tc c h c ng vào ct c chuy c l p Tuy nh xác tra c u tra c u xác t t ng l ch s thông tin RF c tích lu c c i thi th ch y máy tính mà s ng m tm nh nh s d ng m t s ma tr n vuông l thu t h c ng n h n không th n m b không th c k t qu tra c u tho thu nh l ch s ph n h i c s d ng tra c d li n a, t t c k a ghi 2.4 Nh ng thách th c ph n h i liên quan K thu t Ph n h c nhi u ti n b tb ct c gi i thi i Liu c ng s c kh c ph c nh m t n t i Tuy nhiên, v i nh ng m nguyên th y c a k thu t ph n h i liên quan CBIR n v n ph c nhà khoa h c nghiên c u thêm Các h n ch ph n h i liên quan c a h th ng CBIR Không th trích ch n ng c cao: H u h t k thu t RF CBIR s r trích ch n ng c cao c a nh ch c th c s d ng RF Tuy nhiên, cách v n ho ng t t vi c - CT1401 35 án t t nghi p i Phòng tra c khơng ph n B i vì, vi c tra c u v n c th p c d a t khoá ch S khan hi m m t cân b ng m u ph n h i: M i dùng u không mu n thao tác nhi l n l p ph n h c k t qu t t nh t Vì v y, s ng m u ph n h i g n ct i dùng m t phiên RF nh so v i chi , i v i d li u hu n luy n nh h u h t thu t toán máy h c khơng th cho k t qu xác Thêm n a là, s ng m ng l n ng m u li u hu n luy n m i luôn làm cho vi c , i v i m u d li u hu n luy n h c phân l nh RF c bi t m n nhiên s làm gi xác c a X lý th i gian th c: Quá trình h c RF tr c i vòng l p ph n h i bao g m c hu n luy n ki u ph i th c hi n Vì th mà h th ng s t n r t nhi u th i gian x lý Có m t cách h gi i quy t v s d háp bi u di n nh c m t c u trúc phân c p, 2.5 CBIR v i ph n h i liên quan s d ng SVM 2.5.1 Support Vector Machine c gi i thi u tiên b i Vapnik vào cu i nh n v c quan tâm b i c ng nghiên c u h c máy [6] V i n n t ng lý thuy t m nh m ch t ch c s d ng cho nhi u ng d ng m t c m u nh ph bi n có hi t cho toán phân lo i m u Gi s có m t t p n m c gán nhãn , v i bi u di n nh khơng gian d chi u c a SVM tìm siêu ph ng ng (2.1) cách có l c m có yi=1 m có yi=-1 cho siêu ph ng phân i t l l i phân l p nh nh ch c gi i b i tìm w b cho c c ti u hóa hàm (2.2) N u vi u ki n phân lo là tốn t - CT1401 id i ng i (i=1 n) c i ng u c a SVM i hóa hàm 36 án t t nghi p i Phòng (2.3) ,0 Sao cho hàm kernel p SVM s (2.4) ng bao quy 2.5.2 Ph n h i b nh s là: ng h c ch ng Trong tra c u nh v i ph n h i liên quan d a SVM ng bao quy cs d liên quan gi a nh truy v n m chung, m u có giá tr i c a hàm phân l p l n kh d cao Tron i dùng s ch n m nh y n h i liên quan d a SVM truy n th ng, c x p h ng cùng, t c m u có giá tr l n nh t c a hàm SVM f(x) cho vi c hu n luy n SVM (2.5) Chi c g i ph n h i b ng t i vi c ch n m u liên quan nh t Tuy nhiên, nh ng m u có th khơng ph i m u thơng tin nh t cho hu n luy n SVM, v c c i thi n cl iv có nhi u h a h n nh m u không ch c ch ng bao quy nh c a SVM có th s khơng c SVM ch c quan tâm c ch ng t i vi c ch n u g n nh t v ng bao quy nh SVM: (2.6) V ng bao quy nh có th s c c p nh t t Tuy nhiên vi c tìm m u thơng tin nh t cho hu n luy n SVM m t thách th c - CT1401 37 án t t nghi p i Phòng ÁP D 3.1 T TH NGHI M t 3.1.1 d li u t Microsoft Visual Studio 2010 v i ngôn ng C# n liên k t LibSVMsharp.dll h tr cho vi c áp d ng thu t toán SVM m hu n luy n T d li u th nghi m bao g m 10800 nh l y t COREL C d li u nh d li u bao g m 80 l p khác nhau, m i l p kho ng 100 nh 3.1.2 Trích ch g i sánh trích ch sau , c m t nh a nh n FELib.dll s d s d ng lo c bi u di n b i m t vector 809 ph n t : Color histogram, color moments t ph n t t Edge histogram t bi u di n cho n 81 n 118 Gabor wavelets transform: ph n t t Local Binary Pattern: ph n t t GIST: ph n t t n 238 n 297 n 809 gi a hai hu n luy n SVM LibSVMsharp.dll d Euclid d ng tham s m nh c n 3.2 Các ch 3.2.1 M M nh truy v n nh b ng cách ch n File -> Open Menu ch Trích ch nh truy v n Hi n th nh truy v n lên picturebox 3.2.2 Tra c u nh gi a nh truy v n v i t ng thơng qua hàm tính tốn kho ng cách Euclid S p x p nh gi m d Hi n th d li u nh c s p x p lên khung retrieval results - CT1401 38 án t t nghi p Ch n m t s feedback i Phòng nh g n nh t v i nh truy v n hi n th lên khung relevance i dùng gán nhãn i dùng gán nhãn có liên quan (+1) cho nh g n v i nh truy v n nh t b ng cách kích vào , nh ng nh l i dùng kích c gán nhãn không liên quan (-1) 3.2.3 Ph n h i liên quan Các hu n luy n SVM gán nhãn s quy ng bao nh phân l p s d li u disSVM) ính tốn kho ng cách t ng bao quy nh SVM (kho c g i Hi n th nh có giá tr disSVM l n nh t lên khung retrieval results (t c s p x p c gán nhãn gi m d n theo giá tr disSVM) Ch n nh g n v ng bao quy relevance feedback (t c s p x p giá tr nh SVM hi n th lên khung c gán nhãn d n theo i c a disSVM) i dùng s th c hi n ti p vi c gán nhãn cho nh cl pl i dùng hài lòng v i k t qu tra c u - CT1401 39 án t t nghi p i Phòng 3.3 K t qu th nghi m 3.3.1 Giao di Hình 3-1: Giao di Các thành ph n c m: Menu ch M t picture box hi n th nh truy v n m u M t khung retrieval results hi n th k t qu nh tra c u M t khung relevance feedback l a ch n Browse Retrieval Relevance Feedback Cancel ch hi n th c ch a tra c u i dùng d li u nh c c th p th c hi n ph n h i liên quan d ng trình - CT1401 40 án t t nghi p i Phòng 3.3.2 M t s k t qu th nghi m Hình 3-2 i dùng ch n nh truy v n Hình 3-3: K t qu tra c - CT1401 u 41 án t t nghi p i Phòng Hình 3-4 i dùng ch n nh liên quan l n Hình 3-5: K t qu sau vòng l p ph n h i th nh t - CT1401 42 án t t nghi p i Phòng Hình 3-6: K t qu sau vòng l p ph n h i th hai Hình 3-7 - CT1401 i dùng ch n nh liên quan l n 43 án t t nghi p i Phòng Hình 3-8: K t qu sau vòng l p ph n h i th ba 3.4 M t s nh n xét v Có th th y r ng, vi c áp d ng k thu t máy h c SVM vào ph n h xác tra c u nh d a theo n i dung Tuy nhiên, v n t n t i m t s m t h n ch c háp Các m t h n ch là: Máy tính m t nhi u th tính tốn Thi u l ch s thơng tin ph n h i c c i dùng dài h n h th ng có th h c áp d ng nh c SVM d ng k t h p thu t toán máy h c khác nh m nâng cao hi nh - CT1401 nh u 44 án t t nghi p i Phòng K T LU N Sau m t th i gian tìm hi u nghiên c Tìm hi án t c m t s k t qu sau: c c u trúc c a m t h th ng tra c u nh d a n i dung Tìm hi c m t s ph c u nh d a n i dung Tìm hi m kho ng cách ng ph n h i liên quan Tìm hi u thu t toán máy h h c ph n h i c Xây d c áp d ng vào h th ng ph n h i i dùng nghi m Tuy nhiên th i gian có h n trình nghiên c tài nên v n ch d ng l i vi c xây d nghi m Ngoài i ch d ng l i m c áp d ng m t thu t toán máy h c SVM cho ph n h i liên quan áp d c thu t toán máy h c khác nghi so sánh hi u c a t ng thu t toán v i t mong nh cs n t Th y Cơ b n em có thêm ki n th c kinh nghi m ti p t c hoàn thi n n i dung nghiên c u tài Em xin chân thành c - CT1401 45 án t t nghi p i Phòng TÀI LI U THAM KH O Tài li u Ti ng Vi t: [1] , , , Tài li u Ti ng Anh: [2] Content-based image retrieval with Khuat Thi Thu H relevance feedback inal report master in information and communication and technology, University of Science and Technology of Hanoi, September 2013 [3] Chang, Ran, "Effective graph-based content-based image retrieval systems for large-scale and small-scale image databases", Doctor of Philosophy, Utah State University 2013 [4] Ying Liu, Dengsheng Zhang, Guojun Lu, Wei-ying Ma, A survey of content-based image retrieval with high-level semantics, attern recognition, volume 40, issue 1, January, 2007, 262-282 [5] Dr Fuhui Long, Dr Hongjiang Zhang and Prof David Dagan Feng, Fundamentals of content-based image retrieval nternational journal of computer science and information technologies, vol.3 (1), 2012, 3260 3263 [6] Ngo Truong Giang, Khuat Thi Thu Ha, Ngo Quoc Tao and Nguyen Interactive Image Retrieval with Active Support Vector Machine Learning Information Technology, HaiPhong Private University, Institute of Information Technology, Vietnamese Academy of Sciences and Technology, University of Science and Technology of Hanoi FAIR - Thai Nguyen, 20-21/6/2014 - CT1401 46 ... h p kho ng cách ng Các khái ni c ng d ng tra c u nh , c i thi n hi u n v tra c u nh d a n i dung Gi i thi u khái ni thành ph n n v h th ng tra c u nh d a n i dung Tra c u nh d a n i dung v i ph... ba tác v trên, trích ch nhi m v quan tr n i dung t p t c trích ch n t ) t Ph n l n nghiên c u tra c u nh d a m v 1.3 Kho ng cách ng u nh d a n i dung c tra c u nh hi n có hai h th c phát tri... thuy t t - CT1401 án t t nghi p i Phòng CÁC KHÁI NI N V TRA C U NH D A TRÊN N I DUNG 1.1 Gi i thi u Trong th i bùng n v tìm ki m thơng tin hi n nay, ngồi vi c tìm ki m n n i dung vi c tìm ki m

Ngày đăng: 25/02/2018, 08:03

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan