Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 71 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
71
Dung lượng
1,69 MB
Nội dung
ĐẠI HỌC QUỐC GIA HÀ NỘI TRƢỜNG ĐẠI HỌC CÔNG NGHỆ NGUYỄN THỊ DƢƠNG GÁN NHÃN ẢNH TỰ ĐỘNG SỬ DỤNG KẾT HỢP NHIỀU NGUỒN THÔNG TIN LUẬN VĂN THẠC SĨ ĐIỆN TỬ - VIỄN THÔNG HÀ NỘI - 2017 ĐẠI HỌC QUỐC GIA HÀ NỘI TRƢỜNG ĐẠI HỌC CÔNG NGHỆ NGUYỄN THỊ DƢƠNG GÁN NHÃN ẢNH TỰ ĐỘNG SỬ DỤNG KẾT HỢP NHIỀU NGUỒN THÔNG TIN Ngành: Điện tử truyền thông Chuyên ngành:Kỹ thuật điện tử Mã số: 60530203 LUẬN VĂN THẠC SĨ ĐIỆN TỬ- VIỄN THÔNG NGƢỜI HƢỚNG DẪN KHOA HỌC: TS LÊ VŨ HÀ HÀ NỘI - 2017 LỜI CẢM ƠN Đầu tiên xin chân thành cảm ơn đến Ban Giám Hiệu tập thể thầy cô khoa Điện Tử - Viễn Thông, Trƣờng Đại Học Công Nghệ , Đại Học Quốc Gia Hà Nội tổ chức giảng dạy tạo môi trƣờng thuận lợi cho đƣợc học tập nghiên cứu chuyên sâu lĩnh vực Điện tử viễn thông Xin chân thành cảm ơn anh chị đồng nghiệp quan cơng tác tạo điều kiện thuận lợi, đóng góp ý kiến quý báu Xin cảm ơn bạn bè bảo tơi suốt q trình học tập hoàn thành luận văn Đặc biệt xin gửi lời cảm ơn sâu sắc đến Thầy hƣớng dẫn khoa học TS Lê Vũ Hà TS Nguyễn Hồng Thịnh tận tình hƣớng dẫn, bảo tơi suốt trình nghiên cứu thực luận văn Cuối cùng, tơi xin biết ơn gia đình tạo điều kiện thuận lợi cho yên tâm suốt thời gian học tập nhƣ thời gian nghiên cứu hoàn thành luận văn cao học Nghiên cứu đƣợc tài trợ trung tâm nghiên cứu Châu Á, Đại học Quốc Gia Hà Nội đề tài mã số CA.15.10A Hà Nội, ngày 05 tháng năm 2017 Tác giả luận văn Nguyễn Thị Dƣơng LỜI CAM ĐOAN Tôi xin cam đoan nội dung luận văn thực dƣới hƣớng dẫn TS Lê Vũ Hà Các số liệu, kết trình bày luận văn trung thực Những tƣ liệu đƣợc sử dụng luận văn có nguồn gốc trích dẫn rõ ràng, đầy đủ Mọi chép không hợp lệ, vi phạm quy chế đào tạo, hay gian trá tơi xin chịu hồn tồn trách nhiệm Tác giả luận văn Nguyễn Thị Dƣơng MỤC LỤC PHẦN MỞ ĐẦU 1 Tính cấp thiết luận văn Mục tiêu luận văn Các đóng góp luận văn Bố cục luận văn Chƣơng TỔNG QUAN VỀ PHƢƠNG PHÁP GÁN NHÃN TỰ ĐỘNG CHO ẢNH 1.1 Tổng quan 1.2 Các nghiên cứu lĩnh vực gần 1.3 Bài toán phân loại gán nhãn ảnh tự động 1.4 Biểu diễn ảnh dƣới dạng vector đặc trƣng (Low level features) 10 1.4.1 Tại phải biểu diễn ảnh 10 1.4.2 Đặc trƣng ảnh 12 1.4.2.1 Đặc trƣng toàn cục 12 1.4.2.2 Đặc trƣng cục 12 1.4.3 Các vector đặc trƣng 12 1.4.3.1 Lƣợc đồ màu CH 12 1.4.3.2 Đặc trƣng tƣơng quan màu CORR 13 1.4.3.3 Lƣợc đồ hệ số góc EDH 14 1.4.3.4 Cấu trúc sóng WT 15 1.4.3.5 Mô-men màu CM55 16 1.4.3.6 Phƣơng pháp túi từ điển BOW 16 1.5 Các nguồn thông tin phụ trợ 18 1.6 Phƣơng pháp huấn luyện dùng để phân loại gán nhãn 20 1.6.1 Phƣơng pháp K - láng giềng gần (K-Nearest Neighbors) 20 1.6.2 Phƣơng pháp SVM - Support Vector Machine 21 1.6.3 Đánh giá .23 Chƣơng THUẬT TOÁN GÁN NHÃN ẢNH CHỈ SỬ DỤNG CÁC VECTOR ĐẶC TRƢNG 25 2.1 Ảnh giải (Tags) 25 2.2 Giới thiệu cách tạo 81 nhãn tập liệu NUS-WIDE 26 2.3 Biểu diễn ảnh dƣới dạng vector đặc trƣng 27 2.4 Thuật toán K-NN 29 2.4.1 Phân tích liệu thực nghiệm với K-NN .29 2.4.2 Kết recall K-NN 31 2.5 Thuật toán SVM 32 2.5.1 Phân tích liệu thực nghiệm với SVM .32 2.5.2 Kết recall SVM 33 Chƣơng 3: THUẬT TOÁN SỬ DỤNG KẾT HỢP THÔNG TIN PHỤ TRỢ 35 3.1 Sử dụng thông tin giải 35 3.1.1 Phân tích mối quan hệ giải nhãn 35 3.1.2 Thực nghiệm sử dụng thông tin giải ngƣời dùng tập kiểm thử 37 3.2 Sử dụng vector đặc trƣng giải 38 3.2.1 Dựa thông tin giải ảnh kiểm thử .38 3.2.2 Dựa thông tin giải ảnh huấn luyện 39 KẾT LUẬN 42 TÀI LIỆU THAM KHẢO 44 PHỤ LỤC : DANH MỤC HÌNH ẢNH Hình 1 Một hệ thống CBIR điển hình [Manal and Nordin 2009] Hình Sơ đồ khối khung công việc gán nhãn ảnh tự động Hình Phƣơng pháp tổng quát cách thức thực toán gán nhãn ảnh sử dụng nguồn thông tin khác [Li et al 2016] Hình Ví dụ tìm kiếm ảnh với từ khóa “mountain” Flickr.com Hình Ví dụ minh họa dùng lƣợc đồ màu để phân biệt bò ngựa thảo nguyên 11 Hình Minh họa hai ảnh giống nhƣng góc nhìn khác 11 Hình Minh họa hai ảnh có đặc trƣng tƣơng quan màu giống 14 Hình Minh họa phƣơng pháp túi từ điển [Fei et al 2005] 17 Hình Túi từ - miêu tả đối tƣợng với biểu đồ từ xuất hiện[Fei et al 2005] 18 Hình 10 Ví dụ ảnh tag ngƣời dùng gán cho ảnh 18 Hình 11 Thông tin thông số máy ảnh EXIF ảnh 19 Hình 12 Ví dụ phân lớp cho X thuật toán K-NN 21 Hình 13 Ví dụ phân lớp hai tập hợp bóng Xanh - Đỏ sử dụng SVM 23 Hình 81 nhãn tập liệu NUS-WIDE 28 Hình 2 Số hình ảnh có liên quan đến 81 nhãn NUS-WIDE 29 Hình Sơ đồ tóm tắt bƣớc thực trình phân loại gán nhãn cho ảnh kiểm thử sử dụng K-NN 30 Hình Biểu đồ so sánh kết recall đặc trƣng kết hợp đặc trƣng với K = 50 số nhãn gán cho ảnh (N) tăng dần từ đến 10 31 Hình Sơ đồ tóm tắt bƣớc thực trình phân loại gán nhãn cho ảnh kiểm thử sử dụng SVM 33 Hình Biểu đồ so sánh kết recall đặc trƣng sử dụng thuật toán SVM 34 Hình Biểu đồ Recall sử dụng thông tin giải ngƣời dùng tập kiểm thử 37 Hình Sơ đồ khối trình kết hợp đặc trƣng ảnh giải ảnh kiểm thử 38 Hình 3 Biểu đồ so sánh kết recall đặc trƣng ảnh đặc trƣng kết hợp với giải ảnh kiểm thử 39 Hình Sơ đồ khối dựa thông tin giải ảnh huấn luyện theo cách a 40 Hình Biểu đồ so sánh kết recall đặc trƣng ảnh đặc trƣng ảnh kết hợp với giải ảnh huấn luyện theo cách a 40 Hình Sơ đồ khối dựa thông tin giải ảnh huấn luyện theo cách b 41 Hình Biểu đồ so sánh kết recall đặc trƣng ảnh đặc trƣng ảnh kết hợp với giải ảnh huyến luyện theo cách b 41 DANH MỤC BẢNG Bảng 1 So sánh kỹ thuật gán nhãn Bảng So sánh ƣu điểm nhƣợc điểm kỹ thuật gán nhãn Bảng Chú giải phổ biến tập NUS-WIDE 26 Bảng 2 Kết recall đặc trƣng sử dụng thuật toán K-NN 31 Bảng Kết recall đặc trƣng sử dụng thuật toán SVM 34 Bảng Ví dụ số kết khảo sát mối liên hệ giải (tag) nhãn (concept) 36 PHẦN MỞ ĐẦU Tính cấp thiết luận văn Những năm gần đây, phát triển khoa học công nghệ đặc biệt thiết bị chụp ảnh video nhƣ mạng Internet dẫn đến bùng nổ thơng tin đa phƣơng tiện Lƣợng lớn thơng tin hình ảnh, video với đa dạng chủ đề đƣợc lƣu trữ chia sẻ truy cập mạng Điều đồng nghĩa với yêu cầu thiết vấn đề lƣu trữ, quản lí truy cập liệu Gán nhãn ảnh tự động trở thành chủ đề nóng thách thức lớn xử lý thơng tin khoa học máy tính Mục tiêu kỹ thuật thiết lập trình mà hệ thống máy tính tự động gán cho đối tƣợng ảnh vài nhãn thông tin, vào ta dễ dàng tìm kiếm, phân loại truy xuất ảnh Hiện nay, kỹ thuật đƣợc sử dụng để phân loại truy xuất ảnh thƣờng sử dụng thông tin văn (text) từ nguồn thơng tin phụ trợ (metadata) liệu ví dụ nhƣ nhãn, giải (tag), bình luận (comment) ngƣời dùng (ví dụ nhƣ Google tìm kiếm văn bản) Tuy nhiên lúc thông tin có sẵn, xác, đặc biệt lại phụ thuộc lớn vào quan điểm ngƣời dùng nhƣ ngôn ngữ mà ngƣời dùng sử dụng Hơn việc mô tả ảnh vài từ khóa khơng phải công việc dễ dàng Việc gán nhãn ảnh tay cịn thực khó khăn tốn trở lên bất khả thi số lƣợng ảnh tăng lên nhanh chóng nhƣ Xu hƣớng gán nhãn ảnh cách tự động sử dụng trực tiếp nội dung ảnh (image content), gán nhãn cho ảnh đó, qua giúp dễ dàng quản lí ảnh nhƣ tìm kiếm ảnh Vấn đề ln nhận đƣợc quan tâm nhà nghiên cứu với hi vọng cải thiện độ xác, tốc độ xử lý, đa dạng độ khó tập ảnh Xu hƣớng chung nghiên cứu tìm đặc trƣng tốt việc đặc tả ảnh, qua cải thiện đƣợc độ xác q trình nhận dạng gán nhãn ảnh Một xu hƣớng đƣợc quan tâm sử dụng khai thác triệt để tất thơng tin có từ ảnh 48 42.Dong Liu, Shuicheng Yan, Xian-Sheng Hua, and Hong-Jiang Zhang (2011b), Image Retagging Using Collaborative Tag Propagation, IEEE Transactions on Multimedia 13, pp 702-712 43.Jing Liu, Yifan Zhang, Zechao Li, and Hanqing Lu (2013), Correlation Consistency Constrained Probabilistic Matrix Factorization for Social Tag Refinement, Neurocomputing 119, pp 3-9 44.D Lowe (2004), Distinctive image features from scale-invariant keypoint, Int’l J Computer Vision, 2(60), pp 91-110 45.Hao Ma, Jianke Zhu, Michael Rung-Tsong Lyu, and Irwin King (2010), Bridging the Semantic Gap Between Image Contents and Tags, IEEE Transactions on Multimedia 12, pp 462-473 46.Syaifulnizam Abd Manal and Md Jan Nordin (2009), “Review on statistical approaches for automatic image annotation”, international conference on electrical engineering and informatics 5-7, IEEE 978-14244-4913-2/09 47.B S Manjunath and W.Y Ma (1996), Texture features for browsing and retrieval of image data IEEE Transactions on Pattern Analysis and Machine Intelligence, 18(8), pp 837-842 48.Julian McAuley and Jure Leskovec (2012), Image Labeling on a Network: Using Social-network Metadata for Image Classification, In Proc of ECCV, pp 828-841 49.Philip McParlane, Stewart Whiting, and Joemon Jose (2013b), Improving Automatic Image Tagging Using Temporal Tag Co-occurrence, In Proc of MMM, pp 251-262 50.Philip J McParlane, Yashar Moshfeghi, and Joemon M Jose (2013a), On Contextual Photo Tag Recommendation, In Proc of ACM SIGIR, pp 965-968 51.Ryszard S Michalski (1993), Readings in Knowledge Acquisition and Learning, Morgan Kaufmann Publishers Inc., Chapter A Theory and Methodology of Inductive Learning, pp 323-348 49 52.M Naphade, J R Smith, J Tesic, S Chang, W Hsu, L Kennedy, A Hauptmann, and J Curtis (2006), A large-scale concept ontology for multimedia IEEE MultiMedia, 13, pp 86-91 53.Z Niu, G Hua, X Gao, and Q Tian (2014), Semi-supervised relational topic model for weakly annotated image recognition in social media, In CVPR 54.Zhenxing Niu, Gang Hua, Xinbo Gao, and Qi Tian (2014), Semi- supervised Relational Topic Model for Weakly Annotated Image Recognition in Social Media, In Proc of CVPR, pp 4233-4240 55.D K Park, Y S Jeon, and C S Won (2000), Efficient use of local edge histogram descriptor, In ACM Multimedia 56.Jose Costa Pereira, Emanuele Coviello, Gabriel Doyle, Nikhil Rasiwasia, Gert R.G Lanckriet, Roger Levy, and Nuno Vasconcelos (2014), On the Role of Correlation and Abstraction in Cross-Modal Multimedia Retrieval, IEEE Transactions on Pattern Analysis and Machine Intelligence 36, pp 521-535 57.Guo-Jun Qi, Charu Aggarwal, Qi Tian, Heng Ji, and Thomas Huang (2012), Exploring Context and Content Links in Social Media: A Latent Space Method, IEEE Transactions on Pattern Analysis and Machine Intelligence 34, pp 850-862 58.Xueming Qian, Xian-Sheng Hua, Yuan Yan Tang, and Tao Mei (2014), Social Image Tagging With Diverse Semantics, IEEE Transactions on Cybernetics 44, 12 (2014), pp 2493-2508 59.Zhiming Qian, Ping Zhong, and Runsheng Wang (2015), Tag Refinement for User-contributed Images via Graph Learning and Nonnegative Tensor Factorization, IEEE Signal Processing Letters 22, (2015), pp 13021305 60.Ba Quan Truong, Aixin Sun, and Sourav S Bhowmick (2012), Content is Still King: The Effect of Neighbor Voting Schemes on Tag Relevance for Social Image Retrieval, In Proc of ACM ICMR, 9:1-9:8 50 61.Fabian Richter, Stefan Romberg, Eva Horster, and Rainer Lienhart (2012), Leveraging Community Metadata for Multimodal Image Ranking, Multimedia Tools and Applications 56, (2012), pp 35-62 62.Jitao Sang, Changsheng Xu, and Jing Liu (2012a), User-Aware Image Tag Refinement via Ternary Semantic Analysis, IEEE Transactions on Multimedia 14, pp 883-895 63.Jitao Sang, Changsheng Xu, and Dongyuan Lu (2012b), Learn to Personalized Image Search From the Photo Sharing Websites, IEEE Transactions on Multimedia 14, pp 963-974 64.Jitao Sang, Changsheng Xu, and Jing Liu (2012a), User-Aware Image Tag Refinement via Ternary Semantic Analysis, IEEE Transactions on Multimedia 14, (2012), pp 883-895 65.Neela Sawant, Ritendra Datta, Jia Li, and James Z Wang (2010), Quest for Relevant Tags Using Local Interaction Networks and Visual Content, In Proc of ACM MIR, pp 231-240 66.L G Shapiro and G C Stockman (2003), Computer Vision, Prentice Hall 67.V Shirahatti and K Barnard (1996), “Method for Comparing Content Based Image Retrieval Methods” in Proceedings of the SPIE 2003, pp.18 (IJSIS '96), pp 261 68.Borkur Sigurbjornsson and Roelof Van Zwol (2008), Flickr Tag Recommendation based on Collective Knowl edge, In Proc of WWW, pp 327-336 69.C G M Snoek, M Worring, J C van Gemert, J.-M Geusebroek, and A W M Smeulders (2006), The challenge problem for automated detection of 101 semantic concepts in multimedia, In ACM Multimedia 70.Nitish Srivastava and Ruslan R Salakhutdinov (2014), Multimodal Learning with Deep Boltzmann Machines Journal of Machine Learning Research 15, (2014), pp 2949-2980 71.M Stricker and M Orengo (1995), Similarity of color images, In SPIE Storage and Retrieval for Image and Video Databases III 51 72.Aixin Sun, Sourav S Bhowmick, Nam Nguyen, Khanh Tran, and Ge Bai (2011), Tag-Based Social Image Retrieval: An Empirical Evaluation, Journal of the American Society for Information Science and Technology 62, pp 2364-2381 73.Ledyard R Tucker (1966), Some Mathematical Notes on Three-mode Factor Analysis Psychometrika 31, (1966), pp 279-311 74.Jakob Verbeek, Matthieu Guillaumin, Thomas Mensink, and Cordelia Schmid (2010), Image Annotation with TagProp on the MIRFLICKR Set, In Proc of ACM MIR, pp 537-546 75.Gang Wang, Derek Hoiem, and David Forsyth (2009), Building Text Features for Object Image Classification, In Proc of CVPR, pp 13671374, 462-473 76.L Wenyin, S Dumais, Y Sun, H J Zhang, M Czerwinski and B.Field (2002), “Semi Automatic Image Annotation” in 8th IFIP T.C 13Conference on Human-Computer Interaction, pp 326-333 77.C H Wiener, N Simou and Tzouvaras (2006), Image Annotation on the Semantic Web [Online].Available: http://www.w3.org/TR/2006/WDswbp-image-annotation-20060322 78.Lei Wu, Linjun Yang, Nenghai Yu, and Xian-Sheng Hua (2009), Learning to tag, In Proc of WWW, pp 361-370 79.Lei Wu, Rong Jin, and Anubhav K Jain (2013), Tag Completion for Image Retrieval, IEEE Transactions on Pattern Analysis and Machine Intelligence 35, (2013), pp 716-727 80.Hao Xu, Jingdong Wang, Xian-Sheng Hua, and Shipeng Li (2009), Tag Refinement by Regularized LDA, In Proc of ACM MM, pp 573-576 81.Xing Xu, Akira Shimada, and Rin-ichiro Taniguchi (2014), Tag Completion with Defective Tag Assignments via Image-Tag Reweighting, In Proc of ICME, pp 1-6 82.Yang Yang, Yue Gao, Hanwang Zhang, Jie Shao, and Tat-Seng Chua (2014), Image Tagging with Social Assistance, In Proc of ACM ICMR, pp 81-88 52 83.Zamir, S Ardeshir, and M Shah (2014), Gps-tag refinement using random walks with an adaptive damping factor, In CVPR 84.Guangyu Zhu, Shuicheng Yan, and Yi Ma (2010), Image Tag Refinement Towards Low-Rank, Content-Tag Prior and Error Sparsity, In Proc of ACM MM, pp 461-470 85.Xiaofei Zhu, Wolfgang Nejdl, and Mihai Georgescu (2014), An Adaptive Teleportation Random Walk Model for Learning Social Tag Relevance, In Proc of ACM SIGIR, pp 223-232 86.Guangyu Zhu, Shuicheng Yan, and Yi Ma (2010), Image Tag Refinement Towards Low-Rank, Content-Tag Prior and Error Sparsity, In Proc of ACM MM, pp 461-470 87.Shiai Zhu, Chong-Wah Ngo, and Yu-Gang Jiang (2012), Sampling and Ontologically Pooling Web Images for Visual Concept Learning, IEEE Transactions on Multimedia 14, (2012), pp 1068-1078 88.Jinfeng Zhuang and Steven C.H Hoi (2011), A Two-View Learning Approach for Image Tag Ranking, In Proc of ACM WSDM, pp 625634 PHỤ LỤC Danh sách 1,000 giải đƣợc lấy từ thông tin phụ trợ tập liêu NUSWIDE: abandoned 335 flora 669 picture abstract 336 florida 670 pictures action 337 flower 671 pier actor 338 flowers 672 pilot adorable 339 fly 673 pink adult 340 flying 674 pipes adults 341 foals 675 plane adventure 342 fog 676 plant aerial 343 food 677 plants 10 africa 344 football 678 plastic 11 african 345 forest 679 play 12 afternoon 346 formula 680 playing 13 agent 347 fountain 681 plaza 14 agua 348 fox 682 poland 15 air 349 frame 683 polar 16 aircraft 350 france 684 polaroid 17 airforce 351 free 685 pole 18 airplane 352 freedom 686 police 19 airplanes 353 french 687 politicians 20 airport 354 friend 688 politics 21 alaska 355 friends 689 pond 22 alberta 356 frost 690 pool 23 alley 357 frozen 691 pope 24 amazing 358 fruit 692 port 25 america 359 fun 693 portfolio 26 american 360 funeral 694 portland 27 amsterdam 361 funny 695 portrait 28 analog 362 furniture 696 portraits 29 ancient 363 game 697 portugal 30 angel 364 garden 698 post 31 angle 365 gardens 699 pottery 32 animal 366 gate 700 poverty 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 animals antenna antique antlers apartments apple april aquarium arch architecture arctic argentina arizona army art artist asia asian athlete atlanta atmosphere august austin australia austria auto automobile autumn aviation awesome baby backpack balcony ball balloons band 367 368 369 370 371 372 373 374 375 376 377 378 379 380 381 382 383 384 385 386 387 388 389 390 391 392 393 394 395 396 397 398 399 400 401 402 geometry georgia germany giant giraffe girl girls glacier glass glasses glow goat god gold golden golf gorgeous gothic graffiti grain graphic grass graveyard gray great greece green grey groom ground group guard guest gun guns hair 701 702 703 704 705 706 707 708 709 710 711 712 713 714 715 716 717 718 719 720 721 722 723 724 725 726 727 728 729 730 731 732 733 734 735 736 power prayer president pretty prison protest protesters public puppy pups purple pyramid quality quebec rabbit race racing radar raft rail railing railroad railway rain rainbow rainy rally range raw rays rebel red reef reefs reflection reflections 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 bank bar barcelona barge barn baseball basket basketball bathroom bay bazaar beach bear beards bears beautiful beauty belgium bench berlin best bicycle big bike bird birds black bleu blooms blossoms blue blur boat boats booby book 403 404 405 406 407 408 409 410 411 412 413 414 415 416 417 418 419 420 421 422 423 424 425 426 427 428 429 430 431 432 433 434 435 436 437 438 halloween hand handmade hands hangar happiness happy harbor harbour harvest hat hats hawaii hawk head health heart helicopter helicopters heritage high highway hiking hill hills historic historical history holiday holidays holland home hope horizon horns horse 737 738 739 740 741 742 743 744 745 746 747 748 749 750 751 752 753 754 755 756 757 758 759 760 761 762 763 764 765 766 767 768 769 770 771 772 refugees relief religion reptile restaurant retro rice rifles riot river road roadblock rock rocks rodent roma rome roof room rose ruin ruins run running runway rural rust rusty sad safari sail sailboat sailing sails sand save 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 boston boy boys branch brasil bravo brazil breathtaking brick bride bridge bridges bright brighton britain british brooklyn brown buddha buddhism buddhist bug building buildings bunny burma bus bush business butterfly cabin cables cactus cafe cake california 439 440 441 442 443 444 445 446 447 448 449 450 451 452 453 454 455 456 457 458 459 460 461 462 463 464 465 466 467 468 469 470 471 472 473 474 horses hospital host hot hotel house houseboat houses human hut ice iceland illinois illustration image images india indian individual indonesia industrial industry insect interesting interestingness interior international iran iraq ireland islam island islands israel istanbul italia 773 774 775 776 777 778 779 780 781 782 783 784 785 786 787 788 789 790 791 792 793 794 795 796 797 798 799 800 801 802 803 804 805 806 807 808 scenery scenic school science scientists scotland scuba sculpture sea seascape seaside seattle self sepia sewing shade shadow shadows sheep shell ship ships shirt shoes shooting shop shopping shops shore shot shrine sidewalk sigma sign signs silhouette 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 camera canada canal candid canoe canyon capital car caribou carpet cars castle cat cathedral cats cave ceiling cellphones cemetery center ceremony chair chairs chapel charts cheering cheerleader cheese chicago child chile china chinese christmas church circle 475 476 477 478 479 480 481 482 483 484 485 486 487 488 489 490 491 492 493 494 495 496 497 498 499 500 501 502 503 504 505 506 507 508 509 510 italians italy jail japan japanese jeep jet joy judge july jump june kauai kid kids kiss kit kitchen kitten kitty kuwait ladder lady lake lakes lamp land landing landscape landscapes lawn leaf leaves legs lens leopard 809 810 811 812 813 814 815 816 817 818 819 820 821 822 823 824 825 826 827 828 829 830 831 832 833 834 835 836 837 838 839 840 841 842 843 844 silhouettes silver singapore singing sitting skiing sky skyline skyscraper small smile smoke snake snow soccer social soft soldier soldiers south space spain speed spider sport sports spring square squirrel stadium stairs standing star stars state station 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200 201 202 203 204 205 206 207 208 209 210 211 212 city cityscape classic classroom cliff close closeup clothes clothing cloud clouds cloudy club coast coffee cold collage college color colorado colorful colors colour colourful colours commercials composition concert concrete construction contrast cool copyright coral costume cottage 511 512 513 514 515 516 517 518 519 520 521 522 523 524 525 526 527 528 529 530 531 532 533 534 535 536 537 538 539 540 541 542 543 544 545 546 library life light lighthouse lighting lights lily line lines lion little live lizard locomotive london lonely long look love lovely mac macro madrid magic magical malaysia maldives male males mall mammal man manhattan maps mar march 845 846 847 848 849 850 851 852 853 854 855 856 857 858 859 860 861 862 863 864 865 866 867 868 869 870 871 872 873 874 875 876 877 878 879 880 statue steam steel steps stone stones store storm storms stream street streets stripes structure studio stunning style submarine suburban subway suits summer sun sunglasses sunlight sunny sunrise sunset sunshine surf surreal sweden sweet swim swimming switzerland 213 214 215 216 217 218 219 220 221 222 223 224 225 226 227 228 229 230 231 232 233 234 235 236 237 238 239 240 241 242 243 244 245 246 247 248 country countryside county couple court cow cows crab craft crafts creative creek cross crowd cruise crystals cubism cubs culture cute dance dancing dark darkness dawn day dead death decay december decoration deer delete democrat demonstration desert 547 548 549 550 551 552 553 554 555 556 557 558 559 560 561 562 563 564 565 566 567 568 569 570 571 572 573 574 575 576 577 578 579 580 581 582 mare marine market marsh maryland massachusetts maui meadow meeting melbourne memorial men metal metro mexico michigan microphones military minnesota mirror missouri mist model modern monastery monks monochrome montreal monument moon moose morning mosque mosques moss mother 881 882 883 884 885 886 887 888 889 890 891 892 893 894 895 896 897 898 899 900 901 902 903 904 905 906 907 908 909 910 911 912 913 914 915 916 sydney taiwan talking tanker tanks telephones temple tennis tent texas texture textures thailand theater ties tiger time tokyo tollbooth tomb tornado toronto tortoise tour tourism tourist tower town toy toys track tracks traditional traffic trail train 249 250 251 252 253 254 255 256 257 258 259 260 261 262 263 264 265 266 267 268 269 270 271 272 273 274 275 276 277 278 279 280 281 282 283 284 design designs deutschland digital display dive diving dock documentary dog dogs doll door doorway downtown dramatic drawing dream dress driver drop drops drum dunes dusk dust dynamic eagle earth earthquake east egypt election elephant elephants elk 583 584 585 586 587 588 589 590 591 592 593 594 595 596 597 598 599 600 601 602 603 604 605 606 607 608 609 610 611 612 613 614 615 616 617 618 motion motorcycle mountain mountains movement movie mug mural museum music muslim national natural nature navy nederland needles neon netherlands nets nevada new news nice night nighttime north norway nose nsw oahu ocean october office officers ohio 917 918 919 920 921 922 923 924 925 926 927 928 929 930 931 932 933 934 935 936 937 938 939 940 941 942 943 944 945 946 947 948 949 950 951 952 transportation travel tree trees trip tropical truck trunk tulip tundra tunnel turkey tusks twilight umbrella underground underwater uniform united university urban utah vacation valley valleys vancouver vegetables vehicle victoria vietnam view village vintage virginia vivid volcano 285 286 287 288 289 290 291 292 293 294 295 296 297 298 299 300 301 302 303 304 305 306 307 308 309 310 311 312 313 314 315 316 317 318 319 320 engine england entertainment entrance environment eos europa europe evening excellence explore exposure eye eyes fab fabulous facade face faces factory fall family fan fantastic fantasy farm fashion fauna favorite fawn feline female fence festival field fields 619 620 621 622 623 624 625 626 627 628 629 630 631 632 633 634 635 636 637 638 639 640 641 642 643 644 645 646 647 648 649 650 651 652 653 654 oil oilfield old olympus ontario orange orchid oregon outdoor outdoors outside pacific paint painting paintings pair pakistan palace palm panorama paper parade paradise paris park party path pattern peace peaceful pebbles penguin pennsylvania people perfect person 953 954 955 956 957 958 959 960 961 962 963 964 965 966 967 968 969 970 971 972 973 974 975 976 977 978 979 980 981 982 983 984 985 986 987 988 waiting wales walk walking wall wallpaper war warehouse washington water waterfall waterfalls waterways wave waves weapons weather wedding west wet white wide wild wildlife wind window windows windy wing wings winter wisconsin wolf woman wonder wonderful 321 322 323 324 325 326 327 328 329 330 331 332 333 334 fighter figures film finland firefighter fish fisheye fishing flag flags flash flight flood floor 655 656 657 658 659 660 661 662 663 664 665 666 667 668 perspective pet petals pets philadelphia philippines phone photo photograph photographer photographers photography photojournalism photos 989 990 991 992 993 994 995 996 997 998 999 1000 wood woods work world wow writing yellow york young youth zebra zoo ... kết cải thiện nhiều so với việc sử dụng vector đặc trƣng để gán nhãn tự động cho ảnh Việc sử dụng giải ảnh huấn luyện để tìm nhãn chung để gán cho ảnh kiểm thử cho kết cao việc sử dụng giải ảnh. .. gán nhãn tự động cho ảnh sử dụng vector đặc trƣng để mô tả ảnh Ý tƣởng quan trọng gán nhãn ảnh cách so sánh ảnh cần gán nhãn với ảnh biết nhãn tập huấn luyện Việc so sánh thực trực tiếp hai ảnh. .. (i) Nghiên cứu việc sử dụng kết hợp nhiều loại đặc trƣng ảnh (low level image features) để mô tả biểu diễn ảnh (ii) Sử dụng kết hợp nguồn thông tin phụ trợ nhƣ thông tin văn (nhãn, giải…), nhằm