1. Trang chủ
  2. » Luận Văn - Báo Cáo

Nghiên cứu ứng dụng hog trong nhận dạng đối tượng luận văn thạc sĩ ngành công nghệ thông tin

67 0 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 67
Dung lượng 1,79 MB

Nội dung

BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƢỜNG ĐẠI HỌC GIAO THƠNG VẬN TẢI TRẦN ĐÌNH NAM NGHIÊN CỨU ỨNG DỤNG HOG TRONG NHẬN DẠNG ĐỐI TƢỢNG LUẬN VĂN THẠC SĨ KỸ THUẬT TP.HỒ CHÍ MINH - 2019 BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƢỜNG ĐẠI HỌC GIAO THÔNG VẬN TẢI TRẦN ĐÌNH NAM NGHIÊN CỨU ỨNG DỤNG HOG TRONG NHẬN DẠNG ĐỐI TƢỢNG NGÀNH: CÔNG NGHỆ THÔNG TIN MÃ SỐ: 8.48.02.01 LUẬN VĂN THẠC SĨ KỸ THUẬT NGƢỜI HƢỚNG DẪN KHOA HỌC TS BÙI NGỌC DŨNG TP.HỒ CHÍ MINH - 2019 TRÍCH YẾU LUẬN VĂN CAO HỌC Họ tên học viên: Trần Đình Nam Năm sinh: 1990 Cơ quan cơng tác: Khóa: 25.1 Chun ngành: Cơng nghệ thơng tin Mã số: 8480201 Giáo viên hƣớng dẫn: TS Bùi Ngọc Dũng Tên luận văn: “Nghiên cứu ứng dụng HOG nhận dạng đối tượng” Mục đích nghiên cứu:  Nghiên cứu phƣơng pháp trích trọn đặc trƣng nhận dạng đối tƣợng  Nghiên cứu phƣơng pháp phân loại  Xây dựng đƣợc chƣơng trình nhận dạng xe ô tô Phương pháp nghiên cứu kết đạt được:  Phƣơng pháp nghiên cứu: Đọc hiểu tài liệu, khảo sát nghiên cứu có Tiến tới, đề xuất áp dụng phƣơng pháp HOG (Histogram of oriented gradient) cho việc phân loại xe ô tô với phƣơng tiện khác ảnh trích xuất từ video Phân tích, đánh giá kết đạt đƣợc từ chƣơng trình thực nghiệm  Kết đạt đƣợc: Đã khảo sát tìm hiểu đƣợc số phƣơng pháp xử lý ảnh Nghiên cứu đƣợc phƣơng pháp trích chọn đặc trƣng số phân loại Tiến tới, xây dựng đƣợc ứng dụng nhận dạng ô tô HOG phân loại SVM i Điểm bình qn mơn học: Điểm bảo vệ luận văn: Tp.HCM, ngày tháng năm 2019 Xác nhận giáo viên hƣớng dẫn Học viên thực Xác nhận khoa Trần Đình Nam ii LỜI CAM ĐOAN Tôi xin cam đoan công trình nghiên cứu riêng tơi Các kết đƣợc nêu luận văn trung thực chƣa đƣợc cơng bố cơng trình nghiên cứu khác Mọi trích dẫn luận văn đƣợc rõ nguồn gốc Các kết nghiên cứu chung với tác giả khác đƣợc đồng tác giả đồng ý trƣớc đƣa vào luận văn Tác giả Trần Đình Nam iii LỜI CẢM ƠN Để thực đề tài nghiên cứu hoàn thành luận văn này, nhận đƣợc nhiều giúp đỡ cá nhân tập thể Nhân dịp này, xin gửi lời cảm ơn chân thành tới: Thầy hƣớng dẫn – TS Bùi Ngọc Dũng giảng viên Khoa CNTT trƣờng Đại học Giao thơng vận tải tận tình bảo, hƣớng dẫn tơi suốt q trình thực đề tài hoàn thành luận văn Với lịng kính trọng biết ơn sâu sắc tơi xin gửi tới Thầy lời cảm ơn chân thành nhất! Lãnh đạo trƣờng Đại học Giao thơng vận tải, phịng Đào tạo sau đại học, khoa Công nghệ thông tin tập thể cán bộ, giảng viên khoa Công nghệ thông tin tạo điều kiện giúp đỡ suốt q trình nghiên cứu Sau hết, tơi xin cảm ơn quan tâm, khích lệ gia đình, bạn bè thân hữu động viên tinh thần giúp vƣợt qua khó khăn để hồn thành luận văn Tơi xin chân thành cảm ơn! iv MỤC LỤC TRÍCH YẾU LUẬN VĂN CAO HỌC i LỜI CAM ĐOAN ii LỜI CẢM ƠN iv MỤC LỤC v DANH MỤC CÁC BẢNG .vii DANH MỤC CÁC KÝ HIỆU, VIẾT TẮT viii DANH MỤC CÁC HÌNH VẼ ix MỞ ĐẦU CHƢƠNG 1: TỔNG QUAN VỀ NHẬN DẠNG ĐỐI TƢỢNG 1.1 Giới thiệu nhận dạng đối tƣợng 1.1.1 Định nghĩa toán nhận dạng đối tƣợng 1.1.2 Các yếu tố ảnh hƣởng đến nhận dạng đối tƣợng 1.1.3 Các ứng dụng nhận dạng đối tƣợng 1.1.4 Kiến trúc hệ thống nhận dạng đối tƣợng 1.2 Một số phƣơng pháp nhận dạng đối tƣợng 1.2.1 Hƣớng tiếp cận dựa tri thức 1.2.2 Hƣớng tiếp cận dựa đặc trƣng bất biến 10 1.2.3 Hƣớng tiếp cận dựa so sánh khớp mẫu 11 1.2.4 Hƣớng tiếp cận dựa diện mạo 11 1.3 Đánh giá phƣơng pháp 12 1.3.1 Đánh giá hƣớng tiếp cận dựa cở sở tri thức 12 1.3.2 Đánh giá hƣớng tiếp cận dựa đặc trƣng bất biến 13 1.3.3 Đánh giá hƣớng tiếp cận dựa so khớp mẫu 13 1.3.4 Đánh giá hƣớng tiếp cận dựa diện mạo 14 CHƢƠNG 2: CÁC PHƢƠNG PHÁP TRÍCH CHỌN ĐẶC TRƢNG 15 2.1 Một số phƣơng pháp trích chọn đặc trƣng 15 2.1.1 Phƣơng pháp trích chọn đặc trƣng Gabor 15 v 2.1.2 Hình ảnh lịch sử chuyển động (motion history image) 19 2.1.3 Local binary pattern (LBP) 22 2.1.4 Scale-invariant feature transform 24 2.2 Đặc trƣng HOG (Histogram of oriented gradient) 27 2.2.1 Vector gradient 27 2.2.2 Tính tốn gradients 29 2.2.3 Gán hƣớng cho gradient 29 2.2.4 Tính tốn histogram cho cell khối 29 2.2.5 Chuẩn hoá khối 30 2.3 Một số phân loại 31 2.3.1 Support vector machine (SVM) 31 2.3.2 k-láng giềng gần (k-nearest neighbors) 32 2.3.3 Phân loại Bayes (Bayes classification) 35 CHƢƠNG 3: NHẬN DẠNG PHƢƠNG TIỆN Ô TÔ BẰNG HOG VÀ SVM 36 3.1 Dữ liệu huấn luyện 36 3.2 Tổng quan hệ thống 37 3.3 Tính tốn đặc trƣng 39 3.4 Huấn luyện liệu 41 3.5 Kết 41 KẾT LUẬN VÀ HƢỚNG PHÁT TRIỂN 52 TÀI LIỆU THAM KHẢO 54 vi DANH MỤC CÁC BẢNG Bảng 3.1 Môi trƣờng thực nghiệm 39 vii DANH MỤC CÁC KÝ HIỆU, VIẾT TẮT KÝ HIỆU, VIẾT TẮT DIỄN GIẢI MHI Motion history image LBP Local Binary Pattern SVM Support vector machine SIFT Scale Invariant Feature Transform PCA Principal Components Analysis DoG Difference of Gaussian HOG Histogram of oriented gradient viii Hình 3.7 Quá trình trƣợt cửa số để phát xe 42 43 44 45 46 - Ảnh chụp đƣờng Việt nam: 47 48 49 50 51 KẾT LUẬN VÀ HƢỚNG PHÁT TRIỂN Quá trình tìm hiểu thực thiện luận văn mang lại nhiều kết tích cực, bên cạnh cịn số khó khăn, hạn chế nhƣ sau: Kết đạt đƣợc - Tìm hiểu đƣợc yếu tố ảnh hƣởng kiến trúc mơ hình nhận dạng đối tƣợng - Nghiên cứu đƣợc số phƣơng pháp trích chọn đặc trƣng - Nghiên cứu đƣợc phƣơng pháp nhận dạng đối tƣợng số phân loại - Đã khảo sát tìm hiểu đƣợc số phƣơng pháp xử lý ảnh - Tiến tới, áp dụng phƣơng pháp HOG cho rút trích đặc trƣng ảnh, sau phân loại ảnh xe tơ dùng SVM Khó khăn hạn chế - Chƣa nghiên cứu đƣợc sâu số thuật tốn trích chọn đặc trƣng ảnh để áp dụng so sánh - Chất lƣợng phần cứng hạn chế, chƣa đủ thể thiết lập cho mơ hình địi hỏi cấu hình cao - Số phƣơng pháp đƣợc áp dụng chƣa nhiều chƣa có kết hợp để mang lại hiệu cao - Cơ sở liệu hạn chế, chƣa áp dụng mơ hình nhận dạng đối tƣợng bị che khuất - Chƣa thử nghiệm đƣợc số sở liệu khác nhằm để chứng minh hiệu HOG Hƣớng phát triển - Cập nhật sở liệu đa dạng để tăng tính khả cho mơ hình áp dụng vào thực tế 52 - Sử dụng phần cứng mạnh nhanh để triển khai mơ hình vào hệ thống trực tuyến điều kiện sử dụng camera giám sát - Phát triển giải pháp song song để tăng hiệu suất cho mơ hình áp dụng với nhiều camera giám sát khác 53 TÀI LIỆU THAM KHẢO A.Yuille, P.H.,and D.Cohen (1992), Feature Extraction from Faces Using Deformable Templates, in Computer Vision A F Bobick and J W Davis (2001), The recognition of human movement using temporal templates, IEEE transactions on pattern analysis and machine intelligence, 23(3), pp.257– 267, March 2001 Atreyee Sinha, Sugata Banerji, Chengjun Liu (2014), New color GPHOG descriptors for object and scene image classification, Mach Vis Appl 25(2), pp.361-375 Bo Yang, Songcan Chen (2013), A comparative study on local binary pattern (LBP) based face recognition: LBP histogram versus LBP image, Neurocomputing 120, pp.365-379 Chengjun Liu, Harry Wechsler (2002), Gabor feature based classification using the enhanced fisher linear discriminant model for face recognition, IEEE Trans Image Processing 11(4), pp 467-476 D.J.Hand, W.E.Henley (1996), A K nearest neighbour classifier for assessing consumer credit risk, JStor David Lowe (1999), The SIFT (Scale Invariant Feature Transform) Detector and Descriptor, University of British Columbia Fuzhen Huang and Jianbo Su (2004), “Multiple Face Contour Detection Using adaptive Flows”, Sinobiometrics 2004, LNCS 3338, pp 137-143, Springer-Verlag Berlin Heidelberg G.Yang,T.S.H(1994), ed Human Face Detection in Complex Background Vol 27, pp 53-63 10 H.Rowley, S.B., and T.Kanade (1996), ed Human Face Detection in Visual Scenes Advances in Neural Information Processing Systems 8, pp 875 881 54 11 H.Rowley, S.B., and T.Kanade (1996), ed Neural Network- Based Face Detection Computer Vision and Pattern Recognition, pp 203 - 208 12 I.Craw, H.E., and J.Lishman (1987), ed Automatic Extraction of Face Features ed P.R Letters Vol 5, pp 183-187 13 Kolsch, M and M Turk (2004) Robust Hand Detection, in Conference on Automatic Face and Gesture Recognition 2004: IEEE Intl 14 K.C.Yow, R.Cipolla (1997), Feature-based Human Face Detection, Image and Vision Computing, 15(9), pp 713-735 15 Lowe D G (2004), Distinctive Image Features from Scale-Invariant Keypoints, International Journal of Computer Vision Vol.60 Issue 2, pp 91 - 110 16 Navneet Dalal and Bill Triggs (2005), Histograms of Oriented Gradients for Human Detection, Conference on Computer Vision and Pattern Recognition 2005, 20-25 June 2005 17 Nabila Mansouri, Yousra Ben Jemaa, Eric Watelain (2016), Optimized HOG Descriptor for on Road Cars Detection ICDSC 2016, pp 166-171 18 T.Kanade (1973), Picture Processing Computer Complex and Recognition of Human Faces 1973, Kyoto 19 T.K.Leung, M.C.B., and P.Perona (1995) Finding Faces in Cluttered Scenes Using Random Labeled Graph Matching, in Computer Vision 20 T.Sakai, M.N., and S.Fujibayash (1969), ed Line Extraction and Pattern Detection in a Photograph, ed P Recognition, pp 233 - 248 21 T.Poggio, K.-K.S.a (1998), ed Example-Based Learning for View-Based Human Face Detection ed P.A.a.M Intelligence Vol 20, pp 39-51 22 T Ojala, M Pietikäinen, and D Harwood (1996), "A Comparative Study of Texture Measures with Classification Based on Feature Distributions", Pattern Recognition, vol 29, pp 51-59 55 23 Taher Khadhraoui, Faouzi Benzarti, Hamid Amiri (2017), Gabor-featurebased local generic representation for face recognition with single sample per person SERA 2017, pp 157-160 24 Vapnik V (1999), The Nature of Statistical Learning Theory Springer, 2nd edition 25 http://en.wikipedia.org/wiki/Scale-invariant_feature_transform 56

Ngày đăng: 31/05/2023, 09:02

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w