Nghiên cứu mô hình học từ đIển thưa ứng dụng trong nhận dạng ảnh thóc giống Nghiên cứu mô hình học từ đIển thưa ứng dụng trong nhận dạng ảnh thóc giống Nghiên cứu mô hình học từ đIển thưa ứng dụng trong nhận dạng ảnh thóc giống luận văn tốt nghiệp,luận văn thạc sĩ, luận văn cao học, luận văn đại học, luận án tiến sĩ, đồ án tốt nghiệp luận văn tốt nghiệp,luận văn thạc sĩ, luận văn cao học, luận văn đại học, luận án tiến sĩ, đồ án tốt nghiệp
ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CƠNG NGHỆ PHẠM THỊ LAN ANH NGHIÊN CỨU MƠ HÌNH HỌC TỪ ĐIỂN THƯA ỨNG DỤNG TRONG NHẬN DẠNG THÓC GIỐNG LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN HÀ NỘI - 2018 ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ PHẠM THỊ LAN ANH NGHIÊN CỨU MƠ HÌNH HỌC TỪ ĐIỂN THƯA ỨNG DỤNG TRONG NHẬN DẠNG THĨC GIỐNG LUẬN VĂN THẠC SĨ CƠNG NGHỆ THƠNG TIN Cán hướng dẫn: PGS TS Nguyễn Thị Thủy Cán đồng hướng dẫn: PGS TS Lê Thanh Hà HÀ NỘI, 2018 LỜI CAM ĐOAN Tôi xin cam đoan kết nghiên cứu, thực nghiệm trình bày luận văn thực hướng dẫn Phó giáo sư - Tiến sĩ Nguyễn Thị Thuỷ Phó giáo sư - Tiến sĩ Lê Thanh Hà Tất tham khảo từ nghiên cứu liên quan nêu nguồn gốc cách rõ ràng từ danh mục tài liệu tham khảo luận văn Trong luận văn, khơng có việc chép tài liệu, cơng trình nghiên cứu người khác mà không rõ tài liệu tham khảo TÁC GIẢ LUẬN VĂN Phạm Thị Lan Anh LỜI CẢM ƠN Trước tiên, xin gửi lời cảm ơn sâu sắc đến giáo: Phó giáo sư - Tiến sĩ Nguyễn Thị Thuỷ thầy giáo: Phó giáo sư - Tiến sĩ Lê Thanh Hà, tận tình hướng dẫn tơi suốt trình thực luận văn tốt nghiệp Cảm ơn thầy giáo - Tiến sĩ Trần Quốc Long có góp ý, nhận xét quý giá giúp hồn thiện nội dung nghiên cứu tơi luận văn Tôi xin bày tỏ lời cảm ơn chân thành tới trường Đại học Công Nghệ - ĐHQG Hà Nội thầy cô giáo giảng dạy, truyền thụ kiến thức cho thời gian qua với quan tâm động viên khích lệ tinh thần thành viên phịng thí nghiệm Tương tác người máy HMI – Đại học Công nghệ, Đại học Quốc Gia Hà Nội Tôi cảm ơn đồng nghiệp Khoa Công nghệ thông tin, đặc biệt Bộ mơn Khoa học máy tính – Học viện Nông nghiệp Việt Nam tạo điều kiện hỗ trợ tốt để tơi tập trung hồn thành việc học cao học bảo vệ luận văn thạc sĩ Cuối cùng, xin cảm ơn tất gia đình, bạn bè ln động viên giúp đỡ tơi thời gian nghiên cứu đề tài Tuy có cố gắng định thời gian trình độ có hạn nên luận văn cịn nhiều thiếu sót hạn chế Kính mong nhận góp ý quý thầy cô bạn TÁC GIẢ LUẬN VĂN Phạm Thị Lan Anh MỤC LỤC Lời cam đoan iii Lời cảm ơn iv Mục lục v Danh mục ký hiệu chữ viết tắt Danh mục hình vẽ Danh mục bảng biểu Giới thiệu Chương Mơ hình học từ điển mã thưa 1.1 Biểu diễn thưa học từ điển 1.1.1 Biểu diễn thưa 1.1.2 Học từ điển .8 1.1.3 Mơ hình học từ điển mã thưa 1.2 Xây dựng mơ hình học từ điển mã thưa 10 1.2.1 Giới thiệu họ chuẩn 10 1.2.2 Xác định mã thưa xây dựng từ điển học 15 1.3 Một số mơ hình học từ điển ứng dụng cho phân lớp .18 1.3.1 Mơ hình học từ điển có đảm bảo tính thưa 19 1.3.2 Mơ hình học từ điển khơng cần đảm bảo tính thưa .21 Chương Bài toán nhận dạng ảnh ứng dụng 24 2.1 Tổng quan toán nhận dạng 24 2.1.1 Giới thiệu thị giác máy tính 24 2.1.2 động Bài toán nhận dạng ảnh quy trình thực hệ nhận dạng ảnh tự .26 2.2 Ứng dụng nhận dạng ảnh 29 Chương Cài đặt kết thực nghiệm .32 3.1 Mơ tả tốn 33 3.1.1 Dữ liệu 34 3.1.2 Cài đặt 36 3.2 Kết đạt 37 3.3 Thảo luận ảnh hưởng ràng buộc thưa vào kết nhận dạng 43 Chương Kết luận hướng phát triển 45 Tài liệu tham khảo 46 Phụ lục 49 DANH MỤC KÝ HIỆU VÀ CHỮ VIẾT TẮT CS Compressed Sensing DPL Dictionary Pair Learning K-SVD K-means Singular Value Decomposition LC-KSVD Label Consistent K-means Singular Value Decomposition MP Matching Pursuit NSL Nyquist Sampling Law OMP Orthogonal Matching Pursuit RF Random Forest SAD Sum of Absolute Difference SSD Sum of Squared Difference SST Shannon’ Sampling Theorem SVM Support Véc-tơ Machine DANH MỤC HÌNH VẼ Hình 1.1 Mẫu ảnh đa mức xám biểu diễn dày Hình 1.2 Ảnh đa mức xám với biểu diễn thưa Hình 1.3 Mơ tả giải pháp tối thiểu hóa số chuẩn khơng gian 2-D 14 Hình 2.1 Một số ví dụ thuật tốn thị giác máy 26 Hình 2.2 Một số ví dụ ứng dụng nhận dạng mẫu ảnh 27 Hình 2.3.Quy trình thực hệ nhận dạng ảnh tự động 28 Hình 3.1.Ảnh hạt thóc giống thóc khác trở thành liệu mẫu cho việc học mơ hình 34 Hình 3.2.Biểu đồ thể hiệu suất mơ hình LC-KSVD DPL 39 Hình 3.3.Biểu đồ so sánh tổng thời gian học kiểm tra mơ hình LC-KSVD1, LCKSVD2, DPL 41 Hình 3.4.Biểu đồ tổng hợp kết phân loại mơ hình học từ điển, SVM RF 43 Hình phụ lục 1.Sơ đồ trình nhận dạng biển số xe 49 Hình phụ lục 2.Ảnh biển số xe sau thu nhận phân tách 50 Hình phụ lục 3.Hiệu suất phân lớp mơ hình LC-KSVD DPL 54 Hình phụ lục 4.Thời gian học kiểm tra mơ hình LC-KSVD 1, LC-KSVD 2, DPL 55 DANH MỤC BẢNG BIỂU Bảng 3.1.Thống kê số lượng liệu ảnh giống thóc 35 Bảng 3.2.Kết thay đổi tham số sparsitythres giống Bắc thơm 36 Bảng 3.3.Kết thay đổi tham số DictSize giống thóc Bắc thơm 37 Bảng 3.4.Kết phân lớp LC-KSVD1, LC-KSVD2 DPL 38 Bảng 3.5.Thời gian học mơ hình kiểm tra LC-KSVD DPL 40 Bảng phụ lục 1.Số lượng biển số xe thu nhận 50 Bảng phụ lục 2.Số lượng ký tự tách từ biển số xe 51 Bảng phụ lục 3.Số lượng mẫu toán nhận dạng 10 ký tự 52 Bảng phụ lục 4.Số lượng mẫu toán nhận dạng 14 ký tự 52 Bảng phụ lục 5.Số lượng mẫu toán nhận dạng mẫu 53 Bảng phụ lục 6.Hiệu suất phân lớp LC-KSVD 1, LC-KSVD DPL 54 Bảng phụ lục 7.Thời gian học kiểm tra mơ hình LC-KSVD 1, LC-KSVD 2, DPL 54 GIỚI THIỆU Phương pháp biểu diễn thưa (Sparse represetation) phương pháp đại diện tiêu biểu cho phương pháp biểu diễn tuyến tính [5] chứng minh giải pháp mạnh mẽ cho nhiều lĩnh vực ứng dụng, đặc biệt xử lý tín hiệu, xử lý hình ảnh, học máy, thị giác máy tính Biểu diễn thưa cho thấy tiềm phát triển cho nhiều toán ảnh khử nhiễu ảnh, nén ảnh, khôi phục ảnh, phân loại hình ảnh, phân vùng hình ảnh Sự kết hợp phương pháp biểu diễn thưa dựa từ điển (Dictionary learning) học từ tín hiệu mẫu ban đầu giúp cho mơ hình học từ điển thưa (Dictionary learning and sparse coding) trở thành mơ hình mạnh để biểu diễn tín hiệu ưa chuộng từ bắt đầu hình thành ngày Ban đầu, mơ hình quan tâm đến lớp tốn biểu diễn lại tín hiệu cách thưa thớt phải đảm bảo khả khôi phục tốt Trong năm gần đây, với phát triển khoa học kỹ thuật đòi hỏi từ ứng dụng thực tế, nhà nghiên cứu mơ hình học từ điển thưa cải tiến mơ hình cổ điển thành mơ hình có tính cạnh tranh việc giải toán phân loại/nhận dạng, đặc biệt phân loại/nhận dạng ảnh số Trong luận văn này, tơi tìm hiểu lý thuyết biểu diễn thưa phương pháp để xây dựng mơ hình học từ điển thưa đồng thời trình bày hai hướng phát triển mơ hình học từ điển: mơ hình học từ điển đảm bảo tính thưa mơ hình học từ điển khơng cần đảm bảo tính thưa Sau đó, tơi triển khai cài đặt hai mơ hình đại diện cho hai hướng mơ hình học từ điển với nhãn phù hợp (LC-KSVD) – tiêu biểu cho mơ hình học từ điển đảm bảo thưa mơ hình cặp từ điển (DPL) – tiêu biểu cho mơ hình học từ điển khơng đảm bảo thưa liệu ảnh thóc giống thu nhận từ thực tế Việt Nam Việc áp dụng mơ hình học từ điển liệu ký tự biển số xe (được trình bày phần Phụ lục luận văn này) nhằm mục đích đánh giá sơ khả ứng dụng mơ hình với tốn nhận dạng ảnh để làm tiền đề cho toán nhận dạng thóc giống Ngồi ra, việc áp dụng mơ hình hai liệu khác với đặc điểm, khó khăn khác giúp tơi có đánh giá khách quan mơ hình học từ điển đảm bảo thưa khơng đảm bảo thưa Từ đưa nhận xét hai dạng mơ hình học từ điển đề xuất hướng ứng dụng mơ hình học từ điển thưa Ngoài phần giới thiệu tài liệu tham khảo, luận văn gồm chương với nội dung sau đây: 41 Thời gian học kiểm tra mơ hình học từ điển 70 60 50 40 30 20 10 Time Tr + Tt - LC_KSVD1 Time Tr + Tt - LC_KSVD2 Time Tr + Tt - DPL Hình 3.3.Biểu đồ so sánh tổng thời gian học kiểm tra mơ hình LC-KSVD1, LCKSVD2, DPL Nội dung luận văn đề cập đến kết thử nghiệm liệu với số mơ hình phân lớp ưa chuộng SVM với RF cho kết bảng 3.6 hình 3.4 Phần cài đặt hai mơ hình SVM RF thực nhóm nghiên cứu đề tài Phó giáo sư – Tiến sĩ Nguyễn Thị Thủy đóng vai trị chủ nhiệm đề tài Kết chưa công bố công khai, sử dụng kết để làm minh chứng so sánh mô hình học từ điển với hai mơ hình ưa chuộng kết có giá trị tham khảo luận văn 42 Bảng 3.6.Kết phân lớp SVM RF Tên thóc giống SVM RF ACC ACC Bắc thơm 0.91 0.971 BC – 15 0.875 0.862 Hương thơm 0.803 0.886 J – 02 0.811 0.976 Khang dân 18 0.672 0.922 N 97 0.853 0.973 Nếp 87 0.764 0.956 Q5 0.741 0.898 TBR1 0.729 0.93 TBR36 0.867 0.953 TBR45 0.686 0.879 TCH 0.771 0.931 TH3-3 0.734 0.93 TH3-4 0.718 0.9 TH3-5 0.736 0.904 Thiên ưu 0.791 0.936 Thơm RVT 0.844 0.956 Việt lai 20 0.748 0.877 VS1 0.823 0.953 Xi 23 0.656 0.886 43 Kết phân lớp 1.2 0.8 0.6 0.4 0.2 Acc - LC_KSVD1 Acc - LC_KSVD2 Acc - DPL ACC - SVM ACC - RF Hình 3.4.Biểu đồ tổng hợp kết phân loại mơ hình học từ điển, SVM RF Từ kết thực nghiệm với mơ hình khác thấy LC-KSVD phân lớp tốt SVM số giống thóc Nếp 87 hay Thiên ưu 8; nhiên hầu hết giống thóc cịn lại chưa đạt kết mong muốn Vì vậy, với kết cho thấy mơ hình LC-KSVD với giá trị tham số chưa thật phù hợp với liệu thóc giống quan tâm 3.3 Thảo luận ảnh hưởng ràng buộc thưa vào kết nhận dạng Từ thực nghiệm hai liệu: nhận dạng thóc giống trình bày Chương nhận dạng ký tự biển số xe trình bày Phụ lục, nhận thấy thời gian tính tốn xây dựng mơ hình mơ hình học từ điển khơng đảm bảo thưa (DPL) nhanh vài lần, gần trăm lần (trong thực nghiệm với thóc giống), chí vài chục nghìn lần (trong thực nghiệm ký tự biển số xe ) so với mơ hình học từ điển đảm bảo thưa (LCKSVD) kết phân loại cạnh tranh Do việc theo đuổi biểu diễn thưa có thật đóng vai trị quan trọng cho việc phân lớp hay không vấn đề cần nghiên cứu thêm Kết thực nghiệm luận văn củng cố cho giả thiết biểu diễn thưa yếu tố định cho mơ hình học từ điển phân lớp tốt Như qua kết nghiên cứu lý thuyết tổng quan thực nghiệm cài đặt hai mô hình học từ điển hai liệu khác nhau, nhận thấy việc mơ hình học từ điển đảm bảo 44 thưa (như LC-KSVD) có vài nhược điểm Đầu tiên, tín hiệu đầu vào Y có số chiều cao đẩy số chiều từ điển học lên cao dẫn tới việc hiệu cho lưu trữ liệu, thuật tốn học mơ hình kiểm tra với yêu cầu đảm bảo biểu diễn thưa trở nên phức tạp phải tính tốn với từ điển học số chiều cao, đặc biệt “big data” ứng dụng có số chiều lớn Hơn nữa, với mơ hình học từ điển thưa việc biểu diễn thưa yếu tố định hiệu biểu diễn, biểu diễn thưa lại nhạy cảm với việc xoay kéo dãn kích thước (do thay đổi khiến việc tính tốn hệ số biểu diễn bị thay đổi theo) dẫn tới việc tạo sai khác đủ lớn để thay đổi lớp hình ảnh đối tượng xoay kéo dãn Thứ hai, tham số dùng cho xây dựng mơ hình phức tạp bao gồm trọng số phân lớp, tham số đảm bảo thưa có tham số phù hợp nhãn Các tham số đòi hỏi phải thử chọn nhiều thời gian để có tham số phù hợp cho hiệu suất tốt 45 CHƯƠNG KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN Qua trình thực luận văn, tác giả tìm hiểu lý thuyết tổng quan thị giác máy toán nhận dạng mẫu ảnh, đồng thời tìm hiểu thêm số mơ hình học máy (SVM, RF, Dictionary Learning and Sparse Coding) Cụ thể, tác giả sâu tìm hiểu lý thuyết ứng dụng mơ hình học từ điển, nghiên cứu vai trò biểu diễn thưa toán phân lớp với việc so sánh mặt lý thuyết xây dựng mơ hình lẫn thực nghiệm với hai mơ hình đại diện cho hai hướng phát triển mơ hình học từ điển mơ hình học từ điển đảm bảo thưa (LC-KSVD) mơ hình học từ điển không đảm bảo thưa (DPL) Từ hiểu biết tạo tảng cho trình học tập nghiên cứu thân lĩnh vực thị giác máy tính Về mặt thực tiễn, luận văn trình bày mơ hình học từ điển vừa có khả biểu diễn liệu tốt, vừa phù hợp với phân lớp liệu Luận văn đề xuất ứng dụng mơ hình vào liệu thực tế Việt Nam với việc cài đặt tham số để mơ hình phù hợp với toán Về mặt lý luận, luận văn củng cố cho nhận định vai trò biểu diễn thưa xây dựng mơ hình học từ điển khiến chi phí thời gian tăng đáng kể khơng thật giúp cho mơ hình học từ điển tăng hiệu suất phân loại Để có tốt cho nhận định này, tác giả dự kiến cài đặt mơ hình nhiều liệu khác Ngồi ra, tác giả nhận thấy mơ hình học từ điển LC-KSVD gặp khó khăn lớn với liệu số chiều cao từ điển học kích thước lớn Vì vậy, tác giả dự kiến tìm hiểu thêm kỹ thuật giúp từ mơ hình từ điển LC-KSVD rời rạc (incoherent) để loại bỏ từ dư thừa với mong muốn cải tiến mơ hình LC-KSVD phù hợp với toán phân lớp 46 TÀI LIỆU THAM KHẢO Tài liệu tiếng Việt [1] [2] [3] Nguyễn Đức Tuấn: Học từ điển khơng thưa cho tốn phân loại ảnh Đồ án tốt nghiệp Đại học Bách khoa Hà Nội (2015) Nguyễn Việt Anh : Phát ngã sử dụng đặc trưng chuyển động hình dạng thể dựa camera đơn Luận văn thạc sĩ Đại học Công nghệ Đại học Quốc Gia Hà Nội (2017) Phan Thi Thu Hong, Tran Thi Thanh Hai, Le Thi Lan, Vo Ta Hoang, Nguyen Thi Thuy (2015) “Identification of seeds of different rice varieties using image processing and computer vision techniques”, J Sci & Devel 2015, Vol 13, No 6: 1036-1042 Tài liệu tiếng Anh [4] Aharon, M., Elad, M., Bruckstein, A.: K-svd: An algorithm for designing overcomplete dictionaries for sparse representation IEEE Trans on Signal Processing,54(11) (2006) 4311–4322 [5] B K Natarajan “Sparse approximate solutions to linear systems,” SIAM journal on computing, vol 24, no 2, pp 227–234, 1995 [6] Bernd Jähne (editors) Computer Vision and Applications - A Guide for Students and Practitioners, Academic Press, 24th April 2000 [7] Chenglong Bao et al Dictionary learning for sparse coding: Algorithms and convergence analysis IEEE Transactions on Pattern Analysis and Machine Intelligence ,Volume: 38 , Issue: , pp 1356 – 1369, July 2016 [8] E Simoncelli and E Adelson “Noise removal via bayesian wavelet coring,” in International Conference on Image Processing, vol 1, 1996, pp 379–382 [9] Feng, Z., Yang, M., Zhang, L., Liu, Y., Zhang, D Joint discriminative dimensionality reduction and dictionary learning for face recognition Pattern Recognition 46 (2013) 2134–2143 [10] G Davis, S Mallat, and M Avellaneda “Adaptive greedy approximations,” J Construct Approx., vol 13, pp 57–98, 1997 [11] G Davis, S Mallat, and Z Zhang “Adaptive time-frequency decompositions,” Opt Eng., vol 33, no 7, pp 2183–91, 1994 [12] Gonzalez,R.C.Thomas,M.G “Syntatic Pattern Recognition: an Introduction” , Addison Wesley, Reading, MA, 1978 [13] Hongcheng Wang Discriminative Dictionary Learning via Shared Latent Structure for Object Recognition and Activity Recognition IEEE International Conference on Robotics and Automation (ICRA 2014), At Hong Kong, China [14] I F Gorodnitsky and B D Rao “Sparse signal reconstruction from limited data using FOCUSS: A re-weighted norm minimization algorithm,” IEEE Trans Signal Process., vol 45, pp 600–616, 1997 47 [15] J A Tropp and A C Gilbert “Signal recovery from random measurements via orthogonal matching pursuit,” IEEE Transactions on Information Theory, vol 53, no 12, pp 4655–4666, 2007 [16] J Mairal, F Bach, J Ponce, G Sapiro, and A Zisserman Discriminative learned dictionaries for local image analysis, IEEE Conference on Computer Vision and Pattern Recognition, 2008 [17] J Mairal, F Bach, J Ponce, G Sapiro, and A Zisserman Supervised dictionary learning, Supervised Dictionary Learning RR-6652, pp.15, INRIA 2008 [18] J Marial, M.Elad, and G.Sapiro Sparse representation for color image restoration IEEE Transactions on Image Processing archive, Volume 17 Issue 1, Pp 53-69, 2008 [19] J Shi, X Ren, G Dai, J Wang, and Z Zhang “A nonconvex relaxation approach to sparse dictionary learning,” in Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2011, pp 1809–1816 [20] J Starck, E Candes, and D Donoho “The curvelet transform for image denoising,” Image Processing, IEEE Transactions on, vol 11, no 6, pp 670– 684, 2002 [21] J Wright, M Yang, A Ganesh, S Sastry, and Y Ma Robust face recognition via sparse representation TPAMI, 31(2):210–227, 2009 [22] J.A.Tropp “Greed is good: Algorithmic results for sparse approximation,” IEEE Trans Inf Theory, vol 50, pp 2231–2242, Oct 2004 [23] Jiang, Z., Lin, Z., Davis, L Label consistent k-svd: learning a discriminative dictionary for recognition IEEE Trans on Pattern Anal Mach Intelligence35(11) (2013) 2651–2664 [24] K Huang and S Aviyente Sparse representation for signal classification, Advances in Neural Information Processing Systems 19, NIPS 2006 [25] M Do and M Vetterli “The contourlet transform: an efficient directional multiresolution image representation", IEEE Transactions on Image Processing archive Volume 14 Issue 12, December 2005 Pp 2091-2106 [26] M Elad, M Figueiredo, and Y Ma “On the role of sparse and redundant representations in image processing,” Proceedings of the IEEE, vol 98, no 6, pp 972– 982, 2010 [27] M Schmidt, G Fung, and R Rosale “Optimization methods for l1regularization,” University of British Columbia, West Mall Vancouver, B.C Canada V6T 1Z4, Tech Rep., 2009 [28] Meng Yanga et al Sparse Representation based Fisher Discrimination Dictionary IEEE International Conference on Computer Vision, ICCV 2011, Barcelona, Spain, November 6-13, 2011 [29] Q Zhang and B Li Discriminative k-svd for dictionary learning in face recognition, IEEE Computer Society Conference on Computer Vision and Pattern Recognition, CVPR 2010, pp 2691-2698 [30] R Rubinstein, A Bruckstein, and M Elad “Dictionaries for sparse representation modeling,” Proceedings of the IEEE, vol 98, no 6, pp 1045– 1057, 2010 [31] Ramirez, I., Sprechmann, P., Sapiro, G Classification and clustering via dictionary learning with structured incoherence and shared features IEEE 48 [32] [33] [34] [35] [36] [37] [38] [39] [40] [41] [42] [43] Computer Society Conference on Computer Vision and Pattern Recognition, pp 3501-3508, CVPR 2010 Richard Szeliski Computer Vision: Algorithms and Applications Springer; 1st Edition October 1, 2010 S G Mallat and Z Zhang “Matching pursuits with time-frequency dictionaries,” IEEE Transactions on Signal Processing, vol 41, no 12, pp 3397–3415, 1993 S.Chen,S.A.Billings,andW.Luo “Orthogonal least squares methods and their applicationt on on-linear system identification,” Int.J.Contr., vol 50, no 5, pp 1873–96, 1989 S.S.Chen,D.L.Donoho,andM.A.Saunders “Atomic decomposition by basis pursuit,” SIAM Rev., vol 43, no 1, pp 129–159, 2001 ShuhangGu et al Projective dictionary pair learning for pattern classification Advances in Neural Information Processing Systems 27, NIPS 2014 Sprechmann, P., Litman, R., Yakar, T.B., Bronstein, A., Sapiro, G Efficient supervised sparse analysis and synthesis operators Proceedings of the 26th International Conference on Neural Information Processing Systems Volume 1, Pp 908-916, NIPS 2013 Vinita Dutt,Vikas Chaudhry, Imran Khan “Pattern recognition: An overview” American Journal of Intelligent Systems 2012 W He, Y Zi, B Chen, F Wu, and Z He “Automatic fault feature extraction of mechanical anomaly on induction motor bearing using ensemble superwavelet transform,” Mechanical Systems and Signal Processing, vol 54, pp 457–480, 2015 Y C Pati, R Rezaiifar, and P S Krishnaprasad “Orthogonal matching pursuit: Recursive function approximation with applications to wavelet decomposition,” in Conf Rec 27th Asilomar Conf Signals, Syst Comput., 1993, vol Yang, M., Zhang, L., , Feng, X., Zhang, D Fisher discrimination dictionary learning for sparse representation Proceeding ICCV '11 Proceedings of the 2011 International Conference on Computer Vision, Pp 543-550, 2011 Yunjin, C., Thomas, P., Bischof, H Learning l1-based analysis and synthesis sparsity priors using bilevel optimization Workshop on Analysis Operator Learning vs Dictionary Learning, NIPS 2012 Zheng Zhang et al: A survey of sparse representation: algorithms and applications Published on IEEE Access, Vol 3, pp 490-530, 2015 49 PHỤ LỤC Ứng dụng nhận dạng ký tự biển số xe Nhận dạng ký tự tốn nhận dạng kinh điển có nhiều ứng dụng đời sống nhận diện ký tự viết tay, nhận dạng ký tự chữ chữ số ảnh, Dữ liệu ký tự nhiều nhà nghiên cứu sử dụng để kiểm tra mơ hình học máy mà họ đề xuất Vì vậy, tơi lựa chọn liệu ký tự tách từ liệu ảnh biển số xe để kiểm tra mơ hình học từ điển mà nghiên cứu trước cài đặt mô hình cho tốn nhận dạng thóc giống – tốn đặc trưng ngành Nơng nghiệp trình bày chi tiết Chương Bộ liệu ký tự biển số xe phòng Tương tác người máy (HMI Lab) – Đại học Công nghệ, Đại học Quốc Gia Hà Nội cung cấp Quá trình cài đặt mơ hình học từ điển cho tốn triển khai đồng mặt thiết bị máy móc phiên phần mềm với q trình đặt mơ hình học từ điển liệu ảnh thóc giống a) Mơ tả tốn Bài toán nhận dạng ký tự biển số xe triển khai luận văn sử dụng nguồn liệu từ nhóm nghiên cứu (của phịng HMI) phát triển phần mềm hỗ trợ quản lý phương tiện giao thơng ra/vào khu gửi xe tịa nhà mở rộng dùng hệ thống vào việc kiểm tra, giám sát hành trình phương tiện giao thơng video quan sát Có hai loại phương tiện giao thơng thu nhận liệu xe máy ô tô thuộc ba loại xe: xe tư hữu (biển trắng, ký tự bên đen), xe công (biển xanh, ký tự bên màu trắng) xe quân đội (biển đỏ, ký tự bên màu trắng) Quá trình nhận dạng biển số xe tuân thủ theo giai đoạn sơ đồ hình phụ lục Hình phụ lục Sơ đồ trình nhận dạng biển số xe 50 Khi thu nhận ảnh có tuân thủ số quy tắc để đảm bảo ảnh liệu phù hợp để đưa vào mơ hình nhận dạng: - Biển số cịn ngun vẹn, khơng bị tróc sơn hay rỉ sét, khơng bị che khuất Biển số có hàng, số ký tự ký tự (3 ký tự hàng ký tự hàng dưới) ký tự (3 ký tự hàng ký tự hàng dưới) biển ô tô ký tự (4 ký tự hàng ký tự hàng dưới) ký tự (4 ký tự hàng ký tự hàng dưới) ký tự hàng có dấu gạch nối biển xe máy - Hình chụp biển số khơng bị mờ, nhòe, ký tự biển số phân biệt, nhận dạng trực quan Hình phụ lục 2.Ảnh biển số xe sau thu nhận phân tách Những ảnh không đạt yêu cầu loại bỏ cách thủ công trước đưa vào giai đoạn Do thời gian hoàn thành hệ thống tương đối ngắn nên nhóm nghiên cứu khơng thu nhận đầy đủ ký tự có biển số xe số lượng nhiều ký tự hạn chế nên khơng phù hợp để đưa vào học mơ hình (được đưa bảng phụ lục phụ lục 2) Bảng phụ lục Số lượng biển số xe thu nhận Ơ tơ Xe máy Số ký tự dòng - dòng 3-4 3-5 4-4 4-5 Số lượng biển 195 521 148 212 51 Bảng phụ lục 2.Số lượng ký tự tách từ biển số xe Ký tự A B D E C F G H Số lượng 281 106 193 263 109 124 110 108 117 198 164 12 10 13 Ký tự I J K L M N O P Q R S T U V W X Y Z Số lượng 0 2 0 1 1 Để khắc phục tình trạng này, liệu ký tự biển số xe mà nhận bổ sung liệu tạo tự động máy tính với giả lập tham số nhiễu để triển khai xây dựng kiểm tra mơ hình phân lớp dành cho nhận dạng Giúp cho việc so sánh khả ứng dụng hai mơ hình liệu thực tế liệu ảo, luận văn quan tâm thực toán phân lớp liệu cung cấp số lượng liệu mẫu đưa vào mơ hình phân lớp liệt kê cụ thể bảng phụ lục 3, bảng phụ lục bảng phụ lục 5: - Nhận dạng 10 ký tự: 10 ký tự chữ số (0-9) với liệu hoàn toàn liệu thực tế Nhận dạng 14 ký tự: 10 ký tự chữ số (0-9) ký tự chữ (A, B, D, E) với liệu hoàn toàn liệu thực tế Nhận dạng 36 ký tự: 10 ký tự chữ số (0-9) 26 ký tự chữ (từ A-Z) với liệu có kết hợp liệu thực tế liệu ảo 52 Bảng phụ lục 3.Số lượng mẫu toán nhận dạng 10 ký tự Ký tự Số lượng 281 106 193 263 109 124 110 108 117 198 Bảng phụ lục 4.Số lượng mẫu toán nhận dạng 14 ký tự Ký tự A B D E Số lượng 281 106 193 263 109 124 110 108 117 198 164 12 10 13 53 Bảng phụ lục 5.Số lượng mẫu toán nhận dạng mẫu Ký tự A B C D E F G H Số mẫu 300 300 300 300 300 300 300 300 300 300 300 300 300 300 300 300 300 300 Ký tự I J K L M N O P Q R S T U V W X Y Z Số mẫu 300 300 300 300 300 300 300 300 300 300 300 300 300 300 300 300 300 300 Mơ hình học máy khối nhận dạng mà luận văn cài đặt mơ hình học từ điển đảm bảo thưa (LC-KSVD) mơ hình khơng đảm bảo thưa (DPL) để so sánh thời gian hiệu suất hai mơ hình Bộ liệu ảnh cho toán chia thành loại tương ứng: nhận dạng 10 ký tự (được chia thành 10 loại), nhận dạng 14 ký tự (nhận dạng 14 loại), nhận dạng 36 ký tự (được chia thành 36 loại) Với việc sử dụng mơ hình học từ điển đảm bảo tính thưa LC-KSVD, hai tham số dictsize sparsitythres cìa đặt sau: dictsize = {10:10:70} với toán nhận dạng 10 ký tự 14 ký tự, dictsize = {10:10:100,150,200} với toán nhận dạng 36 ký tự ; sparsitythres = {3,5,7,10:5:70} với toán nhận dạng 10 ký tự 14 ký tự, sparsitythres = {5,10:10:100,150} với toán nhận dạng 36 ký tự Với việc sử dụng mơ hình học từ điển khơng đảm bảo thưa DPL, tham số lựa chọn sau: DictSize = {10:10:200} kết hợp tham số {Tau, lambda, gamma} = {0.975, 0.09, 0.1} b) Kết đạt Kết hiệu suất nhận dạng thời gian thực mơ hình toán đưa bảng phụ lục bảng phụ lục Trong bảng kết quả, ba toán, LC-KSVD2 cho kết tốt so với LC-KSVD1 (gần 90%) lại xa so với DPL (DPL đạt gần 98%) Như mơ hình DPL khơng theo đuổi ràng 54 buộc đảm bảo tính thưa hệ số biểu diễn hồn tồn cho kết phân lớp tốt cạnh tranh (trong trường hợp kết phân lớp tốt hẳn so với LC-KSVD) Bảng phụ lục 6.Hiệu suất phân lớp LC-KSVD 1, LC-KSVD DPL Bài toán nhận dạng Acc_LCKSVD1 Acc_LCKSVD2 Acc_DPL 10 ký tự 0.871 0.891 0.9727 14 ký tự 0.826 0.888 0.9727 36 ký tự 0.771 0.836 0.9676 Hiệu suất phân lớp 1.2 0.8 0.6 0.4 0.2 10 ký tự 14 ký tự Acc_LC-KSVD1 Acc_LC-KSVD2 36 ký tự Acc_DPL Hình phụ lục 3.Hiệu suất phân lớp mơ hình LC-KSVD DPL Bảng phụ lục 7.Thời gian học kiểm tra mô hình LC-KSVD 1, LC-KSVD 2, DPL Bài tốn nhận dạng 10 ký tự 14 ký tự 36 ký tự LC-KSVD T_train(s) T_test(s) 52.498 35.507 5989.74 0.328 0.144 54.456 LC-KSVD DPL T_train(s) T_test(s) T_train(s) T_test(s) 52.153 111.193 10335.27 0.237 0.616 51.915 5.472 4.8 52.223 0.081 0.108 2.807 55 Thời gian học kiểm tra mơ hình 12000 10000 8000 6000 4000 2000 10 ký tự Time Tr+Tt _ LC-KSVD1 14 ký tự Time Tr+Tt _ LC-KSVD2 36 ký tự Time Tr+Tt _ DPL Hình phụ lục 4.Thời gian học kiểm tra mơ hình LC-KSVD 1, LC-KSVD 2, DPL Về mặt thời gian tính tốn, DPL gần khơng bị ảnh hưởng kích thước từ điển LC-KSVD bị ảnh hưởng rõ rệt thể hình phụ lục ... theo đuổi nghiên cứu nhận dạng ảnh thóc giống Với khả mạnh mẽ mơ hình học từ điển nói chung học từ điển đảm bảo tính thưa nói riêng, tơi mong muốn thử nghiệm mơ hình tốn nhận dạng thóc giống mà... thuyết biểu diễn thưa phương pháp để xây dựng mơ hình học từ điển thưa đồng thời trình bày hai hướng phát triển mơ hình học từ điển: mơ hình học từ điển đảm bảo tính thưa mơ hình học từ điển khơng... có đánh giá khách quan mơ hình học từ điển đảm bảo thưa không đảm bảo thưa Từ đưa nhận xét hai dạng mơ hình học từ điển đề xuất hướng ứng dụng mơ hình học từ điển thưa Ngồi phần giới thiệu tài