Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 13 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
13
Dung lượng
380,42 KB
Nội dung
ĐẠI HỌC QUỐC GIA HÀ NỘI VIỆN CÔNG NGHỆ THÔNG TIN NGUYỄN VŨ QUANG GÁN NHÃN ĐỐI TƯỢNG DỰA VÀO KỸ THUẬT NHẬN DẠNG LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN Hà Nội – 2015 ĐẠI HỌC QUỐC GIA HÀ NỘI VIỆN CÔNG NGHỆ THÔNG TIN NGUYỄN VŨ QUANG GÁN NHÃN ĐỐI TƯỢNG DỰA VÀO KỸ THUẬT NHẬN DẠNG Ngành : Công nghệ thông tin Chuyên ngành : Quản lý Hệ thống thông tin Mã số : Chuyên ngành đào tạo thí điểm LUẬN VĂN THẠC SĨ CƠNG NGHỆ THÔNG TIN NGƯỜI HƯỚNG DẪN KHOA HỌC: PGS.TS Đỗ Năng Toàn Hà Nội - 2015 MỤC LỤC LỜI CAM ĐOAN MỤC LỤC CÁC CHỮ VIẾT TẮT DANH MỤC HÌNH VẼ MỞ ĐẦU CHƯƠNG 1: KHÁI QUÁT VỀ GÁN NHÃN VÀ BÀI TOÁN NHẬN DẠNG ĐỐI TƯỢNG .3 1.1 Khái quát gán nhãn 1.1.1 Xử lý ảnh 1.1.2 Gán nhãn xử lý ảnh Error! Bookmark not defined 1.2 Bài toán nhận dạng đối tượng Error! Bookmark not defined 1.2.1 Giới thiệu Error! Bookmark not defined 1.2.2 Các cách tiếp cận Error! Bookmark not defined 1.2.3 Một số hệ thống nhận dạng đối tượng Error! Bookmark not defined 1.2.4 Quy trình hoạt động hệ thống nhận dạng đối tượng Error! Bookmark not defined CHƯƠNG 2: NHẬN DẠNG ĐỐI TƯỢNG SỬ DỤNG MẠNG NƠRON Error! Bookmark not defined 2.1 Kiến trúc hệ thống nhận dạng đối tượng sử dụng mạng nơron nhân tạo Error! Bookmark not defined 2.1.1 Khái niệm mạng nơron nhân tạo Error! Bookmark not defined 2.1.2 Lịch sử phát triển mạng nơron Error! Bookmark not defined 2.1.3 Mơ hình nơron Error! Bookmark not defined 2.1.4 Một số kiến trúc mạng nơron dùng nhận dạng đối tượng Error! Bookmark not defined 2.1.5 Ứng dụng mạng nơron nhân tạo Error! Bookmark not defined 2.2 Thiết kế mạng nơron nhân tạo Error! Bookmark not defined 2.2.1 Các bước thiết kế Error! Bookmark not defined 1 2.2.2 Chi tiết bước thiết kế mạng nơron Error! Bookmark not defined 2.3 Huấn luyện mạng Error! Bookmark not defined 2.3.1 Các phương pháp học Error! Bookmark not defined 2.3.2 Học có giám sát mạng nơron Error! Bookmark not defined 2.3.3 Thuật toán lan truyền ngược Back-Propagation Error! Bookmark not defined 2.4 Nhận dạng sử dụng mạng nơron Error! Bookmark not defined 2.4.1 Khả sử dụng mạng nơron nhận dạng Error! Bookmark not defined 2.4.2 Mơ hình nhận dạng hệ thống sử dụng mạng nơron Error! Bookmark not defined 2.4.3 Nhận dạng hệ thống sử dụng mạng nơron Error! Bookmark not defined CHƯƠNG 3: CHƯƠNG TRÌNH THỬ NGHIỆM Error! Bookmark not defined 3.1 Giới thiệu Error! Bookmark not defined 3.2 Các bước giải toán .Error! Bookmark not defined 3.2.1 Xây dựng mạng nơron Error! Bookmark not defined 3.2.2 Xử lý liệu Error! Bookmark not defined 3.2.3 Huấn luyện mạng Error! Bookmark not defined 3.2.4 Nhận dạng ảnh Error! Bookmark not defined 3.2.5 Lựa chọn công cụ Error! Bookmark not defined 3.3 Một số kết thử nghiê ̣m và đánh giá hệ thống nhận dạng ký tự Error! Bookmark not defined 3.5.1 Thử nghiệm hệ thống nhận dạng ký tự Error! Bookmark not defined 3.5.2 Ưu điểm hạn chế Error! Bookmark not defined 3.5.3 Hướng phát triển tương lai Error! Bookmark not defined DANH MỤC TÀI LIỆU THAM KHẢO MỞ ĐẦU Cùng với phát triển ngày mạnh mẽ khoa học kĩ thuật vài thập kỷ gần đây, xử lý ảnh ngành khoa học tương đối mẻ so với nhiều ngành khoa học khác lĩnh vực phát triển nhanh thu hút quan tâm đặc biệt từ nhà khoa học, thúc đẩy trung tâm nghiên cứu, ứng dụng lĩnh vực hấp dẫn Nhận dạng gán nhãn cho hình ảnh đóng vai trị quan trọng nhiều ứng dụng thực tế khoa học kĩ thuật sống thường ngày như: sản xuất kiểm tra chất lượng, di chuyển Robot, phương tiện lại tự trị, công cụ hướng dẫn cho người mù, an ninh giám sát, nhận dạng đối tượng, nhận dạng mặt, ứng dụng y học, sản xuất, hiệu chỉnh video,… Một ứng dụng quan trọng, việc nhận dạng gán nhãn cho loại hình ảnh … Tự động nhận dạng ảnh đặt vị trí nhãn lĩnh vực trực quan hóa thơng tin Nhãn đoạn văn nhằm truyền đạt thông tin, làm rõ ý nghĩa cấu trúc phức tạp biểu diễn dạng đồ họa Bài toán nhận dạng gán nhãn đề cập, nghiên cứu nhiều giới Tại Việt Nam toán trọng ứng dụng nhiều lĩnh vực Vì vậy, đề tài xây dựng với mục đích: Tìm hiểu tốn nhận dạng hình ảnh gán nhãn, ứng dụng lĩnh vực; Tìm hiểu số vấn đề, thuật toán liên quan; Đặt tảng cho cá nhân nghiên cứu, tìm hiểu sâu vấn đề Từ thiết kế chương trình thử nghiệm nhận dạng gán nhãn cho ảnh cụ thể Luận văn bao gồm chương, nội dung chương sau: Chương 1: Khái quát gán nhãn toán nhận dạng đối tượng Chương khái quát lại kiến thức toán gán nhãn gồm xử lý ảnh gán nhãn xử lý ảnh Đồng thời nói tốn nhận dạng đối tượng, vai trị tầm quan trọng toán nhận dạng đối tượng, phương pháp nhận dạng đối tượng số hệ thống nhận dạng đối tượng tiếng giới Chương 2: Một số vấn đề nhận dạng đối tượng sử dụng mạng nơron Chương đề cập đến số vấn đề nhận dạng đối tượng sử dụng mạng nơron Mô tả kiến trúc hệ thống nhận dạng đối tượng sử dụng mạng nơron nhân tạo cách thiết kế, huấn luyện mạng nơron nhân tạo cho việc nhận dạng Chương 3: Chương trình thử nghiệm Chương áp dụng kiến thức nghiên cứu chương chương 2, sử dụng mạng nơron nhiều lớp lan truyền ngược kỹ thuật gán nhãn để xây dựng chương trình nhận dạng ký tự 3 CHƯƠNG 1: KHÁI QUÁT VỀ GÁN NHÃN VÀ BÀI TOÁN NHẬN DẠNG ĐỐI TƯỢNG Chương khái quát lại kiến thức toán gán nhãn gồm xử lý ảnh gán nhãn xử lý ảnh Đồng thời nói tốn nhận dạng đối tượng, vai trò tầm quan trọng toán nhận dạng đối tượng, phương pháp nhận dạng đối tượng số hệ thống nhận dạng đối tượng tiếng giới 1.1 Khái quát gán nhãn 1.1.1 Xử lý ảnh Hình ảnh tĩnh biểu diễn hàm hai chiều f(x,y), đó, x y tọa độ khơng gian phẳng (2 chiều) Khi xét ảnh "đen-trắng", giá trị hàm f điểm xác định tọa độ (x,y) gọi độ chói (mức xám) ảnh điểm Nếu x,y,và f số hữu giá trị rời rạc, có ảnh số Xử lý ảnh số trình biến đổi ảnh số máy tính (PC) Như vậy, ảnh số tạo số hữu hạn điểm ảnh, điểm ảnh nằm vị trí định có giá trị định Một điểm ảnh ảnh gọi pixel Thị giác có vai trị quan trọng với người việc nhận biết giới xung quanh Chúng ta nhìn khơng để xác định phân loại vật thể, mà cịn để tìm khác biệt để có cảm nhận tổng thể, sơ bộ, cho khung cảnh Thị giác người xác: ta nhận biết khn mặt vài giây, ta phân biệt màu sắc, xử lý lượng lớn thơng tin hình ảnh nhanh Cùng với ngơn ngữ, thơng tin dạng hình ảnh đóng vai trị quan trọng việc trao đổi thơng tin Chính năm gần có kết hợp chặt chẽ ảnh đồ họa lĩnh vực xử lý thông tin Trong công nghệ thông tin, xử lý ảnh chiếm vị trí quan trọng, ứng dụng đa dạng phong phú nhiều lĩnh vực khoa học Lĩnh vực xử lý ảnh thu hút quan tâm nhiều nhà khoa học khả ứng dụng lợi ích to lớn nhiều lĩnh vực xã hội quốc phịng, giải trí, y học, viễn thám giao thông Như biết, thơng tin hình ảnh đóng vai trị quan trọng trao đổi thông tin, phần lớn thông tin mà người thu thông qua thị giác Do vậy, vấn đề nhận dạng xử lý ảnh, đặc biệt so khớp, phân loại, nhận dạng đối tượng ảnh chuyển động quan tâm nhiều nhà nghiên cứu tính khoa học ứng dụng đa dạng Đồng thời, với phát triển không ngừng khoa học tốc độ xử lý máy tính ứng dụng lĩnh vực thị giác máy tính xử lý ảnh ngày phát triển nghiên cứu mạnh mẽ Xử lý ảnh phần lĩnh vực xử lý tín hiệu số Tăng cường chất lượng thơng tin hình ảnh q trình tri giác người biễu diễn máy tính Xử lý ảnh số bao gồm phương pháp kỹ thuật để biến đổi, để truyền tải mã hóa ảnh tự nhiên Xử lý ảnh liên quan đến việc thay đổi hình ảnh để đạt hai mục đích: Thứ nhất: biến đổi ảnh làm đẹp ảnh Thứ hai: tự động phân tích nhận dạng ảnh hay đốn nhận ảnh đánh giá nội dung ảnh Lý phải xử lý ảnh: Ảnh bị lỗi q trình thu ảnh, truyền dẫn hiển thị (hồi phục, nâng cao chất lượng ảnh, nội suy) Ảnh mang nội dung nhạy cảm (vd, chống lại copy không hợp pháp, giả mạo lừa đảo) Tạo ảnh có hiệu ứng nghệ thuật Có thể tạm phân biệt hệ thống xử lý ảnh theo mức độ phức tạp thuật toán xử lý sau: Xử lý ảnh mức thấp: trình biến đổi đơn giản thực lọc nhằm khử nhiễu ảnh, tăng cường độ tương phản hay độ nét ảnh Trong trường hợp này, tín hiệu đưa vào hệ thống xử lý tín hiệu đầu ảnh quang học 5 Xử lý ảnh mức trung: trình xử lý phức tạp hơn, thường sử dụng để phân lớp, phân đọan ảnh, xác định dự đóan biên ảnh, nén anh để lưu trữ truyền phát Đặc điểm hệ thống xử lý ảnh mức trung tín hiệu đầu vào hình ảnh, cịn tín hiệu đầu thành phần tách từ hình ảnh gốc, luồng liệu nhận sau nén ảnh Xử lý ảnh mức cao: q trình phân tích nhận dạng hình ảnh Đây trình xử lý thực hệ thống giác người Các giai đoạn xử lý ảnh Hình 1.1 Các giai đoạn xử lý ảnh Thu nhận ảnh: Ảnh thu nhận từ thế giới thực qu a máy chụp hình,từ tranh ảnh qua máy quét từ vệ tinh thông qua cảm biến số tương tự Nhìn chung hệ thống thu nhận ảnh thực trình Cảm biến: biến đổi lượng quang học thành lượng điện (giai đoạn lấy đối tượng) Tổng hợp lượng điện thành ảnh (giai đoạn lượng tử hóa) Số hóa ảnh: Số hóa ảnh thu nhận để lưu trữ vào máy tính Biến đổi ảnh tương tự thành ảnh rời rạc để xử lý máy tính: Thơng qua q trình lấy đối tượng (rời rạc mặt khơng gian) lượng tử hóa (rời rạc mặt biên độ) 6 Xử lý số: Là tiến trình gồm nhiều cơng đoạn nhỏ: Tăng cường ảnh (Enhancement), khôi phục ảnh (Restoration), phát biên (Egde Detection), phân vùng ảnh (Segmentation), trích chọn đặc tính (Feature Extraction) + Tăng cường ảnh (Image Enhancement): Làm bật đặc trưng chọn để nâng cao chất lượng hình ảnh Các kỹ thuật chọn : lọc độ tương phản , khử nhiễu, màu, biên, giãn độ tương phản + Khôi phục ảnh (Image Restoration): Loại bỏ hay tối thiểu hóa ảnh hưởng môi trường bên ngoài hay hệ thống thu nhận ảnh gây Kế t thu là ảnh gần giống với ảnh gốc Do nguyên nhân khác nhau: thiết bị thu nhận ảnh, nguồn sáng hay nhiễu, ảnh bị suy biến nên cần tăng cường khôi phục ảnh để làm bật số đặc tính ảnh, hay làm cho ảnh gần giống với trạng thái gốc (trạng thái trước ảnh bị biến dạng) + Phân vùng ảnh (Segmentation): Phân chia ảnh thành phận cấu thành, xác định số thành phần ảnh tìm đường thẳng, hình trịn, hình dạng khác biệt ảnh + Phương pháp phát đường biên trực tiếp dựa phân tích thay đổi độ chói ảnh Kỹ thuật chủ yếu dùng để phát biên dùng đạo hàm Khi lấy đạo hàm bậc ảnh ta có phương pháp gradient, lấy đạo hàm bậc hai ta có kỹ thuật Laplace - Hệ định Tùy mục đích ứng dụng mà chuyển sang giai đoạn khác hiển thị, nhận dạng, phân lớp, truyền thông… + Nhận dạng ảnh : Là trình phâ n loại đối tượng biễu diễn theo mô hình nào và gán chúng vào lớp dựa theo quy luật và đối tượng chuẩn.Nhận dạng áp dụng việc bảo mật, an ninh, nhận dạng chữ viế t , Các DANH MỤC TÀI LIỆU THAM KHẢO Tiếng việt [1] Đỗ Năng Toàn (2010), Giáo trình xử lý ảnh, Học viện Cơng nghệ Bưu Viễn thông Tiếng Anh [2] D Heckenberg, B C Lovell (2000), “A Gesture Driven Computer Interface”, Proceeding of Visual Communications and Image Processing, SPIE, 4067, 261-268 [3] Journal on Graphics (2006), Vision and Image Processing, [4] J Mathews (2002), “An Introduction to Edge Detection: The Sobel Edge Detector” [5] Peter l Rockett (2005), “An Improved Rotation-Invarient Thinning Algorithm”, IEEE transaction on Pattern, Analysis and Machine Intelligence, 27, 10 [6] Te-Hsiu Sun, Fang-Chih Tien (2008), Using Backpropagation Neural Network for Face Recognition with 2D+ 3D Hybrid Information, Elsevier: Expert System with Applications, 35,361-372 [7] N Sakai, S Yonekawa and A Matsuzaki, Two-dimensional image analysis of the shape of rice and its applications to separating varieties”, Journal of Food Engineering, vol 27, 1996, pp 397-407 [8] A J M Timmermans, and A A Hulzebosch, Computer vison system for on-line sorting of pot plants using an artificial neural network classifier, Computers and Electronics in Agriculture, vol 15, 1996, pp 41-55 [9] S Abbasi, F Mokhtarian, and J Kittler, Reliable classification of chrysanthemum leaves through curvature scale space, Lecture Notes in Computer Science, vol 1252, 1997, pp 284-295 8 [10] J Camarero, S Siso, and E.G-Pelegrin, Fractal dimension does not adequately describe the complexity of leaf margin in seedlings of Quercus species, Anales del Jardín Botánico de Madrid, vol 60, no 1, 2003, pp 63-71 [11] C-L Lee, and S-Y Chen, Classification of leaf images, 16th IPPR Conference on Computer Vision, Graphics and Image Processing (CVGIP), 2003, pp 355-362 [12] S G Wu, F S Bao, E Y Xu, Y-X Wang, Y-F Chang, and Q-L Xiang, A leaf recognition algorithm for plant classification using probabilistic neural network, The Computing Research Repository (CoRR), vol.1, 2007, pp 11-16 [13] J Pan and Y He, Recognition of plants by leaves digital image and neural network, International Conference on Computer Science and Software Engineering, vol 4, 2008, pp 906 – 910 Các trang web tham khảo [14] http://www.doc.ic.ac.uk/~nd/surprise_96/journal/vol4/cs11/report.htm l#A%20simple%20neuron [15] http://andrewback.com/ivs.php [16] http://www2.htw-dresden.de/~iwe/Belege/Langner/