NHẬN DẠNG ẢNH MẶT NGƯỜI SỬ DỤNG MẠNG NƠRON
BỘ GIÁO DỤC & ĐÀO TẠO TRƢỜNG ĐẠI HỌC SƢ PHẠM KỸ THUẬT TP. HCM KHOA ĐIỆN - ĐIỆN TỬ BỘ MÔN ĐIỆN TỬ - VIỄN THÔNG ĐỒ ÁN MÔN HỌC 2 NGÀNH:CÔNG NGHỆ ĐIỆN TỬ - VIỄN THÔNG Đề tài : NHẬN DẠNG ẢNH MẶT NGƢỜI SỬ DỤNG MẠNG NƠRON TP. HỒ CHÍ MINH – 1/2014 GVHD : ThS HUỲNH THỊ THU HIỀN SVTH :NGUYỄN THANH VIỆT Đồ án môn học 2 Trang ii LỊCH TRÌNH THỰC HIỆN ĐỒ ÁN STT Tuần/ngày Nội dung Xác nhận GVHD 1 2 3 4 5 6 7 8 9 10 Sinh viên thực hiện Đồ án môn học 2 Trang iii LỜI CẢM ƠN Sinh viên thực hiện xin gửi lời cảm ơn chân thành đến Cô Huỳnh Thị Thu Hiền đã tận tình hƣớng dẫn giúp đỡ trong quá trình thực hiện đồ án. Sinh viên thực hiện cũng xin bày tỏ lòng biết ơn đến các thầy cô trƣờng Đại học Sƣ phạm kỹ thuật TPHCM đã tận tình giảng dạy trong thời gian qua để giúp sinh viên có đƣợc những kiến thức để hoàn thành đồ án. Cuối cùng sinh viên thực hiện xin chân thành cảm ơn sự đóng góp ý kiến của các bạn sinh viên. Sinh viên thực hiện Nguyễn Thanh Việt Đồ án môn học 2 Trang iv MỤC LỤC LỊCH TRÌNH ĐỒ ÁN MÔN HỌC………………………………………………….ii LỜI CẢM ƠN iiii MỤC LỤC ……………………………………………………………………iv LIỆT KÊ HÌNH……………………………………………………………….……vi CHƢƠNG 1: MỞ ĐẦU 1 1.1.Đặt vấn đề 1 1.2.Lý do chọn đề tài 1 1.3.Mục tiêu đề tài 1 1.4.Giới hạn đề tài 2 1.5.Bố cục của đồ án. 2 CHƢƠNG 2:CƠ SỞ LÝ THUYẾT 3 2.1. Giới thiệu về hệ thống xử lí ảnh 3 2.1.1. Phần thu nhận ảnh (Image Acquisition) 3 2.1.2.Tiền xử lý (Image Processing) 3 2.1.3. Phân đoạn (Segmentation) hay phân vùng ảnh 4 2.1.4.Biểu diễn ảnh (Image Representation) 4 2.1.5. Nhận dạng và nội suy ảnh (Image Recognition and Interpretation) 4 2.1.6. Cơ sở tri thức (Knowledge Base) 5 2.2. Những vấn đề cơ bản trong hệ thống xử lí ảnh 5 2.2.1. Điểm ảnh (Picture Element) 5 2.2.2. Độ phân giải của ảnh 5 2.2.3. Mức xám của ảnh 6 2.2.4. Định nghĩa ảnh số 6 2.3. Trích chọn đặc trƣng ảnh 7 2.3.1 Thuật toán biến đổi hình thái(Morphological Operations) 7 2.3.2 Thuật toán his-and-miss 8 2.4 Phƣơng pháp hạ Gradient 9 2.5 Mạng nơron 10 2.5.1 Giới thiệu sơ nét về mạng nơron 10 2.5.2 Phân loại mạng nơ-ron nhân tạo 12 Đồ án môn học 2 Trang v 2.5.3 Học tham số(Parameter Learning) 12 2.5.4 Mạng lan truyền ngƣợc 13 2.5.5 Luật học lan truyền ngƣợc(Backpropagation Learning Rule) 14 CHƢƠNG 3: NỘI DUNG NGHIÊN CỨU 16 3.1 Thiết kế chƣơng trình nhận dạng 16 3.1.1 Đọc ảnh dữ liệu và ảnh kiểm tra 16 3.1.2 Huấn luyện ảnh dữ liệu và ảnh kiểm tra 17 3.1.3 Chọn ảnh cần kiểm tra 20 3.1.4 So sánh ngƣỡng 21 CHƢƠNG 4: KẾT QUẢ NGHIÊN CỨU 22 4.1. Phần lý thuyết 22 4.2. Phần mô phỏng 22 CHƢƠNG 5: KẾT LUẬN VÀ HƢỚNG PHÁT TRIỂN 25 5.1. Kết luận 25 5.2.Hƣớng phát triển 25 PHỤ LỤC 26 Phụ lục A: Code của chƣơng trình 26 Giao diện 1 26 Giao diện 2 26 Chƣơng trình msnn1 30 Giao diện 3…………………………………………………………………………32 Phụ lục B: Tài liệu tham khào…………………………………………………… 34 Đồ án môn học 2 Trang vi LIỆT KÊ HÌNH Hình 2.1: Các bƣớc cơ bản trong xử lý ảnh 3 Hình 2.2 Ảnh sau khi biến đổi hình thái 8 Hình 2.3 Kết quả của thuật toán hit-and-miss 9 Hình 2.4 Cấu trúc của nơ-ron sinh hoc 10 Hình 2.5 Nơ-ron nhân tạo 11 Hình 2.6 Đồ thị hàm ngƣỡng 12 Hình 2.7 Mạng lan truyền ngƣợc dùng n lớp ẩn 14 Hình 3.1 Lƣu đồ chƣơng trình nhận dạng 16 Hình 3.2 Lƣu đồ đọc ảnh 17 Hình 3.3 Lƣu đồ giải thuật cho mạng lan truyền ngƣợc 19 Hình 3.4 Ảnh kiểm tra 20 Hình 3.5 So sánh ngƣỡng và chọn ảnh phù hợp 21 Hình 3.6 Ảnh thông báo lỗi 21 Hình 4.1 Chƣơng trình chính 22 Hình 4.2 Chƣơng trình nhận dạng 23 Hình 4.3 Chỉ số ảnh 23 Hình 4.3 Command window trong quá trình huấn luyện 24 Hình 4.4 Kết quả nhận dạng 24 Đồ án môn học 2 Trang 1 CHƢƠNG 1: MỞ ĐẦU CHƢƠNG 1: MỞ ĐẦU 1.1.Đặt vấn đề Những năm gần đây, các bài toán nhận dạng đã có những bƣớc tiến khá quan trọng. Đối tƣợng nhận dạng ngày càng phong phú và đa dạng hơn, việc nhận dạng bây giờ không còn là nhận dạng offline nữa và các góc độ của mặt ngƣời không phải cố định mà nó liên tục thay đổi. Để thực hiện các bài toán nhận dạng này đòi hỏi phải có những thuật toán hiệu quả để giải quyết công việc nhận dạng chính xác và trong thời gian chấp nhận đƣợc. 1.2.Lý do chọn đề tài Ngày nay, công việc nhận dạng khuôn mặt có nhiều ứng dụng quan trọng trong hệ thống bảo mật nhƣ khóa bằng vân tay, giọng nói, giác mạc mắt đến các thiết bị an ninh, truy tìm tội phạm…Ngoài ra nó còn đƣợc sử dụng trong thiết kế robot nhận dạng. Xuất phát từ những yêu cầu thực tế trên ngƣời thực hiện tiến hành tìm hiểu và nghiên cứu đề tài :“NHẬN DẠNG ẢNH MẶT NGƢỜI DÙNG MẠNG NƠRON”. 1.3.Mục tiêu đề tài Ngƣời thực hiện nghiên cứu với các mục tiêu sau: - Tìm hiểu sơ lƣợc về lý thuyết xử lý ảnh. - Tìm hiểu về cấu trúc của nơron nhân tạo, mạng nơron. - Tìm hiểu về thuật toán biến đổi hình thái. - Tìm hiểu các thuật toán nhận dạng và xử lý ảnh. - Nâng cao kỹ năng thiết kế và lập trình bằng ngôn ngữ matlab. - Rèn luyện kỹ năng nghiên cứu, đọc hiểu tài liệu tiếng anh. Đồ án môn học 2 Trang 2 CHƢƠNG 1: MỞ ĐẦU 1.4.Giới hạn đề tài Với thời gian có hạn nên ngƣời nghiên cứu chỉ thực hiện nghiên cứu những vấn đề cơ bản sau: - Nghiên cứu thuật toán lan truyền ngƣợc để nhận dạng khuôn mặt sử dụng mạng nơron. - Nghiên cứu trích đặc trƣng dùng phƣơng pháp biến đổi hình thái. - Nghiên cứu giải thuật và thực hiện phần mền nhận dạng trên matlab. 1.5.Bố cục của đồ án. Chƣơng 1: Giới thiệu Chƣơng 2: Cơ sở lý thuyết Chƣơng 3: Nội dung nghiên cứu Chƣơng 4: Kết quả nghiên cứu và thực hiện Chƣơng 5: Kết luận và hƣớng phát triển Đồ án môn học 2 Trang 3 CHƯƠNG 2: CƠ SỞ LÝ THUYẾT CHƢƠNG 2:CƠ SỞ LÝ THUYẾT 2.1. Giới thiệu về hệ thống xử lí ảnh Xử lý ảnh là một lĩnh vực mang tính khoa học và công nghệ. Nó là một ngành khoa học mới mẻ so với nhiều ngành khoa học khác nhƣng tốc độ phát triển của nó rất nhanh, kích thích các trung tâm nghiên cứu, ứng dụng, đặc biệt là máy tính chuyên dụng riêng cho nó. Đối với một hệ thống xử lý ảnh, các công việc của nó bao gồm các bƣớc nhƣ hình 2.1. Hình 2.1: Các bƣớc cơ bản trong xử lý ảnh 2.1.1. Phần thu nhận ảnh (Image Acquisition) Ảnh có thể nhận qua camera màu hoặc đen trắng. Thƣờng ảnh nhận qua camera là ảnh tƣơng tự (loại camera ống chuẩn CCIR với tần số 1/25, mỗi ảnh 25 dòng), cũng có loại camera đã số hoá (nhƣ loại CCD – Change Coupled Device) là loại photodiot tạo cƣờng độ sáng tại mỗi điểm ảnh. Camera thƣờng dùng là loại quét dòng ; ảnh tạo ra có dạng hai chiều. Chất lƣợng một ảnh thu nhận đƣợc phụ thuộc vào thiết bị thu, vào môi trƣờng (ánh sáng, phong cảnh). 2.1.2.Tiền xử lý (Image Processing) Sau bộ thu nhận, ảnh có thể nhiễu độ tƣơng phản thấp nên cần đƣa vào bộ tiền xử lý để nâng cao chất lƣợng. Chức năng chính của bộ tiền xử lý là lọc nhiễu, nâng độ tƣơng phản để làm ảnh rõ hơn, nét hơn. Phân đoạn ảnh Biểu diễn và mô tả Nhận dạng và nội suy Thu nhận ảnh Tiền xử lý ảnh Cơ sở trí thức Đồ án môn học 2 Trang 4 CHƯƠNG 2: CƠ SỞ LÝ THUYẾT 2.1.3. Phân đoạn (Segmentation) hay phân vùng ảnh Phân vùng ảnh là tách một ảnh đầu vào thành các vùng thành phần để biểu diễn phân tích, nhận dạng ảnh. Ví dụ: để nhận dạng chữ (hoặc mã vạch) trên phong bì thƣ cho mục đích phân loại bƣu phẩm, cần chia các câu, chữ về địa chỉ hoặc tên ngƣời thành các từ, các chữ, các số (hoặc các vạch) riêng biệt để nhận dạng. Đây là phần phức tạp khó khăn nhất trong xử lý ảnh và cũng dễ gây lỗi, làm mất độ chính xác của ảnh. Kết quả nhận dạng ảnh phụ thuộc rất nhiều vào công đoạn này. 2.1.4.Biểu diễn ảnh (Image Representation) Đầu ra ảnh sau phân đoạn chứa các điểm ảnh của vùng ảnh (ảnh đã phân đoạn) cộng với mã liên kết với các vùng lận cận. Việc biến đổi các số liệu này thành dạng thích hợp là cần thiết cho xử lý tiếp theo bằng máy tính. Việc chọn các tính chất để thể hiện ảnh gọi là trích chọn đặc trƣng (Feature Selection) gắn với việc tách các đặc tính của ảnh dƣới dạng các thông tin định lƣợng hoặc làm cơ sở để phân biệt lớp đối tƣợng này với đối tƣợng khác trong phạm vi ảnh nhận đƣợc. Ví dụ: trong nhận dạng ký tự trên phong bì thƣ, chúng ta miêu tả các đặc trƣng của từng ký tự giúp phân biệt ký tự này với ký tự khác. 2.1.5. Nhận dạng và nội suy ảnh (Image Recognition and Interpretation) Nhận dạng ảnh là quá trình xác định ảnh. Quá trình này thƣờng thu đƣợc bằng cách so sánh với mẫu chuẩn đã đƣợc học (hoặc lƣu) từ trƣớc. Nội suy là phán đoán theo ý nghĩa trên cơ sở nhận dạng. Ví dụ: một loạt chữ số và nét gạch ngang trên phong bì thƣ có thể đƣợc nội suy thành mã điện thoại. Có nhiều cách phân loai ảnh khác nhau về ảnh. Theo lý thuyết về nhận dạng, các mô hình toán học về ảnh đƣợc phân theo hai loại nhận dạng ảnh cơ bản: o Nhận dạng theo tham số. o Nhận dạng theo cấu trúc. Một số đối tƣợng nhận dạng khá phổ biến hiện nay đang đƣợc áp dụng trong khoa học và công nghệ là: nhận dạng ký tự (chữ in, chữ viết tay, chữ ký điện tử), nhận dạng văn bản (Text), nhận dạng vân tay, nhận dạng mã vạch, nhận dạng mặt ngƣời… [...]... Cuối cùng chọn ảnh bằng cách đánh chỉ số vào ô “chọn chỉ số” , và bấm nút nhận dạng - Kết quả nhận dạng nhƣ sau: Hình 4.4 Kết quả nhận dạng CHƢƠNG 4: KẾT QUẢ NGHIÊN CỨU Đồ án môn học 2 Trang 25 CHƢƠNG 5: KẾT LUẬN VÀ HƢỚNG PHÁT TRIỂN 5.1 Kết luận Sử dụng mạng nơ-ron để nhận dạng ảnh mặt ngƣời dựa vào thuật toán biến đổi hình thái có ƣu điểm là nó sẽ biến đổi những đặc điểm về hình thái của mặt nguời là... 3.1.2 Huấn luyện ảnh dữ liệu và ảnh kiểm tra Việc huấn luyện ảnh dữ liệu và ảnh kiểm tra sử dụng thuật toán lan truyền ngƣợc (backpropagation) với một lớp ẩn (hidden) Thiết kế thuật toán cho mạng lan truyền ngƣợc Có 7 bƣớc để thực hiện một mạng lan truyền ngƣợc: Bƣớc 1: Khởi tạo các trọng số ngẫu nhiên và có giá trị nhỏ sử dụng Chúng ta có thể sử dụng hàm “randperm” trong MATLAB Sử dụng một hằng số... chƣơng trình nhận dạng 3.1.1 Đọc ảnh dữ liệu và ảnh kiểm tra Ảnh là tập hợp các điểm ảnh Việc đọc ảnh vào chƣơng trình thực chất là nạp ảnh vào một biến của chƣơng trình để xử lý Việc đọc ảnh trong đề tài này thực hiện theo lƣu đồ sau: CHƢƠNG 3: NỘI DUNG NGHIÊN CỨU Đồ án môn học 2 Trang 17 Đọc dữ liệu ảnh Chuyển từ ảnh màu thành ảnh nhị phân Chuẩn hóa kích thƣớc ảnh Lƣu Hình 3.2 Lƣu đồ đọc ảnh Matlab... thiệu sơ nét về mạng nơron Mạng nơron nhân tạo đƣợc thiết kế dựa trên mô hình mạng nơron thần kinh với các phần tử nơron nhân tạo của nó là sự mô phỏng nơron sinh học Đầu tiên, ta tìm hiểu sơ nét về mạng nơ ron sinh học Cấu trúc nơron sinh học Một tế bào nơron gồm bốn phần cơ bản: - Các nhánh và rễ:Các nhánh và rễ là các bộ phận nhận thông tin, các đầu nhạy hoặc các đầu ra của các nơron khác bám vào... Định nghĩa ảnh số Ảnh số là tập hợp các điểm ảnh với mức xám phù hợp dùng để mô tả ảnh gần với ảnh thật Ảnh là một sự vật đại diện cho con ngƣời,sinh vật hay sự vật nào đó v.v… ảnh động nhƣ ta thấy trên truyền hình thực chất là tập hợp của rất nhiều ảnh tĩnh liên tiếp.khi một ảnh đƣợc số hóa thì nó trở thành ảnh số và ảnh số này lại là một tập hợp của rất nhiều phần tử ảnh đƣợc gọi là điểm ảnh hay là... điểm ảnh lại đƣợc biểu diễn dƣới dạng một số hữu hạn các bit Chúng ta có thể chia ảnh ra làm ba loại khác nhau : + Ảnh đen trắng :mỗi điểm ảnh đƣợc biểu diễn bởi một bit + Ảnh Gray – scale :mỗi điểm ảnh đƣợc biểu diễn bằng các mức chói khác nhau,thƣờng thì ảnh này đƣợc biểu diễn bằng 256 mức chói hay là 8 bit cho mỗi điểm ảnh CHƯƠNG 2: CƠ SỞ LÝ THUYẾT Đồ án môn học 2 Trang 7 + Ảnh màu : mỗi điểm ảnh. .. phân Chuẩn hóa kích thƣớc ảnh Lƣu Hình 3.2 Lƣu đồ đọc ảnh Matlab hỗ trợ công cụ đọc ảnh bằng các sử dụng hàm “imread” Sau khi đã đọc ảnh chúng ta sẽ xử lý bức ảnh về dạng chuẩn để chuyển qua công đoạn tiếp theo.Chúng ta sử dụng hàm “rgb2gray” để chuyển từ ảnh màu sang ảnh xám và công đoạn cuối cùng là chuẩn hóa kích thƣớc ảnh, chúng ta dùng hàm “imresize” Sau quá trình trên chúng ta sẽ thu đƣợc hai bộ... điểm ảnh của lân cận 3×3 CHƯƠNG 2: CƠ SỞ LÝ THUYẾT Đồ án môn học 2 Trang 8 Hình sau là một số ảnh mặt ngƣời đã đƣợc biến đổi qua phép xử lý hình thái Hình 2.2 Ảnh sau khi biến đổi hình thái 2.3.2 Thuật toán his-and-miss Thuật toán hit-and-mis là một phép nhân chập dựa trên giản ảnh- co ảnh( dilationerosion-based) Nó là một bộ dò dạng hình thái mà có thể đƣợc sử dụng để tìm ra những đặc trƣng của điểm ảnh. .. Những vấn đề cơ bản trong hệ thống xử lí ảnh 2.2.1 Điểm ảnh (Picture Element) Gốc của ảnh (ảnh tự nhiên) là ảnh liên tục về không gian và độ sáng Để xử lý bằng máy tính (số), ảnh cần phải đƣợc số hoá Số hoá ảnh là sự biến đổi gần đúng một ảnh liên tục thành một tập điểm phù hợp với ảnh thật về vị trí (không gian) và độ sáng (mức xám) Khoảng cách giữa các điểm ảnh đó đƣợc thiết lập sao cho mắt ngƣời... mà có thể dò đƣợc khuôn mặt Về mặt toán học thuật toán này dựa trên lý thuyết tập hợp Nó thêm vào hoặc xóa đi các điểm ảnh từ ảnh nhị phân theo các luật đã biết phụ thuộc vào các mẫu lân cận Phép dãn ảnh và phép co ảnh là hai thao tác xử lý hình thái cơ bản Với phép dãn ảnh, một đối tƣợng sẽ nổi đều lên trong không gian, còn với phép co ảnh đối tƣợng sẽ co đều xuống Xét một ảnh đa mức xám F(j,k) đƣợc