Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 39 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
39
Dung lượng
1,28 MB
Nội dung
ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ Lưu Xuân Thế NGHIÊN CỨUCÁCKỸTHUẬTDÒBIÊNÁPDỤNGTRONGTRÍCHCHỌNCÁCBỘPHẬNKHUÔNMẶT KHOÁ LUẬN TỐT NGHIỆP ĐẠI HỌC HỆ CHÍNH QUY Ngành: Công nghệ thông tin HÀ NỘI – 2010 ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ Lưu Xuân Thế NGHIÊN CỨUCÁCKỸTHUẬTDÒBIÊNÁPDỤNGTRONGTRÍCHCHỌNCÁCBỘPHẬNKHUÔNMẶT KHOÁ LUẬN TỐT NGHIỆP ĐẠI HỌC HỆ CHÍNH QUY Ngành: Công nghệ thông tin Cán bộ hướng dẫn: ThS. Ma Thị Châu HÀ NỘI – 2010 i LỜI CẢM ƠN Lời đầu tiên em xin bày tỏ lòng biết ơn tới các thầy, cô giáo trong trường Đại học Công nghệ - Đại học Quốc gia Hà Nội. Các thầy cô đã dạy bảo, chỉ dẫn chúng em và luôn tạo điều kiện tốt nhất cho chúng em học tập trong suốt quá trình học đại học đặc biệt là trong thời gian làm khoá luận tốt nghiệp. Em xin bày tỏ lòng biết ơn sâu sắc tới cô giáo ThS. Ma Thị Châu, cô đã hướng dẫn em tận tình trong cả học kỳ vừa qua, cô đã góp ý và chỉnh sửa thường xuyên cho khóa luận của em. Tôi cũng xin cảm ơn những người bạn của mình, các bạn đã luôn ở bên tôi, giúp đỡ và cho tôi những ý kiến đóng góp quý báu trong học tập cũng như trong cuộc sống. Hà nội, ngày 2010 Lưu Xuân Thế ii TÓM TẮT Kỹthuậtdòbiên là bài toán mới chỉ xuất hiện cách đây không lâu, chỉ khoảng vài thập niên, nhưng đã có rất nhiều nghiên cứu về nó. Các nghiên cứu ban đầu rất đơn giản, ảnh là đen trắng và chỉ có một khuônmặt chụp thẳng, sau này mở rộng ra cho ảnh màu, ảnh có nhiều khuônmặt với nhiều góc, môi trường xung quanh cũng đi từ đơn giản đến rất phức tạp. Từ khóa : edge detection, edge filter. iii MỤC LỤC LỜI CẢM ƠN i TÓM TẮT ii MỤC LỤC iii Chương 1. GIỚI THIỆU 5 1.1 Giới thiệu về tìm biêntrong nhận dạng khuônmặt 5 1.2 Bài toán nghiên cứukỹthuật dò biênápdụngtrongtríchchọnkhuônmặt 2 1.3 Nội dung và cấu trúc khóa luận 2 Chương 2. CÁCKỸTHUẬTDÒBIÊN 4 2.1 Quy trình phát hiện biên 4 2.2 Kỹthuật phát hiện biên trực tiếp 4 2.2.1 Kỹthuật Gradient 5 2.2.2 Toán tử la bàn 8 2.2.3 Kỹthuật Laplace 10 2.2.4 Tách sườn theo ảnh Canny 11 2.2.5 Dòbiên theo quy hoạch động 12 2.3 Kỹthuật phát hiện biên gián tiếp 15 2.4 Một số phương pháp khác 15 16 2.5 Tổng kết 16 Chương 3. CÁCKỸTHUẬTDÒBIÊN ĐƯỢC ÁPDỤNG 18 3.1 Cáckỹthuật được dùng 18 3.1.1 Lấy biên theo trục X 19 3.1.2 Lấy biên theo trục Y 21 3.1.3 Lấy biên theo Gradient 21 3.1.4 Lấy biên theo Thresholding 21 iv 3.1.5 Lấy biên theo Thinning 21 3.2 Chương trình và kết quả 23 3.3 Biến thành ảnh đa cấp xám 24 3.2.1 Lấy biên theo trục X 24 3.2.2 Lấy biên theo trục Y 25 3.2.3 Lấy biên theo Gradient 26 3.2.4 Lấy biên theo Thresholding 26 3.2.5 Lấy biên theo Thinning 27 3.3 Tổng kết 28 Chương 4. KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN 30 4.1 Kết luận 30 4.2 Hướng phát triển 30 4.2.1 Đặt vấn đề 30 4.2.2 Phương pháp thực hiện 31 TÀI LIỆU THAM KHẢO………………………………………………………… 32 v Chương 1. GIỚI THIỆU 1.1 Giới thiệu về tìm biêntrong nhận dạng khuônmặtKỹthuậtdòbiên là bài toán mới chỉ xuất hiện cách đây không lâu, chỉ khoảng vài thập niên, nhưng đã có rất nhiều nghiên cứu về nó. Các nghiên cứu ban đầu rất đơn giản, ảnh là đen trắng và chỉ có một khuônmặt chụp thẳng, sau này mở rộng ra cho ảnh màu, ảnh có nhiều khuônmặt với nhiều góc, môi trường xung quanh cũng đi từ đơn giản đến rất phức tạp. Bài toán phát hiện biên nói chung và phát hiệ n biênkhuônmặt nói riêng có rất nhiều hướng để phát triển, nhưng có thể kể ra hai hướng chính sau: - Thứ nhất là nhận diện (face recognition) một khuôn mặt, tức là giả sử ta có bức ảnh một khuôn mặt, ta sẽ tìm một bức ảnh có khuônmặt giống với khuônmặttrong ảnh. Ứng dụng của nó là truy tìm tội phạm, các hệ thống an ninh xác đinh dựa vào khuôn mặt. - Thứ hai là xác định vị trí những khuônmặttrong mộ t bức ảnh (face detection), các bức ảnh có thể có nhiều khuôn mặt, có kích thước và góc khác nhau. Ứng dụng của nó như trongcác máy chụp hình có khả năng nhận dạng mặt người để chỉnh độ sáng nơi đó. Biên là vấn đề chủ yếu trongphân tích ảnh, vì các đặc điểm tríchchọntrong quá trình phân tích ảnh chủ yếu dựa vào biên. Một điểm được gọi là điểm biên nếu ở đó có sự thay đổi đột ngột về mức xám. Tập hợp các điểm biên tạo thành biên hay đường bao của ảnh. Về mặt toán học người ta xem biên là nơi có sự thay đổi đột ngột về mức xám, trên cơ sở đó người ta thường sử dụng hai phương pháp phát hiện biên sau: - Phương pháp phát hiện biên trực tiếp - Phương pháp phát hiện biên gián tiếp Xuất phát từ thực tế đó, mục tiêu của luận v ăn là nghiên cứucác phương pháp biểu diễn biên, hệ thống hóa kiến thức về các phương pháp phát hiện biên, tìm hiểu cáckỹthuậtphân vùng ảnh, một bước trước trong quá trình dòbiên và ứng dụng của nó trong xử lý ảnh và xử lý ảnh văn bản là một trong những nhiệm vụ quan trọngtrong việc tự động hóa công việc văn phòng. 2 1.2 Bài toán nghiên cứukỹthuật dò biênápdụngtrongtríchchọnkhuônmặtTrong thực tế, chúng ta gặp nhiều bài toán liên quan đến nhận dạng đối tượng. Thông thường, việc nhận ra các đối tượng thường dựa vào đường biên của chúng. Ở Việt Nam hiện nay đã có một số hệ thống nhận dạng đối tượng như: MapScan, VnDOCR, MarkREAD của Viện Công nghệ thông tin hay VecMap của DolSoft, nhìn chung những ứng dụng và tài tiệu có tính chất hệ thống về các phương pháp biểu phát hiện biên và ứng dụng c ủa nó vẫn là một phần thiếu vắng. Xuất phát từ thực tế đó, mục tiêu của luận văn là nghiên cứucác phương pháp biểu diễn biên, hệ thống hóa kiến thức về các phương pháp phát hiện biên, tìm hiểu cáckỹthuậtphân vùng ảnh, tìm hiểu quá trình dòbiên và ứng dụng của nó trong xử lý ảnh và xử lý ảnh văn bản, là một trong những nhiệm vụ quan trọngtrong việc tự động hóa công vi ệc văn phòng. Trong khóa luận này biênkhuônmặt sẽ được hiển thị thông qua một chương trình mã đơn giản. Với 5 kỹthuật được ápdụngbiênkhuônmặt sẽ được đưa ra với 5 kiểu khác nhau. Mỗi kiểu sẽ là một đặc điểm và khía cạnh riêng. 1.3 Nội dung và cấu trúc khóa luận Khóa luận được tổ chức theo cấu trúc như sau: Chương 1: Giới thiệu Giới thiệu sơ lược về cáckỹthuậtdòbiên nói chung và kỹthuậtdòbiênápdụng với khuônmặt và ápdụng cho việc tríchchọncácbộphận của khuôn mặt. Bài toán phát hiện biên được phân tích dưới khía cạnh toán học giúp ta chọn hướng giải quyết tốt nhất cho bài toán là sử dụngcáckỹthuật tìm kiếm biên cổ điển. Chươ ng này giới thiệu những gì mà khóa luận nghiên cứu từ đó thông qua việc trình bày về nội dung và cấu trúc của khóa luận. Chương 2: Cáckỹthuậtdòbiên Chương hai đi vào giới thiệu giới thiệu cáckỹthuậtdò biên. Với 2 kỹthuậtdòbiên trực tiếp và gián tiếp, nhưng ta chủ yếu đi xâu vào kỹthuậtdòbiên trực tiếp được dùng rộng rãi và thường xuyên. Chương 3: Kỹthuậtdòbiên được ápdụng Chươ ng này giới thiệu vào cáckỹthuậtdòbiên được ápdụngtrong chương trình. Bằng cách sử dụng hàm Gauss để làm trơn ảnh sau đódùngcáckỹthuật tìm kiếm trực tiếp 3 để đưa ra 5 kiểu biên khác nhau với một bức ảnh nói chung và khuônmặttrong chương trình này. Chương 4: Kết luận và hướng phát triển Chương này tổng kết lại những gì đã đạt được và chưa đạt được. Từ đó nêu lên những kết quả hướng tới, hướng nghiên cứu và phát triển tiếp theo. 4 Chương 2. CÁCKỸTHUẬTDÒBIÊN 2.1 Quy trình phát hiện biên ảnh đầu vào output H2.1. Quy trình phát hiện biên B1: Do ảnh ghi được thường có nhiễu, bước một là phải lọc nhiễu B2: Làm nổi biên sử dụngcác toán tử phát hiện biên. B3: Định vị biên. Chú ý rằng kỹthuật nổi biên gây tác dụng phụ là gây nhiễu làm một số biên giả xuất hiện do vậy cần loại bỏbiên giả. B4: Liên kết và tríchchọn biên. 2.2 Kỹthuật phát hiện biên trực tiếp Phương pháp này chủ yếu dựa vào sự biến thiên độ sáng của điểm ảnh để làm nổi biên bằng kỹthuật đạo hàm. - Nếu lấy đạo hàm bậc nhất của ảnh: ta có phương pháp Gradient Định nghĩa: Gradient là một vector f(x, y) có các thành phần biểu thị tốc độ thay đổi mức xám của điểm ảnh (theo hai hướng x, y trong bối cảnh xử lý ảnh hai chiều) tức: Trongđó dx, dy là khoảng cách giữa 2 điểm kế cận theo hướng x, y tương ứng (thực tế chọn dx=dy=1). Đây là phương pháp dựa trên đạo hàm riêng bậc nhất theo hướng x, y. Lọc nhiễu Làm nổi Định vị biêntríchchọnbiên [...]... phương pháp dòbiên tổng thể Phương pháp dòbiên trực tiếp có hiệu quả và ít bị tác động bởi nhiễu 17 Chương 3 CÁCKỸTHUẬTDÒBIÊN ĐƯỢC ÁPDỤNG 3.1 Các kỹ thuật được dùngBiên là tập hợp các điểm tại đó hàm độ sáng của ảnh thay đổi cục bộ đột ngột, dođó để phát hiện biên và tách biên ta dùng phép toán đạo hàm Các phép toán đạo hàm thường dùng là đạo hàm bậc nhất và đạo hàm bậc 2 Vị trí của biên chính... Phát hiện khuônmặt là quá trình đầu tiên quan trọng và cần thiết cho bất kỳ hệ thống xử lý khuônmặt một cách tự động như: nhận dạng khuôn mặt, xác định các thành phần đặc trưng của khuôn mặt, kiểm chứng xác thực khuônmặt Nhiệm vụ của hệ thống phát hiện khuônmặt nhằm xác định xem trong ảnh đầu vào có khuônmặt hay không, nếu có thì chỉ ra vị trị và kích thước của từng khuônmặttrong ảnh Trong hai... 4 KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN 4.1 Kết luận Với 5 phương pháp phát hiện biên đi từ đơn giản đến phức tạp, cũng như là hiệu quả tăng lên theo từng phương pháp Trong chương trình này kỹthuậtdòbiên trực tiếp được sử dụng, cụ thể là phương pháp Gradient Bằng cách sử dụng 2 cặp mặt nạ trực giao cụ thể là 2 ma trận mà biên theo trục X và ma trận biên theo trục Y Biên được lọc theo các phương pháp là cơ... ta có thể tríchchọn những đặc trưng của khuôn mặt, tức là ta sẽ lọc theo ngưỡng và kết hợp ảnh lọc theo ngưỡng và ảnh lọc theo biên ta sẽ được các đặc trưng khuônmặt Qua quá trình làm khóa luận tôi đã nắm được các phương pháp lấy biên và biết được nhưng ápdụng của nó trong xử lý ảnh nói chung Những kết quả mà khóa luận đã đạt được có thể tóm tắt như sau: • Tách ra được biên của khuônmặt với một... pháp được sử dụng • Là bước đệm để cho các bài toán như tríchchọn đặc trưng đối tượng, phân vùng dựa trên biên ảnh • Từ biên ảnh khuônmặt ta có thể làm cho bức chân dung mượt hơn bằng cách tăng cường cho đường biên kết quả liên tục 4.2 Hướng phát triển 4.2.1 Đặt vấn đề Phát hiện và nhận dạng khuônmặttrong ảnh có rất nhiều ứng dụngtrong cuộc sống Đây cũng là bài toán cơ bản cần giải quyết trong các. .. hạn chế điểm cực trị cục bộ với mục đích cung cấp chỉ một đường bao 2.5 Tổng kết Cáckỹthuật sử dụng phương pháp Gradient khá tốt khi độ sáng có tốc độ thay đổi nhanh, khá đơn giản trên cơ sở cácmặt nạ theo các hướng Nhược điểm của cáckỹthuật Gradient là nhạy cảm với nhiễu và tạo cácbiên kép làm chất lượng biên thu được không cao 16 Ngoài ra, người ta còn sử dụng phương pháp “đi theo đường bao”... rộng cácmặt nạ với n hướng cách đều tương ứng với cácmặt Wi; i=1, 2, …, n Khi đó, biênđộ tại hướng thứ i với mặt nạ Wi được xác định: 2.2.3 Kỹthuật Laplace Để khắc phục hạn chế và nhược điểm của phương pháp Gradient, trongđó sử dụng đạo hàm riêng bậc nhất người ta nghĩ đến việc sử dụng đạo hàm riêng bậc hai hay toán tử Laplace Phương pháp dòbiên theo toán tử Laplace hiệu quả hơn phương pháp toán... phân vùng Phương pháp dòbiên gián tiếp khó cài đặt nhưng ápdụng tốt khi sự biến thiên độ sáng nhỏ 2.4 Một số phương pháp khác Ngoài các phương pháp trên, người ta cũng ápdụng một số phương pháp khác cải tiến như tiếp cận bởi mô hình mặt, cách tiếp cận tối ưu hóa Cách tiếp cận theo mô hình mặt dựa vào việc thực hiện xấp xỉ đa thức trên ảnh gốc hay ảnh đã thực hiện phép lọc Laplace Cách tiếp cận tối... theo x và y: Từ đó ta có: Với biênđộ và hướng tính theo công thức trên, thuật toán được minh họa như hình H2.5 trên 2.2.5 Dòbiên theo quy hoạch động Như trên đã nói, dòbiên theo phương pháp Gradient là xác định cực trị cục bộ của Gradient theo các hướng; còn phương pháp Laplace dựa vào các điểm không của đạo hàm bậc hai Phương pháp dòbiên theo quy hoạch động là phương pháp tìm cực trị tổng thể theo... đường biên khác nhau và hiệu quả đã được tăng dần theo từng phương pháp Điều này sẽ được thể hiện rõ nét hơn khi được thể hiện qua hình dưới: 28 H3.9 Quy trình biến đổi lấy biên theo thinning Ta thấy biên được tách biệt một cách rõ ràng hơn khi qua phươg pháp Thinning Với việc lọc biên như thế sẽ rất hiểu quả trong việc tríchchọncác đặc trưng khuôn mặt, từ đó giúp cho việc nhận dạng khuônmặt sẽ . Giới thiệu sơ lược về các kỹ thuật dò biên nói chung và kỹ thuật dò biên áp dụng với khuôn mặt và áp dụng cho việc trích chọn các bộ phận của khuôn mặt. Bài toán phát hiện biên được phân tích. về tìm biên trong nhận dạng khuôn mặt 5 1.2 Bài toán nghiên cứu kỹ thuật dò biên áp dụng trong trích chọn khuôn mặt 2 1.3 Nội dung và cấu trúc khóa luận 2 Chương 2. CÁC KỸ THUẬT DÒ BIÊN 4. khóa luận. Chương 2: Các kỹ thuật dò biên Chương hai đi vào giới thiệu giới thiệu các kỹ thuật dò biên. Với 2 kỹ thuật dò biên trực tiếp và gián tiếp, nhưng ta chủ yếu đi xâu vào kỹ thuật dò biên