giải thuật đối sánh dạng tháp trong nhận dạng ảnh

68 443 0
giải thuật đối sánh dạng tháp trong nhận dạng ảnh

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Luận văn tốt nghiệp GVHD : Phạm Văn Huy SVTH : Ngô Lê Ngọc Bích Trang 4 TRƯỜNG ĐẠI HỌC CẦN THƠ KHOA SƯ PHẠM BỘ MÔN TOÁN LUẬN VĂN TỐT NGHIỆP ĐẠI HỌC GIẢI THUẬT ĐỐI SÁNH DẠNG THÁP TRONG NHẬN DẠNG ẢNH Giáo viên hướng dẫn : Sinh viên thực hiện : Ths. Phạm Văn Huy Ngô Lê Ngọc Bích MSSV : 1050204 Lớp : Toán Tin K31 Năm học : 2008-2009 Luận văn tốt nghiệp GVHD : Phạm Văn Huy SVTH : Ngô Lê Ngọc Bích Trang 5 LỜI CÁM ƠN    Trong quá trình làm luận văn, tôi đã nhận được nhiều sự giúp đỡ của quý thầy cô khoa Sư phạm, bộ môn Toán, sự động viên tinh thần của gia đình và bạn bè. Đây là nguồn động viên tinh thần và vật chất to lớn để tôi đã hoàn thành luận văn tốt nghiệp. Nay tôi xin gửi đến lời tri ân sâu sắc đến toàn thể mọi người. Xin chân thành gửi lời cảm ơn đến thầy Phạm Văn Huy đã cho tôi có cơ hội được hiểu biết về đề tài Máy Học_một đề tài mới mẻ và vô cùng thú vị trong lĩnh vực khoa học máy tính. Cám ơn sự giúp đỡ của thầy về mặt tư liệu tham khảo cũng như sự hướng dẫn trong suốt quá trình thực hiện. Ngoài ra, xin chân thành cảm ơn Mr.John Lee, tác giả của một vài tài liệu mà tôi tham khảo. Cám ơn sự hướng dẫn, giúp đỡ tận tình của ông trong quá trình thu thập và nghiên cứu tài liệu. Tôi xin chân thành cảm ơn sự đóng góp, nhận xét của các Thầy, Cô phản biện và giáo viên hướng dẫn để tôi có thể hoàn thành bày luận văn. Sau cùng chúng tôi xin chân thành cảm ơn gia đình, quý thầy cô trong khoa Sư Phạm, và bạn bè lớp Toán Tin K31, các thành viên của forum Ubuntu Việt Nam cũng như cộng đồng BaamBoo Tra Từ đã giúp đỡ chúng tôi hoàn thành luận văn. Luận văn tốt nghiệp GVHD : Phạm Văn Huy SVTH : Ngô Lê Ngọc Bích Trang 6 NHẬN XÉT CỦA GIÁO VIÊN HƯỚNG DẪN : Luận văn tốt nghiệp GVHD : Phạm Văn Huy SVTH : Ngô Lê Ngọc Bích Trang 7 NHẬN XÉT CỦA GIÁO VIÊN PHẢN BIỆN : Luận văn tốt nghiệp GVHD : Phạm Văn Huy SVTH : Ngô Lê Ngọc Bích Trang 8 Luận văn tốt nghiệp GVHD : Phạm Văn Huy SVTH : Ngô Lê Ngọc Bích Trang 9 MỤC LỤC MỤC LỤC 4 LỜI NÓI ĐẦU 11 I. GIỚI THIỆU CHUNG 12 I.1 GIỚI THIỆU ĐỀ TÀI 12 I.1.1 Tìm kiếm dựa vào từ khóa 12 I.1. 2 Tìm kiếm một bức ảnh đã có trong cơ sở dữ liệu 13 I.1.3 Tìm kiếm những hình ảnh cùng thuộc một chủ đề 13 I.2 MỤC ĐÍCH CỦA ĐỀ TÀI 14 I.3 HƯỚNG GIẢI QUYẾT 14 II. CƠ SỞ LÝ THUYẾ T : 15 II.1 SƠ ĐỒ VORONOI 15 II.2 NHỮNG LÝ THUYẾT CƠ BẢN VỀ CÂY 16 III. NỘI DUNG CHÍNH 17 III.1 CÁC BƯỚC CƠ BẢN TRONG XỬ LÝ ẢNH 18 III.2 GIẢI THUẬT ĐỐI SÁNH DẠNG THÁP [2] 20 III.2.1 Ý tưởng 20 III.2.2 Giải thuật đối sánh dạng tháp (The pyramid match ) 22 III.2.3 Ví dụ minh họa sự phát triển các cấp của giải thuật đối sánh dạng 25 III.2.4 Sơ đồ minh họa giải thuật đối sánh dạng tháp 27 III.2.5 Hiệu quả của giải thuật 29 III.3 GIẢI THUẬT ĐỐI SÁNH DẠNG THÁP ĐỊNH HƯỚNG TỪ VỰNG (VG) [2] 30 III.3.1 Những nét cơ bản của giải thuật VG 31 III.3.2 Những tương ứng trong giải thuật VG 33 III.4 KẾT HỢP GIẢI THUẬT VG VÀ CÂY TỪ VỰNG [2,3,4] 34 III.4.1 Cây từ vựng 34 III.4.2 Cây thích nghi 36 III.4.3 Phát triển cây 37 III.4.4 Cắt tỉa những nút lỗi thời 38 III.4.5 Kết hợp giải thuật VG và cây từ vựng thích nghi trong nhận dạng ảnh 39 III.4.6 Kết hợp nhiều cây 46 III.4.6 Kết quả từ một số thí nghiệm áp dụng giải thuật trên 47 IV. XÂY DỰNG DEMO 53 IV.1 GIỚI THIỆU VỀ UBUNTU VÀ NGÔN NGỮ JAVA 53 IV.1.1 Giới thiệu về Ubuntu 53 IV.1.2 Giới thiệu về Java 54 Luận văn tốt nghiệp GVHD : Phạm Văn Huy SVTH : Ngô Lê Ngọc Bích Trang 10 IV.1.3 Lý do xây dựng demo trên Ubuntu và ngôn ngữ Java 54 IV.2 GIỚI THIỆU DEMO 55 IV.2.1 Giới thiệu một số code được dùng 55 IV.2.2 Các thành phần và mã viết demo 56 IV.2.3 Hướng dẫn sử dụng demo 65 IV.2.4 MỘT VÀI KẾT QUẢ BẰNG CHƯƠNG TRÌNH TRÊN 67 V. KẾT LUẬN VÀ ĐỀ NGHỊ 70 V.1 KẾT QUẢ ĐẠT ĐƯỢC 70 V.2 HẠN CHẾ 70 V.3 HƯỚNG PHÁT TRIỂN CỦA ĐỀ TÀI 70 TÀI LIỆU THAM KHẢO 71 Luận văn tốt nghiệp GVHD : Phạm Văn Huy SVTH : Ngô Lê Ngọc Bích Trang 11 LỜI NÓI ĐẦU Ngày nay, nhận biết được xem là 1 chủ đề thú vị trong lĩnh vực trí tuệ nhân tạo. Nó không chỉ dừng lại ở việc nhận dạng những chữ ( dạng text thông thường). Nó vươn xa hơn trong nhiều lĩnh vực như nhận dạng vân tay, chữ viết, khuôn mặt, giọng nói… Đối với mỗi người dùng, nhận dạng và tìm kiếm là một khái niệm mà bất kỳ ai đều quen thuộc trong quá trình xử lý thông tin. Với lượng thông tin ngày càng đa dạng hơn, đòi hỏi con người phát triển nhiều giải thuật hơn để phù hợp với nguồn cơ sở dữ liệu, đặc biệt đối với nguồn cơ sở dữ liệu động. Bài báo cáo này giới thiệu giải thuật biểu đồ tháp và quá trình phát triển để xây dựng một hệ thống nhận dạng và tìm kiếm hình ảnh dưới nhiều góc độ khác nhau từ khung cảnh, góc nhìn cho đến độ tương phản, độ sáng tối của cùng một hình ảnh với một cơ sở dữ liệu động. Thông qua bài báo cáo, hy vọng sẽ góp một phần nhỏ giúp chúng ta hiểu hơn về cách tổ chức cơ sở dữ liệu phục vụ cho quá trình tìm kiếm dữ liệu nói chung và hình ảnh nói riêng. Đây thực sự là một vấn đề khó trong chuỗi các vấn đề của Máy học. Mặc dù đã rất cố gắng, nhưng không tránh khỏi sai lầm và thiếu sót. Rất mong được sự đóng góp, sửa chữa từ phía bạn đọc. Những ý kiến đóng góp này sẽ là nền tảng để đề tài có thể khắc phục những khuyết điểm và tiếp tục phát triển trong tương lai. Luận văn tốt nghiệp GVHD : Phạm Văn Huy SVTH : Ngô Lê Ngọc Bích Trang 12 I. GIỚI THIỆU CHUNG I.1 GIỚI THIỆU ĐỀ TÀI Hình ảnh được xem là biểu hiện trực quan nhất trong tất cả các phương thức giao tiếp của con người. Do đó, việc tìm kiếm hình ảnh cũng luôn là một vấn đề trọng tâm trong việc nghiên cứu chủ đề nhận dạng và tìm kiếm. Có rất nhiều yêu cầu tìm kiếm hình ảnh để phục vụ cho những mục đích khác nhau từ việc thu thập thông tin, dữ liệu cho đến việc “dạy” cho những cỗ máy vô tri nhận dạng và tìm kiếm hình ảnh. Các đoạn sau trình bày một số yêu cầu tìm kiếm thường gặp. I.1.1 Tìm kiếm dựa vào từ khóa Đây là một phương pháp rất phổ biến trong việc tìm kiếm hình ảnh. Người dùng cần đưa ra một từ khóa miêu tả một cách tổng quát nhìn ảnh cần tìm. Sau đó, máy tính sẽ trả về những hình ảnh tương thích. Một ví dụ thực tế là việc tìm kiếm hình ảnh trên mạng. Hình trên minh họa một quá trình tìm kiếm dựa vào từ khóa. Giả sử, người dùng muốn tìm kiếm những bức ảnh về “con mèo” họ chỉ cần gõ từ khóa này vào ô tìm kiếm và sẽ có ngay được kết quả mong muốn. Vấn đề đặt ra ở đây là Luận văn tốt nghiệp GVHD : Phạm Văn Huy SVTH : Ngô Lê Ngọc Bích Trang 13 phương pháp tìm kiếm như thế nào. Có phải máy tính “đọc” được yêu cầu của người dùng là tìm kiếm hình ảnh về con mèo sau đó “nhìn” xem bức ảnh nào trong cơ sở dữ liệu là thích hợp để trả về kết quả ? Điều này là hoàn toàn không thực hiện được, máy tính không đọc được bất kỳ nào văn bản của con người cũng như không “nhìn” thấy được nội dung của bức ảnh là gì. Ngôn ngữ duy nhất mà máy tính đọc được chỉ là giá trị 0 và 1 ( tương ứng với tắt và mở mạch điện). Bản chất của vấn đề tìm kiếm ở đây là tìm kiếm văn bản (một chủ đề được nghiên cứu, phát triển từ rất sớm và đã có một số thành công nhất định). Mỗi hình ảnh khi được đưa vào cơ sở dữ liệu (hình ảnh online trên mạng) được gán bởi một nhãn (tag) nói lên nội dung mà nó hiển thị. Máy tính dựa vào nhãn này ( hoặc tên file) để có được kết quả trả về. I.1. 2 Tìm kiếm một bức ảnh đã có trong cơ sở dữ liệu Giả sử ta có một số hình ảnh được lưu trữ trong máy tính. Yêu cầu đặt ra là cho một trong những hình ảnh trên, máy tính hãy trả về những thông tin liên quan đến nó ( như tên file, kích thước, vị trí được lưu trên đĩa….). So với yêu cầu tìm kiếm đầu tiên, ở đây việc tìm kiếm đã nâng lên mức độ khó hơn khi cả dữ liệu truy vấn và cở sở dữ liệu cho việc tìm kiếm đều dựa vào hình ảnh. Nhờ một số phần mềm xử lý ảnh (Photoshop), yêu cầu này đã được giải quyết. Trước tiên chia hình ảnh truy vấn ra thành những phần nhỏ, thực hiện tương tự với hình ảnh trong cơ sở dữ liệu. Sau đó, so sánh những mẩu hình này với nhau để có được kết quả tìm kiếm. I.1.3 Tìm kiếm những hình ảnh cùng thuộc một chủ đề Giả sử, cũng với cơ sở dữ liệu như trên. Và một hình ảnh truy vấn như sau : [...]... kho ng cách gi a các i m trong 2 t p có s c trưng Trong c trưng l n lư t là m, n c n O(dmn) ơn v th i gian Ngoài ra, ta th y r ng nh ng i m ư c s p SVTH : Ngô Lê Ng c Bích Trang 29 Lu n văn t t nghi p x p trong bi u GVHD : Ph m Văn Huy nói lên kho ng cách c a nó n nh ng i m khác trong t p i m III.3 GI I THU T HƯ NG T Gi i thu t I SÁNH D NG THÁP NH V NG (VG) [2] i sánh d ng tháp (pyramid match) ã làm... m ư c mã hóa thành nh ng bi u tháp L y giao gi a hai bi u i v i t p g c Bư c u tiên là c trưng thành c t gi ng nh ư trong gi i thu t b t kỳ có ư c m t s nh nghĩa s s p x p c a các ô s d ng trong so sánh các tương ng i m i sánh d ng i sánh g n úng i v i bi u a l i gi i ây là quá trình bi u di n trư c khi có b t k ỳ tương ng nào ư c xem xét So v i gi i thu t i sánh d ng tháp, quá trình này ph c t p hơn... o ( X ), , H L −1 ( X )} , H i ( X ) =  p , n, d  Trong ó, H i ( X ) là 1 bi u i trong 1 , , p , n, d ki   trong không gian ki_chi u ư c gán v i c p i v i nh ng ư ng i trong H i ( X ) và 0 ≤ i < L th tháp, p ∈ Zi ng v i m i ư ng i trong bi u này là 1 b 3 s tương ng v i ch s ô, s các i m trong ô và kho ng cách l n nh t gi a nh ng i m trong ô tâm c a ô Vecto p =  p1 , , pi  , p j ∈ [1,... ư c t ch c t t hơn III.4.5 K t h p gi i thu t VG và cây t v ng thích nghi trong nh n d ng nh Trong các ph n trư c chúng ta ã tìm hi u m t s n i d ng sau : - Gi i thu t i sánh d ng tháp ( pyramid match) v i m c ích tăng kh - Gi i thu t i sánh d ng tháp n ăng ư c lư ng nh ng tương ng gi a các t p d a trên gi i thu t i sánh d ng tháp - Cây t v ng : phương pháp cài c trưng c a hình nh nh hư ng t v ng (VG)... ã gi i thi u trong ph n trên) Khi ó, trong th tháp, m i ngăn tương ng v i m t nút trong cây, v i m i nút là m t danh sách các i m Chú ý r ng v i m i hình nh, danh sách này là r t th ưa th t, không ph i m i c a bi u c trưng c a nh u xu t hi n trong m i ô tháp chèn m t i m m i vào cây, trư c tiên ghi nó vào cây t v ng và t o ra 1 ư ng i song song v i th tháp tương ng _t o ra nh ng ô m i trong ư ng i... GVHD : Ph m Văn Huy i sánh d ng tháp trong vi c o gi ng nhau) gi a hai hình nh S phát tri n c a gi i thu t này ng d ng (s tăng chính xác Gi i thi u nh ng n t cơ b n c a cây t v ng, phương pháp xây d ng cây t v ng thích nghi gi i thu t nó phù h p v i cơ s d li u ng S k t h p gi a cây t và i sánh d ng tháp trong nh n d ng và tìm ki m nh Xây d ng m t h th ng nh n d ng và tìm ki m nh Trong ó, ngư i dùng... c minh h a trong hình 6 SVTH : Ngô Lê Ng c Bích Trang 21 Lu n văn t t nghi p GVHD : Ph m Văn Huy Trong m i l n ph n chia, kích th ư c c a ô sau g p ôi ô trư c Hai i m ư c xem là tương ng nhau khi cùng n m trong m t ô Nh ng i m tương ng trong quá trình u s không ư c xem xét ư c bi u di n thành t p các bi u quá trình sau Khi ó, m i t p i m Ngư i ta g i xu t này là gi i thu t i sánh d ng tháp ( the pyramid... gian tính ng d ng gi a 2 hai t p là O(mL) K t qu này cho th y th i gian so sánh gi a hai t p i m ã ư c tăng áng k so v i gi i thu t i sánh d ng tháp Gi i thu t VG ư c dùng vì nó cho phép ta k t ôi nh ng t p có s chi u l n trong th i gian tuy n tính Ngoài ra, m t lý do quan tr ng trong vi c phát tri n gi i thu t này là v trí các i m trong t p d li u xác nh ô ch a nó ngay khi ư c thêm vào cơ s d li u Các... làm rút g n m t s lư ng l n các phép tính trong vi c tìm các c p i m tương ng Tuy nhiên, quá trình quan sát s phân b c a các i m trong không gian c trưng, sinh Trong không gian nhi u i m t p trung c trưng, m t v n l i phát m t vài vùng có r t ít các i m, trong có quá nơi khác ư c minh h a hình 7 Hình 7 : minh h a hai c p liên ti p nhau c a gi i thu t i sánh d ng tháp Không gian c trưng ư c phân chia thành... ), ψ (Y ) so sánh s gi ng nhau gi a các hình ng d ng càng l n ch ng t hai hình càng có c trưng tương ng III.2.3 Ví d minh h a s phát tri n các c p c a gi i thu t i sánh d ng r r r r Xét hai t p i m X = {x1 , x9 }, Y = {y1 , , y5 } , ví d minh h a s phát tri n 3 c p liên ti p c a gi i thu t i sánh d ng tháp Trong m i c p, tính tr ng s wi và s tương ng m i Ni Nh ng ư ng ngang màu xanh lá trong bi u Hi(X), . triển các cấp của giải thuật đối sánh dạng 25 III.2.4 Sơ đồ minh họa giải thuật đối sánh dạng tháp 27 III.2.5 Hiệu quả của giải thuật 29 III.3 GIẢI THUẬT ĐỐI SÁNH DẠNG THÁP ĐỊNH HƯỚNG TỪ. giữa cây từ và giải thuật đối sánh dạng tháp trong nhận dạng và tìm kiếm ảnh. Xây dựng một hệ thống nhận dạng và tìm kiếm ảnh. Trong đó, người dùng có thể nhúng bất kỳ hình ảnh nào vào cơ sở. DUNG CHÍNH 17 III.1 CÁC BƯỚC CƠ BẢN TRONG XỬ LÝ ẢNH 18 III.2 GIẢI THUẬT ĐỐI SÁNH DẠNG THÁP [2] 20 III.2.1 Ý tưởng 20 III.2.2 Giải thuật đối sánh dạng tháp (The pyramid match ) 22 III.2.3

Ngày đăng: 15/01/2015, 22:12

Từ khóa liên quan

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan