Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 71 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
71
Dung lượng
1,46 MB
Nội dung
1 BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC SƯ PHẠM HÀ NỘI LÊ THI TÂM NGHIÊN CỨU MỘT SỐ KỸ THUẬT TRA CỨU BIỂN BÁO GIAO THÔNG Chuyên ngành: Khoa học máy tính Mã số: 60 48 0101 LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH Người hướng dẫn khoa học: PGS TS ĐỖ NĂNG TOÀN HÀ NỘI - 2013 LỜI CẢM ƠN Trong trình thực luận văn này, em nhận hướng dẫn, bảo tận tình PGS TS Đỗ Năng Tồn, Viện Cơng nghệ Thơng tin thuộc Viện Khoa học Công nghệ Việt Nam cán trực tiếp hướng dẫn khoa học cho em Em xin chân thành cảm ơn giúp đỡ quý báu Em xin chân thành cảm ơn Thầy, Cô giáo khoa Công nghệ thông tin cán bộ, nhân viên phòng Đào tạo Sau đại học, trường Đại học sư phạm Hà Nội anh chị đồng nghiệp quan tạo điều kiện thuận lợi cho học tập nghiên cứu trường Đại học Sư Phạm Hà Nội Xin chân thành cảm ơn anh, chị bạn học viên lớp Cao học K15KHMT- trường Đại học sư phạm Hà Nội động viên, giúp đỡ nhiệt tình chia sẻ với tơi kinh nghiệm học tập, cơng tác suốt khố học Cuối cùng, tơi muốn gửi lời cảm ơn tới gia đình, bạn bè, người thân yêu bên cạnh động viên tơi suốt q trình thực khóa luận tốt nghiệp Mặc dù cố gắng, song luận văn khơng thể tránh khỏi thiếu sót, kính mong dẫn quý thầy cô bạn Vĩnh Phúc, ngày tháng năm 2013 Tác giả Lê Thị Tâm LỜI CAM ĐOAN Tôi xin cam đoan số liệu kết nghiên cứu luận văn trung thực không trùng lặp với đề tài khác Tôi xin cam đoan giúp đỡ cho việc thực luận văn cảm ơn thông tin trích dẫn luận văn rõ nguồn gốc Vĩnh Phúc, ngày tháng năm 2013 Tác giả Lê Thị Tâm MỤC LỤC LỜI CẢM ƠN LỜI CAM ĐOAN MỞ ĐẦU NỘI DUNG Chương 1: KHÁI QUÁT XỬ LÝ ẢNH VÀ BÀI TOÁN TRA CỨU BIỂN BÁO GIAO THÔNG 1.1 KHÁI QUÁT XỬ LÝ ẢNH 1.1.1 Xử lý ảnh 1.1.2 Một số khái niệm xử lý ảnh 1.1.3 Một số phương pháp biểu diễn ảnh 10 1.1.4 Phương pháp phát biên ảnh 12 1.1.5 Phân vùng ảnh 13 1.1.6 Một số phương pháp tra cứu ảnh 18 1.2 BÀI TOÁN TRA CỨU BIỂN BÁO GIAO THÔNG 22 Chương 2: MỘT SỐ KỸ THUẬT TRA CỨU BIỂN BÁO GIAO THƠNG 23 2.1 MƠ HÌNH HỆ THỐNG TRA CỨU ẢNH THEO NỘI DUNG 23 2.2.1 Không gian màu 26 2.2.2 Các moment màu 27 2.2.3 Lược đồ màu (histogram màu) 29 2.2.4 Véc tơ gắn kết màu 30 2.2.5 Sơ đồ tương quan màu 31 2.2.6 Các đặc điểm bất biến màu 32 2.3 TRA CỨU ẢNH DỰA TRÊN HÌNH DẠNG 33 2.3.1 Biên phương pháp phát biên 34 2.3.2 Xử lý ảnh miền tần số biến đổi Fourier [3, 4, 5] 42 2.3.3 Mô tả Fourier 46 2.3.4 Các bất biến moment 49 2.3.5 Các hàm xoay/góc xoay 50 2.3.6 Độ tròn, độ lệch tâm hướng trục 51 Chương 3: CHƯƠNG TRÌNH THỬ NGHIỆM 52 3.1 BÀI TOÁN 52 3.2 PHÂN TÍCH BÀI TOÁN 53 3.3 XÂY DỰNG CHƯƠNG TRÌNH QUERY TRAFFIC SIGNS 59 3.3.1 Sơ đồ khối tổng quát 59 3.3.2 Tra cứu theo hình dạng 60 3.3.3 Tra cứu theo màu sắc 64 3.3.4 Sử dụng chương trình Query Trafic Signs 65 3.4 KHẢ NĂNG MỞ RỘNG CỦA CHƯƠNG TRÌNH 67 3.4.1 Những hạn chế chương trình 67 3.4.2 Khả mở rộng 67 KẾT LUẬN 68 TÀI LIỆU THAM KHẢO 70 MỞ ĐẦU Lý chọn đề tài Những năm gần đây, ảnh số ngày thu hút quan tâm nhiều người, phần thiết bị thu nhận ảnh số ngày phổ biến có giá phù hợp, cho phép nhiều người sở hữu sử dụng Mặt khác công nghệ chế tạo thiết bị lưu trữ cải tiến đời thiết bị lưu trữ có dung lượng lớn giá thành hạ làm cho việc lưu trữ ảnh dạng file trở nên phổ biến Thêm phát triển mạng Internet làm cho số lượng ảnh số đưa lên lưu trữ trao đổi qua Internet lớn Tuy nhiên số lượng ảnh lưu trữ trở nên lớn vấn đề phải có phương pháp tổ chức sở liệu ảnh tốt với kỹ thuật tìm kiếm, tra cứu ảnh hiệu quả, có độ xác cao có hiệu tốt Việc tìm kiếm ảnh mong muốn hàng triệu ảnh thuộc đủ loại chủ đề khác khó khăn Khi số lượng ảnh sưu tập cịn ít, việc nhận diện ảnh hay việc so sánh giống khác nhiều ảnh thực mắt thường, nhiên có số lượng lớn ảnh việc so sánh mắt thường khó khăn, địi hỏi phải có phương pháp hiệu xác Trong thực tế, tốn tra cứu ảnh số có nhiều ứng dụng quan trọng Ví dụ so sánh mẫu vân tay, tìm kiếm ảnh tội phạm v.v toán tra cứu ảnh áp dụng ngành khoa học hình Ngồi lĩnh vực đối tượng nhận dạng, tra cứu có nhiều kiểu tiếng nói, chữ viết, khn mặt, mã vạch … lĩnh vực giao thơng việc tra cứu biển báo vấn đề quan tâm Đây kiểu đối tượng có tính chất hình học đặc trưng, thường bắt gặp đời sống ngày với công dụng đưa cảnh báo thông tin cho người tham gia giao thông Tuy nhiên biển cáo giao thơng khơng có quy luật mà hệ thống ký hiệu với ý nghĩa qui ước kèm theo Việc ghi nhớ hình dạng ý nghĩa tất loại biển báo khó khăn lớn, thường hay có nhu cầu tra cứu tìm hiểu trực quan Bởi việc xây dựng chương trình nhằm phát nhận dạng loại biển báo giao thông cho phép người dùng tra cứu trực quan thơng tin biển báo không nhớ nội dung biển báo Nhằm đạt điều địi hỏi phải sử dụng tới kỹ thuật nhận dạng tra cứu ảnh Chính mà tơi chọn đề tài “ Nghiên cứu số kỹ thuật tra cứu biển báo giao thơng” Vấn đề động lực để chúng tơi tìm hiểu phương pháp tra cứu ảnh số ứng dụng nhiều thực tế tìm kiếm phương pháp phù hợp để giải tốn Mục đích nghiên cứu Mục đích nghiên cứu đề tài nhằm tìm hiểu sở lý thuyết ứng dụng số phương pháp tra cứu ảnh, từ sâu vào nghiên cứu phương pháp tra cứu ảnh theo nội dung Trên sở tiến hành thử nghiệm phương pháp cụ thể để xây dựng chương trình phần mềm tra cứu biển báo giao thông cho phép đọc vào ảnh biển báo mẫu tìm kiếm ảnh tương tự với ảnh mẫu tập hợp ảnh cho trước theo hai đặc điểm hình dạng màu sắc biển báo Như thấy, biển báo giao thông Việt Nam đa dạng, khơng có quy luật mà hệ thống ký hiệu với ý nghĩa qui ước kèm theo Việc ghi nhớ hình dạng ý nghĩa tất loại biển báo khó khăn lớn Bởi việc xây dựng chương trình nhằm phát nhận dạng loại biển báo giao thông cho phép người dùng tra cứu trực quan thơng tin biển báo không nhớ nội dung biển báo có ích Nhiệm vụ nghiên cứu Sau tìm hiểu tốn nhận dạng tra cứu ảnh nói chung, nghiên cứu số kỹ thuật tra cứu biển báo giao thơng nói riêng từ áp dụng để xây dựng chương trình mơ kỹ thuật Đối tượng phạm vi nghiên cứu a Đối tượng nghiên cứu - Các loại biển báo giao thông Việt Nam - Các kỹ thuật tra cứu biển báo giao thông dựa phương pháp tra cứu ảnh theo nội dung - Xây dựng phần mềm mô kỹ thuật tra cứu biển báo giao thông b Phạm vi nghiên cứu: Phương pháp tìm kiếm ảnh dựa nội dung ảnh Những đóng góp đề tài Đề tài “Nghiên cứu số kỹ thuật tra cứu biển báo giao thông” giúp cho việc phát triển phần mềm phát nhận dạng biển báo giao thơng nói riêng nhận dạng ảnh nói chung Chương trình trợ giúp đắc lực cho cơng tác tra cứu, tìm kiếm cải tiến để áp dụng cho số lĩnh vực khác giáo dục, sở hữu trí tuệ, y học, khoa học hình Phương pháp nghiên cứu Đề tài nghiên cứu với kết hợp nhiều phương pháp: phân tích, phân loại đặc tả liệu; nghiên cứu, phân tích tổng hợp tài liệu; phương pháp phân tích thiết kế hệ thống thông tin theo công nghệ hướng đối tượng; kỹ thuật lập trình; phương pháp thiết kế sở liệu đa phương tiện phương pháp mơ hình hố trực quan NỘI DUNG Chương 1: KHÁI QUÁT XỬ LÝ ẢNH VÀ BÀI TOÁN TRA CỨU BIỂN BÁO GIAO THÔNG 1.1 KHÁI QUÁT XỬ LÝ ẢNH Những năm gần đây, vấn đề tra cứu ảnh số nhận quan tâm ngày lớn Nguyên nhân phần phát triển công nghệ chế tạo thiết bị thu nhận lưu trữ ảnh số phát triển mạnh mẽ mạng Internet Người sử dụng nhiều lĩnh vực khác có hội để truy cập sử dụng kho lưu trữ ảnh thuộc đủ loại chủ đề với nhiều kiểu định dạng ảnh khác Tuy nhiên người ta nhận thấy việc tìm ảnh mong muốn sưu tập ảnh đa dạng có kích thước lớn khó khăn Tra cứu ảnh trình tìm kiếm sở liệu ảnh ảnh thoả mãn u cầu Ví dụ, người sử dụng tìm kiếm tất ảnh chủ đề biển sở liệu ảnh người sử dụng khác lại muốn phân loại sở ảnh thành sưu tập có chủ đề khác Một ví dụ khác tra cứu ảnh người muốn tìm tất ảnh tương tự với ảnh mẫu sở liệu ảnh Vấn đề tra cứu ảnh nhìn nhận rộng rãi việc tìm kiếm giải pháp cho vấn đề trở thành lĩnh vực sôi động, thu hút quan tâm nhiều nhà nghiên cứu phát triển 1.1.1 Xử lý ảnh Con người thu nhận thông tin qua giác quan, thị giác đóng vai trị quan trọng Những năm trở lại với phát triển phần cứng máy tính, xử lý ảnh đồ hoạ phát triển cách mạnh mẽ có nhiều ứng dụng sống Xử lý ảnh đồ hoạ đóng vai trị quan trọng tương tác người máy Quá trình xử lý ảnh xem trình thao tác ảnh đầu vào nhằm cho kết mong muốn Kết đầu q trình xử lý ảnh ảnh “tốt hơn” kết luận Có thể hiểu cách khác, xử lý ảnh hay cao cấp thị giác máy tính (Computer Vision) bao gồm tất lý thuyết kỹ thuật liên quan, cho phép tạo lập hệ thống có khả tiếp nhận thơng tin từ hình ảnh thu được, lưu trữ xử lý theo nhu cầu Hình 1.1 – Các bước xử lý ảnh · Thu nhận ảnh: Q trình tiếp nhận thơng tin từ vật thể thông qua camera màu trắng đen, ảnh thu nhận ảnh tương tự ảnh số hóa · Tiền xử lý ảnh: Sau thu nhận, ảnh nhiễu độ tương phản thấp nên cần đưa vào tiền xử lý để nâng cao chất lượng Chức tiền xử lý lọc nhiễu, nâng độ tương phản để làm ảnh rõ hơn, nét · Phân đoạn ảnh: Là tách ảnh đầu vào thành vùng thành phần để biểu diễn phân tích, nhận dạng ảnh Ví dụ: để nhận dạng chữ (hoặc mã vạch) phong bì thư cho mục đích phân loại bưu phẩm, cần chia câu, chữ địa tên người thành từ, chữ, số (hoặc vạch) riêng biệt để nhận dạng Đây phần phức tạp khó khăn xử lý ảnh dễ gây lỗi, làm độ xác ảnh Kết nhận dạng ảnh phụ thuộc nhiều vào công đoạn · Biểu diễn ảnh: Đầu ảnh sau phân đoạn chứa điểm ảnh vùng ảnh (ảnh phân đoạn) cộng với mã liên kết với vùng lận cận Việc biến đổi số liệu thành dạng thích hợp cần thiết cho xử lý máy tính Việc chọn tính chất để thể ảnh gọi trích chọn đặc trưng (Feature Selection) gắn với việc tách đặc tính ảnh dạng thơng tin định lượng làm sở để phân biệt lớp đối tượng với đối tượng khác phạm vi ảnh nhận Ví dụ: nhận dạng ký tự phong bì thư, miêu tả đặc trưng ký tự giúp phân biệt ký tự với ký tự khác · Nhận dạng nội suy ảnh: Nhận dạng ảnh trình xác định ảnh Quá trình thường thu cách so sánh với mẫu chuẩn học (hoặc lưu) từ trước Nội suy phán đoán theo ý nghĩa sở nhận dạng Ví dụ: loạt chữ số nét gạch ngang phong bì thư nội suy thành mã điện thoại 1.1.2 Một số khái niệm xử lý ảnh Ảnh điểm ảnh: Gốc ảnh (ảnh tự nhiên) ảnh liên tục không gian độ sáng Để xử lý máy tính, ảnh cần phải số hoá Số hoá ảnh biến đổi gần ảnh liên tục thành tập điểm phù hợp với ảnh thật vị trí (khơng gian) độ sáng (mức xám) Khoảng cách điểm ảnh 56 Hình 3.3– Một số mẫu biển báo nguy hiểm 57 Với mục đích lưu trữ hình ảnh biển báo giao thông nên thông thường ảnh biển báo giao thông có đối tượng ảnh ảnh đồng có màu sắc tương phản rõ rệt để làm đối tượng ảnh Chúng ta nhận thấy để so sánh, phân loại biển báo giao thơng hai đặc điểm quan trọng hình dạng màu sắc đối tượng ảnh Các biển báo giao thơng thường có đặc điểm kết cấu đơn giản không phản ánh đặc trưng đối tượng Từ phân tích áp dụng số giới hạn sau với toán tra cứu biển báo giao thông: Nhiệm vụ toán xây dựng hệ thống tra cứu ảnh biển báo giao thơng có số chức sau: o Khi người sử dụng cung cấp ảnh mẫu biển báo giao thơng cần tra cứu Hệ thống có nhiệm vụ tìm kiếm sở liệu ảnh có sẵn cho danh sách ảnh tương tự ảnh mẫu theo thứ tự ảnh coi giống với ảnh mẫu xếp phía o Người sử dụng lựa chọn theo hai đặc điểm để so sánh: so sánh theo màu sắc, so sánh theo hình dạng kết hợp hai đặc điểm để so sánh o Người sử dụng thiết lập khoảng cách ngưỡng cho đặc điểm: chương trình trả lại kết mà khoảng cách ảnh kết ảnh mẫu không vượt ngưỡng o Hoặc người sử dụng qui định số lượng ảnh kết trả lại 58 Để đơn giản, xét toán hạn chế sau: o Chỉ xét ảnh có đối tượng ảnh có màu đồng o Các đối tượng ảnh có hình dạng khơng q phức tạp có đường biên tương đối đơn giản o Ảnh có định dạng phổ biến JPG, BMP, GIF, PCX, qua khâu tiền xử lý để loại bỏ nhiễu 59 3.3 XÂY DỰNG CHƯƠNG TRÌNH QUERY TRAFFIC SIGNS 3.3.1 Sơ đồ khối tổng quát Đọc ảnh mẫu Trích chọn đặc điểm Đọc ảnh từ sở DL Trích chọn đặc điểm Tạo Véc tơ đặc trưng Tạo Véc tơ đặc trưng Tính khoảng cách Thêm vào danh sách vị trí thích hợp Hình 3.4: Sơ đồ khối tổng quát chương trình Sơ đồ thể khối chức modul chương trình: o Đọc ảnh: sử dụng thư viện chuẩn Windows để đọc ảnh mẫu ảnh sở liệu vào cấu trúc DIB o Trích chọn đặc điểm: tuỳ thuộc vào đặc điểm cần trích chọn màu sắc hay hình dạng mà khối sử dụng thuật tốn trích chọn tương ứng o Tạo véc tơ đặc trưng: đặc điểm trích chọn dạng véc tơ đặc trưng nhiều chiều o Tính khoảng cách: dựa vào số phương pháp tính khoảng cách trình bày chương để tính khoảng cách tương ứng véc tơ đặc trưng ảnh mẫu ảnh sở liệu o Cuối dựa theo khoảng cách tính được, chương trình xếp kết theo chiều giảm dần độ tương tự véc tơ đặc trưng 60 3.3.2 Tra cứu theo hình dạng Đọc ảnh mẫu Đọc ảnh từ sở DL Dò biên Dò biên Resample 256x256 Resample 256x256 FFT FFT Tạo Véc tơ đặc trưng Tạo Véc tơ đặc trưng Tính k/c Euclide Thêm vào danh sách vị trí thích hợp Hình 3.5: Sơ đồ khối phần tra cứu ảnh theo hình dạng o Ảnh mẫu đọc vào cấu trúc DIB hàm DisplayImage o Sử dụng thuật tốn dị biên gián tiếp để phân vùng ảnh o Thực co/giãn (resample) để chuẩn hoá kích thước (cả hai kích thước luỹ thừa 2) trước chép sang ma trận số phức làm đầu vào hàm biến đổi Fourier nhanh FFT o Hàm FFT trả lại ma trận số phức o Việc tạo véc tơ đặc trưng ảnh thực ma trận số phức Véc tơ đặc trưng vector có 256 chiều o Đọc ảnh sở liệu, thực bước giống với ảnh mẫu để vector đặc trưng ảnh vừa đọc o So sánh vector đặc trưng ảnh mẫu ảnh đọc từ sở liệu cách tính khoảng cách Euclide vector đặc trưng hàm GetShape Distance o Thêm ảnh vừa đọc vào danh sách ảnh tìm thấy, ảnh có sai khác so với ảnh mẫu nhỏ xếp lên 61 · 3.2.2.1 Đọc ảnh Ảnh đọc vào cấu trúc DIB hiển thị thủ tục DisplayImage, đầu vào tên đường dẫn đến file cần đọc, đọc ảnh thành công thủ tục DisplayImage hiển thị ảnh lên khung ảnh định Việc thao tác với cấu trúc DIB thực thông qua cấu trúc DIBSection định nghĩa thư viện GDI32 Windows · 3.2.2.2 Dò biên đối tượng ảnh Phần dò biên đối tượng ảnh sử dụng thuật tốn dị biên gián tiếp cách xác định chu tuyến đối tượng ảnh trình bày chương · 3.2.2.3 Resample Chúng ta biết để thực biến đổi Fourier nhanh kích thước dãy số đầu vào phải luỹ thừa Tuy nhiên ảnh cần đọc lại có số điểm ảnh khác thường khơng thoả mãn u cầu này, thủ tục Resample phải thực phép nội suy để thêm/bớt điểm ảnh để ảnh có số điểm ảnh thoả mãn yêu cầu mà không làm thay đổi chất lượng ảnh Các điểm ảnh thêm vào theo nguyên tắc nội suy Màu mật độ điểm ảnh nội suy tính tốn dựa giá trị điểm ảnh có sẵn ảnh Có nhiều cách để xây dựng thủ tục Resample, có phương pháp thơng dụng [4]: o Nearest Neighbor: điểm ảnh sinh dựa vào thơng tin điểm ảnh phía điểm ảnh mới, phương pháp resample nhanh độ xác thấp (trong phương pháp) 62 o Bilinear: lấy thông tin từ điểm ảnh phía bên cạnh điểm ảnh Chất lượng ảnh tốt so với phương pháp Nearest Neighbor o Bicubic: Là phương pháp xác thông tin điểm ảnh suy từ điểm ảnh xung quanh Trong chương trình sử dụng phương pháp đơn giản Nearest Neighbor Kích thước mảng liệu đầu 256×256 phần tử · 3.2.2.4 Biến đổi Fourier nhanh Hàm biến đổi FFT cải tiến từ chương trình Randy Crane liệt kê "A Simplified Approach to Image Processing" [4] Đầu vào ma trận số phức chiều sinh từ ma trận điểm ảnh đọc cách gán phần ảo tất số phức 0, phần thực gán giá trị điểm ảnh Đầu ma trận số phức hai chiều biểu diễn khai triển Fourier ma trận đầu vào Trong hàm FFT chiều (hàm twoD_FFT() ), hàng ma trận đầu vào biến đổi Fourier hàm biến đổi 1chiều (hàm oneD_FFT() ), sau tính FFT chiều cho cột Hai hàm sở để xây dựng oneD_FFT Scramble() Butterflies() Trong Scramble() sử dụng để xếp lại dãy đầu vào theo thứ tự đảo bit, hàm Butterflies() thuật toán sở, gọi đệ qui để tính FFT · · 3.2.2.5 Tạo véc tơ đặc trưng hình dạng cho ảnh Véc tơ đặc trưng ảnh vector 256 chiều, chứa 256 giá trị số double double* m_Signature; 63 m_Signature = new double[256]; Hàm sinh chữ ký GenerateSignature(): Đầu vào: Ma trận vuông kích thước 256x256 số phức (sinh hàm biến đổi FFT chiều twoD_FFT()) biểu diễn ảnh miền tần số Đầu ra: vector chữ ký 256 chiều mảng 256 số double signature ảnh Thuật tốn: Tính modul (magnitude) phần tử mảng hai chiều 256x256 phần tử theo công thức: Magnitude(i, j ) = Re(i, j ) + Im(i, j ) đó: Magnitude(i,j) modul số phức vị trí hàng i, cột j ma trận, Re(i,j) phần thực số phức vị trí hàng i cột j, Im(i,j) phần áo số phức vị trí hàng i, cột j Chia ảnh đầu vào thành khối kích thước 16x16 Khởi tạo mảng image_Signature[] gồm 256 phần tử Tính signature cho khối theo công thức: block _ Signature = 15 15 åå Mag [(iBlockRow + i), (iBlockCol + j )] i =0 j = Trong đó: block_Signature giá trị signature khối, iBlockRow (0 - 255) số hàng phần tử khối, iBlockCol (0 - 255) số cột phần tử khối, i hàng phần tử khối (i = 0, ,15) , j số cột phần tử khối (j = 0, ,15) Mag[i,j] modul số phức vị trí hàng i, cột j ma trận đầu vào Lưu chữ ký block_Signature lưu vào mảng image_Signature[]; 64 Sau tính xong signature cho 256 khối, tiến hành chuẩn hóa mảng image_Signature[] · 3.2.2.6 So sánh ảnh cách tính khoảng cách Euclide Khoảng cách ảnh Query_Image ảnh Found_Image định nghĩa khoảng cách Euclide hai chữ ký query_Signature[] found_Signature[] theo công thức: diff = 255 å ( found _ Signature[i] - query _ Signature[i]) i =0 Khoảng cách diff nhỏ hai ảnh coi giống 3.3.3 Tra cứu theo màu sắc Đọc ảnh mẫu Đọc ảnh từ sở DL Chuyển đổi 256 màu Chuyển đổi 256 màu Tính histogram màu Tính histogram màu Tính k/c Euclide Thêm vào danh sách vị trí thích hợp Hình 3.6: Sơ đồ khối phần tra cứu ảnh theo màu sắc Sử dụng phương pháp histogram màu trình bày chương o Ảnh mẫu đọc vào cấu trúc DIB hiển thị thủ tục DisplayImage 65 o Giảm số lượng bin màu xuống 256 cách chuyển đổi màu thực điểm ảnh thành số màu bảng màu chuẩn Windows hàm GetClosetIndex o Tính tốn số điểm ảnh bin màu hàm GenerateColorSignature, thu véc tơ 256 chiều véc tơ đặc trưng màu sắc ảnh o Làm bước tương tự với ảnh sở liệu o Tính khoảng cách Euclide véc tơ đặc trưng ảnh mẫu ảnh sở liệu hàm GetColorDistance xếp vào danh sách với khoảng cách nhỏ xếp trước tiên 3.3.4 Sử dụng chương trình Query Trafic Signs o Khởi động chương trình, chọn file ảnh mẫu, ảnh mẫu hiển thị ô khung "Sample Image" o Chọn phương pháp so sánh: hình dạng hay màu sắc, nhập số đo khoảng cách tối đa (giá trị ngưỡng) hộp Similarity Distance o Nhấn nút Find, chương trình yêu cầu người dùng chọn thư mục chứa file ảnh cần tìm Chương trình sau liệt kê tất ảnh có khoảng cách Euclide nhỏ giá trị ngưỡng theo thứ tự tăng dần khoảng cách Euclide, ảnh coi giống xếp trước Khi chọn ảnh danh sách ảnh tìm thấy (Found Image List), chương trình hiển thị ảnh khung Retrieved Image Hình 3.7 trang sau kết chạy chương trình để tìm kiếm ảnh tương tự với ảnh mẫu biển báo cấm xe tải 66 Hình 3.7: Một số kết chạy thử chương trình 67 3.4 KHẢ NĂNG MỞ RỘNG CỦA CHƯƠNG TRÌNH 3.4.1 Những hạn chế chương trình o Chương trình giới thiệu đưa thuật toán đơn giản để trích chọn đặc điểm (sinh véc tơ đặc trưng) nên chắn cho kết so sánh tốt o Các ảnh ban đầu chưa xử lý “sơ chế” lọc nhiễu yêu cầu định dạng đơn giản nên phạm vi so sánh bị hạn chế o Chương trình thiết lập kích thước cố định cho ảnh trước xử lý 256×256, kích thước khối 16×16, số chiều vector đặc trưng 256 làm hạn chế tính mềm dẻo chương trình 3.4.2 Khả mở rộng o Kỹ thuật “tra cứu ảnh theo nội dung” có nhiều hướng nghiên cứu phát triển tạo thuật toán hiệu làm cho máy tính “hiểu” nội dung ảnh Chúng ta hồn tồn xây dựng thuật tốn tốt để trích chọn đặc điểm đặc trưng khác màu sắc, kết cấu, hình dạng đối tượng ảnh để phát triển cho toán nhận dạng vật thể o Thuật toán resample chương trình sử dụng phương pháp đơn giản để thực nội suy, sử dụng thuật tốn cho độ xác cao chắn cải thiện đáng kể chất lượng chương trình o Sử dụng phương pháp làm giảm số chiều véc tơ đặc trưng làm tăng đáng kể tốc độ tra cứu Đối với hệ thống máy tính có trang bị nhiều vi xử lý có xủ lý lõi kép xây dựng thuật toán cho phép phân phối tác vụ cho nhiều vi xử lý đồng thời giải pháp tốt để tăng tốc độ tra cứu o Sử dụng phương pháp tính tốn độ tương tự phù hợp cho loại đặc điểm để có kết so sánh gần với trực giác 68 KẾT LUẬN Bản luận văn trình bày vài kỹ thuật tảng hệ thống tra cứu ảnh theo nội dung bao gồm mô tả nội dung trực quan, đánh giá độ tương tự, sơ đồ đánh số, giao tiếp với người sử dụng đánh giá hiệu hệ thống, nhấn mạnh vào kỹ thuật mơ tả đặc điểm trực quan Các đặc điểm trực quan tổng quát sử dụng nhiều hệ tra cứu ảnh theo nội dung màu sắc, kết cấu, hình dạng thơng tin khơng gian Màu sắc thường biểu diễn thông quan histogram màu, sơ đồ tương quan màu, véc tơ gắn kết màu moment màu khơng gian màu định Hình dạng biểu diễn thống qua bất biến moment, hàm xoay, mơ tả Fourier, độ trịn, độ lệch tâm, hướng trục biến đổi radon Ngoài đặc điểm trực quan điểm ảnh lại sử dụng để phân tách ảnh thành vùng đồng đối tượng ảnh Các đặc điểm cục vùng ảnh đối tượng ảnh dùng hệ thống tra cứu ảnh theo vùng Có nhiều cách để đánh giá khoảng cách đặc điểm trực quan, số cách sử dụng phổ biến khoảng cách Minkowski, khoảng cách toàn phương, khoảng cách Mahalanobis, độ phân kỳ Kullback-Leibler độ phân kỳ Jeffrey Đến thời điểm phương pháp tính khoảng cách Minkowski khoảng cách toàn phương sử dụng rộng rãi Mặc dù kỹ thuật tra cứu ảnh theo nội dung đưa giải pháp thông minh tự động để tìm kiếm ảnh cách hiệu vấn đề kỹ thuật dựa đặc điểm mức thấp Nói chung đặc điểm mức thấp phản ánh đựơc khía cạnh ảnh Ngoài đánh giá độ tương tự đặc điểm trực quan lại chưa liên quan đến đặc điểm sinh lý thị giác người Người sử dụng thường quan 69 tâm đến giống ngữ nghĩa nên kết truy vấn dựa đặc điểm mức thấp thường không thoả mãn u cầu nói chung khó đốn trước Phần cuối luận văn đưa áp dụng cụ thể cho phương pháp tra cứu ảnh theo nội dung Những vấn đề giải luận văn: o Giới thiệu chi tiết phương pháp tra cứu ảnh theo nội dung o Sơ lược cách đánh giá hiệu hệ thống tra cứu ảnh o Giới thiệu số cách tiếp cận tra cứu ảnh theo ngữ nghĩa o Trình bày chi tiết hai kỹ thuật tra cứu ảnh dựa đặc trưng hình dạng đặc trưng màu sắc o Áp dụng phương pháp tra cứu ảnh theo nội dung vào toán tìm kiếm biển báo giao thơng theo hai đặc điểm theo hình dạng theo màu sắc Những vấn đề cịn tồn tại: Do thời gian tìm hiểu đề tài chưa nhiều hạn chế khả lập trình đồ hoạ nên số mục tiêu đặt từ bắt tay nghiên cứu chưa thực chương trình chạy thử này, bao gồm: o Chưa có chức tra cứu ảnh cách kết hợp nhiều đặc điểm o Chưa cài đặt kỹ thuật đánh số hiệu đề cập phần luận o Chưa cài đặt kỹ thuật tăng hiệu hệ thống cách giảm số chiều véc tơ đặc trưng Trong thời gian tới, tơi hy vọng giải vấn đề cịn tồn để xây dựng chương trình thực hữu ích, đáp ứng yêu cầu toán 70 TÀI LIỆU THAM KHẢO Tiếng Việt [1] Lương Mạnh Bá, Nguyễn Thanh Thủy (1999), Nhập môn Xử lý ảnh số, Nhà xuất Khoa học Kỹ thuật, Hà Nội [2] Võ Đức Khánh (2003) Giáo trình xử lý ảnh, Nxb Thống kê, Hà Nội [3] Đỗ Năng Tồn, Phạm Việt Bình (2008), Giáo trình Xử lý ảnh, Nhà xuất Khoa học Kỹ thuật, Hà Nội Tiếng Anh [4] David Dagan Feng, Fuhui Long, Hongjiang Zhang, (2002), Fundamentals of Content-Based Image Retrieval, in Multimedia Information Retrieval and Management - Technological Fundamentals and Applications [5] Do Nang Toan (2002), The boundaries of the region and properties, Science and Technology Journal, Vol.40, Special No, pp 41-48 [6] Low (1991), A Introductory Computer Vision and Image Processin, McGraw-hill, 244p ISBN 0077074033 [7] Randy Crane (1997), A simplied approach to Image Processing: clasical and modern technique in C, Prentice Hall, ISBN 0-13-226616-1 [8] Shengjiu Wang (2001), A Robust CBIR Approach Using Local Color Histograms, Department of Computer Science, University of Alberta, Edmonton, Alberta, Canada, Tech Rep TR 01-13 [9] Peter Howarth, Stefan Ruger (2000), Evaluation of Texture Features for Content-based Image Retrieval, Department of Computing, Imperial College London ... 13 1.1.6 Một số phương pháp tra cứu ảnh 18 1.2 BÀI TỐN TRA CỨU BIỂN BÁO GIAO THƠNG 22 Chương 2: MỘT SỐ KỸ THUẬT TRA CỨU BIỂN BÁO GIAO THÔNG 23 2.1 MƠ HÌNH HỆ THỐNG TRA CỨU ẢNH... nghiên cứu a Đối tượng nghiên cứu - Các loại biển báo giao thông Việt Nam - Các kỹ thuật tra cứu biển báo giao thông dựa phương pháp tra cứu ảnh theo nội dung - Xây dựng phần mềm mô kỹ thuật tra cứu. .. tin biển báo không nhớ nội dung biển báo có ích Nhằm đạt điều địi hỏi phải sử dụng tới kỹ thuật nhận dạng tra cứu ảnh Chính mà chọn đề tài “ Nghiên cứu số kỹ thuật tra cứu biển báo giao thông? ??