Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 82 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
82
Dung lượng
2,22 MB
Nội dung
ĐẠI HỌC THÁI NGUYÊN TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THƠNG LÊ XN LONG NGHIÊN CỨU TRÍCH CHỌN ĐẶC TRƯNG ỨNG DỤNG CHO TÌM KIẾM TỪ TRONG ẢNH TÀI LIỆU LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH THÁI NGUYÊN - 2017 Tai ngay!!! Ban co the xoa dong chu nay!!! ĐẠI HỌC THÁI NGUYÊN TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG LÊ XUÂN LONG NGHIÊN CỨU TRÍCH CHỌN ĐẶC TRƯNG ỨNG DỤNG CHO TÌM KIẾM TỪ TRONG ẢNH TÀI LIỆU Chuyên ngành: Khoa học máy tính Mã số: 60 48 01 01 LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH Người hướng dẫn khoa học: PGS.TS Ngô Quốc Tạo THÁI NGUYÊN - 2017 i LỜI CẢM ƠN Trước hết, em xin bày tỏ lòng biết ơn sâu sắc đến thầy hướng dẫn PGS.TS Ngô Quốc Tạo, người trực tiếp hướng dẫn, tận tình bảo, giúp đỡ em trình hình thành đề tài luận văn Em xin trân thành cảm ơn tới tất thầygiáo, cô giáo Ban lãnh đạo trường Đại học Công nghệ Thông tin Truyền thông Thái Nguyên đem tri thức tâm huyết để truyền đạt vốn kiến thức quý báu cho chúng em luôn tạo điều kiện tốt cho chúng em suốt trình theo học trường Cám ơn đề tài Phịng thí nghiệm trọng điểm: " Nghiên cứu phương pháp tra cứu ảnh dựa vào đa truy vấn" mã số PTNTĐ17.04 hỗ trợ thực luận văn Luận văn hồn thành, ngồi cố gắng thân cịn có động viên, giúp đỡ kích lệ tinh thần bạn bè đồng nghiệp gia đình giúp cho em vượt qua khó khăn thời gian thực luận văn Em xin trân thành cảm ơn tới tất người Học viên Lê Xuân Long ii LỜI CAM ĐOAN Tôi xin cam đoan cơng trình nghiên cứu riêng tơi, với hỗ trợ từ người hướng dẫn khoa học PGS.TS NGÔ QUỐC TẠO Các số liệu, kết nêu luận văn trung thực Việc sử dụng liệu có luận văn thu thập từ nguồn thơng tin khác có ghi phần tài liệu tham khảo Thái Nguyên, tháng 12 năm 2017 Người cam đoan Lê Xuân Long iii MỤC LỤC LỜI CẢM ƠN i LỜI CAM ĐOAN ii MỤC LỤC iii DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ VIẾT TẮT vi DANH MỤC HÌNH VẼ vii MỞ ĐẦU 1 Lý chọn đề tài .1 Đối tượng phạm vi nghiên cứu Hướng nghiên cứu đề tài Ý nghĩa khoa học thực tiễn đề tài Phương pháp nghiên cứu CHƯƠNG 1: TỔNG QUAN VỀ TRA CỨU ẢNH TÀI LIỆU 1.1 Tổng quan tra cứu ảnh tài liệu 1.1.1 Truy vấn người sử dụng 1.1.2 Trích chọn đặc trưng ảnh 1.1.3 Đánh số nhiều chiều 1.2 Một số khái niệm xử lý ảnh 1.2.1 Ảnh đen trắng ảnh màu 13 1.2.2 Không gian màu 14 1.2.3 Phân tích ảnh 16 1.2.4.Tra cứu ảnh 17 1.2.5 Nhận dạng ảnh .18 1.3 Tra cứu thông tin 18 1.4 Những thách thức thiết kế thực thi hệ thống tìm kiếm ảnh tài liệu .19 1.4.1.Tốc độ tính tốn .19 1.4.2.Các tài liệu chất lượng 19 1.4.3.Ngôn ngữ tài liệu 19 iv 1.5 Hệ thống đề xuất 19 CHƯƠNG 2: MỘT SỐ VẤN ĐỀ VỀ TÌM KIẾM TỪ TRONG ẢNH TÀI LIỆU VÀ PHƯƠNG PHÁP TRÍCH CHỌN ĐẶC TRƯNG 22 2.1.Tiền xử lý ảnh .22 2.1.1.Nhiễu ảnh lọc nhiễu .22 2.1.2.Chuẩn hóa kích thước ảnh 23 2.1.3.Làm trơn biên chữ 24 2.1.4.Làm đầy chữ .24 2.1.5.Làm mảnh chữ 24 2.1.6.Điều chỉnh độ nghiêng văn 25 2.2.Các phương pháp trích chọn đặc trưng cho ảnh tài liệu 25 2.3.Trích chọn đặc trưng ứng dụng cho tìm kiếm từ ảnh tài liệu 29 2.3.1.Chuyển ảnh xám .29 2.3.2 Ảnh nhị phân, nhị phân hóa với ngưỡng động 30 2.3.3.Một số thao tác ảnh nhị phân 34 2.3.3.1 Các lân cận điểm ảnh( Image Neighbors) .34 2.3.3.2.Gán nhãn thành phần liên thông (CCL-Connected Components Labeling ) 35 2.3.3.3.Phân đoạn từ ảnh tài liệu .41 2.3.3.4 Đặc trưng vùng đối tượng 43 2.3.3.5 Hình chữ nhật bao điểm cực trị 47 2.3.3.6 Moment không gian .48 2.3.3.7 Phép chiếu 50 2.4 Đối sánh đặc trưng hệ thống đề xuất .51 2.4.1 Tỉ lệ chiều cao chiều rộng (Width to Height Ratio) 51 2.4.2 Mật độ vùng từ (Word Area Density) 51 2.4.3 Điểm trọng tâm từ ( Center of Gravity ) 51 2.4.4 Phép chiếu dọc (Vertical Projection) 52 2.4.5 Phép chiếu hình dạng (Top – Bottom Shape Projections) 55 v 2.4.6 Những đặc trưng phần bên bên từ (Upper - Down Grid Features ) 56 2.5 Thực công việc đối sánh hệ thống đề xuất .58 CHƯƠNG 3: 61 CHƯƠNG TRÌNH THỬ NGHIỆM TÌM KIẾM TỪ TRONG ẢNH TÀI LIỆU TRÊN CƠ SỞ LÝ THUYẾT ĐÃ XÂY DỰNG 61 3.1.Môi trường cài đặt .61 3.2 Hệ thống mô tả chương trình thử nghiệm 61 3.3 Giao diện chương trình tìm kiếm từ ảnh tài liệu 63 3.4 Một số kết 66 3.5 Đánh giá .67 DANH MỤC TÀI LIỆU THAM KHẢO .70 vi DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ VIẾT TẮT RGB Red, Green, Blue CMY Cyan-Magenta-Yellow CBIR Content Baased Image Retrieval CSDL Cơ Sở Dữ Liệu vii DANH MỤC HÌNH VẼ Hình 1.1 Lược đồ mô tả hệ thống tra cứu ảnh dựa vào nội dung .5 Hình 1.2 Các giai đoạn xử lý ảnh [2] 10 Hình 1.3 Hình người với kích thước ảnh khác 12 Hình 1.4 Khơng gian màu RGB 15 Hình 1.5 Khơng gian màu HSV trực quan hóa hình nón 16 Hình 1.6 Cấu trúc chung hệ thống đề xuất tìm từ ảnh tài liệu 20 Hình 2.1 Nhiễu đốm nhiễu vệt .23 Hình 2.2 Chuẩn hóa kích thước ảnh ký tự “A” “P” .24 Hình 2.3 Làm mảnh chữ 24 Hình 2.4 Hiệu chỉnh độ nghiêng văn 25 Hình 2.5 Ảnh màu chuyển sang ảnh xám tính theo cơng thức 29 Hình 2.6 Biểu đồ mức xám ảnh 31 Hình 2.7 Ví dụ Histogram ma trận ảnh xám [3] .32 Hình 2.8 biểu đồ histogram cơng thức tính cho giá trị màu nhỏ ngưỡng t=3 [3] 32 Hình 2.9 Biểu đồ histogram cơng thức tính cho giá trị màu lớn ngưỡng t=3 [3] 32 Hình 2.10 Tính tốn giá trị phương sai lớp ứng với giá trị mức xám [3] 33 Hình 2.11 Kết thu sau sử dụng phương pháp Otsu [3] 33 Hình 2.12 ảnh xám từ chứa nhiều nhiễu (được khoanh đỏ hình trên) 33 Hình 2.13 Ảnh bỏ nhiễu chuyển sang ảnh nhị phân nhờ phương pháp Otsu 34 Hình 2.14 Lân cận điểm ảnh tọa độ (x, y) 35 Hình 2.15 Các khả liên thông sử dụng 35 viii Hình 2.16 Ảnh nhị phân gán nhãn cho thành phần liên kết 36 Hình 2.17 Nhị phân ma trận nhãn điểm ảnh (Foreground pixel ) khởi tạo tăng dần .37 Hình 2.18 Cấu trúc Union-Find thể qua mảng PARENT 37 Hình 2.19 Áp dụng Find cho tồn nốt ta có PARENT .38 Hình 2.20 Ứng dụng thuật tốn gán nhãn cho thành phần liên thơng .41 Hình 2.21 Ảnh tài liệu có nhiều nhiễu 42 Hình 2.22 Tìm thành phần liên thơng ảnh tài liệu 42 Hình 2.23 Loại bỏ nhiễu 42 Hình 2.24 Mở rộng kích thước hình chữ nhật bao theo hai hướng trái phải 43 Hình 2.25 Xác định từ .43 Hình 2.26 Các vùng gán nhãn ảnh tài liệu 46 Hình 2.27 Các đặc trưng vùng hình 2.26 46 Hình 2.28 Tám điểm cực trị vùng nằm Hình chữ nhật bao Các đường chéo đứt đoạn trục điểm cực trị 47 Hình 2.29 Moment trục tính bình phương khoảng cách từ điểm đến trục 49 Hình 2.30 Ảnh nhị phân thằn lằn với phép chiếu ngang dọc 50 Hình 2.31 Xác định tỉ lệ chiều rộng cao dựa vào hình chữ nhật bao vùng từ 51 Hình 2.32 Ảnh tính tốn phép chiếu dọc : (a) ảnh gốc; (b) phép chiếu dọc; (c) phép chiếu làm trơn sử dụng ma trận mặt nạ 5×1 53 Hình 2.33 Ảnh bàn cờ lý tưởng ảnh bàn cờ có nhiễu Sau ảnh khử nhiễu cách làm trơn ảnh sử dụng ma trận mặt nạ 5x5 54 Hình 2.34 Ảnh biểu diễn thao tác với đặc trưng phép chiếu từ 56 57 với giá trị nhị phân lấy từ phần bên từ Để tính tốn đặc trưng này, ban đầu phải có phép chiếu ngang ảnh Sau đó, từ phép chiếu ngang này, phần bên từ xác định theo thuật toán sau: Bước 1: Áp dụng phép làm trơn cho phép chiếu ngang với ma trận mặt nạ 5×1 Bước 2: Bắt đầu từ trên, tìm vị trí i biểu đồ phép chiếu ngang V[i] cho V[i] ≥ H Hình bên Trong đó, H chiều cao lớn phép chiếu ngang (max{V[i]}) Nếu vị trí i nằm nửa bên phép chiếu ngang từ đó khơng có phần bên Bước 3: Tìm vị trí k (0,i) lược đồ phép chiếu ngang V[i] V(k) V(k-1) ≤ Thì k định nghĩa vị trí phần bên từ, Nếu k có giá trị nhỏ ( ) từ khơng có phần bên Hình 2.35 Ảnh biểu diễn thao tác với đặc trưng thông tin về phần bên phần bên từ Sau đó, phần bên từ chia thành mười phần hình 2.35b Số điểm ảnh đen đếm phần Nếu số lớn chiều cao từ 58 giá trị tương đối vector đặc trưng đặt 1; ngược lại đặt Vector đặc trưng thu hình 2.35d Phần bên từ phần mà chữ bình thường có phần nhô hướng xuống chữ ‘y’, ‘p’, ‘g’ v.v Đặc trưng tính tốn tương tự đặc trưng phần từ Nhưng việc tìm kiếm phần bên dưới lên Cuối tổng hợp từ đặc trưng lấy ta có vector đặc trưng gồm 93 thành phần theo thứ tự cấu trúc hình 2.36 bên Hình 2.36 Mơ hình 93 thành phần theo thứ tự cấu trúc 2.5 Thực công việc đối sánh hệ thống đề xuất Thủ tục đối sánh từ xác định ảnh từ tài liệu mà có độ tượng tự cao so với từ truy vấn thông qua cấu trúc vector đặc trưng Đầu tiên, mô tả tạo vector gồm đặc trưng bao gồm 93 thành phần đề xuất hình 2.36 Thành phần đặc trưng tỉ lệ 59 chiều rộng chiều cao; đặc trưng thứ hai đặc trưng mật độ diện tích thứ ba điểm trọng tâm từ Đặc trưng 20 thành phần lấy từ phép chiếu dọc 50 thành phần đặc trưng phép chiếu Cuối cùng, 20 thành phần cuối lấy từ phần bên phần bên từ Tiếp theo, khoảng cách Minskowski (Mahatan) tính tốn theo vector đặc trưng mơ tả cho từ sở liệu: 93 MD(i) Q(k ) W(k , i) (2.5.1) Trong MD(i) khoảng cách Minkowski từ i Q(k) vector đặc trưng mô tả từ truy vấn W(k,i) mô tả từ thứ i Hình 2.37 Thủ tục đối sánh từ Sau đó, tỉ lệ đối sánh với từ cịn lại sở liệu chuẩn hóa giá trị từ đến 100, giá trị thể độ tương tự từ truy vấn với từ sở thấp hay cao Tỉ lệ cho từ tính tốn sau: R(i) 100 Trong đó, MD(i) max(MD) (2.5.2) giá trị tỉ lệ từ i, MD(i) khoảng cách Minskowski có giá trị cao tìm thấy sở liệu 60 Cuối cùng, hệ thống hiển thị ảnh tài liệu có chứa từ theo thứ tự giảm dần tỷ lệ tương ứng Trong trình thực hiện, ảnh tài liệu hiển thị cho người dùng ảnh tài liệu có tỷ lệ tương tự 70% Kết luận Chương chủ yếu trình bày thao tác dùng để nhận dạng từ văn hình ảnh tài liệu tìm hiểu hiểu đặc trưng chung hay dùng để đối sánh đối tượng 61 CHƯƠNG 3: CHƯƠNG TRÌNH THỬ NGHIỆM TÌM KIẾM TỪ TRONG ẢNH TÀI LIỆU TRÊN CƠ SỞ LÝ THUYẾT ĐÃ XÂY DỰNG Trong chương xây dựng chương trình thử nghiệm nhằm mục đích tìm kiếm ảnh tài liệu sở liệu (CSDL) Dữ liệu vào 100 ảnh ngôn ngữ tiếng anh tham khảo từ trang web http://orpheus.ee.duth.gr/irs2_5 Sau đó, ảnh tiền xử lý đưa vào sở liệu Đầu vào 1) Cơ sở liệu ảnh tài liệu: Những ảnh đầu vào (ảnh đa mức xám) chuyển sang ảnh nhị phân đồng thời nhận dạng ký tự từ có ảnh tài liệu đưa vào CSDL 2) Từ: chương trình thử nghiệm cho phép nhập vào từ, chương trình tạo ảnh từ tìm kiếm ảnh có chứa ảnh từ CSDL ảnh tài liệu Đầu ra: Các tệp ảnh có chứa ảnh từ sở liệu tài liệu 3.1.Môi trường cài đặt + Hệ thống đề xuất cài đặt với giúp đỡ công cụ lập trình Visual Studio 2010 phát triển dựa Microsoft.NET Framework 3.5 + Ngơn ngữ lập trình C# + Cơ sở liệu sử dụng Microsoft SQL Server 2012 3.2 Hệ thống mơ tả chương trình thử nghiệm Hệ thống đề xuất tìm kiếm từ ảnh tài liệu dựa phát từ, tìm kiếm ảnh tài liệu cách sử dụng thủ tục kết hợp từ, thực khớp từ trực tiếp hình ảnh tài liệu bỏ qua phương pháp nhận dạng ký tự quang học (OCR - optical character recognition) sử dụng hình ảnh từ truy vấn Tồn hệ thống bao gồm thủ tục A thủ tục B 62 Hình 3.1 Cấu trúc tổng thể hệ thống tìm kiếm từ ảnh tài liệu Trong thủ tục B, hình ảnh tài liệu phân tích để xác định vị trí giới hạn từ bên chúng Sau đó, đặc trưng có khả bắt hình dạng từ loại bỏ khác biệt chi tiết nhiễu phông chữ kết lưu trữ sở liệu Người sử dụng, thủ tục A, nhập từ truy vấn sau hệ thống đề xuất tạo hình ảnh trích chọn đặc trưng Do đó, đặc trưng sử dụng để tìm từ tương tự thông qua thủ tục kết hợp Cuối cùng, ảnh tài liệu có chứa từ tương tự thị cho người dùng Hình ảnh từ hình ảnh truy vấn hình ảnh nhân tạo mơ tả từ tìm kiếm người dùng tạo hệ thống đề xuất với chiều cao chữ chiều cao trung bình tất ảnh văn thu thông qua giai đoạn phân đoạn từ thủ tục B Hệ thống tìm kiếm từ ảnh tài liệu xây dựng chiều cao trung bình 50, loại phơng chữ hình ảnh truy vấn Arial Tuy nhiên, việc làm trơn đặc trưng khác mô tả trước loại bỏ khác biệt nhỏ loại phơng chữ Cuối cùng, hình ảnh truy vấn tạo xử lý giống hệt hình ảnh từ tài liệu 63 3.3 Giao diện chương trình tìm kiếm từ ảnh tài liệu Chương trình thiết kế gồm hai chức thêm ảnh tài liệu vào CSDL tìm kiếm từ ảnh tài liệu Khi thực thêm ảnh tài liệu vào sở liệu, chương trình xuất hộp thoại hình 3.2 hình 3.3 Hình 3.2 hình 3.3 giao diện chức thêm ảnh vào CSDL Chức giao diện duyệt file, lưu hủy Khi ta chọn chức duyệt file chương trình hiển thị đường dẫn để tìm đến file có chứa ảnh tài liệu máy tính, chọn ảnh tài liệu chọn nhiều ảnh tài liệu lúc Khi chọn xong ảnh tài liệu cần thêm vào sở liệu chương trình tự động hiển thị lên ảnh tài liệu tương ứng Sau đó, chọn nút lưu để cập nhật vào sở liệu, đồng thời thực chuyển ảnh tài liệu ban đầu ảnh nhị phân, tìm ngưỡng tự động dựa thuật tốn 64 Otsu tách từ có ảnh tài liệu Vì trình xử lý thời gian định tùy thuộc vào ảnh tài liệu đầu vào Sau trình xử lý xong lên thông báo cập nhật thành công hình 3.4, nhấn vào nút ok ảnh tài liệu qua xử lý đưa vào CSDL Nếu khơng muốn thêm ảnh vào CSDL ấn nút hủy để trở lại giao diện chương trình Hình 3.4 giao diện thêm ảnh vào CSDL thành công Khi thêm ảnh vào CSDL thành công quay trở lại giao diện chương trình Trong giao diện gồm hai phần nhập từ khóa cần tìm phần thứ hai hiển thị kết tìm kiếm Để thực chức người dùng cần nhập từ cần tìm, sau ấn nút tìm kiếm để chương trình tìm ảnh có CSDL Chương trình tạo ảnh cho từ cần tìm đồng thời gọi lại trình xử lý giao diện thêm ảnh vào CSDL để chuyển sang ảnh nhị phân Sau có ảnh nhị phân cho từ cần tìm ảnh CSDL chương trình thực trích chọn đặc trưng để đưa vector đặc trưng gồm 93 thành phần hình 2.36 Sau có vector đặc trưng, chương trình dùng thuật tốn đo khoảng cách Minskowski để tìm từ tương đồng Chương trình đưa kết ảnh chứa từ cần tìm kiếm hình 3.5 Để nhìn chi tiết vị trí từ ảnh tài liệu, người dùng ấn vào nút hiển thị ảnh tài liệu chứa từ Các từ liên quan tài liệu bôi màu vàng người dùng nhìn thấy rõ hình 3.6 65 Hình 3.5 kết tìm kiếm từ Hình 3.6 từ cần tìm kiếm có ảnh tài liệu bôi màu vàng 66 3.4 Một số kết Stt Từ tra cứu language very MOS details technology Tên tài liệu lib81.jpg Số lượng từ tìm thấy Số lượng từ tìm thấy sai lib19.jpg lib33.jpg lib27.jpg lib2.jpg lib13.jpg lib2.jpg lib5.jpg lib6.jpg lib13.jpg lib1.jpg lib3.jpg potential lib56.jpg religion lib80.jpg lib79.jpg lib49.jpg lib33.jpg lib1.jpg lib2.jpg lib3.jpg lib2.jpg lib3.jpg lib4.jpg lib5.jpg lib6.jpg advent CMOS class 10 Bảng 3.1 kết tìm kiếm từ 67 3.5 Đánh giá Đánh giá độ xác tìm kiếm từ ảnh tài liệu sử dụng : Độ xác (precison) tỉ lệ số ghi liên quan tìm tổng số ghi liên quan số ghi không liên quan tìm Khả thu hồi (recall) tỉ lệ số tài liệu tìm tổng số tài liệu liên quan có CSDL Độ xác khả thu hồi biểu diễn dạng tỷ lệ phần trăm Việc đánh giá dựa 100 hình ảnh tài liệu, tìm kiếm ngẫu nhiên 30 từ details potential 3.religion technology advent smoothing culture world between 10 further 11 number 12 Greek 13 might 14 century 15 homage 16 period 17 taxes 18 living 19 growth 20 churches 21 neural 22 foreign 23 smaller 24 extensively 25 eventually 26 diplomatic 27 demands 28 political 29 region 30 break Bảng 3.2 ba mươi từ ngẫu nhiên dùng đánh giá Số thứ tự chữ Độ xác Khả thu hồi 100 100 100 100 100 100 75 100 80 98 50 100 100 100 100 79 100 100 10 100 100 Số thứ tự chữ Độ xác Khả thu hồi 11 100 100 12 98 98 13 100 100 14 100 100 15 38 98 16 100 100 17 50 100 18 100 100 19 100 100 20 100 100 Số thứ tự chữ Độ xác Khả thu hồi 21 100 100 22 100 100 23 100 100 24 20 100 25 80 98 26 100 100 27 100 100 28 100 100 29 100 100 30 50 90 Bảng 3.3 Giá trị độ xác khả thu hồi ba mươi từ ngẫu nhiên dùng đánh giá Độ xác khả thu hồi giá trị đạt mơ tả biểu đồ hình 3.7 Độ xác khả thu hồi cho thử nghiệm 88.0% 98.7% 68 120 100 80 60 40 20 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 Độ xác 120 100 80 60 40 20 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 Khả thu hồi Hình 3.7 thay đổi độ xác thu hồi cho tìm kiếm 69 KẾT LUẬN Trong trình nghiên cứu thực luận văn, với giúp đỡ hướng dẫn thầy giáo hướng dẫn, bạn bè Học viên nhận thấy đạt số kết sau: + Nắm bắt bước tìm kiếm từ hình ảnh tài liệu, hiểu khái niệm xử lý ảnh Thấy vai trò quan trọng xử lý ảnh hệ tìm kiếm, bước tiền xử lý nhằm nâng cao chất lượng ảnh + Tìm hiểu nghiên cứu tổng qt hố phương pháp trích chọn đặc trưng hình ảnh tài liệu, nắm phương pháp đối sánh hình ảnh từ tương ứng Từ đưa giải pháp cho toán đặt luận văn + Đã áp dụng thành công kiến thức tìm hiểu vào cài đặt thử nghiệm chương trình tìm kiếm từ hình ảnh tài liệu Tuy nhiên, kiến thức hạn chế, thời gian hạn hẹp nên tìm hiểu xây dựng hệ thống, tồn hạn chế: + Hệ thống thực cơng việc cơng việc tìm kiếm từ đạt hiểu cao ngôn ngữ la tinh Đối với ngơn ngữ khác chữ tượng hình nước Nhật Bản, Trung Quốc, Ấn Độ.v.v Hệ thống khơng thể tìm kiếm xác + Việc tìm kiếm từ hạn chế độ đo tương tự từ chưa thực hợp lý Cụ thể người dùng phải nhập từ theo chữ viết thường hay chữ viết hoa Ngồi hệ thống khơng tìm từ có phần giống Để tăng cường khả tìm kiếm hệ thống mở rộng phạm vi ứng dụng, nhược điểm nêu cần khắc phục Hướng phát triển hệ thống phải: + Sử dụng nhiều đặc trưng để mô tả từ, đặc biệt các đặc trưng moment +Sử dụng thủ tục đối sánh dựa Dynamic Time Warping , phương pháp lề vector đặc trưng, tìm kiếm từ có phần liên quan +Ngồi ra, hệ thống cải thiện thay tìm kiếm từ, tìm kiếm nhiều từ Cuối cùng, em mong đóng góp ý kiến thầy cơ, bạn bè để xây dựng hệ thống hoàn thiện - 70 - DANH MỤC TÀI LIỆU THAM KHẢO Tiếng việt [1] PGS.TS.Đỗ Năng Tồn,TS.Phạm Việt Bình, “Giáo trình xử lý ảnh”, Khoa Công Nghệ Thông Tin, Đại Học Thái Nguyên [2] PGS.TS Nguyễn Quang Hoan, “Giáo Trình Xử lý ảnh”, Học viện Cơng Nghệ Bưu Chính Viễn Thơng Tiếng anh [3] Nobuyuki Otsu, “A threshold selection method from gray-level histograms” [4] Manesh B Kokare, M.S.Shirdhonkar, “Document Image Retrieval: An Overview” [5] Kavallieratou, E Fakotakis, N Kokkinakis, “An unconstrained handwriting recognition system” [6] Konstantinos Zagoris, Kavallieratou Ergrina, Nikos Papamarkos, “Developing Document Image Retrieval System” [7] Shapiro, Stockman,“Computer Vision” [8] Chew Lim Tan, Weihua Huang, Zhaohui Yu, Yi Xu, “Imaged Document Text Retrieval without OCR” [9] Kobus Barnard , Nikhil V Shirahatti, “A method for comparing content based image retrieval method” [10] Anand Kumar, C.V Jawahar, R Manmatha, "Efficient Search in Document Image Collections” [11] Mark S Nixon, Alberto S Aguado, “Feature Extraction and Image Processing” [12] Million Meshesha, C V Jawahar, “Matching word images for content-based retrieval from printed document images” [13] K Zagoris, N Papamarkos , C Chamzas, “Web Document Image Retrieval System Based on Word Spotting” [14] Toni M Rath, R Manmatha, “Word Image Matching Using Dynamic Time Warping” - 71 - [15] Yue Lu, Chew Lim Tan, “Information Retrieval in Document Image Databases” Danh mục Website tham khảo [16] http://codeproject.com [17] http://en.wikipedia.org/wiki/Euclidean_geometry [18] http://labbookpages.co.uk/software/imgProc/otsuThreshold.html [19] http://orpheus.ee.duth.gr/irs2_5/