Đọc ký tự trong văn bản ngày nay đã trở thành một mảng lớn trong Thị giá máy tính (CV: Computer Vision). Nhìn về lịch sử phát triển của đọc ký tự trong văn bản chúng ta có thể thấy rằng đây là mảng ứng dụng khá mới mẻ. Đọc ký tự trong văn bản đã được tạo ra nhằm giải quyết 2 vấn đề: Phục vụ sự phát triển của điện báo và tạo ra các thiết bị đọc sách cho người mù. Năm 1914, Emanuel Goldberg đã phát triển một máy tính có thể đọc các ký tự và chuyển đổi chúng thành một mã số điện báo chuẩn (telegraph code). Cùng thời gian đó Edmund Fournier dAlbe phát triển Optophone, một máy quét cầm tay khi di chuyển trên một trang in. Thiết bị này có thể tạo ra tiếng khi “thấy” chữ cái hoặc ký tự tương ứng. Trong cuối những năm cuối thập niên 1920 Emanuel Goldberg phát triển một hệ thống được gọi là “Máy tính thống kê” để tìm kiếm số lưu trữ trong vi phim (microfilm) bằng cách sử dụng một hệ thống nhận diện mã quang học. Năm 1931 ông được cấp bằng sáng chế của Hoa Kỳ số 1,838,389 cho phát minh của mình. Bằng sáng chế đã được mua lại bởi IBM sau đó.
ĐẠI HỌC QUỐC GIA TP HỒ CHÍ MINH TRƯỜNG ĐẠI HỌC BÁCH KHOA KHOA ĐIỆN-ĐIỆN TỬ BỘ MÔN VIỄN THÔNG -o0o - BÁO CÁO ĐỒ ÁN MÔN HỌC PHÁT HIỆN KÝ TỰ BẰNG PHƯƠNG PHÁP BIẾN ĐỔI NÉT CHỮ (SWT) SVTH MSSV GVHD : Nguyễn Tuấn Quang : 41002596 : T.S Võ Trung Dũng Tp Hồ Chí Minh, tháng năm 2014 Trang ĐẠI HỌC QUỐC GIA TP.HỒ CHÍ MINH TRƯỜNG ĐẠI HỌC BÁCH KHOA -✩ Số: /BKĐT Khoa: Điện – Điện tử Bộ Môn: Viễn Thông CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM Độc lập – Tự – Hạnh phúc -✩ - NHIỆM VỤ ĐỒ ÁN MÔN HỌC HỌ VÀ TÊN : Nguyễn Tuấn Quang NGÀNH: Đề tài: MSSV: 41002596 ĐIỆN TỬ - VIỄN THÔNG LỚP : DD10DV05 PHÁT HIỆN KÝ TỰ BẰNG PHƯƠNG PHÁP BIẾN ĐỔI NÉT CHỮ (SWT) Nhiệm vụ (Yêu cầu nội dung số liệu ban đầu): Ngày giao nhiệm vụ đồ án: Ngày hoàn thành nhiệm vụ: Họ tên người hướng dẫn: Phần hướng dẫn Nội dung yêu cầu Đồ án thông qua Bộ Môn Tp.HCM, ngày… tháng… năm 2013 CHỦ NHIỆM BỘ MƠN NGƯỜI HƯỚNG DẪN CHÍNH PHẦN DÀNH CHO KHOA, BỘ MÔN: Người duyệt (chấm sơ bộ): Đơn vị: Ngày bảo vệ: Điểm tổng kết: Nơi lưu trữ đồ án: ……… Trang Trang PHẦN MỞ ĐẦU Lời nói đầu Đọc ký tự văn ngày trở thành mảng lớn Thị giá máy tính (CV: Computer Vision) Nhìn lịch sử phát triển đọc ký tự văn thấy mảng ứng dụng mẻ Đọc ký tự văn tạo nhằm giải vấn đề: Phục vụ phát triển điện báo tạo thiết bị đọc sách cho người mù Năm 1914, Emanuel Goldberg phát triển máy tính đọc ký tự chuyển đổi chúng thành mã số điện báo chuẩn (telegraph code) Cùng thời gian Edmund Fournier d'Albe phát triển Optophone, máy quét cầm tay di chuyển trang in Thiết bị tạo tiếng “thấy” chữ ký tự tương ứng Trong cuối năm cuối thập niên 1920 Emanuel Goldberg phát triển hệ thống gọi “Máy tính thống kê” để tìm kiếm số lưu trữ vi phim (microfilm) cách sử dụng hệ thống nhận diện mã quang học Năm 1931 ông cấp sáng chế Hoa Kỳ số 1,838,389 cho phát minh Bằng sáng chế mua lại IBM sau Ngày nay, với phát triển vượt bậc phần cứng máy tính cơng nghệ điện tốn đọc ký tự văn đóng góp nhiều ứng dụng thực tiễn đời sống ngày Chúng ta lấy ví dụ như: - Nhập liệu cho mục đích cơng việc: số hóa sách, kiểm tra hay xác thực hóa đơn, séc, hóa đơn, hộ chiếu… Xác thực biển số xe Khai thác thông tin quan trọng tài liệu bảo hiểm Lấy thông tin từ danh thiếp lưu danh bạ Số hóa sách cách nhanh chóng nhằm đảm bảo việc lưu trữ sách dễ dàng thuận tiện Ta kể đến dự án số hóa sách lớn Project Gutenberg Có thể tìm kiếm thông tin ảnh KTS Rất nhiều ứng dụng ngày trang bị tính Neo Reader (trên smartphone), Google Translate… Chuyển đổi chữ viết tay chữ in dùng việc nhập liệu cách tự nhiên nhanh chóng cho khơng thích nhập liệu bàn phím Áp dụng công nghệ hỗ trợ người bị khiếm thị Đọc ký tự văn thách thức thu hút nhiều ý từ nhà nghiên cứu, nhà sản xuất thiết bị điện tử người dùng Hai nhánh Đọc ký tự văn Phát ký tự Nhận diện ký tự Đồ án nhằm mục đích trình bày Phát ký tự đoạn văn hình ảnh tự nhiên cách sử dụng phiên nâng cao chuyển đổi bề rộng nét chữ (SWT: Stroke Width Transformation) Ứng dụng nhận hình ảnh RGB để tìm kiếm chữ trả hình ảnh nơi đoạn văn phát đánh dấu Do tính SWT, kết phát văn khơng phân biệt kích thước, hướng, phơng chữ ngơn ngữ Trang Mục lục Các mục bao gồm I II III IV V VI Giới thiệu sơ lược SWT 1.1 Hai nhánh Đọc ký tự văn Trang 1.2 SWT Giới thiệu thuật toán SWT 2.1 Vấn đề giả định 2.2 Biến đổi bề rộng nét chữ 2.3 Loại bỏ số dòng dư 2.4 Tìm kiếm ký tự thích hợp 2.5 Nhóm ký tự thích hợp vào vùng chữ Kết chạy thử nghiệm Matlab 3.1 Giao diện 3.2 Tổng quan 3.3 Thử nghiệm Ứng dụng mặt hạn chế 4.1 Ứng dụng 4.2 Những hạn chế Tài liệu tham khảo Lời kết Trang Trang 6-12 Trang 13-16 Trang 17-18 Trang 19 Trang 20 Trang 21 Phần I Giới thiệu sơ lược SWT 1.1 Hai nhánh Đọc ký tự văn bản: Đọc ký tự văn khung cảnh thiên nhiên phần quan trọng nhiều tác vụ thị giác máy tính (Computer Vision-CV) Ví dụ, việc thực nhận dạng ký tự quang học (Optical Character Recognition-OCR) thuật tốn cải thiện cách xác định khu vực văn hình ảnh Phát văn cảnh thiên nhiên lĩnh vực nghiên cứu chuyên sâu có nhiều cách tiếp cận để giải vấn đề Tuy nhiên, hầu hết chương trình phát văn OCR hạn chế người sử dụng ngơn ngữ cụ thể, kích thước hướng văn Hơn nữa, cảnh sắc thiên nhiên, khơng muốn làm cho giả định hạn chế kết phù hợp Có cân hạn chế mà áp dụng chất lượng kết Chúng ta giới hạn tìm kiếm hình thơng tin sai/ nhiễu (noise) mà gặp phải.[1] Sự khác OCR (Nhận diện ký tự Quang học) Phát ký tự OCR Nhận diện chữ hình ảnh có từ scan, fax chi tiết dư có nhiệm vụ “đọc” kí tự Được ứng dụng việc nhập liệu hay lấy thơng tin từ hình ảnh Phát ký tự Phát ký tự hay vùng ký tự có ảnh tự nhiên, ảnh chụp quang ảnh với nhiều chi tiết dư thừa hoa lá, bảng hiệu…Nhiệm vụ “chỉ ra” vùng ký tự Được ứng dụng việc phát vùng ký tự, từ ta dùng thuật tốn thích hợp để xử ký vùng ký tự Ví dụ OCR Phát ký tự OCR Hình chụp từ văn Trang Đoạn văn đọc OCR (Kết lấy từ trang web http://www.onlineocr.net/) TD TD-Thơng qua thuật tốn nhằm nhận biết vùng ký tự Trang Đồ án giới thiệu thuật toán SWT đề cập chi tiết thuật toán ứng dụng hạn chế 1.2 SWT Có nhiều thuật tốn để phát ký tự thuật toán để đề xuất tỏ hiệu vượt trội so với thuật tốn khác SWT SWT thể vượt trội so với thuật tốn khác chỗ dễ hiểu tiêu tốn tài nguyên phần cứng thực hiện.[2] Được công bố năm 2010 tác giả Boris Epshtein, Eyal Ofek Yonatan Wexler Cơng trình khoa học Thuật tốn mẻ giới xử lý ảnh SWT thuật toán dựa phép biến đổi bề rộng chữ Điều có nghĩa ta phát vùng ký tự các ngôn ngữ khác cách dễ dàng mà khơng đòi hỏi phải cho máy học trước với lượng database lớn Ví dụ sau cho ta nhìn chi tiết hơn.[3] Ví dụ 1: Ảnh lấy từ trang www.gabrielweinberg.com Trang Ảnh lấy từ trang www.designsngold.com Ảnh lấy tử trang www.canadianarabcommunity.com Trang Từ Ví dụ ta thấy dù chữ viết ngơn ngữ kí tự có mơtk đặc điểm chung nét chữ ln có bề rộng thay đổi nhỏ Ví dụ 2: Từ ví dụ hai ta thấy ký tự với font khác cho hình dáng khác Nếu thực việc nhận dạng ký tự cách cho máy học ta phải có mẫu database ta sử dụng SWT khơng cần cho học trước Điều có ý nghĩa lớn giúp cho thể có thuật toán xử lý mạnh mẽ gọn nhẹ tốn tài nguyên phần cứng máy Ví dụ 3: Trang 10 Hình ảnh thực tế có nhiều chi tiết phụ hoa, lá, cành nên ta áp dụng việc nhận diện ký tự kết tệ Dưới kết việc nhận diện ký tự trực tiếp chưa qua phép biến đổi Trang 11 E‘ ;.*?a.=@~