Nghiên cứu phương pháp cắt chữ dính viết tay tiếng việt

70 417 0
Nghiên cứu phương pháp cắt chữ dính viết tay tiếng việt

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

ĐẠI HỌC THÁI NGUYÊN TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN & TRUYỀN THÔNG ĐÀO MINH THẮNG NGHIÊN CỨU PHƯƠNG PHÁP CẮT CHỮ DÍNH VIẾT TAY TIẾNG VIỆT LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH THÁI NGUYÊN - 2016 ĐẠI HỌC THÁI NGUYÊN TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN & TRUYỀN THÔNG ĐÀO MINH THẮNG NGHIÊN CỨU PHƯƠNG PHÁP CẮT CHỮ DÍNH VIẾT TAY TIẾNG VIỆT Chuyên ngành: Khoa học máy tính Mã số: 60480101 LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH Người hướng dẫn khoa học: PGS TS NGÔ QUỐC TẠO THÁI NGUYÊN - 2016 i LỜI CẢM ƠN Sau thời gian nghiên cứu làm việc nghiêm túc, động viên, giúp đỡ hướng dẫn tận tình Thầy giáo hướng dẫn PGS.TS Ngô Quốc Tạo, luận văn với đề tài “Nghiên cứu phương pháp cắt chữ dính viết tay tiếng Việt” hoàn thành Tôi xin bày tỏ lòng biết ơn sâu sắc đến: Thầy giáo hướng dẫn PGS.TS Ngô Quốc Tạo tận tình dẫn, giúp đỡ hoàn thành luận văn Đề tài “Hệ thống đeo tay hỗ trợ đọc sách tiếng Việt dành cho người khiếm thị” Mã số VAST01.07/15-16 hỗ trợ thực luận văn Khoa sau Đại học Trường Đại học công nghệ thông tin truyền thông giúp đỡ trình học tập thực luận văn Tôi xin chân thành cảm ơn bạn bè, đồng nghiệp gia đình động viên, khích lệ, tạo điều kiện giúp đỡ suốt trình học tập, thực hoàn thành luận văn HỌC VIÊN Đào Minh Thắng ii LỜI CAM ĐOAN Tên là: Đào Minh Thắng Sinh ngày: 09/12/1987 Học viên lớp cao học CK13A –Trường Đại học Công nghệ thông tin Truyền thông – Đại học Thái Nguyên Hiện công tác tại: Trường Cao đẳng Cơ khí – Luyện kim – Thái Nguyên Tôi xin cam đoan luận văn “Nghiên cứu phương pháp cắt chữ dính viết tay tiếng Việtnghiên cứu hoàn thành hướng dẫn PGS.TS Ngô Quốc Tạo Các kết đạt trình nghiên cứu hoàn toàn trung thực khách quan Tôi xin chịu trách nhiệm lời cam đoan Thái Nguyên, ngày tháng Người cam đoan Đào Minh Thắng năm 2016 iii MỤC LỤC LỜI CẢM ƠN i LỜI CAM ĐOAN ii MỞ ĐẦU Chương 1:TỔNG QUAN VỀ CHỮ VIẾT TIẾNG VIỆT VÀ NHẬN DẠNG CHỮ VIẾT 1.1 Khái quát Chữ viết tiếng Việt 1.1.1 Tóm lược lịch sử phát triển tiếng Việt 1.1.2 Đặc điểm tiếng Việt 11 1.1.3 Khả nắm tả tiếng Việt cách có hệ thống 13 1.2 Trình bày lịch sử nhận dạng chữ viết tay 16 1.3 Giới thiệu hướng tiếp cận việc nhận dạng chữ viết 17 1.3.1 Nhận dạng chữ in 17 1.3.2 Nhận dạng chữ viết tay 18 1.3.3 Một số Hệ thống nhận dạng chữ viết tay tiếng Việt 19 Chương 2: MỘT SỐ PHƯƠNG PHÁP TÁCH CÁC NÉT CHỮ VIẾT TAY TIẾNG VIỆT 23 2.1 Phương pháp tách nét chữ sử dụng Histgram dọc 23 2.1.1 Cân histogram 24 2.1.2 Một số thuật toán phát hiệu chỉnh góc nghiêng văn 25 2.1.2.1 Thuật toán dựa vào phân tích hình chiếu (Projection Profile) 25 2.1.2.2 Các thuật toán dựa vào biến đổi Hough (Hough Transform) 28 2.2 Phương pháp tách nét dựa cấu trúc nét chữ 34 2.2.1 Lược đồ phương pháp cắt chữ dính tiếng Việt 34 2.2.2 Làm mảnh 35 2.2.2.1 Một số khái niệm thuật toán làm mảnh 35 iv 2.2.2.2 Thuật toán làm mảnh song song 39 2.2.3 Xác định điểm nối 42 2.2.4 Tìm đường cắt ứng viên 44 2.2.5 Quyết định chọn đường cắt từ đường cắt ứng viên ………… 47 Chương 3: CÀI ĐẶT VÀ THỬ NGHIỆM 48 3.1 Giới thiệu toán 48 3.2 Phân tích lựa chọn công cụ 49 3.3 Một số kết thử nghiệm đánh giá 54 3.3.1 Phương pháp thử nghiệm 54 3.3.2 Dữ liệu thử nghiệm 55 3.3.3 Kết đánh giá 57 KẾT LUẬN VÀ ĐỀ NGHỊ 60 TÀI LIỆU THAM KHẢO 61 v DANH MỤC HÌNH ẢNH Hình 1.1: Chữ dính viết tay 17 Hình 1.2 Các giai đoạn trình xử lý nhận dạng ảnh 19 Hình 1.3: VnDOCR ví dụ nhận dạng 20 Hình 2.1 Lược đồ xám ảnh 23 Hình 2.2: Xác định khoảng cách hai kí tự hai từ dựa histogram theo chiều dọc 24 Hình 2.3 Cấu trúc dòng văn 25 Hình 2.4 Phép chiếu ngang chiếu dọc trang tài liệu 26 Hình 2.5 Phép chiếu dọc dòng văn 27 Hình 2.6 Phép chiếu ngang dòng văn 27 Hình 2.7 Đường thẳng Hough tọa độ cực 32 Hình 2.8 Biến đổi Hough phát góc nghiêng 33 Hình 2.9: Lược đồ phương pháp tách nét chữ viết tay 35 Hình 2.10: Điểm ảnh p láng giềng 36 Hình 2.11: Các điểm biên liên kết 37 Hình 2.12: Kết ảnh sau áp dụng thuật toán Zang-Suen 42 Hình 2.13: Ảnh gốc - Ảnh xương 42 Hình 2.14: Minh họa điểm nối 43 Hình 2.15: Các trường hợp xác định điểm nối xác 43 Hình 2.16: Trường hợp mà định nghĩa điểm nối không phù hợp 43 Hình 2.17: Ví dụ điểm nối, vùng trắng 44 Hình 2.18: Lựa chọn đường cắt tốt 44 Hình 2.19: Ba đường cắt ứng viên 45 Hình 2.20: Trường hợp cắt 46 vi Hình 2.21: Tất ba đường cắt tách kí tự “o” “a” 46 Hình 2.22: Hai điểm nối (màu xám) 46 Hình 2.23: Hai đường cắt sử dụng đường gẫy tách kí tự “o” “a” 47 Hình 3.1: Sơ đồ xử lý nhận dạng chữ viết tay 49 Hình 3.2: Giao diện Visual Studio 49 Hình 3.3: Generate code Visual stidio 51 Hình 3.4 : Công cụ Break Point Visual studio 52 Hình 3.5: Giao diện hệ thống cắt chữ dính viết tay tiếng Việt 52 Hình 3.6: Chọn liệu ảnh đầu vào 53 Hình 3.7: Chuyển đổi ảnh nhị phân 53 Hình 3.8: Ảnh trước sau làm mảnh 54 Hình 3.9: Các đường cắt ứng viên 54 Hình 3.10: Thử nghiệm 55 MỞ ĐẦU Nhận dạng chữ viết, đặc biệt chữ viết tay, toán quan trọng, có nhiều ứng dụng thực tiễn khác tình báo, kỹ thuật robot,… Bài toán nhận dạng chữ viết nhiều nhà nghiên cứu giới quan tâm giải năm gần Tuy nhiên chưa có phương pháp hoàn chỉnh cho toán tính phức tạp biến dạng liệu đầu vào Đối với việc nhận dạng chữ viết tiếng Việt, năm gần nhà khoa học nước quan tâm nghiên cứu Với toán nhận dạng chữ viết tay tiếng Việt khó vấn đề nét chữ tiếng Việt Trong bối cảnh chữ viết tay Việt Nam, không hai kí tự có nét chữ với gây tình khó mà trọng âm gây tình phức tạp Để giải tốt toán nhận dạng chữ viết tay tiếng Việt, giai đoạn quan trọng phân đoạn ký tự viết tay tiếng Việt Từ lý trên, em chọn luận văn: “Nghiên cứu phương pháp cắt chữ dính viết tay tiếng Việt” Mục tiêu đề tài: Nghiên cứu Tổng quan chữ viết tiếng Việt Hệ thống nhận dạng chữ viết tay để nắm kiến thức liên quan đến chữ viết tiếng Việt hiểu giai đoạn Hệ thống nhận dạng chữ viết tay nói chung, làm sở cho bước nghiên cứu tiếp theo; Nghiên cứu Tổng quan xử lý ảnh làm mảnh ảnh, nắm số phương pháp làm mảnh ảnh bản; Nghiên cứu đưa phương pháp tách nét chữ viết tay tiếng Việt, sử dụng cấu trúc nét để đưa phương pháp tách Cuối cùng, tiến hành cài đặt đưa kết thử nghiệm phương pháp mà đưa để tách nét chữ viết tay tiếng Việt Cấu trúc luận văn chia thành chương cụ thể sau: Chương TỔNG QUAN VỀ CHỮ VIẾT TIẾNG VIỆT VÀ NHẬN DẠNG CHỮ VIẾT Trình bày kiến thức liên quan đến tiếng Việt lịch sử tiếng Việt,… Chữ viết tiếng Việt Trình bày Khái quát Hệ thống nhận dạng chữ viết tay đưa số Hệ thống nhận dạng chữ viết tay tiếng Việt nhà nghiên cứu xây dựng Chương MỘT SỐ PHƯƠNG PHÁP TÁCH CÁC NÉT CHỮ VIẾT TAY TIẾNG VIỆT Trình bày phương pháp làm mảnh song song đưa số phương pháp làm mảnh Trình bày chi tiết phương pháp tách nét Chữ viết tay tiếng Việt mà đưa ra, cụ thể: sử dụng cấu trúc nét để tách ký tự viết tay tiếng Việt Chương CÀI ĐẶT VÀ THỬ NGHIỆM Xây dựng Hệ thống tách nét chữ viết tay tiếng Việt phương pháp mà đưa tiến hành thử nghiệm, đưa kết Hệ thống mà xây dựng 48 Chương CÀI ĐẶT VÀ THỬ NGHIỆM Như trình bày Chương 2, chương tập trung nghiên cứu xây dựng Hệ thống cắt chữ dính viết tay tiếng Việt dựa thuật toán mà trình bày Chương tiến hành thử nghiệm hệ thống với liệu mà tự xây dựng 3.1 Giới thiệu toán Chúng ta biết, nhận dạng chữ viết tay toán khó người viết có cách viết khác nhau, làm cho toán nhân dạng chữ viết tay trở nên phức tạp Đối với chữ viết tiếng Việt toán trở nên khó tiếng Việt không hai kí tự có nét chữ với gây tình khó mà trọng âm gây tình phức tạp Tách nét chữ tiếng Việt bước quan trọng việc nhận dạng chữ viết tay tiếng Việt Độ xác Hệ thống nhận dạng chữ viết tay tiếng Việt phụ thuộc chủ yếu vào bước tách nét chữ tiếng Việt Hiện Việt Nam có số tác giả xây dựng Hệ thống nhận dạng chữ viết tay tiếng Việt Tuy nhiên, độ xác Hệ thống nhận dạng chưa đáp ứng tất yêu cầu thực tế Do vậy, Hệ thống nhận dạng chữ viết tay tiếng Việt cần phải nghiên cứu phát triển nhiều để đáp ứng yêu cầu thực tế Trong Chương 2, nghiên cứu trình bày phương pháp tách nét chữ viết tay tiếng Việt Để kiểm tra tính hiệu phương pháp này, chương xây dựng Hệ thống cắt chữ dính viết tay tiếng Việt sử dụng phương pháp mà trình bày Sau đó, 49 tiến hành thử nghiệm Hệ thống đưa kết đánh giá cho Hệ thống mà xây dựng Ảnh văn Tiền xử lý quét vào Tách chữ Trích chọn đặc trưng Văn nhận dạng Hậu xử lý Huấn luyện nhận dạng Hình 3.1: Sơ đồ xử lý nhận dạng chữ viết tay 3.2 Phân tích lựa chọn công cụ Visual Studio (IDE – Integrated Development Environment) công cụ phát triển phần mềm Microsoft phát triển Visual Studio phần mềm sử dụng lập trình viên để xây dựng nêncác sản phẩm phần mềm Hình 3.2: Giao diện Visual Studio Phiên Visual Studio Microsoft phát hành vào năm 1997 với hai phiên Professional Enterprise Tính đến thời 50 điểm tại, Visual Studio trải qua nhiều thời kì phát triển phát hành Visual Studio Visual Studio 2005, VS 2008, VS 2010, VS 2012, VS 2013 Và phiên Visual Studio phiên Visual Studio 2015 phát hành thức vào tháng năm 2015 Với phiên phát hình có nhiều công nghệ tính mẽ tích hợp Visual Studio có điểm mạnh sau đây: - Hỗ trợ lập trình nhiều ngôn ngữ C/C++, C#, F#, Visual Basic, HTML, CSS, JavaScript Phiên bảnVisual Studio 2015 có hổ trợ ngôn ngữ Python - Visual Studio công cụ hỗ trợ việc Debug cách mạnh mẽ, dễ dàng (Break Point, xem giá trị biến trình chạy, hỗ trợ debug câu lệnh) - Giao diện Visual Studio dễ sử dụng người bắt đầu - Visual Studio hỗ trợ phát triển ứng dụng desktop MFC, Windows Form, Universal App, ứng dụng mobileWindows Phone 8/8.1, Windows 10, Android (Xamarin), iOS phát triển website Web Form, ASP.NET MVC phát triển Microsoft Office - Visual Studio hỗ trợ kéo thả để xây dựng ứng dụng cách chuyên nghiệp, giúp bạn bắt đầu tiếp cận nhanh - Visual Studio cho phép tích hợp extension từ bên Resharper (hổ trợ quản lý viết mã nhanh cho ngôn ngữ thuộc Net), hay việc cài đặt thư viện nhanh chóng thông qua Nuget - Visual Studio sử dụng đông đảo lập trình viên toàn giới 51  Những tiện ích mà Visual Studio cung cấp Hỗ trợ viết mã nguồn nhanh chóng Với việc viết mã nguồn Notepad hay Nodepad++ gặp nhiều khó khăn quên tên hàm, chức hàm làm gì, tham số hàm có gì? Trong Visual Studio có gợi ý code sau bạn gõ tên biến, tên hàm tuyệt vời Hay sử dụng phím tắt để phát sinh code: Ví gõ “cw” sau nhấn TAB TAB Visual Studio tự phát sinh code cho System.Console.WriteLine(); Hay để tạo thuộc tính class cần gõ prop TAB TAB Visual tự generate code cho chúng ta: Hình 3.3: Generate code Visual stidio Ngoài cài thêm số extension hỗ trợ quản lý viết mã tốt như: - Visual Assist: Extension hỗ trợ với ngôn ngữ C++ - ReSharper: Extension hỗ trợ ngôn ngữ thuộc Net Công cụ Debug mạnh mẽ Với IDE mà sử dụng qua cảm thấy Visual Studio công cụ hổ trợ Debug cách mạnh mẽ 52 Ngoài cách xuất thông số (giá trị biến) output hổ trợ hàm printf, cout (C/C++),Console.WriteLine, Debug.WriteLine (C#) Visual Studio debug câu lệnh để kiểm tra giá trị qua câu lệnh Đó việc sử dụng Break Point Hình 3.4 : Công cụ Break Point Visual studio Chính Chúng sử dụng ngôn ngữ Visual C# để xây dựng Hệ thống Môi trường lập trình cho Hệ thống, sử dụng Microsoft Visual Studio 2010  Giao diện chức hệ thống Giao diện hệ thống mà xây dựng có đây: Hình 3.5: Giao diện hệ thống cắt chữ dính viết tay tiếng Việt 53 Chức hệ thống - Dữ liệu InPut (LOAD IMAGE): Tải liệu đầu vào Hình 3.6: Chọn liệu ảnh đầu vào - Tiền xử lý (CONVERT TO BLACK&WHITE): Chuyên đổi ảnh từ ảnh màu sang ảnh nhị phân Hình 3.7: Chuyển đổi ảnh nhị phân - Làm mảnh (THINING): Làm mảnh ảnh liệu đầu vào 54 Hình 3.8: Ảnh trước sau làm mảnh - Histogram theo chiều dọc đường cắt histogram (VERTICAL HISTORAM CUT HISTOGRAM) - Cắt ảnh làm mảnh (CUT THIN): Tìm đường cắt ứng viên để tách nét chữ dính Hình 3.9: Các đường cắt ứng viên 3.3 Một số kết thử nghiệm đánh giá 3.3.1 Phương pháp thử nghiệm Để thử nghiệm Hệ thống mà xây dựng lựa chọn phương pháp thử nghiệm sau: Chúng tiến hành lấy nét chữ tiếng Việt viết tay nhiều người, sau thực scan để tạo ảnh làm đầu vào cho Hệ thống Lựa chọn ảnh InPut có định dạng bmp 256 55 bit Tiếp đến, đưa ảnh vào Hệ thống để hệ thống xác định nét cắt trực tiếp ảnh Hình 3.10: Thử nghiệm 3.3.2 Dữ liệu thử nghiệm Để tiến hành theo phương pháp thử nghiệm trên, xây dựng liệu thử nghiệm cho Hệ thống, liệu trình bày bảng Bảng 3.1: Dữ liệu thử nghiệm cho Hệ thống TT Tên ảnh Test1.bmp Test2.bmp Ảnh 56 TT Tên ảnh Test3.bmp Test4.bmp Test5.bmp Test6.bmp Test7.bmp Ảnh 57 TT Tên ảnh Test8.bmp Ảnh 3.3.3 Kết đánh giá Sau tiến hành theo phương pháp thử nghiệm với liệu thử nghiệm thu thập được, kết thu sau: Bảng 3.2: Kết xác định đường cắt để tách nét chữ ký tự tiếng Việt TT Ảnh Test1.jpg Test2.jpg Test3.jpg Kết 58 TT Ảnh Test4.jpg Test5.jpg Test6.jpg Test7.jpg Test8.jpg Kết Từ bảng kết trên, học viên rút nhận xét sau: - Hệ thống chạy ổn định có thời gian chạy chấp nhận được; 59 - Giao diện hệ thống dễ sử dụng; - Hệ thống tách thành công kí tự - Có thể thấy rằng, nhiều trường hợp yêu cầu đường cắt khác với đường cắt dọc đường cắt cong theo hướng dọc Ưu điểm lớn Hệ thống giải trường hợp sử dụng đường cắt sử dụng đường gẫy từ điểm nối Hạn chế - Đôi lúc, Hệ thống cho kết sai điểm nối lộn xộn điểm nối kí tự phần kí tự ảnh chứa nhiều kí tự tiếng Việt viết dính liền - Chương trình thực cắt chữ dính dòng 60 KẾT LUẬN VÀ ĐỀ NGHỊ - Mục tiêu luận văn đưa ra: + Tìm hiểu nhận dạng chữ viết + Tìm hiểu phương pháp làm mảnh ảnh + Nghiên cứu phương pháp tách nét chữ viết + Thiết kế chương trình tách nét chữ dính viết tay - Kết đạt được: Sau trình tìm hiểu, nghiên cứu em hoàn thành luận văn với kết đạt mục tiêu đề ra: + Hiểu cách nhận dạng chữ viết + Hiểu phương pháp tách nét chữ viết + Hiểu phương pháp làm mảnh ảnh + Thiết kế chương trình cắt chữ dính viết tay dựa nghiên cứu phương pháp làm mảnh ảnh phương pháp tách nét chữ dính viết tay - Hướng phát triển đề tài: + Tiếp tục nghiên cứu để hoàn thành phần mềm cắt chữ dính cho đoạn văn viết tay làm sở cho việc nhận dạng đoạn văn viết tay tiếng Việt 61 TÀI LIỆU THAM KHẢO Tiếng Việt [1] Đỗ Năng Toàn Phạm Việt Bình, Đại học Thái Nguyên, “Giáo trình xử lý ảnh số” Nxb Khoa học kỹ thuật, Hà Nội, 2008 [2] Hoàng Phê (1998), Từ điển tiếng Việt, NXB Đà Nẵng Trung tâm Từ điển học, in lần thứ sáu, Hà Nội – Đà Nẵng [3] Nguyễn Thiện Giáp (2005), Lịch sử Việt ngữ học (tập 1), NXB Giáo dục [4] Trung tâm KHXH&NV Quốc gia (2002), Ngữ pháp tiếng Việt, NXB Khoa học Xã hội Tiếng Anh [5] Anh D Phan, Tao Q Ngo, Hung V Pham (Referee Tran Nguyen Ngoc, PhD) (2012), Vietnamese Handwritten characters segmentation using structure of strokes, Tạp chí Khoa học Kỹ thuật – Học viện KTQS [6] Chen Yi-Kai, Wang Jhing-Fa (2000), Segmentation of single-or multiple-touching handwritten numeral string using background and foreground analysis, IEEE Trans Pattern Anal Mach Intell, Vol 22: Issue 11 p1304-1317 [7] Dipak V Koshti, Sharvari Govolkar (2012), Segmentaion of Touching Characters in Handwritten Devanagari Script In UACEE International Journal of Computer Science and its Applications, Vol 2: Issue [ISSN 22503765], pp 83-87 [8] Eric L'Homer, Extraction of strokes in handwritten characters,on Pattern Recognition 33 (2000)1147}1160 [9] M Blumenstein, X Y Liu, B Verma (2004), A modified direction feature for curvise character recognition, International Joint Conference on Neural Networks (IJCNN’04), Budapest, Hungary, pp 2983-2987 62 [10] Nafiz Arica and Fatos T YarmanVural (2001), An Overview of Character Recognition Focused on Off-Line Handwriting, in IEEE Transactions on Systems, Man, And Cybernetics-Part C: Applications And Reviews, Vol 31, No [11] Sobhana Mari S, G Raju, A modified Thinning Algorithm for Handwritten Tamil Characters, International Journal of Engineering and Technical Research (IJETR) ISSN: 2321-0869, Volume-3, Issue-2, February 2015 [...]... MỘT SỐ PHƯƠNG PHÁP TÁCH CÁC NÉT CHỮ VIẾT TAY TIẾNG VIỆT Trong chương này, chúng tôi sẽ tập trung vào nghiên cứu và trình bày một phương pháp tách các nét chữ viết tay tiếng Việt Trong phương pháp này, chúng tôi sử dụng các đường cắt gẫy, nghĩa là đường cắt gồm có được cắt dọc và cắt ngang Các kiến thức dưới đây được tham khảo từ: [5], [6], [7], [8], [9], [10], [11] 2.1 Phương pháp tách nét chữ sử dụng...3 Chương 1 TỔNG QUAN VỀ CHỮ VIẾT TIẾNG VIỆT VÀ NHẬN DẠNG CHỮ VIẾT Trong chương này, chúng tôi sẽ tập trung nghiên cứu và trình bày những kiến thức cơ bản liên quan đến tiếng Việt như lịch sử phát triển của tiếng Việt, đặc điểm của tiếng Việt chữ viết tiếng Việt Đồng thời, chúng tôi cũng sẽ nghiên cứu và trình bày Khái quát về Hệ thống nhận dạng chữ viết tiếng Việt Các kiến thức dưới đây được... thống nhận dạng chữ viết tay tiếng Việt hiện có Như vậy, tiếng Việt là ngôn ngữ của người Việt và là quốc ngữ của Việt Nam Trong lịch sử đã có ba loại văn tự được dùng để ghi chép tiếng Việt chữ Hán, chữ Nôm và chữ quốc ngữ Chữ Hán và chữ Nôm là văn tự 22 ngữ tố, mỗi chữ biểu thị một âm tiết của tiếng Việt Chữ quốc ngữ là văn tự toàn âm tố, lấy âm tố làm đơn vị Với phạm vi nghiên cứu của báo cáo... dạng chữ viết tay được tách ra hai hướng phát triển: nhận dạng chữ viết tay trực tuyến (online) và chữ viết tay ngoại tuyến (offline) Trong đó nhận dạng chữ viết tay trực tuyến là khi viết lên màn hình thì máy tính sẽ chuyển những hình ảnh viết tay thành dạng text Khác với chữ offline, chữ online có thêm thông tin về thứ tự các điểm, các nét được viết Hiện nay việc nhận dạng chữ viết tay tiếng Anh... cầm tay thậm chí là máy để bàn và điện thoại di động Nhưng đối với tiếng Việt thì chưa có một phần mềm nào tương tự Còn trong nhận dạng chữ viết tay offline chúng ta nghiên cứu về nhận dạng chữ viết tay tự nhiên và nhận dạng chữ viết tay hạn chế Nhận dạng chữ viết tay tự nhiên là dùng để xử lý các văn bản viết tay thông thường, công việc này cực kỳ khó khăn nếu không nói là không thể Nhận dạng chữ viết. .. tiên, chúng tôi nghiên cứu và trình bày những giai đoạn lịch sử phát triển của tiếng Việt để nắm những kiến thức cơ bản về tiếng Việt Sau đó, chúng tôi nghiên cứu và trình bày những đặc điểm của tiếng Việt, có ba đặc điểm: ngữ âm, từ vựng và ngữ pháp, cùng với trình bày chữ viết tiếng Việt Ngoài ra, chúng tôi cũng tập trung nghiên cứu một cách khái quát về Hệ thống nhận dạng chữ viết tay và trình bày... sẽ đơn giản 19 hơn Các chữ trong phiếu điều tra thường là các chữ viết tay hạn chế: viết rõ ràng, rời nhau, hoặc không dính liền nhau nhiều, thậm chí là viết hoa Hiện nay, phần mềm MarkRead cũng đã có tích hợp đặc trưng nhận dạng chữ viết tay hạn chế, nhưng kết quả mới chỉ dừng lại ở phòng thí nghiệm Nhận dạng chữ viết tay vẫn còn là vấn đề thách thức lớn đối với các nhà nghiên cứu Bài toán này chưa... sự lãnh đạo của Đảng Cộng sản Việt Nam Đó cũng là sự phát triển đã diễn ra với một lợi khí mới về chữ viết: "chữ quốc ngữ" Chữ quốc ngữ là một thứ chữ được xây dựng theo nguyên tắc ghi âm, bằng chữ cái Latin Loại chữ này đã được dùng phổ biến từ rất lâu, ở châu Âu Đến thế kỉ 17, một số giáo sĩ phương Tây đem nguyên tắc ấy dùng vào việc 7 ghi âm tiếng Việt, tạo ra một thứ chữ thuận lợi hơn đối với mục... dạng chữ in theo 192 ngôn ngữ khác nhau, phần mềm nhận dạng chữ Việt in VnDOCR 4.0 của Viện Công Nghệ Thông tin Hà Nội có thể nhận dạng được các tài liệu chứa hình ảnh, bảng và văn bản với độ chính xác trên 98%) 1.3.2 Nhận dạng chữ viết tay Với những mức độ ràng buộc khác nhau về cách viết, kiểu chữ, … phục vụ cho các ứng dụng đọc và xử lý các chứng từ, hóa đơn, phiếu ghi, văn bản viết tay, … Nhận dạng chữ. .. nhân dân Việt Nam  Tiếng Việt ở giai đoạn dùng "chữ quốc ngữ" Từ đầu thế kỉ 20 về sau, tiếng Việt dần dần được dùng trong mọi thể loại văn học, mọi địa hạt văn hoá, khoa học, kĩ thuật Nó phát triển thành ngôn ngữ văn học toàn diện Đây là giai đoạn hiện đại của tiếng Việt Ở giai đoạn này, sự phát triển của tiếng Việt diễn ra mạnh và nhanh, cùng một đà với quá trình biến đổi sâu sắc của xã hội Việt Nam ... viết tay tiếng Việt, giai đoạn quan trọng phân đoạn ký tự viết tay tiếng Việt Từ lý trên, em chọn luận văn: Nghiên cứu phương pháp cắt chữ dính viết tay tiếng Việt Mục tiêu đề tài: Nghiên cứu Tổng... liên quan đến tiếng Việt lịch sử tiếng Việt, … Chữ viết tiếng Việt Trình bày Khái quát Hệ thống nhận dạng chữ viết tay đưa số Hệ thống nhận dạng chữ viết tay tiếng Việt nhà nghiên cứu xây dựng... MỘT SỐ PHƯƠNG PHÁP TÁCH CÁC NÉT CHỮ VIẾT TAY TIẾNG VIỆT Trình bày phương pháp làm mảnh song song đưa số phương pháp làm mảnh Trình bày chi tiết phương pháp tách nét Chữ viết tay tiếng Việt mà

Ngày đăng: 09/12/2016, 17:56

Từ khóa liên quan

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan