Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 70 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
70
Dung lượng
1,06 MB
Nội dung
ĐẠI HỌC THÁI NGUYÊN TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN & TRUYỀN THÔNG ĐÀO MINH THẮNG NGHIÊNCỨUPHƯƠNGPHÁPCẮTCHỮDÍNHVIẾTTAYTIẾNGVIỆT LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH THÁI NGUYÊN - 2016 ĐẠI HỌC THÁI NGUYÊN TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN & TRUYỀN THÔNG ĐÀO MINH THẮNG NGHIÊNCỨUPHƯƠNGPHÁPCẮTCHỮDÍNHVIẾTTAYTIẾNGVIỆT Chuyên ngành: Khoa học máy tính Mã số: 60480101 LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH Người hướng dẫn khoa học: PGS TS NGÔ QUỐC TẠO THÁI NGUYÊN - 2016 i LỜI CẢM ƠN Sau thời gian nghiêncứu làm việc nghiêm túc, động viên, giúp đỡ hướng dẫn tận tình Thầy giáo hướng dẫn PGS.TS Ngô Quốc Tạo, luận văn với đề tài “Nghiên cứuphươngphápcắtchữdínhviếttaytiếng Việt” hoàn thành Tôi xin bày tỏ lòng biết ơn sâu sắc đến: Thầy giáo hướng dẫn PGS.TS Ngô Quốc Tạo tận tình dẫn, giúp đỡ hoàn thành luận văn Đề tài “Hệ thống đeo tay hỗ trợ đọc sách tiếngViệt dành cho người khiếm thị” Mã số VAST01.07/15-16 hỗ trợ thực luận văn Khoa sau Đại học Trường Đại học công nghệ thông tin truyền thông giúp đỡ trình học tập thực luận văn Tôi xin chân thành cảm ơn bạn bè, đồng nghiệp gia đình động viên, khích lệ, tạo điều kiện giúp đỡ suốt trình học tập, thực hoàn thành luận văn HỌC VIÊN Đào Minh Thắng ii LỜI CAM ĐOAN Tên là: Đào Minh Thắng Sinh ngày: 09/12/1987 Học viên lớp cao học CK13A –Trường Đại học Công nghệ thông tin Truyền thông – Đại học Thái Nguyên Hiện công tác tại: Trường Cao đẳng Cơ khí – Luyện kim – Thái Nguyên Tôi xin cam đoan luận văn “Nghiên cứuphươngphápcắtchữdínhviếttaytiếngViệt ” nghiêncứu hoàn thành hướng dẫn PGS.TS Ngô Quốc Tạo Các kết đạt trình nghiêncứu hoàn toàn trung thực khách quan Tôi xin chịu trách nhiệm lời cam đoan Thái Nguyên, ngày tháng Người cam đoan Đào Minh Thắng năm 2016 iii MỤC LỤC LỜI CẢM ƠN i LỜI CAM ĐOAN ii MỞ ĐẦU Chương 1:TỔNG QUAN VỀ CHỮVIẾTTIẾNGVIỆT VÀ NHẬN DẠNG CHỮVIẾT 1.1 Khái quát ChữviếttiếngViệt 1.1.1 Tóm lược lịch sử phát triển tiếngViệt 1.1.2 Đặc điểm tiếngViệt 11 1.1.3 Khả nắm tả tiếngViệt cách có hệ thống 13 1.2 Trình bày lịch sử nhận dạng chữviếttay 16 1.3 Giới thiệu hướng tiếp cận việc nhận dạng chữviết 17 1.3.1 Nhận dạng chữ in 17 1.3.2 Nhận dạng chữviếttay 18 1.3.3 Một số Hệ thống nhận dạng chữviếttaytiếngViệt 19 Chương 2: MỘT SỐ PHƯƠNGPHÁP TÁCH CÁC NÉT CHỮVIẾTTAYTIẾNGVIỆT 23 2.1 Phươngpháp tách nét chữ sử dụng Histgram dọc 23 2.1.1 Cân histogram 24 2.1.2 Một số thuật toán phát hiệu chỉnh góc nghiêng văn 25 2.1.2.1 Thuật toán dựa vào phân tích hình chiếu (Projection Profile) 25 2.1.2.2 Các thuật toán dựa vào biến đổi Hough (Hough Transform) 28 2.2 Phươngpháp tách nét dựa cấu trúc nét chữ 34 2.2.1 Lược đồ phươngphápcắtchữdínhtiếngViệt 34 2.2.2 Làm mảnh 35 2.2.2.1 Một số khái niệm thuật toán làm mảnh 35 iv 2.2.2.2 Thuật toán làm mảnh song song 39 2.2.3 Xác định điểm nối 42 2.2.4 Tìm đường cắt ứng viên 44 2.2.5 Quyết định chọn đường cắt từ đường cắt ứng viên ………… 47 Chương 3: CÀI ĐẶT VÀ THỬ NGHIỆM 48 3.1 Giới thiệu toán 48 3.2 Phân tích lựa chọn công cụ 49 3.3 Một số kết thử nghiệm đánh giá 54 3.3.1 Phươngpháp thử nghiệm 54 3.3.2 Dữ liệu thử nghiệm 55 3.3.3 Kết đánh giá 57 KẾT LUẬN VÀ ĐỀ NGHỊ 60 TÀI LIỆU THAM KHẢO 61 v DANH MỤC HÌNH ẢNH Hình 1.1: Chữdínhviếttay 17 Hình 1.2 Các giai đoạn trình xử lý nhận dạng ảnh 19 Hình 1.3: VnDOCR ví dụ nhận dạng 20 Hình 2.1 Lược đồ xám ảnh 23 Hình 2.2: Xác định khoảng cách hai kí tự hai từ dựa histogram theo chiều dọc 24 Hình 2.3 Cấu trúc dòng văn 25 Hình 2.4 Phép chiếu ngang chiếu dọc trang tài liệu 26 Hình 2.5 Phép chiếu dọc dòng văn 27 Hình 2.6 Phép chiếu ngang dòng văn 27 Hình 2.7 Đường thẳng Hough tọa độ cực 32 Hình 2.8 Biến đổi Hough phát góc nghiêng 33 Hình 2.9: Lược đồ phươngpháp tách nét chữviếttay 35 Hình 2.10: Điểm ảnh p láng giềng 36 Hình 2.11: Các điểm biên liên kết 37 Hình 2.12: Kết ảnh sau áp dụng thuật toán Zang-Suen 42 Hình 2.13: Ảnh gốc - Ảnh xương 42 Hình 2.14: Minh họa điểm nối 43 Hình 2.15: Các trường hợp xác định điểm nối xác 43 Hình 2.16: Trường hợp mà định nghĩa điểm nối không phù hợp 43 Hình 2.17: Ví dụ điểm nối, vùng trắng 44 Hình 2.18: Lựa chọn đường cắt tốt 44 Hình 2.19: Ba đường cắt ứng viên 45 Hình 2.20: Trường hợp cắt 46 vi Hình 2.21: Tất ba đường cắt tách kí tự “o” “a” 46 Hình 2.22: Hai điểm nối (màu xám) 46 Hình 2.23: Hai đường cắt sử dụng đường gẫy tách kí tự “o” “a” 47 Hình 3.1: Sơ đồ xử lý nhận dạng chữviếttay 49 Hình 3.2: Giao diện Visual Studio 49 Hình 3.3: Generate code Visual stidio 51 Hình 3.4 : Công cụ Break Point Visual studio 52 Hình 3.5: Giao diện hệ thống cắtchữdínhviếttaytiếngViệt 52 Hình 3.6: Chọn liệu ảnh đầu vào 53 Hình 3.7: Chuyển đổi ảnh nhị phân 53 Hình 3.8: Ảnh trước sau làm mảnh 54 Hình 3.9: Các đường cắt ứng viên 54 Hình 3.10: Thử nghiệm 55 MỞ ĐẦU Nhận dạng chữ viết, đặc biệt chữviết tay, toán quan trọng, có nhiều ứng dụng thực tiễn khác tình báo, kỹ thuật robot,… Bài toán nhận dạng chữviết nhiều nhà nghiêncứu giới quan tâm giải năm gần Tuy nhiên chưa có phươngpháp hoàn chỉnh cho toán tính phức tạp biến dạng liệu đầu vào Đối với việc nhận dạng chữviếttiếng Việt, năm gần nhà khoa học nước quan tâm nghiêncứu Với toán nhận dạng chữviếttaytiếngViệt khó vấn đề nét chữtiếngViệt Trong bối cảnh chữviếttayViệt Nam, không hai kí tự có nét chữ với gây tình khó mà trọng âm gây tình phức tạp Để giải tốt toán nhận dạng chữviếttaytiếng Việt, giai đoạn quan trọng phân đoạn ký tự viếttaytiếngViệt Từ lý trên, em chọn luận văn: “Nghiên cứuphươngphápcắtchữdínhviếttaytiếng Việt” Mục tiêu đề tài: Nghiêncứu Tổng quan chữviếttiếngViệt Hệ thống nhận dạng chữviếttay để nắm kiến thức liên quan đến chữviếttiếngViệt hiểu giai đoạn Hệ thống nhận dạng chữviếttay nói chung, làm sở cho bước nghiêncứu tiếp theo; Nghiêncứu Tổng quan xử lý ảnh làm mảnh ảnh, nắm số phươngpháp làm mảnh ảnh bản; Nghiêncứu đưa phươngpháp tách nét chữviếttaytiếng Việt, sử dụng cấu trúc nét để đưa phươngpháp tách Cuối cùng, tiến hành cài đặt đưa kết thử nghiệm phươngpháp mà đưa để tách nét chữviếttaytiếngViệt Cấu trúc luận văn chia thành chương cụ thể sau: Chương TỔNG QUAN VỀ CHỮVIẾTTIẾNGVIỆT VÀ NHẬN DẠNG CHỮVIẾT Trình bày kiến thức liên quan đến tiếngViệt lịch sử tiếng Việt,… ChữviếttiếngViệt Trình bày Khái quát Hệ thống nhận dạng chữviếttay đưa số Hệ thống nhận dạng chữviếttaytiếngViệt nhà nghiêncứu xây dựng Chương MỘT SỐ PHƯƠNGPHÁP TÁCH CÁC NÉT CHỮVIẾTTAYTIẾNGVIỆT Trình bày phươngpháp làm mảnh song song đưa số phươngpháp làm mảnh Trình bày chi tiết phươngpháp tách nét ChữviếttaytiếngViệt mà đưa ra, cụ thể: sử dụng cấu trúc nét để tách ký tự viếttaytiếngViệt Chương CÀI ĐẶT VÀ THỬ NGHIỆM Xây dựng Hệ thống tách nét chữviếttaytiếngViệtphươngpháp mà đưa tiến hành thử nghiệm, đưa kết Hệ thống mà xây dựng 48 Chương CÀI ĐẶT VÀ THỬ NGHIỆM Như trình bày Chương 2, chương tập trung nghiêncứu xây dựng Hệ thống cắtchữdínhviếttaytiếngViệt dựa thuật toán mà trình bày Chương tiến hành thử nghiệm hệ thống với liệu mà tự xây dựng 3.1 Giới thiệu toán Chúng ta biết, nhận dạng chữviếttay toán khó người viết có cách viết khác nhau, làm cho toán nhân dạng chữviếttay trở nên phức tạp Đối với chữviếttiếngViệt toán trở nên khó tiếngViệt không hai kí tự có nét chữ với gây tình khó mà trọng âm gây tình phức tạp Tách nét chữtiếngViệt bước quan trọng việc nhận dạng chữviếttaytiếngViệt Độ xác Hệ thống nhận dạng chữviếttaytiếngViệt phụ thuộc chủ yếu vào bước tách nét chữtiếngViệt Hiện Việt Nam có số tác giả xây dựng Hệ thống nhận dạng chữviếttaytiếngViệt Tuy nhiên, độ xác Hệ thống nhận dạng chưa đáp ứng tất yêu cầu thực tế Do vậy, Hệ thống nhận dạng chữviếttaytiếngViệt cần phải nghiêncứu phát triển nhiều để đáp ứng yêu cầu thực tế Trong Chương 2, nghiêncứu trình bày phươngpháp tách nét chữviếttaytiếngViệt Để kiểm tra tính hiệu phươngpháp này, chương xây dựng Hệ thống cắtchữdínhviếttaytiếngViệt sử dụng phươngpháp mà trình bày Sau đó, 49 tiến hành thử nghiệm Hệ thống đưa kết đánh giá cho Hệ thống mà xây dựng Ảnh văn Tiền xử lý quét vào Tách chữ Trích chọn đặc trưng Văn nhận dạng Hậu xử lý Huấn luyện nhận dạng Hình 3.1: Sơ đồ xử lý nhận dạng chữviếttay 3.2 Phân tích lựa chọn công cụ Visual Studio (IDE – Integrated Development Environment) công cụ phát triển phần mềm Microsoft phát triển Visual Studio phần mềm sử dụng lập trình viên để xây dựng nêncác sản phẩm phần mềm Hình 3.2: Giao diện Visual Studio Phiên Visual Studio Microsoft phát hành vào năm 1997 với hai phiên Professional Enterprise Tính đến thời 50 điểm tại, Visual Studio trải qua nhiều thời kì phát triển phát hành Visual Studio Visual Studio 2005, VS 2008, VS 2010, VS 2012, VS 2013 Và phiên Visual Studio phiên Visual Studio 2015 phát hành thức vào tháng năm 2015 Với phiên phát hình có nhiều công nghệ tính mẽ tích hợp Visual Studio có điểm mạnh sau đây: - Hỗ trợ lập trình nhiều ngôn ngữ C/C++, C#, F#, Visual Basic, HTML, CSS, JavaScript Phiên bảnVisual Studio 2015 có hổ trợ ngôn ngữ Python - Visual Studio công cụ hỗ trợ việc Debug cách mạnh mẽ, dễ dàng (Break Point, xem giá trị biến trình chạy, hỗ trợ debug câu lệnh) - Giao diện Visual Studio dễ sử dụng người bắt đầu - Visual Studio hỗ trợ phát triển ứng dụng desktop MFC, Windows Form, Universal App, ứng dụng mobileWindows Phone 8/8.1, Windows 10, Android (Xamarin), iOS phát triển website Web Form, ASP.NET MVC phát triển Microsoft Office - Visual Studio hỗ trợ kéo thả để xây dựng ứng dụng cách chuyên nghiệp, giúp bạn bắt đầu tiếp cận nhanh - Visual Studio cho phép tích hợp extension từ bên Resharper (hổ trợ quản lý viết mã nhanh cho ngôn ngữ thuộc Net), hay việc cài đặt thư viện nhanh chóng thông qua Nuget - Visual Studio sử dụng đông đảo lập trình viên toàn giới 51 Những tiện ích mà Visual Studio cung cấp Hỗ trợ viết mã nguồn nhanh chóng Với việc viết mã nguồn Notepad hay Nodepad++ gặp nhiều khó khăn quên tên hàm, chức hàm làm gì, tham số hàm có gì? Trong Visual Studio có gợi ý code sau bạn gõ tên biến, tên hàm tuyệt vời Hay sử dụng phím tắt để phát sinh code: Ví gõ “cw” sau nhấn TAB TAB Visual Studio tự phát sinh code cho System.Console.WriteLine(); Hay để tạo thuộc tính class cần gõ prop TAB TAB Visual tự generate code cho chúng ta: Hình 3.3: Generate code Visual stidio Ngoài cài thêm số extension hỗ trợ quản lý viết mã tốt như: - Visual Assist: Extension hỗ trợ với ngôn ngữ C++ - ReSharper: Extension hỗ trợ ngôn ngữ thuộc Net Công cụ Debug mạnh mẽ Với IDE mà sử dụng qua cảm thấy Visual Studio công cụ hổ trợ Debug cách mạnh mẽ 52 Ngoài cách xuất thông số (giá trị biến) output hổ trợ hàm printf, cout (C/C++),Console.WriteLine, Debug.WriteLine (C#) Visual Studio debug câu lệnh để kiểm tra giá trị qua câu lệnh Đó việc sử dụng Break Point Hình 3.4 : Công cụ Break Point Visual studio Chính Chúng sử dụng ngôn ngữ Visual C# để xây dựng Hệ thống Môi trường lập trình cho Hệ thống, sử dụng Microsoft Visual Studio 2010 Giao diện chức hệ thống Giao diện hệ thống mà xây dựng có đây: Hình 3.5: Giao diện hệ thống cắtchữdínhviếttaytiếngViệt 53 Chức hệ thống - Dữ liệu InPut (LOAD IMAGE): Tải liệu đầu vào Hình 3.6: Chọn liệu ảnh đầu vào - Tiền xử lý (CONVERT TO BLACK&WHITE): Chuyên đổi ảnh từ ảnh màu sang ảnh nhị phân Hình 3.7: Chuyển đổi ảnh nhị phân - Làm mảnh (THINING): Làm mảnh ảnh liệu đầu vào 54 Hình 3.8: Ảnh trước sau làm mảnh - Histogram theo chiều dọc đường cắt histogram (VERTICAL HISTORAM CUT HISTOGRAM) - Cắt ảnh làm mảnh (CUT THIN): Tìm đường cắt ứng viên để tách nét chữdính Hình 3.9: Các đường cắt ứng viên 3.3 Một số kết thử nghiệm đánh giá 3.3.1 Phươngpháp thử nghiệm Để thử nghiệm Hệ thống mà xây dựng lựa chọn phươngpháp thử nghiệm sau: Chúng tiến hành lấy nét chữtiếngViệtviếttay nhiều người, sau thực scan để tạo ảnh làm đầu vào cho Hệ thống Lựa chọn ảnh InPut có định dạng bmp 256 55 bit Tiếp đến, đưa ảnh vào Hệ thống để hệ thống xác định nét cắt trực tiếp ảnh Hình 3.10: Thử nghiệm 3.3.2 Dữ liệu thử nghiệm Để tiến hành theo phươngpháp thử nghiệm trên, xây dựng liệu thử nghiệm cho Hệ thống, liệu trình bày bảng Bảng 3.1: Dữ liệu thử nghiệm cho Hệ thống TT Tên ảnh Test1.bmp Test2.bmp Ảnh 56 TT Tên ảnh Test3.bmp Test4.bmp Test5.bmp Test6.bmp Test7.bmp Ảnh 57 TT Tên ảnh Test8.bmp Ảnh 3.3.3 Kết đánh giá Sau tiến hành theo phươngpháp thử nghiệm với liệu thử nghiệm thu thập được, kết thu sau: Bảng 3.2: Kết xác định đường cắt để tách nét chữ ký tự tiếngViệt TT Ảnh Test1.jpg Test2.jpg Test3.jpg Kết 58 TT Ảnh Test4.jpg Test5.jpg Test6.jpg Test7.jpg Test8.jpg Kết Từ bảng kết trên, học viên rút nhận xét sau: - Hệ thống chạy ổn định có thời gian chạy chấp nhận được; 59 - Giao diện hệ thống dễ sử dụng; - Hệ thống tách thành công kí tự - Có thể thấy rằng, nhiều trường hợp yêu cầu đường cắt khác với đường cắt dọc đường cắt cong theo hướng dọc Ưu điểm lớn Hệ thống giải trường hợp sử dụng đường cắt sử dụng đường gẫy từ điểm nối Hạn chế - Đôi lúc, Hệ thống cho kết sai điểm nối lộn xộn điểm nối kí tự phần kí tự ảnh chứa nhiều kí tự tiếngViệtviếtdính liền - Chương trình thực cắtchữdính dòng 60 KẾT LUẬN VÀ ĐỀ NGHỊ - Mục tiêu luận văn đưa ra: + Tìm hiểu nhận dạng chữviết + Tìm hiểu phươngpháp làm mảnh ảnh + Nghiêncứuphươngpháp tách nét chữviết + Thiết kế chương trình tách nét chữdínhviếttay - Kết đạt được: Sau trình tìm hiểu, nghiêncứu em hoàn thành luận văn với kết đạt mục tiêu đề ra: + Hiểu cách nhận dạng chữviết + Hiểu phươngpháp tách nét chữviết + Hiểu phươngpháp làm mảnh ảnh + Thiết kế chương trình cắtchữdínhviếttay dựa nghiêncứuphươngpháp làm mảnh ảnh phươngpháp tách nét chữdínhviếttay - Hướng phát triển đề tài: + Tiếp tục nghiêncứu để hoàn thành phần mềm cắtchữdính cho đoạn văn viếttay làm sở cho việc nhận dạng đoạn văn viếttaytiếngViệt 61 TÀI LIỆU THAM KHẢO TiếngViệt [1] Đỗ Năng Toàn Phạm Việt Bình, Đại học Thái Nguyên, “Giáo trình xử lý ảnh số” Nxb Khoa học kỹ thuật, Hà Nội, 2008 [2] Hoàng Phê (1998), Từ điển tiếng Việt, NXB Đà Nẵng Trung tâm Từ điển học, in lần thứ sáu, Hà Nội – Đà Nẵng [3] Nguyễn Thiện Giáp (2005), Lịch sử Việt ngữ học (tập 1), NXB Giáo dục [4] Trung tâm KHXH&NV Quốc gia (2002), Ngữ pháptiếng Việt, NXB Khoa học Xã hội Tiếng Anh [5] Anh D Phan, Tao Q Ngo, Hung V Pham (Referee Tran Nguyen Ngoc, PhD) (2012), Vietnamese Handwritten characters segmentation using structure of strokes, Tạp chí Khoa học Kỹ thuật – Học viện KTQS [6] Chen Yi-Kai, Wang Jhing-Fa (2000), Segmentation of single-or multiple-touching handwritten numeral string using background and foreground analysis, IEEE Trans Pattern Anal Mach Intell, Vol 22: Issue 11 p1304-1317 [7] Dipak V Koshti, Sharvari Govolkar (2012), Segmentaion of Touching Characters in Handwritten Devanagari Script In UACEE International Journal of Computer Science and its Applications, Vol 2: Issue [ISSN 22503765], pp 83-87 [8] Eric L'Homer, Extraction of strokes in handwritten characters,on Pattern Recognition 33 (2000)1147}1160 [9] M Blumenstein, X Y Liu, B Verma (2004), A modified direction feature for curvise character recognition, International Joint Conference on Neural Networks (IJCNN’04), Budapest, Hungary, pp 2983-2987 62 [10] Nafiz Arica and Fatos T YarmanVural (2001), An Overview of Character Recognition Focused on Off-Line Handwriting, in IEEE Transactions on Systems, Man, And Cybernetics-Part C: Applications And Reviews, Vol 31, No [11] Sobhana Mari S, G Raju, A modified Thinning Algorithm for Handwritten Tamil Characters, International Journal of Engineering and Technical Research (IJETR) ISSN: 2321-0869, Volume-3, Issue-2, February 2015 [...]... MỘT SỐ PHƯƠNGPHÁP TÁCH CÁC NÉT CHỮVIẾTTAYTIẾNGVIỆT Trong chương này, chúng tôi sẽ tập trung vào nghiêncứu và trình bày một phươngpháp tách các nét chữviếttaytiếngViệt Trong phươngpháp này, chúng tôi sử dụng các đường cắt gẫy, nghĩa là đường cắt gồm có được cắt dọc và cắt ngang Các kiến thức dưới đây được tham khảo từ: [5], [6], [7], [8], [9], [10], [11] 2.1 Phươngpháp tách nét chữ sử dụng...3 Chương 1 TỔNG QUAN VỀ CHỮVIẾTTIẾNGVIỆT VÀ NHẬN DẠNG CHỮVIẾT Trong chương này, chúng tôi sẽ tập trung nghiên cứu và trình bày những kiến thức cơ bản liên quan đến tiếngViệt như lịch sử phát triển của tiếng Việt, đặc điểm của tiếngViệt và chữviếttiếngViệt Đồng thời, chúng tôi cũng sẽ nghiên cứu và trình bày Khái quát về Hệ thống nhận dạng chữviếttiếngViệt Các kiến thức dưới đây được... thống nhận dạng chữviếttaytiếngViệt hiện có Như vậy, tiếngViệt là ngôn ngữ của người Việt và là quốc ngữ của Việt Nam Trong lịch sử đã có ba loại văn tự được dùng để ghi chép tiếngViệt là chữ Hán, chữ Nôm và chữ quốc ngữ Chữ Hán và chữ Nôm là văn tự 22 ngữ tố, mỗi chữ biểu thị một âm tiết của tiếngViệtChữ quốc ngữ là văn tự toàn âm tố, lấy âm tố làm đơn vị Với phạm vi nghiên cứu của báo cáo... dạng chữviếttay được tách ra hai hướng phát triển: nhận dạng chữviếttay trực tuyến (online) và chữviếttay ngoại tuyến (offline) Trong đó nhận dạng chữviếttay trực tuyến là khi viết lên màn hình thì máy tính sẽ chuyển những hình ảnh viếttay thành dạng text Khác với chữ offline, chữ online có thêm thông tin về thứ tự các điểm, các nét được viết Hiện nay việc nhận dạng chữviếttaytiếng Anh... cầm tay thậm chí là máy để bàn và điện thoại di động Nhưng đối với tiếngViệt thì chưa có một phần mềm nào tương tự Còn trong nhận dạng chữviếttay offline chúng ta nghiên cứu về nhận dạng chữviếttay tự nhiên và nhận dạng chữviếttay hạn chế Nhận dạng chữviếttay tự nhiên là dùng để xử lý các văn bản viếttay thông thường, công việc này cực kỳ khó khăn nếu không nói là không thể Nhận dạng chữ viết. .. tiên, chúng tôi nghiêncứu và trình bày những giai đoạn lịch sử phát triển của tiếngViệt để nắm những kiến thức cơ bản về tiếngViệt Sau đó, chúng tôi nghiêncứu và trình bày những đặc điểm của tiếng Việt, có ba đặc điểm: ngữ âm, từ vựng và ngữ pháp, cùng với trình bày chữviếttiếngViệt Ngoài ra, chúng tôi cũng tập trung nghiêncứu một cách khái quát về Hệ thống nhận dạng chữviếttay và trình bày... sẽ đơn giản 19 hơn Các chữ trong phiếu điều tra thường là các chữviếttay hạn chế: viết rõ ràng, rời nhau, hoặc không dính liền nhau nhiều, thậm chí là viết hoa Hiện nay, phần mềm MarkRead cũng đã có tích hợp đặc trưng nhận dạng chữviếttay hạn chế, nhưng kết quả mới chỉ dừng lại ở phòng thí nghiệm Nhận dạng chữviếttay vẫn còn là vấn đề thách thức lớn đối với các nhà nghiêncứu Bài toán này chưa... sự lãnh đạo của Đảng Cộng sản Việt Nam Đó cũng là sự phát triển đã diễn ra với một lợi khí mới về chữ viết: "chữ quốc ngữ" Chữ quốc ngữ là một thứ chữ được xây dựng theo nguyên tắc ghi âm, bằng chữ cái Latin Loại chữ này đã được dùng phổ biến từ rất lâu, ở châu Âu Đến thế kỉ 17, một số giáo sĩ phươngTây đem nguyên tắc ấy dùng vào việc 7 ghi âm tiếng Việt, tạo ra một thứ chữ thuận lợi hơn đối với mục... dạng chữ in theo 192 ngôn ngữ khác nhau, phần mềm nhận dạng chữViệt in VnDOCR 4.0 của Viện Công Nghệ Thông tin Hà Nội có thể nhận dạng được các tài liệu chứa hình ảnh, bảng và văn bản với độ chính xác trên 98%) 1.3.2 Nhận dạng chữviếttay Với những mức độ ràng buộc khác nhau về cách viết, kiểu chữ, … phục vụ cho các ứng dụng đọc và xử lý các chứng từ, hóa đơn, phiếu ghi, văn bản viết tay, … Nhận dạng chữ. .. nhân dân Việt Nam TiếngViệt ở giai đoạn dùng "chữ quốc ngữ" Từ đầu thế kỉ 20 về sau, tiếngViệt dần dần được dùng trong mọi thể loại văn học, mọi địa hạt văn hoá, khoa học, kĩ thuật Nó phát triển thành ngôn ngữ văn học toàn diện Đây là giai đoạn hiện đại của tiếngViệt Ở giai đoạn này, sự phát triển của tiếngViệt diễn ra mạnh và nhanh, cùng một đà với quá trình biến đổi sâu sắc của xã hội Việt Nam ... viết tay tiếng Việt, giai đoạn quan trọng phân đoạn ký tự viết tay tiếng Việt Từ lý trên, em chọn luận văn: Nghiên cứu phương pháp cắt chữ dính viết tay tiếng Việt Mục tiêu đề tài: Nghiên cứu Tổng... liên quan đến tiếng Việt lịch sử tiếng Việt, … Chữ viết tiếng Việt Trình bày Khái quát Hệ thống nhận dạng chữ viết tay đưa số Hệ thống nhận dạng chữ viết tay tiếng Việt nhà nghiên cứu xây dựng... MỘT SỐ PHƯƠNG PHÁP TÁCH CÁC NÉT CHỮ VIẾT TAY TIẾNG VIỆT Trình bày phương pháp làm mảnh song song đưa số phương pháp làm mảnh Trình bày chi tiết phương pháp tách nét Chữ viết tay tiếng Việt mà