Bài tiểu luận môn nghiên cứu khoa học đề tài ứng dụng kỹ thuật nhận dạng ký tự bằng giải thuật SVM vào xây dựng ứng dụng nhập điểm tự động cho trường Đại học An Giang.
Trang 2Đầu tiên, em xin gửi lời cảm ơn sâu sắc đến thầy giáo Tiến sĩ Nguyễn Văn Y người đã truyền đạt kiến thức cho em về môn nghiên cứu phương pháp luận khoa học tại Học Viện Bưu Chính Viễn Thông Qua 2 tháng em đã tiếp thu được rất nhiều điểu bổ ích
về cách làm một bài luận khoa học, từ đó đúc kết được nhiều kinh nghiệm để thực hiện bài tiểu luận nghiên cứu khoa học với đề tài “Ứng dụng kỹ thuật nhận dạng bằng SVM vào xây dựng phần mềm nhập điểm tự động tại trường Đại học An Giang”
Em cũng xin bày tỏ lời cảm ơn đến tập thể lớp cao học hệ thống thông tin M13CQIS01-N, những người bạn đã cùng đồng hành trong suốt quá trình học tập môn nghiên cứu phương pháp luận khoa học, đã lắng nghe, đóng góp và chia sẽ kinh nghiệm đã giúp em hoàn thành tốt hơn bài tiểu luận của mình
Em xin chân thành cảm ơn
Tp Hồ Chí Minh, ngày 18 tháng 01 năm 2014
Học viên Nguyễn Tấn An
Trang 3MỤC LỤC
MỞ ĐẦU 2
1 Lý do chọn đề tài 2
2 Mục tiêu của đề tài 3
3 Câu hỏi nghiên cứu 3
4 Phạm vi nghiên cứu 3
5 Giải pháp hiện có 3
6 Đối tượng và khách thể nghiên cứu 3
7 Giả thuyết khoa học 3
8 Phương pháp chứng mình giả thuyết 4
Chương 1: CƠ SỞ LÝ LUẬN 5
1.1 Tổng quan vấn đề nghiên cứu 5
1.2 Các khái niệm liên quan đến đề tài 7
1.3 Hương tiếp cận của đề tài 13
1.4 Các yếu tố ảnh hưởng đến đề tài 14
Kết luận chương 1 15
Chương 2: CƠ SỞ THỰC TIỄN 16
2.1 Giới thiệu 16
2.2 Khảo sát hiện trạng hệ thống 16
2.3 Kinh nghiệm một số nơi 18
Kết luận chương 2 19
Chương 3: GIẢI PHÁP – MÔ HÌNH – SẢN PHẨM 20
3.1 Mô tả dữ liệu đầu vào và đầu ra 20
3.2 Mô tả sơ lược về phiếu điểm 20
3.3 Giải pháp và các mô hình các quá trình xử lý 22
Kết luận chương 3 28
KẾT LUẬN 29
KHUYẾN NGHỊ 29
TÀI LIỆU THAM KHẢO 30
Trang 4
MỞ ĐẦU
1 Lý do chọn đề tài
Trường Đại học An Giang là một trong những trường đại học lớn ở đồng bằng sông Cửu Long, với tổng số sinh viên lên đến 10000 sinh viên, việc quản lý thông tin sinh viên và kết quả học tập của sinh viên ở trường đã được tin học hóa thông qua website regis.agu.edu.vn, ở website này sinh viên sẽ biết được các thông tin về đăng
ký học phần, thời khóa biểu, lịch thi, kết quả học tập của mình Để cung cấp kết quả học tập của một số lượng lớn sinh viên như vậy, cứ mỗi kỳ thi cán bộ nhập điểm phải nhập điểm vào hệ thống cơ sở dữ liệu điểm để đưa lên website, công việc này mất rất nhiều thời gian và công sức của người nhập liệu, đồng thời nếu thời gian thông báo chậm trễ sẽ làm ảnh hưởng xấu cho sinh viên trong khâu chuẩn bị cải thiện kết quả học tập của mình
Mặt khác, hiện nay khi các lĩnh vực khai thác dữ liệu ngày càng phát triển, trong
đó lĩnh vực nhận dạng ký tự cũng là một trong những đề tài đã được các nhà nghiên cứu quan tâm rất nhiều Bài toán này có 2 dạng, một dạng là bài toán nhận dạng ký tự
in và dạng còn lại là bài toán nhận dạng ký tự viết tay, về nhận dạng ký tự in do ký tự
in có kiểu chữ, kích thước, khoảng cách viết đều có qui định cụ thể nên bài toán này gần như đã được giải quyết trọn vẹn, tuy nhiên với bài toán nhận dạng ký tự viết tay vẫn còn là một thách thức lớn, vì nó phụ thuộc nhiều vào người viết và sự biến đổi quá
đa dạng trong cách viết của mỗi người,… Nếu đặt bài toán này trong một phạm vi hẹp lại, cụ thể hạn chế lại số mẫu chữ viết, và lập yêu cầu cụ thể cách viết rõ ràng hơn thì bài toán này sẽ cho kết quả khả quan hơn Các phương pháp tiếp cận giải quyết bài toán nhận dạng ký tự viết tay khá phong phú, một số phương pháp thường được áp dụng như: mô hình Markov ẩn, cây quyết định, mạng nơ-ron nhân tạo, phương pháp máy học vec-tơ hỗ trợ (SVM), giải thuật Knn, … Trong đó giải thuật SVM là một giải thuật tiên tiến hiện nay, có độ chính xác cao và giải thuật này đã được các nhà nghiên cứu khai khoáng dữ liệu thiết kế và cài đặt một cách hoàn chỉnh vì vậy có thể
sử dụng để xây dựng một ứng dụng riêng khá dễ dàng và đạt hiểu quả cao Từ những bước phát triển trên, nếu ứng dụng bài toán nhận dạng ký tự bằng giải thuật SVM này vào giải quyết vấn đề nhập điểm của trường Đại học An Giang sẽ là một giải pháp hữu hiệu nhằm giảm tải công sức nhập liệu của cán bộ đồng thời nó sẽ giúp nâng cáo chất lượng học tập của sinh viên tại trường và là một trong những ứng dụng công nghệ
Trang 5thông tin vào trường học Vì vậy tôi xây dựng đề tài “Ứng dụng kỹ thuật nhận dạng ký
tự bằng SVM vào xây dựng phần mềm nhập điểm tự động tại trường Đại học An Giang” đi đến xây dựng một chương trình nhập điểm tự động cho trường
2 Mục tiêu của đề tài
Nghiên cứu các cơ sở lý thuyết, giải thuật SVM và các thuật toán xử lý ảnh
Xây dựng mô hình nhận dạng ký tự bằng giải thuật SVM
Đưa ra mô hình làm việc với phiếu điểm tại trường Đại học An Giang
Tích hợp mô hình nhận dạng ký tự vào quy trình nhập điểm tự động tại trường Đại
học An Giang
3 Câu hỏi nghiên cứu
SVM là gì? Sử dụng giải thuật SVM vào bài toán nhận dạng như thế nào? Ưu khuyết điểm của SVM so với các giải thuật nhận dạng khác?
Ứng dụng bài toán nhận dạng ký tự bằng SVM vào phần mềm nhập điểm tự động
như thế nào?
4 Phạm vi nghiên cứu
Ứng dụng nhận dạng ký tự bằng giải thuật SVM vào xây dựng phần mềm nhập điểm
tự động cho trường Đại học An Giang
5 Giải pháp hiện có
Thực hiện thủ công:
Ưu điểm: Tỷ lệ chính xác tương đối cao, trải qua nhiều khâu xác nhận từ sinh
viên đến giảng viên đến người nhập điểm nên hạn chế nhiều sai sót về điểm xảy ra
Nhược điểm: mất nhiều thời gian nhập điểm và vẫn còn sai sót diễn ra, chưa phù hợp với sự phát triển của trường Đại học lớn
6 Đối tượng và khách thể nghiên cứu
Nghiên cứu cấu trúc phiếu điểm của trường Đại học An Giang
Nghiên cứu phép toán tiền xử lý ảnh phục vụ bài toán nhận dạng ký tự
Nghiên cứu giải thuật SVM nhận dạng ký tự số viết tay và ký tự in thông qua phiếu
điểm của trường Đại học An Giang
7 Giả thuyết khoa học
Đề tài phân tích được mô hình nhận dạng ký tự bằng giải thuật SVM cho phiếu điểm của trường Đại học An Giang
Trang 6 Xây dựng được một công cụ nhập điểm tự động cho trường Đại học An Giang mang lại hiệu quả cao về hiệu suất làm việc cũng như tiết kiệm được rất nhiều thời gian so với cách nhập điểm bằng tay thông thông
Nghiên cứu phân tích được bộ nhận dạng chữ viết tay cho nhập điểm sẽ là tiền đề
áp dụng cho nhiều ứng dụng khác
8 Phương pháp chứng mình giả thuyết
Nghiên cứu lý thuyết về thuật toán SVM nhận dạng ký tự viết tay
Sử dụng mã nguồn mở thư viện SVM để xây dựng ứng dụng nhập điểm tự động cho trường Đại học An Giang
Nghiên cứu so sánh các giải thuật trong lĩnh vực nhận dạng chữ viết tay từ đó rút ra điểm mạnh yếu làm tiền để khoa học cho đề tài
Thực nghiệm ứng dụng nhập điểm thông qua phiếu điểm tự động bằng ứng dụng
thực tế tại trường Đại học An Giang
Trang 7Chương 1: CƠ SỞ LÝ LUẬN
1.1 Tổng quan vấn đề nghiên cứu
Tổng quan
Trên thế giới hiện nay có nhiều chương trình nhận dạng chữ viết (chữ in và chữ viết tay) bằng các thứ tiếng Anh, Nga, v.v… như các hệ OMNIPAGE, READ-WRITE, WORD-SCAN, … Ở Việt Nam cũng có một số hệ như WORC của công ty 3C, VIET-
IN của công ty SEATIC, VNDOCR của Viện Công Nghệ Thông Tin, Image Scon của Trung Tâm Tự Động Hóa Thiết Kế, hệ WINGIS của công ty DolfSoft…
Nhìn chung, các sản phẩm phần mềm nhận dạng văn bản tiếng Việt chữ in của nước ta
đã thu được các kết quả khả quan, đặc biệt phần mềm VNDOCR đã được sử dụng rộng rãi trong các cơ quan nhà nước Tuy nhiên về các ứng dụng nhận dạng chữ viết tay thì còn rất hạn chế vì chưa đạt được độ chính xác cao cần thiết để có thể áp dụng rộng rãi trên thực tế, hiện nay bài toán này thường chủ yếu phục vụ yêu cầu đọc và xử
lý trên các biểu mẫu do các chữ viết tay được nằm riêng biệt và rõ ràng, ví dụ như: hóa đơn, phiếu điều tra, … Nhập điểm tự động cũng là một dạng bài toán nhận dạng ký
tự viết tay rời rạc trích xuất từ biểu mẫu cố định
Có rất nhiều phương pháp sử dụng cho bài toán nhận dạng ký tự đã được nghiên cứu
từ trước đến nay và đạt kết quả khá khả quan Dưới đây là một số kết quả của một số phương pháp của các nhà nghiên cứu trước trên cùng một bộ dữ liệu chữ viết tay MNIST:
Bảng 1-1: Bảng so sánh độ chính xác các giải thuật nhận dạng chữ viết tay [4]
1 1-layer Neural nets (LeCun et al., 1998) 88.00
2 Nearest-neighbor (Euclidean L2) nets (LeCun et al.,
1998)
95.00
3 Convolution net LeNet-1 (LeCun et al., 1998) 98.30
4 Convolution net LeNet-4* (LeCun et al., 1998) 98.90
5 Convolution net LeNet-5* (LeCun et al., 1998) 99.15
Trang 86 Convulution Neural Net (CNN)* (Simard el al.,03) 99.10
Kết quả nhận dạng với phương pháp SVM đã mức độ trung bình từ 96.65% đến 98.37% và đặc biệt với giải thuật SVM này không cần bất kỳ xử lý nào đặc biệt khi huấn luyện và thời gian huấn luyện nhanh hơn chỉ mất 30 phút (nhanh hơn 50 lần so với mạng tích chập CNN của (Simard el al.,03), (O’Neill, 2006) và giải thuật AdaBootst.M1(Freund & Schapire, 1995), (Witten & Frank, 2005) cần thời gian huấn luyện gần 1 ngày để đạt độ chính xác như trong bảng) cho độ chính xác tương đương (thấp hơn 0.5%)
Tình hình trong nước
Ở Việt Nam, ở một số trường Đại học như Đại học Hồng Bàng, Đại học Mở, Đại học
Kỹ thuật Công Nghệ Hồ Chí Minh cũng đã có các công trình nghiên cứu về ứng dụng nhập điểm tự động tuy nhiên các công trình nãy vẫn chưa thể đưa vào triển khai thực
tế vì vẫn còn sai sót nhiều trong quá trình nhận dạng
Tình hình ngoài nước
Nói chung về bài toán nhận dạng ký tự viết tay có thể kể đến như: hệ thống nhận dạng chữ viết tay trong lĩnh vực kiểm tra tài khoản ở ngân hàng của nhóm nghiên cứu Simon và O.Baret (Laoria/CNRS & ENPC, Paris)[]; hệ thống chuyên nhận dạng các địa chỉ như ở bưu điện của J.J.Hull, T.K.Ho, J.Favata, V.Govindaraju và S.N.Srihari ở trường Đại học NewYord[]; phần mềm đọc phiếu xuất nhập cảnh của Singapore:
Trang 9Hình 1-1: Phiếu xuất nhập cảnh Singapore đọc được bằng máy
1.2 Các khái niệm liên quan đến đề tài
Giới thiệu SVM
SVM được nghiên cứu từ những năm của thập niên 1960 với công trình của Vapnik và Lerner (1963), Vapnik và Chervonenkis (1964) Cơ sở của SVM dựa trên nền tảng của lý thuyết học thống kê và lý thuyết chiều Vapnik Chervonenkis đã được phát triển qua 3 thập kỷ bởi Vapnik và Chervonenkis Lý thuyết này bắt đầu có những bước phát triển mạnh mẽ về mặt ứng dụng kể từ những năm cuối của thập niên 1990 (Burges, 1996; Osuma, 1997; Platt, 1998) và từ đó đến nay nó đã trở thành một công
cụ khá mạnh trong nhiều lĩnh vực như: nhận dạng chữ viết, nhận dạng mặt người, …
Trong những năm gần đây, SVM được biết đến như một hướng tiếp cận phân lớp hiệu quả và đang được áp dụng rộng rãi trong nhiều ứng dụng thực tế Ưu điểm của SVM là khả năng phân lớp với độ chính xác cao, điều này được bảo đảm bởi các tính chất của siêu phẩm tối ưu và cách sử dụng hàm nhân Tuy nhiên, tốc độ phân lớp của SVM bị đánh giá chậm hơn so với các phương pháp phân lớp khác Trong quá trình phân lớp, SVM phải duyệt qua tất cả các véc tơ tựa để so sánh với mẫu cần nhận dạng, khi số véc tơ tựa tăng thì tốc độ phân lớp cũng giảm xuống tương ứng
Các thuật toán huấn luyện SVM được thực hiện theo ý tưởng sau: tìm siêu phẳng tối ưu trong không gian đặc trưng để cực đại khoảng cách giữa 2 lớp mẫu huấn luyện trong bài toán phân lớp nhị phân Như vậy, việc huấn luyện SVM tương đương
Trang 10với việc giải bài toán tối ưu với số lượng các biến là và số các tham số là , trong đó
là số lượng mẫu huấn luyện
Hình 1-2: Phân lớp SVM.[1]
Điều này dẫn đến bài toán trở nên phức tạp hơn trong cả hai mặt: không gian nhớ để lưu trữ và độ phức tạp để tính toán Hơn nữa, siêu phẳng tối ưu lại nằm trong không gian đặc trưng với số chiều cao hơn dựa trên cơ sở lựa chọn hàm nhân Mà việc lựa chọn hàm nhân phù hợp cho từng ứng dụng cụ thể buộc người sử dụng SVM phải thực hiện nhiều lần huấn luyện với các loại hàm nhân khác nhau tương ứng với các giá trị tham số khác nhau của chúng Mặt khác, mục đích của việc huấn luyện SVM là lọc ra các mẫu huấn luyện có tham gia vào việc tạo siêu phẳng đồng thời loại bỏ các mẫu không liên quan, các mẫu có tham gia tạo ra siêu phẩm được gọi là véc tơ tựa (SV – Support Vector) Có nhiều thuật toán huấn luyện SVM, các thuật toán chặt khúc và thuật toán phân rã đã phân tích bài toán quy hoạch toàn phương (QP – Quadratic Programing) ban đần thành một dãy các bài toán QP nhỏ hơn Các bài toán này đã chứng tỏ rằng có thể giải các bài toán có kích thước vượt quá khả năng lưu trữ của bộ nhớ máy tính Thuật toán SMO có thể xem là trường hợp cá biệt của thuật toán phân
rã, trong mỗi lần lặp SMO giải một bài toán QP với kích thước là hai bằng giải pháp phân tích, vì vậy không cần phải giải bài toán tối ưu Các thuật toán này đã được cài đặt trong hầu hết các phần mềm SVM mã nguồn mở hiện nay như SVMLight, LIBSVM, SVMTorch và HeroSvm
Phương pháp trích trọn đặc trưng WaveletHaar
Trang 11Phương pháp trích chọn đặc trưng Wavelet Haar là một dãy các kỹ thuật khai triển cho phép mô tả đặc trưng của ảnh ở các mức độ khác nhau
Hình 1-3: Trích chọn đặc trưng waveletHaar.[3]
Từ ảnh nhị phân kích thước (hình) quá trình trích chọn đặc trưng được
mô tả theo thuật toán sau:
Procedure waveletHaarFeature
Đầu vào: Ma trận vuông (A,n) cấp
Đầu ra: Tập các đặc trưng * +
Phương thức Khởi tạo: Queue = ; i = 1; Tính Tổng các điểm đen trong toàn bộ ma trận (A,n); PUSH((A,n),Queue); while Queue Do { - POP(Queue,(A,n)); - if(n > 1) { N = n div 2; Chia ảnh thành 4 phần: ;(Hình 3-1) for(j = 1; j 4; j++) PUSH(( ,n),Queue); } - Gọi S, S1, S2, S3, S4 là tổng các điểm đen tương ứng với các khối A, ;
- Tính
- i i+ 3;
Trang 12}
Như vậy với việc chọn kích thước chuẩn hóa cho ảnh ký tự là 16x16 thì phương pháp wavelet Haar sẽ trích chọn ra : 1+ 3+ 4x3 + 4x4x3 + 4x4x4x3 = 256 đặc trưng Phương pháp trích chọn đặc trưng này sẽ tạo ra một dãy số các đặc trưng giảm dần Với cùng một chữ thì các giá trị lớn ở đầu dãy tương đối ổn định, có thể đại diện cho hình dạng khái quát của chữ, còn các giá trị cuối dãy nhỏ dần và không ổn định,
thể hiện sự đa dạng trong từng chi tiết nhỏ của chữ
Một số khái niệm về xử lý ảnh
Khái niệm về ảnh số:
Ảnh số là hình ảnh được lưu trong các thiết bị số như máy ảnh kỹ thuật số, máy tính hoặc các thiết bị số khác Ảnh số là một mảng hai chiều gồm các điểm ảnh (pixel), mỗi điểm ảnh được xác định bởi tọa độ (x,y) và được biểu diễn bởi n bytes dưới các hệ màu khác nhau, theo hệ màu thường có 3 loại ảnh chính:
- Ảnh màu (color image): mỗi điểm ảnh có giá trị gồm 3 màu đỏ (red) cộng xanh lục (green) cộng xanh dương (blue) Mỗi màu có giá trị từ 0 đến 255, nghĩa là mỗi điểm ảnh cần 24bits hay 3bytes để biểu diễn
- Ảnh xám (gray image): giá trị mỗi điểm ảnh nằm trong giải giá trị từ 0 đến 255, nghĩa là cần 8 bits hay 1 byte để biểu diễn mỗi điểm ảnh này
Ảnh nhị phân (binary image): giá trị mỗi điểm ảnh là 0 hoặc 1, nghĩa là trắng hoặc đen Khi xử lý trên máy tính thì người ta dùng ảnh xám để biểu diễn ảnh nhị phân
và lúc này 2 giá trị là 0 hoặc 255, giá trị 0 biểu diễn cho màu đen và giá trị 255 biểu diễn cho màu trắng
Hình 1-4: Ảnh nhị phân; (A) ảnh đầu vào, (B) ảnh nhị phân
Nhị phân hóa ảnh:
Trang 13Nhị phân hóa ảnh là quá trình được thực hiện nhờ vào hàm phân ngưỡng:
Dest(x, y) = 1 if Source(x, y) >= T
0 if Source(x, y) < T
Trong đó, Source(x,y) là giá trị điểm ảnh ở vị trí (x,y) của ảnh nguồn, Dest(x,y) là giá trị điểm ảnh tương ứng ở vị trí (x,y) của ảnh đích T là giá trị ngưỡng Tuy nhiên, giá trị cụ thể của ngưỡng lại phụ thuộc vào từng ảnh, vùng ảnh đầu vào đang xét, không thể lấy cố định
Phép toán hình thái (Morphology)
Phép toán hình thái là những thao tác toán học rời rạc trên tập hợp điểm đó được
sử dụng để làm rõ những nét đặc trưng riêng của hình dạng đối tượng, do vậy có thể tính toán hay nhận biết được chúng một cách dễ dàng Phần lớn các phép toán hình thái học được định nghĩa từ hai phép toán cơ bản là phép co nhị phân (Erosion) và phép toán giãn nhị phân (Dilation)
- Phép giãn nhị phân (Dilation)
Phép giãn nhị phân của một tập hợp A bởi một phần tử cấu trúc B được ký hiệu
là và được định nghĩa qua công thức sau:
* ( ̂) + Phép giãn nhị phân của tập hợp A bởi phần tử cấu trúc B là tập hợp của tất cả các điểm z (z là tâm điểm của phần tử cấu trúc B trên tập hợp A) sao cho phản xạ của giao với tập A tại ít nhất một điểm Hay nói cách khác, phép giãn nhị phân là sự chồng chéo ít nhất một phần tử từ phản xạ của phần tử cấu trúc B với tập hợp A Đồng thời các phần tử này phải là tập con của tập hợp A
Dilation phục vụ nhiều mục đích khác nhau như mở rộng (phình to) các thành liên thông trong ảnh như việc nối kết các vết đứt trong kí tự lại với nhau, lọc biên ,…
- Phép co nhị phân (Erotion)
Phép co nhị phân của tập hợp A bởi phần tử cấu trúc B được kí hiệu và viết dưới dạng công thức như sau:
* ( ) +
Trang 14Với * + Như vậy phép co nhị phân của tập hợp A bởi phần tử cấu trúc B là tập hợp các điểm z (z là tâm điểm của phần tử cấu trúc B trên tập hợp A) sao cho là tập con của
A
Việc thao tác Erosion ảnh phục vụ nhiều mục đích khác nhau như bào mòn (thu nhỏ) thành phần liên thông, lọc biên, có thể khữ nhiễu
Khung sương của ảnh(Skeletonization)
Khung xương của đối tượng ảnh là tập hợp các điểm ảnh cách đều biên của đối tượng, trong luận văn này skeletonization được dùng để biến các ảnh ký tự số đầu vào thành những ảnh nét đơn (có độ dày 1 hay 2 điểm ảnh) chính vì vậy khi các ký tự được viết dưới các nét dày hay mỏng khác nhau thì qua phương pháp này đều chuyển về một chuẩn nhất định, điều này giúp tăng độ chính xác cho việc nhận dạng
Lược đồ chiếu dọc và lược đồ chiếu ngang
Lược đồ chiếu dọc (Vertical Histogram) và lược đồ chiếu ngang (Horizotal Histogram) hai loại lược đồ này xây dựng cho đối tượng là ảnh nhị phân nhằm thống
kê các điểm ảnh theo chiều dọc hay chiều ngang Hai lược đồ này ứng dụng chủ yếu trong phần tách các thành phần bảng điểm trong phần xây dựng ứng dụng sau của luận văn này
Lấy lược đồ chiếu ngang bằng cách duyệt từ trên xuống dưới và từ trái qua phải của ảnh, qua mỗi dòng pixel ta sẽ tiến hành cộng dồn số pixel đen trên từng dòng Số pixel đen trên từng dòng sẽ được biểu diễn thành một đồ thị với trục nằm dọc là chiều cao của ảnh còn trục nằm ngang là số pixel đen đếm được trên dòng Thông qua lược
đồ này ta có thể nhận thấy được sự phân cách giữa các khối văn bản giữa các dòng với nhau
Hình 1-5: Lược đồ chiếu ngang
Trang 15Lấy lược đồ chiếu dọc bằng cách duyệt chúng theo chiều dọc, ứng với mỗi cột ta
sẽ cộng dồn số pixel đen Trên lược đồ trục Oy sẽ là số pixel đen trên một mỗi cột và trục Ox là chiều rộng của ảnh Thông qua lược đồ này ta có thể nhận thấy được sự phân cách giữa các khối văn bản giữa các dòng với nhau
Hình 1-6: Lược đồ chiếu dọc
1.3 Hướng tiếp cận của đề tài
Tiếp cận đề tài từ mô hình chung ứng dụng SVM vào bài toán nhận dạng chữ viết tay rời rạc để xây dựng ứng dụng nhập điểm tự động
Hình 1-7: Mô hình nhận dạng ký tự viết tay rời rạc bằng SVM [2]
- Bước 1: Xây dựng mô hình huấn luyện
Tập dữ liệu huấn luyện sau khi qua các khâu tiền xử lý và trích chọn đặc trưng sẽ được đưa vào máy huấn luyện phân lớp SVM Sau khi kết thúc quá trình huấn luyện, hệ thống sẽ lưu lại giá trị các tham số của hàm quyết định phân lớp để phục vụ cho việc nhận dạng sau này Quá trình huấn luyện tiêu tốn khá nhiều thời gian, tốc độ huấn
Trang 16luyện nhanh hay chậm tùy thuộc vào từng thuật toán huấn luyện, chiến lược phân lớp SVM cũng như số lượng mẫu tham gia huấn luyện
- Bước 2: Phân lớp nhận dạng
Dựa vào giá trị các tham số của hàm quyết định thu được ở Bước 1, một mẫu mới x sau khi đã qua các khâu tiền xử lý và trích chọn đặc trưng sẽ được đưa vào tính toán thông qua hàm quyết định để xác định lớp của mẫu x
Ngoài ra hướng tiếp cận khác của đề tài là tiếp cận theo mô hình tương tác với phiếu điểm nhằm xây dựng một quy trình mới áp dụng nhập điểm tự động tại trường Đại học An Giang
Giảng viên
Cán bộ phòng khảo thí
Phiểu điểm
Regis Database
Xem điểm
Phản hồi
Chương trình nhập điểm tự động
Chỉnh sửa
Hình 1-8: Mô hình tường tác phiếu điểm tại trường Đại học An Giang
1.4 Các yếu tố ảnh hưởng đến đề tài
- Mỗi người có một kiểu chữ khác nhau không của ai giống ai hoàn toàn
- Bộ ký tự tiếng Việt có nhiều chữ có hình dạng rất giống nhau, chỉ khác nhau chút ít
về phần dấu điều này khiến hiệu quả nhận dạng là rất thấp