1. Trang chủ
  2. » Thể loại khác

Một số kỹ thuật trích chọn đặc trưng chữ viết tay trong nhập điểm rèn luyện tự động

69 276 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 69
Dung lượng 1,88 MB

Nội dung

ĐẠI HỌC THÁI NGUYÊN TRƯỜNG ĐH CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG MAI QUỐC AN MỘT SỐ KỸ THUẬT TRÍCH CHỌN ĐẶC TRƯNG CHỮ VIẾT TAY TRONG NHẬP ĐIỂM RÈN LUYỆN TỰ ĐỘNG LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH Thái Nguyên - 2016 Số hóa Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn ĐẠI HỌC THÁI NGUYÊN TRƯỜNG ĐH CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG MAI QUỐC AN MỘT SỐ KỸ THUẬT TRÍCH CHỌN ĐẶC TRƯNG CHỮ VIẾT TAY TRONG NHẬP ĐIỂM RÈN LUYỆN TỰ ĐỘNG Chuyên ngành: Khoa học máy tính Mã số: 60.48.01.01 LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH NGƯỜI HƯỚNG DẪN KHOA HỌC TS Vũ Duy Linh Thái Nguyên - 2016 Số hóa Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn i LỜI CAM ĐOAN Tôi xin cam đoan toàn nội dung luận văn tự sưu tầm, tra cứu xếp cho phù hợp với nội dung yêu cầu đề tài Nội dung luận văn chưa công bố hay xuất hình thức không chép từ công trình nghiên cứu Tất phần mã nguồn chương trình tự thiết kế xây dựng, có sử dụng số thư viện chuẩn thuật toán tác giả xuất công khai miễn phí mạng Internet Nếu sai xin hoàn toàn chịu trách nhiệm Thái Nguyên, ngày tháng 07 năm 2016 Người cam đoan Số hóa Trung tâm Học liệu – ĐHTN i http://www.lrc.tnu.edu.vn ii LỜI CẢM ƠN Trong trình học tập nghiên cứu lớp Cao học khóa 12 chuyên ngành Khoa học máy tính trường ĐH Công nghệ thông tin truyền thông - Đại học Thái Nguyên, nhận nhiều bảo, dìu dắt, giảng dậy nhiệt tình thầy, cô giáo Viện công nghệ thông tin Các thầy cô giáo quản lý trường ĐH Công nghệ thông tin truyền thông - Đại học Thái Nguyên giúp đỡ, tạo điều kiện tốt cho trình công tác học tập Nhân dịp xin bày tỏ lời cảm ơn chân thành tới tập thể thầy, cô giáo Viện công nghệ thông tin, thầy cô giáo trường ĐH Công nghệ thông tin truyền thông - Đại học Thái Nguyên Tôi xin chân thành cảm ơn sâu sắc tới thầy giáo TS Vũ Duy Linh cho nhiều ý kiến đóng góp quý báu, tận tình hướng dẫn tạo điều kiện cho hoàn thành tốt luận văn tốt nghiệp Tôi xin cảm ơn đồng nghiệp người thân động viên, giúp đỡ trình nghiên cứu thực luận văn Quá trình thực đề tài không tránh khỏi thiếu sót, mong tiếp tục nhận đóng góp ý kiến thầy, cô giáo, bạn đồng nghiệp đề tài nghiên cứu để đề tài hoàn thiện Tôi xin trân trọng cảm ơn! Thái Nguyên, ngày tháng 07 năm 2016 Số hóa Trung tâm Học liệu – ĐHTN ii http://www.lrc.tnu.edu.vn iii MỤC LỤC PHẦN MỞ ĐẦU Chương 1: KHÁI QUÁT VỀ NHẬP ĐIỂM RÈN LUYỆN TỰ ĐỘNGTRÍCH CHỌN ĐẶC TRƯNG CHỮ VIẾT TAY 1.1 Khái quát nhập điểm rèn luyện tự động 1.1.1 Quản lý nhập điểm rèn luyện tự động 1.1.2 Kiến trúc hệ thống nhận dạng điểm rèn luyện sử dụng mạng nơron nhân tạo 1.2 Khái quát trích chọn đặc trưng chữ viết tay 13 1.2.1 Đặc trưng màu sắc 15 1.2.2 Đặc trưng hình dạng 16 1.2.3 Đặc trung kết cấu 17 1.2.4 Đặc trung cục bất biến 17 Chương 2: NHẬN DẠNG PHIẾU ĐIỂM SỬ DỤNG MẠNG NƠ RON 19 2.1 Thiết kế mạng nơron nhân tạo 19 2.1.1 Các bước thiết kế 19 2.1.2 Chi tiết bước thiết kế mạng nơron 19 2.2 Các kỹ thuật trích chọn đặc trưng 24 2.2.1 Kỹ thuật trích chọn đặc trưng kết hợp biến đổi DCT thuật toán phân tích thành phần PCA 24 2.2.2 Kỹ thuật trích đặc trưng sử dụng Momen Legendre 27 2.2.3 Kỹ thuật sử dụng mạng Neural nhân chập (Convolution neural network) 32 2.3 Huấn luyện mạng 35 2.3.1 Các phương pháp học 35 2.3.2 Học có giám sát mạng nơron 36 2.3.3 Thuật toán lan truyền ngược Back-Propagation 37 2.4 Nhận dạng sử dụng mạng nơron 49 2.4.1 Khả sử dụng mạng nơron nhận dạng 49 2.4.2 Mô hình nhận dạng hệ thống sử dụng mạng nơron 49 2.4.3 Nhận dạng hệ thống sử dụng mạng nơron 51 Chương 3: CHƯƠNG TRÌNH THỬ NGHIỆM 52 3.1 Đặc trưng phiếu điểm 52 3.2 Bài toán 53 3.3 Tiền xử lý 54 3.4 Phân đoạn trích chọn đặc trưng 57 3.5 Huấn luyện nhận dạng 57 3.6 Hậu xử lý 58 Số hóa Trung tâm Học liệu – ĐHTN iii http://www.lrc.tnu.edu.vn iv PHẦN KẾT LUẬN 58 TÀI LIỆU THAM KHẢO 60 CÁC CHỮ VIẾT TẮT Từ viết tắt Ý nghĩa CSDL Cơ sở liệu MCP Mô hình McCulloch Pitts MSE Mean-Square Error BP Back-Propagation PCA Principal Component Analysis OMR Optical Mark Recognition) Số hóa Trung tâm Học liệu – ĐHTN iv http://www.lrc.tnu.edu.vn v MỤC LỤC HÌNH ẢNH Hình Hình Hình Hình Hình Hình Hình Hình Hình Hình Hình Hình Hình Hình Hình Hình Hình Hình Hình Hình Hình Hình Hình Hình Hình Hình Hình 1: Nơron đơn giản 2: Nơron phức tạp 3: mạng truyền thẳng 4: mạng hồi quy đơn giản 10 5: Perceptron 11 6: Sự khác hồi quy tuyến tính mạng nơron 12 7: Các bước hệ thống nhận dạng văn 14 8: Ví dụ xác định đặc trưng ảnh 15 9: Ảnh hưởng vector riêng, giá trị riênglên tập liệu 24 10: Các bước trích chọn đặc trưng biến DCT kết hợp PCA 26 11: Biến đổi DCT cách lấy liệu theo đường zigzag 27 12: Họ đa thức Legendre 29 13: Thao tác nhân chập 33 14: Quá trình trích chọn đặc trưng sử dụng mạng Neural nhân chập 34 15: Minh họa trình lấy đặc trưng mạng Neuron nhân chập 34 16: Mô hình học có giám sát 36 17: Mạng lan truyền với lớp ẩn 38 18: xấp xỉ mạng trường hợp i = 1, 2, 4, 42 19: Xác định tần số 47 20: Mô hình nhận dạng 50 21: Mẫu phiếu điểm đánh giá rèn luyện 52 22: Mẫu phiếu điểm tổng kết 53 23: Nhị phân hóa ảnh 54 24: Lọc nhiễu 55 25: Chuẩn hóa kích thước ảnh số “4” “6” 55 26: Làm tròn biên chữ 56 27: Làm mảnh chữ 56 Số hóa Trung tâm Học liệu – ĐHTN v http://www.lrc.tnu.edu.vn vi Hình 28: Tách thông tin phiếu điểm 57 Số hóa Trung tâm Học liệu – ĐHTN vi http://www.lrc.tnu.edu.vn PHẦN MỞ ĐẦU Công nghệ thông tin ngành then chố t quá trình công nghiêp̣ hóa hiêṇ đại hóa đất nước Viê ̣c triể n khai nghiên cứu công trình khoa học đưa vào thực tế ứng du ̣ng góp phầ n giải phóng sức lao đô ̣ng người, tiết kiê ̣m thời gian, nâng cao hiêụ suấ t công viê ̣c là mô ̣t viê ̣c làm hết sức có ý nghiã giai đoa ̣n này Bài toán nhâ ̣n dạng chữ viết tay xuất cách lâu ứng dụng hiệu nhiều lĩnh vực khác y tế, giáo dục, quốc phòng, nghiên cứu vũ trụ Trong trình công tác, nhận thấy rằng: Việc xử lý kết đánh giá rèn luyện sinh viên hầu hết trường thực cách thủ công Quy trình đánh giá rèn luyện học sinh - sinh viên tiến hành từ cấp lớp đến cấp khoa cấp trường Kết đánh giá rèn luyện giảng viên nhập vào bảng tổng hợp dựa phiếu đánh giá rèn luyện Việc nhập điểm thủ công tốn nhiều công sức khả nhầm lẫn cao Để giải vấn đề đòi hỏi phải xây dựng công cụ hữu hiệu việc nhận dạng chữ viết tay sẽ đem la ̣i các lơ ̣i ích sau đưa vào ứng du ̣ng thực tế: - Giảm lượng nhân công nhập điểm - Độ xác cao - Tiết kiệm thời gian, công sức - Dễ dàng giám sát tiến trình nhập điểm, giúp đưa cách giải phù hợp có sai sót xảy Trong phạm vi đề tài luận văn thạc sỹ, sâu vào tìm hiểu kỹ thuật trích chọ đặc trưng nhận dạng chữ viết tay phiếu đánh giá kết rèn luyện Do chọn đề tài: “Một số kỹ thuật trích chọn đặc trưng chữ viết tay nhập điểm rèn luyện tự động” Chương 1: KHÁI QUÁT VỀ NHẬP ĐIỂM RÈN LUYỆN TỰ ĐỘNGTRÍCH CHỌN ĐẶC TRƯNG CHỮ VIẾT TAY 1.1 Khái quát nhập điểm rèn luyện tự động 1.1.1 Quản lý nhập điểm rèn luyện tự động Hiện nay, đánh giá kết rèn luyện học sinh, sinh viên trường đại học, cao đẳng trung học chuyên nghiệp nhằm góp phần thực mục tiêu giáo dục đào tạo người Việt Nam phát triển toàn diện, có đạo đức, tri thức, sức khỏe, thẫm mỹ nghề nghiệp, trung thành với lý tưởng độc lập dân tộc chủ nghĩa xã hội; hình thành bồi dưỡng nhân cách, phẩm chất lực công dân, đáp ứng yêu cầu xây dựng bảo vệ Tổ quốc Việc đánh giá kết rèn luyện học sinh, sinh viên việc làm thường xuyên trường Quá trình đánh giá phải đảm bảo xác, công bằng, công khai dân chủ Có nhiều toán hiệu tin cậy để giải khâu nhập điểm toán điều tra xã hội học, thi tuyển sinh qua trắc nghiệm, nhập chứng từ ngân hàng, nhập tờ khai thuế Khó khăn chỗ khối lượng nhập nhiều việc kiểm soát độ xác trình nhập Để tăng tốc độ nhập liệu, số phương pháp nghiên cứu là: - Phân tải để nhập từ nhiều nguồn, nhiều đầu mối; - Nhập qua giá mang tính trung gian để tận dụng nhiều phương pháp, nhiều đầu mối, sau dùng công cụ để chuyển định dạng cần thiết; - Nhập qua giao diện âm hình ảnh, hình ảnh phương pháp quan tâm nhiều Đã có nhiều thành công hệ thống nhận dạng chữ viết, nhận dạng form tài liệu, nhận dạng phiếu đánh dấu 47 số khởi đầu có chứa điểm cực tiểu Bước giảm tần số sau giảm kích thước tần số tìm điểm cực tiểu với độ xác Ta sử dụng phương pháp so sánh hàm để thực bước xác định tần số Thủ tục mô tả hình 14 Ta bắt đầu cách tính số hiệu điểm khởi đầu (điểm a1 hình vẽ), điểm giá trị số hiệu với tham số mạng Bước tính giá trị hàm số hiệu điểm thứ 2, thể điểm b1 hình vẽ cách điểm khởi đầu đoạn ε theo hướng tìm kiếm p0 Hình 19: Xác định tần số Sau đó, ta tiếp tục tính giá trị hàm hiệu điểm bi có khoảng cách đến điểm khởi đầu gấp đôi điểm trước Quá trình dừng lại giá trị hàm tăng lên so với điểm trước (trong hình vẽ điểm b3 b4) Đến đây, ta biết điểm cực tiểu rơi vào khoảng [a5, b5] Ta thu hẹp thêm tần số lẽ điểm cực tiểu rơi vào vùng [a3, b3] [a4, b4] Bây ta tiếp tục bước thực giảm tần số, ta lấy hai điểm c, d khoảng [a5, b5] để thực việc (nếu lấy điểm ta khó có 48 thể xác định liệu điểm cực tiểu nằm vùng nào) Có nhiều cách để chọn điểm trên, ta sử dụng phương pháp gọi là: Golden Section search Phương pháp cố gắng thực tìm kiếm cho số lần phải tính giá trị hàm (tại bước ta cần phải tính giá trị hàm) 2.3.3.3 Đánh giá thuật toán Đưa mẫu học từ miền toán vào mạng việc huấn luyện mạng theo phương pháp học có giám sát liên quan đến cách thức Các mẫu phân chia thành tập huấn luyện tập kiểm thử Mạng khởi tạo trọng số số ngẫu nhiên, sau đó, trọng số điều chỉnh cho phù hợp với tập huấn luyện Tập kiểm thử dùng để xác định xem tỉ lệ thành công việc xác định đầu từ đầu vào mà chưa luyện Mạng đưa vào tập mẫu, mẫu lần, sau biết tất mẫu, phải thực điều chỉnh trọng số cách tính toán lỗi xảy Quá trình lặp lại mạng luyện đủ Kích thước tập giới hạn số lần lặp, trùng với kích thước tập mẫu học, không cần phải xác định thứ tự đưa mẫu vào cho mạng học cách ngẫu nhiên •Ưu điểm thuật toán: -Dễ dàng triển khai; -Phương pháp chuẩn hoạt động tốt; -Thời gian tính toán giảm trọng số chọn ban đầu nhỏ; -Không yêu cầu đặc tính đặc biệt hàm học •Nhược điểm thuật toán: -Có thể bị vướng vào tối thiểu địa phương nghiệm tối ưu; -Số lượng lớn đầu vào/đầu không chắn liên hệ chúng với đầu ra; 49 -Nghiệm phương trình thay đổi theo thời gian; -Đầu mờ số 2.4 Nhận dạng sử dụng mạng nơron 2.4.1 Khả sử dụng mạng nơron nhận dạng Xét trường hợp đối tượng phi tuyến tính có độ phức tạp cao, sử dụng phương pháp giải tích thông thường để nhận dạng khó khăn, chí không thực hiểu biết nghèo nàn đối tượng Vì nhà khoa học đưa ý tưởng sử dụng công cụ tính toán mềm hệ mờ, mạng nơron, đại số gia tử để xấp xỉ Mạng nơron công cụ hữu hiệu để nhận dạng mô hình đối tượng Bằng phương pháp ta mô hình toán thực đối tượng hoàn toàn dùng kết xấp xỉ để thay đối tượng Vì tính phi tuyến mạng nơron (hàm kích hoạt phi tuyến), chúng dùng để mô tả hệ thống phi tuyến phức tạp Mạng nơron công cụ nhận dạng tốt đặc trưng sau: khả học từ kinh nghiệm hay huấn luyện, khả khái quát hoá cho đầu vào không huấn luyện Mạng nơron có khả xấp xỉ hàm phi tuyến cách đầy đủ xác, sử dụng tốt cho mô hình động học phi tuyến Điều quan trọng sử dụng thuật truyền ngược tĩnh động mạng nơron, sử dụng để hiệu chỉnh tham số trình nhận dạng Nền tảng cho tính xấp xỉ hàm mạng nơron nhiều lớp định lý Kolmgorov định lý Stone - Weierstrass Các mạng Nơron nhân tạo đưa lợi qua việc học sử dụng phân loại xử lý song song, điều phù hợp với việc dùng nhận dạng 2.4.2 Mô hình nhận dạng hệ thống sử dụng mạng nơron Khi xét toán điều khiển, trước tiên ta cần phải có hiểu biết đối tượng: số đầu vào, số đầu ra, đại lượng vật lý vào ra, dải giá trị chúng, quy 50 luật thay đổi đại lượng hệ hay mô hình toán học nó, Tuy nhiên đối tượng hay hệ cung cấp đầy đủ thông tin xây dựng mô hình thực từ thông tin Việc nhận dạng việc quan trọng Khi thông số đối tượng cần thiết để việc điều khiển đạt chất lượng mong muốn Khi thông số đối tượng tự thay đổi tiến trình làm việc (đối tượng phi tuyến) có tính động học việc nhận dạng theo chúng phức tạp nhiều so với đối tượng có thông số bất biến Nhận dạng thường chia làm: nhận dạng mô hình nhận dạng tham số Nhận dạng mô hình trình xác định mô hình đối tượng thông số sở đầu vào đầu đối tượng Mô hình thu sau nhận dạng gọi tốt thể đối tượng Như sử dụng mô hình thay cho đối tượng để dự báo, kiểm tra điều khiển Mạng nơron luyện để mô hình hóa quan hệ vào đối tượng Như quy trình nhận dạng mô hình có chất thuật toán luyện mạng Cấu trúc mạng nơron giải toán nhận dạng mô hình đa dạng, tùy thuộc vào toán cụ thể Nhận dạng tham số huấn luyện mạng Mô hình mạng nơron luyện để mô hành vi đối tượng giống mô hình truyền thống biểu diễn Hình 15 Hình 20: Mô hình nhận dạng Tín hiệu sai sở cho trình luyện mạng Mạng nơron mạng nhiều lớp dạng khác sử dụng nhiều thuật luyện mạng khác 51 2.4.3 Nhận dạng hệ thống sử dụng mạng nơron Như hai giai đoạn cần cho nhận dạng lựa chọn mô hình tối ưu tham số Đối với mạng nơron dựa vào nhận dạng lựa chọn số nút ẩn, số lớp ẩn (cấu trúc mạng) tương đương với mô hình lựa chọn Mạng huấn luyện theo kiểu giám sát với kỹ thuật lan truyền ngược, dựa vào luật học sai số hiệu chỉnh Tín hiệu sai số lan truyền ngược qua mạng Kỹ thuật lan truyền ngược sử dụng phương pháp giảm gradient để xác định trọng mạng tương đương với tối ưu tham số Mạng nơron huấn luyện để xấp xỉ mối quan hệ biến.Mạng nơron huấn luyện để tối thiểu hàm sai số Mạng huấn luyện để tối thiểu sai số bình phương đầu mạng đầu vào hệ thống, xác định hàm truyền ngược Trong kiểu nhận dạng đầu mạng hội tụ đầu vào hệ sau huấn luyện, mạng đặc trưng cho hàm truyền ngược hệ Phương pháp nhận dạng khác cần phải hướng đầu hệ thống tới đầu mạng Trong kiểu mạng đặc trưng cho hàm truyền thẳng hệ thống Giả sử hàm phi tuyến để mô tả hệ thuộc lớp hàm biết phạm vi quan tâm cấu trúc mô hình nhận dạng phải phù hợp với hệ thống Với giả thiết ma trận trọng mạng nơron mô hình nhận dạng tồn tại, điều kiện ban đầu hệ thống mô hình có lượng với lượng vào xác định Do trình nhận dạng thực chất điều chỉnh tham số mạng nơron dựa vào sai lệch giá trị đầu hệ thống mô hình 52 Chương 3: CHƯƠNG TRÌNH THỬ NGHIỆM 3.1 Đặc trưng phiếu điểm Trước tiên, vài điều kiện cần phải áp đặt lên việc ghi phiếu để trình phân đoạn nhận dạng diễn thuận lợi là: -Viết rõ ràng, không đứt đoạn, không chồng chéo -Điểm viết vị trí, ô, không đè lên đường bao quanh ô, không dập xóa lên phiếu Đặc trưng chung mẫu phiếu điểm rèn luyện phần gồm tên phiếu điểm, thông tin mô tả phiếu điểm (tên sinh viên, tên lớp, khoa…) Phần điểm sinh viên ghi bảng gồm nhiều hàng, hàng số điểm sinh viên theo tiêu chí Các cột số điểm sinh viên tự đánh giá, lớp đánh giá khoa đánh giá Mẫu phiếu điểm đánh giá rèn luyện: Phiếu điểm gồm cột thông tin: Nội dung đánh giá, điểm số, điểm sinh viên tự đánh giá, điểm lớp đánh giá, điểm hội đồng khoa đánh giá Giáo viên sau chấm thi ghi điểm vào phiếu Hình 21: Mẫu phiếu điểm đánh giá rèn luyện 53 Mẫu phiếu điểm tổng kết: Phiếu điểm tổng kết gồm cột thông tin: số thứ tự, mã sinh viên, họ tên, điểm rèn luyện, ghi Hình 22: Mẫu phiếu điểm tổng kết 3.2 Bài toán Hiện nay, đa phần trường học sử dụng phần mềm tin học để quản lý điểm rèn luyện Việc này, giúp việc quản lý xác, tra cứu nhanh chóng Tuy nhiên, theo tìm hiểu tác giả phần mềm cho cho phép in phiếu điểm để giáo viên chấm thi nhập điểm người phụ trách điểm phải có trách nhiệm nhập điểm tay Mặc dù phần mềm có chức in kiểm dò, công việc hoàn toàn thủ công dẫn tới có nhiều sai sót Bài toán nhập điểm tự động giải khắc phục vấn đề mà tác giả nêu Việc nhập điểm tự động trình thu thập ảnh biên chấm thi (thông thường qua máy Scanner) sau xử lý để đưa bảng điểm xác dạng số máy tính Trong toán này, có hai toán nhỏ cần giải là: Xác định vùng chứa liệu điểm nhận dạng chữ số viết tay Trong phạm vi nghiên cứu luận văn, tác giả tập trung nghiên cứu vào việc nhận dạng chữ số viết tay 54 3.3 Tiền xử lý Giai đoạn góp phần làm tăng độ xác phân lớp hệ thống nhận dạng, nhiên làm cho tốc độ nhận dạng hệ thống chậm lại Vì vậy, tùy thuộc vào chất lượng ảnh quét vào phiếu điểm cụ thể để chọn một vài chức khối Nếu cần ưu tiên tốc độ xử lý chất lượng máy quét tốt bỏ qua giai đoạn Khối tiền xử lý bao gồm số chức năng: Nhị phân hóa ảnh, lọc nhiễu, chuẩn hóa kích thước ảnh, làm trơn biên chữ, làm đầy chữ, làm mảnh chữ xoay văn Nhị phân hóa ảnh Nhị phân hóa ảnh kỹ thuật chuyển ảnh đa cấp xám sang ảnh nhị phân Trong toán phân tích nâng cao chất lượng ảnh nào, cần thiết để xác định đối tượng quan trọng Nhị phân hóa ảnh phân chia ảnh thành phần: phần phần chữ Hầu hết phương pháp nhị phân hóa ảnh lựa chọn ngưỡng thích hợp theo cường độ sáng ảnh sau chuyển tất giá trị độ sáng lớn ngưỡng thành giá trị độ sáng (ví dụ “trắng”) tất giá trị bé ngưỡng thành giá trị độ sáng khác (“đen”) Hình 23: Nhị phân hóa ảnh Lọc nhiễu Nhiễu tập điểm sáng thừa ảnh Khử nhiễu vấn đề thường gặp nhận dạng, nhiễu có nhiều loại (nhiễu đốm, nhiễu vệt, nhiễu đứt nét ) 55 Hình 24: Lọc nhiễu Để khử nhiễu đốm (các nhiễu với kích thước nhỏ), sử dụng phương pháp lọc (lọc trung bình, lọc trung vị ) Tuy nhiên, với nhiễu vệt (hoặc nhiễu có kích thước lớn) phương pháp lọc tỏ hiệu quả, trường hợp sử dụng phương pháp khử vùng liên thông nhỏ tỏ có hiệu Chuẩn hóa kích thước ảnh Hình 25: Chuẩn hóa kích thước ảnh số “4” “6” Việc chuẩn hóa kích thước ảnh dựa việc xác định trọng tâm ảnh, sau xác định khoảng cách lớn từ tâm ảnh đến cạnh trên, dưới, trái, phải hình chữ nhật bao quanh ảnh Thông qua khoảng cách lớn đó, xác định tỷ lệ co, giãn ảnh gốc so với kích thước xác định, từ hiệu chỉnh kích thước ảnh theo tỷ lệ co, giãn Như vậy, thuật toán chuẩn hóa kích thước ảnh luôn đảm bảo tính cân co giãn ảnh, ảnh không bị biến dạng bị lệch 56 Làm trơn biên chữ Đôi chất lượng quét ảnh xấu, đường biên chữ không giữ dáng điệu trơn tru ban đầu mà hình thành đường cưa giả tạo Trong trường hợp này, phải dùng thuật toán làm trơn biên để khắc phục (a) Ảnh gốc, (b) Ảnh sau làm trơn biên Hình 26: Làm tròn biên chữ Chức áp dụng với tự bị đứt nét cách ngẫu nhiên Ảnh đứt nét gây khó khăn cho việc tách chữ, dễ bị nhầm hai phần liên thông tự thành hai tự riêng biệt, tạo nên sai lầm trình nhận dạng Làm mảnh chữ Đây bước quan trọng nhằm phát khung xương tự cách loại bỏ dần điểm biên nét Tuy nhiên, trình làm mảnh chữ nhạy cảm với việc khử nhiễu Hình 27: Làm mảnh chữ Điều chỉnh độ nghiêng văn 57 Do trang tài liệu quét vào không cẩn thận cố in ấn, hàng chữ bị lệch so với lề chuẩn góc α, điều gây khó khăn cho công đoạn tách chữ, tách Trong trường hợp vậy, phải tính lại tọa độ điểm ảnh chữ bị sai lệch Có nhiều kỹ thuật để điều chỉnh độ nghiêng, kỹ thuật phổ biến dựa sở biểu đồ chiếu (projection profile) ảnh tài liệu; số kỹ thuật dựa sở phép biến đổi Hough Fourier 3.4 Phân đoạn trích chọn đặc trưng Khối có nhiệm vụ tách tự khỏi phiếu điểm Chỉ phiếu điểm tách cô lập dòng (ứng với thông tin điểm sinh viên) cô lập tự đơn khỏi tổng thể hệ thống nhận dạng tự Trích chọn đặc trưng đóng vai trò quan trọng hệ thống nhận dạng Trong trường hợp đơn giản nhất, ảnh đa cấp xám ảnh nhị phân sử dụng cho việc nhận dạng Tuy nhiên, hầu hết hệ nhận dạng, để giảm độ phức tạp tăng độ xác thuật toán phân lớp đòi hỏi đặc trưng trích chọn phải rút gọn lại nhỏ tốt phải đảm bảo thông tin tự Với mục tiêu này, tập đặc trưng trích chọn cho lớp cho phân biệt với lớp khác Hình 28: Tách thông tin phiếu điểm 58 3.5 Huấn luyện nhận dạng Tập liệu huấn luyện sau qua khâu tiền xử lý trích chọn đặc trưng đưa vào máy huấn luyện mô hình mạng nơron Sau kết thúc trình huấn luyện, hệ thống lưu lại giá trị tham số hàm định phân lớp để phục vụ cho việc nhận dạng sau 3.6 Hậu xử lý Đây công đoạn cuối trình nhận dạng phiếu điểm Có thể hiểu hậu xử lý bước ghép nối kí tự, điểm nhận dạng chuyển vào sở liệu lưu trữ điểm sinh viên, đồng thời phát lỗi nhận dạng sai cách kiểm tra giá trị số báo danh, số phách, điểm số dựa miền giá trị chúng Việc phát lỗi, sai sót nhận dạng bước góp phần đáng kể vào việc nâng cao chất lượng nhận dạng phiếu điểm PHẦN KẾT LUẬN Trong giai đoạn hệ thống nhập điểm tự động, giai đoạn phân đoạn trích chọn đặc trừng khó khăn đòi hỏi nhiều thời gian ảnh thu từ thiết bị thường bị sai lệch yếu tố góc quay, khoảng cách, ánh sáng, Phần lớn kết nhận dạng sai không trích chọn đặc trưng ảnh Đề tài nghiên cứu số kỹ thuật trích chọn đặc trưng nhận dạng ảnh phương pháp mạng nơron Trong thời gian nghiên cứu thực luận văn, tác giả đạt số kết sau: - Nghiên cứu số kỹ thuật tiền xử lý ảnh nhằm nâng cao chất lượng ảnh đầu vào; - Nghiên cứu số kỹ thuật trích chọn đặc trưng ảnh: Kỹ thuật trích chọn đặc trưng kết hợp biến đổi DCT thuật toán phân tích thành phần PCA, kỹ 59 thuật trích đặc trưng sử dụng Momen Legendre, Kỹ thuật sử dụng mạng Neural nhân chập (Convolution neural network) - Thiết kế chương trình trích nhận dạng ảnh dựa vào mạng nơron Chương trình cho phép nhận ảnh bảng điểm từ file 60 TÀI LIỆU THAM KHẢO Tiếng việt [1] Lương Ma ̣nh Bá, Nguyễn Thanh Thủy (1999), Nhập môn xử lý ảnh số , NXB Khoa ho ̣c kỹ thuâ ̣t [2] Đỗ Năng Toàn (2010), Giáo trình xử lý ảnh, Ho ̣c viện Công nghê ̣ Bưu chiń h Viễn thông Tiếng anh [3] D Heckenberg, B C Lovell (2000), “A Gesture Driven Computer Interface”, Proceeding of Visual Communications and Image Processing, SPIE, 4067, 261-268 [4] Journal on Graphics (2006), Vision and Image Processing, [5] J Mathews (2002), “An Introduction to Edge Detection: The Sobel Edge Detector” [6] Peter l Rockett (2005), “An Improved Rotation-Invarient Thinning Algorithm”, IEEE transaction on Pattern, Analysis and Machine Intelligence, 27, 10 [7] Te-Hsiu Sun, Fang-Chih Tien (2008), Using Backpropagation Neural Network for Face Recognition with 2D+ 3D Hybrid Information, Elsevier: Expert System with Applications, 35,361-372 [8] N Sakai, S Yonekawa and A Matsuzaki, Two-dimensional image analysis of the shape of rice and its applications to separating varieties”, Journal of Food Engineering, vol 27, 1996, pp 397-407 [9] A J M Timmermans, and A A Hulzebosch, Computer vison system for on-line sorting of pot plants using an artificial neural network classifier, Computers and Electronics in Agriculture, vol 15, 1996, pp 41-55 61 [10] S Abbasi, F Mokhtarian, and J Kittler, Reliable classification of chrysanthemum leaves through curvature scale space, Lecture Notes in Computer Science, vol 1252, 1997, pp 284-295 [11] J Camarero, S Siso, and E.G-Pelegrin, Fractal dimension does not adequately describe the complexity of leaf margin in seedlings of Quercus species, Anales del Jardín Botánico de Madrid, vol 60, no 1, 2003, pp 63-71 Các trang website tham khảo [12] http://andrewback.com/ivs.php ... Một số kỹ thuật trích chọn đặc trưng chữ viết tay nhập điểm rèn luyện tự động 2 Chương 1: KHÁI QUÁT VỀ NHẬP ĐIỂM RÈN LUYỆN TỰ ĐỘNG VÀ TRÍCH CHỌN ĐẶC TRƯNG CHỮ VIẾT TAY 1.1 Khái quát nhập điểm. .. THÔNG TIN VÀ TRUYỀN THÔNG MAI QUỐC AN MỘT SỐ KỸ THUẬT TRÍCH CHỌN ĐẶC TRƯNG CHỮ VIẾT TAY TRONG NHẬP ĐIỂM RÈN LUYỆN TỰ ĐỘNG Chuyên ngành: Khoa học máy tính Mã số: 60.48.01.01 LUẬN VĂN THẠC SĨ KHOA... quát nhập điểm rèn luyện tự động 1.1.1 Quản lý nhập điểm rèn luyện tự động 1.1.2 Kiến trúc hệ thống nhận dạng điểm rèn luyện sử dụng mạng nơron nhân tạo 1.2 Khái quát trích

Ngày đăng: 25/06/2017, 17:12

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w