Hiệu chỉnh mẫu và nhận dạng trong nhập điểm tự động Lê Quốc Tuấn Trường Đại học Công nghệ Khoa Công nghệ Thông tin Luận văn Thạc sĩ ngành: Hệ thống thông tin; Mã số: 60 48 05 Người hướng dẫn: PGS. TS. Đỗ Năng Toàn Năm bảo vệ: 2011 Abtract: Khái quát về xử lý ảnh và nhận dạng biểu mẫu. Giới thiệu một số kỹ thuật hiệu chỉnh biểu mẫu. Trình bày về mạng nơron và nhận dạng biểu mẫu. Tiến hành chạy thử nghiệm chương trình. Keywords: Hệ thống thông tin; Công nghệ thông tin; Hiệu chỉnh mẫu; Nhập điểm tự động Content PHẦN MỞ ĐẦU Công nghệ thông tin được xem là ngành mũi nhọn của các quốc gia, đặc biệt là các quốc gia đang phát triển, tiến hành công nghiệp hóa - hiện đại hóa như ở nước ta. Sự bùng nổ thông tin và sự phát triển mạnh mẽ của công nghệ kỹ thuật số, yêu cầu muốn phát triển thì phải tin học hóa các ngành, các lĩnh vực. Cùng với sự phát triển nhanh chóng về phần cứng máy tính, các phần mềm càng trở nên đa dạng, phong phú, hoàn thiện hơn và hỗ trợ hiệu quả hơn cho con người. Các phần mềm hiện nay ngày càng mô phỏng khá nhiều nghiệp vụ phức tạp, hỗ trợ cho người dùng sử dụng thuận tiện, thời gian xử lý nhanh chóng và một số nghiệp vụ tự động hóa cao. Hiện nay, trong hầu hết các cơ sở giáo dục đào tạo của nước ta đều được trang bị phần mềm quản lý đào tạo nhằm nâng cao chất lượng giảng dạy và quản lý học sinh, sinh viên, giúp giảm bớt một phần lớn công việc của đội ngũ cán bộ quản lý giáo dục. Tuy nhiên việc cập nhật điểm thi vào hệ thống phần mềm quản lý giáo dục vẫn còn thủ công, không những làm tốn nhiều công sức của đội ngũ giáo vụ mà còn có nhiều sai sót đặc biệt với những trường có số lượng môn học và số sinh viên lớn. Từ những lý do trên, tôi đã chọn đề tài “HIỆU CHỈNH MẪU VÀ NHẬN DẠNG TRONG NHẬP ĐIỂM TỰ ĐỘNG” với mong muốn phần nào giải quyết được phần nào những khó khăn đó. Thay vì phải nhập điểm thủ công, giờ đây việc nhập điểm trở nên dễ dàng, thuận tiện hơn với chương trình tự động cập nhật điểm. Các công đoạn chính để cập nhật điểm tự động bao gồm: - Phiếu điểm viết tay của giảng viên qua máy quét thu được hình ảnh và đưa vào máy tính. - Phân vùng ảnh thành 2 vùng ảnh cần thiết: Mã sinh viên (hoặc số báo danh) và Điểm thi. - Áp dụng các kỹ thuật tiền xử lý ảnh (nâng cao chất lượng ảnh, chuyển sang ảnh nhị phân, loại bỏ nhiễu, ). - Nhận dạng thông qua mạng nơron với các mẫu thu thập được. - Cập nhật vào Cơ sở dữ liệu. Việc cập nhật điểm tự động rõ ràng đã giải quyết được những khó khăn và bất tiện của chương trình quản lý điểm thông thường để lại. Nội dung của luận văn gồm có 4 chương: Chương 1. Khái quát về xử lý ảnh và nhận dạng biểu mẫu. Chương 2. Một số kỹ thuật hiệu chỉnh biểu mẫu. Chương 3. Mạng nơron và nhận dạng biểu mẫu. Chương 4. Chương trình thử nghiệm. I. Khái quát về xử lý ảnh và nhận dạng biểu mẫu A. Khái quát về xử lý ảnh: - Các giai đoạn của một quá trình xử lý ảnh bao gồm: thu nhận ảnh, tiền xử lý, phân đoạn, tách rút đặc trưng, phân loại. - Mô tả ảnh: Các khái niệm về phần tử ảnh, mức xám, ảnh, phân loại ảnh. - Một số vấn đề trong xử lý ảnh: Kỹ thuật tăng giảm độ sáng, độ tương phản, tách ngưỡng, chuyển đổi sang ảnh nhị phân, loại bỏ nhiễu, di chuyển ảnh B. Nhận dạng biểu mẫu: - Phân tách vùng chứa dữ liệu: Phân tách ảnh đầu vào thành các vùng chứa dữ liệu mà ta cần nhận dạng. - Kỹ thuật tách dòng và tách ký tự. - Trích rút đặc trưng của ảnh. II. Một số kỹ thuật hiệu chỉnh biểu mẫu A. Hiệu chỉnh độ lệch dịch chuyển của ảnh cần nhận dạng so với ảnh gốc. B. Hiệu chỉnh góc lệch: sử dụng các phương pháp chiếu nghiêng, biến đổi Hough và láng giềng gần nhất. III. Mạng nơron và nhận dạng biểu mẫu A. Giới thiệu về mạng nơron: mô hình toán học, phân loại mạng, đặc trưng của mạng nơron, một số mạng nơron cơ bản. B. Nhận dạng biểu mẫu: Thiết kế mạng nơron lan truyền ngược và thuật toán BackPropagation để nhận dạng chữ số viết tay. IV. Thiết kế chương trình chạy thử nghiệm: Xây dựng chương trình để nhập điểm tự động từ phiếu điểm và đưa vào cơ sở dữ liệu. V. KẾT LUẬN Luận văn đã nghiên cứu những kiến thức cơ bản về xử lý ảnh, phương pháp hiệu chỉnh mẫu, nhận dạng mẫu, mạng nơrron lan truyển ngược và ứng dụng để xây dựng chương trình giải quyết bài toán nhập điểm tự động. Reference: [1]. Đỗ Năng Toàn, Phạm Việt Bình (2007), Giáo trình xử lý ảnh, NXB KH kỹ thuật. [2]. Đỗ Năng Toàn, Phạm Văn Dũng, Phạm Việt Bình (2005), “Ứng dụng chu tuyến trong phát hiện gúc nghiêng văn bản”, Kỷ yếu Hội thảo Quốc gia lần thứ 7 - Một số vấn đề chọn lọc của Công nghệ Thông tin và Truyền thông, Đà Nẵng 18- 20/08 /2004, Nxb KH&KT, Hà Nội 2005. [3]. Đỗ Năng Toàn, Ngô Quốc Tạo, Một số phương pháp nâng cao hiệu quả nhận dạng phiếu điều tra dạng dấu phục vụ cho thiết kế hệ nhập liệu tự động markread, Tạp chí Tin học & Điều khiển học, Tập 15, số 4, năm 1999. [4]. Lương Mạnh Bá, Nguyễn Thanh Thuỷ (1999), Nhập môn xử lý ảnh số, NXB Khoa học kỹ thuật. [5]. Nguyễn Đình Thúc (2000), Mạng nơron phương pháp và ứng dụng, NXB Giáo dục. [6]. Pelin CORGEL, Oguzhan OZTAS, Handwritten character recognition system using artificial Neural Networks, Computer Engineering Department, Engineering Faculty, Istanbul University, Avcilar, Istanbul, TURKEY [7]. U V. Marti and H. Bunke, Text Line Segmentation and word recognition in a system for general writer Independent Handwriting Recognition, IEEE (February 5, 2001). [8]. Wojciech Kacalak, New methods for handwriting recognition using artificial neural networks, Technical university of Koszalin, Department of Mechanical Engineering, Raclawicka 15-17, 75-620 Koszalin,Poland. [9]. http://en.wikipedia.org/wiki/Backpropagation (20/04/2009). . 2011 Abtract: Khái quát về xử lý ảnh và nhận dạng biểu mẫu. Giới thiệu một số kỹ thuật hiệu chỉnh biểu mẫu. Trình bày về mạng nơron và nhận dạng biểu mẫu. Tiến hành chạy thử nghiệm chương. biệt với những trường có số lượng môn học và số sinh viên lớn. Từ những lý do trên, tôi đã chọn đề tài “HIỆU CHỈNH MẪU VÀ NHẬN DẠNG TRONG NHẬP ĐIỂM TỰ ĐỘNG” với mong muốn phần nào giải quyết. Hiệu chỉnh mẫu và nhận dạng trong nhập điểm tự động Lê Quốc Tuấn Trường Đại học Công nghệ Khoa Công nghệ Thông tin