Xử lý ảnh là một khoa học còn tương đối mới mẻ so với nhiều ngành khoa học khác, nhất là trên quy mô công nghiệp, song trong xử lý ảnh đã bắt đầu xuất hiện những máy tính chuyên dụng. Nhận dạng là một trong những bộ phận quan trọng của xử lý ảnh và đã được ứng dụng rất hiệu quả trong nhiều lĩnh vực khác nhau như y tế, quốc phòng, nghiên cứu vũ trụ. Mục đích của khóa luận này là nghiên cứu và áp dụng xử lý ảnh vào việc nhận dạng tự động phiếu điều tra. Từ đó làm nền tảng cho việc xây dựng và phát triển hệ thống tổ chức điều tra. Trong các cuộc điều tra, chúng tôi nhận thấy rằng: Việc xử lý kết quả điều tra một cách thủ công thì rất tốn công sức, khả năng nhầm lẫn cao, đặc biệt là trong các cuộc điều tra quy mô lớn. Ví dụ: trong một cuộc điều tra dân số, số phiếu điều tra lên tới hàng trăm nghìn bản. Nếu công việc xử lý kết quả điều tra được tự động hóa thì hiệu quả hơn rất nhiều. Trên thực tế đã có một số hệ thống nhận dạng được cứng hóa phục vụ cho một số mục đích nhất định như: các máy xác định kết quả bầu cử tổng thống ở Mỹ…Và cũng có những sản phẩm phần mềm nhận dạng như : nhận dạng kết quả chấm thi trắc nghiệm…Tuy vậy, những hệ thống này mang tính đặc thù cao, khó áp dụng đồng thời cho nhiều mục đích khác nhau. Do đó chúng tôi có ý tưởng xây dựng một hệ thống nhận dạng tự động phiếu điều tra nhằm mục tiêu có được một hệ thống nhận dạng dễ áp dụng, dùng chung, tốc độ nhanh, với độ chính xác cao. Mặc dù tôi đã hết sức cố gắng trong việc thu thập và nghiên cứu tài liệu, tìm hiểu ngôn ngữ cài đặt nhưng thời gian không cho phép và trình độ còn hạn chế, bên cạnh đó thì tài liệu hết sức nghèo nàn nên sẽ không tránh khỏi sai sót. Vì vậy, tôi rất mong nhận được sự đánh giá đóng góp, bổ sung và khuyến khích của thầy giáo hướng dẫn, các thầy cô giáo trong khoa Công Nghệ Thông Tin cùng các bạn để tôi có thể hoàn thành tốt khoá luận của mình. Cuối cùng tôi xin bày tỏ lòng biết ơn chân thành tới sự hướng dẫn và chỉ bảo tận tình của thầy giáo Lê Văn Bằng cùng các thầy cô giáo trong khoa Công Nghệ Thông Tin đã giúp đỡ trong quá trình thực hiện khoá luận này. Vinh, tháng 5 năm 2006. Sinh viên thực hiện: Lê Văn Vinh 43 A CNTT Tóm tắt Xử lý ảnh là một trong những lĩnh vực có nhiều ứng dụng thiết thực trong thực tế. Khoá luận này trình bày một ứng dụng của xử lý ảnh vào tự động nhận dạng phiếu trả lời trong các cuộc điều tra xã hội. Chúng tôi nhận thấy đây là một hệ thống có nhiều ý nghĩa thực tiễn và có khả năng ứng dụng cao. Khoá luận trình bày về hệ thống xử lý tự động phiếu điều tra, bao gồm các nội dung sau: Chương 1 trình bày cơ sở lý thuyết của xử lý ảnh, bao gồm các khái niệm cơ bản, các kỹ thuật thông dụng trong xử lý và nhận dạng ảnh. Chương 2 đi sâu vào thiết kế phiếu điều tra và các thuật toán nhận dạng phiếu điều tra. Chương 3 khái quát về các chức năng của hệ thống xử lý phiếu điều tra. Chương 4 trình bày các kết quả thực nghiệm của quá trình thiết kế mẫu và nhận dạng phiếu trả lời câu hỏi điều tra. Chương 5 là chương kết luận, nêu một số thành quả thu được và hướng phát triển trong tương lai của đề tài.
KHÓA LUẬN TỐT NGHIỆP XỬ LÝ TỰ ĐỘNG PHIẾU ĐIỀU TRA Đề tài: XỬ LÝ TỰ ĐỘNG PHIẾU ĐIỀU TRA Lời nói đầu Xử lý ảnh khoa học tương đối mẻ so với nhiều ngành khoa học khác, quy mô công nghiệp, song xử lý ảnh bắt đầu xuất máy tính chuyên dụng Nhận dạng phận quan trọng xử lý ảnh ứng dụng hiệu nhiều lĩnh vực khác y tế, quốc phòng, nghiên cứu vũ trụ Mục đích khóa luận nghiên cứu áp dụng xử lý ảnh vào việc nhận dạng tự động phiếu điều tra Từ làm tảng cho việc xây dựng phát triển hệ thống tổ chức điều tra Trong điều tra, nhận thấy rằng: Việc xử lý kết điều tra cách thủ công tốn công sức, khả nhầm lẫn cao, đặc biệt điều tra quy mô lớn Ví dụ: điều tra dân số, số phiếu điều tra lên tới hàng trăm nghìn Nếu công việc xử lý kết điều tra tự động hóa hiệu nhiều Trên thực tế có số hệ thống nhận dạng cứng hóa phục vụ cho số mục đích định như: máy xác định kết bầu cử tổng thống Mỹ…Và có sản phẩm phần mềm nhận dạng : nhận dạng kết chấm thi trắc nghiệm…Tuy vậy, hệ thống mang tính đặc thù cao, khó áp dụng đồng thời cho nhiều mục đích khác Do có ý tưởng xây dựng hệ thống nhận dạng tự động phiếu điều tra nhằm mục tiêu có hệ thống nhận dạng dễ áp dụng, dùng chung, tốc độ nhanh, với độ xác cao Mặc dù cố gắng việc thu thập nghiên cứu tài liệu, tìm hiểu ngôn ngữ cài đặt thời gian không cho phép trình độ hạn chế, bên cạnh tài liệu nghèo nàn nên không tránh khỏi sai sót Vì vậy, mong nhận đánh giá đóng góp, bổ sung khuyến khích ĐẠI HỌC VINH KHOA CÔNG NGHỆ KHÓA LUẬN TỐT NGHIỆP XỬ LÝ TỰ ĐỘNG PHIẾU ĐIỀU TRA thầy giáo hướng dẫn, thầy cô giáo khoa Công Nghệ Thông Tin bạn để hoàn thành tốt khoá luận Cuối xin bày tỏ lòng biết ơn chân thành tới hướng dẫn bảo tận tình thầy giáo Lê Văn Bằng thầy cô giáo khoa Công Nghệ Thông Tin giúp đỡ trình thực khoá luận Vinh, tháng năm 2006 Sinh viên thực hiện: Lê Văn Vinh 43 A CNTT Tóm tắt Xử lý ảnh lĩnh vực có nhiều ứng dụng thiết thực thực tế Khoá luận trình bày ứng dụng xử lý ảnh vào tự động nhận dạng phiếu trả lời điều tra xã hội Chúng nhận thấy hệ thống có nhiều ý nghĩa thực tiễn có khả ứng dụng cao Khoá luận trình bày hệ thống xử lý tự động phiếu điều tra, bao gồm nội dung sau: Chương trình bày sở lý thuyết xử lý ảnh, bao gồm khái niệm bản, kỹ thuật thông dụng xử lý nhận dạng ảnh Chương sâu vào thiết kế phiếu điều tra thuật toán nhận dạng phiếu điều tra Chương khái quát chức hệ thống xử lý phiếu điều tra Chương trình bày kết thực nghiệm trình thiết kế mẫu nhận dạng phiếu trả lời câu hỏi điều tra Chương chương kết luận, nêu số thành thu hướng phát triển tương lai đề tài ĐẠI HỌC VINH KHOA CÔNG NGHỆ KHÓA LUẬN TỐT NGHIỆP XỬ LÝ TỰ ĐỘNG PHIẾU ĐIỀU TRA Mục lục Lời nói đầu……… …………… …………………… CHƯƠNG Các vấn đề xử lý ảnh…………………… 1.1 Tổng quan hệ thống xử lý ảnh……………………… 1.2 Các vấn đề xử lý ảnh…………………………… 1.2.1 Một số khái niệm ………………………………………… 1.2.2 Biểu diễn ảnh………………………………………………… 1.2.3 Tăng cường ảnh – khôi phục ảnh…….……………………… 1.2.4 Nhận dạng ảnh……………………………………………… 1.3 Thu nhận ảnh…………………………………………………… 1.3.1 Thiết bị thu nhận ảnh………………………………………… 1.3.2 Biểu diễn màu……………………………………………… 1.3.3 Hệ tọa độ màu……………………………………………… 1.4 Các kỹ thuật xử lý ảnh bản………………………………… 1.4.1 Nhị phân hóa……………………………………………… 1.4.2 Khử nhiễu………………………………………………… 1.4.3 Làm trơn biên, lấp đầy chỗ trống…………………………… 1.4.4 Đường thẳng Hough………………………………………… 1.4.5 Chỉnh độ nghiêng ảnh…………………………………… CHƯƠNG 2: Nhận dạng phiếu điều tra……………………………… 4 5 7 8 9 10 10 11 11 12 14 2.1 Mô tả toán………………………………………………… 2.2 Thiết kế mẫu phiếu điều tra…………………………………… 2.3 Kỹ thuật nhận dạng chung phiếu điều tra…………………… 2.3.1 Các tham số cần thiết……………………………………… 2.3.2 Nhận dạng đường thẳng dày……………………………… 2.3.3 Chỉnh độ nghiêng…………………………………………… 2.3.4 Nhận dạng khung…………………………………………… 2.4 Kĩ thuật nhận dạng mẫu phiếu trả lời loại 1…………………… 2.4.1 Tách dòng…………………………………………………… 2.4.2 Tách ô……………………………………………………… 2.4.3 Nhận dạng ô chọn…………………………………… 2.5 Kĩ thuật nhận dạng mẫu phiếu trả lời loại 2………………… 2.5.1 Tách dòng………………………………………………… 2.5.2 Tách ô……………………………………………………… 2.5.3 Nhận dạng ô chọn……………………………… CHƯƠNG 3:Thử nghiệm xây dựng phần mềm tổ chức điều tra…… 15 15 19 19 20 21 23 24 24 25 26 27 27 28 29 3.1 Mô tả điều tra……………………………………… 3.1.1 Xác định mục tiêu điều tra………………………………… 3.1.2 Phân loại câu hỏi điều tra…………………………………… ĐẠI HỌC VINH 31 31 32 KHOA CÔNG NGHỆ KHÓA LUẬN TỐT NGHIỆP XỬ LÝ TỰ ĐỘNG PHIẾU ĐIỀU TRA 3.2 Xây dựng chức hệ thống tổ chức điều tra…… 3.2.1 Mục tiêu hệ thống tổ chức điều tra…………………… 3.2.2 Yêu cầu kỹ thuật…………………………………………… 3.2.3 Các yêu cầu chức hệ thống………………… 3.2.4 Biểu đồ phân rã chức năng………………………………… 3.2.5 Đặc tả chi tiết chức …………………………… 3.2.6 Các hồ sơ tài liệu sử dụng hệ thống…………… 3.2 Bảng phân tích thực thể chức năng……………………… 3.2.8 Biểu đồ luồng liệu mức 0……………………………… 3.2.9 Biểu đồ luồng liệu mức tiến trình “1 Tạo phiếu điều tra”………………………………………………… 3.2.10 Biểu đồ luồng liệu mức tiến trình “1.4 In phiếu điều tra, phiếu trả lời”…………………………………… 3.2.11 Biểu đồ luồng liệu mức tiến trình “2 Đọc phiếu trả lời 3.2.12 Biểu đồ luồng liệu mức tiến trình “3 Phân tích kết 34 34 34 35 37 39 40 41 43 44 45 46 điều ra” CHƯƠNG 4: Thực nghiệm tạo mẫu ……………………………… 46 4.1 Thực nghiệm tạo mẫu phiếu trả lời………………………… 4.1.1 Các yêu cầu mẫu phiếu trả lời……………………… 4.1.2 Thực nghiệm tạo mẫu…………………………………… 4.2 Thực nghiệm xác định ngưỡng trắng……………………… 4.3 Thực nghiệm xác định ngưỡng nhận dạng đường thẳng dày 4.3.1 Ngưỡng dài………………………………………………… 4.3.2 Ngưỡng nghiêng…………………………………………… 4.4 Thực nghiệm xác định ngưỡng nhận dạng khung… 4.4.1 Ngưỡng xác định cạnh ngang trên………………………… 4.4.2 Ngưỡng xác định cạnh bên…………………………… 4.5 Thực nghiệm nhận dạng mẫu phiếu trả lời loại 1……… 4.5.1 Nhận dạng dòng…………………………………………… 4.5.2 Nhận dạng ô……………………………………………… 4.5.3 Nhận dạng ô tích……………………………………… 4.6 Thực nghiệm nhận dạng phiếu trả lời loại 2…………… 4.6.1 Nhận dạng dòng…………………………………………… 4.6.2 Thực nghiệm xác định ô…………………………………… 4.6.3 Nhận dạng ô tích…………………………………… 4.7 Thực nghiệm nhận dạng hai loại mẫu phiếu trả lời………… 4.7.1 Thực nghiệm nhận dạng đường thẳng dày………………… 4.7.2 Thực nghiệm xoay ảnh…………………………………… 4.7.3 Thực nghiệm nhận dạng khung……………………… 4.7.4 Thực nghiệm nhận dạng mẫu phiếu trả lời loại 1…… 47 47 48 52 53 53 54 54 54 55 55 55 56 57 57 57 59 59 61 61 62 62 63 ĐẠI HỌC VINH KHOA CÔNG NGHỆ KHÓA LUẬN TỐT NGHIỆP XỬ LÝ TỰ ĐỘNG PHIẾU ĐIỀU TRA 4.7.5 Thực nghiệm nhận dạng mẫu phiếu trả lời loại 2…… 4.8 So sánh kết thực nghiệm hai loại mẫu phiếu trả lời CHƯƠNG 5: Kết luận……………………………………… ……… 66 68 Phụ lục……………………………………………………….……… Tài liêụ tham khảo…………………………………………………… Chương 1: Các vấn đề xử lý ảnh 1.1 Tổng quan hệ thống xử lý ảnh Để hình dung cấu hình hệ thống xử lý ảnh chuyên dụng hay hệ thống xử lý ảnh dùng nghiên cứu, đào tạo, trước hết xem xét bước cần thiết xử lý ảnh ĐẠI HỌC VINH KHOA CÔNG NGHỆ KHÓA LUẬN TỐT NGHIỆP XỬ LÝ TỰ ĐỘNG PHIẾU ĐIỀU TRA Lưu trữ Scanner Thu nhận ảnh Số hóa Phân tích ảnh Nhận dạng Camera Lưu trữ Hệ định Hình 1.1 Các giai đoạn xử lý ảnh Trước hết trình thu nhận ảnh Ảnh thu nhận qua camera Thường ảnh thu nhận qua camera tín hiệu tương tự (loại camera ống kiểu CCIR), tín hiệu số hóa (loại CCD – Charge Coupled Devide) Ảnh thu nhận từ vệ tinh qua cảm ứng (sensor), hay ảnh, tranh quét scanner Chi tiết trình thu nhận ảnh mô tả mục 1.3 Tiếp theo trình số hóa (Digitalizer) để biến đổi tín hiệu tương tự sang tín hiệu rời rạc (lấy mẫu) số hóa lượng hóa, trước chuyển sang giai đoạn xử lý, phân tích hay lưu trữ lại Quá trình phân tích ảnh thực chất bao gồm nhiều công đoạn nhỏ Trước hết công việc tăng cường ảnh để nâng cao chất lượng ảnh Do nguyên nhân khác nhau: chất lượng thiết bị thu nhận ảnh, nguồn sáng hay nhiễu, ảnh bị suy biến Do cần phải tăng cường khôi phục lại ảnh để làm bật số đặc tính ảnh, hay làm cho ảnh gần giống với trạng thái gốc – trạng thái trước ảnh bị biến dạng Giai đoạn phát đặc tính biên, phân vùng ảnh, trích chọn đặc tính, v.v… Cuối cùng, tùy theo mục đích ứng dụng, giai đoạn nhận dạng, phân lớp hay định khác Các giai đoạn trình xử lý ảnh mô tả hình 1.1 ĐẠI HỌC VINH KHOA CÔNG NGHỆ KHÓA LUẬN TỐT NGHIỆP XỬ LÝ TỰ ĐỘNG PHIẾU ĐIỀU TRA 1.2 Các vấn đề xử lý ảnh Như đề cập phần giới thiệu, thấy cách khái quát vấn đề xử lý ảnh Để hiểu chi tiết hơn, trước tiên ta xem xét hai khái niệm (thuật ngữ) thường dùng xử lý ảnh, Pixel (phần tử ảnh) Grey level (mức xám), tóm tắt vấn đề 1.2.1 Một số khái niệm • Pixel (Picture Element): phần tử ảnh Ảnh thực tế ảnh liên tục không gian giá trị độ sáng Để xử lý ảnh máy tính cần thiết phải tiến hành số hóa ảnh Trong trình số hóa, người ta biến đổi tín hiệu liên tục sang tín hiệu rời rạc thông qua trình lấy mẫu (rời rạc hóa không gian) lượng hóa thành phần giá trị mà nguyên tắc mắt thường không phân biệt hai điểm kề Trong trình này, người ta sử dụng khái niệm Picture element mà ta quen gọi hay viết Pixel – phần tử ảnh Như vậy, ảnh tập hợp pixel Ở cần phân biệt khái niệm pixel hay đề cập đến hệ thống đồ họa máy tính Để tránh nhầm lẫn ta tạm gọi khái niệm pixel pixel thiết bị Khái niệm pixel thiết bị xem xét sau: ta quan sát hình (trong chế độ đồ họa), hình không liên tục mà gồm nhiều điểm nhỏ, gọi pixel Mỗi pixel gồm cặp tọa độ (x, y) màu ĐẠI HỌC VINH KHOA CÔNG NGHỆ KHÓA LUẬN TỐT NGHIỆP a Ảnh với độ phân giải 72 dpi XỬ LÝ TỰ ĐỘNG PHIẾU ĐIỀU TRA b Ảnh với độ phân giải 36 dpi Hình 1.2 Biểu diễn ảnh với độ phân giải khác Cặp tọa độ (x, y) tạo nên độ phân giải (resolution) Như hình máy tính có nhiều loại với độ phân giải khác nhau: hình CGA có độ phân giải 320 x 320; hình VGA 640 x 350,… Như vậy, ảnh tập hợp điểm ảnh Khi số hóa, thường biểu diễn bảng hai chiều I(n, p): n dòng p cột Ta nói ảnh gồm n x p pixels Người ta thường ký hiệu I(x, y) để pixel Hình 1.2 cho ta thấy việc biểu diễn ảnh với độ phân giải khác Một pixel lưu trữ 1, 4, hay 24 bit • Gray level: Mức xám Mức xám kết mã hóa tương ứng cường độ sáng điểm ảnh với giá trị số - kết trình lượng hóa Cách mã hóa kinh điển thường dùng 16, 32 hay 64 mức Mã hóa 256 mức phổ dụng lý kỹ thuật Vì 2^8 = 256 (0, 1, …, 255), nên với 256 mức, pixel mã hóa bit 1.2.2 Biểu diễn ảnh Trong biểu diễn ảnh, người ta thường dùng phần tử đặc trưng ảnh pixel Nhìn chung xem hàm hai biến chứa thông tin biểu diễn ảnh Các mô hình biểu diễn ảnh cho ta mô tả logic hay định lượng tính chất hàm Trong biểu diễn ảnh cần ý tính trung thực ảnh tiêu chuẩn “thông minh” để đo chất lượng ảnh tính hiệu kỹ thuật xử lý Việc xử lý ảnh số yêu cầu ảnh phải mẫu hóa lượng tử hóa Thí dụ ảnh ma trận 512 dòng gồm khoảng 512 x 512 pixel Việc lượng tử hóa ảnh chuyển đổi tín hiệu tương tự sang tín hiệu số (Analog Digital Convert) ảnh lấy mẫu sang số hữu hạn mức xám ĐẠI HỌC VINH KHOA CÔNG NGHỆ KHÓA LUẬN TỐT NGHIỆP XỬ LÝ TỰ ĐỘNG PHIẾU ĐIỀU TRA Một số mô hình thường dùng biểu diễn ảnh: mô hình toán, mô hình thống kê Trong mô hình toán, ảnh hai chiều biểu diễn nhờ hàm hai biến trực giao gọi hàm sở Với mô hình thống kê, ảnh coi phần tử tập hợp đặc trưng đại lượng như: kỳ vọng toán học, hiệp biến, phương sai, moment 1.2.3 Tăng cường ảnh – khôi phục ảnh Tăng cường ảnh bước quan trọng, tạo tiền đề cho xử lý ảnh Nó gồm loạt kỹ thuật như: lọc độ tương phản, khử nhiễu, màu, v.v… 2.2.4 Nhận dạng ảnh Nhận dạng ảnh trình liên quan đến mô tả đối tượng mà người ta muốn đặc tả Quá trình nhận dạng thường sau trình trích chọn đặc tính chủ yếu đối tượng Có hai kiểu mô tả đối tượng: - Mô tả tham số (nhận dạng theo tham số) - Mô tả theo cấu trúc (nhận dạng theo cấu trúc) Trên thực tế, người ta áp dụng kỹ thuật nhận dạng thành công với nhiều đối tượng khác như: nhận dạng ảnh vân tay, nhận dạng chữ (chữ cái, chữ số, chữ có dấu) Ngoài ra, kỹ thuật nhận dạng dựa vào kỹ thuật mạng nơron áp dụng cho kết khả quan 1.3 Thu nhận ảnh 1.3.1 Thiết bị thu nhận ảnh Các thiết bị thu nhận ảnh cho ảnh trắng đen B/W (Black & White) với mật độ từ 400 đến 1600 dpi (dot per inch) ảnh màu 600 dpi Với ảnh B/W mức màu Với ảnh đa cấp xám, mức xám biến thiên từ đến 255 Ảnh ĐẠI HỌC VINH KHOA CÔNG NGHỆ KHÓA LUẬN TỐT NGHIỆP 10 XỬ LÝ TỰ ĐỘNG PHIẾU ĐIỀU TRA màu, điểm ảnh lưu trữ bytes ta có x màu (cỡ 16,7 triệu màu) Khi dùng scanner, dòng photodiot quét ngang ảnh (quét theo hàng) cho ảnh với độ phân giải ngang tốt Đầu scanner ảnh ma trận số mà ta quen gọi đồ ảnh (ảnh Bitmap), số hóa (digitalizer) tạo ảnh vectơ có hướng Trong xử lý ảnh máy tính, ta không nói đến thiết bị monitor (màn hình) để ảnh Monitor có nhiều loại khác nhau: - CGA: 640 x 320 x 16 màu, - EGA: 640 x 350 x 16 màu, - VGA: 640 x 480 x 16 màu, - SVGA: 1024 x 768 x 256 màu Với ảnh màu, có nhiều cách tổ hợp màu khác Theo lý thuyết màu Thomas đưa từ năm 1802, màu tổ hợp từ màu bản: Red (đỏ), Green (lục) Blue (lơ) Thiết bị ảnh máy đen trắng, máy in màu hay máy vẽ (ploter) Máy vẽ có nhiều loại: loại dùng bút, loại phun mực Nhìn chung, hệ thống thu nhận ảnh thực hai trình: - Cảm biến: biến đổi lượng quang học (ánh sáng) thành lượng điện - Tổng hợp lượng điện thành ảnh 1.3.2 Biểu diễn màu Ánh sáng màu tổ hợp ánh sáng đơn sắc Mắt người cảm nhận vài chục màu, song lại phân biệt hàng ngàn màu Có thuộc tính chủ yếu cảm nhận màu: - Brighness: sắc màu, gọi độ chói ĐẠI HỌC VINH KHOA CÔNG NGHỆ KHÓA LUẬN TỐT NGHIỆP 63 XỬ LÝ TỰ ĐỘNG PHIẾU ĐIỀU TRA Nếu số điểm đen ô lớn ngưỡng số điểm đen tối thiểu ô ô đánh dấu Từ thực nghiêm, có ngưỡng số điểm đen tối thiểu trên: + Với lựa chọn A: 140 + Với lựa chọn B: 150 + Với lựa chọn C: 140 + Với lựa chọn D: 150 4.7 Thực nghiệm nhận dạng hai loại mẫu phiếu trả lời Ở phần trên, thực nghiệm để tạo mẫu tìm kiếm giá trị tốt cho tham số dùng để nhận dạng phiếu Phần này, trình bày cụ thể trình thực nghiệm mẫu tạo trên, sử dụng tham số nhận dạng xác định Cả hai loại mẫu phiếu trả lởi có trình nhận dạng đường thẳng dày, xoay ảnh, nhận dạng khung giống Chúng khác giai đoạn tách dòng, tách ô nhận dạng ô đươc tích Do đó, trình thực nghiệm diễn sau: 4.7.1 Thực nghiệm nhận dạng đường thẳng dày Với đường thẳng dày có độ dài 15 cm, độ dày pt, ngưỡng xác định độ dài 9/10 độ dài thực tế, ngưỡng nghiêng 20 , ta có kết thực nghiệm: - Thời gian nhận dạng: 0.03 s - Độ xác: 99% Hình 5.3 mô tả ví dụ nhận dạng đường thẳng dày ĐẠI HỌC VINH KHOA CÔNG NGHỆ KHÓA LUẬN TỐT NGHIỆP 64 XỬ LÝ TỰ ĐỘNG PHIẾU ĐIỀU TRA Hình 5.3 Đường thẳng dày 4.7.2 Thực nghiệm xoay ảnh Với ảnh có độ nghiêng 20 , ta có kết thực nghiệm: - Thời gian xoay: 0.02 s - Độ xác: 100% Hình 5.4 Xoay ảnh 4.7.3 Thực nghiệm nhận dạng khung Với mẫu có khung, độ dày cạnh pt, ngưỡng xác định độ dài 9/10 độ dài thực tế, ta có kết thực nghiêm: ĐẠI HỌC VINH KHOA CÔNG NGHỆ KHÓA LUẬN TỐT NGHIỆP 65 XỬ LÝ TỰ ĐỘNG PHIẾU ĐIỀU TRA - Thời gian nhận dạng: 0.25 s - Độ xác: 99% Hình 5.5 Khung 4.7.4 Thực nghiệm nhận dạng mẫu phiếu trả lời loại 4.7.4.1 Thực nghiệm tách dòng Với ngưỡng xác định bắt đầu dòng pixel, ngưỡng chiều cao tối thiểu dòng 25 pixel, ngưỡng chiều cao tối đa dòng 40 pixel, ta có kết thực nghiệm: - Thời gian nhận dạng: 0.01 s - Độ xác: 99% ĐẠI HỌC VINH KHOA CÔNG NGHỆ KHÓA LUẬN TỐT NGHIỆP 66 XỬ LÝ TỰ ĐỘNG PHIẾU ĐIỀU TRA Hình 5.6 Tách dòng 4.7.4.2 Thực nghiệm tách ô Với ngưỡng xác định bắt đầu ô pixel, ngưỡng độ rộng tối thiểu ô 25 pixel, ngưỡng độ rộng tối đa ô 40 pixel, ta có kết thực nghiệm: - Thời gian nhận dạng: 0.01 s - Độ xác: 99% Hình 5.7 Tách ô ĐẠI HỌC VINH KHOA CÔNG NGHỆ KHÓA LUẬN TỐT NGHIỆP 67 XỬ LÝ TỰ ĐỘNG PHIẾU ĐIỀU TRA 4.7.4.3 Thực nghiệm xác định ô tích Với ngưỡng độ chênh lệch điểm đen để xác định ô tích 41 pixel, ta có kết thực nghiệm: - Thời gian nhận dạng: 0.005 - Độ xác: 99% Hình 5.8 Kết 4.7.4.4 Kết thực nghiệm nhận dạng phiếu trả lời loại Chạy thử toàn phiếu trả lời loại có kết sau: - Môi trường thực nghiệm: CPU 1Ghz, RAM 256 Mb - Số phiếu: 50 - Thời gian nhận dạng trung bình phiếu: 0.98 giây - Độ xác trung bình : 99 % ĐẠI HỌC VINH KHOA CÔNG NGHỆ KHÓA LUẬN TỐT NGHIỆP 68 XỬ LÝ TỰ ĐỘNG PHIẾU ĐIỀU TRA 4.7.5 Thực nghiệm nhận dạng mẫu phiếu trả lời loại 4.7.5.1 Thực nghiệm tách dòng Với ngưỡng xác định bắt đầu dòng pixel, ngưỡng chiều cao tối thiểu dòng pixel, ngưỡng chiều cao tối đa dòng 20 pixel, ta có kết thực nghiệm: - Thời gian xác định: 0.01 s - Độ xác : 99% Hình 5.9 Tách dòng 4.7.5.2 Thực nghiệm tách ô - Thời gian tách ô: không đáng kể - Độ xác : 100% ĐẠI HỌC VINH KHOA CÔNG NGHỆ KHÓA LUẬN TỐT NGHIỆP 69 XỬ LÝ TỰ ĐỘNG PHIẾU ĐIỀU TRA Hình 5.10 Tách dòng 4.7.5.3 Thực nghiệm xác định ô tích Với diên tích vùng xét 20 pixel*20 pixel, ngưỡng điểm đen tối thiểu ngưỡng điểm đen tối thiểu ứng với trường hợp tích, ngưỡng diện tích vùng tích 150 (pixel*pixel), có kết thực nghiệm: - Thời gian nhận dạng: 0.02 s - Độ xác :99% ĐẠI HỌC VINH KHOA CÔNG NGHỆ KHÓA LUẬN TỐT NGHIỆP 70 XỬ LÝ TỰ ĐỘNG PHIẾU ĐIỀU TRA Hình 5.11 Kết 4.7.5.4 Kết thực nghiệm nhận dạng phiếu trả lời loại Chạy thử toàn phiếu trả lời loại có kết sau: - Môi trường thực nghiệm: CPU 1Ghz, RAM 256 Mb - Số phiếu: 50 - Thời gian nhận dạng trung bình phiếu: 1.2 s - Độ xác: 99 % 4.8 So sánh kết thực nghiệm hai loại mẫu phiếu trả lời Từ thực nghiệm, rút nhận xét sau: - mẫu cho kết nhận dạng có độ xác cao, tốc độ nhận dạng nhanh - Kỹ thuật xác định vị trí ô áp dụng mẫu phiếu loại có độ xác cao kỹ thuật tìm vị trí ô mẫu phiếu loại ĐẠI HỌC VINH KHOA CÔNG NGHỆ KHÓA LUẬN TỐT NGHIỆP 71 XỬ LÝ TỰ ĐỘNG PHIẾU ĐIỀU TRA - Tốc độ nhận dạng mẫu loại nhanh chút so với tốc độ nhận dạng phiếu loại - Độ xác nhận dạng phiếu loại cao phiếu loại - Kỹ thuật nhận dạng phiếu loại cho độ xác cao với câu hỏi có nhiều tùy chọn Phiếu loại áp dụng cho câu hỏi có lựa chọn ĐẠI HỌC VINH KHOA CÔNG NGHỆ KHÓA LUẬN TỐT NGHIỆP 72 XỬ LÝ TỰ ĐỘNG PHIẾU ĐIỀU TRA Chương 6: Kết luận Trong Khoá luận này, thực công việc sau: • Nghiên cứu áp dụng kỹ thuật xử lý ảnh nhận dạng phiếu điều tra • Nghiên cứu phát triển số thuật toán áp dụng cho nhận dạng hai mẫu phiếu trả lời • Phân tích sơ chức hệ thống hỗ trợ tổ chức điều tra xã hội học • Viết chương trình nhận dạng thực nghiệm hai mẫu phiếu trả lời Kết thực nghiệm khả quan: - Với phiếu trả lời loại 1, thời gian nhận dạng trung bình phiếu s, độ xác 99% - Với phiếu trả lời loại 2, thời gian nhận dạng trung bình phiếu 1.2 s, độ xác 99% Kết luận: - Hệ thống xây dựng có tính khả thi cao - Cả hai mẫu phiếu trả lời thiết kế, thử nghiệm cho kết tốt - Độ phân giải phù hợp quét ảnh 150 dpi Hướng phát triển Khoá luận tương lai: • Nâng cao hiệu độ xác việc nhận dạng phiếu điều tra • Tìm hiểu sâu kiến thức nghiệp vụ điều tra • Phát triển hoàn thiện chức khác hệ thống tổ chức điều tra xã hội ĐẠI HỌC VINH KHOA CÔNG NGHỆ KHÓA LUẬN TỐT NGHIỆP XỬ LÝ TỰ ĐỘNG PHIẾU ĐIỀU TRA 73 Phụ lục Giới thiệu thư viện OPENCV OpenCV (Open Source Computer Vision Library) thư viện mã nguồn mở viết C C++, cung cấp hàm liên quan đến thao tác ảnh thực số thuật toán thông dụng xử lý ảnh Dưới đây, xem xét số cấu trúc hàm thông dụng Cấu trúc IplImage typedef struct _IplImage { int nSize; /* sizeof(IplImage) */ int ID; /* version (=0)*/ int nChannels; int alphaChannel; int depth; /* pixel depth in bits */ char colorModel[4]; char channelSeq[4]; int dataOrder; int origin; int align; /* Alignment of image rows (4 or 8) */ int width; /* image width in pixels */ int height; /* image height in pixels */ struct _IplROI *roi;/* poniter to ROI if any */ struct _IplImage *maskROI; /* must be NULL in OpenCV */ void *imageId; /* ditto */ struct _IplTileInfo *tileInfo; /* ditto */ int imageSize; char *imageData; /* useful size in bytes */ /* pointer to aligned image data */ ĐẠI HỌC VINH KHOA CÔNG NGHỆ KHÓA LUẬN TỐT NGHIỆP int XỬ LÝ TỰ ĐỘNG PHIẾU ĐIỀU TRA widthStep; 74 /* size of aligned image row in bytes */ int BorderMode[4]; /* border completion mode, ignored by OpenCV */ int BorderConst[4]; /* ditto */ char *imageDataOrigin; /* pointer to full, nonaligned image */ }IplImage; Cấu trúc IplImage có nguồn gốc từ thư viện IPL (Image Processing Library) Ở mô tả số trường hay dùng ứng dụng: • width height độ rộng cao ảnh tính theo pixel • depth lưu thông tin số bit dùng để lưu pixel Giá trị depth IPL_DEPTH_8U, IPL_DEPTH_8S, IPL_DEPTH_16S, IPL_DEPTH_32S IPL_DEPTH_32F • widthStep số byte nằm điểm có cột hai hàng kề Trường width khoảng cách hai hàng kề nhau, dòng cho thẳng hàng cách thêm khoảng trống điểm cuối dòng thứ i điểm đầu dòng (i + 1) Điều cốt để tốc độ xử lý ảnh nhanh • imageSize số kích cỡ ảnh tính theo byte dòng Thực chất imageSize = widthStep x height • imageData trỏ tới liệu ảnh • imageDataOrigin trỏ tới liệu chưa Cấu trúc CvPoint typedef struct CvPoint { int x; /* x-coordinate, usually zero-based */ ĐẠI HỌC VINH KHOA CÔNG NGHỆ KHÓA LUẬN TỐT NGHIỆP 75 XỬ LÝ TỰ ĐỘNG PHIẾU ĐIỀU TRA int y; /* y-coordinate, usually zero-based */ } CvPoint; Cấu trúc CvPoint mô tả tọa độ không gian chiều Hàm cvLoadImage Đọc ảnh từ file IplImage* cvLoadImage( const char* filename, int iscolor CV_DEFAULT(1)); filename tên file ảnh cần nạp iscolor Nếu > 0, ảnh nạp luôn có kênh (channel).; Nếu 0, ảnh nạp có kênh; Nếu < 0, ảnh nạp với số kênh phụ thuộc vào file ảnh Hàm cvLoadImage đọc ảnh từ file trả trỏ tới ảnh Hiện tại, OpenCV hỗ trợ loại ảnh sau: Windows bitmaps - BMP, DIB; JPEG files - JPEG, JPG, JPE; Portable Network Graphics - PNG; Portable image format - PBM, PGM, PPM; Sun rasters - SR, RAS; TIFF files - TIFF, TIF Hàm cvSaveImage Ghi ảnh file int cvSaveImage(const char* filename, const CvArr* image ); filename Tên file image Ảnh cần ghi ĐẠI HỌC VINH KHOA CÔNG NGHỆ KHÓA LUẬN TỐT NGHIỆP 76 XỬ LÝ TỰ ĐỘNG PHIẾU ĐIỀU TRA Hàm cvNamedWindow Tạo cửa sổ hiển thị ảnh int cvNamedWindow( const char* name, unsigned long flags ); name Tên cửa sổ, dùng định danh cửa sổ xuất tiêu đề cửa sổ flags Định nghĩa thuộc tính cửa sổ Đặt CV_WINDOW_AUTOSIZE cho phép tự động thay đổi kích thước cửa sổ (resize), ngược lại đặt Hàm cvDestroyWindow Giải phóng cửa sổ void cvDestroyWindow( const char* name ); name Tên cửa sổ cần giải phóng Hàm cvShowImage Hiển thị ảnh cửa sổ xác định void cvShowImage( const char* name, const CvArr* image ); name Tên cửa sổ image Ảnh cần hiển thị ĐẠI HỌC VINH KHOA CÔNG NGHỆ KHÓA LUẬN TỐT NGHIỆP 77 XỬ LÝ TỰ ĐỘNG PHIẾU ĐIỀU TRA Tài liệu tham khảo [1] Lương Mạnh Bá, Nguyễn Thanh Thủy Nhập môn xử lý ảnh số Nhà xuất khoa học kỹ thuật [2] Ian T Young, Jan J.Gerbrands, Lucas J van Vliet Image Processing Fundamentals [3] John C Russ The image processing handbook, third edition CRC Press [4] William K Pratt Digital Image Processing: PIKS Inside, Third Edition [5] Jaroslav Borovieka Circle detection using Hough transforms documentation [6] Ali Ajdari Rad, Karim Faez, Navid Qaragozlou Fast circle detection using Gradient pair vectors [7] Philippe Crochat, Daniel Franklin Back-Progagation Neural Network Tutorial ĐẠI HỌC VINH KHOA CÔNG NGHỆ ... Nhận dạng phiếu điều tra 2.1 Mô tả toán Bài toán bao gồm công đoạn: ĐẠI HỌC VINH KHOA CÔNG NGHỆ KHÓA LUẬN TỐT NGHIỆP 17 XỬ LÝ TỰ ĐỘNG PHIẾU ĐIỀU TRA - Đọc phiếu tự động - Nhận dạng kết tự động -... thống xử lý tự động phiếu điều tra, bao gồm nội dung sau: Chương trình bày sở lý thuyết xử lý ảnh, bao gồm khái niệm bản, kỹ thuật thông dụng xử lý nhận dạng ảnh Chương sâu vào thiết kế phiếu điều. .. trình xử lý ảnh mô tả hình 1.1 ĐẠI HỌC VINH KHOA CÔNG NGHỆ KHÓA LUẬN TỐT NGHIỆP XỬ LÝ TỰ ĐỘNG PHIẾU ĐIỀU TRA 1.2 Các vấn đề xử lý ảnh Như đề cập phần giới thiệu, thấy cách khái quát vấn đề xử lý