Microsoft Word Noi dung doc 1 PHẦN MỞ ĐẦU Lý do chọn đề tài Trong thời đại phát triển mạnh mẽ của công nghệ thông tin, khái niệm ảnh số đã trở nên thông dụng với hầu hết mọi người trong xã hội từ nhữn[.]
- - PHẦN MỞ ĐẦU Lý chọn đề tài Trong thời đại phát triển mạnh mẽ công nghệ thông tin, khái niệm ảnh số trở nên thông dụng với hầu hết người xã hội từ máy chụp ảnh cao cấp đến điện thoại di động tích hợp chụp ảnh việc thu nhận ảnh số dễ dàng hết Do đó, xử lý ảnh lĩnh vực người quan tâm môn học chuyên ngành sinh viên công nghệ thông tin nước Ngồi ra, xử lý ảnh cịn liên quan đến nhiều ngành khoa học khác hệ thống thông tin, nhận dạng (khuôn mặt, dấu vân tay, …) Đối với người chúng ta, việc học phân biệt khác ký tự thật dễ dàng để máy tính làm điều tương tự khơng dễ dàng chút nào, việc cần đến người có kiến thức tốt xử lý ảnh giúp máy tính học phân biệt ký tự kết lại không mong muốn Những hệ thống nhận dạng ký tự (OCR - Optical Character Recognition) phát triển hàng ngày với độ ổn định cao nhằm phục vụ cho xu hướng tự động hóa người Trong hệ thống nhận dạng biển số xe hệ thống quan trọng góp phần giải nạn kẹt xe tồn quốc gia có lưu lượng xe lưu thơng dày đặc sở hạ tầng không phát triển kịp để đáp ứng nhu cầu Bên cạnh đó, nhận dạng biển số xe ứng dụng nhiều thực tế Với bãi giữ xe, họ cần công cụ vừa giữ xe trả xe nhanh nhằm giảm tải kẹt xe vào cao điểm, vừa có độ an tồn cao để tránh trường hợp xe.Với trạm thu phí, họ cần công cụ giảm số lượng nhân công, với người quản lý tồn khu vực thu phí mà khơng cần tốn nhiều cơng sức.Với cảnh sát giao thông, họ cần công cụ giúp họ kiểm sốt số lượng xe lưu thơng đường xác định xác xe máy vi phạm giao thông mà không cần truy đuổi… Trên ví dụ điển hình khả ứng dụng hệ thống nhận dạng biển số xe - - Vì vậy, việc nghiên cứu hệ thống nhận dạng biển số xe tự động cần thiết có ý nghĩa lớn mặt ứng dụng, đáp ứng nhu cầu tự động hóa xã hội Từ yêu cầu đó, chúng em xin thực đề tài “Xây dựng chương trình nhận dạng biển số xe gắn máy tự động Việt Nam” Lịch sử nghiên cứu Trong xu tự động hóa, xử lý ảnh nói chung giải thuật nhận dạng nói riêng có vai trị quan trọng, nhân tố định đến thành công chương trình Nhận dạng biển số xe tự động vấn đề nhiều quốc gia quan tâm trở thành đề tài nóng hổi quốc gia phát triển theo hướng tự động hóa Vì điều đó, số cá nhân tập thể lĩnh vực xử lý ảnh nghiên cứu góc độ, khía cạnh, phương pháp khác Đầu tiên đề tài “Algorithmic and mathematical principles of automatic number plate recognition systems” (Ondrej Martinsky, BRNO University of Technology, 2007) Đề tài phần kế hoạch nghiên cứu “SecurityOriented reseach in information technology, msm 0021630528” đại học kỹ thuật BRNO Đề tài trình bày chi tiết bước nhận dạng ký tự, có so sánh phương pháp chọn phương pháp tốt cho công việc cụ thể Đề tài khơng đánh giá cao tỉ lệ nhận dạng thành công nhiều môi trường khác không cao Đề tài “Segmenting the license plate region using a color model” (Kaushik Deb and Kang-Huyn Jo, University of Ulsan, South Korea, 2002) đưa phương pháp xác định vùng biển số xe hoàn toàn cách sử dụng mơ hình màu HSI thành phần liên thông, ý tưởng đề tài dừng lại bước tách ký tự biển số mà không nghiên cứu giải thuật nhận dạng Đề tài “A real-time vehicle license plate region system” (Bar-Hen Ron, Israel Institute of Technology, 2002) tập trung nhiều xử lý mạng Nơron Đề tài cho ta thấy cách tính xác cho tham số điều kiện - - Bài báo “Pixel Clustering Based Partitioning Techique for Character Recognition in Vehicle License Plate” nhóm tác giả Siddhartha Choubey – G.R.Sinha – Bhagwati Charan Patel – Abha Choubey – Kavita Thakur đạt giải thi ICMLC 2011, tập trung trình bày hai giải thuật phân vùng ký tự, tách riêng ký tự theo phép chiếu ngang phép chiếu dọc Đề tài “Phân tích bố cục nhận dạng ảnh cơng văn tiếng Việt” (Võ Đại Bình – Nguyễn Thị Tú Mi – Nguyễn Thùy Giang, Trường Đại Học Nông Lâm TPHCM, 2002) trình bày tốt phân tách khối ảnh với tỉ lệ thành cơng cao, bên cạnh đề cập nhiều đến giải thuật tính góc nghiêng, quay ảnh tách ký tự văn Hình Hệ thống ORC phân tích bố cục văn Những đề tài nghiên cứu tài liệu tài liệu quý báu giúp chúng em định hướng nghiên cứu đề tài, từ chúng em rút phương pháp cần thiết tối ưu đề tài, tìm phương pháp để ứng dụng hoàn thành tốt đề tài chúng em Mục tiêu nghiên cứu Xây dựng chương trình nhận dạng biển số xe gắn máy từ ảnh chụp đầu vào hiển thị dạng văn Đối tượng nghiên cứu phạm vi nghiên cứu - Đối tượng nghiên cứu : biển số xe gắn máy Việt Nam - - - Phạm vi nghiên cứu : tất biển số xe gắn máy Việt Nam, có biển số ban hành Việt Nam với hàng gồm ký tự Phương pháp nghiên cứu - Khảo sát, tìm hiểu thu thập tài liệu, hình ảnh biển số, đề tài nghiên cứu trước - Tìm hiểu bước nhận dạng biển số xe bao gồm: xác định vị trí biển số xe, tách ký tự biển số nhận dạng ký tự biển số - Tìm hiểu, lựa chọn phương pháp cần thiết bước trình nhận dạng biển số - Kế thừa phương pháp đạt kết tốt phù hợp với nội dung cần đạt đề tài - Phát triển cải tiến phương pháp có đề tài trước để xây dựng chương trình hướng tới kết tốt - Tìm hướng bước cần làm đề tài, đặc biệt giải thuật nhận dạng Những đóng góp đề tài - vấn đề mà đề tài chưa thực - Đề tài đưa hướng giải thuật nhận dạng theo phân lớp Bayes dựa xác suất tính từ mơmen bất biến ký tự tập tin mẫu - Tạo tiền đề cho việc xây dựng hệ thống nhận dạng biển số xe sau - Tuy nhiên, đề tài cịn tồn số khó khăn định kích trước tập tin mẫu nhỏ Kết cấu đề tài Báo cáo trình bày thành ba phần chính: Phần mở đầu, phần nội dung phần kết luận Phần mở đầu Giới thiệu sơ lược lý chọn đề tài, lịch sử nghiên cứu, mục tiêu nghiên cứu, đối tượng phạm vi nghiên cứu, phương pháp nghiên cứu, đóng góp - - vấn đề tồn đề tài để từ đem lại cho người nhìn tổng quan đề tài Phần nội dung Chương 1: Khái quát xử lý ảnh Trình bày khái niệm, định nghĩa ảnh số, xử lý ảnh số Chương 2: Phương pháp nhân dạng biển số xe Trình bày nội dung trình tự bước trình nhận dạng biển số Đưa số phương pháp so sánh lựa chọn phương pháp tối ưu Chương 3: Chương trình nhận dạng biển số xe tự động Giới thiệu chương trình kết đạt sau khoảng thời gian nghiên cứu Phần kết luận - - CHƯƠNG 1: KHÁI QUÁT VỀ XỬ LÝ ẢNH 1.1 Ảnh số 1.1.1, Khái niệm ảnh Ảnh định nghĩa hàm hai chiều, f(x, y), x y mặt phẳng tọa độ, f vị trí x, y gọi mức xám ảnh điểm [6] Hình 1.1 Ảnh hai chiều 1.1.2, Mơ hình màu RGB Chúng ta có bảy màu chuẩn đỏ, cam, vàng, lục, lam, chàm, tím Nhưng thực tế ta khơng thể nhìn thấy ranh giới dãy màu chúng liên lục với Xét cấu tạo tất màu liên kết ba màu Red (đỏ), Green (xanh lá), Blue (xanh dương) Hình 1.2 Mơ hình màu RGB Mỗi màu mã hóa 8bit, mắt người cảm nhận 16 triệu màu thực tế mắt người cảm nhận khác biệt màu giá trị màu chênh lệch lớn Mơ hình màu RGB bao gồm ba mặt phẳng độc lập Vì vậy, để sử dụng mơ hình màu RGB cho xử lý ảnh ảnh phải biểu diễn theo mặt phẳng màu - - 1.1.3, Mơ hình màu HSI Mơ hình màu HSI mơ hình dựa việc miêu tả màu sắc tự nhiên trực quan mắt người, cơng cụ tốt thuật tốn xử lý ảnh [11] Mơ hình màu HSI biểu diễn thành phần: Hue (sắc lượng), Saturation (độ bão hịa), Intensity (độ chói) White I Green Cyan S Yellow H Blue Red Magenta Black Hình 1.3 Mơ hình màu HSI 1.1.3.1, Hue Mơ tả màu đối tượng dùng để phân biệt khác màu vàng, xanh, đỏ,… Hue biểu thị từ đến 360 độ Trong đó, độ màu đỏ, 60 độ màu vàng, 120 độ màu xanh lá, 180 độ màu xanh lơ, 240 độ màu xanh dương 300 độ màu hồng sẫm Hình 1.4 Hue - - 1.1.3.2, Saturation Mơ tả độ màu hay khoảng cách màu tới điểm có cường độ cân (ảnh xám) Phạm vi Saturation từ đến Hình 1.5 Saturation 1.1.3.3, Intensity Mô tả độ sáng màu Intensity có phạm vi từ đến Trong đó, màu đen, màu trắng Hình 1.6 Intensity Cơng thức chuyển đổi từ mơ hình màu RGB sang mơ hình màu HSI [7] ⎧ θ H =⎨ ⎩ 360 − θ if B ≤ G if B > G (1.1-1) Trong đó: ⎧ ⎫ ⎪ ⎪ [( R − G ) + ( R − B)] θ = cos ⎨ ⎬ 2 ⎪⎩ ⎡⎣ ( R − G ) + ( R − B )(G − B ) ⎤⎦ ⎭⎪ −1 S = 1− [ min(R, G, B)] ( R + G + B) (1.1-2) (1.1-3) - - I = ( R + G + B) (1.1-4) Chú ý: Nếu S = H khơng xác định Nếu I = S khơng xác định 1.2 Một số khái niệm xử lý ảnh 1.2.1, Xử lý ảnh gì? Xử lý ảnh xem trình thao tác ảnh đầu vào nhằm cho kết mong muốn Kết đầu q trình xử lý ảnh ảnh tốt kết luận [1] Ảnh “tối ưu” Ảnh Xử lý ảnh Kết luận Hình 1.7 Quá trình xử lý ảnh 1.2.2, Các phép hình thái học Hình thái thuật ngữ nghiên cứu cấu trúc hay tính chất hình học đối tượng ảnh [10] Mục tiêu việc ứng dụng phép tốn hình thái học nhằm đơn giản hóa tín hiệu việc loại bỏ thông tin không cần thiết Phần lớn phép tốn hình thái định nghĩa từ hai phép toán phép giãn nở ( Dilation) phép bào mòn (Erosion) 1.2.2.1, Dilation Cho A B hai tập Z, giãn nở A B kí hiệu A ⊕ B định nghĩa sau { } A ⊕ B = z ( B) z ∩ A ≠ ∅ Lấy tập (1.2) dời độ dời z cho tập vừa dời giao với tập A khác rỗng - 10 - Lưu ý phương trình dựa tập phản xạ B, B thường = B đối xứng nên Hình 1.8 Phép giãn nở ảnh 1.2.2.2, Erosion Cho A B tập Z, bào mịn A B kí hiệu A Θ B định nghĩa sau AΘB = { z ( B ) z ∩ Ac = ∅} (1.3) c Trong A ảnh ngược với ảnh A Hình 1.9 Phép bào mịn ảnh 1.2.2.3, Opening Phép mở tập hợp A phần tử có cấu trúc B, ký hiệu A o B định nghĩa sau A o B = ( AΘ B ) ⊕ B Trong Α Θ B : phép bào mòn ảnh A ⊕ B : phép giản nở ảnh (1.4) - 39 - Hình 2.21 Sử dụng phép chiếu ngang cắt biển số thành hàng Tiếp theo, ta thực tách riêng ký tự hàng Khác với việc chia biển số thành hai hàng, ta xác định ranh giới hai hàng phép chiếu ngang tiến hành chia biển số Ở đây, ta sử dụng thông số cần thiết để xác định đâu ký tự đâu ký tự Mỗi ký tự có khoảng cách định với ký tự bên cạnh hay nói cách khác hai ký tự liền kề đếu có phân bố giá trị (màu đen) nhiều Dựa vào đặc điểm đó, ta sử dụng phép chiếu dọc [7] (Vertical Projection) để xác định ranh giới hai ký tự liền kề (Hình 2.22) Hình 2.22 Ảnh mơ tả phép chiếu dọc - 40 - Dựa vào đó, tao chọn ba thông số làm điều kiện để tách riêng ký tự wi, hi si • wi – khoảng cách hai vị trí có phân bố điểm đen nhiều • hi – giá trị lớn khoảng wi • si – diện tích vùng chứa ký tự sai số cho phép Hình 2.22 Hình thể hai thơng số wi hi - 41 - Bắt đầu Ảnh đầu vào (Hàng Trên) Ảnh đầu vào (Hàng Dưới) VerticalProjection(HangTren,p); VerticalProjection(HangDuoi,p); S i0 Đ j = j +1; Đ j