Cơ sở của thị giác máy chính là lý thuyết về xử lý ảnh số trong đó bao gồm các quá trình thu nhận ảnh, xử lý ảnh, phân tích ảnh và nhận dang ảnh...Vân đề nhận dạng xe, thông thường được
Trang 1BO GIAO DUC VA DAO TAO TRUONG DAI HOC SU’ PHAM KY THUAT
THÀNH PHÓ HÒ CHÍ MINH
HGMUIIE
ĐỎ ÁN TÓT NGHIỆP NGÀNH KỸ THUẬT ĐIỆN - ĐIỆN TỬ
Trang 2KHOA ĐIỆN - ĐIỆN TỬ
BỘ MÔN ĐIỆN TỬ CÔNG NGHIỆP
TRƯ VIÊN TRƯỜNG D1:^?XT
Tp.Hồ Chí Minh, tháng 8 năm 2014
Trang 3
TRUONG DH, SU PHAM KY THUAT CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM
TP HÒ CHÍ MINH ĐỘC LẬP - TỰ DO - HẠNH PHÚC
KHOA DIEN-DIEN TU
Tp HCM, ngày tháng năm 20144
NHIEM VU DO AN TOT NGHIỆP
HQ TEN SINH VIEN: NGUYEN QUOC THAI MSSV: 09901012
CHUYÊN NGÀNH : Sư Phạm Kỹ thuật Điện - Điện tử Mã ngành: 01
Trang 4
4, Kết quả đạt được của ĐATN sau khi thực hiệt
HH: NGÀY GIÁO NHIỆM VỤ:
V NGAY HOAN THANH NHIEM VỤ: Ộ
VI, HỘ VÀ TÊN CÁN BỘ HUONG DAN: THS PHAM VAN KHOA
Trang 5Nhận dạng biển số xe ứng dung Arm9
Trang 6Nhận dạng biển số xe ứng dung Arm9
LOI CAM ON
Xin gửi lời cảm ơn chân thành đến quý thầy cô trường Đại học Sư Phạm Kỹ Thuật Thành
Phố Hồ Chí Minh nói _chung và khoa Điện — Điện tử nói riêng đã truyền đạt những kiến thức quý báu trong suốt năm năm học và tạo điều kiện thuận lợi để người thực hiện đề tài học tập tốt
Xin gửi lời cảm ơn đến thầy Phạm Van Khoa, người đã theo sát hướng dẫn và động viên
giúp đỡ trong suôt quá trình thực hiện đô án này
Cảm ơn gia đình, cha mẹ đã là nguồn động viên to lớn về vật chất và tỉnh thần trong suốt
thời gian học hành, để có được tương lai, theo đuổi ước mơ và sự nghiệp
Chan thành cảm ơn các anh, chị và các bạn trong khoa Điện — Điện tử, đặc biệt là các bạn trong lớp 099011A đã giúp đỡ, động viên và hỗ trợ nhau trong suôt quá trình học tập
Xan chan thanh cam on!
Người thực hiện đê tài
NGUYEN QUOC THÁI
Trang 7
Nhận dạng biển số xe ứng dung Arm9
TOM TAT DE TAL
Trước đây, khi số lượng các phương tiện xe máy còn chưa nhiều, việc quản lý chúng thường đơn giản và ít gặp khó khăn Ngày nay, khi số lượng xe máy đã trở nên rất nhiều
thì các hệ thống quản lý cũ không còn hiệu quả và không còn mang tính kinh tế nữa, Vì
vậy, đã có nhiều công trình nghiên cứu thực tiễn nhằm giải quyết vấn đề này Nổi bật
trong số đó là các công trình nghiên cứu ứng dụng thị giác máy vào trong hệ thống nhận
dang xe nhằm phục vụ công tác quản lý Cơ sở của thị giác máy chính là lý thuyết về xử
lý ảnh số trong đó bao gồm các quá trình thu nhận ảnh, xử lý ảnh, phân tích ảnh và nhận
dang ảnh Vân đề nhận dạng xe, thông thường được thực hiện thông qua việc nhận dang biển số của chính xe đó Một vấn đề đặt ra là hầu hết các ứng dụng nhận dạng biển số xe
hiện tại thường được xây dựng trên nền tảng máy tính cá nhân và hoạt động của chúng là không thể tách rời ra khỏi máy tính cá nhân được
Trong ¡ này, người nghiên cứu tập trung phát triển một ứng dụng nhận dạng biển số
xe có thể hoạt động độc lập trên nền | tang một hệ nhúng Nội dung đề tài được giải quyết Uieo hướng tập trung khai thác thế mạnh của bộ vi điều khiển S3C6410 trên board EricnidlyArm Tiny6410 Thực chất bộ vi điều khiển này là một SoC (System on a Chip)
có nhân xư lý la Arm Về cơ bản, đề tài đã có thể chứng minh rằng: hoàn toàn có thê xây
dựng ứng dạng nhận dạng biển số xe hoạt động trên nền tảng Arm thay vì hoạt động trên
máy tính cá nhán, Qua đó, càng cho thấy 16 kha năng ứng dụng của Arm vào các lĩnh vực
công nghệ cao má trước đây, người ta thường nghĩ chỉ có thẻ thực hiện được trên máy tính
Đề tải đã tạo được một nên tảng nghiên cứu mới và có nhiều tiềm năng phát triển theo
hướng rộng và sâu trong việc ứng dụng các hệ nhúng vào nhiều lĩnh vực khác nhau trong cuộc sóng, Đặc biệt là chuyển những nghiên cứu mang tính học thuật thành
Trang 8Nhận dạng biển số xe ứng dụng Arm9
NHAN XÉT CỦA GIÁO VIÊN HƯỚNG DẪN
Trang 9
Nhận dạng biển số xe ứng dung Arm9
NHAN XÉT CỦA GIÁO VIÊN PHẢN BIỆN
Giáo viên phản biện
Trang 10
Nhận dạng biển số xe ứng dụng Arm9
MỤC LỤC
Trang bia
Quyét dinh giao dé tai
Phân A:Giới thiệu
Lời cảm ơn
Tóm tắt đề t
Nhận xét của giáo viên hướng d:
Nhận xét của giáo viên phản biện
Mục lục
Liệt kê bảng
Liệt kê hình
2.1.5.Các ác thành phân cơ bản cả của
1.Phát hiện tính không liên tục
2 t6; 2.Phân đoạn ảnh dựa vào các vùng ảnh con
2.7.Tổng quan về nhận dạng ảnh
2.7.1 Không gian biểu diễn đối tượng, không gian diễn dịch
2.7.2.Ban chat của quá trình nhận dạng
Trang 11Nhận dạng biển số xe ứng dung Arm9
2.7.3.Nhận dạng dựa trên phân hoạch không gian
Chương 3: Hệ thống nhận dạng biển số xe và nền tảng phát triển hệ thống
3.1.Tổng quan về hệ thống nhận dạng biển số xe
3.1.1.Giới thiệu chung
3.1.2.Các đặc trưng cơ bản của biến số xe máy Việt Nam
3.3.2.Nén tang Arm va kién tric Arm11
3.3.3,Téng quan vé board FriendlyARM Tiny
3.3.4, Embedded Linux trén board FriendlyArm Tiny6410
Chương 4: Thiết kế phần mềm nhận dạng biển số xe
4.1 Yêu cầu thiết kế
42 Các công cụ hỗ trợ
4.2.1.1rinh biên dịch chéo
4.2.2 Thu vién OpenCV
1.Cấu hình biên dịch cho Am và biên
5 2.Download chương trình xuống board va thy thi
Chương 5: Kết quả nghiên cứu, kết luận và hướng phát triển
5.1.Kết quả nghiên cứu
Trang 12Nhận dạng biển số xe ứng dung Arm9
LIỆT KÊ BẢNG
Bảng 3.1: Các dạng lõi tiêu biểu của ARM
Bảng 3.2: Các đặc trưng nỗi bật của Board Tiny6410
Bang 4.1: Kêt quả thực nghiệm phần mềm nhận đạng bi:
Trang 13
LIỆT KÊ HÌNH Hình 2.1: Các bước cơ bản trong xử lý ả
Hình 2.2: Sơ đồ phân tích và xử lý ảnh và lưt
Hình 2.3: Các thành phần chính của một hệ thống xử lý ảnh
Hình : Khuông lượng tử theo L mức xám
Hình 2.5: Lân cận các điểm ảnh của tọa độ (x, y)
Hình oc trung Vi
Hình 2.7: Các bộ lọc nâng cao
Hình 2.8: Mã hóa và giải mã bởi mã hóa biến đổi
Hình : Cải thiện ảnh nhị phân
Hình Hệ thống nhận dạng biên sô xe cơ bản
: Hình ảnh biển số xe dân sự ở Việt Nam
: Ảnh xám và lược đồ xám tương ứng của ảnh
Hình 3.4: Bài toán phân lớp tuyến tính
Hình 3.5: Lề và đường biên trong SVM
Hình 3.6: [ưa chọn đường phân lớp trong phân lớp tuyên tính
linh 3.7: Tính khoảng cách từ điểm dữ liệu đến mặt phân cách
Hình M6 hinh phat trién ứng dụng nhúng
Hình 3.9- Cấu trúc đường ống 8 tầng của Arm11
Hinh 3.10: L4i xử lý Arm1176JZF-
Hình 3.11: Board tiny641
Hinh 3.12: Board Tiny641
Hinh ‘hu viện OpenCV
Hinh dung bé loc Canny trong do bién
Hinh cụ lập trinh đa nén tang Qt
Hinh Qt Creator
Hinh 4.7: Tao project mdi trong Qt Creator
Hình 4.8: Giao diện lấp trình Qt
Hình 4.9: Cơ chế signals & slots trong Qt
Hình 4.10: Cấu hình sử dụng OpenCV trong Q\
Hình 4.11: Thiết lập qt version
Hình 4.12: Thêm nên tảng biên dịch chéo trên Q\
Hình 4.13: Chuyển ảnh ngõ vào sang ảnh xám
Hình 4.14: Ngưỡng nhị phân Otsu
Hình 4.15: Ảnh ngõ vào sau khi thực hiện nhị phân hóa ảnh
Hình 4.16: Tìm biên bằng bộ lọc Canny
Hình 4.17: Ảnh sau khi thực hiện phép dãn nở
Hình 4.18: Xác định các đường bao trong ảnh
Hình 4.19: Tách biển số
Hình 4.20: Kêt quả sau khi tách ký tự
Hình 4.21: Chia nhỏ ảnh để tìm đặc trung,
Hình 4.22: Sử dụng cơ chế signals slots trong phần mềm
Hình 4.23: Giao diện phần mêm nhận dạng biên sô xe
Trang 14Nhận dạng biển số xe ứng dung Arm9
Phần mềm tạo mẫu huấn luy
Các mẫu huấn luyện
Tổ chức thư mục huấn luyện
Kết quả quá trình huấn luyện
Giao diện phần mềm huắn luyện SVM
Kiểm tra lại kết quả huấn luyện huấn luyện
Lưu đề quá trình huấn luyện SVM
Cấu hình thư viện OpenCV cho Arm
Cấu hình biên dịch ứng dụng cho Arm
Đăng nhập vao kit bing Terminal
Kết nối ftp v6i kit FriendlyArm
Giao dign phan mém trén board Tiny6410
Trang 15Nhận dạng biển số xe ứng dung Arm9
Trang 16Nhận dạng biển số xe ứng dung Arm9
Chương 1
DAN NHAP
Chương 1: Dẫn nhập.
Trang 17Nhận dạng biển số xe ứng dụng Arm9
1.1 Đặt vấn đề
Trước đây, khi các phương tiện xe máy còn chưa nhiều, việc quản lý chúng thường đơn
giản và ít gặp khó khăn Ngày nay, khi số lượng xe máy đã trở nên rất nhiều thì các hệ
thống quản lý cũ không còn hiệu quả và không còn mang tính kinh tế nữa Vì vay, đã có nhiều công trình nghiên cứu thực tiễn nhằm giải quyết vấn đề này Nổi bật trong số đó là
các công trình nghiên cứu ứng dụng thị giác máy vào trong hệ thống nhận dạng xe nhằm
phục vụ công tác quản lý Cơ sở của thị giác máy chính là lý thuyết về xử lý ảnh số trong
đó bao gôm các quá trình thu nhận ảnh, xử lý ảnh, phân tích ảnh và nhận dạng ảnh Vấn
đề nhận dạng xe, thông thường được thực hiện thông qua việc nhận dạng biển số của chính xe đó Một vấn đề đặt ra là hầu hết các ứng dụng nhận dạng biển số xe hiện tại thường được xây dựng trên nền tang máy tính cá nhân và hoạt động của chúng là không,
thể tách rời ra khỏi máy tính cá nhân được
Trong đề tài này, người nghiên cứu tập trung phát triển một ứng dụng nhận dạng, biểi số
xe có thể hoạt động độc lập trên nền | tang một hệ nhúng dung đề tài được giải quyết theo hướng tập trung khai thác thế mạnh của pe vi diéu khién $3C6410 trên board
FriendlyArm Tiny6410 Thực chất bộ vỉ điều khiển này là một SoC (System on a Chip)
e6 nhan xtrly la Arm Về cơ bản, đề tài đã có thể chứng minh rằng: hoàn toàn có thể xây dựng tn ung nhận dạng, biển số xe hoạt động trên nên tảng Arm thay vì hoạt động trên máy tính cá nhân Qua đó, càng cho thấy rõ khả năng ứng dụng của Arm vào các lĩnh vực công nghệ cao ma trước đây, người ta thường nghĩ chỉ có thể thực hiện được trên máy tính
còi thì một ứng đụng hoạt động trên thiết bị điện thoại di động thường không đáp ứng được hoặc gặp rát nhiêu khó khăn, nhất là vấn đề phần cứng
Đổi với ở nước ngoài với sự phát triển của khoa học kỹ thuật và kinh tế, đã có nhiều công trình nghiên cứu về hệ thông nhận dạng biển số xe Hơn thế nữa, các hệ thống ứ ứng
dụng nhận dạng biển số xe được nghiên cứu, phát triển thành các sản phẩm thương mại
với độ ôn định và tin cậy cao, được ứng dụng rộng rãi vào trong thực tiễn
1.3.Mục đích nghiên cứu
Xây dựng ứng dụng nhận dạng biển số xe hoạt động trên board FriendlyARM Tiny6410 Ứng dụng hoạt động trên nên tâng hệ điều hành Embedded Linux cài đặt trên board
Điều này được thê hiện thông qua việc lập trình ứng dung bằng phần mềm Qt trên máy
phát triển Ubuntu, ứng dụng được biên dịch và download xuông board và sau đó có thể
hoạt động độc lập
1.4.Đối tượng và phạm vi nghiên cứu
Đối tượng nghiên cứu
-_ Phần mềm nhận dạng, biển số xe hoạt động trên board Tiny6410
- Board FriendlyARM Tiny6410
Trang 18
Nhận dang biển số xe ứng dụng Arm9
- Phần mềm chỉ nhận dạng từ tập cơ sở dữ liệu offline (tức các ảnh có sẵn),
~ Phần mềm được thiết kế hoạt động trên nên tang Linux với giao diện Qt
~ Phần mềm chỉ xử lý và nhận dang đối với các ảnh đầu vào là biển số xe máy dân sự của Việt Nam
1.5,Ý nghĩa khoa học và thực tiễn của đề tài
» _Y nghĩa khoa học của đề tài
* Tính thực tiễn của đề tài
J1ién nay nhu cau xây dựng các ứng dụng chạy độc lập trên nên tảng hệ nhúng là rất lớn
các công trình nghiên cứu vê hệ thống nhận dạng biển số xe thường được phát
1.6.Phương pháp và phương tiện nghiên cứu
» Phương pháp nghién cru
Ba phương pháp nzhiến cứu chính đã được áp dụng để thực hiện đề tài này là: Phương pháp tham khảo tái iiệu, phương pháp thống kê và phương pháp 1 thực nghiệm
-_ Áp dụng phương ,pháp tham khảo tài liệu: Thông tin về giải pháp lập trình ứng
dụng nhận dạng biển số xe máy trên nền tảng Arm cũng như về board FriendlyARM còn rất ít va khan hiếm Nhưng đề tự thực hiện được một ứng dụng hoàn chỉnh, đòi hỏi người thực hiện phải được trang bị thêm nhiều kiến thức công nghệ khác về: ập trình
Qt với ngôn ngữ C++, thiết kế hệ thống hệ thông nhận dang bien số xe trên cơ sở xử lý ảnh số, câu trúc board FriendlyARM Tiny6410 Có nhiều kiến thức và kỹ năng quan trọng và cần thiết cho đề tài nhưng người thực hiện chưa được trang bị trong chương trình học, vì vậy có khá nhiều nguôn tài liệu tham khảo từ các trang Web và ebook đã được tác giả đề tài kham khảo và nghiên cứu nhiều trong quá trình thực hiện
Việc tham khảo tài liệu đã giúp người thực hiện củng cô lại một cách khoa học các kiến thức đã có và xây dựng những nền tảng kiến thức mới Qua đó, tác giả cũng chọn
lọc ra được những nguồn kiến thức quan trọng làm kim chỉ nam cho tác giả thực
nghiệm nghiên cứu
- Áp dụng phương pháp thống kê: Trong quá trình thực hiện lập trình nhận dạng biển
SỐ Xe máy, với một tập cơ sở dữ liệu là các ảnh của biến số, các ảnh này khác nhau về nội dung, về độ sáng, độ tương phản, màu sắc Để thực hiện hoàn chỉnh quá t trình nhận dạng các ảnh này, đòi hỏi người nghiên cứu phải tiến hành thống kê các số liệu
có liên quan như tập ảnh đầu vào, tập mẫu phục vụ trong việc huấn luyện, phân loại,
thống kê kết quả nhận dạng được, từ đó tính toán hiệu suất của quá trình nhận
Trang 19
Nhận dạng biển số xe ứng dung Arm9
dạng Nhờ phương pháp thực nghiệm, quá trình nhận dạng được thực hiện có hiệu quả hơn, kêt quả ngiên cứu được đánh giá một cách khách quan, chính xác
- Áp dụng phương pháp thực nghiệm: Sản phẩm nghiên cứu của đề tài pra là một sản phẩm vật lý thực, chính vì vậy, đòi hỏi tác giả phải tiến hành nhí lần thực
nghiệm để thử nghiệm các mẫu đầu vào và các phiên bản chương 1 trình phần mềm Để giảm bớt thời gian và chỉ phí thực nghiệm, người thực hiện còn kết hợp với mô phỏng
hệ thống trên máy tính, Sau khi việc kiểm chứng trên mô phỏng đạt được những kết
quả nhất định, thì sẽ được tiến hành biên dịch phần mềm và thực thi trên hệ thống đích
Để thực nghiệm được thì người thực hiệt đề tai phai cần đến các phương tiện nghiên cứu sau: Bao gôm phương tiện (công cụ) phần mềm và phương tiện (công cụ) phần cứng
Phương tiện (công cụ) phần mềm:
-_ Hệ điều hành Ubuntu : Được dùng làm môi trường phát triển, mô phỏng và biên
dịch ứng dung
liệ điều hành Embedded Linux: được dùng làm môi trường thực thi ứng dụng, cụng ác cơ chế, phương thức để ứng dụng giao tiếp, khai thác các tài nguyên
phân cứng của board Tiny6410
-_ Phán mém Qt Creator: được dùng làm môi trường lập trình ứng dụng, viết mã
ø dụng với giao diện đồ họa
“mm qte-everywhere-opensouree-src: dùng để hỗ trợ biên dịch các ứng dụng,
Ot chay trén nén tang ARM
- Trinh biến dich arm-linux-gec: hỗ trợ biên dịch chéo ứng dụng
~_ Bộ thư viện OpenCV: cung cấp các hàm, các thuật toán phục vụ xử lý ảnh
~_ Cùng một số thư viện, công cụ hỗ trợ biên dịch và biên dịch chéo ứng dụng
Phương tiện (công cụ) phân cứng:
- Board Tiny64i0: La phan cứng trung tâm chạy ứng dụng nhận dạng, biển số xe
~ Máy tính cá nhán: sử dụng laptop làm máy phát triển
Ba phương pháp nghiên cứu trên được áp dụng xen kế và bổ trợ cho nhau để từ đó giúp
người nghiên cứu hình thành được những kiến thức quý giá và đi đến thực hiện thành
công đề tài “Nhận dạng biển số xe ứng dụng Arm9”
Trang 20
Chương 2:Tông quan về xử lý ảnh số và nhận dạng,
Trang 21ảnh ta có phân tích ảnh đẻ thu được các thông tin đặc trưng giúp cho việc phân loại ảnh
(image classification), nhận dang anh (image recognition)
Xử lý và nhận đạng là một lĩnh vực từ lâu được nhiều người quan tâm Nó đã được ứng, dụng vào nhiều lĩnh vực như:
* Trong y học, cải thiện ảnh X-quang và nhận dạng đường biên mạch máu từ ảnh chụp bằng tia X, ứng dụng vào các xét nghiệm lâm sảng như phát hiện u não, nội soi cắt lớp
+ Trong thiên văn học, hệ thống chụp hình gắn trên tàu vũ trụ hạn chế về kích thước và
trọng lượng, do đó chất lượng hình ảnh nhận được bị giảm như bị mờ, méo hình học và
nhiễu nền Các hình đó được xử lý bằng hệ thống máy tính
* Trong các lĩnh vực công nghiệp, người máy ngày càng đóng vai trò quan trọng Chúng thực hiện các công việc nguy hiểm, đòi hỏi tốc độ và độ chính xác cao vượt quá khả năng, con người Người máy sẽ trở nên tỉnh vi hơn và thị giác máy tính đóng vai trò quan trọng hơn Người ta không chỉ đòi hỏi người máy phát hiện và nhận dạng các bộ phận công nghiệp ma con phải “hiểu” được những gì chúng “thấy” và đưa ra hành động phù hợp Vì
vậy, xử lý anh dong vai trò quan trọng trong thị giác máy tính
là môn học liên quan đến nhiêu lĩnh vực và cân nhiều kiến thức cơ sở khác Đầu tiên phải
kể đến › số là một môn học hết sức cơ bản cho xử lý tín hiệu chung, các khái
niệm về các biến đôi Fourier, biến đổi Laplace, các bộ lọc hữu hạn Thứ hai,
các công cụ toán như Đại số tuyến tính, Sác xuất, thống kê Một số kiến thức cần thiết như Trí tuệ
phát triển vào những năm 1955 Điều này có thể giải thích được vì sau chiến tranh thế
giới thứ hai, máy tính phát triển nhanh tạo điều kiện cho quá trình xử lý ảnh số thuận lợi
Năm 1964, máy tính đã có khả năng xử lý và nâng cao chất lượng ảnh từ mặt trang và vệ tỉnh Ranger 7 của Mỹ bao gồm: làm nổi đường biên, lưu ảnh Từ năm 1964 đến nay, các
phương tiện xử lý, nâng cao chất lượng, nhận dạng ảnh phát triển không ngừng Các
phương pháp tri thức nhân tạo như mạng nơ ron nhân tạo, các thuật toán xử lý hiện đại và
cải tiến, các công cụ nén ảnh ngày càng được áp dụng rộng rãi và thu nhiều kết quả khả
quan
2.1.3.Các ứng dụng của xử lý ảnh số
Biến đổi ảnh (Image Transform)
Trong xử lý ảnh do số điểm ảnh lớn các tính toán nhiều (độ phức tạp tính toán cao) đòi hỏi dung lượng bộ nhớ lớn, thời gian tính toán lâu Các phương pháp khoa học kinh điển
áp dụng cho xử lý ảnh hầu hết khó khả thi Người ta sử dụng các phép toán tương đương
hoặc biến đổi sang miễn xử lý khác để dễ tính toán Sau khi xử lý dễ dang hơn được thực
Trang 22
Nhận dạng biễn số xe ứng dụng Arm9
hiện, dùng biến đổi ngược để đưa về miền xác định ban đầu, các biến đổi thường gặp
trong xử lý ảnh gồm :
- Biên đôi Fourier, Cosin, Sin
- Biến đổi (mô tả) ảnh bằng tích chập, tích Kronecker (theo xử lý tín hiệu số)
~._ Các biên đổi khác như KL (Karhumen Loeve), Hadamard
Một số các công cụ xác xuất thống kê cũng được sử dụng trong xử lý ảnh
Nén anh
Ảnh dù ở dạng nào vẫn chiếm không gian nhớ rất lớn Khi mô tả ảnh người ta đưa kỹ
thuật nén ảnh vào Các giai đoạn nén ảnh có thể chia ra thế hệ 1, thế hệ 2 Hiện nay, các
chuẩn MPEG được dùng với ảnh và đang phát huy hiệu quả
Các phương pháp xử ly ảnh bất đầu từ các ứng dụng chính: nâng cao chât lượng ảnh và
phân tích ảnh Để dễ hình dung, ta xét các bước cần thiết trong xử lý ảnh Đầu tiên, ảnh
tự nhiên từ thế giới bên ngoài được thu nhận qua các thiết bị thu (camera, máy chụp ảnh)
Trước đây, ảnh thu qua camera là các ảnh tương tự (loại camera ống kiểu CCIR) Gần
đây, với sự phát triển của công nghệ, đặc biệt là kỹ thuật số, ảnh màu hoặc đen trắng
được lây từ camera, sau đó nó được chuyển trực tiếp thành ảnh số tạo điều kiện thuận lợi
cho lưu trữ và các quá trình xử lý tiếp theo Mặt khác, ảnh cũng có thể tiếp nhận từ vệ
tính, có thể quét từ ảnh chụp bằng máy quét ảnh Hình 2.1 mô tả các bước co ban trong
xử lý ảnh
Hình 2.1 Các bước cơ bản trong xử lý ảnh
Sơ đồ này bao gồm các thành phần như sau:
a Phần thu nhận ảnh (Image acquisition)
Ảnh có thể nhận qua camera màu hoặc đen trắng Thường ảnh nhận qua camera là ảnh
tương tự (loại camera ông chuân CCIR với tần số 1⁄25, mỗi ảnh 25 dòng), cũng có loại Camera đã số hóa (như loai CCD — Change Coupled Device) là loại photodiot tạo cường
độ sáng tại mỗi điểm ảnh Camera thường dùng là loại quét dòng, ảnh tạo ra có dang 2
chiều Chất lượng ảnh thu nhận được phụ thuộc vào thiết bị thu, vào môi trường (ánh sáng, phong cảnh)
b Tiền xử lý ảnh (Image Pre| rocessing) | |
Sau bộ thu nhận, ảnh có thê chứa nhiễu, độ tương phản thap nén can dua vào bộ
tiền xử lý để nâng cao chất lượng Chức năng chính của bộ tiền xử lý là lọc nhiễu, nâng độ tương phản để làm ảnh rõ hơn, nét hơn
c Phân đoạn (Segmentation) hay phân vùng ảnh
Trang 23
Nhận dạng biển số xe ứng dụng Arm9
Phân vùng ảnh là tách một ảnh đầu vào thành các vùng thành phần để biểu diễn phân
tích, nhận dạng ảnh Ví dụ : để nhận dạng chữ (hoặc mã vạch) trên phong bì thư cho mục
đích phân loại bưu phẩm, cần chia các câu, chữ về địa chỉ hoặc tên thành các từ, các chữ,
các số (hoặc các vạch) riêng biệt để nhận dạng Đây là phần phức tạp khó khăn nhất trong
xử lý ảnh và cũng dễ gây lỗi, làm mất độ chính xác của ảnh Kết quả nhận dạng phụ thuộc rất nhiều vào công đoạn này
d Biểu diễn ảnh (Image Representation)
Đầu ra ảnh sau khi phân đoạn chứa các điểm ảnh của vùng ảnh (ảnh đã phân đoạn) cộng với mã liên kết với các vùng lân cận Việc biến đổi các số liệu này thành dạng thích hợp
là cần thiết cho xử lý tiếp theo bằng máy tính Việc chọn các tính chất để thẻ hiện ảnh
gọi là trích chọn đặc trưng (Feature Selection) gin với việc tách các đặc tính của ảnh dưới dạng các thông tin định lượng hoặc làm cơ sở để phân biệt lớp đối tượng này với đối
tượng khác trong phạm vi ảnh nhận được Ví dụ : trong nhận dạng ký tự trên phong bì thư, chúng ta miêu tả các đặc trưng của từng ký tự giúp phân biệt ký tự này với ký tự khác
e Nhận dạng và nội suy ánh (Image Recognition and Interpretation) |
Nhận dạng cánh là quá trình xác định ảnh Quá trình này thường thu được bằng cách so sánh với mẫu chuẩn đã được học (hoặc lưu) từ trước Nội suy là phán đoán theo ý nghĩa
dựa trên cơ sở nhận dạng Ví dụ: một loạt chữ số và nét gạch ngang trên phong bì thư có
thế nội suy thánh mã điện thoại Có nhiều cách phân loại ảnh khác nhau Theo lý thuyết
vê nhận d các mô hình toán học về ảnh được phân theo hai loại nhận dạng ảnh cơ
bản:
* Nhận đạng theo tham số
* Nhận heo cầu trúc
j ø nhận dạng khá phổ biến hiện nay đang được áp dụng trong khoa học và
đạng ký tự (chữ in, chữ viết tay, chữ ký điện tử), nhận dạng văn bản (Text), nhận n tay, nhận dạng mã vạch, nhận dạng mặt người
f Cơ sở trí thức (Knowledge Base)
Như đã nói ở trên ảnh là một đối tượng khá phức tạp về đường nét, độ sáng tối, dung lượng điểm ảnh, môi trường để thu ảnh phong phú kéo theo nhiễu Trong nhiều khâu xử
lý và phân tích ảnh ngoài việc đơn giản hóa các phương pháp toán học đâm bảo tiện lợi cho xử lý, người ta mong muốn bắt chước quy trình tiêp nhận và xử lý theo cách của con người Trong các bước xử lý đó, nhiều khâu hiện nay đã xử lý theo các phương pháp trí tuệ con người Vì vay, các cơ sở tri thức được quan tâm
øg Môtả (biểu diễn ảnh)
Từ hình 2.1 cho thay, ảnh sau khi số hóa sẽ được lưu vào bộ nhớ, hoặc chuyển sang các khâu tiếp theo để phân tích Nếu lưu trữ ảnh trực tiếp từ các ảnh thô, đòi hỏi dung lượng
bộ nhớ cực lớn và không hiệu quả theo quan điểm ứng dụng và công nghệ Thông thường, các ảnh thô đó được đặc tả (biểu diễn) lại hay đơn giản là mã hóa theo các đặc điểm của ảnh gọi là các đặc trưng ảnh ([mage Features) như : biên ảnh (Boundary), vùng
ảnh (Region) Một số phương pháp biểu diễn thường dùng như:
- Biểu diễn bằng mã chạy (Run-Length Code)
- Biểu diễn bằng mã xích (Chain Code)
2 Biểu diễn bằng mã tứ phân (Quad-Tree Code)
Biểu diễn bằng mã chạy :
Phương pháp này thường biểu diễn cho vùng ảnh và áp dụng cho ảnh nhị phân Một vùng ảnh R có thê mã hoá đơn giản nhờ một ma trận nhị phân:
- U(m,n)= l1 nếu (m, n) thuộc R
~ U(m, n) = 0 nếu (m, n) không thuộc R
Trang 24Nhận dạng biển số xe ứng dụng Arm9
Trong đó: Uím, n) là hàm mô tả mức xám ảnh tại tọa độ (m,n) Với cách biểu diễn
trên, một vùng ảnh được mô tả bằng một tập các chuỗi số 0 hoặc 1 Giả sử chúng ta mô
tả ảnh nhị phân của một vùng ảnh được thể hiện theo toạ độ (x, y) theo các chiều và đặc
tả chỉ đối với giá trị “1” khi đó dạng mô tả có thể là: (x, y)r; trong đó (x, y) là toạ độ, r là
số lượng các bit có giá trị “1” liên tục theo chiều ngang hoặc dọc
Biểu diễn bằng mã xích :
Phương pháp này thường dùng để biểu diễn đường biên ảnh Một đường bắt kỳ được chia thành các đoạn nhỏ Nối các điểm chia, ta có các đoạn thang kế tiếp được gán hướng cho
đoạn thing đó tạo thành một dây xích gồm các đoạn Các hướng có thể chọn 4, 8, 12,
24, mdi hướng được mã hoá theo số thập phân hoặc số nhị phân thành mã của hướng
Biểu diễn bằng mã tứ phân :
Phương pháp mã tứ phân được dùng để mã hoá cho vùng ảnh Vùng ảnh đầu tiên được
chia làm bốn phần thường là bằng nhau Nếu mỗi vùng đã đồng nhất (chứa toàn điểm đen (1) hay trắng (0)), thì gán cho vùng đó một mã và không chia tiếp Các vùng không đồng
nhất được chia tiếp làm bốn phần theo thủ tục trên cho đến khi tất cả các vùng đều đồng nhất Các mã phân chia thành các vùng con tạo thành một cây phân chia các vùng đồng nhất
Trên đây là các thành phần co ban trong các khâu xử lý ảnh Trong thực tố, các quá trình
sử đụ! nh số không nhất thiết phải qua hết các khâu đó tùy theo đặc điểm ứng dụng
Hình cho sơ đó phân tích và xử lý ảnh và lưu đồ thông tin giữa các khối một cách khá
day du Anh sau khi được số hóa được nén, lưu lại để truyền cho các hệ thống khác sử
dụng hoặc 4ê xử lý tiếp theo, Mặt khác, ảnh sau khi số hóa có thể bỏ qua công đoạn nâng
cao chất ảnh đủ chất lượng theo một yêu cầu nào đó) để chuyển tới khâu phân đoạn hoặc ?2 khâu phân đoạn chuyển trực tiếp tới khâu trích chọn đặc trưng Hình 2.2 cũng chia các nhánh song song như: nâng cao chất lượng ảnh có hai nhánh phân biệt,
Trang 25máy tính số, hệ thống gôm các đầu đo (thu nhận ảnh); bộ số hóa; máy tính số; bộ hiên thị;
bộ nh ø xử lý ảnh cơ bản có thể gồm: máy tính cá nhân kèm theo vỉ mạch
nạ VỚA hoặc SVGA, đĩa chứa các ảnh dùng để kiểm tra các thuật toán
và một màn n có hỗ trợ VGA hoặc §VGA Nối với cổng vào của thiết bị thu nhận anh
là một video camera, va cong ra nôi với một màn hình Thực tế, phần lớn các nghiên cứu của chúng ta được đưa ra trên ảnh mức xám (ảnh đen trắng) Bởi vậy, hệ thống sẽ bao gồm một thiết ur ly anh den trang va một màn hình đen tring Ảnh mức xám được áp
dụng trong nhiều lĩnh vực như sinh vật học hoặc trong công nghiệp Thực tế chỉ ra rằng,
bất ky ứng dụng nao trén ảnh, mức xám cũng, ứng dụng được trên ảnh màu Với lý do đó,
hệ thống ban dau nén chi bao gồm các thiết bị thu nhận và hiển thị ảnh đen trắng Với ảnh màu, nền sử dụng một hệ thống mới như Hình 2.3, trừ trường hợp bạn cân một camera TV mâu và một màn hình đa tần số (ví dụ như NEC MultiSync, Sony Multiscan,
hoặc Mitsubishi Diamond Scan) để hiển thị ảnh mau Nếu khả năng hạn ché, có thể dùng
PC kèm theo vỉ mạch VGA và màn hình VGA, đê dựng ảnh được
tích ảnh bao hàm việc xem xét dữ liệu ảnh để giải quyết dễ dàng một bài toán thị giác
Quá trình phân tích ảnh bao hàm hai vấn đề khác: trích chọn đặc trưng và phân lớp mẫu
Có nhiều ứng dụng của thị giác máy tính như:
Trong các hệ thống sản xuất, thị giác máy tính thường được sử dụng trong việc điều
khiển chất lượng
Chương 2:Tổng quan về xử lý ảnh số và nhận dạng 1
Trang 26Nhận dạng biển số xe ứng dung Arm9
Trong nhiều lĩnh vực khác nhau trong cộng đồng y tế, mà ở đó chắc chắn các kiểu ứng dụng sẽ tiếp tục được phát triển Các ví dụ hiện nay về các hệ thống y tế đang được phát triển bao gôm: các hệ ` thống chẩn đoán các khối u đa tự động, các hệ thống trợ giúp giải
phẫu thần kinh khi phẫu thuật não bộ, và các hệ thống test bệnh án tự động
Lĩnh vực an ninh và pháp luật cũng là một lĩnh vực hứa hẹn cho việc phát triển các hệ thống thị giác máy tính, với các ứng dụng từ nhận dạng tự động vân tay cho đến phân tích DNA Các hệ thông an ninh nhận dạng người thông qua việc scan võng mạc mắt, scan
khuôn mặt, và các đường tĩnh mạch ở tay đã được phát triển
Chương trình không gian U.S và BQP, với việc phát triển các khả năng thị giác cho rô bết đang được nghiên cứu và phát triển Các ứng dụng từ xe cộ tự chủ cho dén bắt bám
mục tiêu và nhận đạng Các vệ tinh theo quĩ đạo trái đất thu thập những dung lượng lớn
dữ liệu ảnh hàng, ngày, và các ảnh này sẽ tự động được scan để hỗ trợ việc lập bản đồ, dự báo thời tiết, và giúp chúng ta hiểu được những thay đổi đang xảy trên hành tinh chúng
(hay một hàm) liên tục trong không gian cũng như theo giá trị thành dạng số rời rạc được
gọi la số haá ảnh Việc biến đổi này có thể gồm hai bước:
Bước ]: Đo giá trị trên các khoảng không gian gọi là lấy mẫu
Bước 2: A cương độ (hoặc giá trị) đo được thành một số hữu hạn các mức rời rạc
gọi là lượn ita
Lấy mẫu
Lấy mẫu là mót quá trinh, qua đó ảnh được tạo nên trên một vùng có tính liên tục được
chuyên thành các ziá trị rời rạc theo tọa độ nguyên Quá trình này gôm 2 lựa chọn:
~ Một là: khoảr mau
~ Hai là: cách n dang mau
Lựa chọn thứ nhất được đảm bảo nhờ lý thuyết lấy mẫu của Shannon Lựa chọn thứ hai liên quan đến $4 do (Metric) được dùng trong miền rời rạc
Khoảng lầy mẫu (Sampling Interval)
Anh lay mẫu có thể được mô tả như việc lựa chọn một tập các vị trí lấy mẫu trong không gian hai chiều liên tục Đầu tiên mô tả qua quá trình lấy mẫu một chiều với việc sử dụng ham delta:
= yy (0 khí x # 0 ä
ore (œ—ze)dx =[” ð = (x— xạ)dx=1 0-2)
Tiếp theo chúng ta định nghĩa hàm răng lược với các khoảng Ax như sau:
Comb(x)=y£-_« ô(x — rAx) (2-3)
với r là số nguyên, Ax : khoảng lấy mẫu
Như vậy, hàm răng lược là chuỗi các xung răng lược từ (-o đến +o), Giả sử hàm một
chiều g(x) được mô tả (gần đúng) bằng g(7Az) tức là:
Trang 27a(x) “{g(0), a(Ax), g(2Ax), ,8((N-1) Ax )} (2-7)
Cha y 1: Khoang lay mau (Sampling Interval) là Axlà một tham số cần phải được chọn
đủ nhỏ, thích hợp, nếu không tín hiệu thật không thể khôi phục lại được từ tín hiệu lấy
mẫu
Chú ý 2: Từ lý thuyết về xử lý tín hiệu số , (2-6) là tích chập trong miền không gian sẽ
Mặt khác (2-6) tương đương với tích chập trong miễn tần số œ tức là biến đôi Fourier
của gs(X) là Gs(@§)
k
trong đó wx 1a giá trị tần số ứng với giái tri x trong miền không gian
Điều kiện khôi phục ảnh lấy mẫu về ảnh thật được phát biểu từ định lý lẫy mẫu của
Shannon
Lượng tử hóa
1u tượng tử hoá là một quá trình lượng hoá tin hiệu thật dùng chung cho các loại xử lý tín
Ên cơ sở máy tính van dé này đã được nghiên cứu kỹ lưỡng và có nhiều lời giải lý
dưới nhiều giả định của các nhà nghiên cứu như Panter và Dite (1951), Max
( 1960), Variter (1965) Các giá trị lấy mau Z là một tập các số thực từ giá trị Zmin đến
Mi một số trong các giá trị mẫu Z cần phải biến đổi thành một tập hữu ính lưu trữ hoặc xử lý
i ượng từ hoá là ánh xạ từ các sô thực mô tả giá trị lây mẫu thành một giải
hữu hạn các s thực Nói cách khác, đó là quá trình sô hoá biên độ
LL LÌ
|
Hình 2.4 Khuông lượng tử theo L mức xám
Giả sử Z là một giá trị lấy mẫu (số thực) tại vị trí nào đó của mặt phẳng ảnh, và Zmin
oem và giả sử chúng ta muôn lượng hoá giá trị đó thành một trong các mức rời
rac: 12, tương ứng với Zmin đến Zmax (Hình 2.4) Khi đó, quá trình lượng hoá
có nid thus hiện bằng cách chia toàn bộ miền vào (Zmax - Zmin) thành L khoảng, mỗi khoảng là AI và khoảng thứ I được đặt tại điểm giữa các khoảng liền kè li họ các giá
trị z được thực hiện và mô tả bằng li theo quá trình trên đây, khi đó sai số của quá trình
lấy mẫu có thể được xác định theo ;
2.2.3.Mối liên hệ giữa các điểm ảnh
Một ảnh số giả sử được biểu diễn bằng hàm f(x, y) Tập con các điểm ảnh là S; cặp điểm
ảnh có quan hệ với nhau ký hiệu là p, q Chúng ta nêu một sô các khái niệm sau
a Các lân cận của điểm ảnh (Image Neighbors)
Chương 2:Tổng quan về xử lý ảnh số và nhận dạng 13
Trang 28Nhận dạng biển số xe ứng dụng Arm9
Giả sử có điểm ảnh p tại toạ độ (x,y).p có 4 điểm lân cận gần nhất theo chiều đứng và
ngang (có thể coi như lân cận 4 hướng chính: Đông, Tây, Nam, Bắc)
{OcL, y); Œ, y~1); Œx, y+); (+L, y)} = N4(p)
trong đó: số 1 là giá trị logic; N4(p) tập 4 điểm lân cận của p
_ &-1,y) @y) (x+1, y)
Bắc (x-1,y+1) @œ,y+Ù) (x+1, y+1)
Hình 2.5 Lân cận các điểm ảnh của tọa độ (x,y)
~ (4c lan can chéo : các điểm lân cận chéo NP(p) (Có thể coi lân cận chéo là 4
ñhuớng : Đông-Nam, Đông-Bắc, Tây-Nam, Tây-Bắc)
£) = { (+1, y+l); (x+1, y-1); @-1, yÊ1); @-1, y-1)}
N8(p) = N4(p) + NP@) là tập hợp 8 lân cận của điểm ảnh p
(x, y) nam ở biên (mép) ảnh; một số điểm sẽ nằm ngoài ảnh
Giả sử V là tập các giá trị mức xám Một ảnh có các giá trị cường độ sáng từ thang mức
xám từ 32 đến 64 được mô tả như sau :
V=(32, 33, ., 63, 64}
Có 3 loại liên kết
-_ Liên kết 4: Hai điểm ảnh p và q được nói là liên kết 4 với các giá trị cường độ
sáng V nếu q nằm trong, một các lân cận của p, tức q thuộc N4(p)
-_ Liên kết 8: Hai điểm ảnh p và q nằm trong một các lân cận 8 của p, tức q thuộc
N§(p)
~_ Liên kết m (liên kết hỗn hợp): Hai điểm ảnh p và q với các giá trị cường độ sáng
V được nói là liên kết m nếu
+q huộc N4( ) hoặc
+q hudc NP(p)
c Đo khoảng cách giữa các iềm ảnh
Định nghĩa: Khoảng cách D(p, q) giữa hai điểm ảnh p toạ độ (x, y), q toạ độ (s, t) 1a ham khoảng cách (Distance) hoặc Metric nếu:
1 D(,q) > 0 (Với D(,g)=0 nếu và chỉ nếu p=q)
Trang 29Nhận dạng biển số xe ứng dụng Arm9
DeŒ,q) = [Œ — s92 + (y = 0)?)]!/?
Khoảng cách khối: Khoảng cách D4(p, q) được gọi là khoảng cách khối đồ thị (City-
Block Distance) va duoc xác định như sau:
DA) =|[x-s[+|y - t|
Giá trị khoảng cách giữa các điểm ảnh r: giá trị bán kính r giữa điểm ảnh từ tâm điểm ảnh
đến tâm điểm ảnh q khác Ví dụ: Màn hình CGA 12” (12”*2,54cm = 30,48cm=304,8mm)
độ phân giải 320*200; tỷ lệ 4/3 (Chiều dài/Chiều rộng) Theo định lý Pitago về tam giác
vuông, đường chéo sẽ lấy tỷ lệ 5 phần (5/43: đường chéo/chiều dài/chiều rộng màn hình); khi đó độ dài thật là(305/244/183) chiều rộng màn hình 183mm ứng với
màn hình CGA 200 điểm ảnh theo chiều dọc
Như vậy, khoảng cách điêm ảnh lân cận của CGA 12” là = 1mm
Khoảng cách D8(p, q) còn gọi là khoảng cách bàn cờ (Chess-Board Distance) giữa điểm ảnh p, q được xác định như sau:
D§(p,q) = max (| x-s |, | y-t |)
2.3.Nâng cao chất ' lượng ảnh trong miền không gian
1.Các phép biến đổi mức xám cơ bản
cao chât lượng là bước cần thiết trong xử lý ảnh nhằm hoàn thiện một số đặc tính của ánh Nang cao chất lượng ảnh gồm hai công đoạn khác nhau: tăng cường ảnh và khôi phục ánh Táng cường ảnh nhằm hoàn thiện các đặc tính của ảnh như :
- Loenk hay làm trơn ảnh
1 tượng ng điều chỉnh mức xám của ảnh,
ết dựa trên các kỹ thuật trong
gian và tần số Toán tử điểm là phép biến đổi đối với từng điểm ảnh
quan đến các điểm lân cận khác, trong khi đó, toán tử không gian sử
ụ cận để quy chiếu tới điểm ảnh đang xét Một số phép biển đôi có tính toán phức tạp được chuyế én sang miền tần số để thực hiện, kết quả cuối cùng được chuyển trở lại miền khóng gian nhờ các biến đổi ngược
Khai niệm về toán từ điểm:
Xử lý điểm ảnh thực chất là biến đôi giá trị một điểm ảnh dựa vào giá trị của chính nó mà không hề dựa vào các điểm ảnh khác Có hai cách tiệm cận với phương pháp này Cách thứ nhất dùng một hàm biến đổi thích hợp với mục đích hoặc yêu cầu đặt ra để biến đổi
giá trị mức xám của điểm ảnh sang một giá trị mức xám khác Cách thứ hai là dùng lược
đồ mức xám (Gray Histogram) Về mặt toán học, toán tử điểm là một ánh xạ từ giá trị
cường độ ánh sáng u(m, n) tại toạ độ (m, n) sang giá trị cường độ ánh sáng khác v(m, n)
thông qua hàm f(.), tức là:
v(m, n)~f(uím, n)) (2-10)
Nói một cách khác, toán tử điểm là toán tử không bộ nhớ, ở đó một mức xác u € [0, N]
được ánh xa sang m6t mic ximv €[0,N]:v=f(u) Ứng dụng chính của các toán tử
điểm là biến đổi độ tương phản của ảnh Ánh xạ f khác nhau tùy theo các ứng dụng Các
đạng toán tử điểm được giới thiệu cụ thể như sau:
Các cấp độ ơ ,B ,y xác định độ tương phản tương đối L là số mức xám cực đại
Tach nhiễu và phân ngưỡng
Trang 30Thận dạng biển số xe ứng dụng Arm9
0 O<u<a
L u>b Trong đó a = b =t gọi là phân ngưỡng
2.3.2.Bộ lọc trong miền không gian
Lọc không gian thường được thực hiện để khử nhiễu hoặc thực hiện một số kiểu nâng cao
ảnh
Có ba kiểu lọc được trình bảy ở đây là:
~ Lọc trung bình
- Lọc trung vị
- Loc nang cao
Hai kiểu lọc đầu tiên chủ yếu được sử dụng để che đậy hoặc khử nhiễu, mặc dù chúng
cũng có thể được sử dụng cho các ứng dụng cụ thể khác Các bộ lọc nâng cao thường để
làm sáng các cạnh và các chỉ tiết nằm trong ảnh
Nhiều bộ lọc không gian được thực hiện thông qua phép cuộn Bởi vì thao tác mặt nạ
cuộn cung cấp kết quả là tổng, trọng số của các giá trị của một pixel và các láng giềng của
nó, nên được gọi là một bộ lọc tuyến tính Một khía cạnh thú vị của các mặt nạ cuộn là
hiện ứng tông thể có thể dự đoán được dựa trên mẫu của chúng Chẳng hạn, nếu các hệ số
của trật nạ có lông bằng 1, thì độ sáng trung bình của ảnh sẽ được giữ nguyên Nếu tổng các hệ số báng 0, thì độ sáng trung bình sẽ mắt đi và trả về một ảnh tối Hơn nữa, nếu các
hệ sô có cá ára vá dương, thì mặt nạ là một bộ lọc trả về chỉ thông tin cạnh, còn nếu các
hệ số đều đư ng, thi nd là một bộ lọc làm mờ (blur) ảnh the image
Lọc trung bình:
Cac bé loc trung binh thao tác trên các nhóm pixel địa phương được gọi là vùng láng
giềng và tỉ; é pixel trung tâm bởi trung bình của các pixel trong cùng láng giêng đó
Việc thay thế nấy được thực hiện bằng một mặt nạ cuộn chẳng hạn như mặt nạ 3x3 sau đây:
1/9 1/9 1/9
1/9 1/9 1/9
Chú ý rằng các hệ số trong mặt nạ này có tổng bằng 1, nên độ sáng ảnh giữ nguyên, và
các hệ số đều dương nên nó có khuynh hướng làm nhoè ảnh Cũng có các bộ lọc trung bình khác phức tạp hơn được thiết kế dùng cho các kiểu nhiễu cụ thể
Lọc trung vị:
Lọc trung vị là lọc phi tuyến Một phép lọc phi tuyến là một kết quả không thể thu được
từ một tông trọng số của các pixel láng giềng, như đã thực hiện với mặt nạ cuộn Tuy nhiên lọc trung vị cũng thực hiện trên cùng một vùng láng giềng địa phương Sau khi đã
định nghĩa kích thước vùng láng giềng, pixel trung tâm được thay bằng trung vị tức là giá
trị chính giữa của tất cả các giá trị lang giềng
Vi du: Cho trước một cùng láng giéng 3x3:
Trang 31Nhận dạng biển số xe ứng dung Arm9
giữa, trường hợp này là 5 Giá trị 5 này tiếp đó được đặt vào vị trí trung tâm Một bộ lọc
trung vị có thể sử dụng một vùng láng giềng có kích thước bất kì, nhưng phô biến là các
kích thước 3x3, 5x5 và 7x7 Chú ý rằng ảnh đầu ra phải được ghỉ vào một ảnh riêng (bộ
đệm) Hình 2.6 minh hoạ việc sử dụng bộ lọc trung vị để khử nhiễu
Hình 2.6 Lọc trung vị
Bộ lọc nâng cao:
Các bộ lọc ¿ cao được xét ở đây có các bộ lọc kiểu laplacian-type và lọc sai
phân (difference filter) Các kiều bộ lọc này có khuynh hướng để đưa ra, hoặc nâng cao các chỉ tiết trong anh Hai mặt nạ cuộn sử dụng cho các bộ lọc kiểu laplacian là
Các bộ lọc kiéu laplacian sé nang cao được các chỉ tiết đêu theo mọi hướng Còn các bộ
lọc sai phân sẽ náng cao các chi tiết theo hướng xác định theo mặt nạ đã chọn Có 4 mặt
nạ cuộn lọc sai phán tương ứng với theo các hướng dọc, ngang và hướng theo hai đường,
Trang 32Nhận dang biển số xe ứng dụng Arm9
Hình 2.7 Các bộ lọc nâng cao
2.4.Nén ảnh
1.Các kiến thức cơ bản
én dữ liệu (Data Compression)
Nền dữ liệu nhám làm giảm lượng thông tin “dư thừa” trong dữ liệu gốc và do vậy, lượng, thông tin thu được sau khi nén thường nhỏ hơn đữ liệu gốc rất nhiều Với dữ liệu ảnh, kết
quả thường Í4 10:1, Một số phương pháp còn cho kết quả cao hơn Theo kết quả nghiên
cứu được gan day tai Vién Kỹ thuật Georfie, kỹ thuật nén fratal cho tỉ sô nén là
30 wén 1 Ngoai thuật ngữ “nén dữ liệu”, do bản chất của kỹ thuật này nó còn có một số
tên gọi khác nư : giảm độ dư thừa, mã hóa ảnh gốc
Từ hơn kỷ nay, có rất nhiều kỹ thuật nén đã được công bố trên các tài liệu về
nén và các phán mém nén dữ liệu đã xuất hiện ngày càng nhiều trên thương trường Tuy nhiên, chưa có ng pháp 1 nén nào được coi là phương phap van nang (Universal) vi
nó phụ thuộc vào r¡ yêu tố và bản chất của dữ liệu gốc Trong luận văn này, chúng ta không thể hy vọng xem xét tất cả các phương pháp nén Hơn thế nữa, các kỹ thuật nén
dữ liệu chung đã được trình bày trong nhiều tài liệu chuyên ngành Ở đây, chúng ta chỉ
để cập các phương pháp nén có đặc thù riêng cho dữ liệu ảnh
Tỷ lệ nén (Compression Rate)
Tỷ lệ nén là một trong các đặc trưng quan trọng nhất của mọi phương pháp nén Tuy nhiên, về cách đánh giá và các kết quả công bố trong các tài liệu cũng cần quan tâm xem xét Nhìn chung, người ta định nghĩa tỷ lệ cơ bản của phương pháp nén Nhiều khi tỷ lệ nén cao cũng chưa thể nói phương, pháp đó hiệu quả hơn các phương pháp khác, vì còn các chi phi như thời gian, không gian và thậm chí cả độ phức tạp tính toán nữa Thí dụ
như nén phục vụ trong, truyền dữ liệu: vấn đề đặt ra là hiệu quả nén có tương hợp với
đường truyền không Cũng cần phân biệt dữ liệu với nén băng truyền
Mục đích chính của nén là giảm lượng thông tin dư thừa và dẫn tới giảm | kích thước dữ
liệu Tuy vậy, đôi khi quá trình nén cũng làm giảm băng truyền tín hiệu số hóa thấp hơn
so với truyền tín hiệu tương tự
b.Các loại dư thừa dữ liệu
Như đã nói, nén nhằm mục đích giảm kích thước dữ liệu bằng cách loại bỏ dư thừa đữ
liệu Việc xác định bản chất các kiểu dư thừa dữ liệu rất có ích cho việc xây dựng các
phương pháp nén dữ liệu khác nhau Nói một cách khác, các phương pháp nén dữ liệu
khác nhau là do sử dụng các kiểu dư thừa khác nhau Người ta coi có 4 kiểu dư thừa
Trang 33hận dạng biển số xe ứng dụng Arm9
- Sự phân bố ký tự : Trong một dãy ký tự,có một số ký tự có tần suất xuất hiện
nhiều hơn so với các dãy khác Do vậy, ta có thể mã hóa dữ liệu một cách cô đọng hơn
Các dãy ký tự có tần suất cao được thay bởi một từ mã nhị phân với số bit nhỏ; ngược lại
các dãy có tần suất xuất hiện thấp sẽ được mã hóa bởi từ mã có nhiều bít hơn Đây chính
là bản chất của phương pháp mã hóa từ hóa Huffman
+ Sự lặp lại của các ký tự : Kỹ thuật nén dùng trong trường hợp này là thay dãy lặp
đó bởi dãy mới gồm hai thành phần: số lần lặp và kí hiệu dùng để mã hóa Phương pháp
mã hóa kiểu này có tên là mã hóa loạt dài RLC (Run Length Coding)
- Những mẫu sử dụng tần suất: Có thể có dãy ký hiệu nào đó xuất hiện với tần suất
tương đối cao Do vây, có thể mã hóa bởi ít bit hơn Đây là cơ sở của phương pháp mã hóa kiểu từ điển do Lempel- Ziv đưa ra và có cải tiến vào năm 1977, 1978 và do đó có tên gọi là phương pháp nén LZ77,LZ78 Năm 1984, Tery Welch đã cải tiến hiệu quả hơn và đặt tên là LZW (Lempel-Ziv-Welch)
- Độ dư thừa vị trí: Do sự phụ thuộc lẫn nhau của dữ liệu, đôi khi biết được ký
hiệu (giá trị) xuất hiện tại một vị trí, đồng thời có thể đoán trước sự xuất hiện của các giá
trị ở các vị trí khác nhau một cách phù hợp Chang han, anh biéu dién trong một lưới hai chiều một số điểm ở hàng dọc trong một khối dữ liệu lại xuất hiện trong cùng vị trí ở các hàng khác nhau Do vậy, thay vì lưu trữ dữ liệu, ta chỉ cần lưu trữ vị trí hàng và cột
Phương pháp nén dựa trên sự dư thừa này gọi là phương pháp mã hóa dự đoán
Phan loại phương pháp nén
ó phân loại các phương pháp nén khác nhau Cách thứ nhất dựa vào nguyên
ch na: pita, các phương pháp nén thành hai He lớn:
- Nén o mat thông tin: họ này bao gồm các phương pháp mà sau khi giải nén ta không thụ được dữ liệu như bản gốc Phương pháp này lợi dụng tính chất của mắt
nhận một số vặn xoăn trong ảnh khi khôi phục lại Tất nhiên, các phương nảy chỉ có hiệu quả khi mà độ vặn xoắn chấp nhận được bằng mắt thường hay với dung sai nảo đấy
Cách phân loại thứ hai dựa vào cách thức thực hiện nén Theo cách này, người ta cũng phân thành hai họ:
- Phương pháp không gian (Spatial Data Compression): Các phương, pháp thuộc
họ này thực hiện nén bằng các tác động trực tiếp lên việc lấy mẫu của ảnh trong miên không gian
- Phương pháp sử dụng biến đổi (Transform Coding): gồm các phương pháp tác
động lên sự biến đổi của ảnh gốc mà không tác động trực tiếp như họ trên
Có một cách phân loại khác nữa, cách phân loại thứ ba, dựa vào lý thuyết của sự mã hóa
Cách này cũng phân các phương pháp nén thành hai họ:
- Các phương pháp nén thế hệ thứ nhất: Gồm các phương pháp mà mức độ tính
toán là đơn giản, thí dụ việc lấy mẫu, gán từ mã,.v.v
~ Các phương pháp nén thé hệ thứ hai: dựa vào độ bão hòa của tỷ lệ nén
2.4.2.Nén ảnh dựa vào biến đổi
a.Nguyên tắc chung
Các phương pháp mã hóa dựa vào biến đổi làm giảm lượng thông tin dư thừa không tác
động lên miền không gian ¢ của ảnh số mà tác động lên miễn bi ến đổi Các biến đổi được dùng ở đây là các biến đổi tuyến tính như: biến đổi KL, biên đôi Fourier, biến đổi Hadamard, Sin, Cosin vv Vì ảnh số thường có kích thước rất lớn, nên trong cài đặt người ta thường chia ảnh thành các khối chữ nhật nhỏ Thực tế, người ta dùng khối vuông
kích thước cỡ 16x16 Sau đó biến đổi từng khối một cách độc lập
Chương 2:Tông quan về xử lý ảnh số và nhận dang Tô
Trang 34
Thận dạng biển số xe ứng dung Arm9
Chúng ta đã biết, dạng chung của biến đổi tuyến tính 2 chiều là:
Xím,n)=Ðs° Lian, n, k, D (k,l
- x(k, D là tín hiệu vào Cr tee)
- a(m, n, k, ]) là các hệ số củ
Ma trận này gọi là nhân của biến iến đổi — là phần tử của ma trận biến đổi A Cách xác định các hệ số này là phụ thuộc vào từng,
loại biến đổi sử dụng Đối với phan lớn các biến đổi 2 chiều, nhân có tính đối xứng và tách được :
A[m, n, k, []ƑA'[m, k] A” En, 1
Nếu biến đổi là KL thì các hệ sô đó chính là các phần tử của véctơ riêng
b.Thuật toán mã hóa dùng biến đổi 2 chiều
Các phương pháp mã hóa dùng biến đổi 2 chiều thường có 4 bước sau:
B1, Chia ảnh thành khối:
~ Ảnh được chia thành các khối nhỏ kích thước k x 1 và biến đổi các khối đó
một cách độc lập để thu được các khối Vị, ¡=0,1, ,B với B = MxN/( x1)
B2 Xác định phân phối bit cho từng khối:
- Thường các hệ sô hiệp biến của các biến đổi là khác nhau Mỗi hệ số yêu cầu
lượng hóa với một số lượng bit khác nhau
133 Thiết kế bộ lượng hóa:
-_ Với phán lớn các biết đổi, các hệ số vO, 0) là không â âm Các hệ số còn lại có
0 Để tính các hệ số, ta có thể dùng phân bố Gauss hay Laplace Các hệ
xc rã hóa bởi số bit khác nhau, thường từ 1 đến 8 bit Do vậy cân thiết kế 8 tơng hóa, Để dễ cài đặt, tín hiệu vào v1 (k, I) được chuẩn hóa để có dạng:
AK DEAK D/O, DEO.)
Trước khí thiết kế bộ lượng hóa, người ta tìm cách loại bỏ một số hệ sô không cân
lượng tính toản sẽ rất lớn vì phải tính ma trận hiệp biến, i iép sau là phải giải
phương trình tìm trị riêng và véctơ riêng để xác định các hệ số Vì lý do này, trên
thực tẾ người tai thích dùng các biến đổi khác như Hadamard, Haar, Sin và Cosin Trong sô biến đổi này, biến đổi Cosin thường hay được dùng, nhiều hơn
Hình 2.8 Mã hóa và giải mã bởi mã hóa bởi biến đổi
e.Mã hóa dùng biến đổi Cosin và chuẩn Jpeg
Phép biến đỗi Cosin một chiều
Phép biến đổi Cosin rời rạc (DCT) được Ahmed đưa ra vào năm 1974 Kể từ đó đến
Chương 2:Tông quan về xử lý ảnh số và nhận dạng 20
Trang 35
Nhận dạng biển số xe ứng dụng Arm9
nay nó được ứng dụng rất rộng rãi trong nhiều phương pháp mã hóa ảnh khác nhau nhờ
hiệu suât gan như tôi ưu của nó đối với các ảnh có độ tương quan cao giữa các điểm ảnh
lân cận Biến đổi Cosin rời rạc được sử dụng trong chuẩn ảnh nén JPEG và định dạng phim MPEG
Phép biến đổi Cosin rời rac mt chiều được định nghĩa bởi:
i phan, mirc xám chỉ có 2 giá trị là 0 hay 1 Do vậy, ta coi một phần tử ảnh
như một phân tử lô-gíc và có thể áp dụng các toán tử hình học (morphology operator)
dựa trên khái niệm biến đổi hình học của một ảnh bởi một phần tử cấu trúc (structural
điểm lân cận với mô-típ của mặt nạ theo cách lấy hội hay lấy tuyển Hình 2.9 dưới đây,
chỉ ra một phán tử cấu trúc và cách lấy hội hay tuyển:
Hình 2.9 Cải thiện ảnh nhị phân
Dựa vào nguyên tắc trên, người ta sử dụng 2 kỹ thuật: dan anh (dilatation) va co anh
(erosion) Dãn ảnh nhằm loại bỏ điểm đen bị vây bởi các điểm trang Trong kỹ thuật nay,
một cửa số N+1 x N+1 được rê đi khắp ảnh và thực hiện đối sánh một pixel của ảnh với
(N+1*2 - 1 điểm lân cận (không tính điểm ở tâm) Phép đối sánh ở đây thực hiện bởi
phép tuyển lôgíc Thuật toán biến đổi được tóm tắt như sau:
For all pixels I(x,y) do
Begin
Tinh F
Trang 36Nhận dạng biển số xe ứng dụng Arm9
OR (xy) {tinh or 16 gic } -ifF
OR
&y)_ then ImaOut(x,y) < 1 else ImaOut(x,y) <- Imaln(x,y)
End 2.5.2.Một số thuật toán hình thái cơ bản trên ảnh nhị phân
Khuếch đại và nội suy ảnh
Có nhiều ứng dụng cần thiết phải phóng đại một vùng của ảnh Có nghĩa là lấy một vùng của ảnh đã cho và cho hiện lên như một ảnh lớn Có 2 phương pháp được dùng là lặp
(Replication) và nội suy tuyến tính (linear interpolation)
Phương pháp lặp
Người ta lấy một vùng của ảnh kích thước M xN và quét theo hàng
Mỗi điểm ảnh nằm trên đường quét sẽ được lặp lại 1 lần và hàng quét cũng được lặp lại 1
lần nữa Như vậy ta sẽ thu được ảnh với kích thước 2N x 2N Điêu này tương, đương với chèn thêm một hàng 0 và một cột 0 rồi chập với mặt nạ H
Thông thường, tron phán tích ảnh, ta muốn nghiên cứu tỉ mỉ một vùng cụt thể trong ảnh,
ta gọi là ving quan tam (Region of Interest-ROI) Dé lam điều đó, ta cần các thao tác chỉnh sửa các t4 độ không gian của ảnh, và chúng được xếp vào loại các thao tác hình
học ảnh
Các thao tác hình học ảnh trình bày ở đây bao gồm: cắt xén, zoom, phóng to (enlarge),
thu nhé (shrink), tịnh tiền, và quay Quá trình cắt xén ảnh là quá trình chọn ra một phần
nhỏ của ảnh, một ảnh con, và cất nó ra khỏi pha còn lại của ảnh Sau khi ta đã cắt xén ra một ảnh con từ ảnh gộc, ta có thể zoom to nó bằng cách phóng to nó Quá trình zoom này có thể được thực hiện theo một số cách thức khác nhau, nhưng thông thường
là được thực hiện ở xử lý bậc 0 hoặc bậc nhất (zero- or first-order hold ) Một xử lý bậc 0
được thực hiện bằng cách lặp lại các giá trị pixel trước đó, do đó tạo ra một hiệu ứng khối
(block), Để mở rộng kích thước ảnh bằng xử lý bậc nhát, ta cần thực hiện một phép nội suy tuyến tính giữa các pixel kề nhau
Tịnh tiến và quay ảnh:
Hai thao tác dang chú ý khác trong hình học ảnh ROI là tịnh tiến và quay
Quá trình tịnh tiên có thể được thực hiện với các phương trình sau:
T76:
c=c+cs
trong dé r’ vac’ 1a cdc toa độ mới, r và c là cdc toa dé ban dau, và rọ và cọ là các khoảng
cách cần dịch chuyên (tinh tién) anh
Qué trinh quay cần sử dụng các phương trình sau:
1°”=rcos9 +csin9 c?’=-rsin6+ccos®
Trang 37Nhận dạng biển số xe ứng dụng Arm9
trong đó r'°, `” là các toạ độ mới, r và e là các toạ độ ban đầu, 9 là góc quay 0 được định
aa theo chiều quay kim đồng hồ tính từ trục hoành trong ảnh mà gốc toạ độ nằm ở góc
trái trên
2.6.Phân vùng ảnh
2.6.1.Phát hiện tính không liên tục
Phân vùng ảnh là bước then chốt trong xử lý ảnh Giai đoạn này nhằm phân tích ảnh
thành những thành phần có cùng tính chất nào đó dựa theo biên hay các vùng liên thông
“Tiêu chuẩn để xác định các vùng liên thông có thể là cùng mức xám, cùng màu hay cùng
độ nhám Trước hết cần làm rõ khái niệm "ving ảnh" (Segment) và đặc điểm vật lý của
vùng Vùng ảnh là một chỉ tiết, một thực thể trong toàn cảnh Nó là một tập hợp các điểm
có cùng hoặc gần cùng một tính chất nào đó : mức xám, mức màu, độ nhám Vùng ảnh
là một trong hai thuộc tính của ảnh Nói đến vùng ảnh là nói đến tính chất bề mặt Đường
bao quanh một vùng ảnh (Boundary) là biên ảnh Các điểm trong một vùng ảnh có độ
biến thiên giá trị mức xám tương đối đồng đều hay tính kết cấu tương đồng Dựa vào đặc tính vật lý của ảnh, người ta có nhiều ¡ kỹ thuật phân vùng : phân vùng dựa theo miền liên
thông gọi là phân vùng dựa theo miễn đồng nhất hay miễn kề ; phân vùng dựa vào biên gọi là phân vùng biên Ngoài ra còn có các kỹ thuật phân vùng khác dựa vào biên độ,
phần vụng dựa theo kết cầu
Phan vung anh theo ngưỡng, biên độ
Các đặc tỉnh đrn n, cần thiết nhất của ảnh là biên độ và các tính chất vật lý như : độ
tương phá sáng, màu sắc hoặc đáp ứng phổ Như vậy, có thể dùng ngưỡng
bién dO dé phan vung khi biên độ đủ lớn đặc trưng cho ảnh Thí dụ, biên độ trong bộ cảm biến ảnh hông ngoại có thể phản ánh vùng có nhiệt độ thấp hay vùng có nhiệt độ cao Kỹ thuật phân ngướng theo bién độ rất có lợi đối với ảnh nhị phân như văn bản in, đồ họa, anh mau hay anh X-quang
Viéc chon n; + quan trọng Nó bao gồm các bước :
- Xem xét lược đỗ xám của ảnh để xác định các đỉnh và các khe Nếu ảnh có đạng rắn lượn (nhiêu đỉnh và khe), các khe có thể dùng để chọn ngưỡng
- Chọn ngưỡng t sao cho một phần xác định trước ị của toàn bộ số mẫu là thấp hơn t
~ Điều chỉnh ngơjỡng dựa trên lược đồ xám của các điểm lân cận
- Chọn ngưỡng theo lược đồ xám của những, điểm thỏa mãn tiêu chuẩn chọn Thí
dụ, với ảnh có độ tương phản thấp, lược đồ của những điểm có biên độ Laplace
g(m,n) lớn hơn giá trị t định trước (sao cho từ 5% đến 10% số điểm ảnh với Gradient lớn nhất sẽ coi như biên) sẽ cho phép xác định các đặc tính ảnh lưỡng cực tốt hơn ảnh gốc
= Khi có mô hình phân lớp xác suất, việc xác định ngưỡng dựa vào tiêu chuẩn xác suất nhằm cực tiểu xác suất sai số hoặc dựa vào một số tính chất khác của luật Bayes
2.6.2.Phân đoạn ảnh dựa vào các vùng ảnh con
Kỹ thuật phân vùng ảnh thành các miền đồng nhất dựa vào các tính chất quan trọng nào
đó của miễn ảnh Việc lựa chọn các tính chất của miền sẽ xác định tiêu chuẩn phân vùng
Tính đồng nhất của một miễn ảnh là điểm chủ yếu xác định tính hiệu quả của việc phân vùng Các 'tiêu chuẩn hay được dùng là sự thuần nhất về mức xám, màu sắc đối với ảnh
màu, kết cấu sợi và chuyển động
Các phương pháp phân vùng ảnh theo miền đồng nhất thường áp dụng là :
~ Phương pháp tách cây tứ phân
Trang 38Nhận đạng biển số xe ứng dụng Am9
~ Phương pháp cục bộ
- Phương pháp tổng hợp
a.Phương pháp tách cây tứ phân
Về nguyên tắc, phương pháp này kiểm tra tính đúng đắn của tiêu chuẩn đề ra một cách
tổng thê trên miễn lớn của ảnh Nếu tiêu chuẩn được thỏa mãn, việc phân đoạn coi như kết thúc Trong trường hợp ngược lại, chia miền đang xét thành 4 miền nhỏ hơn Với mỗi
miền nhỏ, áp dụng một cách đệ quy phương pháp trên cho đến khi tất cả các miền đều
thỏa mãn điêu kiện
b.Phương pháp cục bộ
Ý tưởng của phương pháp là xét ảnh từ các miền nhỏ nhất rồi nối chúng lại nếu thỏa mãn tiêu chuẩn để được một miền đồng nhất lớn hơn Tiếp tục với các miền thu được cho đến
khi không thể nối thêm được nữa Số miền còn lại cho ta kết quả phân đoạn Như vậy,
miền nhỏ nhất của bước xuất phát là điểm ảnh.Phương pháp này hoàn toàn ngược với
phương pháp tách Song điều quan trọng ở đây là nguyên lý nối 2 vùng Việc nỗi 2 vùng
được thực hiện theo nguyên tắc sau :
~ Hai vùng phải đáp ứng tiêu chuẩn, thí dụ như cùng màu hay cùng mức xám
- Hai vùng phải kê cận nhau
Khái niệm kê cận: trong xử lý ảnh, người ta dùng khái niệm liên thông để xác định tính chat ké can Có hai khái niệm về liên thông là 4 liên thông và 8 liên thông Với 4 liên
thông một điểm ảnh I(x,y) sẽ có 4 kế cận theo 2 hướng x va y; trong khi đó với 8 liên
thông, đi (x,y) sẽ có 4 liên thông theo 2 hướng x, y và 4 liên thông khác theo hướng
chéo 45 đó,
c.Phương pháp tang hợp
Hai phương pháp nói (hợp) và tách đều có nhược điểm Phương pháp tách sẽ tạo nên một cấu trúc phán cáp vá thiết lập mối quan hệ giữa các vùng Tuy nhiên, nó thực hiện việc
chia qué cl Phương pháp hợp cho phép làm giảm số miễn liên thông xuống tối
thiểu, nhưng cấu trúc hàng ngang dàn trải, không cho ta thấy r mối liên hệ giữa các miền
Vì nhược diem nay, ngudi ta nghi dén phối hợp cả 2 phương pháp Trước tiên, dùng phương pháp tách đé tao nền cây tứ phân, phân đoạn theo hướng từ gốc đến lá lếp theo,
tiến hành duyệt cáy theo chiêu ngược lại và hợp các vùng có cùng tiêu chuân Với
phương pháp nảy ta thu được một cấu trúc ảnh với các miền liên thông có kích thước tối
Nhận dạng ảnh là giai đoạn cuôi cùng của các hệ thông xử lý ảnh Nhận dạng ảnh dựa
trên nền tảng lý thuyết nhận dạng (pattern recognition) nói chung và đã được đề cập trong,
nhiều sách, tài liệu về nhận dạng Ở đây, người nghiên cứu không nhắc lại mà chỉ trình bày một cách tổng quan về các khái niệm eơ bản và các phương pháp thường được sử
dung trong kỹ thuật nhận dang ảnh Nhìn chung, có ba cách tiếp cận trong nhận dạng ảnh:
~_ Nhận dạng tham sô
~_ Nhận dạng theo cau trúc
- Nhận dạng dựa trên trí tuệ nhân tao
Hai cách tiếp cận đầu là các kỹ thuật kinh điền Các đôi tượng ảnh quan sát và thu nhận
được phải trải qua giai đoạn tiền xử lý, làm nôi các chỉ tiết, tiếp theo là trích chon va biéu diễn các đặc trưng, và cuối cùng là giai đoạn nhận dạng Cách tiệp cận thứ ba hoàn toàn
khác Nó dựa vào cơ chế đóan nhận, lưu trữ và phân biệt đổi tượng mô phỏng theo hoạt
động của hệ thần kinh con người Do cơ chế đặc biệt, các đối tượng thu nhận bởi thị giác
người không cần qua giai đoạn cải thiện mà chuyển ngay sang giai đoạn tổng hợp, đối
sánh với các mẫu đã lưu trữ đẻ nhận dạng Đây là cách tiếp cận có nhiều hứa hẹn
Chương 2:Tông quan về xử lý ảnh số và nhận dạng 2¬
Trang 39Nhận dạng biển số xe ứng dụng Arm9
2.7.1.Không gian biểu diễn đối t ông gian diễn dị
Không gian biểu diễn đối tượng pee San alent
Các đổi tượng khi quan sát hay thu thập được thường được biểu diễn bởi tập các đặc
trưng hay đặc tính Trong trường hợp xử lý ảnh, ảnh sau khi được tăng cường để nâng, cao chất lượng, phân vùng và trích chọn đặc tính như đã trình bày trong các phần trước,
được biểu diễn bởi các đặc trưng như biên, miền đồng nhất Người ta thường phân các
đăc trưng này thành các loại như : đặc trưng topo, đặc trưng hình học và đặc trưng chức
năng Việc biểu diễn ảnh theo đặc trưng nào là phụ thuộc vào ứng dụng tiếp theo
Ở đây ta đưa ra một cách hình thức việc biểu diễn các đối tượng Giả sử đối tượng X
(ảnh, chữ viết, dầu vân tay, ) được biểu diễn bởi n thành phẩn (n đặc trưng): X={¡, x;,
#¿›; „„ #ạ}, mỗi x¡ biểu diễn một đặc tính Không gian biểu diễn đối tượng thường được gọi tắt là không gian đối tượng X được định nghĩ:
trong đó mỗi X; biểu diễn một đối tượng Không gian này có thể là vô hạn Để tiện xem
xét chúng ta chỉ xét tập X là hữu hạn
Không gian diễn dịch :
Không gian diễn dịch là tập hợp các tên gọi của đối tượng Kết thúc quá trình nhận dạng,
ta xác định được tên gọi cho các đối tượng trong tập không gian đối tượng hay nói là đã
nhận được đôi tượng Một cách hình thức, gọi © là tập tên đối tượng:
(={W,W¿, ,Wy }với wị là tên các đối tượng
Quá ưình nhán dang đối tượng f là một ánh xa f: X -> © với f là tập các quy luật để định
một phần tử troziz % ứng với một phần tử trong @ Nếu tập các quy luật và tập tên các đối
tượng là biết trước như trong nhận dạng chữ viết (có 26 lớp từ A dén Z), người ta gọi là
nhận dạng có tzáy Trường hợp thứ hai là nhận dạng không có thây Dĩ nhiên trường hợp
này việc nhan dang có khó khăn hơn
2.7.2.Bản chất của quá trinh nhận dạng,
Qua trinh nhan dang gom 3 giai đoạn chính:
- Lua chon mé hinh biéu dién déi tugng -
-_ Lựa chọn luật ra quyết định (phương pháp nhận dạng) và suy diễn quá trình học
- Hoge nhan dang
Khi mô hình biểu diễn đối tượng đã được xác định, có thể là định lượng (mô hình tham
số) hay định tính (mô hình câu trúc), quá trình nhận dang chuyển sang giai đoạn học Học
là giai đoạn rất quan trọng Thao tác học nhằm cải thiện, điều chỉnh việc phân hoạch tập
Việc nhận dạng chính là tìm ra quy luật và các thuật toán để có thể gán đôi tượng vào
một lớp hay nói một cách khác gán cho đối tượng một tên Ở đây ta xem xét kỹ thuật
phân loại dựa vào học có thây
Học có thầy (supervised learning) _ - : l
Kỹ thuật phân loại nhờ kiến thức biết trước gọi là học có thay Dic điểm cơ bản của kỹ
thuật nảy là người ta có một thư viện các mẫu chuân Mẫu cân nhận dạng sẽ được đem so
sánh với mẫu chuẩn để xem nó thuộc loại nào Ví dụ như trong một ảnh viễn thám, người
ta muốn phân biệt một cánh đồng lúa, một cánh rừng hay một vùng đắt hoang mà đã có các miêu tả về các đối tượng đó Vấn đề chủ yếu là thiết kế một hệ thống đề có thể đối sánh đối tượng trong ảnh với mẫu chuẩn và quyết định gán cho chúng vào một lớp Việc
đối sánh nhờ vào các thủ tục ra quyết định dựa trên một công cụ gọi là hàm phân lớp hay
hàm ra quyết định
Trang 40
ˆ Nhận dạng biển số xe ứng dụng Arm9
-ll) t5 tin k trên phân hoạch không gian
Trong kỹ thuật này, các đối tượng nhậi ác đối l ãi đối
được tiêu diễn bởi một vector nhiều thê P °t 9 đời tưng ib, ME IDE SOE SAN
Phân hoạch không gian
Giả sử không gian đối tượng X được định nghĩa: X={X, Xạ, , X,„} X; là một vector
Người ta nói p là một phân hoạch của không gian X thành các lớp Œ¡ Đây là trường hợp
lý tưởng, tập X tách được hoàn toàn Trong thực tế, thường gặp không gian biểu diễn tách được từng phân Như vậy phân loại là dựa vào việc xây dựng một ánh xạ f: X -> p Công
cụ xây dựng ánh xạ này là các hàm phân biệt (Discriminant functions)
Hàm phân lớp hay hàm ra quyết định
Để phân đôi tượng vào các lớp, ta phải xác định số lớp và ranh giới giữa các lớp đó Hàm phân lớp hay hàm phân biệt là một công cụ rất quan trọng Gọi {g;} là lớp các hàm phân lớp Lớp hàm này được định nghĩa như sau:
nếu Vỉ # k, g„(X) thì ta quyết định chọn X E lớp k
Như vậy, đê phân biệt k lớp, ta cân k-1 hàm phân biệt Hàm phân biệt ø của một lớp nào
đó thường dùng là hàm tuyên tính, có nghĩa là ;
a(X)=mo ty Xy twa Xot AW Ky
trong 46: w; là cdc trong sé gan cho cdc thanh phan X;, Wo 1 trong sé dé viét cho gon
‘Trong trường hợp g là tuyến tính, người ta nói là việc phân lớp là tuyến tính hay siêu
phẳng (hypeplan)
Cac ham phan biệt thường được xây dựng dựa trên khái niệm khoảng cách hay dựa vào
xác suất có điều kiện, Lẽ tự nhiên, khoảng cách là một công cụ rất tốt để xác định xem
đối tượng có nhau” hay không Nếu khoảng cách nhỏ hơn một ngưỡng t nào đó ta coi 2 đối tượng l4 giống nhau và gộp chúng vào một lớp Ngược lại, nếu khoảng cách lớn
hơn ngưỡ ó nzhĩa là chúng khác nhau và ta tách thành 2 lớp
Trong một số trương hợp, người ta dựa vào xác suất có điều kiện để phân lớp cho đối
tượng Lý thuyết xác suất có điều kiện được Bayes nghiên cứu khá kỹ và chúng ta có thể
áp ung lý thuyết nay đề phân biệ i tugng
Gọi : P(X/C;) là xác suat dé c6 X biét rang c6 xuất hiện lớp Œ¡
P(€//X) là xác suất có điều kiện để X thuộc lớp Œ¡
với X là đối tượng nhận dạng, C; là các lớp đôi tượng | -
Quá trình học tập cho phép ta xác định P(X/Œ,) và nhờ công thức Bayes về xác suất có điều kiện áp dụng trong điều kiện nhiều biến, chúng ta sẽ tính được P(Œ;/X) theo công
Nếu P(C,/X)> P (Š) với vi z k thì X C Tay theo cée phuong phép nhận dạng khác
nhau, hàm phân biệt sẽ có cách nhận dạng khác nhau