1. Trang chủ
  2. » Giáo Dục - Đào Tạo

Nhận dạng biển số xe Ứng dụng arm9

120 0 0
Tài liệu được quét OCR, nội dung có thể không chính xác
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Nhận dạng biển số xe ứng dụng ARM9
Tác giả Nguyen Quoc Thai
Người hướng dẫn ThS. Pham Van Khoa
Trường học Trường Đại Học Sư Phạm Kỹ Thuật Thành Phố Hồ Chí Minh
Chuyên ngành Sư Phạm Kỹ Thuật Điện - Điện Tử
Thể loại Đồ án tốt nghiệp
Năm xuất bản 2014
Thành phố Thành phố Hồ Chí Minh
Định dạng
Số trang 120
Dung lượng 14,12 MB

Nội dung

Cơ sở của thị giác máy chính là lý thuyết về xử lý ảnh số trong đó bao gồm các quá trình thu nhận ảnh, xử lý ảnh, phân tích ảnh và nhận dang ảnh...Vân đề nhận dạng xe, thông thường được

Trang 1

BO GIAO DUC VA DAO TAO TRUONG DAI HOC SU’ PHAM KY THUAT

THÀNH PHÓ HÒ CHÍ MINH

HGMUIIE

ĐỎ ÁN TÓT NGHIỆP NGÀNH KỸ THUẬT ĐIỆN - ĐIỆN TỬ

Trang 2

KHOA ĐIỆN - ĐIỆN TỬ

BỘ MÔN ĐIỆN TỬ CÔNG NGHIỆP

TRƯ VIÊN TRƯỜNG D1:^?XT

Tp.Hồ Chí Minh, tháng 8 năm 2014

Trang 3

TRUONG DH, SU PHAM KY THUAT CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM

TP HÒ CHÍ MINH ĐỘC LẬP - TỰ DO - HẠNH PHÚC

KHOA DIEN-DIEN TU

Tp HCM, ngày tháng năm 20144

NHIEM VU DO AN TOT NGHIỆP

HQ TEN SINH VIEN: NGUYEN QUOC THAI MSSV: 09901012

CHUYÊN NGÀNH : Sư Phạm Kỹ thuật Điện - Điện tử Mã ngành: 01

Trang 4

4, Kết quả đạt được của ĐATN sau khi thực hiệt

HH: NGÀY GIÁO NHIỆM VỤ:

V NGAY HOAN THANH NHIEM VỤ: Ộ

VI, HỘ VÀ TÊN CÁN BỘ HUONG DAN: THS PHAM VAN KHOA

Trang 5

Nhận dạng biển số xe ứng dung Arm9

Trang 6

Nhận dạng biển số xe ứng dung Arm9

LOI CAM ON

Xin gửi lời cảm ơn chân thành đến quý thầy cô trường Đại học Sư Phạm Kỹ Thuật Thành

Phố Hồ Chí Minh nói _chung và khoa Điện — Điện tử nói riêng đã truyền đạt những kiến thức quý báu trong suốt năm năm học và tạo điều kiện thuận lợi để người thực hiện đề tài học tập tốt

Xin gửi lời cảm ơn đến thầy Phạm Van Khoa, người đã theo sát hướng dẫn và động viên

giúp đỡ trong suôt quá trình thực hiện đô án này

Cảm ơn gia đình, cha mẹ đã là nguồn động viên to lớn về vật chất và tỉnh thần trong suốt

thời gian học hành, để có được tương lai, theo đuổi ước mơ và sự nghiệp

Chan thành cảm ơn các anh, chị và các bạn trong khoa Điện — Điện tử, đặc biệt là các bạn trong lớp 099011A đã giúp đỡ, động viên và hỗ trợ nhau trong suôt quá trình học tập

Xan chan thanh cam on!

Người thực hiện đê tài

NGUYEN QUOC THÁI

Trang 7

Nhận dạng biển số xe ứng dung Arm9

TOM TAT DE TAL

Trước đây, khi số lượng các phương tiện xe máy còn chưa nhiều, việc quản lý chúng thường đơn giản và ít gặp khó khăn Ngày nay, khi số lượng xe máy đã trở nên rất nhiều

thì các hệ thống quản lý cũ không còn hiệu quả và không còn mang tính kinh tế nữa, Vì

vậy, đã có nhiều công trình nghiên cứu thực tiễn nhằm giải quyết vấn đề này Nổi bật

trong số đó là các công trình nghiên cứu ứng dụng thị giác máy vào trong hệ thống nhận

dang xe nhằm phục vụ công tác quản lý Cơ sở của thị giác máy chính là lý thuyết về xử

lý ảnh số trong đó bao gồm các quá trình thu nhận ảnh, xử lý ảnh, phân tích ảnh và nhận

dang ảnh Vân đề nhận dạng xe, thông thường được thực hiện thông qua việc nhận dang biển số của chính xe đó Một vấn đề đặt ra là hầu hết các ứng dụng nhận dạng biển số xe

hiện tại thường được xây dựng trên nền tảng máy tính cá nhân và hoạt động của chúng là không thể tách rời ra khỏi máy tính cá nhân được

Trong ¡ này, người nghiên cứu tập trung phát triển một ứng dụng nhận dạng biển số

xe có thể hoạt động độc lập trên nền | tang một hệ nhúng Nội dung đề tài được giải quyết Uieo hướng tập trung khai thác thế mạnh của bộ vi điều khiển S3C6410 trên board EricnidlyArm Tiny6410 Thực chất bộ vi điều khiển này là một SoC (System on a Chip)

có nhân xư lý la Arm Về cơ bản, đề tài đã có thể chứng minh rằng: hoàn toàn có thê xây

dựng ứng dạng nhận dạng biển số xe hoạt động trên nền tảng Arm thay vì hoạt động trên

máy tính cá nhán, Qua đó, càng cho thấy 16 kha năng ứng dụng của Arm vào các lĩnh vực

công nghệ cao má trước đây, người ta thường nghĩ chỉ có thẻ thực hiện được trên máy tính

Đề tải đã tạo được một nên tảng nghiên cứu mới và có nhiều tiềm năng phát triển theo

hướng rộng và sâu trong việc ứng dụng các hệ nhúng vào nhiều lĩnh vực khác nhau trong cuộc sóng, Đặc biệt là chuyển những nghiên cứu mang tính học thuật thành

Trang 8

Nhận dạng biển số xe ứng dụng Arm9

NHAN XÉT CỦA GIÁO VIÊN HƯỚNG DẪN

Trang 9

Nhận dạng biển số xe ứng dung Arm9

NHAN XÉT CỦA GIÁO VIÊN PHẢN BIỆN

Giáo viên phản biện

Trang 10

Nhận dạng biển số xe ứng dụng Arm9

MỤC LỤC

Trang bia

Quyét dinh giao dé tai

Phân A:Giới thiệu

Lời cảm ơn

Tóm tắt đề t

Nhận xét của giáo viên hướng d:

Nhận xét của giáo viên phản biện

Mục lục

Liệt kê bảng

Liệt kê hình

2.1.5.Các ác thành phân cơ bản cả của

1.Phát hiện tính không liên tục

2 t6; 2.Phân đoạn ảnh dựa vào các vùng ảnh con

2.7.Tổng quan về nhận dạng ảnh

2.7.1 Không gian biểu diễn đối tượng, không gian diễn dịch

2.7.2.Ban chat của quá trình nhận dạng

Trang 11

Nhận dạng biển số xe ứng dung Arm9

2.7.3.Nhận dạng dựa trên phân hoạch không gian

Chương 3: Hệ thống nhận dạng biển số xe và nền tảng phát triển hệ thống

3.1.Tổng quan về hệ thống nhận dạng biển số xe

3.1.1.Giới thiệu chung

3.1.2.Các đặc trưng cơ bản của biến số xe máy Việt Nam

3.3.2.Nén tang Arm va kién tric Arm11

3.3.3,Téng quan vé board FriendlyARM Tiny

3.3.4, Embedded Linux trén board FriendlyArm Tiny6410

Chương 4: Thiết kế phần mềm nhận dạng biển số xe

4.1 Yêu cầu thiết kế

42 Các công cụ hỗ trợ

4.2.1.1rinh biên dịch chéo

4.2.2 Thu vién OpenCV

1.Cấu hình biên dịch cho Am và biên

5 2.Download chương trình xuống board va thy thi

Chương 5: Kết quả nghiên cứu, kết luận và hướng phát triển

5.1.Kết quả nghiên cứu

Trang 12

Nhận dạng biển số xe ứng dung Arm9

LIỆT KÊ BẢNG

Bảng 3.1: Các dạng lõi tiêu biểu của ARM

Bảng 3.2: Các đặc trưng nỗi bật của Board Tiny6410

Bang 4.1: Kêt quả thực nghiệm phần mềm nhận đạng bi:

Trang 13

LIỆT KÊ HÌNH Hình 2.1: Các bước cơ bản trong xử lý ả

Hình 2.2: Sơ đồ phân tích và xử lý ảnh và lưt

Hình 2.3: Các thành phần chính của một hệ thống xử lý ảnh

Hình : Khuông lượng tử theo L mức xám

Hình 2.5: Lân cận các điểm ảnh của tọa độ (x, y)

Hình oc trung Vi

Hình 2.7: Các bộ lọc nâng cao

Hình 2.8: Mã hóa và giải mã bởi mã hóa biến đổi

Hình : Cải thiện ảnh nhị phân

Hình Hệ thống nhận dạng biên sô xe cơ bản

: Hình ảnh biển số xe dân sự ở Việt Nam

: Ảnh xám và lược đồ xám tương ứng của ảnh

Hình 3.4: Bài toán phân lớp tuyến tính

Hình 3.5: Lề và đường biên trong SVM

Hình 3.6: [ưa chọn đường phân lớp trong phân lớp tuyên tính

linh 3.7: Tính khoảng cách từ điểm dữ liệu đến mặt phân cách

Hình M6 hinh phat trién ứng dụng nhúng

Hình 3.9- Cấu trúc đường ống 8 tầng của Arm11

Hinh 3.10: L4i xử lý Arm1176JZF-

Hình 3.11: Board tiny641

Hinh 3.12: Board Tiny641

Hinh ‘hu viện OpenCV

Hinh dung bé loc Canny trong do bién

Hinh cụ lập trinh đa nén tang Qt

Hinh Qt Creator

Hinh 4.7: Tao project mdi trong Qt Creator

Hình 4.8: Giao diện lấp trình Qt

Hình 4.9: Cơ chế signals & slots trong Qt

Hình 4.10: Cấu hình sử dụng OpenCV trong Q\

Hình 4.11: Thiết lập qt version

Hình 4.12: Thêm nên tảng biên dịch chéo trên Q\

Hình 4.13: Chuyển ảnh ngõ vào sang ảnh xám

Hình 4.14: Ngưỡng nhị phân Otsu

Hình 4.15: Ảnh ngõ vào sau khi thực hiện nhị phân hóa ảnh

Hình 4.16: Tìm biên bằng bộ lọc Canny

Hình 4.17: Ảnh sau khi thực hiện phép dãn nở

Hình 4.18: Xác định các đường bao trong ảnh

Hình 4.19: Tách biển số

Hình 4.20: Kêt quả sau khi tách ký tự

Hình 4.21: Chia nhỏ ảnh để tìm đặc trung,

Hình 4.22: Sử dụng cơ chế signals slots trong phần mềm

Hình 4.23: Giao diện phần mêm nhận dạng biên sô xe

Trang 14

Nhận dạng biển số xe ứng dung Arm9

Phần mềm tạo mẫu huấn luy

Các mẫu huấn luyện

Tổ chức thư mục huấn luyện

Kết quả quá trình huấn luyện

Giao diện phần mềm huắn luyện SVM

Kiểm tra lại kết quả huấn luyện huấn luyện

Lưu đề quá trình huấn luyện SVM

Cấu hình thư viện OpenCV cho Arm

Cấu hình biên dịch ứng dụng cho Arm

Đăng nhập vao kit bing Terminal

Kết nối ftp v6i kit FriendlyArm

Giao dign phan mém trén board Tiny6410

Trang 15

Nhận dạng biển số xe ứng dung Arm9

Trang 16

Nhận dạng biển số xe ứng dung Arm9

Chương 1

DAN NHAP

Chương 1: Dẫn nhập.

Trang 17

Nhận dạng biển số xe ứng dụng Arm9

1.1 Đặt vấn đề

Trước đây, khi các phương tiện xe máy còn chưa nhiều, việc quản lý chúng thường đơn

giản và ít gặp khó khăn Ngày nay, khi số lượng xe máy đã trở nên rất nhiều thì các hệ

thống quản lý cũ không còn hiệu quả và không còn mang tính kinh tế nữa Vì vay, đã có nhiều công trình nghiên cứu thực tiễn nhằm giải quyết vấn đề này Nổi bật trong số đó là

các công trình nghiên cứu ứng dụng thị giác máy vào trong hệ thống nhận dạng xe nhằm

phục vụ công tác quản lý Cơ sở của thị giác máy chính là lý thuyết về xử lý ảnh số trong

đó bao gôm các quá trình thu nhận ảnh, xử lý ảnh, phân tích ảnh và nhận dạng ảnh Vấn

đề nhận dạng xe, thông thường được thực hiện thông qua việc nhận dạng biển số của chính xe đó Một vấn đề đặt ra là hầu hết các ứng dụng nhận dạng biển số xe hiện tại thường được xây dựng trên nền tang máy tính cá nhân và hoạt động của chúng là không,

thể tách rời ra khỏi máy tính cá nhân được

Trong đề tài này, người nghiên cứu tập trung phát triển một ứng dụng nhận dạng, biểi số

xe có thể hoạt động độc lập trên nền | tang một hệ nhúng dung đề tài được giải quyết theo hướng tập trung khai thác thế mạnh của pe vi diéu khién $3C6410 trên board

FriendlyArm Tiny6410 Thực chất bộ vỉ điều khiển này là một SoC (System on a Chip)

e6 nhan xtrly la Arm Về cơ bản, đề tài đã có thể chứng minh rằng: hoàn toàn có thể xây dựng tn ung nhận dạng, biển số xe hoạt động trên nên tảng Arm thay vì hoạt động trên máy tính cá nhân Qua đó, càng cho thấy rõ khả năng ứng dụng của Arm vào các lĩnh vực công nghệ cao ma trước đây, người ta thường nghĩ chỉ có thể thực hiện được trên máy tính

còi thì một ứng đụng hoạt động trên thiết bị điện thoại di động thường không đáp ứng được hoặc gặp rát nhiêu khó khăn, nhất là vấn đề phần cứng

Đổi với ở nước ngoài với sự phát triển của khoa học kỹ thuật và kinh tế, đã có nhiều công trình nghiên cứu về hệ thông nhận dạng biển số xe Hơn thế nữa, các hệ thống ứ ứng

dụng nhận dạng biển số xe được nghiên cứu, phát triển thành các sản phẩm thương mại

với độ ôn định và tin cậy cao, được ứng dụng rộng rãi vào trong thực tiễn

1.3.Mục đích nghiên cứu

Xây dựng ứng dụng nhận dạng biển số xe hoạt động trên board FriendlyARM Tiny6410 Ứng dụng hoạt động trên nên tâng hệ điều hành Embedded Linux cài đặt trên board

Điều này được thê hiện thông qua việc lập trình ứng dung bằng phần mềm Qt trên máy

phát triển Ubuntu, ứng dụng được biên dịch và download xuông board và sau đó có thể

hoạt động độc lập

1.4.Đối tượng và phạm vi nghiên cứu

Đối tượng nghiên cứu

-_ Phần mềm nhận dạng, biển số xe hoạt động trên board Tiny6410

- Board FriendlyARM Tiny6410

Trang 18

Nhận dang biển số xe ứng dụng Arm9

- Phần mềm chỉ nhận dạng từ tập cơ sở dữ liệu offline (tức các ảnh có sẵn),

~ Phần mềm được thiết kế hoạt động trên nên tang Linux với giao diện Qt

~ Phần mềm chỉ xử lý và nhận dang đối với các ảnh đầu vào là biển số xe máy dân sự của Việt Nam

1.5,Ý nghĩa khoa học và thực tiễn của đề tài

» _Y nghĩa khoa học của đề tài

* Tính thực tiễn của đề tài

J1ién nay nhu cau xây dựng các ứng dụng chạy độc lập trên nên tảng hệ nhúng là rất lớn

các công trình nghiên cứu vê hệ thống nhận dạng biển số xe thường được phát

1.6.Phương pháp và phương tiện nghiên cứu

» Phương pháp nghién cru

Ba phương pháp nzhiến cứu chính đã được áp dụng để thực hiện đề tài này là: Phương pháp tham khảo tái iiệu, phương pháp thống kê và phương pháp 1 thực nghiệm

-_ Áp dụng phương ,pháp tham khảo tài liệu: Thông tin về giải pháp lập trình ứng

dụng nhận dạng biển số xe máy trên nền tảng Arm cũng như về board FriendlyARM còn rất ít va khan hiếm Nhưng đề tự thực hiện được một ứng dụng hoàn chỉnh, đòi hỏi người thực hiện phải được trang bị thêm nhiều kiến thức công nghệ khác về: ập trình

Qt với ngôn ngữ C++, thiết kế hệ thống hệ thông nhận dang bien số xe trên cơ sở xử lý ảnh số, câu trúc board FriendlyARM Tiny6410 Có nhiều kiến thức và kỹ năng quan trọng và cần thiết cho đề tài nhưng người thực hiện chưa được trang bị trong chương trình học, vì vậy có khá nhiều nguôn tài liệu tham khảo từ các trang Web và ebook đã được tác giả đề tài kham khảo và nghiên cứu nhiều trong quá trình thực hiện

Việc tham khảo tài liệu đã giúp người thực hiện củng cô lại một cách khoa học các kiến thức đã có và xây dựng những nền tảng kiến thức mới Qua đó, tác giả cũng chọn

lọc ra được những nguồn kiến thức quan trọng làm kim chỉ nam cho tác giả thực

nghiệm nghiên cứu

- Áp dụng phương pháp thống kê: Trong quá trình thực hiện lập trình nhận dạng biển

SỐ Xe máy, với một tập cơ sở dữ liệu là các ảnh của biến số, các ảnh này khác nhau về nội dung, về độ sáng, độ tương phản, màu sắc Để thực hiện hoàn chỉnh quá t trình nhận dạng các ảnh này, đòi hỏi người nghiên cứu phải tiến hành thống kê các số liệu

có liên quan như tập ảnh đầu vào, tập mẫu phục vụ trong việc huấn luyện, phân loại,

thống kê kết quả nhận dạng được, từ đó tính toán hiệu suất của quá trình nhận

Trang 19

Nhận dạng biển số xe ứng dung Arm9

dạng Nhờ phương pháp thực nghiệm, quá trình nhận dạng được thực hiện có hiệu quả hơn, kêt quả ngiên cứu được đánh giá một cách khách quan, chính xác

- Áp dụng phương pháp thực nghiệm: Sản phẩm nghiên cứu của đề tài pra là một sản phẩm vật lý thực, chính vì vậy, đòi hỏi tác giả phải tiến hành nhí lần thực

nghiệm để thử nghiệm các mẫu đầu vào và các phiên bản chương 1 trình phần mềm Để giảm bớt thời gian và chỉ phí thực nghiệm, người thực hiện còn kết hợp với mô phỏng

hệ thống trên máy tính, Sau khi việc kiểm chứng trên mô phỏng đạt được những kết

quả nhất định, thì sẽ được tiến hành biên dịch phần mềm và thực thi trên hệ thống đích

Để thực nghiệm được thì người thực hiệt đề tai phai cần đến các phương tiện nghiên cứu sau: Bao gôm phương tiện (công cụ) phần mềm và phương tiện (công cụ) phần cứng

Phương tiện (công cụ) phần mềm:

-_ Hệ điều hành Ubuntu : Được dùng làm môi trường phát triển, mô phỏng và biên

dịch ứng dung

liệ điều hành Embedded Linux: được dùng làm môi trường thực thi ứng dụng, cụng ác cơ chế, phương thức để ứng dụng giao tiếp, khai thác các tài nguyên

phân cứng của board Tiny6410

-_ Phán mém Qt Creator: được dùng làm môi trường lập trình ứng dụng, viết mã

ø dụng với giao diện đồ họa

“mm qte-everywhere-opensouree-src: dùng để hỗ trợ biên dịch các ứng dụng,

Ot chay trén nén tang ARM

- Trinh biến dich arm-linux-gec: hỗ trợ biên dịch chéo ứng dụng

~_ Bộ thư viện OpenCV: cung cấp các hàm, các thuật toán phục vụ xử lý ảnh

~_ Cùng một số thư viện, công cụ hỗ trợ biên dịch và biên dịch chéo ứng dụng

Phương tiện (công cụ) phân cứng:

- Board Tiny64i0: La phan cứng trung tâm chạy ứng dụng nhận dạng, biển số xe

~ Máy tính cá nhán: sử dụng laptop làm máy phát triển

Ba phương pháp nghiên cứu trên được áp dụng xen kế và bổ trợ cho nhau để từ đó giúp

người nghiên cứu hình thành được những kiến thức quý giá và đi đến thực hiện thành

công đề tài “Nhận dạng biển số xe ứng dụng Arm9”

Trang 20

Chương 2:Tông quan về xử lý ảnh số và nhận dạng,

Trang 21

ảnh ta có phân tích ảnh đẻ thu được các thông tin đặc trưng giúp cho việc phân loại ảnh

(image classification), nhận dang anh (image recognition)

Xử lý và nhận đạng là một lĩnh vực từ lâu được nhiều người quan tâm Nó đã được ứng, dụng vào nhiều lĩnh vực như:

* Trong y học, cải thiện ảnh X-quang và nhận dạng đường biên mạch máu từ ảnh chụp bằng tia X, ứng dụng vào các xét nghiệm lâm sảng như phát hiện u não, nội soi cắt lớp

+ Trong thiên văn học, hệ thống chụp hình gắn trên tàu vũ trụ hạn chế về kích thước và

trọng lượng, do đó chất lượng hình ảnh nhận được bị giảm như bị mờ, méo hình học và

nhiễu nền Các hình đó được xử lý bằng hệ thống máy tính

* Trong các lĩnh vực công nghiệp, người máy ngày càng đóng vai trò quan trọng Chúng thực hiện các công việc nguy hiểm, đòi hỏi tốc độ và độ chính xác cao vượt quá khả năng, con người Người máy sẽ trở nên tỉnh vi hơn và thị giác máy tính đóng vai trò quan trọng hơn Người ta không chỉ đòi hỏi người máy phát hiện và nhận dạng các bộ phận công nghiệp ma con phải “hiểu” được những gì chúng “thấy” và đưa ra hành động phù hợp Vì

vậy, xử lý anh dong vai trò quan trọng trong thị giác máy tính

là môn học liên quan đến nhiêu lĩnh vực và cân nhiều kiến thức cơ sở khác Đầu tiên phải

kể đến › số là một môn học hết sức cơ bản cho xử lý tín hiệu chung, các khái

niệm về các biến đôi Fourier, biến đổi Laplace, các bộ lọc hữu hạn Thứ hai,

các công cụ toán như Đại số tuyến tính, Sác xuất, thống kê Một số kiến thức cần thiết như Trí tuệ

phát triển vào những năm 1955 Điều này có thể giải thích được vì sau chiến tranh thế

giới thứ hai, máy tính phát triển nhanh tạo điều kiện cho quá trình xử lý ảnh số thuận lợi

Năm 1964, máy tính đã có khả năng xử lý và nâng cao chất lượng ảnh từ mặt trang và vệ tỉnh Ranger 7 của Mỹ bao gồm: làm nổi đường biên, lưu ảnh Từ năm 1964 đến nay, các

phương tiện xử lý, nâng cao chất lượng, nhận dạng ảnh phát triển không ngừng Các

phương pháp tri thức nhân tạo như mạng nơ ron nhân tạo, các thuật toán xử lý hiện đại và

cải tiến, các công cụ nén ảnh ngày càng được áp dụng rộng rãi và thu nhiều kết quả khả

quan

2.1.3.Các ứng dụng của xử lý ảnh số

Biến đổi ảnh (Image Transform)

Trong xử lý ảnh do số điểm ảnh lớn các tính toán nhiều (độ phức tạp tính toán cao) đòi hỏi dung lượng bộ nhớ lớn, thời gian tính toán lâu Các phương pháp khoa học kinh điển

áp dụng cho xử lý ảnh hầu hết khó khả thi Người ta sử dụng các phép toán tương đương

hoặc biến đổi sang miễn xử lý khác để dễ tính toán Sau khi xử lý dễ dang hơn được thực

Trang 22

Nhận dạng biễn số xe ứng dụng Arm9

hiện, dùng biến đổi ngược để đưa về miền xác định ban đầu, các biến đổi thường gặp

trong xử lý ảnh gồm :

- Biên đôi Fourier, Cosin, Sin

- Biến đổi (mô tả) ảnh bằng tích chập, tích Kronecker (theo xử lý tín hiệu số)

~._ Các biên đổi khác như KL (Karhumen Loeve), Hadamard

Một số các công cụ xác xuất thống kê cũng được sử dụng trong xử lý ảnh

Nén anh

Ảnh dù ở dạng nào vẫn chiếm không gian nhớ rất lớn Khi mô tả ảnh người ta đưa kỹ

thuật nén ảnh vào Các giai đoạn nén ảnh có thể chia ra thế hệ 1, thế hệ 2 Hiện nay, các

chuẩn MPEG được dùng với ảnh và đang phát huy hiệu quả

Các phương pháp xử ly ảnh bất đầu từ các ứng dụng chính: nâng cao chât lượng ảnh và

phân tích ảnh Để dễ hình dung, ta xét các bước cần thiết trong xử lý ảnh Đầu tiên, ảnh

tự nhiên từ thế giới bên ngoài được thu nhận qua các thiết bị thu (camera, máy chụp ảnh)

Trước đây, ảnh thu qua camera là các ảnh tương tự (loại camera ống kiểu CCIR) Gần

đây, với sự phát triển của công nghệ, đặc biệt là kỹ thuật số, ảnh màu hoặc đen trắng

được lây từ camera, sau đó nó được chuyển trực tiếp thành ảnh số tạo điều kiện thuận lợi

cho lưu trữ và các quá trình xử lý tiếp theo Mặt khác, ảnh cũng có thể tiếp nhận từ vệ

tính, có thể quét từ ảnh chụp bằng máy quét ảnh Hình 2.1 mô tả các bước co ban trong

xử lý ảnh

Hình 2.1 Các bước cơ bản trong xử lý ảnh

Sơ đồ này bao gồm các thành phần như sau:

a Phần thu nhận ảnh (Image acquisition)

Ảnh có thể nhận qua camera màu hoặc đen trắng Thường ảnh nhận qua camera là ảnh

tương tự (loại camera ông chuân CCIR với tần số 1⁄25, mỗi ảnh 25 dòng), cũng có loại Camera đã số hóa (như loai CCD — Change Coupled Device) là loại photodiot tạo cường

độ sáng tại mỗi điểm ảnh Camera thường dùng là loại quét dòng, ảnh tạo ra có dang 2

chiều Chất lượng ảnh thu nhận được phụ thuộc vào thiết bị thu, vào môi trường (ánh sáng, phong cảnh)

b Tiền xử lý ảnh (Image Pre| rocessing) | |

Sau bộ thu nhận, ảnh có thê chứa nhiễu, độ tương phản thap nén can dua vào bộ

tiền xử lý để nâng cao chất lượng Chức năng chính của bộ tiền xử lý là lọc nhiễu, nâng độ tương phản để làm ảnh rõ hơn, nét hơn

c Phân đoạn (Segmentation) hay phân vùng ảnh

Trang 23

Nhận dạng biển số xe ứng dụng Arm9

Phân vùng ảnh là tách một ảnh đầu vào thành các vùng thành phần để biểu diễn phân

tích, nhận dạng ảnh Ví dụ : để nhận dạng chữ (hoặc mã vạch) trên phong bì thư cho mục

đích phân loại bưu phẩm, cần chia các câu, chữ về địa chỉ hoặc tên thành các từ, các chữ,

các số (hoặc các vạch) riêng biệt để nhận dạng Đây là phần phức tạp khó khăn nhất trong

xử lý ảnh và cũng dễ gây lỗi, làm mất độ chính xác của ảnh Kết quả nhận dạng phụ thuộc rất nhiều vào công đoạn này

d Biểu diễn ảnh (Image Representation)

Đầu ra ảnh sau khi phân đoạn chứa các điểm ảnh của vùng ảnh (ảnh đã phân đoạn) cộng với mã liên kết với các vùng lân cận Việc biến đổi các số liệu này thành dạng thích hợp

là cần thiết cho xử lý tiếp theo bằng máy tính Việc chọn các tính chất để thẻ hiện ảnh

gọi là trích chọn đặc trưng (Feature Selection) gin với việc tách các đặc tính của ảnh dưới dạng các thông tin định lượng hoặc làm cơ sở để phân biệt lớp đối tượng này với đối

tượng khác trong phạm vi ảnh nhận được Ví dụ : trong nhận dạng ký tự trên phong bì thư, chúng ta miêu tả các đặc trưng của từng ký tự giúp phân biệt ký tự này với ký tự khác

e Nhận dạng và nội suy ánh (Image Recognition and Interpretation) |

Nhận dạng cánh là quá trình xác định ảnh Quá trình này thường thu được bằng cách so sánh với mẫu chuẩn đã được học (hoặc lưu) từ trước Nội suy là phán đoán theo ý nghĩa

dựa trên cơ sở nhận dạng Ví dụ: một loạt chữ số và nét gạch ngang trên phong bì thư có

thế nội suy thánh mã điện thoại Có nhiều cách phân loại ảnh khác nhau Theo lý thuyết

vê nhận d các mô hình toán học về ảnh được phân theo hai loại nhận dạng ảnh cơ

bản:

* Nhận đạng theo tham số

* Nhận heo cầu trúc

j ø nhận dạng khá phổ biến hiện nay đang được áp dụng trong khoa học và

đạng ký tự (chữ in, chữ viết tay, chữ ký điện tử), nhận dạng văn bản (Text), nhận n tay, nhận dạng mã vạch, nhận dạng mặt người

f Cơ sở trí thức (Knowledge Base)

Như đã nói ở trên ảnh là một đối tượng khá phức tạp về đường nét, độ sáng tối, dung lượng điểm ảnh, môi trường để thu ảnh phong phú kéo theo nhiễu Trong nhiều khâu xử

lý và phân tích ảnh ngoài việc đơn giản hóa các phương pháp toán học đâm bảo tiện lợi cho xử lý, người ta mong muốn bắt chước quy trình tiêp nhận và xử lý theo cách của con người Trong các bước xử lý đó, nhiều khâu hiện nay đã xử lý theo các phương pháp trí tuệ con người Vì vay, các cơ sở tri thức được quan tâm

øg Môtả (biểu diễn ảnh)

Từ hình 2.1 cho thay, ảnh sau khi số hóa sẽ được lưu vào bộ nhớ, hoặc chuyển sang các khâu tiếp theo để phân tích Nếu lưu trữ ảnh trực tiếp từ các ảnh thô, đòi hỏi dung lượng

bộ nhớ cực lớn và không hiệu quả theo quan điểm ứng dụng và công nghệ Thông thường, các ảnh thô đó được đặc tả (biểu diễn) lại hay đơn giản là mã hóa theo các đặc điểm của ảnh gọi là các đặc trưng ảnh ([mage Features) như : biên ảnh (Boundary), vùng

ảnh (Region) Một số phương pháp biểu diễn thường dùng như:

- Biểu diễn bằng mã chạy (Run-Length Code)

- Biểu diễn bằng mã xích (Chain Code)

2 Biểu diễn bằng mã tứ phân (Quad-Tree Code)

Biểu diễn bằng mã chạy :

Phương pháp này thường biểu diễn cho vùng ảnh và áp dụng cho ảnh nhị phân Một vùng ảnh R có thê mã hoá đơn giản nhờ một ma trận nhị phân:

- U(m,n)= l1 nếu (m, n) thuộc R

~ U(m, n) = 0 nếu (m, n) không thuộc R

Trang 24

Nhận dạng biển số xe ứng dụng Arm9

Trong đó: Uím, n) là hàm mô tả mức xám ảnh tại tọa độ (m,n) Với cách biểu diễn

trên, một vùng ảnh được mô tả bằng một tập các chuỗi số 0 hoặc 1 Giả sử chúng ta mô

tả ảnh nhị phân của một vùng ảnh được thể hiện theo toạ độ (x, y) theo các chiều và đặc

tả chỉ đối với giá trị “1” khi đó dạng mô tả có thể là: (x, y)r; trong đó (x, y) là toạ độ, r là

số lượng các bit có giá trị “1” liên tục theo chiều ngang hoặc dọc

Biểu diễn bằng mã xích :

Phương pháp này thường dùng để biểu diễn đường biên ảnh Một đường bắt kỳ được chia thành các đoạn nhỏ Nối các điểm chia, ta có các đoạn thang kế tiếp được gán hướng cho

đoạn thing đó tạo thành một dây xích gồm các đoạn Các hướng có thể chọn 4, 8, 12,

24, mdi hướng được mã hoá theo số thập phân hoặc số nhị phân thành mã của hướng

Biểu diễn bằng mã tứ phân :

Phương pháp mã tứ phân được dùng để mã hoá cho vùng ảnh Vùng ảnh đầu tiên được

chia làm bốn phần thường là bằng nhau Nếu mỗi vùng đã đồng nhất (chứa toàn điểm đen (1) hay trắng (0)), thì gán cho vùng đó một mã và không chia tiếp Các vùng không đồng

nhất được chia tiếp làm bốn phần theo thủ tục trên cho đến khi tất cả các vùng đều đồng nhất Các mã phân chia thành các vùng con tạo thành một cây phân chia các vùng đồng nhất

Trên đây là các thành phần co ban trong các khâu xử lý ảnh Trong thực tố, các quá trình

sử đụ! nh số không nhất thiết phải qua hết các khâu đó tùy theo đặc điểm ứng dụng

Hình cho sơ đó phân tích và xử lý ảnh và lưu đồ thông tin giữa các khối một cách khá

day du Anh sau khi được số hóa được nén, lưu lại để truyền cho các hệ thống khác sử

dụng hoặc 4ê xử lý tiếp theo, Mặt khác, ảnh sau khi số hóa có thể bỏ qua công đoạn nâng

cao chất ảnh đủ chất lượng theo một yêu cầu nào đó) để chuyển tới khâu phân đoạn hoặc ?2 khâu phân đoạn chuyển trực tiếp tới khâu trích chọn đặc trưng Hình 2.2 cũng chia các nhánh song song như: nâng cao chất lượng ảnh có hai nhánh phân biệt,

Trang 25

máy tính số, hệ thống gôm các đầu đo (thu nhận ảnh); bộ số hóa; máy tính số; bộ hiên thị;

bộ nh ø xử lý ảnh cơ bản có thể gồm: máy tính cá nhân kèm theo vỉ mạch

nạ VỚA hoặc SVGA, đĩa chứa các ảnh dùng để kiểm tra các thuật toán

và một màn n có hỗ trợ VGA hoặc §VGA Nối với cổng vào của thiết bị thu nhận anh

là một video camera, va cong ra nôi với một màn hình Thực tế, phần lớn các nghiên cứu của chúng ta được đưa ra trên ảnh mức xám (ảnh đen trắng) Bởi vậy, hệ thống sẽ bao gồm một thiết ur ly anh den trang va một màn hình đen tring Ảnh mức xám được áp

dụng trong nhiều lĩnh vực như sinh vật học hoặc trong công nghiệp Thực tế chỉ ra rằng,

bất ky ứng dụng nao trén ảnh, mức xám cũng, ứng dụng được trên ảnh màu Với lý do đó,

hệ thống ban dau nén chi bao gồm các thiết bị thu nhận và hiển thị ảnh đen trắng Với ảnh màu, nền sử dụng một hệ thống mới như Hình 2.3, trừ trường hợp bạn cân một camera TV mâu và một màn hình đa tần số (ví dụ như NEC MultiSync, Sony Multiscan,

hoặc Mitsubishi Diamond Scan) để hiển thị ảnh mau Nếu khả năng hạn ché, có thể dùng

PC kèm theo vỉ mạch VGA và màn hình VGA, đê dựng ảnh được

tích ảnh bao hàm việc xem xét dữ liệu ảnh để giải quyết dễ dàng một bài toán thị giác

Quá trình phân tích ảnh bao hàm hai vấn đề khác: trích chọn đặc trưng và phân lớp mẫu

Có nhiều ứng dụng của thị giác máy tính như:

Trong các hệ thống sản xuất, thị giác máy tính thường được sử dụng trong việc điều

khiển chất lượng

Chương 2:Tổng quan về xử lý ảnh số và nhận dạng 1

Trang 26

Nhận dạng biển số xe ứng dung Arm9

Trong nhiều lĩnh vực khác nhau trong cộng đồng y tế, mà ở đó chắc chắn các kiểu ứng dụng sẽ tiếp tục được phát triển Các ví dụ hiện nay về các hệ thống y tế đang được phát triển bao gôm: các hệ ` thống chẩn đoán các khối u đa tự động, các hệ thống trợ giúp giải

phẫu thần kinh khi phẫu thuật não bộ, và các hệ thống test bệnh án tự động

Lĩnh vực an ninh và pháp luật cũng là một lĩnh vực hứa hẹn cho việc phát triển các hệ thống thị giác máy tính, với các ứng dụng từ nhận dạng tự động vân tay cho đến phân tích DNA Các hệ thông an ninh nhận dạng người thông qua việc scan võng mạc mắt, scan

khuôn mặt, và các đường tĩnh mạch ở tay đã được phát triển

Chương trình không gian U.S và BQP, với việc phát triển các khả năng thị giác cho rô bết đang được nghiên cứu và phát triển Các ứng dụng từ xe cộ tự chủ cho dén bắt bám

mục tiêu và nhận đạng Các vệ tinh theo quĩ đạo trái đất thu thập những dung lượng lớn

dữ liệu ảnh hàng, ngày, và các ảnh này sẽ tự động được scan để hỗ trợ việc lập bản đồ, dự báo thời tiết, và giúp chúng ta hiểu được những thay đổi đang xảy trên hành tinh chúng

(hay một hàm) liên tục trong không gian cũng như theo giá trị thành dạng số rời rạc được

gọi la số haá ảnh Việc biến đổi này có thể gồm hai bước:

Bước ]: Đo giá trị trên các khoảng không gian gọi là lấy mẫu

Bước 2: A cương độ (hoặc giá trị) đo được thành một số hữu hạn các mức rời rạc

gọi là lượn ita

Lấy mẫu

Lấy mẫu là mót quá trinh, qua đó ảnh được tạo nên trên một vùng có tính liên tục được

chuyên thành các ziá trị rời rạc theo tọa độ nguyên Quá trình này gôm 2 lựa chọn:

~ Một là: khoảr mau

~ Hai là: cách n dang mau

Lựa chọn thứ nhất được đảm bảo nhờ lý thuyết lấy mẫu của Shannon Lựa chọn thứ hai liên quan đến $4 do (Metric) được dùng trong miền rời rạc

Khoảng lầy mẫu (Sampling Interval)

Anh lay mẫu có thể được mô tả như việc lựa chọn một tập các vị trí lấy mẫu trong không gian hai chiều liên tục Đầu tiên mô tả qua quá trình lấy mẫu một chiều với việc sử dụng ham delta:

= yy (0 khí x # 0 ä

ore (œ—ze)dx =[” ð = (x— xạ)dx=1 0-2)

Tiếp theo chúng ta định nghĩa hàm răng lược với các khoảng Ax như sau:

Comb(x)=y£-_« ô(x — rAx) (2-3)

với r là số nguyên, Ax : khoảng lấy mẫu

Như vậy, hàm răng lược là chuỗi các xung răng lược từ (-o đến +o), Giả sử hàm một

chiều g(x) được mô tả (gần đúng) bằng g(7Az) tức là:

Trang 27

a(x) “{g(0), a(Ax), g(2Ax), ,8((N-1) Ax )} (2-7)

Cha y 1: Khoang lay mau (Sampling Interval) là Axlà một tham số cần phải được chọn

đủ nhỏ, thích hợp, nếu không tín hiệu thật không thể khôi phục lại được từ tín hiệu lấy

mẫu

Chú ý 2: Từ lý thuyết về xử lý tín hiệu số , (2-6) là tích chập trong miền không gian sẽ

Mặt khác (2-6) tương đương với tích chập trong miễn tần số œ tức là biến đôi Fourier

của gs(X) là Gs(@§)

k

trong đó wx 1a giá trị tần số ứng với giái tri x trong miền không gian

Điều kiện khôi phục ảnh lấy mẫu về ảnh thật được phát biểu từ định lý lẫy mẫu của

Shannon

Lượng tử hóa

1u tượng tử hoá là một quá trình lượng hoá tin hiệu thật dùng chung cho các loại xử lý tín

Ên cơ sở máy tính van dé này đã được nghiên cứu kỹ lưỡng và có nhiều lời giải lý

dưới nhiều giả định của các nhà nghiên cứu như Panter và Dite (1951), Max

( 1960), Variter (1965) Các giá trị lấy mau Z là một tập các số thực từ giá trị Zmin đến

Mi một số trong các giá trị mẫu Z cần phải biến đổi thành một tập hữu ính lưu trữ hoặc xử lý

i ượng từ hoá là ánh xạ từ các sô thực mô tả giá trị lây mẫu thành một giải

hữu hạn các s thực Nói cách khác, đó là quá trình sô hoá biên độ

LL LÌ

|

Hình 2.4 Khuông lượng tử theo L mức xám

Giả sử Z là một giá trị lấy mẫu (số thực) tại vị trí nào đó của mặt phẳng ảnh, và Zmin

oem và giả sử chúng ta muôn lượng hoá giá trị đó thành một trong các mức rời

rac: 12, tương ứng với Zmin đến Zmax (Hình 2.4) Khi đó, quá trình lượng hoá

có nid thus hiện bằng cách chia toàn bộ miền vào (Zmax - Zmin) thành L khoảng, mỗi khoảng là AI và khoảng thứ I được đặt tại điểm giữa các khoảng liền kè li họ các giá

trị z được thực hiện và mô tả bằng li theo quá trình trên đây, khi đó sai số của quá trình

lấy mẫu có thể được xác định theo ;

2.2.3.Mối liên hệ giữa các điểm ảnh

Một ảnh số giả sử được biểu diễn bằng hàm f(x, y) Tập con các điểm ảnh là S; cặp điểm

ảnh có quan hệ với nhau ký hiệu là p, q Chúng ta nêu một sô các khái niệm sau

a Các lân cận của điểm ảnh (Image Neighbors)

Chương 2:Tổng quan về xử lý ảnh số và nhận dạng 13

Trang 28

Nhận dạng biển số xe ứng dụng Arm9

Giả sử có điểm ảnh p tại toạ độ (x,y).p có 4 điểm lân cận gần nhất theo chiều đứng và

ngang (có thể coi như lân cận 4 hướng chính: Đông, Tây, Nam, Bắc)

{OcL, y); Œ, y~1); Œx, y+); (+L, y)} = N4(p)

trong đó: số 1 là giá trị logic; N4(p) tập 4 điểm lân cận của p

_ &-1,y) @y) (x+1, y)

Bắc (x-1,y+1) @œ,y+Ù) (x+1, y+1)

Hình 2.5 Lân cận các điểm ảnh của tọa độ (x,y)

~ (4c lan can chéo : các điểm lân cận chéo NP(p) (Có thể coi lân cận chéo là 4

ñhuớng : Đông-Nam, Đông-Bắc, Tây-Nam, Tây-Bắc)

£) = { (+1, y+l); (x+1, y-1); @-1, yÊ1); @-1, y-1)}

N8(p) = N4(p) + NP@) là tập hợp 8 lân cận của điểm ảnh p

(x, y) nam ở biên (mép) ảnh; một số điểm sẽ nằm ngoài ảnh

Giả sử V là tập các giá trị mức xám Một ảnh có các giá trị cường độ sáng từ thang mức

xám từ 32 đến 64 được mô tả như sau :

V=(32, 33, ., 63, 64}

Có 3 loại liên kết

-_ Liên kết 4: Hai điểm ảnh p và q được nói là liên kết 4 với các giá trị cường độ

sáng V nếu q nằm trong, một các lân cận của p, tức q thuộc N4(p)

-_ Liên kết 8: Hai điểm ảnh p và q nằm trong một các lân cận 8 của p, tức q thuộc

N§(p)

~_ Liên kết m (liên kết hỗn hợp): Hai điểm ảnh p và q với các giá trị cường độ sáng

V được nói là liên kết m nếu

+q huộc N4( ) hoặc

+q hudc NP(p)

c Đo khoảng cách giữa các iềm ảnh

Định nghĩa: Khoảng cách D(p, q) giữa hai điểm ảnh p toạ độ (x, y), q toạ độ (s, t) 1a ham khoảng cách (Distance) hoặc Metric nếu:

1 D(,q) > 0 (Với D(,g)=0 nếu và chỉ nếu p=q)

Trang 29

Nhận dạng biển số xe ứng dụng Arm9

DeŒ,q) = [Œ — s92 + (y = 0)?)]!/?

Khoảng cách khối: Khoảng cách D4(p, q) được gọi là khoảng cách khối đồ thị (City-

Block Distance) va duoc xác định như sau:

DA) =|[x-s[+|y - t|

Giá trị khoảng cách giữa các điểm ảnh r: giá trị bán kính r giữa điểm ảnh từ tâm điểm ảnh

đến tâm điểm ảnh q khác Ví dụ: Màn hình CGA 12” (12”*2,54cm = 30,48cm=304,8mm)

độ phân giải 320*200; tỷ lệ 4/3 (Chiều dài/Chiều rộng) Theo định lý Pitago về tam giác

vuông, đường chéo sẽ lấy tỷ lệ 5 phần (5/43: đường chéo/chiều dài/chiều rộng màn hình); khi đó độ dài thật là(305/244/183) chiều rộng màn hình 183mm ứng với

màn hình CGA 200 điểm ảnh theo chiều dọc

Như vậy, khoảng cách điêm ảnh lân cận của CGA 12” là = 1mm

Khoảng cách D8(p, q) còn gọi là khoảng cách bàn cờ (Chess-Board Distance) giữa điểm ảnh p, q được xác định như sau:

D§(p,q) = max (| x-s |, | y-t |)

2.3.Nâng cao chất ' lượng ảnh trong miền không gian

1.Các phép biến đổi mức xám cơ bản

cao chât lượng là bước cần thiết trong xử lý ảnh nhằm hoàn thiện một số đặc tính của ánh Nang cao chất lượng ảnh gồm hai công đoạn khác nhau: tăng cường ảnh và khôi phục ánh Táng cường ảnh nhằm hoàn thiện các đặc tính của ảnh như :

- Loenk hay làm trơn ảnh

1 tượng ng điều chỉnh mức xám của ảnh,

ết dựa trên các kỹ thuật trong

gian và tần số Toán tử điểm là phép biến đổi đối với từng điểm ảnh

quan đến các điểm lân cận khác, trong khi đó, toán tử không gian sử

ụ cận để quy chiếu tới điểm ảnh đang xét Một số phép biển đôi có tính toán phức tạp được chuyế én sang miền tần số để thực hiện, kết quả cuối cùng được chuyển trở lại miền khóng gian nhờ các biến đổi ngược

Khai niệm về toán từ điểm:

Xử lý điểm ảnh thực chất là biến đôi giá trị một điểm ảnh dựa vào giá trị của chính nó mà không hề dựa vào các điểm ảnh khác Có hai cách tiệm cận với phương pháp này Cách thứ nhất dùng một hàm biến đổi thích hợp với mục đích hoặc yêu cầu đặt ra để biến đổi

giá trị mức xám của điểm ảnh sang một giá trị mức xám khác Cách thứ hai là dùng lược

đồ mức xám (Gray Histogram) Về mặt toán học, toán tử điểm là một ánh xạ từ giá trị

cường độ ánh sáng u(m, n) tại toạ độ (m, n) sang giá trị cường độ ánh sáng khác v(m, n)

thông qua hàm f(.), tức là:

v(m, n)~f(uím, n)) (2-10)

Nói một cách khác, toán tử điểm là toán tử không bộ nhớ, ở đó một mức xác u € [0, N]

được ánh xa sang m6t mic ximv €[0,N]:v=f(u) Ứng dụng chính của các toán tử

điểm là biến đổi độ tương phản của ảnh Ánh xạ f khác nhau tùy theo các ứng dụng Các

đạng toán tử điểm được giới thiệu cụ thể như sau:

Các cấp độ ơ ,B ,y xác định độ tương phản tương đối L là số mức xám cực đại

Tach nhiễu và phân ngưỡng

Trang 30

Thận dạng biển số xe ứng dụng Arm9

0 O<u<a

L u>b Trong đó a = b =t gọi là phân ngưỡng

2.3.2.Bộ lọc trong miền không gian

Lọc không gian thường được thực hiện để khử nhiễu hoặc thực hiện một số kiểu nâng cao

ảnh

Có ba kiểu lọc được trình bảy ở đây là:

~ Lọc trung bình

- Lọc trung vị

- Loc nang cao

Hai kiểu lọc đầu tiên chủ yếu được sử dụng để che đậy hoặc khử nhiễu, mặc dù chúng

cũng có thể được sử dụng cho các ứng dụng cụ thể khác Các bộ lọc nâng cao thường để

làm sáng các cạnh và các chỉ tiết nằm trong ảnh

Nhiều bộ lọc không gian được thực hiện thông qua phép cuộn Bởi vì thao tác mặt nạ

cuộn cung cấp kết quả là tổng, trọng số của các giá trị của một pixel và các láng giềng của

nó, nên được gọi là một bộ lọc tuyến tính Một khía cạnh thú vị của các mặt nạ cuộn là

hiện ứng tông thể có thể dự đoán được dựa trên mẫu của chúng Chẳng hạn, nếu các hệ số

của trật nạ có lông bằng 1, thì độ sáng trung bình của ảnh sẽ được giữ nguyên Nếu tổng các hệ số báng 0, thì độ sáng trung bình sẽ mắt đi và trả về một ảnh tối Hơn nữa, nếu các

hệ sô có cá ára vá dương, thì mặt nạ là một bộ lọc trả về chỉ thông tin cạnh, còn nếu các

hệ số đều đư ng, thi nd là một bộ lọc làm mờ (blur) ảnh the image

Lọc trung bình:

Cac bé loc trung binh thao tác trên các nhóm pixel địa phương được gọi là vùng láng

giềng và tỉ; é pixel trung tâm bởi trung bình của các pixel trong cùng láng giêng đó

Việc thay thế nấy được thực hiện bằng một mặt nạ cuộn chẳng hạn như mặt nạ 3x3 sau đây:

1/9 1/9 1/9

1/9 1/9 1/9

Chú ý rằng các hệ số trong mặt nạ này có tổng bằng 1, nên độ sáng ảnh giữ nguyên, và

các hệ số đều dương nên nó có khuynh hướng làm nhoè ảnh Cũng có các bộ lọc trung bình khác phức tạp hơn được thiết kế dùng cho các kiểu nhiễu cụ thể

Lọc trung vị:

Lọc trung vị là lọc phi tuyến Một phép lọc phi tuyến là một kết quả không thể thu được

từ một tông trọng số của các pixel láng giềng, như đã thực hiện với mặt nạ cuộn Tuy nhiên lọc trung vị cũng thực hiện trên cùng một vùng láng giềng địa phương Sau khi đã

định nghĩa kích thước vùng láng giềng, pixel trung tâm được thay bằng trung vị tức là giá

trị chính giữa của tất cả các giá trị lang giềng

Vi du: Cho trước một cùng láng giéng 3x3:

Trang 31

Nhận dạng biển số xe ứng dung Arm9

giữa, trường hợp này là 5 Giá trị 5 này tiếp đó được đặt vào vị trí trung tâm Một bộ lọc

trung vị có thể sử dụng một vùng láng giềng có kích thước bất kì, nhưng phô biến là các

kích thước 3x3, 5x5 và 7x7 Chú ý rằng ảnh đầu ra phải được ghỉ vào một ảnh riêng (bộ

đệm) Hình 2.6 minh hoạ việc sử dụng bộ lọc trung vị để khử nhiễu

Hình 2.6 Lọc trung vị

Bộ lọc nâng cao:

Các bộ lọc ¿ cao được xét ở đây có các bộ lọc kiểu laplacian-type và lọc sai

phân (difference filter) Các kiều bộ lọc này có khuynh hướng để đưa ra, hoặc nâng cao các chỉ tiết trong anh Hai mặt nạ cuộn sử dụng cho các bộ lọc kiểu laplacian là

Các bộ lọc kiéu laplacian sé nang cao được các chỉ tiết đêu theo mọi hướng Còn các bộ

lọc sai phân sẽ náng cao các chi tiết theo hướng xác định theo mặt nạ đã chọn Có 4 mặt

nạ cuộn lọc sai phán tương ứng với theo các hướng dọc, ngang và hướng theo hai đường,

Trang 32

Nhận dang biển số xe ứng dụng Arm9

Hình 2.7 Các bộ lọc nâng cao

2.4.Nén ảnh

1.Các kiến thức cơ bản

én dữ liệu (Data Compression)

Nền dữ liệu nhám làm giảm lượng thông tin “dư thừa” trong dữ liệu gốc và do vậy, lượng, thông tin thu được sau khi nén thường nhỏ hơn đữ liệu gốc rất nhiều Với dữ liệu ảnh, kết

quả thường Í4 10:1, Một số phương pháp còn cho kết quả cao hơn Theo kết quả nghiên

cứu được gan day tai Vién Kỹ thuật Georfie, kỹ thuật nén fratal cho tỉ sô nén là

30 wén 1 Ngoai thuật ngữ “nén dữ liệu”, do bản chất của kỹ thuật này nó còn có một số

tên gọi khác nư : giảm độ dư thừa, mã hóa ảnh gốc

Từ hơn kỷ nay, có rất nhiều kỹ thuật nén đã được công bố trên các tài liệu về

nén và các phán mém nén dữ liệu đã xuất hiện ngày càng nhiều trên thương trường Tuy nhiên, chưa có ng pháp 1 nén nào được coi là phương phap van nang (Universal) vi

nó phụ thuộc vào r¡ yêu tố và bản chất của dữ liệu gốc Trong luận văn này, chúng ta không thể hy vọng xem xét tất cả các phương pháp nén Hơn thế nữa, các kỹ thuật nén

dữ liệu chung đã được trình bày trong nhiều tài liệu chuyên ngành Ở đây, chúng ta chỉ

để cập các phương pháp nén có đặc thù riêng cho dữ liệu ảnh

Tỷ lệ nén (Compression Rate)

Tỷ lệ nén là một trong các đặc trưng quan trọng nhất của mọi phương pháp nén Tuy nhiên, về cách đánh giá và các kết quả công bố trong các tài liệu cũng cần quan tâm xem xét Nhìn chung, người ta định nghĩa tỷ lệ cơ bản của phương pháp nén Nhiều khi tỷ lệ nén cao cũng chưa thể nói phương, pháp đó hiệu quả hơn các phương pháp khác, vì còn các chi phi như thời gian, không gian và thậm chí cả độ phức tạp tính toán nữa Thí dụ

như nén phục vụ trong, truyền dữ liệu: vấn đề đặt ra là hiệu quả nén có tương hợp với

đường truyền không Cũng cần phân biệt dữ liệu với nén băng truyền

Mục đích chính của nén là giảm lượng thông tin dư thừa và dẫn tới giảm | kích thước dữ

liệu Tuy vậy, đôi khi quá trình nén cũng làm giảm băng truyền tín hiệu số hóa thấp hơn

so với truyền tín hiệu tương tự

b.Các loại dư thừa dữ liệu

Như đã nói, nén nhằm mục đích giảm kích thước dữ liệu bằng cách loại bỏ dư thừa đữ

liệu Việc xác định bản chất các kiểu dư thừa dữ liệu rất có ích cho việc xây dựng các

phương pháp nén dữ liệu khác nhau Nói một cách khác, các phương pháp nén dữ liệu

khác nhau là do sử dụng các kiểu dư thừa khác nhau Người ta coi có 4 kiểu dư thừa

Trang 33

hận dạng biển số xe ứng dụng Arm9

- Sự phân bố ký tự : Trong một dãy ký tự,có một số ký tự có tần suất xuất hiện

nhiều hơn so với các dãy khác Do vậy, ta có thể mã hóa dữ liệu một cách cô đọng hơn

Các dãy ký tự có tần suất cao được thay bởi một từ mã nhị phân với số bit nhỏ; ngược lại

các dãy có tần suất xuất hiện thấp sẽ được mã hóa bởi từ mã có nhiều bít hơn Đây chính

là bản chất của phương pháp mã hóa từ hóa Huffman

+ Sự lặp lại của các ký tự : Kỹ thuật nén dùng trong trường hợp này là thay dãy lặp

đó bởi dãy mới gồm hai thành phần: số lần lặp và kí hiệu dùng để mã hóa Phương pháp

mã hóa kiểu này có tên là mã hóa loạt dài RLC (Run Length Coding)

- Những mẫu sử dụng tần suất: Có thể có dãy ký hiệu nào đó xuất hiện với tần suất

tương đối cao Do vây, có thể mã hóa bởi ít bit hơn Đây là cơ sở của phương pháp mã hóa kiểu từ điển do Lempel- Ziv đưa ra và có cải tiến vào năm 1977, 1978 và do đó có tên gọi là phương pháp nén LZ77,LZ78 Năm 1984, Tery Welch đã cải tiến hiệu quả hơn và đặt tên là LZW (Lempel-Ziv-Welch)

- Độ dư thừa vị trí: Do sự phụ thuộc lẫn nhau của dữ liệu, đôi khi biết được ký

hiệu (giá trị) xuất hiện tại một vị trí, đồng thời có thể đoán trước sự xuất hiện của các giá

trị ở các vị trí khác nhau một cách phù hợp Chang han, anh biéu dién trong một lưới hai chiều một số điểm ở hàng dọc trong một khối dữ liệu lại xuất hiện trong cùng vị trí ở các hàng khác nhau Do vậy, thay vì lưu trữ dữ liệu, ta chỉ cần lưu trữ vị trí hàng và cột

Phương pháp nén dựa trên sự dư thừa này gọi là phương pháp mã hóa dự đoán

Phan loại phương pháp nén

ó phân loại các phương pháp nén khác nhau Cách thứ nhất dựa vào nguyên

ch na: pita, các phương pháp nén thành hai He lớn:

- Nén o mat thông tin: họ này bao gồm các phương pháp mà sau khi giải nén ta không thụ được dữ liệu như bản gốc Phương pháp này lợi dụng tính chất của mắt

nhận một số vặn xoăn trong ảnh khi khôi phục lại Tất nhiên, các phương nảy chỉ có hiệu quả khi mà độ vặn xoắn chấp nhận được bằng mắt thường hay với dung sai nảo đấy

Cách phân loại thứ hai dựa vào cách thức thực hiện nén Theo cách này, người ta cũng phân thành hai họ:

- Phương pháp không gian (Spatial Data Compression): Các phương, pháp thuộc

họ này thực hiện nén bằng các tác động trực tiếp lên việc lấy mẫu của ảnh trong miên không gian

- Phương pháp sử dụng biến đổi (Transform Coding): gồm các phương pháp tác

động lên sự biến đổi của ảnh gốc mà không tác động trực tiếp như họ trên

Có một cách phân loại khác nữa, cách phân loại thứ ba, dựa vào lý thuyết của sự mã hóa

Cách này cũng phân các phương pháp nén thành hai họ:

- Các phương pháp nén thế hệ thứ nhất: Gồm các phương pháp mà mức độ tính

toán là đơn giản, thí dụ việc lấy mẫu, gán từ mã,.v.v

~ Các phương pháp nén thé hệ thứ hai: dựa vào độ bão hòa của tỷ lệ nén

2.4.2.Nén ảnh dựa vào biến đổi

a.Nguyên tắc chung

Các phương pháp mã hóa dựa vào biến đổi làm giảm lượng thông tin dư thừa không tác

động lên miền không gian ¢ của ảnh số mà tác động lên miễn bi ến đổi Các biến đổi được dùng ở đây là các biến đổi tuyến tính như: biến đổi KL, biên đôi Fourier, biến đổi Hadamard, Sin, Cosin vv Vì ảnh số thường có kích thước rất lớn, nên trong cài đặt người ta thường chia ảnh thành các khối chữ nhật nhỏ Thực tế, người ta dùng khối vuông

kích thước cỡ 16x16 Sau đó biến đổi từng khối một cách độc lập

Chương 2:Tông quan về xử lý ảnh số và nhận dang Tô

Trang 34

Thận dạng biển số xe ứng dung Arm9

Chúng ta đã biết, dạng chung của biến đổi tuyến tính 2 chiều là:

Xím,n)=Ðs° Lian, n, k, D (k,l

- x(k, D là tín hiệu vào Cr tee)

- a(m, n, k, ]) là các hệ số củ

Ma trận này gọi là nhân của biến iến đổi — là phần tử của ma trận biến đổi A Cách xác định các hệ số này là phụ thuộc vào từng,

loại biến đổi sử dụng Đối với phan lớn các biến đổi 2 chiều, nhân có tính đối xứng và tách được :

A[m, n, k, []ƑA'[m, k] A” En, 1

Nếu biến đổi là KL thì các hệ sô đó chính là các phần tử của véctơ riêng

b.Thuật toán mã hóa dùng biến đổi 2 chiều

Các phương pháp mã hóa dùng biến đổi 2 chiều thường có 4 bước sau:

B1, Chia ảnh thành khối:

~ Ảnh được chia thành các khối nhỏ kích thước k x 1 và biến đổi các khối đó

một cách độc lập để thu được các khối Vị, ¡=0,1, ,B với B = MxN/( x1)

B2 Xác định phân phối bit cho từng khối:

- Thường các hệ sô hiệp biến của các biến đổi là khác nhau Mỗi hệ số yêu cầu

lượng hóa với một số lượng bit khác nhau

133 Thiết kế bộ lượng hóa:

-_ Với phán lớn các biết đổi, các hệ số vO, 0) là không â âm Các hệ số còn lại có

0 Để tính các hệ số, ta có thể dùng phân bố Gauss hay Laplace Các hệ

xc rã hóa bởi số bit khác nhau, thường từ 1 đến 8 bit Do vậy cân thiết kế 8 tơng hóa, Để dễ cài đặt, tín hiệu vào v1 (k, I) được chuẩn hóa để có dạng:

AK DEAK D/O, DEO.)

Trước khí thiết kế bộ lượng hóa, người ta tìm cách loại bỏ một số hệ sô không cân

lượng tính toản sẽ rất lớn vì phải tính ma trận hiệp biến, i iép sau là phải giải

phương trình tìm trị riêng và véctơ riêng để xác định các hệ số Vì lý do này, trên

thực tẾ người tai thích dùng các biến đổi khác như Hadamard, Haar, Sin và Cosin Trong sô biến đổi này, biến đổi Cosin thường hay được dùng, nhiều hơn

Hình 2.8 Mã hóa và giải mã bởi mã hóa bởi biến đổi

e.Mã hóa dùng biến đổi Cosin và chuẩn Jpeg

Phép biến đỗi Cosin một chiều

Phép biến đổi Cosin rời rạc (DCT) được Ahmed đưa ra vào năm 1974 Kể từ đó đến

Chương 2:Tông quan về xử lý ảnh số và nhận dạng 20

Trang 35

Nhận dạng biển số xe ứng dụng Arm9

nay nó được ứng dụng rất rộng rãi trong nhiều phương pháp mã hóa ảnh khác nhau nhờ

hiệu suât gan như tôi ưu của nó đối với các ảnh có độ tương quan cao giữa các điểm ảnh

lân cận Biến đổi Cosin rời rạc được sử dụng trong chuẩn ảnh nén JPEG và định dạng phim MPEG

Phép biến đổi Cosin rời rac mt chiều được định nghĩa bởi:

i phan, mirc xám chỉ có 2 giá trị là 0 hay 1 Do vậy, ta coi một phần tử ảnh

như một phân tử lô-gíc và có thể áp dụng các toán tử hình học (morphology operator)

dựa trên khái niệm biến đổi hình học của một ảnh bởi một phần tử cấu trúc (structural

điểm lân cận với mô-típ của mặt nạ theo cách lấy hội hay lấy tuyển Hình 2.9 dưới đây,

chỉ ra một phán tử cấu trúc và cách lấy hội hay tuyển:

Hình 2.9 Cải thiện ảnh nhị phân

Dựa vào nguyên tắc trên, người ta sử dụng 2 kỹ thuật: dan anh (dilatation) va co anh

(erosion) Dãn ảnh nhằm loại bỏ điểm đen bị vây bởi các điểm trang Trong kỹ thuật nay,

một cửa số N+1 x N+1 được rê đi khắp ảnh và thực hiện đối sánh một pixel của ảnh với

(N+1*2 - 1 điểm lân cận (không tính điểm ở tâm) Phép đối sánh ở đây thực hiện bởi

phép tuyển lôgíc Thuật toán biến đổi được tóm tắt như sau:

For all pixels I(x,y) do

Begin

Tinh F

Trang 36

Nhận dạng biển số xe ứng dụng Arm9

OR (xy) {tinh or 16 gic } -ifF

OR

&y)_ then ImaOut(x,y) < 1 else ImaOut(x,y) <- Imaln(x,y)

End 2.5.2.Một số thuật toán hình thái cơ bản trên ảnh nhị phân

Khuếch đại và nội suy ảnh

Có nhiều ứng dụng cần thiết phải phóng đại một vùng của ảnh Có nghĩa là lấy một vùng của ảnh đã cho và cho hiện lên như một ảnh lớn Có 2 phương pháp được dùng là lặp

(Replication) và nội suy tuyến tính (linear interpolation)

Phương pháp lặp

Người ta lấy một vùng của ảnh kích thước M xN và quét theo hàng

Mỗi điểm ảnh nằm trên đường quét sẽ được lặp lại 1 lần và hàng quét cũng được lặp lại 1

lần nữa Như vậy ta sẽ thu được ảnh với kích thước 2N x 2N Điêu này tương, đương với chèn thêm một hàng 0 và một cột 0 rồi chập với mặt nạ H

Thông thường, tron phán tích ảnh, ta muốn nghiên cứu tỉ mỉ một vùng cụt thể trong ảnh,

ta gọi là ving quan tam (Region of Interest-ROI) Dé lam điều đó, ta cần các thao tác chỉnh sửa các t4 độ không gian của ảnh, và chúng được xếp vào loại các thao tác hình

học ảnh

Các thao tác hình học ảnh trình bày ở đây bao gồm: cắt xén, zoom, phóng to (enlarge),

thu nhé (shrink), tịnh tiền, và quay Quá trình cắt xén ảnh là quá trình chọn ra một phần

nhỏ của ảnh, một ảnh con, và cất nó ra khỏi pha còn lại của ảnh Sau khi ta đã cắt xén ra một ảnh con từ ảnh gộc, ta có thể zoom to nó bằng cách phóng to nó Quá trình zoom này có thể được thực hiện theo một số cách thức khác nhau, nhưng thông thường

là được thực hiện ở xử lý bậc 0 hoặc bậc nhất (zero- or first-order hold ) Một xử lý bậc 0

được thực hiện bằng cách lặp lại các giá trị pixel trước đó, do đó tạo ra một hiệu ứng khối

(block), Để mở rộng kích thước ảnh bằng xử lý bậc nhát, ta cần thực hiện một phép nội suy tuyến tính giữa các pixel kề nhau

Tịnh tiến và quay ảnh:

Hai thao tác dang chú ý khác trong hình học ảnh ROI là tịnh tiến và quay

Quá trình tịnh tiên có thể được thực hiện với các phương trình sau:

T76:

c=c+cs

trong dé r’ vac’ 1a cdc toa độ mới, r và c là cdc toa dé ban dau, và rọ và cọ là các khoảng

cách cần dịch chuyên (tinh tién) anh

Qué trinh quay cần sử dụng các phương trình sau:

1°”=rcos9 +csin9 c?’=-rsin6+ccos®

Trang 37

Nhận dạng biển số xe ứng dụng Arm9

trong đó r'°, `” là các toạ độ mới, r và e là các toạ độ ban đầu, 9 là góc quay 0 được định

aa theo chiều quay kim đồng hồ tính từ trục hoành trong ảnh mà gốc toạ độ nằm ở góc

trái trên

2.6.Phân vùng ảnh

2.6.1.Phát hiện tính không liên tục

Phân vùng ảnh là bước then chốt trong xử lý ảnh Giai đoạn này nhằm phân tích ảnh

thành những thành phần có cùng tính chất nào đó dựa theo biên hay các vùng liên thông

“Tiêu chuẩn để xác định các vùng liên thông có thể là cùng mức xám, cùng màu hay cùng

độ nhám Trước hết cần làm rõ khái niệm "ving ảnh" (Segment) và đặc điểm vật lý của

vùng Vùng ảnh là một chỉ tiết, một thực thể trong toàn cảnh Nó là một tập hợp các điểm

có cùng hoặc gần cùng một tính chất nào đó : mức xám, mức màu, độ nhám Vùng ảnh

là một trong hai thuộc tính của ảnh Nói đến vùng ảnh là nói đến tính chất bề mặt Đường

bao quanh một vùng ảnh (Boundary) là biên ảnh Các điểm trong một vùng ảnh có độ

biến thiên giá trị mức xám tương đối đồng đều hay tính kết cấu tương đồng Dựa vào đặc tính vật lý của ảnh, người ta có nhiều ¡ kỹ thuật phân vùng : phân vùng dựa theo miền liên

thông gọi là phân vùng dựa theo miễn đồng nhất hay miễn kề ; phân vùng dựa vào biên gọi là phân vùng biên Ngoài ra còn có các kỹ thuật phân vùng khác dựa vào biên độ,

phần vụng dựa theo kết cầu

Phan vung anh theo ngưỡng, biên độ

Các đặc tỉnh đrn n, cần thiết nhất của ảnh là biên độ và các tính chất vật lý như : độ

tương phá sáng, màu sắc hoặc đáp ứng phổ Như vậy, có thể dùng ngưỡng

bién dO dé phan vung khi biên độ đủ lớn đặc trưng cho ảnh Thí dụ, biên độ trong bộ cảm biến ảnh hông ngoại có thể phản ánh vùng có nhiệt độ thấp hay vùng có nhiệt độ cao Kỹ thuật phân ngướng theo bién độ rất có lợi đối với ảnh nhị phân như văn bản in, đồ họa, anh mau hay anh X-quang

Viéc chon n; + quan trọng Nó bao gồm các bước :

- Xem xét lược đỗ xám của ảnh để xác định các đỉnh và các khe Nếu ảnh có đạng rắn lượn (nhiêu đỉnh và khe), các khe có thể dùng để chọn ngưỡng

- Chọn ngưỡng t sao cho một phần xác định trước ị của toàn bộ số mẫu là thấp hơn t

~ Điều chỉnh ngơjỡng dựa trên lược đồ xám của các điểm lân cận

- Chọn ngưỡng theo lược đồ xám của những, điểm thỏa mãn tiêu chuẩn chọn Thí

dụ, với ảnh có độ tương phản thấp, lược đồ của những điểm có biên độ Laplace

g(m,n) lớn hơn giá trị t định trước (sao cho từ 5% đến 10% số điểm ảnh với Gradient lớn nhất sẽ coi như biên) sẽ cho phép xác định các đặc tính ảnh lưỡng cực tốt hơn ảnh gốc

= Khi có mô hình phân lớp xác suất, việc xác định ngưỡng dựa vào tiêu chuẩn xác suất nhằm cực tiểu xác suất sai số hoặc dựa vào một số tính chất khác của luật Bayes

2.6.2.Phân đoạn ảnh dựa vào các vùng ảnh con

Kỹ thuật phân vùng ảnh thành các miền đồng nhất dựa vào các tính chất quan trọng nào

đó của miễn ảnh Việc lựa chọn các tính chất của miền sẽ xác định tiêu chuẩn phân vùng

Tính đồng nhất của một miễn ảnh là điểm chủ yếu xác định tính hiệu quả của việc phân vùng Các 'tiêu chuẩn hay được dùng là sự thuần nhất về mức xám, màu sắc đối với ảnh

màu, kết cấu sợi và chuyển động

Các phương pháp phân vùng ảnh theo miền đồng nhất thường áp dụng là :

~ Phương pháp tách cây tứ phân

Trang 38

Nhận đạng biển số xe ứng dụng Am9

~ Phương pháp cục bộ

- Phương pháp tổng hợp

a.Phương pháp tách cây tứ phân

Về nguyên tắc, phương pháp này kiểm tra tính đúng đắn của tiêu chuẩn đề ra một cách

tổng thê trên miễn lớn của ảnh Nếu tiêu chuẩn được thỏa mãn, việc phân đoạn coi như kết thúc Trong trường hợp ngược lại, chia miền đang xét thành 4 miền nhỏ hơn Với mỗi

miền nhỏ, áp dụng một cách đệ quy phương pháp trên cho đến khi tất cả các miền đều

thỏa mãn điêu kiện

b.Phương pháp cục bộ

Ý tưởng của phương pháp là xét ảnh từ các miền nhỏ nhất rồi nối chúng lại nếu thỏa mãn tiêu chuẩn để được một miền đồng nhất lớn hơn Tiếp tục với các miền thu được cho đến

khi không thể nối thêm được nữa Số miền còn lại cho ta kết quả phân đoạn Như vậy,

miền nhỏ nhất của bước xuất phát là điểm ảnh.Phương pháp này hoàn toàn ngược với

phương pháp tách Song điều quan trọng ở đây là nguyên lý nối 2 vùng Việc nỗi 2 vùng

được thực hiện theo nguyên tắc sau :

~ Hai vùng phải đáp ứng tiêu chuẩn, thí dụ như cùng màu hay cùng mức xám

- Hai vùng phải kê cận nhau

Khái niệm kê cận: trong xử lý ảnh, người ta dùng khái niệm liên thông để xác định tính chat ké can Có hai khái niệm về liên thông là 4 liên thông và 8 liên thông Với 4 liên

thông một điểm ảnh I(x,y) sẽ có 4 kế cận theo 2 hướng x va y; trong khi đó với 8 liên

thông, đi (x,y) sẽ có 4 liên thông theo 2 hướng x, y và 4 liên thông khác theo hướng

chéo 45 đó,

c.Phương pháp tang hợp

Hai phương pháp nói (hợp) và tách đều có nhược điểm Phương pháp tách sẽ tạo nên một cấu trúc phán cáp vá thiết lập mối quan hệ giữa các vùng Tuy nhiên, nó thực hiện việc

chia qué cl Phương pháp hợp cho phép làm giảm số miễn liên thông xuống tối

thiểu, nhưng cấu trúc hàng ngang dàn trải, không cho ta thấy r mối liên hệ giữa các miền

Vì nhược diem nay, ngudi ta nghi dén phối hợp cả 2 phương pháp Trước tiên, dùng phương pháp tách đé tao nền cây tứ phân, phân đoạn theo hướng từ gốc đến lá lếp theo,

tiến hành duyệt cáy theo chiêu ngược lại và hợp các vùng có cùng tiêu chuân Với

phương pháp nảy ta thu được một cấu trúc ảnh với các miền liên thông có kích thước tối

Nhận dạng ảnh là giai đoạn cuôi cùng của các hệ thông xử lý ảnh Nhận dạng ảnh dựa

trên nền tảng lý thuyết nhận dạng (pattern recognition) nói chung và đã được đề cập trong,

nhiều sách, tài liệu về nhận dạng Ở đây, người nghiên cứu không nhắc lại mà chỉ trình bày một cách tổng quan về các khái niệm eơ bản và các phương pháp thường được sử

dung trong kỹ thuật nhận dang ảnh Nhìn chung, có ba cách tiếp cận trong nhận dạng ảnh:

~_ Nhận dạng tham sô

~_ Nhận dạng theo cau trúc

- Nhận dạng dựa trên trí tuệ nhân tao

Hai cách tiếp cận đầu là các kỹ thuật kinh điền Các đôi tượng ảnh quan sát và thu nhận

được phải trải qua giai đoạn tiền xử lý, làm nôi các chỉ tiết, tiếp theo là trích chon va biéu diễn các đặc trưng, và cuối cùng là giai đoạn nhận dạng Cách tiệp cận thứ ba hoàn toàn

khác Nó dựa vào cơ chế đóan nhận, lưu trữ và phân biệt đổi tượng mô phỏng theo hoạt

động của hệ thần kinh con người Do cơ chế đặc biệt, các đối tượng thu nhận bởi thị giác

người không cần qua giai đoạn cải thiện mà chuyển ngay sang giai đoạn tổng hợp, đối

sánh với các mẫu đã lưu trữ đẻ nhận dạng Đây là cách tiếp cận có nhiều hứa hẹn

Chương 2:Tông quan về xử lý ảnh số và nhận dạng 2¬

Trang 39

Nhận dạng biển số xe ứng dụng Arm9

2.7.1.Không gian biểu diễn đối t ông gian diễn dị

Không gian biểu diễn đối tượng pee San alent

Các đổi tượng khi quan sát hay thu thập được thường được biểu diễn bởi tập các đặc

trưng hay đặc tính Trong trường hợp xử lý ảnh, ảnh sau khi được tăng cường để nâng, cao chất lượng, phân vùng và trích chọn đặc tính như đã trình bày trong các phần trước,

được biểu diễn bởi các đặc trưng như biên, miền đồng nhất Người ta thường phân các

đăc trưng này thành các loại như : đặc trưng topo, đặc trưng hình học và đặc trưng chức

năng Việc biểu diễn ảnh theo đặc trưng nào là phụ thuộc vào ứng dụng tiếp theo

Ở đây ta đưa ra một cách hình thức việc biểu diễn các đối tượng Giả sử đối tượng X

(ảnh, chữ viết, dầu vân tay, ) được biểu diễn bởi n thành phẩn (n đặc trưng): X={¡, x;,

#¿›; „„ #ạ}, mỗi x¡ biểu diễn một đặc tính Không gian biểu diễn đối tượng thường được gọi tắt là không gian đối tượng X được định nghĩ:

trong đó mỗi X; biểu diễn một đối tượng Không gian này có thể là vô hạn Để tiện xem

xét chúng ta chỉ xét tập X là hữu hạn

Không gian diễn dịch :

Không gian diễn dịch là tập hợp các tên gọi của đối tượng Kết thúc quá trình nhận dạng,

ta xác định được tên gọi cho các đối tượng trong tập không gian đối tượng hay nói là đã

nhận được đôi tượng Một cách hình thức, gọi © là tập tên đối tượng:

(={W,W¿, ,Wy }với wị là tên các đối tượng

Quá ưình nhán dang đối tượng f là một ánh xa f: X -> © với f là tập các quy luật để định

một phần tử troziz % ứng với một phần tử trong @ Nếu tập các quy luật và tập tên các đối

tượng là biết trước như trong nhận dạng chữ viết (có 26 lớp từ A dén Z), người ta gọi là

nhận dạng có tzáy Trường hợp thứ hai là nhận dạng không có thây Dĩ nhiên trường hợp

này việc nhan dang có khó khăn hơn

2.7.2.Bản chất của quá trinh nhận dạng,

Qua trinh nhan dang gom 3 giai đoạn chính:

- Lua chon mé hinh biéu dién déi tugng -

-_ Lựa chọn luật ra quyết định (phương pháp nhận dạng) và suy diễn quá trình học

- Hoge nhan dang

Khi mô hình biểu diễn đối tượng đã được xác định, có thể là định lượng (mô hình tham

số) hay định tính (mô hình câu trúc), quá trình nhận dang chuyển sang giai đoạn học Học

là giai đoạn rất quan trọng Thao tác học nhằm cải thiện, điều chỉnh việc phân hoạch tập

Việc nhận dạng chính là tìm ra quy luật và các thuật toán để có thể gán đôi tượng vào

một lớp hay nói một cách khác gán cho đối tượng một tên Ở đây ta xem xét kỹ thuật

phân loại dựa vào học có thây

Học có thầy (supervised learning) _ - : l

Kỹ thuật phân loại nhờ kiến thức biết trước gọi là học có thay Dic điểm cơ bản của kỹ

thuật nảy là người ta có một thư viện các mẫu chuân Mẫu cân nhận dạng sẽ được đem so

sánh với mẫu chuẩn để xem nó thuộc loại nào Ví dụ như trong một ảnh viễn thám, người

ta muốn phân biệt một cánh đồng lúa, một cánh rừng hay một vùng đắt hoang mà đã có các miêu tả về các đối tượng đó Vấn đề chủ yếu là thiết kế một hệ thống đề có thể đối sánh đối tượng trong ảnh với mẫu chuẩn và quyết định gán cho chúng vào một lớp Việc

đối sánh nhờ vào các thủ tục ra quyết định dựa trên một công cụ gọi là hàm phân lớp hay

hàm ra quyết định

Trang 40

ˆ Nhận dạng biển số xe ứng dụng Arm9

-ll) t5 tin k trên phân hoạch không gian

Trong kỹ thuật này, các đối tượng nhậi ác đối l ãi đối

được tiêu diễn bởi một vector nhiều thê P °t 9 đời tưng ib, ME IDE SOE SAN

Phân hoạch không gian

Giả sử không gian đối tượng X được định nghĩa: X={X, Xạ, , X,„} X; là một vector

Người ta nói p là một phân hoạch của không gian X thành các lớp Œ¡ Đây là trường hợp

lý tưởng, tập X tách được hoàn toàn Trong thực tế, thường gặp không gian biểu diễn tách được từng phân Như vậy phân loại là dựa vào việc xây dựng một ánh xạ f: X -> p Công

cụ xây dựng ánh xạ này là các hàm phân biệt (Discriminant functions)

Hàm phân lớp hay hàm ra quyết định

Để phân đôi tượng vào các lớp, ta phải xác định số lớp và ranh giới giữa các lớp đó Hàm phân lớp hay hàm phân biệt là một công cụ rất quan trọng Gọi {g;} là lớp các hàm phân lớp Lớp hàm này được định nghĩa như sau:

nếu Vỉ # k, g„(X) thì ta quyết định chọn X E lớp k

Như vậy, đê phân biệt k lớp, ta cân k-1 hàm phân biệt Hàm phân biệt ø của một lớp nào

đó thường dùng là hàm tuyên tính, có nghĩa là ;

a(X)=mo ty Xy twa Xot AW Ky

trong 46: w; là cdc trong sé gan cho cdc thanh phan X;, Wo 1 trong sé dé viét cho gon

‘Trong trường hợp g là tuyến tính, người ta nói là việc phân lớp là tuyến tính hay siêu

phẳng (hypeplan)

Cac ham phan biệt thường được xây dựng dựa trên khái niệm khoảng cách hay dựa vào

xác suất có điều kiện, Lẽ tự nhiên, khoảng cách là một công cụ rất tốt để xác định xem

đối tượng có nhau” hay không Nếu khoảng cách nhỏ hơn một ngưỡng t nào đó ta coi 2 đối tượng l4 giống nhau và gộp chúng vào một lớp Ngược lại, nếu khoảng cách lớn

hơn ngưỡ ó nzhĩa là chúng khác nhau và ta tách thành 2 lớp

Trong một số trương hợp, người ta dựa vào xác suất có điều kiện để phân lớp cho đối

tượng Lý thuyết xác suất có điều kiện được Bayes nghiên cứu khá kỹ và chúng ta có thể

áp ung lý thuyết nay đề phân biệ i tugng

Gọi : P(X/C;) là xác suat dé c6 X biét rang c6 xuất hiện lớp Œ¡

P(€//X) là xác suất có điều kiện để X thuộc lớp Œ¡

với X là đối tượng nhận dạng, C; là các lớp đôi tượng | -

Quá trình học tập cho phép ta xác định P(X/Œ,) và nhờ công thức Bayes về xác suất có điều kiện áp dụng trong điều kiện nhiều biến, chúng ta sẽ tính được P(Œ;/X) theo công

Nếu P(C,/X)> P (Š) với vi z k thì X C Tay theo cée phuong phép nhận dạng khác

nhau, hàm phân biệt sẽ có cách nhận dạng khác nhau

Ngày đăng: 19/11/2024, 11:36

HÌNH ẢNH LIÊN QUAN

Hình  2.1.  Các  bước  cơ  bản  trong  xử  lý  ảnh - Nhận dạng biển số xe Ứng dụng arm9
nh 2.1. Các bước cơ bản trong xử lý ảnh (Trang 22)
Hình  2.2.  Sơ  đồ  phân  tích  và  xử  lý  ảnh  và  lưu  đồ  thông  tin  giữa  các  khối - Nhận dạng biển số xe Ứng dụng arm9
nh 2.2. Sơ đồ phân tích và xử lý ảnh và lưu đồ thông tin giữa các khối (Trang 24)
Hình  2.3.  Các  thành  phần  chính  của  hệ  thống  xử  lý  ảnh - Nhận dạng biển số xe Ứng dụng arm9
nh 2.3. Các thành phần chính của hệ thống xử lý ảnh (Trang 25)
Hình  2.7.  Các  bộ  lọc  nâng  cao. - Nhận dạng biển số xe Ứng dụng arm9
nh 2.7. Các bộ lọc nâng cao (Trang 32)
Hình  3.3.  Ảnh  xám  và  lược  đồ  xám  tương  ứng  của  ảnh - Nhận dạng biển số xe Ứng dụng arm9
nh 3.3. Ảnh xám và lược đồ xám tương ứng của ảnh (Trang 44)
Hình  3.5  Lễ  và  đường  biên  trong  SVM - Nhận dạng biển số xe Ứng dụng arm9
nh 3.5 Lễ và đường biên trong SVM (Trang 47)
Hình  3.8.  Mô  hình  phát  triỂn  ứng  dụng  nhúng  / - Nhận dạng biển số xe Ứng dụng arm9
nh 3.8. Mô hình phát triỂn ứng dụng nhúng / (Trang 49)
Bảng  3.1.  Các  dạng  l2í  tiếu  biể - Nhận dạng biển số xe Ứng dụng arm9
ng 3.1. Các dạng l2í tiếu biể (Trang 50)
Hình  3.10.  Lõi  xử  lý  ARM11761ZF-8 - Nhận dạng biển số xe Ứng dụng arm9
nh 3.10. Lõi xử lý ARM11761ZF-8 (Trang 52)
Hình  3.9.  Cấu  trúc  đường  ống  8  tầng  của  ARMI11  Tập  lệnh  Thumb-2  cũng  được  giới  thiệu  hỗ  trợ  các  lệnh  Thumb  16  và  32  bit - Nhận dạng biển số xe Ứng dụng arm9
nh 3.9. Cấu trúc đường ống 8 tầng của ARMI11 Tập lệnh Thumb-2 cũng được giới thiệu hỗ trợ các lệnh Thumb 16 và 32 bit (Trang 52)
Bảng  3.2.  Các  đặc  trưng  nổi  bật  của  Board  Tiny6410 - Nhận dạng biển số xe Ứng dụng arm9
ng 3.2. Các đặc trưng nổi bật của Board Tiny6410 (Trang 53)
Hình  3.12.  Board  Tiny6410  SDK  cùng  với  các  chuẩn  giao  tiếp  hỗ  trợ  Board  Tiny6410  SDK  kết  hợp  với  board  xử  lý  Tny6410  tạo thành  một  hệ  thống  phần  cứng  hoàn  chỉnh,  có  khả  năng  xử  lý  các  ứng  dụng  đòi  hỏi  tốc  độ  xử   - Nhận dạng biển số xe Ứng dụng arm9
nh 3.12. Board Tiny6410 SDK cùng với các chuẩn giao tiếp hỗ trợ Board Tiny6410 SDK kết hợp với board xử lý Tny6410 tạo thành một hệ thống phần cứng hoàn chỉnh, có khả năng xử lý các ứng dụng đòi hỏi tốc độ xử (Trang 54)
Hình  4.1.  Bộ  thư  viện  OpenCV. - Nhận dạng biển số xe Ứng dụng arm9
nh 4.1. Bộ thư viện OpenCV (Trang 58)
Hình  4.4.  Ứng  dụng  bộ  lọc  Canny  trong  dò  biên  ảnh - Nhận dạng biển số xe Ứng dụng arm9
nh 4.4. Ứng dụng bộ lọc Canny trong dò biên ảnh (Trang 62)
Hình  4.6.  Giao  diện  Qt  Creator  Tạo  một  project  mới: - Nhận dạng biển số xe Ứng dụng arm9
nh 4.6. Giao diện Qt Creator Tạo một project mới: (Trang 66)

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w