1. Trang chủ
  2. » Luận Văn - Báo Cáo

Ứng dụng phương pháp phát hiện biên trong nhận dạng các đối tượng hình học

25 173 0
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 25
Dung lượng 319,32 KB

Nội dung

ĐẠI HỌC ĐÀ NẴNG TRƯỜNG ĐẠI HỌC BÁCH KHOA NGUYỄN THANH HUY ỨNG DỤNG PHƯƠNG PHÁP PHÁT HIỆN BIÊN TRONG NHẬN DẠNG CÁC ĐỐI TƯỢNG HÌNH HỌC Chuyên ngành: Khoa học máy tính Mã số: 8480101 TÓ

Trang 1

ĐẠI HỌC ĐÀ NẴNG

TRƯỜNG ĐẠI HỌC BÁCH KHOA

NGUYỄN THANH HUY

ỨNG DỤNG PHƯƠNG PHÁP PHÁT HIỆN BIÊN TRONG NHẬN DẠNG CÁC ĐỐI TƯỢNG HÌNH HỌC

Chuyên ngành: Khoa học máy tính

Mã số: 8480101

TÓM TẮT LUẬN VĂN THẠC SĨ KỸ THUẬT

Đà Nẵng, Năm 2018

Trang 2

Công trình được hoàn thành tại TRƯỜNG ĐẠI HỌC BÁCH KHOA

Người hướng dẫn khoa học: TS TRƯƠNG NGỌC CHÂU

Phản biện 1: PGS.TS NGUYỄN THANH BÌNH

Phản biện 2: TS HOÀNG VĂN DŨNG

Luận văn được bảo vệ trước Hội đồng chấm Luận văn tốt nghiệp thạc

sĩ kỹ thuật chuyên ngành Khoa học máy tính họp tại Trường Đại học

Bách khoa Đà Nẵng vào ngày 5 tháng 01 năm 2019

Có thể tìm hiểu luận văn tại:

- Trung tâm Học liệu và Truyền t hông Trường Đại học Bách khoa

Đại học Đà Nẵng

- Thư viện Khoa Công nghệ thông tin, Trường Đại học Bách khoa –

Đại học Đà Nẵng

Trang 3

MỞ ĐẦU

1 Lý do chọn đề tài

Thông tin giúp làm tăng hiểu biết của con người, là nguồn gốc của nhận thức và là cơ sở của quyết định Hình ảnh là một nguồn cung cấp thông tin tương đối phong phú và trực quan so với những nguồn thông tin khác Do đó, việc xử lý, nhận dạng hình ảnh sao cho thông tin thu được rõ ràng và chính xác nhất là một yêu cầu xuất phát thực tiễn

Sự phát triển nhanh chóng mạnh mẽ về công nghệ chế tạo, công nghệ phần cứng đã tạo ra các sản phẩm với nhiều tí nh năng ưu việt, chất lượng cao Trong đó phải kể đến sự phát triển của các thiết bị thu nhận hình ảnh thực như máy ảnh, camera, máy scan,…tuy nhiên thách thức chính cho công nghệ phần mềm trong lĩnh vực này là việc tiền xử

lý và xử lý nhận dạng các hình ảnh số thu được từ các hệ thống đó

Các thuật toán xử lý ảnh mà cụ thể là phát hiện xử lý biên của

sự vật mà hình ảnh thu được là tiền đề căn bản để nhận dạng đối tượng một cách chính xác nhất, đặc biệt là các đối tượng hình học Qua đó, giúp cho chúng ta có cái nhìn tổng quan hơn về xử lý ảnh, về các phương pháp phát hiện biên đối tượng trong ảnh và từ đó đưa ra được phương án nhận dạng tối ưu trong từng trường hợp cụ thể

Đề tài sẽ đưa ra ứng dụng cụ thể trong việc ứng dụng các thuật toán phát hiện biên vào bài toán nhận dạng các đối tượng hình học nhằm mình chứng cho quá trình lựa chọn giải thuật hợp lý khi xử lý các yêu cầu về nhận dạng và xử lý ảnh trong thực tế

2 Mục tiêu nghiên cứu

- Nghiên cứu các phương pháp phát hiện biên trong xử lý ảnh số

- Nghiên cứu một số phương pháp nhận dạng đối tượng

Trang 4

- Đề xuất các giải thuật ứng dụng phương pháp phát hiện biên

để nhận dạng các đối tượng hình học

3 Đối tượng và phạm vi nghiên cứu

a Đối tượng nghiên cứu

- Các phương pháp phát hiện biên

- Các phương pháp nhận dạng

b Phạm vi nghiên cứu

Nhận dạng các đối tượng hình học: hình tròn, hình vuông, hình chữ nhật, hình thoi, hình elip và hình tam giác

4 Phương pháp nghiên cứu

Nghiên cứu, tìm hiểu các giải thuật nhằm phát hiện biên các đối tượng trong ảnh số Sau đó kết hợp sử dụng các phương pháp nhận dạng để phát triển thuật toán nhận dạng các đối tượng hình học

Các phương pháp sẽ thực hiện để đạt được mục tiêu nghiên cứu:

a Phương pháp thu thập thông tin:

- Thu thập các tài liệu tổng quan về xử lý ảnh

- Thu thập tài liệu, bài báo về các phương pháp phát hiện biên trong xử lý ảnh số

- Thu thập tài liệu, thông tin về các giải thuật nhận dạng

- Tìm kiếm các tài liệu trong và ngoài nước, các bài báo và công trình nghiên cứu liên quan đến các giải thuật nhận dạng các đối tượng hình học

b Phương pháp so sánh

- Tổng hợp và đối chiếu giữa những tài liệu thu được để đưa ra một cái nhìn tổng quan nhất giữa các phương pháp cũng như ưu nhược điểm của nó

c Phương pháp phân tích

Trang 5

- Phân tích thuật toán, cách thức hoạt động cũng như đặc trưng của mỗi thuật toán

- Phân tích những hiệu quả áp dụng của các thuật toán đối với các ứng dụng cụ thể nhằm đạt đưa kết quả tốt nhất

d Phương pháp chuyên gia

- Tham vấn từ các chuyên gia trong lĩnh vực này nhằm hoàn thiện các nội dung cần nghiên cứu

e Phương pháp thực nghiệm

- Xây dựng giải thuật xử lý nâng cao chất lượng ảnh trong trường hợp ứng dụng cụ thể bằng các phương pháp đã được nghiên cứu, từ đó rút ra những kết luận cho việc nghiên cứu

5 Bố cục của luận văn

Mở đầu

Chương 1: Cơ sở lý thuyết

Chương 2: Xây dựng mô hình nhận dạng đối tượng hình học Chương 3: Triển khai thực nghiệm

Cuối cùng là phần Kết luận và hướng phát triển

CHƯƠNG 1: CƠ SỞ LÝ THUYẾT

1 1 TỔNG QUAN VỀ XỬ LÝ ẢNH SỐ

1.1.1 Giới thiệu về xử lý ảnh

Cùng với ngôn ngữ tự nhiên, hình ảnh đã đóng một vai trò hết sức quan trọng trong việc trao đổi thông tin Tính trực quan của hình ảnh đã giúp cho con người hiểu rõ và sâu sắc hơn các thông tin cần thu thập Người ta đã chứng minh được rằng, trong tất cả các kênh thu nhận thông tin của con người thì lượng thông tin thu nhận qua kênh thị giác chiếm khoảng 70% Hình ảnh là kết quả của việc thu

Trang 6

nhận và biểu diễn của năng lượng ánh sáng trải dài từ tia gamma (có bước sóng nhỏ) đến sóng radio (có bước sóng lớn) Tuy nhiên, mắt người chỉ cảm nhận được một vùng giới hạn rất nhỏ trong phổ điện từ Ngược lại, máy tính có thể đọc được một vùng rất rộng trong phổ điện từ, từ tia gamma đến sóng radio Nó có thể biểu diễn

và xử lý những bức ảnh được sinh ra bởi những nguồn mà con người không thể nhận biết được, như ảnh siêu âm, ảnh hồng ngoại, ảnh trong vùng tia X, … Do đó xử lý ảnh có một phạm vi ứng dụng tương đối rộng lớn

1.1.2 Các bước cơ bản trong xử lý ảnh

Thu nhận ảnh: ảnh có thể được thu nhận trong thế giới thực

qua máy chụp hình, từ tranh ảnh thông qua máy quét hoặc từ vệ tinh qua các bộ cảm biến bằng tín hiệu số hoặc tín hiệu tương tự

Số hoá ảnh: Tất cả các thông tin được lưu trong máy tính đều ở

dạng số Vì vậy, ảnh sau khi thu nhận được từ các thiết bị khác cần phải được số hoá để lưu trữ hoặc có thể dùng để xử lý tiếp

Phân tích ảnh: Phân tích ảnh là một quá trình gồm nhiều giai

đoạn nhỏ hơn: tăng cường ảnh để nâng cao chất lượng ảnh và khắc phục những thiếu sót trong quá trình thu nhận ảnh và số hoá ảnh như nhiễu, méo làm nổi bật các đặc trưng chính của ảnh đảm bảo cho ảnh gần giống với hình ảnh thật nhất

Phát hiện và trích chọn các đặc trưng: như biên, màu, kết

cấu, Sau quá trình này ảnh được lưu trữ hoặc sử dụng cho việc nhận dạng hoặc cho hệ hỗ trợ quyết định

Đối sánh, nhận dạng ảnh: Là quá trình đối sánh, phân lớp ảnh

phục vụ cho các mục đích khác nhau

Trang 7

Tổng quan các giai đoạn cơ bản trong xử lý ảnh

có khả năng thể hiện được quá trình nhận thức của người qua các mức:

Đối sánh, nhận dạng

Hệ quyết định Lưu trữ

Trang 8

kỷ qua có thể tích hợp theo các hướng tiếp cận sau: Trích rút đặc trưng, đối sánh mẫu, thống kê, cấu trúc, mô hình Markov ẩn, mạng nơ ron và SVM

1.2.2.1 Phương pháp trích rút đặc trưng

Phương pháp trích rút đặc trưng là một trong những phương pháp cổ điển của nhận dạng Phương pháp này được thể hiện rõ nét trong nhận dạng các đối tượng hình học Thuật toán nhận dạng được thực hiện thông qua 2 bước chính:

Bước 1: Trích chọn các đặc tính từ các mẫu hình học đầu vào Bởi vì chúng ta chủ yếu quan tâm tới việc nhận dạng các mẫu hình học, hệ thống nhận dạng cũng dựa chủ yếu trên các thông tin về mặt hình học

Bước 2: Sử dụng logic mờ hoặc ước lượng toán học: Để vượt qua giới hạn về sự không rõ ràng giữa các hình, phương pháp sử dụng logic mờ để kết hợp một độ đo nào đó trong việc nhận dạng các hình

1.2.2.2 Đối sánh mẫu

Kỹ thuật nhận dạng đối tượng hình học đơn giản nhất dựa trên

cơ sở đối sánh các nguyên mẫu (prototype) để nhận dạng hình Nói chung, toán tử đối sánh xác định mức độ giống nhau giữa hai vectơ (nhóm các điểm, hình dạng, độ cong ) trong một không gian đặc trưng Các kỹ thuật đối sánh có thể nghiên cứu theo ba hướng sau:

+ Đối sánh trực tiếp

+ Đối sánh mềm các mẫu biến dạng (Deformable Templates and Elastic Matching)

+ Đối sánh giảm nhẹ (Relaxation Matching)

1.2.2.3 Phương pháp tiếp cận cấu trúc

1.2.2.4 Các phương pháp thống kê

1.2.2.5 Các phương pháp học máy tiên tiến

Trang 9

1.3 CÁC PHƯƠNG PHÁP PHÁT HIỆN BIÊN CỔ ĐIỂN

1.3.1 Phân loại các kỹ thuật phát hiện biên

Phương pháp phát hiện biên trực tiếp

Phương pháp phát hiện biên này nhằm làm nổi biên dựa vào sự biến thiên về giá trị độ sáng của điểm ảnh Kỹ thuật chủ yếu dùng phát hiện biên ở đây là kỹ thuật đạo hàm

Nếu lấy đạo hàm bậc nhất của ảnh ta có phương pháp Gradient Phương pháp này bao gồm kỹ thuật Gradient và kỹ thuật la bàn

Nếu lấy đạo hàm bậc hai của ảnh ta có phương pháp Laplace

Phương pháp phát hiện biên gián tiếp

Là quá trình phân vùng dựa vào phép xử lý kết cấu đối tượng,

cụ thể là dựa vào sự biến thiên nhỏ và đồng đều độ sáng của các điểm ảnh thuộc một đối tượng Nếu các vùng của ảnh được xác định thì đường phân ranh giữa các vùng đó chính là biên ảnh cần tìm Việc phát hiện biên và phân vùng đối tượng là hai bài toán đối ngẫu Từ

Trang 10

phát hiện biên ta có thể tiến hành phân lớp đối tượng, như vậy là đã phân vùng được ảnh Và ngược lại, khi đã phân vùng được ảnh nghĩa

là đã phân lập được thành các đối tượng, từ đó có thể phát hiện được biên cần tìm

Quy trình phát hiện biên

Bước 1: Do ảnh ghi được thường có nhiễu, bước đầu tiên của quá trình này là giảm nhiễu của ảnh cần xử lý

Bước 2: Làm nổi biên sử dụng các toán tử phát hiện biên

Bước 3: Định vị biên Chú ý rằng kỹ thuật nổi biên gây tác dụng phụ là gây nhiễu làm một số biên giả xuất hiện do vậy cần loại

bỏ biên giả

Bước 4: Liên kết và trích chọn biên

1.3.2 Kỹ thuật phát hiện biên trực tiếp

1.3.2.1 Kỹ thuật phát hiện biên Gradient

Kỹ thuật Gradient là kỹ thuật dò biên cục bộ dựa vào cực đại của đạo hàm

Đây là phép toán lấy đạo hàm bậc nhất trong không gian hai chiều

Theo định nghĩa Gradient là một véctơ có các thành phần biểu thị tốc độ thay đổi giá trị của điểm ảnh, ta có:

) (

) , (

x f

y x

f

= f(x)

dx

y x f y dx x

) (

) , (

y f

y x

f

= f(y)

dy

y x f dx y x

Trong đó dx, dy là khoảng cách giữa 2 điểm kế cận theo hướng

x, y tương ứng (thực tế chọn dx= dy=1) Đây là phương pháp dựa

theo đạo hàm riêng bậc nhất theo hướng x, y

Trang 11

Toán tử Sobel được Duda và Hart đặt ra năm 1973 với các mặt

nạ tương tự như của Robert nhưng khác cấu hình:

Kỹ thuật Gradient dùng toán tử Gradient lấy đạo hàm theo một hướng

Trang 12

Kỹ thuật la bàn dùng toán tử la bàn lấy đạo hàm theo tám hướng: Bắc, Nam, Đông, Tây, Đông bắc, Tây bắc, Đông nam, Tây nam

Toán tử la bàn do Gradient dựa trên sự đánh giá tất cả các hướng có thể của một đường biên ảnh trong một ảnh rời rạc Bởi vậy thay vì chỉ áp dụng hai mặt nạ như các toán tử trong kỹ thuật Gradient ở trên, tám mặt nạ đã được dùng, mỗi cái cung cấp một cạnh đường biên dọc theo một trong tám hướng có thể của vòng

Như vậy, mỗi điểm ảnh đầu ra là giá trị lớn nhất trong tám kết quả nhân xoắn của mặt nạ với ma trận ảnh Sau mỗi lần nhân xoắn, ta quay mặt nạ này đi một góc 450

ngược chiều kim đồng hồ : 00, 450,

1.3.4 Kỹ thuật phát hiện biên Laplace

Để khắc phục hạn chế và nhược điểm của phương pháp Gradient, trong đó sử dụng đạo hàm riêng bậc nhất người ta nghĩ đến việc sử dụng đạo hàm riêng bậc hai hay toán tử Laplace Phương pháp dò biên theo toán tử Laplace hiệu quả hơn phương pháp toán

tử Gradient trong trường hợp mức xám biến đổi chậm, miền chuyển đổi mức xám có độ trải rộng

Toán tử Laplace được xác định như sau:

2

f = 22

x

f

+ 22

y f

Trang 13

Toán tử Laplace dùng một số kiểu mặt nạ khác nhau nhằm tính gần đúng đạo hàm riêng bậc hai Các dạng mặt nạ theo toán tử Laplace bậc 3x3 có thể:

Toán tử Laplace dùng nhiều kiểu mặt nạ khác nhau để xấp xỉ rời rạc đạo hàm bậc hai Dưới đây là ba kiểu mặt nạ hay dùng:

Trang 14

Cơ sở lý thuyết thuật toán

Ý tưởng thuật toán: Ý tưởng của phương pháp này là định vị đúng vị trí bằng cách cực tiểu hoá phương sai 2 của vị trí các điểm cắt "Zero" hoặc hạn chế số điểm cực trị cục bộ để chỉ tạo ra một

đường bao

Các ràng buộc mà phương pháp phát hiện biên Canny đã thực hiện được đó là: mức lỗi, định vị và hiệu suất Trong đó:

Mức lỗi: có ý nghĩa là một phương pháp phát hiện biên chỉ

và phải tìm tất cả các biên, không biên nào được tìm bị lỗi

Định vị: Điều này nói đến độ chênh lệch cấp xám giữa các điểm trên cùng một biên phải càng nhỏ càng tốt

Hiệu suất: là làm sao cho khi tách biên không được nhận ra nhiều biên trong khi chỉ có một biên tồn tại

1.4.2 Phương pháp Shen - Castan

Shen và Castan có cùng quan điểm với Canny về một mẫu chung trong việc tách các đường biên Đó là: nhân xoắn ảnh với một mặt nạ làm mịn, sau đó tìm ra điểm biên Tuy nhiên trong những phân tích của họ lại tạo ra một hàm khác để tối ưu, đó là việc đề xuất cực tiểu hoá hàm sau trong không gian một chiều

1.4.3 Phát hiện biên dựa vào Wavelet

Phương pháp này sử dụng biến đổi Wavelet rời rạc (DWT) để phân tích ảnh thành nhiều ảnh có đặc điểm và xấp xỉ Xấp xỉ giống như ảnh gốc, theo tỷ lệ ¼

1.5 KẾT CHƯƠNG

Các nội dung được trình bày ở trên tập trung vào lý thuyết tổng quan về xử lý ảnh, nhận dạng đối tượng và đặc biệt là các phương pháp nhận dạng phổ biến hiện nay và tập trung vào nghiên cứu chi tiết các phương pháp phát hiện biên cơ bản nhất Mỗi phương pháp đều có

Trang 15

các ưu nhược điểm khác nhau phù hợp với các trường hợp cụ thể của đối tượng Có hai nhóm phương pháp cơ bản, phương pháp phát hiện biên trực tiếp tập trung vào các đối tượng nhận dạng đơn giản, không hoặc ít nhiễu vì vậy việc cài đặt thuật toán và tốc độ xử lý thuật toán tương đối dễ dàng và nhanh chóng Phương pháp phát hiện biên gián tiếp sử dụng các giải thuật phức tạp hơn, đòi hỏi thời gian xử lý nhiều hơn, được sử dụng để phát hiện biên các đối tượng phức tạp, mức độ nhiễu lớn, không đều

Các nghiên cứu trên cũng đã chỉ ra lịch sử quá trình nghiên cứu

về nhận dạng đã phát triển nhiều phương pháp nhận dạng khác nhau, mỗi phương pháp có những ưu, nhược điểm và phù hợp với một đối tượng hoặc nhóm đối tượng nhất định (chữ viết, hình học, sinh trắc học, )

Đối với các phương pháp nhận dạng bằng trích chọn đặc trưng, bằng tập mờ hay phương pháp đối sánh: các phương pháp này cơ bản

sử dụng các đặc trưng riêng có của đối tượng, kết quả nhận dạng tương đối tốt, tốc độ trong xử lý nhận dạng cao và sử dụng các thuật toán nhận dạng không phức tạp

Các phương pháp nhận dạng học máy là các phương pháp được nghiên cứu và phát triển về sau, được nhiều nhà khoa học tập trung nghiên cứu Các phương pháp này thường được sử dụng nhận dạng các đối tượng phức tạp, đòi hỏi quá trình xử lý nhận dạng mất nhiều thời gian do phải trải qua quá trình học (huấn luyện), tốc độ xử lý chậm hơn và thuật toán nhận dạng bao gồm nhiều bước khác nhau, nhiều tham số, phức tạp hơn Tuy nhiên, kết quả nhận dạng của các phương pháp này thường đưa đến hiệu quả cao hơn

Đối với bài toán cụ thể của với việc nhận dạng các đối tượng hình học, là các đối tượng cố định, có khả năng định nghĩa được các

Ngày đăng: 15/09/2019, 22:55

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w