ĐẠI HỌC ĐÀ NẴNG TRƯỜNG ĐẠI HỌC BÁCH KHOA NGUYỄN THANH HUY ỨNG DỤNG PHƯƠNG PHÁP PHÁT HIỆN BIÊN TRONG NHẬN DẠNG CÁC ĐỐI TƯỢNG HÌNH HỌC Chuyên ngành: Khoa học máy tính Mã số: 8480101 TÓ
Trang 1ĐẠI HỌC ĐÀ NẴNG
TRƯỜNG ĐẠI HỌC BÁCH KHOA
NGUYỄN THANH HUY
ỨNG DỤNG PHƯƠNG PHÁP PHÁT HIỆN BIÊN TRONG NHẬN DẠNG CÁC ĐỐI TƯỢNG HÌNH HỌC
Chuyên ngành: Khoa học máy tính
Mã số: 8480101
TÓM TẮT LUẬN VĂN THẠC SĨ KỸ THUẬT
Đà Nẵng, Năm 2018
Trang 2Công trình được hoàn thành tại TRƯỜNG ĐẠI HỌC BÁCH KHOA
Người hướng dẫn khoa học: TS TRƯƠNG NGỌC CHÂU
Phản biện 1: PGS.TS NGUYỄN THANH BÌNH
Phản biện 2: TS HOÀNG VĂN DŨNG
Luận văn được bảo vệ trước Hội đồng chấm Luận văn tốt nghiệp thạc
sĩ kỹ thuật chuyên ngành Khoa học máy tính họp tại Trường Đại học
Bách khoa Đà Nẵng vào ngày 5 tháng 01 năm 2019
Có thể tìm hiểu luận văn tại:
- Trung tâm Học liệu và Truyền t hông Trường Đại học Bách khoa
Đại học Đà Nẵng
- Thư viện Khoa Công nghệ thông tin, Trường Đại học Bách khoa –
Đại học Đà Nẵng
Trang 3MỞ ĐẦU
1 Lý do chọn đề tài
Thông tin giúp làm tăng hiểu biết của con người, là nguồn gốc của nhận thức và là cơ sở của quyết định Hình ảnh là một nguồn cung cấp thông tin tương đối phong phú và trực quan so với những nguồn thông tin khác Do đó, việc xử lý, nhận dạng hình ảnh sao cho thông tin thu được rõ ràng và chính xác nhất là một yêu cầu xuất phát thực tiễn
Sự phát triển nhanh chóng mạnh mẽ về công nghệ chế tạo, công nghệ phần cứng đã tạo ra các sản phẩm với nhiều tí nh năng ưu việt, chất lượng cao Trong đó phải kể đến sự phát triển của các thiết bị thu nhận hình ảnh thực như máy ảnh, camera, máy scan,…tuy nhiên thách thức chính cho công nghệ phần mềm trong lĩnh vực này là việc tiền xử
lý và xử lý nhận dạng các hình ảnh số thu được từ các hệ thống đó
Các thuật toán xử lý ảnh mà cụ thể là phát hiện xử lý biên của
sự vật mà hình ảnh thu được là tiền đề căn bản để nhận dạng đối tượng một cách chính xác nhất, đặc biệt là các đối tượng hình học Qua đó, giúp cho chúng ta có cái nhìn tổng quan hơn về xử lý ảnh, về các phương pháp phát hiện biên đối tượng trong ảnh và từ đó đưa ra được phương án nhận dạng tối ưu trong từng trường hợp cụ thể
Đề tài sẽ đưa ra ứng dụng cụ thể trong việc ứng dụng các thuật toán phát hiện biên vào bài toán nhận dạng các đối tượng hình học nhằm mình chứng cho quá trình lựa chọn giải thuật hợp lý khi xử lý các yêu cầu về nhận dạng và xử lý ảnh trong thực tế
2 Mục tiêu nghiên cứu
- Nghiên cứu các phương pháp phát hiện biên trong xử lý ảnh số
- Nghiên cứu một số phương pháp nhận dạng đối tượng
Trang 4- Đề xuất các giải thuật ứng dụng phương pháp phát hiện biên
để nhận dạng các đối tượng hình học
3 Đối tượng và phạm vi nghiên cứu
a Đối tượng nghiên cứu
- Các phương pháp phát hiện biên
- Các phương pháp nhận dạng
b Phạm vi nghiên cứu
Nhận dạng các đối tượng hình học: hình tròn, hình vuông, hình chữ nhật, hình thoi, hình elip và hình tam giác
4 Phương pháp nghiên cứu
Nghiên cứu, tìm hiểu các giải thuật nhằm phát hiện biên các đối tượng trong ảnh số Sau đó kết hợp sử dụng các phương pháp nhận dạng để phát triển thuật toán nhận dạng các đối tượng hình học
Các phương pháp sẽ thực hiện để đạt được mục tiêu nghiên cứu:
a Phương pháp thu thập thông tin:
- Thu thập các tài liệu tổng quan về xử lý ảnh
- Thu thập tài liệu, bài báo về các phương pháp phát hiện biên trong xử lý ảnh số
- Thu thập tài liệu, thông tin về các giải thuật nhận dạng
- Tìm kiếm các tài liệu trong và ngoài nước, các bài báo và công trình nghiên cứu liên quan đến các giải thuật nhận dạng các đối tượng hình học
b Phương pháp so sánh
- Tổng hợp và đối chiếu giữa những tài liệu thu được để đưa ra một cái nhìn tổng quan nhất giữa các phương pháp cũng như ưu nhược điểm của nó
c Phương pháp phân tích
Trang 5- Phân tích thuật toán, cách thức hoạt động cũng như đặc trưng của mỗi thuật toán
- Phân tích những hiệu quả áp dụng của các thuật toán đối với các ứng dụng cụ thể nhằm đạt đưa kết quả tốt nhất
d Phương pháp chuyên gia
- Tham vấn từ các chuyên gia trong lĩnh vực này nhằm hoàn thiện các nội dung cần nghiên cứu
e Phương pháp thực nghiệm
- Xây dựng giải thuật xử lý nâng cao chất lượng ảnh trong trường hợp ứng dụng cụ thể bằng các phương pháp đã được nghiên cứu, từ đó rút ra những kết luận cho việc nghiên cứu
5 Bố cục của luận văn
Mở đầu
Chương 1: Cơ sở lý thuyết
Chương 2: Xây dựng mô hình nhận dạng đối tượng hình học Chương 3: Triển khai thực nghiệm
Cuối cùng là phần Kết luận và hướng phát triển
CHƯƠNG 1: CƠ SỞ LÝ THUYẾT
1 1 TỔNG QUAN VỀ XỬ LÝ ẢNH SỐ
1.1.1 Giới thiệu về xử lý ảnh
Cùng với ngôn ngữ tự nhiên, hình ảnh đã đóng một vai trò hết sức quan trọng trong việc trao đổi thông tin Tính trực quan của hình ảnh đã giúp cho con người hiểu rõ và sâu sắc hơn các thông tin cần thu thập Người ta đã chứng minh được rằng, trong tất cả các kênh thu nhận thông tin của con người thì lượng thông tin thu nhận qua kênh thị giác chiếm khoảng 70% Hình ảnh là kết quả của việc thu
Trang 6nhận và biểu diễn của năng lượng ánh sáng trải dài từ tia gamma (có bước sóng nhỏ) đến sóng radio (có bước sóng lớn) Tuy nhiên, mắt người chỉ cảm nhận được một vùng giới hạn rất nhỏ trong phổ điện từ Ngược lại, máy tính có thể đọc được một vùng rất rộng trong phổ điện từ, từ tia gamma đến sóng radio Nó có thể biểu diễn
và xử lý những bức ảnh được sinh ra bởi những nguồn mà con người không thể nhận biết được, như ảnh siêu âm, ảnh hồng ngoại, ảnh trong vùng tia X, … Do đó xử lý ảnh có một phạm vi ứng dụng tương đối rộng lớn
1.1.2 Các bước cơ bản trong xử lý ảnh
Thu nhận ảnh: ảnh có thể được thu nhận trong thế giới thực
qua máy chụp hình, từ tranh ảnh thông qua máy quét hoặc từ vệ tinh qua các bộ cảm biến bằng tín hiệu số hoặc tín hiệu tương tự
Số hoá ảnh: Tất cả các thông tin được lưu trong máy tính đều ở
dạng số Vì vậy, ảnh sau khi thu nhận được từ các thiết bị khác cần phải được số hoá để lưu trữ hoặc có thể dùng để xử lý tiếp
Phân tích ảnh: Phân tích ảnh là một quá trình gồm nhiều giai
đoạn nhỏ hơn: tăng cường ảnh để nâng cao chất lượng ảnh và khắc phục những thiếu sót trong quá trình thu nhận ảnh và số hoá ảnh như nhiễu, méo làm nổi bật các đặc trưng chính của ảnh đảm bảo cho ảnh gần giống với hình ảnh thật nhất
Phát hiện và trích chọn các đặc trưng: như biên, màu, kết
cấu, Sau quá trình này ảnh được lưu trữ hoặc sử dụng cho việc nhận dạng hoặc cho hệ hỗ trợ quyết định
Đối sánh, nhận dạng ảnh: Là quá trình đối sánh, phân lớp ảnh
phục vụ cho các mục đích khác nhau
Trang 7Tổng quan các giai đoạn cơ bản trong xử lý ảnh
có khả năng thể hiện được quá trình nhận thức của người qua các mức:
Đối sánh, nhận dạng
Hệ quyết định Lưu trữ
Trang 8kỷ qua có thể tích hợp theo các hướng tiếp cận sau: Trích rút đặc trưng, đối sánh mẫu, thống kê, cấu trúc, mô hình Markov ẩn, mạng nơ ron và SVM
1.2.2.1 Phương pháp trích rút đặc trưng
Phương pháp trích rút đặc trưng là một trong những phương pháp cổ điển của nhận dạng Phương pháp này được thể hiện rõ nét trong nhận dạng các đối tượng hình học Thuật toán nhận dạng được thực hiện thông qua 2 bước chính:
Bước 1: Trích chọn các đặc tính từ các mẫu hình học đầu vào Bởi vì chúng ta chủ yếu quan tâm tới việc nhận dạng các mẫu hình học, hệ thống nhận dạng cũng dựa chủ yếu trên các thông tin về mặt hình học
Bước 2: Sử dụng logic mờ hoặc ước lượng toán học: Để vượt qua giới hạn về sự không rõ ràng giữa các hình, phương pháp sử dụng logic mờ để kết hợp một độ đo nào đó trong việc nhận dạng các hình
1.2.2.2 Đối sánh mẫu
Kỹ thuật nhận dạng đối tượng hình học đơn giản nhất dựa trên
cơ sở đối sánh các nguyên mẫu (prototype) để nhận dạng hình Nói chung, toán tử đối sánh xác định mức độ giống nhau giữa hai vectơ (nhóm các điểm, hình dạng, độ cong ) trong một không gian đặc trưng Các kỹ thuật đối sánh có thể nghiên cứu theo ba hướng sau:
+ Đối sánh trực tiếp
+ Đối sánh mềm các mẫu biến dạng (Deformable Templates and Elastic Matching)
+ Đối sánh giảm nhẹ (Relaxation Matching)
1.2.2.3 Phương pháp tiếp cận cấu trúc
1.2.2.4 Các phương pháp thống kê
1.2.2.5 Các phương pháp học máy tiên tiến
Trang 91.3 CÁC PHƯƠNG PHÁP PHÁT HIỆN BIÊN CỔ ĐIỂN
1.3.1 Phân loại các kỹ thuật phát hiện biên
Phương pháp phát hiện biên trực tiếp
Phương pháp phát hiện biên này nhằm làm nổi biên dựa vào sự biến thiên về giá trị độ sáng của điểm ảnh Kỹ thuật chủ yếu dùng phát hiện biên ở đây là kỹ thuật đạo hàm
Nếu lấy đạo hàm bậc nhất của ảnh ta có phương pháp Gradient Phương pháp này bao gồm kỹ thuật Gradient và kỹ thuật la bàn
Nếu lấy đạo hàm bậc hai của ảnh ta có phương pháp Laplace
Phương pháp phát hiện biên gián tiếp
Là quá trình phân vùng dựa vào phép xử lý kết cấu đối tượng,
cụ thể là dựa vào sự biến thiên nhỏ và đồng đều độ sáng của các điểm ảnh thuộc một đối tượng Nếu các vùng của ảnh được xác định thì đường phân ranh giữa các vùng đó chính là biên ảnh cần tìm Việc phát hiện biên và phân vùng đối tượng là hai bài toán đối ngẫu Từ
Trang 10phát hiện biên ta có thể tiến hành phân lớp đối tượng, như vậy là đã phân vùng được ảnh Và ngược lại, khi đã phân vùng được ảnh nghĩa
là đã phân lập được thành các đối tượng, từ đó có thể phát hiện được biên cần tìm
Quy trình phát hiện biên
Bước 1: Do ảnh ghi được thường có nhiễu, bước đầu tiên của quá trình này là giảm nhiễu của ảnh cần xử lý
Bước 2: Làm nổi biên sử dụng các toán tử phát hiện biên
Bước 3: Định vị biên Chú ý rằng kỹ thuật nổi biên gây tác dụng phụ là gây nhiễu làm một số biên giả xuất hiện do vậy cần loại
bỏ biên giả
Bước 4: Liên kết và trích chọn biên
1.3.2 Kỹ thuật phát hiện biên trực tiếp
1.3.2.1 Kỹ thuật phát hiện biên Gradient
Kỹ thuật Gradient là kỹ thuật dò biên cục bộ dựa vào cực đại của đạo hàm
Đây là phép toán lấy đạo hàm bậc nhất trong không gian hai chiều
Theo định nghĩa Gradient là một véctơ có các thành phần biểu thị tốc độ thay đổi giá trị của điểm ảnh, ta có:
) (
) , (
x f
y x
f
= f(x)
dx
y x f y dx x
) (
) , (
y f
y x
f
= f(y)
dy
y x f dx y x
Trong đó dx, dy là khoảng cách giữa 2 điểm kế cận theo hướng
x, y tương ứng (thực tế chọn dx= dy=1) Đây là phương pháp dựa
theo đạo hàm riêng bậc nhất theo hướng x, y
Trang 11Toán tử Sobel được Duda và Hart đặt ra năm 1973 với các mặt
nạ tương tự như của Robert nhưng khác cấu hình:
Kỹ thuật Gradient dùng toán tử Gradient lấy đạo hàm theo một hướng
Trang 12Kỹ thuật la bàn dùng toán tử la bàn lấy đạo hàm theo tám hướng: Bắc, Nam, Đông, Tây, Đông bắc, Tây bắc, Đông nam, Tây nam
Toán tử la bàn do Gradient dựa trên sự đánh giá tất cả các hướng có thể của một đường biên ảnh trong một ảnh rời rạc Bởi vậy thay vì chỉ áp dụng hai mặt nạ như các toán tử trong kỹ thuật Gradient ở trên, tám mặt nạ đã được dùng, mỗi cái cung cấp một cạnh đường biên dọc theo một trong tám hướng có thể của vòng
Như vậy, mỗi điểm ảnh đầu ra là giá trị lớn nhất trong tám kết quả nhân xoắn của mặt nạ với ma trận ảnh Sau mỗi lần nhân xoắn, ta quay mặt nạ này đi một góc 450
ngược chiều kim đồng hồ : 00, 450,
1.3.4 Kỹ thuật phát hiện biên Laplace
Để khắc phục hạn chế và nhược điểm của phương pháp Gradient, trong đó sử dụng đạo hàm riêng bậc nhất người ta nghĩ đến việc sử dụng đạo hàm riêng bậc hai hay toán tử Laplace Phương pháp dò biên theo toán tử Laplace hiệu quả hơn phương pháp toán
tử Gradient trong trường hợp mức xám biến đổi chậm, miền chuyển đổi mức xám có độ trải rộng
Toán tử Laplace được xác định như sau:
2
f = 22
x
f
+ 22
y f
Trang 13
Toán tử Laplace dùng một số kiểu mặt nạ khác nhau nhằm tính gần đúng đạo hàm riêng bậc hai Các dạng mặt nạ theo toán tử Laplace bậc 3x3 có thể:
Toán tử Laplace dùng nhiều kiểu mặt nạ khác nhau để xấp xỉ rời rạc đạo hàm bậc hai Dưới đây là ba kiểu mặt nạ hay dùng:
Trang 14Cơ sở lý thuyết thuật toán
Ý tưởng thuật toán: Ý tưởng của phương pháp này là định vị đúng vị trí bằng cách cực tiểu hoá phương sai 2 của vị trí các điểm cắt "Zero" hoặc hạn chế số điểm cực trị cục bộ để chỉ tạo ra một
đường bao
Các ràng buộc mà phương pháp phát hiện biên Canny đã thực hiện được đó là: mức lỗi, định vị và hiệu suất Trong đó:
Mức lỗi: có ý nghĩa là một phương pháp phát hiện biên chỉ
và phải tìm tất cả các biên, không biên nào được tìm bị lỗi
Định vị: Điều này nói đến độ chênh lệch cấp xám giữa các điểm trên cùng một biên phải càng nhỏ càng tốt
Hiệu suất: là làm sao cho khi tách biên không được nhận ra nhiều biên trong khi chỉ có một biên tồn tại
1.4.2 Phương pháp Shen - Castan
Shen và Castan có cùng quan điểm với Canny về một mẫu chung trong việc tách các đường biên Đó là: nhân xoắn ảnh với một mặt nạ làm mịn, sau đó tìm ra điểm biên Tuy nhiên trong những phân tích của họ lại tạo ra một hàm khác để tối ưu, đó là việc đề xuất cực tiểu hoá hàm sau trong không gian một chiều
1.4.3 Phát hiện biên dựa vào Wavelet
Phương pháp này sử dụng biến đổi Wavelet rời rạc (DWT) để phân tích ảnh thành nhiều ảnh có đặc điểm và xấp xỉ Xấp xỉ giống như ảnh gốc, theo tỷ lệ ¼
1.5 KẾT CHƯƠNG
Các nội dung được trình bày ở trên tập trung vào lý thuyết tổng quan về xử lý ảnh, nhận dạng đối tượng và đặc biệt là các phương pháp nhận dạng phổ biến hiện nay và tập trung vào nghiên cứu chi tiết các phương pháp phát hiện biên cơ bản nhất Mỗi phương pháp đều có
Trang 15các ưu nhược điểm khác nhau phù hợp với các trường hợp cụ thể của đối tượng Có hai nhóm phương pháp cơ bản, phương pháp phát hiện biên trực tiếp tập trung vào các đối tượng nhận dạng đơn giản, không hoặc ít nhiễu vì vậy việc cài đặt thuật toán và tốc độ xử lý thuật toán tương đối dễ dàng và nhanh chóng Phương pháp phát hiện biên gián tiếp sử dụng các giải thuật phức tạp hơn, đòi hỏi thời gian xử lý nhiều hơn, được sử dụng để phát hiện biên các đối tượng phức tạp, mức độ nhiễu lớn, không đều
Các nghiên cứu trên cũng đã chỉ ra lịch sử quá trình nghiên cứu
về nhận dạng đã phát triển nhiều phương pháp nhận dạng khác nhau, mỗi phương pháp có những ưu, nhược điểm và phù hợp với một đối tượng hoặc nhóm đối tượng nhất định (chữ viết, hình học, sinh trắc học, )
Đối với các phương pháp nhận dạng bằng trích chọn đặc trưng, bằng tập mờ hay phương pháp đối sánh: các phương pháp này cơ bản
sử dụng các đặc trưng riêng có của đối tượng, kết quả nhận dạng tương đối tốt, tốc độ trong xử lý nhận dạng cao và sử dụng các thuật toán nhận dạng không phức tạp
Các phương pháp nhận dạng học máy là các phương pháp được nghiên cứu và phát triển về sau, được nhiều nhà khoa học tập trung nghiên cứu Các phương pháp này thường được sử dụng nhận dạng các đối tượng phức tạp, đòi hỏi quá trình xử lý nhận dạng mất nhiều thời gian do phải trải qua quá trình học (huấn luyện), tốc độ xử lý chậm hơn và thuật toán nhận dạng bao gồm nhiều bước khác nhau, nhiều tham số, phức tạp hơn Tuy nhiên, kết quả nhận dạng của các phương pháp này thường đưa đến hiệu quả cao hơn
Đối với bài toán cụ thể của với việc nhận dạng các đối tượng hình học, là các đối tượng cố định, có khả năng định nghĩa được các