1. Trang chủ
  2. » Luận Văn - Báo Cáo

(Luận văn thạc sĩ) Nghiên Cứu Phương Pháp Tra Cứu Ảnh Dựa Trên Thuật Toán Phân Đoạn Ảnh

62 0 0
Tài liệu được quét OCR, nội dung có thể không chính xác
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 62
Dung lượng 19,37 MB

Nội dung

Một số kỹ thuật phân đoạn ảnh KẾT LUẬN CHƯƠNG MOT PHAN DOAN ANH THEO MO HINH TACH, GHEP VUNG PHAN DOAN ANH THEO MO HiINH GHEP VUNG Ghép theo mau Ghép theo biên PHAN ĐOẠN ẢNH THEO MÔ H

Trang 1

: NGHIEN CUU PHUONG PHAP TRA CUU ANH DUA TREN s

Trang 2

BO GIAO DUC VIEN HAN LAM KHOA HOC

HOC VIEN KHOA HOC VA CONG NGHE

Lé Manh Hiép

NGHIEN CUU PHUONG PHAP TRA CUU ANH DUA TREN

THUAT TOAN PHAN DOAN ANH

Chuyên ngành: Hệ thống thông tin

Mã số: 8480104

LUAN VAN THAC SI HE THONG THONG TIN

NGUOI HUGNG DAN KHOA HOC:

Hướng dẫn: NGÔ QUỐC TẠO

Hà Nội - 2020

Trang 3

LOI CAM DOAN Tôi xin cam đoan bài luận văn này là sự nghiên cứu của bản thân (ngoài phần tham khảo đã được trích rõ) cùng với hướng dẫn của

PGS.TS Ngô Quốc Tạo Tôi xin chịu trách nhiệm hoàn toàn nếu Xảy Ta Sal

phạm

Tác giả luận văn

Lê Mạnh Hiệp

Trang 4

LOI CAM ON Đầu tiên em xin gửi lời cảm ơn chân thành tới thầy giáo,

PGS TS Ngô Quốc Tạo, là người đã tận tình hướng dẫn, chỉ bảo em rất nhiều

trong quá trình tìm hiểu nghiên cứu và hoàn thành luận văn nay Từ đó đã giúp

em có thêm nhiều kiến thức về xử ly ảnh — một lĩnh vực mới đối với em Luận văn được sự hỗ trợ của nhiệm vụ cao cấp NVCC02.01/20-20 và đề tài “Nghiên

cứu cải tiến hiệu quả tra cứu ảnh thông qua học khoảng cách”, mã số VAST01.07/19-20

Đồng thời, em xin chân thành cám ơn các thầy cô tại Học viện Khoa học và Công nghệ, Viện hàn lâm Khoa học và Công nghệ Việt Nam đã trang bị cho em

những kiến thức cơ bản cần thiết trong suốt thời gian học tập tại trường để em hoàn thành tốt luận văn này

Trong quá trình học cũng như trong suốt thời gian làm luận văn tốt nghiệp không tránh khỏi những thiếu sót, em rất mong được sự góp ý quý báu của các thầy cô cũng như tất cả các bạn để kết quả của em được hoàn thiện hơn

Sau cùng, em xin gửi lời cảm ơn đến gia đình, bạn bè đã tạo mọi điều kiện

để em xây dựng thành công luận văn này

Em xIn chân thành cảm ơn!

Trang 5

DANH SACH CAC TU VIET TAT

7 HSL Hue-Saturation-Luminance

Trang 6

DANH MUC BANG

Bảng 3.2 Bảng cơ sở đữ liệu Image 48 Bảng 3.3 Bảng cơ sở đữ liệu Cluster 49

Trang 7

DANH MUC HINH ANH

Hinh 1.1 Các giai đoạn xử lý anh 6

Hình 1.3 Không gian màu RGB được trực quan hoá như một hình 13

khôi Hình 1.4 Mô tả không gian màu HSŠV 14 Hình 2.1 Biểu diễn phan cum phan cap bottom-up cua 5 đối 24

BR2,2

Hinh 3.2 Giao dién form CBC sau khi open anh 4] Hinh 3.3 Giao dién form chon nguéng CBC 41

Hinh 3.6 Giao dién form K-Means open anh 42 Hinh 3.7 Một số keeta quả phan đoạn theo K-Means 43

Trang 8

Hình 3.1] Kiến trúc tông quát của hệ thống tra cứu ảnh 46

Hình 3.12 | Giao diện chính hệ thống tra cứu ảnh 48

Hình 3.13 Mỗi quan hệ giữa các bảng 49

Trang 9

Chuong1: | TONG QUAN VE PHAN DOAN ANH

1.1 MOT SO KHAI NIEM VE XU LY ANH

1.1.1 Giới thiệu

1.1.2 Cac giai đoạn xử lý ảnh

1.1.3 Một số khái niệm cơ bản

113.1 Diém anh - Pixel

1.3.2 Muc tiéu anh phan doan anh

Trang 10

Một số kỹ thuật phân đoạn ảnh

KẾT LUẬN CHƯƠNG MOT

PHAN DOAN ANH THEO MO HINH TACH, GHEP VUNG

PHAN DOAN ANH THEO MO HiINH GHEP VUNG

Ghép theo mau Ghép theo biên

PHAN ĐOẠN ẢNH THEO MÔ HÌNH TÁCH VÙNG

Tách theo màu

Tách theo vùng đồng nhất

SO SÁNH THUẬT TOÁN K MEAN VỚI CBC KẾT LUẬN CHƯƠNG HAI

ỨNG DỤNG PHẦN ĐOẠN ẢNH TRONG TRA CỨU

ẢNH DỰA TREN CAC PHUONG PHAP PHAN

DOAN ANH

PHAN TICH BAI TOAN KET QUA DAT ĐƯỢC ĐÁNH GIÁ HIEU QUA PHAN DOAN

UNG DUNG PHAN DOAN CBC VAO TRA CUU ANH

Trang 11

MO DAU

Cùng với xu hướng phát triển của các phương tiện truyền thông, các phương tiện lưu trữ hình ảnh, kích thước của các tập ảnh số được gia tăng một

cách chóng mặt Hiệu quả của các công cụ tìm kiếm, tra cứu ảnh được yêu cầu

từ rất nhiều lĩnh vực khác nhau gồm: trinh sát, thời trang, phòng chống tội phạm Cùng chung mục đích này, rất nhiều các hệ thống tra cứu ảnh đã được phát triển Có hai nên tảng là: dựa trên văn bản (text-based) và dựa trên nội dung (content-based)

Bài viết này đã trình bày một kỹ thuật lập chỉ mục màu không gian hiệu quả được thiết kế sử dụng phương pháp phân khúc Kỹ thuật này có tính chất

của dịch thuật, xoay và nhân rộng bất biến Việc thu hồi được chấp nhận để xuất

hiện đáng kế thay đổi và cung cấp các cơ sở của màu sắc phù hợp gián tiếp

Hiệu suất truy xuất của kỹ thuật cũng đã được thiết lập để vượt trội so với cho

các đối tác khác của nó

Luận văn sẽ trình bày kỹ thuật phản hồi liên quan được ứng dụng trong tra

cứu ảnh dựa trên nội dung để thu hẹp khoảng cách ngữ nghĩa, cải thiện hiệu

năng tra cứu Báo cáo được chia làm 3 chương:

Chương 1: Tổng quan về phân đoạn ảnh

Giới thiệu các khái niệm cơ bản về hệ thông tra cứu ảnh dựa trên phân đoạn ảnh

Chương 2: Phân đoạn ảnh theo mô hình tách ghép vùng Giới thiệu các phương pháp phản hồi liên quan và máy học

Chương 3: Áp dụng cài đặt thử nghiệm

Cài đặt chương trình thử nghiệm dựa trên lý thuyết từ chương 1 và chương 2

Trang 12

Chuong 1

TONG QUAN VE PHAN DOAN ANH

Xu ly anh ngay nay da tro thanh mot nganh khoa hoc lon, da co mat trong nhiễu lĩnh vực của cuộc séng Dieu này chúng ta có thể diễn giải được

từ một định nghĩa đơn giản vé ngành khoa học này: Xử lý ảnh là ngành khoa học nghiên cứu các giai đoạn xứ lý thông tin dạng hình ảnh, mà hình ảnh là một trong những dạng thông tin phong phú nhất đối với chúng ta Bước quan trọng nhất và cũng là khó khăn nhất trong giai đoạn xử lý ảnh là bước phân

đoạn ảnh Phán đoạn là việc phán tách các đối tuong cẩu thành nên ảnh thô

từ đó có thể sử dụng cho các ứng dụng sau này

1.1 MOT SO KHAI NIEM VE XU LY ANH

1.1.1 Giới thiệu

Thế giới kỹ thuật số là kỹ thuật số với sự xuất hiện của nhiều thiết bị

được sử dụng trong việc thu nhận hình ảnh Ngày nay, việc lưu trữ số lượng lớn hình ảnh trở nên dễ dàng bằng cách sử dụng các kỹ thuật xử lý hình ảnh Việc truy cập nhanh vào các bộ sưu tập hình ảnh không lồ này và truy xuất các hình

ảnh tương tự của một hình ảnh nhất định (Truy vấn) từ bộ sưu tập hình ảnh khống lồ này đưa ra những thách thức lớn và đòi hỏi các thuật toán hiệu quả

Mục tiêu chính của hệ thông được đề xuất là cung cấp một kết quả chính xác với thời gian tính toán thấp hơn Với mục đích của chúng tôi, chúng tôi giới thiệu trong hệ thống truy xuất hình ảnh dựa trên nội dung (CBIR) bước phân loại và chúng tôi áp dụng kỹ thuật phân cụm k-nghĩa để khớp với các mô tả hình ảnh

Trang 13

Công việc này cung cấp một cái nhìn chỉ tiết về giải pháp mà chúng tôi đã áp dụng và đáp ứng hoàn hảo nhu cầu của chúng tôi Để xác thực, chúng tôi áp

dụng tất cả các kỹ thuật này trên hai cơ sở dữ liệu hình ảnh để đánh giá hiệu suất

của hệ thống của chúng tôi

Nhiều kỹ thuật xử lý hình ảnh kỹ thuật số, hay xử lý hình ảnh kỹ thuật số

như thường được gọi, đã được phát triển vào những năm 1960, tại Phòng thí nghiệm Bell, Phòng thí nghiệm Động cơ phản lực, Viện Công nghệ Massachusetts, Đại học Maryland và một vài cơ sở nghiên cứu khác, với ứng

dụng cho hình ảnh vệ tinh, chuyên đổi tiêu chuẩn ảnh dây, hình ảnh y tế, điện

thoại truyền hình, nhận dạng nhân vật và nâng cao hình ảnh [3| Mục đích của

việc xử lý hình ảnh sớm là để cải thiện chất lượng của hình ảnh Nó nhằm mục

đích cho con người để cải thiện hiệu ứng hình ảnh của con người Trong xử lý

hình ảnh, đầu vào là hình ảnh chất lượng thấp và đầu ra là hình ảnh có chất

lượng được cải thiện Xử lý hình ảnh phố biến bao gồm nâng cao hình ảnh, phục hồi, mã hóa và nén Ứng dụng thành công đầu tiên là Phòng thí nghiệm Động cơ phản lực Mỹ (JPL) Họ đã sử dụng các kỹ thuật xử lý hình ảnh như hiệu chỉnh

hình học, chuyển đôi màu, loại bỏ nhiễu, v.v trên hàng ngàn bức ảnh mặt trăng được gửi bởi Space dò Ranger 7 vào năm 1964, có tính đến vị trí của mặt trời và

môi trường của mặt trăng Tác động của việc lập bản đồ thành công bản đồ bề mặt của mặt trăng bằng máy tính là một thành công lớn Sau đó, giai đoạn xử lý

hình ảnh phức tạp hơn đã được thực hiện trên gần 100.000 bức ảnh được gửi lại bởi tàu vũ trụ, nhờ đó đã thu được bản đồ địa hình, bản đồ màu và khảm toàn cảnh mặt trăng, đạt được kết quả phi thường và đặt nên móng vững chắc cho con người hạ cánh mặt trăng

Tuy nhiên, chỉ phí xử lý khá cao với thiết bị điện toán thời đó Điều đó đã thay đôi vào những năm 1970, khi việc xử lý hình ảnh kỹ thuật số tăng sinh khi

các máy tính rẻ hơn và phần cứng chuyên dụng trở nên có sẵn Điều này dẫn đến

5

Trang 14

hình ảnh được xử lý trong thời gian thực, đối với một số vấn dé chuyên dụng như chuyên đôi tiêu chuẩn truyền hình Khi các máy tính đa năng trở nên nhanh hơn, chúng bắt đầu đảm nhận vai trò của phần cứng chuyên dụng cho tất cả các hoạt động ngoại trừ máy tính chuyên dụng và chuyên sâu nhất Với các máy tính nhanh và bộ xử lý tín hiệu có sẵn trong những năm 2000, xử lý hình ảnh kỹ

thuật số đã trở thành hình thức xử lý hình ảnh phô biến nhất và thường được sử

dụng vì đây không chỉ là phương pháp linh hoạt nhất mà còn rẻ nhất

ảnh có n chiêu Tại một vị trí bất kì nào đó của đối tượng mỗi điểm ảnh được coi

như đặc trưng cường độ sáng hay một dấu hiệu nào đó của đối tượng trong

không gian và nên nó có thé xem như một hàm n biến P(cl, c2, , cn)

Các giai đoạn xử lý ảnh có thể được mô tả bằng sơ đồ sau:

Trang 15

— Thu nhận -—> nỘI suy

Hình 1.2: Các giai đoạn xử lý ảnh chỉ tiết

1 Thu nhận ảnh: Là công đoạn đầu tiên quan trọng đối với một quá trình xử lý

ảnh Ảnh đầu vào được thu nhận qua các thiết bị là máy quét, camera, sensor,

vv tiếp sau đó các tín hiệu này sẽ được xử lý số hóa Một số thông số quan

trọng ở bước này là chất lượng màu, dung lượng bộ nhớ độ phân giải, và tốc độ

thu nhận ảnh của các thiết bị

2 Tiền xử lý: là bước mà ảnh sẽ được xử lý về độ tương phản,khử độ lệch, khử

nhiễu, khử bóng vv nhằm làm cho chất lượng ảnh trở nên tốt hơn các bộ lọc

sẽ thực hiện việc này

3 Phân đoạn ảnh: Ảnh sẽ được xử lý phân tích cho ra thành các phần tử có cùng đặc điểm giống nhau dựa vào biên hoặc vùng liên thông — cùng mức xám,

độ nhám, màu Kết quả của việc này nhằm đưa ra một mô tả khái quát của ảnh

thô có cầu tạo từ các phần tử không giống nhau Với đa số ứng dụng chỉ cần dùng vài đặc trưng nhất định trong khi đó lượng thông tin trong ảnh lại lớn, nên cần tôi giản lượng thông tin quá lớn đó Quá trình đó là trích chọn đặc tính chủ yêu à phân vùng ảnh

Trang 16

4 Biéu dién va mé ta hinh anh: Phan doan anh xong sé cho ta dit liéu pixel thé, gồm tập hợp các pixel của khu vực ảnh hoặc chức năng biên của một khu vực

ảnh đó Với cả hai trường hợp này thì nên chuyển đổi dữ liệu thô sang loại khác

phù hợp hơn để giúp máy tính xử lý Việc đầu tiên khi chuyển đổi là xác định

đại diện một khu vực ảnh là khu hoàn chin chứa các pixel của nó hay là một

ranh giới Biếu diễn ranh giới của một khu vực phù hợp cho ứng dụng chủ yếu liên quan đến các đặc điểm ngoài của các đối tượng, chăng hạn như các biến dạng trên ranh giới và các cạnh Các biểu diễn khu vực phù hợp với các ứng dụng dùng khai thác các thuộc tính bên trong đôi tượng, chăng hạn như hình ảnh hoặc cầu trúc khung xương của nó Một phần quan trọng trong việc đôi chuyển

đữ liệu hình ảnh thô thành định dạng phù hợp hợn cho việc xử lý là việc lựa chọn ảnh đại diện phù hợp cho khu vực hình ảnh Ngoài ra ta còn phải có một phương pháp mô tả các dữ liệu sẽ được chuyên đổi để cho các thuộc tính quan tâm được tô sáng và để xử lý chúng dễ dàng hơn

4 Nhận dạng và nội suy: Đây là bước cuối cùng trong quy trình xử lý ảnh Nhận dạng hình ảnh có thê được nhìn thấy đơn giản bang cach dan nhãn các đối tượng trong hình ảnh Nội suy là quá trình gắn ý nghĩa cho một tập hợp các đối tượng đã biết Hầu hết các ứng dụng đều chỉ đừng lại ở việc tiền xử lý Các chức năng như nội suy, nhận dạng hay chỉ xuất hiện trong phân tích hình ảnh tự động,

bán tự động, nhận dạng chữ viết tay, trích xuất thông tin tử hình ảnh

1.1.3 Một số khái niệm cơ bản

1.1.3.1 Điểm ảnh - Pixel

Hình ảnh thật là tập hợp hình ảnh liên tục của các giả trị không gian và độ sáng Nếu muốn xử lý hình ảnh bằng máy tính, hình ảnh cần phải được số hóa

Trang 17

Quá trình số hóa là việc người ta thu lay tín hiệu rời rạc từ tín hiệu liên tục thông

qua quá trình lây mẫu và định lượng các thành phần giá trị, về nguyên tắc, hai điểm liên kề sẽ không thể nhìn thấy bằng mắt thường Trong quá trình này, ta sử dụng khái niệm Pixel - là yếu tố Ảnh mà chúng ta quen thuộc Tập các Pixel sẽ

N§(Œ.y)) = N4((,y)) © {Œ+1,y+1), (x-1,y-1), (x+1,y-1), %-1,y+1))

- 4 láng giềng của (x,y) là một tập hợp bao gồm láng giềng ngang và dọc

của nó:

Trang 18

N4(Œ.y)) = {+1,y), (%-1,y), (x,y+1), (x.y-1)}

1.1.3.5 Vùng hiên thông

Nếu hai điểm (xa,yA) và (xs,yp) bất kỳ của R có thể được nối bởi một

đường (XA.Vp) (X¡:1;Yi+1) (X¡›Vi) (Xi-t,Vi-L), › (Xp,Vp), VỚI Cắc điểm (x;,y;) thudc

vao R va điểm (x¡y¡) bất kỳ nào kề sát với điểm trước (x¡,y;¡) và điểm tiếp theo (X:+1,yis1) tại đường đó Điểm (x,,y¡) được cho là kề với điểm (x¿,y¿) nếu

(xx,y,) thuộc vào lang giéng trực tiếp của (x¡y) thì vùng R sẽ được gọi là liên thông

1.1.3.6 Đối tượng ảnh

Mối quan hệ kết nối k trong E (k = 4,8) là một mối quan hệ tương đương

có một phản xạ, đối xứng và bắc cầu Mỗi một lớp tương đương là thành phân

kết nối k của hình ảnh Chúng ta sẽ gọi mỗi phần tử được kết nối k của hình ảnh

là một đối tượng hình ảnh

1.1.3.7 Chu tuyến ảnh

Chu tuyến ảnh là dãy các điểm P1, , Pn của đối tượng ảnh có Pi và Pi+l

(i=1, , n-1) 1a cdc 8-lang giêng của nhau và P1 là 8-láng giềng của Pn, Vi 3Q

không thuộc đối tượng ảnh và Q là 4- láng giềng của Pi (hay nói cách khác Vi

Trang 19

1.1.4 Các định dạng cơ bản trong xử ly anh

Định dạng tệp hình ảnh là phương tiện được chuân hóa đề tô chức và lưu trữ hình ảnh kỹ thuật số Định dạng tệp hình ảnh có thể lưu trữ đữ liệu ở định

dạng không nén, định dạng nén

e JPEG 2000 là một tiêu chuẩn nén cho phép lưu trữ cả mất mát và mất mát Các phương thức nén được sử dụng khác với các phương pháp trong JFIF / JPEG tiêu chuẩn; chúng cải thiện chất lượng và tỷ lệ nén, nhưng cũng đòi hỏi

sức mạnh tính toán nhiều hơn đề xử lý JPEG 2000 cũng bồ sung các tính năng

còn thiếu trong JPEG Nó gần như không phô biến như JPEG, nhưng hiện tại nó được sử dụng trong chỉnh sửa và phân phối phim chuyên nghiệp (ví dụ, một số rạp chiếu phim kỹ thuật số sử dụng JPEG 2000 cho từng khung phim riêng lẻ)

e GIF (Định dạng trao đổi đồ họa) được sử dụng bình thường giới hạn

trong bảng màu 8 bit hoặc 256 màu (trong khi độ sâu màu 24 bit là có thể về mặt

kỹ thuật) [1] [2] GIF thích hợp nhất để lưu trữ đồ họa với một vài màu, chang

hạn như sơ đồ, hình dạng, logo và hình ảnh theo phong cách hoạt hình đơn giản,

vì nó sử dụng nén không mất LZW, hiệu quả hơn khi các vùng lớn có một màu

duy nhất và ít hiệu quả hơn cho chụp ảnh hoặc hình ảnh hoà sắc Do tính đơn

giản và tudi tac cua GIF, né đã đạt được sự hỗ trợ phân mềm gần như toàn cầu

Do khả năng hoạt hình của nó, nó vẫn được sử dụng rộng rãi dé cung cấp hiệu ứng hoạt hình, mặc dù tỷ lệ nén thấp so VỚI các định dạng video hiện đại

e - Định dạng tệp BMP (Windows bitmap) xử lý các tệp đô họa trong Hệ

điều hành Microsoft Windows Thông thường, các tệp BMP không được nén, do

đó lớn và không mất đữ liệu; lợi thế của họ là cấu trúc đơn giản và sự chấp nhận

rộng rãi trong các chương trình Windows

li

Trang 20

1.2 DAC TRUNG ANH

1.2.1 Màu sắc

Một hình ảnh màu thường được lưu trữ trong bộ nhớ dưới dạng bản đồ

raster, một mảng hai chiều gồm các bộ ba số nguyên nhỏ; hoặc (hiếm khi) là ba

bản đồ raster riêng biệt, một cho mỗi kênh Các lớp hình ảnh R, G và B riêng

biệt Tám bit trên mỗi mẫu (24 bít mỗi pixel) có vẻ phù hợp với hầu hết các mục

đích sử dụng, nhưng các tạo phẩm dải mờ vẫn có thê nhìn thấy trong một số

hình ảnh thay đôi trơn tru, đặc biệt là những đối tượng cần xử lý Các ứng dụng đòi hỏi đặc biệt có thê sử dụng 10 bit cho mỗi mẫu trở lên Mặt khác, một số

định dạng tệp hình ảnh và card đồ họa được sử dụng rộng rãi chỉ có thê sử dụng

8 bit cho mỗi pixel, tức là chỉ có 256 màu khác nhau hoặc 2 bit3 trên mỗi kênh

Chuyển đổi hình ảnh tông màu liên tục như hình ảnh sang các định dạng như vậy đòi hỏi phải phối màu và mang lại kết quả khá nhiễu và mờ

1.2.1.1 Cac m6 hinh mau

Một của một tập hợp các màu đại diện bởi không gian màu, màu sắc

thường được xác định trong không gian màu 3 chiều Một số trong đó được sử dụng phô biến trong đồ họa máy tính

> M6 hinh RGB

Không gian màu RGB là không gian màu được sử dụng nhiều nhất cho đồ họa máy tính Trong đó R, G và B là viết tắt của các từ đỏ (Đỏ), xanh lục (Xanh lục) và xanh lam (Xanh lam) Đây là không gian màu cộng: đỏ, xanh lá cây và xanh dương được kết hợp để tạo ra các màu khác Không gian này không đồng nhất trong nhận thức Không gian màu RGB có thê được hiển thị đưới dạng khỗi lập phương, như được minh họa trong Hình 1.3

12

Trang 21

Hình 1.3: Không gian màu RGB được trực quan hoá như một hình khối

> Mỗi trục màu (R, G, B) đều quan trọng như nhau Do đó, mỗi trục nên

được định lượng với độ chính xác như nhau Khi không gian màu RGB được

định lượng, số lượng thùng sẽ luôn là một khối Thông thường, các thùng 8 (23),

64 (43), 216 (63), 512 (83) được sử dụng để định lượng không gian màu RGB

Chuyến đổi một hình ảnh RGB thành một hình anh thang độ xám nhận được

tổng của R, G và B và chia kết quả cho ba

> — Mô hình màu HSx

Các màu HSI, HSB, HSV, và HLS viết tắt là HSx, liên quan mật thiết với

các màu con người nhìn HŠx mô tả lại các đặc tính màu sắc, độ sang độ đậm Màu HSx được mô tả băng hình nón hoặc trụ, có các không gian khác nhau ở

việc thay đối 3 màu RGB Trong hình 1.4, không gian màu HSV có hình nón

13

Trang 22

Hinh 1.4: Mo ta khong gian mau HSV

Sắc thái là một phần của không gian màu HSx Màu sắc là góc giữa các đường tham chiếu và gốc trong không gian màu RGB Pham vi gia tri nam trong

khoảng từ 00 đến 3600 Theo clairage cua Uy ban Quốc tế, màu sắc là một thuộc tính của nhận thức cảm tính, theo đó một khu vực có vẻ tương tự với một màu

nhận biết như đỏ, xanh lá cây, xanh dương hoặc sự kết hợp của hai trong số các

màu được cảm nhận Ngoài ra theo độ bão hòa CIE là màu được đánh giá theo

tỷ lệ độ sáng của nó Trong một hình nón độ bão hòa là khoảng cách từ tâm đến cạnh hình nón Chiều cao của đường cắt là giá trị (giá trị) là độ sáng hoặc độ

chói của màu Khi độ bão hòa S bằng 0, H không xác định, giá trị trên trục V đại

diện cho hình ảnh màu xám Không gian màu HSV dễ dàng định lượng Mức

lượng tử hóa phố biến trong không gian màu này là 162 cấp độ với H nhận 18

cấp độ, S và V nhận được 3 cấp độ

14

Trang 23

> Không gian màu YUV va YIQ

Không gian màu YUV và YIQ được phát triển cho truyền hinh radio Không gian màu YIQ giống như không gian màu YUV, trong đó mặt phẳng I-Q

là mặt phăng quay 33 độ của mặt phăng U-V Tín hiệu Y đại điện cho độ chói của pixel và là kênh duy nhất được sử dụng trong TV đen trắng U và V cho

YUV và I và Q cho YIQ là các thành phần màu

> Khong gian mau CIE XYZ va LUV

Không gian màu đầu tiên là không gian màu XYZ được phát triển bởi CIE Gém có thành phần độ chói Y là tổng trọng số của R_ G và B X và Y là các thành phần màu Không gian màu XYZ là sự không đồng nhất về nhận thức

Trong lượng tử hóa không gian mau XYZ, méi trục được định lượng với cùng

độ chính xác

Không gian màu CIE LUV là một biến thể bức xạ của không gian màu XYZ duoc nhận thức đồng nhất Kênh L của không gian mau LUV là độ chói

của màu Các kênh U và V là các thành phần màu Vì vậy, khi U và V được đặt

thành 0, kênh L đại diện cho hình ảnh thang độ xám

Trong định lượng không gian LUV, mỗi trục được định lượng với cùng độ chính xác Đối với cả khong gian mau XYZ va LUV, cac so đồ định lượng

thường sử dụng thùng 8 (23), 27 (33), 64 (43), 125 (53)

15

Trang 24

1.2.1.2 Luoc đồ mâu

So do mau dugc xac dinh bang mot nhom cac bin, trong do moi bin biéu

thi xac suat cua cac pixel trong anh Mot so d6 mau H cua một ảnh đã cho được

xác định bởi véc tơ:

H={H[0], H[1], H[2], ., H[i], HIN]},

Có ¡ biểu diễn một màu trong sơ đồ màu và tương ứng với một khối con trong không gian màu RGB, HỊ7] là số các pixel có màu 7 trong ảnh, có N là số các bin trong lược đồ màu

Mỗi pixel trong ảnh sẽ thuộc về một bin của lược đồ màu của ảnh, nên đối

với lược đồ màu của một ảnh, giá trị của mỗi bin là số các pixel có cùng màu

Đề so sánh kích cỡ các ảnh, ta chuẩn hóa các lược đồ màu Lược đồ màu chuẩn hóa H” được xác định bằng:

H=‡H†0I, H11], HZ|, HH] H'ỊN|,

Ở đây A'[i] Xã , P là tổng số các pixel trong ảnh

Trong sơ đồ định lượng không gian màu lý tưởng, các màu riêng lẻ không năm trong cùng một khối và các màu tương tự được gán cho cùng một khối Sử dụng một số màu làm giảm khả năng các màu tương tự được gán cho các thùng khác nhau, nhưng cũng làm tăng khả năng các màu riêng lẻ được gán cho cùng

một thùng, nội dung thông tin của hình ảnh bị giảm Mặt khác, các bảng màu với

số lượng thùng lớn sẽ chứa nhiều thông tin hơn về nội dung của hình ảnh, do đó làm giảm khả năng các màu riêng lẻ sẽ được gan cho củng một thùng Tuy nhiên, chúng làm tăng khả năng các màu tương tự sẽ được gán cho các thùng

16

Trang 25

khác nhau và tăng không gian lưu trữ đề hiển thị hình ảnh và tính khoảng cách

giữa các bảng màu Do đó, cần có sự thỏa hiệp trong việc xác định số lượng thùng được sử dụng trong bảng màu

1.2.2 Kết cấu

Cấu trúc là một mô tả khu vực trợ giúp tốt trong quá trình tra cứu Kết cầu

không có khả năng tìm thay hình ảnh tương tự, nhưng nó có thé duoc str dung dé

phân loại hình ảnh kết cẫu từ hình ảnh không có cấu trúc và sau đó kết hợp với

các thuộc tính đặc trưng khác như màu sac dé tao ra chung để tra cứu hiệu quả hơn Một trong những đại diện phổ biến nhất của các tính năng cấu trúc là ma trận đồng khả năng được đề xuất bởi Haralick et al [3] Ma trận dựa trên hướng

và khoảng cách pixel Các số liệu thống kê từ ma trận đồng xác suất được trích xuất và biêu diễn đưới dạng thông tin câu trúc Tamura và cộng sự [2] đề xuất một phương pháp để trích xuất sáu thuộc tính cầu trúc đặc trưng coarseness,

contrast, directionality, likeliness, regularity and roughness

1.2.3 Hinh dang

Hình dạng được coI là một đặc trưng quan trọng trong việc mô tả các đối

tượng nỗi bật trong một ảnh và có thể giúp phân biệt giữa hai hình ảnh

Bước đầu tiên là sử dụng một phương pháp phân đoạn thích hợp để chia ảnh thành các vùng khác nhau Các kỹ thuật phân đoạn có thê được chia thành

ba loại: dựa vào vùng, dựa vào đường biên và dựa vào pixel Sau khi ảnh được phân đoạn và thu được các khu vực, các đặc trưng thuộc về các khu vực thu được sẽ được ghi lại Các mã xích [4] sử dụng 4 hoặc § liên thông dé biéu dién

các đoạn thăng tạo thành đường biên của vùng Dấu hiệu, số lượng các hình và

đa giác là các lược đô biêu diễn khác

17

Trang 26

Bước tiếp theo là sử dụng các mô tả phù hợp cho các khu vực này để có thể sử dụng chúng trong khi khớp các vùng của các hình ảnh khác nhau Mô tả

hình được chia thành ba loại: Mô tả ranh giới xác định các thuộc tính của ranh

giới Kỹ thuật ranh giới sử dụng phác thảo khu vực để tính toán số liệu Mô tả Fourier là một trong những phương pháp phô biến của loại này Trong kỹ thuật

này, các ranh giới của một khu vực nhất định được năm bắt và biến thành

Fourier [4] Các hệ số Fourier chiếm ưu thế được sử dụng làm mô tả hình Các

mô tả khác trong thể loai nay 1a torques [1]

Nếu một khu vực có hình dạng tổng hợp, nó có thể được chia thành các

hình đơn giản hơn như hình chữ nhật hoặc hình tròn và một số thuộc tính của

các hình đơn giản này và mối quan hệ của chúng có thê được sử dụng để mô tả

hình ảnh Mô tả khu vực khác bao gồm màu sắc và kết câu Một số đặc điểm của một khu vực, chang han như một tiêu điểm, không cụ thê đối với ranh giới hoặc nội dung của khu vực

1.3 TONG QUAN VE PHAN DOAN ANH

1.3.1 Phân đoạn anh

Ngày nay, với việc phát triển các thiết bị thu thập và đại diện hình ảnh, hình ảnh xám được thay thế hoàn toàn bởi hình ảnh màu vì sự hiệu quả của chúng Để màu của một pIxel được thê hiện bằng vectơ RGB a Gọi z là một

pixel lân cận của pixel a Chúng tôi nói rằng z tương tự như a nếu khoảng cách giữa chúng nhỏ hơn một ngưỡng xác định D0 Khoảng cách Euclide giữa z và a

được cho bởi:

18

Trang 27

f 2 2 211/2

trong đó, các chỉ số R, G và B biểu thị các thành phần RGB cua vecto a va Zz

Nếu D (z, a) D0 pixel z và a thuộc cùng phân đoạn màu Bắt đầu với một pixel tùy ý tại vị trí (r, c) một khu vực có thê được phát triển bằng cách kiểm tra hàng xóm gần nhất (8 - hàng xóm) của (r, c) từng người một và chấp nhận pixel lân cận thuộc cùng một vùng với (r, c) nêu khoảng cách giữa chúng nhỏ hon DO

Khi một pixel mới được chấp nhận là thành viên của hiện tại khu vực lân cận

gân nhất của pixel mới này được kiểm tra Quá trình này điễn ra đệ quy cho đến

khi không còn pixel nào được chấp nhận Tất cả các pIxel của khu vực hiện tại

được đánh dấu bằng một nhãn duy nhất Sau đó, một pixel không nhãn khác

được chọn và thủ tục tương tự được lặp lại Quét hình ảnh từ trái sang phải, từ

trên xuống dưới cùng chúng ta tiếp tục ghi nhãn các vùng cho đến khi mọi pixel

dugc gan cho mot sỐ vùng hoặc khác

1.3.2 Mục tiêu của phán đoạn ảnh

Mục tiêu của phân đoạn ảnh là để đơn giản hóa và hoặc thay đổi biểu diễn

của một tắm ảnh vào điều gì đó có ý nghĩa hơn và dễ dàng để phân tích[1] Phân

vùng ảnh thường được sử dụng để xác định vị trí các đối tượng, đường biên

(đường thắng, cong.vv) Hay nói cách khác phân vùng ảnh là một quá trình gán nhãn (assigning a lablel) cho mỗi điểm ảnh trong một bức ảnh, các điểm ảnh trong cùng một nhãn sẽ có những đặc tính giống nhau về màu sắc, cường độ

hoặc kết câu của ảnh

Kết quả của việc phân vùng ảnh là tập hợp các phân đoạn (segments) bao gồm có thể là toàn bộ bức ảnh hoặc tập hợp các đường biên chiết xuất từ

19

Trang 28

hinh anh Cac diém anh trong cùng một vùng có đặc tính tương tự nhau vê

màu sắc, cường độ hoặc kêt câu Các vùng lần cận thì khác nhau đáng kê về các đặc trưng trên

1.3.3 Một số kỹ thuật phân đoạn anh

Quá trình phân đoạn ảnh có thể được chia thành ba nhóm chính như sau:

° Phân đoạn ảnh dựa trên không gian đặc trưng

° Phân đoạn ảnh dựa trên các mô hình vật lý

°Ổ Phân đoạn ảnh dựa trên không gian ảnh

Các phương pháp dựa trên không gian đặc trưng

Quá trình phần vùng một hình ảnh kỹ thuật số thành nhiều phân đoạn được xác định là phân đoạn hình ảnh Phần đoạn nhằm mục đích phân chia một hình ảnh thành các khu vực có thể đại diện hơn và dễ phân tích hơn Các vùng

như vậy có thể tương ứng với các bề mặt riêng lẻ, các đối tượng hoặc các phần

tự nhiên của các đối tượng Thông thường phân đoạn hình ảnh là quá trình được

sử dụng để định vị các đối tượng và ranh giới (ví dụ: đường hoặc đường cong)

trong hình ảnh Hơn nữa, nó có thể được định nghĩa là quá trình ghi nhãn cho mỗi pixel trong ảnh, trong đó tất cả các pixel có cùng nhãn đều có chung một số

đặc điểm hình ảnh nhất định Thông thường phân đoạn sử dụng thông tin cục bộ

trong hình ảnh kỹ thuật số để tính toán phân đoạn tốt nhất, chẳng hạn như thông

tin màu được sử dụng để tạo biểu đồ hoặc thông tin chỉ ra các cạnh, ranh giới

hoặc thông tin kết cấu

20

Trang 29

Cac phuong phap dia trén khong gian anh

Có nhiều không gian màu khác nhau được đề xuất trong văn học, mỗi cái

có tính chất, ưu điểm riêng, hạn chế, và các lĩnh vực ứng dụng Công việc này

tập trung vào năm ví dụ phố biến, thường là được sử dụng trong các tác vụ xử lý

anh: RGB, HSV, L *a*b*,L*u* v *, va khong gian mau đối thủ Đề mà

đánh giá xem thông tin màu sắc có ý nghĩa tại tất cả, một đại diện hình ảnh thang độ xám đơn giản được bao gồm đưới dạng không gian màu sắc thứ sáu

Do tính đơn giản của nó, không gian màu RGB là nhất thường được sử dụng Nó

được thể hiện bằng màu đỏ (R), màu xanh lá cây (G) và màu xanh lam (B) Màu

cuối cùng là được xác định bởi sự kết hợp phụ gia của ba màu cơ bản đó Không

gian màu Hue, Saturatlon và Value (HSV) tách cường độ từ sắc độ và thê hiện chúng một cách độc lập Huế mô tả vị trí của màu trong 360° phô Độ bão hòa

mô tả độ tinh khiết của màu: nó đo sự khác biệt giữa màu và giá trị thang độ xám của cường độ bằng nhau Giá trị, là kênh thứ ba, là đo độ sáng Tùy thuộc vào các kỹ thuật mà các thuật toán này áp dụng, chúng được phân loại thành các

nhóm sau:

e Kỹ thuật chia vùng và chia

e Kỹ thuật tăng trưởng vùng

e Lý thuyết đồ thị

e Mang neural

Các phương pháp dựa trên mô hình vật lý

Giả định trung tâm của các phương pháp dựa trên mô hình là các cấu trúc quan tâm có xu hướng hướng tới một hình dạng cụ thể Do đó, người ta có thê

tìm kiếm một mô hình xác suất đặc trưng cho hình dạng và sự biến đôi của nó

Khi phân đoạn một hình ảnh, các ràng buộc có thể được áp dụng bang cach str

21

Trang 30

dung mô hình này như trước Một nhiệm vụ như vậy có thê liên quan đến đăng

ký các ví dụ đào tạo cho một tư thé chung, biéu dién xác suất của sự thay đôi

của các mẫu đã đăng ký và suy luận thông kê giữa mô hình và hình ảnh Các phương pháp quan trọng khác trong tài liệu cho phân đoạn dựa trên mô hình bao

gồm mô hình hình dạng hoạt động và mô hình xuất hiện hoạt động

1.4 KẾT LUẬN CHƯƠNG MỘT

Qua chương một ta đã tìm hiểu về tong quan xử lý ảnh cùng các khái niệm cơ bản trong xử lý ảnh và từ đó tìm hiệu về phân đoạn ảnh cùng một số kỹ thuật phân đoạn

22

Trang 31

Chuong 2

PHAN DOAN ANH THEO MO HINH TACH, GHEP VUNG

2.1 PHAN DOAN ANH THEO MO HINH GHEP VUNG

2.1.1 Ghép theo mau

Clustering là một kỹ thuật nhóm các điểm tương đồng như việc những điểm ở cùng một nhóm thì sẽ giống nhau hơn những điểm khác nhóm Những

điểm cùng một nhóm được gọi là một cluster Va Hierarchical clustering là việc

nhóm theo mô hình cây Kết tụ - Bottom up hoặc Phân chia - Top down

Phương pháp bottom-up, Trong kỹ thuật này, ban đầu mỗi điểm dữ liệu

được coI là một cụm riêng lẻ Ở mỗi lần lặp, các cụm tương tự hợp nhất với các cụm khác cho đến khi một cụm hoặc K cụm được hình thành

Thuật toán cơ bản của Agglomerative là thăng về phía trước:

e _ Đặt mỗi điểm dữ liệu là một cụm

Phân cụm phân cấp bottom-up được dùng nhiều hơn phương pháp /op- down do viéc dé ghép cac cum voi nhau hon so voi bottom-up

23

Ngày đăng: 28/11/2024, 21:21

TỪ KHÓA LIÊN QUAN

w