Một số kỹ thuật phân đoạn ảnh KẾT LUẬN CHƯƠNG MOT PHAN DOAN ANH THEO MO HINH TACH, GHEP VUNG PHAN DOAN ANH THEO MO HiINH GHEP VUNG Ghép theo mau Ghép theo biên PHAN ĐOẠN ẢNH THEO MÔ H
Trang 1: NGHIEN CUU PHUONG PHAP TRA CUU ANH DUA TREN s
Trang 2BO GIAO DUC VIEN HAN LAM KHOA HOC
HOC VIEN KHOA HOC VA CONG NGHE
Lé Manh Hiép
NGHIEN CUU PHUONG PHAP TRA CUU ANH DUA TREN
THUAT TOAN PHAN DOAN ANH
Chuyên ngành: Hệ thống thông tin
Mã số: 8480104
LUAN VAN THAC SI HE THONG THONG TIN
NGUOI HUGNG DAN KHOA HOC:
Hướng dẫn: NGÔ QUỐC TẠO
Hà Nội - 2020
Trang 3LOI CAM DOAN Tôi xin cam đoan bài luận văn này là sự nghiên cứu của bản thân (ngoài phần tham khảo đã được trích rõ) cùng với hướng dẫn của
PGS.TS Ngô Quốc Tạo Tôi xin chịu trách nhiệm hoàn toàn nếu Xảy Ta Sal
phạm
Tác giả luận văn
Lê Mạnh Hiệp
Trang 4LOI CAM ON Đầu tiên em xin gửi lời cảm ơn chân thành tới thầy giáo,
PGS TS Ngô Quốc Tạo, là người đã tận tình hướng dẫn, chỉ bảo em rất nhiều
trong quá trình tìm hiểu nghiên cứu và hoàn thành luận văn nay Từ đó đã giúp
em có thêm nhiều kiến thức về xử ly ảnh — một lĩnh vực mới đối với em Luận văn được sự hỗ trợ của nhiệm vụ cao cấp NVCC02.01/20-20 và đề tài “Nghiên
cứu cải tiến hiệu quả tra cứu ảnh thông qua học khoảng cách”, mã số VAST01.07/19-20
Đồng thời, em xin chân thành cám ơn các thầy cô tại Học viện Khoa học và Công nghệ, Viện hàn lâm Khoa học và Công nghệ Việt Nam đã trang bị cho em
những kiến thức cơ bản cần thiết trong suốt thời gian học tập tại trường để em hoàn thành tốt luận văn này
Trong quá trình học cũng như trong suốt thời gian làm luận văn tốt nghiệp không tránh khỏi những thiếu sót, em rất mong được sự góp ý quý báu của các thầy cô cũng như tất cả các bạn để kết quả của em được hoàn thiện hơn
Sau cùng, em xin gửi lời cảm ơn đến gia đình, bạn bè đã tạo mọi điều kiện
để em xây dựng thành công luận văn này
Em xIn chân thành cảm ơn!
Trang 5DANH SACH CAC TU VIET TAT
7 HSL Hue-Saturation-Luminance
Trang 6
DANH MUC BANG
Bảng 3.2 Bảng cơ sở đữ liệu Image 48 Bảng 3.3 Bảng cơ sở đữ liệu Cluster 49
Trang 7
DANH MUC HINH ANH
Hinh 1.1 Các giai đoạn xử lý anh 6
Hình 1.3 Không gian màu RGB được trực quan hoá như một hình 13
khôi Hình 1.4 Mô tả không gian màu HSŠV 14 Hình 2.1 Biểu diễn phan cum phan cap bottom-up cua 5 đối 24
BR2,2
Hinh 3.2 Giao dién form CBC sau khi open anh 4] Hinh 3.3 Giao dién form chon nguéng CBC 41
Hinh 3.6 Giao dién form K-Means open anh 42 Hinh 3.7 Một số keeta quả phan đoạn theo K-Means 43
Trang 8
Hình 3.1] Kiến trúc tông quát của hệ thống tra cứu ảnh 46
Hình 3.12 | Giao diện chính hệ thống tra cứu ảnh 48
Hình 3.13 Mỗi quan hệ giữa các bảng 49
Trang 9
Chuong1: | TONG QUAN VE PHAN DOAN ANH
1.1 MOT SO KHAI NIEM VE XU LY ANH
1.1.1 Giới thiệu
1.1.2 Cac giai đoạn xử lý ảnh
1.1.3 Một số khái niệm cơ bản
113.1 Diém anh - Pixel
1.3.2 Muc tiéu anh phan doan anh
Trang 10Một số kỹ thuật phân đoạn ảnh
KẾT LUẬN CHƯƠNG MOT
PHAN DOAN ANH THEO MO HINH TACH, GHEP VUNG
PHAN DOAN ANH THEO MO HiINH GHEP VUNG
Ghép theo mau Ghép theo biên
PHAN ĐOẠN ẢNH THEO MÔ HÌNH TÁCH VÙNG
Tách theo màu
Tách theo vùng đồng nhất
SO SÁNH THUẬT TOÁN K MEAN VỚI CBC KẾT LUẬN CHƯƠNG HAI
ỨNG DỤNG PHẦN ĐOẠN ẢNH TRONG TRA CỨU
ẢNH DỰA TREN CAC PHUONG PHAP PHAN
DOAN ANH
PHAN TICH BAI TOAN KET QUA DAT ĐƯỢC ĐÁNH GIÁ HIEU QUA PHAN DOAN
UNG DUNG PHAN DOAN CBC VAO TRA CUU ANH
Trang 11MO DAU
Cùng với xu hướng phát triển của các phương tiện truyền thông, các phương tiện lưu trữ hình ảnh, kích thước của các tập ảnh số được gia tăng một
cách chóng mặt Hiệu quả của các công cụ tìm kiếm, tra cứu ảnh được yêu cầu
từ rất nhiều lĩnh vực khác nhau gồm: trinh sát, thời trang, phòng chống tội phạm Cùng chung mục đích này, rất nhiều các hệ thống tra cứu ảnh đã được phát triển Có hai nên tảng là: dựa trên văn bản (text-based) và dựa trên nội dung (content-based)
Bài viết này đã trình bày một kỹ thuật lập chỉ mục màu không gian hiệu quả được thiết kế sử dụng phương pháp phân khúc Kỹ thuật này có tính chất
của dịch thuật, xoay và nhân rộng bất biến Việc thu hồi được chấp nhận để xuất
hiện đáng kế thay đổi và cung cấp các cơ sở của màu sắc phù hợp gián tiếp
Hiệu suất truy xuất của kỹ thuật cũng đã được thiết lập để vượt trội so với cho
các đối tác khác của nó
Luận văn sẽ trình bày kỹ thuật phản hồi liên quan được ứng dụng trong tra
cứu ảnh dựa trên nội dung để thu hẹp khoảng cách ngữ nghĩa, cải thiện hiệu
năng tra cứu Báo cáo được chia làm 3 chương:
Chương 1: Tổng quan về phân đoạn ảnh
Giới thiệu các khái niệm cơ bản về hệ thông tra cứu ảnh dựa trên phân đoạn ảnh
Chương 2: Phân đoạn ảnh theo mô hình tách ghép vùng Giới thiệu các phương pháp phản hồi liên quan và máy học
Chương 3: Áp dụng cài đặt thử nghiệm
Cài đặt chương trình thử nghiệm dựa trên lý thuyết từ chương 1 và chương 2
Trang 12Chuong 1
TONG QUAN VE PHAN DOAN ANH
Xu ly anh ngay nay da tro thanh mot nganh khoa hoc lon, da co mat trong nhiễu lĩnh vực của cuộc séng Dieu này chúng ta có thể diễn giải được
từ một định nghĩa đơn giản vé ngành khoa học này: Xử lý ảnh là ngành khoa học nghiên cứu các giai đoạn xứ lý thông tin dạng hình ảnh, mà hình ảnh là một trong những dạng thông tin phong phú nhất đối với chúng ta Bước quan trọng nhất và cũng là khó khăn nhất trong giai đoạn xử lý ảnh là bước phân
đoạn ảnh Phán đoạn là việc phán tách các đối tuong cẩu thành nên ảnh thô
từ đó có thể sử dụng cho các ứng dụng sau này
1.1 MOT SO KHAI NIEM VE XU LY ANH
1.1.1 Giới thiệu
Thế giới kỹ thuật số là kỹ thuật số với sự xuất hiện của nhiều thiết bị
được sử dụng trong việc thu nhận hình ảnh Ngày nay, việc lưu trữ số lượng lớn hình ảnh trở nên dễ dàng bằng cách sử dụng các kỹ thuật xử lý hình ảnh Việc truy cập nhanh vào các bộ sưu tập hình ảnh không lồ này và truy xuất các hình
ảnh tương tự của một hình ảnh nhất định (Truy vấn) từ bộ sưu tập hình ảnh khống lồ này đưa ra những thách thức lớn và đòi hỏi các thuật toán hiệu quả
Mục tiêu chính của hệ thông được đề xuất là cung cấp một kết quả chính xác với thời gian tính toán thấp hơn Với mục đích của chúng tôi, chúng tôi giới thiệu trong hệ thống truy xuất hình ảnh dựa trên nội dung (CBIR) bước phân loại và chúng tôi áp dụng kỹ thuật phân cụm k-nghĩa để khớp với các mô tả hình ảnh
Trang 13Công việc này cung cấp một cái nhìn chỉ tiết về giải pháp mà chúng tôi đã áp dụng và đáp ứng hoàn hảo nhu cầu của chúng tôi Để xác thực, chúng tôi áp
dụng tất cả các kỹ thuật này trên hai cơ sở dữ liệu hình ảnh để đánh giá hiệu suất
của hệ thống của chúng tôi
Nhiều kỹ thuật xử lý hình ảnh kỹ thuật số, hay xử lý hình ảnh kỹ thuật số
như thường được gọi, đã được phát triển vào những năm 1960, tại Phòng thí nghiệm Bell, Phòng thí nghiệm Động cơ phản lực, Viện Công nghệ Massachusetts, Đại học Maryland và một vài cơ sở nghiên cứu khác, với ứng
dụng cho hình ảnh vệ tinh, chuyên đổi tiêu chuẩn ảnh dây, hình ảnh y tế, điện
thoại truyền hình, nhận dạng nhân vật và nâng cao hình ảnh [3| Mục đích của
việc xử lý hình ảnh sớm là để cải thiện chất lượng của hình ảnh Nó nhằm mục
đích cho con người để cải thiện hiệu ứng hình ảnh của con người Trong xử lý
hình ảnh, đầu vào là hình ảnh chất lượng thấp và đầu ra là hình ảnh có chất
lượng được cải thiện Xử lý hình ảnh phố biến bao gồm nâng cao hình ảnh, phục hồi, mã hóa và nén Ứng dụng thành công đầu tiên là Phòng thí nghiệm Động cơ phản lực Mỹ (JPL) Họ đã sử dụng các kỹ thuật xử lý hình ảnh như hiệu chỉnh
hình học, chuyển đôi màu, loại bỏ nhiễu, v.v trên hàng ngàn bức ảnh mặt trăng được gửi bởi Space dò Ranger 7 vào năm 1964, có tính đến vị trí của mặt trời và
môi trường của mặt trăng Tác động của việc lập bản đồ thành công bản đồ bề mặt của mặt trăng bằng máy tính là một thành công lớn Sau đó, giai đoạn xử lý
hình ảnh phức tạp hơn đã được thực hiện trên gần 100.000 bức ảnh được gửi lại bởi tàu vũ trụ, nhờ đó đã thu được bản đồ địa hình, bản đồ màu và khảm toàn cảnh mặt trăng, đạt được kết quả phi thường và đặt nên móng vững chắc cho con người hạ cánh mặt trăng
Tuy nhiên, chỉ phí xử lý khá cao với thiết bị điện toán thời đó Điều đó đã thay đôi vào những năm 1970, khi việc xử lý hình ảnh kỹ thuật số tăng sinh khi
các máy tính rẻ hơn và phần cứng chuyên dụng trở nên có sẵn Điều này dẫn đến
5
Trang 14hình ảnh được xử lý trong thời gian thực, đối với một số vấn dé chuyên dụng như chuyên đôi tiêu chuẩn truyền hình Khi các máy tính đa năng trở nên nhanh hơn, chúng bắt đầu đảm nhận vai trò của phần cứng chuyên dụng cho tất cả các hoạt động ngoại trừ máy tính chuyên dụng và chuyên sâu nhất Với các máy tính nhanh và bộ xử lý tín hiệu có sẵn trong những năm 2000, xử lý hình ảnh kỹ
thuật số đã trở thành hình thức xử lý hình ảnh phô biến nhất và thường được sử
dụng vì đây không chỉ là phương pháp linh hoạt nhất mà còn rẻ nhất
ảnh có n chiêu Tại một vị trí bất kì nào đó của đối tượng mỗi điểm ảnh được coi
như đặc trưng cường độ sáng hay một dấu hiệu nào đó của đối tượng trong
không gian và nên nó có thé xem như một hàm n biến P(cl, c2, , cn)
Các giai đoạn xử lý ảnh có thể được mô tả bằng sơ đồ sau:
Trang 15
— Thu nhận -—> nỘI suy
Hình 1.2: Các giai đoạn xử lý ảnh chỉ tiết
1 Thu nhận ảnh: Là công đoạn đầu tiên quan trọng đối với một quá trình xử lý
ảnh Ảnh đầu vào được thu nhận qua các thiết bị là máy quét, camera, sensor,
vv tiếp sau đó các tín hiệu này sẽ được xử lý số hóa Một số thông số quan
trọng ở bước này là chất lượng màu, dung lượng bộ nhớ độ phân giải, và tốc độ
thu nhận ảnh của các thiết bị
2 Tiền xử lý: là bước mà ảnh sẽ được xử lý về độ tương phản,khử độ lệch, khử
nhiễu, khử bóng vv nhằm làm cho chất lượng ảnh trở nên tốt hơn các bộ lọc
sẽ thực hiện việc này
3 Phân đoạn ảnh: Ảnh sẽ được xử lý phân tích cho ra thành các phần tử có cùng đặc điểm giống nhau dựa vào biên hoặc vùng liên thông — cùng mức xám,
độ nhám, màu Kết quả của việc này nhằm đưa ra một mô tả khái quát của ảnh
thô có cầu tạo từ các phần tử không giống nhau Với đa số ứng dụng chỉ cần dùng vài đặc trưng nhất định trong khi đó lượng thông tin trong ảnh lại lớn, nên cần tôi giản lượng thông tin quá lớn đó Quá trình đó là trích chọn đặc tính chủ yêu à phân vùng ảnh
Trang 164 Biéu dién va mé ta hinh anh: Phan doan anh xong sé cho ta dit liéu pixel thé, gồm tập hợp các pixel của khu vực ảnh hoặc chức năng biên của một khu vực
ảnh đó Với cả hai trường hợp này thì nên chuyển đổi dữ liệu thô sang loại khác
phù hợp hơn để giúp máy tính xử lý Việc đầu tiên khi chuyển đổi là xác định
đại diện một khu vực ảnh là khu hoàn chin chứa các pixel của nó hay là một
ranh giới Biếu diễn ranh giới của một khu vực phù hợp cho ứng dụng chủ yếu liên quan đến các đặc điểm ngoài của các đối tượng, chăng hạn như các biến dạng trên ranh giới và các cạnh Các biểu diễn khu vực phù hợp với các ứng dụng dùng khai thác các thuộc tính bên trong đôi tượng, chăng hạn như hình ảnh hoặc cầu trúc khung xương của nó Một phần quan trọng trong việc đôi chuyển
đữ liệu hình ảnh thô thành định dạng phù hợp hợn cho việc xử lý là việc lựa chọn ảnh đại diện phù hợp cho khu vực hình ảnh Ngoài ra ta còn phải có một phương pháp mô tả các dữ liệu sẽ được chuyên đổi để cho các thuộc tính quan tâm được tô sáng và để xử lý chúng dễ dàng hơn
4 Nhận dạng và nội suy: Đây là bước cuối cùng trong quy trình xử lý ảnh Nhận dạng hình ảnh có thê được nhìn thấy đơn giản bang cach dan nhãn các đối tượng trong hình ảnh Nội suy là quá trình gắn ý nghĩa cho một tập hợp các đối tượng đã biết Hầu hết các ứng dụng đều chỉ đừng lại ở việc tiền xử lý Các chức năng như nội suy, nhận dạng hay chỉ xuất hiện trong phân tích hình ảnh tự động,
bán tự động, nhận dạng chữ viết tay, trích xuất thông tin tử hình ảnh
1.1.3 Một số khái niệm cơ bản
1.1.3.1 Điểm ảnh - Pixel
Hình ảnh thật là tập hợp hình ảnh liên tục của các giả trị không gian và độ sáng Nếu muốn xử lý hình ảnh bằng máy tính, hình ảnh cần phải được số hóa
Trang 17Quá trình số hóa là việc người ta thu lay tín hiệu rời rạc từ tín hiệu liên tục thông
qua quá trình lây mẫu và định lượng các thành phần giá trị, về nguyên tắc, hai điểm liên kề sẽ không thể nhìn thấy bằng mắt thường Trong quá trình này, ta sử dụng khái niệm Pixel - là yếu tố Ảnh mà chúng ta quen thuộc Tập các Pixel sẽ
N§(Œ.y)) = N4((,y)) © {Œ+1,y+1), (x-1,y-1), (x+1,y-1), %-1,y+1))
- 4 láng giềng của (x,y) là một tập hợp bao gồm láng giềng ngang và dọc
của nó:
Trang 18N4(Œ.y)) = {+1,y), (%-1,y), (x,y+1), (x.y-1)}
1.1.3.5 Vùng hiên thông
Nếu hai điểm (xa,yA) và (xs,yp) bất kỳ của R có thể được nối bởi một
đường (XA.Vp) (X¡:1;Yi+1) (X¡›Vi) (Xi-t,Vi-L), › (Xp,Vp), VỚI Cắc điểm (x;,y;) thudc
vao R va điểm (x¡y¡) bất kỳ nào kề sát với điểm trước (x¡,y;¡) và điểm tiếp theo (X:+1,yis1) tại đường đó Điểm (x,,y¡) được cho là kề với điểm (x¿,y¿) nếu
(xx,y,) thuộc vào lang giéng trực tiếp của (x¡y) thì vùng R sẽ được gọi là liên thông
1.1.3.6 Đối tượng ảnh
Mối quan hệ kết nối k trong E (k = 4,8) là một mối quan hệ tương đương
có một phản xạ, đối xứng và bắc cầu Mỗi một lớp tương đương là thành phân
kết nối k của hình ảnh Chúng ta sẽ gọi mỗi phần tử được kết nối k của hình ảnh
là một đối tượng hình ảnh
1.1.3.7 Chu tuyến ảnh
Chu tuyến ảnh là dãy các điểm P1, , Pn của đối tượng ảnh có Pi và Pi+l
(i=1, , n-1) 1a cdc 8-lang giêng của nhau và P1 là 8-láng giềng của Pn, Vi 3Q
không thuộc đối tượng ảnh và Q là 4- láng giềng của Pi (hay nói cách khác Vi
Trang 191.1.4 Các định dạng cơ bản trong xử ly anh
Định dạng tệp hình ảnh là phương tiện được chuân hóa đề tô chức và lưu trữ hình ảnh kỹ thuật số Định dạng tệp hình ảnh có thể lưu trữ đữ liệu ở định
dạng không nén, định dạng nén
e JPEG 2000 là một tiêu chuẩn nén cho phép lưu trữ cả mất mát và mất mát Các phương thức nén được sử dụng khác với các phương pháp trong JFIF / JPEG tiêu chuẩn; chúng cải thiện chất lượng và tỷ lệ nén, nhưng cũng đòi hỏi
sức mạnh tính toán nhiều hơn đề xử lý JPEG 2000 cũng bồ sung các tính năng
còn thiếu trong JPEG Nó gần như không phô biến như JPEG, nhưng hiện tại nó được sử dụng trong chỉnh sửa và phân phối phim chuyên nghiệp (ví dụ, một số rạp chiếu phim kỹ thuật số sử dụng JPEG 2000 cho từng khung phim riêng lẻ)
e GIF (Định dạng trao đổi đồ họa) được sử dụng bình thường giới hạn
trong bảng màu 8 bit hoặc 256 màu (trong khi độ sâu màu 24 bit là có thể về mặt
kỹ thuật) [1] [2] GIF thích hợp nhất để lưu trữ đồ họa với một vài màu, chang
hạn như sơ đồ, hình dạng, logo và hình ảnh theo phong cách hoạt hình đơn giản,
vì nó sử dụng nén không mất LZW, hiệu quả hơn khi các vùng lớn có một màu
duy nhất và ít hiệu quả hơn cho chụp ảnh hoặc hình ảnh hoà sắc Do tính đơn
giản và tudi tac cua GIF, né đã đạt được sự hỗ trợ phân mềm gần như toàn cầu
Do khả năng hoạt hình của nó, nó vẫn được sử dụng rộng rãi dé cung cấp hiệu ứng hoạt hình, mặc dù tỷ lệ nén thấp so VỚI các định dạng video hiện đại
e - Định dạng tệp BMP (Windows bitmap) xử lý các tệp đô họa trong Hệ
điều hành Microsoft Windows Thông thường, các tệp BMP không được nén, do
đó lớn và không mất đữ liệu; lợi thế của họ là cấu trúc đơn giản và sự chấp nhận
rộng rãi trong các chương trình Windows
li
Trang 201.2 DAC TRUNG ANH
1.2.1 Màu sắc
Một hình ảnh màu thường được lưu trữ trong bộ nhớ dưới dạng bản đồ
raster, một mảng hai chiều gồm các bộ ba số nguyên nhỏ; hoặc (hiếm khi) là ba
bản đồ raster riêng biệt, một cho mỗi kênh Các lớp hình ảnh R, G và B riêng
biệt Tám bit trên mỗi mẫu (24 bít mỗi pixel) có vẻ phù hợp với hầu hết các mục
đích sử dụng, nhưng các tạo phẩm dải mờ vẫn có thê nhìn thấy trong một số
hình ảnh thay đôi trơn tru, đặc biệt là những đối tượng cần xử lý Các ứng dụng đòi hỏi đặc biệt có thê sử dụng 10 bit cho mỗi mẫu trở lên Mặt khác, một số
định dạng tệp hình ảnh và card đồ họa được sử dụng rộng rãi chỉ có thê sử dụng
8 bit cho mỗi pixel, tức là chỉ có 256 màu khác nhau hoặc 2 bit3 trên mỗi kênh
Chuyển đổi hình ảnh tông màu liên tục như hình ảnh sang các định dạng như vậy đòi hỏi phải phối màu và mang lại kết quả khá nhiễu và mờ
1.2.1.1 Cac m6 hinh mau
Một của một tập hợp các màu đại diện bởi không gian màu, màu sắc
thường được xác định trong không gian màu 3 chiều Một số trong đó được sử dụng phô biến trong đồ họa máy tính
> M6 hinh RGB
Không gian màu RGB là không gian màu được sử dụng nhiều nhất cho đồ họa máy tính Trong đó R, G và B là viết tắt của các từ đỏ (Đỏ), xanh lục (Xanh lục) và xanh lam (Xanh lam) Đây là không gian màu cộng: đỏ, xanh lá cây và xanh dương được kết hợp để tạo ra các màu khác Không gian này không đồng nhất trong nhận thức Không gian màu RGB có thê được hiển thị đưới dạng khỗi lập phương, như được minh họa trong Hình 1.3
12
Trang 21Hình 1.3: Không gian màu RGB được trực quan hoá như một hình khối
> Mỗi trục màu (R, G, B) đều quan trọng như nhau Do đó, mỗi trục nên
được định lượng với độ chính xác như nhau Khi không gian màu RGB được
định lượng, số lượng thùng sẽ luôn là một khối Thông thường, các thùng 8 (23),
64 (43), 216 (63), 512 (83) được sử dụng để định lượng không gian màu RGB
Chuyến đổi một hình ảnh RGB thành một hình anh thang độ xám nhận được
tổng của R, G và B và chia kết quả cho ba
> — Mô hình màu HSx
Các màu HSI, HSB, HSV, và HLS viết tắt là HSx, liên quan mật thiết với
các màu con người nhìn HŠx mô tả lại các đặc tính màu sắc, độ sang độ đậm Màu HSx được mô tả băng hình nón hoặc trụ, có các không gian khác nhau ở
việc thay đối 3 màu RGB Trong hình 1.4, không gian màu HSV có hình nón
13
Trang 22
Hinh 1.4: Mo ta khong gian mau HSV
Sắc thái là một phần của không gian màu HSx Màu sắc là góc giữa các đường tham chiếu và gốc trong không gian màu RGB Pham vi gia tri nam trong
khoảng từ 00 đến 3600 Theo clairage cua Uy ban Quốc tế, màu sắc là một thuộc tính của nhận thức cảm tính, theo đó một khu vực có vẻ tương tự với một màu
nhận biết như đỏ, xanh lá cây, xanh dương hoặc sự kết hợp của hai trong số các
màu được cảm nhận Ngoài ra theo độ bão hòa CIE là màu được đánh giá theo
tỷ lệ độ sáng của nó Trong một hình nón độ bão hòa là khoảng cách từ tâm đến cạnh hình nón Chiều cao của đường cắt là giá trị (giá trị) là độ sáng hoặc độ
chói của màu Khi độ bão hòa S bằng 0, H không xác định, giá trị trên trục V đại
diện cho hình ảnh màu xám Không gian màu HSV dễ dàng định lượng Mức
lượng tử hóa phố biến trong không gian màu này là 162 cấp độ với H nhận 18
cấp độ, S và V nhận được 3 cấp độ
14
Trang 23> Không gian màu YUV va YIQ
Không gian màu YUV và YIQ được phát triển cho truyền hinh radio Không gian màu YIQ giống như không gian màu YUV, trong đó mặt phẳng I-Q
là mặt phăng quay 33 độ của mặt phăng U-V Tín hiệu Y đại điện cho độ chói của pixel và là kênh duy nhất được sử dụng trong TV đen trắng U và V cho
YUV và I và Q cho YIQ là các thành phần màu
> Khong gian mau CIE XYZ va LUV
Không gian màu đầu tiên là không gian màu XYZ được phát triển bởi CIE Gém có thành phần độ chói Y là tổng trọng số của R_ G và B X và Y là các thành phần màu Không gian màu XYZ là sự không đồng nhất về nhận thức
Trong lượng tử hóa không gian mau XYZ, méi trục được định lượng với cùng
độ chính xác
Không gian màu CIE LUV là một biến thể bức xạ của không gian màu XYZ duoc nhận thức đồng nhất Kênh L của không gian mau LUV là độ chói
của màu Các kênh U và V là các thành phần màu Vì vậy, khi U và V được đặt
thành 0, kênh L đại diện cho hình ảnh thang độ xám
Trong định lượng không gian LUV, mỗi trục được định lượng với cùng độ chính xác Đối với cả khong gian mau XYZ va LUV, cac so đồ định lượng
thường sử dụng thùng 8 (23), 27 (33), 64 (43), 125 (53)
15
Trang 241.2.1.2 Luoc đồ mâu
So do mau dugc xac dinh bang mot nhom cac bin, trong do moi bin biéu
thi xac suat cua cac pixel trong anh Mot so d6 mau H cua một ảnh đã cho được
xác định bởi véc tơ:
H={H[0], H[1], H[2], ., H[i], HIN]},
Có ¡ biểu diễn một màu trong sơ đồ màu và tương ứng với một khối con trong không gian màu RGB, HỊ7] là số các pixel có màu 7 trong ảnh, có N là số các bin trong lược đồ màu
Mỗi pixel trong ảnh sẽ thuộc về một bin của lược đồ màu của ảnh, nên đối
với lược đồ màu của một ảnh, giá trị của mỗi bin là số các pixel có cùng màu
Đề so sánh kích cỡ các ảnh, ta chuẩn hóa các lược đồ màu Lược đồ màu chuẩn hóa H” được xác định bằng:
H=‡H†0I, H11], HZ|, HH] H'ỊN|,
Ở đây A'[i] Xã , P là tổng số các pixel trong ảnh
Trong sơ đồ định lượng không gian màu lý tưởng, các màu riêng lẻ không năm trong cùng một khối và các màu tương tự được gán cho cùng một khối Sử dụng một số màu làm giảm khả năng các màu tương tự được gán cho các thùng khác nhau, nhưng cũng làm tăng khả năng các màu riêng lẻ được gán cho cùng
một thùng, nội dung thông tin của hình ảnh bị giảm Mặt khác, các bảng màu với
số lượng thùng lớn sẽ chứa nhiều thông tin hơn về nội dung của hình ảnh, do đó làm giảm khả năng các màu riêng lẻ sẽ được gan cho củng một thùng Tuy nhiên, chúng làm tăng khả năng các màu tương tự sẽ được gán cho các thùng
16
Trang 25khác nhau và tăng không gian lưu trữ đề hiển thị hình ảnh và tính khoảng cách
giữa các bảng màu Do đó, cần có sự thỏa hiệp trong việc xác định số lượng thùng được sử dụng trong bảng màu
1.2.2 Kết cấu
Cấu trúc là một mô tả khu vực trợ giúp tốt trong quá trình tra cứu Kết cầu
không có khả năng tìm thay hình ảnh tương tự, nhưng nó có thé duoc str dung dé
phân loại hình ảnh kết cẫu từ hình ảnh không có cấu trúc và sau đó kết hợp với
các thuộc tính đặc trưng khác như màu sac dé tao ra chung để tra cứu hiệu quả hơn Một trong những đại diện phổ biến nhất của các tính năng cấu trúc là ma trận đồng khả năng được đề xuất bởi Haralick et al [3] Ma trận dựa trên hướng
và khoảng cách pixel Các số liệu thống kê từ ma trận đồng xác suất được trích xuất và biêu diễn đưới dạng thông tin câu trúc Tamura và cộng sự [2] đề xuất một phương pháp để trích xuất sáu thuộc tính cầu trúc đặc trưng coarseness,
contrast, directionality, likeliness, regularity and roughness
1.2.3 Hinh dang
Hình dạng được coI là một đặc trưng quan trọng trong việc mô tả các đối
tượng nỗi bật trong một ảnh và có thể giúp phân biệt giữa hai hình ảnh
Bước đầu tiên là sử dụng một phương pháp phân đoạn thích hợp để chia ảnh thành các vùng khác nhau Các kỹ thuật phân đoạn có thê được chia thành
ba loại: dựa vào vùng, dựa vào đường biên và dựa vào pixel Sau khi ảnh được phân đoạn và thu được các khu vực, các đặc trưng thuộc về các khu vực thu được sẽ được ghi lại Các mã xích [4] sử dụng 4 hoặc § liên thông dé biéu dién
các đoạn thăng tạo thành đường biên của vùng Dấu hiệu, số lượng các hình và
đa giác là các lược đô biêu diễn khác
17
Trang 26Bước tiếp theo là sử dụng các mô tả phù hợp cho các khu vực này để có thể sử dụng chúng trong khi khớp các vùng của các hình ảnh khác nhau Mô tả
hình được chia thành ba loại: Mô tả ranh giới xác định các thuộc tính của ranh
giới Kỹ thuật ranh giới sử dụng phác thảo khu vực để tính toán số liệu Mô tả Fourier là một trong những phương pháp phô biến của loại này Trong kỹ thuật
này, các ranh giới của một khu vực nhất định được năm bắt và biến thành
Fourier [4] Các hệ số Fourier chiếm ưu thế được sử dụng làm mô tả hình Các
mô tả khác trong thể loai nay 1a torques [1]
Nếu một khu vực có hình dạng tổng hợp, nó có thể được chia thành các
hình đơn giản hơn như hình chữ nhật hoặc hình tròn và một số thuộc tính của
các hình đơn giản này và mối quan hệ của chúng có thê được sử dụng để mô tả
hình ảnh Mô tả khu vực khác bao gồm màu sắc và kết câu Một số đặc điểm của một khu vực, chang han như một tiêu điểm, không cụ thê đối với ranh giới hoặc nội dung của khu vực
1.3 TONG QUAN VE PHAN DOAN ANH
1.3.1 Phân đoạn anh
Ngày nay, với việc phát triển các thiết bị thu thập và đại diện hình ảnh, hình ảnh xám được thay thế hoàn toàn bởi hình ảnh màu vì sự hiệu quả của chúng Để màu của một pIxel được thê hiện bằng vectơ RGB a Gọi z là một
pixel lân cận của pixel a Chúng tôi nói rằng z tương tự như a nếu khoảng cách giữa chúng nhỏ hơn một ngưỡng xác định D0 Khoảng cách Euclide giữa z và a
được cho bởi:
18
Trang 27f 2 2 211/2
trong đó, các chỉ số R, G và B biểu thị các thành phần RGB cua vecto a va Zz
Nếu D (z, a) D0 pixel z và a thuộc cùng phân đoạn màu Bắt đầu với một pixel tùy ý tại vị trí (r, c) một khu vực có thê được phát triển bằng cách kiểm tra hàng xóm gần nhất (8 - hàng xóm) của (r, c) từng người một và chấp nhận pixel lân cận thuộc cùng một vùng với (r, c) nêu khoảng cách giữa chúng nhỏ hon DO
Khi một pixel mới được chấp nhận là thành viên của hiện tại khu vực lân cận
gân nhất của pixel mới này được kiểm tra Quá trình này điễn ra đệ quy cho đến
khi không còn pixel nào được chấp nhận Tất cả các pIxel của khu vực hiện tại
được đánh dấu bằng một nhãn duy nhất Sau đó, một pixel không nhãn khác
được chọn và thủ tục tương tự được lặp lại Quét hình ảnh từ trái sang phải, từ
trên xuống dưới cùng chúng ta tiếp tục ghi nhãn các vùng cho đến khi mọi pixel
dugc gan cho mot sỐ vùng hoặc khác
1.3.2 Mục tiêu của phán đoạn ảnh
Mục tiêu của phân đoạn ảnh là để đơn giản hóa và hoặc thay đổi biểu diễn
của một tắm ảnh vào điều gì đó có ý nghĩa hơn và dễ dàng để phân tích[1] Phân
vùng ảnh thường được sử dụng để xác định vị trí các đối tượng, đường biên
(đường thắng, cong.vv) Hay nói cách khác phân vùng ảnh là một quá trình gán nhãn (assigning a lablel) cho mỗi điểm ảnh trong một bức ảnh, các điểm ảnh trong cùng một nhãn sẽ có những đặc tính giống nhau về màu sắc, cường độ
hoặc kết câu của ảnh
Kết quả của việc phân vùng ảnh là tập hợp các phân đoạn (segments) bao gồm có thể là toàn bộ bức ảnh hoặc tập hợp các đường biên chiết xuất từ
19
Trang 28hinh anh Cac diém anh trong cùng một vùng có đặc tính tương tự nhau vê
màu sắc, cường độ hoặc kêt câu Các vùng lần cận thì khác nhau đáng kê về các đặc trưng trên
1.3.3 Một số kỹ thuật phân đoạn anh
Quá trình phân đoạn ảnh có thể được chia thành ba nhóm chính như sau:
° Phân đoạn ảnh dựa trên không gian đặc trưng
° Phân đoạn ảnh dựa trên các mô hình vật lý
°Ổ Phân đoạn ảnh dựa trên không gian ảnh
Các phương pháp dựa trên không gian đặc trưng
Quá trình phần vùng một hình ảnh kỹ thuật số thành nhiều phân đoạn được xác định là phân đoạn hình ảnh Phần đoạn nhằm mục đích phân chia một hình ảnh thành các khu vực có thể đại diện hơn và dễ phân tích hơn Các vùng
như vậy có thể tương ứng với các bề mặt riêng lẻ, các đối tượng hoặc các phần
tự nhiên của các đối tượng Thông thường phân đoạn hình ảnh là quá trình được
sử dụng để định vị các đối tượng và ranh giới (ví dụ: đường hoặc đường cong)
trong hình ảnh Hơn nữa, nó có thể được định nghĩa là quá trình ghi nhãn cho mỗi pixel trong ảnh, trong đó tất cả các pixel có cùng nhãn đều có chung một số
đặc điểm hình ảnh nhất định Thông thường phân đoạn sử dụng thông tin cục bộ
trong hình ảnh kỹ thuật số để tính toán phân đoạn tốt nhất, chẳng hạn như thông
tin màu được sử dụng để tạo biểu đồ hoặc thông tin chỉ ra các cạnh, ranh giới
hoặc thông tin kết cấu
20
Trang 29Cac phuong phap dia trén khong gian anh
Có nhiều không gian màu khác nhau được đề xuất trong văn học, mỗi cái
có tính chất, ưu điểm riêng, hạn chế, và các lĩnh vực ứng dụng Công việc này
tập trung vào năm ví dụ phố biến, thường là được sử dụng trong các tác vụ xử lý
anh: RGB, HSV, L *a*b*,L*u* v *, va khong gian mau đối thủ Đề mà
đánh giá xem thông tin màu sắc có ý nghĩa tại tất cả, một đại diện hình ảnh thang độ xám đơn giản được bao gồm đưới dạng không gian màu sắc thứ sáu
Do tính đơn giản của nó, không gian màu RGB là nhất thường được sử dụng Nó
được thể hiện bằng màu đỏ (R), màu xanh lá cây (G) và màu xanh lam (B) Màu
cuối cùng là được xác định bởi sự kết hợp phụ gia của ba màu cơ bản đó Không
gian màu Hue, Saturatlon và Value (HSV) tách cường độ từ sắc độ và thê hiện chúng một cách độc lập Huế mô tả vị trí của màu trong 360° phô Độ bão hòa
mô tả độ tinh khiết của màu: nó đo sự khác biệt giữa màu và giá trị thang độ xám của cường độ bằng nhau Giá trị, là kênh thứ ba, là đo độ sáng Tùy thuộc vào các kỹ thuật mà các thuật toán này áp dụng, chúng được phân loại thành các
nhóm sau:
e Kỹ thuật chia vùng và chia
e Kỹ thuật tăng trưởng vùng
e Lý thuyết đồ thị
e Mang neural
Các phương pháp dựa trên mô hình vật lý
Giả định trung tâm của các phương pháp dựa trên mô hình là các cấu trúc quan tâm có xu hướng hướng tới một hình dạng cụ thể Do đó, người ta có thê
tìm kiếm một mô hình xác suất đặc trưng cho hình dạng và sự biến đôi của nó
Khi phân đoạn một hình ảnh, các ràng buộc có thể được áp dụng bang cach str
21
Trang 30dung mô hình này như trước Một nhiệm vụ như vậy có thê liên quan đến đăng
ký các ví dụ đào tạo cho một tư thé chung, biéu dién xác suất của sự thay đôi
của các mẫu đã đăng ký và suy luận thông kê giữa mô hình và hình ảnh Các phương pháp quan trọng khác trong tài liệu cho phân đoạn dựa trên mô hình bao
gồm mô hình hình dạng hoạt động và mô hình xuất hiện hoạt động
1.4 KẾT LUẬN CHƯƠNG MỘT
Qua chương một ta đã tìm hiểu về tong quan xử lý ảnh cùng các khái niệm cơ bản trong xử lý ảnh và từ đó tìm hiệu về phân đoạn ảnh cùng một số kỹ thuật phân đoạn
22
Trang 31Chuong 2
PHAN DOAN ANH THEO MO HINH TACH, GHEP VUNG
2.1 PHAN DOAN ANH THEO MO HINH GHEP VUNG
2.1.1 Ghép theo mau
Clustering là một kỹ thuật nhóm các điểm tương đồng như việc những điểm ở cùng một nhóm thì sẽ giống nhau hơn những điểm khác nhóm Những
điểm cùng một nhóm được gọi là một cluster Va Hierarchical clustering là việc
nhóm theo mô hình cây Kết tụ - Bottom up hoặc Phân chia - Top down
Phương pháp bottom-up, Trong kỹ thuật này, ban đầu mỗi điểm dữ liệu
được coI là một cụm riêng lẻ Ở mỗi lần lặp, các cụm tương tự hợp nhất với các cụm khác cho đến khi một cụm hoặc K cụm được hình thành
Thuật toán cơ bản của Agglomerative là thăng về phía trước:
e _ Đặt mỗi điểm dữ liệu là một cụm
Phân cụm phân cấp bottom-up được dùng nhiều hơn phương pháp /op- down do viéc dé ghép cac cum voi nhau hon so voi bottom-up
23