Phõn đoạn ảnh dựa vào phõn cụm dữ liệu

Một phần của tài liệu Phương pháp phân cụm và ứng dụng (Trang 66 - 76)

7. Thuật toỏn phõn cụm dữ liệu dựa trờn mẫu 1 Thuật toỏn EM

1.2 Phõn đoạn ảnh dựa vào phõn cụm dữ liệu

Việc ỏp dụng cỏc tớnh năng của địa phương để phõn khỳc clustering quy mụ hỡnh ảnh màu xỏm-được tài liệu trong Schachter et al. [1979]. Tài liệu nhấn mạnh đến việc lựa chọn thớch hợp của tớnh năng ở mỗi điểm ảnh chứ khụng phải là phương phỏp phõn cụm, và đề xuất việc sử dụng cỏc mặt phẳng tọa độ hỡnh ảnh (khụng gian thụng tin) là tớnh năng bổ sung để được làm việc tại cỏc phõn nhúm dựa trờn phõn khỳc. Mục tiờu của phõn cụm là cú được một chuỗi cỏc cụm hyperellipsoidal bắt đầu với cỏc trung tõm cụm vị trớ tại cỏc vị trớ mật độ tối đa trong khụng gian mẫu, và cỏc cụm phỏt triển về cỏc trung tõm cho đến khi một thử nghiệm tốt đẹp của 2 cho phự hợp đó bị vi phạm. Một loạt cỏc tớnh năng được thảo luận và ỏp dụng cho cả hai màu xỏm và màu sắc hỡnh ảnh.

Một thuật toỏn phõn cụm kết tụ đó được ỏp dụng bởi Silverman và Cooper [1988] cho vấn đề của học khụng giỏm sỏt của cụm vectơ hệ số cho hai mụ hỡnh ảnh tương ứng với cỏc phõn đoạn hỡnh ảnh. Cỏc mụ hỡnh đầu tiờn là đa thức cho cỏc số đo hỡnh ảnh quan sỏt; giả định ở đõy là hỡnh ảnh là một bộ sưu tập của đồ thị liền kề nhiều bề mặt, mỗi một hàm đa thức của cỏc mặt phẳng tọa độ hỡnh ảnh, được lấy mẫu trờn lưới đường quột để tạo ra cỏc hỡnh ảnh quan sỏt . Thuật toỏn tiền xử lý bằng cỏch lấy vectơ của hệ số của hỡnh vuụng ớt nhất phự hợp với cỏc dữ liệu trong cửa sổ hỡnh ảnh M phõn chia. Một thuật toỏn phõn cụm kết tụ hũa trộn (ở mỗi bước) hai cụm cú một cụm toàn cầu tối thiểu giữa-khoảng cỏch Mahalanobis . Cựng một khuụn khổ đó được ỏp dụng đối với phõn khỳc của hỡnh ảnh kết cấu, nhưng cú hỡnh ảnh như mụ hỡnh đa thức là khụng thớch hợp, và một tham số ngẫu nhiờn Markov mụ hỡnh trường đó được giả định để thay thế.

Wu và Leahy [1993] mụ tả việc ỏp dụng cỏc nguyờn tắc của dũng chảy mạng để phõn loại khụng giỏm sỏt, yielding một cuốn tiểu thuyết thuật toỏn phõn cấp cho phõn cụm dữ liệu. Về bản chất, kỹ thuật này xem cỏc mẫu khụng nhón như cỏc nỳt trong một đồ thị, trong đú trọng lượng của một cạnh (chẳng hạn như dung tớch) là một thước đo giống nhau giữa cỏc nỳt tương ứng. Cụm được xỏc định bằng cỏch loại bỏ cỏc cạnh của đồ thị để tạo phõn chia kết nối đồ thị con. Trong phõn khỳc hỡnh ảnh, điểm ảnh được 4-lỏng giềng hoặc 8-lỏng giềng ở cỏc cạnh chia sẻ hỡnh ảnh mỏy bay trong đồ thị kề

xõy dựng, và trọng lượng của một cạnh đồ thị dựa trờn độ lớn của một cạnh hỡnh ảnh đưa ra giả thuyết giữa cỏc điểm ảnh liờn quan (độ lớn này được tớnh bằng cỏch sử dụng mặt nạ đơn giản phỏi sinh). Do đú, việc phõn đoạn này hoạt động bằng cỏch tỡm đường nột đúng cửa trong hỡnh ảnh, và tốt nhất là cú nhón cạnh hơn là dựa trờn khu vực trờn.

Trong Vinod et al. [1994], hai mạng nơ-ron thần kinh được thiết kế để thực hiện mụ hỡnh phõn cụm khi kết hợp. Một hai tầng mạng hoạt động trờn một biểu đồ đa chiều của dữ liệu để xỏc định "nguyờn mẫu" được sử dụng để phõn loại cỏc mụ hỡnh đầu vào thành cỏc cụm. Những nguyờn mẫu được phỏt triển thành mạng lưới phõn loại, một hai điều hành mạng lớp trờn biểu đồ cỏc dữ liệu đầu vào, nhưng được định hướng để cú trọng lượng khỏc nhau từ mạng lựa chọn nguyờn mẫu. Trong cả hai mạng lưới, cỏc biểu đồ của hỡnh ảnh được sử dụng để trọng lượng đúng gúp của mụ hỡnh là một trong những mẫu lỏng giềng theo xem xột đến vị trớ của nguyờn mẫu hay phõn loại cuối cựng; như vậy, nú cú khả năng là mạnh mẽ hơn khi so sỏnh với cỏc kỹ thuật đú là một giả định tiềm ẩn mật độ tham số chức năng cho cỏc lớp mẫu. Kiến trỳc này đó được thử nghiệm trờn màu xỏm quy mụ và cỏc vấn đề phõn khỳc màu.

Jolion et al. [1991] mụ tả một quỏ trỡnh để tỏch cỏc cụm tuần tự từ cỏc mụ hỡnh đầu vào thiết lập bằng cỏch xỏc định cỏc khu vực hyperellipsoidal cú chứa một phần nhỏ trong quy định của cỏc điểm khụng phõn lớp trong bộ này. Cỏc khu vực chiết xuất được so sỏnh với nhất lắp đa biến Gaussian mật độ thụng qua một thử nghiệm Kolmogorov-Smirnov, và chất lượng phự hợp được sử dụng như là một con số đỏng để chọn vựng tốt nhất 'ở mỗi phộp lặp. Quỏ trỡnh này tiếp tục cho đến khi dừng lại là một tiờu chớ hài lũng. Thủ tục này được ỏp dụng cho cỏc vấn đề của lựa chọn ngưỡng cho phõn khỳc đa ngưỡng của hỡnh ảnh cường độ và phạm vi phõn khỳc của hỡnh ảnh.

Kỹ thuật Clustering cũng đó được thành cụng được sử dụng cho cỏc phõn đoạn của nhiều hỡnh ảnh , đú là một nguồn phổ biến của cỏc dữ liệu đầu vào cho ba chiều đối tượng hệ thống cụng nhận [Jain và Flynn 1993]. Phạm vi cảm biến ảnh lưới tọa độ thường trở lại với giỏ trị đo tại mỗi điểm ảnh đang được cỏc tọa độ của một vị trớ trong khụng gian 3D. Những vị trớ 3D cú thể được hiểu là những địa điểm mà cỏc tia đang nổi lờn từ cỏc địa điểm mỏy bay hỡnh ảnh trong một bú cắt nhau của cỏc đối tượng ở phớa trước của cảm biến.

Cỏc tớnh năng của cơ bản của khỏi niệm phõn cụm dữ đặc biệt hấp dẫn cho cỏc phõn khỳc hỡnh ảnh từ nhiều (khụng giống như đo cường độ) cỏc phộp đo tại mỗi điểm ảnh cú cựng một đơn vị (chiều dài); này sẽ làm cho quảng cỏo hoc biến đổi hoặc chuẩn húa hỡnh ảnh tớnh năng khụng cần thiết nếu mục tiờu của họ là để ỏp đặt bằng rộng trờn cỏc tớnh năng đú. Tuy nhiờn, phạm vi ảnh phõn đoạn thường gắn thờm để đo khụng gian chức năng, loại bỏ lợi thế này.

Hỡnh ảnh của một hệ thống được mụ tả trong phạm vi phõn khỳc Hoffman và Jain [1987] sử dụng phõn cụm bỡnh phương lỗi trong một khụng gian sỏu chiều tớnh năng như một nguồn của một phõn khỳc "ban đầu" là tinh tế (thường là qua việc sỏp nhập cỏc phõn đoạn) thành đầu ra cỏc phõn đoạn. Kỹ thuật này được nõng cao trong Flynn và Jain [1991], và được sử dụng trong một so sỏnh cú hệ thống gần đõy của phõn đoạn hỡnh ảnh [Hoover et al. 1996]; như vậy, nú cú lẽ là một trong những giới hạn kỹ thuật phõn cụm tồn tại lõu nhất phạm vi đó thực hiện tốt trờn rất nhiều hỡnh ảnh.

Việc phõn đoạn này hoạt động như sau. Tại mỗi điểm ảnh (i, j) trong phạm vi hỡnh ảnh đầu vào, cỏc đo lường được ký hiệu tương ứng 3D

xij,yij,zij, nơi xij là một hàm tuyến tớnh của j (số cột) và yij là một hàm tuyến tớnh của tụi (số lượng hàng). Một kk lỏng giềng của (i, j) được sử dụng để ước lượng bề mặt 3D  zij y ij x ij ij n n n

n  , , tại (i, j), thụng thường bằng việc tỡm kiếm ớt nhất-ụ vuụng phẳng phự hợp với cỏc điểm 3D trong lỏng giềng. Cỏc vộc tơ tớnh năng cho điểm ảnh tại (i, j) là sỏu chiều  z

ij y ij x ij ij ij ij y z n n n x , , , , , , và một phõn khỳc ứng cử viờn được tỡm thấy bởi phõn cụm cỏc vectơ tớnh năng này. Vỡ cỏc lý do thực tế, khụng phải vector tớnh năng của mỗi điểm ảnh được sử dụng trong cỏc thủ tục phõn cụm; thường 1.000 vectơ tớnh năng được lựa chọn bởi lấy mẫu phụ.

Thuật toỏn CLUSTER [Jain và Dubes 1988] đó được sử dụng để cú được cỏc nhón phõn đoạn cho mỗi điểm ảnh. CLUSTER là một thuật toỏn mở rộng của thuật toỏn k-means, nú cú khả năng xỏc định một số cụm của một tập dữ liệu, mỗi một số khỏc nhau của cỏc cụm. Hoffman và Jain [1987] cũng thử nghiệm với cỏc kỹ thuật phõn nhúm khỏc (vớ dụ, hoàn chỉnh, liờn kết, liờn kết đơn, đồ thị, lý thuyết, và cỏc thuật toỏn lỗi bỡnh phương) và hàng CLUSTER để cung cấp sự kết hợp tốt nhất về hiệu suất và độ chớnh xỏc. Một

lợi thế bổ sung của CLUSTER là nú tạo ra một chuỗi cỏc cụm đầu ra (tức là, một cụm 2-giải phỏp lập thụng qua một Kmax – cụm giải phỏp mà Kmax được chỉ định bởi người dựng và thường là 20 hoặc hơn); mỗi phõn nhúm theo thứ tự sản lượng này thống kờ clustering kết hợp giữa-cụm tỏch và trong cụm phõn tỏn -. Phõn cụm tối ưu húa cỏc số liệu thống kờ này được chọn là một trong cụm tốt nhất. Mỗi điểm ảnh trong phạm vi hỡnh ảnh được gỏn nhón phõn đoạn của cỏc trung tõm cụm gần nhất. Điều này bước phõn loại khoảng cỏch tối thiểu khụng được bảo đảm để sản xuất phõn đoạn đú được kết nối trong mặt phẳng hỡnh ảnh, do vậy, một thành phần kết nối ghi nhón thuật toỏn phõn bổ cỏc nhón mới cho cỏc khu vực phõn chia được đặt trong cựng một nhúm. Hoạt động tiếp theo bao gồm cỏc xột nghiệm loại bề mặt, việc sỏp nhập cỏc bản vỏ liền kề sử dụng một thử nghiệm cho sự hiện diện của mộp nhăn hoặc nhảy cạnh giữa cỏc phõn đoạn liền kề, và ước lượng thụng số bề mặt.

(a) (b)

(c) (d)

Hỡnh 27. Phõn đoạn ảnh bằng phõn cụm dữ liệu.

(a): Ảnh đầu vào. (b): Mặt bằng chớnh tắc hỡnh ảnh được chọn. (c): Bước đầu phõn đoạn (19 nhúm giải phỏp) trả lại bằng cỏch sử dụng CLUSTER 1000 sỏu chiều mẫu từ hỡnh ảnh như là một mẫu thiết lập. (d): kết quả phõn đoạn cuối cựng(8 phõn đoạn) (c) (d) sau khi đó xử lý

Hỡnh 27 cho thấy tiến trỡnh này được ỏp dụng cho một loạt hỡnh ảnh. Một phần của hỡnh hiển thị nhiều hỡnh ảnh đầu vào; phần b cho thấy sự phõn bố của bề mặt. Trong c một phần, cỏc phõn đoạn đầu tiờn trở lại bởi CLUSTER và sửa đổi để đảm bảo phõn đoạn kết nối được hiển thị. Phần d cho thấy phõn khỳc cuối cựng được tạo ra bởi việc sỏp nhập cỏc bản vỏ lỗi kề mà khụng cú một mộp nhăn đỏng kể giữa chỳng. Cỏc cụm cuối cựng hợp lý khỏc biệt đại diện cho cỏc bề mặt cú trong này đối tượng phức tạp.

Cỏc phõn tớch kết cấu hỡnh ảnh đó được quan tõm bởi cỏc nhà nghiờn cứu trong vài năm. Kết cấu kỹ thuật phõn đoạn đó được phỏt triển bằng cỏch sử dụng một loạt cỏc mụ hỡnh kết cấu và hoạt động hỡnh ảnh. Nguyờn và Cohen [1993], kết cấu phõn khỳc hỡnh ảnh đó được địa chỉ húa mẫu với hỡnh ảnh như là một hệ thống phõn cấp của hai trường Markov ngẫu nhiờn, lấy một số số liệu thống kờ đơn giản từ mỗi khối hỡnh để tạo thành một vector tớnh năng, và phõn nhúm cỏc khối bằng cỏch sử dụng phương phỏp K-means mờ. Thủ tục phõn cụm ở đõy là sửa đổi để cựng nhau ước tớnh số lượng cỏc cụm cũng như cỏc thành viờn trong mờ của mỗi vộc tơ tớnh năng cho cỏc cụm khỏc nhau.

Một hệ thống phõn chia hỡnh ảnh cho kết cấu đó được mụ tả bởi Jain và Farrokhnia [1991]; ở đú, bộ lọc Gabor đó được sử dụng để cú được một bộ 28-định hướng và tớnh năng chọn lọc cỏc kết cấu trong cỏc lỏng giềng của mỗi điểm ảnh. 28 tớnh năng được giảm đến một số lượng nhỏ hơn thụng qua một thủ tục lựa chọn tớnh năng, và cỏc tớnh năng kết quả được tiền xử lý và sau đú nhúm bằng cỏch sử dụng chương trỡnh CLUSTER.

Một bảng thống kờ [Dubes 1987] được sử dụng để lựa chọn tốt nhất cỏc cụm. Tối thiểu khoảng cỏch phõn loại được sử dụng để nhón mỗi điểm ảnh trờn hỡnh ảnh gốc. Kỹ thuật này đó được thử nghiệm trờn một số kết cấu ghộp bao gồm cỏc kết cấu Brodatz tự nhiờn và hỡnh ảnh tổng hợp. Hỡnh 28 (a) cho thấy một khảm kết cấu bao gồm bốn đầu vào của cỏc kết cấu Brodatz phổ biến [Brodatz 1966]. Phần b cho thấy phõn khỳc sản xuất khi cỏc tớnh năng lọc Gabor được ghộp để chứa cỏc thụng tin khụng gian (tọa độ pixel). Bộ lọc này dựa vào kỹ thuật Gabor đó được chứng minh rất mạnh và đó được mở rộng tới cỏc phõn đoạn tự động của văn bản trong tài liệu [Jain và hattacharjee 1992] và phõn đoạn của cỏc đối tượng trong nền phức tạp [Jain et al. 1997].

(a) (b)

Hỡnh 28. Kết quả của kết cấu phõn đoạn ảnh (a): kết cấu khảm 4 lớp. (b): bốn nhúm giải phỏp thực hiện bởi giải thuật CLUSTER với tọa độ điểm ảnh bao gồm trong cỏc tớnh năng thiết lập.

Phõn cụm dữ liệu cú thể được sử dụng như là một giai đoạn tiền xử lý để xỏc định cỏc lớp học mẫu để phõn loại giỏm sỏt tiếp theo. Taxt và Lundervold [1994] và Lundervold et al. [1996] mụ tả một thuật toỏn clustering partitional và một kỹ thuật ghi nhón hướng dẫn sử dụng để xỏc định cỏc lớp vật liệu (vớ dụ, nóo tủy chất lỏng, chất trắng, bắp Khối, khối u) trong cỏc hỡnh ảnh được đăng ký của một con người cú được ở đầu năm kờnh khỏc nhau hỡnh ảnh cộng hưởng từ (yielding một năm chiều tớnh năng vector tại mỗi điểm ảnh). Một số phõn cụm đó thu được và kết hợp với kiến thức tờn miền (nhõn lực chuyờn mụn) để xỏc định cỏc lớp khỏc nhau. Quyết định quy định phõn loại giỏm sỏt được dựa trờn những lớp này được lấy. Hỡnh 29 (một) cho thấy một trong những kờnh của một đầu vào-đa quang phổ hỡnh ảnh; phần b cho thấy 9-cụm kết quả. Thuật toỏn K-means là đó được ỏp dụng cho cỏc phõn khỳc của LANDSAT hỡnh ảnh trong Solberg et al. [1996]. Cỏc trung tõm cụm ban đầu được chọn tương tỏc của một nhà điều hành đào tạo, và tương ứng với cỏc lớp học sử dụng đất như khu vực đụ thị, đất (thực vật miễn phớ) cỏc khu vực, rừng, đồng cỏ, và nước. Hỡnh 30 (một) cho thấy những hỡnh ảnh đầu vào hoàn trả như màu xỏm; phần b cho thấy kết quả của thủ tục phõn cụm dữ liệu.

(a) (b)

Hỡnh 29. Phõn đoạn ảnh y tế đa quang phổ. (a)Kờnh duy nhất của ảnh đầu vào. (b) 9 cụm phõn đoạn ảnh

(a) (b)

Hỡnh 30: Phõn đoạn ảnh LANDSAT. (a) Bản gốc hỡnh ảnh ESA / EURIMAGE / Sattelitbild). (b): Cảnh đó được phõn cụm.

2.Nhận dạng đối tƣợng và ký tự 2.1 Nhận dạng đối tƣợng

Việc sử dụng cỏc phõn nhúm để xem nhúm đối tượng 3D cho mục đớch cụng nhận đối tượng trong phạm vi dữ liệu đó được mụ tả trong Dorai và Jain [1995]. Cỏc thuật ngữ dựng để chỉ xem một hỡnh ảnh phạm vi của một đối tượng thu được từ bất cứ quan điểm tựy ý. Hệ thống xem xột, làm việc theo một quan điểm phụ thuộc (hoặc xem trung tõm) cỏch tiếp cận đối với vấn đề cụng nhận đối tượng; mỗi đối tượng được cụng nhận là đại diện trong điều khoản của một thư viện hỡnh ảnh loạt cỏc đối tượng đú.

Cú rất nhiều ý cú thể cú của một đối tượng 3D và mục tiờu một trong những cụng việc mà là để trỏnh kết hợp một đầu vào xem khụng rừ đối với từng hỡnh ảnh của từng đối tượng. Một chủ đề phổ biến trong văn học cụng nhận đối tượng được lập chỉ mục, trong đú xem chưa biết được sử dụng để chọn một tập hợp con của điểm của một tập hợp con của cỏc đối tượng trong cơ sở dữ liệu để so sỏnh hơn nữa, và từ chối tất cả cỏc điểm khỏc của đối tượng. Một trong những cỏch tiếp cận để đỏnh chỉ sử dụng cỏc khỏi niệm của cỏc tầng lớp xem; một lớp học xem là tập hợp cỏc điểm chất lượng tương tự của một đối tượng. Trong tỏc phẩm đú, cỏc lớp học xem đó được xỏc định bởi phõn cụm dữ liệu; phần cũn lại của tiểu mục này vạch ra cỏc kỹ thuật.

Xem đối tượng đó được nhúm lại vào cỏc lớp học dựa trờn hỡnh dạng giống nhau của cỏc tớnh năng phổ. Mỗi hỡnh ảnh đầu vào của một đối tượng xem trong sản lượng cụ lập một vector tớnh năng mà nú mụ tả. Cỏc tớnh năng vector chứa trong mười phỳt đầu tiờn trung tõm của một hỡnh bỡnh thường

   h h H h

m1 ( ) ( ) hoỏ quang phổ phõn phối, H(h), của một đối tượng xem là

thu được từ dữ liệu phạm vi của nú bằng cỏch xõy dựng một biểu đồ của cỏc giỏ trị chỉ số hỡnh dạng (cú liờn quan đến cỏc giỏ trị bề mặt cong) và tớch lũy tất cả cỏc đối tượng điểm ảnh mà rơi vào mỗi thựng. Bởi bỡnh thường húa

Một phần của tài liệu Phương pháp phân cụm và ứng dụng (Trang 66 - 76)

Tải bản đầy đủ (PDF)

(100 trang)