1. Trang chủ
  2. » Công Nghệ Thông Tin

5 giao trinh xulyanh chuong 3

24 116 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 24
Dung lượng 1,25 MB

Nội dung

Cùng với sự phát triển nhanh chóng của khoa học công nghệ, các kỹ thuật dựa trên trí tuệ nhân tạo và thị giác máy tính ứng dụng trong các hệ thống thông minh đạt được những kết quả vượt bậc, có nhiều triển vọng. Cuộc cách mạng công nghiệp lần thứ 4 (Industry 4.0) hiện đang diễn ra tại trên phạm vi toàn cầu, đặc biệt ở các nước có nền khoa học kỹ thuật phát triển…. Industry 4.0 tập trung vào sản xuất và dịch vụ thông minh chủ yếu dựa trên các hệ thống tương tác thực ảo, các hệ thống thông minh dần thay thế con người. Nền tảng của các hệ thống thông minh có thể nói bắt nguồn từ lĩnh vực trí tuệ nhân tạo và thị giác máy. Trong đó, thị giác máy là một trong những giác quan máy quan trọng nhất giúp cho quá trình thu nhận tín hiệu, xử lý, phân tích nhằm đưa ra tri thức phục vụ các hệ thống ra quyết định. Nội dung cuốn sách gồm 7 chương lần lượt trình bày những kiến thức nhập môn về xử lý ảnh, các phương pháp nâng cao trong phân tích, nhận dạng mẫu, kỹ thuật học sâu như: các phép biến đổi, điều chỉnh nâng cao chất lượng ảnh; biến đổi ảnh màu, ảnh đa mức xám, toán tử tích chập, các bộ lọc ảnh và phép biến đổi không gian ảnh, biến đổi hình thái học ứng dụng trong phân tích vùng ảnh, trích biên đối tượng; phương pháp phân đoạn ảnh theo phân ngưỡng thủ công, phân ngưỡng tự động; phương pháp phân tích ảnh như phân đoạn ảnh bằng thuật toán phân cụm kmeans, Meanshift, Watershed, trích chọn đặc trưng cơ bản như kỹ thuật trích chọn cạnh, điểm chính (keypoint) và mô tả vùng đặc trưng vùng ảnh. Cuốn sách cũng giới thiệu một số phương pháp trích chọn đặc trưng nâng cao như SIFT, SUFT, HOG, Haarlike feature; phương pháp so khớp đặc trưng giữa các ảnh phục vụ phát hiện đối tượng tương đồng và nhận dạng mẫu cùng với kỹ thuật lọc loại trừ nhiễu trong so khớp ảnh. Phần cuối trình bày những kỹ thuật nhận dạng mẫu và phân loại đối tượng từ cách tiếp cận truyền thống như cây quyết định, rừng ngẫu nhiên, boosting, máy phân loại hỗ trợ vector SVM, mạng neural nhân tạo và đến kỹ thuật học sâu, mạng neural tích chập như mạng LeNet, AlexNet, ZFNet, GooLeNet, VGGNet, RCNN và kiến trúc mạng mô tả ngữ nghĩa ảnh. Cuốn sách này được biên soạn dựa trên kinh nghiệm tích lũy qua quá trình nghiên cứu và giảng dạy của tác giả liên quan đến lĩnh vực thị giác máy tính, trí tuệ nhân tạo và các hệ thống thông minh. Hy vọng, cuốn sách là nguồn kiến thức hữu ích phục vụ học tập, tham khảo cho sinh viên, học viên cao học các ngành liên quan đến khoa học máy tính, công nghệ thông tin, cũng như độc giả quan tâm đến lĩnh vực nhận dạng xử lý ảnh và ứng dụng trí tuệ nhân tạo trong nhận dạng mẫu

Trang 1

Chương 3

PHƯƠNG PHÁP PHÂN ĐOẠN ẢNH

Chương này trình bày một số phương pháp phân đoạn ảnh cơ bản như phân ngưỡng thủ công, phân ngưỡng tự động, phân ngưỡng Otsu Bên cạnh đó, một số phương pháp xử lý nâng cao cũng được giới thiệu như

kỹ thuật phân đoạn ảnh bằng thuật toán phân cụm dữ liệu k-means, kỹ

thuật trung bình dịch chuyển Meanshift, kỹ thuật dâng nước vạch ngăn cách Watershed, phân đoạn phân cấp

3.1 TỔNG QUAN VỀ PHÂN ĐOẠN ẢNH

Trong lĩnh vực xử lý ảnh, phân đoạn ảnh (segmentation) được hiểu là quá trình nhóm điểm ảnh thành các vùng sao cho các điểm ảnh trong cùng một vùng có chung đặc điểm, tính chất nào đó, ví dụ như sự tương

tự về màu sắc, cường độ hoặc kết cấu Nói cách khác, phân đoạn ảnh là một quá trình chia một ảnh số thành nhiều vùng khác nhau, mỗi vùng gồm tập hợp các điểm ảnh (có thể gọi là superpixels hoặc region) có cùng tính chất Trong một số tài liệu, phân đoạn hình ảnh còn được gọi là phân vùng ảnh Mục tiêu của việc phân đoạn là để đơn giản hóa hoặc thay đổi cách biểu diễn một ảnh theo tiêu chuẩn nào đó nhằm làm cho nó ý nghĩa hơn và dễ dàng trong phân tích, trích xuất đặc trưng[12] Kết quả của quá trình phân đoạn ảnh là tập hợp các vùng (region) hay còn gọi là các phân đoạn (segments) có thể bao gồm toàn bộ ảnh hoặc tập hợp các vùng đối tượng được trích xuất ra từ ảnh

Phân đoạn ảnh có ý nghĩa quan trọng trong việc phát hiện các đặc tính

và cấu trúc đối tượng trong ảnh vì mỗi vùng thường miêu tả cấu trúc tương ứng với đối tượng trong vùng đó Ví dụ số lượng các vùng trong ảnh thể hiện rằng trong ảnh đó có chứa nhiều đối tượng khác nhau và ngược lại mỗi đối tượng chứa các vùng trong nó tương ứng với các phần khác nhau của cùng đối tượng Phân đoạn ảnh có nhiều ứng dụng quan trọng trong nhiều lĩnh vực khác nhau như phân tích hình ảnh y học (medical imaging), phát hiện và nhận dạng đối tượng, phát hiện hành động trong các hệ thống camera giám sát thông minh, hệ thống điều khiển và giao thông thông minh, xe không người lái, xử lý hình ảnh vệ tinh…

Trang 2

Phân đoạn ảnh được xem là quá trình tiền xử lý, có ý nghĩa quan trọng trong hệ thống xử lý ảnh Phân đoạn tốt sẽ giúp cho quá trình xử lý ở các bước tiếp theo đạt hiệu quả cao hơn, nâng cao độ chính xác và cũng như tiết kiệm chi phí tính toán

H 3.1 Phân đoạn bằng phương pháp đồ thị và phương pháp Mean shift[13]Các vùng phân tách được dùng trong nhiều ngữ cảnh khác nhau và đặc biệt có thể được sử dụng làm đại diện thay thế cho đối tượng và biểu diễn dưới dạng nhiều hình thức khác nhau[10] Việc lựa chọn mô tả vùng

dữ liệu có nhiều cách thức khác nhau tùy thuộc vào tính chất, mục tiêu và đảm bảo phù hợp cho từng ứng dụng cụ thể Nhiều ứng dụng không chỉ đòi hỏi mô tả các vùng riêng lẻ mà còn cần thể hiện được mối quan hệ với nhau giữa các vùng trong ảnh

H 3.2 Phân đoạn ảnh dựa vào ngưỡng đơn và ngưỡng kép[10] để trích xuất

các vùng đối tượng khác nhau Hình minh họa trên thể hiện phân đoạn ảnh với các điều kiện ngưỡng đơn và ngưỡng đôi dùng các giá trị ngưỡng khác nhau Một hình ảnh

Trang 3

được phân vùng bằng cách sử dụng loại ngưỡng đơn và ngưỡng đôi để cho ra các vùng có mức xám khác nhau Hình (a) thể hiện ảnh gốc và (b) lược đồ màu tương ứng với ảnh, hình (c) thể hiện kết quả phân đoạn với

ngưỡng đơn T1=70, hình (d) thể hiện kết quả phát hiện vùng lõi sử dụng

ngưỡng thứ hai T2=155, (e) phân đoạn thông thường với ngưỡng=T2,

(f) phân ngưỡng kép T1 và T2 để trích chọn vùng năm trong khoảng

T1<=Ngưỡng<=T2

3.2 PHÂN ĐOẠN BẰNG NGƯỠNG

Ngưỡng (threshold) là một khái niệm phổ biến trong lĩnh vực phân đoạn đối tượng của kỹ thuật xử lý ảnh Ngưỡng được dùng để chỉ một giá trị nào đó mà ta dùng để phân tách một tập hợp các điểm ảnh thành các

vùng phân biệt Ví dụ sử dụng một ngưỡng th để phân đoạn ảnh thành các vùng có cường độ sáng lớn hơn th và các vùng còn lại có giá trị cường độ sáng nhỏ hơn hoặc bằng th Giá trị ngưỡng thường được xác

định dựa vào giá trị đặc biệt như giá trị trung bình, giá trị trung vị hoặc dựa vào khảo sát thống kê theo kinh nghiệm Có nhiều cách phân loại khác nhau, tuy nhiên nếu căn cứ vào số lượng ngưỡng dùng cho phân đoạn thì có phương pháp phân đoạn sử dụng ngưỡng đơn, phân đoạn ngưỡng kép hoặc phân đoạn đa ngưỡng Nếu căn cứu vào tính chất biến thiên của giá trị ngưỡng thì có thể phân thành phương pháp dùng ngưỡng

cố định (constant threshold) và ngưỡng động hay ngưỡng thích ứng (adaptive threshold) Trong đó, ngưỡng động được hiểu theo nghĩa giá trị của ngưỡng sẽ thay đổi tùy thuộc vào sự biến thiên của tập dữ liệu ảnh theo không gian và thời gian Thông thường giá trị ngưỡng được xác định bằng cách áp dụng phương pháp phân tích thống kê

3.2.1 P â gưỡng thủ công

Phân ngưỡng thủ công là phương pháp đơn giản với chi phí tính toán thấp, trong một số trường hợp đặc biệt với giá trị mức xám biết trước, phương pháp này tỏ ra hiệu quả và có thể áp dụng trực tiếp được Quá trình phân đoạn dựa vào ngưỡng thủ công được thực hiện theo công thức và kết quả thu được là ảnh nhị phân như sau:

Trang 4

Với F là kết quả phân đoạn theo ngưỡng, I là ảnh đầu vào, Th là

ngưỡng đơn được dùng để phân đoạn

Ví dụ đơn giản sử dụng ngưỡng cố định trong phân đoạn để trích xuất

title( 'Threshold segmentation' );

H 3.3 Kết quả phân ngưỡng với giá trị ngưỡng Th=80.

3.2.2 Phân đoạn gưỡng tự động

Trong trường hợp tổng quát, ảnh biến đổi phức tạp yêu cầu phân đoạn ảnh cần phải được thiết kế hiệu quả, linh động đáp ứng được với nhiều tình huống khác nhau và kết quả bền vững Vì vậy, việc lựa chọn ngưỡng phân đoạn cần được thiết lập một cách linh động bởi hệ thống tự động hoặc theo thống kê kinh nghiệm nào đó Thông thường, quá trình phân đoạn ảnh cần xét đến các yếu tố liên quan về thông tin đối tượng trong ảnh, môi trường và nền nhằm xác định các vùng liên quan đến đối tượng khác nhau hơn là chỉ sử dụng giá trị ngưỡng cố định Các thông tin liên quan để phân đoạn thường bao gồm các yếu tố sau[10]:

- Đặc điểm về cường độ sáng của các đối tượng

- Kích thước của đối tượng

- Tỷ lệ chiếm chỗ bởi các đối tượng trong ảnh

- Số lượng đối tượng khác nhau xuất hiện trong cùng ảnh

Trang 5

Như vậy, quá trình chọn ngưỡng tự động được hiểu là quá trình xác định giá trị ngưỡng để phân đoạn ảnh được thực hiện hoàn toàn bằng chương trình mà không nhờ sự can thiệp của con người Việc xác định ngưỡng tự động được thực hiện trên cơ sở phân tích sự phân bố cường độ giá trị xám của hình ảnh Lược đồ (histogram) ảnh thường được sử dụng

để phân tích phân bố giá trị xám và sử dụng kiến thức kinh nghiệm để lựa chọn ngưỡng một cách thích hợp, thích ứng với từng trường hợp, điều kiện sáng cụ thể Khi thông tin được xác định càng mang tính tổng quát thì miền áp dụng phân đoạn càng tăng lên

Giả sử trong ảnh có n đối tượng là O1, O2,…, On bao gồm hình nền và giá trị mức xám phân bố theo các giá trị , ,… , với hàm phân bố xác

suất tương ứng là P1(z),…, P n (z) Trong nhiều ứng dụng, hàm phân bố xác suất P 1 ,…Pn của đối tượng xuất hiện trong hình có thể được biết trước thì thông tin này có thể được sử dụng nhằm xác định ngưỡng phân đoạn Khi tính chất hình học, chiếu sáng của cảnh vật điều khiển theo hàm phân bố xác

suất về giá trị cường độ sáng P i (z) thì ta không thể xác định được các giá trị

ngưỡng Hầu hết phương pháp tự động thường lựa chọn ngưỡng sử dụng kích thước đối tượng, xác suất xuất hiện và ước lượng phân phối cường độ sáng bằng cách tính giá trị lược đồ cường độ sáng của ảnh

H 3.4 Xác định ngưỡng phân đoạn bằng lược đồ ảnh

3.2.2.1 Phương pháp p-Tile

Phương pháp p-tile sử dụng các thông tin về vùng hoặc kích thước của

đối tượng để xác định ngưỡng phân đoạn ảnh Giả sử đối tượng chiếm

diện tích %p của một vùng ảnh, sử dụng thông tin này để phân đoạn lược

đồ giá trị xám của hình đầu vào ta có thể chọn một hoặc nhiều ngưỡng

với %p điểm ảnh của đối tượng Trong thực tế, phương pháp này được sử

dụng giới hạn trong một số ứng dụng đặc biệt khi có thể ước lượng được diện tích đối tượng trong trường hợp tổng quát

Trang 6

H 3.5 Phân ngưỡng p-tile sử dụng 2 ngưỡng

3.2.2.2 Phương pháp mode

Nếu các đối tượng trong hình có cùng (hoặc tương đồng) mức xám còn vùng nền có giá trị mức xám khác biệt và hàm nhiễu của giá trị mức xám bị ảnh hưởng theo hàm phân phối xác suất Gaussian thì có thể giả sử giá trị mức xám được phân phối theo các hàm phân phối xác suất chuẩn

là ( và ( Lược đồ ảnh được phân phối có hai đỉnh cực trị, như ở ví dụ minh họa trên xác định ngưỡng phân đoạn bằng lược đồ cường độ sáng

Trong trường hợp lý tưởng, cường độ sáng là đồng nhất, , phân phối sẽ có hai đỉnh trong một lược đồ sáng và ngưỡng được thay thế bất kỳ giữa hai đỉnh Tuy nhiên trong thực tế, hai đỉnh này không tách biệt một cách rõ ràng khi xác định đỉnh và rãnh của lược đồ xám thì ngưỡng có thể được xác định bằng giá trị điểm ảnh tương ứng với vùng đó Trong phần lớn các ứng dụng thực tế, khi lược đồ ảnh phân phối thưa ở vùng trũng thì việc phân đoạn không nhạy cảm với giá trị ngưỡng phân đoạn Bài toán xác định cực trị tại đỉnh lồi và lõm để phát hiện ngưỡng là bài toán có nghiệm không tầm thường và có nhiều phương pháp khác nhau được nghiên cứu nhằm giải quyết tìm nghiệm cho bài toán này Trong bài toán tìm ngưỡng tự động liên quan đến việc xác định các điểm lồi và điểm lõm cực trị của một điểm trên lược đồ ảnh

Trang 7

H 3.6 Cường độ xám của hình nền và các đối tượng:

(a) trường hợp lý tưởng ngưỡng T phân biệt rõ ràng , (b) trường hợp tổng quát mức xám chồng nhau, có thể xác định theo phân phối

chuẩn Gaussian ( và ( Thuật toán mô tả tìm kiếm các đỉnh cực trị phục vụ xác định ngưỡng như sau:

Thuật toán: Xác định đỉnh cho lựa chọn ngưỡng xấp xỉ

1 Tìm hai cực trị lớn nhất trong lược đồ ảnh với một khoảng cách tối

thiểu nào đó, giả sử tại các mức xám tương ứng là g i và g j.

2 Tìm điểm thấp nhất g k trong lược đồ ảnh H sao cho nó nằm giữa g i

và g j

3 Tìm đỉnh được xác định bởi min (H(g i ), H(g j ))/ H(g k)

4 Kết hợp bộ giá trị (g i , g j , g k) với đỉnh cao nhất để xác định ngưỡng

phân đoạn ảnh Giá trị g k là ngưỡng tốt để phân tách đối tượng

tương ứng với g i và g j

Cách tiếp cận này có thể tạo ra các hình chứa đối tượng với giá trị cường

độ xám trung bình khác nhau Giả sử có n đối tượng với hàm mật độ phân

bố của giá trị cường độ xám lần lượt xác định theo ( , ( và ảnh nền với cường độ xám phân bố theo ( Nếu các giá trị trung bình quá khác biệt, giá trị phương sai nhỏ và không có

đối tượng nào có kích thước quá nhỏ thì lược đồ ảnh sẽ chứa n+1 đỉnh Vị trí các rảnh T1, T2,…, Tn có thể được xác định và các điểm ảnh với mức xám

trong mỗi khoảng [T i , T i+1] có thể được gán cho đối tượng tương ứng

H 3.7 Lược đồ cường độ xám (histogram) dùng để xác định ngưỡng cho

các đối tượng với các giá trị mức xám khác nhau

(a)

Miền không gian ban đầu (b)

Trang 8

3.2.2.3 Phương pháp lặp chọn ngưỡng

Phương pháp lặp lựa chọn ngưỡng bắt đầu với một ngưỡng xấp xỉ nào

đó và thực hiện liên tục quá trình lặp để tinh chỉnh ngưỡng Vấn đề này được kỳ vọng có thể lựa chọn ngưỡng mới từ ngưỡng đã được chọn trước

đó sao cho việc phân đoạn được tốt hơn Quá trình điều chỉnh ngưỡng đóng vai trò rất quan trọng quyết định đến thành công của cách tiếp cận này và được mô tả như sau:

Thuật toán Phương pháp lặp chọn ngưỡng

1 Lựa chọn một ước lượng ngưỡng khởi tạo T Ta có thể khởi tạo

giá trị này bằng giá trị trung bình cường độ xám của ảnh

2 Chia hình ảnh thành hai nhóm R1 và R2 bằng cách sử dụng

ngưỡng T

3 Tính các giá trị trung bình cường độ xám của 2 vùng R1 và R2tương ứng là và

4 Chọn giá trị ngưỡng mới là T=

5 Lặp lại bước 2 đến 4 cho đến khi giá trị trung bình và không thay đổi

3.2.2.4 Ngưỡng thích nghi cục bộ

Nếu ánh sáng chiếu lên vật thể (kể cả nền) không đồng nhất thì các phương pháp chọn ngưỡng phân đoạn ở phần trước sẽ không phù hợp Ánh sáng không đồng nhất có thể do bóng (shadow) hoặc hướng của nguồn sáng khi chiếu lên vật thể Trong hầu hết các trường hợp, cùng một giá trị ngưỡng có thể không phù hợp để áp dụng cho toàn bộ ảnh Khác với các phương pháp trước thực hiện phân tích lược đồ mức xám ảnh áp dụng trên toàn bộ ảnh, phương pháp thích nghi cục bộ giải quyết vấn đề ánh sáng không đồng nhất hoặc phân phối không đều giá trị xám của nền, tập trung vào các vùng nhỏ của ảnh để chia ảnh thành các ảnh con nhằm tiền hành xác định ngưỡng cho mỗi vùng con đó Một số kỹ thuật đã được nghiên cứu để giải quyết phù hợp vấn đề này một cách hiệu quả như cách tiếp cận trực tiếp

Cách tiếp cận trực tiếp là phân chia ảnh thành m×m vùng ảnh con nhỏ hơn (chia thành lưới) và chọn ngưỡng T ij cho mỗi ảnh con thứ ij dựa vào

Trang 9

lược đồ xám tương ứng với Phân đoạn tổng thể thu được là tập hợp các vùng phân đoạn ảnh nhỏ Ví dụ kết quả phân đoạn thích nghi cục bộ được thể hiện như sau: Trong hình là ảnh về nền và các hạt gạo, với điều kiện ánh sáng không đều, phần trên của ảnh sáng và phần dưới của ảnh tối hơn; hình giữa là lược đồ mức xám toàn cục của ảnh gốc, nếu chọn ngưỡng đơn hoặc ngược kép cố định áp dụng cho toàn bộ ảnh sẽ

không hiệu quả; chia ảnh gốc thành m×m ảnh con và tiến hành tính lược

đồ xám và xác định ngưỡng cho cho mỗi ảnh con để phân đoạn cho ra kết quả ở hình thứ 3 (hình bên phải)

H 3.8 Phân đoạn theo phương pháp ngưỡng thích nghi cục bộ

3.2.2.5 Phân đoạn ngưỡng kép

Trong nhiều ứng dụng, giá trị xám bất kỳ phụ thuộc vào đối tượng Tuy nhiên, các giá trị xám được thêm vào phụ thuộc vào đối tượng hoặc

hình nền Trong trường hợp như vậy, ta sẽ sử dụng ngưỡng tích lũy T1đến lõi của đối tượng và sau đó sử dụng phương pháp loang ảnh để phát triển vùng đối tượng Phương pháp này phát triển vùng đối tượng phụ thuộc vào từng ứng dụng đặc biệt Cách tiếp cận chung nhất bao gồm sử dụng các ngưỡng khác nhau để xác định việc chấp nhận điểm ảnh nếu vùng lân cận chứa điểm ảnh quan trọng (điểm chính) hoặc sử dụng tính chất cường độ xám để xác định điểm ảnh có thuộc vùng đối tượng hay không Cách tiếp cận đơn giản nhất là chấp nhận tất cả điểm ảnh dưới

ngưỡng thứ hai T2 và liên kết lại thành một tập hợp các điểm

Trang 10

Thuật toán sau mô tả cách thực hiện của phân ngưỡng kép được thể hiện như sau

Thuật toán: Ngưỡng kép để phát triển vùng

1 Lựa chọn 2 ngưỡng T1 và T2 theo thuật toán chọn ngưỡng

2 Phân đoạn ảnh thành ba tập gồm R 1 , R 2 và R 3:

R 1 tập gồm các điểm ảnh có giá trị cường độ xám dưới ngưỡng T 1;

R 2 tập gồm các điểm ảnh có giá trị xám trong khoảng ngưỡng từ T 1

đến T 2;

R 3 tập gồm các điểm ảnh còn lại có giá trị cường độ xám trên

ngưỡng T 2

3 Duyệt qua mỗi điểm ảnh thuộc vùng R2, nếu điểm ảnh nào có một

vùng lân cận thuộc về R1 thì ta gán lại điểm ảnh này đến vùng R 1.

4 Lặp lại bước 3 cho đến khi không có điểm ảnh nào cần được gán lại

5 Gán lại bất cứ điểm ảnh nào còn lại ở vùng R 2 và R 3

3.2.3 Phân đoạn bằng kỹ thuật Otsu

Phương pháp phân đoạn Otsu được đề xuất bởi Nobuyuki Otsu năm 1979[14] và tên của phương pháp được gọi theo tên ông Kỹ thuật Otsu được sử dụng để tự động phân cụm ảnh dựa trên kỹ thuật phân ngưỡng hoặc chuyển đổi ảnh đa mức xám thành ảnh nhị phân Thuật toán tính ngưỡng một cách tự động dựa vào giá trị cường độ sáng của ảnh đầu vào nhằm thay thế cho việc sử dụng ngưỡng cố định trong phân đoạn ảnh Thuật toán Otsu giả sử ảnh chứa 2 lớp điểm ảnh theo lược đồ gồm hai trạng thái (điểm ảnh thuộc đối tượng và điểm ảnh thuộc nền) Sau đó thực hiện tính ngưỡng tối ưu tách thành 2 lớp sao cho sự kết hợp giữa chúng (phương sai trong lớp) là cực tiểu (tối thiểu) trong lớp và do đó phương sai các lớp là cực đại và được xác định là tổng trọng số phương sai của 2 lớp

Các trọng số 0 và 1 là xác suất của 2 lớp được phân tách bởi

ngưỡng t, phương sai của hai lớp tương ứng là 2

0

 và 12 Xác suất lớp 0,1( )t được tính từ L bin của histogram

Trang 11

1 0

1 1

1 1

0

( )( )

( )( )

( )

t

i L

i t L T i

Các xác suất và giá trị trung bình có thể tính bằng thuật toán lặp như sau:

- Tính lược đồ xám ảnh và xác suất của mỗi mức xám;

- Khởi tạo bộ trọng số i(0)và i(0);

- Thực hiện tính từng giá trị ngưỡng có thể với t=1, max(intensity)

- Cập nhật lại bộ giá trị ivà i

- Tính giá trị b2( )t

- Giá trị ngưỡng mong muốn tương ứng với giá trị cực đại của b2( )t

Việc chọn ngưỡng t=k với 0<k< max(intensity) để phân ảnh đầu vào thành hai lớp với C1 là tập hợp các điểm ảnh có giá trị bé hơn hoặc bằng

k và C2 là tập hợp các điểm ảnh có giá trị lớn hơn k Tỉ lệ lớp C1 số lượng

điểm ảnh mức k với tổng số lượng điểm ảnh được ký hiệu P1(k), tương tự

tỷ lệ lớp C2 ký hiệu là P2(k)

Trang 12

Matlab có hai hàm graythresh() và multithresh() trong công cụ Image Processing Toolbox được cài đặt tương ứng với thuật toán Otsu đơn mức

Ngày đăng: 21/05/2019, 07:41

TỪ KHÓA LIÊN QUAN

w