Ảnh sau khi chạy Template EdgeDetect

Một phần của tài liệu (LUẬN văn THẠC sĩ) nghiên cứu ứng dụng công nghệ mạng nơron tế bào vào bài toán phân đoạn ảnh (Trang 34)

Chƣơng II

BÀI TOÁN PHÂN ĐOẠN ẢNH 2.1. Giới thiệu chung về phân đoạn ảnh

*. Phát hiện biên ảnh

- Điểm Biên: Một điểm ảnh được coi là điểm biên nếu có sự thay đổi nhanh hoặc đột ngột về mức xám (hoặc màu). Ví dụ trong ảnh nhị phân, điểm đen gọi là điểm biên nếu lân cận nó có ít nhất một điểm trắng.

- Đường biên (đường bao: boundary): tập hợp các điểm biên liên tiếp tạo thành một đường biên hay đường bao.

- Ỷ nghĩa của đường biên trong xử ỉỷ: ý nghĩa đầu tiên: đường biên là một loại đặc trưng cục bộ tiêu biểu trong phân tích, nhận dạng ảnh. Thứ hai, người ta sử dụng biên làm phân cách các vùng xám (màu) cách biệt. Ngược lại, người ta cũng sử dụng các vùng ảnh để tìm đường phân cách.

- Tầm quan trọng của biên: để thấy rõ tầm quan trọng của biên, xét ví dụ sau: khi người họa sĩ muốn vẽ một danh nhân, họa sĩ chỉ cần vẽ vài đường nứt tốc họa mà không cần vẽ một cách đầy đủ.

- Mô hình biểu diễn đường biên, theo toán học: điểm ảnh có sự biến đổi mức xám u(x) một cách đột ngột theo hình dưới.

Hình 2.1. Đường bao của ảnh

Các khái niệm và định nghĩa tóm tắt trên là cơ sở giúp ta hiểu và dùng để hiểu cách xây dựng, thiết kế các kỹ thuật phát hiện biên ảnh.

Các bước của phân tích ảnh có thể mô tả theo sơ đồ dưới đây. Việc dò và tìm biên ảnh là một trong các đặc trưng thuộc khối trích chọn đặc trưng.

Hình 2.2. Các bước xử lý của phân tích ảnh

Như vậy việc phát hiện biên chính là tìm ra ranh giới giữa các vùng ảnh trong thao tác phân đoạn ảnh

*. Phân đoạn ảnh

- Phân đoạn ảnh: Để phân tích các đối tượng trong ảnh, cần phải phân biệt được các đối tượng cần quan tâm với phần còn lại của ảnh, hay còn gọi là nền ảnh. Những đối tượng này có thể tìm ra được nhờ các kỹ thuật phân đoạn ảnh, theo nghĩa tách phần tiền cảnh ra khỏi hậu cảnh trong ảnh.

- Phân đoạn ảnh là bước then chốt trong xử lý ảnh. Giai đoạn này nhằm phân tích ảnh thành những thành phần có cùng tính chất nào đó dựa theo biên hay các vùng liên thông. Tiêu chuẩn để xác định các vùng liên thông có thể là cùng mức xám, cùng màu hay cùng độ nhám... Trước hết cần làm rõ khái niệm "vùng ảnh" và đặc điểm vật lý của vùng.

Ví dụ ảnh phân đoạn:

Ảnh ban đầu sau khi phân đoạn đã được phân thành các vùng màu riêng biệt .

* Phân vùng ảnh

- Vùng ảnh là một chi tiết, một thực thể trong toàn cảnh. Nó là một tập hợp các điểm có cùng hoặc gần cùng một tính chất nào đó : mức xám, mức màu, độ nhám… Vùng ảnh là một trong hai thuộc tính của ảnh. Nói đến vùng ảnh là nói đến tính chất bề mặt. Ðường bao quanh một vùng ảnh là biên ảnh. Các điểm trong một vùng ảnh có độ biến thiên giá trị mức xám tương đối đồng đều hay tính kết cấu tương đồng.

- Dựa vào đặc tính vật lý của ảnh, người ta có nhiều kỹ thuật phân vùng : phân vùng dựa theo miền liên thông gọi là phân vùng dựa theo miền đồng nhất hay miền kề; phân vùng dựa vào biên gọi là phân vùng biên. Ngoài ra còn có các kỹ thuật phân vùng khác dựa vào biên độ, phân vùng dựa theo kết cấu.

2.2. Các hƣớng tiếp cận phân đoạn ảnh

Phân đoạn ảnh là chia ảnh thành các vùng không trùng lắp. Mỗi vùng gồm một nhóm pixel liên thông và đồng nhất theo một tiêu chí nào đó. Tiêu chí này phụ thuộc vào mục tiêu của quá trình phân đoạn. Ví dụ như đồng nhất về màu sắc, mức xám, kết cấu, độ sâu của các layer… Sau khi phân đoạn mỗi pixel chỉ thuộc về một vùng duy nhất. Để đánh giá chất lượng của quá trình phân đoạn là rất khó. Vì vậy trước khi phân đoạn ảnh cần xác định rõ mục tiêu của quá trình phân đoạn là gì. Xét một cách tổng quát, ta có thể chia các hướng tiếp cận phân đoạn ảnh thành ba nhóm chính như sau:

Các kỹ thuật phân đoạn ảnh dựa trên không gian đặc trưng. Các kỹ thuật dựa trên không gian ảnh.

Các kỹ thuật dựa trên các mô hình vật lý.

Nếu giả định màu sắc bề mặt của các đối tượng trong ảnh là một thuộc tính bất biến và các màu sắc đó được ánh xạ vào một không gian màu nào đó, vậy thì đối với mỗi đối tượng trong ảnh như là một cụm các điểm trong không gian màu đó. Mức độ phân tán của các điểm trong trong một cụm được xác định chủ yếu bởi sự khác biệt về màu sắc. Một cách khác, thay vì ánh xạ các pixel trong ảnh vào một không gian màu cụ thể, ta xây dựng một histogram dựa trên các đặc trưng màu cho ảnh đó (ví dụ như Hue), và thông thường, các đối tượng trong ảnh sẽ xuất hiện như các giá trị đỉnh trong histogram đó. Do đó, việc phân vùng các đối tượng trong ảnh tương ứng với việc xác định các cụm – đối với cách biểu diễn thứ nhất – hoặc xác định các vùng cực trị của histogram – đối với cách biểu diễn thứ hai.

2.2.2. Các phƣơng pháp dựa trên không gian ảnh

Hầu hết những phương pháp được đề cập trong phần trên đều hoạt động dựa trên các không gian đặc trưng của ảnh(thông thường là màu sắc). Do đó, các vùng ảnh kết quả là đồng nhất tương ứng với các đặc trưng đã chọn cho từng không gian. Tuy nhiên, không có gì đảm bảo rằng tất cả các vùng này thể hiển một sự cô đọng về nội dung xét theo ý nghĩa không gian ảnh. Mà đặc tính này là quan trọng thứ hai sau đặc tính về sự thuần nhất của các vùng ảnh. Do các phương pháp gom cụm cũng như xác định ngưỡng đã nêu đều bỏ qua thông tin về vị trí của các pixel trong ảnh.

Trong các báo cáo khoa học về phân vùng ảnh mức xám, có khá nhiều kỹ thuật cố thực hiện việc thoả mãn cùng lúc cả hai tiêu chí về tính đồng nhất trong không gian đặc trưng của ảnh và tính cô đọng về nội dung ảnh. Tuỳ theo các kỹ thuật mà các thuật giải này áp dụng, chúng được phân thành các nhóm sau:

Các thuật giải áp dụng kỹ thuật chia và trộn vùng. Các thuật giải áp dụng kỹ thuật tăng trưởng vùng.

Các thuật giải áp dụng lý thuyết đồ thị. Các giải thuật áp dụng mạng neural. Các giải thuật dựa trên cạnh.

2.2.3. Các phƣơng pháp dựa trên mô hình vật lý

Tất cả các giải thuật được xem xét qua, không ít thì nhiều ở mặt nào đó đều có khả năng phát sinh việc phân vùng lỗi trong các trường hợp cụ thể nếu như các đối tượng trong ảnh màu bị ảnh hưởng quá nhiều bởi các vùng sáng hoặc bóng mờ, các hiện tượng này làm cho các màu đồng nhất trong ảnh thay đổi nhiều hoặc ít một cách đột ngột. Và kết quả là các thuật giải này tạo ra các kết quả phân vùng quá mức mong muốn so với sự cảm nhận các đối tượng trong ảnh bằng mắt thường. Để giải quyết vấn đề này, các giải thuật phân vùng ảnh áp dụng các mô hình tương tác vật lý giữa bề mặt các đối tượng với ánh sáng đã được đề xuất. Các công cụ toán học mà các phương pháp này sử dụng thì không khác mấy so với các phương pháp đã trình bày ở trên, điểm khác biệt chính là việc áp dụng các mô hình vật lý để minh hoạ các thuộc tính phản chiếu ánh sáng trên bề mặt màu sắc của các đối tượng.

Cột mốc quan trọng trong lĩnh vực phân vùng ảnh dựa trên mô hình vật lý được Shafer đặt ra. Hạn chế chính của giải thuật này là nó chỉ làm việc trên các vật chất điện môi không đồng nhất.

2.3. Một số phƣơng pháp phân đoạn ảnh

2.3.1. Phƣơng pháp phân đoạn dựa vào ngƣỡng cố định

Đây là phương pháp chọn ngưỡng độc lập với dữ liệu ảnh. Nếu biết trước là chương trình ứng dụng sẽ làm việc với các ảnh có độ tương phản rất cao, trong đó các đối tượng quan tâm rất tốt có nền gần như là đồng nhất và rất sáng thì việc chọn ngưỡng T =128 (xét trên thang độ sáng từ 0 đến 255) là một giá trị chọn khá chính xác. Chính xác ở đây hiểu theo nghĩa là số các điểm ảnh bị phân lớp sai là cực tiểu.

Ngưỡng là một khái niệm khá quen thuộc trong xử lý ảnh cũng như rất nhiều giải thuật khác. Nó dùng để chỉ một giá trị mà người ta dựa vào để phân hoạch một tập hợp thành các miền phân biệt. Chia ngưỡng cường độ và gán điểm ảnh vào từng lớp khác nhau. Cách giải quyết dựa trên histogram của ảnh.[6]

Ưu điểm của phương pháp này là đơn giản, và được dùng cho phân đoạn sơ bộ.

Ý tưởng chính của phương pháp này là chia một ảnh ban đầu ra làm nhiều vùng nhỏ. Sau đó, dựa vào nguỡng cục bộ của từng vùng để trộn các vùng nhỏ thành các vùng có cường độ xám nằm trong một ngưỡng cho phép.

Tạo ngưỡng được sử dụng để trích xuất một đối tượng ra khỏi nền bằng cách chỉ định một giá trị cường độ T cho mỗi điểm ảnh như vậy mà mỗi điểm ảnh là một trong hai phân loại như là một điểm đối tượng hoặc một điểm nền.

Nếu dựa vào số lượng ngưỡng áp dụng cho cùng một tập dữ liệu người ta sẽ phân ra các phương pháp ứng dụng ngưỡng đơn, ngưỡng kép, hay đa ngưỡng. Nếu dựa vào sự biến thiên của giá trị Ngưỡng, trong cùng phạm vi ứng dụng người ta sẽ phân ra các phương pháp dùng ngưỡng cố định và không cố định. Ngưỡng không cố định nghĩa là giá trị của nó sẽ thay đổi tùy theo sự biến thiên của tập dữ liệu theo không gian và thời gian. Thông thường giá trị này được xác định thông qua khảo sát tập dữ liệu bằng phương pháp thống kê.

Biên độ của các tính chất vật lý của ảnh (như độ phản xạ, độ truyền sáng, màu sắc...) là một đặc tính đơn giản và hữu ích. Nếu biên độ đủ lớn đặc trưng cho ảnh thì có thể dùng ngưỡng biên độ để phân đoạn ảnh. Thí dụ, biên độ trong bộ cảm biến hồng ngoại có thể phản ảnh vùng có nhiệt độ thấp hay nhiệt độ cao. Đặc biệt, kỹ thuật phân ngưỡng theo biên độ rất có ích đối với ảnh nhị phân như văn bản in, đồ họa, ảnh màu hay ảnh X - quang.

Việc chọn ngưỡng rất quan trọng. Nó bao gồm các bước:

- Bước 1: Xem xét lược đồ xám của ảnh để xác định các đỉnh và các

khe. Nếu ảnh có dạng rắn lượn (nhiều đỉnh và khe), các khe có thể dùng để chọn ngưỡng.

- Bước 2: Chọn ngưỡng z sao cho một phần xác định trước  của toàn

bộ số mẫu là thấp hơn z.

- Bước 3: Điều chỉnh ngưỡng dựa trên lược đồ xám của các điểm lân

cận.

- Bước 4: Chọn ngưỡng theo lược đồ xám của những điểm thỏa mãn

tiêu chuẩn chọn.

- Bước 5: Khi có mô hình phân lớp xác định, việc xác định ngưỡng dựa

vào tiêu chuẩn xác suất nhằm cực tiểu xác xuất sai số hoặc dựa vào một số tính chất khác của luật Bayes.

Xét một thuật toán đơn giản trong kỹ thuật này là: Giả sử sét đến các đối tượng sáng (Object) trên nền tối (background), một tham số Z - gọi là ngưỡng độ sáng, sẽ được chọn cho một ảnh f[x,y] theo cách:

If f[x,y] ≥Z f[x,y] = object = 1

Else f[x,y] = Background = 0

Ngược lại, đối với các đối tượng tối trên nền sáng có thuật toán như sau:

If f[x,y] <Z f[x,y] = object = 1 Else f[x,y] = Background = 0

Vậy vấn đề chính là nên chọn ngưỡng Z như thế nào để việc phân vùng đạt được kết quả cao nhất?

- Đánh giá thuật toán

Một phương pháp phân đoạn ảnh mới đã được đưa ra. Trong phương pháp này xác định ngưỡng tối ưu bằng cách xem xét đến hình thái ảnh. Phương pháp này đã kết hợp một cách hiệu quả những thông tin về độ đồng

nhất và thông tin về tính ổn định khi thuộc vào một lớp của một điểm dựa trên histogram. Nguyên lý cơ bản để thực hiện công việc này là dựa trên mệnh đề phát biểu rằng trong hầu hết những ảnh trong thực tế, tại ngưỡng tối ưu, các phần tử có độ không ổn định cao nhất thì đều xuất hiện trong lân cận của biên độ đối tượng. Được dẫn đường bởi mệnh đề này, đã chứng minh rằng thông tin về độ đồng nhất có thể được sử dụng như thế nào trong việc kết hợp với độ không ổn định để nâng cao chất lượng cho ngưỡng tối ưu.

2.3.2. Phƣơng pháp phân đoạn dựa vào miền đồng nhất 2.3.2.1. Giới thiệu chung

Kỹ thuật phân vùng ảnh thành các miền đồng nhất dựa vào các tính chất quan trọng nào đó của điểm ảnh. Việc lựa chọn các tính chất của miền sẽ xác định tiêu chuẩn phân vùng. Tính đồng nhất của một miền ảnh là điểm chủ yếu xác định tính hiệu quả của việc phân vùng. Các tiêu chuẩn hay được dùng là sự thuần nhất về mức xám, màu sắc đối với ảnh màu, kết cấu sợi và chuyển động.

Giả sử rằng một miền ảnh X phải được phân thành N vùng khác nhau: R1,...,RN và nguyên tắc phân đoạn là một vị từ của công thức P(R). Việc phân đoạn ảnh chia tập X thành các tập con Ri, i = 1..N phải thỏa mãn:

- Các vùng Ri, i=1..N phải lấp kín hoàn toàn ảnh: - Hai vùng khác nhau phải là những tập hợp rời nhau:

Ri Rj = 0 với i ≠ j - Mỗi vùng Ri phải có tính đồng nhất:

P(Ri) = TRUE với i = 1..N

- Nếu Ri, Rj là hai vùng rời nhau thì (Ri Rj) phải là một vùng ảnh không đồng nhất:

Kết quả của việc phân vùng ảnh phụ thuộc vào dạng của vị từ P và các đặc trưng được biểu diễn bởi vector đặc trưng. Thường thì vị từ P có dạng P(R,X,z), trong đó X là vector đặc trưng gắn với một điểm ảnh và z là một tập hợp các tham số ( thường là các ngưỡng). Trong trường hợp đơn giản nhất, vector đặc trưng X chỉ chứa giá trị mức xám của ảnh I(k,l) và vector ngưỡng chỉ gồm một ngưỡng Z. Một nguyên tắc phân đoạn đơn giản có công thức:

P(R): f(k,l) <Z

Trong trường hợp các ảnh màu, vector đặc trưng X có thể là ba thành phần ảnh RGB [fR(k,l), fG(k,l), fB(k,l)]Z. Lúc đó luật phân ngưỡng có dạng:

P(R,x,z): ((fR(k,l)<ZR)&&(fG(k,l)<ZR)&&(fB(k,l)<ZR))

- Các phương pháp phân vùng theo miền đồng nhất thường áp dụng là: - Phương pháp tách cây tứ phân

- Phương pháp cục bộ - Phương pháp tổng hợp

2.3.2.2. Phƣơng pháp tách cây tứ phân

Phương pháp tách cây tứ phân dựa trên nguyên tắc kiểm tra tính hợp thức của tiêu chuẩn đồng nhất một cách tổng thể trên miền lớn. Nếu tiêu chuẩn được thỏa mãn, việc phân đoạn xem như kết thúc. Trong trường hợp ngược lại, chia miền đang xét thành 4 miền nhỏ hơn, áp dụng đệ quy bằng phương pháp trên cho mỗi miền nhỏ hơn cho đến khi tất cả các miền đều thỏa mãn tiêu chuẩn đồng nhất.

Thuật toán được mô phỏng như sau: procedure PhanDoan(Mien) Begin

If miền đang xét không thỏa Then Begin

For i =1 to 4 Do PhanDoan(Zi) End

Else Exit End;

Thuật toán này tạo nên một cây mà mỗi nút cha có 4 nút con ở mọi mức, trừ mức ngoài cùng. Vì thế cây này có tên là tứ phân. Gốc của cây là ảnh ban đầu, một vùng thỏa tiêu chuẩn tạo nên một nút lá, nếu không sẽ tạo nên một nút nhánh.

Giả sử chọn tiêu chuẩn phân vùng là màu sắc và quy ước mọi điểm của vùng là màu trắng sẽ tạo nên một nút lá trắng và tương tự như vậy với nút lá đen. Nút màu ghi có nghĩa là vùng không thuần nhất và phải tiếp tục chia. Hình 2.1 minh họa thuật toán tách cây tứ phân: ảnh gốc (a) được chia thành 4 phần được kết quả phân mức 1 (b), tiếp tục thực hiện đối với các phần nhỏ, ta

Một phần của tài liệu (LUẬN văn THẠC sĩ) nghiên cứu ứng dụng công nghệ mạng nơron tế bào vào bài toán phân đoạn ảnh (Trang 34)

Tải bản đầy đủ (PDF)

(80 trang)