Mô hình Perona-Malik

Một phần của tài liệu Nghiên cứu loại trừ nhiễu và phân đoạn ảnh bằng phương pháp lọc khuếch tán phi tuyến (Trang 28 - 35)

Qua những thảo luận ở trên về lọc khuếch tán tuyến tính chúng ta đã thấy được những ưu nhược điểm của nó. Và để khắc phục những nhược điểm đó, chúng ta sẽ thảo luận về tính năng vượt trội của lọc khuếch tán phi tuyến.

Trước tiên chúng ta sẽ nói về ý tưởng cơ bản

Perona và Malik đề xuất một phương pháp khuếch tán phi tuyến để khắc phục các vấn đề cục bộ và làm mờ của lọc khuếch tán tuyến tính. Họ áp dụng một quá trình không đồng nhất làm giảm khuếch tán ở những vị trí có tính hợp lý lớn hơn các biên. Tính hợp lý này được đo bằng |∇𝑢|2 . Các bộ lọc Perona-Malik dựa trên phương trình:

𝜕𝑡𝑢 = 𝑑𝑖𝑣(𝑔(|∇𝑢|2)∇𝑢) (2.26) Và nó sử dụng các tính chất khuếch tán như

𝑔(𝑠2) = 1

Tác giả: Nguyễn Xuân Việt 27 Mặc dù Perona và Malik được đặt tên cho bộ lọc không đẳng hướng của họ, nhưng ở đây nó sẽ được coi là một mô hình đẳng hướng, vì nó sử dụng một khuếch tán vô hướng có giá trị mà không phải là một tensor khuếch tán.

Có một điều thú vị là tồn tại một mối quan hệ giữa (2.26) với động lực học thần kinh nhận thức ánh sáng: năm 1984 Cohen và Grossberg [94] đã đề xuất một mô hình vỏ não thị giác sơ cấp với các hiệu ứng ức chế tương tự như trong mô hình Perona- Malik.

Những thí nghiệm của Perona và Malik thì rất ấn tượng và trực quan: các biên vẫn được duy trì ổn định trong một thời gian rất dài. Nó đã được chứng minh rằng việc dò biên dựa trên quá trình này nhanh hơn so với dò biên Canny tuyến tính, thậm chí không áp dụng triệt tiêu cực đại không và hạn chế hiện tượng trễ. Điều này là do sự khuếch tán và dò biên tương tác với nhau trong một quá trình duy nhất thay vì luôn bị coi là hai quá trình độc lập được áp dụng về sau.

Tăng cường biên

Để nghiên cứu hoạt động của bộ lọc Perona-Malik ở các biên, chúng ta sẽ xét trường hợp không gian một chiều. Điều này sẽ làm đơn giản hóa phép biểu diễn và mô tả hoạt động chính khi gần một biên thẳng một ảnh hai chiều xấp xỉ như một hàm của một biến.

Đối với khuếch tán (2.27) suy ra hàm thông lượng 𝛷(𝑠) ≔ 𝑠𝑔(𝑠2) thỏa mãn

𝛷′(𝑠) ≥ 0 cho |s| ≤ λ, và 𝛷′(𝑠) < 0 cho |s| > λ, xem Hình 2.2. khi đó (2.26) có thể được viết lại như sau

𝜕𝑡𝑢 = 𝛷′(𝑢𝑥)𝑢𝑥𝑥 (2.28) Chúng ta thấy rằng mặc dù khuếch tán không âm của nó mô hình Perona-Malik loại parabol thuận cho |𝑢𝑥| ≤ 𝜆, loại parabol nghịch cho |𝑢𝑥| > 𝜆.

Tác giả: Nguyễn Xuân Việt 28

Hình 2.2 (a) Khuếch tán 𝑔(𝑠2) ; (b) Hàm thông lượng Φ(s)

Do đó, λ đóng vai trò của một tham số tương phản phân ly thuận (độ tương phản thấp) từ các vùng khuếch tán nghịch (độ tương phản cao).

Không phải là khó để xác minh rằng bộ lọc Perona-Malik làm tăng độ dốc tại các điểm uốn của các biên trong một vùng nghịch: nếu tồn tại một giải pháp làm trơn u một cách đầy đủ nó thỏa mãn

𝜕𝑡(𝑢𝑥2) = 2𝑢𝑥𝜕𝑥(𝑢𝑡) = 2𝛷′′(𝑢𝑥)𝑢𝑥𝑢𝑥𝑥2 + 2𝛷′(𝑢𝑥)𝑢𝑥𝑢𝑥𝑥𝑥 (2.29) Một vị trí 𝑥0 nơi mà 𝑢𝑥2 đạt cực đại tại một số thời điểm t được đặc trưng bởi

𝑢𝑥𝑢𝑥𝑥 = 0 và 𝑢𝑥𝑢𝑥𝑥𝑥 ≤ 0. Do vậy

(𝜕𝑡(𝑢𝑥2))(𝑥0, 𝑡) ≥ 0 𝑐ℎ𝑜 |𝑢𝑥(𝑥0, 𝑡)| > 𝜆 (2.30) Trong trường hợp hai chiều, (2.28) được thay thế bởi [12]

𝜕𝑡𝑢 = 𝛷′(∇𝑢)𝑢𝜂𝜂 + 𝑔(|∇𝑢|2)𝑢𝜉𝜉 (2.31) Trong đó tọa độ ξ và η biểu thị hướng vuông góc và song song với ∇𝑢 tương ứng. Do vậy, chúng ta có khuếch tán thuận dọc theo các đường đẳng phốt (tức là các đường của mức xám không đổi) được kết hợp với khuếch tán thuận nghịch dọc theo các luồng (đường biến thiên mức xám tối đa).

Chúng ta thấy rằng hoạt động khuếch tán thuận nghịch không chỉ giới hạn khuếch tán đặc biệt (2.27) mà còn xuất hiện trong tất cả các khuếch tán 𝑔(𝑠2) làm suy giảm nhanh chóng gây ra các hàm thông lượng không đơn điệu 𝛷(𝑠) = 𝑠𝑔(𝑠2). Việc làm

Tác giả: Nguyễn Xuân Việt 29 giảm nhanh chóng các khuếch tán được hướng tới một cách rõ ràng trong phương pháp Perona-Malik khi nó cho kết quả mong muốn về việc làm mờ các dao động nhỏ và làm nét các biên. Do vậy, nó là lý do chính cho các kết quả ấn tượng một cách rõ ràng của kỹ thuật khôi phục này.

Điều đó chứng tỏ rằng giá trị tối ưu cho tham số tương phản λ phải phụ thuộc vào vấn đề này. Một số đề xuất đã được thực hiện để tạo thuận lợi cho một sự lựa chọn như vậy trong thực tế, ví dụ việc thích ứng với nó để một điểm phân vị được chỉ định trong tích gradient histogramme, bằng cách sử dụng các tính chất thống kê của việc thiết lập các vùng được coi là phẳng, hoặc ước tính bằng các phương thức hình học của vùng ảnh.

Bài toán giả định sai (điều kiện liệt)

Thật không may, các phương trình thuận nghịch của Perona-Malik gây ra một số vấn đề lý thuyết. Mặc dù không có lý thuyết tổng quan cho quá trình parabol phi tuyến, nhưng có tồn tại các khuôn khổ nhất định cho phép thành lập các kết quả giả định đúng cho một lớp lớn các phương trình. Xét ba ví dụ như sau:

 Cho S(N) biểu thị tập các ma trận đối xứng N x N và Hess(u) Hessian của u. Các bất đẳng thức vi sai cổ điển dựa trên bổ đề Nagumo-Westphal yêu cầu khai triển phương trình phi tuyến cơ bản

𝜕𝑡 = 𝐹(𝑡, 𝑥, 𝑢, ∇𝑢, 𝐻𝑒𝑠𝑠(𝑢)) (2.32) Thỏa mãn tính chất đơn điệu

𝐹(𝑡, 𝑥, 𝑟, 𝑝, 𝑌) ≥ 𝐹(𝑡, 𝑥, 𝑟, 𝑝, 𝑋) (2.33) Với tất cả 𝑋, 𝑌 ∈ 𝑆(2) trong đó Y – X là bán toàn phương dương.

 Cùng một yêu cầu cần thiết cho việc áp dụng lý thuyết về các giải pháp. Một giới thiệu chi tiết vào khuôn khổ này có thể tìm thấy trong một bài báo của Crandall, Ishii và Lions [103].

 Cho H là một không gian Hilbert với tích vô hướng và A: H  H. Để áp dụng các khái niệm của các hoạt động đơn điệu tối đa cho vấn đề này

Tác giả: Nguyễn Xuân Việt 30

𝑑𝑢

𝑑𝑡 + 𝐴𝑢 = 0,

(2.34)

𝑢(0) = 𝑓 (2.35)

Phải đảm bảo rằng A là đơn điệu,

(𝐴𝑢 − 𝐴𝑣, 𝑢 − 𝑣) ≥ 0 ∀𝑢, 𝑣 ∈ 𝐻 (2.36) Chúng ta thấy rằng hàm thông lượng không đơn điệu của quá trình Perona-Malik ngụ ý rằng (2.32) không được thỏa mãn cũng không được định nghĩa bởi 𝐴𝑢 ≔ −𝑑𝑖𝑣((𝑔|∇𝑢|2)∇𝑢) là đơn điệu. Do vậy, không khuôn khổ nào được áp dụng để đảm bảo các kết quả giả định đúng.

Một lý do tại sao người ta bi quan về giả định đúng của phương trình Perona- Malik là một kết quả của Hollig [187]. Ông đã xây dựng một quá trình khuếch tán thuận nghịch mà có thể có nhiều giải pháp. Mặc dù quá trình khác với quá trình Perona-Malik, nhưng nó là một trong báo hiệu điều gì có thể xảy ra. Năm 1994 phỏng đoán chung là các bộ lọc Perona-Malik có thể có các giải pháp không ổn định, nhưng người ta cũng không nên mong đợi tính độc đáo cũng như tính ổn định. Trong khi đó, nhiều kết quả lý thuyết có giá trị cung cấp những hiểu biết sâu hơn về tính thực tế về bài toán giả định sai của các bộ lọc Perona-Malik.

Kawohl và Kutev đã chứng minh rằng quá trình Perona-Malik không có giải pháp chung cho dữ liệu ban đầu liên quan đến khuếch tán nghịch. Sự tồn tại của giải pháp cục bộ vẫn chưa được chứng minh. Tuy nhiên, nếu chúng tồn tại, Kawohl và Kutev đã chỉ ra rằng những giải pháp này là duy nhất và thỏa mãn nguyên lý max-min. Hơn nữa, theo các giả thuyết đặc biệt trên các dữ liệu ban đầu thì có thể thiết lập một nguyên lý so sánh.

Các kết quả của You và cộng sự [446] đưa ra bằng chứng cho thấy quá trình Perona-Malik là không ổn định đối với nhiễu của ảnh ban đầu. Họ đã chỉ ra rằng hàm năng lượng dẫn đến quá trình Perona-Malik khi sự suy giảm đường dốc nhất có một số lượng vô hạn các cực tiểu chung dày đặc trong không gian ảnh. Mỗi cực tiểu tương ứng một ảnh liên tục từng mảng, và các ảnh ban đầu khác nhau có thể kết thúc trong cực tiểu khác nhau với 𝑡 → ∞ .

Tác giả: Nguyễn Xuân Việt 31 Phương trình khuếch tán thuận nghịch của Perona-Malik không phi tự nhiên khi họ mới xem xét lần đầu tiên: bên cạnh tầm quan trọng của chúng trong thị giác máy họ đã đề xuất một mô hình toán học cho biến đổi nhiệt và khối lượng trong một dòng cắt nhiễu được phân tầng một cách ổn định. Một mô hình như vậy được sử dụng để giải thích nhiệt độ không đổi theo từng bước hoặc độ mặn trong đại dương. Các phương trình có liên quan cũng đóng một vai trò quan trọng trong các dao động phổ biến và tính đàn hồi.

Về khía cạnh số, tính bất ổn chủ yếu là do quan sát được gọi là hiệu ứng bậc thang, một biên đường sigma khai triển thành các đoạn tuyến tính theo mảng được phân biệt bởi các bước nhảy. Nó đã được quan sát bởi Posmentier năm 1977 [333]. Ông đã sử dụng một phương trình Perona-Malik cho các mô phỏng số về độ mặn trong các đại dương. Bắt đầu từ một sự phân bố ban đầu làm tăng độ trơn, ông đã cho thấy việc tạo ra các nhiễu dẫn đến một biên dạng không đổi theo từng bước sau một thời gian.

Trong xử lý ảnh, các nghiên cứu số của hiệu ứng bậc thang đã được thực hiện bởi Nitzberg và Shihota [310], Frohlich và Weickert [148], và Benhamouda [36]. Tất cả các kết quả đều theo cùng một hướng: số lượng các vùng tạo ra phụ thuộc rất lớn vào hiệu ứng phân bố đều của sự rời rạc. Những sự rời rạc tốt hơn thì không đều và dẫn đến nhiều bậc hơn. Weickert và Benhamouda đã chỉ ra rằng hiệu ứng phân bố đều của một rời rạc vi sai hữu hạn tiêu chuẩn là đủ để đưa các bộ lọc Perona-Malik tới một vấn đề ban đầu được giả định đúng cho một hệ thống phi tuyến của các phương trình vi phân thông thường. Cách giải chung của nó thỏa mãn nguyên lý max-min và hội tụ cho cho một trạng thái ổn định không đổi.

Cũng có tồn tại một giải thích về mặt rời rạc tại sao việc tăng bậc về bản chất là quan sát được sự bất ổn: trong không gian 1-D, các rời rạc FD tiêu chuẩn là đơn điệu, bảo đảm rằng không có thêm dao động xảy ra trong khai triển. Điều này đã được chứng minh bởi Dzu Magaziewa [123] trong trường hợp bán rời rạc và bởi Benhamouda trong trường hợp rời rạc với một sự rời rạc thời gian rõ ràng.

Tác giả: Nguyễn Xuân Việt 32 Perona và Malik đã phủ định giả định về tiên đề quy mô không gian tuyến tính của Koenderink mà việc làm trơn nên xử lý tất cả các điểm không gian và các mức quy mô như nhau. Thay vào đó, họ yêu cầu các biên vùng phải được sắc nét và trùng với các biên về tất cả ngữ nghĩa ở mỗi cấp phân giải, và việc làm trơn trong vùng đó phải được ưu tiên để làm trơn liên vùng. Các tính chất này được quan tâm trong thực tế, khi chúng đảm bảo rằng các kiến trúc có thể phát hiện được một cách dễ dàng và các vấn đề tương ứng có thể được bỏ qua. Các thí nghiệm đã chứng minh rằng các bộ lọc Perona-Malik thỏa mãn những yêu cầu này khá tốt.

Để thiết lập một tính chất quy mô không gian làm trơn cho quá trình khuếch tán phi tuyến này, một cách tự nhiên nó sẽ được chứng minh theo nguyên lý max-min, để cho biết rằng có tồn tại một giải pháp làm trơn toàn diện. Kể từ khi vấn đề tồn tại được sử dụng là nút cổ chai trong quá khứ, sự thử nghiệm đầu tiên là do Kawohl và Kutev những người đã thiết lập một nguyên lý cực trị về giải pháp không ổn định cục bộ cho các bộ lọc Perona-Malik. Tất nhiên, điều này chỉ thỏa mãn một phần, vì theo lý thuyết quy mô không gian người ta quan tâm tới việc có một nguyên lý cực trị cho toàn bộ khoảng thời gian [0, ∞) .

Tuy nhiên, các thử nghiệm khác để áp dụng các khuôn khổ quy mô không gian cho quá trình Perona-Malik vẫn chưa thành công.

 Salden, Florack và Eberly đã đề xuất để thực hiện lý thuyết quy mô không gian tuyến tính cho trường hợp phi tuyến bằng cách xem xét quá trình khuếch tán phi tuyến. Nhưng các bộ lọc Perona-Malik lại không thuộc về lớp này.

 Alvarez, Guichard, Lions và Morel [12] đã phát triển một tiên đề quy mô không gian phi tuyến bao gồm lý thuyết quy mô không gian tuyến tính cũng như quá trình hình thái phi tuyến. Tiên đề làm trơn của họ là một giả định đơn điệu (nguyên lý so sánh) đòi hỏi phải có quy mô không gian để duy trì:

𝑓 ≤ 𝑔 => 𝑇𝑡𝑓 ≤ 𝑇𝑡𝑔 ∀𝑡 ≥ 0 (2.37) Tính chất này liên quan chặt chẽ với nguyên lý max-min và 𝐿∞ -ổn định của giải pháp. Tuy nhiên, mô hình Perona-Malik không phù hợp với khuôn khổ này, bởi vì

Tác giả: Nguyễn Xuân Việt 33 giải pháp không ổn định cục bộ của nó thỏa mãn nguyên lý so sánh chỉ trong một khoảng thời gian giới hạn, chứ không phải cho tất cả > 0.

Một phần của tài liệu Nghiên cứu loại trừ nhiễu và phân đoạn ảnh bằng phương pháp lọc khuếch tán phi tuyến (Trang 28 - 35)

Tải bản đầy đủ (PDF)

(131 trang)