Khuếch tán phi tuyến là một kỹ thuật xử lý ảnh rất hiệu quả, có thể sử dụng để giảm nhiễu ảnh và rút gọn ảnh. Khuếch tán phi tuyến dựa trên một sự tương tự của các quá trình khuếch tán vật lý. Các quá trình khuếch tán vật lý được mô hình hóa bằng phương trình vi phân sau:
𝜕𝑢 𝜕𝑡 = 𝑑𝑖𝑣(𝐷 ∙ ∇𝑢) (3.57) Cho 𝑢0 = (𝑢0,𝑖,𝑗) 𝑖,𝑗=0 𝑁−1
là một tín hiệu nhiễu rời rạc được khảo sát trên hình vuông
Ω = [0, 𝑁] × [0, 𝑁] được coi là tổng của ảnh ban đầu 𝑓 và một số nhiễu Gauss. Đầu tiên chúng ta áp dụng khuếch tán phi tuyến cho tín hiệu nhiễu 𝑢0, và sau đó áp dụng biến đổi curvelet để nhân dạng và tách biên. Chiến lược áp dụng xử lý khuếch tán nhằm tránh các đỉnh/kết cấu hẹp bị làm trơn quá nhiều như trong khuếch tán thông thường. Nó có thể bảo toàn biên độ tín hiệu của các thành phần chi tiết tốt hơn đồng thời làm giảm các dao động pseudo-Gibbs.
Khuếch tán phi tuyến làm cho tham số khuếch tán (u) không còn là một hằng số nữa, nhưng thay vào đó khuếch tán trở thành một hàm gradient mật độ nghịch biến với các gradient cao.
𝑑𝑢/𝑑𝑡 = 𝑑𝑖𝑣( 𝑑(𝑔𝑟𝑎𝑑(𝑢)) ∗ 𝑔𝑟𝑎𝑑(𝑢) ) (3.58)
Công thức mới này cho phép thực thi giảm nhiễu ảnh mà vẫn bảo toàn được các biên. Người ta chỉ cần một số bước lặp khuếch tán để thu được một kết quả thỏa mãn. Kết quả thu được sau quá trình lọc khuếch tán phi tuyến bao gồm các tính chất quan trọng của ảnh được khôi phục. Bước tiếp theo chúng ta áp dụng biến đổi curvelet
Tác giả: Nguyễn Xuân Việt 84 như đã phân tích trong Phần 3.4.2 cho ảnh đã được khử nhiễu để thực hiện khôi phục biên.
Tác giả: Nguyễn Xuân Việt 85
Chương 4. Phân đoạn ảnh sử dụng lọc khuếch tán 4.1 Phân đoạn ảnh
Trong thị giác máy tính, phân đoạn ảnh là quá trình phân vùng một hình ảnh kỹ thuật số thành nhiều vùng ảnh (tập hợp các điểm ảnh, hay còn được biết như là những “superpixel” ). Mục đích của quá trình phân đoạn ảnh là để đơn giản hóa và thay đổi các thuộc tính đại diện cho một hình ảnh để dễ dàng phân tích. Phân đoạn ảnh thường được sử dụng để xác định vị trí của các đối tượng và các đường bao quanh một vùng ảnh (đường thẳng, đường cong) trong hình ảnh. Cụ thể hơn, phân đoạn ảnh là quá trình “gán nhãn” cho mỗi điểm ảnh trong một hình ảnh như vậy các điểm ảnh có cùng một nhãn sẽ chia sẻ chung một đặc điểm nhất định.
Kết quả của quá trình phân đoạn ảnh là một tập hợp các vùng ảnh , có thể là toàn bộ hình ảnh, hoặc một tập hợp đường viền trích ra từ hình ảnh. Mỗi điểm ảnh trong một vùng ảnh là tương tự về đặc tính hoặc tính chất được tính toán, ví dụ như màu sắc, cường độ, hoặc kết cấu. Những vùng ảnh liền kề thì có sự khác nhau rõ rệt về một tính chất đặc trưng. Khi áp dụng vào một chuỗi ảnh, điển hình như trong hình ảnh y tế, kết quả các đường viền sau khi phân đoạn có thể sử dụng để tạo dựng lại các hình ảnh 3D với sự giúp đỡ của các thuật toán nội suy như các khối Marching.
Ứng dụng của phân đoạn ảnh:
Phục hồi hình ảnh gốc
Thị giác máy
Hình ảnh y tế:
Xác định vị trí khối u và các bệnh lý
Đo khối lượng mô
Chẩn đoán, nghiên cứu cấu trúc giải phẫu
Lập kế hoạch phẫu thuật
Mô phỏng phẫu thuật ảo
Tác giả: Nguyễn Xuân Việt 86
Phát hiện đối tượng
Phát hiện người đi bộ
Phát hiện khuôn mặt
Phát hiện đèn báo giảm tốc độ
Xác định vị trí các đối tượng trong hình ảnh vệ tinh (đường, rừng, cây…)
Nhận dạng:
Nhận dạng khuôn mặt
Nhận dạng vân tay
Nhận dạng mống mắt
Hệ thống điều khiển đèn giao thông
Giám sát video
Dựa vào các đặc tính vật lý của ảnh, người ta có nhiều kỹ thuật phân đoạn:
Phân vùng theo miền đồng nhất hay miền kề
Phân đoạn biên
Phân đoạn dựa vào ngưỡng biên độ
Phân đoạn dựa vào kết cấu
4.1.1 Phân đoạn ảnh theo ngưỡng biên độ
Đây là phương pháp đơn giản nhất của phân đoạn ảnh.
Phương pháp này dựa trên một giá trị ngưỡng để biến hình ảnh mức xám thành một hình ảnh nhị phân. Ngoài ra còn có một biểu đồ ngưỡng cân bằng.
Việc chọn ngưỡng là rất quan trọng. Nó bao gồm các bước:
Xem xét lược đồ độ xám của ảnh để xác định các đỉnh và khe. Nếu ảnh có dạng rắn lượn (nhiều đỉnh và khe), các khe có thể dùng để chọn ngưỡng.
Chọn ngưỡng t sao cho một phần xác định trước của toàn bộ số mẫu là thấp hơn t.
Điều chỉnh ngưỡng dựa trên lược đồ xám của các điểm lân cận.
Chọn ngưỡng theo lược đồ xám của những điểm thỏa mãn tiêu chuẩn chọn.
Thí dụ, với ảnh có độ tương phản thấp, lược đồ của những điểm có biên độ Laplace g(m,n) lớn hơn giá trị t định trước (sao cho từ 5% đến 10% số điểm ảnh với Gradient lớn nhất sẽ coi như biên) sẽ cho phép xác định các đặc tính ảnh lưỡng cực tốt hơn ảnh gốc.
Tác giả: Nguyễn Xuân Việt 87 Khi phân vùng xong, nếu ảnh rõ nét thì việc phân vùng coi như kết thúc. Nếu không, cần điều chỉnh ngưỡng.
Khi có mô hình phân lớp xác suất, việc xác định ngưỡng dựa vào tiêu chuẩn xác suất nhằm cực tiểu xác suất sai số hoặc dựa vào một số tính chất khác của luật Bayes.
Một số phương pháp phổ biến được sử dụng trong công nghiệp bao gồm: phương pháp entropy cực đại, phương pháp của Otsu (phương sai tối đa), và xếp nhóm phương thức k.
Gần đây, các phương pháp đã được phát triển cho xác định ngưỡng trong ảnh chụp cắt lớp (CT). Ý tưởng của phương pháp là ngưỡng có nguồn gốc từ hình ảnh chụp X-quang thay vì hình ảnh tái tạo.
Các phương pháp mới cho việc sử dụng quy tắc làm mờ đa chiều dựa trên ngưỡng phi tuyến. Trong những chương trình quyết định với mỗi điểm ảnh cho một vùng ảnh là dựa trên nguyên tắc đa chiều xuất phát từ logic mờ và thuật toán phát triển dựa trên môi trường ánh sáng ảnh và ứng dụng.
4.1.2 Phương pháp xếp nhóm
Các thuật toán phương thức k là một phương pháp lặp để phân đoạn ảnh thành các cụm K. Thuật toán cơ bản như sau:
Chọn các cụm trung tâm K, theo cách ngẫu nhiên hoặc dựa trên một số phương pháp phỏng đoán.
Chỉ định mỗi điểm ảnh trong hình ảnh để xếp nhóm sao cho khoảng cách giữa điểm ảnh đó và điểm ảnh trung tâm là tối thiểu
Tính toán lại các nhóm trung tâm bằng cách tính trung bình tất cả các điểm ảnh trong một nhóm
Lặp lại bước 2 và 3 cho đến khi đạt được sự hội tụ (tức là không có điểm ảnh nào thay đổi nhóm)
Trong trường hợp này, khoảng cách là một bình phương hoặc chênh lệch tuyệt đối giữa một điểm ảnh và một cụm trung tâm. Sự khác biệt này dựa vào màu sắc điểm ảnh, cường độ, kết cấu và vị trí, hoặc kết hợp có trọng số của các yếu tố này. K có thể được lựa chọn ngẫu nhiên hoặc thủ công, hoặc do một phương pháp phỏng đoán. Thuật toán này được đảm bảo để hội tụ, nhưng nó
Tác giả: Nguyễn Xuân Việt 88 có thể không quay trở lại giải pháp tối ưu. Chất lượng của giải thuật này phụ thuộc vào các thiết lập ban đầu của các cụm và giá trị K.
4.1.3 Phương pháp nén
Phương pháp nén quy định rằng phân đoạn tối ưu nhất là phương pháp có độ giảm thiểu tối đa, trên tất cả các phân đoạn có thể có, và độ dài mã hóa của dữ liệu. Các kết nối giữa hai khái niệm là các phân đoạn cố gắng tìm kiếm các mẫu trong một hình ảnh và bất kỳ quy tắc nào trong ảnh có thể được sử dụng để nén nó. Phương pháp mô tả từng phân đoạn bằng kết cấu và hình dạng đường biên. Mỗi thành phần được mô hình hóa bởi một hàm phân bố xác suất và thời gian mã hóa của nó được tính như sau:
1. Việc mã hóa đường biên thúc đẩy thực tế rằng những khu vực trong những hình ảnh tự nhiên có xu hướng là một đường viền mịn. Điều này trước đây được sử dụng bởi mã hóa Huffman để mã hóa các chuỗi mã khác nhau của đường viền trên ảnh. Như vậy. đường biên càng mịn, chiều dài mã hóa nó đạt được càng ngắn.
2. Cấu trúc được mã hóa bằng cách nén tổn hao tương tự như nguyên tác tối thiểu hóa chiều dài (MDL), nhưng ở đây chiều dài của dữ liệu trong các mô hình được ước tính bằng số lần lấy mẫu entropy của mô hình. Các kết cấu trong từng khu vực được mô hình hóa bởi sự phân bố chuẩn nhiều chiều mà entropy được đưa vào dưới dạng biểu thức. Một tính chất thú vị của mô hình này là entropy ước tính giới hạn entropy thực sự của các dữ liệu đầu vào từ trên xuống. Điều này là bởi vì trong số tất cả các phân bố với một ý nghĩa nhất định và có tính hiệp biến, phân bố bình thường có các entropy lớn nhất. Như vậy, độ dài mã hóa thực không thể có nhiều hơn những gì mà giải thuật cố gắng để giảm thiểu.
Đối với bất kỳ phân khúc nào của một hình ảnh, phương pháp này mang số bit cần thiết để mã hóa hình ảnh dựa trên phân đoạn nhất định. Như vậy, trong số tất cả các phân đoạn có thể có của một hình ảnh, mục đích là để tìm ra phân đoạn trong đó chiều dài mã hóa là ngắn nhất. Điều này có thể được thực hiện bằng phương pháp phân nhóm xếp chồng đơn giản. Các biến dạng trong quá trình nén tổn hao có thể khác nhau trong mỗi hình ảnh. Tham số này có thể được ước tính một cách phỏng đoán từ sự tương phản của kết cấu trong hình ảnh. Ví dụ, khi các kết cấu trong một
Tác giả: Nguyễn Xuân Việt 89 hình ảnh tương tự nhau, như trong các hình ảnh ngụy trang, độ nhạy cao hơn và do đó lượng tử hóa thấp hơn.
4.1.4 Phương pháp biểu đồ sắc thái
Phương pháp này rất hiệu quả so với các phương pháp phân đoạn ảnh khác vì nó chỉ yêu cầu một lược đồ duy nhất thông qua các điểm ảnh. Trong kỹ thuật này, một biểu đồ được tính từ tất cả các điểm ảnh trong hình ảnh, và những đỉnh và khe trong biểu đồ được sử dụng để xác định vị trí các cụm trong hình ảnh. Màu sắc hoặc cường độ có thể được sử dụng như là thước đo.
Sự tinh tế trong kỹ thuật này là áp dụng đệ quy các phương pháp biểu đồ tìm kiếm các cụm trong hình ảnh để chia chúng thành các cụm nhỏ hơn. Hoạt động này được lặp đi lặp lại cho đến khi không còn cụm nào được hình thành.
Một bất lợi của phương pháp biểu đồ tìm kiếm là nó có thể khó khăn để xác định các đỉnh và khe có ý nghĩa trong hình ảnh.
Phương pháp này có thể áp dụng cho nhiều khung hình, trong khi duy trì hiệu quả của lược đồ đơn duy nhất. Các biểu đồ có thể được thực hiện trong nhiều hình dạng khi nhiều khung hình được xem xét. Các cách tiếp cận tương tự được thực hiện với một khung hình có thể được áp dụng cho nhiều khung hình, và khi kết quả được sáp nhập, đỉnh và khe mà trước đây rất khó để xác định có thể phân biệt. Các biểu đồ có thể được áp dụng dựa trên cơ sở cho mỗi điểm ảnh mà thông tin kết quả được sử dụng để xác định màu sắc thường gặp nhất trong vị trí điểm ảnh. Cách tiếp cận này dựa trên phân đoạn đối tượn hoạt động và một môi trường tĩnh, dẫn đến một loại phân đoạn khác hữu ích hơn trong việc theo dõi các hình ảnh .
4.2 Phân đoạn ảnh sử dụng PDE
PDE có thể sử dụng để phân đoạn ảnh bằng cách sử dụng một phương trình vi phân từng phần và giải phương trình đó bằng một kĩ thuật số hóa. Khuyếch tán đường cong là kỹ thuật phổ biến của loại này, với nhiều ứng dụng trong phân tách đối tượng, theo dõi đối tượng, tái tạo hình ảnh… Ý tưởng chính là phát triển một đường cong ban đầu đối với khả năng thấp nhất của một hàm ước lượng, trong đó ý định nghĩa
Tác giả: Nguyễn Xuân Việt 90 của nó phản ánh các nhiệm vụ được giải quyết. Đối với hầu hết các vấn đề ngược lại, giảm thiểu chức năng ước lượng là rất đáng kể và áp đặt các giới hạn độ mịn nhất lên các giải pháp, mà trong trường hợp này có thể được thể hiện như các ràng buộc về hình thái trên đường cong phát triển.
Phương pháp tham số
Kỹ thuật Langrage được dựa trên việc cài đặt thông số đường viền theo chiến lược lấy mẫu và sau đó phát triển từng phần tử theo hình ảnh và các điều kiện nội bộ. Kỹ thuật như vậy là nhanh chóng và hiệu quả, tuy nhiên, ban đầu công thức “tham số hoàn toàn ”(do Kass, Witkin và Terzopoulos đưa ra vào năm 1987 và được biết đến như “snakes”), bị chỉ trích vì những hạn chế liên quan đến việc lựa chọn chiến lược lấy mẫu, các tính chất hình học nội bộ của đường cong, thay đổi cấu trúc liên kết (tác đường cong và sát nhập), giải quyết các vấn đề trong các kích thước cao hơn…Ngày nay, những công thức “rời rạc” được phát triển để giải quyết những hạn chế trong khi vẫn duy trì hiệu quả cao. Trong cả hai trường hợp, giảm thiểu khả năng thường được tiến hành bằng cách sử dụng sự giảm đi một gradient mạnh nhất, theo đó các dẫn xuất được tính toán sử dụng, ví dụ như sự khác biệt hữu hạn.
Phương pháp thiết lập cấp độ
Các phương thức thiết lập cấp độ ban đầu được đề xuất để theo dõi sự di chuyển trên bề mặt bởi Osher và Sethian vào năm 1988 và đã lan rộng trên các lĩnh vực về hình ảnh khác nhau vào cuối những năm 90. Nó có thể được sử dụng để giải quyết hiệu quả các vấn đề của đường cong, mặt phẳng … Ý tưởng chính là để đại diện cho các đường viền phát triển ta sử dụng thuật toán đánh dấu, không tương đương với các đường viền thực tế. Sau đó, theo các phương trình chuyển động của các đường viền, người ta có thể dễ dàng lấy được một luồng tương tự cho bề mặt được ngầm hiểu là khi áp dụng các mức bằng không sẽ phản ánh được sự lan truyền của đường viền.
Phương pháp Marching nhanh
Phương pháp này dược sử dụng trong phân đoạn ảnh, và hiện tại đã được cải thiện (cho phép tốc độ truyền tính cực và tiêu cực).
Tác giả: Nguyễn Xuân Việt 91
4.3 Phân đoạn ảnh sử dụng bộ lọc khuyếch tán phi tuyến
Đã có nhiều mô hình tuyến tính và phi tuyến tính đã được đề xuất để làm mịn và phân đoạn ảnh. Mô hình tuyến tính liên quan đến phương trình nhiệt tiêu chuẩn
𝜕𝑡𝑢 = ∆𝑢 với u x( , 0) f x( ) trong đó 𝑓: ℜ2 → ℜ là một ảnh có giá trị vô hướng. Khuyếch tán tuyến tính làm mờ các phần quan trọng của ảnh ví dụ như biên. Ngoài ra nó thay đổi của các biên, tức là khi chuyển từ vùng mịn tới vùng không mịn, nó định vị lại các biên. Nói chung, các cấu trúc liên quan là rất quan trọng do sự hiện diện của các điểm rẽ nhánh.
Khuếch tán phi tuyến dị hướng đã được đề xuất bởi rất nhiều nhà nghiên cứu. Tất cả các mô hình phi tuyến và khác nhau về hệ số khuyếch tán và giới hạn khuếch tán. Một vài trong số đó được bổ sung một giới hạn phản ứng. Tiếp theo, tôi sẽ trình bày một phương trình lọc khuếch tán phi tuyến bổ sung các điều kiện để có thể vừa lọc nhiễu, giữ lại các tính chất đặc trưng của biên và phân đoạn.
Mô hình như sau:
𝜕𝑢 𝜕𝑡 = 𝑔(∇𝐺𝜎 ∗ 𝑢)|∇𝑢|𝑑𝑖𝑣 (∇𝑢 |∇𝑢|) + ∇𝑔(∇𝐺𝜎 ∗ 𝑢) ∙ ∇𝑢 − 𝛽|∇𝑢|(𝑢 − 𝐼) (1) 𝜕𝑢 𝜕𝑛| 𝜕𝑅