CHƯƠNG 2 PHÉP TỐN HÌNH THÁI HỌC TRONG XỬ LÝ ẢNH
2.3. Ứng dụng của phép toán hình thái
2.3.3. Tô đầy vùng (Region Filling)
Ảnh nhị phân thường là kết quả của các phép thực hiện phân ngưỡng hoặc phân đoạn ảnh xám hoặc ảnh màu đầu vào. Những phép biến đổi này rất hiểm khi “hoàn hảo” do những nhân tố bên ngồi mà trong q trình lấy mẫu ảnh chúng ta khơng kiểm sốt được như cường độ sáng hay độ chói xuất hiện trong ảnh và nó có thể để lại những “lỗ hổng” sau khi thực hiện lấy ngưỡng hoặc phân đoạn ảnh. Sử dụng các phép xử lý hình thái học để lấp đầy các lỗ hổng thực sự rất hiệu quả.
Làm đầy vùng của một đối tượng từ biên là bổ sung giá trị 1 vào tồn bộ vùng ở phía bên trong biên của đối tượng. Cho một ảnh nhị phân A, các điểm ảnh ở biên của đối tượng trong hình ảnh A có giá trị là 1 và các điểm ảnh khác có giá trị là 0. Ta bắt đầu q trình làm đầy bằng cách gán giá trị 1 vào điểm ảnh
p ở bên trong biên của đối tượng, sau đó lặp đi lặp lại phép giãn nhị phân giữa
điểm ảnh với phần tử cấu trúc B dưới giới hạn đặt ra bởi phép bù của tập hợp A (Ac). Bởi vì nếu hạn chế khơng được đặt thì chương trình sẽ lặp đi lặp lại phép gán này, dẫn tới xảy ra hiện tượng tràn qua các vùng khác trên ảnh, thậm chí tồn bộ ảnh.
Với X0=p và B là phần tử cấu trúc, phép làm đầy vùng trong ảnh sẽ được xác định bởi công thức:
�� = (��−1 ⊕ �) ∩ �� (2.12)
Với k=1, 2, 3, …, k-1 Thuật toán sẽ dừng khi Xk=Xk-1.
Thí dụ, ở hình 2.20, A là ảnh ban đầu chỉ chứa biên của đối tượng (giá trị là 1), B
là phần tử cấu trúc có kích thước 3x3 và hình dạng chữ thập. Khi đó thuật tốn sẽ thực hiện lần lượt theo trình tự như sau:
Bước 1: Thuật toán sẽ gán giá trị 1 cho một điểm ảnh p bên trong vùng biên.
Bước 2: Áp dụng phép giãn nhị phân từ điểm ảnh p với phần tử cấu trúc B, đồng thời lấy giao của kết quả phép giãn với phần bù của tập hợp A.
Như vậy, sau khi lấy giao của hai tập hợp thì phần nào có giá trị là 1 tương xứng với giá trị 1 của phần bù tập hợp A thì được giữ ngun, phần nào có giá trị 1 tương xứng với giá trị 0 của phần bù tập hợp A thì sẽ được gán là 0. Quá
trình này sẽ được lặp đi lặp lại cho đến khi tất cả các điểm ảnh tương ứng bên trong biên của đối tượng được gán là 1.
Bước 3: Cuối cùng lấy hợp giữa X7 và biên A ta sẽ được đối tượng đã được làm đầy từ biên vùng trong ảnh (Hình 2.20).
Hình 2.20. Quá trình lấp đầy vùng đối tượng trong ảnh
2.3.4. Trích chọn các thành phần liên thông (Extraction of Connected Components)
Trong thực tế, bài tốn trích chọn thành phần liên thơng trong ảnh nhị phân đóng vai trị quan trọng trong các ứng dụng phân tích ảnh tự động. Tương tự như phép làm đầy vùng, quá trình thực hiện thuật tốn cũng được lặp đi lặp lại với phép trích chọn các thành phần liên thơng.
Cho một ảnh nhị phân trong đó đối tượng là tập hợp A bao gồm một số thành phần liên thông. Những điểm ảnh nào thuộc đối tượng thì được đánh dấu là 1 và điểm ảnh nào nằm ngồi đối tượng thì được đánh dấu là 0. Ta có thể tách các thành phần liên thông bằng cách gán một điểm ảnh ở trong đối tượng rồi từ điểm ảnh đó, lặp đi lặp lại phép giãn nhị phân với phần tử cấu trúc dưới hạn chế đặt ra bởi tập hợp A.
Cho bước khởi tạo X0=p và B là phần tử cấu trúc 3×3 với các giá trị là 1. Quá
trình lặp tại bước thứ k như sau:
�� = (��−1 ⊕ �) ∩ , = � � 1,2,3 … (2.13)
Hình 2.21. Q trình trích chọn các thành phần liên thơng trong ảnh bằng phép tốn hình thái
Quá trình lặp sẽ dừng tại bước k nếu Xk = Xk-1. Do đó, Xk-1 được chọn là thành phần liên thơng.
2.3.5. Làm mảnh ảnh (Thinning)
Làm mảnh ảnh là tương tự như phép co, nhưng nó khơng phải là ngun nhân làm mất xuất hiện các thành phần của đối tượng. Nó giảm các đối tượng để làm mảnh của
một điểm ảnh, tạo ra một trục liên thông nhỏ hơn mà cách đều từ các đối tượng cạnh. Làm mảnh ảnh được thực hiện sớm, các bước cơ bản của xử lý ảnh trong việc biểu diễn hình dạng cấu trúc của mẫu như một đồ thị.
Thuật toán làm mảnh thường bao gồm nhiều lần lặp, mỗi lần lặp tất cả các điểm ảnh của đối tượng sẽ được kiểm tra, các phần tử cấu trúc được thiết kế để tìm các điểm biên mà khi loại bỏ điểm ảnh trên đối tượng thì sẽ khơng làm ảnh hưởng tới các liên thông. Nếu điểm ảnh nào mà thỏa mãn điều kiện của phần tử cấu trúc thì sẽ bị loại bỏ. Quá trình này cứ lặp đi lặp lại cho tới khi khơng cịn điểm biên nào được xóa nữa.
Làm mảnh tập hợp A bởi phần tử cấu trúc B, ký kiệu � ⊗ �, xác định bởi công
thức sau:
⊗ = −
� � � (� � ∗ �) = ∩ � (� � ∗ �)� (2.14)
Để có thể làm mảnh một đối tượng A một cách hiệu quả hơn, ta dựa vào dãy các phần tử cấu trúc.
{�} = {�1, �2, … , ��} (2.15)
Trong đó Bi nhận được từ Bi-1, qua phép quay quanh tâm điểm của nó. Với khái niệm này ta định nghĩa phép làm mảnh bởi một dãy các phần tử cấu trúc theo công thức.
⊗
� {�} = ((… (( ⊗ � �1) ⊗ �2) … ) ⊗ ��) (2.16)
Nói cách khác, quá trình làm mảnh A bởi Bi, kết quả lại tiếp tục được làm mảnh bởi B2 cho đến Bn. Lúc này, đối tượng trong ảnh hầu như không thay đổi nữa.
Xét thí dụ q trình làm mảnh (Hình 2.22). Quá trình làm mảnh đối tượng sẽ được lặp đi lặp lại cho đến khi đối tượng khơng có sự thay đổi nào thì dừng lại.
Theo cơng thức tổng qt ta có:
⊗
Như vậy, trong thí dụ này quá trình làm mảnh được lặp đi lặp lại 2 lượt. Trong mỗi lần lặp đối tượng phải trải qua quá trình làm mảnh với 8 phần tử cấu trúc: B1, B2, B3, …, B8.
Hình 2.22. Quá trình làm mảnh đối tượng trong hình ảnh
Hình 2.23. Ví dụ về làm mảnh đối tượng
(a) ảnh gốc, (b) ảnh kết quả làm mỏng (c) ảnh gốc, (d) ảnh kết quả làm mỏng
2.3.6. Làm dày đối tượng trong ảnh (Thickening)
Làm dày đ i tố ượng tương t nh phép giãn nh, nh ng nó khơng sát nh p/g p các đ iự ư ả ư ậ ộ ố
tượng không k t n i v i nhau. Nó đế ố ớ ượ ử ục s d ng đ làm to các đ i tể ố ượng b lõm và cóị
th bi u di n qua công th c sau:ể ể ễ ứ
⊙ = ∪
� � � (� ⊗ �)
(2.18) Với B là phần tử cấu trúc thích hợp. Tương tự như quá trình làm mảnh, quá
trình làm dày đối tượng có thể được biểu diễn như sau:
⊙
� {�} = (… (( ⊙ � �1) ⊙ �2) … ) ⊙ �� (2.19)
Hình 2.24. Kết quả làm dày đối tượng
(a) ảnh gốc, (b) ảnh kết quả làm dày. (c) ảnh gốc, (d) ảnh kết quả làm dày.
2.3.7. Tìm khung xương (Skeletonization)
Xương ảnh được sử dụng nhiều trong ứng dụng lĩnh vực máy tính, phân tích hình ảnh và xử lý hình ảnh số bao gồm nhận dạng ký tự quang học, nhận dạng vân tay, kiểm tra thị giác, nhận dạng mẫu, …
Tìm xương của ảnh tương tự như làm mảnh ảnh, nhưng nó tìm chi tiết hơn cấu trúc của đối tượng. Tìm xương nhấn mạnh các thuộc tính rõ của các ảnh.
Cho A là một tập ảnh nhị phân chứa các đối tượng điểm ảnh 1 và các điểm ảnh nền là 0. B là phần tử cấu trúc 3×3 với các giá trị 1. Khi đó, nếu ký hiệu S(A) là khung xương của tập hợp A thì thuật tốn tìm khung xương được xác định qua cơng thức:
Trong đó: � ( � �) = ⋃ ��(�) = � 0
(2.20)
��(�) = ⋃�{( ⊖ � ��) − [( ⊖ � ��) ∘ �]} (2. ��), (2.21)
=0
�
( ⊖� ��) là thực hiện k phép trừ liên tiếp của ( ⊖� �)
K là bước lặp cuối cùng trước khi A suy biến thành một tập rỗng.
Hình 2.25. Q trình thực hiện thuật tốn tìm xương
Hình sau là ví dụ về việc thực hiện tìm xương của các đối tượng trong ảnh.
Hình 2.26. Ví dụ tìm xương của các đối tượng
(a) là ảnh gốc,
(b) là ảnh kết quả sử dụng phép biến đổi tìm xương của đối tượng trong ảnh gốc.
2.3.8. Phép tốn hình thái Gradient (Morphology Gradient Operator)
Phép toán này là sự kết hợp của: Phép mở ảnh, phép đóng ảnh bởi cùng phần tử cấu trúc và phép trừ giữa 2 ảnh đó.
=
Trong đó S là phần tử cấu trúc. Thay vì lấy ảnh ban đầu trừ ảnh co, ở đây ta lấy ảnh dãn trừ đi ảnh được co. Điều này sẽ làm tăng sự tương phản và bề rộng của những cạnh được trích chọn. Một ứng dụng quan trọng của phép toán này trên ảnh nhị phân và ảnh xám là để trích đường bao quanh của đối tượng.
Hình 2.27. Đường dốc hình thái
a. Ảnh bảo vệ đĩa
b. Các cạnh được làm rõ bằng phương pháp trích biên sau đó được phân ngưỡng c. Đường dốc hình thái
d. Ảnh (c) sau khi phân ngưỡng.
2.4. Các phép lọc hình thái học ứng dụng cho ảnh OCR2.4.1. Mơ hình ảnh tài liệu kém chất lượng 2.4.1. Mơ hình ảnh tài liệu kém chất lượng
Mặc dù phần lớn các tài liệu được tạo ra và lưu dưới dạng kỹ thuật số, nhưng chúng ta vẫn thường xuyên tương tác với các tài liệu giấy. Tài liệu giấy và kỹ thuật số có những điểm mạnh bổ sung cho nhau: giấy nhẹ, dễ mang theo, dễ vận chuyển, dễ đọc và dễ dàng chú thích. Trái lại, tài liệu điện tử lại có thể được tìm kiếm, lưu trữ trong cơ sở dữ liệu và dễ dàng được chia sẻ qua mạng.
Một cách lý tưởng, người ta có thể chuyển đổi giữa các phiên bản giấy và kỹ thuật số của một tài liệu để mang lại lợi ích từ những ưu điểm của từng phương tiện làm cho điều này khả thi, cần một cách đơn giản, nhanh chóng để qt chính xác tài liệu giấy
vào máy tính, máy quét phẳng cùng với phần mềm đáp ứng được nhu cầu này, nhưng máy quét có thể cồng kềnh, chậm chạp. Mặt khác máy ảnh điện thoại cầm tay với webcam nhỏ, có thể chụp nhanh ảnh tài liệu và dễ sử dụng trong cài đặt di động.
Màu nền trước và nền sau của văn bản khá đồng nhất và các ký tự này nằm trong bảng chữ cái chuẩn mực. Thách thức là chụp và nhận dạng văn bản một cách chính xác, do chất lượng ảnh tài liệu thường kém do được chụp bởi các hệ thống dựa trên camera có sẵn.
Đối với hình ảnh cung cấp đủ độ phân giải một cách chính xác phân đoạn ký tự in (chẳng hạn như hình ảnh từ máy quét hoặc máy ảnh độ phân giải cao với ánh sáng được kiểm sốt) các phương pháp OCR hiện tại có độ chính xác cao. Ngồi ra, ảnh ghép có độ phân giải cao có thể được tạo từ loạt hình ảnh camera độ phân giải thấp. Ta cần tìm kiếm một phương pháp có thể nhận dạng trực tiếp văn bản từ một hình ảnh duy nhất.
2.4.2. Lọc hình thái học
2.4.2.1. Tốn tử hình thái trên khơng gian đồ thị
Từ quan điểm chính thức, xử lý hình ảnh kỹ thuật số trước đây ao gồm phân tích các phép biến đổi trên các tập con của Z2 (tập hợp các điểm ảnh trong một hình ảnh nhị phân) và các phép biến đổi hoạt động trên các ánh xạ từ Z2đến N (hình ảnh đơn lẻ). Theo quan điểm như vậy, các tốn tử hình thái tốn học cung cấp một bộ cơng cụ lọc và phân đoạn rất hữu ích trong các ứng dụng.[7]
Mặt khác, ngày càng có nhiều sự quan tâm đến việc xem xét các đối tượng kỹ thuật số khơng chỉ bao gồm các điểm mà cịn bao gồm các phần tử nằm giữa chúngvà mang thông tin cấu trúc về cách các điểm được ghép lại với nhau. Đơn giản nhất trong số các biểu diễn này là đồ thị (khơng trọng số). Miền của một hình ảnh được coi là một đồ thị có đỉnh tập hợp được tạo bởi các điểm ảnh và tập hợp cạnh của nó được cung cấp bởi một quan hệ dựa trên các điểm ảnh này. Trong bối cảnh này, cần phải xem xét các phép biến đổi tác động trên tập hợp tất cả các đồ thị con và không chỉ hành động trên tập hợp tất cả tập hợp con của các điểm ảnh.
Khi xử lý đồ thị G, thường cần để xem xét đồ thị được tạo ra bởi một tập hợp con S các đỉnh của G. Cuối cùng, sự kết hợp với S là tập con lớn nhất của các cạnh của G sao cho cặp thu được là một đồ thị. Trong khác trường hợp, phải xét một đồ thị được
Được thúc đẩy bằng cách phân loại và hiểu các hoạt động này và kết hợp, vậy đề xuất một nghiên cứu có hệ thống về các tốn tử cơ bản là được sử dụng để lấy một tập hợp các cạnh từ một tập các đỉnh và một tập các đỉnh từ một tập hợp các cạnh. Nó chỉ ra rằng các tốn tử này là sự giãn nở và ăn mịn. Chúng cho phép khơi phục khái niệm cổ điển về sự giãn nở / xói mịn của một tập hợp con đỉnh và để mở rộng nó đến các đồ thị con. Từ đó, có thể đề xuất một số xử lý ăn mòn và giãn nở thực hiện được trên các tập con của các đỉnh và trên các đồ thị con.
2.4.2.2. Tốn tử hình thái trên các phức hợp đơn giản
Mục tiêu của ở đây là tìm hiểu sự giãn nở và ăn mịn hình thái tác động lên các phức hợp (trong đó cả đầu vào và đầu ra của các tốn tử đều là phức hợp) và điều đó tạo ra phép đo hạt khơng tầm thường, (tức là đo độ hạt trong đó độ giãn nở khơng phải là đơn vị)1. Thật vậy, những phép đo hạt tầm thường như vậy đã được biết đến là quan trọng trong hình thái tốn học để phân tích và lọc kỹ thuật số đối tượng theo kích thước của chúng. Sau một lời nhắc ngắn gọn về các tính từ hình thái trong khn khổ mạng, ở đây tác giả trình bày các tốn tử cổ điển cho xử lý các không gian topo như các phức chất đơn giản. Sau đó, chỉ ra rằng giãn nở, ăn mịn và đo hạt đáp ứng các đặc tính nêu trên có thể thu được bằng cách cẩn thận việc tạo ra các tốn tử tơpơ này.
Trong hình thái tốn học, bất kỳ tốn tử nào liên kết các phần tử của mạng tinh thể L1 với các phần tử của mạng tinh thể L2 được gọi là sự giãn nở nếu nó đi cùng với đỉnh. Tương tự, một tốn tử giao tiếp với cận dưới đỉnh được gọi là một sự xói mịn. Khái niệm về tính từ, được nhắc lại dưới đây, cho phép phân loại sự giãn nở và ăn mịn thành các cặp tốn tử dẫn đến phép đo hạt.
Gọi L1 và L2 là hai mạng có quan hệ thứ tự và siêu tối đa được ký hiệu bởi ≤1, ≤2, V1 và V2. Hai toán tử α: L2 → L1 và αA: L1 → L2 tạo thành một tính từ (αA; α) nếu α (a)
≤1, a ≤2 αA (b) với mọi phần tử a trong L2 và b trong L1. Người ta đã iết rõ rằng, với hai toán tử α và αA, nếu cặp (αA.; α) là một tính từ, thì αA là một xói mịn và α là một sự giãn nở. Hơn nữa, nếu α là một sự giãn nở, thì quan hệ sau đặc trưng cho mối liên kết của nó xói mịn αA:
1 Phép đo hạt (Granulometry) là một cách tiếp cận để tính tốn phân bố kích thước của các hạt trong hình ảnh nhị phân
∈
∀� ℒ1, ��(�) = �2{ � ∈ ℒ2 ∣ 𝛽(�) ≤1 𝛽 (2.23)
Ở đây việc trình bày hai cặp tốn tử liền kề, chúng cổ điển trong cấu trúc liên kết, và điều đó sẽ phục vụ để có được các phép đo hạt tầm thường trên các phức hợp.
Cho x là một đơn vị trong C, đặt: �ˆ =
̅{̅�̅̅∣̅̅�̅ ̅̅⊆̅̅̅�̅̅ ,̅�̅ ̅̅≠̅ ̅̅∅̅̅}̅̅a̅n̅̅d̅�ˇ = {� ∈ ℂ ∣ � ⊆ �}. Các toán tử Cl: �(ℂ) → �(ℂ) và St: �(ℂ) → �(ℂ) được xác định bởi: ∈ ∀� (ℂ), ��(�) =∪ { ˆ � ∣ ∈ � � }; (2.24) ∈ ∀� (ℂ), ��(�) =∪ { ˘ � ∣ ∈ � � }; (2.25)
Theo định nghĩa, các toán tử Cl và St đi cùng với nhau. Do đó, nó là độ giãn trên