Chương 2 : LÝ THUYẾT XỬ LÝ ẢNH
2.3. Nội dung lý thuyết xử lý ảnh dùng trong đề tài
2.3.4. Phân đoạn ảnh (phân vùng ảnh)
Để phân tích các đối tượng trong ảnh, chúng ta cần phân biệt được đối tượng cần khảo sát với phần còn lại của ảnh (nền), tức là ta phải tách đối tượng ra khỏi nền. Đây là bước phức tạp, khó khăn nhất trong xử lý ảnh và cũng dễ gây lỗi, làm mất độ chính xác của ảnh nhưng bước này rất quan trọng để chuẩn bị cho việc trích chọn đặc trưng và nhận dạng các đối tượng. Kết quả nhận dạng ảnh phụ thuộc rất nhiều vào cơng đoạn này.
Sự phân đoạn là một bài tốn phân loại theo mặt bằng điểm ảnh, trong đó ảnh được tách ra thành các điểm ảnh thuộc về đối tượng cần khảo sát và những điểm ảnh không phải của đối tượng cần khảo sát (thuộc về nền).
Một phương pháp phân đoạn ảnh đơn giản và hiệu quả là sử dụng một ngưỡng giá trị xám để phân tách ảnh ra thành đối tượng và nền. Các điểm ảnh ở bên dưới ngưỡng giá trị xám thuộc về nền, còn những điểm ảnh ở bên trên ngưỡng giá trị xám thuộc về đối tượng.
Các kỹ thuật phân đoạn vùng có thể được chia thành 3 loại:
- Các kỹ thuật cục bộ: dựa trên các đặc tính cục bộ của các điểm ảnh và các
lân cận của nó.
- Các kỹ thuật tổng thể: phân đoạn một ảnh dựa trên cơ sở của thông tin lấy
từ tổng thể như sử dụng biểu đồ mức xám histogram.
- Các kỹ thuật chia, nối và phát triển: dựa trên các khái niệm tương đồng về hình dạng và tính đồng nhất của một miền ảnh. Hai vùng có thể được nối với nhau nếu tương tự nhau và liền kề bên nhau. Các vùng khơng đồng nhất có thể được chia thành các vùng nhỏ hơn. Một vùng có thể được phát triển bằng cách nối các điểm ảnh sao cho nó đồng nhất với nhau.
Phân đoạn bằng một ngưỡng: Bài toán phân đoạn ảnh đơn giản nhất xảy ra
khi một ảnh chứa một đối tượng có độ sáng đồng nhất và nền có một độ sáng khác. Giả sử rằng ta đang quan tâm tới các đối tượng sáng (object) trên nền tối (background)
21
𝑔(𝑥, 𝑦) = {1 𝑛ế𝑢 𝑓(𝑥, 𝑦) > 𝑇0 𝑛ế𝑢 𝑛𝑔ượ𝑐 𝑙ạ𝑖 (2.14)
Ngược lại, nếu với đối tượng tối trên nền sáng thì lúc này việc phân đoạn ảnh thành 2 vùng được thực hiện như sau:
𝑔(𝑥, 𝑦) = {1 𝑛ế𝑢 𝑓(𝑥, 𝑦) < 𝑇 0 𝑛ế𝑢 𝑛𝑔ượ𝑐 𝑙ạ𝑖
(2.15)
Tham số T gọi là ngưỡng độ sáng. Có rất nhiều thuật tốn chọn ngưỡng T như: ngưỡng cố định, dựa trên lược đồ xám, chọn ngưỡng thông qua sự không ổn định của lớp và tính thuần nhất của vùng,….Việc lựa chọn ngưỡng T dựa trên biểu đồ mức xám của ảnh [14].
Nếu nền và đối tượng trong ảnh có độ sáng tương phản thì biểu đồ mức xám có 2 đỉnh cực đại. Khi đó, ngưỡng được chọn chính là điểm cực tiểu nằm giữa 2 đỉnh cực đại trong biểu đồ mức xám. Khi ảnh có nhiễu sẽ gây khó khăn trong việc tính tốn điểm cực tiểu. Vì vậy, cần phải dùng bộ lọc thơng thấp một chiều để lọc nhiễu.
Nếu ảnh có độ sáng của nền và của đối tượng chêch lệch nhau khơng nhiều thì biểu đồ mức xám của ảnh khơng có 2 đỉnh cực đại phân biệt. Khi đó, ảnh sẽ được chia thành nhiều vùng ảnh nhỏ để tính tốn biểu đồ mức xám cho từng vùng. Nếu biểu đồ mức xám của mỗi vùng ảnh nhỏ vẫn khơng có 2 đỉnh cực đại phân biệt thì ngưỡng sẽ được nội suy từ các biểu đồ mức xám của các vùng ảnh lân cận.
Khi đã phân đoạn được ảnh g(x,y) thì đường bao có thể tìm được bằng cách tìm sự chuyển đổi từ một vùng ảnh này đến một vùng ảnh khác [14].
𝑏(𝑥, 𝑦) = {
1 𝑛ế𝑢 (𝑔(𝑥, 𝑦) ∈ 𝑅𝑖 𝑣à 𝑔(𝑥, 𝑦 − 1) ∈ 𝑅𝑗, 𝑖 ≠ 𝑗) ℎ𝑜ặ𝑐 (𝑔(𝑥, 𝑦) ∈ 𝑅𝑖 𝑣à 𝑔(𝑥 − 1, 𝑦) ∈ 𝑅𝑗, 𝑖 ≠ 𝑗) 0
22
Có thể dùng nhiều mức ngưỡng khác nhau để phân đoạn ảnh thành N đối tượng, mỗi đối tượng Ri sẽ có 2 ngưỡng Ti-1 và Ti.
Các ngưỡng có thể tạo thành dưới dạng:
𝑔(𝑥, 𝑦) = 𝑅𝑖 𝑛ế𝑢 𝑇𝑖−1 ≤ 𝑓(𝑥, 𝑦)𝑇𝑖, 𝑖 = 1, … , 𝑁 (2.17)
Các ngưỡng được rút ra từ biểu đồ mức xám của ảnh bằng cách tìm N-1 điểm cực đại giữa N đỉnh liên tiếp nhau trong biểu đồ mức xám.
Các phương pháp phân vùng ảnh theo miền đồng nhất thường áp dụng là: - Phương pháp tách cây tứ phân
- Phương pháp cục bộ - Phương pháp tổng hợp
Phương pháp cục bộ:
Phương pháp này xem xét ảnh từ các miền nhỏ nhất rồi nối chúng lại nếu thỏa mãn tiêu chuẩn để được một miền đồng nhất lớn hơn. Tiếp tục với các miền thu được cho đến khi không thể nối thêm được nữa. Số miền ảnh còn lại cuối cùng chính là kết quả của phép phân đoạn ảnh.
Việc nối 2 vùng được thực hiện theo nguyên tắc sau:
- Hai vùng ảnh phải đáp ứng tiêu chuẩn như: cùng màu hay cùng mức xám.
- Hai vùng ảnh phải nằm kế cận nhau.
Dựa theo nguyên lý của phương pháp nối, ta có 2 thuật toán:
- Thuật tốn tơ màu (Blob Coloring): sử dụng khái niệm 4 liên thông, dùng một cửa sổ di chuyển trên ảnh để so sánh với tiểu chuẩn nối.
- Thuật toán đệ quy cục bộ: sử dụng phương pháp tìm kiếm trong một cây để làm tăng kích thước vùng.
Phương pháp tách cây tứ phân (quadtree):
Phương pháp này về nguyên tắc kiểm tra tính đúng đắn của tiêu chuẩn đề ra một cách tổng thể trên miền lớn của ảnh. Nếu tiêu chuần được thỏa mãn thì việc
23
phân đoạn coi như kết thúc. Trong trường hợp ngược lại, chia miền đang xét thành 4 miền nhỏ hơn. Với mỗi miền nhỏ được chia lại áp dụng tiêu chuẩn cho đến khi tất cả các miền đều thỏa mãn điều kiện.
Tiêu chuẩn xét miền đồng nhất ở đây có thể dựa vào mức xám. Ngồi ra, có thể dựa vào độ lệch chuẩn hay độ chênh giữa giá trị mức xám lớn nhất và giá trị mức xám nhỏ nhất.
Phương pháp tổng hợp
Phương pháp này kết hợp cả 2 phương pháp nối (hợp) và tách.Trước tiên, dùng phương pháp tách để tạo nên cây tứ phân, phân đoạn theo hướng từ gốc đến lá. Tiếp theo, tiến hành duyệt cây theo chiều ngược lại và hợp các vùng có cùng tiêu chuẩn. Với phương pháp này ta thu được một cấu trúc ảnh với các miền liên thơng có kích thước tối đa.