Chương 2 : CƠ SỞ LÝ THUYẾT
2.1 Phương pháp xử lý ảnh
2.1.1 Tổng quan.
Xử lý ảnh là một lĩnh vực mang tính khoa học và cơng nghệ. Nó là một ngành khoa học mới mẻ so với nhiều ngành khoa học khác nhưng tốc độ phát triển của nó rất nhanh, kích thích các trung tâm nghiên cứu, ứng dụng, đặc biệt là máy tính chuyên dụng riêng cho nó. Xử lý ảnh là một quá trình liên tục. Đầu tiên là thu nhận ảnh từ camera, vệ tinh hay các bộ cảm ứng,… Tiếp theo tín hiệu lấy vào sẽ được số hóa thành tín hiệu số và chuyển qua giai đoạn xử lý, phân tích hay lưu trữ lại. Việc xử lý ảnh chính là tăng cường ảnh, tức là làm cho ảnh trở nên đẹp hơn, tốt hơn và rõ hơn.
Ảnh có thể được hiểu là thơng tin (về đường nét, hình khối, màu sắc…) của vật thể hay quang cảnh được chiếu sáng mà con người cảm nhận và quan sát được bằng mắt và hệ thống thần kinh thị giác. Đối tượng chính của xử lý ảnh chính là ảnh chụp tự nhiên. Quá trình xử lý ảnh được hiểu là xử lý nội dung thông qua dữ liệu ảnh, qua đó nâng cao chất lượng ảnhhiển thị hay đạt được một yêu cầu cảm quan nào đó. Ảnh thông thường được hiểu là dữ liệu trên một mặt phẳng ảnh, ta còn gọi là ảnh đơn (Image), hay ảnh tĩnh. Ngoài ảnh đơn, ta còn gặp dạng chuỗi các ảnh được chụp liên tiếp nhau thông qua mối quan hệ về thời gian, ảnh đó gọi là chuỗi ảnh, (hay ảnh động, phim). Ở đây ta chỉ quan tâm đến đối tượng là ảnh đơn. Ảnh đơn biểu diễn dữ liệu ảnh thơng qua (các) hàm độ chói của các biến tọa độ trong mặt phẳng ảnh: I(x,y)
Đối với ảnh đơn sắc, hay ảnh mức xám, dữ liệu hình ảnh được biểu diễn dưới dạng một hàm độ chói I(x,y). Với các giá trị I(x,y), x, y là các số thực, và ta có 0 ≤ I(x,y) ≤ IMAX. Với ảnh màu, dữ liệu ảnh được biểu diễn thơng qua 3 hàm độ chói của 3 màu cơ bản R (đỏ), G (xanh lá), B (xanh lam): IR(x,y), IG(x,y) , IB(x,y). Ảnh số là một dạng biểu diễn, lưu trữ và thể hiện ảnh tĩnh. Ảnh số thực chất là ảnh chụp (mặt phẳng ảnh gồm vô số điểm với vô số các giá trị màu khác nhau) thơng qua q trình lấy mẫu (rời rạc hóa về khơng gian) và lượng tử hóa (rời rạc hóa về mặt giá trị
dữ liệu). Ảnh số được biểu diễn dưới dạng một ma trận điểm ảnh I[m,n] (với m nằm trong đoạn [0..M], n nằm trong đoạn [0..N]) , mỗi phần tử của ma trận đó gọi là một điểm ảnh – pixel. Trong đó giá trị của mỗi điểm ảnh lại phụ thuộc vào từng loại ảnh: Ảnh nhị phân: một điểm ảnh chỉ nhận 2 mức giá trị nên cần 1 bit lưu trữ. Ảnh đa mức xám: giá trị điểm ảnh được chia thành 256 mức [0…255] nên ta cần 8 bits/pixel. Với ảnh màu: tùy thuộc vào số lượng màu, chất lượng màu mà ta cần 8, 16, 24 bits/pixel. Với hệ màu cơ bản RGB ta cần 3*8 = 24 bits/pixel. Đến đây việc xử lý ảnh trở thành việc xử lý các phần tử của ma trận điểm ảnh.
Một bức ảnh số được biểu diễn bởi một ma trận điểm ảnh I[m,n], trong đó một điểm ảnh được đặc trưng bởi tọa độ [m,n] và giá trị màu I. Như vậy, các phép xử lý ảnh có thể tác động vào tọa độ của các điểm ảnh, làm thay đổi vị trí của các điểm ảnh, hình khối trong ảnh, ta gọi đó là các phép xử lý về hình học. Bên cạnh tác độngvào tọa độ của các điểm ảnh, các phép xử lý ảnh cũng có tác động đến giá trị màu I của các điểm ảnh, ta gọi đó là các phép xử lý về nội dung. Nhìn chung các phép xử lý hình học khơng làm thay đổi nội dung của ảnh và được ứng dụng phổ biến trong quá trình hiển thị hình ảnh. Các phép xử lý về nội dung tác động làm thay đổi các thành phần về mặt giá trị màu của điểm ảnh, từ đó mang lại những hiệu quả về cảm nhận khác nhau.
Tuy nhiên, nhiều khi không phải ảnh nào cũng rõ nét cũng đẹp, chẳng hạn những vật thể mà bản thân nó đã xấu thì ảnh chụp của nó khơng thể đẹp được.Thậm chí ảnh chụp càng rõ nét thì càng xấu, vì cái xấu đã được soi rất rõ, rất kỹ. Do đó, đối với những ảnh như vậy, ta khơng mong muốn nó rõ thêm nữa, mà muốn nó mờ đi để che bớt khuyết điểm của vật trong ảnh. Lúc này, ta chỉ giữ lại những sóng với tần số thấp trong miền tần số (Lowpass filter), bỏ đi các sóng có tần số cao thể hiện độ sắc nét của ảnh. Bởi vì, các sóng này giờ đây chỉ đóng vai trị nhiễu mà thơi.
2.1.2 Điểm ảnh.
Ảnh gốc (ảnh tự nhiên) là ảnh liên tục về không gian và độ sáng. Để xử lý bằng máy tính, ảnh cần phải được số hố. Số hoá ảnh là sự biến đổi gần đúng một ảnh liên tục thành một tập điểm phù hợp với ảnh thật về vị trí (khơng gian) và độ sáng (mức xám). Khoảng cách giữa các điểm ảnh đó được thiết lập sao cho mắt người
không phân biệt được ranh giới giữa chúng. Mỗi một điểm như vậy gọi là điểm ảnh (PEL: Picture Element) hay gọi tắt là Pixel. Trong khuôn khổ ảnh hai chiều, mỗi pixel ứng với cặp tọa độ (x, y).
Điểm ảnh (Pixel) là một phần tử của ảnh số tại toạ độ (x, y) với độ xám hoặc màu nhất định. Kích thước và khoảng cách giữa các điểm ảnh đó được chọn thích hợp sao cho mắt người cảm nhận sự liên tục về không gian và mức xám (hoặc màu) của ảnh số gần như ảnh thật. Mỗi phần tử trong ma trận được gọi là một phần tử ảnh.
2.1.3 Độ phân giải của ảnh
Độ phân giải (Resolution) của ảnh là mật độ điểm ảnh được ấn định trên một ảnh số được hiển thị.
Theo định nghĩa, khoảng cách giữa các điểm ảnh phải được chọn sao cho mắt người vẫn thấy được sự liên tục của ảnh. Việc lựa chọn khoảng cách thích hợp tạo nên một mật độ phân bổ, đó chính là độ phân giải và được phân bố theo trục x và y trong không gian hai chiều.
2.1.4 Nén ảnh.
Nhằm giảm thiểu không gian lưu trữ. Thường được tiến hành theo cả hai cách khuynh hướng là nén có bảo tồn và khơng bảo tồn thơng tin.Nén khơng bảo tồn thì thường có khả năng nén cao hơn nhưng khả năng phục hồi thì kém hơn. Trên cơ sở hai khuynh hướng, có 4 cách tiếp cận cơ bản trong nén ảnh:
• Nén ảnh thống kê: Kỹ thuật nén này dựa vào việc thống kê tần xuất xuất hiện của giá trị các điểm ảnh, trên cơ sở đó mà có chiến lược mã hóa thích hợp. Một ví dụ điển hình cho kỹ thuật mã hóa này là *.TIF
• Nén ảnh khơng gian: Kỹ thuật này dựa vào vị trí khơng gian của các điểm ảnh để tiến hành mã hóa. Kỹ thuật lợi dụng sự giống nhau của các điểm ảnh trong các vùng gần nhau. Ví dụ cho kỹ thuật này là mã nén *.PCX
• Nén ảnh sử dụng phép biến đổi: Đây là kỹ thuật tiếp cận theo hướng nén khơng bảo tồn và do vậy, kỹ thuật thướng nến hiệu quả hơn. *.JPG chính là tiếp
• Nén ảnh Fractal: Sử dụng tính chất Fractal của các đối tượng ảnh, thể hiện sự lặp lại của các chi tiết. Kỹ thuật nén sẽ tính tốn để chỉ cần lưu trữ phần gốc ảnh và quy luật sinh ra ảnh theo nguyên lý Fractal.
2.1.5 Trích chọn đặc điểm
Các đặc điểm của đối tượng được trích chọn tuỳ theo mục đích nhận dạng trong q trình xử lý ảnh. Có thể nêu ra một số đặc điểm của ảnh sau đây:
• Đặc điểm không gian: Phân bố mức xám, phân bố xác suất, biên độ, điểm uốn v.v...
• Các đặc điểm loại này được trích chọn bằng việc thực hiện lọc vùng (zonal filtering). Các bộ vùng được gọi là “mặt nạ đặc 10 điểm” (feature mask) thường là các khe hẹp với hình dạng khác nhau (chữ nhật, tam giác, cung trịn v.v...)
• Đặc điểm biên và đường biên: Đặc trưng cho đường biên của đối tượng và do vậy rất hữu ích trong việc trích trọn các thuộc tính bất biến được dùng khi nhận dạng đối tượng. Các đặc điểm này có thể được trích chọn nhờ tốn tử gradient, tốn tử la bàn, toán tử Laplace, tốn tử “chéo khơng” (zero crossing) v.v…
Việc trích chọn hiệu quả các đặc điểm giúp cho việc nhận dạng các đối tượng ảnh chính xác, với tốc độ tính tốn cao và dung lượng nhớ lưu trữ giảm xuống.