2.2. Cơ sở về Xử Lý Ảnh
2.2.2. Ảnh và điểm ảnh
3 Tham khảo: Xử Lý Ảnh (Giáo trình dành cho sinh viên ngành Điện – Điện Tử)[6], TS. Nguyễn Thanh Hải. Nhà
Ảnh XỬ LÝ ẢNH Ảnh “tốt hơn” Kết luận Thu nhận ảnh (Scanner, Camera, Sensor,…) Tiền xử lý Đối sánh rút ra kết luận Trích chọn những đặc điểm Hậu xử lý Hệ quyết định Lưu trữ
CHƯƠNG 2 CƠ SỞ LÝ THUYẾT
Ảnh số là một tập hợp của nhiều điểm ảnh, hay còn gọi là pixel. Mỗi một pixel biểu diễn một màu sắc (ảnh màu) hay độ sáng (ảnh đen trắng) nhất định tại một điểm duy nhất. Pixel được xem như là dấu hiệu hay cường độ sáng tại 1 toạ độ trong không gian của ảnh. Các giá trị có thể có của các pixel của ảnh là mức xám và màu.
Ảnh được biểu diễn dưới dạng một ma trận 2 chiều với các pixel được xác định bởi cặp tọa độ (x, y). Giá trị độ sáng được số hóa trong xử lý ảnh được gọi là giá trị mức xám. Một ảnh số có kích thước xác định gồm có M hàng và N cột gọi là ảnh có kích
thước M × N và được biểu diễn dưới dạng mà trận như sau:
𝑓(𝑥, 𝑦) = [
𝑓(1,1) … 𝑓(1, 𝑁)
⋮ ⋱ ⋮
𝑓(𝑀, 1) … 𝑓(𝑀, 𝑁)
] (2.3)
Trong đó: 𝑓(𝑥, 𝑦) là giá trị của pixel tại vị trí (𝑥, 𝑦).
2.2.3. Phân loại ảnh
Có 2 dạng quan trọng trong ảnh số được dùng với nhiều mục đích khác nhau là ảnh màu và ảnh đen trắng (hay cịn gọi là ảnh xám), ngồi ra cịn có ảnh nhị phân và ảnh chỉ số.
2.2.3.1. Ảnh xám (gray image)
Ảnh đen trắng chỉ bao gồm 2 màu: màu đen và màu trắng. Người ta phân mức đen trắng đó thành L mức. Nếu sử dụng số bit B = 8 bit để mã hóa mức đen trắng (hay mức xám) thì L được xác định:
L = 2B (trong ví dụ ta có L = 28 = 256 mức).
Nếu L = 2, B=1, nghĩa là chỉ có 2 mức: mức 0 và mức 1, cịn gọi là ảnh nhị phân. Mức 1 ứng với màu sáng, còn mức 0 ứng với màu tối. Ảnh nhị phân khá đơn giản, các phần tử ảnh có thể coi như các phần tử logic. Ứng dụng chính của nó được dùng theo tính logic để phân biệt đối tượng ảnh với nền hay để phân biệt điểm biên với điểm khác.
CHƯƠNG 2 CƠ SỞ LÝ THUYẾT
Nếu L lớn hơn 2 ta có ảnh đa mức xám. Mức xám là kết quả của sự biến đổi tương ứng một giá trị độ sáng của một điểm ảnh thành một giá trị nguyên dương. Nói cách khác, với ảnh nhị phân mỗi điểm ảnh được mã hóa trên 1 bit, còn với ảnh đa mức xám, mỗi điểm ảnh được mã hóa trên nhiều bit hơn. Như vậy, nếu dùng 8 bit (1 byte) để biểu diễn mức xám, số các mức xám có thể biểu diễn được là 256. Mỗi mức xám được biểu diễn dưới dạng là một số nguyên nằm trong khoảng từ 0 đến 255, với mức 0 biểu diễn cho mức cường độ đen nhất và 255 biểu diễn cho mức cường độ sáng nhất.
Các thang giá trị mức xám thơng thường khác có thể là: 16, 32, 64, 128 mức.
Hình 2.9: Sự thay đổi mức xám
2.2.3.2. Ảnh màu (color image)
Một ảnh màu thường được tạo thành từ nhiều pixel, mỗi pixel có giá trị gồm 3 màu đỏ (red), xanh lục (green) và xanh dương (blue). Mỗi màu có giá trị từ 0 đến 255, nghĩa là mỗi pixel cần 24bits hay 3bytes để biểu diễn. Ta có thể kiểm tra bằng cách dùng phần mêm Paint của Windows, tạo một ảnh có kích thước 1024x1024 rồi lưu với định dạng màu BMP, sau đó xem thơng tin bức ảnh sẽ thấy size là 3MB.
2.2.3.3. Ảnh nhị phân (binary image)
Chỉ dùng duy nhất 1 bit để biểu diễn một pixel, giá trị mỗi pixel là 0 hoặc 1, nghĩa là đen hoặc trắng. Trong thực tế khi xử lý trên máy tính thì người ta dùng ảnh xám để biểu diễn ảnh nhị phân và lúc này 2 giá trị là 0 hoặc 255.
CHƯƠNG 2 CƠ SỞ LÝ THUYẾT
Một ảnh chỉ số bao gồm một ma trận dữ liệu X và ma trận bản đồ màu map, được tạo thành từ một mảng màu có sẵn bị giới hạn. Những ảnh này có dữ liệu dành cho mỗi pixel bao gồm chỉ số có sẵn chỉ rõ màu trong tập có sẵn ứng với pixel đang xem xét.
Lena Söderberg (Nguồn: Wikipedia)
Hình 2.10: Ví dụ ảnh màu (a) được biến đối sang ảnh xám (b) và ảnh nhị phân (c)
2.2.4. Các thiết bị thu nhận ảnh
Các thiết bị thu nhận ảnh bao gồm camera, scanner các thiết bị thu nhận này có thể cho ảnh đen trắng. Các thiết bị thu nhận ảnh có 2 loại chính ứng với 2 loại ảnh thông dụng Raster, Vector.
Các thiết bị thu nhận ảnh thông thường Raster là camera, các thiết bị thu nhận ảnh thông thường Vector là sensor hoặc bàn số hoá Digitalizer hoặc được chuyển đổi từ ảnh Raster.
Nhìn chung các hệ thống thu nhận ảnh thực hiện 2 q trình:
• Cảm biến: biến đổi năng lượng quang học thành năng lượng điện. • Tổng hợp năng lượng điện thành ảnh.
2.2.5. Biểu diễn ảnh
CHƯƠNG 2 CƠ SỞ LÝ THUYẾT
Ảnh trên máy tính là kết quả thu nhận theo các phương pháp số hoá được nhúng trong các thiết bị kỹ thuật khác nhau. Quá trình lưu trữ ảnh nhằm 2 mục đích:
• Tiết kiệm bộ nhớ • Giảm thời gian xử lý
Việc lưu trữ thông tin trong bộ nhớ có ảnh hưởng rất lớn đến việc hiển thị, in ấn, và xử lý ảnh được xem như là 1 tập hợp các điểm với cùng kích thước nếu sử dụng càng nhiều pixel thì bức ảnh càng đẹp, càng mịn và càng thể hiện rõ hơn chi tiết của ảnh, người ta gọi đặc điểm này là độ phân giải.
Việc lựa chọn độ phân giải thích hợp tuỳ thuộc vào nhu cầu sử dụng và đặc trưng của mỗi ảnh cụ thể, trên cơ sở đó các ảnh thường được biểu diễn theo 2 mơ hình cơ bản:
2.2.5.1. Mơ hình Raster
Đây là cách biểu diễn ảnh thông dụng nhất hiện nay, ảnh được biểu diễn dưới dạng ma trận các điểm (pixel). Thường thu nhận qua các thiết bị như camera, scanner. Tuỳ theo yêu cầu thực thế mà mỗi pixel được biểu diễn qua 1 hay nhiều bit.
Mơ hình Raster thuận lợi cho hiển thị và in ấn. Ngày nay công nghệ phần cứng cung cấp những thiết bị thu nhận ảnh Raster phù hợp với tốc độ nhanh và chất lượng cao cho cả đầu vào và đầu ra. Một thuận lợi cho việc hiển thị trong môi trường Windows là Microsoft đưa ra khuôn dạng ảnh DIB (Device Independent Bitmap) làm trung gian.
CHƯƠNG 2 CƠ SỞ LÝ THUYẾT
Hình 2.11: Quá trình hiển thị và chỉnh sửa, lưu trữ ảnh thơng qua DIB
2.2.5.2. Mơ hình Vector
Trong mơ hình vector người ta sử dụng hướng giữa các vector của pixel lân cận để mã hoá và tái tạo hình ảnh ban đầu, ảnh vector được thu nhận trực tiếp từ các thiết bị số hoá như Digital hoặc được chuyển đổi từ ảnh Raster thơng qua các chương trình số hố.
Biểu diễn ảnh mơng hình Vector ngồi mục đích tiết kiệm khơng gian lưu trữ dễ dàng cho hiển thị và in ấn còn đảm bảo dễ dàng trong lựa chọn sao chép di chuyển tìm kiếm. Những nghiên cứu về biểu diễn vectơ đều tập trung từ chuyển đổi từ ảnh Raster.
Hình 2.12: Sự chuyển đổi giữa các mơ hình biểu diễn ảnh
2.2.6. Chỉnh mức xám
Nhằm khắc phục tính khơng đồng đều của hệ thống gây ra. Thơng thường có 2 hướng tiếp cận: BMP, TIF, GIF, PCX … DIB Cửa sổ Paint Thay đổi
CHƯƠNG 2 CƠ SỞ LÝ THUYẾT
• Giảm số mức xám: Thực hiện bằng cách nhóm các mức xám gần nhau thành
một bó. Trường hợp chỉ có 2 mức xám thì chính là chuyển về ảnh đen trắng. Ứng dụng: In ảnh màu ra máy in đen trắng.
• Tăng số mức xám: Thực hiện nội suy ra các mức xám trung gian bằng kỹ thuật
nội suy. Kỹ thuật này nhằm tăng cường độ mịn cho ảnh.
2.2.7. Trích chọn đặc điểm
Các đặc điểm của đối tượng được trích chọn tuỳ theo mục đích nhận dạng trong q trình xử lý ảnh. Có thể nêu ra một số đặc điểm của ảnh sau đây:
• Đặc điểm khơng gian: Phân bố mức xám, phân bố xác suất, biên độ,
điểm uốn v.v..
• Đặc điểm biến đổi: Các đặc điểm loại này được trích chọn bằng việc thực hiện
lọc vùng (zonal filtering). Các bộ vùng được gọi là “mặt nạ đặc điểm” (feature mask) thường là các khe hẹp với hình dạng khác nhau (chữ nhật, tam giác, cung trịn v.v..)
• Đặc điểm biên và đường biên: Đặc trưng cho đường biên của đối tượng và do
vậy rất hữu ích trong việc trích chọn các thuộc tính bất biến được dùng khi nhận dạng đối tượng. Các đặc điểm này có thể được trích chọn nhờ tốn tử gradient, toán tử la bàn, tốn tử Laplace, tốn tử “chéo khơng” (zero crossing) v.v..
Việc trích chọn hiệu quả các đặc điểm giúp cho việc nhận dạng các đối tượng ảnh chính xác, với tốc độ tính tốn cao và dung lượng nhớ lưu trữ giảm xuống.
2.3. Các loại ảnh y khoa
CHƯƠNG 2 CƠ SỞ LÝ THUYẾT
Tia X hay X quang hay tia Röntgen được phát hiện bởi Wilhelm Röntgen4 vào năm 1895 là một dạng của sóng điện từ. Nó có bước sóng trong khoảng từ 0,01 đến 10 nanômét tương ứng với dãy tần số từ 30 Petahertz đến 30 Exahertz và năng lượng từ 120 eV đến 120 keV. Bước sóng của nó ngắn hơn tia tử ngoại nhưng dài hơn tia gamma.
Tia X có khả năng xuyên qua nhiều vật chất nên thường được dùng trong chụp ảnh y tế. Hình thái đơn giản nhất của ảnh X-Quang là hình chiếu 2D của cơ thể 3D được tạo ra trên phim chiếu xạ cơ thể với hạt photon X-ray. Chế độ này được gọi là chiếu hình ảnh phẳng. Mỗi tia của các hạt photon X-ray bị suy hao bởi các yếu tố phụ thuộc vào sự suy giảm tuyến tính hệ số dọc theo đường đi của các tia và tạo ra mức xám tương ứng tại các điểm trên phim hoặc các thiết bị đo được sử dụng.
Hình 2.13: Ảnh tia X hay hình chiếu 2D của vậy thể 3D 5
Hình ảnh X-Quang được tạo ra là hình phẳng 2D của vật thể 3D, nơi mà các chi tiết bên trong chồng lên nhau. Bộ thu thường dùng nhất trong ảnh X-Quang là màn phim kết hợp. Các tia X thoát ra từ vật thể 3D cần chụp và chạm vào màn huỳnh quang (phốt pho) lằm bằng hợp chất của các nguyên tố đất hiếm như lanthanum oxybromide hoặc
4 Wilhelm Conrad Röntgen (27/3/1845 – 10/2/1923), sinh ra tại Lennep, Đức, là một nhà vật lý, giám đốc Viện vật lý ở Đại học Würzburg.
CHƯƠNG 2 CƠ SỞ LÝ THUYẾT
gadolinium oxysulfide, tia X được chuyển thành hạt photon ánh sáng có thể nhìn thấy
được. Một phim nhạy sáng được đặt tiếp xúc với màn hình ghi nhận kết quả, phim chứa một lớp nhũ bạc halogen với độ dày khoảng 10 um. Độ sáng hoặc tối của phim phụ thuộc vào số lượng các photon ánh sáng đến phim.
Hình 2.14: Hình chụp X-Ray ngực của một bệnh nhân
2.3.2. Ảnh chụp CT
Kỹ thuật chụp quét cắt lớp điện toán (Computed Tomography), thường được gọi là chụp CT là phương pháp chẩn đốn hình ảnh sử dụng tia X để tạo nên các bức ảnh về mặt cắt các bộ phận cơ thể. CT đơi khi cịn được viết là CAT - Computed (Computerized)
Axial Tomography.
Trong quá trình chụp CT, tia X chiếu xung quanh vùng cần khảo sát, giúp tạo nên những hình ảnh ba chiều của cấu trúc cơ quan bên trong. Một máy tính thu thập những thơng tin này và sử dụng chúng để tạo ra các hình ảnh riêng biệt, được gọi là những "lát cắt". Những hình ảnh này có thể được lưu trữ, xem trên màn hình hoặc in ra thành phim. Có thể tạo nên các hình ảnh ba chiều của cơ quan trong cơ thể bệnh nhân bằng cách sắp xết từng lát cắt riêng lẻ lại với nhau.
CHƯƠNG 2 CƠ SỞ LÝ THUYẾT
Hình 2.15: Hình ảnh 2 lát cắt khi chụp CT vùng bụng
Chụp CT có thể tạo nên những hình ảnh chi tiết cơ thể một cách nhanh chóng, kể cả não, ngực và bụng. Chụp CT có thể được sử dụng để:
Khảo sát mạch máu.
Khảo sát các khối u, kể cả ung thư.
Hướng dẫn bác sĩ phẫu thuật sinh thiết đúng vị trí.
Với dạng đơn giản nhất của hình chụp CT, chỉ mặt phẳng cắt ngang cần thiết của cơ thể được chiếu xạ bằng cách sử dụng các tia chuẩn trực của các photon tia X, thay vì chiếu xạ trên tồn bộ cơ thể với chùm tia X dạng 3D như trong chụp X-Quang thông thường. Các tia X được đo tại nhiều vị trí và góc xung quanh cơ thể và qt qua cơ thể. Sau đó dựa trên ngun tắc khơi phục hình ảnh từ hình chiếu để tính tốn hình chụp của một phần cơ thể.
Lát cắt 1
Lát cắt 2
Đốt sống
CHƯƠNG 2 CƠ SỞ LÝ THUYẾT
Hình 2.16: Mơ tả chụp cắt lớp CT
Trong hình 2.16, chỉ mặt phẳng ngang cần thiết mới được chiếu xạ tia X. Hình chiếu của mặt phẳng cắt ngang 2D – PQRS của đối tượng đã thể hiện một hình 1D – P’Q’.
Điểm bất lợi của phương pháp chụp ảnh X-Quang và CT là kỹ thuật bức xạ ion- hóa có thể gây nguy hiểm cho các mơ, có mức giới hạn về cường độ bức xạ mà mỗi bệnh nhân có thể chụi được. Đặc biệt là trong chụp X-Quang, CT sản khoa và nhi khoa.
CHƯƠNG 2 CƠ SỞ LÝ THUYẾT
Ảnh CT được tái tạo từ việc ánh xạ hệ số suy hao tuyến tính từ đối tượng xử lý của hệ thống chụp CT. Tỷ lệ cường độ sáng trong ảnh CT tính theo đơn vị Hounsfield6 (HU). Hệ số suy hao tuyến tính trong ảnh CT gồm 1 khoảng rất rộng giá trị Hounsfield từ -1000 HU (khơng khí) tới trên +3000 HU (xương) cho nên rất khó quan sát ảnh nếu khơng biến đối chúng về dạng thang đo mức xám phù hợp độ phân giải trên màn hình vi tính hoặc lá phim.
Hình 2.18: Mơ tả q trình ánh xạ ảnh CT
2.3.3. Ảnh chụp MRI
Chụp cộng hưởng từ gọi đầy đủ là "chụp cộng hưởng từ hạt nhân" hay MRI
(Magnetic Resonance Imaging) là một phương pháp thu hình ảnh của các cơ quan trong
cơ thể sống và quan sát lượng nước bên trong các cấu trúc của các cơ quan. Ảnh cộng hưởng từ hạt nhân dựa trên một hiện tượng vật lý là hiện tượng cộng hưởng từ hạt nhân.
6 Sir Godfrey Newbold Hounsfield, (1919-2004) là kỹ sư về điện người Anh. Ông cùng với Allan McLeod Cormack giành giải Nobel Sinh lý và Y khoa năm 1979 cho cơng lao triển khai kỹ thuật X-quang cắt lớp có sự hỗ trợ của máy tính. Chiếc máy chụp cắt lớp vi tính do Hounsfield phát minh ra vào năm 1972 được dùng để chụp
Ảnh CT gốc Ảnh ánh xạ 255 0 -1000 >3000 W L
CHƯƠNG 2 CƠ SỞ LÝ THUYẾT
Chụp MRI bắt đầu được dùng để chẩn đoán bệnh từ năm 1982. Hiện tượng cộng hưởng từ hạt nhân bắt đầu được 2 tác giả Bloch và Purcell7 phát hiện năm 1952. Sự khác nhau cơ bản giữa chụp MRI và chụp X-Quang là năng lượng dùng trong chụp X quang là năng lượng phóng xạ tia X cịn trong chụp MRI là năng lượng vô tuyến điện.
Mọi vật thể đều được cấu tạo từ nguyên tử. Hạt nhân nguyên tử được cấu tạo từ các proton (mỗi proton mang điện tích +1) và các neutron (khơng mang điện tích). Quay quanh hạt nhân là các electron (mang điện tích âm). Trong nguyên tử trung hịa về điện tích, số proton của hạt nhân bằng đúng số electron của nguyên tử đó. Tất cả các “hạt” này đều chuyển động. Neutron và proton quay quanh trục của chúng, electron quay quanh hạt nhân và quay quanh trục của chúng. Sự quay của các “hạt” nói trên quanh trục của chúng tạo ra một mơmen góc quay gọi là spin. Ngồi ra, các hạt mang điện tích khi chuyển động sẽ sinh ra từ trường. Vì proton có điện tích dương và quay nên nó tạo ra một từ trường giống như một nam châm nhỏ, gọi là mômen từ (magnetic moment). Trong điều kiện bình thường các momen từ định hướng phân tán làm chúng triệt tiêu nhau, nên người ta khơng ghi được tín hiệu gì của chúng. Nhờ các đặc tính vật lý như vậy, khi đặt một vật thể vào trong một từ trường mạnh, các momen từ đang định hướng phân tán sẽ trở nên định hướng song song và đối song song.
Hình 2.19: Định hướng phân tán của các momen từ