Đáp án: Cách làm âm ảnh được cho bằng phương trình: s=L-1-r trong đó L=256 là số lượng mức xám, r là mức xám đầu vào, s là mức xám đầu ra Quan sát đồ thị ta thấy: Mức xám đầu ra “ngược”
Trang 1Đề thi Xử Lý Ảnh
GV: Trần Tiến Đức
MỤC LỤC
ĐỀ THI VÀ ĐÁP ÁN MÔN XỬ LÝ ẢNH SỐ
Chương 3 gồm 13 câu từ câu 1 đến câu 13
Câu 1 Xây dựng và cài đặt thuật toán làm âm ảnh.
Đáp án:
Cách làm âm ảnh được cho bằng phương trình: s=L-1-r trong đó L=256 là số lượng mức xám, r
là mức xám đầu vào, s là mức xám đầu ra
Quan sát đồ thị ta thấy: Mức xám đầu ra “ngược” với đầu vào, tức là thuật toán này biến ảnh đen trở thành ảnh trắng và trắng thành đen.
L-1
L-1
Trang 2• log(1+r): tránh trường hợp log = 0.
Quan sát đồ thị thấy đường log làm cho ảnh trở nên sáng hơn.
Hằng số c được tính như sau:
L-1 (0,0)
Negative
Trang 3Câu 3 Xây dựng và cài đặt thuật toán biến đổi lũy thừa ảnh.
• γ>1: làm cho ảnh tối hơn.
c: được tính như sau:
R
Trang 4Câu 4 Xây dựng và cài đặt thuật toán biến đổi tuyến tính từng phần.
Đáp án:
Quan sát trên đồ thị ta thấy:
Biến đổi ảnh đen ít thành ảnh đen nhiều, làm cho ảnh trắng ít trở thành trắng nhiều Tức là làm tăng độ tương phản của ảnh (kéo giãn độ tương phản).
1
x x
x x
−
−
Y=
1 2
1 2
(r2,s2)
(r1,s1)
Trang 6Cân bằng histogram được cho bằng phương trình:
s=T(r)=(L-1) ∫r pr w dw
0
) (
với pr(w) : Xác suất xảy ra mức xám w
Trong xác suất, tích phân của hàm mật độ là hàm phân phối Công thức trên có w là biến liên
tục, ta không thể lập trình nó Ta phải dùng công thức rời rạc:
sk=T(rk)=(L-1) ∑
=
k j
j
r r p
0
) ( với k= 0,1,2,…,L-1
Trang 7Tính histogram của ảnh rồi suy ra hàm biến đổi histogram tự động
Biến đổi histogram mong muốn.
vk=G(zk)= k
k
j z j
s z
∑
= 0
) ( Cho rk, ta suy ra zk như sau:
zk = G-1(T(rk))
Ví dụ cho histogram mong muốn như hình vẽ sau:
Trang 8Để mô tả histogram mong muốn như hình vẽ, ta dùng phương trình đường thẳng đi qua hai điểm (x1,y1) và (x2,y2):
1
x x
x x
−
−
=>y=
1 2
1 2
x x
y y
Trang 9Trong trường hợp 2 mức xám kề nhau chênh lệch quá nhỏ, nếu ta cân bằng histogram tự động
sẽ không có kết quả Trong trường hợp đó ta phải dùng histogram cục bộ.
Chọn cửa sổ có kích thước lẻ để có phần tử trung tâm, ví dụ: m=n=3, cân bằng histogram của dữ liệu lấy từ cửa sổ và thay phần tử trung tâm bằng phần tử mới.
Trang 11Vì vậy ở phần này ta nêu ra tiêu chuẩn chọn khối ảnh để làm rõ.
Tiêu chuẩn chọn khối ảnh căn cứ vào 2 đại lượng thống kê là mean (giá trị trung bình hay giá trị
kỳ vọng) và variance (phương sai) Xem xét các ví dụ sau:
100 4 4 10 variance = 208/4 = 52
deviation = var iance =7.21
Trang 124 1 1 4 Variance=10/4=2.5
Deviation= var iance =1.58
Ý nghĩa:
Variance (phương sai) dùng để đo sự phân tán của dữ liệu xa hay gần giá trị mean Nếu variance bằng không nghĩa là dữ liệu bằng nhau.
Để đo 2 khối dữ liệu với nhau thì mean và variance của khối phải gần bằng nhau.
Tiêu chuẩn chọn khối trong ảnh để làm rõ:
2 : là phương sai, còn là độ lệch chuẩn.
) , (
y x f
y x Ef
msxy: mean của khối ảnh
mG: mean của toàn bộ ảnh
sxy: độ lệch chuẩn khối ảnh
G: độ lệch chuẩn của toàn bộ ảnh.
Nếu msxy<=k0mG và k1 G<= sxy<=k2 G
Nếu ngược lại
Trang 13variance = variance + (a[x][y]-mean)*(a[x][y]-mean);
Trang 14Câu 9 Xây dựng và cài đặt thuật toán lọc tuyến tính làm trơn.
Mặt nạ lọc người ta sẽ cho tùy vào bài toán cụ thể.
Tổng quát lọc trong không gian được cho bằng phương trình :
g(x,y)= ∑
−
a a
−
+ +
b b t
t y s x f t s
w ( , ) ( , ) Trong đó :
mxn là kích thước của bộ lọc, m và n thường là số lẻ để bộ lọc có phần tử trung tâm.
a=m/2 và b=n/2 là kích thước nữa bộ lọc.
Phép toán lọc trong không gian được gọi là tổng chập (convolution).
Đối với lọc tuyến tính, mặt nạ lọc thường là bộ lọc trung bình.
1 x
Trang 15Lọc median (lọc trung vị) là lấy vị trí chính giữa
Lọc median đặc biệt hiệu quả khi trong ảnh có nhiễu xung, nhiễu xung còn được gọi là nhiễu muối tiêu Nhiễu muối tiêu là những đốm đen và đốm trắng trong ảnh.
Thực hiện lọc median như sau:
Lấy số liệu vào từng cửa sổ (3x3) Tạo mảng một chiều, sắp tăng dần và phần tử f(x,y) được thay bằng phần tử chính giữa.
{
BYTE *b = *a;
BYTE temp;
Trang 16Người ta dùng đạo hàm cấp một hoặc cấp hai để làm tăng độ nét của ảnh.
Yêu cầu đaọ hàm cấp một:
- Đạo hàm cấp một bằng 0 trong miền có mức xám đồng đều.
- Đạo hàm cấp một khác 0 ở điểm đầu của mức xám bước hoặc mức xám thoai thoải.
- Đạo hàm cấp một khác 0 dọc theo mức xám thoai thoải.
Đạo hàm cấp một của hàm hai chiều được gọi là gradient, ký hiệu là ∇ và được định nghĩa như
sau :
Trang 17Đạo hàm cấp một theo hướng x là : gx = z8-z5
Đạo hàm cấp một theo hướng y là : gy = z6-z5
Nhưng Roberts đã định nghĩa đạo hàm cấp một theo x như sau : gx=z9-z5
và đạo hàm cấp một theo y là : gy=z8-z6
Trang 18Ta có hai mặt nạ gx và gy và gọi là mặt nạ Roberts.
Mặt nạ Roberts có kích thước chẵn nên không có phần tử trung tâm Do đó Sobel đã mở rộng định nghĩa đạo hàm cấp một như sau :
Trang 19double **Sobelx, **Sobely;
Sobelx[0][0] = -1; Sobelx[0][1] = -2; Sobelx[0][2] = -1;
Sobelx[1][0] = 0; Sobelx[1][1] = 0; Sobelx[1][2] = 0;
Sobelx[2][0] = 1; Sobelx[2][1] = 2; Sobelx[2][2] = 1;
Sobely[0][0] = -1; Sobely[0][1] = 0; Sobely[0][2] = 1;
Sobely[1][0] = -2; Sobely[1][1] = 0; Sobely[1][2] = 2;
Sobely[2][0] = -1; Sobely[2][1] = 0; Sobely[2][2] = 1;
ConvolutionInt(f,M,N,gx,Sobelx,m,n,TRUE);
ConvolutionInt(f,M,N,gy,Sobely,m,n,TRUE);
Mag[x][y] = abs(gx[x][y]) + abs(gy[x][y]);
Trang 20g[x][y] = (int)(1.0*r/max*255);
}
Yêu cầu của đạo hàm cấp hai:
- Đạo hàm cấp hai bằng 0 ở vùng có mức xám đồng đều.
- Đạo hàm cấp hai khác 0 ở đầu và cuối của mức xám bước hoặc mức xám thoai thoải.
- Đạo hàm cấp hai bằng 0 dọc theo mức xám thoai thoải.
Định nghĩa đạo hàm cấp hai của hàm một chiều như sau:
∇ : gradient (đạo hàm cấp một của hàm 2 biến)
Đạo hàm cấp 2 của ảnh còn được gọi là toán tử Laplace.
Trang 21) ,
(
2f x y
∇ =f(x+1,y)+f(x-1,y)+f(x,y+1)+f(x,y-1)-4f(x,y)
Hay viết dưới dạng mặt nạ như sau :
Ta mở rộng thêm các mặt nạ đào hàm cấp hai như sau :
Tùy bài toán mà ta dùng mặt nạ cho phù hợp.
Nâng cao độ nét của ảnh được cho bằng phương trình:
g(x,y)=f(x,y)+c[ ∇2f (x,y)]
Trong đó:
c=-1 nếu tâm mặt nạ âm
c=1 nếu tâm mặt nạ dương
Mức xám đầu ra sẽ có giá trị nhỏ hơn 0 và lớn hơn 255 nên ta phải chuẩn hóa để mức xám đầu
ra nằm trong khoảng 0 255.
Đơn giản nhất: nếu đầu ra có giá trị âm thì cho bằng 0, nếu đầu ra >255 thì cho bằng 255.
Chuẩn hóa cách khác:
Trang 22Ta có giá trị min (giá trị âm) và max, ta phải chuyển khoảng min max vào 0…255 bằng công thức sau :
g[x][y]=
min max
min ] ][
[
−
−
y x g
Trang 23w = (double **)Alloc2D(m,n,sizeof(double));
Trang 24Kí hiệu: f _( y x , ) : là ảnh đã làm nhòe,
Mặt nạ làm nhòe được biểu diễn bằng các phương trình sau:
gmask(x,y)=f(x,y) - f _( y x , ) g(x,y) = f(x,y) + k.gmask(x,y)
k được chọn > 0, khi k=1 ta gọi là mặt nạ làm nhòe, khi k>1 ta gọi là lọc tăng cường.
Mặt nạ Gauss dùng để làm nhòe ảnh được cho bằng phương trình :
gauss(x,y) = 2
2 2
2 σ
y xe
+
−
σ : độ lệch chuẩn được cho trước.
Code:
}
return;
}
Trang 25void UnsharpMask(BYTE **f, BYTE **g)
{
double **Gauss, sigma=3, sum;
double **fbar, **gmask;
// Tao mat na Gauss
Gauss[x+2][y+2] = exp(-(1.0*x*x+1.0*y*y)/(2*sigma*sigma));sum = 0;
ConvolutionDouble(f, M, N, fbar, Gauss, m, n, TRUE);
gmask[x][y] = (f[x][y] - fbar[x][y]);
int s;
double k = 4.5;
return;
}
Trang 26Chương 9 gồm câu 6 câu từ câu 14 đến câu 19
Câu 14 Xây dựng và cài đặt thuật toán Erosion.
Đáp án:
Erosion là bào mòn.
Cho A và B là 2 tập trong Z, bào mòn A bởi B kí hiệu là .
Ta lấy tập B dời đi một độ dời z sao cho tập vừa dời là tập con của A
Trang 27if (B[s+a][t+b] == 1 && f[p][q] != 255) {
flag = FALSE;
}}
Cho A và B là 2 tập trong Z, giãn nở A bởi B kí hiệu là được định nghĩa là:
Lấy tập dời đi một độ dời z sao cho tập vừa dời giao với tập A khác rỗng.
Lưu ý phương trình này dựa trên tập phản xạ của B, nhưng do B thường là đối xứng nên = B
Trang 28Opening của tập A bởi phần tử cấu trúc B ký hiệu là , được định nghĩa như sau:
Opening thường dùng để xóa nhiễu.
Trang 29Biên của tập A kí hiệu là Đầu tiên ta bào mòn A bởi B, lấy ảnh A ban đầu trừ đi ảnh
đã bào mòn, ta sẽ được biên.
// Hieu chinh anh
Trang 30g[x][y] = f[x][y] - temp[x][y];
return;
}
Câu 19 Xây dựng và cài đặt thuật toán lấp lỗ trống.
Đáp án:
Cho một đối tượng ở bên trong có lỗ trống, mục đích là ta phải lấp lỗ trống này.
Lấp lỗ trống được cho bằng phương trình:
Trang 31Thuật toán ngừng khi Xk của bước trước và sau không thay đổi.
c[x][y] = 255;
Trang 33}Thoat:
Trang 34Chương 10 gồm 7 câu từ câu 20 đến câu 26
Câu 20 Xây dựng và cài đặt thuật toán phát hiện cạnh ảnh bằng đạo hàm cấp hai.
Đáp án:
Có 3 bước cơ bản phải làm để phát hiện cạnh ảnh:
• Làm trơn ảnh để giảm nhiễu.
• Phát hiện những điểm ở trên cạnh.
• Bỏ những điểm ở trên cạnh không cần thiết.
Người ta dùng mặt nạ đạo hàm cấp hai để phát hiện cạnh ảnh, nhưng cạnh ảnh sẽ bị dày lên gấp đôi, và ta phải xử lí trường hợp này.
Ngoài ra người ta dùng các mặt nạ đạo hàm cấp hai sau đây để phát hiện cạnh ảnh.
Nếu muốn phát hiện đường thẳng trong ảnh thì ta dung lần 4 mặt nạ này lần lượt quét qua ảnh.
Ta gọi đầu ra tại 1 điểm ảnh là R1, R2, R3 và R4.
Điểm ảnh cần lấy có
Khi lập trình có 4 đầu ra, ta lấy điểm ảnh có Rmax.
Lưu ý tổng các hệ số trong mặt nạ đều = 0
Mục đích là khi quét mặt nạ qua vùng ảnh có độ sáng đồng đều thì đầu ra sẽ = 0.
Trang 35temp = (int **)Alloc2D(M,N,sizeof(int));
Trang 36Gọi gx là ảnh đạo hàm theo hướng x.
gy là ảnh đạo hàm theo hướng y.
Ảnh độ lớn:
hay dùng công thức xấp xỉ.
Ảnh của hướng (direction) hay là ảnh góc pha:
Ta có thể kết hợp thêm với ngưỡng để lấy những điểm ảnh trên cạnh cho tốt.
Chẳng hạn ta lấy ngưỡng =33% giá trị max của đạo hàm cấp 1, nếu ta phát hiện điểm ảnh nhỏ hơn ngưỡng thì ta bỏ qua.
Trang 37Được gọi là độ lệch chuẩn
được gọi là phương sai
Ta dùng hàm Gauss để làm trơn ảnh và lọc nhiễu.
Suy ra đạo hàm cấp 2 của Gauss
Đạo hàm cấp 2 của hàm 2 chiều Gauss còn được gọi là Laplace của Gauss và viết tắt là LoG Thuật toán Marr-Hildreth gồm các bước sau đây.
- Dùng mặt nạ Gauss để làm trơn ảnh
- Tính Laplace của ảnh ở bước 1.
- tìm điểm cắt 0 của ảnh đạo hàm cấp 2, điểm cắt 0 là điểm ảnh ở bước 2 mà trước đó có giá trị dương và sau đó có giá trị âm và ngược lại.
Trang 38Ta thường cho = 4 và kích thước của bộ lọc là n = 6
Câu 23 Xây dựng thuật toán phát hiện cạnh Canny.
Đáp án:
Cho đến nay phương pháp phát hiện cạnh của Canny là tốt nhất.
Phương pháp của Canny dựa trên 3 mục tiêu sau đây:
Trang 39• Bước 1: dùng mặt nạ Gauss làm trơn ảnh.
• Bước 2: tính ảnh đạo hàm cấp 1 và ảnh góc pha: M(x,y) và α(x,y).
• Bước 3: xóa những đỉnh nhỏ.
• Bước 4: dùng ngưỡng kép và phân tích liên thông để nối các cạnh bị đứt.
Ví dụ: ngưỡng thấp được chọn TL=0.04, ngưỡng cao được khoảng 2.5 TL.
Câu 24 Xây dựng thuật toán liên kết cạnh bằng xử lý cục bộ.
Đáp án:
Dùng mặt nạ đạo hàm cấp một như Sobel hay Prewitt để phát hiện cạnh của ảnh đã làm trơn.
Bước 1: Tính M(x,y) và α(x,y)
Bước 2: Tạo ảnh nhị phân g, theo công thức sau đây.
TM là ngưỡng, A là góc của cạnh cần quan tâm, TA là phạm vi góc
Bước 3: Quét từng dòng qua ảnh và lấp những lổ trống, nếu chiều dài của lổ trống đó không vượt quá K.
Bước 4: Phát hiện lổ trống theo hướng khác bằng cách là quay ảnh một góc , lặp lại bước 3
và quay ngược trở lại
Trang 40Viết phương trình đường thẳng đi qua hai điểm A và B, tiếp theo ta tính khoảng cách từ các điểm còn lại đến đường thẳng đó và chọn khoảng cách lớn nhất, trong trường hợp này là điểm
C Viết phương trình đường thẳng qua AC và BC Tính khoảng cách còn lại từ các đỉnh và chọn khoảng cách lớn nhất D… Nối A B C D E F.Nếu khoảng cách từ các điểm đến đường thẳng nhỏ hơn ngưỡng T thì ta dừng và không chia tiếp Như vậy ta đã xấp xỉ 1 đường đứt nét thành đường gấp khúc
Hai vấn đề khó nhất là:
Thứ nhất làm sao ta biết được hai điểm ban đầu, thứ hai là sao biết được thứ tự của đỉnh Ta có thể chọn điểm bên phải nhất và bên trái nhất làm điểm ban đầu Cách khác là ta tìm những điểm xa nhất của đường cong Còn bây giờ thuật toán phải cho trước hai điểm ban đầu và cho trước các đỉnh theo thứ tự.
Thuật toán như sau:
Bước 1: cho trước P là tập hợp các đỉnh có thứ tự, cho trước hai đỉnh bắt đầu A và B.
Bước 2: khai bao ngưỡng T, ví dụ cho T=5, khai báo 2 stacks là open và closed.
Bước 3: đặt điểm A vào stacks open và điểm B vào stacks closed Đối với đường cong khép kín thì bước 3 có thay đổi một chút, điểm A được đưa vào stacks open và điểm B được đưa vào stacks open và stacks closed.
Trang 41Bước 4: viết phương trình đường thẳng của hai đỉnh sau cùng trong stacks closed và stacks open.
Bước 5: Tính khoảng cách từ các đỉnh giữa hai đỉnh ở bước 4 với đường thẳng ở bước 4 và chọn đỉnh có khoảng cách lớn nhất.
Bước 6: Nếu khoảng cách lớn nhất lớn hơn ngưỡng thì đưa đỉnh đó vào stack opend và quay trở lại bước 4
Bước 7: Ngược lại, lấy đỉnh trong open và đưa vào closed.
Bước 8: Nếu open chưa rỗng thì đến bước 4.
Bước 9: đến khi nào open rỗng thì thôi, các đỉnh trong stacks closed là các đỉnh cần tìm.
Câu 26 Xây dựng và cài đặt thuật toán biến đổi Hough.
Đáp án:
Mục đích của biến đổi Hough là để phát hiện ra đường thẳng và đường tròn, hoặc đường bất kì Thông thường nhất là dùng biến đổi Hough để phát hiện
đường thẳng.
Cho điểm xi, yi ở trong mặt phẳng x, y.
Phương trình đường thẳng y=ax+b.
Nếu đường thẳng đi qua điểm (xi,yi) thì nó sẽ là yi=axI +b Khi
cho a, b thay đổi thì có rất nhiều đường thẳng đi qua (xi,yi).
Ta có thêm một điểm (xj,yj) nữa thì cũng có vô số đường thẳng
đi qua (xj,yj).
Như vậy sẽ có một đường thẳng đi qua hai điểm (xi,yi) và (xj,yj).
Và đường thẳng đó sẽ có a, b giống nhau.
Yi= axi+b
Yj= axj+b
Trang 42Dùng mặt phẳng a, b không biết được kích thước ảnh là bao
nhiêu vì cho ảnh chạy từ -∞, ∞ và b: -∞, ∞
Để khắc phục a, b có thể ra tới ∞, thì ta chuyển phương trình
đường thẳng qua tọa độ cực:
Do các điểm ảnh có tọa độ x dương, y dương nên chạy từ -900
đến 900 và phạm vi của là , trong đó D là khoảng
cách xa nhất giữa 2 góc đối diện ở trong ảnh.
if ((int)(x*cos(theta*pi/180)+y*sin(theta*pi/180)) == rho)
Hough[rho+RHO/2][theta+THETA/2] += 20;
Trang 44Chương 4 gồm 10 câu từ câu 27 đến câu 36
Câu 27 Trình bày các bước lọc ảnh trong miền tần số.
Đáp án:
Lọc ảnh trong miền tần số gồm 7 bước sau đây:
Bước 1: Cho ảnh đầu vào f(x,y) có kích thước MxN Mở rộng ảnh có kích thước là PxQ Cụ thể P=2M, Q=2N.
Bước 2: Thêm zero vào phần mở rộng, ta được ảnh fp(x,y).
Bước 3: Nhân fp(x,y) với (-1)x+y để dời F(0,0) vào tâm ảnh.
Bước 4: Biến đổi Fourier của ảnh ở Bước 3 ta được F(u,v).
Bước 5: Cho hàm lọc có giá trị thực H(u,v) đối xứng qua tâm (P/2,Q/2) Thực hiện phép nhân G(u,v) = F(u,v)H(u,v).
Bước 6: Thu được ảnh đã xử lý bằng biến đổi Fourier ngược, lấy phần thực và dời trở lại gốc tọa
độ
Bước 7: Bỏ phần đã mở rộng, ta thu được ảnh g(x,y) có kích thước MxN.
Biểu diễn bằng sơ đồ khối:
Trang 45Câu 28 Xây dựng và cài đặt thuật toán làm trơn ảnh trong miền tần số dùng bộ lọc lowpass lý tưởng.
Đáp án:
Lọc trong miền tần số được cho bằng phương trình:
Trong đó F(u,v) là biến đổi Fourier của ảnh f.
Để làm trơn trong miền tần số ta dùng bộ lọc lowpass (thông thấp).
Có 3 loại bộ lọc thông thấp thông dụng:
Bộ lọc lowpass lý tưởng, Butterworth, Gauss.
Bộ lọc lowpass lý tưởng không thể chế tạo được bằng phần cứng do quán tính của linh kiện điện tử Tuy nhiên ta có thể lập trình bằng phần mềm Bộ lọc lowpass lý tưởng được cho bằng phương trình:
trong đó:
D0 là tần số cắt
D(u,v) là khoảng cách từ một điểm bất kì (u,v) đến tâm của ảnh
Đồ thị của bộ lọc lowpass lý tưởng
Trang 46void IdealLowpassFiltering(BYTE **f, BYTE **g)
// Buoc 1 va 2 Mo rong anh va them zero