Lời mở dầu Xử lý ảnh là một ngành khoa học còn tương đối mới mė so với nhiều ngành khoa học khác. Hiện nay nó đang là một trong những lĩnh lực được quan tâm và đã trở thành môn học chuyên ngành của sinh viên hệ kỹ sư, cử nhân ngành Công nghệ Thông tin. Nhờ có công nghệ số hóa hiện đại, ngày nay con người đã có thể xử lý tín hiệu nhiều chiều thông qua nhiều hệ thống khác nhau, từ những mạch số đơn giản cho đến những máy tính song song cao cấp. Mục tiêu của xử lý này có thể chia làm ba hướng như sau: + Xử lý ảnh ban đầu để có được ảnh mới theo một yêu cầu xác định (ví dụ như ảnh mờ cần xử lý để đưoc ảnh rõ hơn) + Phân tích ảnh để thu được các thông tin đặc trưng giúp cho việc phân loại, nhận biết ảnh (ví dụ phân tích ảnh vân tay để trích chọn các đặc trưng vân tay) + Hiểu ảnh đầu vào để có những mô tả về ảnh ở mức cao hơn, sâu hơn (ví dụ từ ảnh mộttai nạn giao thông phác họa hiện trường tai nạn). Trong bài giảng này, chúng ta sẽ tập trung vào những khái niệm cơ bản của xử lý ảnh và giới hạn vấn đề trong phạm vi 2 chiều Các ứng dụng trong: Sản xuất và kiểm tra chất lượng Di chuyển của Robot Các phương tiện đi lại tự trị Công cụ hướng dẫn cho người mù An ninh và giám sát Nhận dạng đổi tượng, nhận dạng mặt Ứng dụng trong y học Sản xuất, hiệu chinh Video Chinh phục vũ trụ... Với những ứng dụng to lớn của công nghệ xử lý ảnh, chúng ta hãy bắt tay vào ngay từ bây giờ tỉm hiểu, làm việc với một trong những thể giới đầy tiềm năng này.
Bài giảng Xử lý ảnh số Lời mở đầu Xử lý ảnh ngành khoa học tương đối mẻ so với nhiều ngành khoa học khác Hiện lĩnh lực quan tâm trở thành môn học chuyên ngành sinh viên hệ kỹ sư, cử nhân ngành Cơng nghệ Thơng tin Nhờ có cơng nghệ số hóa đại, ngày người xử lý tín hiệu nhiều chiều thơng qua nhiều hệ thống khác nhau, từ mạch số đơn giản máy tính song song cao cấp Mục tiêu xử lý chia làm ba hướng sau: Xử lý ảnh ban đầu để có ảnh theo yêu cầu xác định (ví dụ ảnh mờ cần xử lý để ảnh rõ hơn) Phân tích ảnh để thu thơng tin đặc trưng giúp cho việc phân loại, nhận biết ảnh (ví dụ phân tích ảnh vân tay để trích chọn đặc trưng vân tay) Hiểu ảnh đầu vào để có mô tả ảnh mức cao hơn, sâu (ví dụ từ ảnh mộttai nạn giao thơng phác họa trường tai nạn) Trong giảng này, tập trung vào khái niệm xử lý ảnh giới hạn vấn đề phạm vi – chiều Các ứng dụng trong: - Sản xuất kiểm tra chất lượng - Di chuyển Robot - Các phương tiện lại tự trị - Công cụ hướng dẫn cho người mù - An ninh giám sát - Nhận dạng đối tượng, nhận dạng mặt - Ứng dụng y học - Sản xuất, hiệu chỉnh Video - Chinh phục vũ trụ… Với ứng dụng to lớn công nghệ xử lý ảnh, bắt tay vào từ tìm hiểu, làm việc với giới đầy tiềm GV Mai Cường Thọ Bài giảng Xử lý ảnh số Chương I Tổng quan hệ thống xử lý ảnh vấn đề xử lý ảnh I Ảnh Hệ thống xử lý ảnh Ảnh - Tín hiệu ảnh thuộc loại tín hiệu đa chiều: tọa độ(x,y,z), độ sáng(λ), thời gian(t) - Ảnh tĩnh không gian chiều định nghĩa hàm biến S(x,y), với S giá trị biên độ (được biểu diễn màu sắc) vị trí khơng gian (x,y) - Phân loại ảnh + Ảnh tương tự S(x,y): (x,y) liên tục, S liên tục + Ảnh số S(m,n): (m,n) rời rạc, S rời rạc - Một ảnh (gồm tập điểm ảnh) xem bao gồm tập ảnh (các vùng ảnh) Thuật ngữ gọi ROIs – vùng quan tâm (Regions of Interest) - Ảnh số không gian rời rạc thu từ ảnh tương tự khơng gian liên tục thơng qua q trình số hóa Q trình số hóa hiểu đơn giản sau + Ảnh tương tự chia thành M hàng, N cột + Giao hàng cột gọi là: pixel + Giá trị biên độ pixel tọa độ nguyên (m,n) s(m,n): trung bình độ sáng pixel S (m, n) ≤ L (L số mức xám dùng biểu diễn ảnh) - M, N thường chọn M=N=2K (K=8,9,10) L =2B , B số bít mã hóa cho độ sáng(biên độ) pixel - Ảnh số biểu diễn ma trận chiều Các phần tử biểu diễn cho pixel số hóa - Ta ký hiệu ảnh số S(M,N) Ta nói ảnh có độ phân giải MxN Ký hiệu s(m,n) để phần tử ảnh Hình 1.1 : Ảnh tương tự Ảnh số hóa GV Mai Cường Thọ Bài giảng Xử lý ảnh số Hệ thống xử lý ảnh - Xử lý ảnh: Ảnh vào → Ảnh kết - Đối tượng xử lý hệ thống ảnh (hàm biến liên tục rời rạc) - Có thể tóm tắt hệ thống xử lý ảnh gồm giai đoạn sau: Hình 1.2 Các giai đoạn hệ thống xử lý ảnh + Thu nhận ảnh: - Qua camera (tương tự, số) - Từ vệ tinh qua cảm ứng (Sensors) - Qua máy quét ảnh (Scaners) + Số hóa ảnh: Biến đổi ảnh tương tự thành ảnh rời rạc để xử lý máy tính: Thơng qua q trình lấy mẫu (rời rạc mặt không gian) lượng tử hóa (rời rạc mặt biên độ) + Xử lý số: tiến trình gồm nhiều cơng đoạn nhỏ: Tăng cường ảnh (Enhancement), khôi phục ảnh (Restoration), phát biên (Egde Detection), phân vùng ảnh (Segmentation), trích chọn đặc tính (Feature Extraction) + Hệ định: Tùy mục đích ứng dụng mà chuyển sang giai đoạn khác hiển thị, nhận dạng, phân lớp, truyền thông… II Các vấn đề xử lý ảnh Biểu diễn mơ hình hóa ảnh Biểu diễn ảnh - Ảnh xem hàm biến chứa thông tin biểu diễn ảnh Các mơ hình biểu diễn ảnh cho ta mô tả logic hay định lượng hàm Dựa vào phần tử đặc trưng ảnh pixel Giá trị pixel giá trị vô hướng, vector (3 thành phần trường hợp ảnh màu) - Ta biểu diễn ảnh hàm toán học, ma trận điểm Trong mơ hình tốn học, ảnh hai chiều biểu diễn nhờ hàm hai biến, GV Mai Cường Thọ Bài giảng Xử lý ảnh số ∑ ∑ S (k , l )δ (m − k , n − l ) ∞ S (m, n) = ∞ với ≤ m, k ≤ M − 1, ≤ n, l ≤ N − k = −∞ l = −∞ Biểu diễn hàm toán - S: ảnh - (m,n): Tọa độ Pixel miền không gian (2D) - s(m,n): Độ sáng (Mức xám) pixel (m,n) - [0-Lmax]: Thang mức xám - Vùng mức xám phép sử dụng Lmax thường 255, nghĩa sử dụng thang mức xám bit ≤ s(m, n) ≤ 255 - Với ≤ m ≤ M − 1, ≤ n ≤ N − , ta gọi ảnh số M x N Biểu diễn ma trận điểm: Hình 1.3 a, Ảnh thật 10x10; b, Ảnh zoom; c, Mô tả ảnh ma trận điểm Mơ hình hóa ảnh - Mơ hình cảm nhận ảnh: Là mơ hình biểu diễn thơng qua thuộc tính cảm nhận ảnh (màu sắc, cường độ sáng), thuộc tính thời gian, cảm nhận phối cảnh, bố cục - Mô hình cục bộ: Là mơ hình biểu diễn thể mối tương quan cục phần tử ảnh (ứng dụng cho toán xử lý nâng cao chất lượng ảnh) - Mơ hính tổng thể: Là mơ hình biểu diễn ảnh xem ảnh tập hợp đối tượng, đối tượng có mối quan hệ khơng gian với (ứng dụng cho tốn phân nhóm nhận dạng ảnh) Tăng cường ảnh Mục đích: Tăng cường thuộc tính cảm nhận, làm cho ảnh tốt lên theo ý nghĩa đó, tiện phục vụ cho xử lý GV Mai Cường Thọ Bài giảng Xử lý ảnh số Các thao tác: - Thay đổi độ tương phản, thay đổi màu sắc, cường độ sáng, lọc nhiễu, nội suy, làm trơn ảnh Các phương pháp chính: - Các phương pháp thao tác điểm (Point Operation) - Các thao tác không gian (Spatial Operation) Khơi phục ảnh Mục đích: Khơi phục lại ảnh ban đầu, loại bỏ biến dạng khỏi ảnh tùy theo nguyên nhân gây biến dạng Ảnh đầu vào f (α , β ) g ( x, y ) = h( x, y;α , β ) Hệ thống thu nhận ảnh Ảnh đầu g ( x, y ) ∫ ∫ h( x, y;α , β ) f (α , β )dαd ( β + η ( x, y)) ∞ ∞ − ∞− ∞ η ( x, y ) hàm biểu diễn nhiễu cộng f (α , β ) hàm biểu diễn đối tượng g ( x, y ) ảnh thu nhận h( x, y;α , β ) đáp ứng xung hệ thống, gọi hàm tán xạ điểm (Point Spread Function- PSF) Một vấn đề khơi phục ảnh tiêu biểu tìm xấp xỉ f (α , β ) PSF đo lường hay quan sát được, ảnh mờ tính chất sác xuất q trình nhiễu Các thao tác: lọc nhiễu, giảm độ méo,… Các phương pháp: lọc ngược, lọc thích nghi (Wiener), khơi phục ảnh từ hình chiếu Biến đổi ảnh Mục đích: Biến đổi thể ảnh góc nhìn khác tiến cho việc xử lý, phân tích ảnh Các phương pháp: Biến đổi Fourier, Sin, Cosin, KL, … Phân tích ảnh Mục đích: Tìm đặc trưng ảnh, xây dựng quan hệ chúng dựa vào đặc trưng cục Các thao tác: Tìm biên, tách biên, làm mảnh đường biên, phân vùng ảnh, phân loại đối tượng GV Mai Cường Thọ Bài giảng Xử lý ảnh số Các phương pháp: Phương pháp phát biên cục bộ, dò biên theo qui hoạch động, phân vùng theo miền đồng nhất, phân vùng dựa theo đường biên… Nén ảnh Mục đích: giảm không gian lưu trữ, thuận tiện truyền thông mạng Phương pháp: nén không thông tin, nén thông tin + Nén khơng thơng tin (nén xác): khai thác thông tin dư thừa + Nén thông tin: khai thác thông tin dư thừa thơng tin khơng liên quan - Hiện có số chuẩn nén hay dùng: JPEG, MPEG (JPEG-2000, MPEG-4) Nhận dạng - Nhận dạng ảnh trình liên quan đến mô tả đối tượng mà người ta muốn đặc tả Thường sau q trình trích chọn đặc tính đối tượng - Có kiểu mô tả đối tượng: + Mô tả theo tham số (nhận dạng theo tham số) + Mô tả theo cấu trúc (nhận dạng theo cấu trúc) Ứng dụng: nhận dạng đối tượng, mặt, vân tay, văn bản… - Nhận dạng chữ in đánh máy phục vụ cho việc tự động hóa việc đọc tài liệu, tăng nhanh tốc độ chất lượng thu nhận thông tin từ máy tính - Nhận dạng chữ viết tay (với số ràng buộc) Mạng nơron kỹ thuật áp dụng vào nhận dạng cho kết khả quan III Một số quan hệ pixel - Gọi f(x,y) ảnh số, p, q điểm ảnh, S tập điểm ảnh Quan hệ láng giềng (neighborhood) Cho điểm ảnh p(x,y) - Các láng giềng theo hướng đứng, ngang N4(p): (x+1,y), (x-1,y), (x,y+1), (x,y-1) - Các láng giềng theo hướng chéo ND(p): (x+1,y+1), (x+1,y-1), (x-1,y+1), (x-1,y-1) - Các láng giềng theo hướng N8(p): N4(p) + ND(p) N4(p) ND(p) Quan hệ liên thông (Conectivity) GV Mai Cường Thọ N8(p) Bài giảng Xử lý ảnh số - Quan hệ liên thông pixel quan trọng vì: sử dụng để thiết lập đường biên đối tượng thành phần vùng ảnh - Hai pixel có quan hệ liên thông với nếu: + Chúng láng giềng + Các giá trị xám chúng thỏa mãn tiêu chuẩn định tương đồng - Với ∀p ∈ S , tập pixel S có liên thơng với p gọi thành phần liên thông S - Nếu S có thành phần liên thơng, S gọi tập liên thông Quan hệ lân cận (Adjacency) Gọi V tập giá trị xám dùng để định nghĩa lân cận Ví dụ V = {1} tập định nghĩa cho lân cận pixel có giá trị - 4-Adjacency: pixel p,q 4-Adjacency q ∈ N ( p) - 8-Adjacency: pixel p,q 8-Adjacency q ∈ N ( p) - m-Adjacency: pixel p,q m-Adjacency nếu: + q ∈ N ( p) q ∈ N D ( p ) N ( p ) ∩ N D ( p) ∉ V m-Adjacency cải tiến 8-Adjacency, nhằm loại bỏ bớt đường liên kết kép thường gặp phải ta dùng 8-Adjacency ảnh S1, S2 gọi lân cận nếu: số pixel S1 lân cận số pixel S2 Khoảng cách pixel (Distance Measures) Cho p(x,y), q(s,t), z(u,v) D hàm xác định khoảng cách + D(p,q) ≥ (D(p,q)=0 p=q) + D(p,q) = D(q,p) + D(p,z) ≤ D(p,q) + D(q,z) Khoảng cách Euclidean (De Distance) De ( p, q) = ( x − s )2 + ( y − t )2 - Các điểm có khoảng cách Euclidean nhỏ r kể từ (x,y) nằm đường trịn bán kính r tâm (x,y) City-Block Distance (D4 Distance) 2 GV Mai Cường Thọ 1 2 2 Bài giảng Xử lý ảnh số – D4(p,q) = |x-s| + |y-t| Ví dụ: Tập pixel với D4 ≤ kể từ p(x,y): ChessBoard Distance (D4 Distance) – D8(p,q) = max(|x-s|,|y-t|) Ví dụ: Tập pixel với D8 ≤ kể từ p(x,y): 2 2 2 1 2 1 2 1 2 2 2 Rõ ràng D4, D8 độc lập với đường (path) tồn nối điểm Bởi việc tính khoảng cách ta quan tâm tới tọa độ điểm (khơng ý đến việc có tồn đường liên thơng chúng hay khơng) IV Các mơ hình màu Dải phổ điện từ (Electromagnetic (EM)) Spectrum Mơ hình màu Là phương pháp diễn giải đặc tính tác động màu ngữ cảnh định Không có mơ hình màu đầy đủ cho khía cạnh màu Người ta sử dụng mơ hình màu khác để mơ tả tính chất nhận biết khác màu Thí dụ: GV Mai Cường Thọ Bài giảng Xử lý ảnh số + Mơ hình màu RGB: ánh sáng Red, Green Blue ứng dụng cho hình, TV + Mơ hình HSV: Nhận thức người + Mơ hình CYK: Máy in II.1 Màu sở biểu đồ màu CIE Năm 1931: CIE (Commision Internationale de l’Éclairage) xây dựng màu sở chuẩn quốc tế: • Cho phép màu khác định nghĩa tổng trọng lượng ba màu sở • Do khơng tồn màu sở chuẩn phổ nhìn thấy để tổng hợp màu -> CIE sử dụng màu tưởng tượng • Mỗi màu sở CIE xác định đường cong phân bổ lượng • Nếu A, B, C tổng số màu sở chuẩn cần xác định màu cho trước phổ nhìn thấy thành phần màu là: x= • A A+ B+C y= B C z= A+ B +C A+ B+C Nhưng x+y+z=1 cần giá trị xác định màu • Cho khả biểu diễn màu biểu đồ 2D -> Biểu đồ CIE Biểu đồ CIE • Khi vẽ giá trị x, y màu phổ nhìn thấy -> Biểu đồ CIE đường cong hình lưỡi (còn gọi biểu đồ kết tủa – CIE Chromaticity Diagram) • Các điểm màu gán nhãn đường cong từ violet (400 nm) đến red (700 nm) • Điểm C tương ứng màu trắng (ánh sáng ban ngày) • Biểu đồ CIE phương tiện lượng hóa độ tinh khiết bước sóng trội: • Độ tinh khiết điểm màu C1: xác định khoảng cách tương đối đoạn thẳng nối C với đường cong qua C1 • Màu • • bù: biểu diễn điểm cuối C3, C4 đoạn thẳng qua C Gam màu xác định điểm: biểu diễn đoạn thẳng nối hai điểm màu C5, C6 Gam màu xác định điểm: ba điểm C7, C8, C9 xác định màu tam giác GV Mai Cường Thọ Bài giảng Xử lý ảnh số 10 C2 C7 C9 C5 C8 C1 C4 C3 C C6 Hình vẽ biểu đồ màu CIE Ứng dụng biểu đồ CIE để so sánh gam màu thiết bị ngoại vi Máy in in màu hiển thị hình • GV Mai Cường Thọ Bài giảng Xử lý ảnh 51 II Phương pháp phát biên trực tiếp Tương tự phép toán làm trơn ảnh, khả lấy đạo hoàm theo tọa độ điểm quan trọng Bài toán chiếu theo định nghĩa toán học đạo hàm khơng thể thực việc lấy đạo hàm điểm ảnh, ảnh số hóa khơng phải hàm liên tục a[x,y] theo biến tọa độ mà hàm rời rạc a[m,n] với biến tọa độ nguyên Vì lý đó, thuật tốn ma trình bày xem xấp xỉ cho đạo hàm thật theo tọa độ ảnh liên tục ban đầu f(x) x f’(x ) x f’’(x) x Phương pháp Gradient Phương pháp gradient phương pháp dò biên cục dựa vào cực đại đạo hàm bậc Vì ảnh hàm biến, tính đạo hàm cần phải xác định hướng cần lấy đạo hàm Các hướng hướng ngang, dọc, tùy ý kết hợp hướng ngang dọc Ký hiệu hx , hy , hθ lọc đạo hàm theo hướng x,y, Ta có quan hệ sau: [ hθ ] = cos θ h x + sin θ h y Theo định nghĩa gradient ∇f ( x, y ) vectơ có thành phần biểu thị tốc độ thay đổi giá trị điểm ảnh theo hai hướng x y i x , i y vector đơn vị r r theo hai hướng x y ∇ f ( x, y ) = GV Mai Cường Thọ r r ∂f ( x, y ) r ∂f ( x, y) r ix + i y = (hx ⊗ f ( x, y))i x + (hx ⊗ f ( x, y ))i y ∂x ∂y Bài giảng Xử lý ảnh 52 Các thành phần gradient tính bởi: ∂f ( x, y ) f ( x + dx, y ) − f ( x, y ) = fx ≈ dx ∂x ∂f ( x, y ) f ( x, y + dy ) − f ( x, y ) = fy ≈ ∂y dy Với dx khoảng cách điểm theo hướng x(khoảng cách tính số điểm) tương tự với dy Trên thực tế người ta hay dùng dx=dy=1 Như ta có : Độ lớn Gradient : ∇f ( x, y = (hx ⊗ f ( x, y )) + (h y ⊗ f ( x, y )) h y ⊗ f ( x, y ) hx ⊗ f ( x, y ) Hướng Gradient : ψ (∇f ( x, y )) = arctan Độ lớn Gradiant xấp xỉ : ∇f ( x, y ) = hx ⊗ f ( x, y ) + h y ⊗ f ( x, y ) Trong kỹ thuật gradient, người ta chia nhỏ thành kỹ thuật(do dùng toán tử khác nhau) : kỹ thuật gradient kỹ thuật la bàn Kỹ thuật gradient dùng toán tử gradient lấy đạo hàm theo hướng; kỹ thuật la bàn dùng toán tử la bàn lấy đạo hàm theo hướng: Bắc, Nam, Đông, Tây Đông Bắc, Tây Bắc, Đông Nam, Tây Nam Thực ký thuật trên, với điểm ảnh I(m,n) I, đạo hàm theo x, theo y kí hiệu tương ứng Ix, Iy Ta có: I x (m, n) = I (m + 1, n) − I (m, n) I y (m, n) = I (m, n + 1) − I (m, n) r r ⇒ ∇I (m, n) = ( I (m + 1, n) − I (m, n ))i x + ( I ( m, n + 1) − I ( m, n))i y ⇒ ∇I (m, n ) = I (m + 1, n) − I (m, n ) + I ( m, n + 1) − I ( m, n) Điều tương đương với nhân chập ảnh với mặt nạ (bộ lọc) hx hy [hx ] = [h y ]T = [1 − 1] hx(m,n) I(m,n) hy(m,n) GV Mai Cường Thọ ∇I (m, n) + Bài giảng Xử lý ảnh 53 Nói chung, ảnh kết sau áp dụng kỹ thuật biên phụ thuộc nhiều vào việc chọn (hx , hy.) Sau số lọc khác hay dùng - [hx ] = [h y ]T = [1 − 1] (2.1) - Bộ lọc Sobel 1 − 1 1 1 [hx ] = 2 − 2 = 2 • [1 − 1] 4 1 − 1 1 1 1 1 1 h y = 0 = • [1 1] 4 − − 1 − 1 [ ] Theo ta thấy hx hy tách được, lọc lấy đạo hàm theo hướng nhờ phương trình (2.1) làm trơn theo hướng trực giao với hướng nhờ lọc tam giác 1- chiều - Bộ lọc Prewitt 1 − 1 1 1 1 [hx ] = 1 − 1 = 1 • [1 − 1] 3 1 − 1 1 1 1 1 1 1 hy = 0 = • [1 1] 3 − − − 1 − 1 [ ] Theo ta thấy hx hy tách được, lọc lấy đạo hàm theo hướng nhờ phương trình (2.1) làm trơn theo hướng trực giao với hướng nhờ lọc 1- chiều Toán tử la bàn Toán tử la bàn đo gradient theo số hướng chọn Nếu kí hiệu gk gradient la bàn theo hướng θk=π/2 +2kπ với k=0,1, 2,…7 Như ta có gradient E theo hướng ngược chiều kim đồng hồ [ hθ ] = cos θ h x + sin θ h y GV Mai Cường Thọ Bài giảng Xử lý ảnh 54 Có nhiều tốn tử la bàn khác Nhưng đây, trình bày cách chi tiết toán tử Kish Toán tử sử dụng mặt nạ 3x3 5 −3 H1 = − − −3 −3 −3 H4 = − −3 −3 −3 −3 0 5 W E WS −3 −3 −3 − H6 = 5 NE −3 −3 −3 −3 −3 H5 = − H2 = − −3 −3 −3 −3 −3 H3 = − N NW 5 −3 −3 − H7 = 5 −3 SE S −3 Mơ hình hướng 5 −3 H8 = −3 −3 −3 −3 −3 −3 Trong H1, H2, H3, …H8 tương ứng với hướng: 00, 450, 900, 1350, 1800, 2250, 3150 Nếu ta kí hiệu ∇i, i=1, 2, …8 gradient thu theo hướng mặt nạ, biên độ gradient (x, y) tính sau: ∇( x, y ) = Max( ∇ i ( x, y ) , i = 1,2, 8) Kỹ thuật Laplace Các phương pháp đánh giá gradient làm việc tốt độ sáng thay đổi rõ nét Khi mức xám thay đổi chậm, miền chuyển tiếp trải rộng, phương pháp hiệu phương pháp sử dụng đạo hàm bậc 2, gọi phương pháp Laplace Toán tử Laplace định nghĩa sau: ∇2 f = ∂2 f ∂2 f + dx dy Toán tử Laplace dùng nhiều kiểu mặt nạ khác để xấp xỉ rời rạc đạo hàm bậc hai Dưới kiểu mặt nạ hay dùng: −1 H1 = − − −1 −1 −1 −1 H2 = −1 −1 −1 −1 −1 −2 H3 = − − −2 Với mặt nạ H1, người ta dùng phần tử tâm có giá trị thay giá trị Để dễ hình dung việc xấp xỉ đạo hàm bậc hai không gian rời rạc mặt nạ H1 ý nghĩa mặt nạ H1, ta xét chi tiết cách tính đạo hàm bậc Trong không gian rời rạc đạo hàm bậc tính: GV Mai Cường Thọ Bài giảng Xử lý ảnh 55 ∂2 f = f ( x, y ) − f ( x − 1, y ) − f ( x + 1, y ) ∂x ∂2 f = f ( x, y ) − f ( x, y − 1) − f ( x, y + 1) ∂y Vậy ∇ f = − f ( x − 1, y ) − f ( x, y − 1) + f ( x, y ) − f ( x, y + 1) − f ( x + 1, y ) Phương pháp khớp nối lỏng a Khái niệm láng giềng láng giềng Với điểm P bao phủ xung quanh điểm: P0, P1, …P8 Ta có láng giềng P gồm điểm: P0, P1, P2, P3, P4, P5, P6, P7 Láng giềng P gồm điểm: P0, P2, P4, P6 P3 P2 P1 P4 P P0 P5 P6 P7 b Phương pháp khớp nối lỏng • Xét điểm p q điểm láng giềng • I(p), I(q): giá trị mức xám điểm p q • Nếu I ( p ) − I (q ) > θ coi có cặp biên (p, q) Ví dụ: Cho ma trận ảnh chọn θ =3 ta có 2 6 3 6 2 6 8 II CÁC KỸ THUẬT DỊ BIÊN Kỹ thuật Freeman(dị biên theo ảnh đen trắng) Thuật toán Bước1: Quét ảnh đến gặp điểm đen Gọi pixel Bước 2: Lặp Nếu “điểm ảnh thời đen” rẽ trái Ngược lại rẽ phải Dừng gặp điểm ban đầu GV Mai Cường Thọ Bài giảng Xử lý ảnh 56 34 33 12 13 10 15 18 14 19 11 35 32 16 25 31 30 27 29 28 17 21 20 24 23 26 22 Cải tiến thuật toán (Luân văn tiến sĩ: Hồ Ngọc Kỷ -1992) Thuật toán Bước1: Quét ảnh đến gặp điểm đen Gọi pixel Bước 2: Lặp Nếu “điểm ảnh thời đen” Thì “dị ngược” Ngược lại “sang phải” Đến gặp pixel 1 12 11 10 Dò biên theo cặp vùng Phương pháp Tìm cặp điểm (n,v), n v điểm láng giềng, n điểm v điểm vùng Ban đầu có (n0, v0) dựa vào ta tìm (n1, v1), qua trình tiếp tục Tổng quát có (ni, vi) ta tìm (ni+1, vi+1), cho ni ni+1 láng giềng , vi vi+1 láng giềng GV Mai Cường Thọ Bài giảng Xử lý ảnh 57 Q trình dị biên theo vùng là: tìm dãy điểm (n0, v0), (n1, v1)…(nk, vk) cho n0, n1, ….nk : chu tuyến v0, v1, ….vk : chu tuyến vùng Cặp (ni+1, vi+1) láng giềng 00000000000000 00001111111000 00011111111100 00011111111100 00011111111000 00011111110000 00001111100000 00000000000000 Xấp xỉ đoạn thẳng Nối điểm xuất phát R với điểm xét Pc đoạn thẳng Sau tính toạ độ Pi, điểm nằm R Pc cho khoảng cách từ Pi đến đoạn thẳng cực đại Gọi khoảng cách di Nếu di lớn ngưỡng cho trước (độ xác xấp xỉ) người ta phân đoạn RPc thành đoạn RPi PiPc tiếp tục thực lấy mẫu với đoạn đoạn thẳng tìm “rất gần” với đường bao • • • • Pi • • di • • • • • • Pi • di • • • • • Pc • P2 • R P1 • • • • Pc • R • • • R GV Mai Cường Thọ • • • • • • • • Pc Hình xấp xỉ đường biên đường gấp khúc Bài giảng Xử lý ảnh 58 III CÁC PHƯƠNG PHÁP PHÂN VÙNG ẢNH Để phân tích đối tượng ảnh, cần phải phân biệt đối tượng cần quan tâm với phần cịn lại ảnh Những đối tượng tìm nhờ kỹ thuật phân đoạn ảnh, theo nghĩa tách phần tiền cảnh khỏi hậu cảnh ảnh Chúng ta cần phải hiểu là: - Khơng có kỹ thuật phân đoạn vạn năng, theo nghĩa áp dụng cho loại ảnh Khơng có kỹ thuật phân đoạn hồn hảo Có thể hiểu phân vùng tiến trình chia ảnh thành nhiều vùng, vùng chứa đối tượng hay nhóm đối tượng kiểu Chẳng hạn, đối tượng kí tự trang văn đoạn thẳng vẽ kỹ thuật nhóm đối tượng biểu diễn từ hay hay đoạn thẳng tiếp xúc Ta có số phương pháp phân vùng ảnh sau: Thuật toán gán nhãn thành phần liên thông Kỹ thuật gán cho thành phần liên thông ảnh nhị phân nhãn riêng biệt Nhãn thường số tự nhiên đến tổng số thành phần liên thơng có ảnh Giải thuật quét ảnh từ trái sang phải từ xuống Trong dòng thứ pixel đen, nhãn gán cho đường chạy liên tục pixel đen Với pixel đen dòng tiếp theo, pixel lân cận dòng trước pixel bên trái xem xét Nếu pixel lân cận gán nhãn, nhãn tương tự gán cho pixel đen thời; ngược lại nhãn chưa sử dụng chọn Thủ tục tiếp tục dòng cuối ảnh Lúc kết thúc tiến trình này, thành phần liên thơng chứa pixel có nhãn khác xem xét lân cận pixel đen, chẳng hạn pixel “?” hình vẽ Pixel lân cận trái lân cận dịng trước gán nhãn cách riêng biệt Một tình phải xác định ghi lại Sau tiến trình quét ảnh, việc gán nhãn hoàn tất cách thống mâu thuẫn nhãn gán lại nhãn chưa sử dụng GV Mai Cường Thọ Bài giảng Xử lý ảnh 59 Để minh hoạ ta có hình biểu diễn sau : …… PPPP L? * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * P: lân cận trước, L lân cân trái 1 1 1 1 1 1 ? ⇒ * * * * * * * * * Hình b Ảnh ban đầu 1 1 1 1 1 1 4 4 4 2 2 2 2 2 1 1 3 3 2 2 2 2 2 * * * * * * * * * * Hình c Tiến trình gán nhãn Hình d Sau quét đầy đủ ⇒ 1 1 1 1 1 1 3 3 3 1 1 1 1 1 1 1 2 2 Hình e Kết sau Vd : phương pháp sửa nhãn ∃(p,q) liên thông mà label(p)label(q) -> sửa nhãn cho giống Phân vùng tách tứ phân Về nguyên tắc, phương pháp kiểm tra tính hợp thức tiêu chuẩn cách tổng thể miền lớn ảnh Nếu tiêu chuẩn thỏa, việc phân đoạn coi kết thúc Trong trường hợp ngược lại, ta chia miền xét thành miền nhỏ Với miền nhỏ, ta áp dụng cách đệ quy phương pháp tất miền thỏa Thuật toán tạo nên mà nút cha có nút mức trừ mức ngồi Vì có tên tứ phân Cây cho ta hình ản rõ nét cấu trúc phân cấp vùng tương ứng với tiêu chuẩn GV Mai Cường Thọ Bài giảng Xử lý ảnh 60 Một vùng thỏa chuẩn tạo nên nút lá, khơng tạo nên nút có nút tương ứng với việc chia làm vùng Ta tiếp tục phân xong Các nút biểu diễn số vùng phân Tiêu chuẩn phân vùng màu sắc Nếu điểm vùng màu trắng tạo nên nút trắng tương tự với nút đen Nút màu ghi vùng không phải tiếp tục chia Với ngưỡng θ cho trước, vùng phải thỏa điều kiện • • Độ lệch chuẩn σ < θ Hoặc Max − Min < θ với Max, Min giá trị lớn nhỏ mức xám vùng cần chia • Giá trị điểm ảnh vùng cách lấy trung bình giá trị vùng Ảnh gốc Vùng Vùng Vùng Vùng Phân đoạn mức Ví dụ: Cho ảnh S(m, n) , phân vùng theo tiêu chí: ngưỡng θ= Max − Min < θ Vùng 2 S (m, n) = 7 2 2 7 2 GV Mai Cường Thọ 4 5 5 4 4 5 5 4 6 3 6 6 3 6 8 2 8 8 2 9 2 4 6 8 kết 2 S (m, n) = 7 2 7 2 5 5 4 5 5 4 6 3 6 3 6 8 2 8 2 9 Bài giảng Xử lý ảnh 61 Ta có tứ phân sau 21 22 (4) (2) 23 24 (5) (5) (7) (2) (4) (2) (3) (6) (9) (3) (2) (8) (7) 11 14 (8) 12 13 (6) (7) (6) (9) (8) (2) (1) (3) (3) Phân vùng hợp Ý tưởng phương pháp xem xét ảnh từ miền nhỏ hợp chúng lại thỏa tiêu chuẩn để miền đồng lớn Ta lại tiếp tục với miền thu hợp Số miền lại cho ta kết phân đoạn Như miền nhỏ bước xuất phát điểm ảnh Phương pháp hợp vùng thực sau: • Giả sử có vùng ω ω’ • Ta xác định cặp điểm láng giềng (p, q) cho p ∈ω q ∈ω’ • Xác định T ( p, q) = 1 if I ( p ) − I (q) ≤ θ otherwise Trong I(p), I(q) giá trị mức xám điểm p q, θ1 giá trị ngưỡng cho trước • Gọi b(ω) b(ω’) số điểm biên vùng ω ω’ GV Mai Cường Thọ Bài giảng Xử lý ảnh • Xét 62 hàm khả hợp vùng : KNG (ϖ , ϖ ' ) = • Nếu ( ) ∑ T ( p, q) Min(b(ϖ ), b(ϖ ' )) KNG ϖ , ϖ ' ≥ θ hợp vùng ω ω thành vùng ’ Ví dụ: Xét khả hợp vùng ảnh sau, θ1 =3, θ =0.6 1 6 6 6 1 6 6 1 8 S ( m, n ) = 6 8 2 6 8 2 4 8 2 2 4 4 Gọi A, B, C, D, E vùng chứa mức xám 1, 2, 4, 6, Ta có bảng 1, Đếm số điểm biên vùng tính tốn ω’ ω A B C D E A B C D E B(ω) 0 0 0 11 0 11 - 10 11 19 10 ∑ T ( p, q) Xác định hợp vùng Bảng KNG(ω,ω’) A B C D E A B C D 5/10 0 5/10 4/6 0 4/6 3/6 0 3/6 - 0 11/10 Kết luận : Có thể hợp vùng D E 11/10 >θ2 Có thể hợp vùng B C 4/6 >θ2 GV Mai Cường Thọ Bài giảng Xử lý ảnh 63 IV Phân vùng ảnh dựa theo ngưỡng biên độ - Kỹ thuật lấy ngưỡng Kỹ thuật dựa ý tưởng đơn giản Một tham số θ, gọi ngưỡng độ sáng, chọn để áp dụng cho ảnh a[m,n] theo cách sau: Nếu a[m, n] ≥ θ a[m, n] = object = a[m, n ] = background = Ngược lại Thuật toán giả định quan tâm đến đối tượng sáng (object) hay ảnh (background) giá trị “1” “0” Câu hỏi trung tâm kỹ thuật lấy ngưỡng là: Chúng ta nên chọn ngưỡng θ nào? Mặc dù khơng có thuật tốn chọn ngưỡng vạn áp dụng cho loại ảnh Chúng ta có nhiều phương pháp đưa đây: Ngưỡng cố định Phương pháp chọn ngưỡng độc lập với liệu ảnh Nếu biết trước chương trình ứng dụng làm việc với ảnh có độ tương phản cao, đối tuợng quan tâm tối gần đồng sáng, giá trị ngưỡng khơng đổi 128 thang độ sáng từ đến 255 giá trị chọn xác Chính xác nên hiểu theo nghĩa số lượng điểm ảnh bị phân lớp sai cực tiểu Ngưỡng dựa lược đồ Trong hầu hết trường hợp, ngưỡng chọn từ lược đồ độ sáng vùng hay ảnh cần phân đoạn Hình cho ví dụ ảnh lược đồ độ sáng liên kết với GV Mai Cường Thọ Bài giảng Xử lý ảnh 64 Có nhiều kỹ thuật chọn ngưỡng tự động xuất phát từ lược đồ xám Những kỹ thuật phổ biến số trình bày Những kỹ thuật tận dụng lợi làm trơn liệu lược đồ ban đầu mang lại, nhằm loại bỏ dao động nhỏ độ sáng Tuy nhiên thuật tốn làm trơn cần phải cẩn trọng khơng làm dịch chuyển vị trí đỉnh lược đồ Nhận xét dẫn đến thuật toán làm trơn lược đồ dây, với độ rộng cửa sổ W N, thông dụng N=3 N=5 (bộ lọc trung bình 1-chiều): h smooth [b ] = N ( N −1 ) / ∑ h [b − i ] raw i = − (N −1) / 2.1 Tuật toán đẳng liệu (Isodata) Kỹ thuật chọn ngưỡng theo kiểu lặp Ridler Calvard đưa Thuật toán sau: - Chia lược đồ thành đoạn giá trị ngưỡng khởi động θ = B −1 , tức phần nửa thang độ xám động ảnh - Sau tính tốn độ sáng trung bình vùng: - m f , điểm ảnh thuộc đối tượng - mb, điểm ảnh - Tính giá trị ngưỡng θ = m f , + mb, Quá trình tiếp tục với ngưỡng giá trị ngưỡng không thay đổi dừng lại Biểu diễn dạng cơng thức tốn học, có: θk = m f , k −1 + mb, k −1 θ k = θ k −1 2.2 Thuật toán tam giác Thuật toán Zack đưa (36) minh họa hình (trang bên) Trong hình này, quan sát thấy đường thẳng xây dựng cách nối từ giá trị lớn lược đồ độ sáng bmax đến giá trị nhỏ lược đồ độ sáng bmin Với độ sáng b khoảng [bmax, bmin], tính khoảng cách d từ giá trị lược đồ b h[b] đến đường thẳng có Giá trị b0 ứng với khoảng cách lớn chọn làm giá trị ngưỡng θ GV Mai Cường Thọ Bài giảng Xử lý ảnh 65 Kỹ thuật lấy ngưỡng không thiét phải áp dụng cho tồn ảnh, mà áp dụng cho vùng ảnh Hai tác giả Chow Kaneko phát triển biến thể kỹ thuật lấy ngưỡng cách chia ảnh có kích thước MxN thành nhiều vùng không chồng chất lên Các giá trị ngưỡng tính riêng biệt cho vùng sau kết hợp lại thơng qua phép nội suy để hình thành nên mặt ngưỡng cho tồn ảnh Trong thuật tốn này, kích thước vùng cần chọn cách thích hợp cho có lượng đáng kể điểm ảnh vùng, nhằm phục vụ cho việc tính lược đồ xác định ngưỡng tương ứng Tính hữu ích thuật toán này, nhiêu thuật toán khác, phụ thuộc vào ứng dụng cụ thể GV Mai Cường Thọ