Bài Giảng Công Nghệ Xử Liý Ảnh Số - Mai Cường Thọ phần 1 pdf

7 367 2
Bài Giảng Công Nghệ Xử Liý Ảnh Số - Mai Cường Thọ phần 1 pdf

Đang tải... (xem toàn văn)

Thông tin tài liệu

Bài giảng Xử lý ảnh số 1 GV. Mai Cường Thọ Lời mở đầu Xử lý ảnh là một ngành khoa học còn tương đối mới mẻ so với nhiều ngành khoa học khác. Hiện nay nó đang là một trong những lĩnh lực được quan tâm và đã trở thành môn học chuyên ngành của sinh viên hệ kỹ sư, cử nhân ngành Công nghệ Thông tin. Nhờ có công nghệ số hóa hiện đại, ngày nay con người đã có thể xử lý tín hiệu nhiều chiều thông qua nhiều hệ thống khác nhau, từ những mạch số đơn giản cho đến những máy tính song song cao cấp. Mục tiêu của xử lý này có thể chia làm ba hướng như sau: Xử lý ảnh ban đầu để có được ảnh mới theo một yêu cầu xác định (ví dụ như ảnh mờ cần xử lý để được ảnh rõ hơn) Phân tích ảnh để thu được các thông tin đặc trưng giúp cho việc phân loại, nhận biết ảnh (ví dụ phân tích ảnh vân tay để trích chọn các đặc trưng vân tay) Hiểu ảnh đầu vào để có những mô tả về ảnh ở mức cao hơn, sâu hơn (ví dụ từ ảnh mộttai nạn giao thông phác họa hiện trường tai nạn). Trong bài giảng này, chúng ta sẽ tập trung vào những khái niệm cơ bản của xử lý ảnh và giới hạn vấn đề trong phạm vi 2 – chiều Các ứng dụng trong: - Sản xuất và kiểm tra chất lượng - Di chuyển của Robot - Các phương tiện đi lại tự trị - Công cụ hướng dẫn cho người mù - An ninh và giám sát - Nhận dạng đối tượng, nhận dạng mặt - Ứng dụng trong y học - Sản xuất, hiệu chỉnh Video - Chinh phục vũ trụ… Với những ứng dụng to lớn của công nghệ xử lý ảnh, chúng ta hãy bắt tay vào ngay từ bây giờ tìm hiểu, làm việc với một trong những thế giới đầy tiềm năng này. Bài giảng Xử lý ảnh số 2 GV. Mai Cường Thọ Chương I Tổng quan về hệ thống xử lý ảnh và các vấn đề trong xử lý ảnh I. Ảnh và Hệ thống xử lý ảnh 1. Ảnh - Tín hiệu ảnh thuộc loại tín hiệu đa chiều: tọa độ(x,y,z), độ sáng(λ), thời gian(t). - Ảnh tĩnh trong không gian 2 chiều được định nghĩa là một hàm 2 biến S(x,y), với S là giá trị biên độ (được biểu diễn bằng màu sắc) tại vị trí không gian (x,y). - Phân loại ảnh + Ảnh tương tự S(x,y): (x,y) liên tục, S liên tục. + Ảnh số S(m,n): (m,n) rời rạc, S rời rạc. - Một ảnh (gồm một tập các điểm ảnh) có thể xem như bao gồm tập các ảnh con (các vùng ảnh). Thuật ngữ gọi là ROIs – vùng quan tâm (Regions of Interest). - Ảnh số trong không gian rời rạc thu được từ ảnh tương tự trong không gian liên tục thông qua quá trình số hóa. Quá trình số hóa có thể hiểu đơn giản như sau + Ảnh tương tự được chia thành M hàng, N cột. + Giao của hàng và cột được gọi là: pixel + Giá trị biên độ của pixel tại tọa độ nguyên (m,n) là s(m,n): là trung bình độ sáng trong pixel đó. LnmS ≤ ),( (L số mức xám dùng biểu diễn ảnh). - M, N thường được chọn là M=N=2 K (K=8,9,10). L =2 B , B là số bít mã hóa cho độ sáng(biên độ) mỗi pixel. - Ảnh số được biểu diễn bởi ma trận 2 chiều. Các phần tử của nó là biểu diễn cho các pixel số hóa. - Ta ký hiệu 1 ảnh số là S(M,N). Ta nói ảnh có độ phân giải MxN. Ký hiệu s(m,n) để chỉ ra một phần tử ảnh. Hình 1.1 : Ảnh tương tự và Ảnh số hóa Bài giảng Xử lý ảnh số 3 GV. Mai Cường Thọ 2. Hệ thống xử lý ảnh - Xử lý ảnh: Ảnh vào → Ảnh kết quả. - Đối tượng xử lý của hệ thống ở đây là các ảnh (hàm 2 biến liên tục hoặc rời rạc). - Có thể tóm tắt hệ thống xử lý ảnh gồm các giai đoạn chính như sau: Hình 1.2 Các giai đoạn chính trong hệ thố ng xử lý ảnh + Thu nhận ảnh: - Qua các camera (tương tự, số). - Từ vệ tinh qua các bộ cảm ứng (Sensors). - Qua các máy quét ảnh (Scaners). + Số hóa ảnh: Biến đổi ảnh tương tự thành ảnh rời rạc để xử lý bằng máy tính: Thông qua quá trình lấy mẫu (rời rạc về mặt không gian) và lượng tử hóa (rời rạc về mặt biên độ). + Xử lý số: là một tiến trình gồm nhiều công đoạn nhỏ: Tăng cường ảnh (Enhancement), khôi phục ảnh (Restoration), phát hiện biên (Egde Detection), phân vùng ảnh (Segmentation), trích chọn các đặc tính (Feature Extraction) + Hệ quyết định: Tùy mục đích của ứng dụng mà chuyển sang giai đoạn khác là hiển thị, nhận dạng, phân lớp, truyền thông… II. Các vấn đề cơ bản trong xử lý ảnh 1. Biểu diễ n và mô hình hóa ảnh  Biểu diễn ảnh - Ảnh có thể xem là một hàm 2 biến chứa các thông tin như biểu diễn của một ảnh. Các mô hình biểu diễn ảnh cho ta một mô tả logic hay định lượng của hàm này. Dựa vào phần tử đặc trưng của ảnh đó là pixel. Giá trị pixel có thể là một giá trị vô hướng, hoặc là 1 vector (3 thành phần trong trường hợp ảnh màu). - Ta có thể biểu diễn ảnh bằng hàm toán học, hoặc các ma trận điểm. Trong mô hình toán học, ảnh hai chiều được biểu diễn nhờ các hàm hai biến, đó là Bài giảng Xử lý ảnh số 4 GV. Mai Cường Thọ ∑ ∑ ∞ −∞= ∞ −∞= −−= k l lnkmlkSnmS ),(),(),( δ với 1,0,1,0 −≤≤−≤≤ NlnMkm  Biểu diễn bằng hàm toán - S: ảnh - (m,n): Tọa độ của Pixel trong miền không gian (2D) - s(m,n): Độ sáng (Mức xám) của pixel (m,n). - [0-L max ]: Thang mức xám - Vùng các mức xám được phép sử dụng. L max thường là 255, nghĩa là chúng ta sử dụng thang mức xám 8 bit. 255),(0 ≤ ≤ nms - Với 10,10 −≤≤−≤≤ NnMm , ta gọi đó là ảnh số M x N  Biểu diễn bằng ma trận điểm: Hình 1.3 a, Ảnh thật 10x10; b, Ảnh được zoom; c, Mô tả ảnh bằng ma trận điểm  Mô hình hóa ảnh - Mô hình cảm nhận ảnh: Là mô hình biểu diễn thông qua các thuộc tính cảm nhận ảnh (màu sắc, cường độ sáng), các thuộc tính về thời gian, các cảm nhận về phối cảnh, bố cục. - Mô hình cục bộ: Là mô hình biểu diễn thể hiện mối tương quan cục bộ của các phần tử ảnh (ứng dụng cho các bài toán xử lý và nâng cao chất lượng ảnh). - Mô hính tổng thể: Là mô hình biểu diễn ảnh xem ảnh như là một tập hợp các đối tượng, và các đối tượng này có mối quan hệ không gian với nhau (ứng dụng cho các bài toán phân nhóm và nhận dạng ảnh). 2. Tăng cường ảnh  Mục đích: Tăng cường các thuộc tính cảm nhận, làm cho ảnh tốt lên theo một ý nghĩa nào đó, tiện phục vụ cho các xử lý tiếp theo. Bài giảng Xử lý ảnh số 5 GV. Mai Cường Thọ  Các thao tác: - Thay đổi độ tương phản, thay đổi màu sắc, cường độ sáng, lọc nhiễu, nội suy, làm trơn ảnh.  Các phương pháp chính: - Các phương pháp thao tác trên điểm (Point Operation) - Các thao tác không gian (Spatial Operation) 3. Khôi phục ảnh  Mục đích: Khôi phục lại ảnh ban đầu, loại bỏ các biến dạng ra khỏi ảnh tùy theo nguyên nhân gây ra biến dạng. ∫ ∫ ∞ ∞− ∞ ∞− += )),((),(),;,(),( yxddfyxhyxg ηβαβαβα ),( yx η là hàm biểu diễn nhiễu cộng. ),( β α f là hàm biểu diễn đối tượng. ),( yxg là ảnh thu nhận. ),;,( β α yxh là đáp ứng xung của hệ thống, còn gọi là hàm tán xạ điểm (Point Spread Function- PSF). Một vấn đề khôi phục ảnh tiêu biểu là tìm một xấp xỉ của ),( β α f khi PSF có thể đo lường hay quan sát được, ảnh mờ và các tính chất sác xuất của quá trình nhiễu.  Các thao tác: lọc nhiễu, giảm độ méo,…  Các phương pháp: lọc ngược, lọc thích nghi (Wiener), khôi phục ảnh từ các hình chiếu. 4. Biến đổi ảnh  Mục đích: Biến đổi thể hiện của ảnh dưới các góc nhìn khác nhau tiến cho việc xử lý, phân tích ảnh.  Các phương pháp: Biến đổi Fourier, Sin, Cosin, KL, … 5. Phân tích ảnh  Mục đích: Tìm ra các đặc trưng của ảnh, xây dựng quan hệ giữa chúng dựa vào các đặc trưng cục bộ.  Các thao tác: Tìm biên, tách biên, làm mảnh đường biên, phân vùng ảnh, phân loại đối tượng. H ệ th ố ng thu nh ậ n ả nh Ả nh đầ u ra ),( yxg Ả nh đầ u vào ),( β α f ),;,( β α yxh Bài giảng Xử lý ảnh số 6 GV. Mai Cường Thọ  Các phương pháp: Phương pháp phát hiện biên cục bộ, dò biên theo qui hoạch động, phân vùng theo miền đồng nhất, phân vùng dựa theo đường biên… 6. Nén ảnh  Mục đích: giảm không gian lưu trữ, thuận tiện truyền thông trên mạng.  Phương pháp: nén không mất thông tin, nén mất thông tin + Nén không mất thông tin (nén chính xác): khai thác các thông tin dư thừa. + Nén mất thông tin: khai thác các thông tin dư thừa và các thông tin không liên quan. - Hiện nay có một số chuẩn nén hay dùng: JPEG, MPEG (JPEG-2000, MPEG-4) 7. Nhận dạ ng - Nhận dạng ảnh là quá trình liên quan đến mô tả đối tượng mà người ta muốn đặc tả nó. Thường đi sau quá trình trích chọn các đặc tính của đối tượng. - Có 2 kiểu mô tả đối tượng: + Mô tả theo tham số (nhận dạng theo tham số). + Mô tả theo cấu trúc (nhận dạng theo cấu trúc).  Ứng dụng: nhận dạng đối tượng, mặt, vân tay, văn bản… - Nhận dạng chữ in hoặc đánh máy phục vụ cho việc tự động hóa việc đọc tài liệu, tăng nhanh tốc độ và chất lượng thu nhận thông tin từ máy tính. - Nhận dạng chữ viết tay (với một số ràng buộc)  Mạng nơron là một kỹ thuật mới đang được áp dụng vào nhận dạng và cho kết quả khả quan. III. Một số quan hệ cơ bản giữa các pixel - Gọi f(x,y) là ảnh số, p, q là các điểm ảnh, S là một tập con các điểm ảnh. 1. Quan hệ láng giềng (neighborhood) Cho điểm ảnh p(x,y) - Các láng giềng theo hướng đứng, ngang N 4 (p): ( x+1,y), (x-1,y), (x,y+1), (x,y-1) - Các láng giềng theo hướng chéo N D (p): (x+1,y+1), (x+1,y-1), (x-1,y+1), (x-1,y-1) - Các láng giềng theo 8 hướng N 8 (p): N 4 (p) + N D (p) 2. Quan hệ liên thông (Conectivity) N 4 (p) N D (p) N 8 (p) Bài giảng Xử lý ảnh số 7 GV. Mai Cường Thọ 2 212 2112 212 2 0 - Quan hệ liên thông giữa 2 pixel là quan trọng bởi vì: nó được sử dụng để thiết lập các đường biên của đối tượng và các thành phần của các vùng ảnh. - Hai pixel là có quan hệ liên thông với nhau nếu: + Chúng là láng giềng của nhau + Các giá trị xám của chúng thỏa mãn tiêu chuẩn nhất định về sự tương đồng. - Với Sp ∈ ∀ , thì tập các pixel trong S có liên thông với p thì được gọi là một thành phần liên thông của S. - Nếu S chỉ có 1 thành phần liên thông, thì S được gọi là 1 tập liên thông. 3. Quan hệ lân cận (Adjacency)  Gọi V là tập các giá trị xám dùng để định nghĩa lân cận. Ví dụ { } 1=V là một tập định nghĩa cho lân cận của các pixel có giá trị 1. - 4-Adjacency : 2 pixel p,q là 4-Adjacency nếu )( 4 pNq∈ - 8-Adjacency : 2 pixel p,q là 8-Adjacency nếu )( 8 pNq ∈ - m-Adjacency : 2 pixel p,q là m-Adjacency nếu: + )( 4 pNq∈ hoặc )(pNq D ∈ và VpNpN D ∉∩ )()( 4 m-Adjacency là sự cải tiến của 8-Adjacency , nhằm loại bỏ bớt các đường liên kết kép thường gặp phải khi ta dùng 8-Adjacency .  2 ảnh con S 1 , S 2 được gọi là lân cận nhau nếu: một số pixel trong S 1 là lân cận của một số pixel trong S 2 6. Khoảng cách giữa các pixel (Distance Measures) Cho p(x,y), q(s,t), z(u,v). D là hàm xác định khoảng cách. + D(p,q) ≥ 0 (D(p,q)=0 nếu p=q) + D(p,q) = D(q,p) và + D(p,z) ≤ D(p,q) + D(q,z)  Khoảng cách Euclidean (D e Distance) ( ) ( ) 22 ),( tysxqpD e −+−= - Các điểm có khoảng cách Euclidean nhỏ hơn hoặc bằng r kể từ (x,y) là nằm trong đường tròn bán kính r tâm tại (x,y).  City-Block Distance (D 4 Distance) . ( x +1, y), (x -1 , y), (x,y +1) , (x,y -1 ) - Các láng giềng theo hướng chéo N D (p): (x +1, y +1) , (x +1, y -1 ) , (x -1 , y +1) , (x -1 , y -1 ) - Các láng giềng theo 8 hướng N 8 (p): N 4 (p) + N D (p) 2 tập con các điểm ảnh. 1. Quan hệ láng giềng (neighborhood) Cho điểm ảnh p(x,y) - Các láng giềng theo hướng đứng, ngang N 4 (p): ( x +1, y), (x -1 , y), (x,y +1) , (x,y -1 ) - Các láng giềng theo. GV. Mai Cường Thọ 2 212 211 2 212 2 0 - Quan hệ liên thông giữa 2 pixel là quan trọng bởi vì: nó được sử dụng để thiết lập các đường biên của đối tượng và các thành phần của các vùng ảnh. -

Ngày đăng: 14/07/2014, 01:20

Từ khóa liên quan

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan