Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 70 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
70
Dung lượng
723,24 KB
Nội dung
LỜI CẢM ƠN Trước hết em xin bày tỏ lòng biết ơn sâu sắc thầy giáo hướng dẫn PGS.TS Ngô Quốc Tạo, Viện Công Nghệ Thông Tin -Viện Khoa Học & Công Nghệ Việt Nam tận tình giúp đỡ, bảo em thời gian vừa qua dành nhiều thời gian quý báu để giúp em hoàn thành đề tài giao Em xin chân thành cảm ơn thầy PGS, TS Đỗ Năng Tồn, Viện Cơng Nghệ Thơng Tin – Viện Khoa Học & Công Nghệ Việt Nam, người cho em niềm đam mê lĩnh vực Xử lý ảnh Em xin gửi lời cảm ơn đến Thầy cô giáo Khoa Công nghệ thông tin, trường Đại Học Dân Lập Hải Phòng giảng dạy chúng em suốt quãng thời gian qua, cung cấp cho chúng em kiến thức chuyên môn cần thiết quý báu giúp chúng em hiểu rõ lĩnh vực nghiên cứu để hoàn thành đề tài giao Cuối cùng, em xin cảm ơn bạn bè gia đình động viên cổ vũ, đóng góp ý kiến cho em suốt trình học làm tốt nghiệp, giúp em hoàn thành đề tài đồ án thời hạn Hải Phòng, tháng năm 2010 Sinh viên Nguyễn Thị Lan MỤC LỤC LỜI CẢM ƠN 1.1 Tổng quan xử lý ảnh 1.1.1 Xử lý ảnh 1.1.2 Ảnh điểm ảnh 1.1.3 Mức xám ( Gray level) 1.1.4 Pixel ( Picture element) .7 1.1.5 Biểu diễn ảnh .7 1.1.6 Tăng cƣờng khôi phục ảnh 1.1.7 Biến đổi ảnh .8 1.1.8 Phân tích ảnh .8 1.1.9 Nhận dạng ảnh 1.1.10 Nén ảnh .8 1.2 Các định dạng xử lý ảnh 1.3 Một số khái niệm phát biên 10 1.3.1 Khái niệm biên 10 1.3.2 Tại phải tìm biên .10 1.3.3 Các khái niệm nhiễu 11 1.3.4 Quy trình phát biên 12 1.4 Các phƣơng pháp đánh giá thuật toán phát biên .12 1.4.1 Đánh giá Pratt 13 1.4.2 Đánh giá Kitchen-Rosenfeld 13 CHƢƠNG II: CÁC PHƢƠNG PHÁP PHÁT HIỆN BIÊN CỔ ĐIỂN 15 2.1 Cơ sở phép tốn tìm biên 15 2.1.1 Khái niệm 15 2.1.2 Toán tử đạo hàm 17 2.2 Phƣơng pháp tìm biên dựa kĩ thuật lọc tuyến tính 18 2.2.1 Phƣơng pháp đạo hàm bậc Gradient 19 2.2.2 Phƣơng pháp đạo hàm bậc Laplace 21 2.3 Một số phƣơng pháp tìm biên phi tuyến 22 2.3.1 Phƣơng pháp tìm biên theo hình chóp ( pyramid edge detection) 22 2.3.2 Phƣơng pháp tốn tử tìm biên la bàn Kirsch 24 2.4 Kỹ thuật dò biên tổng quát 25 2.4.1 Các khái niệm 25 2.4.2 Các kỹ thuật dò biên .26 CHƢƠNG III: PHƢƠNG PHÁP PHÁT HIỆN BIÊN DỰA VÀO 29 PHÉP TỐN HÌNH THÁI 29 3.1 Các phép tốn hình thái 29 3.2 Thuật toán phát biên dựa vào phép tốn hình thái 31 3.3 Ứng dụng phép tốn hình thái nhận dạng biên ảnh 32 CHƢƠNG IV: MỘT SỐ PHƢƠNG PHÁP PHÁT HIỆN BIÊN NÂNG CAO 33 4.1 Phƣơng pháp Canny 33 4.1.1 Cơ sở lý thuyết thuật toán .33 4.1.2 Mơ tả thuật tốn .35 4.2 Phƣơng pháp Shen - Castan 39 4.2.1 Cơ sở lý thuyết thuật toán .39 4.2.2 Hoạt động thuật toán .41 4.3 Phƣơng pháp phát biên Marr- Hildreth 43 4.3.1 Cơ sở lý thuyết chung 43 4.3.2 Mơ tả thuật tốn 44 ỨNG DỤNG CÁC PHƢƠNG PHÁP PHÁT HIỆN BIÊN 45 CHƢƠNG V: CÀI ĐẶT VÀ ĐÁNH GIÁ CÁC THUẬT TOÁN 48 5.1 Các phƣơng pháp cổ điển 48 5.1.1 Thuật toán 48 5.2 Phƣơng pháp Canny phƣơng pháp Shen-Castan 50 5.2.1 So sánh hai thuật toán .50 5.2.2 Đánh giá so sánh hai phƣơng pháp 51 KẾT LUẬN 52 CÀI ĐẶT CHƢƠNG TRÌNH NGUỒN .53 PHẦN MỞ ĐẦU Xử lý ảnh nghành khoa học tương đối mẻ so với nhiều nghành khoa học khác Tuy nhiên, nghành khoa học tiến bước dài dần khẳng định nghành khoa học thiếu lĩnh vực ứng dụng công nghệ thông tin Trong Xử lý ảnh việc nhận dạng phân lớp đối tượng địi hỏi nhiều q trình xử lý khác nhau, cơng cụ khơng thể thiếu việc phát biên Do biên đóng vị trí phân tích ảnh, biên tạo nên khn dạng đối tượng Biên ranh giới đối tượng đường ranh giới phân biệt hai đối tượng kề Điều có nghĩa biên đối tượng xác định xác đối tượng định vị thuộc tính đối tượng diện tích, chu vi hình dạng tính Có nhiều phương pháp phát biên khác Chúng dựa sở thay đổi đột ngột độ sáng điểm ảnh Hiện nay, phương pháp phát biên nâng cao xây dựng sở phân tích lý thuyết chặt chẽ mơ hình tốn học biên nhiễu Cách phát biên khơng cịn đơn giản trước nữa, chúng sử dụng loạt kỹ thuật phức tạp kỹ thuật loại trừ điểm không cực đại (nonmaximum suppress), kỹ thuật phân ngưỡng trễ (hyteresis thresholding), kỹ thuật phân ngưỡng cục bộ…Kết việc tìm biên hiệu xác Để trình bày vấn đề cách rõ ràng đồ án nay, em xin trình bày chương sau: Chƣơng I: Một số khái niệm Xử lý ảnh Chương trình bày tổng quát Xử lý ảnh khái niệm dùng đồ án Chƣơng II: Các phương pháp phát biên cổ điển Dùng toán tử đạo hàm để tìm biên Tiếp theo kỹ thuật dị biên tổng quát Chƣơng III: Phương pháp phát biên dựa vào phép tốn hình thái Hai phép tốn hình thái là: Dilation Erosion Chƣơng IV: Một số phương pháp phát biên nâng cao Chương đề cập đến phương pháp tìm biên nâng cao phương pháp Canny, ShenCastan, Marr-Hildreth Tiếp theo ứng dụng biên Chƣơng V: Cài đặt đánh giá số thuật toán phương pháp phát biên ngôn ngữ Virtual C++ Kết luận: Phụ lục: Khi bắt tay vào việc nghiên cứu đề tài này, em cố gắng để hồn thành cơng việc giao, song điều kiện thời gian trình độ cịn hạn chế nên em khơng thể khơng tránh khỏi thiếu sót Em mong góp ý thầy giáo hướng dẫn, thầy giáo phản biện thầy cô giáo bạn bè Khoa Cơng Nghệ Thơng Tin, qua em rút kinh nghiệm thực tế bổ ích để sau em xây dựng chương trình hồn chỉnh CHƢƠNG I: MỘT SỐ KHÁI NIỆM CƠ BẢN TRONG XỬ LÝ ẢNH 1.1 Tổng quan xử lý ảnh 1.1.1 Xử lý ảnh Xử lý ảnh lĩnh vực khoa học gồm tất liên quan đến việc thao tác ảnh nhằm đưa ảnh mong muốn Xử lý ảnh liên quan đến hình ảnh có, đồ họa máy tính liên quan đến việc tổng hợp hình ảnh thực ảo máy tính Ngoài đồ họa đối tượng hai ba chiều, cịn xử lý ảnh nhiều Lưu trữ Camera Thu nhận ảnh Số hóa Phân tích ảnh Nhận dạng Sensor Lưu trữ Hệ định Hình 1: Sơ đồ tổng quát hệ thống nhận dạng xử lý ảnh Trong sơ đồ ảnh cần xử lý thơng qua hệ thống thu nhận ảnh Hệ thống thu nhận ảnh bao gồm thiết bị chụp camera, máy quét scanner, máy chụp hình… Ảnh sau thu nhận qua hệ thống thu nhận, ảnh lấy mẫu số hóa, sau phân tích theo loại ảnh Có nhiều loại ảnh chúng lưu trữ file khác như: file Bitmap, file PCX, file Gif…Tuy nhiên phần đồ án em hiển thị ảnh dạng file Bitmap Ảnh sau phân tích lưu trữ tùy theo ứng dụng cụ thể mà chọn cách thích hợp để phân tích Vì vậy: Mục đích xử lý ảnh là: • Biến đổi ảnh làm cho ảnh đẹp • Tự động phân tích nhận dạng ảnh hay đoán nhận ảnh đánh giá nội dung ảnh 1.1.2 Ảnh điểm ảnh Trong q trình số hóa người ta biến đổi tín hiệu liên tục thành tín hiệu rời rạc thơng qua q trình lấy mẫu lượng tử hóa Do điểm ảnh xem biểu diễn cường độ sáng hay dấu hiệu ảnh tọa độ Ảnh cịn tập hợp điểm ảnh 1.1.3 Mức xám ( Gray level) Mức xám mã hóa tương ứng cường độ sáng điểm ảnh với giá trị số kết trình lượng tử hóa Cách mã hóa thường dùng 16, 32, hay 64 mức Mã hóa 256 mức thơng dụng kỹ thuật =256( 0,1…255) nên với 256 mức pixel mã hóa bit 1.1.4 Pixel ( Picture element) Là phần tử ảnh, điểm ảnh Ảnh thực tế ảnh liên tục khơng gian độ sáng Để xử lý ảnh máy tính cần phải tiến hành số hóa, người ta biến đổi tín hiệu liên tục sang tín hiệu rời rạc thơng qua q trình lấy mẫu (rời rạc hóa khơng gian) lượng hóa thành phần giá trị mà nguyên tắc mắt thường không phân biệt hai điểm kề Do điểm ảnh tập hợp pixel, pixel gồm cặp tọa độ x, y màu Một pixel lưu trữ 1, 4, hay 24 bit 1.1.5 Biểu diễn ảnh Trong biểu diễn ảnh, người ta dùng phần tử đặc trưng ảnh pixel Có thể xem hàm hai biến chứa thông tin biểu diễn ảnh, việc xử lý ảnh số yêu cầu ảnh phải mã hóa lượng tử hóa Việc lượng tử hóa ảnh chuyển đổi tín hiệu tương tự sang tín hiệu số ảnh lấy mẫu sang số hữu hạn mức xám Một số mơ hình thường dùng xử lý ảnh, mơ hình tốn, mơ hình thống kê 1.1.6 Tăng cƣờng khôi phục ảnh Tăng cường ảnh bước quan trọng tạo tiền đề cho xử lý ảnh, gồm loạt kỹ thuật như: lọc độ tương phản, khử nhiễu, màu… Khôi phục ảnh nhằm loại bỏ suy giảm ảnh 1.1.7 Biến đổi ảnh Trong thuật ngữ biến đổi ảnh thường dùng để nói đến lớp ma trận đơn vị kỹ thuật dùng để biến đổi ảnh Một số loại biến đổi dùng như: biến đổi Fourier, Sin, Cosin, Hadamard, tích Kronecker, biến đổi Karhumen Loeve… 1.1.8 Phân tích ảnh Liên quan đến việc xác định độ đo định lượng ảnh để đưa mô tả đầy đủ ảnh Các kỹ thuật sử dụng nhằm mục đích xác định biên ảnh 1.1.9 Nhận dạng ảnh Là q trình liên quan đến việc mơ tả đối tượng mà người ta muốn đặc tả Quá trình nhận dạng thường sau q trình trích chọn đặc tính chủ yếu đối tượng Có hai kiểu mơ tả đối tượng là: mơ tả tham số ( nhận dạng theo tham số ) mô tả theo cấu trúc ( nhận dạng theo cấu trúc) 1.1.10 Nén ảnh Dữ liệu ảnh liệu khác cần phải lưu trữ hay truyền mạng, lượng thông tin để biểu diễn cho ảnh lớn Do làm giảm lượng thơng tin hay nén liệu nhu cầu cần thiết 1.2 Các định dạng xử lý ảnh Trong trình xử lý ảnh, ảnh thu nhận vào máy tính phải mã hóa Hình ảnh lưu trữ dạng tệp tin số hóa Một số dạng ảnh chuẩn hóa như: ảnh GIF, BMP, PCX, IMG, TIFF… • Ảnh IMG: Là ảnh đen trắng, phần đầu ảnh có 16 byte chứa thông tin cần thiết, ảnh IMG nén theo dịng Mỗi dịng bao gồm gói ( pack) Các dòng giống nén thành gói • Ảnh PCX: Định dạng ảnh PCX định dạng ảnh cổ điển nhất, thường dùng để lưu trữ ảnh, sử dụng phương pháp mã loại dài RLE (Run-Length-Encoded ) để nén liệu ảnh, trình nén giải nén thực dịng ảnh • Ảnh TIFF: Là ảnh mà liệu chứa tệp thường tổ chức thành nhóm dịng ( cột) qt liệu ảnh • Ảnh GIF (Graphics Interchanger Format): Với định dạng ảnh GIF vướng mắc mà định dạng khác gặp phải số ảnh tăng lên khơng cịn Dạng ảnh GIF cho chất lượng cao độ phân giải đồ họa đạt cao, cho phép hiển thị hầu hết phần cứng • Ảnh BMP ( Windows Bitmap): Là định dạng tập tin hình ảnh phổ biến, cấu trúc tập tin ảnh bao gồm phần: •• Bitmap Header (14 bytes): giúp nhận dạng tập tin bitmap •• Bitmap Information (40 bytes): lưu số thơng tin chi tiết giúp hiển thị ảnh •• Color Palette (4*x bytes), x số màu ảnh: định nghĩa màu sử dụng ảnh •• Bitmap Data: lưu liệu ảnh 1.3 Một số khái niệm phát biên 1.3.1 Khái niệm biên Biên ranh giới đối tượng đường ranh giới phân biệt hai đối tượng kề Do biên đóng vị trí phân tích ảnh, điểm ảnh biên có thay đổi đột ngột mức xám Tập hợp điểm biên tạo thành biên hay đường bao ảnh Do điểm gọi biên điểm đen có điểm trắng lân cận 1.3.2 Tại phải tìm biên Tìm biên làm bật lên điểm ảnh mà có biến đổi lớn giá trị độ sáng so với điểm xung quanh, thực chất công đọan quan trọng cơng việc phân tích ảnh, nguyên nhân khác làm cho ảnh bị suy biến, phải tăng cường khôi phục lại ảnh Tìm biên cịn tìm đường bao quanh đối tượng, trình định vị điểm biên mà biên lại làm tăng độ tương phản biên nền, biên nhìn thấy cách dễ dàng Hiện có nhiều định nghĩa đường biên, định nghĩa sử dụng số trường hợp định Điển hình gồm ba loại đường biên chính: đường biên lý tưởng, đường biên bậc thang, đường biên thực( khơng trơn) Hình 2: Các đƣờng biên a, Đường biên lý tưởng b, Đường biên bậc thang c, Đường biên thực 10 for(i=-M2;ik2)?k1:k2; k=y*nWidth+x; l=Pixels[k]*4+ColorType; pallett[l]=(BYTE)R; } Phƣơng pháp Laplace input: Pixels: day pixels Pallett: bang mau ColorType: loai mau xuli RED,GREEN,hay BLUE ColorTableSize:kich thuoc bang mau nWidth,nHeight: chieu rong va cao cua anh output: Pallett: bang mau da bi thay doi void Timbien::Laplace2(BYTE *Pixels,BYTE *Pallett, int ColorType,int ColorTableSize, int nWidth, int nHeight) { //Laplace 56 int N=3; int M=3; // kich thuoc cua so int WindowSize=N*M; int x,y,i,j,s,k,l; int q; double ws[9]={ -1, -1, -1, -1, 8, -1, -1,-1,-1}; double w[3][3]={ -1,-1,-1, -1, 8,-1, -1,-1,-1}; double R; //buf chua bang mau tam thoi buf=(BYTE*)new char[ColorTableSize*sizeof(BYTE)]; for(i=0;i>1; int M2=M>>1; for(y=N2;y