Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 58 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
58
Dung lượng
1,5 MB
Nội dung
Bộ giáo dục đào tạo Tr-ờng đại học dân lập hải phòng -o0o - TÌM HIỂU PHƢƠNG PHÁP CỰC TIỂU NĂNG LƢỢNG DỰA TRÊN ĐỘ ĐỒNG NHẤT VÀ ĐỘ KHÔNG ỔN ĐỊNH CHO PHÂN ON NH đồ án tốt nghiệp đại học hệ quy Ngành: Công nghệ Thông tin Sinh viên thực hiện: Lờ Th Ngc Mai Giáo viên h-ớng dẫn: PGS TS Ngụ Quc To MÃ số sinh viên: 110315 Hải Phòng - 2011 Mục lục LỜI CẢM ƠN .4 DANH MỤC TỪ VIẾT TẮT DANH SÁCH ẢNH LỜI MỞ ĐẦU .7 CHƢƠNG 1: TỔNG QUAN VỀ XỬ LÝ ẢNH VÀ PHÂN ĐOẠN ẢNH 1.1 Tổng quan xử lý ảnh .8 1.1.1 XLA gì? 1.1.2 Sơ đồ tổng quát XLA 1.1.3 Mô tả (biểu diễn ảnh) 11 1.1.4 Các khái niệm 13 1.2 Tổng quan phân đoạn ảnh 15 CHƢƠNG 2: CÁC HƢỚNG TIẾP CẬN CHÍNH TRONG PHÂN ĐOẠN ẢNH 17 2.1 Các phƣơng pháp dựa không gian đặc trƣng 17 2.2 Các phƣơng pháp dựa không gian ảnh .17 2.3 Các phƣơng pháp dựa mơ hình vật lý 18 2.4 Một số thuật toán phân đoạn ảnh 23 2.4.1 Thuật toán Entropy cực đại .23 2.4.2 Thuật toán độ lệch nhỏ 29 CHƢƠNG 3: PHƢƠNG PHÁP CỰC TIỂU NĂNG LƢỢNG DỰA TRÊN ĐỘ ĐỒNG NHẤT VÀ ĐỘ KHÔNG ỔN ĐỊNH CHO PHÂN ĐOẠN ẢNH .36 3.1 Giới thiệu 36 3.1.1 Cơ sở lý thuyết 36 3.1.2 Tối ƣu tự động ngƣỡng 36 3.2 Lý thuyết 37 3.2.1 Cƣờng độ dựa độ không ổn định 37 3.2.2 Bề mặt lƣợng tối ƣu ngƣỡng 38 3.3 Phƣơng pháp 38 3.3.1 Phân bố xác suất tiên nghiệm đối tƣợng o( )và B( ) .39 3.3.2 Hàm mật độ 40 3.3.3 Bản đồ gradient chuẩn ∇σ 40 3.3.4 Tối ƣu giá trị σ bề mặt lƣợng E 40 3.4 Tiến trình giải thuật: 42 CHƢƠNG 4: CÀI ĐẶT CHƢƠNG TRÌNH VÀ ĐÁNH GIÁ 44 4.1 Cài đặt chƣơng trình 44 4.1.1 Định dạng ảnh BMP 44 4.1.2 Cài đặt thử nghiệm 45 4.2 Một số kết đánh giá 54 KẾT LUẬN .57 TÀI LIỆU THAM KHẢO 58 Lê Thị Ngọ c Mai – CT1101 LỜI CẢM ƠN Trƣớc hết em xin gửi lời cảm ơn đến PGS TS Ngô Quốc Tạo – Viện CNTT, Viện KH&CN Việt Nam, ngƣời thầy hƣớng dẫn em nhiều suốt q trình tìm hiểu nghiên cứu hồn thành đồ án tốt nghiệp từ lý thuyết đến ứng dụng Sự hƣớng dẫn thầy giúp em có thêm đƣợc hiểu biết phân đoạn ảnh, đặc biệt phƣơng pháp cực tiểu lƣợng dựa độ đồng độ không ổn định cho phân đoạn ảnh Đồng thời em xin chân thành cảm ơn thầy cô môn nhƣ thầy cô trƣờng trang bị cho em kiến thức cần thiết để em hồn thành tốt đồ án Em xin gửi lời cảm ơn đến gia đình, bạn bè tạo điều kiện thuận lợi để em xây dựng thành cơng đồ án Dù cố gắng để hoàn thành cơng việc đƣợc giao, song trình độ cịn hạn chế nên khơng thể tránh khỏi thiếu sót Em mong nhận đƣợc góp ý thơng cảm ngƣời Em xin trân thành cảm ơn! Hải Phòng, Ngày tháng năm 2011 Sinh viên thực Lê Thị Ngọc Mai Lê Thị Ngọ c Mai – CT1101 DANH MỤC TỪ VIẾT TẮT Kí hiệu viết tắt Giải thích XLA Xử lý ảnh R Red G Green B Blue Lê Thị Ngọ c Mai – CT1101 DANH SÁCH ẢNH Hình 1.1 Quá trình XLA Hình 1.2 Các bƣớc XLA Hình 1.3 Biểu diễn ảnh mã chạy 11 Hình 1.4 Biểu diễn ảnh mã xích (8 hƣớng) 12 Hình 1.5 Biểu diễn ảnh mã tứ phân 13 Hình 1.6 Các láng giềng điểm ảnh (x, y) 15 Hình 2.1 Phân đoạn theo thuật toán Entropy cực đại 28 Hình 2.2 Phân đoạn theo thuật toán độ lệch nhỏ 34 Hình 3.2 Ví dụ minh họa dịng lƣợng bề mặt lƣợng 41 Hình 3.1 Minh họa vực bên 42 Hình 4.1 Ảnh lƣu dƣới dạng BMP đuôi bmp 44 Hình 4.2 Kết phân đoạn ảnh bơng hoa biểu đồ dịng lƣợng 54 Hình 4.3 Kết phân đoạn ảnh gái biểu đồ dịng lƣợng 55 Lê Thị Ngọ c Mai – CT1101 LỜI MỞ ĐẦU Trong vài thập kỷ qua, khai thác đa tầng thông tin ảnh hai hay nhiều chiều chủ đề nhiều nghiên cứu Đặc biệt thông dụng kỹ thuật ảnh nhiều ngành nhƣ y học, vật lý, hóa học… làm đẩy mạnh q trình xử lý ảnh máy tính để khai thác liệu ảnh lớn nhằm đƣa sản phẩm mong muốn Phân đoạn nhiệm vụ bật ứng dụng ảnh cụ thể nhƣ liên quan tới phân loại đối tƣợng, hình dạng, phân tích chuyển động… Vì nhiều lý mà xác định đối tƣợng cách xác hiệu quan trọng xử lý ảnh máy tính cơng việc đƣợc gọi phân đoạn ảnh Trong thời gian đầu, phƣơng pháp phân vùng ảnh đƣợc đƣa chủ yếu làm việc ảnh mức xám hạn chế phƣơng tiện thu thập lƣu trữ Ngày nay, với phát triển phƣơng tiện thu nhận biểu diễn ảnh , ảnh màu hầu nhƣ thay hoàn toàn ảnh mức xám việc biểu diễn lƣu trữ thông tin ƣu vƣợt trội hẳn so với ảnh mức xám Do đó, kỹ thuật, thuật giải thực việc phân vùng ảnh loại ảnh màu liên tục đƣợc phát triển để đáp ứng nhu cầu Các thuật giải, kỹ thuật thƣờng đƣợc phát triển dựa tảng thuật giải phân vùng ảnh mức xám có sẵn Mục đích em tìm hiểu phƣơng pháp cực tiểu lƣợng dựa độ đồng độ không ổn định cho phân đoạn ảnh Và đƣợc trình bày chƣơng: Chƣơng 1: Trình bày tổng quan xử lý ảnh phân đoạn ảnh bao gồm khái niệm bản, sơ đồ tổng quát hệ thống xử lý ảnh vấn đề xử lý ảnh, vai trò, nhiệm vụ phân đoạn ảnh Chƣơng 2: Giới thiệu hƣớng tiếp cận phân đoạn ảnh, bao gồm: phƣơng pháp dựa không gian đặc trƣng, phƣơng pháp dựa không gian ảnh, phƣơng pháp dựa mơ hình vật lý Trong chƣơng này, em xin trình bày hai thuật tốn phân đoạn ảnh, thuật tốn Entropy cực đại thuật tốn độ chia nhỏ Chƣơng 3: Trình bày phƣơng pháp cực tiểu lƣợng dựa độ đồng độ không ổn định cho phân đoạn ảnh bao gồm: giới thiệu tổng quan, sở lý thuyết phƣơng pháp, tiến trình giải thuật Chƣơng 4: Cài đặt chƣơng trình, đƣa số kết đánh giá Lê Thị Ngọ c Mai – CT1101 CHƢƠNG 1: TỔNG QUAN VỀ XỬ LÝ ẢNH VÀ PHÂN ĐOẠN ẢNH Xử lý ảnh lĩnh vực mang tính khoa học cơng nghệ Nó ngành khoa học mẻ so với nhiều ngành khoa học khác tốc độ phát triển nhanh, kích thích trung tâm nghiên cứu, ứng dụng, đặc biệt máy tính chun dụng cho Khoảng mười năm trở lại đây, phần cứng máy tính thiết bị liên quan có tiến vượt bậc tốc độ tính tốn, dung lượng chứa, khả xử lý… giá giảm đến mức máy tính thiết bị liên quan đến xử lý ảnh khơng cịn thiết bị chun dụng Khái niệm ảnh số trở nên thông dụng với hầu hết người xã hội việc thu nhận ảnh số thiết bị cá nhân hay chuyên dụng với việc đưa vào máy tính xử lý trở nên đơn giản 1.1 Tổng quan xử lý ảnh (XLA) 1.1.1 XLA gì? Qua trình XLA trình thao tác ảnh đầu vào nhằm cho kết mong muốn Kết đầu ảnh “tốt hơn” kết luận [1] ảnh “tốt hơn” Ảnh Xử lý ảnh Kết luận Hình 1.1 Q trình XLA Ảnh xem tập hợp điểm ảnh điểm ảnh đƣợc xem nhƣ đắc trƣng cƣờng độ sáng hay dấu hiệu vị trí đối tƣợng khơng gian thể xem nhƣ hàm n bất biến P(c1, c2, c3,…,cn) Do đó, ảnh XLA xem nhƣ ảnh n chiều Mục đích XLA là: Biến đổi ảnh làm tăng chất lượng ảnh: Phƣơng pháp biến đổi ảnh đƣợc sử dụng việc xử lý ảnh chụp từ khơng trung (chƣơng trình đo đạc từ máy bay, vệ tinh ảnh vũ trụ) xử lý ảnh y học (ảnh chụp cắt lát, ảnh siêu âm, vv…) Một ứng dụng khác Lê Thị Ngọ c Mai – CT1101 việc biến đổi ảnh mã hố ảnh, ảnh đƣợc xử lý để lƣu trữ truyền Tự động nhận dạng, đoán ảnh, đánh giá nội dung ảnh: Các phƣơng pháp nhận dạng ảnh đƣợc sử dụng xử lý tế bào, nhiễm sắc thể, nhận dạng chữ vv Thực chất công việc nhận dạng phân loại đối tƣợng thành lớp đối tƣợng biết thành lớp đối tƣợng chƣa biết Bài toán nhận dạng ảnh tốn lớn, có nhiều ý nghĩa thực tiễn ta thấy để cơng việc nhận dạng trở nên dễ dàng ảnh phải đƣợc tách thành đối tƣợng riêng biệt – mục đích tốn phân đoạn ảnh Nếu phân đoạn ảnh không tốt dẫn đến sai lầm trình nhận dạng ảnh, ngƣời ta xem công đoạn phân đoạn ảnh vấn đề then chốt q trình xử lý ảnh nói chung 1.1.2 Sơ đồ tổng quát XLA Thu nhận ảnh Tiền xử lý Phân đoạn ảnh Biểu diễn mô tả Nhận dạng nội suy Cơ sở tri thức Hình 1.2 Các bƣớc XLA Thu nhận ảnh (Image Acquisition): Ảnh nhận qua camera màu đen trắng, scanner hay giác quan… Thƣờng ảnh nhận qua camera scanner ảnh tƣơng tự ảnh số (với camera số hóa) Camera thƣờng dùng loại qt dịng; ảnh tạo có dạng hai chiều Chất lƣợng ảnh thu đƣợc phụ thuộc vào thiết bị thu môi trƣờng (ánh sáng, phong cảnh) Lê Thị Ngọ c Mai – CT1101 10 Tiền xử lý (Image Processing): Sau thu nhận, ảnh nhiễu, độ tƣơng phản thấp nên cần đƣa vào tiền xử lý đê nâng cao chất lƣợng Chức tiền xử lý lọc nhiễu, nâng độ tƣơng phản làm cho ảnh rõ hơn, nét Phân đoạn ảnh (Image Segmetation): Phân đoạn ảnh tách ảnh ban đầu thành vùng thành phần để biểu diễn phân tích nhận dạng ảnh Đây phần phức tạp, khó khăn XLA, dễ gây lỗi, làm độ xác ảnh Kết nhận dạng ảnh phụ thuộc nhiều vào công đoạn Biểu diễn ảnh (Image Representation): Ảnh đầu sau phân đoạn chứa điểm ảnh vùng ảnh (ảnh phân đoạn) cộng với mã liên kết với vùng lân cận Việc biến đổi số liệu thành dạng thích hợp cần thiết cho xử lý máy tính Việc chọn tính chất để thể ảnh gọi trích chọn đặc trƣng (Feature Selection) gắn với việc tách đặc tính ảnh dƣới dạng thơng tin định lƣợng làm sở để phân lớp đối tƣợng với đối tƣợng khác phạm vi ảnh nhận đƣợc Ví dụ: nhận dạng ký tự, ta miêu tả đặc trƣng ký tự, giúp phân biệt ký tự với ký tự khác Nhận dạng nội suy ảnh (Image Recagnition and Interpretation): Nhận dạng ảnh trình xác định ảnh Quá trình thƣờng thu đƣợc cách so sánh với mẫu chuẩn đƣợc học (hoặc lƣu) từ trƣớc Nội suy phán đoán theo ý nghĩa sở nhận dạng Có nhiều cách phân loại khác ảnh Theo lý thuyết nhận dạng, mơ hình tốn học ảnh đƣợc phân theo hai loại nhận dạng bản: - Nhận dạng theo tham số - Nhận dạng theo cấu trúc Một số đối tƣợng nhận dạng phổ biến đƣợc áp dụng khoa học công nghệ nhận dạng ký tự, nhận dạng văn bán, nhận dạng vân tay, nhận dạng mã vạch, nhận dạng khuôn mặt… Cơ sở tri thức (Knowledge Base): Ảnh đối tƣợng phức tạp đƣờng nét, độ sáng tối, dung lƣợng điểm ảnh, môi trƣờng để thu nhận ảnh phong phú, kéo theo nhiễu Trong nhiều khâu xử lý phân tích ảnh, ngồi việc đơn giản hóa phƣơng pháp tốn học đảm bảo tiện lợi cho xử lý, ngƣời ta bắt chƣớc quy trình tiếp nhận XLA theo cách ngƣời Trong bƣớc xử lý đó, nhiều khâu xử lý theo phƣơng pháp trí tuệ ngƣời Vì vậy, sở tri thức đƣợc phát huy Lê Thị Ngọ c Mai – CT1101 44 CHƢƠNG 4: CÀI ĐẶT CHƢƠNG TRÌNH VÀ ĐÁNH GIÁ 4.1 Cài đặt chƣơng trình 4.1.1 Định dạng ảnh BMP Trong đồ họa máy tính, BMP định dạng tệp tin hình ảnh phổ biến Các tệp tin đồ họa lƣu dƣới dạng BMP thƣờng có bmp (hình 4.1) dib Hình 4.1 Ảnh lƣu dƣới dạng BMP bmp Các thuộc tính tiêu biểu tệp tin ảnh BMP (cũng nhƣ file ảnh nói chung) là: Số pixel điểm ảnh, thƣờng đƣợc ký hiệu n Một ảnh BMP n n-bit có màu Giá trị n lớn ảnh có nhiều màu rõ nét Giá trị tiêu biểu n (ảnh đen trắng), (ảnh 16 màu), (ảnh 256 màu), 16 (ảnh 65536 màu) 24 (ảnh 16 triệu màu) Ảnh BMP 24-bit có chất lƣợng hình ảnh trung thực Chiều cao ảnh (height), cho điểm ảnh (pixel) Chiều rộng ảnh (width), cho điểm ảnh Cấu trúc tệp tin ảnh BMP gồm phần: Bitmap Header (14 bytes): giúp nhận dạng tập tin bitmap - Lƣu trữ thông tin tệp ảnh Lê Thị Ngọ c Mai – CT1101 45 - Chứa chữ ký ảnh có giá trị 0x4D42, cỡ tệp tin, lƣu không, thông tin vùng bitmap infomation (lƣu địa vùng liệu) Bitmap Information (40 bytes): lƣu số thông tin chi tiết giúp hiển thị ảnh nhƣ chiều rộng ảnh, chiều cao ảnh, số màu, kiểu nén, độ phân giải ngang, dọc… Color Palette (4*n bytes), n số màu ảnh: định nghĩa màu đƣợc sử dụng ảnh - Là mảng chiều gồm n phần tử - Mỗi mảng gồm phần tử byte cho R, byte cho G byte cho B, byte cho cƣờng độ (thƣờng không dùng) Bitmap Data: lƣu liệu ảnh - Bố trí thành dịng scanline - Lƣu trữ từ dƣới lên - Đƣợc dùng để XLA Đặc điểm bật định dạng BMP tập tin hình ảnh thƣờng khơng đƣợc nén thuật toán Khi lƣu ảnh, điểm ảnh đƣợc ghi trực tiếp vào tập tin - điểm ảnh đƣợc mô tả hay nhiều byte tùy thuộc vào giá trị n ảnh Do đó, hình ảnh lƣu dƣới dạng BMP thƣờng có kích cỡ lớn, gấp nhiều lần so với ảnh đƣợc nén (chẳng hạn GIF, JPEG hay PNG) 4.1.2 Cài đặt thử nghiệm - Giá trị gradient σ biến thiên dải [1% (IMIN – IMAX), 40% (IMIN – IMAX)] với giá trị gradient σ ngƣỡng biế n thiên dả i [IMIN, IMAX] - Sử dụng màu khác cho vùng đối tƣợng khác - Đƣa dòng lƣợng giá trị gradient σ hợp lệ lớn nhấ t void CImageSegmentationDoc::OnRunCuctieu(int ga) { // TODO: Add your command handler code here CDC dcMem; Lê Thị Ngọ c Mai – CT1101 46 BITMAP bm; m_bmBitmap.GetBitmap(&bm); RGBQUAD *pRGB = new RGBQUAD[256]; dcMem.CreateCompatibleDC(NULL); dcMem.SelectObject(m_bmBitmap); ::GetDIBColorTable(dcMem,0,256,pRGB ); BYTE* p = new BYTE[bm.bmWidth*bm.bmHeight]; BYTE* ptg = new BYTE[bm.bmWidth*bm.bmHeight]; m_bmBitmap.SetBitmapBits(bm.bmWidth*bm.bmHeight,pd); m_bmBitmap.GetBitmapBits(bm.bmWidth*bm.bmHeight,p); m_bmBitmap.GetBitmapBits(bm.bmWidth*bm.bmHeight,ptg); int t=min; // nguong bien thien int Thres[256]; // tap nguong int gra=ga; // gradient double he[256]; // Entropy double Po[256],Pb[256],P[256]; // xs tien nghiem va hau nghiem double E[256]; // nang luong int mdS=0,mdo=0; // ham mat float tt=0.0; int h,w; int i,j,k,l; double e=2.718281828; double* grac = new double[bm.bmWidth*bm.bmHeight]; int dem1=0,dem2=0; h=bm.bmHeight; w=bm.bmWidth; Lê Thị Ngọ c Mai – CT1101 47 for(i=0;i