Phân vùng ảnh viễn thám là vấn đề được các nhà nghiên cứu viễn thám quan tâm. Ảnh viễn thám có thể có nhiều kênh, độ phân giải rất cao. Có nhiều kĩ thuật phân vùng khác nhau như K-Means, C-Means, Watersed, ... Trong đó, Fuzzy C-Means (FCM) được đánh giá rất cao về khả năng phân vùng bằng việc sử dụng logic mờ.Tuy nhiên, phương pháp này gặp vấn đề khi phân vùng ảnh có kích thước lớn như ảnh viễn thám.
Nguyễn Tu Trung, Vũ Văn Thỏa, Đặng Văn Đức PHÂN VÙNG ẢNH VIỄN THÁM KÍCH THƯỚC LỚN DỰA TRÊN PHÂN CỤM MỜ Nguyễn Tu Trung*, Vũ Văn Thỏa+, Đặng Văn Đức* * Viện Công Nghệ Thông Tin, Viện Hàn Lâm Khoa Học Công Nghệ Việt Nam + Học Viện Cơng Nghệ Bưu Chính Viễn Thơng Tóm tắt: Phân vùng ảnh viễn thám vấn đề nhà nghiên cứu viễn thám quan tâm Ảnh viễn thám có nhiều kênh, độ phân giải cao Có nhiều kĩ thuật phân vùng khác K-Means, C-Means, Watersed, Trong đó, Fuzzy C-Means (FCM) đánh giá cao khả phân vùng việc sử dụng logic mờ.Tuy nhiên, phương pháp gặp vấn đề phân vùng ảnh có kích thước lớn ảnh viễn thám Ngoài ra, kết phân cụm phụ thuộc nhiều vào tương phản ảnh Bài báo trình bày kĩ thuật cải tiếnthuật tốn FCM để thực với ảnh viễn thám kích thước lớn (FGMM), Tách hợp, Các mơ hình Markov, Hầu hết phương pháp sử dụng cường độ điểm ảnh để định nghĩa vùng, đưa phân đoạn hỗn tạp, cụ thể với ảnh đa phổ có độ phân giải cao Hiện nay, số thuật tốn bao gồm thơng tin ngữ cảnh quy trình để giảm bớt tính hỗn tạp phân đoạn Trong số thơng tin ngữ cảnh phân đoạn trích chọn từ ảnh sử dụng Trong [1, 2], tác giả đề xuất kĩ thuật phân cụm kết hợp thuật toán Watershed biến đổi Wavelet để phân vùng ảnh.Trong [3], Balaji cộng trình bày phân đoạn ảnh dựa đặc trưng màu từ ảnh với việc chuyển điểm Từ khóa: Phân vùng ảnh, Phân cụm mờ, Ảnh ảnh từ không gian RGB sang không gian L*a*b* viễn thám.1 phân cụm khơng gian Trong [7], tác giả trình bày thuật tốn 2D-KMeans Trong [9], Chang cộng trình bày thuật toán I GIỚI THIỆU phân cụm k-means mờ sử dụng khoảng cách tâm Xử lý ảnh viễn thám nói chung phân vùng cụm tiến trình xử lý lặp nối tiếp để giảm ảnh (hay phân cụm) viễn thám nói riêng vấn độ phức tạp tính tốn thuật tốn phân cụm đề nghiên cứu từ lâu k-means mờ thông thường quan tâm Phân cụm quy trình dùng để trích chọn nét đối Fuzzy C-Means (FCM) đánh giá cao tượng việc định nghĩa vùng tương khả phân vùng việc sử dụng logic mờ ứng Nhiệm vụ chức phân vùng ảnh Trong [4], tác giả kết hợp thuật từ ảnh đa ban đầu, tiến hành xử lý phân chia toán phân cụm mờ biểu thức điều chỉnh thành vùng, cụm khác Hiện nay, có mức xám khác để tăng cường độ ảnh y tế Trong nhiều phương pháp phân vùng khác như: [8], đề xuất thuật toán C-Mean mờ song song Các phương pháp hình thái, Các phương pháp họ (FCM) cho phân đoạn ảnh việc phân chia K-means, Mơ hình pha trộn Gaussian có giới hạn tính toán xử lý Trong [10], tác Tác giả liên hệ: Nguyễn Tu Trung, email: nttrung@ioit.ac.vn Đến tòa soạn: 12/2/2016, chỉnh sửa: 12/4/2016, chấp nhận đăng: 30/05/2016 giả thực nghiên cứu so sánh thuật toán phân cụm mờ phân cụm mờ entropy Các tập liệu dụng bao gồm IRIS, WINES, OLITOS andpsychosis Số năm 2016 Tạp chí KHOA HỌC CƠNG NGHỆ 43 THƠNG TIN VÀ TRUYỀN THƠNG PHÂN VÙNG ẢNH VIỄN THÁM KÍCH THƯỚC LỚN DỰA TRÊN PHÂN CỤM MỜ Tuy nhiên, thuật toán FCM gặp vấn đề phân vùng ảnh có kích thước lớn ảnh viễn thám Trong nghiên cứu này, chúng tơi đề xuất quy trình phân vùng ảnh viễn thámnhằm khắc phục hạn chế Các phần lại báo trình bày sau Phần trình bày thuật tốn phân cụm mờ gốc Thuật tốn phân cụm mờ cải tiến trình bày phần Một số thử nghiệm trình bày phần Phần kết luận báo Phân cụm c-Means mờ [5] thuật toán dùng rộng rãi phân lớp mờ Trong xem xét logic tập mờ, thuật toán phát triển dựa phân cụm k-Means Trong thuật tốn này, điểm ảnh khơng cụm biểu diễn nhiều thành viên cụm Bài toán phân cụm mờ phát biểu sau Cho tập liệu X gồm n đối tượng tổ chức thành c cụm thể qua hàm liên thuộc mô tả mức độ đối tượng liệu thuộc cụm i với : ≤ μij ≤ 1, (1 ≤ j ≤ n,1 ≤i ≤ c) (1a) ∑ )1b( c i µij = 1,(1 ≤ j ≤ n) Thuật toán phân cụm FCM [5] thực lặp nhằm tối ưu (cực tiểu hóa) hàm mục tiêu (Jm) sau: ∑ ∑ c J m = =i n =j ( µij ) d ( x j ,Vi ) )2( Trong đó: c - số cụm; n - số pixel ảnh; μij - giá trị thành viên pixel thứ j trung tâm cụm thứ i; m - trọng số mũ, tham số mờ; xi- vector thứ j; Vi- vector trung tâm cụm thứ i; d2(xj, Vi)- khoảng cách xj Vi Tạp chí KHOA HỌC CƠNG NGHỆ 44 THƠNG TIN VÀ TRUYỀN THƠNG Thuật tốn FCM sau: Đầu vào: Số cụm c, tham số mờ, tiêu chuẩn dừng Đầu ra: c cụm liệu cho hàm mục tiêu (2) đạt giá trị tối thiểu II THUẬT TỐN PHÂN CỤM MỜ A Thuật tốn phân cụm mờ Để tối ưu hóa hàm mục tiêu công thức (2), trung tâm cụm Vj μij giá trị tính theo cơng thức sau: Số năm 2016 Bắt đầu 1: Nhập giá trị cho tham số c(1 ≤ i ≤ c), m ∈ (1; ∞ ); k = 0; khởi tạo ma trận phân hoạch U(o) = {μij}thỏa mãn (1a), (1b), (1c), điều kiện dừng ε 2: Tại bước k: 2.1: Tính tâm cụm Vi (1 ≤ i ≤ c) theo công thức (3) 2.2: Tính ma trận thành viên cập nhật U(k+1) theo công thức (4) 2.3: So sánh U(k) U(k+1) Nếu ||U(k) - U(k+1)|| < ε dừng Ngược lại, tăng k, quay lại 2.1 Kết thúc B Nhược điểm FCM với ảnh viễn thám kích thước lớn Thuật tốn phân cụm mờ [5] nảy sinh vấn đề gặp ảnh có kích thước lớn mà cụ thể ảnh viễn thám độ phân giải cao Vấn đề nảy sinh từ ma trận độ thuộc µ Theo cơng thức (4), kích thước µ tính sau: Sizeμ = c.n.8 (Byte) (5) Trong đó: c số cụm, n số pixel (kích thước) ảnh Giả sử ta có ảnh kích thước 2048 x 2048 Ta muốn phân thành 20 cụm Khi đó, Sizeµ 2048 x 2048 x 20 x (B) = x 20 x (MB) = 640 (MB) Ma trận độ thuộc lưu Nguyễn Tu Trung, Vũ Văn Thỏa, Đặng Văn Đức RAM Như vậy, cần có RAM 1GB lưu ma trận độ thuộc trường hợp Tuy nhiên, muốn phân thành 40 cụm Sizeµ 1280 (MB) > 1024 (MB) = 1GB Điều nghĩa có RAM 1GB khơng đủ để chứa phần tử ma trận độ thuộc Và để thuật tốn FCM thực ta buộc phải tăng RAM tạm gọi lsiFCM (large size image Fuzzy cMeans) Sơ đồ thuật toán minh hoạ Hình Nếu ảnh có kích thước 16000 x 16000, số lớp c = 20, Sizeµ 16000 x 16000 x 20 x (B) = 39062.5 (MB) ≈ 39 (GB) Chúng ta thấy, với ảnh kích thước số lớp kể nhớ RAM lớn cho máy tính cá nhân khơng thể chứa dẫn tới FCM thực thi ma trận độ thuộc lưu RAM Chúng ta nghĩ đến việc dùng đĩa cứng để lưu ma trận thay dung RAM Tuy nhiên, với ảnh màu thơng thường thời gian thực FCM chậm Với ảnh viễn thám, thời gian lên tới đơn vị ngày Như không hiệu Tất điều giải thích ngun nhân FCM [5] gặp vấn đề với ảnh kích thước lớn mà cụ thể ảnh viễn thám Image = {Pix(i,j): ≤ i ≤ M, ≤ j ≤ N} B1: Chia Chúng ta biểu diễn lại ảnh theo khía cạnh tập hợp Biểu diễn ban đầu ảnh theo tập pixel Giả sử ảnh có kích thước M x N Khi ta có: (6) Ảnh gốc chia thành P x Q ô (p ô theo chiều ngang, q ô theo chiều dọc) Mỗi có kích thước khơng q 512 x 512 (Mc x Nc) pixel để đảm bảo thủ tục FCM thực thi Theo chiều ngang, ô liền kề có phần xếp chồng nửa kích thước ô Cell(x,y) Theo chiều dọc, ô liền kề có phần xếp chồng nửa kích thước Khi đó, ta có biểu diễn ảnh sau: Image = {Cell(x,y): ≤ x ≤ P, ≤ y ≤ Q} (7) Trong đó: Cell(x,y) = {Pix(i,j): ≤ i ≤ Mc, ≤ j ≤ Nc} (8) Mc, Nc < 1024 B2: Phân cụm FCM ô III THUẬT TOÁN PHÂN CỤM MỜ CẢI TIẾN Tiến hành phân cụm Cell(x,y) với thuật tốn FCM.Gọi V(x,y,k) tâm thứ k ô Cell(x,y), ta c tâm cụm ô Cell(x,y): CentersCell(x,y) = {V(x,y,k): ≤ k ≤ c } (9) ≤ x ≤ P, ≤ y ≤ Q Tính trọng số tâm thứ k ô Cell(x,y) theo công thức: đó, μ(Pix(i, j), k) giá trị thành viên điểm ảnh Pix(i, j) với cụm thứ k ô Cell(x,y) Sau phân cụm tất ô, ta tập tâm cụm sau: Hình 1: Lưu đồ thuật toán lsiFCM CentersImage={CentersCell(x,y) :1≤x≤P,1≤y≤Q} (11) CentersImage={V(x,y,k):1≤x≤P,1≤y≤Q,1≤k≤c} (12) Trong phần này, chúng tơi đề xuất thuật tốn phân cụm mờ ảnh viễn thám kích thước lớn mà tập trọng số sau: Số năm 2016 Tạp chí KHOA HỌC CÔNG NGHỆ 45 THÔNG TIN VÀ TRUYỀN THÔNG PHÂN VÙNG ẢNH VIỄN THÁM KÍCH THƯỚC LỚN DỰA TRÊN PHÂN CỤM MỜ mềm GRASS’ Đây đề tài cấp nhà nước, thuộc Chương trình KHCN Vũ Trụ Trong đó, ảnh SPOT với độ phân giải cao, bán với giá B3: Phân cụm tập tâm cụm sử dụng FCM cao Cục Viễn thám - Bộ Tài nguyên Môi Sau thu tập tâm cụm ô, tiếp trường, khoảng vài chục triệu ảnh Hai là, tục thực thuật toán phân cụm FCM tập loại ảnh Quickbird, gồm kênh: Lam, Lục, Đỏ, tâm cụm với hàm mục tiêu công thức cận hồng ngoại, tải từ liệu mẫu tính tâm hiệu chỉnh sau: trang http://opticks.org Do khn khổ báo có hạn, nhóm tác giả trình việc thử nghiệm với hai mẫu ảnh đầu vào khác WeiImage={Wei(x,y,k):1≤x≤P,1≤y≤Q,1≤k≤c} (13) Từ đây, ta thu tập tâm cụm với c tâm cụm Trong thử nghiệm chúng tơi chọn máy tính có RAM 1GB Mẫu lại ảnh lớn mà với số cuối cụm thử nghiệm đủ để FCM thực B4: Tổng hợp với RAM 1GB Các mẫu liệt kê Từ c tâm cụm thu B3, tính lại giá trị Bảng I thành viên điểm ảnh ảnh đầu vào với tâm cụm Bảng I Các ảnh dùng thử nghiệm Thử nghiệm Thử nghiệm IV THỬ NGHIỆM Chúng tơi tiến hànhthử nghiệm thuật tốn đề xuất lsiFCM so sánh với thuật toán gốc FCM Trong đó, mẫu với kích thước trung bình mà thực với FCM (trong điều kiện RAM không lớn) để so sánh kết hai thuật tốn Kích thước khơng lớn 250 x 250 điểm ảnh Để đánh giá chất lượng phân cụm, A Thử nghiệm sử dụng số độ đồng cụm [6][7] Ảnh gốc ảnh vệ tinh Quickbird có kích thước 2056 x 2065 (điểm ảnh) Hình mơ tả ảnh cho sau: cụm sinh thuật toán FCM lsiFCM với cụm đó, I ảnh phân đoạn, kích thước ảnh, R số vùng ảnh phân cụm, diện tích điểm ảnh vùng thứ i, lỗi màu vùng i (khoảng cách Euclidean vector màu mức xám điểm ảnh vùng thứ i vector màu qui cho vùng i ảnh phân đoạn) Hình Chi tiết cụm FCM thử nghiệm Tập liệu phục vụ cho thử nghiệm gồm hai loại Một là, loại ảnh SPOT 4, gồm kênh: Lục, Đỏ, Cận hồng ngoại, Hồng ngoại, chụp khu vực Hòa Hình Chi tiết cụm lsiFCM thử nghiệm Bình Sơn La với 21 ảnh chụp năm 2003 14 ảnh chụp năm 2008 Loại ảnh này, nhóm tác giả Hình thống kê độ đồng theo có tham gia thực đề tài “Phát triển số F(I) F’(I) cụm sinh FCM phần mềm xử lý ảnh viễn thám phần lsiFCM với số cụm 5, 7, Tạp chí KHOA HỌC CÔNG NGHỆ 46 THÔNG TIN VÀ TRUYỀN THÔNG Số năm 2016 Nguyễn Tu Trung, Vũ Văn Thỏa, Đặng Văn Đức Hình Chi tiết cụm lsiFCM thử nghiệm Ảnh gốc ảnh vệ tinh SPOTcó kích thước 2200 x 2101 Hình mô tả ảnh cụm sinh thuật tốn FCM lsiFCM với cụm Hình 10 thống kê độ đồng theo số F(I) F’(I) cụm sinh FCM lsiFCM với số cụm 4, 6, 7, Hình Biểu đồ so sánh số F(I) cụm sinh FCM lsiFCM thử nghiệm (*1.0e+3) Hình Biểu đồ so sánh số F(I) cụm sinh FCM lsiFCM thử nghiệm 2(*1.0e+3) Hình Biểu đồ so sánh số F’(I) cụm sinh FCM lsiFCM thử nghiệm (*1.0e-3) Hình 10 Biểu đồ so sánh số F’(I) cụm sinh FCM lsiFCM thử nghiệm 2(*1.0e-3) Hình Biểu đồ so sánh thời gian thực thi FCM lsiFCM thử nghiệm Hình thống kê thời gian thực thi FCM, lsiFCM trường hợp 5, 7, cụm với ảnh thử nghiệm B Thử nghiệm Hình Chi tiết cụm FCM thử nghiệm Hình 11 Biểu đồ so sánh thời gian thực thi FCM lsiFCM thử nghiệm Số năm 2016 Tạp chí KHOA HỌC CƠNG NGHỆ 47 THƠNG TIN VÀ TRUYỀN THƠNG PHÂN VÙNG ẢNH VIỄN THÁM KÍCH THƯỚC LỚN DỰA TRÊN PHÂN CỤM MỜ Hình 11 thống kê thời gian thực thi FCM, TÀI LIỆU THAM KHẢO lsiFCM trường hợp 4, 6, 7, cụm với [1] C R Jung, J Scharcanski, “Robust ảnh thử nghiệm Watershed segmentation using the wavelet transforms”, Proceedings of the XV Brazilian Nhận xét: Symposium on Computer Graphics and Image Processing (SIBGRAPI’02) 1530- Về mặt chất lượng phân cụm, theo đánh giá 1834/02,2000, IEEE độ đồng từ bảng biểu đồ trên, lsiFCM đảm bảo độ ổn định so với FCM, [2] Claudio Rosito Jung “Multiscale chí có trường hợp tốt FCM Image Segmentation using Wavelets and Watersheds”, Proceedings of the - Về mặt tốc độ thực thi, lsiFCM chậm XVI Brazilian Symposium on Computer nhiều so với FCM Điều hiển nhiên Graphics and Image Processing số lượng cần phân cụm nhiều Tuy (SIBGRAPI’02) 1530-1834/03, 2003, nhiên, cải thiện cách đột IEEE biến tốc độ thực thi lsiFCM song [3] T Balaji, M Sumathi, “Relational Features song hoá giai đoạn phân cụm ô of Remote Sensing Image lassification using Effective K-Means Clustering”, V KẾT LUẬN International Journal of Advancements in Research & Technology, vol 2, no 8, pp Trong nghiên cứu này, đề xuất 103-107, Aug 2013 thuật toán phân vùng ảnh viễn thám lsiFCM Ý tưởng thuật toán cải tiến thuật toán [4] A.E Hasanien, A Badr, A Comparative Study on Digital Mamography phân cụm mờ cho việc phân vùng ảnh viễn thám Enhancement Algorithms Based on Fuzzy kích thước lớn Đầu tiên, ảnh chia thành Theory, Studies in Informatics and Control, nhiều có kích thước Sau đó, tiến vol 12, no 1, Mar 2003 hành phân cụm với thuật tốn FCM để thu tập tâm cụm Sau tất ô [5] Bezdek J.C., R Ehrlich, W Full, FCM: The fuzzy c-Means clustering algorithm, phân cụm, ta có tập tâm cụm ô Computers & Geosciences, vol 10, no trọng số tương ứng Tiếp tục sử dụng thuật 2-3, pp 191-203, 1984 tốn FCM với cơng thức tính tâm để phân cụm tập tâm Kết thu tập [6] J Liu, and Y H Yang, Multiresolution color tâm Quá trình tổng hợp việc tính lại giá image segmentation, IEEE Transactions on Partern Analysis and Machine Intelligence, trị thành viên điểm ảnh tập tâm cuối vol 16, no 7, pp 689-700, Jul 1994 Các kết thử nghiệm chứng tỏ lsiFCM cho kết phân vùng tốt, đạt độ ổn định so [7] Intan Aidha Yusoff, Nor Ashidi Mat Isa, với FCM Two-Dimensional Clustering Algorithms for Image Segmentation, WSEAS Tuy nhiên, việc thực thuật toán FCM với Transactions on Computers, vol 10, no nhiều ô, tốc độ thực thi lsiFCM chậm 10, pp 332-342, Oct 2011 nhiều so với FCM Do đó, nghiên cứu tiếp [8] Shahram Rahimi, M Zargham, A Thakre, theo, hướng tới việc song song hóa giai “A Parallel Fuzzy C-Mean Algorithm đoạn phân cụm ô để tăng tốc độ thực thi for Image Segmentation”, Processing thuật toán đề xuất NAFIPS’04, pp 234-237, 2004, http:// Tạp chí KHOA HỌC CƠNG NGHỆ 48 THƠNG TIN VÀ TRUYỀN THÔNG Số năm 2016 Nguyễn Tu Trung, Vũ Văn Thỏa, Đặng Văn Đức opensiuc.lib.siu.edu/cs_pubs/26 [9] Chih-tang Chang, Jim Z C Lai, and Muder Jeng, A Fuzzy K-means Clustering Algorithm Using Cluster Center Displacement, Journal of Information Science and Engineering 27, pp 995-1009, 2011 [10] Subhagata Chattopadhyay, DilipKumar Pratihar, SanjibChandra DeSarkar, A comparative study of fuzzy c-means algorithm and entropy-based fuzzy clustering algorithms, Computing and Informatics, vol 30, pp 701–720, 2011 Nguyễn Tu Trung Sinh năm 1985 Hà Nội Tốt nghiệp trường ĐH Sư phạm Hà Nội năm 2007 thạc sỹ trường ĐH Công Nghệ, ĐH Quốc Gia HN năm 2011, nghiên cứu sinh khóa 2013, Học viện Cơng nghệ Bưu Viễn thông Hiện công tác Viện CNTT, Viện Hàn lâm KHCNVN Lĩnh vực nghiên cứu: Xử lý ảnh, xử lý tiếng nói, hệ thống thơng tin, hệ thống nhúng Điện thoại: 0936 114 331 E-mail: nttrung@ioit.ac.vn Vũ Văn Thỏa Sinh năm 1955 Ninh Binh Tốt nghiệp Đại học Sư phạm Vinh năm 1975, Tiến Sĩ Viện Điều khiển Liên Xô cũ năm 1990 SEGMENTING THE LARGE SIZE REMOTE SENSING IMAGES BASED ON FUZZY CLUSTERING Abstract: Remote sensing image clustering is the issue that is interested by remote sensing researchers Remote sensing image can have multi bands and high resolution There are multi algorimths as K-Means, C-Means, Watersed, Therein, Fuzzy C-Means (FCM) is estimated very hight because it can cluster by using fuzzy logic However, this method has problem when clustering images with large size as remote sensing image In addition, results of clustering dependences the enhancement of image very much This paper presents a technique which improves the algorimth FCM to execute remote sensing image with large Số năm 2016 Hiện công tác Khoa Quốc tế Đào tạo Sau Đại học, Học viện Công nghệ Bưu Viễn thơng Lĩnh vực nghiên cứu: Lý thuyết thuật tốn, tối ưu hóa, hệ thơng tin địa lý, mạng viễn thông Điện thoại: 0913 321 674 E-mail: thoa236@gmail.com Đặng Văn Đức Sinh năm 1951 Nhận học vị Tiến sĩ năm 1996 Nhận chức danh Phó Giáo sư năm 2002 Hiện công tác Viện CNTT, Viện Hàn lâm KHCNVN Lĩnh vực nghiên cứu: GIS Viễn thám, Đa phương tiện, Công nghệ phần mềm Điện thoại: 0912 223 163 E-mail: dvduc@ioit.ac.vn Tạp chí KHOA HỌC CƠNG NGHỆ 49 THÔNG TIN VÀ TRUYỀN THÔNG ...PHÂN VÙNG ẢNH VIỄN THÁM KÍCH THƯỚC LỚN DỰA TRÊN PHÂN CỤM MỜ Tuy nhiên, thuật toán FCM gặp vấn đề phân vùng ảnh có kích thước lớn ảnh viễn thám Trong nghiên cứu này, đề xuất quy trình phân vùng. .. tốn phân cụm mờ ảnh viễn thám kích thước lớn mà tập trọng số sau: Số năm 2016 Tạp chí KHOA HỌC CÔNG NGHỆ 45 THÔNG TIN VÀ TRUYỀN THÔNG PHÂN VÙNG ẢNH VIỄN THÁM KÍCH THƯỚC LỚN DỰA TRÊN PHÂN CỤM MỜ... 2.1 Kết thúc B Nhược điểm FCM với ảnh viễn thám kích thước lớn Thuật tốn phân cụm mờ [5] nảy sinh vấn đề gặp ảnh có kích thước lớn mà cụ thể ảnh viễn thám độ phân giải cao Vấn đề nảy sinh từ ma