Bài viết tập trung vào nghiên cứu cách kết hợp thuật toán MCC và K-means nhằm tối ưu hơn trong bài toán phân loại đám mây điểm LiDAR để từ đó có thể sử dụng điểm sau phân loại vào bài toán khảo sát bề mặt của khu vực đo.
Kỷ yếu Hội nghị KHCN Quốc gia lần thứ XI Nghiên cứu ứng dụng Công nghệ thông tin (FAIR); Hà Nội, ngày 09-10/8/2018 DOI: 10.15625/vap.2018.00050 NGHIÊN CỨU KẾT HỢP THUẬT TOÁN MCC VÀ K-MEANS TRONG PHÂN LOẠI ĐÁM MÂY ĐIỂM LIDAR Nguyễn Thị Hữu Phương1, Đặng Văn Đức2, Nguyễn Trường Xuân1, Trần Mạnh Trường2 Khoa Công nghệ thông tin, Trường Đại học Mỏ - Địa chất Viện Công nghệ thông tin, Viện Hàn lâm Khoa học Công nghệ Việt Nam nguyenphuong85.nb@gmail.com, dvduc@ioit.ac.vn, nguyentruongxuan@humg.edu.vn, tmtruong@ioit.ac.vn TĨM TẮT: Năm 2007, nhóm tác giả Jeffrey S.Evans Andrew T.Hudak đề xuất thuật toán MCC (Multiscale Curvature Classification) để phân loại tự động đám mây điểm thành hai lớp mặt đất không mặt đất Trong q trình phân loại, nhóm tác giả ghi nhận điểm thuộc lớp mặt đất để tiến hành tạo DEM cho khu vực khảo sát, nhóm điểm khơng mặt đất bị loại bỏ, nhóm điểm có chứa nhiều thơng tin có ích bề mặt không gian khu vực khảo sát Với mong muốn thu thập ghi nhận thơng tin có ích nhóm điểm trên, báo tập trung vào nghiên cứu cách kết hợp thuật toán MCC K-means nhằm tối ưu toán phân loại đám mây điểm LiDAR để từ sử dụng điểm sau phân loại vào toán khảo sát bề mặt khu vực đo Từ khóa: MCC, K-Means, LiDAR, đám mây điểm ĐẶT VẤN ĐỀ Công nghệ LiDAR công nghệ tiên tiến hàng đầu hệ thống công nghệ thu thập liệu không gian giới Với khả trực tiếp thu nhận đám mây điểm 3D với hộ xác cao, LiDAR áp dụng rộng rãi việc thành lập mô hình số độ cao (Digital Elevation Model - DEM) bề mặt địa hình, dựa vào theo dõi dòng chảy nước hay giám sát di chuyển khối, thành lập đồ viễn thám Công nghệ LiDAR phát triển ứng dụng thiết bị laser, định vị vệ tinh đo quán tính để thu thập liệu địa lý bề mặt trái đất So sánh với phương pháp thu nhận xử lý trắc địa ảnh truyền thống, xử lý liệu LiDAR dễ dàng hơn, thành lập xác mơ hình DEM Hơn nữa, xung laser xuyên qua địa hình, địa vật lá, mặt đất tán LiDAR kỹ thuật viễn thám quang học chủ động, thu nhận thông tin đối tượng cách truyền chùm tia laser đến đối tượng cần khảo theo tuyến khảo sát cụ thể Sự phản xạ chùm tia laser từ đối tượng phát phân tích thu nhận cảm biến LiDAR Những thu nhận ghi lại xác thời gian từ xung laser phát đến trở để tính khoảng cách cảm biến mục tiêu Kết hợp với thơng tin vị trí từ thiết bị GPS, phép đo khoảng cách chuyển thành phép đo ba chiều thực tế mục tiêu phản xạ không gian đối tượng (ESRI, 2018) Công nghệ LiDAR tạo đám mây điểm lớn chứa nhiều thơng tin có giá trị khu vực đo vẽ, khảo sát Đám mây điểm tập hợp điểm đại diện cho hình dạng đặc trưng 3D Mỗi điểm có toạ độ (X, Y, Z) số trường hợp có đặc trưng bổ sung thêm Đám mây điểm có nguồn gốc từ liệu thô quét từ đối tượng vật lý bề mặt Trái đất nhà, cối, nhà máy, đường dây điện, … Một đám mây điểm thường lớn từ hàng chục nghìn đến hàng chục triệu điểm Do đó, để sử dụng đám mây điểm vào mục đích thành lập DEM/DTM phải tiến hành phân loại đám mây điểm thành lớp chuyên biệt lớp mặt đất, không mặt đất, lớp nhà cao tầng, … (Knowlegde Center, 2015) Với toán phân phân loại đám mây điểm LiDAR, có nhiều nhà khoa học giới nghiên cứu có thành cơng định Như nghiên cứu nhóm tác giả (Borja Rodriguez - Cuenca, nnk, 2015) sử dụng thuật toán phát điểm để phát phân loại đối tượng đô thị cối từ liệu 3D MLS (Mobile Laser Scanning) TLS Phương pháp bao gồm việc phân đoạn tự động để loại bỏ phần khơng liên quan đến q trình phân đoạn dọc đối tượng Những đối tượng phân đoạn thuật tốn RX sau phân cụm để chia lớp đối tượng thành lớp cối, hồ nhân tạo,… Hay nghiên cứu (A.Brzank, C.Heipke, 2005), đưa phương pháp để phân loại liệu LiDAR thành điểm mặt nước mặt đất Những điểm đo phân loại theo đường quét nghiên cứu tác giả áp dụng logic mờ việc xác định giá trị thành viên cho điểm thuộc lớp mặt nước Sau đó, phép phân loại phát làm xác cách so sánh độ cao khác điểm gần mặt nước mặt nước Trong đó, nghiên cứu (Suresh K Lodha nnk., 2003), (Yu chuan chang nnk., 2008, (Zhuqiang Li nnk., 2016) đưa phương pháp thuật toán để phân loại đám mây điểm LiDAR nhằm trích xuất thơng tin phục vụ cho trình nghiên cứu Năm 2007, hai tác giả J Evans T Hudak đề xuất thuật toán phân loại đám mây điểm LiDAR dựa miền cong đa tỉ lệ MCC (Multiscale Curvature Classification), sau phân loại đám mây điểm phân thành hai lớp điểm mặt đất (ground) khơng mặt đất (non-ground) Nhóm tác giả sử dụng nhóm điểm mặt đất để thành lập DEM khu vực khảo sát, đó, nhóm điểm không mặt đất bị loại bỏ, lại nhóm điểm chứa nhiều thơng tin có ích khu vực khảo sát Với mong muốn thu nhận phân loại nhóm điểm khơng mặt đất bị loại bỏ thuật tốn MCC, nhóm tác giả áp dụng thuật tốn K-means cho nhóm điểm Thuật tốn K-means thuật tốn phân 380 NGHIÊN CỨU KẾT HỢP THUẬT TỐN MCC VÀ K-MEANS TRONG PHÂN LOẠI ĐÁM MÂY ĐIỂM LIDAR cụm phổ biến, nghiên cứu (Kun Zhang nnk., 2015) nhóm tác sử dụng tham số mật độ đám mây điểm điều kiện để lựa chọn số lượng cụm để tiến hành phân loại điều kiện để hội tụ Hay nghiên cứu (C Torresan nnk., 2016) phương pháp tác giả sử dụng để phân loại rừng thuật toán phân cụm K-means thuật toán phân loại theo thứ bậc kết hợp với phương pháp máy học Để đánh giá độ xác phương pháp tác giả sử dụng phân loại, nhiên kết phân loại có sai số tương đối lớn 45.9% với liệu chọn, rừng tỉ lệ lỗi 33.3% II NGHIÊN CỨU KẾT HỢP THUẬT TOÁN MCC VÀ K-MEANS TRONG PHÂN LOẠI ĐÁM MÂY ĐIỂM LIDAR 2.1 Thuật toán MCC Thuật toán MCC thuật toán sử dụng để phân loại đám mây điểm LiDAR 3D phát triển Moscow Forestry Sciences Laboratory, sử dụng chủ yếu để phân loại tia phản xạ LiDAR môi trường rừng Thuật toán sử dụng để phân loại điểm thành hai lớp mặt đất không mặt đất (Jeffrey S.Evans, Andrew T.Hudak, 2007) MCC thuật toán phân loại tín hiệu phản xạ LiDAR vượt ngưỡng độ cong bề mặt, cách tiếp cận đa tỉ lệ xác định độ lệch điểm cần phân loại với bề mặt trung bình loại bỏ dần điểm khỏi nhóm mặt đất Thuật tốn tính tốn bề mặt trung bình từ điểm mặt đất đặc trưng phép lặp TPS (Thin Plate Spline), sau hiệu chỉnh thơng qua lõi lọc (Jeffrey S Evans, Andrew T Hudak, 2007) Thuật tốn MCC có hai tham số s (scale - biểu thị cho tỉ lệ) t ngưỡng độ cong (curvature threshold), tham số tỉ lệ hàm tỉ lệ đối tượng mặt đất khoảng lấy mẫu (khoảng cách sau) liệu LiDAR (Jeffrey S Evans, Andrew T Hudak, 2007) Triển khai thuật toán MCC tác giả định nghĩa vevtor Z(s) chứa giá trị tọa độ tất điểm LiDAR Vector sử dụng phép lặp bề mặt raster sử dụng phép lặp TPS với độ phân giải theo tỉ lệ Một lõi lọc có kích thước 3x3 duyệt qua tất phép lọc để tìm vector x(s) Miền tỉ lệ l mơ hình lặp thiết lập với tham số mơ hình chạy đến hội tụ t định nghĩa người dùng (Jeffrey S Evans, Andrew T Hudak, 2007) Dung sai độ cong t thêm vào x(s) điểm phân lớp vào lớp không mặt đất việc sử dụng điều kiện “If Z(s) > c then phân lớp khơng mặt đất” Trong c độ cong miền tỉ lệ l (Jeffrey S Evans, Andrew T Hudak, 2007) Thuật tốn MCC mơ tả sau (Jeffrey S Evans, Andrew T Hudak, 2007): 1) Một bề mặt phẳng lặp cách sử dụng Z(s) TPS Hai tham số mơ hình cho miền tỉ lệ l áp dụng tham số tỉ lệ ngưỡng độ cong t (khởi tạo t người dùng định nghĩa) 2) Một lõi lọc 3x3 duyệt qua toàn bề mặt, vector x(s) định nghĩa có độ trùng khớp với Z(s) 3) Độ cong miền tỉ lệ l tình theo công thức: c = x(s) + t; với x(s) vector độ cao trung bình trùng khớp với Z(s) miền tỉ lệ l t tham số ngưỡng độ cong miền tỉ lệ l 4) Điểm LiDAR phân lớp vào lớp không mặt đất bị loại bỏ nếu: If Z(s) > c then phân lớp không mặt đất Với c độ cong miền tỉ lệ l 5) Ngưỡng hội tụ j đánh giá, sau mơ hình lặp lại bắt đầu với miền tỉ lệ Hình Mơ tả thuật tốn phân loại đám mây điểm LiDAR với MCC Nguyễn Thị Hữu Phương, Đặng Văn Đức, Nguyễn Trường Xuân, Trần Mạnh Trường 381 2.2 Áp dụng K-means phân loại nhóm điểm khơng mặt đất với thuật toán MCC K-means thuật toán phân cụm dành cho liệu nhiều chiều, thuật toán dễ hiểu, dễ triển khai nhiên điểm yếu thuật toán làm việc với giới hạn số lượng liệu Với liệu đám mây điểm, thuật toán K-means hoạt động với chiều liệu X, Y, Z tính tốn trắc địa Khoảng cách Euclide sử dụng để tính tốn khoảng cách điểm(Kun Zhang nnk., 2015) Trong báo này, chúng tơi áp dụng thuật tốn K-means để phân lớp điểm bị loại bỏ gán vào lớp không mặt đất sau phân loại với thuật toán MCC Những điểm sau phân loại với MCC gán nhãn nhóm điểm khơng mặt đất, nhãn nhóm điểm mặt đất lưu file có định dạng las Định dạng LAS định dạng nhị phân chuẩn hóa để lưu trữ liệu đám mây điểm chiều thuộc tính điểm với thông tin tiêu đề ghi độ dài biến đổi cụ thể cho liệu Hàng triệu điểm liệu lưu trữ dạng đám mây liệu chiều dạng loạt điểm x (kinh độ), y (vĩ độ) z (độ cao) Ngồi thơng tin toạ độ (x, y, z) điểm liệu LiDAR lữu trữ thơng tin khác cường độ tín hiệu phản xạ, số tín hiệu phản xạ, thời gian về, nguồn (đường bay) điểm (NOAA, 2012) Trong đám mây điểm sau phân loại này, thu nhận điểm có nhãn để tiến hành phân loại với K-means Kết sử dụng cho thành lập mơ hình 3D khu vực đo vẽ Thuật toán triển khai sau: Input: đám mây điểm LiDAR Output: điểm sau phân loại For l = to Repeat Lặp tìm S = TPS(U, , f); Lặp tìm S’ = 3x3 Untill điểm khơng thuộc U < 10% tổng số điểm Phân lớp điểm lại U vào lớp mặt đất If Pj thuộc nhóm lớp khơng mặt đất {Chọn số cụm cần phân loại, tính tốn tâm cụm khởi tạo Repeat{ Gán điểm vào cụm có tâm gần Tính tốn lại trọng tâm cụm ∑ ∑ } Untill hội tụ Return tâm cụm, số điểm cụm} End Hình Kết hợp thuật tốn MCC K-means phân loại đám mây điểm LiDAR 382 NGHIÊN CỨU KẾT HỢP THUẬT TOÁN MCC VÀ K-MEANS TRONG PHÂN LOẠI ĐÁM MÂY ĐIỂM LIDAR III THỬ NGHIỆM 3.1 Dữ liệu thử nghiệm Bộ liệu sử dụng để thử nghiệm báo liệu đám mây điểm LiDAR download từ trang web www.opentopo.sdsc.edu, khu vực khảo sát rừng quốc gia Tahoe Với số lượng điểm 780.405 điểm; Xmin, Ymin = (717068.453734, 4366529.995007); Xmax, Ymax = (717471.08773, 4366736.144926) Đây liệu thu từ thiết bị quét gắn không (Airborne LiDAR), mật độ điểm 8,93 điểm /m 2, quét khu vực có diện tích 89,7 km2 Với hệ thống toạ độ Horizontal: NAD83 (2011) UTM Zone 10N meters [EPSG: 26910], Vertical: NAVD88 (Geoid 12a), phép chiếu UTM, đơn vị đo mét Hệ thống quét có tham số: ảng Tham số liệu Tham số Góc quét (Scan FOV) Tần số quét Bước sóng tia laser Thời gian lấy mẫu Độ dài thời gian Cường độ (Min, max) Chỉ tiêu – 500 – 70Hz 1064 nm 1ns T0 = 40ns, Treturn = 440ns (1, 8160) Hình Hình ảnh khu vực đo vẽ 3.2 Thử nghiệm đánh giá Lựa chọn tham số s = 3, t = 0,3 cho thuật toán phân loại với MCC Hình Lựa chọn tham số cho thuật toán MCC Với miền tỉ lệ SD1, SD2, SD3, kết phân loại có 344.021 điểm phân loại vào lớp mặt đất, 436.384 điểm thuộc lớp khơng mặt đất Hình Kết sau phân loại Nguyễn Thị Hữu Phương, Đặng Văn Đức, Nguyễn Trường Xuân, Trần Mạnh Trường 383 Hình Các điểm sau phân loại với MCC Sau trình phân loại với MCC có 436.384 điểm gán vào nhóm mặt đất, tham số s t lựa chọn 0,3 Với miền tỉ lệ SD1 = 1,5 (0,5s) với lần lặp, SD2 = (s) với lần lặp, SD3 = 4,5 (1,5s) với lần lặp Điều kiện hội tụ thuật toán MCC 0,0026% (9 điểm gán vào lớp không mặt đất miền tỉ lệ với lần lặp thứ 4) Với tỉ lệ điểm không mặt đất miền tỉ lệ sau: Hình Tỉ lệ phân loại miền Hình DEM khu vực khảo sát Với 436.384 điểm sau phân loại thuộc lớp khơng mặt đất, tiếp tục phân loại với thuật tốn K-means Lựa chọn thuộc tính độ cao (Z) điểm làm thuộc tính phân cụm, điều kiện hội tụ đặt cho thuật toán 0, số lần lặp lớn 10 Lựa chọn k = tương ứng với số lớp mơ hình mơ hình 3D khu vực khảo sát Khi lựa chọn k = 3, tâm cụm khởi tạo số lần lặp thuật toán thay đổi sau: ảng Khởi tạo tâm cụm số lần lặp với k = (a) Tâm cụm khởi tạo Tâm cụm lần lặp cuối số điểm gán vào cụm: (b) Số lần lặp thuật toán 384 NGHIÊN CỨU KẾT HỢP THUẬT TOÁN MCC VÀ K-MEANS TRONG PHÂN LOẠI ĐÁM MÂY ĐIỂM LIDAR ảng Số điểm sau phân loại gán vào cụm Hình Kết sau phân loại với k = Với k = k = 3, số điểm lỗi thuật tốn (số điểm khơng thuộc cụm nào), điều kiện hội tụ thuật toán 0, khoảng cách nhỏ tâm cụm khởi tạo với k = 118 với k = 59 Có thể thấy, với số điểm tương đối lớn 400 nghìn điểm, thuật tốn K-means cho số điểm lỗi 0, số lần lặp thuật toán nhỏ 10 – số lần lặp chấp nhận Sau q trình phân loại, điểm thuộc nhóm khơng mặt đất thu nhận phân loại chi tiết tuỳ theo mục đích sử dụng Các điểm sau phân loại gán nhãn, phân loại theo độ cao Từ đó, thành lập mơ hình khu vực khảo sát Hình 10 Mơ hình đám mây điểm 3D (a) Zmin (b) Zmax Hình 11 Mơ hình TIN với độ cao lớn nhỏ So sánh mô hình thành lập với hình ảnh vệ tinh khu vực khảo sát hình thấy mơ hình 3D thành lập sau phân loại với MCC K-means đáp ứng yêu cầu IV KẾT LUẬN Dữ liệu đám mây điểm LiDAR liệu chứa nhiều thơng tin có ích, có khả thu nhận thông tin khu vực đo vẽ rộng lớn nên số lượng điểm đám mây điểm thường lớn Do đó, để lựa chọn thuật tốn phù hợp để phân loại hồn tồn cần thiết Qua thử nghiệm cho thấy, thuật toán MCC thuật toán phân loại đám Nguyễn Thị Hữu Phương, Đặng Văn Đức, Nguyễn Trường Xuân, Trần Mạnh Trường 385 mây điểm tự động, phân chia điểm thành hai lớp mặt đất khơng mặt đất Trong thuật toán K-means sử dụng để phân loại lớp điểm khơng mặt đất, có tỉ lệ điểm lỗi 0, điều kiện hội tụ Có thể thấy, K-means có khả sử dụng để phân loại đám mây điểm LiDAR, liệu sau phân loại áp dụng cho toán cụ thể V LỜI CẢM ƠN Các tác giả biết ơn ủng hộ báo từ dự án IoIT (VAST) đề tài sở có mã số CS18.10 VI TÀI LIỆU THAM KHẢO [1] A Brzank, C Heipke (2005) Classification of LiDAR data into water and land points in coastal areas ISPRS [2] Beril Sirmacek, Roderik Lindenbergh (2015) Automatic classification of trees from laser scanning point clouds ISPRS, 137-144 [3] Borja Rodriguez - Cuenca, nnk (2015) Automatic detection and classification of pole-like objects in urban point cloud data using an anomaly detection algorithm Remote Sensing, 7, 12680-12703 [4] C Torresan, nnk (2016) Using classification trees to predict forest structure types from LiDAR data Annals of forest research, 59 [5] ESRI (2018, 06 09) What is LiDAR data? Retrieved from http://desktop.arcgis.com/en/arcmap/10.3/managedata/las-dataset/what-is-lidar-data-.htm [6] Jeffrey S Evans, Andrew T Hudak (2007) A multiscale curvature algorithm for classifying discrete return LiDAR in forest environments IEEE transactions on geoscience and remote sensing , 1029-1038 [7] Knowlegde Center (2015, 28) What is point cloud https://knowledge.safe.com/articles/257/what-is-a-point-cloud-what-is-lidar.html data? Retrieved from [8] Kun Zhang, nnk (2015) A new kmeans clustering algorithm for point cloud International Journal of Hybrid Information Technology, 8(9), 157-170 [9] N Yastikli, Z Cetin (2014) Classification of LiDAR data with point based classification methods ISPRS [10] Suresh K Lodha, nnk (2003) Aerial LiDAR data classification using AdaBoost [11] Yu chuan chang, nnk (2008) Automatic classification of LiDAR data in to ground and non-ground points Remote sensing and Spatial information Sciences, 457-462 [12] Zhuqiang Li, nnk (2016) A three step approach for TLS point cloud classification IEEE THE STUDY COMBINES MCC AND KMEANS ALGORITHMS IN LIDAR POINT CLOUD CLASSIFICATION Nguyen Thi Huu Phuong, Dang Van Duc, Nguyen Truong Xuan, Tran Manh Truong ABSTRACT: In 2007, the authors Jeffrey S Evans and Andrew T.Hudak proposed the MCC (Multiscale Curvature Classification) algorithm to automatically classify the point cloud into ground and non-ground classess In the classification process, the authors only recorded the points in the ground class to conduct the DEM creation for the surveyed area, the non-ground point group was eliminated, while this is the point group containing much information there Desiring to collect and record useful information in this point group, the paper focuses on the study of how to combine the MCC and K-means algorithms to optimize the LiDAR point cloud classification problem ... phân loại, nhiên kết phân loại có sai số tương đối lớn 45.9% với liệu chọn, rừng tỉ lệ lỗi 33.3% II NGHIÊN CỨU KẾT HỢP THUẬT TOÁN MCC VÀ K-MEANS TRONG PHÂN LOẠI ĐÁM MÂY ĐIỂM LIDAR 2.1 Thuật toán. .. phân loại đám mây điểm LiDAR 382 NGHIÊN CỨU KẾT HỢP THUẬT TOÁN MCC VÀ K-MEANS TRONG PHÂN LOẠI ĐÁM MÂY ĐIỂM LIDAR III THỬ NGHIỆM 3.1 Dữ liệu thử nghiệm Bộ liệu sử dụng để thử nghiệm báo liệu đám mây. ..380 NGHIÊN CỨU KẾT HỢP THUẬT TOÁN MCC VÀ K-MEANS TRONG PHÂN LOẠI ĐÁM MÂY ĐIỂM LIDAR cụm phổ biến, nghiên cứu (Kun Zhang nnk., 2015) nhóm tác sử dụng tham số mật độ đám mây điểm điều kiện