2. Những nội dung nghiên cứu
3.4 Kết quả thử nghiệm
3.4.1 Phân loại với K-means
Đám mây được đưa và phân cụm với K-means, số cụm được lựa chọn là 2 (K=2), số lần lặp tối đa được lựa chọn là 10. Thuộc tính được đưa vào sử dụng phân cụm là thuộc tính độ cao Z của điểm.
Tâm cụm khởi tạo và sự thay đổi tâm cụm trong các lần lặp được thể hiện trong hình 30, 31.
Hình 31: Sự thay đổi của tâm cụm qua các lần lặp
Thuật toán có điểm hội tụ là 0, với 8 lần lặp. Tâm cụm lần lặp cuối được thể hiện trong hình 32, sự phân bố của số điểm trong mỗi cụm được thể hiện trong hình 33, với số điểm lỗi là 0.
Hình 32: Tâm cụm sau lần lặp thứ 8
Hình 33: Số điểm của mỗi cụm
Kết quả phân cụm được sử dụng thành lập mô hình DEM/DSM với độ phân giải là 1m. Mô hình DEM được thể hiện trong hình 34, DSM được thể hiện trong hình 35.
Hình 34: Mô hình DEM với độ phân giải là 1m
Hình 35: Mô hình DSM với độ phân giải là 1m
3.4.2 Phân loại với PointNet
Với đám mây điểm được sử dụng phân loại với PointNet, thực hiện trích chọn đặc trưng với 2 lớp điểm: Ground và Non-ground. Lựa chọn số điểm huấn luyện và kiểm tra theo nguyên tắc: 2/3 train và 1/3 test.
Dữ liệu xác thực cũng được yêu cầu. Nó được sử dụng để cung cấp đánh giá khách quan về một mô hình trong quá trình đào tạo và hữu ích để xác định và ngăn chặn việc trang bị quá mức, trong đó mô hình chỉ hoạt động tốt trên dữ liệu đào tạo chứ không có gì khác. Dữ liệu xác thực phải tương tự như dữ liệu đào tạo ở chỗ nó bao gồm các lĩnh vực đại diện được quan tâm và sử dụng cùng một sơ đồ phân loại nhưng đến từ các địa điểm khác nhau. Có thể sử dụng cùng một dữ liệu dự án được sử dụng để đào tạo, chỉ là các tập hợp con khác nhau. Nói chung, cần nhiều dữ liệu đào tạo hơn dữ liệu xác thực. Không có quy tắc cố định nào, nhưng không có gì lạ khi sử dụng dữ liệu đào tạo nhiều hơn nhiều lần so với dữ liệu xác thực.
Dữ liệu xác thực và huấn luyện kích thước khối được chia thành các khối nhỏ có thể quản lý được. Các khối điểm này sau đó được đặt thành một định dạng có thể truy cập vào thư viện học sâu. Kích thước các khối một cách hợp lý. Mục tiêu của chúng là chứa một số điểm hợp lý so với bộ nhớ GPU khả dụng. Huấn luyện sẽ tải các điểm và cấu trúc dữ liệu thứ cấp cho bao nhiêu khối tại một thời điểm được đặt bởi một tham số huấn luyện được gọi là kích thước lô. Ở đây có sự tác động lẫn nhau của một số biến số cần chú ý. Các lô kiểm soát số lượng khối được xử lý tại một thời điểm. Khối là tập hợp các điểm và thuộc tính của chúng. Số lượng điểm trong một khối được xác định bởi kích thước của khối và mật độ điểm tại vị trí của khối. Các khối sẽ chứa một số điểm tương đối nhất quán nếu mật độ của đám mây điểm là nhất quán. Có thể sử dụng bộ dữ liệu trong đó mật độ điểm thay đổi rất nhiều, nhưng nó có thể sẽ yêu cầu đào tạo nhiều hơn để làm cho nó hoạt động tốt.
block_size = square_root(target_point_count) * 2d_point_spacing
Cài đặt điểm tối thiểu cho mỗi khối trên công cụ huấn luyện được sử dụng để bỏ qua các khối huấn luyện chứa không đủ số điểm. Thông thường, các khối xung quanh chu vi dự án không có nhiều điểm. Ngoài ra, trong khi tạo dữ liệu huấn luyện, giới hạn điểm khối có thể đã đạt đến cho một trong các khối khác. Các khối tiếp theo được thực hiện để giữ các điểm tràn. Trong cả hai trường hợp, các khối có tương đối ít điểm không đặc biệt hữu ích vì vậy tốt hơn là không nên đưa chúng vào quá trình huấn luyện.
Sau quá trình huấn luyện, độ chính xác của mô hình được đánh giá với độ chính xác acc = 0.768.
Các lớp được phân loại với PointNet được thể hiện trong bảng 2:
Điểm Ground Non-Ground Missing
453.982 480.861 0
Bảng 2: Sự phân bố của các điểm sau khi phân loại với PointNet
Bin Frequency Cumulative % Bin Frequency Cumulative % 1 453982 83,21% 1 453982 83,21% 2 480861 100,00% 2 480861 100,00% More 0 100,00% More 0 100,00%
Bảng 3: Sự tương quan của các điểm trong hai lớp điểm Ground và Non-Ground
0.00% 50.00% 100.00% 150.00% 0 200000 400000 600000 1 2 More Fr e q u e n cy Bin Histogram Frequency Cumulative %
Hình 37: Biểu đồ Histogram về sự phân bố của hai lớp điểm
Qua biểu đồ tương quan có thể thấy, sự tương quan của hai lớp ở mức cao, kết quả phân loại đảm bảo độ chính xác trong đánh giá kết quả.
Đám mây điểm sau phân lớp, sử dụng thành lập DEM/DSM được thực hiện trong hình 38, 39.
Hình 38: Mô hình DSM với độ phân giải là 1m
Hình 40: Mô hình 3D đám mây điểm khu vực bay quét
3.4.3 So sánh kết quả phân lớp với K-means và PointNet
Kết quả phân lớp với hai thuật toán được sử dụng các độ đo Precision, Recall và F1 để đánh giá độ chính xác được thể hiện trong bảng 4:
Thuật toán Precision Recall F1
K-means 89,90% 88,90% 89,40%
PointNet 91,29% 91,00% 91,14%
Bảng 4: Bảng kết quả đánh giá trên độ đo
Qua bảng kết quả đánh giá, có thể thấy khi lựa chọn được mô hình phù hợp, thực hiện huấn luyện chính xác giúp cho PointNet có kết quả phân loại chính xác hơn so với K-means.
Với mô hình trong PointNet, vấn đề về tiền xử lý dữ liệu và trích chọn đặc trưng sẽ quyết định nhiều đến độ chính xác của mô hình.
Trong khi đó, K-means là thuật toán hoàn toàn phân cụm dựa trên khoảng cách giữa các điểm, lựa chọn tâm cụm và số lần lặp sẽ quyết định về số lượng điểm được phân vào mỗi cụm. Tuy nhiên, kết quả của K-means bị ảnh hưởng do
KẾT LUẬN
Hiện nay, ở Việt Nam công nghệ LiDAR được ứng dụng rộng rãi trong nhiều lĩnh vực như: Trắc địa bản đồ, trong kỹ thuật môi trường, vật lý, khảo cổ học, …. Tuy nhiên, những việc áp dụng này chỉ dừng lại ở việc ứng dụng công nghệ LiDAR xây dựng bản đồ địa hình, lập bản đồ ngập úng, dự báo trượt lở, lập bản đồ giao thông, tạo mô hình DTM, DSM, lập bản đồ các tuyến truyền tải dài, …. Việc đi sâu nghiên cứu giải quyết các bài toán phân loại điểm nhằm mở rộng khả năng ứng dụng của công nghệ LiDAR hiện nay vẫn chưa có sản phẩm nào được công bố tại Việt Nam. Do đó, đề tài nghiên cứu góp phần làm rõ hiệu quả, độ chính xác khi sử dụng một số thuật toán trong việc giải quyết bài toán phân loại đám mây điểm đồng thời là cơ sở để mở rộng các ứng dụng khai thác dữ liệu LiDAR.
TÀI LIỆU THAM KHẢO TIẾNG VIỆT
1. TS. Lương Chính Kế, “Thành lập DEM/DTM/DSM bằng công nghệ LiDAR”, 2005.
2. TS. Trần Đình Luật, Th.S Nguyễn Thị Kim Dung, Th.S Lưu Thị Thu Thủy, Th.S Trần Hồng Hạnh, “Khả năng ứng dụng công nghệ LiDAR xây dựng mô hình số địa hình vùng bãi bồi cửa sông ven biển trong điều kiện Việt Nam”, Tạp chí Tài nguyên và Môi trường, vol.1, pp. 24-28, 2015.
3. Trần Đình Trí, “Công nghệ LiDAR”, Bài giảng dành cho cao học, Trường Đại học Mỏ - Địa chất, 2013.
TIẾNG ANH
4. J.Niemeyer, C.Mallet, F.Rottensteiner, U.Sorgel, "CRF for the classification of LiDAR point cloud," Remote Sensing, 2011.
5. J. Kunapo, "Spatial data integration for classification of 3D point cloud from digital photogrammetry," Applied GIS, Monash University Express, vol. 3, no. 3, pp. 26.1-26.15, 2005.
6. Jeffrey S.Evans, Andrew T.Hudak, "A multiscale curvature algorithm for classifying discrete return LiDAR in forested environments," IEEE, vol. 45, pp. 1029- 1038, 2007.
7. N.El-Ashmawy, A.Shaker, "Raster vs Point cloud LiDAR data classification," The International Archives of the Photogrammetry, RS and Spatial Information Sciences, Vols. XL-7, pp. 79-83, 2014.
8. N.Yastikli, Z.Cetin, "Classification of LiDAR data with point based classification methods," vol. 3, 2015.
9. .S.forge,"SourceForge,"[Online],Available: http://sourceforge.net/projects/mcclidar.
10. Wade T.Tinkham, Hongyu Huang, "A comparision of two open source LiDAR surface classification algorithm," Remote Sensing, vol. 3, pp. 638-649, 2011.
11. Binbin Zhang, Shikun Huang, Wen Shen, Zhihua Wei, "Explaining the PointNet: What Has Been Learned Inside the PointNet?," CVPR Workshops, 2019.