3.4.2 Phân loại với PointNet
Với đám mây điểm được sử dụng phân loại với PointNet, thực hiện trích chọn đặc trưng với 2 lớp điểm: Ground và Non-ground. Lựa chọn số điểm huấn luyện và kiểm tra theo nguyên tắc: 2/3 train và 1/3 test.
Dữ liệu xác thực cũng được yêu cầu. Nó được sử dụng để cung cấp đánh giá khách quan về một mô hình trong quá trình đào tạo và hữu ích để xác định và ngăn chặn việc trang bị quá mức, trong đó mô hình chỉ hoạt động tốt trên dữ liệu đào tạo chứ không có gì khác. Dữ liệu xác thực phải tương tự như dữ liệu đào tạo ở chỗ nó bao gồm các lĩnh vực đại diện được quan tâm và sử dụng cùng một sơ đồ phân loại nhưng đến từ các địa điểm khác nhau. Có thể sử dụng cùng một dữ liệu dự án được sử dụng để đào tạo, chỉ là các tập hợp con khác nhau. Nói chung, cần nhiều dữ liệu đào tạo hơn dữ liệu xác thực. Không có quy tắc cố định nào, nhưng không có gì lạ khi sử dụng dữ liệu đào tạo nhiều hơn nhiều lần so với dữ liệu xác thực.
Dữ liệu xác thực và huấn luyện kích thước khối được chia thành các khối nhỏ có thể quản lý được. Các khối điểm này sau đó được đặt thành một định dạng có thể truy cập vào thư viện học sâu. Kích thước các khối một cách hợp lý. Mục tiêu của chúng là chứa một số điểm hợp lý so với bộ nhớ GPU khả dụng. Huấn luyện sẽ tải các điểm và cấu trúc dữ liệu thứ cấp cho bao nhiêu khối tại một thời điểm được đặt bởi một tham số huấn luyện được gọi là kích thước lô. Ở đây có sự tác động lẫn nhau của một số biến số cần chú ý. Các lô kiểm soát số lượng khối được xử lý tại một thời điểm. Khối là tập hợp các điểm và thuộc tính của chúng. Số lượng điểm trong một khối được xác định bởi kích thước của khối và mật độ điểm tại vị trí của khối. Các khối sẽ chứa một số điểm tương đối nhất quán nếu mật độ của đám mây điểm là nhất quán. Có thể sử dụng bộ dữ liệu trong đó mật độ điểm thay đổi rất nhiều, nhưng nó có thể sẽ yêu cầu đào tạo nhiều hơn để làm cho nó hoạt động tốt.
block_size = square_root(target_point_count) * 2d_point_spacing
Cài đặt điểm tối thiểu cho mỗi khối trên công cụ huấn luyện được sử dụng để bỏ qua các khối huấn luyện chứa không đủ số điểm. Thông thường, các khối xung quanh chu vi dự án không có nhiều điểm. Ngoài ra, trong khi tạo dữ liệu huấn luyện, giới hạn điểm khối có thể đã đạt đến cho một trong các khối khác. Các khối tiếp theo được thực hiện để giữ các điểm tràn. Trong cả hai trường hợp, các khối có tương đối ít điểm không đặc biệt hữu ích vì vậy tốt hơn là không nên đưa chúng vào quá trình huấn luyện.
Sau quá trình huấn luyện, độ chính xác của mô hình được đánh giá với độ chính xác acc = 0.768.
Các lớp được phân loại với PointNet được thể hiện trong bảng 2:
Điểm Ground Non-Ground Missing
453.982 480.861 0
Bảng 2: Sự phân bố của các điểm sau khi phân loại với PointNet
Bin Frequency Cumulative % Bin Frequency Cumulative % 1 453982 83,21% 1 453982 83,21% 2 480861 100,00% 2 480861 100,00% More 0 100,00% More 0 100,00%
Bảng 3: Sự tương quan của các điểm trong hai lớp điểm Ground và Non-Ground
0.00% 50.00% 100.00% 150.00% 0 200000 400000 600000 1 2 More Fr e q u e n cy Bin Histogram Frequency Cumulative %