Giới thiệu :Trong những năm gần đây , với sự tiến bộ nhanh chóng của máy tính và cảm biến , người ta đã cóthể ứng dụng robot di chuyển tự động trên mặt đất trong các lĩnh vực xây dựng ,
Trang 1ĐẠI HỌC BÁCH KHOA HÀ NỘI
TRƯỜNG ĐIỆN – ĐIỆN TỬ
──────── *** ───────
Nghiên cứu thuật toán tìm đường đi tối ưu , tránh va chạm dành cho robot tự hành di
chuyển trên mặt đất
Học kỳ : 20231
Họ và tên sinh viên : Hoàng Văn Tùng
Mã sinh viên: 20214135
Hà Nội, tháng 12 năm 2023
Trang 2Mục lục
Tóm tắt : 3
I Giới thiệu : 3
II Công việc liên quan : 5
III Phương pháp : 6
A Xác định vấn đề : 6
B Mô hình từ đầu đến cuối (end-to-end) : 7
C Huấn luyện mô hình 7
D Triển khai kế hoạch chuyển động 8
IV Thử nghiệm 8
A Nền tảng robot 8
B Đào tạo dữ liệu 9
C Đánh giá từng khung hình 9
D So sánh quỹ đạo trong môi trường mô phỏng 10
E Điều hướng trong thế giới thực tế 12
F Phản ứng đối với thay đổi đột ngột 13
V THẢO LUẬN 14
VI KẾT LUẬN 14
Tài liệu tham khảo : 14
Trang 3Tóm tắt :
Lập kế hoạch cho robot là chìa khóa cho robot trong điều hướng , di chuyển tự động Vì vậy , đề tài nghiên cứu được đưa ra là thu thập dữ liệu , xây dựng thuật toán và bản đồ cho lộ trình của robot Trong bài nghiên cứu này , tôi xin trình bày mô hình có khả năng ánh xạ từ dữ liệu được xác định thông qua laser 2D và một vị trí mục tiêu , để đưa ra các lệnh di chuyển cần thiết cho robot Mô hình điều hướng end-to-end (nhận cảm biến và trực tiếp đưa ra lệnh thực thi) hướng mục tiêu cho nền tảng hoạt động của robot Tôi đánh giá chất lượng của việc lập kế hoạch chuyển động thông qua mạng nơ-ron (DNN) và so sánh với phương pháp thông dụng của lập kế hoạch chuyển động dựa trên phương pháp toàn cầu trên lưới , so sánh trong cả trường hợp thực tế và mô phỏng Từ việc đưa ra được kết quả so sánh trên mô phỏng và thực tế của phương pháp nghiên cứu , dự kiến có thể áp dụng trong thực tế , sử dụng trong đa môi trường
I Giới thiệu :
Trong những năm gần đây , với sự tiến bộ nhanh chóng của máy tính và cảm biến , người ta đã có thể ứng dụng robot di chuyển tự động trên mặt đất trong các lĩnh vực xây dựng , quy hoạch đường
đi , bánh lái tự động và vô số ứng dụng vô cùng thiết thực trong đời sống
Một trong những thách thức trong việc chế tạo robot là đáp ứng được nhu cầu của con người Về điều hướng , vấn đề này được định nghĩa là việc đi từ vị trí hiện tại đến vị trí mục tiêu , thực hiện chính sách điều hướng mong muốn Tuy nhiên , để có thể hiểu rõ được đường đi ngắn nhất , tránh vật cản thì cần sự can thiệp thủ công của con người tốn nhiều thời gian Ngoài ra , các giải pháp lập
kế hoạch chuyển động cổ điển yêu cầu một số bước tiền xử lý dữ liệu thường được tách riêng Bản
đồ môi trường phải được cung cấp từ trước , dữ liệu cảm biến được xử lý trước và các đối tượng tiềm năng phải được phát hiện để người lập kế hoạch có thể phản ứng phù hợp cho giai đoạn sau Robot được thiết lập sẵn chặng đường sẽ không có khả năng phản ứng với những tiềm ẩn bất ngờ , những chướng ngại vật số lượng lớn gây cản trở và không thể hiện được chức năng của một robot tự động
Với mục đích giảm số lượng điều chỉnh thủ công , đạt được hiệu suất mong muốn , tăng khả năng tự động di chuyển của robot , tôi trình bày cách tiếp cận ngược lại : lập kế hoạch di chuyển dựa trên dữ liệu thực tế Robot được cung cấp dữ liệu thực thi nhất định từ môi trường đào tạo ảo Bằng phương pháp này , người điều khiển có thể hiển thị mong muốn và chiến lược điều hướng của bản thân cho robot Trong quá trình điều hướng , robot sẽ được học lặp đi lặp lại lộ trình cụ thể từ dữ liệu của chuyên gia cung cấp (Reinforcement learning) , không chỉ vậy , robot cần hiểu được các chiến lược tránh va chạm và chuyển chúng sang môi trường (Supervised Learning) Kết luận lại, lập
kế hoạch đóng vai trò quan trọng trong việc điều hướng cho các loại robot di chuyển tự động Để lập một kế hoạch chuyển động lý tưởng , chúng ta cần một thuật toán giải quyết những điểm không chắc chắn trong mô hình thế giới nhận thức để giảm thiểu tác động của các vật thể lên tiến trình của robot và tìm đường đi tối ưu trong thời gian ngắn
Trang 4Hình 1 : Nền tảng robot có khả năng điều hướng an toàn qua một môi trường giống như mê cung chỉ bằng cách sử dụng thông tin laser và mục tiêu cục bộ (phía trên bên trái) Quỹ đạo đã đi qua cuối cùng được hiển thị trên bản đồ (bên phải) Hình ảnh tầm nhìn của robot chỉ được hiển thị để minh họa mục đích và không được sử dụng làm đầu vào cho thuật toán từ đầu đến cuối
Cách hoạt động của robot không yêu cầu bản đồ có sẵn để điều hướng Với dữ liệu cảm biến và vị trí tương đối , robot có thể tự động điều hướng đến vị trí mong muốn và tránh được những vật thể ngẫu nhiên Với thiết kế nhận diện vật thể thông qua cảm biến , xác định vị trí tương đối thì robot không bị giới hạn di chuyển bất kỳ môi trường nào Tuy nhiên , bài nghiên cứu này sẽ tập trung vào robot di chuyển trong môi trường tĩnh
Dữ liệu cảm biến sẽ được gửi tới robot thông qua cảm biến từ laser Phương pháp học máy dựa trên mạng thần kinh (Deep Neural Network) có tiềm năng lớn nhất để mô hình hóa các phần phụ thuộc phức tạp Nó đã cho thấy tiềm năng trong các ứng dụng khác nhau [1],[2],[3] cùng một số ứng dụng khác Để đào tạo kế hoạch chuyển động từ đầu đến cuối , tôi sử dụng phương pháp đường đi toàn cầu để đưa ra quỹ đạo hoàn chỉnh từ vị trí bắt đầu đến mục tiêu , cụ thể là dùng công cụ tìm phạm vi laser với góc quét 270 độ hướng vế phía trước làm cảm biến cho robot
Hiệu suất của mô hình chuyển động từ đầu đến cuối được kiểm tra cả trong mô phỏng và trên nền tảng robot thực Để phân tích tổng quát hóa của mô hình lập kế hoạch chuyển động cục bộ , điều quan trọng là tiến hành trong các môi trường chưa từng thấy trước đây , môi trường này khó xác định dữ liệu hơn môi trường được sử dụng để đào tạo
Những phần chính trong nghiên cứu là :
● Công cụ lập kế hoạch chuyển động toàn diện dựa trên dữ liệu được nhận diện từ phạm vi laser , đến các lệnh chuyển động
● Triển khai và thử nghiệm robot trên môi trường chưa xác định
● Đưa ra kế hoạch di chuyển cụ thể , đánh giá hiệu quả của phương pháp học sâu (Deep Neural Network) với phương pháp lập kế hoạch chuyển động với lộ trình có sẵn và chỉnh sửa , điều chỉnh lộ trình theo thủ công
Cấu trúc phần còn lại của tài liệu : Ở phần 2 , trình bày tổng quan nghiên cứu Phần 3 trình bày vấn
đề và cách tiếp cận Phần 4 sẽ nghiên cứu thực nghiệm : thu thập dữ liệu và phân tích dữ liệu Phần
5 thảo luận về kết quả Phần 6 rút ra kết luận
Trang 5II Công việc liên quan :
Lập kế hoạch chuyển động từ end-to-end dựa trên dữ liệu bao gồm nhiều lĩnh vực nghiên cứu, cả từ phía nhận thức và lập kế hoạch chuyển động Trên phía nhận thức, phần hiểu cảnh đặc biệt quan trọng Dữ liệu đầu vào phải được xử lý để trích xuất thông tin liên quan
Vì va chạm với các đối tượng xung quanh cần được tránh và mục tiêu phải được đạt được, trong công việc của chúng tôi, đặc biệt là phần hiểu cảnh vật lý hoặc chính xác hơn là hiểu biết không gian phải được xác định Fragkiadaki et al [1] đã chỉ ra rằng có thể học một mô hình về động học của quả bóng và tường dựa trên các mô phỏng được thể hiện cho mô hình trong quá trình huấn luyện Mà không cần bất kỳ kiến thức trước về động học và va chạm của quả bóng, mô hình này có thể dự đoán chuyển động của một số quả bóng bi-a trong cấu hình chưa từng thấy trước đó Điều này chỉ ra rằng
có thể mô hình hóa tương tác vật lý/không gian bằng DNNs Chen et al [4] trình bày một phương pháp trích xuất thông tin không gian từ dữ liệu hình ảnh và sử dụng các đặc trưng được trích xuất để lập kế hoạch chuyển động của một ô tô tự động Phương pháp không phải là từ đầu đến cuối vì nó bao gồm nhiều lớp xử lý, tuy nhiên, nó đã chứng minh rằng thông tin trích xuất có thể được sử dụng trực tiếp bởi một lập kế hoạch chuyển động Ondurska et al [5] trình bày một ứng dụng từ đầu đến cuối của các mạng nơ-ron cho theo dõi đối tượng động sử dụng dữ liệu laser Công việc của họ chỉ ra rằng mạng nơ-ron có thể được sử dụng để trích xuất thông tin không gian quan trọng từ dữ liệu laser hai chiều (2D)
Trên phía lập kế hoạch chuyển động, các nghiên cứu trước đây đã chỉ ra sự tăng cường hiệu suất bằng cách sử dụng các mô hình chuyển động dựa trên học Abbeel et al [6] chỉ ra sự áp dụng của học nghề nghiệp để học các chiến lược điều hướng của con người trên một bãi đỗ xe Ứng dụng này
có thể giảm đáng kể lượng điều chỉnh thủ công cho lập kế hoạch chuyển động Tuy nhiên, kiến thức
về bản đồ và mạng đường là cần thiết, làm cho phương pháp này chỉ áp dụng cho môi trường đơn Các phương pháp của Kuderer et al [7], Pfeiffer et al [8] và Kretzschmar et al [9] sử dụng các kỹ thuật học máy ngược nguyên tắc entropy tối đa cho các mô hình chuyển động nhận thức tương tác Các mô hình tương tác đã học cho người đi bộ dựa trên hành vi được thể hiện trong môi trường đang chiếm dụng Những ứng dụng này cũng chỉ ra rằng lượng điều chỉnh thủ công của các mô hình chuyển động và tương tác có thể giảm bằng cách áp dụng các kỹ thuật học máy và mô hình chuyển động đã học có thể vượt qua các mô hình được thiết kế bằng tay
Đối với các ứng dụng yêu cầu sự phối hợp chặt chẽ giữa nhận thức và điều khiển, như lập kế hoạch đường cho một cánh tay robot đóng nắp chai, Levine et al [10] chỉ ra rằng các phương pháp học từ đầu đến cuối có thể mang lại lợi ích và vượt qua các phương pháp đa tầng Một vấn đề tìm kiếm chính sách được chuyển đổi thành một vấn đề học tăng cường sâu sâu sử dụng mạng nơ-ron tích chập (CNN) cho ánh xạ phức tạp giữa trạng thái và hành động Mô hình đã học có thể lập kế hoạch thành công cho mã lực của một cánh tay robot, dựa trên dữ liệu hình ảnh nguyên thô Phương pháp khác dựa trên học tăng cường sâu sâu dựa trên hình ảnh để lập kế hoạch/chưa định được trình bày bởi Mnih et al [11] Họ chỉ ra rằng có thể học chơi nhiều trò chơi máy tính dựa trên dữ liệu pixel màn hình và thậm chí vượt qua người chơi con người
Liên quan đến ứng dụng robot di động của việc học từ đầu đến cuối, Ross et al [12] trình bày một phương pháp học bộ điều khiển trái/phải cho một phương tiện bay không người lái (UAV) dựa trên
dữ liệu hình ảnh UAV có thể tự động điều hướng qua rừng và tránh va chạm với cây trong hầu hết các trường hợp Tuy nhiên, chỉ có thể kiểm soát chuyển động trái/phải trong khi lệnh chuyển động
Trang 6tiến vẫn được chọn bởi một nhà điều khiển con người Kim et al [13] mở rộng phương pháp này cho một ứng dụng hành lang nơi họ học về vận tốc dịch và xoay Tuy nhiên, phương pháp chỉ được thử nghiệm trong những hành lang trống trải không có vật cản nào chặn đường đi của UAV Phương pháp tránh va chạm từ đầu đến cuối dựa trên hình ảnh khác được trình bày bởi Muller et al [14] Họ tập trung vào việc trích xuất đặc trưng hình ảnh và khả năng chuyển giao giữa các điều kiện môi trường khác nhau Chứng minh rằng việc tránh va chạm hoạt động, tuy nhiên, hiệu suất điều hướng của robot không được phân tích
Sergeant et al [15] trình bày một phương pháp lập kế hoạch chuyển động từ đầu đến cuối dựa trên laser và dữ liệu được điều khiển bởi máy nén sâu Khả năng tránh va chạm của phương pháp này được thể hiện trong mô phỏng và trên một nền tảng robot Khác với khung công việc của chúng ta, không có vị trí mục tiêu của robot nào được xem xét, do đó, nó không thể áp dụng như một kỹ thuật lập kế hoạch chuyển động cục bộ nếu một mục tiêu phải được đạt đến Với phương pháp này, robot
có thể di chuyển trên các đường đi hợp lý, tuy nhiên, không thể đạt được một mục tiêu cụ thể III Phương pháp :
Phần này mô tả vấn đề cơ bản và phương pháp chúng ta xử lý vấn đề
A Xác định vấn đề :
Con người thường có thể nhận diện tốt môi trường , tự thu thập tốt thông tin và đưa ra quyết định hợp lý từ thông tin đó Tuy nhiên , để đưa ra được quyết định nhanh chóng , họ cũng cần tích lũy thông qua kiến thức xuyên suốt cuộc đời mà họ sống
Để robot đưa ra được quyết định đúng – di chuyển robot tới vị trí mong muốn (bao gồm hướng di chuyển) – robot phải vượt qua nhiều giai đoạn Đầu tiên , trích xuất được dữ liệu từ bộ cảm biến Thứ hai , sử dụng thông tin này , tìm ra mô hình mối quan hệ giữa các quan sát và hành động cần thực thi Thứ ba , trong quá trình triển khai , mô hình phải đưa ra được quyết định đúng ngay khi xuất hiện quan sát mới(xác định môi trường nhanh chóng trong trường hợp xuất hiện chướng ngại vật đột xuất)
Phương pháp tính trực tiếp các lệnh di chuyển thích hợp dựa trên dữ liệu cảm biến và mục tiêu Với các mô phỏng , tôi đưa ra hàm :
� =��(y, g)
y : dữ liệu cảm biến nhận được
g : thông tin mục tiêu
u : hàm thực thi lệnh mong muốn , ánh xạ trực tiếp dữ liệu cảm biến y và thông tin mục tiêu g thành các lệnh di chuyển
Hàm được tham số hóa bởi vecto tham số� Trong quá trình huấn luyện robot , chúng ta sẽ tìm các tham số hàm� mà xử lý dữ liệu tốt nhất Tiêu chí tối ưu được đánh giá thông qua sai lệch so với thực thi thông qua điều khiển thủ công từ các chuyên gia :
�����(y, g)−����
Trang 7� (y, g)� : lệnh di chuyển theo dự đoán
����: lệnh di chuyển được cung cấp bởi các chuyên gia
Trong quá trình triển khai , các tham số mô hình� đã được xác định và các lệnh thực thi có thể được tính toán dựa trên y , g
B Mô hình từ đầu đến cuối (end-to-end) :
Hình 2 : Cấu trúc của CNN Dữ liệu laser được xử lý bởi phần tích chập, bao gồm hai khối xây dựng
dư thừa như trình bày trong [16] Phần FC của mạng kết hợp các đặc trưng được trích xuất và thông tin mục tiêu Kích thước đầu vào/đầu ra của mô hình tổng thể được hiển thị trên các kết nối Chính sách đề xuất L1 được áp dụng cho tất cả các tham số của mô hình
Mối quan hệ từ đầu đến cuối giữa dữ liệu đầu vào và các lệnh thực thi có thể dẫn đến một mô hình phức tạp bất kỳ Trong số nhiều phương pháp học máy khác nhau, DNNs/CNNs được biết đến với khả năng như một hàm xấp xỉ siêu tham số để mô hình các phụ thuộc phức tạp và phi tuyến Trong công việc này, chúng ta sẽ sử dụng một Convolutional Neural Networks (mạng nơ-ron tích chập) để biểu diễn hàm�� Toàn bộ quy trình xử lý từ việc trích xuất thông tin đến việc tìm ra các lệnh thực thi phải được bao phủ bởi một mô hình duy nhất Như đã đề cập trước đó, các đầu vào được đo bởi các đo lường của bộ dò phạm vi laser 2D và vị trí mục tiêu tương đối, có nghĩa là vị trí của mục tiêu (tọa độ cực) trong một hệ tọa độ tâm của robot Để có được các đặc trưng hiểu biết về không gian,
dữ liệu laser được xử lý bởi một CNN trước khi đầu ra của mạng con đó được kết hợp với thông tin mục tiêu và xử lý bởi các lớp kết nối đầy đủ (FC – Fully Connected Layer – một loại lớp trong nơ-ron nhân tạo, thường xuất hiện ở cuối của mô hình và thực hiện nhiệm vụ phân loại dữ liệu) của mô hình Cấu trúc của mô hình mạng nơ-ron được hiển thị trong Hình 2 Mạng bao gồm hai khối xây dựng còn lại bao gồm các kết nối tắt như đề xuất trong [18], chỉ ra rằng có thể giảm thiểu độ phức tạp của quá trình huấn luyện bằng cách sử dụng các mạng dư, so với việc xếp các tích chồng lên nhau Trong bài nghiên cứu này sẽ nêu ra hai mô hình Đối với phiên bản đầu tiên (CNN smallFC), ba kích thước lớp FC là (256, 256, 256) trong khi đối với phiên bản thứ hai (CNN bigFC), kích thước của chúng được tăng lên là (1024, 1024, 512) Phần tích chập của cả hai mạng không thay đổi, như được hiển thị trong Hình 2 Việc triển khai mô hình mạng nơ-ron của chúng tôi dựa trên framework TensorFlow của Google [17]
C Huấn luyện mô hình
Mục tiêu cuối cùng của phương pháp được trình bày là khả năng học một đặc điểm di chuyển được chuyển cho robot bởi một người điều khiển chuyên gia theo một cách được giám sát Để tránh gánh nặng của việc thu thập dữ liệu di chuyển của con người ở quy mô lớn, chúng tôi dựa vào mô phỏng nơi một kế hoạch chuyển động toàn cầu được sử dụng như một chuyên gia Điều này là một đặc
Trang 8điểm rất quan trọng trong các ứng dụng robot nơi việc thu thập dữ liệu đắt đỏ Đối với mỗi bước thời gian i , bộ dữ liệu :
γᵢ=(yᵢ, gᵢ, uᵢₑₓₚ, ᵢ) yᵢ:đo lường laser
gᵢ : thông tin mục tiêu
uᵢₑₓₚ, ᵢ : lệnh di chuyển được cung cấp bởi chuyên gia
Ở đây, lệnh tốc độ u=(v,ω) bao gồm vận tốc dịch chuyển và vận tốc xoay Để giảm thiểu các tương quan thời gian trong dữ liệu huấn luyện đến mức tối thiểu, các bộ dữ liệu được ngẫu nhiên hóa trước khi sử dụng cho việc huấn luyện Quá trình tối ưu hóa được thực hiện bằng cách sử dụng trình tối ưu hóa Adam [18] với huấn luyện theo lô nhỏ Hàm mất mát cho mỗi bước học giám sát k được cho bởi công thức :
��(�)=�1�.
� = �
�+� �
���(y�, g�)−����,�
Trong đóΓ = [γᵢ , …, γ� �+ ��] bao gồm nhiều mẫu của bộ huấn luyện ���đại diện cho mô hình tại bước huân luyện hiện tại
D Triển khai kế hoạch chuyển động
Một ưu điểm của các mô hình mạng nơ-ron so với các phương pháp khác là thời gian truy vấn dự kiến của chúng trong quá trình kiểm thử Trong khi độ phức tạp của các phương pháp đa giai đoạn
có thể tăng lên nếu môi trường trở nên phức tạp hơn, độ phức tạp của mạng nơ-ron không bị ảnh hưởng bởi môi trường của robot và truy vấn vẫn giữ nguyên Vì không cần xử lý trước dữ liệu laser
từ bên ngoại, độ phức tạp tính toán và do đó cũng thời gian truy vấn cho một lệnh lái chỉ phụ thuộc vào độ phức tạp của mô hình, mà sau khi được đào tạo là hằng số
Mô hình mạng nơ-ron được trình bày tính toán các lệnh thực thi theo từng khung hình Không có bộ nhớ nội hoặc ngoại vi được sử dụng để xem xét các đầu ra trước đó và đầu vào
IV Thử nghiệm
Phần này bao gồm các thí nghiệm đã được tiến hành và đánh giá kết quả Đầu tiên, nền tảng robot được giới thiệu, nó được sử dụng trong tất cả các thí nghiệm, cả trong mô phỏng và thực tế Tiếp theo, quá trình tạo dữ liệu đào tạo được mô tả trước khi bốn thí nghiệm (hai trong mô phỏng, hai trên nền tảng thực) được trình bày để đánh giá Sau đây , mô hình lập kế hoạch chuyển động dựa trên mạng nơ-ron sẽ được gọi là lập kế hoạch sâu
A Nền tảng robot
Sử dụng một TurtleBot dựa trên Kobuki làm nền tảng robot của mình Thêm một cảm biến laser Hokuyo UTM1 hướng về phía trước với góc nhìn (FOV) là 270 độ và khoảng quét tối đa là 30 m cho robot lái chuyển với bánh lái cấp độ Cảm biến laser có độ phân giải góc là 0,25 độ, dẫn đến 1080 lần
Trang 9đo trong mỗi quét Sử dụng một máy tính Intel NUC với bộ vi xử lý i7-5557U 3,10 GHz chạy Ubuntu 14.04 làm máy tính trên bảng và Robot Operating System (ROS) làm middleware
B Đào tạo dữ liệu
Hình 3 : Thống kê lỗi của lỗi từng khung giữa ROS (chuyên gia) và bộ lập kế hoạch sâu Dữ liệu đánh giá không được sử dụng để huấn luyện trước đó Ba hình nhỏ minh họa các bản đồ mà đánh giá được thực hiện Việc xem bản đồ được cải thiện khi phóng to trên màn hình máy tính
Chúng ta sử dụng mạng lưới điều hướng 2D của ROS cho lớp điều hướng hai cấp độ (toàn cầu và cục bộ) Trên cấp độ toàn cầu, chúng ta sử dụng lập kế hoạch Dijkstra dựa trên lưới, trong khi một phương pháp tiếp cận cửa sổ động (DWA) được sử dụng ở cấp độ cục bộ Chúng ta sử dụng Stage 2D như một bộ mô phỏng động trong quá trình tạo dữ liệu đào tạo Trong quá trình tạo dữ liệu, robot di chuyển đến 30 vị trí mục tiêu ngẫu nhiên, sử dụng lập kế hoạch điều hướng của chuyên gia Dữ liệu đào tạo được tạo ra trên bản đồ "train" và dữ liệu đánh giá được tạo ra trên hai bản đồ "eval1" và
"eval2" [Hình 3] Bản đồ "train" gốc được hiển thị trong cột bên trái của Hình 3 và Hình 4 Đối với các thử nghiệm thực tế, chúng tôi sử dụng dữ liệu đào tạo từ cả bản đồ "train" và bản đồ "eval2" Bản đồ "eval2" bao gồm những vật thể lộn xộn và khác nhau mà robot có thể gặp phải trong thử nghiệm thực tế Chúng tôi tạo ra 6000 quỹ đạo trên bản đồ "train" và 4000 quỹ đạo trên bản đồ
"eval2" với mô hình chạy trên GPU Nvidia GeForce GTX 980 Ti, tương ứng với khoảng 2,1 triệu và 2,2 triệu cặp dữ liệu đầu vào/đầu ra
C Đánh giá từng khung hình
Thí nghiệm này tập trung vào đánh giá lỗi của mô hình CNN liên quan đến các lệnh thực thi di chuyển được tính toán Như đã đề cập trong Phần IV-B, mô hình được đào tạo với các mẫu từ bản đồ huấn luyện duy nhất Thí nghiệm này được thực hiện bằng cách sử dụng mô hình CNN smallFC Để độc lập với GPU trong quá trình kiểm thử, việc truy vấn phải được thực hiện bằng CPU duy nhất Trên một máy tính có bộ xử lý Intel i7-4810MQ với tốc độ 2.8GHz, thời gian truy vấn trung bình của mô hình là 4.3 ms
Đối với quá trình đánh giá, chúng tôi tạo các cặp dữ liệu đầu ra/đầu vào cho ba bản đồ bao gồm train, eval1 và eval2, bằng cách di chuyển đến 30 vị trí mục tiêu ngẫu nhiên mỗi lần, sử dụng lập kế hoạch chuyển động của chuyên gia Dựa trên dữ liệu này (không thấy trong quá trình đào tạo), lỗi giữa các lệnh lái dịch chuyển và xoay của mô hình và lập kế hoạch chuyển động của chuyên gia được tính toán cho mỗi cặp dữ liệu đầu ra/đầu vào
Như thống kê lỗi trong Hình 3 đã cho thấy, lỗi đánh giá nhỏ nhất có thể quan sát được trên bản đồ huấn luyện Chúng tôi nhận thấy rằng những giá trị lớn ngoại vi của lệnh vận tốc quay thường xuất hiện khi quay chỗ, ví dụ như quay 180° về phải hoặc trái có ảnh hưởng lớn đến lỗi vận tốc quay
Trang 10nhưng chỉ ảnh hưởng nhỏ đến hành vi thực tế của robot Bản đồ eval1 có cấu trúc khác biệt so với bản đồ huấn luyện, nhưng các vật cản có hình dạng tương tự Điều này dẫn đến tăng lỗi đánh giá, đặc biệt là lệnh vận tốc quay Chuyển đến bản đồ eval2, cả phần dịch chuyển và phần quay của lỗi đánh giá tăng lên thêm nữa
Kết quả này xác nhận mong đợi của chúng tôi Mô hình có khả năng chuyển đổi kiến thức về hiểu biết cảnh và điều hướng từ môi trường này sang môi trường khác Tuy nhiên, nếu sự chênh lệch trong cấu trúc môi trường lớn, chẳng hạn như giữa bản đồ huấn luyện và bản đồ eval, hiểu biết cảnh đúng đắn có thể không đảm bảo, dẫn đến sự chênh lệch lớn hơn giữa lệnh lái của chuyên gia và mô hình CNN
D So sánh quỹ đạo trong môi trường mô phỏng
Thí nghiệm trước đã chứng minh khả năng của việc phân tích từng khung hình Trong phần này, phân tích hiệu suất của mô hình điều hướng khi triển khai nó như một trình lập kế hoạch chuyển động trên nền tảng robot Thí nghiệm này sẽ cho chúng ta biết liệu các đặc điểm điều hướng có được từ chuyên gia hay có sự chệch lệch đặc biệt trên một bản đồ cụ thể không Mô hình CNN và dữ liệu huấn luyện giống như trong thí nghiệm trước Cả cho môi trường đào tạo và môi trường eval1, các nhiệm vụ với vị trí mục tiêu cố định được tạo ra Trong khi trình lập kế hoạch ROS có thông tin toàn cầu về bản đồ như trong quá trình đào tạo, mô hình điều hướng sâu chỉ nhận thông tin mục tiêu tương đối (điểm đỏ, Hình 4) và kết quả của cảm biến laser ở mỗi bước thời gian như một đầu vào Vì mô phỏng là xác định, chỉ có một nhiệm vụ cho mỗi trình lập kế hoạch được đánh giá Khả năng tái tạo của phương pháp sẽ được kiểm tra trong thí nghiệm thế giới thực kế tiếp
Vì cấu trúc lập kế hoạch được sử dụng cho việc đào tạo là một phương pháp lập kế hoạch chuyển động theo lớp, nó không thể được mô tả trong một hàm chi phí đơn Do đó, ngoài việc kiểm tra trực quan, quỹ đạo cũng được đánh giá dựa trên các chỉ số sau đây, được lấy cảm hứng từ [23]:
�����: khoảng cách từ vị trí cuối cùng của quỹ đạo đến điểm mục tiêu được tổng hợp qua tất cả các quỹ đạo
������: giá trị tuyệt đối tích hợp của gia tốc dịch chuyển qua tất cả các quỹ đạo
E���: giá trị tuyệt đối tích hợp của gia tốc xoay qua tất cả các quỹ đạo
dist : tổng quãng đường đã đi được cho nhiệm vụ
time : tổng thời gian di chuyển cho nhiệm vụ