Trong hệ thống xe tự lái, suy luận trực tuyến có thể được phân loại thành ba chế độ: chế độ suy luận cục bộ, chế độ suy luận biên và chế độ suy luận chung. Cho suy luận cục bộ, các phương tiện tự thực hiện suy luận. Hiệu suất suy luận chủ yếu phụ thuộc vào khả năng tính tốn (tài ngun tính tốn và lưu trữ khơng gian) của các phương tiện, tuy nhiên, thường rất hạn chế. Đối với suy luận cạnh biên, dữ liệu thô phải được tải lên tới máy chủ biên qua đường lên khơng dây. Chúng ta lưu ý rằng ở đó tồn tại hai mối nguy tiềm ẩn liên quan đến cách tiếp cận này. Một là bảo mật dữ liệu do dữ liệu được tải lên đầy đủ người phục vụ. Khác là độ trễ giao tiếp đáng kể là được giới thiệu sau khi nhiều phương tiện tải lên dữ liệu thơ với kích thước và số lượng thơng qua kênh đường lên giới hạn băng thông. Được thúc đẩy bởi những thách thức trong hai suy luận trước các chế độ, suy luận chung của phương tiện cạnh tranh trở nên đầy hứa hẹn bởi chia mơ hình mạng nơ ron sâu (DNN) đã được đào tạo thành hai phần: các lớp mạng nơron nông (SNN) ở bên xe và các lớp DNN ở cạnh bên. Vì vậy, các loại xe chỉ cần up thông số trung gian đến máy chủ biên để giảm độ trễ đầu cuối với suy luận chung. Trong thực tế, mức tăng độ trễ giới hạn có thể là đạt được do hiệu ứng khuếch đại dữ liệu, cho biết rằng kích thước của dữ liệu đầu ra trung gian của nơron sâu mạng lớn hơn của dữ liệu đầu vào. Trong ngữ cảnh này, chọn một điểm tách thích hợp trong khi tránh hiệu ứng khuếch đại dữ liệu trở nên quan trọng và do đó kích thước trọng số các thơng số đã tải lên có thể nhỏ hơn nhiều so với kích thước của dữ liệu bằng cách thiết kế mơ hình mạng nơ- ron một cách thích hợp.
3.4.3 Nghiên cứu điển hình: Phát hiện đối tượng trực quan được hỗ trợ bởi EI
Trong phần này, chúng ta xem xét phát hiện đối tượng trực quan dựa trên hệ thống lái tự động. Do hạn chế về máy tính nguồn và ngân sách năng lượng eo hẹp của các phương tiện tự lái, chúng thường cần sự giúp đỡ từ BS để cộng tác xử lý các tác vụ nhạy cảm với độ trễ. Kể từ khi quyết định chiến lược giảm tải làm với việc giảm thiểu tiêu thụ năng lượng của AVs và độ trễ có thể được hình thành như một vấn đề MINLP, đó là NP-Thật khó, chúng ta thiết kế một mạng nơ-ron truyền nguồn cấp dữ liệu dựa trên MTL mơ hình bằng cách học ánh xạ end-to-end giữa xác suất các tham số đầu vào và các giải pháp đầu ra. Đặc biệt, quyết định giảm tải nhị phân được coi là một đa lớp vấn đề phân loại với sự mất mát entropy chéo và phân bổ tài ngun tính tốn của máy chủ biên được xem xét như một vấn đề hồi quy với lỗi bình phương trung bình (MSE) thua. Trong quá trình đào tạo MTL, trình tối ưu hóa Adam được sử dụng để giảm thiểu tổn thất tổng có trọng số, trong đó χ c và χ l biểu thị trọng lượng của chúng, tương ứng. Cần lưu ý rằng kích thước của mơ hình MTL được đào tạo thích hợp nhỏ hơn 2 KB, và do đó máy chủ biên có đủ khơng gian lưu trữ để tiết kiệm mơ hình MTL được đào tạo, thậm chí có thể được lưu vào bộ nhớ đệm trước bộ nhớ của máy chủ biên để thực hiện suy luận hiệu quả hơn. Với mơ hình MTL được đào tạo ngoại tuyến.