11 Phương pháp suy luận xác suất để nâng cao độ tin cậy cho bài toán định vị

Một phần của tài liệu Nghiên cứu hệ thống xây dựng bản đồ, lập quỹ đạo và điều khiển bám quỹ đạo cho robot tự hành bốn bánh đa hướng (Trang 54)

cảm biến thu về trong quá trình di chuyển cũng được sử dụng để phát hiện những vật cản động, vật cản bất ngờ xuất hiện Trong phần này, luận án trình bày về việc thiết kế một hệ thống nhận thức cho FWOMR dựa trên kỹ thuật SLAM và nền tảng ROS

2 1 1 Phương pháp suy luận xác suất để nâng cao độ tin cậy cho bài toán địnhvị robot vị robot

Phương pháp suy luận xác xuất Bayesian [35], [69] là một thuật toán tổng hợp dữ liệu thống kê dựa trên định lý Bayes [13] với xác suất có điều kiện hay xác suất hậu nghiệm để ước tính Véc tơ trạng thái n-chiều ' X ' , sau khi đã được quan sát hoặc đo được hàm ' Z ' Thông tin ngẫu nhiên chứa trong Z và X được mô tả bởi một hàm mật độ xác suất P(Z / X) , được gọi là hàm khả năng, hoặc mơ hình cảm biến, đó là hàm mục tiêu phụ thuộc vào quan sát Hàm khả năng liên quan đến mức độ mà xác suất hậu nghiệm bị thay đổi và được đánh giá thơng qua các thí nghiệm độc lập hoặc bằng cách sử dụng các thông tin sẵn có về vấn đề này Nếu thơng tin trạng thái X được thực hiện độc lập trước khi quan sát, sau đó hàm khả năng có thể được cải thiện

để đưa ra kết quả chính xác hơn Như một thơng tin tiên nghiệm về X có thể được đóng gói như xác suất tiên nghiệm P(X = x) và được coi như là chủ quan bởi vì nó khơng dựa trên dữ liệu quan sát được Định lý Bayes đưa ra một phân bố có điều kiện hậu nghiệm là X x , với giá trị đo được Z z

P(X xΖ z) P(Ζ zX x)P(X = x)

P(Ζ zX x)P(X = x)dx= P

( Ζ   z X   x) P ( X = x)

P(Ζ = z) (2 1)

Do mẫu số chỉ phụ thuộc vào giá trị đo (tổng được thực hiện trên tất cả các giá trị có thể của trạng thái), một cách tiếp cận trực quan để ước tính có thể được thực hiện bằng cách lấy cực đại phân bố hậu nghiệm, ví dụ, bằng cách lấy cực đại số phân tử của phương trình (2 1) Phương pháp này gọi là ước tính tối đa một hậu nghiệm MAP (Maximum a posteriori) và được tính bởi:

x MAP arg max P(Ζ z1, Ζ z2X x)

x (2 2)

Một phương pháp khác được gọi là hàm ước lượng sai số trung bình bình phương tối thiểu MMSE (Minimum Mean Square Error), nghĩa là giảm thiểu khoảng cách Euclide giữa trạng thái thật và ước tính sau khi quan sát đã được thực hiện Thực tế, để hợp nhất các giá trị đó từ hai cảm biến, phương trình (2 1) có thể viết lại:

P(X xΖ z1,z 2 )P ( Ζ   z   X  x) P ( Ζ   z X 2   x) P ( X   x)

P(Ζ z1,z 2 ) (2 3)

Phương pháp phối hợp cảm biến sử dụng kỹ thuật xác suất Bayes được mơ tả như trong Hình 2 1

Sen sơ 1: Hiệu chỉnh/

Ước tính P(Z=z1 X=x) Sen sơ 2: Hiệu chỉnh/

Ước tính

Sen sơ n: Hiệu chỉnh/ Ước tính P(Z=z2 X=x) P(Z=zn X=x) Lý thuyết Bayes P(X=x Z=z1,z2, zn ) Mạch logic chọn: - MAP - MMSE

Hình 2 1 Phương pháp phối hợp đa cảm biến sử dụng kỹ thuật Bayesian

2 1 2 Phương pháp sử dụng bộ lọc Kalman cho bài toán định vị robot

Bộ lọc Kalman (Kalman Filter) rời rạc sử dụng mơ hình tốn học cho lọc các tín hiệu bằng cách sử dụng các phép đo với một số lượng đáng kể các sai số thống kê và có hệ thống được phát triển bởi Kalman và Bucy vào năm 1960 [47] Thông thường, một bộ lọc Kalman tổng hợp dữ liệu đo được trong một khoảng thời gian liên tiếp, cung cấp một ước tính khả năng xảy ra lớn nhất của một tham số Nó cũng có thể liên kết với các đầu vào của đa cảm biến thành một véc tơ của các trạng thái bên trong có chứa các tham số quan tâm, miễn là chúng chỉ phụ thuộc tuyến tính giữa các đầu vào và các trạng thái của hệ thống [91] Bộ lọc sử dụng thuật toán thời gian rời rạc để loại bỏ nhiễu từ các tín hiệu của cảm biến để tạo ra được dữ liệu tổng hợp, ví dụ ước tính các giá trị làm trơn của vị trí, vận tốc, và gia tốc tại một dãy các điểm trong quỹ đạo Mơ hình bộ lọc Kalman chuẩn được suy ra từ 2 phương trình tuyến tính Phương trình thứ nhất mơ tả động học của hệ thống:

xk Axk1 Buk1 wk1 (2 4) Trong đó:

xk là véc tơ trạng thái của hệ thống tại thời điểm k

A là ma trận trạng thái không suy biến

Véc tơ uk1 miêu tả đầu vào hệ thống tại thời điểm k - 1

Mối quan hệ véc tơ đầu vào uk1 và véc tơ trạng thái xk được xác định bằng ma

trận B , w k1 là một biến ngẫu nhiên biểu diễn cho nhiễu hệ thống Phương trình tuyến tính thứ 2 mơ tả quan sát nhiễu của hệ thống, với phép đo zm :

z k Hxk vk (2 5)

Trong mỗi phần tử của vec-tơ z k chứa một quan sát cảm biến tại thời điểm k Ma trận H liên quan tới các phép đo trạng thái bên trong, v k biểu diễn nhiễu đo

Các biến ngẫu nhiên wk và v k được giả định là nhiễu quá trình và nhiễu đo; độc lập với nhau, ồn trắng và có phân bố xác suất chuẩn:

w k N 0, Qk ; v k N 0, R k ; E(w i v jT ) 0

Qk là các ma trận hiệp phương sai nhiễu đầu vào; Rk là ma trận hiệp phương sai của nhiễu đo Bài tốn bộ lọc Kalman chính là tìm giá trị ước lượng của trạng thái

x khi biết được sự biến thiên của nó mà ta đo được một đại lượng z phụ thuộc tuyến tính vào x Nói cách khác, dựa trên các số liệu đo z , có thể tìm được một hệ số Kalman K trong mỗi chu kỳ lấy mẫu tín hiệu đo thuộc một vòng lặp đệ quy gọi là bộ lọc Kalman, sao cho giá trị ước lượng trạng thái của hệ gần với giá trị thực nhất Như vậy, quá trình thực hiện của bộ lọc Kalman là một vòng lặp đệ quy gồm 2 giai đoạn là pha dự đốn (với các phương trình cập nhật thời gian) và pha hiệu chỉnh (với các phương trình cập nhật số liệu) Hệ số Kalman Kk sẽ được tính tốn, sau đó véc

tơ trạng thái và ma trận lỗi tương quan Pk sẽ được cập nhật từ các đánh giá bước

trước xˆk và Pk Để khởi động bộ lọc Kalman, người ta phải cung cấp một ước tính

tiên nghiệm xˆ 0 và một ước tính hiệp phương sai lỗi của nó P0 P0 có thể được khởi

tạo với một ước tính giá trị ban đầu khơng chính xác, khi đó ứng dụng tiếp theo của bộ lọc Kalman sẽ cho Pk tiếp cận gần với giá trị chính xác của nó

Bước dự đốn Bước hiệu chỉnh

Hình 2 2 Sơ đồ thuật tốn bộ lọc Kalman chuẩn rời rạc

Hình 2 2 trình bày sơ đồ thuật tốn lọc Kalman Trong pha dự đoán, các cập nhật thời gian cho ước lượng trạng thái tiên nghiệm và hiệp phương sai sai số tiên nghiệm được tiến hành

Pk APAT Q (2 7) Trong pha hiệu chỉnh, hệ số Kalman sẽ được tính và ước lượng trạng thái hậu

nghiệm được cập nhật trên cơ sở phép đo z :

 xk x Kk (z k H x ) P (I K k H )P (2 8) (2 9) (2 10) Nếu giá trị của Q được chọn là lớn hơn chính giá trị thật của nó, bộ lọc Kalman

sẽ đặt độ tin cậy vào các giá trị đo lường hơn là hệ thống Khi đó, các kết quả đánh giá sẽ phụ thuộc sai số của phép đo Nếu giá trị Q chọn nhỏ hơn chính nó, độ trễ thời gian sẽ được tăng lên Khi Q nhỏ hơn rất nhiều so với giá trị thật, bộ lọc sẽ phân kỳ dẫn đến kết quả là không ổn định về mặt tính tốn, như vậy việc chọn giá trị Q thông thường dựa trên thực nghiệm

Đối với robot di động, việc sử dụng bộ lọc Kalman để hiệu chỉnh định vị dựa trên hai hoặc nhiều dữ liệu đầu vào khác nhau [18], [34] và [91] Bộ lọc Kalman giải quyết các vấn đề phổ biến của ước tính trạng thái xm mà quá trình điều khiển

thời gian rời rạc phụ thuộc vào phương trình sai phân ngẫu nhiên tuyến tính Nhưng khi ước tính hoặc mối quan hệ giữa các phép đo quá trình điều khiển là phi tuyến thì việc giải quyết bài tốn này là một bộ lọc Kalman được tuyến tính hóa hoặc bộ lọc Kalman mở rộng EKF (Extended Kalman Filter) Bằng việc khai triển chuỗi Taylor các hàm hệ thống và hàm đo phi tuyến, có thể tuyến tính hóa q trình dự đốn xung quanh dự đoán hiện tại sử dụng một phần dẫn xuất của q trình và chức năng đo lường để đưa vào tính tốn dự đốn Để thực hiện, ta bắt đầu hiệu chỉnh từ bộ lọc Kalman rời rạc Hãy giả định rằng phương trình trạng thái của hệ thống (2 4) của ước tính trạng thái zm , nhưng q trình điều khiển thời gian rời rạc phụ thuộc vào phương trình sai phân ngẫu nhiên phi tuyến tính:

Với biến quan sát zm :

xk f (xk1, uk1, wk1) (2 11)

Kk k k H P H T (HP T R)1 ˆ ˆ k ˆ k

z k h(xk , vk ) (2 12) Các biến ngẫu nhiên wk và v k cũng được giả định là nhiễu quá trình và nhiễu

đo như (2 4) và (2 5), trong trường hợp này hàm phi tuyến f ở phương trình (2 11) liên quan đến trạng thái ở bước thời gian hiện tại k đến trạng thái ở bước thời gian trước đó k Nó cịn bao gồm các tham số đầu vào uk và nhiễu quá trình wk Hàm phi tuyến h của phép đo trong phương trình (2 12) biểu diễn mối liên quan giữa trạng thái xk với phép đo z k Tương tự như bộ lọc Kalman chuẩn rời rạc, quá trình thực

hiện của bộ lọc Kalman mở rộng cũng là một vòng lặp đệ quy với hai giai đoạn là bước dự đốn (với các phương trình cập nhật thời gian) và bước hiệu chỉnh (với các phương trình cập nhật số liệu) như trên Hình 2 3

Bước dự đốn Bước hiệu chỉnh

Hình 2 3 Sơ đồ thuật tốn bộ lọc Kalman mở rộng Bước dự đốn với các phương trình cập nhật:

xˆk f (xˆ k1, uk1,0)

Pk APk1 AT WkQk1WkT

Bước hiệu chỉnh với các phương trình cập nhật:

 xk x Kk (z k h(x ,0)) P (I K k H )P Trong đó: (2 13) (2 14) (2 15) (2 16) (2 17) Kk k k k k k k k kT P H T (H P H T )1 V R V ˆ ˆ k ˆ k k k

xkn là ước lượng trạng thái tiên nghiệm ở bước k nhận được từ tiên nghiệm quá

trình ở bước k

xkn là ước lượng trạng thái hậu nghiệm ở bước k - 1 nhận được sau phép đo z k

Pk là ma trận hiệp biến của sai số ước lượng trạng thái tiên nghiệm

Pk là ma trận hiệp biến của sai số ước lượng trạng thái hậu nghiệm

Qk1 là ma trận hiệp phương sai nhiễu đầu vào

Rk là ma trận hiệp phương sai của nhiễu đo

Kk là hệ số lọc Kalman

I là ma trận đơn vị

Các biến ngẫu nhiên w k và v k được giả định là nhiễu quá trình và nhiễu đo

như (2 13) và (2 14)

A là ma trận Jacobian của các đạo hàm riêng của f theo x :

Aij fi x j

(xˆ k1, uk1,0)

W là ma trận Jacobian của các đạo hàm riêng của f theo w : Wij fi

w j

(xˆ k1, uk1,0)

H là ma trận Jacobian của các đạo hàm riêng của h theo x :

H ij hi

x j (xˆ k ,0)

V là ma trận Jacobian của các đạo hàm riêng của h theo v :

Vij hi v j

(xˆ k ,0)

Qua những phân tích ở trên chúng ta thấy rằng khi sử dụng bộ lọc Kalman rời rạc cho phép đạt được nhiều kết quả mong muốn [90] Tuy nhiên, mơ hình

tuyến tính của hệ thống khơng phải lúc nào cũng khả thi Vì vậy EKF đã được dẫn xuất từ các phương trình ngẫu nhiên phi tuyến cho mơ hình hệ thống [42] Việc ứng

dụng EKF cho robot di động rất đa dạng, ví dụ như định vị cho robot di động có các bánh xe được điều khiển vi sai [38], hay ứng dụng EKF cho tổng hợp đa cảm biến để nâng cao khả năng ước lượng trạng thái của robot di động [44], [92] Hơn nữa, trong một môi trường đa cảm biến với các ma trận đo lường giống hệt nhau, các phép đo có thể được xử lý một cách riêng biệt để có được độ phức tạp tính tốn thấp hơn Trong trường hợp các ma trận đo khơng giống nhau là thích hợp sử dụng hợp nhất véc tơ đầu vào chứa các thông tin của tất cả các cảm biến Thêm một lý do quan trọng khi tổng hợp đa cảm biến có nhiều loại khác nhau, do thời gian xử lý, thời gian cập nhật trên mỗi cảm biến khác nhau, nhưng vẫn có thể mơ hình hóa được với các dạng thơng tin của EKF và do đó có thể tổng hợp được nhiều cảm biến khác nhau, tăng số chiều dữ liệu [40]

SLAM được định nghĩa là một q trình mà ở đó robot có thể xây dựng bản đồ của môi trường, đồng thời sử dụng bản đồ đó để ước tính vị trí của robot trong mơi trường đó Thuật tốn SLAM là cơng trình được nghiên cứu bởi các tác giả Smith, Self và Cheeseman [86], sau đó nó được phát triển bởi Hugh Durrant-Whyte và cộng sự [25], [53] Thuật toán SLAM đề xuất vấn đề xây dựng bản đồ của môi trường không xác định cho robot di động đồng thời điều hướng môi trường bằng bản đồ [95]

Như trên Hình 2 4, thuật tốn SLAM được định nghĩa là việc ước tính vị trí vật cản mơi trường và vị trí của robot trong mơi trường đó

Ở dạng xác suất, SLAM được biểu diễn dưới dạng phân bố xác suất sau:

P(xk , m | z0:k , u0:k ) (2 18)

Với u0:k =u0 , u1, , u k =u0:k-1, u k : tập chứa các giá trị đầu vào điều khiển từ thời điểm ban đầu đến thời điểm k , m =m1, m2 , , mn : tập các điểm mốc thể hiện vị trí vật cản z 0:kz0 ,z1, , zkz 0:k1, zk : tập các điểm mốc quan sát được từ thời điểm ban đầu đến thời điểm k [68] Phân bố xác suất này mơ tả phân bố hậu nghiệm liên kết giữa vị trí điểm mốc trong bản đồ m với trạng thái của robot xk tại

Hình 2 4 Kỹ thuật SLAM

Việc tính tốn giá trị phân bố xác xuất này u cầu mơ hình chuyển trạng thái và mơ hình quan sát để mơ tả việc tác động của tín hiệu điều khiển và các giá trị quan sát được Mơ hình quan sát mơ tả xác suất thực hiện được giá trị quan sát z k khi vị trí robot và vị trí điểm mốc trên bản đồ được xác định có dạng:

P(z k | xk , m) (2 19)

Với giả thiết rằng khi vị trí của robot và bản đồ được xác định thì các giá trị quan sát được là độc lập có điều kiện, khi đó mơ hình chuyển động của robot được mô tả bởi phân bố xác suất chuyển trạng thái sau:

P(xk | xk -1, uk ) (2 20)

Phân bố này được giả sử thoả mãn tiêu chuẩn Markov, ở đó trạng thái xk chỉ phụ thuộc vào trạng thái ngay trước nó xk-1 và tín hiệu điều khiển uk , và xk độc lập với các giá trị quan sát được và bản đồ m

Thuật toán SLAM được thực thi với hai bước là bước dự đoán (prediction) và bước chỉnh sửa (correction)

· Bước dự đốn được mơ tả bởi phân bố:

P(xk , m | z0:k-1, u0:k )

Do trạng thái của robot xk , xk-1 và bản đồ m là độc lập, có thể viết lại:

P(xk , m | z 0:k1, u0:k , x0 ) P(xk | z 0:k1, u0:k ) P(m | z 0:k1, u0:k ) , u , x | z , u , u )dx , u , x , m | z , u ) dx (2 21) (2 22)  P(xk | z 0:k1 0:k k1) P(xk1 0:k1 0:k ) P(m | z 0:k1 0:k k1  P(xk | z 0:k1 0:k k1) P(xk1 0:k1 0:k k1

Vì xk có tính chất Markov nên (2 22) được viết gọn thành:

P(xk , m | z 0:k1, u0:k , x0 ) P(xk | xk-1, uk ) P(xk-1, m | z0:k-1, u0:k-1 ) dxk-1 (2 23) Sau khi tính tốn bước dự đốn, bước chỉnh sửa được thực hiện theo phân bố:

P(xk , m | z 0:k1, u0:k , x0 )P ( z k | x k , m ) P (x k , m | z 0:k -1 , u 0:k )

P(z k | z0:k -1 , u0:k ) (2 24)

Biểu thức (2 23) và (2 24) mơ tả q trình tính tốn đệ quy cho việc tính tốn xác suất hậu nghiệm cho trạng thái robot xk và bản đồ m tại thời điểm k dựa vào

tập quan sát z0:k và tập tín hiệu điều khiển đầu vào u0:k

Có thể thấy trong Hình 2 4, hầu hết những sai lệch xảy ra giữa vị trí ước tính và vị trí thật của các điểm mốc (vật cản) là bởi sai lệch về vị trí của robot khi thu được các tín hiệu quan sát vật cản Điều này có nghĩa là các giá trị sai lệch trong việc dự đốn vị trí của các điểm mốc có tính tương quan cao Thực tế, điều này có nghĩa là khoảng cách giữa các điểm mốc mi m j có khả năng biết được chính xác, ngay cả

khi vị trí thực tế của điểm mốc là một giá trị chưa biết trước Trong dạng xác suất, điều này có nghĩa là mật độ xác suất chung cho mỗi cập điểm mốc P(mi ,m j ) là gần

Một phần của tài liệu Nghiên cứu hệ thống xây dựng bản đồ, lập quỹ đạo và điều khiển bám quỹ đạo cho robot tự hành bốn bánh đa hướng (Trang 54)

Tải bản đầy đủ (DOCX)

(169 trang)
w