LÝ THUYẾT VỀ ƯỚC LƯƠNG

Một phần của tài liệu TÌM HIỂU bộ lọc KALMAN ỨNG DỤNG lọc NHIỄU TRONG cảm BIẾN (Trang 35)

2

3.2. LÝ THUYẾT VỀ ƯỚC LƯƠNG

3.2.1.

3.2.1. KHÁI NIỆM :KHÁI NIỆM :

Trong thống kê, một ước lượng là một giá trị được tính toán từ một mẫu thử (échantillon) và người ta hy vọng đó là giá trị tiêu biểu cho giá trị cần xác định trong dân số (population). Người ta luôn tìm một ước lượng sao cho đó là ước lượng "không chệch" (unbiased), hội tụ (converge), hiệu quả (efficient) và vững (robust).

3.2.2.3.2.2. ĐÁNH GIÁ CHẤT LƯỢNGĐÁNH GIÁ CHẤT LƯỢNG

Một ước lượng là một giá trị x (x nhỏ) được tính toán trên một mẫu được lấy một cách ngẫu nhiên, do đó giá trị của x là một biến ngẫu nhiên với kì vọng E(x) và phương sai V(x). Nghĩa là giá trị x có thể dao động tùy theo mẫu thử, nó có ít cơ hội để có thể bằng đúng chính xác giá trị X (X lớn) mà nó đang ước lượng. Mục đích ở đây là ta muốn có thể kiểm soát sự sai lệch giá trị x và giá trị X.

Một biến ngẫu nhiên luôn dao động xung quanh giá trị kì vọng của nó. Ta muốn là kì vọng của x phải bằng X. Khi đó ta nói ước lượng là không chệch (unbiased). Trung bình tích lũy trong ví dụ về chiều cao trung bình của trẻ 10 tuổi một ước lượng đúng, trong khi ước lượng về tổng số

cá trong hồ được tính như trong ví dụ là một ước lượng không đúng, đó là ước lượng thừa: trung bình tổng số cá ước lượng được luôn lớn hơn tổng số cá có thực trong hồ.

Ta cũng muốn là khi mẫu thử càng rộng, thì sai lệch giữa xX càng nhỏ. Khi đó ta nói ước lượng là hội tụ. Định nghĩa theo ngôn ngữ toán học là như sau:

(xn) hội tụ nếu với mọi số thực dương. (xác suất để sai lệch với

giá trị thực cần ước lượng lớn hơn tiến về 0 khi kích cỡ của mẫu thử càng lớn)

Biến ngẫu nhiên dao động quanh giá trị kì vọng của nó. Nếu phương sai V(x) càng bé, thì sự dao động càng yếu. Vì vậy ta muốn phương sai của ước lượng là nhỏ nhất có thể. Khi đó ta nói ước lượng là hiệu quả (eficient).

Cuối cùng, trong quá trình điều tra, có thể xuất hiện một giá trị "bất thường" (ví dụ có trẻ 10 tuổi nhưng cao 1,80 m). Ta muốn giá trị bất thường này không ảnh hưởng quá nhiều đến giá trị ước lượng. Khi đó ta nói ước lượng là vững (robust). Có thể thấy trung bình tích lũy trong ví dụ về chiều cao trung bình trẻ 10 tuổi không phải là một ước lượng vững.

3.2.3.

3.2.3. PHƯƠNG SAI.PHƯƠNG SAI.

Trong lý thuyết xác và thống kê phương sai của một biến ngẫu nhiên là một độ đo sự phân tán thống kê của biến đó, nó hàm ý các giá trị của biến đó thường ở cách giá trị kỳ vọng bao xa.

Phương sai của biến ngẫu nhiên giá trị thực là moment trung tâm, nó còn là nửa bất biến (cumulant) thứ hai của nó. Phương sai của một biến ngẫu nhiên là bình phương của độ lệch chuẩn.

Nếu là giá trị kỳ vọng của biến ngẫu nhiên X, thì phương sai là (3.1)

Nghĩa là, phương sai là giá trị kỳ vọng của bình phương của độ lệch của X so với giá trị trung bình của nó. Nói nôm na, phương sai là "trung bình của bình phương khoảng cách của mỗi điểm dữ liệu tới trung bình". Do đó, nó là giá trị trung bình của bình phương độ lệch. Phương sai

Đồ Án Tốt Nghiệp Trang 34

của biến ngẫu nhiên X thường được ký hiệu là , , hoặc đơn giản là .định nghĩa trên áp dụng cho cả các biến ngẫu nhiên rời rạc và liên tục.

Nhiều phân phối, ví dụ như phân phối Cauchy, là không có phương sai, do tích phân có được từ định nghĩa phương sai là phân kỳ. Một phân phối không tồn tại giá trị kỳ vọng thì cũng không tồn tại phương sai. Nhưng điều ngược lại thì không đúng: có những phân phối mà giá trị kì vọng tồn tại nhưng không tồn tại phương sai.

Nếu phương sai tồn tại, thì nó không bao giờ âm, vì bình phương một số luôn dương hoặc bằng 0. Đơn vị của phương sai là bình phương đơn vị của giá trị quan sát được của biến ngẫu nhiên. Ví dụ, phương sai của tập hợp các chiều cao đo được tính theo centimet (cm) có đơn vị là cm bình phương. Đơn vị này gây bất tiện nên các nhà thống kê thường sử dụng căn bậc hai của phương sai, gọi là độ lệch chuẩn, coi như là tổng của các phân tán.

Nếu ab là các hằng số thực, X là một biến ngẫu nhiên, thì cũng là biến ngẫu nhiên với phương sai là:

(3.2)

Khi tính phương sai, để thuận tiện ta thường dùng công thức:

(3.3) (3.4)

Với là hiệp phương sai, bằng 0 nếu X và Y là 2 biến ngẫu nhiên độc lập lẫn nhau. Phương pháp Delta sử dụng khai triển Taylor bậc hai để xấp xỉ phương sai của hàm số của một hay nhiều biến ngẫu nhiên. Ví dụ, phương sai của hàm số theo một biến ngẫu nhiên được xấp xỉ bởi:

(3.5)

với giả thiết khả vi bậc hai, trung bình và phương sai của là hữu hạn (tức tồn tại). Trên nhiều tình huống thực tế, giá trị chính xác của phương sai của một tổng thể, kí hiệu bởi là không thể xác định trước được.

Phương pháp chung để ước lượng phương sai của một tổng thể (hữu hạn hoặc vô hạn) là ta sẽ lấy một mẫu hữu hạn các cá thể từ quần thể. Giả sử rằng mẫu thu được có các giá trị đo được

là .

Phương sai của mẫu (gọi tắt là phương sai mẫu) , được tính bởi: Chương 3: Bộ Lọc Kalman

(3.6) trong đó là số bình quân số học của mẫu.

Tuy nhiên, là một ước lượng chệch (biased) của phương sai quần thể. Ước lượng sau là một ước lượng không chệch (unbiased) của phương sai quần thể:

(3.7)

3.2.4.

3.2.4. ƯỚC LƯỢNG CỦA TRUNG BÌNH VÀ PHƯƠNG SAI.ƯỚC LƯỢNG CỦA TRUNG BÌNH VÀ PHƯƠNG SAI.

Ta chọn ngẫu nhiên n cá thể trong một dân số gồm N cá thể. Ta quan tâm đến đặc trưng định lượng Y của dân số với trung bình và phương sai V(Y). Trong mẫu đó, đặc trưng Y có

trung bình và phương sai đo được lần lượt là và . (3.8) Lưu ý là các giá trị và σ2 thay đổi tùy theo mẫu thử, do đó chúng là các biến ngẫu nhiên với trung bình và phương sai riêng khác nhau.

Ước lượng trung bình của Y:

Thông thường trung bình của Y, tức là được ước lượng bởi: . (3.9)còn được gọi là trung bình tích lũy (hay trung bình cộng). Ta chứng minh được đây là ước lượng đúng(unbiased), nghĩa là

Ước lượng phương sai của Y:

σ2 là một ước lượng của V(Y), nhưng là ước lượng không đúng, ta chứng minh được kì vọng của σ2 luôn nhỏ hơn V(Y), tức ước lượng là thiếu.

Các ước lượng đúng của V(Y) là:

(3.10) trong trường hợp lấy mẫu có hoàn lại

Đồ Án Tốt Nghiệp Trang 36

(3.11) trong trường hợp lấy mẫu không hoàn lại.

Trong trường hợp mẫu lớn, phép tính có hoàn lại và phép tính không hoàn lại là như nhau,

vì xấp xỉ bằng 1. Vì vậy trong trường hợp tổng quát ước lượng đúng của V(Y)

là: (3.12) được gọi là phương sai tích lũy của Y. Xem thêm chứng minh trong bài Phương sai

Tính hiệu quả và tính hội tụ

Mức độ dao động của quanh kì vọng của nó phụ thuộc vào phương sai của nó, ký hiệu bởi . Phương sai này được tính theo V(Y).

(3.13)trong trường hợp lấy mẫu có hoàn lại

(3.14) trong trường hợp lấy mẫu không hoàn lại.

Ta nhận thấy với N rất lớn hai giá trị trên gần như bằng nhau. Phần sau đây ta chỉ xét trường hợp lấy mẫu có hoàn lại, với giả thuyết N là rất lớn.

Rõ ràng n càng lớn, càng nhỏ. Do đó, mẫu càng lớn, ước lượng càng hiệu quả. Bất đẳng thức Bienaymé-Tchebychev chỉ ra rằng, với mọi số thực dương ,

(3.15)nên nên

(3.16)

Vì hội tụ về 0 khi n tiến về vô cực, nên ta cũng có điều tương tự với . (3.17) Ước lượng là hội tụ.

Phân chia dân số thành các lớp đồng nhất để làm mẫu điều tra có thể làm giảm đáng kể giá trị phương sai của ước lượng, do đó ước lượng sẽ càng hiệu quả.

Lấy mẫu một cách ngẫu nhiên với xác suất không đồng đều, dẫn đến điều tra nhiều lần hoặc co cụm, sẽ làm thay đổi các công thức được tính trên.

Cuối cùng, việc dùng thêm các thông tin phụ hợp lý cho phép chỉnh sửa các ước lượng để có được các kết quả gần với giá trị thật cần ước lượng hơn.

Khả năng ước lượng kì vọng và phương sai cho phép ước lượng các tham số của một phân phối xác suất (phân phối bình thường, phân phối Poisson vv...).Trong xác suất, ta thường xác định một phân phối xác suất lý thuyết dựa vào các thực nghiệm thống kê. Trong trường hợp biến ngẫu nhiên rời rạc hữu hạn, ta dùng ước lượng cho mỗi xác suất pk, tần suất fk tính từ mẫu thử. Các giá

trị của fk là các biến ngẫu nhiên, dĩ nhiên các ước lượng này không thể bằng chính xác các giá

trị pk. Để làm rõ sự sai khác giữa chúng có đáng kể hay không, ta thực hiện các kiểm định giả

thuyết thống kê, trong đó phổ biến nhất là kiểm định χ² (Chi bình phương).

3.2.5.

3.2.5. HƯƠNG PHÁP BÌNH PHƯƠNG BÉ NHẤTHƯƠNG PHÁP BÌNH PHƯƠNG BÉ NHẤT

Trong toán học, phương pháp bình phương tối thiểu, còn gọi là bình phương nhỏ nhất hay bình phương trung bình tối thiểu, là một phương pháp tối ưu hóa để lựa chọn một đường khớp nhất cho một dải dữ liệu ứng với cực trị của tổng các sai số thống kê (error) giữa đường khớp và dữ liệu.

Phương pháp này giả định các sai số (error) của phép đo đạc dữ liệu phân phối ngẫu nhiên. Định lý Gauss-Markov chứng minh rằng kết quả thu được từ phương pháp bình phương tối thiểu không thiên vị và sai số của việc đo đạc dữ liệu không nhất thiết phải tuân theo, ví dụ, phân bố Gauss. Một phương pháp mở rộng từ phương pháp này là bình phương tối thiểu có trọng số.

Phương pháp bình phương tối thiểu thường được dùng trong khớp đường cong. Nhiều bài toán tối ưu hóa cũng được quy về việc tìm cực trị của dạng bình phương, ví dụ như tìm cực tiểu của năng lượng hay cực đại của entropy.

Giả sử dữ liệu gồm các điểm (xi, yi) với i = 1, 2, ..., n. Chúng ta cần tìm một hàm số f thỏa mãn

Đồ Án Tốt Nghiệp Trang 38

f(xi) ≈ yi (3.18)

Giả sử hàm f có thể thay đổi hình dạng, phụ thuộc vào một số tham số, pj với j 1, 2, ..., m.

f(x) = f(pj, x) (3.19)

Nội dung của phương pháp là tìm giá trị của các tham số pj sao cho biểu thức sau đạt cực

tiểu:

(3.20)

Nội dung này giải thích tại sao tên của phương pháp là bình phương tối thiểu.

Đôi khi thay vì tìm giá trị nhỏ nhất của tổng bình phương, người ta có thể tìm giá trị nhỏ nhất của bình phương trung bình:

(3.21) Điều này dẫn đến tên gọi bình phương trung bình tối thiểu. Trong hồi quy tuyến tính, người ta thay biểu thức

f(xi) ≈ yi (3.22)

bằng

f(xi) = yi + εi (3.23)

với hệ số nhiễu ε là biến ngẫu nhiên có giá trị kỳ vọng bằng 0.

Trong biểu thức của hồi quy tuyến tính x được đo chính xác, chỉ có y chịu nhiễu loạn ε. Thêm nữa, hàm f tuyến tính với các tham số pj.

Nếu f không tuyến tính với các tham số, ta có hồi quy phi tuyến, một bài toán phức tạp hơn nhiều hồi quy tuyến tính.

3.3. LỌC THICH NGHI-BỘ LỌC KALMAN3.3.1. LÝ THUYẾT BỘ LỌC KALMAN 3.3.1. LÝ THUYẾT BỘ LỌC KALMAN

Được đề xuất từ năm 1960 bởi giáo sư Kalman để thu thập và kết hợp linh động

các thông tin từ cảm biến thành phần. Một khi phương trình định hướng và mẫu thống kê nhiễu trên mỗi cảm biến được biết và xác định, bộ lọc Kalman sẽ cho ước lượng giá trị tối ưu (chính xác do đã được loại sai số, nhiễu) như là đang sử dụng một tín hiệu 'tinh khiết' và có độ phân bổ không đổi. Trong hệ thống này, tín hiệu cảm biến vào bộ lọc gồm hai tín hiệu: từ cảm biến góc (inclinometer) và cảm biến vận tốc góc (gyro). Tín hiệu ngõ ra của bộ lọc là tín hiệu của inclinometer và gyro đã được loại nhiễu nhờ hai nguồn tín hiệu hỗ trợ và xử lý lẫn nhau trong bộ lọc, thông qua

quan hệ (vận tốc góc = đạo hàm/vi phân của giá trị góc

Bô lọc Kalman đơn giản là thuật toán xử lý dữ liệu hồi quy tối ưu. Có nhiều cách xác định tối ưu, phụ thuộc tiêu chuẩn lựa chọn trình thông số đánh giá. Nó cho thấy rằng bộ lọc Kalman tối ưu đối với chi tiết cụ thể trong bất kỳ tiêu chuẩn có nghĩa nào. Một khía cạnh của sự tối ưu này là bộ lọc Kalman hợp nhất tất cả thông tin được cung cấp tới nó. Nó xử lý tất cả giá trị sẵn có, ngoại trừ độ sai số, ước lượng giá trị hiện thời của những giá trị quan tâm, với cách sử dụng hiểu biết động học thiết bị giá trị và hệ thống, mô tả số liệu thống kê của hệ thống nhiễu, gồm nhiễu ồn, nhiễu đo và sự không chắc chắn trong mô hình động học, và những thông tin bất kỳ về điều kiện ban đầu của giá trị quan tâm.

Hình3.1 :Tín hiệu thu chưa lọc

Đồ Án Tốt Nghiệp Trang 40

Hình 3.2: Tín hiệu thu đã lọc qua kalman

Bô lọc Kalman đơn giản là thuật toán xử lý dữ liệu hồi quy tối ưu. Có nhiều cách xác định tối ưu, phụ thuộc tiêu chuẩn lựa chọn trình thông số đánh giá. Nó cho thấy rằng bộ lọc Kalman tối ưu đối với chi tiết cụ thể trong bất kỳ tiêu chuẩn có nghĩa nào. Một khía cạnh của sự tối ưu này là bộ lọc Kalman hợp nhất tất cả thông tin được cung cấp tới nó. Nó xử lý tất cả giá trị sẵn có, ngoại trừ độ sai số, ước lượng giá trị hiện thời của những giá trị quan tâm, với cách sử dụng hiểu biết động học thiết bị giá trị và hệ thống, mô tả số liệu thống kê của hệ thống nhiễu, gồm nhiễu ồn, nhiễu đo và sự không chắc chắn trong mô hình động học, và những thông tin bất kỳ về điều kiện ban đầu của giá trị quan tâm.

Hình 3.3 Sơ đồ bộ lọc Kalman

Hình trên mô hình hóa hoạt động của mạch lọc Kalman. Chúng ta có tín hiệu đo được, chúng ta có mô hình của tín hiệu đo được (đòi hỏi tuyến tính) và sau đó là áp dụng vào trong hệ thống phương trình của mạch lọc để ước lượng trạng thái quan tâm. Thực ra tín hiệu đo là không khó, phương trình đã có sắn, cái chung ta cần chính là mô hình hoá hệ thống. Để có thể ứng dụng một cách hiểu quả mạch lọc Kalman thì chúng ta phải mô hình hóa được một cách tuyến tính sự thay đổi của trạng thái cần ước lượng (estimate) hoặc ước đoán (predict).

3.3.2.

3.3.2. QUY TRÌNH ƯỚC LƯỢNGQUY TRÌNH ƯỚC LƯỢNG

Kalman filter định vị vấn đề chung nhằm ước lượng giá trị xℜn của tiến trình kiểm soát thời gian gián đoạn biểu diễn bằng phương trình tuyến stochastic khác nhau:

(1) (3.23)

với giá trị zℜm :

(2) (3.24)

Trong đó w và v là 2 vector biến ngẫu nhiên đại diện cho nhiễu hệ thông và nhiễu đo đạc. 2 biến ngãy nhiên này độc lập và được giả sử là tuân theo phân bố Gauss với trung bình =0 và ma trận hiệp biến (covariance) lần lượt là Q và R

w ~N(0,Q) (3.25)

v ~N(0,R) (3.26)

Nếu vector trạng thái x có kích thước là n, thì ma trận A sẽ có kích thứoc là n x n. B (n x l) là ma trận phụ thuộc vào điều khiển tối ưu u với u là vector có kích thước là l. Vector đo đạc z có kích thước là m nên ma trận H sẽ là m x n. Chú ý rằng các ma trận Q,R, A, H có thể thay đổi theo thời gian (từng bước k), nhưng ở đây chùng được giả sử không đổi.

3.3.3. THUẬT TOÁN KALMAN GIÁN ĐOẠN3.3.3. THUẬT TOÁN KALMAN GIÁN ĐOẠN 3.3.3. THUẬT TOÁN KALMAN GIÁN ĐOẠN

Bộ lọc Kalman ước lượng tiến trình bằng việc sử dụng hình thức kiểm soát

Một phần của tài liệu TÌM HIỂU bộ lọc KALMAN ỨNG DỤNG lọc NHIỄU TRONG cảm BIẾN (Trang 35)

Tải bản đầy đủ (PDF)

(53 trang)