1. Trang chủ
  2. » Công Nghệ Thông Tin

Bài giảng Lý thuyết nhận dạng – Chương 3: Nhận dạng mẫu dựa trên thống kê

45 62 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Nhận Dạng Mẫu Dựa Trên Thống Kê
Tác giả TS Ngô Hữu Phúc
Trường học Học viện kỹ thuật quân sự
Chuyên ngành Khoa học máy tính
Định dạng
Số trang 45
Dung lượng 2,8 MB

Nội dung

Bài giảng Lý thuyết nhận dạng – Chương 3: Nhận dạng mẫu dựa trên thống kê với các nội dung bộ phân lớp cực tiểu khoảng cách; phân lớp theo khoảng cách Mahalanobis; ước lượng tham số hợp lý cực đại của phân bố Gaussia; mô hình hỗn hợp; giải thuật EM – cực đại hàm tin cậy; giải thuật EM – cực đại hàm tin cậy...

Trang 1

LÝ THUYẾT NHẬN DẠNG

Biên soạn: TS Ngô Hữu Phúc

Bộ môn: Khoa học máy tính Học viện kỹ thuật quân sự Email: ngohuuphuc76@gmail.com

Trang 2

3.4 B Ộ PHÂN LỚP CỰC TIỂU KHOẢNG CÁCH

3.4.1 Phân lớp theo khoảng cách Euclidean (1/2)

 Bộ phân lớp Bayesian tối ưu thỏa một số rằng buộc sau:

 Các lớp có xác suất như nhau

 Dữ liệu của tất cả các lớp theo phân bố chuẩn Gaussian

 Ma trận hiệp phương sai là giống nhau với tất cả các lớp

 Ma trận hiệp phương sai có dạng đường chéo và tất cả cácthành phần trên đường chéo giống nhau, dạng S = σ2I, với I là

ma trận đơn vị

Trang 3

3.4 B Ộ PHÂN LỚP CỰC TIỂU KHOẢNG CÁCH

3.4.1 Phân lớp theo khoảng cách Euclidean (2/2)

 Với các rằng buộc trên, bộ phân lớp Bayesian tối ưu tươngđương bộ phân lớp cực tiểu khoảng cách Euclidean

 Như vậy, cho vecto x chưa biết, x sẽ được gán vào lớp ωi nếu:

𝐱 − 𝐦𝐢 ≡ 𝐱 − 𝐦𝐢 𝐓 𝐱 − 𝐦𝐢 < 𝐱 − 𝐦𝐣 , ∀𝐢 ≠ 𝐣

Nhận xét:

 Bộ phân lớp Euclidean thường được sử dụng vì tính đơn giản của nó,

kể cả trong trường hợp các rằng buộc trên không thỏa mãn.

 Cách phân lớp này còn được gọi là phân lớp gần nhất theo tiêu chuẩn Euclidean.

Trang 4

3.4 B Ộ PHÂN LỚP CỰC TIỂU KHOẢNG CÁCH

3.4.2 Phân lớp theo khoảng cách Mahalanobis

 Trong bộ phân lớp Bayesian tối ưu, nếu bỏ yếu tố: ma trận hiệpphương sai có dạng đường chéo với các phần tử giống nhau,khi đó, bộ phân lớp này tương đương với phân lớp cực tiểu theokhoảng cách Mahalanobis

 Như vậy, với vecto x chưa biết, x được gán vào lớp ωi nếu:

𝐱 − 𝐦𝐢 𝐓𝐒−𝟏 𝐱 − 𝐦𝐢 < 𝐱 − 𝐦𝐣 𝐓𝐒−𝟏 𝐱 − 𝐦𝐣 , ∀𝐣 ≠ 𝐢

 Trong đó, S là ma trận hiệp phương sai

Trang 5

V Í DỤ MỤC 3.4-1

 Xem xét bài toán phân lớp (với 2 lớp) trên không gian 3 chiều

 Hai lớp lần lượt là ω1 và ω2 với:

 Sử dụng mô hình phân bố Gaussian.

 m1 = 0, 0, 0 T; m1 = 0.5, 0.5, 0.5 T.

 Cả hai lớp có xác suất như nhau.

 Ma trận hiệp phương sai là:

S = 0.010.8 0.01 0.010.2 0.01

0.01 0.01 0.2

 Với vecto x = 0.1, 0.5, 0.1 T , x được gán là nhãn gì theo 2khoảng cách Euclidean và Mahalanobis?

Trang 7

[num,z(i)]=min(dm);

end

Trang 9

3.4.3 ƯỚC LƯỢNG THAM SỐ HỢP LÝ CỰC ĐẠI CỦA PHÂN

BỐ GAUSSIAN

 Trong thực tế, vấn đề thường gặp: chưa biết hàm phân bố xácsuất của dữ liệu Do đó cần ước lượng thông qua dữ liệu huấnluyện

 Một cách tiếp cận đơn giản: giả thiết có dạng phân bố, sử dụng

dữ liệu huấn luyện để ước lượng tham số hợp lý cực đại

Trang 10

3.4.3 ƯỚC LƯỢNG THAM SỐ HỢP LÝ CỰC ĐẠI CỦA PHÂN

BỐ GAUSSIAN (CONT)

 Kỹ thuật ước lượng hợp lý cực đại (maximum likelihood - ML)được sử dụng rộng rãi để ước lượng các tham số chưa biết củaphân bố nào đó

 Tập trung vào phân bố Gaussian, giả sử có N điểm, xi ∈ Rl, i =1,2, … , N Các điểm này có phân bố chuẩn, sử dụng ước lượng

ML để tìm giá trị kỳ vọng và ma trận hiệp phương sai tươngứng

𝐱𝐢 − 𝐦𝐌𝐋 𝐱𝐢 − 𝐦𝐌𝐋 𝐓

Trang 12

V Í DỤ MỤC 3.4-2 ( CONT )

function

[m_hat,S_hat]=Gaussian_ML_estima

te(X)

% Ước lượng ML% distribution,

based on a data set X.

% Input:

% X: ma trận lxN matrix.

% Output

% m_hat: vecto có l thành phần,

ước lượng giá trị kỳ vọng.

% S_hat: ma trận lxl, ước lượng

hiệp phương sai

S_hat=S_hat+(X(:,k)-end

S_hat=(1/N)*S_hat;

Trang 17

randn( 'seed' ,0);

m1=[1, 1]'; m2=[3, 3]';

m=[m1 m2];

S(:,:,1)=[0.1 -0.08; -0.08 0.2];

Trang 18

V Í DỤ PHẦN 3.5 ( CONT )

% 3 Thay đổi ma trận hiệp

phương sai, xác suất P1 và P2.

figure(4);

Trang 19

% N: số điểm trong mô hình

% sed: giá trị khởi tạo cho hàm

Trang 20

V Í DỤ PHẦN 3.5 ( CONT )

 Hình 1

Trang 21

V Í DỤ PHẦN 3.5 ( CONT )

 Hình 2:

Trang 22

V Í DỤ PHẦN 3.5 ( CONT )

 Hình 3:

Trang 23

V Í DỤ PHẦN 3.5 ( CONT )

 Hình 4:

Trang 24

3.6 G IẢI THUẬT EM – CỰC ĐẠI HÀM TIN CẬY

 Để có được mô hình hỗn hợp cần có tham số của phân bố códạng: 𝐩(𝐱|𝐣; 𝛉).

 Ví dụ: có x ~ N(μ, σ) → θ = (μ, σ) T

Với trường hợp biết nhóm dữ liệu: có thể ước lượng θ và P j

bằng việc sử dụng ML

Với trường hợp chưa biết nhóm dữ liệu: có thể ước lượng θ

và P j bằng việc sử dụng giải thuật EM

Trang 25

3.6 GIẢI THUẬT EM – CỰC ĐẠI HÀM TIN CẬY (CONT)

 Ví dụ về vấn đề của bài toán

 Trong ví dụ trên:

 𝜇1, 𝜇2, 𝜎1, 𝜎2, 𝑃1, 𝑃2 được xác định như thế nào?

Trang 26

3.6 GIẢI THUẬT EM – CỰC ĐẠI HÀM TIN CẬY (CONT)

 Ý tưởng: sử dụng kỹ thuật ML cho dữ liệu không đầy đủ

 Gọi y là bộ dữ liệu đầy đủ, 𝐲 ∈ 𝐘 ⊂ 𝐑𝐦 , với hàm mật độ xácsuất 𝐩𝐲(𝐲; 𝛉), với 𝛉 là vector tham số chưa biết Tuy nhiên, y

không thấy trực tiếp

 Ta có thể quan sát được 𝐱 = 𝐠 𝐲 ∈ 𝐗 ⊂ 𝐑𝐦, với l < m, và cóhàm mật độ xác suất 𝐩𝐱(𝐱; 𝛉)

Ước lượng ML của θ thỏa mãn khi:

Trang 27

3.6 GIẢI THUẬT EM – CỰC ĐẠI HÀM TIN CẬY (CONT)

Các bước của giải thuật EM:

E-step : Tại lần lặp thứ (t + 1) tính giá trị kỳ vọng:

Trang 28

3.6 GIẢI THUẬT EM – CỰC ĐẠI HÀM TIN CẬY (CONT)

 Với ý tưởng trên, phần này mô tả giải thuật cho mô hình hỗnhợp Gaussian với ma trận hiệp phương sai dạng đường chéo

 Trong trường hợp này: xác suất tiền nghiệm 𝐏𝐣; giá trị kỳ vọng

𝛍j; phương sai 𝛔𝐣𝟐 chưa biết

 Cần ước lượng 𝛉 tại bước 𝐭 + 𝟏

Trang 29

3.6 GIẢI THUẬT EM – CỰC ĐẠI HÀM TIN CẬY (CONT)

E-step:

M-step:

Trang 30

3.6 GIẢI THUẬT EM – CỰC ĐẠI HÀM TIN CẬY (CONT)

 Sau khi hoàn thành các bước lặp, chỉ cần tính 𝐏(𝐣|𝐱𝐤; 𝛉 𝐭 )

Trang 31

V Í DỤ MỤC 3.6

 Chuẩn bị dữ liệu cho bài toán:

 Sinh bộ dữ liệu có N=500 dữ liệu 2D được theo hàm phân bố:

Trang 32

V Í DỤ MỤC 3.6 ( CONT )

 Trường hợp 1:

 J = 3

 m1,ini = 0,2 T; m2,ini = 5,2 T; m3,ini = 5,5 T

 S1,ini = 0.15I; S2,ini = 0.27I; S3,ini = 0.4I; P1,ini = P2,ini = P3,ini = 1

3

 Trường hợp 2:

 J = 3

 m1,ini = 1.6,1.4 T; m2,ini = 1.4,1.6 T; m3,ini = 1.3,1.5 T

 S1,ini = 0.2I; S2,ini = 0.4I; S3,ini = 0.3I; P1,ini = 0.2; P2,ini = 0.4; P3,ini = 0.4

Trang 33

V Í DỤ MỤC 3.6 ( CONT )

 Dữ liệu đầu vào:

Trang 34

V Í DỤ MỤC 3.6 ( CONT )

 Kết quả trường hợp 1:

Trang 35

V Í DỤ MỤC 3.6 ( CONT )

 Kết quả trường hợp 2:

Trang 36

V Í DỤ MỤC 3.6 ( CONT )

 Kết quả trường hợp 3:

Trang 37

3.7 C ỬA SỔ PARZEN

 Đối với bài toán ước lượng không tham số của một phân bốchưa biết dựa trên bộ dữ liệu đã cho có thể sử dụng phươngpháp cửa sổ Parzen để ước lượng phân bố

 Ý tưởng chung: Chia không gian nhiều chiều thành các hìnhkhối có kích thước h Qua đó, ước lượng các thành phần củaphân bố dựa trên số dữ liệu trong hình khối

Trang 38

3.7 C ỬA SỔ PARZEN ( CONT )

 Giả sử có N dữ liệu dạng 𝑥𝑖 ∈ 𝑅𝑙, 𝑖 = 1,2, … , 𝑁, xác suất có thểước lượng bằng:

0 𝑛ế𝑢 𝑛𝑔ượ𝑐 𝑙ạ𝑖

 Hàm 𝜙 được gọi là hàm nhân Thông thường, chọn hàm nhân là Gaussian.

Trang 39

3.7 C ỬA SỔ PARZEN ( CONT )

 Nếu nhân là hàm Gaussian, khi đó ta có:

𝑝 𝑥 ≈ 1

𝑁𝑖=1

𝑁

12𝜋 𝑙/2ℎ𝑙 𝑒𝑥𝑝 − 𝑥 − 𝑥𝑖 𝑇 𝑥 − 𝑥𝑖

2ℎ2

Trang 40

2𝜎12 + 2

3

12𝜋𝜎22 𝑒𝑥𝑝 − 𝑥 − 2 2

2𝜎22

 Với: 𝜎12 = 𝜎12 = 0.2

 Sử dụng cửa sổ Parzen để ước lượng lại dữ liệu nói trên

Trang 42

px(k)=px(k)*(1/N)*(1/(((2*pi)^(l /2))*(h^l)));

k=k+1;

x=x+xstep;

end

Trang 43

V Í DỤ PHẦN 3.7 ( CONT )

Kết quả:

Trang 45

3.8 Ư ỚC LƯỢNG K LÁNG GIỀNG GẦN NHẤT ( CONT )

 Một số công thức tính 𝑉 𝑥 :

 Với không gian 1D: 𝑉 𝑥 = 2𝜌.

 Với không gian 2D: 𝑉 𝑥 = 𝜋𝜌2.

 Với không gian 3D: 𝑉 𝑥 = 43𝜋𝜌3.

 Trong đó: 𝜌 là khoảng cách xa nhất từ x đến k láng giềng

Ngày đăng: 24/09/2020, 04:18

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN