0
Tải bản đầy đủ (.pdf) (69 trang)

Phương pháp phân tách tuyến tính

Một phần của tài liệu LUẬN VĂN THẠC SĨ NHẬN DẠNG ẢNH MẶT NGƯỜI SỬ DỤNG MẠNG NƠRON (Trang 27 -30 )

Phương pháp PCA ở trên còn có nhược điểm là chỉ làm nổi bật lên các

đặc trưng của từng ảnh mà chưa quan tâm đến các ảnh đó là của cùng một

người hay của những người khác nhau. Phương pháp phân tách tuyến tính (LDA – Linear Discriminant Analysis) có thể khắc phục được những nhược

điểm đó. Nhiệm vụ chính của phương pháp là tính sự biến thiên giữa các ảnh của những người khác nhau và tính sự biến thiên giữa các ảnh của cùng một

người, sau đó tìm một phép biến đổi để làm cực đại tỉ số của hai sự biến thiên trên. Nghĩa là, tập ảnh huấn luyện sẽđược biến đổi sang một không gian mới sao cho sự khác nhau giữa các ảnh của những người khác nhau được tăng lên

tối đa, đồng thời cũng làm tăng sự giống nhau giữa các ảnh của cùng một

người. Hình 1.9 là một ví dụ minh họa trực quan ý nghĩa của phép biến đổi này. Hình 1.9(a) là một cách biến đổi không tốt khi các hình chiếu của các

điểm thuộc hai lớp vẫn lẫn lộn với nhau; hình 1.9(b) là một cách biến đổi khá tốt khi hình chiếu của các điểm thuộc cùng một lớp gần nhau, còn hình chiếu của các điểm khác lớp xa nhau.

Thông thường trong phương pháp LDA, sự phân bố ngoại và sự phân bố

nội được dùng làm tiêu chí để phân lớp. Ma trận phân bố nội được tính như sau:

= 1 − − (1.8) trong đó:  là ảnh thứi của lớp j.j là giá trị trung bình của lớp j.C là sốlượng lớp.  Nj là sốlượng ảnh trong lớp j.N là tổng sốảnh trong tập huấn luyện. Ma trận phân bố ngoại: = 1 − − (1.9)

trong đó là giá trị trung bình của tất cả các lớp.

Không gian mới của LDA được hình thành từ tập vector W = [W1, .., Wd], thỏa mãn

= arg max = (1.10)

Ma trận phân bố nội Sw biểu diễn sự phân bố gần nhau của các ảnh trong các lớp và ma trận phân bố ngoại Sb mô tả sự tách biệt của các lớp. Khi các

ảnh được chiếu lên các vector của W, các ảnh sẽđược phân bố gần nhau trong mỗi lớp và sẽđược tách biệt giữa các lớp, càng nhiều càng tốt. Nói cách khác,

các vector này cực tiểu hóa mẫu số và cực đại hóa tử số của công thức (1.10). Nếu ma trận Sw là khả nghịch, tỉ số ở công thức (1.10) sẽđạt cực đại khi các vector của W là các vector riêng của . Đối với bài toán nhận dạng mặt

người, ma trận Sw thường không khả nghịch, vì số lượng ảnh nhỏ hơn rất nhiều so với số chiều biểu diễn ảnh. Có nhiều phương pháp khác nhau để giải quyết vấn đề của LDA như phương pháp giả nghịch đảo, phương pháp không

gian con hoặc phương pháp không gian null.

Trong luận văn này, phương pháp giả nghịch đảo được dùng để giải quyết vấn đề trên. Vì ảnh gốc có kích thước 112×92, mỗi ảnh có thể coi là một điểm trong không gian 10304 chiều, số chiều này quá lớn để có thể thực hiện LDA

nên trước hết cần sử dụng phương pháp PCA để giảm bớt số chiều của không

gian này. Sau đó, áp dụng phương pháp giả nghịch đảo với tập dữ liệu mới để

tìm ma trận biến đổi W.

Để tính ma trận giả nghịch đảo , Swđược phân tích như sau: = (1.11)

trong đó:

  = diag(1, .., k) chứa các giá trị riêng dương của Sw, nghĩa là các phần tửtrên đường chéo chính của  là các giá trị riêng của Sw, còn các phần tửkhác đều bằng 0.

k là hạng của Sw.

Q1 chứa các vector riêng của Swtương ứng với k giá trị riêng dương. Khi đó ma trận giả nghịch đảo của Sw là:

= (1.12)

Cuối cùng, các vector riêng của ứng với các giá trị riêng dương

Hình 1.10 là một số ảnh sau khi biến đổi theo phương pháp phân tách tuyến tính.

Hình 1.10. Ảnh sau khi biến đổi theo LDA

Một phần của tài liệu LUẬN VĂN THẠC SĨ NHẬN DẠNG ẢNH MẶT NGƯỜI SỬ DỤNG MẠNG NƠRON (Trang 27 -30 )

×