Bài toán

Có rất nhiều mô hình khác nhau của các bài toán nhận dạng ảnh mặt

người. Với bài toán trong luận văn, có một cơ sở dữ liệu ảnh của một tập N

người, mỗi người có M ảnh khác nhau, gọi là tập ảnh huấn luyện. Hệ thống sẽ

sử dụng tập ảnh huấn luyện này để học. Khi đưa vào nhận dạng, đầu vào của hệ thống là một ảnh của một người bất kỳ trong tập N người trên. Đầu ra của hệ thống xác định ảnh đầu vào là của người nào trong sốN người ban đầu.

3.2 Thiết kế hệ thống

3.2.1 Trích chọn đặc trưng

Trước khi thực hiện PCA hoặc LDA, các ảnh gốc là các ma trận hai chiều

kích thước 112×92 được chuyển sang biểu diễn dưới dạng các vector 10304 chiều. Mỗi ảnh huấn luyện sẽđược bổ sung một ảnh ở dạng ảnh gương của nó

đểtăng thêm sựđa dạng cho tập ảnh huấn luyện (hình 3.1).

Hình 3.1. Ảnh gốc được bổ sung ảnh gương

Trong chương trình này, khi thực hiện phân tích thành phần chính, các

vector riêng được chọn tương ứng với các giá trị riêng lớn hơn hoặc bằng 103, kết quảlà có 49 vector riêng được chọn.

Trước khi thực hiện LDA, các ảnh gốc cần phải được thực hiện PCA để

giảm số chiều của dữ liệu vì số chiều bằng 10304 là quá lớn để thực hiện LDA. Ở đây, các vector riêng được chọn tương ứng với các giá trị riêng lớn

hơn hoặc bằng 105 (số lượng vector riêng nhiều hơn so với phương pháp

PCA ở trên).

Đối với pha xử lý hình thái ảnh, ảnh sau khi được biến đổi cũng sẽ được thực hiện phân tích thành phần chính để để giảm số chiều trước khi đưa vào

huấn luyện mạng nơron.

3.2.2 Thiết kế mạng nơron

Chương trình sử dụng ba mạng nơron riêng biệt ứng với mỗi phương pháp

phân tích ở trên. Phương pháp huấn luyện mạng vềcơ bản giống như phần lý thuyết đã trình bày, tuy nhiên giá trị tỉ lệ học là không cố định. Trong quá trình huấn luyện, nếu lỗi mới của mạng vượt quá lỗi cũ với một tỉ lệ định

trước, các giá trị mới của trọng số và bias sẽđược bỏ qua. Ngoài ra, giá trị của tỉ lệ học sẽ giảm xuống. Trái lại, các trọng số và bias sẽ được tính lại giá trị

mới. Nếu lỗi mới nhỏhơn lỗi cũ, tỉ lệ học sẽtăng lên.

Ba mạng nơron ứng với ba phương pháp phân tích sẽ được huấn luyện

độc lập với nhau. Khi thực hiện nhận dạng, ảnh nhận dạng sẽ được biến đổi và tính toán theo từng phương pháp phân tích. Ba giá trị kết quả sẽ được so sánh với nhau, chọn kết quả phù hợp nhất để làm kết quả nhận dạng của hệ

thống, việc so sánh này dựa trên khoảng cách Euclide của các ảnh.

3.3 Chương trình 3.3.1 Cơ sở dữ liệu ảnh

Trong luận văn này, bộ ảnh dữ liệu được lấy từ cơ sở dữ liệu ORL (Olivetti Research Laboratory, Surrey University). Các ảnh ở đây tương đối

đa dạng, thích hợp cho việc kiểm thử hệ thống. Bộ ảnh chụp 40 người khác nhau, mỗi người có 10 ảnh riêng, các ảnh này có thể được chụp ở những thời

điểm khác nhau, với những góc nghiêng khác nhau, những trạng thái khác

nhau như cười hoặc không cười, đeo kính hoặc không, nheo mắt, miệng mở

hoặc đóng…

Phương pháp phân tách tuyến tính

Phương pháp xử lý hình thái