Phát hiện khuôn mặt giả mạo trong VIDEO phần 2 luận văn thạc sĩ

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề	Phát Hiện Khuôn Mặt Giả Mạo Trong Video Phần 2 Luận Văn Thạc Sĩ
Trường học	Trường Đại Học
Chuyên ngành	Công Nghệ Thông Tin
Thể loại	luận văn thạc sĩ

Định dạng
Số trang	30
Dung lượng	1,15 MB

Nội dung

15 CHƯƠNG 2 CƠ SỞ LÝ THUYẾT 2 1 Vị trí quan trọng trên khuôn mặt 2 1 1 Định nghĩa Phát hiện các vị trí quan trọng trên khuôn mặt là một tập hợp con của vấn đề dự đoán hình dạng cho một hình ảnh đầu vào và thông thường là ROI chỉ định đối tượng quan tâm, một công cụ dự đoán hình dạng cố gắng định vị các điểm quan tâm chính dọc theo hình Trong bối cảnh xác định các vị trí quan trọng trên khuôn mặt, mục tiêu của quá trình này là phát hiện các điểm xác định cấu trúc quan trọng trên khuôn mặt bằ.

CHƯƠNG CƠ SỞ LÝ THUYẾT 2.1 Vị trí quan trọng khuôn mặt 2.1.1 Định nghĩa Phát vị trí quan trọng khn mặt mợt tập hợp vấn đề dự đốn hình dạng cho mợt hình ảnh đầu vào thơng thường ROI định đối tượng quan tâm, một công cụ dự đốn hình dạng cố gắng định vị điểm quan tâm dọc theo hình Trong bối cảnh xác định vị trí quan trọng khn mặt, mục tiêu trình phát điểm xác định cấu trúc quan trọng khuôn mặt phương pháp dự đốn hình dạng 2.1.2 Ứng dụng Các vị trí quan trọng khn mặt sử dụng để khoanh vùng thể vùng bật khn mặt, ví dụ như: đơi mắt, lơng mày, mũi, miệng, hàm, Xác định vị trí quan trọng khuôn mặt áp dụng thành công để chỉnh khn mặt, ước tính tư đầu, hốn đổi khuôn mặt, phát chớp mắt nhiều ứng dụng khác 2.1.3 Cơ sở ý tưởng phương pháp Phát vị trí quan trọng khn mặt mợt q trình gồm hai bước [14]: Bước 1: Xác định vùng khn mặt hình ảnh Bước 2: Phát điểm xác định cấu trúc quan trọng khn mặt 2.1.3.1 Xác định vùng khn mặt hình ảnh Phát khn mặt (Bước 1) thực nhiều phương pháp Chúng ta sử dụng phương pháp Haar cascades, hay áp dụng trình phát đối tượng HOG huấn luyện trước kết hợp với SVM cho việc phát khuôn mặt, 15 chí sử dụng thuật tốn dựa học sâu để thực cơng việc [14] Ưu nhược điểm phương pháp [14]: Haar cascades: Nhanh, xác, khó khăn để điều chỉnh thông số HOG + SVM: Thông thường xác so với Haar cascades với sai số hơn, tham số để điều chỉnh thời gian thử nghiệm chậm so với Haar cascades Học sâu: Chính xác mạnh mẽ nhiều so với Haar cascades HOG + SVM huấn luyện xác, rất chậm tùy tḥc vào đợ sâu đợ phức tạp mơ hình, tăng tốc cách thực huấn luyện GPU Trong hai trường hợp, thuật toán thực tế sử dụng để phát khuôn mặt ảnh khơng phải vấn đề Thay vào đó, điều quan trọng nhất thông qua một số phương pháp, có hợp giới hạn khn mặt (tức tập (x, y) tọa độ khuôn mặt hình ảnh) 2.1.3.2 Phát điểm xác định cấu trúc quan trọng khn mặt Với vùng hình chữ nhật chứa khuôn mặt phát hiện, áp dụng Bước 2: phát cấu trúc quan trọng khn mặt Có nhiều loại xác định vị trí quan trọng khn mặt, bản, tất phương pháp cố gắng gắn nhãn cho vùng khuôn mặt: miệng, lông mày, mắt, mũi, hàm Phương pháp xác định vị trí quan trọng khuôn mặt bao gồm thư viện dlib [17] một triển khai dựa báo Kazemi Sullivan [18] Phương pháp bắt đầu cách sử dụng một tập huấn luyện vị trí quan trọng khn mặt dán nhãn mợt hình ảnh Những hình ảnh dán nhãn thủ công, định cụ thể (x, y) phối hợp vùng xung quanh cấu trúc khn mặt Sau tính xác śt khoảng cách cặp điểm ảnh đầu vào Với liệu h́n luyện này, mợt nhóm hồi quy huấn luyện để ước tính vị trí quan trọng khn mặt trực tiếp từ cường đợ điểm ảnh Kết cuối sử dụng để phát vị trí quan trọng khn mặt thời gian thực với dự đốn chất lượng cao 16 Bợ phát điểm vị trí quan trọng khuôn mặt huấn luyện trước thư viện dlib sử dụng để ước tính vị trí 68 điểm (x, y) - điều phối ánh xạ tới điểm khuôn mặt Các số tọa đợ hiển thị hình 2.1 [19] Hình 2.1 Hiển thị tọa đợ 68 vị trí quan trọng mặt từ bợ liệu iBUG 300-W 17 2.2 Máy ảnh 2.2.1 Giới thiệu thuật ngữ 2.2.1.1 Ma trận nội Ma trận nội [16] biến đổi tọa đợ camera 3D thành tọa đợ hình ảnh đồng nhất mặt phẳng 2D Hình chiếu phối cảnh mơ hình hóa máy ảnh minh họa hình 2.2 [16] Hình 2.2 Mơ máy ảnh Ma trận nợi tham số hóa Hartley Zisserman [21] công thức (2-1) K= (2-1) Mỗi tham số nội mô tả một thuộc tính hình học máy ảnh Các phần sau xem xét tḥc tính mợt cách chi tiết 18 2.2.1.2 Tiêu cự Độ dài tiêu cự (fx, fy) khoảng cách lỗ kim tấm phim (mặt phẳng hình ảnh) Đợ dài tiêu cự đo pixel Trong mợt máy ảnh, fx fy có giá trị, minh họa f hình 2.3 [16] Hình 2.3 Tiêu cự Trên thực tế, fx fy khác với mợt số lý sau: ❖ Lỗ hổng cảm biến máy ảnh kỹ thuật số ❖ Hình ảnh thu nhỏ khơng đồng xử lý ❖ Ống kính máy ảnh có biến dạng ❖ Máy ảnh sử dụng định dạng biến hình (Anamorphic format [22]), ống kính nén cảnh hình rợng thành hình ảnh có kích thước tiêu chuẩn ❖ Lỗi hiệu chuẩn máy ảnh Trong tất trường hợp này, hình ảnh thu có pixel khơng hồn tồn hình vng Có hai đợ dài tiêu cự khác cho hình ảnh khơng trực quan, mợt số văn (Forsyth Ponce [37]) sử dụng một độ dài tiêu cự nhất "tỷ lệ khung hình" mô tả mức độ sai lệch so với pixel vuông hồn hảo Mợt tham số hóa tách biệt hình học camera (nghĩa đợ dài tiêu cự) khỏi biến dạng tỷ lệ khung hình 19 2.2.1.3 Trục "Trục chính" máy ảnh đường vng góc với mặt phẳng hình ảnh qua lỗ kim Điểm giao gióng trục với mặt phẳng hình ảnh gọi "điểm chính" minh họa hình 2.4 [16] Hình 2.4 Trục điểm 2.2.1.4 Điểm bù gốc "Điểm bù gốc"(x0, y0) vị trí điểm so với điểm gốc phim, hình minh họa 2.5, 2.6 [16] bên giả định điểm bù gốc phía bên trái video Hình 2.5 Điểm bù gốc 20 Việc tăng xo sang phải tương đương việc dịch phim sáng trái không thay đổi lỗ kim, hình 2.6 Hình 2.6 Mơ thay đổi xo 2.2.1.5 Trục lệch Trục lệch gây biến dạng cắt hình ảnh chiếu khơng có bất kỳ tương quan với trục xiên một máy ảnh lỗ kim thực sự, rõ ràng một số quy trình số hóa gây sai lệch khác [7] 2.2.2 Mô máy ảnh đơn giản Như thảo luận trước đó, có xếp lỗ kim tấm phim ảnh hưởng lên hình ảnh hợp vật lý xung quanh máy ảnh khơng liên quan Vì lý này, nhiều cuộc thảo luận máy ảnh sử dụng một biểu diễn trực quan đơn giản hơn: máy ảnh hình chóp cụt Vùng xem máy ảnh có hình kim tự tháp đơi gọi "hình nón nhìn thấy".Mợt ví dụ thêm mợt số hình cầu 3D vào hình nón có khả khả hiển thị tạo hình ảnh hình 2.7 [16] 21 Hình 2.7 Mơ mợt số hình cầu vùng máy ảnh hình chóp Vì hợp bao ngồi máy ảnh khơng liên quan nên ẩn Ngồi ra, lưu ý hình ảnh phim mô tả một phiên thực tế Để mơ điều này, đề x́t sử dụng “hình ảnh ảo” thay phim Hình ảnh ảo có tḥc tính giống hình ảnh phim, khơng giống hình ảnh thật, hình ảnh ảo xuất trước máy ảnh hình ảnh chiếu khơng bị xóa (ví dụ hình 2.8 [16]) Hình 2.8 Mơ hình ảnh ảo qua máy ảnh 22 Lưu ý vị trí kích thước mặt phẳng hình ảnh ảo tùy ý, nghĩa tăng gấp đơi kích thước hình ảnh ảo miễn nhân đơi khoảng cách với lỗ kim Sau xóa hình ảnh thật, cịn lại đại diện "ảnh hình chóp cụt" máy ảnh hình 2.9 [16] Hình 2.9 Ảnh hình chóp cụt Lỗ kim thay đầu hình chóp nhìn thấy, hình ảnh đại diện mặt phẳng hình ảnh ảo Hình ảnh đại diện sử dụng phần sau 2.2.3 Các tham số nội với phép biến đổi 2D Trong phần trước, tác giả viết giải thích vectơ tọa đợ hình ảnh 3D, chuyển thành tọa đợ hình ảnh 2D đồng nhất Ngồi ra, viết hiểu vectơ tọa độ đồng nhất 2D chuyển thành một tập hợp điểm 2D Điều cho mợt nhìn ma trận nội tại: một chuỗi phép biến đổi 2D Chúng ta phân tách ma trận nợi thành một chuỗi phép biến đổi cắt, chia tỷ lệ dịch, tương ứng với độ lệch trục, độ dài tiêu cự điểm bù chính, tương ứng cơng thức (2-2): 23 K= (2-2) = (2DTranslation) × (2DScaling) × (2Dshear) Một phân rã tương đương cắt sau chia tỷ lệ cơng thức (2-3): K= (2-3) (2DTranslation) × (2DScaling) × (2Dshear) Giải thích phân tách tham số bên bên thành lĩnh vực 3D 2D một cách tương ứng Một kết đáng ý điều tham số nội ảnh hưởng đến khả hiển thị đối tượng bị chặn tiết lộ phép biến đổi 2D đơn giản khơng gian hình ảnh 2.3 Thuật tốn Levenberg-Marquardt 2.3.1 Giới thiệu 2.3.1.1 Giới thiệu tốn bình phương cực tiểu phi tuyến Bài tốn bình phương cực tiểu phi tuyến [23] sử dụng cần khớp một hàm ŷ(t; p) một biến độc lập t một vectơ n tham số p đến một tập hợp m điểm liệu (ti, yi), để giảm thiểu tổng bình phương trọng số lỗi (hoặc phần dư trọng số) liệu đo yi hàm phù hợp với đường cong ŷ(t; p) Thước đo mức đợ phù hợp có giá trị vơ hướng gọi tiêu chuẩn sai số chi bình phương tổng bình phương biến phân phối thơng thường phân phối phân phối Chi bình phương, cơng thức (2-4)-(2-6) χ 2(p)= (2-4) 24 Trong một số trường hợp, Levenberg-Marquardt rất chậm để hợi tụ Điều đặc biệt mơ hình có mười tham số u cầu thuật tốn nhích chậm dọc theo không gian thu thập liệu hẹp.[15] 2.4 Biểu đồ đốc dịnh hướng 2.4.1 Giới thiệu Biểu đồ độ dốc định hướng (HOG) [13] mợt loại trích x́t đặc trưng Mục đích trích xuất đặc trưng trừu tượng hóa đối tượng cách trích x́t đặc trưng đối tượng bỏ thơng tin khơng hữu ích Vì vậy, HOG sử dụng chủ yếu để mơ tả hình dạng xuất một đối tượng ảnh Bản chất phương pháp HOG sử dụng thông tin phân bố cường độ độ đốc hướng biên để mô tả đối tượng cục bợ ảnh Các tốn tử HOG cài đặt cách chia nhỏ một ảnh thành vùng con, gọi "ô" với ô, ta tính tốn mợt histogram hướng độ dốc cho điểm nằm ô Ghép biểu đồ lại với ta có mợt biểu diễn cho ảnh ban đầu Để tăng cường hiệu nhận dạng, biểu đồ cục bợ chuẩn hóa đợ tương phản cách tính một ngưỡng cường độ một vùng lớn ô, gọi khối sử dụng giá trị ngưỡng để chuẩn hóa tất khối Kết sau bước chuẩn hóa mợt vectơ đặc trưng có tính bất biến cao thay đổi điều kiện ánh sáng 2.4.2 Phương pháp Có bước để xây dựng mợt vectơ HOG cho hình ảnh biểu thị qua hình 2.10 [13] 30 Tiền xử lý Tính đợ dốc Tính vectơ đặc trưng cho Chuẩn hóa khối Tính tốn vectơ HOG Hình 2.10 Các bước xây dựng vectơ HOG 2.4.2.1 Tiền xử lý Trong bước này, để thuận tiện cho việc chia hình ảnh thành khối, tính tốn đặc trưng bước tiếp theo, cần thay đổi kích thước tất hình ảnh tập liệu mợt kích thước chung (ví dụ hình 2.11 [13]) Original Image : 720 X 475 Hình 2.11 Chuẩn hóa kích thước hình ảnh Bước chuẩn hóa hồn tồn không bắt buộc, một số trường hợp, bước cải thiện hiệu śt bợ mơ tả HOG Có ba phương pháp chuẩn hóa mà xem xét [13]:  Quy định chuẩn Gamma: Trong trường hợp này, ta lấy log(p) pixel p hình ảnh đầu vào  Chuẩn hố gốc-vng: Ở lấy sqrt(p) pixel p hình ảnh đầu vào Theo định nghĩa, bình thường bậc hai nén cường độ điểm ảnh đầu vào thấp nhiều so với chuẩn bình thường gamma 31  Chuẩn hóa phương sai: Ở đây, tính cần giá trị cường đợ điểm ảnh trung bình đợ lệch tiêu chuẩn hình ảnh đầu vào Với điểm ảnh ta trừ giá trị trung bình cường đợ điểm ảnh sau chuẩn hóa cách chia cho đợ lệch chuẩn 2.4.2.2 Tính độ dốc Đây bước đầu tiên, thực hai phép nhân chập ảnh gốc với chiều, tương ứng với toán tử lấy đạo hàm theo hai hướng Ox Oy Trong đó, hướng tương ứng công thức (2-23): Dx =[-1 1] Dy =[1 -1]T (2-23) Với một ảnh đầu vào I, có ảnh đạo hàm riêng theo hướng đó, theo cơng thức (2-24): Ix = I * D x (2-24) Iy = I * D y Khi đó, tính đợ đốc bao gồm hai thành phần cường độ hướng theo công thức (2-25), (2-26): Cường độ: |G| = (2-25) Hướng: θ = (2-26) Đối với hình ảnh màu, đồ đốc ba kênh (red, green blue) đánh giá Độ lớn độ đốc một điểm ảnh giá trị lớn nhất cường độ độ đốc ba kênh, góc góc tương ứng với đợ đốc tối đa 2.4.2.3 Tính vectơ đặc trưng cho Để tính tốn vectơ đặc trưng cho ơ, cần chia hình ảnh thành khối, khối lại chia thành ô Để xác định số khối, sử dụng công thức (2-27): nblock_image = (2-27) 32 đó: Wimage, Wblock, Wcell: chiều rộng ảnh, khối, ô Himage, Hblock, Hcell: chiều dài ảnh, khối, ô Sau xác định số khối kích thước khối, ơ, để tính tốn vectơ đặc trưng cho ô, cần:  Chia không gian hướng thành p bin(số chiều vectơ đặc trưng ô)  Rời rạc hóa góc hướng nghiêng điểm ảnh vào bin Giả sử góc hướng nghiêng pixel vị trí (x,y) có đợ lớn alpha(x,y)  Trường hợp rời rạc hóa unsigned-HOG với p=9: B(x,y) = round mod p (2-28)  Trường hợp rời rạc hóa signed-HOG với p= 18 B(x,y) = round mod p (2-29) Giá trị bin định lượng tổng cường độ biến thiên điểm ảnh thuộc bin Sau tính tốn đặc trưng ơ, ta nối vectơ đặc trưng ô để thu vectơ đặc trưng khối Số chiều vectơ đặc trưng khối tính theo cơng thức (2-30): sizeblock = n*sizecell (2-30) tong đó: n: số ô khối sizecell: số chiều vectơ đặc trưng ô (sizecell=9 sử dụng “unsigned- HOG” sizecell=18 sử dụng “signed-HOG”) 33 Ví dụ: Trong trường hợp này, hình ảnh có kích thước 64x128, ta chia hình ảnh thành khối có kích thước 16x16 Mỗi khối bao gồm ơ, có kích thước 8x8 hình 2.12[13] Hình 2.12 Chia hình ảnh thành Tiếp theo, tiến hành tính tốn đặc trưng HOG Hình 2.13 Tính tốn đặc trưng HOG ô 34 Tại cell, xây dựng một biểu đồ cường độ độ đốc cách chọn pixel vào biểu đồ Trọng số chọn pixel phụ tḥc hướng cường đợ đợ đốc (được tính tốn từ bước 2) pixel (ví dụ hình 2.14 [13]) Hình 2.14 Chọn pixel theo hướng cường đợ Như hình ảnh trên, pixel có bao quanh màu xanh lam Nó có hướng 80 đợ cường đợ 2, ta thêm vào ô thứ (hướng 80 độ) Tiếp theo pixel có bao quanh màu đỏ Nó có hướng 10 đợ cường đợ Vì khơng có ô 10 độ, nên ta chọn vào ô độ 20 độ, ô thêm đơn vị Sau chọn hết pixel mợt kích thước 8x8, ta thu kết hình 2.15 Hình 2.15 Biểu đồ thể lượt chọn cho ô 35 2.4.2.4 Chuẩn hóa khối Để tăng cường hiệu nhận dạng, biểu đồ cục bộ chuẩn hóa đợ tương phản cách tính mợt ngưỡng cường độ một khối sử dụng giá trị để chuẩn hóa tất khối Kết sau bước chuẩn hóa mợt vectơ đặc trưng có tính bất biến cao thay đổi điều kiện ánh sáng Có nhiều phương pháp dùng để chuẩn hóa khối Gọi v vectơ cần chuẩn hóa chứa tất biểu đồ mội khối ‖v(k)‖ giá trị chuẩn hóa v theo chuẩn k=1, e mợt số nhỏ Khi đó, giá trị chuẩn hóa tính mợt công thức (2-31)-(2-33): L2 – norm : f = (2-31) L1 – norm : f = (2-32) L1 – sqrt : f = (2-33) Ghép vectơ đặc trưng khối thu vectơ đặc trưng R-HOG cho ảnh Số chiều vectơ đặc trưng ảnh tính theo cơng thức (2-34): sizeimage = n * sizeblock (2-34) đó: n: số khối hình ảnh sizeblock: số chiều vectơ đặc trưng khối 2.4.2.5 Tính tốn vectơ đặc trưng HOG Mợt ví dụ với hình ảnh kích thước 64x128, chia thành khối 16x16 chồng nhau, có khối ngang 15 khối dọc, nên có 7x15 = 105 khối Mỗi khối gồm ô Khi áp dụng biểu đồ cho ô, khối đại diện mợt vectơ có kích thước 36x1 Vì vậy, nối tất vectơ mợt khối lại với 36 nhau, ta thu vectơ đặc trưng HOG ảnh có kích thước 105x36x1 = 3780x1 2.5 Support vector machine 2.5.1 Giới thiệu Support vector machine hay Máy vectơ hỗ trợ (SVM) [25] một thuật tốn tḥc nhóm học có giám sát dùng để phân chia liệu thành nhóm riêng biệt Ý tưởng SVM tìm mợt siêu phẳng để phân tách điểm liệu hình 2.16 [25] Hình 2.16 Đường phân cách điểm liệu SVM không gian chiều 37 2.5.2 Lề Lề khoảng cách siêu phẳng đến điểm liệu gần nhất tương ứng với phân lớp SVM cố gắng tối ưu thuật tốn cách tối đa hóa giá trị lề Hình 2.17 Biểu diễn lề SVM Theo hình 2.17 [25], ta chọn hai siêu phẳng lề H1 qua điểm thuộc lớp âm H2 qua điểm thuộc lớp dương song song với H0 H1 : wT x + b = -1 (2-35) T H2 : w x + b = Khoảng cách H1 đến H0 d- Khoảng cách H0 đến H0 d+ 2.5.3 Tính Lề Khoảng cách từ mợt điểm xk đến siêu phẳng H0 có cơng thức (2-36): d= = (2-36) 38 Từ ta tính mức lề công thức (2-37): m = d_ + d+ = (2-37) Vậy việc huấn luyện giải thuật SVM tương đương với tốn cực tiểu hóa với điều kiện (2-38)(2-39) : wT xi + b ≤ -1, if yi = -1 (2-38) wTxi + b ≥ 1, if yt = (2-39) Nhân hai vế bất đẳng thức (2-38) (2-39) với yi ta có điều kiện thu gọn (2-40): yi.(wTxi + b) > = i = n (2-40) Với điều kiện này, tốn Hard Margin SVM Việc tìm margin cực đại giải tốn đối ngẫu Lagrange Cơng thức hàm tối ưu cho Hard Margin SVM viết lại (2-40): (w,b) = (2-41) Điều kiện: yi (wTxi + b) ≥ i = n 2.5.4 Lề mềm Để tránh khớp, nhiều để muốn có lề cao, ta phải chấp nhận việc mợt vài liệu chia khơng xác, lề trường hợp gọi lề mềm Hard Margin ám việc tìm lề mà tất liệu thỏa mãn phận chia Với toán thực tế, việc tìm lề cứng nhiều bất khả thi, việc chấp nhận sai lệch mợt mức chấp nhận vô cần thiết Với lề mềm, hàm mục tiêu có thêm mợt số hạng để giúp tối thiểu hy sinh (2-42): +C (2-42) đó: C: Hằng số ξ = [ξ1, ξ2, …,ξn] 39 Điều kiện ràng buộc thay đổi thành (2-43): yi (wTxi + b) ≥ 1- ξi - ξi – yi (wTxi + b) ≤ 0, i = n (2-43) ξi ≥ 0, i = n Công thức hàm tối ưu cho lề mềm SVM (2-44): (w, b, ξ) = arg Điều kiện: - ξi – yi (wTxi + b) ≤ 0, i = n (2-44) ξi ≥ 0, i = n 2.5.5 Nhân Nhân SVM một hàm số biến đổi liệu x từ không gian đặc trưng ban đầu thành liệu một không gian hàm số Ф(x) (ví dụ hình 2.18 [25]) Hình 2.18 Dùng nhân để biến đổi liệu chiều thành chiều Ngồi ra, có mợt số hàm nhân thông dụng SVM bảng 2.1 40 Bảng 2.1 Công thức một số hàm nhân (kernel) thông dụng SVM Tên nhân Công thức Linear Ф( x, z) = xT z Polynomial Ф( x, z) = (r + γxT z)d Radial Basic Function (RBF) Ф(x, z) = exp(-γ Sigmoid ), γ> Ф( x, z) = tanh(γxTz + r ) 2.5.6 Nhận xét Ưu điểm:  Cơ sở toán học chặt chẽ  Dự đoán rất nhanh  Tiết kiệm bợ nhớ  Có thể giải hai tốn tuyến tính phi tuyến tính  Hoạt đợng hiệu liệu có số lượng chiều lớn Khuyết điểm:  Dữ liệu trước h́n luyện cần phải trích chọn tḥc tính phù hợp  Không phù hợp với số lượng liệu lớn thời gian h́n luyện cao  Mơ hình có xu hướng khớp số lượng đặc trưng nhiều số lượng mẫu 2.6 Random forest 2.6.1 Giới thiệu Random forest [26] một bộ phân lớp bao gồm một tập hợp định.Random forest đưa dự đốn dựa mợt c̣c bỏ phiếu định riêng lẻ 2.6.2 Phương pháp Mỗi định RF xây dựng dựa mợt thuật tốn A với tập liệu h́n luyện S mợt vectơ ngẫu nhiên θ, θ lấy mẫu dựa một số phân phối 41 Để xác định một RF cụ thể, cần xác định thuật toán A phân phối θ Có nhiều cách để làm điều này, tơi mơ tả mợt cách số sau:  Khởi tạo θ: Lấy một mẫu ngẫu nhiên từ S, cụ thể chúng tối lấy mẫu một tập liệu h́n luyện S' có kích thước m' cách sử dụng phân phối liên tục S Tôi xây dựng chuỗi I1, I2, , It một tập một tập hợp đặc trưng ([d]) có kích thước k, tạo cách lấy mẫu thống nhất phần tử ngẫu nhiên từ [d] Tất biến ngẫu nhiên tạo thành vectơ θ  Sử dụng thuật tốn A (ví dụ: sử dụng thuật toán ID3) để xây dựng định dựa bợ mẫu S', giai đoạn phân tách thuật toán, thuật toán giới hạn việc chọn mợt tính tối đa hóa Gain từ tập It Nếu k nhỏ, hạn chế ngăn ngừa mức 2.6.3 Nhận xét Ưu điểm:  Random forest giải tốn phân lớp hồi quy  Có khả xử lý tập liệu lớn nhiều chiều  Có phương pháp hiệu để ước tính liệu bị thiếu trì đợ xác thiếu phần lớn liệu  Có nhiều phương pháp cân lỗi số lượng liệu lớp không đồng Nhược điểm: ❖ Không giống định, phân lớp tạo random forest rất khó để giải thích 2.7 Perceptron đa lớp 2.7.1 Giới thiệu Perceptron đa lớp (MLP) [27] một mạng thần kinh đơn giản tạo từ liên kết Perceptron tảng để hiểu mạng khác phức tạp học sâu 42 Hình 2.19 Cấu trúc Perceptron đa lớp MLP tập hợp Perceptron chia làm nhiều nhóm, nhóm tương ứng với mợt lớp Trong hình 2.19 có lớp: lớp đầu vào, lớp đầu ra, lớp ẩn 2.7.2 Phương pháp Phương pháp phổ biến nhất để tối ưu MLP Gradient Descent (GD) Để áp dụng GD, cần tính gradient hàm mất mát theo ma trận trọng số W(l) vectơ bias b(l) Trước hết, cần tính kết dự đốn ŷ với mợt đầu vào x theo cơng thức (2-45)-(2-48): a(0) = x z(l) = W(l)Ta (l-1) + b(l), l = 1,2, , L a(l) = f (z(l)), l = 1,2, , L ŷ= a(L) (2-45) (2-46) (2-47) (2-48) Giả sử J(W, b, X, Y) một hàm mất mát tốn, W, b tập hợp tất ma trận trọng số lớp biases lớp X, Y cặp liệu huấn luyện với cột tượng ứng với mợt điểm liệu Để áp dụng Gradient 43 Descent, cần tính , l = 1,2, ….,L Ví dụ hàm mất mát hàm Mean Square Error (MSE) có cơng thức sau (2-49): J(W, b, X, Y) = = (2-49) Theo cơng thức trên, việc tính tốn trực tiếp giá trị phức tạp hàm mất mát không phụ thuộc trực tiếp vào hệ số Phương pháp phổ biến nhất dùng lan truyền ngược giúp tính đợ dốc ngược từ lớp cuối đến lớp Lớp cuối tính tốn trước gần gũi với kết dự đốn hàm mất mát Việc tính tốn đợ dốc lớp trước thực dựa quy tắc đạo hàm hàm hợp 2.7.3 Nhận xét Ưu điểm:  MLP giải tốn phân lớp hồi quy  Thời gian dự đoán nhanh Nhược điểm:  Khi số lượng lớp ẩn lớn, số lượng hệ số cần tối ưu lớn lên mơ hình trở nên phức tạp Dẫn tới tốc đợ tính tốn chậm dễ bị tượng khớp  MLP một hộp đen Khó biết kết dự đốn mơ hình tính tốn 44 ... cơng thức (2- 2): 23 K= (2- 2) = (2DTranslation) × (2DScaling) × (2Dshear) Một phân rã tương đương cắt sau chia tỷ lệ cơng thức (2- 3): K= (2- 3) (2DTranslation) × (2DScaling) × (2Dshear) Giải thích... y) tọa độ khuôn mặt hình ảnh) 2. 1.3 .2 Phát điểm xác định cấu trúc quan trọng khn mặt Với vùng hình chữ nhật chứa khuôn mặt phát hiện, áp dụng Bước 2: phát cấu trúc quan trọng khn mặt Có nhiều... xạ tới điểm khuôn mặt Các số tọa đợ hiển thị hình 2. 1 [19] Hình 2. 1 Hiển thị tọa đợ 68 vị trí quan trọng mặt từ bộ liệu iBUG 300-W 17 2. 2 Máy ảnh 2. 2.1 Giới thiệu thuật ngữ 2. 2.1.1 Ma trận

Ngày đăng: 30/06/2022, 14:19