15 CHƯƠNG 2 CƠ SỞ LÝ THUYẾT 2 1 Vị trí quan trọng trên khuôn mặt 2 1 1 Định nghĩa Phát hiện các vị trí quan trọng trên khuôn mặt là một tập hợp con của vấn đề dự đoán hình dạng cho một hình ảnh đầu vào và thông thường là ROI chỉ định đối tượng quan tâm, một công cụ dự đoán hình dạng cố gắng định vị các điểm quan tâm chính dọc theo hình Trong bối cảnh xác định các vị trí quan trọng trên khuôn mặt, mục tiêu của quá trình này là phát hiện các điểm xác định cấu trúc quan trọng trên khuôn mặt bằ.
CHƯƠNG CƠ SỞ LÝ THUYẾT 2.1 Vị trí quan trọng khuôn mặt 2.1.1 Định nghĩa Phát vị trí quan trọng khn mặt mợt tập hợp vấn đề dự đốn hình dạng cho mợt hình ảnh đầu vào thơng thường ROI định đối tượng quan tâm, một công cụ dự đốn hình dạng cố gắng định vị điểm quan tâm dọc theo hình Trong bối cảnh xác định vị trí quan trọng khn mặt, mục tiêu trình phát điểm xác định cấu trúc quan trọng khuôn mặt phương pháp dự đốn hình dạng 2.1.2 Ứng dụng Các vị trí quan trọng khn mặt sử dụng để khoanh vùng thể vùng bật khn mặt, ví dụ như: đơi mắt, lơng mày, mũi, miệng, hàm, Xác định vị trí quan trọng khuôn mặt áp dụng thành công để chỉnh khn mặt, ước tính tư đầu, hốn đổi khuôn mặt, phát chớp mắt nhiều ứng dụng khác 2.1.3 Cơ sở ý tưởng phương pháp Phát vị trí quan trọng khn mặt mợt q trình gồm hai bước [14]: Bước 1: Xác định vùng khn mặt hình ảnh Bước 2: Phát điểm xác định cấu trúc quan trọng khn mặt 2.1.3.1 Xác định vùng khn mặt hình ảnh Phát khn mặt (Bước 1) thực nhiều phương pháp Chúng ta sử dụng phương pháp Haar cascades, hay áp dụng trình phát đối tượng HOG huấn luyện trước kết hợp với SVM cho việc phát khuôn mặt, 15 chí sử dụng thuật tốn dựa học sâu để thực cơng việc [14] Ưu nhược điểm phương pháp [14]: Haar cascades: Nhanh, xác, khó khăn để điều chỉnh thông số HOG + SVM: Thông thường xác so với Haar cascades với sai số hơn, tham số để điều chỉnh thời gian thử nghiệm chậm so với Haar cascades Học sâu: Chính xác mạnh mẽ nhiều so với Haar cascades HOG + SVM huấn luyện xác, rất chậm tùy tḥc vào đợ sâu đợ phức tạp mơ hình, tăng tốc cách thực huấn luyện GPU Trong hai trường hợp, thuật toán thực tế sử dụng để phát khuôn mặt ảnh khơng phải vấn đề Thay vào đó, điều quan trọng nhất thông qua một số phương pháp, có hợp giới hạn khn mặt (tức tập (x, y) tọa độ khuôn mặt hình ảnh) 2.1.3.2 Phát điểm xác định cấu trúc quan trọng khn mặt Với vùng hình chữ nhật chứa khuôn mặt phát hiện, áp dụng Bước 2: phát cấu trúc quan trọng khn mặt Có nhiều loại xác định vị trí quan trọng khn mặt, bản, tất phương pháp cố gắng gắn nhãn cho vùng khuôn mặt: miệng, lông mày, mắt, mũi, hàm Phương pháp xác định vị trí quan trọng khuôn mặt bao gồm thư viện dlib [17] một triển khai dựa báo Kazemi Sullivan [18] Phương pháp bắt đầu cách sử dụng một tập huấn luyện vị trí quan trọng khn mặt dán nhãn mợt hình ảnh Những hình ảnh dán nhãn thủ công, định cụ thể (x, y) phối hợp vùng xung quanh cấu trúc khn mặt Sau tính xác śt khoảng cách cặp điểm ảnh đầu vào Với liệu h́n luyện này, mợt nhóm hồi quy huấn luyện để ước tính vị trí quan trọng khn mặt trực tiếp từ cường đợ điểm ảnh Kết cuối sử dụng để phát vị trí quan trọng khn mặt thời gian thực với dự đốn chất lượng cao 16 Bợ phát điểm vị trí quan trọng khuôn mặt huấn luyện trước thư viện dlib sử dụng để ước tính vị trí 68 điểm (x, y) - điều phối ánh xạ tới điểm khuôn mặt Các số tọa đợ hiển thị hình 2.1 [19] Hình 2.1 Hiển thị tọa đợ 68 vị trí quan trọng mặt từ bợ liệu iBUG 300-W 17 2.2 Máy ảnh 2.2.1 Giới thiệu thuật ngữ 2.2.1.1 Ma trận nội Ma trận nội [16] biến đổi tọa đợ camera 3D thành tọa đợ hình ảnh đồng nhất mặt phẳng 2D Hình chiếu phối cảnh mơ hình hóa máy ảnh minh họa hình 2.2 [16] Hình 2.2 Mơ máy ảnh Ma trận nợi tham số hóa Hartley Zisserman [21] công thức (2-1) K= (2-1) Mỗi tham số nội mô tả một thuộc tính hình học máy ảnh Các phần sau xem xét tḥc tính mợt cách chi tiết 18 2.2.1.2 Tiêu cự Độ dài tiêu cự (fx, fy) khoảng cách lỗ kim tấm phim (mặt phẳng hình ảnh) Đợ dài tiêu cự đo pixel Trong mợt máy ảnh, fx fy có giá trị, minh họa f hình 2.3 [16] Hình 2.3 Tiêu cự Trên thực tế, fx fy khác với mợt số lý sau: ❖ Lỗ hổng cảm biến máy ảnh kỹ thuật số ❖ Hình ảnh thu nhỏ khơng đồng xử lý ❖ Ống kính máy ảnh có biến dạng ❖ Máy ảnh sử dụng định dạng biến hình (Anamorphic format [22]), ống kính nén cảnh hình rợng thành hình ảnh có kích thước tiêu chuẩn ❖ Lỗi hiệu chuẩn máy ảnh Trong tất trường hợp này, hình ảnh thu có pixel khơng hồn tồn hình vng Có hai đợ dài tiêu cự khác cho hình ảnh khơng trực quan, mợt số văn (Forsyth Ponce [37]) sử dụng một độ dài tiêu cự nhất "tỷ lệ khung hình" mô tả mức độ sai lệch so với pixel vuông hồn hảo Mợt tham số hóa tách biệt hình học camera (nghĩa đợ dài tiêu cự) khỏi biến dạng tỷ lệ khung hình 19 2.2.1.3 Trục "Trục chính" máy ảnh đường vng góc với mặt phẳng hình ảnh qua lỗ kim Điểm giao gióng trục với mặt phẳng hình ảnh gọi "điểm chính" minh họa hình 2.4 [16] Hình 2.4 Trục điểm 2.2.1.4 Điểm bù gốc "Điểm bù gốc"(x0, y0) vị trí điểm so với điểm gốc phim, hình minh họa 2.5, 2.6 [16] bên giả định điểm bù gốc phía bên trái video Hình 2.5 Điểm bù gốc 20 Việc tăng xo sang phải tương đương việc dịch phim sáng trái không thay đổi lỗ kim, hình 2.6 Hình 2.6 Mơ thay đổi xo 2.2.1.5 Trục lệch Trục lệch gây biến dạng cắt hình ảnh chiếu khơng có bất kỳ tương quan với trục xiên một máy ảnh lỗ kim thực sự, rõ ràng một số quy trình số hóa gây sai lệch khác [7] 2.2.2 Mô máy ảnh đơn giản Như thảo luận trước đó, có xếp lỗ kim tấm phim ảnh hưởng lên hình ảnh hợp vật lý xung quanh máy ảnh khơng liên quan Vì lý này, nhiều cuộc thảo luận máy ảnh sử dụng một biểu diễn trực quan đơn giản hơn: máy ảnh hình chóp cụt Vùng xem máy ảnh có hình kim tự tháp đơi gọi "hình nón nhìn thấy".Mợt ví dụ thêm mợt số hình cầu 3D vào hình nón có khả khả hiển thị tạo hình ảnh hình 2.7 [16] 21 Hình 2.7 Mơ mợt số hình cầu vùng máy ảnh hình chóp Vì hợp bao ngồi máy ảnh khơng liên quan nên ẩn Ngồi ra, lưu ý hình ảnh phim mô tả một phiên thực tế Để mơ điều này, đề x́t sử dụng “hình ảnh ảo” thay phim Hình ảnh ảo có tḥc tính giống hình ảnh phim, khơng giống hình ảnh thật, hình ảnh ảo xuất trước máy ảnh hình ảnh chiếu khơng bị xóa (ví dụ hình 2.8 [16]) Hình 2.8 Mơ hình ảnh ảo qua máy ảnh 22 Lưu ý vị trí kích thước mặt phẳng hình ảnh ảo tùy ý, nghĩa tăng gấp đơi kích thước hình ảnh ảo miễn nhân đơi khoảng cách với lỗ kim Sau xóa hình ảnh thật, cịn lại đại diện "ảnh hình chóp cụt" máy ảnh hình 2.9 [16] Hình 2.9 Ảnh hình chóp cụt Lỗ kim thay đầu hình chóp nhìn thấy, hình ảnh đại diện mặt phẳng hình ảnh ảo Hình ảnh đại diện sử dụng phần sau 2.2.3 Các tham số nội với phép biến đổi 2D Trong phần trước, tác giả viết giải thích vectơ tọa đợ hình ảnh 3D, chuyển thành tọa đợ hình ảnh 2D đồng nhất Ngồi ra, viết hiểu vectơ tọa độ đồng nhất 2D chuyển thành một tập hợp điểm 2D Điều cho mợt nhìn ma trận nội tại: một chuỗi phép biến đổi 2D Chúng ta phân tách ma trận nợi thành một chuỗi phép biến đổi cắt, chia tỷ lệ dịch, tương ứng với độ lệch trục, độ dài tiêu cự điểm bù chính, tương ứng cơng thức (2-2): 23 K= (2-2) = (2DTranslation) × (2DScaling) × (2Dshear) Một phân rã tương đương cắt sau chia tỷ lệ cơng thức (2-3): K= (2-3) (2DTranslation) × (2DScaling) × (2Dshear) Giải thích phân tách tham số bên bên thành lĩnh vực 3D 2D một cách tương ứng Một kết đáng ý điều tham số nội ảnh hưởng đến khả hiển thị đối tượng bị chặn tiết lộ phép biến đổi 2D đơn giản khơng gian hình ảnh 2.3 Thuật tốn Levenberg-Marquardt 2.3.1 Giới thiệu 2.3.1.1 Giới thiệu tốn bình phương cực tiểu phi tuyến Bài tốn bình phương cực tiểu phi tuyến [23] sử dụng cần khớp một hàm ŷ(t; p) một biến độc lập t một vectơ n tham số p đến một tập hợp m điểm liệu (ti, yi), để giảm thiểu tổng bình phương trọng số lỗi (hoặc phần dư trọng số) liệu đo yi hàm phù hợp với đường cong ŷ(t; p) Thước đo mức đợ phù hợp có giá trị vơ hướng gọi tiêu chuẩn sai số chi bình phương tổng bình phương biến phân phối thơng thường phân phối phân phối Chi bình phương, cơng thức (2-4)-(2-6) χ 2(p)= (2-4) 24 Trong một số trường hợp, Levenberg-Marquardt rất chậm để hợi tụ Điều đặc biệt mơ hình có mười tham số u cầu thuật tốn nhích chậm dọc theo không gian thu thập liệu hẹp.[15] 2.4 Biểu đồ đốc dịnh hướng 2.4.1 Giới thiệu Biểu đồ độ dốc định hướng (HOG) [13] mợt loại trích x́t đặc trưng Mục đích trích xuất đặc trưng trừu tượng hóa đối tượng cách trích x́t đặc trưng đối tượng bỏ thơng tin khơng hữu ích Vì vậy, HOG sử dụng chủ yếu để mơ tả hình dạng xuất một đối tượng ảnh Bản chất phương pháp HOG sử dụng thông tin phân bố cường độ độ đốc hướng biên để mô tả đối tượng cục bợ ảnh Các tốn tử HOG cài đặt cách chia nhỏ một ảnh thành vùng con, gọi "ô" với ô, ta tính tốn mợt histogram hướng độ dốc cho điểm nằm ô Ghép biểu đồ lại với ta có mợt biểu diễn cho ảnh ban đầu Để tăng cường hiệu nhận dạng, biểu đồ cục bợ chuẩn hóa đợ tương phản cách tính một ngưỡng cường độ một vùng lớn ô, gọi khối sử dụng giá trị ngưỡng để chuẩn hóa tất khối Kết sau bước chuẩn hóa mợt vectơ đặc trưng có tính bất biến cao thay đổi điều kiện ánh sáng 2.4.2 Phương pháp Có bước để xây dựng mợt vectơ HOG cho hình ảnh biểu thị qua hình 2.10 [13] 30 Tiền xử lý Tính đợ dốc Tính vectơ đặc trưng cho Chuẩn hóa khối Tính tốn vectơ HOG Hình 2.10 Các bước xây dựng vectơ HOG 2.4.2.1 Tiền xử lý Trong bước này, để thuận tiện cho việc chia hình ảnh thành khối, tính tốn đặc trưng bước tiếp theo, cần thay đổi kích thước tất hình ảnh tập liệu mợt kích thước chung (ví dụ hình 2.11 [13]) Original Image : 720 X 475 Hình 2.11 Chuẩn hóa kích thước hình ảnh Bước chuẩn hóa hồn tồn không bắt buộc, một số trường hợp, bước cải thiện hiệu śt bợ mơ tả HOG Có ba phương pháp chuẩn hóa mà xem xét [13]: Quy định chuẩn Gamma: Trong trường hợp này, ta lấy log(p) pixel p hình ảnh đầu vào Chuẩn hố gốc-vng: Ở lấy sqrt(p) pixel p hình ảnh đầu vào Theo định nghĩa, bình thường bậc hai nén cường độ điểm ảnh đầu vào thấp nhiều so với chuẩn bình thường gamma 31 Chuẩn hóa phương sai: Ở đây, tính cần giá trị cường đợ điểm ảnh trung bình đợ lệch tiêu chuẩn hình ảnh đầu vào Với điểm ảnh ta trừ giá trị trung bình cường đợ điểm ảnh sau chuẩn hóa cách chia cho đợ lệch chuẩn 2.4.2.2 Tính độ dốc Đây bước đầu tiên, thực hai phép nhân chập ảnh gốc với chiều, tương ứng với toán tử lấy đạo hàm theo hai hướng Ox Oy Trong đó, hướng tương ứng công thức (2-23): Dx =[-1 1] Dy =[1 -1]T (2-23) Với một ảnh đầu vào I, có ảnh đạo hàm riêng theo hướng đó, theo cơng thức (2-24): Ix = I * D x (2-24) Iy = I * D y Khi đó, tính đợ đốc bao gồm hai thành phần cường độ hướng theo công thức (2-25), (2-26): Cường độ: |G| = (2-25) Hướng: θ = (2-26) Đối với hình ảnh màu, đồ đốc ba kênh (red, green blue) đánh giá Độ lớn độ đốc một điểm ảnh giá trị lớn nhất cường độ độ đốc ba kênh, góc góc tương ứng với đợ đốc tối đa 2.4.2.3 Tính vectơ đặc trưng cho Để tính tốn vectơ đặc trưng cho ơ, cần chia hình ảnh thành khối, khối lại chia thành ô Để xác định số khối, sử dụng công thức (2-27): nblock_image = (2-27) 32 đó: Wimage, Wblock, Wcell: chiều rộng ảnh, khối, ô Himage, Hblock, Hcell: chiều dài ảnh, khối, ô Sau xác định số khối kích thước khối, ơ, để tính tốn vectơ đặc trưng cho ô, cần: Chia không gian hướng thành p bin(số chiều vectơ đặc trưng ô) Rời rạc hóa góc hướng nghiêng điểm ảnh vào bin Giả sử góc hướng nghiêng pixel vị trí (x,y) có đợ lớn alpha(x,y) Trường hợp rời rạc hóa unsigned-HOG với p=9: B(x,y) = round mod p (2-28) Trường hợp rời rạc hóa signed-HOG với p= 18 B(x,y) = round mod p (2-29) Giá trị bin định lượng tổng cường độ biến thiên điểm ảnh thuộc bin Sau tính tốn đặc trưng ơ, ta nối vectơ đặc trưng ô để thu vectơ đặc trưng khối Số chiều vectơ đặc trưng khối tính theo cơng thức (2-30): sizeblock = n*sizecell (2-30) tong đó: n: số ô khối sizecell: số chiều vectơ đặc trưng ô (sizecell=9 sử dụng “unsigned- HOG” sizecell=18 sử dụng “signed-HOG”) 33 Ví dụ: Trong trường hợp này, hình ảnh có kích thước 64x128, ta chia hình ảnh thành khối có kích thước 16x16 Mỗi khối bao gồm ơ, có kích thước 8x8 hình 2.12[13] Hình 2.12 Chia hình ảnh thành Tiếp theo, tiến hành tính tốn đặc trưng HOG Hình 2.13 Tính tốn đặc trưng HOG ô 34 Tại cell, xây dựng một biểu đồ cường độ độ đốc cách chọn pixel vào biểu đồ Trọng số chọn pixel phụ tḥc hướng cường đợ đợ đốc (được tính tốn từ bước 2) pixel (ví dụ hình 2.14 [13]) Hình 2.14 Chọn pixel theo hướng cường đợ Như hình ảnh trên, pixel có bao quanh màu xanh lam Nó có hướng 80 đợ cường đợ 2, ta thêm vào ô thứ (hướng 80 độ) Tiếp theo pixel có bao quanh màu đỏ Nó có hướng 10 đợ cường đợ Vì khơng có ô 10 độ, nên ta chọn vào ô độ 20 độ, ô thêm đơn vị Sau chọn hết pixel mợt kích thước 8x8, ta thu kết hình 2.15 Hình 2.15 Biểu đồ thể lượt chọn cho ô 35 2.4.2.4 Chuẩn hóa khối Để tăng cường hiệu nhận dạng, biểu đồ cục bộ chuẩn hóa đợ tương phản cách tính mợt ngưỡng cường độ một khối sử dụng giá trị để chuẩn hóa tất khối Kết sau bước chuẩn hóa mợt vectơ đặc trưng có tính bất biến cao thay đổi điều kiện ánh sáng Có nhiều phương pháp dùng để chuẩn hóa khối Gọi v vectơ cần chuẩn hóa chứa tất biểu đồ mội khối ‖v(k)‖ giá trị chuẩn hóa v theo chuẩn k=1, e mợt số nhỏ Khi đó, giá trị chuẩn hóa tính mợt công thức (2-31)-(2-33): L2 – norm : f = (2-31) L1 – norm : f = (2-32) L1 – sqrt : f = (2-33) Ghép vectơ đặc trưng khối thu vectơ đặc trưng R-HOG cho ảnh Số chiều vectơ đặc trưng ảnh tính theo cơng thức (2-34): sizeimage = n * sizeblock (2-34) đó: n: số khối hình ảnh sizeblock: số chiều vectơ đặc trưng khối 2.4.2.5 Tính tốn vectơ đặc trưng HOG Mợt ví dụ với hình ảnh kích thước 64x128, chia thành khối 16x16 chồng nhau, có khối ngang 15 khối dọc, nên có 7x15 = 105 khối Mỗi khối gồm ô Khi áp dụng biểu đồ cho ô, khối đại diện mợt vectơ có kích thước 36x1 Vì vậy, nối tất vectơ mợt khối lại với 36 nhau, ta thu vectơ đặc trưng HOG ảnh có kích thước 105x36x1 = 3780x1 2.5 Support vector machine 2.5.1 Giới thiệu Support vector machine hay Máy vectơ hỗ trợ (SVM) [25] một thuật tốn tḥc nhóm học có giám sát dùng để phân chia liệu thành nhóm riêng biệt Ý tưởng SVM tìm mợt siêu phẳng để phân tách điểm liệu hình 2.16 [25] Hình 2.16 Đường phân cách điểm liệu SVM không gian chiều 37 2.5.2 Lề Lề khoảng cách siêu phẳng đến điểm liệu gần nhất tương ứng với phân lớp SVM cố gắng tối ưu thuật tốn cách tối đa hóa giá trị lề Hình 2.17 Biểu diễn lề SVM Theo hình 2.17 [25], ta chọn hai siêu phẳng lề H1 qua điểm thuộc lớp âm H2 qua điểm thuộc lớp dương song song với H0 H1 : wT x + b = -1 (2-35) T H2 : w x + b = Khoảng cách H1 đến H0 d- Khoảng cách H0 đến H0 d+ 2.5.3 Tính Lề Khoảng cách từ mợt điểm xk đến siêu phẳng H0 có cơng thức (2-36): d= = (2-36) 38 Từ ta tính mức lề công thức (2-37): m = d_ + d+ = (2-37) Vậy việc huấn luyện giải thuật SVM tương đương với tốn cực tiểu hóa với điều kiện (2-38)(2-39) : wT xi + b ≤ -1, if yi = -1 (2-38) wTxi + b ≥ 1, if yt = (2-39) Nhân hai vế bất đẳng thức (2-38) (2-39) với yi ta có điều kiện thu gọn (2-40): yi.(wTxi + b) > = i = n (2-40) Với điều kiện này, tốn Hard Margin SVM Việc tìm margin cực đại giải tốn đối ngẫu Lagrange Cơng thức hàm tối ưu cho Hard Margin SVM viết lại (2-40): (w,b) = (2-41) Điều kiện: yi (wTxi + b) ≥ i = n 2.5.4 Lề mềm Để tránh khớp, nhiều để muốn có lề cao, ta phải chấp nhận việc mợt vài liệu chia khơng xác, lề trường hợp gọi lề mềm Hard Margin ám việc tìm lề mà tất liệu thỏa mãn phận chia Với toán thực tế, việc tìm lề cứng nhiều bất khả thi, việc chấp nhận sai lệch mợt mức chấp nhận vô cần thiết Với lề mềm, hàm mục tiêu có thêm mợt số hạng để giúp tối thiểu hy sinh (2-42): +C (2-42) đó: C: Hằng số ξ = [ξ1, ξ2, …,ξn] 39 Điều kiện ràng buộc thay đổi thành (2-43): yi (wTxi + b) ≥ 1- ξi - ξi – yi (wTxi + b) ≤ 0, i = n (2-43) ξi ≥ 0, i = n Công thức hàm tối ưu cho lề mềm SVM (2-44): (w, b, ξ) = arg Điều kiện: - ξi – yi (wTxi + b) ≤ 0, i = n (2-44) ξi ≥ 0, i = n 2.5.5 Nhân Nhân SVM một hàm số biến đổi liệu x từ không gian đặc trưng ban đầu thành liệu một không gian hàm số Ф(x) (ví dụ hình 2.18 [25]) Hình 2.18 Dùng nhân để biến đổi liệu chiều thành chiều Ngồi ra, có mợt số hàm nhân thông dụng SVM bảng 2.1 40 Bảng 2.1 Công thức một số hàm nhân (kernel) thông dụng SVM Tên nhân Công thức Linear Ф( x, z) = xT z Polynomial Ф( x, z) = (r + γxT z)d Radial Basic Function (RBF) Ф(x, z) = exp(-γ Sigmoid ), γ> Ф( x, z) = tanh(γxTz + r ) 2.5.6 Nhận xét Ưu điểm: Cơ sở toán học chặt chẽ Dự đoán rất nhanh Tiết kiệm bợ nhớ Có thể giải hai tốn tuyến tính phi tuyến tính Hoạt đợng hiệu liệu có số lượng chiều lớn Khuyết điểm: Dữ liệu trước h́n luyện cần phải trích chọn tḥc tính phù hợp Không phù hợp với số lượng liệu lớn thời gian h́n luyện cao Mơ hình có xu hướng khớp số lượng đặc trưng nhiều số lượng mẫu 2.6 Random forest 2.6.1 Giới thiệu Random forest [26] một bộ phân lớp bao gồm một tập hợp định.Random forest đưa dự đốn dựa mợt c̣c bỏ phiếu định riêng lẻ 2.6.2 Phương pháp Mỗi định RF xây dựng dựa mợt thuật tốn A với tập liệu h́n luyện S mợt vectơ ngẫu nhiên θ, θ lấy mẫu dựa một số phân phối 41 Để xác định một RF cụ thể, cần xác định thuật toán A phân phối θ Có nhiều cách để làm điều này, tơi mơ tả mợt cách số sau: Khởi tạo θ: Lấy một mẫu ngẫu nhiên từ S, cụ thể chúng tối lấy mẫu một tập liệu h́n luyện S' có kích thước m' cách sử dụng phân phối liên tục S Tôi xây dựng chuỗi I1, I2, , It một tập một tập hợp đặc trưng ([d]) có kích thước k, tạo cách lấy mẫu thống nhất phần tử ngẫu nhiên từ [d] Tất biến ngẫu nhiên tạo thành vectơ θ Sử dụng thuật tốn A (ví dụ: sử dụng thuật toán ID3) để xây dựng định dựa bợ mẫu S', giai đoạn phân tách thuật toán, thuật toán giới hạn việc chọn mợt tính tối đa hóa Gain từ tập It Nếu k nhỏ, hạn chế ngăn ngừa mức 2.6.3 Nhận xét Ưu điểm: Random forest giải tốn phân lớp hồi quy Có khả xử lý tập liệu lớn nhiều chiều Có phương pháp hiệu để ước tính liệu bị thiếu trì đợ xác thiếu phần lớn liệu Có nhiều phương pháp cân lỗi số lượng liệu lớp không đồng Nhược điểm: ❖ Không giống định, phân lớp tạo random forest rất khó để giải thích 2.7 Perceptron đa lớp 2.7.1 Giới thiệu Perceptron đa lớp (MLP) [27] một mạng thần kinh đơn giản tạo từ liên kết Perceptron tảng để hiểu mạng khác phức tạp học sâu 42 Hình 2.19 Cấu trúc Perceptron đa lớp MLP tập hợp Perceptron chia làm nhiều nhóm, nhóm tương ứng với mợt lớp Trong hình 2.19 có lớp: lớp đầu vào, lớp đầu ra, lớp ẩn 2.7.2 Phương pháp Phương pháp phổ biến nhất để tối ưu MLP Gradient Descent (GD) Để áp dụng GD, cần tính gradient hàm mất mát theo ma trận trọng số W(l) vectơ bias b(l) Trước hết, cần tính kết dự đốn ŷ với mợt đầu vào x theo cơng thức (2-45)-(2-48): a(0) = x z(l) = W(l)Ta (l-1) + b(l), l = 1,2, , L a(l) = f (z(l)), l = 1,2, , L ŷ= a(L) (2-45) (2-46) (2-47) (2-48) Giả sử J(W, b, X, Y) một hàm mất mát tốn, W, b tập hợp tất ma trận trọng số lớp biases lớp X, Y cặp liệu huấn luyện với cột tượng ứng với mợt điểm liệu Để áp dụng Gradient 43 Descent, cần tính , l = 1,2, ….,L Ví dụ hàm mất mát hàm Mean Square Error (MSE) có cơng thức sau (2-49): J(W, b, X, Y) = = (2-49) Theo cơng thức trên, việc tính tốn trực tiếp giá trị phức tạp hàm mất mát không phụ thuộc trực tiếp vào hệ số Phương pháp phổ biến nhất dùng lan truyền ngược giúp tính đợ dốc ngược từ lớp cuối đến lớp Lớp cuối tính tốn trước gần gũi với kết dự đốn hàm mất mát Việc tính tốn đợ dốc lớp trước thực dựa quy tắc đạo hàm hàm hợp 2.7.3 Nhận xét Ưu điểm: MLP giải tốn phân lớp hồi quy Thời gian dự đoán nhanh Nhược điểm: Khi số lượng lớp ẩn lớn, số lượng hệ số cần tối ưu lớn lên mơ hình trở nên phức tạp Dẫn tới tốc đợ tính tốn chậm dễ bị tượng khớp MLP một hộp đen Khó biết kết dự đốn mơ hình tính tốn 44 ... cơng thức (2- 2): 23 K= (2- 2) = (2DTranslation) × (2DScaling) × (2Dshear) Một phân rã tương đương cắt sau chia tỷ lệ cơng thức (2- 3): K= (2- 3) (2DTranslation) × (2DScaling) × (2Dshear) Giải thích... y) tọa độ khuôn mặt hình ảnh) 2. 1.3 .2 Phát điểm xác định cấu trúc quan trọng khn mặt Với vùng hình chữ nhật chứa khuôn mặt phát hiện, áp dụng Bước 2: phát cấu trúc quan trọng khn mặt Có nhiều... xạ tới điểm khuôn mặt Các số tọa đợ hiển thị hình 2. 1 [19] Hình 2. 1 Hiển thị tọa đợ 68 vị trí quan trọng mặt từ bộ liệu iBUG 300-W 17 2. 2 Máy ảnh 2. 2.1 Giới thiệu thuật ngữ 2. 2.1.1 Ma trận