1. Trang chủ
  2. » Giáo Dục - Đào Tạo

2667 10597 1 pb 7379

13 36 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 13
Dung lượng 2,75 MB

Nội dung

Tạp chí Tin học Điều khiển học, T.29, S.2 (2013), 173–185 XÁC ĐỊNH VỊ TRÍ MẮT NGƯỜI TRONG VIDEO BẰNG CÁCH KẾT HỢP DỊ TÌM VÀ THEO VẾT CÁP PHẠM ĐÌNH THĂNG1 , DƯƠNG CHÍ NHÂN2 , NGƠ ĐỨC THÀNH3 , LÊ ĐÌNH DUY1 , DƯƠNG ANH ĐỨC1 Trường Trường The Đại học Công nghệ Thông tin, ĐHQG TP HCM Đại Học Khoa Học Tự Nhiên, ĐHQG TPHCM Graduate University for Advanced Studies (Sokendai), Japan Tóm tắt Bài báo trình bày phương pháp xác định vị trí mắt người dựa việc kết hợp dò tìm mắt người (eye detector) theo vết mắt người (eye tracker) Phương pháp giúp cải tiến kết xác định vị trí mắt người nhờ dò tìm cung cấp ước lượng tốt cho vị trí ứng viên mắt người, theo vết tìm vị trí tốt vị trí ứng viên việc sử dụng thêm thông tin thời gian Thực nghiệm tiến hành video từ sở liệu TRECVID 2009, sở liệu “Tư Thế Đầu Người” (HEAD POSE DATASET) trường đại học Boston video từ Đài truyền hình Việt Nam cho thấy kết phương pháp kết hợp đem lại hiệu cao so với việc sử dụng dò tìm theo vết đơn lẻ Từ khóa Xác định vị trí mắt người, dò tìm mắt người, theo vết mắt người Abstract In this paper, we propose a method to combine an eye tracker and an eye detector for robust eye localization in video Instead of sequential intergration of the two systems, we use eye locations suggested by an eye detector for initialization and measurement of updating steps of particlesused inan eye tracker This combination helps to improve the localization performance since the detector provides good estimation of eye location candidates, meanwhile the tracker helps to find the best eye location by using temporal information Experiments were conducted on two benchmark video databases (TRECVID and Boston University Headpose datasets) and videos from Vietnamese Television The results show that our method achieves a remarkable improvement compared to the state-of-the-art eye detector and eye tracker Key words Eye localization, human eye detection, human eye tracking GIỚI THIỆU Dò tìm đặc trưng mặt người nhiệm vụ yếu nhiều ứng dụng liên quan đến ảnh mặt người như: nhận dạng mặt người, xác định biểu cảm xúc mặt người, điều khiển tương tác người máy Những đặc trưng khuôn mặt người bật mắt, lông mày, mũi, miệng, cằm Giữa đặc trưng này, mắt người có vai trò quan trọng việc chuyển giao tín hiệu tương tác, ý định dẫn người dùng cho máy tính Thơng tin vị trí mắt người mặt người ổn định nên việc xác định vị 174 CÁP PHẠM ĐÌNH THĂNG ccs trí mắt người bước cần thiết nhiều phương pháp phân loại ảnh mặt người, chỉnh chuẩn hoá ảnh mặt người Chính có nhiều nghiên cứu chuyên sâu nhận dạng mắt người ảnh mặt người video [1, 3, 4, 5] Tuy nhiên việc dò tìm vị trí mắt người gặp phải nhiều khó khăn thay đổi tư đầu người, mắt nhắm mở, điều kiện ánh sáng thay đổi, bị che khuất phần tóc, đeo kính nên việc xác định vị trí mắt người cách xác thách thức Hình 1cho thấy số ví dụ trường hợp khó khăn gặp phải, liệu lấy từ sở liệu TRECVID 2009 Hình Ví dụ trường hợp khó khăn gặp phải a) Biểu mặt người thay đổi, b) tư đầu người thay đổi, c) nhắm mắt che khuất, d) Người có đeo kính Hiện nay, việc xác định vị trí mắt người video cách áp dụng kỹ thuật xử lý ảnh thông thường tiến hành qua bước chính: (1) xác định vị trí mặt người; (2) xác định vị trí mắt người ảnh mặt người Tiến trình sau: dò tìm mặt người sử dụng để xác định vị trí mặt người khung hình đầu tiên, sau việc xác định vị trí mắt người dựa vào dò tìm theo vết mắt người Đối với phương pháp dựa dò tìm, ý tưởng sử dụng dò tìm khung hình video Bộ dò tìm mắt người mạnh ảnh mặt người nhìn thẳng mắt người mở Tuy vậy, phương pháp bị hạn chế biểu cảm xúc mặt người thay đổi nhiều (tư đầu người, nhắm mắt, cười làm vùng mắt bị nhỏ lại) Mặt khác, phương pháp sử dụng theo vết mắt người [12, 13] số trường hợp đáp ứng hạn chế dò tìm mắt người, ước lượng vị trí mắt người mà nhắm mắt bị ảnh hưởng tư đầu người thay đổi Tuy nhiên, độ xác theo vết phụ thuộc nhiều vào bước khởi tạo ban đầu Hơn nữa, theo vết thường không ổn định dễ bị sai chuyển động nhanh thời điểm dẫn đến ước lượng khung ảnh khơng xác Trong viết này, phát triển phương pháp kết hợp kỹ thuật tiên tiến trước để xác định vị trí mắt người video Phương pháp kết hợp kết dò tìm mắt người theo vết mắt người, theo vết mắt người sử dụng mơ hình “particle filter” Cụ thể thơng tin có từ theo vết giúp xác định vị trí mắt người khung ảnh mà dò tìm bị lỗi Mặt khác thơng tin dò tìm tích hợp vào theo vết thời điểm nên việc tích luỹ lỗi theo vết giảm xuống theo thời gian Đối với việc theo vết đối tượng video chuỗi ảnh, “particle filter” chứng tỏ lợi ước lượng khơng tuyến tính khơng phải phân bố Gauss Trong particle filter, thông tin quan trọng particle trọng số nó, trọng số ước lượng xác độ xác theo vết lại cải thiện Chính vậy, phương pháp chúng tơi tập trung vào việc tính tốn cập nhật lại trọng số cách kết hợp thơng tin cung cấp dò tìm theo vết mắt người Thực nghiệm tiến hành video từ sở XÁC ĐỊNH VỊ TRÍ MẮT NGƯỜI TRONG VIDEO 175 liệu video TRECVID 2009, “Tư Thế Đầu Người” đại học Boston Hoa Kỳ video từ đài truyền hình Việt Nam Kết thực nghiệm cho thấy độ xác phương pháp kết hợp cao phương pháp sử dụng dò tìm theo vết riêng lẻ CÁC CƠNG TRÌNH NGHIÊN CỨU LIÊN QUAN Trong năm gần đây, có số lượng lớn phương pháp xác định vị trí mắt người ảnh video công bố, phương pháp chia làm hướng riêng biệt sau [3, 16]: (1) sử dụng thiết bị đo xung điện để ghi lại thông tin xung điện vùng da xung quanh hốc mắt sử dụng thiết bị đặc biệt gắn trước ống kính máy quay phim[17, 18], (2) sử dụng kỹ thuật xử lý ảnh để xác định vị trí mắt người [1, 3, 4, 5] 2.1 Các phương pháp sử dụng thiết bị phụ trợ Đối với hướng (1), phương pháp dò tìm phải tốn chi phí cao cho thiết bị đo xung điện Các phương pháp [17, 18] xác định vị trí mắt người mạnh nhanh cách dùng số thiết bị phần cứng đeo trực tiếp vào mắt người, thiết bị chiếu đèn hồng ngoại vào mắt người làm cho đồng tử sáng phân biệt với vùng khác, từ xác định vị trí mắt người Tuy nhiên phương pháp gặp phải hạn chế sau: video phải quay khoảng cách gần với mắt người, độ xác phụ thuộc nhiều vào mắt nhắm, kích thước mắt, video thu phòng thí nghiệm 2.2 Các phương pháp sử dụng kỹ thuật xử lý ảnh xác định vị trí mắt người 2.2.1 Dò tìm mắt người Như trình bày phần giới thiệu, ý tưởng phương pháp sử dụng dò tìm khung hình video Các kỹ thuật dò tìm khung hình dựa thơng tin hình học dựa đặc trưng Dựa thơng tin hình học, phương pháp xây dựng mẫu hình học mắt người xác định vị trí mắt người khung hình dựa việc so khớp mẫu thông qua độ đo tương đồng Yuille cộng [5] phân vùng khn mặt tìm vùng giống mắt người ước lượng vị trí mắt Một mở rộng phương pháp Yuille, K Lam cộng [19] ước lượng vị trí gần mắt người việc tính trung bình sử dụng góc mắt xác định để giảm số lần lặp việc tối ưu hoá mẫu Cũng nằm hướng tiếp cận này, vào năm 2008, Valenti cộng [3] công bố phương pháp xác định vị ví mắt người cách kết hợp dò tìm mắt người kỹ thuật “isophote voting” để xác định mẫu vòng tròn mắt người Thực nghiệm cho thấy phương pháp có kết tốt trường hợp ánh sáng môi trường bị thay đổi hay tư đầu người thay đổi Các phương pháp dựa thơng tin hình học đạt độ xác cao với ảnh mặt người nhìn thẳng, nhiên ảnh đầu vào lại đòi hỏi phải có độ tương phản cao, mơ hình hình học bước khởi tạo phải xác, chưa đáp ứng với trường hợp chuyển động đầu người thay đổi lớn Mặt khác, số hướng tiếp cận dựa vào rút trích đặc trưng liên quan đến mắt người thường trải qua giai đoạn chính: (1) rút trích đặc trưng, (2) dùng kỹ thuật phân lớp 176 CÁP PHẠM ĐÌNH THĂNG ccs xác suất để xác định vị trí mắt người Ở giai đoạn (1), số phương pháp công bố dựa thông tin đặc trưng cạnh [6], đặc trưng dạng sóng [10] Và giai đoạn (2), kỹ thuật SVM [7, 9], Adaboost mạng nơ ron [2, 8, 9] sử dụng Dựa mô vậy, [2, 9] trình bày phương pháp sử dụng mạng nơ ron đa lớp: dò tìm vị trí mắt người huấn luyện thơng qua mạng nơ ron xác định vị trí mắt người trường hợp mắt xoay, co dãn hoạt động tốt với điều kiện ánh sáng môi trường thay đổi Tuy nhiên, phương pháp huấn luyện với ảnh mặt người nhìn thẳng 2.2.2 Theo vết mắt người Với phương pháp sử dụng theo vết mắt người, sử dụng theo vết để xác định vị trí mắt người qua chuỗi ảnh mặt người video Phương pháp thông thường tiến hành thông qua bước: (1) bước khởi tạo xác định vị trí mắt người khung hình đầu tiên, (2) bước dùng theo vết để xác định vị trí mắt người khung hình Wu Junwe cộng [13] xác định vị trí mắt người khung hình tự động cách dựa nhị phân xác suất, sau thông tin ban đầu cung cấp cho theo vết để xác định vị trí mắt người khung hình Phương pháp cho thấy ngồi việc xác định vị trí mắt người dò tìm nháy mắt video Các phương pháp hướng cho thấy đáp ứng trường hợp tỉ lệ hay kích thước mắt người bị thay đổi video với mặt người nhìn thẳng PHƯƠNG PHÁP TIẾP CẬN ĐỀ XUẤT Như đề cập phần trước, ý tưởng quan trọng mơ hình đề xuất nhằm khai thác thông tin video thơng tin thời gian, thơng tin chuyển động để nâng cao hiệu cho toàn hệ thống xác định vị trí mắt người Khác với cách tiếp cận trước đây, không đơn sử dụng dò tìm theo vết mắt người cách riêng lẻ mà tích hợp thành hệ thống Nhờ vậy, hệ thống đề xuất có ưu điểm sau: (1) nhờ vào kết từ dò tìm, theo vết mắt người khởi tạo cách tự động; (2) nhờ vào vị trí mắt người khung hình trước, theo vết xác định vị trí mắt người khung hình cách liên tục trường hợp dò tìm khơng thể xác định vị trí mắt; (3) ứng với thời điểm định, kết dò tìm sử dụng để hiệu chỉnh kết dò tìm theo vết nhờ vậy, đảm bảo kết dò tìm xác Chính nhờ cải tiến trên, kết dò tìm toàn hệ thống nâng cao đáng kể Hình mơ tả mơ hình hệ thống kết hợp dò tìm mắt người theo vết mắt người 3.1 Dò tìm mắt người sử dụng kỹ thuật isophote Một phương pháp dò tìm vị trí mắt người đạt hiệu cao kể đến phương pháp sử dụng “isophote voting” [3] Dựa đặc điểm dạng hình học mắt đường cong đối xứng, phương pháp tìm cách xác định XÁC ĐỊNH VỊ TRÍ MẮT NGƯỜI TRONG VIDEO 177 Hình Mơ hình hệ thống kết hợp dò tìm theo vết vùng có nhiều dạng đường cong đối xứng ảnh nhằm tìm vùng biên mắt Sau đó, kĩ thuật bầu chọn (voting) có trọng số áp dụng để tìm vị trí tâm mắt cho xác Trong phương pháp này, tác giả sử dụng khái niệm “isophote” Đây đường cong kết nối điểm ảnh có độ sáng Hình minh họa cho isophote ảnh Hình Minh hoạ Isophote ảnh mắt người a) Ảnh nguyên bản; b) Các đường cong isophote tương ứng Nhờ isophote độc lập với phép xoay thay đổi tuyến tính ánh sáng, phương pháp Valenti thể nhiều ưu điểm q trình xác định vị trí mắt Các thực nghiệm cho thấy phương pháp đạt hiệu cao với điều kiện ánh sáng khác hay tư đầu người thay đổi Với ưu điểm trên, dò tìm tích hợp vào hệ thống xác định vị trí mắt người Và kết thực nghiệm chứng minh việc kết hợp với theo vết, độ xác nâng cao xác định tốt điều kiện ngoại cảnh thay đổi (hướng khuôn mặt thay đổi nhiều, mắt nhắm, ) 3.2 Theo vết mắt người sử dụng particle filter framework Bộ theo vết mắt người sử dụng mơ hình theo vết sử dụng particle filter kết hợp với biểu đồ đặc trưng màu Perez cộng [14] đề xuất Mỗi đối tượng theo vết (mắt người) biểu diễn N particle, particle thời điểm t mô tả vector St = (xt , yt , st ) với (xt , yt ) vị trí particle (vị trí mắt) st tỉ lệ (kích thước mắt) particle Như vậy, trạng thái mắt người xác định dãy 178 CÁP PHẠM ĐÌNH THĂNG ccs trạng thái particle sau: Xt = {(Sti , πti )|i = N } π trọng số particle, Σ( i = 1)N πti = Ý tưởng mơ hình particle filter xấp xỉ xác xuất hậu nghiệm p(Xt , Zt ) tập mẫu gán trọng số Trong Zt trạng thái mắt người quan sát thời điểm t Và trọng số particle tính dựa khoảng cách Bhattacharyya biểu đồ đặc trưng màu particle tương ứng với biểu đồ đặc trưng màu mẫu tính thời điểm khởi tạo 3.3 Xác định vị trí mắt người cách kết hợp dò tìm theo vết mắt người Để trì q trình theo vết với độ xác cao, theo vết mắt người cần phải đảm bảo trọng số particle tính tốn hợp lý Nếu trọng số particle khơng tính tốn hợp lý làm cho hệ thống dễ dàng dấu đối tượng khó phục hồi khung hình Do đó, trọng số particle yếu tố quan trọng định hiệu theo vết Trong mơ hình đề xuất, ngồi việc sử dụng dò tìm để khởi tạo tự động cho theo vết mắt người, kết dò tìm tích hợp vào bước tính tốn cập nhật trọng số cho particle giai đoạn theo vết nhằm đảm bảo bước hệ thống tính tốn cách hợp lý nhờ nâng cao đáng kể độ xác tồn hệ thống.Mơ hình đề xuất gồm có bước xử lý sau: (a) Khởi tạo Nhằm tránh việc khởi tạo thủ công cho theo vết, thời điểm dò tìm xác định vị trí mắt người, tham số cho theo vết khởi tạo Các tham số gồm có: - Biểu đồ đặc trưng màu tọa độ mắt trái mắt phải (x1 , y1 ), (x2 , y2 ) có từ dò tìm Biểu đồ màu dùng làm biểu đồ tham chiếu cho vùng mắt người khung hình - N : số lượng particles xung quanh điểm (x1 , y1 ), (x2 , y2 ) Trong thực nghiệm, tạo 300 particles ngẫu nhiên xung quanh vị trí mắt người để dự đốn vị trí điểm Do vùng mắt người ảnh nhỏ, nên số lượng particles lớn dẫn đến nhiều particles sinh cách xa vị trí thực mắt Ngược lại số lượng particles nhỏ không phủ hết vị trí cần thiết dùng cho dự đốn (b) Dự đốn Một mơ hình chuyển động áp dụng để ước lượng vị trí n particle khung hình Ta định nghĩa vector trạng thái sau: St = (xt , yt , st ) (xt , yt ) toạ độ vị trí mắt người st kích thước mắt người thời điểm t Cho lan truyền tập mẫu ước lượng chuyển động mắt người thơng qua mơ hình hồi qui động cấp (a second order autoregressive dynamic model) Công thức chuyển động cụ thể sau xt+1 = Axt + Bxt−1 + Cvt , vt ∼ N (0, σt ) yt+1 = Ayt + Byt−1 + Cvt , vt ∼ N (0, σt ) XÁC ĐỊNH VỊ TRÍ MẮT NGƯỜI TRONG VIDEO 179 st+1 = Ast + Bst−1 + Cvt , vt ∼ N (0, σt ) ma trận A, B đại diện cho thành phần bất biến ma trận C đại diện cho thành phần ngẫu nhiên σt phương sai phân phối chuẩn Gauss Như vt tỉ lệ với phân phối Gaussian sau vt = 2πσt2 e−zt /2σt (4) zt giá trị phát sinh ngẫu nhiên [−1, 1] Trong thực nghiệm giá trị a[i, j], b[i, j], c[i, j] 2, -1, để mơ phương trình chuyển động khơng (c) Cập nhật trọng số Để tính tốn trọng số wti cho particle theo vết, ước lượng xác suất điều kiện mô tả sau wti ∝ p(yt |xit ) (5) chuẩn hoá vào đoạn [0, 1] wti = wti i ΣN i=1 wt (6) Đây bước quan trọng việc cải tiến mơ hình kết hợp đề ra, Mục 3.4 trình bày chi tiết cách tính trọng số cách kết hợp trọng số dò tìm theo vết (d) Chọn lọc mẫu Những particle có trọng số thấp bị loại bỏ particle có trọng số cao giữ lại, tạo mẫu tốt cho xác định vị trí mắt Các bước 2, 3, tiếp tục lặp lại khung hình cuối video 3.4 Cập nhật trọng số tích hợp với thơng tin từ dò tìm mắt người Để gán trọng số cho tập mẫu chúng tơi tính hệ số Bhattacharyya biểu đồ tham chiếu (reference histogram) biểu đồ mục tiêu (target histogram) Sau sử dụng phân phối xác suất Gauss cho hệ số Bhattacharyya Khoảng cách Bhattacharyya ngắn thể trọng số cao Cụ thể sau πiB = 2 e−(dB )/(2σB ) (7) 2πσB dB khoảng cách Bhattacharyya biểu đồ tham chiếu biểu đồ particle phương sai phân phối chuẩn Gauss, thứ i, πiB trọng số chưa chuẩn hoá σB thực nghiệm chọn 10 kết tối ưu Tiếp theo, thông tin dò tìm mắt người sử dụng thời điểm để kết hợp với thành phần Gauss Bhattacharyya Trong trường hợp ta tính phân phối chuẩn Gauss cho khoảng cách Euclidean vị trí particle với vị trí cung cấp dò tìm mắt người, cụ thể sau 180 CÁP PHẠM ĐÌNH THĂNG ccs πiE = 2 e−(dE )/(2σE ) (8) 2πσE dE khoảng cách Euclidean vị trí particle vị trí cung cấp phương dò tìm mắt người, πiE trọng số thu từ tính tốn dò tìm σE = sai phân phối chuẩn Gauss, thực nghiệm ta sử dụng phân phối chuẩn hố σE Sau đó, trọng số chuẩn hoá vào đoạn [0,1] wi = πi N Σi=1 πi (9) πi trọng số thu từ dò tìm theo vết Và cuối thông tin dò tìm theo vết kết hợp sau wi =∝ ∗wiB + (1− ∝) ∗ wiE ∝ trọng số kết hợp theo vết dò tìm ∝ gán gần cho video có nhiều chuyển động khn mặt, ngược lại ∝ gán gần cho trường hợp sử dụng độ xác dò tìm chuyển động mặt người Trong báo này, việc sử dụng kết hợp trực tiếp hai trọng số mang tính tổng quát đảm bảo cho chi phí tính tốn thấp đáp ứng cho hệ thống thực thi thời gian thực Hơn nữa, kết thực nghiệm Mục 4.2 chứng minh hiệu mơ hình đề xuất so với phương pháp nhận dạng theo vết riêng lẻ 4.1 THỰC NGHIỆM Cơ sở liệu đánh giá Tiến hành thực nghiệm video chọn ngẫu nhiên từ sở liệu TRECVID 2009 Các khuôn mặt người video xuất với hướng nhìn khác nhau, kích cỡ khác nhau, nhiều thay đổi biểu khuôn mặt khác với môi trường hậu cảnh khác Cơ sở liệu đại học Boston bao gồm 45 video người thực động tác thay đổi tư đầu người điều kiện ánh sáng phòng thí nghiệm Cơ sở liệu có mặt người đầu người ln xuất trừ trường hợp đặc biệt cá nhân đối tượng tự làm che khuất phần Ngồi ra, thực nghiệm video thu từ đài truyền hình Việt Nam Mỗi video gồm khoảng 1000 khung hình chứa ảnh mặt người với động tác tư đầu người khác Để đánh giá độ xác chúng tơi sử dụng độ đo cho vị trí mắt người cơng bố Jesorsky cộng [15], độ đo sử dụng nhiều cơng trình cơng bố [3, 11] Cơng thức đo lường tỉ lệ lỗi chuẩn hố (normalize error) sau e= max(dlef t , dright ) d (11) XÁC ĐỊNH VỊ TRÍ MẮT NGƯỜI TRONG VIDEO 181 dlef t dright khoảng cách Euclidean vị trí mắt người xác định mơ hình vị trí mắt người bảng xác thực liệu (ground truth), d khoảng cách mắt trái mắt phải xác thực sở liệu Trong phần kết hợp dò tìm theo vết, tham số ∝ trọng số kết hợp Do trước đánh giá kết tồn hệ thống ta thực nghiệm đánh giá độ ảnh hưởng trọng số kết hợp thay đổi giá trị Hình 4c cho thấy kết hệ thống trọng số ∝ thay đổi với sở liệu đại học Boston Kết cho thấy tất trường hợp độ xác hệ thống gần tương đương Do thực nghiệm, chọn ∝=0.5 cho cân dò tìm theo vết Bảng thể kết hệ thống sở liệu TRECVID 2009, Boston VTV Thông số kích thước vùng mắt tính dựa vào nhân trắc học độ xác đánh giá với tỉ lệ lỗi chuẩn hoá khoảng từ [0, 0.5] Bảng Thực nghiệm sở liệu TRECVID2009 BOSTON Hình 4a thể biểu đồ độ xác hệ thống kết hợp đề xuất độ xác dò tìm theo vết sử dụng riêng lẻ với sở liệu TRECVID Từ kết cho thấy rằng, theo vết (tracker) bị lỗi hay hội tụ cục trọng số particle gần vị trí mà dò tìm (detector) trả lớn particle xa, giảm thiểu lỗi theo vết tăng độ xác theo vết Chính so sánh hệ thống kết hợp đề xuất (detector + tracker) theo vết (tracker) sử dụng riêng lẻ, độ xác e < 0.1 tăng 17% e < 0.5 tăng 12% Ngược lại, dò tìm (detector) bị lỗi theo vết ước lượng vị trí mắt người khung hình Kết so sánh độ xác hệ thống đề xuất dò tìm riêng lẻ (detector) e < 0.25 tăng 2% e < 0.5 tăng 3% Đối với sở liệu đại học Boston, thông số thử nghiệm đánh giá giống với thông số sử dụng đánh giá sở liệu Trecvid Kết thử nghiệm đánh giá trình bày Bảng biểu đồ 4b, kết cho thấy sử dụng kết hợp dò tìm theo vết độ xác hệ thống tăng lên đáng kể so với việc sử dụng riêng lẻ Ngoài ra, với kết thực nghiệm video thu từ VTV đài truyền hình Việt Nam cho thấy kết ổn định hệ thống kết hợp đề xuất Hình thể kết hệ thống kết hợp sở liệu đại học Boston với trường hợp khác mặt người có đeo kính, ánh sáng mơi trường thay đổi tư đầu người thay đổi (ngước lên, ngước xuống, quay trái, phải) 182 CÁP PHẠM ĐÌNH THĂNG ccs (a) (b) (c) Hình (a) Kết thực nghiệm sở liệu TRECVID 2009; (b) Kết thực nghiệm sở liệu Đại Học Boston; (c) Kết ảnh hưởng trọng số kết hợp thay đổi giá trị Hình Kết thực nghiệm sở liệu đại học Boston với trường hợp khác (a) (b) (c) Hình Kết so sánh: a) Hệ thống kết hợp, b) dò tìm, c) theo vết Thực nghiệm Hình so sánh kết hệ thống kết hợp theo vết dò tìm so với kết dò tìm theo vết riêng lẻ Khung hình thứ 155 trích từ video sở liệu Boston Trong trường hợp này, đầu người tư nghiêng sang phải dò tìm bị lỗi khơng dò tìm mặt người khung hình (Hình 6b), theo vết hệ thống kết hợp xác định vị trí mắt người Mặt khác so sánh theo vết hệ thống kết hợp kết thu từ hệ thống kết hợp xác hệ thống kết hợp giảm tỉ lệ lỗi từ bước trước nhờ kết dò tìm Một trường hợp khác, thí nghiệm Hình 7: khung hình 31 hệ thống bị lỗi nhờ dò tìm (khung hình 53) giúp cho theo vết giảm lỗi tích luỹ cho kết xác (khung hình 54, 55) Thực nghiệm tích hợp vị trí mắt người vào hệ thống chuẩn hoá nhận dạng ảnh mặt người Chuẩn hoá ảnh mặt người giai đoạn quan trọng hệ thống nhận dạng mặt người Việc xác định tự động vị trí mắt giúp cho hệ thống nhận dạng mặt người không giảm thiểu chi phí thời gian mà nâng cao độ xác cho hệ thống Bước XÁC ĐỊNH VỊ TRÍ MẮT NGƯỜI TRONG VIDEO 183 Hình Bộ dò tìm giúp cho theo vết giảm thiểu lỗi tích luỹ đầu tiên, dò tìm mặt người xác định vùng chứa mặt người Sau khoản cách hai vị trí trung tâm mắt trái phải đầu vào quan trọng cho cơng đoạn chuẩn hố ảnh mặt người Trong phần thực nghiệm tích hợp kết xác định vị trí mắt người vào hệ thống chuẩn hoá nhận dạng mặt người trường đại học Colorado State Hoa Kỳ Trong đó, trường hợp ảnh mặt người với tư đầu nhìn nghiêng xoay chuẩn hố lại Hình ví dụ trường hợp sử dụng vị trí mắt người để chuẩn hố ảnh mặt người dạng nhìn nghiêng tư xoay Và kết ảnh mặt người chuẩn hoá thành dạng nhìn thẳng dựa vào khoảng cách hai mắt Hình Kết sử dụng vị trí mắt người chuẩn hoá ảnh mặt người Đối với việc nhận dạng mặt người, tiến hành thực nghiệm sở liệu Boston Số ảnh mặt người sở liệu Boston 8955 ảnh người khác Thực nghiệm trường hợp: có sử dụng vị trí mắt người khơng sử dụng Khi khơng sử dụng vị trí mắt người thu 8158 ảnh mặt người cho kết Và sử dụng vị trí mắt kết 8591 ảnh Đối với sở liệu Boston nhờ kết vị trí mắt tích hợp nên giúp cho hệ thống nhận dạng khuôn mặt tư nhìn nghiêng xoay (những trường hợp dò tìm mặt người bị lỗi) nhờ nâng cao độ xác tồn hệ thống Hơn nữa, việc xác định vị trí mắt tự động giúp cho giảm thiểu nhiều thời gian chi phí cho việc gán nhãn mắt cho cơng đoạn chuẩn hố ảnh mặt người 184 CÁP PHẠM ĐÌNH THĂNG ccs KẾT LUẬN Bài báo đề xuất phương pháp xác định vị trí mắt người dựa việc kết hợp theo vết mắt người sử dụng particle filter với dò tìm mắt người Qua cho thấy lợi việc sử dụng thông tin thời gian chuyển động video Cả dò tìm theo vết sử dụng particle filter cho thấy hiệu việc kết hợp để tăng độ xác hệ thống Thực nghiệm cho thấy ưu việc kết hợp trường hợp tư đầu người thay đổi, mắt nhắm mắt người bị che khuất phần Kết thực nghiệm cho thấy độ xác hệ thống kết hợp tăng từ 3% ± 5% so với dò tìm riêng lẻ tăng từ 12% ± 17% so với theo vết riêng lẻ sở liệu TRECVID 2009 đại học Boston Ngoài thực nghiệm cho thấy kết vị trí mắt đạt nhiều lợi tích hợp vào hệ thống chuẩn hoá nhận dạng ảnh mặt người TÀI LIỆU THAM KHẢO [1] P Campadelli, R Lanzarotti, and G Lipori, Eye localization: a survey, The Fundamentals of Verbal and Non-verbal Communication and the Biometrical Issue, NATO Science Series, 2007 [2] W Peng, MB Green, J Qiang, J Wayman, Automatic eye detection and its validation, Proc 2005 IEEE CS Conf Computer Vision and Pattern Recognition (2005) 164–164 [3] R Valenti and T Gevers, Accurate eye center location and tracking using isophote curvature, Proc 2008 IEEE CS Conf Computer Vision and Pattern Recognition (2008) 1–8 [4] L Bai, L Shen, and Y Wang, A novel eye location algorithm based on radial symmetry transform, International Conf on Pattern Recognition (2006) 511—514 [5] A L Yuille, P W Hallinan, and D S Cohen, Feature extraction from faces using deformable templates, International Journal of Computer Vision (2) (1992) 99–111 [6] S Asteriadis, N Nikolaidis, A Hajdu, and I Pitas, An eye detec-tion algorithm using pixel to edge information, IEEE CS Conf on Control, Communications, and Signal Processing (2006) 1–4 [7] P Campadelli, R Lanzarotti, and G Lipori, Precise eye and mouth lo-calization, International Journal of Pattern Recognition and Artificial Intelligencece 23 (3) (2009) 359–379 [8] C Garcia and M Delakis, Convolutional face finder: A neural architecture for fast and robust face detection, IEEE Transactions on Pattern Analysis and Machine Intelligence 26 (11) (2004) 1408–1423 [9] X Tang, Z Ou, T Su, H Sun, and P Zhao, Robust precise eye location by adaBoost and SVM techniques, Advances in Neural Networks 3497 (2) (2005) 93—98 [10] J Huang and H Wechsler, Eye detection using optimal wavelet packets and radial basis functions, Journal of Pattern Recognition and Artificial Intelligence 13 (7) (1999) 1009–1026 [11] F Yang, J Huang, P Yang, D Metaxas, Eye localization through multiscale sparse dictionaries, IEEE Conf on Automatic Face and Gesture Recognition (0) (2011) 514–518 [12] K Grauman, M Betke, J Gips and G R Bradski, Communication via eye blinks detection and duration analysis in real time, Proc 2008 IEEE CS Conf.Computer Vision and Pattern Recognition (0) (2001) 1010–1017 XÁC ĐỊNH VỊ TRÍ MẮT NGƯỜI TRONG VIDEO 185 [13] Wu Junwen and Trivedi Mohan M., An eye localization, tracking and blink pattern recognition system: Algorithm and evaluation, ACM Transactions on Multimedia Computing, Communications, and Applications (2) (2010) [14] Prez Patrick, Hue Carine, Vermaak Jaco, and Gangnet Michel, Color-based probabilistic tracking, European Conference on Computer Vision (3) (2002) 661–675 [15] J Oliver, K J Kirchberg, and F Robert, Robust face detection using the hausdorff distance, International Conf on Audio- and Video-Based Biometric Person Authentication 2091 (2) (2001) 90–95 [16] A T Duchowski, Eye Tracking Methodology: Theory and Practice, Springer, 2007 [17] Z Zhu and Q Ji, Robust real-time eye detection and tracking under variable lighting conditions and various face orientations, Journal of Computer Vision and Image Understanding 98 (1) (2005) 124–154 [18] c Morimoto, D Koons, A Amir, and Flickner, Pupil detection and tracking using multiple light sources, Journal of Image and Vision Computing 18 (4) (2000) 331–335 [19] K Lam and H Yan, Locating and extracting the eye in human face images, Journal of Pattern Recognition 29 (5) (1996) 771—779 Ngày nhận 10 - - 2013 Nhận lại sau sửa ngày 04 - - 2013 ... 13 (7) (19 99) 10 09 10 26 [11 ] F Yang, J Huang, P Yang, D Metaxas, Eye localization through multiscale sparse dictionaries, IEEE Conf on Automatic Face and Gesture Recognition (0) (2 011 ) 514 – 518 ... Recognition (2006) 511 — 514 [5] A L Yuille, P W Hallinan, and D S Cohen, Feature extraction from faces using deformable templates, International Journal of Computer Vision (2) (19 92) 99 11 1 [6] S Asteriadis,... chuyển động cụ thể sau xt +1 = Axt + Bxt 1 + Cvt , vt ∼ N (0, σt ) yt +1 = Ayt + Byt 1 + Cvt , vt ∼ N (0, σt ) XÁC ĐỊNH VỊ TRÍ MẮT NGƯỜI TRONG VIDEO 17 9 st +1 = Ast + Bst 1 + Cvt , vt ∼ N (0, σt )

Ngày đăng: 04/11/2019, 23:57