Kĩ thuật tách biên video shot 33

Một phần của tài liệu Một số kĩ thuật truy tìm nhân vật trong các kho dữ liệu video lớn (Trang 39 - 40)

Luận văn tách shot dựa trên thông tin được cung cấp trong dữ liệu TRECVID (2004 → 2006), bao gồm: tên shot, vị trí bắt đầu, độ dài thời gian… (http://www-nlpir.nist.gov/projects/trecvid/). Trong trường hợp dữ liệu thực nghiệm không hỗ trợ thông tin ranh giới shot thì phương pháp Histogram sẽ được sử dụng.

Phương pháp tách shot trong dữ liệu TRECVID được đề xuất bởi Christian Petersohn, thuộc Viện Fraunhofer (Heinrich Hertz) tại Berlin [19]. Video được phân đoạn để tạo danh sách shot chủ (master list of shots). Kết quả lần duyệt thứ nhất qua các phân đoạn là những shot con (subshot) . Do tham chiếu shot chủ (master shot) được thiết kế để đánh giá thủ công, cần thực hiện lần duyệt thứ hai để tạo các shot chủ có chiều dài ít nhất là 2 giây. Trong lần duyệt thứ hai, bắt đầu từ đầu tập tin, các shot con được kết hợp lại với nhau nếu cần thiết cho đến khi shot hiện tại có độ dài ít nhất 2 giây, từ điểm bắt đầu kết hợp cho đến shot con kế tiếp. Keyframe được xác định bằng cách đi đến khung hình giữa của shot, tiếp đó, phân tích vùng phải và trái khung hình đó để định vị I-Frame gần nhất. Nó trở thành keyframe và được rút trích ra. Các keyframe được cung cấp cả ở mức shot con (NRKF) và shot chủ (RKF). Trong một số ít trường hợp, sẽ không có I-Frame được xác định, khi đó khung hình giữa sẽ được chọn. <VideoSegment id="shot1_1"> <MediaTime> <MediaTimePoint>T00:00:00:0F30000</MediaTimePoint> <MediaDuration>PT00H00M03S26116N30000F</MediaDuration> </MediaTime> <TemporalDecomposition> <VideoSegment id="shot1_1_RKF"> <MediaTime> <MediaTimePoint>T00:00:01:27057F30000</MediaTimePoint> </MediaTime> </VideoSegment> </TemporalDecomposition> </VideoSegment>

Các tập tin thông tin shot cho dữ liệu TRECVID được cung cấp dưới định dạng .mp7.xml. Hình 3.2 trình bày cấu trúc biểu diễn thông tin của một shot trong tập tin .mp7.xml. Tham khảo ý nghĩa các tag và cách biểu diễn thời gian trong

http://www-nlpir.nist.gov/projects/tv2003/common.shot.ref/shots2003/.

Một phần của tài liệu Một số kĩ thuật truy tìm nhân vật trong các kho dữ liệu video lớn (Trang 39 - 40)