Mô tả cấu trúc và nội dung video đề xuất bởi Hjelsvold và Midtstraum [18]. Tác giả đề xuất mô hình có những đặc điểm chung, và có thể biến đổi đối với các
ứng dụng khác nhau để chỉ ra các lĩnh vực công nghệ và thuộc tính cho chúng. Những mô hình sau được hỗ trợ:
- Cấu trúc của video hữu hình bằng các khối ghép, dãy các cảnh và lược đồ ngắn. - Chú giải của video hữu hình
- Chia sẻ và sử dụng lại video hữu hình bằng cách phân tách logic dòng video từ các đoạn video vật lý.
Những người khác đề xuất một mô hình dữ liệu giao tiếp đồ họa gọi là mô hình đồ họa video trực tiếp – VSDG cho phân tách ngữ nghĩa không gian – thời gian của dữ liệu video [19]. Mô hình đề xuất trích thông tin không gian và thời gian với từng đối tượng (con người, toà nhà, xe cộ…) trong một đoạn video và miêu tả lại chúng dưới dạng đồ thị trực tiếp. Chúng còn được đưa vào một khung đồ họa dựa trên thông tin về không gian và thời gian và dựa trên tập các thao tác khái quát n-chiều được xác định dựa vào mối tương quan giữa không gian và thời gian của đối tượng được mô tả trong dữ liệu. Chúng mô tả một phương thức trình bày nội dung dựa trên truy vấn về không gian hay không gian và thời gian.
CHƢƠNG 4 MÔ HÌNH CƠ SỞ DỮ LIỆU VIDEO CHO LẬP DANH MỤC VÀ KHÔI PHỤC
NỘI DUNG VIDEO
4.1 Tổng quan
Không giống như CSDL quan hệ, CSDL video cho phép thao tác trên các đối tượng khác nhau như văn bản, ảnh, biểu đồ, âm thanh, nhạc và dữ liệu video động.
Nhiều ứng dụng video trong tương lai đòi hỏi số hóa một lượng hình ảnh và dữ liệu video cho tương tác video bao gồm việc tìm kiếm, duyệt, biểu thị, xem lại, biên soạn…Do sự tách rời số lượng của loại dữ liệu này, những khả năng trên đòi hỏi thuật toán xử lý ảnh và đồ họa máy tính có tính hiệu quả trong mô hình hóa tự động và lập danh mục các đoạn video. Có hai vấn đề đáng lưu ý liên quan tới việc mô hình và quản trị video.
Phát triển các kỹ thuật định dạng trong việc mô hình ngữ nghĩa của thông tin video. Mô hình này có khả năng khái quát hóa thông tin video cũng như thu thập ngữ nghĩa của chúng. Nó cung cấp trình diễn hình ảnh, cảnh phim và các sự kiện phức tạp với thuật ngữ đối tượng và các hoạt động không gian – thời gian của chúng.
Thiết kế lập danh mục, tìm kiếm và các phương pháp tổ chức hiệu quả cho dữ liệu video. Tìm kiếm trong CSDL video có thể cần nhiều tính toán, đặc biệt khi khôi phục nội dung cơ bản cần thiết đối với dữ liệu video và ảnh ở dạng nén hoặc không nén.
Đặc tính quan trọng của dữ liệu video là ý nghĩa không gian – thời gian. Người sử dụng có thể tạo các câu hỏi bao gồm cả khái niệm không gian và thời gian. Tuy nhiên, có thể xuất hiện sự bất đồng do khác biệt trong quan niệm hay dự định sử
khăn đối với CSDL qui ước, thậm chí ngày nay vấn đề này vẫn chưa được hiểu rõ ràng. Do vậy, việc cung cấp một bản phiên dịch dễ hiểu về dữ liệu video là một vấn đề đang nghiên cứu.
Hầu hết các hệ CSDL video hiện có tận dụng các kỹ thuật xử lý ảnh gốc để lập danh mục dữ liệu video hoặc sử dụng các phương pháp của CSDL truyền thống dựa trên từ khóa hoặc các bộ mô tả chú thích. Các đoạn video có thể được kết hợp hoặc ghép nối dựa trên ngữ nghĩa của chúng. Tuy nhiên, các phương pháp này đều nhàm chán bởi sự tiếp nhận nội dung video được thực hiện theo cách thô sơ, chứ không tự động xử lý hình ảnh và đồ họa máy tính.
Phương pháp nghiên cứu dựa vào logic không gian – thời gian được sử dụng để mô tả nội dung của một ảnh hoặc một chuỗi các ảnh. Một hệ thống khôi phục chuỗi ảnh mẫu được phát triển, là nơi các ảnh được xử lý và trình diễn theo logic không gian – thời gian và truy vấn được đưa vào bằng cách sử dụng hình minh họa và sau đó được chuyển bằng logic không gian – thời gian. Xử lý câu hỏi được thực hiện qua việc ghép logic không gian – thời gian của hình cần tìm với hình được lưu trữ bên trong CSDL. Việc này biểu thị một tiến trình có ý nghĩa trong việc khôi phục nội dung ban đầu.
Hình 4.1 mô tả mô hình dữ liệu video với phương pháp tiếp cận hai chiều. Mô hình hướng đối tượng để lưu trữ và khôi phục các sự kiện không gian – thời gian và kết hợp ý nghĩa với video. Đỉnh cao nhất tương ứng với mô hình phân phối thông tin với mức đoạn video. Đỉnh thấp nhất tương ứng với hiển thị dữ liệu nhóm hoặc liên kết thông tin qua các đoạn được hỗ trợ bởi mô hình hướng đối tượng. Tích hợp của mô hình đoạn bên trong và đoạn bên ngoài dẫn đến cơ chế đánh chỉ mục hiệu quả cho xử lý truy vấn nội dung trực tuyến. Đối với hầu hết các truy vấn, khung đề xuất có khả năng tránh thực hiện tính toán trong dữ liệu gốc trong khi xử lý truy vấn bởi những tính toán này có thể quá hạn và có thể thực hiện bên ngoài. Bên cạnh đó, khung này cho phép khái niệm hóa dữ liệu video sử dụng cả hai phương pháp trừu tượng dữ liệu hướng đối tượng từ dưới lên và từ trên xuống. Trong phương pháp từ dưới lên, có thể tạo ra tình huống phức tạp từ những sự kiện đơn giản trong khi với
phương pháp từ trên xuống, có thể tích hợp hoặc nhóm các tình huống có chung ngữ nghĩa.
Object Oriented Intra-Clip Modeling
raw video data
encoded information using low-level model event characterization object-oriented video data managerment
Object-Oriented Inter-Clip Modeling
heterogeneous
users’ views object-oriented representation
Hình 4.1: Tiếp cận dữ liệu video trừu tượng hóa hướng đối tượng