1.6 CÁC NHIỆM VỤ THIẾT KẾ CỦA HỆ THỐNG CSDL ĐA PHƢƠNG TIỆN
1.6.8 Các nhiệm vụ khác
1.6.8.1 Nén dữ liệu đa phƣơng tiện
Mục tiêu chính của nén dữ liệu đa phƣơng tiện là khả năng nén nhiều nhất có thể không quan tâm đến khía cạnh trình diễn và tìm kiếm. Phần lớn các tệp âm thanh, ảnh và video đƣợc nén nhờ kỹ thuật hay theo chuẩn nhất định. Để trích chọn đặc trƣng của các file này thì trƣớc hết phải giải nén chúng đã. Quan điểm này không hiệu quả về mặt tính toán vì nén và giải nén phải thực hiện vài lần trong tiến trình trích chọn, không hiệu quả khi lƣu trữ vì các tệp nén và các đặc trƣng trích chọn đƣợc lƣu trữ tách biệt. Do vậy, cần có kỹ thuật nén sao cho trích chọn đặc trƣng thực hiện trực tiếp trong dữ liệu nén và trong đó nén trên cơ sở đối tƣợng, không trên cơ sở các giá trị mẫu riêng rẽ. Có thể thực hiện chỉ số hóa và truy tìm ảnh trong dữ liệu nén DCT, lƣợng tử véctơ, wavelet. Nếu có thể chuyển ảnh bitmap sang đồ họa véctơ thì đạt đƣợc tỷ lệ nén cao hơn và dễ dàng truy vấn hơn. MPEG-4 và JPEG2000 là thí dụ về các chuẩn tổ hợp nén và truy vấn.
Khía cạnh khác của nén là phải phù hợp với truyền tin và trình diễn. Trong nhiều ứng dụng, ảnh thumbnail đƣợc hiển thị trƣớc trong màn hình hay cửa sổ để user lựa chọn. Nếu user quan tâm ảnh nào thì họ chọn ảnh và phiên bản mật độ lớn hơn để hiển thị. Có thể thực hiện ứng dụng loại này theo hai cách sau:
- Phƣơng pháp thứ nhất: Ảnh kích thƣớc khác nhau suy diễn từ cùng một ảnh đƣợc tạo ra, nén, lƣu trữ riêng rẽ trong server. Các ảnh có kích thƣớc yêu cầu sẽ gửi đến client để hiển thị. Thí dụ, dữ liệu ảnh thumbnail đƣợc truyền để hiển thị, dữ liệu ảnh gốc đƣợc gửi trình tự theo yêu cầu.
- Phƣơng pháp thứ hai: Các ảnh đƣợc nén và lƣu trữ theo kích thƣớc ban đầu. Dựa vào yêu cầu, dữ liệu ảnh gốc đƣợc truyền đến client không quan tâm đến yêu cầu của client. Trong phần lớn trƣờng hợp, client làm giảm dữ liệu ảnh truyền thành kích thƣớc nhỏ hơn để hiển thị. Nếu user muốn quan sát toàn bộ ảnh gốc thì ảnh gốc đƣợc truyền đi.
Cả hai phƣơng pháp đều không hiệu quả từ góc độ không gian lƣu trữ và băng thông. Để giải quyết vấn đề trên, cần sử dụng kỹ thuật nén phân cấp nhƣ JPEG và MPEG-4. Nó không chỉ tiết kiệm không gian lƣu trữ và băng thông mạng mà còn làm giảm thời gian đáp ứng vì ảnh đƣợc truyền, giải mã, hiển thị một cách tiến triển dần dần thay cho giải mã và hiển thị chỉ khi dữ liệu đã sẵn sàng.
1.6.8.2 Chuẩn hóa biểu diễn dữ liệu
Trong tiến trình trích chọn đặc trƣng và nén, đã giả sử rằng các giá trị mẫu thô cho mỗi media có đƣợc theo cùng cách và có cùng ý nghĩa. Trong thực tế giả sử này là không thực. Thí dụ, các đoạn âm thanh đƣợc ghi ở các cƣờng độ khác nhau, vậy việc so sánh trực tiếp các giá trị mẫu từ các đoạn âm thanh khác nhau là vô nghĩa. Tƣơng tự, các giá trị pixel ảnh từ các ảnh khác nhau có thể có ý nghĩa khác nhau vì sử dụng các giá trị gama hiệu chỉnh khác nhau và hệ thống màu khác nhau. Do vậy, các thông tin ảnh hƣởng giá trị mẫu cần gộp vào header tệp và các giá trị mẫu đƣợc hiệu chỉnh tùy theo trích chọn đặc trƣng. Ngày nay, các khuôn mẫu âm thanh và ảnh không bao gồm thông tin này. Cần có trình diễn chuẩn cho mỗi medium.
CHƢƠNG 2 - MỘT SỐ KỸ THUẬT CHỈ MỤC VÀ TÌM KIẾM ĐỐI TƢỢNG TRONG VIDEO SỐ