ABC Corp đã từng bị kết án với tội mưu sát lưu trữ trong kho dữ liệu tội phạm Bắc Mỹ. Các dữ liệu này cũng được quản lý theo các cách khác nhau. Trên thực tế chỉ xét riêng nước Mỹ tại các bang khác nhau cũng có sự khác nhau trong việc lưu trữ các hồ sơ tội phạm. Một số bang thì sử dụng các file phẳng một số thì sử dụng Dbase, Oracle, một số khác thì dùng Sybase Với truy vấn có mức độ phức tạp hơn đòi hỏi tiếp cận tất cả các khuôn dạng dữ liệu văn bản nói trên, nhưng còn phải thêm vào đó là kiểu dữ liệu hình ảnh. · Query 1.6 (Heterogeneous Multimedia Query). Giả thiết rằng cơ quan cảnh sát đưa ra truy vấn ”Tìm tất cả những người đã chụp ảnh với Jose Orojuelo và họ đã bị bắt trong vụ mưu sát tại Mỹ và gần đây họ đã nhận tiền chuyển vào tài khoản từ ABC Corp ”. Trong truy vấn này chúng ta không chỉ phải xác định những người thoả mãn yêu cầu trong Query 1.5 mà còn phải xác định trong những người tìm được từ Query 1.5ai đã chụp ảnh với Jose Orojuelo. Với nhiệm vụ này có thể đòi hỏi phải tiếp cận với: § Cơ sở dữ liệu thẻ căn cước chứa tên cũng như hình ảnh của mọi người. § Cơ sở dữ liệu các hình ảnh chứa các ảnh chụp liên quan đến các vụ điều tra (đã được trình bày trong phần trước) § Các dữ liệu video theo dõi để thấy được cuộc gặp gỡ giữa một kẻ khả nghi và Jose Orojuelo đã được ghi lại trước đó. § Các thuật toán xử lý ảnh để xác định ai xuất hiện trong bức ảnh chụp hay trong băng video. Nhìn chung, các truy vấn này đòi hỏi phải tiếp cận đến các hình thức thường khác nhau của dữ liệu quan hệ, dữ liệu hình ảnh và các thuật toán xử lý ảnh. · Query 1.7 (Complex Heterogeneous Multimedia Query). Một giả thuyết phức tạp hơn, cơ quan cảnh sát cần hỏi câu truy vấn “Tìm tất cả những ai đã liên lạc với Jose Orojuelo và họ đã bị kết án bởi tội mưu sát tại Bắc Mỹ và những ai gần đây nhận tiền chuyển vào tài khoản riêng từ ABC Corp”. Trong truy vấn này khái niệm giao tiếp (contact) giữa người thoả mãn Query 1.5 và Jose Orojuelo bao hàm ý nghĩa rộng lớn của cách giao giao tiếp. Thí dụ, một hình thức giao tiếp có thể thông qua ảnh chụp, ảnh theo dõi hay ảnh video: hai người được xem như là giao tiếp nếu họ chụp chung ảnh. Mặt khác, hai người giao tiếp nếu họ hội thoại với nhau. Thí dụ, nếu băng ghi âm cho thấy ai đó nói với Jose Orojuelo trên điện thoại thì nó thoả mãn “giao tiếp” trong câu truy vấn trên đây. Tương tự, thư điện tử là một hình thức khác của giao tiếp giữa những người liên quan. Cuối cùng thư đánh máy và thư viết tay trao đổi giữa Jose Orojuelo và ai đó cũng thoả mãn tiêu chí “giao tiếp” nói trên. Như vậy, để trả lời được câu truy vấn trên đây, ta cần xâm nhập đến dải rộng dữ liệu văn bản khác nhau (để trả lời truy vấn Query 1.5), bao gồm các DBMS quan hệ khác nhau, cũng như các loại dữ liệu khác nhau như ảnh, video, audio, văn bản và chữ viết tay. 1.3 Các ứng dụng khác Các kịch bản mẫu về ứng dụng đa phương tiện trên đây đã mô tả phần lớn các hình thức dữ liệu multimedia và các lập luận có thể bắt gặp. Tuy nhiên ta còn thấy nhiều thí dụ khác về đa phương tiện từ các lĩnh vực khác nhau. 1.3.1 Các dịch vụ đa phương tiện trong giáo dục Ngày nay, nhiều trường đại học đã cung cấp chương trình giáo dục từ xa giành cho những ai không có điều kiện tham gia lớp học với những lý do khác nhau như do điều kiện địa lý hay thời gian để có thể theo các khoá học. Khoá học như vậy ngày nay thông thường được tiến hành với việc gửi các băng ghi hình (nếu không bị hạn chế về thời gian thì các buổi học kết hợp tham khảo các tư liệu đa phương tiện là rất tốt). Trong một tương lai không xa, người sử dụng máy tính có thể truy cập trực tuyến các kho tài liệu dưới dạng băng hình, băng tiếng liên quan đến việc học tập. Thí dụ một sinh viên có thể truy cập đến một trong các dịch vụ trên máy chủ của nhà cung cấp dịch vụ và đưa ra câu truy vấn có thể như “Tìm tất cả các bài giảng với chủ đề PR-quadtrees có trong thư viện tài liệu”. Thư viện có thể chứa đựng thông tin về chủ đề này trong các phương tiện lưu trữ khác nhau (các băng video bài giảng, các tập tài liệu in) liên quan đến chủ đề trên. Giải pháp truy vấn đòi hỏi khả năng duyệt qua các tư liệu để tìm được các phần phù hợp, nó có thể là một video clip. Ngoài các bài giảng, người sử dụng có khả năng lựa chọn được tài liệu mà họ cho là phù hợp nhất. 1.3.2 Ngành công nghiệp điện ảnh Trong một tương lai rất gần, nhu cầu về phim ảnh theo yêu cầu (on demand) sẽ rất lớn. Người sử dụng có thể dễ dàng chọn các bộ phim tại nhà và xem chúng qua TV tại nhà. Trong thời gian hiện nay cách thức chọn phim mà người sử dụng mong muốn là rất phong phú. Cũng như việc ứng dụng đa phương tiện trong lĩnh vực giáo dục miêu tả ở trên, trong lĩnh vực điện ảnh người sử dụng có thể lựa chọn phim mong muốn bằng cách trộn cả truy vấn tìm kiếm và duyệt. Thí dụ, người sử dụng muốn xem một bộ phim Alfred Hitchcock nhưng trong đó không có sự tham gia diễn xuất của Jimmy Stewart (có lẽ anh ta đã xem một số bộ phim kiểu này trước đây và đã trở nên nhàm chán với sự diễn xuất của Jimmy Stewart). Một hệ thống đa phương tiện hỗ trợ tương tác như vậy của người sử dụng thì phải có khả năng tìm kiếm hiệu quả những bộ phim thoả mãn nhu cầu của người sử dụng. Hơn thế nữa, người sử dụng nên có được khả năng xem trước những mẩu phim giới thiệu mà họ mong muốn. Ngoài ra, họ nên được quyền xem xét các bài phê bình về bộ phim, với sự cân nhắc như vậy có thể giúp người sử dụng lựa chọn được những bộ phim mà anh ta thực sự muốn xem. 1.3.3 Lời khuyên của các chuyên gia Rất nhiều chúng ta không muốn phải trả giá cắt cổ cho việc sửa chữa ô tô. Trong nhiều trường hợp, việc sửa chữa có thể thực hiện dễ dàng, rẻ tiền nếu ta có chút ít tri thức cơ bản về những việc cần làm. Sách hướng dẫn sử dụng nhiều khi vô ích vì nó quá dày để thực hành. Một ý tưởng thú vị là tạo ra trợ giáo tự động (assistant) hay các tác tử (agent) cho các công việc khác nhau từ sửa chữa ống nước cho đến sửa chữa ô tô. Thí dụ với việc sửa chữa ô tô, chúng ta muốn tương tác với chương trình để chỉ ra trên màn hình cái chúng ta cần nhìn thấy dưới mui xe. Hướng dẫn sử dụng quá súc tích: các câu như “miếng đệm cao su 16-inch đặt ở bên phíc cắm của cuộn dây đánh lửa” cho ta quá nhiều ý nghĩa. Người trợ giáo tự động sửa chữa ô tô sẽ chỉ ra ảnh (có thể lấy ra từ tài liệu hướng dẫn điện tử) của các chi tiết liên quan đến xe ô tô. Người sử dụng dễ dàng quan sát ảnh này và xác định phần vật lý nào trong xe tương ứng với phần đánh dấu trong ảnh. Giả sử phải thay thế toàn bộ miếng đệm, hệ thống sẽ in ra toàn độ đặc tả kỹ thuật của nó cùng với danh sách các nhà cung cấp trong vùng nơi họ sống. 1.3.4 Công nghiệp du lịch Rất nhiều người lập kế hoạch nghỉ hè cho gia đình hàng năm phải đến các đại lý du lịch hay trong sách quảng cáo du lịch để tìm ra địa điểm du lịch phù hợp tài chính và thoả mãn nhu cầu nghỉ ngơi của họ. Nhưng ta có thể lập kế hoạch toàn bộ chuyến du lịch tại nhà. Hệ thống đa phương tiện cài đặt đại lý du lịch thông minh cho người sử dụng khả năng khớp nối các nhu cầu du lịch của họ, sau đó hỏi hệ thống để tìm ra vị trí thoả mãn. Hệ thống có thể cho lại nhiều điểm đến đều thoả mãn yêu cầu người sử dụng. Hệ thống sẽ in ra toàn bộ hành trình, chi tiết về khách sạn, lịch bay 1.3.5 Shopping tại nhà Tương tự như công nghiệp du lịch, ta có thể sử dụng cùng khái niệm để thương mại sản phẩm đến khách hàng. Như trong trường hợp của công nghiệp du lịch, khách hàng có thể gọi hay xâm nhập các nhà cung cấp dịch vụ mà họ cung cấp thông tin trực tuyến về các sản phẩm đang có và các thông tin thương mại khác. 1.4 Kết luận Các thí dụ liệt kê trên đây cùng chia sẻ các khía cạnh chung mà có thể là cách trừu tượng để hình thành lõi dữ liệu sẽ trình diễn và lõi của thuật toán sẽ cài đặt. Các khía cạnh chung này là độc lập với bất kỳ ứng dụng cụ thể nào. > Chương 2 CẤU TRÚC DỮ LIỆU ĐA CHIỀU Phần lớn dữ liệu đa phương tiện liên quan đến không gian và thời gian. Dữ liệu loại này còn được gọi là dữ liệu n chiều, xuất phát từ thực tế là dữ liệu có các thuộc tính trong không gian n chiều. Thí dụ, không gian có hai hay ba chiều, không gian-thời gian có 4 chiều ( các trục x, y, z, t). Ta sẽ nghiên cứu kỹ thuật biểu diễn thông tin n chiều. Phần lớn các kỹ thuật lưu trữ dữ liệu n-chiều đều sử dụng việc tách “phân cấp” không gian và được biểu diễn bởi các cây. Gốc cây biểu diễn toàn bộ vùng. Nút biểu diễn vùng, cành biểu diễn việc phân hoạch vùng ra tiểu vùng. Có nhiều cấu trúc dữ liệu khác nhau được sử dụng để biểu diễn việc tách phân cấp vùng. Ta sẽ nghiên cứu cây k-d, cây tứ phân điểm, cây tứ phân MX và cây R. Mỗi chúng thực hiện tách không gian theo cách khác nhau và có ưu điểm và nhược điểm riêng. 2.1 Mở đầu Error! Một trong kịch bản về ứng dụng đa phương tiện là dữ liệu có nguồn gốc thông tin địa lý (GIS). Một hình thức đơn giản nhất là GIS lưu trữ thông tin về vùng nào đó của trái đất như bản đồ (ảnh) chứa các đặc trưng nổi trội. Trong trường hợp này, bản đồ là ảnh hai chiều, một số điểm trên bản đồ được xem như các đối tượng cần quan tâm. Các điểm này có thể được lưu trữ trong nhiều cấu trúc dữ liệu đặc biệt. Hình 2.1a) là bản đồ đơn giản có một số điểm quan tâm trên nó. Các điểm được đánh dấu bởi địa danh (thí dụ như Banja Luka, Brcko). Thay vì điểm quan tâm, ứng dụng có thể quan tâm đến vùng bản đồ. Trong trường hợp này cấu trúc dữ liệu phải có khả năng lưu trữ thông tin về các vùng. Hình 2.1b) biểu diễn cùng bản đồ nhưng chứa một số vùng quan tâm. Chương này chỉ ra cách biểu diễn dữ liệu bản đồ trên hình 2.1 bằng các loại cây k- d, cây tứ phân và cây R. 2.2 Cây k-d (k-d Trees) Cây k-d được sử dụng để lưu trữ dữ liệu điểm k-chiều như chỉ ra trên hình 2.1a. Không sử dụng nó để lưu trữ dữ liệu vùng. Như vậy, cây 2-d (khi k=2) lưu trữ dữ liệu điểm 2-chiều, cây 3-d lưu trữ dữ liệu điểm 3-chiều Thí dụ này đề cập đến dữ liệu điểm 2-d, sau đó khái quát lên dữ liệu điểm 3-d. 2.2.1 Cấu trúc nút Error! Trong cây 2-d, mỗi nút có cấu trúc bản ghi nhất định với kiểu như sau: nodetype = record INFO: infotype; XVAL: real; YVAL: real; LLINK: nodetype; RLINK: nodetype; end Trường INFO có thể có kiểu bất kỳ do người sử dụng định nghĩa và phụ thuộc vào ứng dụng cụ thể. Thí dụ, nó có thể là trường xâu ký tự mô tả địa danh, . k- d, cây tứ phân và cây R. 2.2 Cây k-d (k-d Trees) Cây k-d được sử dụng để lưu trữ dữ liệu điểm k-chiều như chỉ ra trên hình 2.1a. Không sử dụng nó để lưu trữ dữ liệu vùng. Như vậy, cây 2-d. liệu điểm 2-chiều, cây 3-d lưu trữ dữ liệu điểm 3-chiều Thí dụ này đề cập đến dữ liệu điểm 2-d, sau đó khái quát lên dữ liệu điểm 3-d. 2.2.1 Cấu trúc nút Error! Trong cây 2-d, mỗi nút. các tư liệu để tìm được các phần phù hợp, nó có thể là một video clip. Ngoài các bài giảng, người sử dụng có khả năng lựa chọn được tài liệu mà họ cho là phù hợp nhất. 1.3.2 Ngành công nghiệp