- 60 - TÌM KIẾMDỮLIỆUĐAPHƯƠNGTIỆN Nguyễn Đại Thắng Giáo viên hướng dẫn: PGS.TS Đỗ Trung Tuấn Daithang1111@yahoo.com Giới thiệu Những tiến bộ gần đây trong công nghệ đaphương tiện, công nghệ Internet, công nghệ truyền thông và sự bùng nổ của World Wide Web đã đưa đến cuộc cách mạng mới cho con người. Con người đã thực sự bước vào kỉ nguyên đaphương tiện, cùng với những tiện ích là hàng trăm vấn đề nảy sinh. Trong đó vấn đề n ổi cộm là việc tìm kiếm ảnh, âm thanh và video … để có thể tận dụng được mọi tài nguyên sẵn có trong các tuyển tập và trên Internet. Sự đa dạng của các loại dữliệu cũng như kích thước ngày càng lớn của chúng yêu cầu phải có những công cụ và phương pháp khác nhau. Khoá luận này tập trung vào các nguyên lý cơ bản cũng như các công nghệ có thể phát triển để tìm kiếmdữliệuđa phươ ng tiện. Khoá luận cũng Demo một hệ thống lưu trữ và tìm kiếm Video sử dụng các thuộc tính gán. Chương 1. Các vấn đề cơ bản trong tìm kiếmdữliệuđaphươngtiện Chương này đưa ra toàn bộ các vấn đề liên quan đến tìm kiếmdữliệuđaphương tiện. Với việc trình bày các kiến thức từ cơ bản nhất cho đến các vấn đề k ĩ thuật, chương này có thể giúp ta hiểu được mọi khía cạnh liên quan đến vấn đến tìm kiếmdữliệuđaphương tiện. Nội dung chính như sau: 1.1. Giới thiệu Giới thiệu về dữliệuđaphươngtiện và nhu cầu tìm kiếm. 1.2. Tìm kiếm thông tin Vấn đề tìm kiếm thông tin trong các hệ thống dữliệu đòi hỏi phải tuân theo một số tiêu chuẩn. Trong đó việc sử dụng các ngôn ngữ đánh chỉ số (indexing language) là vấn đề cơ bản nhất cần quan tâm. Việc sử dụng ngôn ngữ này giúp cho các truy vấn người dùng và các mô tả đối tượng trong cơ sở dữliệu được thống nhất, từ đó giúp việc tìm kiếm được thuận lợi. 1.3. Chuẩn bị các đối tượng thông tin Các đối tượng thông tin trong thực tế là một mớ hỗn độn, chúng ta phải tổ chức chúng vào cơ sở dữliệu sao cho việc khai thác và sử dụng là thuận lợi nhất. Điều này đối với văn bản là điều dễ dàng, tuy nhiên với loại dữliệu âm thanh, hình ảnh thì rất phức tạp. 1.4. Tìm kiếmđaphươngtiện Với các loại dữliệuđaphươngtiện khác nhau thì phải có các cách thức tìm kiế m khác nhau. Tuy tất các chúng đều có thể đưa về tìm kiếm văn bản tuy nhiên có một số đặc điểm ngăn cản điều này. Ví dụ như đặc tính thời gian của các Video, việc khó khăn khi nhận dạng các âm thanh, tính chủ quan của người dùng v.v. Phần này giải quyết các cách thức tìm kiếm cho các dạng khác nhau của dữliệu như văn bản, ảnh, video… 1.5. Đối sánh Việc tìm kiếm luôn luôn liên quan đế n đối sánh các mô tả đối tượng và truy vấn. Những phương pháp đối sánh nào được sử dụng và hợp lý cho loại dữliệu nào được giải quyết trong phần này. 1.6. Đo đạc chất lượng Trong khi xây dựng các hệ thống tìm kiếmđaphươngtiện ta luôn phải quan tâm đến chất lượng cũng như hiệu suất của hệ thống. Các thông số chính trong việc đo đạc hệ thống như độ chính xác, độ tìm kiếm được phân tích. Chương 2. Một số hệ thống tìm kiếm Chương này đưa ra các trang tìm kiếm áp dụng các phương pháp đã đưa ra trong chương 1 để - 61 - minh họa cho tính ứng dụng của chúng. Các mặt mạnh, yếu của các trang tìm kiếm đối với các loại phươngtiện (ảnh, âm thanh, Video…) được phân tích. Chương 3. Lưu trữ dữliệu Video Hệ thống lưu trữ Video có các đặc điểm rất khác so với các hệ thống lưu trữ khác. Sự khác nhau này xuất phát từ đặc tính không gian và thời gian của Video. Do đó, việc xây dựng hệ thống cần tính đến một số vấn đề: 3.1. Xây dựng mô hình dữliệu Video Có nhiều phương pháp mô hình hoá dữliệu Video để phù hợp với việc lưu trữ, phân tích và tìm kiếm. Phần này đưa ra một số mô hình chính và trực quan của Video cũng như các điểm mạnh, điểm yếu của chúng. 3.2. Việc phân tích cảnh Video Phân tích cảnh Video rất quan trọng trong việc xác định ngữ ngữ của Video. M ột số thuật toán phát hiện sự thay đổi cảnh được đưa ra đối với các cảnh thay đổi đột ngột, thay đổi từ từ và đối với sự thay đổi cảnh trong Video nén. 3.3. Đánh chỉ số Video Để tiện cho việc tìm kiếm, Video cần được đánh chỉ số phù hợp. Ngoài các phương pháp giống với văn bản, một số phương pháp khác đặc trưng cho đ ánh chỉ số Video cũng được đưa ra. Chương 4. Hệ thống lưu trữ Video Đối với một trường đại học hoặc một tổ chức lớn thì các dữliệu Video là rất phổ biến. Việc lưu trữ và tìm kiếm loại dữliệu này thường không cần thiết phải sử dụng các công cụ mạnh mà thường dùng các thuộc tính gán (giống như văn b ản) để hỗ trợ việc khai thác Video. Tôi xây dựng một hệ thống Video đơn giản sử dụng các thuộc tính do người dùng gán để hỗ trợ việc tìm kiếm. Tuy nhiên để hỗ trợ cho một khối lượng lớn dữliệu thì hệ thống cần phải bổ xung các công cụ của xử lý ngôn ngữ. Một hệ thống tham khảo (The Digital Library Project) đang được xây dựng tại trường đại học University of California, Berkeley, USA. Tài liệu tham khảo. [1] Gupta, T. Weymouth, and R. Jain M, The VIMSYS model, 1991. [2] T. G.A. Smith and G. Davenport, The stratification system : A design environment for random access memory, 1992. [3] E. Oomoto and K. Tanaka, Design and implementation of Video- object database system, 1993. [4] B. Shahraray, Scene change detection and content-based sampling of Video sequences, SPIE, 1995. [5] K. Otsuji, Y. Tonomura, and Y. Ohba, Video browsing using bright-ness data, 1991. [6] Swanberg, C. F. Shu, R. Jain. Knowledge guided parsing in Video databases, 1993. [7] S. W. Smoliar and H. J. Zhang, Contenr- Based Video indexing and Retrieval, 1994. [8] Elsevier, A Rule- Base Video Database System Architecture, 2002. [9] Jelena Tesic, Intelligent Image Database Seaching System, UCSB, 2002. [10] ChrisTos Faloutsos, Multimedia Indexing, Carnegie Mellon University, Pittsburgh, Pennsylvania, 2002. [11] Ying Li and C-c Jay Kuo, Introduction to Content-Based Image Retrieval-Overview of Key Techniques, University of Southern, Los Angeles, California, 2002. [12] Wallapak Tavanapong and Kien A.Hua, Design and Implementation of a Video Browsing System for The Internet, Department of Computer Science, Iowa State University, Ames, USA, 2001. [13] Marti A.Hearst, Next Generation Web Search: Setting Our Sites, University of California, Berkeley, 2000. [14] Arjen P.de Vries, Content Dependence in Multimedia Database, Journal of The American Society for Information Science and Technology, 2001. [15] Dr Andrew Salway, Modelling Multimedia Information, Lectures of Surrey UK, 2005. . vấn đến tìm kiếm dữ liệu đa phương tiện. Nội dung chính như sau: 1.1. Giới thiệu Giới thiệu về dữ liệu đa phương tiện và nhu cầu tìm kiếm. 1.2. Tìm kiếm thông. vấn đề cơ bản trong tìm kiếm dữ liệu đa phương tiện Chương này đưa ra toàn bộ các vấn đề liên quan đến tìm kiếm dữ liệu đa phương tiện. Với việc trình