LỜI MỞ ĐẦU Công nghệ multimedia liên quan tới việc mô tả sự kết hợp các dạng thức thông tin khác nhau (văn bản, dữ liệu, hình ảnh, âm thanh,video) dưới dạng tín hiệu số. Có thể nêu ra đây một số ứng dụng multimedia như : • Elearning. • Hội thảo Video (Video Conferencing). • Thư viện điện tử (Elibrary). • Hiện tại ảo (Vitual Reality). Các công nghệ chuyên dùng để thao tác, truyền phát, điều khiển các dữ liệu multimedia đã và đang được nghiên cứu một cách rất sôi động.Các hệ thống multimedia cần có một hệ thống phân phối nhằm mục đích thu thập các đối tượng multimedia và đưa chúng đến người dùng, một trong số các phương tiện đầu tiên được dùng dến là đĩa từ và đĩa quang. Ngày nay, Internet cũng như các giao thức khác như TCPIP, NetBIOS, các mạng Lan đang trở thành các phương tiện để truyền bá dữ liệu multimedia . Khả năng mô tả phong phú cũng như khả năng đồ họa của các web browser (trình duyệt web) cùng với các tính năng đang được tiếp tục tăng cường như hoạt họa, âm thanh và Video khiến các web browser (trình duyệt web) đang trở thành một phương tiện mới để mang lại các dữ liệu multimedia cho người dùng.Các công nghệ chủ yêu liên quan đến multimedia bao gồm: • Kỹ thuật nén. • Video Servers. • Các kỹ thuật về mạng (internet, tokenring, ethernet, ATM …vv). • Các công nghệ truyền dữ liệu. • Các công nghệ về cáp truyền dẫn. • Công nghệ xác thực. • Các công nghệ về cơ sở dữ liệu I. Giới thiệu chung về cơ sở dữ liệu đa phương tiện 1.Một vài nét về cơ sở dữ liệu Một cơ sở dữ liệu (CSDL) là tập hợp của các dữ liệu có liên quan đến nhau. Một hệ quản trị cơ sở dữ liệu (DBMS) là hệ thống phần mềm trợ giúp cho các quá trình khai báo, xây dựng và thao tác với CSDL phục vụ cho các ứng dụng khác nhau. Trong thư viện, CSDL và các DBMS đôi khi được sử dụng thay thế nhau. Ở đây CSDL hiểu như một bộ sưu tập hoặc một kho dữ liệu hoặc nhiều mục truyền thông. Chúng ta sử dụng các DBMS như một hệ thống thực thể để quản lý CSDL. CSDL multimedia bao gồm thêm các kiểu dữ liệu khác như: • Văn bản. • Hình ảnh. • Âm thanh. • Video.
Trang 1BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC KINH TẾ-KĨ THUẬT CÔNG NGHIỆP
KHOA CÔNG NGHỆ THÔNG TIN
Giảng viên: Trần Bích Thảo
Sinh viên thực hiện:
Nhóm 10:
1.Nguyễn Hữu Sáng
2.Nguyễn Thị Duyên
29, tháng 09 năm 2012
Trang 2LỜI MỞ ĐẦU
Công nghệ multimedia liên quan tới việc mô tả sự kết hợp các dạng thức thông tin khác nhau (văn bản, dữ liệu, hình ảnh, âm thanh,video) dưới dạng tín hiệu số Có thể nêu ra đây một số ứng dụng multimedia như :
• E-learning.
• Hội thảo Video (Video Conferencing).
• Thư viện điện tử (Elibrary).
• Hiện tại ảo (Vitual Reality).
Các công nghệ chuyên dùng để thao tác, truyền phát, điều khiển các dữ liệu multimedia đã và đang được nghiên cứu một cách rất sôi động.Các hệ thống multimedia cần có một
hệ thống phân phối nhằm mục đích thu thập các đối tượng multimedia và đưa chúng đến người dùng, một trong số các phương tiện đầu tiên được dùng dến là đĩa từ và đĩa quang Ngày nay, Internet cũng như các giao thức khác như TCP/IP, NetBIOS, các mạng Lan đang trở thành các phương tiện để truyền bá dữ liệu multimedia Khả năng mô tả phong phú cũng như khả năng đồ họa của các web browser (trình duyệt web) cùng với các tính năng đang được tiếp tục tăng cường như hoạt họa, âm thanh và Video khiến các web browser (trình duyệt web) đang trở thành một phương tiện mới để mang lại các dữ liệu multimedia cho người dùng.Các công nghệ chủ yêu liên quan đến multimedia bao gồm:
Trang 3I Giới thiệu chung về cơ sở dữ liệu đa phương tiện
1.Một vài nét về cơ sở dữ liệu
Một cơ sở dữ liệu (CSDL) là tập hợp của các dữ liệu có liên quan đến nhau Một hệ quản trị cơ sở dữ liệu (DBMS) là hệ thống phần mềm trợ giúp cho các quá trình khai báo, xây dựng và thao tác với
và các DBMS đôi khi được sử dụng thay thế nhau Ở đây CSDL hiểu như một bộ sưu tập hoặc một kho dữ liệu hoặc nhiều mục
truyền thông Chúng ta sử dụng các DBMS như một hệ thống thực thể để quản lý CSDL CSDL multimedia bao gồm thêm các kiểu dữ liệu khác như:
• Tích hợp các phương tiện khác (Media Intergration)
• Khả năng sắp xếp và mô tả thông tin
• Khả năng khai thác dữ liệu
• Khả năng lưu trữ lớn
• Giao diện multimedia
• Hỗ trợ truy vấn tương tác multimedia
Thông thường các đối tượng riêng lẻ của một hình ảnh hoặc một khung hình video (video frame) sẽ có một vài mối liên hệ bộ phận với các đối tượng khác Các mối liên hệ này đưa đến một số các ràng buộc trong quá trình tìm kiếm các đối tượng trong CSDL
multimedia Căn cứ trên cơ sở này việc triển khai các ứng dụng multimedia trên nền các hệ quản trị CSDL hướng đối tượng sẽ
thuận lợi hơn so với các hệ quản trị cơ sở dữ liệu quan hệ
(RDBMS) hiện thời
Trang 42.Cơ sở dữ liệu đa phương tiện (CSDL Multimedia)
Dữ liệu multimedia được chia thành hai lớp là các dữ liệu liên tục
và các dữ liệu không liên tục Các dữ liệu liên tục bao gồm các dữ liệu âm thanh, video thay đổi theo thời gian Các dữ liệu không liên tục là các dữ liệu không phục thuộc vào thời gian, các loại dữ liệu đặc trưng cho dạng này là các dữ liệu văn bản (có hoặc không có định dạng),hình ảnh tĩnh và các đối tượng đồ họa Các kiểu dữ liệu thông thường của một CSDL multimedia bao gồm:
• Dữ liệu văn bản (có hoặc không có định dạng)
• Đồ họa: là các bản vẽ, minh họa được mã hóa như các tệp
postscript
• Hình ảnh: là các hình ảnh được mã hóa sử dụng các dạng thức chuẩn như là
JPEG hoặc MPEG
• Các hoạt hình
• Âm thanh
• Video
Các đặc tính chung của dữ liệu multimedia bao gồm:
• Thiếu cấu trúc: Các dữ liệu multimedia có khuynh hướng phi cấu trúc vì vậy các tác nghiệp quản trị dữ liệu chuẩn như chỉ số hoá, tìm kiếm nội dung, truy vấn dữ liệu thường là không áp dụng được
• Tính tạm thời: Một vài kiểu dữ liệu multimedia như là Video, âm thanh và hoạt hình đều phụ thuộc vào yếu tố thời gian liên quan mậtthiết đến việc lưu trữ,thao tác và mô tả chúng
• Có dung lượng lớn: các dữ liệu video và âm thanh thường đòi hỏi các thiết bị lưu trữ lớn
• Các ứng dụng hỗ trợ: các dữ liệu phi chuẩn có thể đòi hỏi các quy trình xử lý phức tạp như việc sử dụng các thuật toán nén dữ liệu đối với các ứng dụng CSDL multimedia
2.1 Các kiểu truyền thông và multimedia
Truyền thông đề cập đến các kiểu thông tin hoặc các kiểu biểu diễn thông tin, ví dụ như dữ liệu vần chữ cái, hình ảnh, âm thanh, truyền hình Có nhiều cách phân lớp truyền thông Những cách phân loại chung được dựa trên những dạng vật lý và những mối quan hệ
truyền thông với thời gian Ta phân lớp truyền thông dựa trên việc
có hay không có chiều thời gian Ngầm định này hướng tới hai lớp truyền thông tĩnh và động (hoặc tính liên tục về thời gian)
Trang 5Truyền thông tĩnh không bao hàm yếu tố thời gian, các nội dung
và nghĩa của chúng không phụ thuộc vào thời gian được biểu
diễn.Truyền thông tĩnh bao gồm các dữ liệu vần chữ cái, các đồ thị
và các ảnh tĩnh
Truyền thông động bao hàm yếu tố thời gian, các nghĩa và tính chính xác của chúng phụ thuộc vào loại được biểu diễn Truyền thông động gồm các hoạt hình, âm thanh và video
Các truyền thông này có bản chất khoảng thống nhất hoặc tốc độ riêng của chúng Chẳng hạn, để truyền cảm giác chuyển động nhịp nhàng video phải thực hiện 25 hình mỗi giây (hoặc 30 hình phụ thuộc vào hệ thống video đang sử dụng) Tương tự, khi chúng ta phát lại một lời nhắn hoặc đoạn nhạc đã được ghi âm, chỉ có một loại thể hiện là thích hợp Việc phát lại ở chế độ nhanh hơn hoặc chậm hơn sẽ làm méo nghĩa hoặc chất lượng âm thanh Vì những truyền thông này phải được phát liên tục ở tốc độ cố định mà chúng thường được gọi là truyền thông liên tục Chúng cũng còn được gọi truyền thông đẳng thời vì mối quan hệ cố định giữa mỗi đơn vị truyền thông và thời gian
Truyền thông đề cập đến một bộ sưu tập các kiểu truyền thông đã
sử dụng cùng nhau Điều đó có nghĩa là ít nhất có kiểu truyền thông
dữ liệu là không theo ký tự chữ (nghĩa là ít nhất có một kiểu truyền thông là ảnh, âm thanh hoặc truyền hình) Ở đây, “multimedia” được sử dụng như một tính từ vì vậy chúng ta sẽ nói một cách đặc trưng là thông tin multimedia, dữ liệu multimedia, hệ thống
multimedia, liên lạc multimedia,ứng dụng multimedia, Dữ liệu multimedia chính là sự biểu diễn về các loại truyền thông
multimedia mà máy tính có thể đọc được Thông tin multimedia là thông tin đã truyền bằng các kiểu truyền thông multimedia Đôi khi,thông tin multimedia và dữ liệu multimedia được sử dụng có thể thay cho nhau Đôi khi chúng ta sử dụng thuật ngữ multimedia hay truyền thông và đối tượng nhằm chỉ một thực thể tự trị nào đó trong
được truy vấn, truy xuất và được trình diễn Thuật ngữ “đối tượng”
có thể là chưa xác định thích hợp theo nghĩa
hướng đối tượng (Object Oriented) Ngữ cảnh sẽ làm nó rõ ràng hơn
dù cho nó được sử dụng trong một ý nghĩa chung hoặc trong cách tiếp cận hướng đối tượng
Trang 62.2 Sự phát triển về dữ liệu multimedia và các đặc trưng của nó
Hiện nay chúng ta đang tập trung khai phá thông tin multimedia Ví
dụ, một số lượng lớn hình ảnh và video đang được tạo lập và lưu trữtrên internet Nhiều hoạ sỹ và bức tranh trong nhiều kiểu in ra là đang được chuyển sang dạng kỹ thuật số cho dễ xử lý, phân phối và bảo tồn Các bức tranh từ các bản tin trên vô tuyến và trên báo cũng được chuyển sang dạng kỹ thuật số để dễ bảo trì và bảo tồn Một số lớn các hình ảnh y tế đang được tập trung hàng ngày và các vệ tinh đang được sản xuất nhiều hơn Khuynh hướng này có ý định tiếp tụcnâng cấp việc lưu trữ và các công nghệ kỹ thuật số Việc lập ra một chỗ chứa đối với lượng lớn thông tin multimedia ngày càng tăng như vậy còn được ít sử dụng Điều này sẽ không thể sử dụng đầy đủthông tin multimedia này trừ khi nó được tổ chức để truy xuất nhanhtheo yêu cầu
Không chỉ là đang tăng về số lượng dữ liệu đang được lưu trữ, mà còn cả các kiểu dữ liệu và các đặc trưng của chúng là khác nhau từ
dữ liệu ký tự chữ
Có những đặc trưng chính của dữ liệu multimedia như sau:
• Dữ liệu multimedia, nhất là âm thanh và video, là dữ liệu có số lượng lớn Ví dụ, một video 10 phút trung bình chiếm 1,5 GB chưa nén
• Âm thanh và video có chiều thời gian và chúng khi biểu diễn sẽ chiếm tỷ lệ cố định để hoạt động có hiệu quả như đã yêu cầu
• Âm thanh số, ảnh và video được trình diễn theo một loạt giá trị đơn cá thể và thiếu cấu trúc ngữ nghĩa rõ ràng cho máy tính để tự động hoá nhận biết nội dung
• Nhiều ứng dụng multimedia đòi hỏi việc biểu diễn đồng thời các kiểu truyền thông đa năng theo cách kết hợp không gian và thời gian
• Ý nghĩa của dữ liệu multimedia đôi khi rất mờ và có tính chủ
quan Ví dụ, mỗi người có cách giải thích cùng 1 bức tranh theo cách khác nhau hoàn toàn riêng
• Dữ liệu multimedia là giàu về thông tin, nhiều tham số được đòi hỏi mới trình diễn đủ nội dung của nó
Trang 72.3 Các DBMS và vai trò của chúng trong việc xử lý dữ liệu multimedia
Các DBMS ngày nay được xây dựng khá tốt và được sử dụng rộng rãi đối với dữ liệu có cấu trúc Các DBMS trội nhất là các hệ quản trị dữ liệu quan hệ (RDBMS) Trong RDBMS, thông tin được tổ chức thành bảng hoặc các quan hệ Các dòng của bảng tương ứng với các khoản mục thông tin hoặc các record (bản ghi), trong khi đó các cột tương ứng với các thuộc tính
Ví dụ như ngôn ngữ truy vấn có cấu trúc (SQL) được sử dụng để tạo ra các bảng như thế và để chèn và truy xuất thông tin từ các bảng đó
Chúng ta dùng một ví dụ đơn giản để minh hoạ cách sử dụng SQL
để tạo lập một bảng và chèn, truy xuất thông tin từ đó Giả sử chúng
ta muốn lập một bảng chứa các bản ghi về sinh viên bao gồm số hiệu sinh viên (tương tự như mã sinh viên), tên và địa chỉ Ta có lệnh sau:
Create table STUDENT
Lệnh trên sẽ chèn một dòng vào bảng STuDeNT
Thông tin trong bảng được truy xuất khi sử dụng câu lệnh SELECT của SQL Ví dụ, nếu muốn truy xuất tên của sinh viên với sinh viên
số 32, ta sử dụng lệnh truy vấn sau:
Select Name
From STUDENT
Where Stu#=32
Các thuộc tính trong RDBMS (Hệ quản trị cơ sở dữ liệu quan hệ) đã
cố định kiểu và độ rộng Trong ví dụ trên, thuộc tính Stu# là kiểu integer với độ dài cố định là 32 bit Như vậy, RDBMS là thích hợp
để xử lý dữ liệu số và dòng ký tự ngắn
Để hỗ trợ cho các trường có giá trị lớn trong RDBMS, một khái niệm được gọi là đối tượng rộng hoặc nhị phân (BLOB) sẽ được
Trang 8giới thiệu Một BLOB là một xâu bit lớn các độ dài biến Ví dụ, nếu
ta muốn lưu bức tranh của sinh viên trong bản ghi ở bảng
STUDENT trên, chúng ta có thể tạo ra một bảng khi sử dụng lệnh sau:
Create table STUDENT(
cách thích hợp trong hướng đối tượng Trong đó mỗi đối tượng chứa các đặc tính hoặc thuộc tính và các phương pháp hoặc các hàmđược sử dụng để chế tác ra các đặc tính khác Ví dụ, chúng ta có thểđịnh nghĩa một loại ảnh sau:
Create type IMAGE(
Trang 9Các khái niệm về các BLOB và các đối tượng là một bước gần với
xử lý dữ liệu multimedia Nhưng các BLOB được sử dụng chỉ để lưu dữ liệu có khối lượng lớn
Trong khi các đối tượng chứa vài thuộc tính đơn giản, nhiều chức năng hơn nên được phát triển để xử lý việc truy xuất multimedia dựa vào nội dung Một vài các khả năng được yêu cầu như sau:
• Các công cụ, tự động hoá hoặc bán tự động trích rút các nội dung
và các đặc trưng trong dữ liệu multimedia
• Các cấu trúc chỉ số hoá đa chiều, để điều khiển các vector
• Giao diện sử dụng, được thiết kế cho phép các câu hỏi đa dạng trong nhiều kiểu truyền thông đa dạng và cung cấp các trình diễn multimedia
2.4 Kiến trúc cho việc tổ chức nội dung
Ở đây chúng ta xem xét tới 3 kiến trúc áp dụng cho việc tổ chức nội dung của một hệ thống CSDL multimedia
2.4.1 Nguyên lý tự trị
Nguyên lý này đề cập tới việc chúng ta nhóm tất cả các dữ liệu ảnh,
dữ liệu video và tất cả các dữ liệu văn bản và chỉ số hóa chúng theo nguyên tắc tối đa hóa hiệu suất của tất cả các loại truy nhập đối với các loại dữ liệu mà chúng ta dự định Nguyên lý này đảm bảo rằng với mỗi loại dữ liệu (ảnh, video, văn bản) chúng đều được tổ chức với một cách thức đặc trưng phù hợp với mỗi loại dữ liệu này
Trang 10Hình 2.1: Mô tả nguyên lý tự trị
2.4.2 Nguyên lý đồng nhất
Một nguyên lý kiến trúc khác mà chúng ta có thể lựa chọn là
nguyên lý đồng nhất,nguyên lý này giúp chúng ta tìm được một cấu trúc tóm tắt chung cho tất cả các loại dữ liệu Cấu trúc này có thể được dùng trong việc chỉ số hóa tất cả các loại dữ liệu qua đó
tạo ra một “chỉ số thống nhất” mà chúng ta có thể dùng để truy cập tới các đối tượng khác nhau Hay nói một cách khác là chúng ta có thể trình bầy tất cả các đối tượng khác nhau( ảnh, video, âm thanh, văn bản) trong một cấu trúc dữ liệu duy nhất và qua đó phát triển các thuật toán để truy vấn cấu trúc dữ liệu này
Trang 11
Hình 2.2: Mô tả nguyên lý đồng nhất
2.4.3 Nguyên lý lai ghép
Ý tưởng của nguyên lý này là dựa trên sự kết hợp của 2 nguyên lý
đã trình bầy ở trên.Kết quả của nguyên lý này là một kiểu dữ liệu nào đó sử dụng chỉ số (index) riêng của chúng, trong khi đó các kiểu
dữ liệu khác sẽ sử dụng một chỉ số (Index) “thống nhất”
Hình 2.3: Mô tả nguyên lý lai ghép
Trang 12Cả ba loại nguyên lý trên đều có những ưu điểm và nhược điểm riêng của mình Kiến trúc dựa trên nguyên lý tự trị đòi hỏi việc tạo
ra các thuật toán và cấu trúc dữ liệu của mỗi kiểu dữ liệu, ngoài ra
nó cũng đòi hỏi các kỹ thuật hỗ trợ cho việc liên kết chéo
giữa các cấu trúc dữ liệu khác nhau này Các công việc này đòi hỏi tính phức tạp cao và đòi hỏi một lượng thời gian lớn cho việc phát triển Bên cạnh các nhược điểm trên, việc xây dựng các cấu trúc được đặc biệt hóa tối ưu cho việc truy xuất dến từng loại dữ liệu khác nhau, CSDL multimedia được tổ chức theo nguyên lý này thường đem lại hiệu quả cao trong việc xử lý tìm kiếm Đối với các ngân hàng dữ liệu đã được xây dựng sẵn, nơi mà các thuật toán và các cấu trúc dữ liệu đã được sử dụng có hiệu quả thì việc áp dụng nguyên lý tự trị là mô hình kiến trúc thích hợp nhất Các kỹ thuật hướng đối tượng chính là công cụ đắc lực nhất hỗ trợ cho việc triển khai theo nguyên lý này bằng cách xem mỗi loại dữ liệu nguồn là một đối tượng mà các phương thức của nó có thể truy cập được từ một CSDL multimedia tổng thể
Trái ngược với nguyên lý tự trị, nguyên lý đồng nhất đòi hỏi chúng
ta phải tìm ra được một cấu trúc dữ liệu chung mà có thể dùng để lưu trữ các thông tin về nội dung của hình ảnh, video, văn bản, âm thanh và các loại dữ liệu khác Điều này đòi hỏi chúng ta phải phân tích nội dung của mỗi kiểu dữ liệu và tóm tắt được phần chung của chúng, qua đó xây dựng một bộ chỉ số dựa trên các yếu tố chung đã được xác định này Ưu điểm nổi bật của nguyên lý đồng nhất là dễ dàng triển khai và các thuật toán thường được thực hiện rất nhanh Nhược điểm chính của nguyên lý này là các sự chú giải phải
được tạo ra theo một cách riêng nào đó, thường là được tạo ra một cách thủ công hoặc là tự động, việc tạo ra các chú giải một cách thủ công thường đỏi hòi nhiều về mặt thời gian cũng như chi phí, mặt khác trong quá trình tạo các chú giải này thường sẩy ra sự mất mát thông tin nếu ngôn ngữ dùng để chú giải không trình bầy hết được các khía cạnh của nội dung Có thể đưa ra đây một số ví dụ như ngôn ngữ chú giải nội dung của hình ảnh có thể làm mất các thông tin về bề mặt của một điểm ảnh (pixel) hoặc một nhóm điểm ảnh Tương tự như vậy ngôn ngữ chú giải nội dung của âm thanh có thểlàm mất các thông tin về biên độ, tần số của tín hiệu tại một thời điểm nào đó
Nguyên lý lai tạo tập hợp được các ưu điểm của cả hai nguyên lý nêu trên, đồng thời giảm thiểu được một số các nhược điểm của
Trang 13chúng Giả sử chúng ta muốn tạo ra một CSDL multimedia bao gồmcác kiểu dữ liệu M1,…….,Mn, chúng ta bắt đầu bằng việc phân chiatập này thành 2 phần:
• Phần 1: bao gồm các loại dữ liệu kế thừa từ các nguồn dữ liệu có sẵn, tồn tại sẵn các chỉ số và các thuật toán để thao tác với chỉ số Với việc bố trí này chúng ta đã tận dụng được lợi thế của các chỉ số
Sau khi đã tiến hành xong việc phân chia, chúng ta bắt đầu tiến hành việc xây dựng các thuật toán cần thiết để kết hợp các nguồn dữliệu khác nhau lại bằng việc sử dụng các tập chỉ sổ riêng của chúng Cách tiếp cận này giúp chúng ta thừa kế được tối đa các tài nguyên
có sẵn, đồng thời giảm thiểu được các công việc phải thực hiện thêm bởi vì các tệp chỉ số riêng có sẵn đối với mỗi loại dữ liệu đã được tận dụng
Giả sử, một người dùng muốn đưa ra một câu hỏi “ Hãy tìm tất
cả các hình ảnh và các đọan video mà trong đó ông chủ của đối tượng A có mặt và trao đổi với đối tượng B” Câu hỏi này
bao gồm một sự kết hợp giữa các tệp chỉ số của các loại dữ liệu khác nhau, chúng sẽ truy cập đến CSDL hình ảnh (thông qua tệp chỉ
số của dữ liệu hình ảnh), đến CSDL âm thanh (thông qua tệp chỉ số
âm thanh) và đến một CSDL quan hệ (thông qua tệp chỉ số
quan hệ), câu hỏi này có thể được diễn tả như sau:
SELECT Name, Image, Audio
From Employee E, Image I, Audio A
Where E.Name= “A” AND
I contains E.boss and
A contains E.boss AND
A CONTAINS B
2.5.Tổ chức dữ liệu multimedia dựa trên nguyên lý đồng nhất.
Xét ví dụ sau: