1. Trang chủ
  2. » Luận Văn - Báo Cáo

Cơ sở dữ liệu đa phương tiện CSDL nâng cao

37 185 1

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Cấu trúc

  • MỞ ĐẦU

  • CHƯƠNG I. TỔNG QUAN VỀ CƠ SỞ DỮ LIỆU ĐA PHƯƠNG TIỆN

  • 1. Khái niệm dữ liệu đa phương tiện

  • 2. Các đặc trưng của cơ sở dữ liệu đa phương tiện:

  • 3. Sự cần thiết đối với cơ sở dữ liệu đa phương tiện:

  • 4. Tổ chức nội dung trong cơ sở dữ liệu đa phương tiện:

  • CHƯƠNG II . NGÔN NGỮ TRUY VẤN CƠ SỞ DỮ LIỆU ĐA PHƯƠNG TIỆN

  • 1. Truy vấn SMDSs (mô tả đồng nhất):

  • 2. Truy vấn dữ liệu đa phương tiện mô tả dưới kiến trúc lai tạo:

  • CHƯƠNG III. HỆ QUẢN TRỊ CƠ SỞ DỮ LIỆU ĐA PHƯƠNG TIỆN

  • 5. Các yêu cầu của hệ quản trị cơ sở dữ liệu đa phương tiện:

  • 6. Các vấn đề của hệ quản trị cơ sở dữ liệu đa phương tiện:

  • CHƯƠNG IV. ỨNG DỤNG CỦA CƠ SỞ DỮ LIỆU ĐA PHƯƠNG TIỆN – ORACLE MULTIMEDIA

  • 1. Giới thiệu chung:

  • CHƯƠNG V . KẾT LUẬN

  • CHƯƠNG V. TÀI LIỆU THAM KHẢO

Nội dung

TRƯỜNG ĐẠI HỌC GIAO THÔNG VẬN TẢI KHOA CÔNG NGHỆ THƠNG TIN TÌM HIỂU CƠ SỞ DỮ LIỆU ĐA PHƯƠNG TIỆN Lớp cao học Cơng nghệ thơng tin – Khố 27.1 Môn học: Cơ sở liệu nâng cao Học viên: Trần Văn Long Hà Nội, tháng 11 năm 2019 MỤC LỤC MỞ ĐẦU .5 CHƯƠNG I TỔNG QUAN VỀ CƠ SỞ DỮ LIỆU ĐA PHƯƠNG TIỆN .5 Khái niệm liệu đa phương tiện .5 Các đặc trưng sở liệu đa phương tiện: .6 Sự cần thiết sở liệu đa phương tiện: Tổ chức nội dung sở liệu đa phương tiện: CHƯƠNG II NGÔN NGỮ TRUY VẤN CƠ SỞ DỮ LIỆU ĐA PHƯƠNG TIỆN 10 Truy vấn SMDSs (mô tả đồng nhất): 11 Truy vấn liệu đa phương tiện mô tả kiến trúc lai tạo: 14 CHƯƠNG III HỆ QUẢN TRỊ CƠ SỞ DỮ LIỆU ĐA PHƯƠNG TIỆN .2 Các yêu cầu hệ quản trị sở liệu đa phương tiện: .4 Các vấn đề hệ quản trị sở liệu đa phương tiện: .4 CHƯƠNG IV ỨNG DỤNG CỦA CƠ SỞ DỮ LIỆU ĐA PHƯƠNG TIỆN – ORACLE MULTIMEDIA Giới thiệu chung: CHƯƠNG V KẾT LUẬN 19 CHƯƠNG V TÀI LIỆU THAM KHẢO 20 BẢNG GIẢI THÍCH THUẬT NGỮ VÀ KÝ HIỆU VIẾT TẮT STT THUẬT NGỮ/VIẾT TẮT Ý NGHĨA CSDL Cơ sở liệu Hyperlink Siêu liên kết MDBMS Hệ quản trị CSDL đa phương tiện DBMS Hệ quản trị CSDL QoS Quality of Service, chất lượng dịch vụ CNTT Công nghệ thông tin Media Phương tiện truyền thông OracleDB Oracle Database, sở liệu Oracle Binary Large Object, kiểu liệu đối tượng nhị BLOB phân kích thước lớn Multipurpose Internet Mail Extensions, 10 MIME chuẩn Internet định dạng cho thư điện tử Dung lượng mà thiết bị lưu trữ cần để xử lý 11 Bit rate giây âm (hay video) 12 Sampling rate Số lần lấy mẫu giây âm 13 VCR Video cassette recorder, đầu thu video Character large object, kiểu liệu đối tượng kí 14 CLOB tự kích thước lớn Extention Markup Language, ngôn ngữ đánh dấu 15 XML mở rộng File-based large object, kiểu liệu dùng để lưu trữ định vị (liên kết) tới tập tin nhị phân 16 BFILEs bên (lưu trữ bên sở liệu) 17 Scale Thay đổi kích thước ảnh mà giữ nguyên tỉ lệ 18 URL Universal resource locator, địa trang web hệ thống World Wide Web Hyper Text Transfer Protocol, giao thức truyền 19 HTTP tải siêu văn Một đơn vị lưu trữ bên sở liệu Oracle, tham khảo thêm địa chỉ: http://www.adp- 20 Tablespace gmbh.ch/ora/concepts/tablespaces.html Structured Query Language, ngơn ngữ truy vấn 21 SQL có cấu trúc MỞ ĐẦU Trong thời đại ngày nay, công nghệ thông tin (CNTT) phát triển vượt bậc đến mức ăn sâu vào sống hàng ngày người Sự phát triển CNTT gắn với xu hướng máy tính cá nhân sử dụng ngày phổ biến; công nghệ phần cứng phát triển không ngừng mang đến thiết bị nghe nhìn có độ phân giải cao, có khả hiển thị nội dung đa phương tiện tuyệt vời; bên cạnh hạ tầng kỹ thuật mạng cải thiện đáng kể cho phép nội dung đa phương tiện truyền tải qua mạng nhanh nhất, phục vụ nhu cầu người dùng từ giải trí đến cơng việc Tuy nhiên, nhu cầu người dùng khả đáp ứng liệu đa phương tiện lớn phát sinh vấn đề quản lý khai thác liệu đa phương tiện cách tốt nhất? Các liệu đa phương tiện hoàn toàn lưu trữ đĩa truy cập cách truyền thống, để đáp ứng yêu cầu nêu ta cần phải tổ chức chúng thành sở liệu (CSDL) đa phương tiện cần tới hệ quản trị CSDL đa phương tiện dùng để quản lý hỗ trợ khai thác chúng Vậy CSDL đa phương tiện gì? Tại lại cần dùng đến CSDL đa phương tiện? Các tảng lý thuyết CSDL đa phương tiện ứng dụng gì? Các nội dung tìm hiểu đề tài CHƯƠNG I TỔNG QUAN VỀ CƠ SỞ DỮ LIỆU ĐA PHƯƠNG TIỆN Khái niệm liệu đa phương tiện Cơ sở liệu đa phương tiện tập hợp liệu đa phương tiện có liên quan với Các kiểu liệu thông hường CSDL đa phương tiện bao gồm:  Văn bản: có mặt hầu hết ứng dụng đa phương tiện nhằm giải thích thêm cho dạng liệu văn bản; loại liệu đa dạng (được sử dụng với nhiều loại ngôn ngữ khác nhau) lưu trữ nhỏ gọn nhất;  Audio: gần loại liệu phổ biến với nhiều định dạng khác (mp3, wav, wma, cd, ra, qt…) File audio chưa chuyển hóa thành liệu số có kích thước lớn (1s chiếm 10Kb) nén dễ dàng (hệ số nén file mp3 - 12:1); Hình ảnh: bao gồm ảnh đen trắng, ảnh xám, ảnh màu Hình ảnh có nhiều định dạng (bmp, gif, jpeg, pcx, png…) Một trang ảnh có độ phân giải cao chiếm vài Mb, âm thanh, hình ảnh nén, ví dụ định dạng JPEG có hệ số nén thường lớn 10;  Video kĩ thuật số: chuỗi hình ảnh liên tục Loại liệu thường đòi hỏi dung lượng lưu trữ lớn hệ số nén cao Vận tốc truyền thu video kĩ thuật số phải nằm khoảng 20-30 hình giây Trong loại video kĩ thuật số, phim hoạt hình loại nhỏ gọn dễ lưu trữ loại khác sử dụng hình ảnh tổng hợp có sử dụng mẫu chuẩn;  Ảnh vec-tơ loại ảnh mà hình vẽ tạo nên công thức điểm ảnh Ảnh vectơ có dạng: chiều chiều Ưu điểm ảnh vec-tơ thay đổi độ lớn ảnh mà không làm thay đổi chất lượng ảnh;  Tích hợp văn hình ảnh;  Tích hợp audio video;  Siêu phương tiện dạng biểu diễn phi tuyến tính liệu đa phương tiện (chứa hyperlink) Dữ liệu đa phương tiện chia thành hai lớp liệu liên tục liệu không liên tục Các liệu liên tục bao gồm liệu âm thanh, video thay đổi theo thời gian Các liệu không liên tục liệu không phục thuộc vào thời gian, loại liệu đặc trưng cho dạng liệu văn (có khơng có định dạng), hình ảnh tĩnh đối tượng đồ họa Các đặc trưng sở liệu đa phương tiện: Do CSDL đa phương tiện tổng hợp nhiều liệu đa phương tiện khác nên có đặc trưng bậc sau:  Thiếu cấu trúc (Lack of structure): CSDL đa phương tiện thường khơng có cấu trúc, tác vụ chuẩn CSDL truyền thống số hóa, tìm kiếm nội dung, truy xuất liệu khơng thực được;  Tính thời gian (Temporality): Một vài kiểu liệu multimedia Video, âm hoạt hình phụ thuộc vào yếu tố thời gian liên quan mật thiết đến việc lưu trữ, thao tác mô tả chúng;  Dung lượng lưu trữ lớn (Massive Volume): liệu video âm thường đòi hỏi thiết bị lưu trữ lớn;  Các ứng dụng hỗ trợ (Logistics): liệu phi chuần đòi hỏi quy trình xử lý phức tạp việc sử dụng thuật toán nén liệu ứng dụng CSDL đa phương tiện Sự cần thiết sở liệu đa phương tiện: Như trình bày phần trên, nhu cầu ngày lớn liệu đa phương tiện hữu CSDL đa phương tiện cần thiết Điều xuất phát từ số nguyên nhân sau:  Các liệu đa phương tiện có kích thước lớn ảnh hưởng đến việc lưu trữ, truy xuất truyền tải nội dung đa phương tiện;  Cấu trúc liệu đa phương tiện khác xa so với CSDL chuẩn;  Các kiểu liệu có tính chất liên tục (như video audio) xử lý CSDL chuẩn – vốn dành để xử lý kiểu liệu không liên tục văn số; Ngồi ra, nói đến CSDL đa phương tiện không nhắc đến hệ quản trị CSDL đa phương tiện Nhờ có mà liệu đa phương tiện tổ chức khai thác hợp lý, giải vấn đề Tổ chức nội dung sở liệu đa phương tiện: Ở xem xét tới kiến trúc áp dụng cho việc tổ chức nội dung hệ thống CSDL đa phương tiện:  Nguyên lý tự trị;  Nguyên lý đồng nhất;  Nguyên tắc lai ghép 4.1 Nguyên lý tự trị (atonomy): Nguyên lý đề cập tới việc nhóm tất liệu ảnh, liệu video tất liệu văn số hóa chúng theo nguyên tắc tối đa hóa hiệu suất tất loại truy nhập loại liệu mà dự định Nguyên lý đảm bảo với loại liệu (ảnh, video, văn bản) chúng tổ chức với cách thức đặc trưng phù hợp với loại liệu Hình 1: Mơ tả ngun lý tự trị Kiến trúc dựa nguyên lý tự trị đòi hỏi việc tạo thuật toán cấu trúc liệu kiểu liệu, ngồi đòi hỏi kỹ thuật hỗ trợ cho việc liên kết chéo cấu trúc liệu khác Các cơng việc đòi hỏi tính phức tạp cao đòi hỏi lượng thời gian lớn cho việc phát triển Bên cạnh nhược điểm trên, việc xây dựng cấu trúc chuyên biệt hóa đem đến tối ưu cho việc truy xuất đến loại liệu khác nhau, CSDL đa phương tiện tổ chức theo nguyên lý thường đạt hiệu cao việc xử lý tìm kiếm Đối với ngân hàng liệu xây dựng sẵn, nơi mà thuật toán cấu trúc liệu sử dụng có hiệu việc áp dụng ngun lý tự trị mơ hình kiến trúc thích hợp Các kỹ thuật hướng đối tượng công cụ đắc lực hỗ trợ cho việc triển khai theo nguyên lý cách xem loại liệu nguồn đối tượng mà phương thức truy cập từ CSDL đa phương tiện tổng thể 4.2 Nguyên lý đồng (uniformity): Một nguyên lý kiến trúc khác mà lựa chọn nguyên lý đồng nhất, nguyên lý giúp tìm cấu trúc tóm tắt chung cho tất loại liệu Cấu trúc dùng việc số hóa tất loại liệu qua tạo “chỉ số thống nhất” mà dùng để truy cập tới đối tượng khác Hay nói cách khác trình bày tất đối tượng khác (ảnh, video, âm thanh, văn bản) cấu trúc liệu qua phát triển thuật toán để truy vấn cấu trúc liệu Hình 2: Mơ tả ngun lý đồng Trái ngược với nguyên lý tự trị, nguyên lý đồng đòi hỏi phải tìm cấu trúc liệu chung mà dùng để lưu trữ thông tin nội dung hình ảnh, video, văn bản, âm loại liệu khác Điều đòi hỏi phải phân tích nội dung kiểu liệu tóm tắt phần chung chúng, qua xây dựng số dựa yếu tố chung xác định này.ưu điểm bật nguyên lý đồng dễ dàng triển khai thuật toán thường thực nhanh Nhược điểm nguyên lý giải phải tạo theo cách riêng đó, thường tạo cách thủ cơng tự động, việc tạo giải cách thủ cơng thường đỏi hòi nhiều mặt thời gian chi phí, mặt khác trình tạo giải thường xảy mát thông tin ngôn ngữ dùng để giải khơng trình bày hết khía cạnh nội dung Có thể đưa số ví dụ ngơn ngữ giải nội dung hình ảnh làm thơng tin bề mặt điểm ảnh (pixel) nhóm điểm ảnh Tương tự ngôn ngữ giải nội dung âm làm thơng tin biên độ, tần số tín hiệu thời điểm 4.3 Nguyên lý lai (hybrid): Ý tưởng nguyên lý dựa kết hợp nguyên lý trình bày Kết nguyên lý kiểu liệu sử dụng số (index) riêng chúng, kiểu liệu khác sử dụng số (Index) “thống nhất” Loại liệu sử dụng kiểu số phụ thuộc vào đặc tính khác Hình 3: Mô tả nguyên lý lai ghép Nguyên lý lai tạo tập hợp ưu điểm hai nguyên lý nêu trên, đồng thời giảm thiểu số nhược điểm chúng Giả sử muốn tạo CSDL đa phương tiện bao gồm kiểu liệu M1, …….,Mn, bắt đầu việc phân chia tập thành phần:  Phần 1: bao gồm loại liệu kế thừa từ nguồn liệu có sẵn, tồn sẵn số thuật toán để thao tác với số Với việc bố trí tận dụng lợi số mã nguồn sẵn có  Phần 2: bao gồm liệu không kế thừa từ nguồn khơng có sẵn số (điều đồng nghĩa với việc khơng có thuật tốn để thao tác với tập số) Trong trường hợp việc tiếp cận xây dựng hệ thống theo nguyên lý đồng cách thức thích hợp cách tiếp cận nảy sinh việc gây mát thông tin vật lý chi tiết Sau tiến hành xong việc phân chia, bắt đầu tiến hành việc xây dựng thuật toán cần thiết để kết hợp nguồn liệu khác lại việc sử dụng tập số riêng chúng Cách tiếp cận giúp thừa kế tối đa tài nguyên có sẵn, đồng thời giảm thiểu cơng việc phải thực thêm tệp số riêng có sẵn loại liệu tận dụng CHƯƠNG II NGÔN NGỮ TRUY VẤN CƠ SỞ DỮ LIỆU ĐA PHƯƠNG TIỆN Ngày nay, với phát triển vượt bậc công nghệ thu giữ (capture) liệu nghe nhìn khơng gia lưu trữ ngày gia tăng cho phép tạo sưu tập khổng lồ liệu đa phương tiện Tuy nhiên, CSDL ngày phình to khó khăn việc tìm kiếm ảnh hay video mong muốn lại tăng lên Để giải vấn đề này, người ta có hai phương pháp phát triển:  Phương pháp thứ nhất: sử dụng thông tin nhập thủ công hay bao gồm thiết kế bảng, tiêu đề, từ khóa mơ tả - thường xác định từ trước lược đồ phân loại (classification schemes) Phương pháp biết đến với tên gọi truy xuất dựa thuộc tính (attribute-based retrieval);  Phương pháp thứ hai: sử dụng đặc trưng rút trích từ nội dung đối tượng đa phương tiện nhận diện đối tượng để phân loại nội dung liệu đa phương tiện Phương pháp biết đến với tên gọi truy xuất dựa nội dung (content-based retrieval) Phương pháp đề xuất ý tưởng sử dụng vectơ đặc trưng – giá trị số có kích thước cố định rút trích từ nội dung để truy vấn Do tính chất phức tạp độ rộng phương pháp thứ hai nên nghiên cứu tập trung tìm hiểu phương pháp thứ Cụ thể, tìm hiểu ngơn ngữ truy vấn đơn giản xây dựng dựa SQL dùng để khai thác liệu đa phương tiện Ở phần tìm hiểu cách tổ chức liệu theo nguyên lý đồng lai ghép Việc mở rộng ngôn ngữ truy vấn SQL sử dụng cho việc truy vấn liệu xây dựng kiến trúc mô tả đồng tiền đề để tiếp tục mở rộng ngôn ngữ truy cách thủ công tốn thời gian kết thường chủ quan hạn chế phụ thuộc vào từ vựng Một phương pháp khác sử dụng dựa việc truy cập nội dung, xem xét đến nội dung thực liệu đa phương tiện xuất phát từ ngữ cảnh thông tin Trong thời gian gần đây, việc nghiên cứu số hoá dựa nội dung tiến hành mạnh mẽ với mục đích số hố liệu đa phương tiện dựa đặc trưng xác định thu trực tiếp từ liệu Các đặc trưng khác màu sắc, hình dạng, kết cấu bề mặt, chuỗi đặc trưng đặc trưng khác dùng để số hoá ảnh Để thu đặc trưng đòi hỏi phải phân tích tự động liệu đa phương tiện, phương thức sử dụng liệu ảnh liệu video xử lý ảnh, đón nhận ảnh phân tích chuỗi video Đối với liệu video, chuỗi video trước tiên phân tách thành chuỗi hợp thành, sau đặc trưng tóm tắt (thường frame khoá) lựa chọn để đặc trưng cho chuỗi Việc số hoá liệu video dựa frame khoá giống liệu ảnh Đối với liệu âm thanh, việc số hoá dựa nội dung có tham gia việc phân tích tín hiệu, tự động nhận biết lời nói với việc số hố dựa từ khố Mặt khác, việc số hố dựa thông tin khác phụ thuộc vào kiểu liệu âm thanh, ví dụ vài nhà phát triển sử dụng đặc trưng nhịp điệu, hợp âm giai điệu cho việc số hoá dựa nội dung liệu âm Tương tự vậy, việc tìm kiếm khai thác liệu âm dựa nội dung đề xuất dựa đặc tính liệu âm qua đặc trưng âm học giác quan… Việc số hoá dựa nội dung gợi vài vấn đề cần quan tâm Trước hết, với liệu đa phương tiện người hiểu theo cách khác Thứ hai, người dùng thường cần thông tin thay đổi khác nhau, đặc trưng khơng đủ để số hố hồn tồn kiểu liệu đa phương tiện cho trước Một vấn đề khác cần phải xem xét vấn đề hiệu quả, việc số hoá phải nhanh số phải lưu trữ cách hiệu để phục vụ cho việc truy cập dễ dàng mà số lượng liệu đa phương tiện lưu trữ lớn Bởi đặc tính vốn có liệu multimedia khác nên việc số hố khơng thể tiến hành cách hồn tồn tự động, đơn cử máy tính phân tích dễ dàng ảnh có chứa tác phẩm nghệ thuật, gần khơng thể tự động xác định ý nghĩa tác phẩm đó, điều có người làm 4.4 Hỗ trợ truy vấn đa phương tiện, khai thác duyệt: Các truy vấn người dùng thường xử lý cách sử dụng số có sẵn, nhiên khác với CSDL truyền thống, tính xác tìm kiếm liệu đa phương tiện khơng phải xác tuyệt đối Thơng thường so sánh hai liệu đa phương tiện kết thu thường gần tương tự, giả sử trường hợp liệu có liệu đầu vào kết thu từ truy vấn sinh nhiều giá trị Đã có nhiều nghiên cứu sâu vào việc tìm phương thức thích hợp trợ giúp cho người dùng có khả khai thác hiệu liệu đa phương tiện, chẳng hạn thơng qua việc cung cấp giao diện thích hợp để người dùng duyệt cách thuận lợi kết có từ q trình tìm kiếm Việc hỗ trợ duyệt cách trực tiếp cho phép người sử dụng khai thác thơng tin có khả liên quan đến kết thời cách lựa chọn mục liệu tương ứng cần quan tâm sâu Truy vấn ví dụ (Query-by-Example) phương pháp sử dụng để nhập truy vấn CSDL đa phương tiện, đặc biệt liệu ảnh Ở người dùng đưa yêu cầu cách sử dụng mẫu có sẵn (ví dụ ảnh tương tự), giao diện sử dụng để nhập truy vấn vào hệ thống trở thành vấn đề cần phải quan tâm Do tính chất đa dạng kiểu liệu đa phương tiện nên kiểu liệu đa phương tiện phải có giao diện truy vấn khác nhau, vấn đề cần xem xét làm để tích hợp giao diện khác vào hệ thống tích hợp CSDL đa phương tiện Một vấn đề khác cần phải giải việc bao gồm truy vấn liệu không gian truy vấn liệu thời gian đòi hỏi phải có thơng tin khơng gian thời gian Ngoài vấn đề nêu trên, MDBMS có số vần đề khác mà phạm vi đề tài nghiên cứu cấp môn học nên không đề cập đến Cụ thể là:  Tích hợp đa phương tiện, thể chất lượng dịch vụ (QoS);  Quản trị CSDL đa phương tiện phân tán; Sự hỗ trợ hệ thống CHƯƠNG IV ỨNG DỤNG CỦA CƠ SỞ DỮ LIỆU ĐA PHƯƠNG TIỆN – ORACLE MULTIMEDIA Giới thiệu chung: Oracle Multimedia (OM – trước Oracle Intermedia) tính cho phép CSDL Oracle lưu trữ, quản lý, truy xuất hình ảnh, video, âm thanh, liệu media hỗn hợp OM mở rộng độ tin cậy, tính sẵn có, khả quản lý liệu CSDL Oracle nội dung đa phương tiện kiểu truyền thống, Internet, thương mại điện tử, ứng dụng đa phương tiện OM khơng kiểm sốt thiết bị thu giữ media (media capture) thiết bị đầu ra, chức giao lại cho phần mềm ứng dụng Công nghệ quan hệ - đối tượng: OracleDB hệ quản trị CSDL quan hệ - đối tượng Điều có nghĩa là, ngồi vai trò truyền thống việc quản lý an tồn hiệu liệu quan hệ, cung cấp hỗ trợ cho định nghĩa loại đối tượng, bao gồm liệu liên quan với đối tượng phương thức thực chúng Công nghệ quan hệ - đối tượng bao gồm việc hỗ trợ tích hợp BLOBs để cung cấp sở cho việc bổ sung đối tượng phức tạp, chẳng hạn âm thanh, hình ảnh, video số hóa vào CSDL Trong Oracle Multimedia, đặc trưng liệu âm lưu trữ kiểu liệu quan hệ đối tượng ORDAudio, tương tự với liệu hỗn hợp ORDDoc, hình ảnh ORDImage, video ORDVideo Cả kiểu lưu trữ thông tin nguồn liệu kiểu liệu quan hệ đối tượng khác gọi ORDSource Các khả Oracle Multimedia: Các khả đa phương tiện Oracle bao gồm lưu trữ, thu hồi, quản lý, thao tác với liệu đa phương tiện quản lý CSDL Oracle OM hỗ trợ lưu trữ định dạng tập tin thơng dụng, bao gồm hình ảnh tạo máy tính, định dạng âm thanh, video CSDL OM cung cấp phương tiện để thêm cột hay đối tượng chứa liệu âm thanh, hình ảnh, video, hay liệu media hỗn hợp khác vào bảng có sẵn, chèn vào lấy liệu đa phương tiện Điều cho phép nhà thiết kế CSDL mở rộng CSDL có với liệu đa phương tiện, để xây dựng ứng dụng CSDL đa phương tiện dành cho người dùng cuối OM sử dụng loại đối tượng, tương tự lớp Java hay C++, để mô tả liệu đa phương tiện Những loại đối tượng gọi ORDAudio, ORDDoc, ORDImage, ORDVideo Một thể loại đối tượng bao gồm thuộc tính, siêu liệu, liệu media, phương thức Dữ liệu media liệu âm thanh, hình ảnh, video, liệu media hỗn hợp khác Siêu liệu thông tin liệu, chẳng hạn độ dài đối tượng, kiểu nén, định dạng Các phương thức thủ tục mà thực đối tượng, chẳng hạn getContent() setProperties() Các đối tượng OM có mơ hình lưu trữ liệu media chung Các thành phần liệu media đối tượng lưu trữ sở liệu, đối tượng kiểu BLOB kiểm soát giao dịch Các liệu media lưu trữ bên ngồi sở liệu, mà khơng nằm kiểm sốt giao dịch Trong trường hợp này, trỏ lưu trữ sở liệu kiểm soát giao dịch, liệu media lưu trữ trong:   Đối tượng lớn dựa tập tin (BFILE);  Một đường dẫn URL mạng; Một nguồn người dùng xác định máy chủ liệu media chuyên biệt, máy chủ khác Siêu liệu media lưu trữ CSDL kiểm soát OM Dù cho liệu media lưu trữ bên hay bên CSDL, OM quản lý siêu liệu cho tất loại media tự động trích xuất siêu liệu cho âm thanh, hình ảnh, video Siêu liệu bao gồm thuộc tính sau:  Lưu trữ thơng tin âm thanh, hình ảnh, video, hay liệu media hỗn hợp khác, bao gồm loại nguồn, đường dẫn, tên nguồn, liệu lưu trữ cục (trong CSDL) hay bên ngoài;  Cập nhật thơng tin nhãn thời gian cho âm thanh, hình ảnh, video, liệu media hỗn hợp khác;   Mô tả liệu âm video; Định dạng liệu âm thanh, hình ảnh, video, liệu media hỗn hợp khác;  Kiểu MIME liệu âm thanh, hình ảnh, video, liệu media hỗn hợp khác;  Các đặc trưng âm thanh: kiểu mã hóa, số kênh, tỉ lệ mẫu, kích thước mẫu, kiểu nén, thời gian phát (duration);  Các đặc trưng hình ảnh: chiều cao chiều rộng, độ dài nội dung hình ảnh, định dạnh nội dung hình ảnh, định dạng nén hình ảnh;  Các đặc trưng video: chiều rộng cao khung, độ phân giải khung, tỉ lệ khung, thời gian phát, số khung, kiểu nén, số lượng màu sắc bit rate  Các siêu liệu trích xuất XML, đạo diễn hay nhà sản xuất phim Một vài ví dụ ứng dụng OM:  Nơi lưu trữ cho hình ảnh kiểm tra kĩ thuật số;   Hồ sơ sức khỏe điện tử; Tổng đài điện thoại;  Học từ xa học trực tuyến;  Tiếp thị bất động sản;  Phòng trưng bày nghệ thuật kĩ thuật số;  Nơi lưu trữ tài liệu hình ảnh;  Thông tin tin tức dịch vụ khách hàng tài chính;  Xuất web;  Lưu trữ web nhạc video Khái niệm âm thanh: 4.1 Âm số hóa: ORDAudio hợp việc lưu trữ, truy xuất quản lý liệu âm số hóa CSDL Âm tạo máy thu âm, nguồn âm microphone, âm số hóa, thiết bị ghi âm chuyên biệt khác, chí thuật tốn chương trình Thiết bị thu âm tạo tín hiệu tương tự hay tín hiệu liên tục, chẳng hạn âm micro thu vào âm ghi lại media từ tính chuyển đổi thành giá trị số với đặc trưng điển hình âm định dạng, kiểu mã hóa, số kênh, sampling rate, kích thước mẫu, kiểu nén, thời gian phát 4.2 Các thành phần âm thanh: Âm số hóa chứa liệu âm (các bit số hóa) thuộc tính mơ tả liệu âm Âm có định dạng khác nhau, kiểu mã hóa, kiểu nén, số kênh, sampling rate, kích thước mẫu thời gian phát khác phụ thuộc vào cách mà liệu âm thu lại theo kĩ thuật số hóa ORDAudio lưu trữ truy xuất liệu âm định dạng liệu có hỗ trợ ORDAudio tự động trích xuất siêu liệu từ liệu âm nhiều định dạng âm thơng dụng, ví dụ như: wav, ra, rm, ram, mp4, mpg, 3gp, au, aff, atf Kích thước âm số hóa (số byte) có xu hướng lớn so với đối tượng máy tính truyền thống, chẳng hạn số văn Do đó, số chế mã hóa sử dụng để nén liệu âm xuống byte hơn, chiếm dung lượng tải nhỏ thiết bị lưu trữ mạng Khái niệm ORDDoc – liệu media hỗn hợp: 5.1 Dữ liệu media hỗn hợp số hóa: ORDDoc hợp việc lưu trữ, truy xuất quản lý liệu media hỗn hợp CSDL Kiểu ORDDoc lưu trữ liệu media hỗn hợp bao gồm âm thanh, hình ảnh, liệu video cột CSDL Thay có cột riêng biệt cho đối tượng âm thanh, hình ảnh, văn video, bạn sử dụng cột đối tượng ORDDoc để đại diện cho tất loại đa phương tiện 5.2 Các thành phần liệu media hỗn hợp: Các thành phần liệu media hỗn hợp bao gồm liệu (các bit số hóa) thuộc tính mơ tả liệu media hỗn hợp Dữ liệu media hỗn hợp có định dạng khác nhau, tùy thuộc vào ứng dụng tạo liệu media OM lưu trữ truy xuất liệu media định dạng liệu hỗ trợ Kiểu ORDDoc sử dụng ứng dụng mà yêu cầu bạn phải lưu trữ kiểu liệu media hỗn hợp cột, bạn xây dựng mục siêu liệu chung tất kiểu liệu media khác Sử dụng mục này, bạn tìm kiếm tất loại liệu media hỗn hợp khác Lưu ý bạn sử dụng kỹ thuật tìm kiếm tương tự loại liệu media hỗn hợp khác lưu trữ loại đối tượng khác nhau, cột khác bảng ORDDoc tự động trích xuất siêu liệu từ liệu nhiều định dạng âm thanh, hình ảnh video phổ biến ORDDoc trích xuất thuộc tính ứng dụng lưu trữ chúng thuộc tính comments đối tượng dạng XML Khái niệm hình ảnh: 6.1 Hình ảnh số hóa: ORDImage tích hợp việc lưu trữ, truy xuất, quản lý hình ảnh kĩ thuật số sở liệu ORDImage hỗ trợ hình ảnh hai chiều, tĩnh, hình ảnh raster số hóa lưu trữ biểu diễn nhị phân đối tượng cảnh giới thực Hình ảnh tạo văn máy quét ảnh, nguồn video (như máy ảnh kỹ thuật số VCR kết nối với số hóa video, thiết bị chuyên chụp ảnh, hay chí thuật tốn chương trình) Thiết bị chụp tiếp nhận tín hiệu tương tự hay tín hiệu liên tục ánh sáng chiếu vào phim máy ảnh, chuyển thành giá trị số lưới điểm liệu hai chiều gọi pixel 6.2 Các thành phần hình ảnh: Hình ảnh số hóa bao gồm liệu hình ảnh (các bit mã hóa) thuộc tính mơ tả liệu hình ảnh Các liệu hình ảnh (pixel) có độ sâu khác tùy thuộc vào ảnh chụp tổ chức theo nhiều cách khác Việc tổ chức liệu hình ảnh gọi định dạng liệu ORDImage lưu trữ truy xuất liệu hình ảnh định dạng liệu ORDImage xử lý tự động trích xuất thuộc tính hình ảnh nhiều định dạng liệu phổ biến như: bmp, cal, dcm, fpx, gif, jpg, pcx, png,… Các không gian lưu trữ cần thiết cho hình ảnh số hóa lớn so với thuộc tính liệu truyền thống số văn Nhiều chương trình nén có sẵn để giảm bớt byte, giảm dung lượng thiết bị lưu trữ giảm dung lượng tải mạng 6.3 Metadata in Images Tính siêu liệu nâng cao hành vi loại đối tượng ORDImage cách thêm khả đọc (hay trích xuất) ghi (hay nhúng) siêu liệu ứng dụng hình ảnh Ngồi ra, tính thông qua tiêu chuẩn để biểu diễn siêu liệu phân tách từ tập tin hình ảnh Siêu liệu lưu trữ CSDL, đánh mục, tìm kiếm tạo sẵn sàng cho ứng dụng sử dụng chế chuẩn CSDL Oracle Khái niệm video: 7.1 Video số hóa: ORDVideo tích hợp lưu trữ, truy xuất quản lý liệu video số hóa CSDL Video tạo đầu thu video, máy quay phim, video hoạt hình số hóa, thiết bị quay video chun dụng khác, chí thuật tốn chương trình Một số thiết bị ghi video tiếp nhận tín hiệu tương tự hay liên tục, chẳng hạn video thu vào máy quay phim video ghi lại media từ tính chuyển đổi thành giá trị số với đặc trưng điển hình video chẳng hạn định dạng, kiểu mã hóa, tỷ lệ khung hình, kích thước khung hình (chiều rộng chiều cao), độ phân giải khung hình, độ dài video, kiểu nén , số lượng màu sắc, bit rate 7.2 Các thành phần video: Video số hóa bao gồm liệu video (các bit số hóa) thuộc tính mô tả cho liệu video Dữ liệu video có định dạng khác nhau, kiểu nén, tỉ lệ khung hình, kích thước khung hình, độ phân giải khung hình, thời gian chơi, loại nén, số lượng màu sắc tốc độ bit phụ thuộc vào cách liệu video kỹ thuật số ghi lại ORDVideo lưu trữ truy xuất liệu video định dạng liệu hỗ trợ ORDVideo có thể:  Tự động trích xuất siêu liệu từ liệu video nhiều định dạng video phổ biến; Trích xuất thuộc tính ứng dụng lưu trữ chúng thuộc tính “comments” đối tượng dạng XML;   Được thiết kế để nhận hỗ trợ thêm định dạng video (bởi mở rộng) Kích thước video số hóa (số byte) có xu hướng lớn so với đối tượng máy tính truyền thống, chẳng hạn số văn Do đó, số chế mã hóa sử dụng liệu để nén liệu video byte hơn, chiếm dung lượng nhỏ thiết bị lưu trữ mạng Lưu trữ truy vấn đa phương tiện: Media lưu trữ loại đối tượng OM, trực tiếp BLOBs BFILEs Bạn nhận thấy lợi ích lớn việc lưu trữ media loại đối tượng OM Tuy nhiên, nhiều tính OM có sẵn để lưu trữ media BLOBs BFILEs sử dụng giao diện quan hệ Giao diện quan hệ OM cho phép nhà phát triển sử dụng phương thức tĩnh loại đối tượng OM với media có lưu trữ BLOBs BFILEs Cụ thể, nhà phát triển di chuyển liệu media hệ thống tập tin cục sở liệu; phân tích trích xuất thuộc tính liệu media; lưu trữ đặc tính dạng XMLType CLOB định dạng XML, tùy chọn, cột quan hệ cá nhân Các nhà phát triển không cần phải thay đổi lược đồ ứng dụng có khởi tạo loại đối tượng OM để tận dụng lợi giao diện quan hệ Các phương thức tĩnh OM sử dụng để thực hoạt động xử lý hình ảnh cắt, scale, nén, chuyển đổi định dạng Các kiểu đối tượng ORDAudio, ORDDoc, ORDImage ORDVideo chứa thuộc tính kiểu ORDSource phương thức cho việc thao tác nguồn liệu đa phương tiện 8.1 Lưu trữ liệu đa phương tiện OM lưu trữ liệu đa phương tiện nguồn nội CSDL, kiểm soát giao tác BLOB Nó tham chiếu mở rộng liệu đa phương tiện số hóa lưu trữ nguồn bên tập tin (tập tin thuộc hệ điều hành cụ thể) hệ thống tập tin cục bộ, URL máy chủ HTTP, nguồn định nghĩa người dùng máy chủ khác, chẳng hạn máy chủ media Mặc dù chế lưu trữ bên đặc biệt thuận lợi cho việc tích hợp liệu đa phương tiện có với CSDL, liệu đa phương tiện không đặt kiểm sốt giao tác không lưu trữ CSDL Các BLOB lưu trữ tablespace CSDL cách tối ưu hóa khơng gian cung cấp truy cập hiệu Các BLOB lớn khơng lưu trữ nội tuyến (BLOBs kilobyte lưu trữ nội tuyến) với dòng liệu khác Tùy thuộc vào kích thước BLOB, định vị (locator) lưu trữ hàng BLOB đích thực (lên đến 8-128 TB, tùy thuộc vào kích thước khối) lưu trữ tablespace khác Bộ định vị coi trỏ đến vị trí thực tế giá trị BLOB Khi bạn chọn BLOB, có nghĩa bạn chọn định vị thay giá trị, điều thực minh bạch Một lợi thiết kế định vị nhiều BLOB tồn dòng đơn Ví dụ, bạn muốn lưu trữ đoạn clip ngắn băng dạy học, đoạn ghi âm chứa mô tả ngắn gọn nội dung nó, đề cương khóa học, ảnh giảng viên, đồ dẫn đến trung tâm đào tạo nằm dòng Bởi BFILE khơng đặt kiểm sốt giao tác CSDL, người dùng thay đổi nguồn bên ngồi mà khơng cần cập nhật CSDL, gây mâu thuẫn với định vị BFILE Các loại đối tượng OM ORDAudio, ORDDoc, ORDImage ORDVideo cung cấp phương thức bao gói để làm việc sau:   Thiết lập nguồn liệu cục bên ngoài;  Sửa đổi thời gian lần cập nhật đối tượng;  Thiết lập thông tin kiểu nguồn bên ngồi, vị trí, tên liệu ;  Chuyển liệu vào khỏi CSDL; Lấy thông tin nội dung liệu cục chiều dài, vị trí nó, đưa nội dung vào BLOB tạm thời, xóa nó;  Truy cập nguồn liệu cách mở, đọc, viết, cắt xén đóng lại 8.2 Truy vấn liệu đa phương tiện: Khi lưu trữ CSDL, liệu đa phương tiện truy vấn lấy cách sử dụng cột chữ-hoặc-số khác thuộc tính đối tượng bảng để tìm hàng có chứa liệu mong muốn Ví dụ, bạn chọn video clip từ bảng Traning với tên khóa học 'Oracle Database Concepts' Dữ liệu đa phương tiện truy vấn theo siêu liệu trích xuất, theo cột bảng khác theo nội dung, chẳng hạn truy xuất dựa nội dung hình ảnh với mục chuyên biệt tùy chọn Nạp liệu đa phương tiện Dữ liệu đa phương tiện quản lý tốt CSDL Oracle Dữ liệu đa phương tiện bạn cần phải nạp vào CSDL để tận dụng ưu độ tin cậy, khả mở rộng, tính sẵn có, khả quản lý liệu Để đưa liệu đa phương tiện vào CSDL với số lượng lớn, bạn sử dụng:  SQL*Loader SQL*Loader tiện ích Oracle cho phép bạn nạp liệu, trường hợp này, liệu đa phương tiện (dữ liệu LOB), từ tập tin đa phương tiện bên ngồi vào bảng CSDL có chứa cột thuộc kiểu đối tượng OM  PL/SQL Một mở rộng thủ tục SQL, PL/SQL ngơn ngữ lập trình tiên tiến hệ thứ tư (4GL) Oracle Bạn viết thủ tục PL/SQL để nạp liệu đa phương tiện từ BLOB, hệ thống tập tin, nguồn liệu media theo URL vào cột thuộc kiểu đối tượng OM Ưu điểm việc sử dụng SQL*Loader dễ dàng để tạo kiểm tra tập tin kiểm soát hoạt động nạp liệu bạn Ưu điểm việc sử dụng đoạn mã PL/SQL để tải liệu bạn bạn gọi phương thức bạn tải liệu để tạo hình ảnh thu nhỏ, trích xuất thuộc tính CHƯƠNG V KẾT LUẬN Sự phát triển gần việc sử dụng liệu đa phương tiện ứng dụng rộng rãi Cơ sở liệu đa phương tiện cần thiết để quản lý hiệu sử dụng hiệu liệu đa phương tiện thời đại sống số hiên Sự đa dạng ứng dụng cách sử dụng liệu đa phương tiện khác nhau, cơng nghệ thay đổi nhanh chóng, phức tạp vốn có việc giải thích ngữ nghĩa, đại diện so sánh với tương tự… đặt nhiều thách thức MDBs giai đoạn cần nâng cao tầm quan trọng tính cấp thiết Ngày nay,sự phát triển MDBs liên kết chặt chẽ để gắn kết lĩnh vực ứng dụng Những kinh nghiệm có từ việc phát triển sử dụng ứng dụng đa phương tiện giúp thúc đẩy công nghệ sở liệu đa phương tiện Từ góc độ người sử dụng, sở liệu cung cấp chức cho truy vấn dễ dàng, thao tác thu nhận thông tin có liên quan cao từ sưu tập lớn liệu lưu trữ Cùng với phát triển nhanh chóng cơng nghệ tin học khối lượng liệu đa phương tiện(Multimedia) thu thập lưu trữ dạng số ngày nhiều dẫn tới việc tìm kiếm liệu đa phương tiện trở nên khó khăn ngày cần có nhiều hệ thống để hỗ trợ tìm kiếm thơng tin giúp người dùng tìm kiếm cách xác nhanh chóng thơng tin mà họ cần kho liệu khổng lồ Với phát triển nhanh chóng đó, đề tài tìm hiểu giúp bạn tiếp cận gần với sở liệu đa phương tiện nhằm đáp ứng nhu cầu cấp thiết thời đại bùng nổ thông tin điện tử CHƯƠNG V TÀI LIỆU THAM KHẢO Tiếng Anh [1] Arif Ghafoor (1995) Multimedia Database Management System ACM Computing Surveys, Vol 27, No 4, December Retrievaled December 16, 2012 from http://discovery.bitspilani.ac.in/discipline/csis/vimal/267MMC/AdditionalReadings/Multimedia %20Database s.pdf [2] Prof Dr Gunter Saake (2012) Multimedia Retrieval in Databases Foundations and Index Structures OvG Universität Magdeburg, Fakultät für Informatik, Institut für Technische und Betriebliche Informationssysteme Retrievaled December 16, 2012 from http://wwwiti.cs.unimagdeburg.de/iti_db/lehre/advdb/SoSe2011/mmdb.pdf [3] V.S Subrahmanian (1998) Multimedia Database Principles of Multimedia Database Systems, chapter Morgan Kaufmann Publishers Inc San Francisco, CA, USA Retrievaled December 17, 2012 from http://www4.comp.polyu.edu.hk/~cstyng/cyberu.02/MMDB.ppt [4] Chien Yu and Teri Brandenburg (2011) Multimedia database applications: issues and concerns for classroom teaching Department of Instructional Systems & Workforce Development, Mississippi State University Retrievaled December 15, 2012 from http://arxiv.org/ftp/arxiv/papers/1102/1102.5769.pdf Tiếng Việt [5] Trần Hoài Nam (2004) Luận văn thạc sĩ Cơ sở liệu đa phương tiện – yêu cầu vấn đề Trường Đại học Công nghệ - Đại học Quốc gia Hà Nội Truy xuất vào ngày 16/12/2012 từ http://www.scribd.com/doc/67984184/18/C %C6%A0-S%E1%BB%9E-D%E1%BB%AE-LI%E1%BB%86U-%C4%90APH%C6%AF%C6%A0NG-TI%E1%BB%86N-Multimedia-Database [6] Khuyết danh Bài giảng Cơ sở liệu đa phương tiện Truy xuất vào ngày 17/12/2012 từ http://tin2k11.forumd.biz/t1980-tai-lieu-cl-a-phuong-tien Liên kết [7] http://docs.oracle.com/cd/A84870_01/doc/inter.816/a67293/vir_cbr.htm [8] http://docs.oracle.com/cd/B28359_01/appdev.111/b28415/ch_intr.htm [9] http://multimediadb.blogspot.com/2006/03/why-need-multimedia-database.html ... thuyết CSDL đa phương tiện ứng dụng gì? Các nội dung tìm hiểu đề tài CHƯƠNG I TỔNG QUAN VỀ CƠ SỞ DỮ LIỆU ĐA PHƯƠNG TIỆN Khái niệm liệu đa phương tiện Cơ sở liệu đa phương tiện tập hợp liệu đa phương. .. TRỊ CƠ SỞ DỮ LIỆU ĐA PHƯƠNG TIỆN .2 Các yêu cầu hệ quản trị sở liệu đa phương tiện: .4 Các vấn đề hệ quản trị sở liệu đa phương tiện: .4 CHƯƠNG IV ỨNG DỤNG CỦA CƠ SỞ DỮ LIỆU... TỔNG QUAN VỀ CƠ SỞ DỮ LIỆU ĐA PHƯƠNG TIỆN .5 Khái niệm liệu đa phương tiện .5 Các đặc trưng sở liệu đa phương tiện: .6 Sự cần thiết sở liệu đa phương tiện:

Ngày đăng: 03/12/2019, 08:55

TỪ KHÓA LIÊN QUAN

w