23 Mô hình CO’ sở dữ liệu đối tượng quan hệ
2.4.1 Quản lý nội dung đa phương tiện
C ác kiểu đối tư ọ n g đ a phưrm g tiện
O racle InterM edia cho phép quản lý dữ liệu đa phương tiện thông qua một tập hợp các kiểu đổi tượng ORDImage, ORDAudio, and ORDVideo tương ứng với các dữ liệu image, audio và video. Các kiểu đối tượng này tương tự như các lớp trong Java hoặc c++
gồm có các thuộc tính, siêu đừ liệu, nội dung dữ liệu đa phương tiện và cả các phương thức.
> Nội dung dừ liệu là những dữ liệu thực liên quan đến từng loại dữ liệu image, audio, video hoặc dạng hồn hợp.
> Siêu d ữ liệu là thông tin định dạng về nội dung dữ liệu bao gồm các thông tin như độ dài của đổi tượng, có định dạng nén hay không hoặc các thông tin khác được cung cấp từ chương trình ứng dụng như tên cùa một ca sỹ cho một bài hát kỹ thuật số nào đó v.v.
phối hoặc trích siêu dữ liệu, hoặc nén hoặc chuyển đồi định dạng dừ liệu (ví dụ như chuyển đổi định dạng ảnh).
Ngoài ra, Oracle InterM edia còn có kiểu đổi tượng ORDDoc. Kiểu đối tượng này cỏ thể chứa hồn hợp các đổi tượng ORDImage, ORDAudio hoặc ORDVideo. Vì vậy, với kiểu đổi ĩượng ORDDoc vấn đề về quàn lý sẽ phức tạp hơn với các đối tượng khác.
Trong quá trình sử dụng, các kiểu đối tượng này có thể được m ờ rộng để hồ trợ cho các ứng dụng phức tạp khác như:
> Bổ sung thêm các định dạng phức tạp;
> Luợc đồ nén và giải nén mới;
> Chi mục chuyên biệt;
> T ự tạo các truy vấn tối ưu và các phương thức;
> Các nguồn đữ liệu mới;
> Các giải thuật xừ lý dữ liệu chuyên dụng.
Việc thêm một hoặc nhiều cột đa phương tiện (ORĐImage, ORDAudio, and ORD V ideo) vào trong các bảng đã có (hình 2.1) hoặc tạo ra bảng mới có các cột đữ liệu đa phương tiện có thể thực hiện đơn giản. Điều này thể hiện khả năng quản ỉỷ kết hợp dữ liệu đa phương tiện và quan hệ.
- 35 -
Với tính mờ của Oracle IntcrM edia. SQI., chuẩn có thể truy cập các kiểu dừ liệu image, audio, video, các phương thức và siêu dữ liệu dựa trên các kiểu đối tượng O RD Im age, ORDAuđio, ORDVideo. Ngoài ra, Oracle InterM edia còn hỗ trợ Internet cho các Web Server và các còng cụ tác chủ (authoring tools) khác. Các ửng dụng cũng có thể truy cập Oracle InterM eđia qua giao diện đối tượng quan hệ. Các ngôn ngữ lập trinh như Java, C++ hoặc 3GLs có thể sử dụng Oracle InterMedia qua lớp thư viện, PL/SQL hoặc Oracle Call Interface (OCI) đề xây dựng các ứng dụng.
M ô h ìn h lưu tr ữ các đối tư ợ n g đ a p h ư ơ n g tiện
Việc lưu trữ dữ liệu đa phương tiện trong Oracle có nhiều sự lựa chọn như:
> Lưu trữ ở dạng BLOBs (Binary large objects) trong CSDL;
> Hoặc lưu trữ ờ dạng BFILEs (File - based large objects) ờ một vị trí xác định trong hệ thống file đặc tnm g cùa hệ điều hành;
> URLs (Uniform Resource Locator) chứa dữ liệu image, audio và video trên một HTTP server đó nào ví dụ như Oracle Application Server hoặc Oracle Database, Netscape Application Server, M icrosoft Internet Information Server (IIS), Apache HTTPD Server và Spyglass Servers.
> Các Server chuyên dụng dùng để lưu trừ đừ liệu đa phương tiện
K hả năng nhập xuất đ ữ liệu giừa CSDL Oracle với các nguồn dữ liệu khác cũng có thể thực hiện dễ đàng. Cách lưu trữ dữ liệu đa phương tiện bên ngoài CSDL cung cấp một kỹ thuật thuận tiện cho việc quản lý dữ liệu đa phương tiện, vì các dữ liệu này được ỉưu trữ tập trung, thao tác nhập hoặc xuất dừ liệu ờ dạng BLÓBs và nguồn BFILEs bên ngoài có thể thực hiện tại mọi thời điểm.
Các đối tượng của Oracle InterM eđia (ORDAudio, ORDImage, ORDVideo, and O R D D oc) có chung một mô hình lưu (rữ dữ liệu. Thành phần dữ liệu đa phương tiện cùa các đối tượng này được lưu trữ trong c a sờ dữ liệu dưới dạng BLOBs có sự kiểm soát giao dịch hoặc bên ngoài cơ sờ dữ liệu và không có sự kiếm soát giao dịch. Cách thức
-36 -
lưu trữ dừ liệu bèn ngoài có thể sử dụng BFILEs (tệp phảng cùa hệ diều hành), qua các URL của HTTP server, hoặc trên một Server dữ liệu đa phưong tiện chuyên biệt, hoặc từ nguồn đ ữ liệu do nsỊirời dùng định nghĩa trên các Server khác.
Siêu dữ liệu và các phương thức cùa đổi tượng luôn được lưu trữ trong CSDL dưới sự kiểm soát của O racle InterM edia. D ù nội dung dữ liệu đa phươntỉ tiện được ỉưu trử ở trong hay ngoài CSDL, Oracle InterM eđia vẫn sẽ quản lý tấ t cả các kiểu đối tuợne đa phương tiện và tự đ ộ n s trích siêu dữ liệu cho từng kiểu đổi tượng. Siêu d ữ liệu bao gồm:
> Thông tin về audio, video, image và các dạng d ữ liệu hỗn hợp khác gồm nguồn gốc, vị trí, tên nguồn, v.v.
> Cập nhật thông tin có liên quan đến định dạng dữ ỉiệu và thời gian sửa đổi;
> Kiểu dừ liệu đa phương tiện M IM E (sử dụng trong các ứng dụng W eb và mail);
> Độ rộng, cao của ảnh, độ lớn nội dung ảnh, định dạng ảnh hoặc kiểu nén ảnh;
> Kiểu mã hóa audio, số lượng kênh, tốc độ lấy mẫu, kích thước mẫu, kiều nén, thời gian thực hiện và phần mô tả;
> Độ cao, rộng cùa frame video, tốc độ và độ phân giải của frame, thời gian thực hiện, số lượng fram es, kiểu nén, số lượng m àu, sổ lượng bits và phần mô tả;
> Sự lựa chọn siêu dừ liệu cho ứng đụng (ví dụ như tên ca sỹ hoặc tên hãng phim);
> Siêu dừ liệu của các dạng dữ liệu trong XM L.
V ới các dạng d ữ liệu đa phương tiện, siêu d ữ liệu thường gắn liền với các đặc điểm của kiểu dữ liệu đó như:
> Các đặc điểm cùa Im age: độ cao, độ rộng và độ dài nội dung ảnh, định dạng ảnh vả các định dạng nén ảnh.
> Các đặc điểm của Audio: kiểu mã hóa, số kênh (rãnh), tốc độ lấy mẫu, kich thước mẫu, kiểu nén và thời gian thực hiện (khoảng thời gian).
> Các đặc điểm cùa Video: độ cao và độ rộng cùa frame, độ phân giãi của frame, tốc độ, thời 2,ian thực hiện (khoảng thời gian), số frames, kiểu nén, số màu, và tỷ lệ bits.
Các phương thức trích siêu dừ liệu thường là một tập các phương thức thao tác trên dữ liệu cụ thể. Ví dụ đối với images, có thể thực hiện việc chuyền đối định đạng, nén. xác định tỷ lệ xích, cất xén, sao chép, chiếu, quay và điều chình tỷ lệ sáng cùa ảnh v.v.
N hư vậy, Oracle InterM edia hồ trợ lưu trữ các định dạng file phổ biến như các dạng image, và các định dạng chuỗi audio, video trong cơ sờ dữ liệu. Các thao tác thêm (add) các cột hoặc các đối tượng đa phương tiện vào các bảng dữ liệu đã có, hoặc chèn (insert) hoặc truy vấn (retrieve) dữ liệu đa phưcmg tiện cũng được hỗ trợ. Điều này cho phép các nhà thiết kế cơ sờ dữ liệu có thể mở rộng các cơ sở dữ liệu đã có với dữ liệu đa phương tiện, hoặc có thể xây đựng mới các ứng dụng cơ sờ dữ liệu đa phương tiện cho người sử dụng. Các chưyên gia phát triền Oracle ỉnterMedia có thể sử dụng các chức năng cơ sờ sẵn có để xây đựng các ứng đụng đa phương tiện chuyên dụng.
Trong khi xây dựng các ứng dụng, các nhà phát triển ứng dụng nhận thấy vai trò và lọi ích cùa Oracle InterM edia cùng với các dịch vụ tích hợp khác nhir Jdeveloper giúp cho môi trường phát triền các ứng dụng và vấn đề quản lý dữ liệu trên Oracle trở nên thuận lợi hơn.
G iao diện dổi tư ợ n g q u a n hệ
Trước đây các ứng dụng thường lưu trữ dữ liệu đa phứcmg tiện ở dạng BLOBs hon là sử dụng các đối tượng của Oracle InterM edia. Hiện nay, các ứng dụng có thê sử dụng các đặc điểm cùa Oracle InterM edia thông qua çiao diện đối tượng quan hệ cùa Oracle InterM edia làm Oracle InterM edia trở nên gần gũi hơn.
- 3S -
2 .4 .3 K iể u đ ố i tư ợ n g ả n h O R D Im a g e tr o n g O ra c le I n te r M e đ ia
ORDImage trong Oracie InterMedia hỗ trợ lim trừ các ảnh bitmap (hay ảnh quét raster) tĩnh hat chiều của các vật thể dưới dạng nhị phân. Các hình ảnh có thể được tạo ra từ một tài liệu hay từ máy quét ành, một nguồn video như mảy quay camera hay đầu íỉhi video VCR được nổi với một thiết bị sổ hoá video hoặc bộ giữ khung ảnh màn hình (, các thiếi bị giữ hình ảnh chuyên biệt hay thậm chí bằng các thuật toán hình ành). Các thiết bị thu giữ hình ánh iấy tín hiệu tương tự hay liên tục như ánh sáng chiểu lên phim trong máy ảnh và chuyển nỏ sang các giá trị số trẽn một lưới điềm hai chiều (grid o f points). Các điểm ờ mắt lưới này gọi ià các điềm ảnh (pixel). Các thiết bị bao gồm việc thu giữ và hiển thị ảnh cần cỏ các ứng dụng điều khiển.
C ác th à n h p h ầ n của ảnh
Các ảnh số chứa dữ liệu ảnh (dưới dạng các bit) và các thuộc tính mô tả các đặc điểm của ành. Các thuộc tính tối thiều của một ảnh bao gồm:
> Kích thước ảnh (độ cao trên từng dòng quét ảnh và độ rộng tính theo pixels);
> Sổ lượng bits/1 pixels trong từng mẫu mầu của ành;
> Kiểu nén;
> Đ ịnh dạng nội dung ảnh bao gồm có các dạng:
• Ảnh một màu hoặc độ sâu của bit (M onochrome or bit depth);
• Mô hình mẫu (Band Interleaved by Plane, Band Interleaved by Line, BandSequential);
• Mô hình màu (Lookup Table, Direct), không gian màu (GRAY, RGB);
• Các thuộc tính riêng.
G ắn kèm với ảnh đôi khi còn có các thông tin riêng như tên của người được chụp, mô tà ảnh, ngày chụp, người chụp, v.v. Do vậy, dữ liệu ảnh được lưu trừ cùng với dừ liệu text mô tả ảnh nằm ở một cột hay thuộc tinh trên bàng cơ sờ dừ liệu.
D ừ liệu ảnh (các điềm ảnh) có chiều sâu (tính bằng sổ bit cho một điểm ảnh) biến đồi phụ thuộc vào cách ảnh được giữ và được tổ chức theo các cách khác nhau. Sự tổ chức dữ liệu ảnh tạo nên định dạng dữ liệu ảnh. Ngoài ra nó còn có lhể lưu trữ và truy xuất dữ liệu ảnh thuộc bất cứ định dạng nào. ORDImage cỏ thể xù lý và trích dẫn các thuộc tính ảnh một cách tự động.
Oracle InterM edia hỗ trợ hầu hết các định dạng ánh như: TIFF, JFIF (thường dùng JPG), BMP, TARGA, EXIF, PCX, PICT, GIF, CALS, SUN RASTER, FPIX, PNGF, PPMF, PGMF, PBM F, W BM P, và RPIX. Điều này giúp cho các nhà phát triển cỏ thể dễ dàng lưu trữ các ảnh được tạo ra từ nhiều ứng dụng khác nhau mà không cần biết các kiểu định dạng file ảnh đó. Oraice InterMedia không yêu cầu các ứng dụng thực hiện chuyển đổi các file ảnh từ dạng này sang dạng khác trước khi nó được lưu trữ hoặc truy vấn, điều này đàm bảo cho các thao tác trên ảnh không !àm ảnh hường đến sự hiển thị ảnh. Tuy nhiên, O racle InterM edia vẫn cung cấp khà năng chuyển đồi giữa các định dạng ảnh đề đáp ứng cho nhu cầu cùa từng ứng dụng.
Ví dụ: Oracle InterM eđia có thể chuyển đổi các ảnh từ một định dạng nào đó sang W BMP để các ảnh đó được sừ dụng trong các ứng dụng đi động. RPIX không có định dạng nén trong O racle InterM edia điều này làm cho việc xử lý ảnh dễ dàng truy cập đến từng pixel. Thuộc tính cùa ảnh hoặc các định dạng ảnh bcn ngoài có thể dễ dàng được chuyển đồi sang dạng RPIX bằng việc sử dụng các phương thức biến đổi các thuộc tính của ảnh trước khi đưa vào Oracle InterMedia. Các thuộc tinh sau khi đã được biến đồi, Oracle InterM edia có thể xử lý ảnh, lưu trữ, truy vấn, áp dụng các thao tác trên ảnh và các phương thức chuyển đổi cần thiết. Oracle InterM edia có thể đọc viết dữ liệu ảnh với các độ sâu bits khác nhau kể cả ảnh một màu (1 bit), 2 ,4 , 6, 8, 12, 16, 24, 32 và 48 bits.
Đ ịnh d ạ n g trá o đổi ảnh (Im age in te rc h an g e fo rm at)
Mô tà rõ ràng việc tổ chức và sử dụng các thuộc tính, đữ liệu và thường có cả các lược đồ nén để cho phép các ứng dụng tạo, trao đổi và sừ dụng các hỉnh ảnh. Các định
- 39 -
-40 -
dạng tráo đổi thường được Um thành các file trên đĩa. Chúng có thể được trao đổi theo kiểu tuần tự qua mạng và được xem như một giao thức, c ỏ nhiều iĩnh vực ứng dụng trong thế giới ành sổ và nhiều ứ n s dụng đề tạo hay tận dụng các ánh sổ trong ứng dụng. ORDỈm age hồ trợ lưu trừ, truy xuất tất cả các định đạns, ảnh và hồ trợ xừ lý, trích xuất thuộc tíiứi của nhiều định dạng ảnh.
C ác lược đồ nén
Không gian lưu trữ cẩn cho ảnh số cỏ thể coi là lớn so với dừ liệu truyền thống, nên có nhiều lược đồ nén được dùng để giảm kich thước ảnh xuống'còn vài byte. Như vậy đã giảm không gian lưu trừ và giảm tải cho mạng. Các lược đồ nén lossless không làm mất thông tin ảnh nên khi giải nén thu được ảnh tương đưcmg với ảnh gốc từng bit một. Còn lược đồ nén lossy không cho ta ảnh gổc khi giải nén, màu sắc ành có thể bị thay dồi nhtmg mẳt người không nhận thấy được.
Oracle InterM edia hỗ trợ hầu hết các ỉược đồ nén rất hiệu quả như:
> Lược đồ mã hóa Huffman run-length CCITT G3 / G4 được dùng cho các ảnh văn bản.
> Lược đồ mã hóa ISO/CCỈTT JPEG dùng cho các ảnh chụp (thậm chí cho cả màu sắc).
> Lược đồ nén Lossless RLE dùng cho tất cả các loại ảnh trên thực tế.
Oracle InterM edia hồ trợ cho các nhà phát triển ứng dụng cả các kỹ thuật nén phức tạp bằng cách cho phép họ đom giản hóa các yêu cầu về ảnh được nén hoặc không nén. Thêm vào đó, ngoải khả năng trích siêu dữ liệu, chuyền đổi định dạng ánh và nén ảnh, Oracle InterM edia còn cung cấp một tập các hàm thao tác dựa trên server như xác định tỷ xích (scaling), cắt xén ảnh (cropping), v.v. Sự hỗ trợ nảy rất hữu dụng cho việc chuẩn bị dữ liệu ảnh vào một mục đích nào đó chẳng hạn như quan sát ảnh hoặc đưa ảnh đã qua xử lý làm đầu vào cùa một tiến trình xử lý khác, ảnh cũng có thể được xem trước hoặc thu nhỏ lại nhưng vẫn rất rõ ràng. Các nhà phát triển phát triển ứng dụng muốn xừ
- 4 i -
lý những ành có độ tinh xào hoặc chuyên nghiệp có thể tương tác đồ họa trên giao diện người dùng.
2 .4 .4 K iể u đ ố i t u ọ n g â m th a n h O R D A u d io
ORDAudio lưu trữ, truy vấn và quản iỷ dữ liệu audio số trong cơ sờ dừ liệu. Audio có thể được đưa ra bời máy ghi âm audio, nguồn audio như micro, audio số hoặc một số các thiết bị ghi âm audio chuyên dụng thậm chí cỏ thể từ các thuật toán. Các thiết bị ghi audio nấm bắt các tin hiệu ỉiên tục hoặc tương tự như âm thanh được phát ra từ micro hoặc âm thanh được ghi trên phương tiện có tính từ và chuyển đổi nó sang các giá trị số cùng với nhừng đặc trưng riêng cùa audio chẳng hạn như định dạng, kiểu mã hỏa, số kênh, tỳ lệ mẫu, kích thước mẫu, kiểu nén và khoảng thời gian thực hiện.
C ác th à n h p h ầ n củ a A u d io
Audio số gồm dữ liệu audio (các bits được sổ hóa), các thuộc tính mô tả và đặc trung của dữ liệu audio. Các ứng dụng audio thường kết hợp các thòng tin của một ứng dụng cụ thể nào đó chẳng hạn như để mô tả cho một audio clip có ngày ghi, tác già hoặc diễn viên v.v. dữ liệu của audio lưu trữ các mô tả ờ dạng text thành thuộc tính hoặc cột trong một bảng cơ sở dữ liệu.
D ữ liệu audio cỏ các định dạng khác nhau như A IFF , A IFF C , A U FF, WAV, M PEG í, M PEG II, M PEG III, and R ealN etw orks audio. Tùy từng định dạng, mà dữ liệu audio cỏ các kiểu m ã hóa, nén, số lượng kênh, tốc độ mẫu, kích thước mẫu và thời gian thực hiện. ORDA udio lưu trữ và truy vấn dữ liệu audio ờ bất cứ định dạng nào. O R D A udio còn có thể tự động trích siêu đữ ỉiệu từ dữ liệu audio có các định dạng phổ biến khác. ORDA udio trích xuất các thuộc tính ứng dụng và lưu trữ chúng trong trường ghi chú cùa đối tượng theo dạng XML.
Kích thước audio số (số lượng bytes) có khuynh hướng lớn hơn so với các đổi