Đo tính tương tự

Một phần của tài liệu Nghiên cứu ứng dụng cơ sở dữ liệu quan hệ mở rộng vào xây dựng cơ sở dữ liệu đa phương tiện (Trang 26)

Truy vấn đa phương tiện trên cơ sở tính tương tự thay cho đối sánh chính xác giữa các dữ liệu cần truy vấn và các dữ liệu trong CSDL. Tính tương tụ được tính toán trên cơ sở các đặc trưng, thuộc tính trích chọn và dưới dạng một hay nhiều giá trị. Tuy nhiên, tương quan của kết quả truy vấn vẫn do con người quyết định. Các kiểu đặc trưng được sử dụng để mô tả các đối tượng đóng vai trò quan trọng để phù hợp với yêu cầu này. Thước đo tính tương tự rất phức tạp vì quyết định cùa người sử dụng là chủ quan và phụ thuộc ngữ cảnh.

1.2.5 Đ ảm b ả o c h ấ t lư ợ n g d ịc h v ụ (Q o S ) tr o n g c lie n t, s e r v e r và hệ th ố n g tr u y ề n tin

CSDLĐPT thông thường là phân tán. Các dối tượny đa phưcmg tiện được truy tim từ server và truyền đến client để trình diễn. Dữ liệu đa phương tiện đòi hòi bảng thông rộng, không gian lưu trữ lớn và tốc độ đường truyền cao, giới hạn, thời gian trễ và đồng bộ không gian, thời gian. Các media và ứng đụng khác nhau có các đòi hòi khác nhau. Các đòi hỏi này phải thỏa mãn cho toàn bộ phiên trình điễn và truyền tin trong toàn bộ hệ thống.

Để cung cấp khung làm việc đồnc nhất để chỉ ra và đảm bâo vêu cầu khác nhau này, QoS được đề xuất. ỌoS là tập các tham số yêu cầu. Là hợp đồng giao kèo giữa úng dụng đa phương tiện và hệ thống. Khi ứng dụng có nhu cầu khởi động phiên làm việc, nó đệ trình yêu cầu QoS lèn hệ thống. Hệ thống có thể sẽ không chấp nhận yêu cầu, có thể đàm phán các yêu cầu ứng dụng thấp hơn. Khi hệ thống chấp nhận yêu cầu, hợp đồng giữa hệ thống và ứng dụng đứợc ký và hệ thống phải cung cấp QoS đòi hòi. Đàm bảo nảy dưới hỉnh thúc cùa 1 trong 3 dạng sau:

> Đảm bào tiền định (hard - deterministic): Luôn thỏa mãn yêu cầu QoS.

> Đảm bảo thống kê (soft - statistical): Đảm bảo dịch vụ được cung cấp với xác suất xác định p.

> Đảm bảo nỗ lực (effort): Không đảm bảo QoS. ứ n g dụng thực hiện ỉâu tùy ý. Là chiến lược phân chia hệ thống truyền thống.

Một hệ thống đa phương tiện điến hình bao gồm ba thành phần chính: hosts (bao gồm cả clients và servers) dưới sự điều khiển cùa ọs, bộ quàn ỉý lưu trừ, hệ thổng truyền tin và giao vận.

QoS được đảm bảo khi các tài nguyên hệ thống được quàn lý đúng đắn. Các tài nguyên hệ thống bao gồm chu kỳ CPƯ, bộ nhớ, băng thông, v.v. Mồi thành phần hệ thống phải có bộ quản lý tài nguyên, nó điều phối việc sử dụng tài nguyên.

Vấn đề nghiên cứu QoS còn khá mới mè. Nhiều nhiệm vụ nghiên cứu được đặt ra, thí đụ làm thế nào để chuyển đồi các tham số QoS sang các yêu cầu tài

- 2 6 -

nsuycn và phàn chia các phicn làm việc như the nào đẻ nhiều phiên làm việc dcu dược dáp ứng bời số lượng cố định tài nguyên.

1.2.6 C á c n h iệ m v ụ k h á c

1.2.6.1 Nén dữ liệu đa phương tiện

Mục tiêu chinh cùa nén dữ liệu đa phương tiện là khả năng nén nhiều nhất có thề không quan tâm đến khía cạnh trình diễn và tìm kiếm. Phần lớn các tệp âm (hanh, ành và video được nén nhờ kỹ thuật hay theo chuẩn nhất định. Để trích chọn đặc trưng của các file này thì trước hết phải giải nén chúng đã. Quan điềm này không hiệu quả về mặt tính toán vi nén và giải nén phải thực hiện vài lần trong tiến trình trích chọn, không hiệu quả khi lưu trữ vì các tệp nén và các đặc trưng trích chọn được lưu trừ tách biệt. Do vậy, cần có kỹ thuật nén sao cho trích chọn đặc trưng thực hiện trực tiếp trong dừ liệu nén và trong đó nén trên cơ sở đối tượng, không trên cơ sờ các giá trị mẫu riêng rẽ. Có thể thực hiện chỉ số hóa và truy tìm ảnh trong dữ liệu nén DCT, lượng tử vẻctơ, v.v. Nếu có thề chuyển ảnh bitmap sang đồ họa véctơ thì đạt được tỷ lệ nén cao hơn và dễ dàng truy vấn hơn. MPEG-4 và JPEG2000 là thí dụ về các chuẩn tổ hợp nén và truy vẩn.

Khía cạnh khác của nén là phải phù hợp với truyền tin và trình diễn. Trong nhiều ứng dụng, ảnh thumbnail được hiển thị trước trong màn hình hay cửa sổ để người đùng iựa chọn. Nếu người dùng quan tâm ánh nào thì họ chọn ảnh và phiên bàn mật độ lớn hơn để hiển thị. Có thể thực hiện ứng dụng loại này theo hai cách sau:

> Phưomg pháp thứ nhất: Ảnh kích thước khác nhau suy diễn từ cùng một ảnh được tạo ra, nén, lưu trữ riêng rẽ trong server. Các ảnh có kích thước yêu cầu sẽ gửi đến client để hiển thị. Thi dụ, dữ liệu ảnh thumbnail được truyền để hiển thị, dữ liệu ảnh gốc được gửi ừình tự theo yêu cầu.

> Phương pháp thứ hai: Các ảnh được nén và lưu trữ theo kích thước ban đầu. Dựa vào yêu cầu, dữ liệu ảnh gốc được truyền đến client không quan tâm đến yêu cầu của client. Trong phần lớn các trường hợp, client làm

giảm dữ liệu ãnh truyền ihành kích thước nhò hơn để hiến thị. Nếu user muốn quan sát toàn bộ ảnh gốc thì ảnh gốc được truyền đi.

Cả hai phương pháp đều không hiệu quả từ góc độ không gian lưu trữ và băng thông. Để giải quyết vấn đề trên, cẩn sử dụng kỹ thuật nén phản cấp như JPEG và MPEG-4. Nó không chỉ tiết kiệm không gian lưu trữ và băng thông mạng mà còn lảm giảm thời gian đáp ứng vì ảnh được truyền, giải mã, hiền thị một cách tiến triền dần dần thay cho giải mã và hiển thị chi khi dữ liệu đã sẵn sàng.

1.2.6.2 Chuẩn hóa biểu diễn dữ liệu

Trong tiến trình trích chọn đặc trưng và nén, đã giả sử rằng các giá trị mẫu thô cho mỗi media cỏ được theo cùng cách và có cùng ý nghĩa. Trong thực tế già sử này là không thực. Thí dụ, các đoạn âm thanh được ghi ờ các cường độ khác nhau, vì vậy việc so sánh trực tiếp các giá trị mẫu từ các đoạn âm thanh khác nhau là vô nghĩa. Tương tự, các giá trị pixel ành từ các ảnh khác nhau có thể có ý nghĩa khác nhau vì sử dụng các giả trị gama hiệu chinh khác nhau và hệ thống màu khác nhau. Do vậy, các thông tin ảnh hưởng giá trị mẫu cần gộp vào header tệp và các giá trị mẫu được hiệu chinh tùy theo trích chọn đặc trưng. Ngày nay, các khuôn mầu âm thanh và ảnh không bao gồm thông tin nảy. c ầ n có trình diền chuẩn cho mỗi medium.

C h ư ơ n g 2

V Â N Đ È L Ự A C H Ọ N M Ô H Ì N H c ơ S Ở D Ữ L I Ệ U C H O C Ỡ S Ở D ữ L I Ệ U Đ A P H Ư Ơ N G T I Ệ N■ •

Trong sổ các nhiệm vụ thiết kế CSDLĐPT có để cập đến mô hình dữ liệu cung cấp khung làm việc để biểu diễn các thuộc tính của dừ liệu mà nó được lưu trữ và truy vấn nhờ hệ thống. Bên cạnh đó các thao tác trên dừ liệu, tim kiếm dữ liệu và các thuộc tính của nó trong CSD L cũng được thực hiện. Hiện nay, có nhiều loại mô hình dữ liệu khác nhau như mô hình mạng, phân cấp, mô hình quan hệ. đối tượng quan hệ, mô hình hướng đối tượng, v.v. dẫn đến nhiều sự lựa chọn khi xây dựng và tổ chức các hệ CSDL theo mò hình dừ liệu cụ thể nào đó.

Phần trình bày trong chương sẽ nêu khái quát đặc điểm của các mô hình cơ sở dữ liệu chính là quan hệ, hưcmg đối tượng và đối tượng quan hệ làm nền tảng cho sự lựa chọn mô hinh dữ liệu cho CSDLĐPT [1][3][4][5]. Đồng thời trình bày khả năng quàn lý và đáp ứng các yêu cầu ứng dụng đa phương tiện dựa trên mô hình dữ liệu đối tượng quan hệ của hai HQTCSDL nổi bật là Oracle và DB2 [8].

2 .1 M ô h ì n h c ơ s ở d ữ l i ệ u q u a n h ệ

Cơ sờ dừ liệu quan hệ (Relational database - RDB) ỉà một cơ sở dừ liệu m à dữ liệu được lưu thành các bảng dưới dạng các hàng và cột dữ liệu. Mỗi bảng được định nghĩa dựa trên các kiểu dữ liệu đã được cung cấp sẵn và được chi định khóa. Các bảng trong cơ sờ dữ liệu có thể thiết lập quan hệ với nhau tạo nên sự ràng buộc chặt chẽ về mặt dữ liệu cũng như cấu trúc để đảm bảo tối ưu cho cơ sở dữ liệu, tránh dư thừa thông tin. Mỗi cột dữ liệu (trưởng hay thuộc tính) đều được xác định kiểu giá trị và với mỗi hàng, mỗi cột chỉ chứa một kiểu giá trị duy nhất.

M ột cơ sở dừ liệu quan hệ thường gồm một sổ thành phần như sau:

- 29-

> Ràng buộc, quan hệ: thiết lập quan hệ giũa các bàng dừ liệu với nhau.

> Khung nhìn (View) / Câu hỏi (Query): cho phép quan sát dữ liệu được lấy từ nhiều bàng dữ liệu khác nhau, được xảy dựng dựa trên tập lệnh SQL.

'r- Thủ tục / hàm: bao gồm hai loại: Store Procedure và Trigger. Cho phép lấy dữ

liệu từ các bảng hoặc tự động cập nhật cơ sờ dữ liệu khi có một sự thay đổi nào đó. Việc sừ dụng các hàm/thù tục trong cơ sỡ dữ liệu quan hệ (do hệ quàn trị cơ sở dữ liệu quản lý và thực thi) giúp cho các thao tác trên đừ liệu thực hiện nhanh hơn.

Ngoài ra, đối với mỗi hệ quản trị cơ sở dữ liệu quan hệ khác nhau có thể hỗ trợ thêm các chức năng khác nhau cho người sử dụng cơ sờ dữ liệu như:

> Lập chi mục: cho phép người xây dựng cơ sờ dù liệu lập chì mục dựa trẽn một sổ trường dữ liệu nào đó, phục vụ cho việc tim kiếm dữ liệu, khai thác dữ liệu thực hiện nhanh hơn.

> Quàn lý nọicời dùng: quàn lý và phân quyền người sử dụng cơ sờ dừ liệu. Với

mỗi người dùng riêng biệt sẽ được phép can thiệp vào một phần hoặc toàn bộ cơ sở dữ liệu.

Thông thường một cơ sở dữ liệu quan hệ cũng hỗ trợ việc lưu trữ các dữ liệu đa phương tiện ở dạng BLOB (Binary large object). Tuy nhiên, cơ sở dừ liệu quan hệ không hồ trợ các thao tác với nội đung cùa các dữ liệu đó.

M ột số hệ quản trị cơ sở dữ liệu quan hệ phổ biến: M icrosoft Access, M icrosoft SQL Server, M yS Q L ....

2 . 2 M ô h ì n h C O ' s ở d ữ l i ệ u h ư ớ n g đ ố i t ư ợ n g

Cơ sờ dữ liệu hướng đối tượng (Object Oriented Database - OODB) hay còn gọi là cơ sở dữ liệu đối tượng (Object Database - ODB) là cơ sờ dữ liệu cho phép tạo, điều khiển và lưu trừ các đổi tượng theo cách thức dễ hiểu và liên tục. OODB lun toàn bộ thông tin mô tã về đối tượng (thông tin ihuộc tính) và lược đồ của đổi tượng (cấu trúc của

- 3 0 -

đối tượng) cùng với nhau. Điều này hoàn toàn khác với cơ s ờ dữ liệu quan hệ (R-DB), các thông tin có thề lưu trong nhiều bàng dữ liệu khác nhau và cơ sờ dừ liệu đổi tượng quan hệ, đối tượng sau khi chuyển đổi sẽ lưu vào các bàng dừ liệu quan hệ như một cơ sỡ dữ liệu quan hệ truyền thống.

Khái niệm hướng đối tượng cung cấp công cụ để thiết kết một mô hình dữ liệu lón, có thể mô tả được các cấu trúc dữ liệu tự nhiên, trừu tượng và phức tạp. Với cơ sở đữ liệu hướng đối tượng, các kiểu dữ liệu có thể là các đối tượng cơ sở.

Hiện nay chưa có 1 chuẩn rộng rãi về O O D B, các sản phẩm của OODB vẫn còn khá hạn chế và đang trong giai đoạn sơ khai. Trong thời gian này, cơ sở dữ liệu đổi tượng quan hệ (O RD B) ra đời dựa trên sự bổ sung thêm các tính năng vào RDB. Một hệ quản trị cơ sở dữ liệu hướng đối tượng bao gồm 2 tiêu chuẩn sau:

> Là một hệ quản trị cơ sỡ dữ liệu;

> Là một hệ thống hướng đối tượng.

Mỗi kiểu đổi tượng của OODB có m ột chì danh xác định đối tượng OID. Tuy nhiên, để xác định đối tượng trong cơ sở dữ liệu người dùng cỏ thể định nghĩa khóa (là một tập con các thuộc tính).

M ột đối tượng trong OODB thường gồm ba thành phần:

> OID: chỉ danh xác định đối tượng íà duy nhất.

> Khởi tạo: cung cấp hàm khời tạo đối tượng từ các đối tượng dữ liệu khác.

> Giá trị: bao gồm giá trị của đối tượng.

OODB sử dụng OSQL để thao tác trên các đối tượng dữ liệu.

M ột số hệ quản trị cơ sở dữ liệu đổi tượng quan hệ: O2, Ozone, O bjectivity/D B :O bjectStore,PSE/Pro, ...

- 31 -

2 .3 M ô h ì n h c ơ s ở d ữ liệ u đ ố i t ư ợ n g q u a n h ệ

Cơ sờ dữ liệu đối tượng quan hệ (Object Relational Database - ORDB) là sự mở rộng cùa cơ sở dữ liệu quan hệ để cho phép đưa các đối iượng dừ liệu phửc tạp vào cơ sở dữ liệu. Khi một đối tượng dữ liệu được đưa vào cơ sờ dữ liệu, hệ thống sẽ chuyển đổi thông tin của đối tượng và lưu vào các bàng đữ liệu với các hàng, các cột như là cơ sỡ dữ liệu quan hệ. Cho phép người dùng có thể thao tác cập nhật và khai thác trên nội dung dữ liệu của đối tượng đã lưu trữ. Khi muốn khôi phục một đối tượng từ cơ sở dữ liệu, hệ thống sẽ tồne hợp lại các dữ liệu đơn giản tại các bàng và xây dựng Ịại thành đối tượng phức tạp.

c ơ sờ dữ liệu đối tượng quan hệ lưu trũ dữ liệu trong các bảng như một cơ sở

dữ liệu quan hệ truyền thống, tức là tất cả dữ liệu tại một cột nào đó của bảng phải cùng kiểu, vi vậy khỏng cỏ sự khác biệt giữa dữ liệu là đối tượng và phi đối tượng. Bản thân các kiểu dữ liệu cùa cơ sở dữ liệu đối tượng quan hệ không phải là các đối tượng. Các đối tưọ-ng được xây đựng từ nhừng kiểu dữ liệu cơ bản.

Ràng buộc về tỉnh thực thi: do cơ sờ dữ liệu đổi tượng quan hệ chuyền đổi dữ

liệu giữa định dạng đối tượng thành định dạng của cơ sờ dữ liệu quan hệ nên tốc độ thực hiện của cơ sở dữ liệu sẽ giảm theo kích cỡ của đối tượng và độ lớn của cơ sờ dữ liệu. Tuy nhiên, mô hình cơ sở dữ liệu đối tượng quan hệ rất thích hợp với những hệ thống cơ sở dữ liệu rẩt lớn và phức tạp.

ưu điểm của ORDBMS. ưu điểm chính của cơ sở dữ liệu đối tượng quan hệ là hệ

thống tụ động chuyển đổi đối tượng phức tạp giữa một định dạng RDB và định dạng cơ sở dữ liệu đối tượng mà nó cung cấp. Vì vậy, người lập trình không cần viết mã lệnh để chuyển đổi 2 định dạng đó (RDB - ORDB), mặt khác việc truy cập cở sờ dừ liệu dễ dàng thực hiện từ một ngôn ngữ lập trình hướng đổi tượng.

Các đặc trirng của ORDBMS. ngoài các đặc trưng cùa RDB, ORDB có thêm một

số đặc trưng mới phục vụ cho các kiếu đối tượng, đó là:

- 32 -

kiểu dữ liệu mới là các lớp, các đổi tượng để lưu trũ các đối tượng dữ liệu phức tạp dựa trên các kiểu dừ liệu đã có. Mỗi đối tượng lưu trong cơ sờ đữ liệu có một định đanh đổi tượng (O ID ) độc lập vời các dữ liệu thuộc tính của đối tượng.

> Phương thức: là các hàm, các thù tục gắn với lớp đối tượng. Các phương thức

này làm việc ũrơng tự như các hàm của SQL truyền thống, vi vậy chúng ta có thể sử dụng trong các query và trong việc định nghĩa các kiểu dừ liệu mới.

> Tinh thừa ké: một đổi tượng có thể thừa kế toàn bộ hoặc một phần dữ liệu và

các phương thức cùa các đối tượng khác.

> Hỗ trợ đa thừa kể: một đối tượng có thể thừa kế từ nhiều đối tượng khác nhau và có thể định nghĩa các hàm nạp chồng.

> Phương thức truy cập dử liệu: sử đụng cách lập chì mục theo cây nhị phân và cây đệ quy (B-tree & R-tree ).

> SQL 4: có thể truy cập dữ liệu của ORDB bàng cách sử đụng ngôn ngữ truy vẩn

Một phần của tài liệu Nghiên cứu ứng dụng cơ sở dữ liệu quan hệ mở rộng vào xây dựng cơ sở dữ liệu đa phương tiện (Trang 26)

Tải bản đầy đủ (PDF)

(113 trang)