Mô hình hóa dữ liệu tập trung vào việc thiết kế xây dựng các thao tác trên cơ sở dữ liệu đa phương tiện để thực hiện các giao thức truyền thông, các thao tác trích chọn, chèn, truy cập... Khi thực hiện các thao tác với các dữ liệu đa phương tiện liên
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
tục như âm thanh, video, hoạt hình... cần phải chú ý các khái niệm luồng dữ liệu, thời gian, thành phần tại mỗi thời điểm và đồng bộ hóa.
Một trong những vấn đề quan trong nhất của hệ thống cơ sở dữ liệu đa phương tiện là sự mô tả về cấu trúc của phương tiện truyền thông, hạn chế thời gian truy cập, cập nhật và trình bày.
3.1.1.3 Lƣu trữ dữ liệu
Các đối tượng đa phương tiện được lưu trữ trong cơ sở dữ liệu, gồm các phương tiện truyền thông không liên tục như văn bản, hình ảnh... và phương tiện truyền thông liên tục (coi như phương tiện truyền thông động) như âm thanh, video, hoạt hình... Các phương tiện truyền thông liên tục có tính chất thời gian thực ngược lại các phương tiện truyền thông không liên tục không có tính chất này. Do đó cơ chế để lưu trữ các dữ liệu này là rất khác nhau, hầu hết các dữ liệu phương tiện truyền thông liên tục được lưu trữ bằng cách sử dụng máy chủ lưu trữ riêng biệt để đáp ứng các yêu cầu thời gian thực, dữ liệu không liên tục được lưu trữ trong cơ sở dữ liệu dưới dạng các tệp dữ liệu meta. Nói chung các dữ liệu có thể được lưu trữ trong ổ cứng, ổ CD-ROM, DVD hoặc trực tuyến. Máy chủ lưu trữ một số lượng lớn các tài liệu đa phương tiện, quản lí một số lượng rất lớn các thiết bị lưu trữ nên các thiết bị lưu trữ này được tổ chức theo hình thức phân cấp.
3.1.1.4 Xác định dữ liệu trả về
Mục tiêu cuối cùng của bất kỳ một cơ sở dữ liệu đa phương tiện là phải có phương thức truy cập thông tin đa phương tiện hiệu quả. Đối với việc truy cập, các đối tượng đa phương tiện có thể phân thành hai loại đối tượng là: đối tượng chủ động (đang hoạt động, trình diễn) và thụ động (chưa trình diễn). Các đối tượng có tham gia vào quá trình trình diễn gọi là đối tượng chủ động (đang thực hiện). Tương tự, các đối tượng không tham gia vào quá trình trình diễn gọi là đối tượng thụ động. Một môi trường khai thác cơ sở dữ liệu tốt nếu có thể coi tất cả các đối tượng đa phương tiện là chủ động. Ví dụ nếu một bản nhạc đang được truy cập từ cơ sở dữ liệu và được phát đồng thời thì coi phương thức truy cập bản nhạc đó là chủ động, nếu chưa được phát thì coi là thụ động.
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
3.1.1.5 Truy cập dữ liệu
Để lấy được dữ liệu từ cơ sở dữ liệu phải sử dụng ngôn ngữ truy cập. Trong quá trình quản trị cơ sở dữ liệu, các truy cập dữ liệu của người dùng được xử lí bằng cách định nghĩa các thủ tục truy cập, ngôn ngữ truy cập như là một thành phần của hệ quản trị cơ sở dữ liệu, nó không thể tách rời. Một ngôn ngữ truy cập đa phương tiện phải có khả năng xử lí các ràng buộc phức tạp liên quan đến không gian và thời gian. Một ngôn ngữ truy cập mạnh mẽ cần phải xử lí tốt các từ khoá, chỉ mục của các từ khoá và nội dung của đối tượng đa phương tiện. Khi định nghĩa các truy cập, có hai loại truy cập được sử dụng: truy cập xác định và truy cập mờ. Truy cập xác định, là loại truy cập mà người sử dụng luôn xác định rõ những gì mà họ đang tìm kiếm. Truy cập mờ là loại truy cập mà các thuộc tính của đối tượng truy cập không rõ ràng. Trong trường hợp như vậy, các truy cập dữ liệu đa phương tiện có thể được chia thành truy cập nhóm từ khoá, truy cập ngữ nghĩa, truy cập trực quan. Hiện nay, truy cập từ khoá vẫn được sử dụng phổ biến bởi tính đơn giản của các truy cập này. Truy cập ngữ nghĩa là phương pháp truy cập khó khăn nhất bởi việc xác định chỉ mục phù hợp với mẫu. Truy cập trực quan được sử dụng theo bối cảnh, tức thông qua biểu tượng xác định nội dung tìm kiếm.
3.1.1.6 Phƣơng tiện truyền thông
Truyền thông là mục tiêu cuối cùng của bất kỳ hệ thống thông tin nào. Hệ thống đa phương tiện với tính năng phức tạp có khả năng đáp ứng đa môi trường cho phép nhiều người sử dụng giao tiếp với hệ thống tại một thời điểm.
3.1.2 Các bước để tạo ra một cơ sở dữ liệu đa phương tiện
Để tạo ra một cơ sở dữ liệu đa phương tiện, thực hiện theo các bước: 1. Bước 1: Xác định các kiểu dữ liệu đa phương tiện.
2. Bước 2: Số hóa các tài liệu đa phương tiện để có thể lưu trữ được trong máy tính. Tại đây mỗi tài liệu đa phương tiện được lưu trữ trong một tệp với các định dạng khác nhau. Chẳng hạn, các tài liệu âm thanh là các tệp có định dạng: WAV, MIDI, MP3, AIFF, RA, ASF, WMA, CDA...; các tài liệu video là các tệp có định dạng: AVI, MPEG, ASF, QT...
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
3. Bước 3: Tiến hành phân loại, đánh danh mục, đánh chỉ số.
4. Bước 4: Nhập văn bản mô tả các tài liệu đa phương tiện vào cơ sở dữ liệu đa phương tiện. Nội dung văn bản này được sử dụng để truy cập dữ liệu.
3.2 Xử lí âm thanh bằng Cool Edit
Cool Edit là một phần mềm xử lí âm thanh kỹ thuật số đa chức năng, chuyên nghiệp nhưng dễ sử dụng của tập đoàn Syntrillium. Hiện nay, phiên bản chạy ổn định và mới nhất là Cool Edit Pro 2.1. Cool Edit cho phép xử lí các tệp âm thanh số với tỉ lệ mẫu lên đến 192kHz (có cả 96kHz), có hỗ trợ cắm ActiveMovie/DirectX, kiểm soát tới từng track, tự động xoá khoảng trống. Cool Edit có các trình (i) kiểm soát tầng CD; (ii) chuyển đổi tỉ lệ mẫu chất lượng cao; (iii) xử lí theo kịch bản và lô; (iv) biên tập và điều khiển âm thanh; (v) phân tích âm thanh với các trình thể hiện phổ âm thanh và phân tích tần số….
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
Một số chức năng xử lí âm thanh chuyên dụng: 1. Chuyển từ âm thanh mono sang stereo;
2. Chuyển đổi định dạng: Cool Edit cho phép chuyển đổi qua lại giữa các định dạng tệp âm thanh như: wav, mp3, dbl, sam, iff, fvx, aif,snv, txt, cel, voc, vox, dwd, au, smp, wma, asf, asx...
3. Lọc âm thanh: Cool Edit có nhiều bộ lọc với các hiệu ứng âm thanh khác nhau như: lọc ồn, convert sample type...
4. Biên tập âm thanh: Cool Edit cho phép sao chép, cắt, dán chỉnh sửa lại tệp âm thanh đã có...
5. Nén nhạc đa băng tần;
6. Ghi âm từ các nguồn âm thanh khác nhau như: CD, trực tuyến...
7. Xác định các đặc trưng của tệp âm thanh như: tần số, số lượng mẫu, biên độ, cao độ, trường độ, thành phần mẫu, công suất...
3.3 Tổ chức cơ sở dữ liệu âm thanh nhạc cụ
3.3.1 Tổ chức cơ sở dữ liệu đa phương tiện
Mô hình cơ sở dữ liệu đa phương tiện không được xếp vào các cơ sở dữ liệu truyền thống. Các cơ sở dữ liệu thuộc hệ quản trị cơ sở dữ liệu thế hệ thứ nhất, thứ hai và các cơ sở dữ liệu theo mô hình tiên tiến, là mô hình dữ liệu phân cấp, mô hình dữ liệu suy diễn và mô hình dữ liệu hướng đối tượng, hay được kể đến. Tuy nhiên theo khía cạnh ứng dụng, không thể không kể đến cơ sở dữ liệu đa phương tiện.
Cần đưa ra các khái niệm toán học hình thức, thường được gọi là phương tiện trừu tượng để mô tả các kiểu dữ liệu đa phương tiện và các thủ tục xử lí dữ liệu đa phương tiện. Người ta cần xét các khía cạnh đặc biệt hơn so với các mô hình dữ liệu truyền thống, như vấn đề chỉ số hóa, vấn đề nén dữ liệu đa phương tiện.
3.3.1.1 Thiết kế và kiến trúc của cơ sở dữ liệu đa phƣơng tiện
Việc thiết kế và xây dựng mô hình của các cơ sở dữ liệu đa phương tiện liên quan đến việc tổ chức nội dung dữ liệu đa phương tiện và việc thể hiện vật lí của các dữ liệu.
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
1. Các kiến trúc về tổ chức nội dung
Người ta đưa ra ba kiến trúc ứng với các cách tiếp cận khi tổ chức nội dung chỉ số hóa trong hệ thống cơ sở dữ liệu đa phương tiện.
Hình 3.2 Kiến trúc khối chức năng cho hệ thống xử lí dữ liệu đa phƣơng tiện
2. Nguyên tắc tự quản
Theo tiếp cận tự quản, mỗi loại dữ liệu được tổ chức theo cách tự phù hợp. Sự phù hợp được hiểu tuỳ thuộc vào loại phương tiện cụ thể.
3. Nguyên tắc đồng đều
Một cách tiếp cận đề xuất kiến trúc hệ thống là đảm bảo tính đồng đều, cho phép chỉ số hóa tất cả các dữ liệu đa phương tiện. Việc “chỉ số hóa một cách thống nhất” đồng nghĩa với việc người ta sử dụng một cấu trúc thống nhất cho mọi loại dữ liệu đa phương tiện.
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
4. Nguyên tắc tổ chức hỗn hợp
Tiếp cận theo nguyên tắc hỗn hợp kết hợp cả hai cách tiếp cận trên. Kiến trúc này có dữ liệu đa phương tiện có loại chỉ số riêng, và số khác tuân theo chỉ số chung.
5. Một số nhận xét
1. Nếu sử dụng chỉ số theo tiếp cận tự trị, mỗi loại dữ liệu có cách chỉ số hóa riêng sẽ không thuận lợi cho công tác bảo trì các mối nối dữ liệu. Đối với chương trình xử lí nhiều loại dữ liệu, việc truy cập đến nhiều loại chỉ số hóa sẽ khó khăn, vì phải có các thao tác riêng đối với mỗi cách chỉ số. Vậy việc tạo cơ sở dữ liệu chung sẽ gặp không ít khó khăn;
2. Phương pháp thống nhất cách chỉ số hóa được thể hiện qua thiết bị về thông báo, siêu dữ liệu, mà thông tin về thiết bị chung có trong ngôn ngữ xử lí dữ liệu. Tuy nhiên, kiến trúc theo tiếp cận này cần xác định được hình thức trừu tượng áp dụng cho tất cả các loại dữ liệu đa phương tiện;
3. Theo tiếp cận hỗn hợp, người ta tránh được nhiều nhược điểm mà hai tiếp cận trên phải gặp:
Giả sử cần tạo cơ sở dữ liệu đa phương tiện với các phương tiện M1, M2...,Mn;
Cần tách các Mi ra (i) các phương tiện có xuất xứ hợp lệ, kèm với chỉ số và thuật toán xử lí chỉ số. Do vậy, cần dùng các ưu điểm của thuật toán và chỉ số; (ii) các phương tiện không có nguồn gốc hợp lệ, không có chỉ số. Khi đó người ta khuyến cáo sử dụng tiếp cận kiến trúc thống nhất;
Cần tạo các mã cần thiết để liên kết chéo các nguồn dữ liệu theo các chỉ số. Điều này cho phép làm tăng các điểm chung, và giảm các cái riêng.
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
Hình 3.4 Kiến trúc chỉ số hóa hỗn hợp
3.3.1.2 Tổ chức cơ sở dữ liệu dựa trên nguyên tắc thống nhất
Tư tưởng cơ bản của nguyên tắc thống nhất là “theo quan điểm về ngữ nghĩa, nội dung của dữ liệu đa phương tiện thường độc lập với nhau”. Khi có càng ít dữ liệu meta, người dùng càng cần thiết tiến hành các thao tác theo các câu hỏi chi tiết.
Tiếp cận thống nhất việc chỉ số hóa, có sử dụng dữ liệu meta để hướng dẫn thiết kế, nhưng không có đối với tất cả các đối tượng đa phương tiện trong cơ sở dữ liệu, cũng có những khó khăn cần được giải quyết.
Nhìn chung tiếp cận thống nhất có nhiều ưu điểm. Có thể liệt kê:
1. Siêu dữ liệu thường được lưu trữ trong các cấu trúc quan hệ hướng đối tượng. Người ta có thể dùng ngôn ngữ SQL để hỏi dữ liệu đa phương tiện; 2. Viết chương trình xử lí các siêu dữ liệu không khó;
3. Viết chương trình với một phần dữ liệu, hay phần dữ liệu trích ra, là công việc mà người lập trình quen thuộc.
Do vậy, có thể sử dụng kiến trúc thống nhất cách chỉ số hóa và sử dụng siêu dữ liệu để hướng dẫn việc thống nhất hóa.
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
3.3.1.3 Mô tả trừu tƣợng các đối tƣợng đa phƣơng tiện
Trừu tượng về phương tiện nhằm vào cấu trúc hình thức, cho phép thu nhận nội dung của phương tiện. Theo cách trực quan, trừu tượng về phương tiện xác định cấu trúc dữ liệu để mô tả thông tin về nguồn phương tiện.
Trước khi xác định được trừu tượng về phương tiện, người ta thường tự đặt câu hỏi về dạng dữ liệu chung khi có nhiều dạng dữ liệu? Khi đó người ta cần xác định các loại khác nhau của dữ liệu, nhằm thu được nhìn nhận các dữ liệu về đối tượng theo kiểu chung. Do vậy, người ta xây dựng công cụ chung, được gọi là Shell hay cấu trúc xương, dùng cho mục đích chung. Đối với cấu trúc chung này, cần có các đặc tính để phân biệt các dạng dữ liệu về bản chất đã khác nhau.
Các đặc tính chung của nội dung phương tiện có (i) các đối tượng riêng biệt, với các nội dung được mô tả là hình ảnh, video, âm thanh, hay văn bản; (ii) trong mỗi đối tượng đều có các phần tử nhỏ, chi tiết hóa các hành động; mỗi hành động nhỏ cũng có các thuộc tính.
Cơ sở dữ liệu đa phương tiện đơn giản là tập hữu hạn các trừu tượng về phương tiện.
Hình 3.5 Quan hệ ≤ trong hệ thống cơ sở dữ liệu đa phƣơng tiện có cấu trúc
3.3.1.4 Ngôn ngữ hỏi dữ liệu đa phƣơng tiện
Ngôn ngữ hỏi dữ liệu cho phép tìm kiếm, xử lí dữ liệu. Với dữ liệu quan hệ, người ta đã dùng ngôn ngữ SQL. Với dữ liệu đa phương tiện được mô hình theo tiếp cận mô hình dữ liệu quan hệ, ngôn ngữ tựa SQL được đề xuất. Ngôn ngữ này (i) Mở rộng SQL cho phép hỏi dữ liệu theo kiến trúc thể hiện thống nhất; (ii) Mở rộng SQL cho kiến trúc lai, kết hợp tiếp cận thống nhất và tự trị.
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
Hỏi hệ thống SMDS: có các hàm mẫu xây dựng sẵn, cho phép tìm đối
tượng, tìm khía cạnh của đối tượng, tìm các thuộc tính. Câu “SELECT…FROM” của SQL cần được thay đổi phù hợp;
Hỏi trên các thể hiện hỗn hợp của các dữ liệu đa phương tiện.
3.3.1.5 Kỹ thuật tìm kiếm
Để tìm kiếm thông tin trong cơ sở dữ liệu, người dùng cần xác định được (i) đối tượng dữ liệu cần tìm; (ii) bảng cơ sở dữ liệu cần trích dữ liệu; (iii) các vị từ tạo câu hỏi. Các câu hỏi cơ sở dữ liệu truyền thống được diễn tả ở dạng văn bản, thông qua ngôn ngữ hỏi, như ngôn ngữ chuẩn công nghiệp SQL. Các câu hỏi cơ sở dữ liệu đa phương tiện cần đến chức năng phụ trợ để tìm theo nội dung. Đề xuất mở rộng SQL, các ngôn ngữ hỏi theo nội dung mới và ngôn ngữ hiển thị đang được đưa ra.
Hình 3.6 Mô hình tìm kiếm thông tin tổng quát
1. Tìm theo nội dung và sử dụng từ khoá
Nếu thông tin dựa vào từ khoá thì (i) thông tin cần được chỉ số hóa; (ii) hay các đối tượng cần được tự động ghi nhận và có từ khoá tương ứng trong chỉ số. Tuy nhiên, khi dùng chỉ số hóa thủ công hay tự động, các từ mô tả được thêm vào chỉ số có thể phù hợp hay không phù hợp với các từ khoá đã được người dùng sử dụng.
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
2. Lọc thông tin
Các bộ lọc thông tin là cầu nối giữa người dùng và nguồn tin. Các bộ lọc trợ