Đề cương ôn tập môn cơ sở dữ liệu đa phương tiện

10 1.2K 26
Đề cương ôn tập môn cơ sở dữ liệu đa phương tiện

Đang tải... (xem toàn văn)

Thông tin tài liệu

Câu 1: Các loại liệu ĐPT cách phân loại ? - - Các loại liệu ĐPT bao gồm: + Dữ liệu văn (có cấu trúc) + Dữ liệu âm + Dữ liệu ảnh + Dữ liệu video Một số cách phân loại liệu: + Dựa định dạng vật lý + Dựa mối quan hệ liệu ĐPT với chiều thời gian hay không gian Câu 2: Các đặc tính liệu ĐPT? - Các đặc tính liệu ĐPT gồm có: + Dung lượng lớn (video, audio) + Dữ liệu video audio có chiều thời gian nên phải trình bày tốc độ xác định + Dữ liệu số audio, images, video biểu diễn chuỗi giá trị mẫu riêng biệt, thiếu cấu trúc ngữ nghĩa để máy tính tự động nhận dạng nội dung + Nhiều ứng dụng ĐPT đòi hỏi biểu diễn đồng thời nhiều loại liệu ĐPT theo chiều thời gian không gian phù hợp + Dữ liệu ĐPT mang nhiều thông tin Do cần nhiều tham số để biểu diễn nội dung cách đắn Câu 3: So sánh DBMS với IR? DBMS IR Một DBMS chứa ghi cấu trúc đồng Trong IR, ghi cấu trúc, thuộc nhất: tính cố định: + Mỗi ghi đặc trưng thuộc tính + Để đánh mục: keywords, index terms, doc + Giá trị thuộc tính miêu tả rõ ràng đầy descriptor đủ ghi + Tạo từ khóa mục đóng vai trò quan trọng Trong DBMS, việc truy vấn thông tin dựa Trong IR, không đòi hỏi trùng lặp tuyệ đối trùng lặp tuyệt đối câu truy vấn giá trị Sự truy vấn dựa độ trùng khớp tập thuật ngữ Sử dụng phương pháp trùng lặp xấp xỉ phần thuộc tính ghi Cùng term có nghĩa khác Câu 4: Vai trò DBMS IR truy vấn thông tin ĐPT?  Vai trò DBMS (Hệ quản trị sở liệu) truy vấn thông tin ĐPT: - Các hệ quản trị CSDL phát triển sử dụng rộng rãi liệu có cấu trúc - Trong hệ quản trị CSDL quan hệ, thông tin tổ chức dạng bảng quan hệ Các hàng bảng tương ứng với đơn vị thông tin ghi Các cột tương ứng với thuộc tính - SQL sử dụng để thao tác CSDL + Ví dụ: create table STUDENT( Student_id integer, Name varchar(50), Address varchar(100)) - Các thuộc tính hệ quản trị CSDL quan hệ có kiểu cố định có kích cỡ cố định Hệ quản trị CSDL quan hệ phù hợp với việc xử lý liệu kiểu chữ số xâu ký tự ngắn Loại liệu lớn có độ dài biến đổi hỗ trợ hệ quản trị CSDL quan hệ đối tượng rộng nhị phân (BLOB) + Ví dụ: create table STUDENT( Student_id integer, Name varchar(50), Address varchar(100), Picture BLOB) - Hệ quản trị CSDL hướng đối tượng + Kết nối đặc điểm hướng đối tượng với CSDL quan hệ + Các đối tượng định nghĩa theo kiểu hướng đối tượng Mỗi đối tượng chứa thuộc tính phương thức + Ví dụ: Create type Image( Private Size integer, Resolution integer, Content float[], Public …) create table STUDENT( Student_id integer, Name varchar(50), Address varchar(100), Picture IMAGE) - BLOBs đối tượng bước tiếp cận đến xử lý liệu ĐPT BLOBs lưu trữ liệu có khối lượng lớn, đối tượng chứa thuộc tính đơn giản dẫn đến số yêu cầu để xử lý truy vấn liệu ĐPT sau: + Các công cụ tự động bán tự động trích chọn nội dung đặc trưng chứa liệu ĐPT + Cấu trúc đánh mục đa chiều để xử lý vector đặc trưng + Các độ đo tương đồng để truy vấn thông tin ĐPT thay sử dụng trùng lặp xác + Các hệ thống lưu trữ liệu kích cỡ lớn, băng tần rộng, thời gian thực + Giao diện người dùng cho phép tạo câu truy vấn linh hoạt loại liệu ĐPT khác nhau, biễu diễn liệu ĐPT  Vai trò IR truy vấn thông tin ĐPT - IR tập trung vào truy vấn tài liệu văn - Các kỹ thuật IR đóng vai trò quan trọng quản lý thông tin ĐPT bởi: + Tồn lượng lớn tài liệu văn dạng tổ chức, ví dụ thư viện + Văn dùng để giải loại liệu ĐPT khác - Tuy nhiên, việc dùng kỹ thuật IR xử lý thông tin ĐPT có hạn chế: + Việc giải trình thủ công, tốn thời gian + Việc giải không đầy đủ mang tính chủ quan + Các kỹ thuật IR xử lý câu truy vấn dạng khác văn + Một vài đặc điểm ĐPT khó mô tả văn (kết cấu ảnh, hình thù đối tượng ) Câu 5: Các kiến trúc hệ thống CSDL ĐPT? a Kiến trúc cặp lỏng - Thế kiến trúc cặp lỏng + Hệ quản trị CSDL hệ thống gồm CSDL thao tác CSDL đó, thiết kế tảng phần cứng, phần mềm với kiên trúc định + Hệ quản trị CSDL quản lý liệu metadata + Thành phần quản lý tệp tin đa phương tiện, quản lý liệu đa phương tiện + Module tích hợp hệ quản trị CSDL thành phần quản lý tệp tin đa phương tiện - Ưu điểm: Tận dụng hệ thống quản lý tệp tin đa phương tiện khác để quản lý liệu b Kiến trúc cặp chặt - Kiến trúc cặp chặt + Hệ quản trị CSDL quản lý liệu đa phương tiện metadata + Hệ quản trị CSDL MM-DBMS - Ưu điểm: Các chức DBMS áp dụng CSDL đa phương tiện + Quản lý truy vấn + Quản lý giao dịch + Quản lý lưu trữ + Quản lý bảo mật toàn vẹn c Kiến trúc lược đồ - Lược đồ metadata mô tả liệu dpt CSDL - Mô hình mức lươc đồ - Lược đồ định nghĩa cách nhìn người dùng CSDL (video view, audio view…) - Lược đồ khái niệm xây dựng dựa mô hình liệu - Lược đồ trong: cấu trúc liệu bên - Mỗi lược đồ có cách biểu diễn khác - Mappings thực chuyển đổi từ biểu diễn sang biểu diễn khác d Kiến trúc chức e Kiến trúc hệ thống mở rộng f - Kiến trúc phân tán Cách mà đối tượng phân tán kết hợp + Truy vấn + Giao dịch + Metadata + Bảo mật + Toàn vẹn liệu g Kiến trúc liên động - Client/server (CORBA) - Ba tầng (three tier) - Hướng thành phần h Kiến trúc siêu phương tiện: hỗ trợ duyệt CSDL theo liên kết Câu 6: Dữ liệu meta cho CSDL đa phương tiện? Định nghĩa Metadata - Là dạng liệu mô tả liệu Trong sở liệu, metadata dạng biểu diễn khác đối tượng sở liệu Trong sở liệu quan hệ, metadata định nghĩa bảng, cột, sở liệu, view nhiều đối tượng khác Trong kho liệu, metadata dạng định nghĩa liệu như: bảng, cột, báo cáo, luật doanh nghiệp hay quy tắc biến đổi Metadata bao quát tất phương tiện kho liệu - Metadata phải chứa thông tin: cấu trúc liệu, thuật toán sử dụng để tổng hợp liệu, ánh xạ xác định tương ứng liệu từ môi trường tác nghiệp sang kho liệu Vai trò Metadata  -     - Thông tin metadata cung cấp cho phép người dùng cuối hiểu rõ chất liệu mà họ có định sử dụng cách đắn phù hợp liệu Cấu trúc nội dung liệu bao gồm số loại thông tin bản: Thông tin mô tả thân liệu metadata; thông tin liệu mà metadata mô tả; thông tin cá nhân, tổ chức liên quan đến liệu metadata liệu Các loại metadata Metadata cho loại phương tiện khác Đặc trưng mối quan hệ với nội dung liệu đa phương tiện Metadata trích chọn trực tiếp từ liệu đa phương tiện Metadata cho liệu văn Chứa đựng thông tin liệu văn Metadata độc lập nội dung: + Loại liệu văn + Số trang + Định dạng + Số chương, số paragraph chương Metadata phụ thuộc nội dung: Nội dung câu chuyện, từ khóa, tiêu đề, tóm tắt SGML (standard generalized markup language), XML sử dụng để gán thẻ cho loại liệu văn  trích chọn Các thẻ lưu DBs Dữ liệu text giải Metadata cho liệu ảnh Sử dụng liệu text để mô tả ảnh Metadata lưu DBs Metadata độc lập/phụ thuộc nội dung Ví dụ: Bức ảnh X mô tả đại dương với rừng cọ nhà bãi biển Metadata cho liệu âm Mô hình hóa cho liệu âm Gán thẻ metadata Trích chọn từ khóa thẻ Dữ liệu âm giải Metadata độc lập/phụ thuộc nội dung Metadata cho liệu video Mô hình hóa cho liệu video Gán thẻ metadata Trích chọn từ khóa thẻ Dữ liệu video giải Metadata độc lập/phụ thuộc nội dung Metadata cho liệu kết hợp Metadata dùng để đồng hiển thị loại phương tiện Các khía cạnh liên quan đến Metadata Ontology cho liệu đa phương tiện + Ontology đặc tả khái niệm hóa + Dùng để biểu diễn tri thức chung cho trình cộng tác Chú giải + Quản lý giải: trích chọn, truy vấn, cập nhật, tương quan giải liệu đa phương tiện Chất lượng dịch vụ nguồn gốc liệu + Độ xách liệu + Nguồn gốc liệu Quản lý Metadata Truy vấn Cập nhật Bảo mật Trích chọn Câu 7: Kĩ thuật đánh mục cho loại liệu khác nhau? - - Dữ liệu văn bản: dựa từ khóa Một văn mang lúc nhiều yếu tố, phải chọn từ khóa có ý nghĩa rộng phải ký tự Không nên chọn từ khóa dài hay ngắn Lựa chọn từ khóa cần phải trả lời câu hỏi: văn thuộc loại nào? Đối tượng hướng đến ai? Người dùng dùng loại công cụ để tìm kiếm? Dữ liệu ảnh: dựa từ khóa, ảnh Dữ liệu video: dựa từ khóa, ảnh trích trọn từ ảnh Audio: từ khóa Chú giải Câu 8: Các kỹ thuật lưu trữ sở liệu đa phương tiện? - - - - Dùng mảng đĩa rẻ tiền Kiến trúc lưu trữ phân cấp + Dùng băng từ đĩa quan để lưu trữ dài hạn, đĩa từ lưu đoạn bắt đầu phương tiện (trễ ban đầu thấp) + Di chuyển files từ băng từ đĩa từ có yêu cầu (trễ ban đầu dài  giải pháp dựa mẫu sử dụng, tần số sử dụng) Lưu trữ liệu thiết bị + Các tệp tin phân thành blocks + Các blocks lưu đĩa theo phương pháp khác • Lưu liên tục: Các block file định vị liên tiếp block đĩa  Ưu điểm:dễ cài đặt  Nhược điểm: Tốn thời gian chèn xóa, phân mảnh đĩa  Thích hợp cho ứng dụng ghi lần, đọc nhiều lần • Lưu có ràng buộc: Từng block file chứa trỏ trỏ tới block  Ưu điểm: dễ mở rộng file  Nhược điểm: đọc file chậm • Lưu rải rác  Danh sách liên kết, FAT, I-nodes Lưu trữ liệu mảng đĩa + Lưu toàn file đa phương tiện đĩa + Lưu file đĩa khác + Lưu toàn file đa phương tiện đĩa + Lưu toàn file đa phương tiện đĩa + Lưu file đĩa khác + Các kỹ thuật phân tán blocks đĩa: • Data Striping: Blocks tổ chức thành nhóm truy cập, đĩa truy cập đồng • Data interleaving: Các đĩa không truy cập đồng • Mong muốn có kích thước blocks với kích thước đơn vị liệu phương tiện logic Điều độ đĩa điều khiển tiếp nhận + Thiết bị lưu trữ cần truyền liệu với tốc độ phương tiện biểu thị phía client + Hoạt động đĩa không tất định nên cần có chế điều độ đĩa để trì liên tục liệu + Cần chế điều khiển tiếp nhận để tránh tải hệ thống • Dải tần tổng luồng yêu cầu phải nhỏ tốc độ truyền đĩa + Điều độ đĩa điều khiển tiếp nhận nhằm nâng cao hiệu suất sử dụng tài nguyên đầu đọc đĩa + Mục tiêu điều độ đĩa: làm giảm thời gian tìm kiếm, giảm trễ quay vòng, tăng dung lượng đĩa Câu 9: Mô hình hoạt động QoS mức đảm bảo QoS CSDL ĐPT? a Mô hình hoạt động QoS - Ứng dụng gửi yêu cầu QoS - Hệ thống ĐPT: + Chấp nhận yêu cầu đủ tài nguyên + Từ chối đề xuất QoS thấp không đủ tài nguyên Các phần từ cần thiết để đảm bảo QoS: + Cơ chế đặc tả QoS để ứng dung rõ yêu cầu QoS + Điều khiển chấp nhận dịch vụ + Quá trình thỏa hiệp QoS + Cung cấp điều độ tài nguyên + Giám sát lưu lượng từ ứng dụng b Các mức đảm bảo QoS - Đảm bảo tất định (cứng): Đắt, hiệu sử dụng tài nguyên, worse case Đảm bảo thống kê (mềm): QoS đáp ứng đến tỷ lệ phần trăm định, hiệu sử dụng tài nguyên, khó cài đặt Đảm bảo best-effort: đảm bảo QoS, hệ thống cung cấp tài nguyên có Câu 10: Các thuật toán điều độ đĩa?    Điều độ đĩa để giảm thời gian tìm kiếm, giảm trễ quay vòng, tăng thông lượng đĩa, cun Các thuật toán điều độ đĩa truyền thống: FCFS (First Come First Served): Không xem xét yếu tố vị trí đầu đọc hướng di chuyển SSTF (Shortest Seek Time First): Xem xét vị trí đầu đọc Scan: Xem xét chuyển động đầu đọc Nhược điểm phương pháp truyền thống không xem xét yếu tố thời gian luồng (stream)  Không phù hợp cho điều độ máy chủ đa phương tiện  Ngoài có thuật toán điều độ đĩa khác: - EDF (Earleast Dealine First): + Ưu điểm: Đảm bảo yếu tố thời gian cho luồng + Nhược điểm: Không xem xét yếu tố vị trí đầu đọc - Scan-Earleast Deadline First: Kết hợp thuật toán Scan với EDF: + Khi nhiều yêu cầu có deadline áp dụng scan + Khi tất yêu cầu có deadline thuật toán trở thành Scan ngược lại + Thuật toán hiệu có nhiều yêu cầu có deadline  Cần kỹ thuật để tăng số yêu cầu có deadline - Thuật toán Round-Robin: + Các luồng phục vụ lượt riêng biệt + Trình tự phục vụ cho luồng cố định lượt + Khoảng thời gian lần phục vụ liên tiếp luồng phụ thuộc vào khoảng thời gian lượt + Thuật toán thích hợp với chế lưu liệu lên đĩa kiểu liên tục ràng buộc - Điều độ quét nhóm: + Mỗi lượt phân thành nhóm thực round-robin cho nhóm + Trong nhóm thực Scan Câu 11: Các bước trình đánh mục tự động liệu text? - Mục đích đánh mục tìm thuật ngữ biểu diễn tài liệu cách tốt Quá trình đánh mục tự động bao gồm bước: Xác định từ tiêu đề, tóm tắt và/hoặc tài liệu Loại bỏ stop words Nhận dạng từ đồng nghĩa nhử từ điển Stemming để có gốc từ Đếm tần số gốc từ tài liệu Tính toán trọng số cho gốc từ Tạo file số dựa từ trọng số

Ngày đăng: 08/06/2016, 08:11

Từ khóa liên quan

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan