1 Học viện Công nghệ Bưu chính Viễn thông ðỗ Trung Tuấn Cơ sở dữ liệu ña phương tiện Hà Nội, 2010 2 Mục lục Mục lục 2 Giới thiệu 5 Chương I Tổng quan về cơ sở dữ liệu ña phương tiện 6 1 1 Mở ñầu 6 1 2[.]
Học viện Cơng nghệ Bưu Viễn thơng ðỗ Trung Tuấn Cơ sở liệu ña phương tiện Hà Nội, 2010 Mục lục Mục lục Giới thiệu Chương I Tổng quan sở liệu ña phương tiện 1.1 Mở ñầu 1.2 Khái niệm liệu ña phương tiện 1.1.1 Kiểu liệu ña phương tiện 1.1.2 Cơ sở liệu hệ quản trị sở liệu 1.1.3 Tìm kiếm thơng tin tư liệu văn 1.1.4 Tìm kiếm số hóa đa phương tiện 1.1.5 Trích ñặc trưng, thể nội dung số hóa 1.3 ðặc trưng ñối tượng ña phương tiện 1.3.1 Sự gia tăng liệu ña phương tiện tính chất chúng 1.3.2 Hệ quản trị sở liệu vai trị quản lí liệu đa phương tiện 1.3.3 Hệ thống tìm kiếm thơng tin liệu ña phương tiện 11 1.3.4 Tiếp cận tích hợp để tìm kiếm số hóa đa phương tiện 11 1.3.5 Tổng quan hệ thống tìm kiếm số hóa đa phương tiện 12 1.4 Cấu trúc lưu trữ sở liệu ña phương tiện 12 1.4.1 Giới thiệu 13 1.4.2 Cây k-D 13 1.4.3 Cây tứ phân 18 1.4.4 Cây tứ phân MX 21 1.4.5 Cây R 24 1.4.6 So sánh cấu trúc liệu ña phương tiện 26 1.5 Ngôn ngữ thao tác liệu ña phương tiện 27 1.5.1 Giao diện người dùng 27 1.5.2 Khả hệ thống tìm kiếm số hóa ứng dụng 27 1.6 Kết luận 28 Chương Tư liệu ña phương tiện tương tác 29 2.1 Cơ sở liệu ña phương tiện tương tác 29 2.1.1 Giới thiệu 29 2.1.2 Kiến trúc MIRS 29 2.1.3 Các mơ hình liệu 31 2.1.4 Thiết kế giao diện người dùng 35 2.2 Mơ hình hố tư liệu ña phương tiện tương tác IMD 37 2.2.1 Mơ hình hố tương tác với kiện 38 2.2.2 Tổ hợp không gian, thời gian nhân tố 40 2.2.3 Dữ liệu văn 42 2.2.4 ðồ họa vecto hình động 44 2.2.5 Âm 50 2.2.6 Hình ảnh số 57 2.2.7 Video số 64 2.3 Phân loại 69 2.3.1 Một số chuẩn 70 2.3.2 Các đặc tính u cầu liệu ứng dụng đa phương tiện 71 2.4 Mơ hình kịch 74 2.4.1 Kịch IMD 74 2.4.2 Kịch ña phương tiện 75 2.5 Tìm kiếm tư liệu ña phương tiện tương tác 77 2.5.1 Tìm tư liệu đa phương tiện tương tác dựa cấu trúc không gian, thời gian 78 2.6 Kết luận 81 Chương Thành tựu xu hướng 82 3.1 Các thành tựu cơng nghệ hệ quản trị sở liệu ña phương tiện 82 3.1.1 Mơ hình hố 82 3.1.2 Toàn vẹn 82 3.1.3 Tìm theo nội dung 82 3.2 Các sản phẩm thương mại mẫu nghiên cứu 86 3.2.1 Một số sản phẩm 86 3.2.2 Quản lý ña phương tiện 86 3.2.3 Các vai trị dự án đa phương tiện 89 3.3 Hướng phát triển sở liệu ña phương tiện 90 3.3.1 Một số hướng khuynh hướng 90 3.3.2 An tồn liệu đa phương tiện 91 3.3.3 Yêu cầu tổ chức liệu ña phương tiện 93 3.4 Kết luận 95 Chương Quản trị liệu ña phương tiện 96 4.1 Khái niệm quản trị sở liệu ña phương tiện 96 4.1.1 Dạng liệu ña phương tiện 96 4.1.2 Ngơn ngữ hỏi liệu đa phương tiện 97 4.1.3 Vấn ñề khác 98 4.2 Kiến trúc hệ quản trị sở liệu ña phương tiện 98 4.2.1 Các kiến trúc tổ chức nội dung 98 4.2.2 Nguyên tắc tự quản 98 4.2.3 Nguyên tắc ñồng ñều 98 4.2.4 Nguyên tắc tổ chức hỗn hợp 99 4.2.5 Một số nhận xét 99 4.2.6 Tổ chức sở liệu dựa nguyên tắc thống 100 4.3 Các kỹ thuật mơ hình hóa liệu 100 4.3.1 Mơ hình quan hệ 100 4.3.2 Cơ sở liệu hướng ñối tượng 101 4.3.3 Cơ sở liệu ña phương tiện 107 4.4 Các kĩ thuật số hoá trừu tượng hoá 108 4.4.1 Giới thiệu 108 4.4.2 Chỉ số hố sở liệu đa phương tiện 109 4.4.3 Các số hiển 109 4.4.4 Trừu tượng hoá video 110 4.4.5 ðồ thị chuyển cảnh 112 4.5 Tìm thơng tin ña phương tiện dựa nội dung 112 4.5.1 Giới thiệu tìm thơng tin ña phương tiện 112 4.5.2 Lọc thông tin 113 4.5.3 Hỏi liệu ña phương tiện 113 4.5.4 Tìm theo nội dung, sử dụng từ khố 114 4.6 Thí dụ sở liệu ña phương tiện 114 4.6.1 Một số hệ thống 114 4.6.2 Tìm đối tượng dựa hình dạng 117 4.6.3 Thể hình dạng 118 4.6.4 Việc khớp hình 118 4.6.5 Các liên kết video ña phương tiện 118 4.7 Các ứng dụng ña phương tiện 119 4.7.1 Các hình ảnh thơ 120 4.7.2 Thể ảnh ñã nén 122 4.7.3 Xử lí ảnh thơng qua việc phân ñoạn ảnh 124 4.7.4 Tìm kiếm dựa tương tự 126 4.7.5 Tổng quát sở liệu ảnh 129 4.7.6 Thể sở liệu ảnh nhờ mơ hình quan hệ 129 4.7.7 Thể sở liệu ảnh R 132 4.7.8 Kết luận sở liệu ảnh 134 4.8 Nhận xét liệu ña phương tiện 134 4.8.1 ðảm bảo QoS hệ thống truyền thông, máy chủ máy khách 134 4.8.2 Một số vấn ñề khác 135 4.9 Kết luận 137 Hướng dẫn sử dụng tài liệu theo chương trình khung 138 Tài liệu tham khảo 142 Giới thiệu Trong nhiều năm, nghiên cứu phát triển ña phương tiện cần thiết ứng dụng truyền thơng để thể thơng tin đa phương tiện Ngày nhiều liệu số đa phương dạng hình ảnh, video, âm thanh… địi hỏi kĩ thuật lưu trữ, tìm kiếm hiệu mạnh Người ta so sánh yêu cầu với yêu cầu thể liệu kí tự dạng tính tốn năm 70 kỉ XX Do phát triển quản trị liệu ña phương tiện bình thường tổ chức Trước hết nhu cầu thực tế, công nghệ khơng đủ khả giải vấn đề ñối với liệu ña phương tiện Một khó khăn việc số hóa tìm kiếm liệu ña phương tiện Người ta thấy cần biết cơng nghệ quản lí liệu đa phương tiện ðầu tiên đặc tính liệu đa phương tiện khía cạnh thiết kế cho phép hệ thống sở liệu ña phương tiện ñáp ứng yêu cầu liệu ðối với loại liệu ña phương tiện, văn bản, hình ảnh, âm video, cần có kĩ thuật số hóa riêng, ứng với đặc tính liệu thơ Cơng cụ tìm kiếm liệu ña phương tiện cần lộ ñược câu hỏi người dùng, dựa mức ñộ tương tự mẫu liệu lưu trữ Việc tìm kiếm số hóa theo nội dung liệu đa phương tiện quan trọng khó khăn, khía cạnh rút từ liệu thơ thường thể qua vecto nhiều chiều, địi hỏi nhiều thời gian xử lí Các kĩ thuật cấu trúc liệu có vai trị liên quan đến hiệu tìm kiếm liệu Cơ sở liệu ña phương tiện với truy cập từ xa, qua mạng máy tính, theo mơ hình khách/ chủ… phải xử lí tình liên quan đến truyền liệu, mã hóa liệu Vậy kiến trúc máy tính, việc lưu trữ đa phương tiện, hệ thống ñiều hành, hạ tầng mạng cần ñược quan tâm Trong hệ quản trị sở liệu truyền thống, hiệu liên quan đến tính hiệu quả, theo thời gian trả lời câu hỏi Trong hệ thống ña phương tiện, hiệu quan trọng, hiệu tìm kiếm, đối tượng có phát đối tượng tiềm ẩn, có ý nghĩa Người ta đề cập điều việc tìm kiếm theo so sánh tương tự, liệu không cho phép so sánh khớp Do ñộ ño hiệu cần thiết ñối với hệ quản trị sở liệu ña phương tiện Một số khía cạnh khác, an tồn liệu, chuẩn… ñáng ñược quan tâm Chương I Tổng quan sở liệu ña phương tiện 1.1 M ñu Các nghiên cứu phát triển ña phương tiện nhằm vào truyền thông thể liệu ña phương tiện, xác ñịnh quyền tác giả Hệ quản trị sở liệu ña phương tiện giữ vai trò hệ quản trị truyền thống, khác liệu phức tạp ña dạng ðể ñảm bảo tính hiệu truy cập tìm kiếm, hệ quản trị cần có kĩ thuật tìm kiếm số hóa khác Vậy việc số hóa tìm kiếm ña phương tiện mục ñích chính, trước xem xét chức hệ quản trị Phần ñầu thể hệ thống số hóa tìm kiếm MIRS1 vài ứng dụng chung Hình Một số logo đa phương tiện 1.2 Khái nim d liu ña phương tin Cần thiết xác ñịnh từ ñầu số khái niệm, ñịnh nghĩa sử dụng suốt q trình liên quan đến hệ thống đa phương tiện 1.1.1 Kiểu liệu ña phương tiện ðịnh nghĩa: Phương tiện2: phương tiện nhằm đến kiểu thơng tin hay kiểu thể thông tin, liệu số, chữ, hình ảnh, âm thanh, video Có nhiều cách xác định phương tiện Phân loại thơng thường dựa vào dạng vật lí mối quan hệ phương tiện với thời gian Ở xác định phương tiện khơng đề cập yếu tố thời gian Thời gian cho phép xác ñịnh phương tiện tĩnh với phương tiện ñộng, tức thời gian liên tục ðịnh nghĩa: Phương tiện tĩnh3: phương tiện khơng có chiều thời gian, nội dung ý nghĩa chúng không phụ thuộc vào thời gian thể Các phương tiện tĩnh gồm liệu số, chữ, ñộ họa, hình tĩnh Hình tĩnh ñược xem sản phẩm ñược vẽ, quét hay chụp máy chụp ảnh multimedia indexing and retrieval systems media static media ðịnh nghĩa: Phương tiện động1: phương tiện có chiều thời gian, với ý nghĩa tính xác tùy theo tốc ñộ thể Phương tiện ñộng gồm hình động, âm video Các phương tiện có khoảng đơn vị bên hay tốc độ Chẳng hạn video có 25 khung giây Việc thể lại cần theo cách tổ chức trước Do phương lại liên tục theo tốc ñộ cố ñịnh, chúng ñược gọi phương tiện liên tục Người ta gọi chúng phương tiện ñẳng thời, tức chiếm thời gian nhau, quan hệ cố ñịnh ñơn vị phương tiện thời gian ða phương tiện nhằm vào tập kiểu phương tiện sử dụng Nó ngầm xác định có kiểu liệu khác số, chữ Do thuật ngữ “đa phương tiện” nhằm tính chất tính từ ðịnh nghĩa: Dữ liệu đa phương tiện2: liệu hướng ñến thể máy ñọc ñược kiểu phương tiện gộp Thơng tin đa phương tiện hướng tới thơng tin truyền tải nhờ kiểu phương tiện gộp ðôi người ta dùng lẫn liệu đa phương tiện với thơng tin đa phương tiện Người ta sử dụng thuật ngữ ña phương tiện phương tiện ñể thực thể tự trị MIRS, cho phép hỏi, tìm kiếm thể Thuật ngữ “đối tượng” khơng hồn tồn xác tiếp cận hướng ñối tượng 1.1.2 Cơ sở liệu hệ quản trị sở liệu Trong tài liệu sở liệu, hệ thống sở liệu ñã phân biệt hệ quản trị sở liệu DBMS với sở liệu DB3 Giữa vấn đề đa phương tiện này, đơi lẫn lộn hai thuật ngữ ðịnh nghĩa: Hệ quản trị sở liệu4: phần mềm cho phép mô tả, lưu trữ xử lí liệu cách khoa học 1.1.3 Tìm kiếm thơng tin tư liệu văn Hệ thống tìm kiếm thơng tin tự động IR5 phát triển để xử lí khối lượng lớn tài liệu khoa học từ 1940 Chức hệ thống lưu quản lí số lớn tư liệu văn theo cách tìm kiếm nhanh tư liệu cho câu hỏi người dùng ðịnh nghĩa: Hệ thống tìm thơng tin tự động (IR): hệ thống lưu quản lí số lớn tư liệu văn theo cách tìm kiếm nhanh tư liệu câu hỏi người dùng 1.1.4 Tìm kiếm số hóa đa phương tiện Việc tìm kiếm DBMS dựa cấu trúc liệu cho phép so sánh khớp IR ñược xem hệ thống tìm kiếm theo văn Việc tìm kiếm theo nội dung dựa ñặc trưng phương tiện thực màu sắc, hình dáng, thay ghi chú, diễn giải văn phương tiện dynamic media multimedia data DBMS Database Management Systems, DB Database DBMS information retrieval ðịnh nghĩa: Tìm kiếm theo theo nội dung1: tìm kiếm dựa đặc trưng thực màu sắc, hình dáng… phương tiện Tìm kiếm theo nội dung thường dựa vào tính tương tự, thay so sánh khớp câu hỏi tập mục tin sở liệu Ở hệ thống ña phương tiện, MIRS hướng ñến tìm kiếm theo (i) DBMS; (ii) IR; (iii) theo nội dung 1.1.5 Trích ñặc trưng, thể nội dung số hóa ðịnh nghĩa: ðặc trưng ñiểm bật, giúp phân biệt cá thể ñã cho với cá thể khác mà ta đem so sánh Trong MIRS, trích đặc trưng hay thể nội dung, tức đặc trưng nội dung mục tin, việc quan trọng Q trình trích đặc trưng thực tự ñộng hay bán tự ñộng Trong vài tư liệu tìm theo nội dung, thuật ngữ “trích đặc trưng” dùng cho việc số hóa Do vậy, sử dụng “chỉ số”, người ta nhằm ñến cấu trúc liệu hay tổ chức ñặc trưng ñược rút để tìm hiệu 1.3 ðc trưng ca ñ i tư!ng ña phương tin ðề cập nhu cầu hệ thống số hóa tìm kiếm ña phương tiện, người ta thấy ba việc sau ñây cho thấy MIRS có ý nghĩa: Ngày nhiều liệu ña phương tiện ñược thu thập lưu trữ; Dữ liệu ña phương tiện khác với liệu truyền thống tính chất riêng, có u cầu ý nghĩa khác; Cho dù kĩ thuật IR dùng để tìm kiếm đa phương tiện, khơng đảm bảo tính hiệu ñối với xử lí liệu ña phương tiện ðịnh nghĩa: ðối tượng vật, khái niệm hay thực thể 1.3.1 Sự gia tăng liệu ña phương tiện tính chất chúng Khơng thể khơng đối mặt với thơng tin đa phương tiện Người ta khơng thể tránh hết liệu âm tranh, ảnh Xu hướng sử dụng liệu ña phương tiện làm tăng cơng nghệ lưu trữ số Dễ dàng đáp ứng nhu cầu ña phương tiện nhỏ, ñối với u cầu tồn diện, địi hỏi hệ thống tổ chức liệu, tìm kiếm nhanh Hình Sử dụng khái niệm ña phương tiện: máy bay vượt ngưỡng âm Người ta không chịu sức ép khối lượng liệu, mà cịn kiểu liệu đa Content-based retrieval dạng tính chất khác với liệu số, chữ truyền thống Các tính chất liệu đa phương tiện liệt kê: • Dữ liệu ña phương tiện, ñặc biệt liệu âm thanh, video liệu ñược nén với tỉ lệ cao, khoảng Gb chức ñược khoảng 10 phút video; • Dữ liệu âm video có chiều thời gian, địi hỏi thể theo tốc độ cố định để đạt hiệu dự định; • Các liệu âm thanh, hình ảnh video số thể theo loạt mẫu riêng, khó tự động ghi nhận nội dung khơng dễ xác định cấu trúc ngữ nghĩa chúng; • Nhiều ứng dụng ña phương tiện cần thể ñồng thời nhiều dạng phương tiện theo cách tương ứng với khơng gian thời gian; • Ý nghĩa liệu đa phương tiện thường mờ chủ quan, khơng tiện xác định rõ; • Dữ liệu đa phương tiện mang nhiều thơng tin, địi hỏi nhiều tham số thể nội dung Hình Hình động tạo khung 1.3.2 Hệ quản trị sở liệu vai trị quản lí liệu đa phương tiện ðịnh nghĩa: Hệ quản trị sở liệ, DBMS, phần mềm cho phép mơ tả, lưu trữ xử lí liệu cách khoa học Các DBMS truyền thống phù hợp với liệu có cấu trúc Mơ hình liệu quan hệ mơ hình thơng dụng từ 1980 đến Dữ liệu theo mơ hình quan hệ ñược tổ chức bảng quan hệ, có thuộc tính n_bộ Có ba lớp ngơn ngữ hỏi liệu, ngơn ngữ đại số quan hệ mà ñại diện SQL ñược sử dụng nhiều Thí dụ create table STUDENT ( stu# integer, name char (20), address char (100) ); câu bổ sung liệu insert into STUDENT values (10, "Lew, Tom", "2 Main St., Churchill, Australia"); Bảng Dữ liệu thí dụ Tìm kiếm liệu select name from STUDENT where stu# = 32 Thuộc tính DBMS liệu theo kiểu cố định, chẳng hạn số nguyên, chiếm 32 bit ðể trợ giúp biến ñộ dài thay ñổi, người ta ñưa khái niệm ñối tượng nhị phân lớn BLOB1 ðịnh nghĩa: BLOB2: BLOB xâu bit lớn có độ dài thay ñổi Thí dụ cần lưu ảnh sinh viên create table STUDENT ( stu# integer, name char (20), address char (100) picture BLOB); BLOB xâu bit, nên DBMS quan hệ nội dung hay ngữ nghĩa nó, mà xem khối liệu DBMS hướng ñối tượng kết hợp nhiều khía cạnh quản trị liệu, lưu trữ tìm kiếm, với tiếp cận hướng đối tượng, với khía cạnh đóng gói, thừa kế, xác ñịnh ñối tượng Người ta tự hỏi liệu tốt khơng kết hợp mơ hình quan hệ với mơ hình hướng đối tượng, chưa có mơ hình liệu đa phương tiện Các đối tượng ña phương tiện ñược nhận thức theo tiếp cận hướng ñối tượng phù hợp dễ thể lại Hệ thống quan hệ ñối tượng cho phép (i) xác ñịnh ñối tượng theo nghĩa hướng ñối tượng; (ii) sử dụng chức xử lí liệu quan hệ có Thí dụ: xác định kiểu liệu hình ảnh: create type IMAGE ( private size integer, resolution integer, content float[], public ); Và sử dụng create table STUDENT ( stu# integer, name char (20), binary large object binary large object 10 address char (100) picture IMAGE); Khác BLOB ñối tượng ñối tượng ñược xác ñịnh phù hợp, với thuộc tính chịu phép xử lí thuộc tính, mà BLOB khơng thể Khái niệm BLOB ñối tượng ñánh dấu bước quản lí liệu đa phương tiện, BLOB dùng ñể lưu trữ liệu, lúc ñối tượng cần nhiều thuộc tính để thể nội dung liệu Các tính cần phát triển cho liệu đa phương tiện là: • Cơng cụ trích rút nội dung ñặc trưng ña phương tiện, tự ñộng hay bán tự ñộng, liệu ña phương tiện; • Cấu trúc số để quản lí vecto đặc trưng đa phương tiện; • ðộ đo tính tương tự, tìm kiếm thay cho so sánh khớp; • Hệ thống lưu trữ phân tán ñối với liệu lớn hạ tầng truyền thơng u cầu thời gian thực; • Giao diện người dùng, thiết kế cho kiểu liệu ña phương tiện khác cho phép thể ña dạng 1.3.3 Hệ thống tìm kiếm thơng tin liệu đa phương tiện ðịnh nghĩa: Cơng cụ tìm kiếm phần mềm nhằm cho phép người dùng tìm kiếm đọc thơng tin có phần mềm đó, trang Web, hay toàn Internet Hệ thống IR dùng cho liệu văn Các kĩ thuật sử dụng IR quan trọng nhờ (i) nhiều tư liệu văn tổ chức; (ii) văn minh họa cho phương tiện khác, âm thanh, hình ảnh, video Người ta sử dụng kĩ thuật IR ñối với liệu ña phương tiện Tuy nhiên chúng có vài hạn chế: • Minh họa, ghi cho phương tiện khác thường thực thủ công, tốn thời gian; • Minh họa văn khơng thể ñủ chủ quan; • Các kĩ thuật IR cho phép hỏi theo văn bản; • Một vài đặc trưng đa phương tiện bề mặt ảnh, hình dáng ñối tượng phức tạp, không dùng văn mà mơ tả hết 1.3.4 Tiếp cận tích hợp để tìm kiếm số hóa đa phương tiện Dù hệ thống tìm kiếm thơng tin IR có ích khung cảnh xử lí liệu đa phương tiện, liệu có cấu trúc, người ta cần kĩ thuật để quản lí tính chất riêng liệu đa phương tiện Ngồi kĩ thuật xử lí liệu DBMS truyền thống ñối với liệu có cấu trúc, việc tích hợp thêm kĩ thuật cho liệu hình ảnh, âm thanh, video cho phép hệ thống tìm kiếm số hóa đa phương tiện MIRS ðịnh nghĩa: Chỉ số hệ thống dùng để tìm kiếm thơng tin nhanh dễ 11 1.3.5 Tổng quan hệ thống tìm kiếm số hóa đa phương tiện Trong hệ thống MIRS, mục tin sở liệu ñược tiền xử lí để rút đặc trưng nội dung ngữ nghĩa Các mục tin số hóa nhằm tăng tốc tìm kiếm Các câu hỏi người dùng trích đặc trưng, so sánh tương tự với đặc trưng ủó ủc ch s Câu hỏi Xử lí trích đặc trng Đặc trng câu hỏi mục tin Xử lí số hóa mục tin đợc số hóa So sánh tơng tự Tìm mục tin t−¬ng tù Hình Mơ hình tìm kiếm thơng tin tổng qt Cịn số vấn đề: (i) mục tin có chứa kiểu phương tiện ?; (ii) cách rút ñặc trưng từ mục tin phương tiện; (iii) ñộ ño tương tự, với khung nhìn đa dạng người dùng; (iv) ñánh giá hiệu tìm kiếm ðịnh nghĩa: Thị giác khả nhận diễn giải thông tin từ ánh sáng vào mắt Việc tri giác cịn ñược gọi thị lực, nhìn Hình Giác quan người 1.4 C$u trúc lưu tr s d liu ña phương tin Khi ñề cập cấu trúc liệu ña phương tiện, ñiểm cần lưu ý trước tiên liệu đa phương tiện ln mang khía cạnh (i) khơng gian (ii) thời gian Khơng gian liệu đa phương tiện thường nhiều chiều ðịnh nghĩa: Cấu trúc liệu cách lưu trữ tổ chức liệu cụ thể máy tính để liệu sử dụng hiệu Người ta quan tâm việc nhận thức liệu đa phương tiện, cách hình thức hố chúng Các khái niệm ña phương tiện cần ñược áp phương pháp hình thức để phát triển ứng dụng Hầu hết liệu n chiều ñều dùng cách thể phân rã theo thơng tin 12 ðể hình thức hố, trừu tương hố liệu đa phương tiện, người ta cần ñến kĩ thuật k-chiều, tứ phân theo ñiểm, tứ phân, R ðồng thời cịn phải quan tâm đến phương pháp cài đặt kĩ thuật ðịnh nghĩa: Khơng gian, thời gian: Không gian mở rộng ba chiều, không giới hạn, đối tượng kiện xảy có vị trí hướng tương ñối Thời gian phần hệ thống ño, dùng cho kiện tuần tự, ñể so sánh thời lượng kiện khoảng thời gian chúng, để lượng hóa tỉ lệ thay đổi chuyển ñộng ñối tượng 1.4.1 Giới thiệu Dạng tổ chức liệu địa lí thơng dụng GIS, thể dạng ñồ, tức ñiểm Mỗi ñiểm không gian ñược thể qua cấu trúc liệu Dữ liệu địa lí đa dạng, thấy điểm, đường thẳng, đường cong, hình, ñồ, liệu gắn với ñồ theo tầng địa lí khác Các thơng tin thay ñổi theo thời gian 1.4.2 Cây k-D Sử dụng k-d ñể lưu trữ ñiểm ñồ ðịnh nghĩa: Cây cấu trúc liệu thông dụng, thể cấu trúc liệu phân cấp với tập nút liên kết Về toán học, đồ thị khơng xoay vịng nút; nút có nút con, thuộc nút cha 1.4.2.1 Cấu trúc nút Nút k-d có cấu trúc Kiểu liệu nút = record INFO: kiểu thông tin; XVAL: real; YVA L: real; LLINK: ↑ kiểu nút; RLINK: ↑ kiểu nút; End; Các mối nối RLINK LLINK cho phép trỏ tới nút phải trái nút Giả sử T trỏ ñến gốc k-d Nếu N nút người ta xác ñịnh thêm mức1 nút N: Mức (N) = N gốc cây; mức (P) + N nút nút cha P ðịnh nghĩa: Cây 2-d nhị phân thoả mãn (i) Khi N nút mức chẵn nút trái M có M.XVAL < N.XVAL nút L bên phải có L.XVAL ≥ N.XVAL; (ii) Khi N nút mức lẻ nút trái M có M.YVAL < N.YVAL nút L bên phải có L.YVAL ≥ N.YVAL level 13 XVAL = 10, YVAL = 20 N N mức chẵn L M XVAL = < N.XVAL M mức lẻ M.YVAL = 12 XVAL = 12 >= N.XVAL L2 M2 YVAL = < M.YVAL YVAL = 14 >= M.YVAL Hình Qui định giá trị X, Y nút 1.4.2.2 Bổ sung tìm kiếm 2-d u cầu thêm nút N vào có Cây có trỏ T, ngầm hiểu trỏ trỏ ñến nút T Người ta thấy có khả năng: Nếu N ≡ T hiển nhiên có nút N cây; Ngược lại, người ta sang trái N.XVAL < T.XVAL, nút T nút chẵn (0); sang phải N.XVAL không nhỏ hơn; Tại nút vừa ñến P, P ≡ N xong, ngược lại P nút lẻ, nên vào giá trị YVAL ñể ñịnh sang trái hay phải Nếu N.YVAl < p.YVAL người ta sang trái; ngược lại sang phải Tiếp tục từ bước 2, cho ñến dừng hay ñến nút bổ sung nút N Việc tìm kiếm nút N với giá trị XVAL YVAL ñược thực dị tìm để bổ sung nút Thí dụ: Người ta có đồ với điểm Hà nội (19, 45), Hải phòng (40, 50), Hà tây (38, 38), Hà đơng (54, 40), Hồ bình (4, 4) Nếu xuất phát từ Hà nội, người ta xây dựng ñược thơng tin Dựa 2-d có, người ta tiến hành (i) tìm kiếm; (ii) bổ sung nút theo cách Hµ néi (19, 45) Hoµ bình Hải phòng (4, 4) (40, 50) Hà tây (38, 38) Hà đông (54, 40) Hỡnh Cỏc nỳt trờn cõy 2-d 1.4.2.3 Xố nút 2-d Vấn đề đặt là: giả sử cần xố nút có trỏ T; nút cần xố có toạ độ (x, y) 14 Bước cần tìm nút (x, y), thoả mãn N.XVAL = x N.YVAl = y Bước khẳng định có nút N cần xố, thực theo cách ñã nêu mục trước; Nếu nút N nút lá, người ta huỷ nút N cách thay ñổi trỏ nút cha trỏ ñến nút N Các trỏ nút cha NIL; Nếu N nút trung gian, công việc phức tạp P R N N R P Hình Chọn nút R thay N i Khi N.LLINK ≠ NIL, tức N có trái Tl, N.RLINK ≠ NIL, tức có phải Tr: cần tìm nút R Tl hay Tr để thay N, R bị xoá khỏi cây {Tl, Tr} Do người ta thực ba bước nhỏ sau: • • ii Bước Tìm nút R để thay {Tl, Tr}; Bước Thay trường nối LLINK, RLINK khơng rỗng N vào trường nói R; • Bước Xố R khỏi {Tl, Tr}; • Q trình kết thúc có Ti ∈ {Tl, Tr} với mức cao hơn; Vấn ñề ñặt bước thứ tìm R thay {Tl, Tr} cần có quan hệ khơng gian tất nút P {Tl, Tr}, mà N sinh ra, nút P • • • Nếu P thuộc góc tây nam N P tây nam R; Nếu P tây bắc N P tây bắc R; ðiều có nghĩa R thay có tính chất a Mỗi M Tl:M.XVAL < R.XVAL N mức chẵn; M.YVAL < R.YVAL N mức lẻ; N ®ang ë møc chẵn N R Cây trái Tl M Hỡnh V trí nút thay R N mức chẵn b iii Mỗi M Tr thoả mãn: M.XVAL ≥ R.XVAL N mức chẵn; ngược lại N mức lẻ Khi Tr ≠ NIL, xét trường hợp mức chẵn lẻ N: 15 • iv v vi Nếu N mức chẵn nút Tr có giá trị XVAL nhỏ nút R thay Chẳng hạn nút Hà nội bị loại nút Hà tây thay thế; • Nếu N mức lẻ, nút thay Tr có YVAL bé Nhìn chung người ta thực “tìm nút thay trái với vài điều kiện” • Nếu N mức chẵn, nút phù hợp Tl nút có XVAL lớn nhất; • Nếu N mức lẻ, người ta chọn nút có YVAL đạt cực đại; Vấn đề ñặt Tl có nhiều nút ñạt giá trị cực đại, XVAL hay YVAL, điều (2) ñịnh nghĩa 2-d bị vi phạm áp dụng ba bước thực Do cần xố nút N trung gian, nên tìm nút thay R phải, việc tác ñộng vào trái hay gây bền vững cấu trúc cây; Khi phải Tr = NIL, người ta chọn R thay Tl với giá trị x nhỏ Tl N nút mức chẵn, hay chọn R thay có y nhỏ N mức lẻ; ba bước thực nhỏ trên, thay Bước Thay tất trường không rỗng N trường R ðặt N.RLINK = N.LLINK, N.LLINK = NIL; N N NIL NIL Hình Cấu trúc nút 1.4.2.4 Câu hỏi phạm vi cấu trúc 2-d Vấn đề tìm nút (x, y) phạm vi bán kính r từ (x0, y0) Sẽ có vịng trịn bán kính r với tâm ñiểm (x0, y0) (x, y) (19, 45) Hình Miền cần tìm có nút (19, 45) Liên quan ñến câu hỏi này, người ta thấy nút N có miền RN với bán kinh r Vịng trịn tạo từ (x0, y0) khơng giao với vịng trịn RN khơng xét N Khái niệm miền liên quan đến nút, có loại: Xét nút Hà nội (19, 45), người ta tạo ñược miền Hà nội = {(x, y)}; Nút Hải phòng cho biết miền Hải phòng = {(x, y) | x ≥ 19}; 16 Nút Hà tây cho biết miền Hải tây = {(x, y) | x ≥ 19, y < 50}; Nút Hà đơng cho biết miền Hà đơng = {(x, y) | x ≥ 38, y < 50}; Nút Hồ bình cho biết miền Hồ bình = {(x, y) | x < 19} Trơc Y (19, 45) Trơc X Hình Xác định biên Nhìn chung nút N có nhiều ràng buộc liên quan, gắn với việc xác ñịnh vùng: Xác ñịnh biên X, XLB1, có dạng x ≥ c1; Xác định biên X, XUB2, có dạng x< c2; Xác ñịnh biên Y, YLB3, có dạng y ≥ c3; Xác định biên Y, YUB4, có dạng y< c4 Do cần mở rộng kiểu liệu nút, với tên kiểu nút liệu mới: Kiểu nút = record INFO: kiểu thông tin; XVAL, YVAL: real; XLB, XUB, YLB, YUB: real ∪ {-∞, +∞}; LLINK, RLLINK: ↑ kiểu nút mới; End; Việc bổ sung nút cần thực hiện: Gốc nhận XLB: = -∞, YLB: = -∞ XUB: = +∞, YUB: = +∞; Nếu nút N có cha P P mức chẵn, giá trị phạm vi N xác định theo P: • N.XLB = P.XLB N trái P; ngược lại N phải, N.XLB = P.XVAL; • N.XUB = P.XVAL N trái P; ngược lại N phải, N.XLB = P.XUB; • N.YLB = P YLB; • N.YUB = P YUB; Nếu N có cha P mức P lẻ, thì: • N.YLB = P.YLB N trái P; ngược lại N phải, N.YLB = XLB lower bound on x XUB upper bound on x YLB lower bound on y YUB upper bound on y 17 P.YVAL; N.YUB = P.YVAL N trái P; ngược lại N phải, N.YLB = P.YUB; N.XLB = P XLB; N.XUB = P XUB; • • • ðối với việc tìm kiếm vùng cây, người ta có nhận xét: • • Khi gốc T khơng giao, xét trái, phải; Với khơng giao, loại bỏ trình tìm kiếm 1.4.2.5 Cây k-d tổng quát Cây k-d tổng qt có k ≥ Cây 2-d dùng để thể nút khơng gian chiều Cây k-d với k ≥ ñược dùng cho khơng gian k chiều, chẳng hạn điểm (x, y, z) sử dụng 3-d ðối với tổng quát, khơng thể sử dụng XVAL, YVAL để trỏ đến hai con, mà dùng vecto VAL k chiều, ứng với trỏ trỏ ñến ðịnh nghĩa: Cây T có cấu trúc nút k-d nút N T, thì: • Nút N có mức i Mức tính i = “mức thực sự” mod k; • nút M trái N, M.VAL [i] < N VAL [i]; • nút P phải N, P VAL[i] ≥ N.VAL [i] Các thuật tốn sử dụng cho 2-d ñược phát triển dùng cho k-d Khi k = 1, người ta làm việc với nhị phân quen thuộc 1.4.3 Cây tứ phân Cây tứ phân1, hay bốn phần, ñược dùng ñể thể điểm khơng gian chiều Cây 2-d có tác dụng Tuy nhiên ñiểm khác biệt tứ phân chia miền thành phần, 2-d cho phép tách miền hai phần Trôc Y Trôc Y (N.XVAL, N.YVAL) (N.XVAL, N.YVAL) Trôc X Khi N mức lẻ Trục X Khi N mức chẵn Hình Vai trị trục ngang dọc chia miền Bốn phần ứng với bốn tứ phân ñược gọi tên theo hướng ñối với nút N: đơng bắc NE, tây bắc NW, tây nam SW, đơng nam SE2 Kiểu liệu mơ tả là: Kiểu nút tứ phân = record INFO: kiểu thông tin; XVAL: real; point quadtree north east, north west, south west, south east 18 YVAL: real; NW, SW, NE, SE: ↑ kiểu nút tứ phân; End; PhÇn tây bắc NW Phần đông bắc NE (N.XVAL, N.YVAL) Phần đông nam SE Phần tây nam SW Hỡnh Bn phn so với nút 1.4.3.1 Tìm kiếm thơng tin bổ sung nút tứ phân Khi có giá trị điểm khơng gian, thí dụ trước với ñồ ñiểm Hà nội (19, 45), Hải phịng (40, 50), Hà tây (38, 38), Hà đơng (54, 40), Hồ bình (4, 4), người ta xây dựng ñược cách phát triển dần nút Chẳng hạn từ nút Hà nội, người ta dùng trỏ đến nút khác, theo vị trí tương đối so với nút Hà nội Nót thø ba Nút thứ hai N Cấu trúc nút tø ph©n Nót thø nhÊt Hình Ngun tắc mơ tả nút tứ phân Việc xây dựng ñược tiến hành theo: Cây rỗng, người ta xác ñịnh nút ñầu Hà nội, toạ ñộ (19, 45); Chia phần khơng gian; (40, 50) Hµ néi N W S W N E S E (19, 45) H¶i phßng N W S W N E S E Hình Thêm nút Hà nội xác định vị trí tương đối Hải phịng so với Hà nội Bổ sung nút Hà tây Do phần chưa có nút nào, trỏ từ nút Hà nội trỏ trực tiếp đến nút Hà tây; Với nút Hà đơng: có nút Hà tây SE nút Hà nội, người ta nhận thấy nút Hà tây cho phép tách không gian phần, nút Hà đơng NE nút Hà tây; 19 Việc bổ sung nút Hồ bình đơn giản Hµ néi N W S W N E S E Hải phòng N W S W N E Hà tây S E N W Hoà bình N W S W N E S W N E S E Hà đông S E N W S W N E S E Hình Các nút tứ phân Nhìn chung, trường hợp xấu nhất, n nút tạo nên ñộ cao n-1 mức Lưu ý thời gian tìm kiếm nút, bổ sung nút ñược biểu diễn tuyến tính theo số nút n 1.4.3.2 Xoá nút tứ phân Khi nút N cần xố nút cơng việc đơn giản Nhưng N nút trung gian, việc tìm nút thay phức tạp, do: • Mỗi nút gắn với miền, vùng đồ, có cách xác định khác 2-d Trong 2-d, người ta ñã dùng ràng buộc x ≥ c1, x < c2, y ≥ c3, y < c4; • Trong tứ phân, mô tả kiểu liệu Kiểu nút tứ phân = record INFO: kiểu thông tin; XVAL, YVAl: real; XLB, YLB, XUB, YUB: real ∪ {-∞, +∞} NW, SW, NE, SE: ↑ kiểu nút tứ phân; End; Việc xoá nút cần lưu ý ñến việc bổ sung nút Việc bổ sung nút N vào có trỏ T ñược thực hiện: Nếu N gốc T, N.XLB = -∞, N.YLB = -∞, N.XUB = +∞, N.YUB = +∞; Nếu P nút cha n, việc gán giá trị theo tham chiếu ñến bảng sau, tuỳ theo vị trí tương ñối N ñối với P Trong bảng người ta sử dụng kí hiệu độ rộng hình bao w = P.XUB – P.XLB, chiều cao hình bao h = YUB – YLB Trường hợp N.XLB N.XUB N.YLB N.YUB N tây bắc P.XLB P.XLB + w / P.YLB + h / P.YUB N tây nam P.XLB P.XLB + w / P.YLB P.YLB + h / N đơng bắc P.XLB + w / P.XUB P.YLB + h / P.YUB N đơng nam P.XLB + w / P.XUB P.YLB P.YLB + h / Hình Bảng tra cứu giá trị cận trên/ cho nút Trong trình tìm nút R thay N số con, để xố N, người ta nhận 20 ... hướng ñối tượng 1.1.2 Cơ sở liệu hệ quản trị sở liệu Trong tài liệu sở liệu, hệ thống sở liệu ñã phân biệt hệ quản trị sở liệu DBMS với sở liệu DB3 Giữa vấn đề đa phương tiện này, đơi lẫn lộn... nghệ quản lí liệu đa phương tiện ðầu tiên đặc tính liệu đa phương tiện khía cạnh thiết kế cho phép hệ thống sở liệu ña phương tiện ñáp ứng yêu cầu liệu ðối với loại liệu ña phương tiện, văn bản,... kiểu liệu khác số, chữ Do thuật ngữ ? ?đa phương tiện? ?? nhằm tính chất tính từ ðịnh nghĩa: Dữ liệu đa phương tiện2 : liệu hướng ñến thể máy ñọc ñược kiểu phương tiện gộp Thơng tin đa phương tiện