Xoá cây trong R-Trees

Một phần của tài liệu Cấu trúc dữ liệu đa phương tiện và mô hình cơ sở dữ liệu hình ảnh (Trang 47)

Việc xoá các đối tƣợng từ cây R-Trees có thể gây ra một nút trong cây R- Trees trở nên thiếu hụt (underflow). Nhắc lại rằng một R-Tree bậc k phải bao gồm ít nhất K/2 hình chữ nhật trong nó. Khi thực hiện xoá một hình chữ nhật từ một R- Tree, phải đảm bảo rằng nút đó không bị thiếu hụt. Ví dụ, xem xét R-Trees nhƣ hình 2.15 trình bày trên. Giả thiết rằng, thực hiện xoá chữ nhật R9. Nút chứa R9 chỉ còn lại một nút trong nó nếu thực hiện xoá R9, kết quả là nút này sẽ phản ánh một điều kiện thiếu hụt. Trong trƣờng hợp này, phải tạo ra đƣợc nhóm logic mới. Một khả năng là sắp xếp lại các nhóm nhƣ sau:

Group Rectangle

G1 R1, R2, R3

G2 R4, R6, R7

G3 R5, R8

Bảng 2.5

Cây R mới là kết quả của việc xoá nút R9, nó đƣợc thể hiện trên hình 2.19. Bảng 2.5 là kết quả.

2.6 Kết luận

Trong chƣơng này, 4 loại cấu trúc dữ liệu đã đƣợc khảo sát: cây k-d, cây tứ phân điểm, cây tứ phân MX và cây R. Mỗi chúng đều có ƣu điểm và nhƣợc điểm nhất định.

Cây tứ phân điểm rất dễ cài đặt. Tuy nhiên, cây tứ phân điểm có k nút thì có thể có độ cao là k, nhƣ vậy làm tăng độ phức tạp cho chèn và tìm kiếm (nó có thể là O(k)). Hơn nữa mỗi so sánh đòi hỏi so sánh hai toạ độ. Việc xoá nút trong cây loại này là khá khó khăn: vì việc tìm kiếm nút ứng viên thay thế cho nút đang xoá thông thƣờng là không đơn giản. Cuối cùng truy vấn khoảng trong cây này cần O(2 n), n là tổng số bản ghi trong cây.

Cây k-d rất dễ cài đặt. Tuy nhiên, cây k-d chứa k nút có thể có độ cao k, do vậy chèn và tìm kiếm có thể phức tạp. Trong thực tế đƣờng dẫn từ gốc tới lá của cây loại này dài hơn trong cây tứ phân điểm bởi vì cây này là cây nhị phân. Độ phức tạp tồi nhất của tìm kiếm dài trong cây k-d là: O(kxn1-

k

1

). Khi k=2, thì độ phức tạp còn

O(2 n) nhƣ cây tứ phân điểm.

Cây tứ phân MX đảm bảo có độ cao nhất là O(n), trong đó vùng đƣợc biểu diễn có (2n

x2n) tế bào. Nói cách khác việc chèn, xoá và tìm kiếm trong cây loại này

cần thời gian là O(n). Tìm kiếm dải của cây này rất hiệu quả với thời gian O(N + 2h), trong đó N là tổng số điểm kết quả truy vấn và h là độ cao của cây.

Tƣơng tự với cây R. Tuy nhiên, cây R có thể có nhiều chữ nhật lƣu trong cùng nút, nó phù hợp với xâm nhập đĩa từ bằng cách giảm độ cao của cây.

Một bất lợi của cây R là các chữ nhật bao kết hợp với các nút khác nhau có thể phủ lên nhau. Nhƣ vậy, việc tìm kiếm trong cây R thay vì đi theo một vết nhƣ các cây khác, là phải đi theo nhiều vết trong cây. Trong trƣờng hợp này lại làm tăng số lần thâm nhập đĩa.

Tổng thể, cây R hiệu quả hơn cây k-d và cây tứ phân điểm trong các ứng dụng đa phƣơng tiện bởi vì ứng dụng loại này đòi hỏi dung lƣợng đĩa rất lớn phải xâm nhập. Tuy nhiên nếu chỉ số nhỏ thì sử dụng cây tứ phân MX sẽ hiệu quả hơn.

Chƣơng 3

CƠ SỞ DỮ LIỆU ẢNH

Chƣơng này sẽ trình bày CSDL ảnh ,các định nghĩa trừu tƣợng về nội dung ảnh đƣợc đề xuất. Mô tả nội dung ảnh có thể thực hiện bằng tay hay tự động. Cả hai trƣờng hợp đều cần cấu trúc dữ liệu để lƣu trữ. Một vài kỹ thuật xử lý ảnh đƣợc khảo sát.

Ba kỹ thuật tổng quát để hiện thực CSDL ảnh sẽ đƣợc trình bày. Chúng bao gồm. thứ nhất, CSDL ảnh đƣợc cài đặt bằng cách mở rộng mô hình quan hệ theo phƣơng pháp đối tƣợng - quan hệ. Thứ hai, cài đặt bằng các cấu trúc dữ liệu n chiều nhƣ mô tả trong chƣơng trƣớc. Cuối cùng là cài đặt bằng phƣơng pháp biến đổi ảnh. Vài chục năm gần đây rất nhiều cơ quan tham gia thu nhập dữ liệu ảnh. NASA thu nhập lƣợng lớn ảnh trái đất. Nhiều nƣớc khác lƣu trữ ảnh hộ chiếu, ảnh về giấu vân tay. Các bệnh viện có vô số ảnh chụp X quang và cắt lớp…

Trong mô hình dữ liệu quan hệ truy vấn thƣờng thực hiện với văn bản. Trong CSDL ảnh, với yêu cầu tìm ảnh của ai đó thì câu truy vấn là “Cho trước ảnh mẫu, hãy tìm kiếm mọi ảnh trong CSDL gần giống ảnh mẫu và cho biết các thuộc tính của ảnh cho lại”. Hai đặc tính quan trọng của truy vấn này là: câu truy vấn có ảnh kèm theo. Thứ hai, truy vấn hỏi ảnh “tƣơng tự”. Trong trƣờng hợp này phải xác định thế nào là tƣơng tự.

Một phần của tài liệu Cấu trúc dữ liệu đa phương tiện và mô hình cơ sở dữ liệu hình ảnh (Trang 47)

Tải bản đầy đủ (PDF)

(120 trang)