Các kỹ thuật nén XML truy vấn

Một phần của tài liệu luận văn: tìm hiểu và so sánh một số kỹ thuật nén XML (Trang 26)

Mục đích của các bộ nén XML có khả năng truy vấn đó là cho phép truy vấn được thực hiện trực tiếp trên các định dạng nén mà không cần phải giải nén toàn bộ tài liệu. Tỉ lệ nén c n nhóm này thấp hơn so với các bộ nén XML lưu trữ. Tuy nhiên, các bộ nén này có vai tr rất quan trọng đối với các ứng dụng được lưu trữ trên những thiết bị có tài nguyên hạn chế như thiết bị di động và các hệ thống GPS. Nhóm này có hai loại chính đó bao gồm bộ nén đồng cấu và bộ nén không đồng cấu.

Bộ nén đồng cấu (homomorphic compressors) là loại bộ nén giữ lại cấu trúc ban đầu của tài liệu XML trong định dạng nén, vì vậy nó có thể truy cập và phân tích trong cùng một cách như là định dạng gốc ban đầu.

Bộ nén không đồng cấu non-homomorphic compressors) là loại bộ nén tách phần cấu trúc và phần dữ liệu riêng rẽ nhau trong quá trình mã hóa tài liệu XML. Vì vậy, cấu trúc của định dạng nén khác với tài liệu gốc và nó cần phải được phân tích theo một cách khác trong quá trình giải nén.

ảng 2.2: Danh sách các bộ nén c khả năng truy vấn [16]

ộ nén XML Phụ thuộc

lược đ Kỹ thuật nén Các bộ nén đầu cuối

XGrind Yes Dictionary-Based Huffman Encoding

XPress Yes Dictionary-Based Reverse Arithmetic Encoding

QXT Yes Dictionary-Based Gzip, LZMA, PPM

XSeq No Context-Free Grammars Arithmetic Encoding XCQ No Dictionary-Based Block Statistics Signature TREECHOP No Prefixed Dictionary-Based No

XQzip No Dictionary-Based Gzip

XBzip No Succinct labeled tree XBW

ISX No Succinct labeled tree Gzip

XCpaqs No Dictionary-Based Dictionary-Based+Suffix Encoding+BWT

XQueC No Binary Path-Based

Encoding

Divert based on types of data containers

Kết luận

Trong chương này, chúng ta đã tìm hiểu một số khái niệm về nén dữ liệu như tỷ lệ nén, hiệu suất nén, độ dư thừa dữ liệu và phân loại nén dữ liệu bao gồm nén tổn hao và nén không tổn hao. Nén dữ liệu XML cũng được giới thiệu trong chương này bao gồm các kỹ thuật nén văn bản tổng quát, kỹ thuật nén có sự nhận biết XML, kỹ thuật nén XML không truy vấn và kỹ thuật nén XML hỗ trợ truy vấn. Chương tiếp theo sẽ giới thiệu năm kỹ thuật nén XML bao gồm XMill, XGrind, XAUST, XSAQCT và EXI.

Chương 3. MỘT SỐ KỸ THUẬT NÉN XML

Chương này trình bày kiến trúc và quá trình cài đặt chi tiết của năm kỹ thuật nén XML bao gồm XMill, XGrind, XAUST, XSAQCT và EXI.

Một phần của tài liệu luận văn: tìm hiểu và so sánh một số kỹ thuật nén XML (Trang 26)