Các vấn đề liên quan

Một phần của tài liệu (LUẬN VĂN THẠC SĨ) Công nghệ nén Delta ứng dụng trong cập nhật phần mềm tại Ngân hàng Công thương Việt Nam Luận văn ThS. Công nghệ thông tin 60 48 15 (Trang 39 - 41)

2.5.1 Khoảng trống miễn cƣỡng trong bộ nén delta

Như đã mơ tả trong phần 2.2, thuật tốn tham lam của Tichy đã đạt được kết quả trong một tập tuỳ ý nào đĩ của khối di chuyển. Cách di chuyển của các khối xác định

cách mã hố trong sự thực thị Trong phần 2.3, chúng ta đã bàn về một sự thi hành dựa trên khung LZ77. Tuy nhiên, các thuật tốn này cĩ thể cho một sự thi hành nghèo nàn hơn khi gặp phải giới hạn về bộ nhớ trong các bộ xử lý nén và giải nén. Đầu tiên, chúng ta thực hiện phép nén delta trong giới hạn về khơng gian và thời gian, điều này sẽ bị ảnh hưởng khi file fold và fnew cĩ kích thước lớn. Một giải pháp đơn giản trong trường hợp này là cĩ thể giới hạn sự tìm kiếm đối với các tiền tố dài nhất trong fold, các tiền tố này đứng trước các điểm kết thúc của các xâu đã được mã hố. Tuy nhiên, các kết quả này sẽ khơng đạt được mức ý nghĩa đĩ khi các xâu con xuất hiện khơng cùng thứ tự trong cả fold và fnew.

Để giải quyết vấn đề đĩ, người ta đưa ra một thuật tốn là thuật tốn chỉnh sửa một bước. Thuật tốn sử dụng một buffer chứa tất cả các bản sao của yêu cầu, và thực hiện sự chỉnh sửa trên các yêu cầu này sau khi sự phù hợp tốt nhất được tìm thấỵ Cĩ 2 loại chỉnh sửa cĩ thể làm. Chỉnh sửa đuơi (tail correction) được thực hiện sau khi insert 1 bản copy yêu cầu từ một phần chưa mã hố trước đĩ của fold. Thuật tốn cố gắng để mở rộng xâu phù hợp về phía sau trong cả fold và fnew . Nếu sự phù hợp như vậy được tìm thấy theo hướng giật lùi, cĩ một khả năng cho việc thay thế lệnh copy trước đĩ bằng cách tích hợp chúng vào lệnh copy hiện thờị Loại chỉnh sửa thứ 2 là chỉnh sửa chung, cĩ thể thực hiện khi 1 xâu con phù hợp M được tìm thấy trong phần đã mã hố của fnew. Trong trường hợp này, thuật tốn sẽ cố gắng để xác định xem đoạn mã hố trước đĩ của M cĩ thể đã được nén rồi hay chưa và vì thế M cĩ thể được mã hố bởi một lệnh copy đơn. Hơn nữa, để giới hạn tiêu tốn khơng gian chứa các xâu con, chúng ta sử dụng một kỹ thuật gọi là kiểm tra điểm. Kỹ thuật này sẽ đảm bảo một xâu con đã được insert vào bảng băm sao cho vùng vị trí nhỏ nhưng việc lựa chọn số phải thật cẩn thận. Kết quả của sự mở rộng này là kỹ thuật nén delta đảm bảo được cả các yêu cầu về khơng gian và thời gian, cĩ thể làm việc với kích thước file bất kỳ.

2.5.2 Chọn file tham chiếu

Trong một vài ứng dụng, sự thi hành của nén delta phụ thuộc lớn vào việc lựa chọn file tham chiếu phù hợp. Chẳng hạn, để nén một tập các file liên quan, chúng ta cần chọn cho mỗi file một hoặc nhiều file tham chiếu cĩ sự giống nhau với nĩ; mỗi file tham chiếu tự nĩ cũng cĩ thể nén theo cách nàỵ Trong trường hợp cĩ 1 file tham chiếu cho mỗi file nén, vấn đề này trở thành tìm một nhánh tốt hơn trong đồ thị tương ứng trực tiếp, trong đĩ, mỗi cạnh (i,j) cĩ trọng số bằng kích thước của delta với i tương ứng với file tham chiếu j. Trong một số tài liệu, vấn đề này cĩ thể giải quyết theo hướng bình phương của thời gian, tuy nhiên lại mắc phải 2 hạn chế: Đầu tiên,

giải pháp cĩ thể chứa một chuỗi các tài liệu rất dài cần phải truy nhập nếu muốn giải nén một file cụ thể nào đĩ. Thứ hai, với một bộ sưu tập lớn, bình phương thời gian trở thành khĩ chấp nhận, nhất là vấn đề giá trong việc tính trọng số thích hợp của đồ thị trực tiếp.

Nếu chúng ta áp độ dài cao hơn đối với chuỗi tham chiếu, sau đĩ tìm giải pháp tốt hơn thì sẽ trở thành thuật tốn NP Completẹ Nếu chúng ta cho phép mỗi file được nén sử dụng hơn 1 file tham chiếu, thì vấn đề này cĩ thể được giảm tới 1 nhánh đồ thị tối ưu, như được chỉ ra trong thuật tốn NP Complete thậm chí khơng cĩ giới hạn độ dài của xâụ

Một ví dụ của chuỗi tham chiếu dài là khi giải quyết với các phiên bản khác nhau của cùng 1 file, như một hệ thống điều khiển xem xét lại chẳng hạn. Trong trường hợp này, việc lựa chọn file tham chiếu nhằm cực tiểu hố dữ liệu là hiển nhiên, nhưng sự lựa chọn này cĩ thể phải yêu cầu đến những phiên bản rất cũ và do đĩ sẽ khá đắt. Rất nhiều kỹ thuật đã được đề xuất để giải quyết vấn đề này bằng cách tạo ra một số giới hạn các short cut tới các phiên bản cũ hơn.

2.5.3 Đồng bộ các file từ xa

Trong phần này, chúng ta tập trung vào vấn đề đồng bộ các file ở xa, trong trường hợp khi server khơng cĩ quyền truy nhập tới file tham chiếụ Những thuật tốn đã biết đối với vấn đề này cĩ khác biệt so với bộ nén deltạ Chúng ta sẽ bàn về 2 hướng nghiên cứu chính: (1) hướng nghiên cứu dựa trên chuỗi dấu vân tay được thực hiện theo thuật tốn rsync tuy nĩ khơng đạt được giới hạn tối ưu nào, và (2) dựa trên việc tơ màu đồ thị, hướng này đạt được sự thi hành tối ưu dưới các mơ hình hiện thời cho khoảng cách file, nhưng dường như nĩ khơng phù hợp trong thực tế. Chúng ta cũng sẽ bàn về các vấn đề liên quan trong việc đánh giá sự tương đồng của file và cách điều hồ tập các bản ghi trong một databasẹ

Một phần của tài liệu (LUẬN VĂN THẠC SĨ) Công nghệ nén Delta ứng dụng trong cập nhật phần mềm tại Ngân hàng Công thương Việt Nam Luận văn ThS. Công nghệ thông tin 60 48 15 (Trang 39 - 41)

Tải bản đầy đủ (PDF)

(83 trang)