Cải thiện thời gian

Một phần của tài liệu (LUẬN văn THẠC sĩ) nghiên cứu phương pháp nén dữ liệu để tăng hiệu quả lưu trữ chuỗi DNA (Trang 59 - 61)

2.2. Đánh giá

2.2.2. Cải thiện thời gian

Thực nghiệm ở trên đã chứng minh Fresco hiệu quả hơn các thuật tốn cùng loại và cũng đã cho thấy sự vượt trội của JDNA so với Fresco. Ở phần tiếp theo, người viết sẽ chỉ trình bày so sánh hiệu quả về thời gian và vùng nhớ của JDNA so với Fresco.

Thực nghiệm này so sánh hiệu quả về thời gian của cả hai cơng cụ cho việc nén và giải nén hệ gen người. Việc đánh giá thời gian được chia thành 4 phần:

Nén đầy đủ: Đây là sự thực hiện đầy đủ của thư viện; gồm thời gian bắt

đầu, đọc tệp, sắp xếp bộ nhớ, đánh chỉ số tham chiếu, nén và ghi tệp.

Đánh chỉ số thời gian: Vì JDNA đưa ra đánh chỉ số theo yêu cầu nên ta chỉ so sánh thời gian đánh chỉ số.

Thời gian nén: Trong phạm vi luận văn, người viết đánh giá hiệu suất của

hai phương pháp chỉ trên việc nén, bằng cách đo thời gian cho việc nén thực sự.

Thời gian giải nén: Ở đây đánh giá hiệu suất giải nén cả hai thư viện, đo

Thực nghiệm đo cả hai thời gian bắt đầu, JVM với cấu hình cho JDNA trung bình mất 0,1 giây để bắt đầu, FRESCO mất 0,04 giây. Thời gian nén đầy đủ đo được sử dụng dịng lệnh time, kết quả cĩ thể thấy ở hình 2.10.

Hình 2.10. Thời gian nén

Như đã mơ tả từ trước, JDNA tránh đánh chỉ số, điều này tạo nên sự khác biệt lớn về thời gian nén. Những giá trị này cĩ thể thấy ở bảng 2.1. Những tệp lớn (ví dụ nhiễm sắc thể 1) mất khoảng 5 giây để nén với cấu trúc thuật tốn này, đây là một khác biệt lớn so với FRESCO mất gần cả phút để nén cùng số tệp. Thời gian nén của JDNA gần như là cố định (khoảng 3 giây), cịn khoảng 2 giây với những nhiễm sắc thể nhỏ. Kết quả này nhanh hơn khoảng 5 đến 12 lần so với những gì ta thấy ở FRESCO. Sự khác biệt này là do đánh chỉ số theo yêu cầu. Vì khơng đánh chỉ số tồn bộ tham chiếu, JDNA khơng mất thời gian đánh chỉ số khi bắt đầu thực hiện.

Thời gian mỗi thư viện dùng để đánh chỉ số gen tham chiếu được đo trong quá trình thực hiện chương trình, kết quả cĩ thể thấy ở bảng 2.1. JDNA hầu như khơng tốn thời gian đánh chỉ số, đặc biệt là so với thời gian đánh chỉ số luơn lớn hơn ở FRESCO. JDNA dùng thời gian cho nén đầy đủ với bất kỳ nhiễm sắc thể nào. Một phần trăm nhỏ các cặp bazơ được đánh chỉ số, cĩ thể thấy ở bảng 2.1 và hình 2.11. FRESCO luơn đánh chỉ số 100% các tham chiếu gen.

Hình 2.11. Phần trăm đánh chỉ số tham chiếu ở mỗi cơng cụ

Kết quả đo thời gian nén của chương trình được thể hiện ở hình 2.10. JDNA tốn thời gian gần như FRESCO cho bước nén, hai phương thức này khác nhau về thời gian thực hiện chủ yếu là ở bước đánh chỉ số.

Một phần của tài liệu (LUẬN văn THẠC sĩ) nghiên cứu phương pháp nén dữ liệu để tăng hiệu quả lưu trữ chuỗi DNA (Trang 59 - 61)

Tải bản đầy đủ (PDF)

(82 trang)