Phục hồi nhanh các máy ảo

Một phần của tài liệu Giải pháp đảm bảo an toàn dữ liệu trên nền tảng ảo hóa (Trang 38)

Một trong những yêu cầu căn bản của doanh nghiệp là tính liên tục khi sử dụng. nếu môt máy tính bị lỗi, gần như ngay lập tức nó phải được phục hồi lại để đảm bảo công việc cho tất cả nhân viên. Một trong những các tiếp cận truyền thống là chúng ta sẽ sao lưu toàn bộ dữ liệu bằng cách bất kì dữ liệu nào được ghi vào máy tính, chúng ta sẽ lưu nó ở 2 nơi khác nhau. Điều này đảm bảo mục tiêu thời gian phục hồi nhanh, đáng tin cậy nhưng chúng ta cần trả một số tiền lớn cho việc lưu trữ dữ liệu và băng thông mạng cho việc sao lưu. Thời gian phục hồi của một máy tính có thể bị ảnh hưởng bởi các ứng dụng, hệ điều hành, phần cứng hay các lỗi của máy chủ. Tuy nhiên, mối quan tâm lớn nhất của doanh nghiệp chỉ là sự liên tục trong sử dụng, hay thời gian phục hồi bao lâu, dữ liệu có được giữ lại ngay tại thời điểm máy tính bị lỗi hay không? Các máy ảo có thể mất rất nhiều thời gianđể sao lưu bằng cách sử dụng các công cụ sao lưu truyền thống. bởi vì, một công cụ sao lưu truyền thống sẽ tiêu thụ một lượng băng thông mạng lớn, một khu vực lưu trữ trên SAN lớn. để khắc phục điều này, chúng ta đang dần chuyển sang công nghệ sao lưu trực tiếp trong môi trường ảo hóa, điều này cho phép hiệu quả phục hồi ngay lập tức.

Để sao lưu các máy ảo, chúng ta nên sử dụng các công cụ được thiết kế riêng cho ảo hóa. Các công cụ này sẽ lọa bỏ hệ điều hành khách và trực tiếp sao lưu các tệp tin trên đĩa VM. Điều đó tiết kiệm tải không cần thiết và do đó tang hiệu suất tạo ra các máy ảo khi sao lưu và tang hiệu suất phục hồi máy ảo sau khi sao lưu.

1.4.2. Kiểm tra các máy ảo được sao lưu

Một máy ảo được sao lưu là vô ích nếu máy ảo đó bị hỏng hoặc mất một số tập tin quan trọng. Ví dụ: một bản sao lưu bị thiếu mất tập tin registry của windows. Khi cần phục hồi, chúng ta phục hồi bằng bản sao lưu này. Kết quả là sau khi phục hồi chúng ta sẽ không thể khởi động được windows. Điều đó đặt ra yêu cầu các công cụ sao lưu cần phải có khả năng kiểm tra sự không đầy

đủ của các bản sao lưu, các bản sao lưu bị hỏng hoặc không thể phục hồi lại được. Thêm vào đó nó cần hiển thị khả năng xác minh để các nhà quản trị có thể yên tâm các hệ thống sao lưu được vận hành an toàn.

Một công cụ sao lưu tốt cần phải đặt đặt các bản sao lưu của máy ảo trong một môi trường cô lập đặc biệt để kiểm tra. Các công cụ có khả năng khởi động máy ảo và kiểm tra. Các công cụ này có thể chạy các kịch bản một cách tự độngtrên máy ảo và so sánh kết quả với các giá trị tham chiếu để xác minh các ứng dụng có thể hoạt động bình thường khi được phục hồi.

Khả năng này đặc biệt quan trọng đối với các đơn vj sử dụng các ứng dụng thời gian thực như các ứng dụng tài chính, ứng dụng ngân hang, …

1.4.3. Phục hồi mịn

Đôi khi các máy ảo chỉ cần phục hồi một phần. Điều này xảy ra do quá trình sử dụng và giao tiếp giữa phần mềm và người sử dụng. ví dụ: chúng ta xóa nhầm các tài liệu quan trọng của công ty, các thiết lập email, … Trong trường hợp này, sẽ hiệu quả hơn rất nhiều nếu chúng ta chỉ cần phả phục hồi các thành phần mong muốn chứ không phải là phục hồi toàn bộ máy ảo.

Để thực hiện quá trình khôi phục này, thông thường quản trị viên sẽ phải bắt đầu với một bản sao lưu máy ảo không có mạng, phục hồi các ứng dụng, các tệp tin được yêu cầu và sau đó ghi lại các chỉnh sửa này vào máy ảo.

1.4.4. Băng thông yêu cầu và ổ cứng lưu trữ dành cho sao lưu thấp

Việc sao lưu và phục hồi dữ liệu đảm bảo cho việc truy cập một cách liên tục của dữ liệu nhưng nó khiến doanh nghiệp pải tra một khoản phí lớn về không gian lưu trữ và băng thông mạng. Hai kĩ thuật làm giảm bớt chi phí này là nén và chống trùng lặp.

Nén giúp giữ các máy ảo được sao lưu nhưng giảm số lượng dữ liệu được lưu trữ trên đĩa cứng khi một hoặc nhiều máy ảo được sao lưu. Điều này cũng làm giảm lưu lượng mạng trong quá trình sao lưu máy ảo. Hơn nữa, nếu máy ảo sao lưu cần được chuyển sang một trung tâm dữ liệu sao lưu thì phương châm là càng nhỏ càng tốt đối với chi phí cho mạng diện rộng.

Chống trùng lặp là kĩ thuật so sánh máy ảo đang hoạt động với máy ảo đã được sao lưu trước đó và sao lưu phần dữ liệu sai khác. Sau đó tạo một con trỏ đến phần dữ liệu sai khác được sao lưu này. Khi phần sao lưu được gọi, hệ thống sẽ gọi bản sao lưu đầu tiên sau đó sao lưu đến phần dữ liệu sai khác.

Về cơ bản, chống trùng lặp ngăn chặn các bản sao lưu của cùng một dữ liệu không cần thiết. Điều này làm giảm đến 90% dung lượng sao lưu. Ngoài ra, chống trùng lặp còn làm giảm lưu lượng mạng dành cho việc sao lưu.

Phương pháp so sánh toàn bộ máy ảo để sao lưu một thành phần chung rồi sau đó sao lưu các thành phần sai khác trên từng máy ảo làm giảm tối thiểu chi phí dành cho sao lưu. Một số công cụ sao lưu cung cấp sự linh hoạt ctrong việc lựa chọn hình thức sao lưu để cân bằng giữa sợ tỉ mỉ của giải pháp chống trùng lặp và tốc độ sao lưu.

Chƣơng 2: Giải pháp an toàn dữ liệu trên nên ảo hóa 2. 1. Phƣơng thức sao lƣu và phục hồi dữ liệu

Các phương pháp sao lưu và phục hồi dữ liệu đã được nghiên cứu rất nhiều năm và đạt tới mức gần như hoàn hảo đối với một hệ thống không ảo hóa. Tuy nhiên, sự ra đời của công nghệ ảo hóa đã làm thay đổi những công nghệ sao lưu và phục hồi dữ liệu. Phục hồi dữ liệu trong ảo hóa với những yêu cầu của nó đặt ra cho công nghệ sao lưu một bài toán mới. Công nghệ sao lưu truyền thống đa số sử dụng các thiết bị lưu trữ dữ liệu, điều này làm cho công nghệ lưu trữ phát triển rất mạnh trong thời gian qua. Một trong những thành phần gần như không thay đổi của phương pháp sao lưu truyền thống là phương pháp sao lưu, trong đó, chủ yếu là dựa vào một phần mềm được cài đặt trên máy chủ, phần mềm này có nhiệm vụ sao chép dữ liệu và gửi đến máy chủ sao lưu bằng kết nối mạng. Với sự ra đời của công nghệ ảo hóa, phương pháp này vẫn có thể hoạt động nhưng không còn là phương pháp sao lưu dữ liệu hiệu quả nhất, bởi vì kiến trúc ảo hóa hoàn toàn khác với kiến trúc của máy chủ vật lý thông thường.

2. 1. 1. Phƣơng pháp sao lƣu và phục hồi dữ liệu truyền thống

a. Sao lưu hệ điều hành dựa trên agent.

Phương pháp này dựa trên một agent được cài đặt trên hệ điều hành. Các máy chủ sao lưu liên lạc với các agent, mà luôn chạy trên máy chủ, và thiết lập một phiên kết nối TCP/IP đến agent. Khi kết nối được thiết lập, các agent sẽ sao chép tất cả các dữ liệu từ hệ thống tệp tin của hệ điều hành và gửi chúng đến các máy chủ sao lưu. Bởi vì các agent sao lưu được cài đặt bên trong hệ điều hành nên nó có thể đọc các tệp tin hệ thống của tất cả các ổ cứng được cấu hình trên máy chủ. Các agent có thể truy cập vào các Master File Table của hệ điều hành để xác định tất cả các tệp tin tồn tại trên các phân vùng của ổ cứng và gửi chúng đến máy chủ sao lưu. Đây là phương pháp sao lưu máy chủ ở mức tệp tin (file level backup) bởi vì các tệp tin được sao chép đến một hệ thống tệp tin nằm trên một thiết bị khác, điều này giống như chúng ta vào windows và copy các thư

mục đến thiết bị lưu trữ được chia sẻ. Để hỗ trợ việc sao lưu được nhanh chóng, một giá trị bit lưu trữ được thiết lập, bất kì khi nào hệ điều hành thay đổi một tệp tin, bit lưu trữ này sẽ tăng lên và các agent sẽ nhận biết rằng tệp tin đã thay đổi so với lần sao lưu trước, các agent sau đó sẽ tiến hành sao lưu tệp tin và chuyển bit lưu trữ về giá trị ban đầu.

Hình 2.1. Sao lưu trên máy vật lý

Vì phương pháp này hoạt động ở cấp độ tệp tin bên trong các hệ điều hành, chỉ sao lưu các tệp tin đang được sử dụng trên hệ điều hành, tất cả các tệp tin bị xóa và phân vùng còn trống sẽ được bỏ qua. Điều này dẫn đến một bản sao đầy đủ có kích thước lớn hơn không gian thực sự trên đĩa cứng và chúng ta không thể biết được dung lượng tối đa dành cho việc sao lưu là bao nhiêu. Phương pháp này không hiệu quả vì nếu chỉ một phần nhỏ của tệp tin thay đổi, toàn bộ tệp tin sẽ được gắn cờ là thay đổi vì vậy toàn bộ tệp tin sẽ được sao lưu. Để vượt qua hạn chế lớn này, các ứng dụng đặc biệt như exchange sẽ được thiết kế các agent đặc biệt có thể sao lưu duy nhất các bản ghi thay đổi chứ không phải sao lưu toàn bộ cơ sở dữ liệu của ứng dụng.

Một hạn chế nữa của phương pháp này là sao lưu các tệp tin đang được mở hoặc đang được sử dụng. Những tệp tin này thường bị khóa bởi hệ điều hành hoặc các ứng dụng, điều này có nghĩa là các agent không thể sao lưu chúng. Để giải quyết vấn đề này và đảm bảo tất cả các tệp tin được sao lưu, các ứng dụng sao lưu có thể sử dụng các agent mở tệp tin đặc biệt.

Sao lưu dữ liệu được thực hiện bên trong hệ điều hành đã hoạt động rất tốt hàng thập kỉ qua với công nghệ máy chủ truyền thống. thuy nhiên, với sự ra đời của công nghệ ảo hóa, công nghệ sao lưu này không còn hiệu quả, và cần thiết phải có các phương pháp thay thế tận dụng được thế mạnh về kiến trúc ảo hóa. Các phương pháp sao lưu mới phải được thiết kế cho môi trường ảo hóa, bỏ qua lớp hệ điều hành thay vào đó là sao lưu các máy ảo ở lớp ảo hóa.

b. lập lịch và thực thi sao lưu

Sao lưu một máy chủ là hoạt động tốn rất nhiều tài nguyên, đặc biệt là tài nguyên mạng và tài nguyên lưu trữ. Khi thực hiện việc sao lưu của các máy chủ vật lý, việc sử dụng các tài nguyên sẽ bị giới hạn do máy chủ cần tài nguyên cho việc sao lưu. Rất nhiều máy chủ có thể được sao lưu đồng thời dẫn đến việc các tài nguyên của máy chủ sao lưu cạn kiệt, trong đó có các tài nguyên về đĩa cứng và mạng. Hầu hết các trung tâm dữ liệu có một cửa sổ sao lưu, đó là khoảng thời gian mà lượng sử dụng thấp nên việc sao lưu không làm ảnh hưởng quá nhiều đến người dung truy cập và các ứng dụng chạy trên các máy chủ được sao lưu. Bởi vì mỗi máy chủ có tài nguyên riêng của mình, một máy chủ bắt đầu sao lưu sẽ không có hoạt động nào khác, điều này dẫn đến nếu có một lịch trình cụ thể thì việc sao lưu của các máy chủ sẽ diễn ra đơn giản hơn rất nhiều.

Có một số mô hình sao lưu dữ liệu khác nhau có thể được kết hợp để có được hệ thống sao lưu tốt nhất. Các phương pháp sao lưu khác nhau được thiết kế để giảm cả về thời gian sao lưu lẫn dung lượng mà bản sao lưu yêu cầu. Có một số phương pháp sao lưu như sau:

- Sao lưu toàn bộ: Đây là phương pháp mà tất cả các dữ liệu trên máy chủ nguồn được sao chép vào các thiết bị sao lưu. Bản sao lưu đầy đủ đòi hỏi nhiều thời gian để thực hiện cũng như nhiều không gian lưu trữ nhất. Bản sao lưu đầy đủ là nền tảng cho các phương pháp sao lưu khác.

- Sao lưu tổng hợp: với phương pháp sao lưu tổng hợp, một bản sao lưu đầy đủ sẽ được thực hiện duy nhất 1 lần và những lần sao lưu tiếp theo tất cả là các bản sao lưu gia tăng. Phương pháp này cho phép thời gian sao lưu ngắn hơn, tiêu thụ ít tài nguyên hơn so với phương pháp sao lưu truyền thống vì

chúng ta không cần phải sao lưu toàn bộ hệ thống đến lần thứ 2. Những sao lưu gia tăng được kết hợp với nhau để tạo thành một bản sao lưu đầy đủ. Bằng cách này, một bản sao lưu đầy đủ cập nhật luôn luôn đạt được mà không cần thiết phải thực hiện sao lưu toàn bộ. Chúng ta có thể khôi phục lại các dữ liệu cũ bởi tất cả các thay đổi được sao lưu và lưu lại dưới dạng tệp tin rollback và xlieuej lược sử được sử dụng để tính toán thời điểm cần phục hồi. Phương pháp này gọi là reverse-delta.

- Sao lưu gia tăng: phương pháp này chỉ sao lưu dữ liệu đã thay đổi kể từ bản sao lưu đầy đủ hoặc bản sao lưu gia tăng trước đó. Phương pháp này dựa trên một bit lưu trữ được xóa ngay sau khi sao lưu. Khi một tệp tin thay đổi, các bit lưu trữ sẽ được thiết lập và chỉ ra các tệp tin đã thay đổi kể từ lần sao lưu cuối cùng. Sao lưu gia tăng sau đó chỉ sao lưu những tệp tin mà có bit lưu trữ được bật và sau đó xóa bit lưu trữ khi quá trình sao lưu hoàn thành. Phương pháp này cho phép quá trình sao lưu nhanh chóng nhưng quá trình phục hồi lại các tệp tin sẽ mất rất nhiều thời gian do cần khôi phục lại các tệp tin đã thay đổi kể từ lần sao lưu đầy đủ cuối cùng.

- Sao lưu khác biệt: đây là phương pháp tương tự với sao lưu gia tăng, nhưng tất cả các dữ liệu thay đổi từ bản sao lưu đầy đủ cuối cùng sẽ được sao lưu mỗi khi sao lưu khác biệt được thực thi. Các tệp tin được thay đổi sẽ được sao lưu với sao lưu khác biệt, các bit lưu trữ sẽ không được tắt, vì vậy tất cả các tệp tin đã được thay đổi từ lần sao lưu toàn bộ cuối cùng sẽ được sao lưu bằng sao lưu khác biệt, kể cả nó đã được sao lưu bởi một bản sao lưu khác biệt trước đó. Trong phương pháp này, việc sao lưu sẽ tốn thời gian và không gian nhớ hơn so với sao lưu gia tăng nhưng thời gian cần thiết để khôi phục lại hệ thống lại giảm đi đáng kể vì chúng ta chỉ cần khôi phục sao lưu đầy đủ cuối cùng và phiên bản sao lưu khác biệt được chọn.

Hầu hết các doanh nghiệp thực hiện một lịch trình sao lưu bao gồm các bản sao lưu đầy đủ được thực hiện định kỳ và tiếp theo là các bản sao lưu gia tăng hoặc khác biệt được thực hiện cho đến khi bản sao lưu đầy đủ tiếp theo

xảy ra và quá trình được lặp lại theo chu kì. Lịch trình sao lưu sẽ thay đổi tùy theo yêu cầu của mỗi công ty như thời gian, ngân sách và cơ sở hạ tầng. c. phục hồi dữ liệu

Có 2 cách để phục hồi dữ liệu từ bản sao lưu đó là phục hồi lại các tệp tin và thư mục riêng hoặc phục hồi tất cả dữ liệu trên máy. Phục hồi một số các tệp tin là loại phổ biến nhất của phục hồi dữ liệu. Để phục hồi một số tệp tin, chúng ta cần chọn thời điểm mà bản sao lưu tồn tại trên máy chủ. Các tệp tin muốn được

Một phần của tài liệu Giải pháp đảm bảo an toàn dữ liệu trên nền tảng ảo hóa (Trang 38)