1.3.1. An toàn dữ liệu:
An toàn dữ liệu một trạng thái tốt của dữ liệu và cơ sở hạ tầng trong đó khả năng dữ liệu bị đánh cắp, giả mạo, gián đoạn thông tin và dịch vụ được giữ ở mức thấp hoặc chấp nhận được.
1.3.2. Các thuộc tính của an toàn dữ liệu:
An toàn dữ liệ phụ thuộc vao năm yếu tố chính: tính bảo mật, tính toàn vẹn, tính sẵn sang, tính xác thực và tính không phủ nhận
Tính bảo mật: là sự đảm bảo rằng dữ liệu chỉ có thể được truy cập bởi những người được phép. Vi phạm tính bảo mật có thể xảy ra do quá trình xử lý thông tin, phân quyền sai hoặc do bị tấn công.
Tính toàn vẹn: là độ tin cậy của dữ liệu hoặc các nguồn thông tin về việc ngăn ngừa những thay đổi trái phép và không phù hợp, là sự đảm bảo rằng thông tin có đủ độ chính xác để sử dụng cho mục đích đề ra.
Tính sẵn sàng: là sự đảm bảo rằng hệ thống pụ trách cung cấp, lưu trữ và xử lý thông tin có thể được truy cập bởi những người được cấp phép bất kì lúc nào.
Tính xác thực: đề cập đến đặc tính của thông tin, tài liệu hoặc bất kỳ dữ liệu nào đảm bảo chất lượng là thật và không bị hỏng so với bản gốc. Vai trò chính của xác thực bao gồm xác nhận người dùng là người yêu cầu và đảm bảo tin nhắn là thực và không bị thay đổi hoặc giả mạo. Sinh trắc học, thẻ thông minh và giấy chứng nhận kỹ thuật số được sử dụng để đảm bảo tính xác thực của dữ liệu, các giao dịch, thông tin liên lạc, hoặc tài liệu.
Tính không phủ nhận: là khả năng đảm bảo rằng một bên trong hợp đồng
hoặc một giao dịch không thể phủ nhận tính xác thực chữ ký của họ trên tài liệu hoặc gửi tin nhắn họ tạo ra. Đó là cách đảm bảo rằng người gửi tin nhắn không thể phủ nhận việc đã gửi tin nhắn và người nhận không thể phủ nhận việc đã nhận tin nhắn.
1.4. Những yêu cầu của an toàn dữ liệu trên nền tảng ảo hóa
Với đặc thù ảo hóa, an toàn dữ liệu cần có những yêu cầu riêng để đáp ứng yêu cầu của doanh nghiệp, chính phủ, … những khách hàng sử dụng dịch vụ. Những yêu cầu này là những mong muốn của người sử dụng.
1.4.1. Phục hồi nhanh các máy ảo
Một trong những yêu cầu căn bản của doanh nghiệp là tính liên tục khi sử dụng. nếu môt máy tính bị lỗi, gần như ngay lập tức nó phải được phục hồi lại để đảm bảo công việc cho tất cả nhân viên. Một trong những các tiếp cận truyền thống là chúng ta sẽ sao lưu toàn bộ dữ liệu bằng cách bất kì dữ liệu nào được ghi vào máy tính, chúng ta sẽ lưu nó ở 2 nơi khác nhau. Điều này đảm bảo mục tiêu thời gian phục hồi nhanh, đáng tin cậy nhưng chúng ta cần trả một số tiền lớn cho việc lưu trữ dữ liệu và băng thông mạng cho việc sao lưu. Thời gian phục hồi của một máy tính có thể bị ảnh hưởng bởi các ứng dụng, hệ điều hành, phần cứng hay các lỗi của máy chủ. Tuy nhiên, mối quan tâm lớn nhất của doanh nghiệp chỉ là sự liên tục trong sử dụng, hay thời gian phục hồi bao lâu, dữ liệu có được giữ lại ngay tại thời điểm máy tính bị lỗi hay không? Các máy ảo có thể mất rất nhiều thời gianđể sao lưu bằng cách sử dụng các công cụ sao lưu truyền thống. bởi vì, một công cụ sao lưu truyền thống sẽ tiêu thụ một lượng băng thông mạng lớn, một khu vực lưu trữ trên SAN lớn. để khắc phục điều này, chúng ta đang dần chuyển sang công nghệ sao lưu trực tiếp trong môi trường ảo hóa, điều này cho phép hiệu quả phục hồi ngay lập tức.
Để sao lưu các máy ảo, chúng ta nên sử dụng các công cụ được thiết kế riêng cho ảo hóa. Các công cụ này sẽ lọa bỏ hệ điều hành khách và trực tiếp sao lưu các tệp tin trên đĩa VM. Điều đó tiết kiệm tải không cần thiết và do đó tang hiệu suất tạo ra các máy ảo khi sao lưu và tang hiệu suất phục hồi máy ảo sau khi sao lưu.
1.4.2. Kiểm tra các máy ảo được sao lưu
Một máy ảo được sao lưu là vô ích nếu máy ảo đó bị hỏng hoặc mất một số tập tin quan trọng. Ví dụ: một bản sao lưu bị thiếu mất tập tin registry của windows. Khi cần phục hồi, chúng ta phục hồi bằng bản sao lưu này. Kết quả là sau khi phục hồi chúng ta sẽ không thể khởi động được windows. Điều đó đặt ra yêu cầu các công cụ sao lưu cần phải có khả năng kiểm tra sự không đầy
đủ của các bản sao lưu, các bản sao lưu bị hỏng hoặc không thể phục hồi lại được. Thêm vào đó nó cần hiển thị khả năng xác minh để các nhà quản trị có thể yên tâm các hệ thống sao lưu được vận hành an toàn.
Một công cụ sao lưu tốt cần phải đặt đặt các bản sao lưu của máy ảo trong một môi trường cô lập đặc biệt để kiểm tra. Các công cụ có khả năng khởi động máy ảo và kiểm tra. Các công cụ này có thể chạy các kịch bản một cách tự độngtrên máy ảo và so sánh kết quả với các giá trị tham chiếu để xác minh các ứng dụng có thể hoạt động bình thường khi được phục hồi.
Khả năng này đặc biệt quan trọng đối với các đơn vj sử dụng các ứng dụng thời gian thực như các ứng dụng tài chính, ứng dụng ngân hang, …
1.4.3. Phục hồi mịn
Đôi khi các máy ảo chỉ cần phục hồi một phần. Điều này xảy ra do quá trình sử dụng và giao tiếp giữa phần mềm và người sử dụng. ví dụ: chúng ta xóa nhầm các tài liệu quan trọng của công ty, các thiết lập email, … Trong trường hợp này, sẽ hiệu quả hơn rất nhiều nếu chúng ta chỉ cần phả phục hồi các thành phần mong muốn chứ không phải là phục hồi toàn bộ máy ảo.
Để thực hiện quá trình khôi phục này, thông thường quản trị viên sẽ phải bắt đầu với một bản sao lưu máy ảo không có mạng, phục hồi các ứng dụng, các tệp tin được yêu cầu và sau đó ghi lại các chỉnh sửa này vào máy ảo.
1.4.4. Băng thông yêu cầu và ổ cứng lưu trữ dành cho sao lưu thấp
Việc sao lưu và phục hồi dữ liệu đảm bảo cho việc truy cập một cách liên tục của dữ liệu nhưng nó khiến doanh nghiệp pải tra một khoản phí lớn về không gian lưu trữ và băng thông mạng. Hai kĩ thuật làm giảm bớt chi phí này là nén và chống trùng lặp.
Nén giúp giữ các máy ảo được sao lưu nhưng giảm số lượng dữ liệu được lưu trữ trên đĩa cứng khi một hoặc nhiều máy ảo được sao lưu. Điều này cũng làm giảm lưu lượng mạng trong quá trình sao lưu máy ảo. Hơn nữa, nếu máy ảo sao lưu cần được chuyển sang một trung tâm dữ liệu sao lưu thì phương châm là càng nhỏ càng tốt đối với chi phí cho mạng diện rộng.
Chống trùng lặp là kĩ thuật so sánh máy ảo đang hoạt động với máy ảo đã được sao lưu trước đó và sao lưu phần dữ liệu sai khác. Sau đó tạo một con trỏ đến phần dữ liệu sai khác được sao lưu này. Khi phần sao lưu được gọi, hệ thống sẽ gọi bản sao lưu đầu tiên sau đó sao lưu đến phần dữ liệu sai khác.
Về cơ bản, chống trùng lặp ngăn chặn các bản sao lưu của cùng một dữ liệu không cần thiết. Điều này làm giảm đến 90% dung lượng sao lưu. Ngoài ra, chống trùng lặp còn làm giảm lưu lượng mạng dành cho việc sao lưu.
Phương pháp so sánh toàn bộ máy ảo để sao lưu một thành phần chung rồi sau đó sao lưu các thành phần sai khác trên từng máy ảo làm giảm tối thiểu chi phí dành cho sao lưu. Một số công cụ sao lưu cung cấp sự linh hoạt ctrong việc lựa chọn hình thức sao lưu để cân bằng giữa sợ tỉ mỉ của giải pháp chống trùng lặp và tốc độ sao lưu.
Chƣơng 2: Giải pháp an toàn dữ liệu trên nên ảo hóa 2. 1. Phƣơng thức sao lƣu và phục hồi dữ liệu
Các phương pháp sao lưu và phục hồi dữ liệu đã được nghiên cứu rất nhiều năm và đạt tới mức gần như hoàn hảo đối với một hệ thống không ảo hóa. Tuy nhiên, sự ra đời của công nghệ ảo hóa đã làm thay đổi những công nghệ sao lưu và phục hồi dữ liệu. Phục hồi dữ liệu trong ảo hóa với những yêu cầu của nó đặt ra cho công nghệ sao lưu một bài toán mới. Công nghệ sao lưu truyền thống đa số sử dụng các thiết bị lưu trữ dữ liệu, điều này làm cho công nghệ lưu trữ phát triển rất mạnh trong thời gian qua. Một trong những thành phần gần như không thay đổi của phương pháp sao lưu truyền thống là phương pháp sao lưu, trong đó, chủ yếu là dựa vào một phần mềm được cài đặt trên máy chủ, phần mềm này có nhiệm vụ sao chép dữ liệu và gửi đến máy chủ sao lưu bằng kết nối mạng. Với sự ra đời của công nghệ ảo hóa, phương pháp này vẫn có thể hoạt động nhưng không còn là phương pháp sao lưu dữ liệu hiệu quả nhất, bởi vì kiến trúc ảo hóa hoàn toàn khác với kiến trúc của máy chủ vật lý thông thường.
2. 1. 1. Phƣơng pháp sao lƣu và phục hồi dữ liệu truyền thống
a. Sao lưu hệ điều hành dựa trên agent.
Phương pháp này dựa trên một agent được cài đặt trên hệ điều hành. Các máy chủ sao lưu liên lạc với các agent, mà luôn chạy trên máy chủ, và thiết lập một phiên kết nối TCP/IP đến agent. Khi kết nối được thiết lập, các agent sẽ sao chép tất cả các dữ liệu từ hệ thống tệp tin của hệ điều hành và gửi chúng đến các máy chủ sao lưu. Bởi vì các agent sao lưu được cài đặt bên trong hệ điều hành nên nó có thể đọc các tệp tin hệ thống của tất cả các ổ cứng được cấu hình trên máy chủ. Các agent có thể truy cập vào các Master File Table của hệ điều hành để xác định tất cả các tệp tin tồn tại trên các phân vùng của ổ cứng và gửi chúng đến máy chủ sao lưu. Đây là phương pháp sao lưu máy chủ ở mức tệp tin (file level backup) bởi vì các tệp tin được sao chép đến một hệ thống tệp tin nằm trên một thiết bị khác, điều này giống như chúng ta vào windows và copy các thư
mục đến thiết bị lưu trữ được chia sẻ. Để hỗ trợ việc sao lưu được nhanh chóng, một giá trị bit lưu trữ được thiết lập, bất kì khi nào hệ điều hành thay đổi một tệp tin, bit lưu trữ này sẽ tăng lên và các agent sẽ nhận biết rằng tệp tin đã thay đổi so với lần sao lưu trước, các agent sau đó sẽ tiến hành sao lưu tệp tin và chuyển bit lưu trữ về giá trị ban đầu.
Hình 2.1. Sao lưu trên máy vật lý
Vì phương pháp này hoạt động ở cấp độ tệp tin bên trong các hệ điều hành, chỉ sao lưu các tệp tin đang được sử dụng trên hệ điều hành, tất cả các tệp tin bị xóa và phân vùng còn trống sẽ được bỏ qua. Điều này dẫn đến một bản sao đầy đủ có kích thước lớn hơn không gian thực sự trên đĩa cứng và chúng ta không thể biết được dung lượng tối đa dành cho việc sao lưu là bao nhiêu. Phương pháp này không hiệu quả vì nếu chỉ một phần nhỏ của tệp tin thay đổi, toàn bộ tệp tin sẽ được gắn cờ là thay đổi vì vậy toàn bộ tệp tin sẽ được sao lưu. Để vượt qua hạn chế lớn này, các ứng dụng đặc biệt như exchange sẽ được thiết kế các agent đặc biệt có thể sao lưu duy nhất các bản ghi thay đổi chứ không phải sao lưu toàn bộ cơ sở dữ liệu của ứng dụng.
Một hạn chế nữa của phương pháp này là sao lưu các tệp tin đang được mở hoặc đang được sử dụng. Những tệp tin này thường bị khóa bởi hệ điều hành hoặc các ứng dụng, điều này có nghĩa là các agent không thể sao lưu chúng. Để giải quyết vấn đề này và đảm bảo tất cả các tệp tin được sao lưu, các ứng dụng sao lưu có thể sử dụng các agent mở tệp tin đặc biệt.
Sao lưu dữ liệu được thực hiện bên trong hệ điều hành đã hoạt động rất tốt hàng thập kỉ qua với công nghệ máy chủ truyền thống. thuy nhiên, với sự ra đời của công nghệ ảo hóa, công nghệ sao lưu này không còn hiệu quả, và cần thiết phải có các phương pháp thay thế tận dụng được thế mạnh về kiến trúc ảo hóa. Các phương pháp sao lưu mới phải được thiết kế cho môi trường ảo hóa, bỏ qua lớp hệ điều hành thay vào đó là sao lưu các máy ảo ở lớp ảo hóa.
b. lập lịch và thực thi sao lưu
Sao lưu một máy chủ là hoạt động tốn rất nhiều tài nguyên, đặc biệt là tài nguyên mạng và tài nguyên lưu trữ. Khi thực hiện việc sao lưu của các máy chủ vật lý, việc sử dụng các tài nguyên sẽ bị giới hạn do máy chủ cần tài nguyên cho việc sao lưu. Rất nhiều máy chủ có thể được sao lưu đồng thời dẫn đến việc các tài nguyên của máy chủ sao lưu cạn kiệt, trong đó có các tài nguyên về đĩa cứng và mạng. Hầu hết các trung tâm dữ liệu có một cửa sổ sao lưu, đó là khoảng thời gian mà lượng sử dụng thấp nên việc sao lưu không làm ảnh hưởng quá nhiều đến người dung truy cập và các ứng dụng chạy trên các máy chủ được sao lưu. Bởi vì mỗi máy chủ có tài nguyên riêng của mình, một máy chủ bắt đầu sao lưu sẽ không có hoạt động nào khác, điều này dẫn đến nếu có một lịch trình cụ thể thì việc sao lưu của các máy chủ sẽ diễn ra đơn giản hơn rất nhiều.
Có một số mô hình sao lưu dữ liệu khác nhau có thể được kết hợp để có được hệ thống sao lưu tốt nhất. Các phương pháp sao lưu khác nhau được thiết kế để giảm cả về thời gian sao lưu lẫn dung lượng mà bản sao lưu yêu cầu. Có một số phương pháp sao lưu như sau:
- Sao lưu toàn bộ: Đây là phương pháp mà tất cả các dữ liệu trên máy chủ nguồn được sao chép vào các thiết bị sao lưu. Bản sao lưu đầy đủ đòi hỏi nhiều thời gian để thực hiện cũng như nhiều không gian lưu trữ nhất. Bản sao lưu đầy đủ là nền tảng cho các phương pháp sao lưu khác.
- Sao lưu tổng hợp: với phương pháp sao lưu tổng hợp, một bản sao lưu đầy đủ sẽ được thực hiện duy nhất 1 lần và những lần sao lưu tiếp theo tất cả là các bản sao lưu gia tăng. Phương pháp này cho phép thời gian sao lưu ngắn hơn, tiêu thụ ít tài nguyên hơn so với phương pháp sao lưu truyền thống vì
chúng ta không cần phải sao lưu toàn bộ hệ thống đến lần thứ 2. Những sao lưu gia tăng được kết hợp với nhau để tạo thành một bản sao lưu đầy đủ. Bằng cách này, một bản sao lưu đầy đủ cập nhật luôn luôn đạt được mà không cần thiết phải thực hiện sao lưu toàn bộ. Chúng ta có thể khôi phục lại các dữ liệu cũ bởi tất cả các thay đổi được sao lưu và lưu lại dưới dạng tệp tin rollback và xlieuej lược sử được sử dụng để tính toán thời điểm cần phục hồi. Phương pháp này gọi là reverse-delta.
- Sao lưu gia tăng: phương pháp này chỉ sao lưu dữ liệu đã thay đổi kể từ bản sao lưu đầy đủ hoặc bản sao lưu gia tăng trước đó. Phương pháp này dựa trên một bit lưu trữ được xóa ngay sau khi sao lưu. Khi một tệp tin thay đổi,