Thông thường việc đầu tư cho một trung tâm công nghệ thông tin là rất tốn kém .Chi phí đầu tư mua các máy chủ cấu hình mạnh và các phần mềm bản quyền là rất đắt đỏ.Trong thời buổi kinh tế khó khăn hiện nay doanh nghiệp nào cũng muốn cắt giảm và hạn chế tối đa các chi phí không cần thiết mà vẫn đáp ứng được năng suất và tính ổn định của hệ thống.thế nên việc ứng dụng ảo hóa trở thành nhu cầu cần thiết của bất kì doanh nghiệp lớn hay nhỏ.Vì thay vì mua mười máy chủ cho mười ứng dụng thì chỉ cần mua một hoặc hai máy chủ có hỗ trợ ảo hóa thì vẫn có thể chạy tốt mười ứng dụng trên.Điều này cho ta thấy sự khác biệt giữa hệ thống ảo hóa và không ảo hóa.Bên cạnh đó việc ứng dụng ảo hóa còn đem lại những lợi ích sau đây .
Quản lý đơn giản : khi triển khai hệ thống ảo hoá thì số lượng máy chủ vật lý giảm đi đáng kể và khi đó việc theo dõi và giám sát hệ thống rất dễ dàng và hầu như được thực hiện bởi công cụ phần mềm quản trị tập trung từ xa do nhà cung cấp phần mềm ảo hoá hỗ trợ. Nhà quản trị dễ dàng theo dõi tình trạng của các máy ảo và của cả hệ thống.Nếu máy chủ bị trục trặc thì có thể chuyển máy ảo từ máy chủ này sang máy chủ khác ,có thể nâng cấp phần cứng bằng cách gắn thêm Ram,ổ cứng một cách nhanh chóng và đơn giản.
Triển khai nhanh : khi triển khai hệ thống thì không cần nhất thiết phải cài đặt toàn bộ máy ảo trên hệ thống .vì mỗi máy ảo chỉ là một tập tin được cài trên một phân vùng trên ổ cứng nên chúng ta có thể tận dụng điều này để giảm thiểu thời gian cài đặt bằng cách sao chép các tập tin này và cấu hình lại cho đúng với yêu cầu của máy ảo đang sử dụng .Với cách làm này sẽ giảm thời gian cài đặt từng máy ảo và tận dụng tối đa tài nguyên nhàn rỗi của tất cả các máy chủ vật lý. Vì thực tế hiện nay tại trung tâm dữ liệu có nhiều máy chủ không khai thác thác hết tài nguyên phần cứng của hệ thống.
Phục hồi và lưu trữ hệ thống nhanh: Vì máy ảo chỉ là một tập tin trên ổ đĩa nên việc sao lưu rất đơn giản là sao chép lại các tập tin này .Và Khi một máy ảo gặp sự cố và hỏng hóc do mộ lỗi hệ điều hành nào đó thì việc phục hồi đon giản là chép đè tập tin đã được sao chép lên tập tin cũ và hệ thống có thể hoạt động bình thường lại ngay như lúc chưa bị lỗi.Thời gian để phục hồi hệ thống là rất ít. Nếu được đầu tư thêm một số máy chủ khác thì ta có thể cấu hình tính năng High Availibility cho các máy chủ ảo hóa này.Khi đó một máy ảo hay một máy chủ bị sự cố
thì tất cả các máy ảo sẽ được di chuyển nóng đến máy chủ khác và có thể hoạt động lại ngay tức thì.
Cân bằng tải và phân phối tài nguyên linh hoạt : Với các công cụ quản lý từ xa các máy chủ và máy ảo ta sẽ thấy được tình trạng của toàn bộ hệ thống từ đó có chình sách năng cấp Cpu, Ram, ổ cứng cho máy chủ hoặc máy ảo đó hoặc di chuyển máy ảo đang quá tải đó sang máy chủ vật lý có cấu hình mạnh hơn, có nhiều tài nguyên còn trống hơn để hoạt động.
Tiết kiệm : công nghệ ảo hóa giúp các doanh nghiệp có thể tiết kiệm được một chi phí lớn đó là điện năng chiếu sang và hệ thống làm mát.Ảo hóa cho phép gom nhiều máy chủ vào một máy chủ vật lý nên chỉ tốn kém chi phí điện tiêu thụ,làm mát và chiếu sang cho một vài máy chủ thôi.bên cạnh đó thì diện tích sử dụng để đặt máy chủ cũng được thu hẹp lại.Và hệ thống dây cáp nối cũng ít đi :
Chương 3 : Các Công Nghệ Giúp Ảo Hóa Hệ Thống 3.1 :Công Nghệ Máy ảo (Virtual Machine)
Máy ảo là một máy tính được cài trên một hệ điều hành khác hay một máy tính khác. Một máy ảo cũng bao gồm phần cứng, các ứng dụng phần mềm và hệ điều hành.điều khác biệt ở đây là lớp phần cứng của máy ảo không phải là các thiết bị thường mà chỉ là một môi trường hay phân vùng mà ở đó nó được cấp phát một số tài nguyên như là chu kì cpu,bộ nhớ,ỗ đĩa….Công nghệ máy ảo cho phép cài và chạy nhiều máy
khách riêng lẻ và được phân bố tài nguyên, ổ cứng, card mạng và các tài nguyên phần cứng khác một cách hợp lý. Việc phân bố tài nguyên này phụ thuộc vào nhu cầu của từng máy ảo ứng dụng và cũng tùy thuộc vào phương pháp ảo hóa được dùng. Đặc biệt khi máy ảo cần truy xuất tài nguyên phần cứng thì nó hoạt động giống như một máy thật hoàn chỉnh. Vì chỉ là một tập tin được phân vùng trên ổ đĩa nên việc di chuyển các máy ảo từ máy chủ này sang máy chủ khác là rất dễ dàng và không cần quan tâm đến vấn đề tương thích phần cứng hay ảnh hưởng tới máy chủ.
.
Hình 3.1 : sơ đồ truy cập tài nguyên phần cứng của các máy ảo.
Trong kiến trúc của một bộ xử lý ảo hóa được chia thành 4 lớp . Lớp 0 là lớp có quyền cao nhất có thể truy cập và can thiệp sâu nhất đến tài nguyên phần cứng. Lớp 0 thường là các hệ điều hành chủ được cài trên chính máy chủ. Lớp 1 là lớp ảo hóa Hypervisor. Lớp này dùng đề quản lý và phân phối tài nguyên đến các máy ảo. Lớp 2 là các hệ điều hành khách chạy trên các máy ảo. Để truy cập tài nguyên phần cứng nó phải liên lạc với lớp ảo hóa và phải qua hệ điều hành máy chủ . Lớp có quyền
can thiệp thấp nhất đến tài nguyên là lớp 3. Đây là các ứng dụng hoạt động trên các máy ảo.
Trong các hệ thống máy tính lớn dùng để xử lý các ứng dụng thương mại và khoa học( mainframe), hệ điều hành chạy trên phần cứng máy thực ở chế độ ưu tiên vì chỉ có hệ điều hành chủ mới được phép sửa đổi và can thiệp vào phần cứng bên dưới nó. Còn máy ảo làm việc ở chế độ giới hạn vì phần cứng mà nó nhìn thấy chỉ là các thiết bị ảo . Khi máy ảo yêu cầu các lệnh hoặc tiến trình thông thường thì hệ điều hành chủ sẽ chuyển tiếp chúng đến bô xử lý để thực thi trực tiếp, còn đối với các lệnh hoặc các tiến trình đặc biệt nhạy cảm can thiệp sâu đến phần cứng bên dưới sẽ bị chặn lại vì có thể làm ảnh hưởng tới hệ thống và máy ảo còn lại. Hệ điều hành chủ sẽ thực thi lệnh với bộ xử lý trên máy thực rồi sau đó mô phỏng kết quả rồi trả về cho máy ảo. Đây là cơ chế nhằm cách ly máy ảo với máy thực để đảm bảo an toàn hệ thống.
3.2 : Công nghệ Raid
3.2.1 : khái niệm Raid
RAID là chữ viết tắt của Redundant Array of Independent Disks có ngĩa là sự tận dụng các phần dư trong các ổ cứng độc lập. Ban đầu, RAID được sử dụng như một giải pháp phòng hộ vì nó cho phép ghi dữ liệu lên nhiều đĩa cứng cùng lúc. RAID chính là sự kết hợp giữa các đĩa cứng vật lý bẳng cách sử dụng một trình điều khiển đặc biệt RAID có thể sử dụng như là một phần cứng lẫn phần mềm.
Hệ thống RAID được dùng trong việc đảm bảo an toàn dữ liệu khi có ổ đĩa bị lỗi và phục hồi lại các dữ liệu , có thể thay nóng ổ đĩa đối
với một số loại RAID và cũng còn tùy thuộc vào máy chủ. RAID ngày càng trở nên cần thiết cho các hệ thống máy tính
Vì RAID mang tính toàn vẹn dữ liệu cao , phục hồi nhanh chóng nên RAID chủ yếu được ứng dụng vào các máy máy chủ, không phải là các máy bàn không thể dùng Raid được mà là do chi phí đầu tư khá tốn kém nên chỉ ở các hệ thống lớn đòi hỏi độ an toàn cho dữ liệu phải cao mới sử dụng.
3.2.2 Lịch sử ra đời và phát triển Raid
Công nghệ Raid bắt nguồn từ những ý tưởng gom những dung lượng nhỏ còn trống ở nhiều ổ cứng để tạo một ổ cứng có dung lượng lớn hơn.Ngày 30-5-1978 Norman Ken Ouchi tại IBM đã nhận được giải thưởng bằng sáng chế với chủ đề “System for recovering data stored in failed memory unit” .Chủ đề này nói về cách hoạt động ghi song song,ánh xạ và ghép đôi mà ngày nay được ứng dụng trong các loại Raid.Sau nhiều năm nghiên cứu thì tại viện nghiên cứu Berkeley , David A Patterson , Garth A Gibson và Randy Katz đã đưa ra định nghĩa vể Raid và các ứng dụng của nó. Vào tháng 6/1988 , trong một hội nghị SIGMOD , RAID chính thức được công bố là từ viết tắt của “Redundant Arrays of inexpensive Disks” và cũng từ ngày này trở đi , khái niệm về RAID được xuất hiện
3.2.3 : Các chuẩn Raid
Các chuẩn RAID là các công nghệ lưu trữ , phân tách dữ liệu được sử dụng trong RAID
Các loại RAID hay còn gọi là cấp độ RAID là những chế độ RAID được ứng dụng dựa trên các công nghệ của những chuẩn RAID Các chuẩn RAID đang nghiên cứu và phát triển hiện nay :
3.2.3.1 : Striping (còn gọi là Song Hành) ,
là một trong những chuẩn RAID mang lại hiệu năng cao nhất , nó giúp ta tăng tốc độ truy cập lên tối đa bằng cách ghi song song dữ liệu lên các ổ đĩa này . Kỹ thuật này sẽ chia các tập tin dữ liệu ra và ghi đồng thời lên ổ đĩa cứng trong cùng một thời gian . Và khi đọc thì cũng đọc cùng lúc trên tất cả các ổ đĩa làm cho tốc độ đọc cao , mang lại hiệu suất cao.
Hình 3.2 : Sơ đồ hoạt động của chuẩn Striping
3.2.3.2 :Duplexing
Còn gọi là chuẩn Ghép Đôi . Đây là chuẩn mở rộng của ánh xạ . Dữ liệu cũng được ghi trên hai ổ cứng nhưng phải có hai bộ điều khiển RAID kết nối với hai đĩa cứng . Chi phí cho kĩ thuật này tốn kém hơn vì phải sử dụng hai bộ điều khiển và dung lượng lưu trữ thật sự chỉ bằng một nửa dung lượng của các ổ đĩa.
Hình 3.3 : Sơ đồ hoạt động của chuẩn Duplexing
3.2.3.3 chuẩn Parity RAID :
Đây là phương pháp bảo vệ an toàn cho dữ liệu , nó sử dụng các thông tin mang tính chẵn lẻ bằng cách lưu giữ một con số nhị phân 0 hoặc 1 cho biết tổng các bit trong gói tin là chẵn hay lẻ . Nếu dùng chuẩn này thì lợi ích lớn nhất của nó là không yêu cầu hệ thống RAID bớt đi một phần dung lượng để lưu trữ dữ liệu . Nhưng khuyết điểm của nó là phải yêu cầu hệ thống có một phần cứng thật mạnh
3.2.4 :Các loại Raid.
3.2.4.1 : RAID level 0
Sử dụng chuẩn gi song hành để ghi dữ liệu lên ổ đĩa.Vì thế tốc độ của chuẩn này thì nhanh và ít tốn kém vì chỉ dùng một thiết bị điều khiển Raid.Nhược điểm của nó là không bảo đảm an toàn dữ liệu.Khi một ổ cứng bị lỗi thì dữ liệu trên các ổ cứng còn lại sẽ không sử dụng được.Không thể thay nóng ổ cứng vì nếu mất một ổ cứng thì toàn bộ dữ liệu sẽ không sử dụng được.Raid 0 đòi hỏi ít nhất hai ổ đĩa và dung
lượng là tổng dung lượng Raid của các ổ đĩa.Ví dụ có hai ổ đĩa 80GB thì Raid 0 sẽ tạo thành một ổ đĩa 160GB.
Hình 3.4 : sơ đồ hoạt động của Raid level 0
3.2.4.2 : RAID level 1 :
Sử dụng chuẩn ánh xạ hay ghép đôi để ghi dữ liệu lên các ổ đĩa.Tốc độ truy xuất dữ liệu bình thường như đối với một ổ đĩa đơn.Ưu điểm của Raid 1 là tính an toàn dữ liệu cao,vì dữ liệu được sao chép và lưu trữ trên hai ổ đĩa khác nhau.Khi một ổ đĩa hỏng thì ổ đĩa thứ hai sẽ hoạt động và dữ liệu được đảm bảo an toàn.Có thể thay nóng một ổ cứng bị hỏng.Công nghệ này cũng đòi hỏi ít nhất hai ổ cứng,và dung lượng sau khi Raid 1 là một nửa tổng dung lượng Raid của các ổ đĩa.Ví dụ có hai ổ đĩa 80GB sau khi Raid 1 sẽ tạo thành 1 ổ đĩa 80GB và một ổ dự phòng.
Hình 3.5 : sơ đồ hoạt động của Raid 1
3.2.4.5 :RAID level 5 :
Đây là loại Raid phổ biến nhất hiện nay vì tốc độ nhanh và độ an toàn dữ liệu cao vì sử dụng kết hợp chuẩn ghi song hành và kiểm tra tính chẳn lẽ (parity) của dữ liệu để ghi lên ổ đĩa.
Quá trình ghi và kiểm tra chẵn lẻ là khá phức tạp nên có thể hình dung theo hai quy luật là Nếu tổng số bits nhiều nhất là số lẻ thì parity là bit 1 .Nếu tổng số bits nhiều nhất là số chẳn thì parity là bit 0.Theo ví dụ hình 3.6 bên dưới nếu dữ liệu ghi vào đĩa 1 và đĩa 2 lần lượt là 1-0.Tổng số bit là 1 nên parity sẽ là 1.Vậy dữ liệu ghi trên 3 đĩa lúc này là 1-0-1.Nếu đĩa 1 bị hư hỏng thì dữ liệu lúc này sẽ là -0-1 và dựa vào quy luật trên ta có thể suy ra dữ liệu trên ổ đĩa 1 là bit 1.Tương tự nếu ổ đĩa thứ hai bị hư thì dữ liệu sẽ là 1- -1 và dựa vào quy luật trên ta có thể suy ra bit trong ổ đĩa thứ hai là bit 0.
Ta có thể thấy dữ liệu có thể được lấy lại một cách nhanh chóng.Tuy nhiên để đầu tư cho phương pháp này thì khá tốn kém.Nó yêu cầu ít nhất ba ổ đĩa và dung lượng ổ đĩa tạo thành là tổng dung lượng Raid trừ đi một đĩa.
Hình 3.6 : Sơ đồ hoạt động của Raid 5
3.2.4.6 : RAID level 1+0
Đây cũng là phương pháp được dùng phổ biến hiện nay vì tính năng chạy nhanh hơn và độ an toàn cao do sử dụng kết hợp cả chuẩn song hành và chuẩn ánh xạ.Nó yêu cầu ít nhất 4 ổ cứng và chia thành 2 cặp.Mỗi cặp sẽ được cấu hình Raid 0 để tăng tốc đọc ghi dữ liệu .Và 2 ồ đĩa sau khi thực hiện Raid 0 sẽ được cấu hình Raid 1 với nhau đề đảm bảo an toàn dữ liệu.Điều này cho thấy là chi phí cho loại này cũng rất cao.Tổng dung lượng của ổ đĩa sau khi Raid 1-0 sẽ là một nửa tổng dung lượng Raid của các ổ cứng.