TỔNG QUAN VỀ MẠNG LƯU TRỮ
Vấn đề lưu trữ dữ liệu
1.1.1 Các vấn đề lưu trữ trong mạng máy tính.
Thế kỉ 20 đánh dấu sự phát triển vượt bậc của công nghệ thông tin trên mọi lĩnh vực của cuộc sống Cùng với đó là sự tăng lên của các dữ liệu cần được lưu trữ và bảo mật,nhất là khi các dịch vụ trực tuyến qua mạng ngày càng phát triển và nở rộ.Các nghành ngân hàng, tài chính, bảo hiểm, y học, bệnh viện, khách sạn,giáo dục…với số lượng khách hàng khổng lồ cần được lưu trữ và bảo mật Cùng với đó là những đặc thù nghành nghề nhất định mà yêu cầu về việc truy cập hay trao đổi thông tin một cách nhanh chóng và chính xác.
Khi xã hội càng phát triển kéo theo sự phát triển của các nghành nghề, số lượng thông tin tăng lên một cách đáng kể, trong khi yêu cầu về lưu trữ ko đổi Do vậy đòi hỏi có một mạng lưu trữ đáp ứng được những yêu cầu mới này Đó chính là mạng lưu trữ dữ liệu SAN(Storage area network).
1.1.2 Yêu cầu đối với mạng lưu trữ
Trước khi có mạng lưu trữ thì việc lưu trữ chỉ thực hiện trên các máy cục bộ, các thiết bị lưu trữ được thiết kế riêng biệt và chỉ sử dụng được cho các máy tính đó Để đáp ứng nhu cầu về chia sẻ dữ liệu mô hình hệ thống mở cho phép chia sẻ dữ liệu lưu trữ qua mạng Ethernet và TCP/IP Mô hình này dữ liệu được gắn trên các file thông tin Với mô hình này thì việc lưu trữ ko liên quan gì đến nền tảng hệ thống của máy trạm
Ưu điểm : Cho phép triển khai hệ thống nhanh chóng và đơn giản.chỉ cần có ổ đĩa cứng và cáp SCSI là có thể nhanh chóng thiết lập một hệ thống lưu trữ mà ko cần phải tính toán hay cấu hình gì Mô hình này thích hợp với những người dùng cá nhân mà dung lượng không quá lớn.
Nhược điểm : Nhược điểm lớn nhất của mô hình truyền thống này là khả năng mở rộng mạng kém, phân tán về mặt địa lí và lãng phí về tài nguyên. Ngoài ra một số nhược điểm khác sẽ được phân tích cụ thể ở phần mô hình DAS.
Dưới đây là mô hình lưu trữ truyền thống theo kiểu client/server:
Hình 1.1 Mô hình chia sẻ file dùng chung client/server
Những yêu cầu đối với mạng lưu trữ hiện nay :
Yêu cầu về tính khả dụng : được đặc trưng bởi băng thông và độ trễ Băng thông là tổng lưu lượng truyền trên một mạng, được tính bằng đơn vịMbits/s hay Mbytes/s Việc tính toán băng thông có ý nghĩa quan trọng trong việc lựa chọn các thiết bị cho mạng Độ trễ cũng là một tham số quan trọng trong việc đánh giá chất lượng của mạng.
Yêu cầu về độ tin cậy : là yêu cầu hàng đầu đối với việc lưu trữ Giúp đảm bảo tính khả thi của mạng trong vấn đề giải quyết độ trễ.
Yêu cầu toàn vẹn dữ liệu : Tức là đảm bảo cho việc dữ liệu ko bị sai lệch so với dữ liệu gốc Điều này có nghĩa là dữ liệu được ghi lên các phương tiện lưu trữ đúng theo thứ tự hay lệnh đã được đề cập đền từ trước của các ứng dụng Độ chắc chắn của dữ liệu là việc ghi dữ liệu hoàn thiện và chính xác lên các thiết bị lưu trữ.
Khả năng mở rộng và nhanh chóng : Mạng lưu trữ phải thích ứng được với sự thay đổi liên tục về nhu cầu đối với tài nguyên lưu trữ.
Đơn giản hóa hạ tầng mạng : Khả năng dễ dàng triển khai với chi phí duy trì tối thiểu Một hạ tầng mạng tốt cho phép giảm chi phí cũng như tận dụng được tài nguyên đã có.
Kết nối mềm dẻo và hỗ trợ môi trường không đồng nhất.
Đảm bảo bảo mật các giao dịch và việc truyền dữ liệu
Các kiến trúc lưu trữ dữ liệu
1.2.1 Kiến trúc lưu trữ lấy server làm trung tâm.
Trong mô hình mạng lưu trữ truyền thống thông thường các thiết bị lưu trữ chỉ kết nối đến một server Nhưng cũng có thể kết nối đồng thời đến hai server để tăng khả năng chịu lỗi khi gặp sự cố, nhung thực sự tại một thời điểm chỉ có một server giao tiếp với các thiết bị lưu trữ này Mô hình như sau:
Hình 1.2 Kiến trúc lưu trữ lấy server làm trung tâm
Nhược điểm của kiến trúc lưu trữ:
Khả năng truy xuất dữ liệu phụ thuộc vào trạng thái của server Khi server gặp sự cố thì dữ liệu trong các thiết bị liên quan đến nó không thể truy xuất được.
Khả năng mở rộng dung lượng phụ thuộc vào server.
Sử dụng tài nguyên không hiệu quả do các server khác nhau không thể chia sẻ dung lượng với nhau.
Quản lí khó khăn và không tập trung do các server cài đặt khác nhau và dữ liệu nằm rải rác trên các server
Hình 1.3 Lãng phí trong kiến trúc lưu trữ lấy server làm trung tâm
1.2.2 Kiến trúc lưu trữ lấy dữ liệu làm trung tâm.
Kiến trúc này còn gọi là kiến trúc lấy thiết bị lưu trữ làm trung tâm, được ra đời nhằm khắc phục những nhược điểm của kiến trúc lấy server làm trung tâm.
Hình 1.4 Kiến trúc lưu trữ lấy dữ liệu làm trung tâm(a) Ý tưởng của mô hình này dựa trên việc làm giảm bớt những điểm có thể gây nên hiểm họa cho hệ thống bằng cách thay thế kết nối bus từ thiết bị lưu trữ đến server bằng một mạng lưu trữ dữ liệu độc lập (kể từ sau server) Qua mô hình có thể thấy thiết bị lưu trữ hoàn toàn độc lập với các server và các server này có thể truy xuất đến các thiết bị lưu trữ mà không phải thông qua bất kì một server nào Khi nhu cầu lưu trữ và truy nhập tăng lên thì các thiết bị lưu trữ được chia thành phân hệ lưu trữ Tức là khi một không gian lưu trữ trống có thể cấp phát một cách linh hoạt cho các server khi nó có nhu cầu, đồng thời kiểu kiến trúc này cũng cho phép khắc phục sự cố mà không làm gián đoạn phục vụ Mô hình lấy dữ liệu làm trung tâm tổng quát như sau.
Hình 1.5 Kiến trúc lưu trữ lấy dữ liệu làm trung tâm(b)
Một trong những điểm quan trọng của kiến trúc này chính là việc hình thành các điểm đa truy nhập mạng lưu trữ và hệ thống Các điểm truy nhập này có thể được kết nối đến một port với địa chỉ duy nhất, ví dụ như : card mạng (NICs), bộ điều hợp chủ (HBAs) hay các điểm truy cập logic như điểm truy cập dịch vụ (SAPs), địa chỉ con hay địa chỉ mạng ảo Khi thiết kế theo mô hình này cần chú ý rằng phải tính toán đến tính ổn định, các cấu trúc dự phòng và một hệ thống lưu trữ nhiều cổng để dễ dàng kết nối đến nhiều server khác nhau cùng lúc.
Các loại hình mạng lưu trữ hiện nay
DAS là khái niệm được đưa ra để chỉ mô hình lưu trữ kiểu máy trạm/máy chủ, trong đó các máy trạm chia sẻ các file dùng chung trên một máy chủ lưu trữ. Các máy chủ này sử dụng nhiều ổ đĩa cứng để lưu trữ dữ liệu và có nhiều cách để tổ chức các ổ đĩa này phụ thuộc vào đường bus kết nối và bộ điều khiển vào ra DAS sử dụng kiểu kết nối tuần tự và mỗi thực thể kết nối vào đường bus chỉ có địa chỉ duy nhất.
Hình 1.6 Kết nối các đĩa cứng với đường bus theo kiểu daisy chain
Nhược điểm của mạng DAS:
Mức độ sẵn sàng của dữ liệu phụ thuộc vào hệ thống máy chủ Mô hình cho thấy tất cả các thiết bị trên đường bus đều phụ thuộc vào một bộ điều khiển vào ra, nếu hệ thống có lỗi thì tất cả các thiết bị trên đường bus đều không thể truy cập Đồng thời mô hình cũng có khả năng gây hiện tượng nút cổ chai khi lượng truy nhập quá lớn.
Cấu hình của DAS là tĩnh do cấu trúc đường bus sẽ gây khó khăn trong việc mở rộng dung lượng tránh tắc nghẽn đường bus.
Hạn chế về độ dài đường bus.
Hạn chế khả năng sử dụng tài nguyên nhớ do các máy chủ không thể chia sẻ dữ liệu với nhau.
Không có tính mở rộng do không gian quản lí nhỏ Khi số lượng thực thể trong DAS càng lớn thì việc phân quyền đường bus là khó khăn trong chuẩn SCSI.
Nhìn chung DAS chỉ thích hợp với mạng có yêu cầu nhỏ, mang tính chất cá nhân.Ngày nay khi yêu cầu về dữ liệu càng lớn và mức độ sẵn sàng của dữ liệu, số lượng thiết bị và khả năng dự phòng của dữ liệu thì DAS không thể đáp ứng được.
NAS chính là triển khai của mô hình máy trạm/máy chủ bằng cách tách riêng máy chủ chạy các ứng dụng khỏi kho lưu trữ Đặt kho lưu trữ trên một máy tính và đơn giản hóa nó đến mức tối đa có thể Có thể thấy NAS là một máy tính chuyên biệt phục vụ cho việc truy nhập dữ liệu theo kiểu máy trạm/máy chủ.NAS có thể coi là giải pháp về phần cứng và phần mềm nhằm tối ưu hóa cho việc chia sẻ dữ liệu. Phần cứng bao gồm máy chủ, card mạng, thiết bị lưu trữ Phần mềm bao gồm hệ thống file, hệ điều hành, bộ điều khiển. Ưu điểm lớn nhất của NAS là khả năng plug&play (cắm là chạy) tức là cho phép gắn thiết bị NAS vào mạng sẵn có và tự động hoạt động luôn không cần mất nhiều thời gian cấu hình và cài đặt Xem xét cấu trúc phần cứng và phần mềm của NAS
Hình 1.7 Cấu trúc phần cứng của một thiết bị NAS
Cấu trúc này bao gồm ba phần quan trọng là máy chủ, phần lưu trữ, phần mạng
Hình 1.8 Cấu trúc phần mềm của thiết bị NAS
Phần mềm hệ điều hành của NAS dụa trên nhân UNIX và được tối ưu hóa cho truy nhập vào ra Hệ điều hành có nhiệm vụ quản lí bộ nhớ, tài nguyên phần cứng và bộ nhớ đệm Hệ thống file của NAS sử dụng chuẩn CIFs và NFS.
• Vị trí của NAS trong mạng lưu trữ
NAS trong mạng LAN được sử dụng như một hệ thống máy chủ file có dung lượng lưu trữ tăng nhanh Các máy client sử dụng dịch vụ của máy chủ ứng dụng, máy chủ ứng dụng truy vấn dữ liệu trong NAS, khi nhu cầu lưu trữ dữ liệu tăng, có thể bổ sung đĩa cứng vào NAS, hoặc thêm thiết bị NAS mới vào mạng.
Hình 1.9 NAS trong mạng LAN
Trong mạng internet NAS đươc sử dụng như một giải pháp có tính mở do kết hợp nhiều máy chủ thành một thiết bị NAS, đồng thời đó là giải pháp cho việc truy cập file lưu trữ qua môi trường web bằng http
Hình 1.10 NAS sử dụng qua internet
Ngoài ra trong mạng doanh nghiệp NAS có thể hỗ trợ việc lưu trữ dữ liệu với dung lượng lớn nhằm mục đích giảm các giao tác của người dùng trong xử lí vào ra NAS được coi là giải pháp tốt cho các doanh nghiệp vừa và nhỏ có nhu cầu sử dụng dữ liệu không lớn và mô hình tổ chức đơn giản Đồng thời NAS tận dụng cơ sở hạ tầng mạng LAN và nền mạng IP sẵn có nên chi phí lắp đặt mạng giảm và dễ dàng hỗ trợ các truy cập từ xa qua internet Tuy nhiên NAS không phù hợp với các dịch vụ mạng đòi hỏi hiệu năng cao về tốc độ vào ra dữ liệu, do hoạt động trên nền IP nên tính bảo mật của NAS không cao.
SAN là một mạng lưu trữ tốc độ cao được thiết kế để kết nối các thiết bị lưu trữ với máy chủ Ý tưởng trong mô hình mạng SAN là sử dụng tập trung các máy chủ và các thiết bị lưu trữ vào một mạng trung tâm, các máy chủ và máy trạm cũng có thể độc lập truy nhập tới thiết bị lưu trữ qua mạng Cách thức của việc truy nhập dữ liệu là theo khối (block), không theo file, do đó việc truy nhập dữ liệu như trong mô hình DAS, chỉ khác là thiết bị lưu trữ không gắn trực tiếp vào máy chủ, mà qua một mạng tốc độ cao.
Hình 1.11 Mô hình mạng lưu trữ đơn giản sử dụng SAN
Sự phát triển của SAN được khởi đầu bằng sự ra đời của chuẩn kết nối Fibre Channel (FC) Chuẩn kết nối này cho phép kết nối các thiết vị ngoại vi, các hệ lưu trữ lớn, máy tính lớn và các thiết bị ngoại vi khác với tốc độ cao hơn rất nhiều môi trường truyền dẫn của mạng thông thường Băng thông hỗ trợ của chuẩn này từ 1 Gbps đến 4 Gbps Chuẩn kết nối này cho phép các thiết bị lưu trữ có thể kết nối với máy chủ ứng dụng để xử lý các yêu cầu truy nhập vào ra dữ liệu với số lượng lớn.
Trong thời kì đầu được ứng dụng, các thiết bị lưu trữ kết nối với nhau bằng chuẩn FC theo vòng ring, đấu nối vào Hub FC Với ưu điểm tốc độ cao và băng thông lớn, các thiết bị lưu trữ không gặp nhiều khó khăn trong vấn đề phân xử sử dụng đường truyền Tuy nhiên mô hình kết nối này sẽ khiến việc mở rộng mạng lưu trữ bị hạn chế do việc kết nối thiết bị mới vào sẽ ảnh hưởng đến cả mạng Thêm nữa, khi số lượng thiết bị lưu trữ trên vòng ring càng nhiều, hiệu quả truyền dẫn càng bị thu hẹp.
Hình 1.12 Mô hình SAN với topo vòng ring Để khắc phục những nhược điểm trên, mạng SAN được tổ chức theo mô hình kết nối chuyển mạch lưới Các thiết bị được kết nối thông qua bộ chuyển mạch(switch) Với cấu tạo mạch đan lưới dạng ma trận bên trong switch, bất cứ thiết bị nào cũng có thể được coi là kết nối trực tiếp với nhau khi tham gia SAN và tất cả đều tận dụng được toàn bộ đường truyền mà không phải chia sẻ Với mô hình kết nối như thế này, việc bổ sung thêm thiết bị mới vào mạng hoàn toàn không ảnh hưởng đến hoạt động của các thiết bị khác.
Hình 1.13 Mô hình SAN dùng FC switch
Nhìn nhận một cách sơ lược, mạng SAN có nhiều thành phần khác nhau, cơ bản nhất là bộ chuyển mạch FC switch cho phép kết nối giữa các thiết bị một cách tối ưu Để kết nối theo chuẩn FC, các thiết bị cần có bộ điều khiển kết nối theo chuẩn FC, tương tự như card mạng, thường gọi là FC Host Bus Adapter (HBA).
Với việc kết nối các máy chủ và thiết bị lưu trữ với nhau một cách tập trung cho phép triển khai ứng dụng đồng thời trên nhiều máy chủ cùng lúc, dùng chung một bộ cơ sở dữ liệu trên nhiều thiết bị lưu trữ Đây chính là điểm mấu chốt để hệ thống SAN có thể đáp ứng một số lượng lớn người dùng sử dụng ứng dụng và truy cập cơ sở dữ liệu Ngoài ra, hệ thống có tính mở rộng và sẵn sàng cao do có thể can thiệp riêng rẽ trên từng thiết bị mà không làm ảnh hưởng hoạt động của toàn hệ thống.
TỔ CHỨC PHẦN CỨNG CỦA MẠNG SAN
Tổ chức phần cứng
Ba thành phần cơ bản của mạng lưu trữ được mô hình hóa đơn giản như sau :
Hìn 2.1 Thành phần cơ bản của mạng lưu trữ
Các server phục vụ các yêu cầu liên quan đến lưu trữ dữ liệu từ người dùng, chúng có thể được triển khai trên các nền tảng khác nhau như Windows, UNIX, Linux Các server được kết nối vào mạng lưu trữ bằng các bộ điều hợp chủ HBA (host bus adapter) Server bao gồm những thành phần sau : Vi xử lí, bộ nhớ, bus bộ nhớ, bus vào/ra(I/O), giao diện kết nối mạng
Hệ thống lưu trữ là một ứng dụng ở mức độ thấp hơn với các câu lệnh chuyên dụng và các protocols cho các hoạt động tương tác với hệ thống hay thiết bị.
Hệ thống lưu trữ triển khai rất nhiều loại công nghệ như : quản lí bộ đĩa trên máy chủ (host-based volume managers) và quản lí ổ đĩa (disk managers), quản lí hệ thống lưu trữ, HBAs (host bus adapters), ảo hóa mạng lưu trữ (virtualization).
Hệ thống lưu trữ có khả năng lưu dữ liệu ổn định, không bị mất dữ liệu khi cắt điện(nonvolatile), độ tin cậy cao Hệ thống lưu trữ bao gồm cả các thành phần vật lý và thành phần logic Thành phần vật lý là các phương tiện phục vụ lưu trữ dữ liệu như : các ổ đĩa cứng, băng từ, các cổng kết nối, nguồn điện Thành phần logic có nhiệm vụ quản lí và điều khiển quá trình ghi, đọc dữ liệu từ các phương tiện lưu trữ
Hình 2.2 Cấu trúc của hệ thống lưu trữ
Cấu trúc trên được phân chia theo chức năng với những thành phần như :
Bộ điều khiển phần cứng và logic (Controller hardware and logic) : thực hiện phần lớn các chức năng lưu trữ của hệ thống Nó xử lý các câu lệnh lưu trữ nhận từ hệ thống máy chủ (host systems) cũng như của các ứng dụng lưu trữ dựa trên hệ thống lưu trữ (subsystems).
Cổng mở rộng : thường là các cổng được nối với các máy chủ.
Bộ nhớ: được sử dụng như là một bộ nhớ đệm.
Công nghệ liên kết trong (bao gồm bus hoặc công nghệ mạng) : được sử dụng để nối các cổng mạng với bộ điều khiển và bộ nhớ, công nghệ sử dụng để kết nối các thiết bị lưu trữ trong mạng.
Thiết bị lưu trữ : nơi lưu trữ dữ liệu thật sự.
Các server kết nối đến các cổng kết nối của hệ thống lưu trữ bằng các kỹ thuật vào ra chuẩn như SCSI, Fibre Channel, iSCSI và có thể sử dụng dung lượng lưu trữ mà hệ thống lưu trữ cung cấp Server hoàn toàn không biết đến cấu trúc vật lý bên trong của hệ thống lưu trữ mà chỉ biết những ổ đĩa logic mà hệ thống lưu trữ cung cấp.
Mục đích lớn nhất của hệ thống lưu trữ đó chính là đảm bảo dữ liệu được liên tục, bằng việc đảm bảo tính sẵn sàng (availability), độ tin cậy (reliability), thời gian timeout, đảm bảo băng thông, tính khả dụng (performance) để thực hiện những điều này ta phải sử dụng các ứng dụng cho dự phòng dữ liệu Các giải pháp tạo dư thừa dựa trên cấu trúc của mạng lưu trữ, có thể thực hiện trên toàn bộ mạng lưu trữ: tại server có thể sử dụng các thiết bị kết nối nhiều port hoặc có thể sử dụng nhiều thiết bị kết nối (HBAs) Các giải pháp dự phòng cho kết nối mạng đó là các biện pháp sử dụng đa đường Trong hệ thống lưu trữ có một bộ điều khiển giữa các cổng kết nối và các ổ đĩa Bộ điều khiển có thể cải thiện đáng kể độ sẵn sàng của dữ liệu và hiệu suất truy xuất dữ liệu bằng kỹ thuật RAID Ngoài ra, bộ điều khiển còn có thể cung cấp các dịch vụ khác như: sao chép tức thời, sao chép từ xa… Bộ điều khiển sử dụng cache dữ liệu để tăng tốc ghi, đọc dữ liệu.
Các hệ thống lưu trữ có một ưu điểm là không gian lưu trữ của hệ thống có thể kết nối một cách linh hoạt với các server một cách trực tiếp hoặc thông qua mạng lưu trữ.
Hệ thống kết nối có nhiệm vụ chính là đảm bảo sự truyền dữ liệu từ server đến thiết bị lưu trữ và ngược lại Và để đảm bảo hoạt động của mạng, hệ thống kết nối còn có nhiệm vụ quản lý, vận hành và bảo dưỡng mạng Có hai công nghệ kết nối được sử dụng trong lưu trữ đó là bus SCSI hoặc ATA cho DAS và Fibre Channel được sử dụng trong SAN.
Hiện nay, hệ thống mạng của mạng lưu trữ chủ yếu được xây dựng theo chồng giao thức Fibre Channel Ngoài ra, một số giao thức khác cũng được phát triển nhằm triển khai mạng lưu trữ trên nền IP như FCIP, iFCP, iSCSI Đặc điểm chung của tất cả các giao thức này là đều khai thác giao thức SCSI (là giao diện thiết bị ngoại vi được sử dụng phổ biến trong các server hiện nay) Tức là các giao thức này được dùng để mang các lệnh và dữ liệu SCSI giữa server và thiết bị lưu trữ qua mạng lưu trữ giống như khi chúng được truyền trên cáp SCSI.
FC lower layer FCP: FC-4
Hình 2.3 Các chồng giao thức sử dụng trong hệ thống mạng
Fibre Channel được dùng để xây dựng các mạng lưu trữ trong một khu vực địa lý nhất định (như một tòa nhà, một trường học ), các mạng này được gọi là FibreChannel SAN Khi kết nối các Fibre Channel SAN với nhau, ngoài việc sử dụng chính giao thức Fibre Channel, còn có thể sử dụng các giao thức FCIP, iFCP là những giao thức dành cho mạng IP để tận dụng những ưu thế như giá thành, cự ly, Lúc này ta gọi đó là IP SAN Riêng đối với iSCSI thì khác, giao thức này được phát triển nhằm xây dựng một mạng IP SAN thuần túy, hoàn toàn không có sự tham gia của Fibre Channel.
Công nghệ phần cứng
2.2.1 Các chuẩn giao tiếp với ổ cứng
Trong môi trường mạng lưu trữ, chúng ta chỉ quan tâm đến một số chuẩn giao tiếp ổ cứng phổ biến sau :
Chuẩn giao tiếp IDE (Integrated Drive Electronics) hay còn được gọi với tên khác là ATA (AT Attachment) là chuẩn phổ biến nhất của ổ cứng ngày nay Nó được sử dụng bởi hầu hết các máy tính cá nhân Một số đặc điểm của loại giao tiếp này như sau :
Chia sẻ kênh giữa ổ chính và ổ phụ: chuẩn giao tiếp IDE chỉ có thể đáp ứng một yêu cầu với thiết bị tại một thời điểm Như vậy nếu dùng hai thiết bị chung cho một kênh IDE thì hai thiết bị phải chia sẻ hiệu năng sử dụng của kênh.
Tốc độ vào ra tối đa của chuẩn giao tiếp này với ổ cứng là 100MB/s. SCSI
Chuẩn giao tiếp SCSI (Small Computer System Interface) là chuẩn phổ biến thứ hai của ổ cứng hiện nay Chuẩn SCSI hoạt động ở mức cao hơn so với IDE, do đó có các cơ chế thông minh hơn SCSI cho phép truyền dữ liệu vào ra với tốc độ
320 MB/s Hỗ trợ 16 thiết bị cùng hoạt động trong phạm vi 12m độ dài cáp Cáp SCSI chỉ hỗ trợ kết nối ở độ dài tối đa 25m và các thiết bị kết nối bằng SCSI chỉ ở dạng nối tiếp.
Chuẩn giao tiếp SATA dựa trên giao tiếp cũ ATA nhưng thay vì truyền 16 bit dữ liệu song song thì SATA truyền nối tiếp Mặc dù truyền nối tiếp nhưng SATA đạt tốc độ truyền nhanh hơn rất nhiều vì loại bỏ được các vấn đề nhiễu tín hiệu do truyền song song Hiện nay, công nghệ SATA đã đạt đến tốc độ truyền 3Gb/s (SATA 300) tuy nhiên độ dài cáp nối bị hạn chế rất nhiều, tối đa là 1m
2.2.2 Cơ chế dư thừa dữ liệu.
Dư thừa dữ liệu là nguyên tắc đầu tiên hỗ trợ việc bảo vệ dữ liệu và đảm bảo tính sẵn sàng, nâng cao độ tin cậy và đảm bảo tính khả dụng Nếu không có các biện pháp dự phòng thì không thể khôi phục được từ lỗi nhỏ nhất đến lỗi ở các thiết bị lưu trữ Chỉ cần một lỗi thiết bị rất nhỏ có thể gây ra thảm họa rất lớn, tuy nhiên lỗi là điều không thể tránh khỏi Do vậy dư thừa là để cho tai họa lớn không xảy ra trong phạm vi rộng.
Các mối đe dọa đến dữ liệu thường thấy:
Mất dữ liệu : dữ liệu có thể bị xóa, ghi đè, thiết bị lưu trữ bị lỗi hoặc bị phá hủy.
Khóa truy nhập : Dữ liệu không bị xâm hại nhưng vì lí do nào đó mà không thể truy nhập được.
Mất tính toàn vẹn dữ liệu : Dữ liệu không bị mất, có thể truy nhập được nhưng không còn chính xác nữa.
Các biện pháp dư thừa chủ yếu như : RAID, soi gương hay cơ chế đa đường sẽ được làm rõ ở phần sau
2.2.3 Kĩ thuật tổ chức dãy ổ cứng RAID
RAID (Redundant Array of Inexpensive Disk) là kĩ thuật kết nối các ổ đĩa riêng biệt thành một dãy với mục đích tăng tốc độ đọc ghi, tăng dung lượng nhớ của hệ thống và có khả năng khôi phục dữ liệu khi xảy ra lỗi ổ đĩa Các ổ đĩa được quản lý bằng một bộ điều khiển, việc quản lý bộ nhớ được thực hiện theo stripe (là một hoặc nhiều block của mỗi ổ đĩa ghép lại) Để thực hiện được cấu hình RAID trên các ổ đĩa cần đến bộ điều khiển RAID (RAID controller), hoặc điều khiển bằng phần mềm nhưng tốc độ chậm hơn Bộ điều khiển RAID nhóm nhiều ổ đĩa vật lí lại với nhau tạo ra các ổ đĩa logic, máy chủ kết nối đến hệ thống RAID chỉ thấy rõ các ổ đĩa logic này và phân phối dữ liệu lên ổ đĩa tương ứng mà máy chủ muốn Các thủ tục ghi lên ổ đĩa vật lí tùy theo chuẩn ma RAID sử dụng và được che dấu hoàn toàn đối với server, đặc điểm chung của các tiêu chuẩn RAID là lưu các thông tin dư thừa Nếu một ổ đĩa bị hỏng thì có thể khôi phục dữ liệu từ các ổ đĩa còn lại hoặc có thể thay ổ đĩa hỏng trong khi hệ thống vẫn hoạt động và được che dấu hoàn toàn đối với máy chủ Do đó máy chủ vẫn hoạt động mà không làm gián đoạn đến việc truy xuất ổ đĩa logic.
Hình 2.4 Duy trì phục vụ bằng ổ đĩa dự phòng
(1)Khi hoạt động bình thường, ổ đĩa dự phòng không được sử dụng ; (2)Một ổ đĩa bị hỏng ; (3)Dữ liệu được khôi phục từ các ổ đĩa còn lại và ghi vào ổ đĩa dự phòng ;(4)Ổ đĩa hỏng được thay bằng ổ đĩa mới, ổ đĩa này trở thành ổ đĩa dự phòng
RAID 0 : việc đọc/ghi dữ liệu tiến hành đồng thời trên tất cả các ổ đĩa thông qua stripe Thông tin phân mảnh đều trên mỗi đĩa, không có khả năng phục hồi khi bị mất dữ liệu Mục đích duy nhất của RAID 0 là tăng tốc đọc/ghi dữ liệu Dung lượng tổng của dãy đĩa bằng tổng dung lượng của tất cả các đĩa, hệ số sử dụng dung lượng nhớ là 100% Giá thành của cấu hình RAID này là rẻ nhất trong các cấu hình RAID Cấu hình này phù hợp với loại dữ liệu không quan trọng (ít thay đổi và được sao lưu thường xuyên), yêu cầu tốc độ đọc ghi cao Các ứng dụng thích hợp như truyền dòng âm thanh và hình ảnh, máy chủ Web, thiết kế đồ họa, làm bộ nhớ đệm cho các hệ thống máy tính lớn.
RAID 1 : Cấu hình RAID này hay còn gọi là cấu hình tạo ảnh, tức là để sử dụng cấu hình này, ta phải có tối thiểu 2 ổ cứng, một ổ cứng chính, còn ổ cứng kia là ảnh của ổ cứng chính, tức là nó giống y hệt ổ chính Như vậy, nếu ta có 4 ổ cứng4GB như trên hình thì ta chỉ có thể sử dụng được tất cả là 8GB, trong khi dung lượng thực tế của 4 ổ là 16GB Vì nó cần một ổ để sao chụp nội dung sang nên ta phải chọn các ổ theo cặp, có dung lượng như nhau Mặt khác, do cứ một ổ chính ta cần một ổ ảnh cho nên có lẽ đây là cấu hình RAID có khả năng chịu lỗi có chi phí đắt nhất
Phương pháp này cho phép đảm bảo dữ liệu khi chẳng may có một ổ nào đó bị hỏng RAID 1 thực hiện tái tạo lại dữ liệu như sau :
Khi có một ổ cứng bị hỏng, dữ liệu được lấy lại từ một ổ lưu ảnh của ổ đó
Điều này cho phép thiết bị có thể phục hồi lại dữ liệu miễn là còn một ổ trong một cặp vẫn chưa bị lỗi.
Kĩ thuật này cho phép dự phòng khi có lỗi, tuy nhiên tốn bộ nhớ cho dự phòng Hệ số sử dụng dung lượng nhớ chỉ là 50%.Loại RAID này thích hợp với các loại dữ liệu quan trọng, yêu cầu độ sẵn sàng cao như dữ liệu tài chính, kế toán, thường dùng cho các hệ thống nhỏ.
RAID 2 : đây là loại cấu hình duy nhất không sử dụng các chuẩn striping, mirroring hay parity RAID 2 chia dữ liệu ở mức bit và ghi đều lên các đĩa, đĩa dự phòng chứa các bit chữa lỗi (parity), các bit này được tính dựa trên các bit thông tin dữ liệu qua mã Hamming Hệ số sử dụng dung lượng nhớ khoảng 71% đến 82%.
Hiện nay RAID 2 gần như không được sử dụng vì yêu cầu loại cạc điều khiển chuyên biệt, giá thành cao.
RAID 3&4 : 2 loại RAID này tương tự nhau, phân phối dữ liệu trên nhiều đĩa khác nhau sử dụng một số byte nhất định, dành riêng một đĩa cho mã chữa lỗi.
RAID 5 : đây là kĩ thuật RAID khá phổ biến, dữ liệu được ghi lên tất cả các ổ đĩa, các mã parity cũng được ghi vào tất cả các ổ đĩa, kĩ thuật này vẫn đảm bảo khả năng khôi phục dữ liệu nhưng tăng tốc độ đọc/ghi Để sử dụng RAID 5 cần ít nhất 3 đĩa cứng Hệ số sử dụng dung lượng nhớ là (số đĩa -1)/số đĩa
RAID 6 : đây có thể coi là sự mở rộng của RAID 5, vì dữ liệu và mã chữa lỗi vẫn được phân phối đều trên các đĩa, nhưng RAID 6 tạo ra 2 mã chữa lỗi cho mỗi một tập dữ liệu được phân phối, nhờ đó tăng khả năng chịu lỗi của RAID 6 Kĩ thuật này làm cho tốc độ ghi chậm hơn RAID 5 nhưng khả năng đọc ngẫu nhiên cao hơn vì số lượng đĩa nhiều hơn.
Kết nối dư thừa và cơ chế đa đường
Soi gương là cơ chế tạo dư thừa nhằm đảm bảo dữ liệu được sao chép và phục hồi khi lỗi xảy ra Soi gương tạo một bản sao giống hệt bản chính tại bất kể nơi nào dọc theo đường kết nối vào/ra giữa một ứng dụng và đích lưu trữ Soi gương có thể chạy trên các host dựa trên phần mềm quản lí dung lượng, phần mềm vận hành thiết bị, HBAs, các thiết bị chuyển mạch và các hệ thống lưu trữ Các kiểu soi gương thường gặp :
Soi gương trên phần mềm của hệ thống máy chủ Soi gương dữ liệu được xem như một nét đặc trưng cơ bản của hệ điều hành quản lí dung lượng hay phần mềm vận hành thiết bị Ưu điểm của kiểu soi gương này là không có những điểm đơn (điểm dễ dàng bị phá hủy) được thể hiện như sau :
Hình 2.10 Soi gương trên phần mềm hệ thống máy chủ Đối với phương pháp dự phòng không có điểm đơn trên kết nối vào/ra thì khi một HBA bị lỗi, kết nối đó sẽ bị đứt và kết nối còn lại sẽ thực hiện nhiệm vụ còn lại của nó Khi đó việc trao đổi dữ liệu sẽ thực hiện thông qua một đường và một đích.
Soi gương trong bộ điều khiển lưu trữ của hệ thống máy chủ Các bộ điều khiển với nhiều cổng tạo nên nhiều đường trên kết nối vào/ra giữa nguồn và đích.
Do đó cả hai cặp đích được sao chép với nhau đều được kết nối đến các cổng trên HBA với các đường riêng biệt và kh một trong hai đường bị lỗi thì giải pháp thay thế sẽ được thực hiện
Hình 2.11 Soi gương với HBA hai cổng
Soi gương trong các thiết bị mạng và switch Các chức năng soi gương có thể được cung cấp bởi các phần cứng và phần mềm bên trong các thiết bị mạng Soi gương là nguyên tắc cơ bản cho việc phát triển các dịch vụ online hoặc cho các ứng dụng thời gian thực và cần được phân biệt với đa đường và sao chép từ xa.
2.3.2 Cơ chế đa đường. Đa đường là một phần nhỏ trong kết nối vào/ra theo công nghệ SCSI Nhờ cơ chế này tạo ra nhiều kết nối giữa các thiết bị nguồn và đích, do đó khi một kết nối bị hỏng có thể thay bằng kết nối khác Tuy nhiên khi có nhiêu kết nối cũng gây khó khăn cho việc định tuyến.
Hình 2.12 Cơ chế đa đường
Các phần mềm đa đường giám sát chức năng khởi tạo lưu trữ của máy chủ nơi phát ra các lệnh vào/ra và xác định các lỗi trong quá trình trao đổi giữa máy chủ và hệ thống lưu trữ Nếu có một lỗi xảy ra thì phần mềm đa đường sẽ thay đổi cổng khởi tạo đang được sử dụng trên host bằng một cổng khác Giải pháp được sử dụng là dùng HBA nhiều cổng như vậy khi một cổng bị lỗi thì có thể chuyển sang cổng khác trên cùng một HBA Giải pháp này thuận lợi về mặt thiết bị chỉ cần thay đổi về phân mềm Tuy nhiên khi cơ chế dự phòng bị lỗi thì không thể thực hiện được. Phần mềm đa đường chạy trong không gian kernel tức là chạy trong chế độ thực đòi hỏi nhanh và không có lỗi Nó không làm thay đổi dữ liệu và không gian lưu trữ mà nhiệm vụ của nó là xác định đường cho dữ liệu từ nguồn tới đích Các phần mềm đa đường hoạt động tại nhiều vị trí khác nhau như :
Trong chương trình quản lí bộ đĩa (hình b)
Giữa chương trình quản lí bộ đĩa và trình điều khiển thiết bị của hệ thống đĩa khi đó phần mềm đa đường đóng vai trò là trình điều khiển thiết bị ảo (hình a)
Trong trình điều khiển của hệ thống đĩa.
Trong trình điều khiển của thiết bị điều hợp.
Hình 2.13 Vị trí của phần mềm đa đường
Các phần mềm xử lý đa tuyến hiện nay được phân loại theo chế độ hoạt động ở đó các kết nối vào ra dư thừa được sử dụng Có hai chế độ hoạt động là tích cực/thụ động và tích cực/tích cực Sử dụng cách phân tích theo stack có thể thấy rõ vị trí của phần mềm đa đường nằm giữa driver các câu lệnh SCSI và các kết nối vật lý ở mức thấp hơn.
Hình 2.14 Phần mềm đa đường trong cấu trúc stack
Trong công nghệ đa đường khi thay đổi đường kết nối được gọi là failover bao gồm các bước :
Xác định các liên kết lỗi : lỗi được xác định sau một khoảng thời gian timeout.
Chuẩn bị cho tiến trình failover : Những hoạt động cần thiết được thực hiện định kì để duy trì hoạt động của các liên kết thụ động.
Khởi tạo kết nối mới : Phải dò tìm trạng thái treo của đường kết nối vào/ra. Nếu sau timeout không tìm thấy thi các hoạt động sẽ chuyển sang liên kết mới.
Hồi phục lại các cấu hình : Để đảm bảo cân bằng giữa các quá trình vào/ra trong mạng lưu trữ Sửa và phục hồi lỗi trên đường truyền cũ.
Cập nhật tất cả các đường truyền và thay đổi cấu hình các liên kết và các lỗi xảy ra trên switch.
2.3.3 Cơ chế che dấu LUN
Che dấu LUN là một quá trình chứng thực cho phép một LUN tồn tại đối với một số server này và không tồn tại đối với một số server khác Hệ thống lưu trữ cung cấp dung lượng lưu trữ cho server bằng cách cho phép server truy xuất đến một số ổ đĩa vật lý trong hệ thống hoặc một ổ đĩa logic do bộ điều khiển RAID tạo ra Dựa trên giao thức SCSI, mỗi một ổ đĩa (vật lý hay logic) mà từ bên ngoài hệ thống có thể thấy được đều được gọi là một đơn vị logic hay LUN (Logical Unit Number).
Khi không thực hiện che dấu LUN, mọi server đều thấy tất cả các ổ đĩa của hệ thống lưu trữ Trong trường hợp này, các server phải được cấu hình rất cẩn thận bởi nếu không rất có thể một server sẽ có những thao tác làm sai thậm chí là hủy dữ liệu trong LUN dành cho server khác Bằng cách thực hiện che dấu LUN, mỗi server chỉ thấy những ổ đĩa mà nó được hệ thống cung cấp Đặc điểm này hạn chế khả năng gây lỗi của một server đến dữ liệu trong LUN của một server khác
Che dấu LUN có thể thực hiện theo cổng kết nối (port-based) hoặc theo server (server-based) kết nối đến hệ thống lưu trữ Che dấu LUN theo cổng kết nối có nghĩa là các ổ đĩa gán cố định với cổng kết nối tương ứng, bất kỳ một server nào kết nối đến cổng này đều thấy các ổ đĩa thuộc cổng này Đối với che dấu LUN theo server thì mỗi server sẽ chỉ thấy các ổ đĩa mà hệ thống lưu trữ cấp cho nó cho dù server nối với cổng nào đi nữa Do đó cách này đạt được sự linh hoạt cao hơn.
TỔ CHỨC PHẦN MỀM CỦA MẠNG SAN
Các giao thức sử dụng trong mạng SAN
3.1.1 Chồng giao thức FC(Fibre Channel)
Ngày nay, nhu cầu truy cập dữ liệu tốc độ cao ngày càng tăng, các ứng dụng đa phương tiện với dung lượng dữ liệu lớn, các máy tính hiệu năng cao cần tốc độ truy cập dữ liệu lớn, tương thích với khả năng xử lý thông tin Đã có rất nhiều công nghệ đi sâu vào phát triển kỹ thuật kết nối hệ thống, mục đích cuối cùng là tạo ra các kết nối dữ liệu cực nhanh và FC là một trong những chuẩn kết nối đó.
Mục đích của FC là phát triển các phương tiện thực tế, giá thành thấp nhưng vẫn sử dụng được, đồng thời cho phép truyền tải một cách nhanh chóng dữ liệu giữa các máy trạm, máy chủ, các thiết bị lưu trữ, các thiết bị hiển thị và các thiết bị ngoại vi khác FC là tên gọi phổ biến của một bộ tích hợp các chuẩn được phát triển bởi ANSI.
Có hai kiểu truyền thông dữ liệu cơ bản giữa các bộ vi xử lý và thiết bị ngoại vi : các kênh (channel) và các mạng (network) Một kênh cung cấp một kết nối điểm-điểm trực tiếp hoặc chuyển mạch giữa các thiết bị truyền thông Kênh thường chủ yếu là phần cứng và truyền dữ liệu ở tốc độ cao với thời gian xử lý ban đầu thấp Ngược lại, kiểu truyền thông mạng là sự tập hợp các nút phân tán (như các máy trạm, máy chủ, hoặc các thiết bị ngoại vi) cùng với giao thức riêng của nó để hỗ trợ sự tương tác giữa các nút Một kết nối mạng thường có thời gian xử lý ban đầu tương đối cao bởi nó chủ yếu là phần mềm, do đó mà nó chậm hơn so với kiểu kênh Kết nối mạng có thể xử lý một lượng lớn công việc hơn so với kênh bởi chúng hoạt động trong một môi trường các kết nối không dự đoán trước, trong khi kênh hoạt động giữa một vài thiết bị với các địa chỉ xác định trước FC cố gắng kết hợp những điểm tốt nhất của hai phương pháp truyền thông này vào một giao diện I/
O mới mà có khả năng đáp ứng yêu cầu của người dùng kênh và người dùng mạng.
Kiến trúc của FC không mô tả một kênh hay là một mô hình mạng thật sự.
Nó cho phép một lược đồ kết nối thông minh chủ động gọi là lưới kết nối (fabric) tới các thiết bị Tất cả những gì mà cổng giao tiếp FC phải làm là quản lý một kết nối điểm-điểm bình thường giữa bản thân nó và fabric FC là một kết nối nối tiếp hiệu suất cao có khả năng hỗ trợ cho giao thức riêng của nó cũng như các giao thức cấp cao khác như FDDI, SCSI, HIPPI và IPI Chuẩn FC nhắm vào nhu cầu truyền tải một lượng lớn thông tin với tốc độ rất cao Công nghệ tốc độ cao (lên tới hàng Gbit/s) có thể được chuyển đổi cho công nghệ LAN bằng cách bổ sung một bộ chuyển mạch được chỉ rõ trong chuẩn FC mà có thể xử lý kiểu đánh địa chỉ đa điểm Một lợi ích khác của FC là nó cho người dùng sử dụng một cổng hỗ trợ cả các giao diện kênh lẫn mạng, làm giảm gánh nặng về số lượng cổng vào ra lớn cho các máy tính FC cung cấp khả năng điều khiển và kiểm soát lỗi hoàn chỉnh trên đường kết nối.
FC đáp ứng các yêu cầu, thách thức cả về chi phí và giá trị thực tiễn, với các ưu điểm sau : FC đưa ra các giải pháp hiệu quả cho lưu trữ và mạng, cung cấp các kết nối linh hoạt với hiệu năng phù hợp, là hình thức truyền thông tin cậy đảm bảo duy trì lâu dài cho doanh nghiệp Đồng thời mô hình kết nối đa dạng, hỗ trợ đa giao thức(SCSI,TCP/IP) Có khả năng tích hợp nhiều máy chủ và không bị nghẽn mạng, khả năng quá tải khi truyền tải nhỏ Trong mô hình kết nối FC, hệ thống switch kết nối các thiết bị được gọi là Fabric Các kiểu kết nối FC là điểm-điểm, vòng lặp hoặc kết nối tập trung qua switch
Hình 3.1 Các kiến trúc FC
Điểm - điểm (Point to Point) (FC-P2P) : kết nối giữa 2 thiết bị Đây là cấu trúc đơn giản nhất, tuy nhiên khả năng kết nối giới hạn.
Vòng lặp Arbitrated Loop (FC-AL) : trong thiết kế này, tất cả các thiết bị nằm trong vòng lặp hoặc vòng tròn (ring), tương tự như mạng token ring.
Việc thêm hoặc bớt một thiết bị khỏi vòng lặp sẽ làm cho hoạt động của vòng lặp bị ngắt Một thiết bị không hoạt động sẽ gây ra đứt vòng Các hub
FC sử dụng để kết nối nhiều thiết bị với nhau và có thể bỏ qua các cổng bị lỗi Một vòng lặp cũng có thể được tạo bằng cách cắm cáp nối tiếp từ port này sang port khác thành một vòng tròn Thông thường một vòng lặp Arbitrated loop giữa 2 port sẽ được tính để trở thành kết nối P2P, nhưng đây không phải là tiêu chuẩn yêu cầu.
Kết nối qua switch (FC-SW) Tất cả các thiết bị hoặc các vòng lặp của thiết bị được kết nối đến các FC switch, tương tự như khái niệm triển khai Ethernet Các switch quản lý trạng thái của mạng, cung cấp khả năng kết nối tối ưu.
FC hoạt động tại các tốc độ khác nhau (133 Mbit/s, 266 Mbit/s, 530 Mbit/s, 1Gbits/s, 2Gbps…) trên cả cáp đồng và cáp quang Khoảng cách truyền biến đổi phụ thuộc vào tốc độ và phương tiện truyền dẫn Đối với cáp quang chế độ đơn sử dụng nguồn sáng laser sóng dài cho hiệu năng cao nhất (khoảng cách tối đa 10 km tại tốc độ 1Gbit/s) Cấu trúc của FC bao gồm 5 lớp tư FC-0 đến FC-4 Các dịch vụ liên kết và dịch vụ fabric được đặt bên cạnh chồng giao thức FC để quản lí và vận hành mạng fibre Channel Bản than FC là khối có định hướng và nối tiếp do đó nó không cần đồng bộ giữa bên gửi và bên nhận.Sự định hướng các khối giúp cho việc truyền dữ liệu hiệu quả với sự hỗ trợ của cơ sở dữ liệu Người ta thường ánh xạ FC theo mô hình OSI truyền thống để dễ dàng nghiên cứu Cũng giống như OSI người ta xây dựng dựa trên lớp FC-0 là lớp vật lí cơ bản nhất Tuy nhiên không có sự ánh xạ hoàn toàn giữa OSI và FC.
Hình 3.2 Mối quan hệ giữa FC và OSI
FC-4 được ánh xạ với 2 tầng là tầng ứng dụng và trình diễn của OSI.
FC-3 và FC-2 tương ứng với cả ba tầng giao vận, tầng phiên và tầng liên kết dữ liệu.
FC-1 và FC-0 được ánh xạ với tầng vật lí dưới cùng, tiếp xúc trực tiếp với môi trường truyền dẫn.
Một điều cần chú ý là không có tầng nào trong FC có thể ánh xạ tương ứng với tầng mạng của mô hình OSI.Thứ hai là sự không phân biệt rạch ròi giữa FC-2 và FC-3, hai tầng này có sự tương hỗ nhau mật thiết trong hoạt động Tức là một số chức năng của FC-3 được xác định dựa trên hoạt động của tầng FC-2 và ngược lại.
FC0 : Lớp vật lý, bao gồm cáp (quang, đồng), bộ kết nối, pinout, …
FC1 : Lớp kết nối vật lý, thực hiện mã hóa và giải mã hóa các tín hiệu.
FC2 : Đưa ra cấu trúc phân cấp gồm phiên trao đổi, chuỗi và khung Chuỗi là một khối dữ liệu lớn được truyên đi giữa phía gửi và phía nhận Trong mỗi phiên trao đổi chỉ có một chuỗi được truyền đi tại một thời điểm, do vậy lớp FC-2 đảm bảo phân phối các chuỗi phía thu và phía phát là như nhau FC truyền các khung điều khiển và khung dữ liệu, khung điều khiển mang thông tin về các sự kiện trong mạng Khi truyền đi trong mạng thì các chuỗi được chia nhỏ như sau :
Hình 3.3 Cấu trúc truyền dẫn tại lớp FC-2
FC3 : Phân chia dữ liệu nhằm quản lí giữa các thiết bị cuối nhiều cổng,do đó dữ liệu được phân phối trên các khung của một phiên trên nhiều cổng làm tăng thông lượng giữa hai thiết bị FC-3 là lớp dịch vụ chung có thể thực hiện nén dữ liệu, mã hóa , sao chép và thực hiên RAID
FC4 : Nhiệm vụ của FC-4 là ánh xạ các giao thức lớp ứng dụng vào hạ tầng mạng FC Các ánh xạ này xác định cách thức sử dụng các cơ chế của
FC và làm thế nào để khai thác các giao thức ứng dụng trên nền tảng mạng FC Khi sử dụng ánh xạ các giao thức cho phép chuyển đổi sang
Lớp FC-4, mức cao nhất trong cấu trúc FC định nghĩa các giao diện ứng dụng mà có thể thực thi qua FC Nó chỉ rõ các luật ánh xạ của các giao thức lớp trên sử dụng các mức FC dưới Khả năng FC truyền thông tin kênh và mạng là như nhau, FC cho phép cả hai loại giao thức được truyền đồng thời qua cùng một giao diện vật lý.
Chồng giao thức FC và chức năng của từng lớp được mô tả như sau :
Các giao thức lớp trên (ULP)
- SCSI-3 (Small Computer System Interface-3)
- Các ánh xạ giao thức Fibre Channel Giao thức Fibre Channel dành cho SCSI-3 (FCP)
IP over Fibre Channel (IPFC) Tập lênh một byte của Fibre Channel
- Các dịch vụ chung Các thiết bị nhiều cổng Mật mã hóa/nén RAID
- Quản lý phiên trao đổi và chuỗi
- Các bộ thiết lập cấu trúc (Ordered sets)
- Các giao thúc điều khiển liên kết
- Giao diện quang và điện
- Các loại cáp và đầu kết nối
Các dịch vụ liên kêt Fibre Channel
Các dịch vụ kết cấu mạng Fibre Channel
Hình 3.5 Chồng giao thức Fibre Channel
Các giao thức kênh và mạng được chỉ ra dưới đây được đề xuất như là FC-4s :
Small Computer System Interface (SCSI).
High Performance Parallel Interface (HIPPI) Framing Protocol.
ATM Adaptation Layer for computer data (AAL5).
Single Byte Command Code Set Mapping (SBCCS).
Mô hình tổ chức SAN
3.2.1 Mô hình mạng SAN theo giao thức FC
Mạng Fibre channel SAN có nhiều cấu hình khác nhau, nhưng linh hoạt và phổ biến nhất là fabric Fabric gồm một hoặc nhiều thiết bị chuyển mạch FC kết nối với nhau Ngoài ra các dịch vụ fabric còn thực hiện quản lí tên và địa chỉ thiết bị,nhãn thời gian và các chức năng khác của chuyển mạch.
Quy mô nhỏ nhất để áp dụng SAN là trong một trung tâm dữ liêu (data center) Việc cấu hình mô hình kết nối các thiết bị SAN chủ yếu dựa trên lượng dữ liệu truy nhập vào ra Tùy theo yêu cầu, đặc trưng của loại ứng dụng triển khai trên hệ thống mà cách tích hợp mạng SAN lại khác nhauCó thể chia ra làm ba cách tổ chức kết nối các switch : theo mô hình biên-lõi, mô hình full-mesh, hoặc mô hình thác phân cấp Ví dụ về mô hình full-mesh giữa các switch của SAN : trong mô hình này các switch đều kết nối với nhau, đồng thời cùng kết nối với máy chủ và kho dữ liệu như mô hình sau :
Hình 3.10 Kết nối full mesh các FC switch
Với mô hình này, đường kết nối từ máy chủ đến kho dữ liệu là nhanh nhất, mức độ sẵn sàng của hệ thống cao, giảm khả năng lỗi, có thể thiết kế đường riêng cho các lưu lượng lớn.
3.2.2 Mô hình mạng SAN theo quy mô
Mô hình mạng lưu trữ nhỏ
Mạng lưu trữ nhỏ được giới hạn từ mô hình trung tâm dữ liệu doanh nghiệp (enterprise datacenter) đến mạng văn phòng hay ở nhà (small office home office- SOHO). Đặc điểm của mạng lưu trữ nhỏ này là :
Có NAS gateway nối với kho lưu trữ dạng khối bằng FCP.
Các thiết bị tích hợp sao lưu, bảo vệ và chia sẻ dữ liệu.
Các module lưu trữ con có nhiều loại cổng giao diện cho phép chuyển đổi từ SCSI song song sang FCP hoặc Ethernet, iSCSI.
Hỗ trợ sao lưu và bảo vệ dữ liệu từ xa qua Internet.
Sau đây là một mô hình tổng quát nhất mô tả mạng lưu trữ ở quy mô nhỏ Có thể tùy biến thiết kế mạng theo các trường hợp khác nhau, nhưng nhìn chung đều bao gồm các thành phần và cơ bản có cấu trúc dưới đây.
Hình 3.11 Mô hình mạng SAN nhỏ, kết hợp với NAS
Trong mô hình này, các máy chủ kết nối với nhau bằng GbE LAN và đều sử dụng iSCSI cho truy cập dữ liệu, nền hệ thống của máy chủ không bị hạn chế vì iSCSI đều được các hãng phát triển hệ điều hành hỗ trợ Các thiết bị NAS kết nối với mạng bằng NAS gateway để chuyển đổi phương thức truy nhập từ file sang khối Các bộ NAS gateway này cũng đảm bảo kết nối GbE với FC Mô hình trên đảm bảo các tính năng cơ bản nhất mà mạng lưu trữ cần có Cách tổ chức mạng này tiết kiệm chi phí đầu tư cho kết nối máy chủ đến kho lưu trữ (không hoàn toàn là FC).
Mô hình mạng lưu trữ doanh nghiệp cỡ vừa
Mô hình này sẽ thực hiện kết nối từ máy chủ đến kho lưu trữ hoàn toàn bằng
FC Các máy trạm bên ngoài vẫn có thể truy cập trực tiếp đến kho lưu trữ bằng iSCSI Cách tổ chức này tốn chi phí cho kết nối FC từ máy chủ đến kho lưu trữ hơn, nhưng lại tăng tính an toàn cho dữ liệu hơn.
Hình 3.12 Mô hình mạng SAN đơn lẻ theo chuẩn FC
Mô hình SAN này đứng đơn lẻ, không kết nối với các mạng SAN khác, hoạt động vào ra dữ liệu qua WAN chỉ là giữa máy trạm với kho lưu trữ Giao thức trong mạng SAN chỉ có FC, không kết hợp các giao thức khác.
Mô hình mạng SAN qua WAN hoặc MAN
Có rất nhiều xu hướng phát triển mô hình kết nối SAN, trong đó có 1 xu hướng quan trọng nổi bật đó là kết hợp mạng IP có sẵn với mạng SAN dùng FC. Đối với một mô hình mạng doanh nghiệp mà các chi nhánh ở cách xa nhau,mỗi chi nhánh đều có kho dữ liệu riêng và sử dụng SAN cho mô hình lưu trữ của mình Các cơ sở dữ liệu ở các nơi cách xa nhau cần sự nhất quán, truy nhập lẫn nhau và sao lưu từ xa nên các thiết bị SAN cần phải kết nối được với nhau để thực hiện trao đổi thông tin
Mặc dù chuẩn FC cho phép kéo dài kết nối đến 10 Km, nhưng trên thực tế triển khai SAN với chuẩn FC đến khoảng cách như vậy là không kinh tế Phương án đơn giản và rẻ tiền hơn là kết hợp chuẩn FC với IP, truyền dữ liệu qua mạng WAN, hoặc trên nền mạng MAN tiên tiến.
Hình 3.13 Mô hình mạng SAN qua WAN hoặc MAN
Thực hiện mạng lưu trữ trên khoảng cách lớn tạo tính an toàn cao cho dữ liệu khi có thiên tai Phù hợp với mô hình người dùng phân tán và mô hình mạng quy mô lớn.
Với khoảng cách lớn của mạng MAN hay WAN, công nghệ truyền dẫn là một vấn đề đối với mạng lưu trữ Mạng MAN có thể là vài km, có thể sử dụng cáp quang dùng CWDM, WDM và DWDM Nếu khoảng cách lớn hơn có thể dùng SONET/SDH.
Máy chủ có thể truy cập kho dữ liệu cục bộ hoặc từ xa, các máy chủ vẫn có thể thực hiện cluster và nhân bản từ xa Nếu khoảng cách ngắn có thể thực hiện nhân bản đồng bộ, khoảng cách dài khiến tốc độ nhân bản chậm có thể dùng nhân bản không đồng bộ
Khi mở rộng cấu hình SAN trên cơ sở mạng Internet cần xử lý một số vấn đề như việc điều khiển các thiết bị lưu trữ từ xa qua mạng WAN, xử lý trực tiếp các thiết bị lưu trữ bằng giao thức iSCSI, thực hiện sao lưu thứ bản từ xa, hỗ trợ clustering …
Hoạt động của mạng SAN
3.3.1 Sao lưu và phục hồi dữ liệu
Sao lưu dữ liệu Đối với một hệ thống lưu trữ dữ liệu, việc sao lưu dữ liệu thường xuyên và chiến lược khôi phục dữ liệu khi xảy ra mất mát là một vấn đề rất quan trọng Ở khía cạnh thiết kế, có một số mô hình sao lưu như sau:
Sao lưu tập trung qua LAN
Hình 3.14 Sao lưu tập trung qua hạ tầng LAN sẵn có
Hình 3.15 Sao lưu từ xa qua WAN
Khôi phục dữ liệu có thể diễn ra trên bộ lưu trữ chính do một số đĩa của dãy bị hỏng Có nhiều giải pháp để phục hồi lại dữ liệu bị mất:
Thay thế đĩa cứng bị hỏng và phục hồi bằng thuật toán của RAID.
Lưu trữ trạng thái dữ liệu ở các thời điểm khác nhau dưới dạng các ảnh dữ liệu (Snapshot) Việc phục hồi lại dữ liệu có thể tiến hành nhanh chóng và lựa chọn được thời điểm khôi phục bằng cách sử dụng các ảnh dữ liệu này Hoạt động này phải được tiến hành bằng phần mềm đi kèm Việc khôi phục dữ liệu có thể thực hiện từ bộ lưu trữ cục bộ tại kho dữ liệu hoặc từ bộ lưu trữ từ xa.
Khi không thực hiện ảo hóa lưu trữ trong mạng lưu trữ thì vẫn còn tồn tại mối liên hệ trực tiếp giữa thiết bị lưu trữ và server Vì vậy, một sự điều chỉnh nhỏ của server yêu cầu một sự thay đổi từ phía hệ thống lưu trữ Một hạn chế khác là sự không tương thích giữa các thiết bị từ các nhà sản xuất khác nhau Một server chỉ có thể kết nối với một số hệ thống lưu trữ được cài đặt một trình điều khiển chuyên biệt được cung cấp bởi cùng một nhà sản xuất cụ thể Như vậy, các server trong mạng không thể truy nhập vào một hệ thống lưu trữ bất kỳ trong mạng
Do vậy, để thỏa mãn các yêu cầu dành cho quản lý một lượng lớn dữ liệu mạng lưu trữ cần có một số công cụ hỗ trợ nhằm đơn giản hóa công việc quản lý đồng thời nhằm khai thác tài nguyên lưu trữ hiệu quả hơn và ảo hóa ra đời nhằm:
Đơn giản hóa quản lý và truy xuất tài nguyên lưu trữ.
Khai thác đầy đủ mọi khả năng của mạng lưu trữ : hiệu quả sử dụng tài nguyên và dữ liệu, nâng cao hiệu suất, bảo vệ dữ liệu chống lại các sự cố có thể xảy ra.
Khai thác những khả năng tiên tiến của mạng lưu trữ hướng đến quản lý dữ liệu và vận hành tự động.
Các vị trí thực hiện ảo hóa:
Ảo hóa trên kênh vào ra : Ảo hóa là tên gọi chung của các chức năng nhưRAID, caching, sao chép tức thời, sao chép từ xa
Hình 3.16 Các vị trí có thể thực hiện ảo hóa lưu trữ Ảo hóa trong hệ thống lưu trữ : mọi thao tác đều đươc thực hiện ở hệ thống lưu trữ không ảnh hưởng đến hoạt động của máy chủ cũng như mọi họa động liên lạc giữa máy chủ và các thiết bị khác
Hình 3.17 Ảo hóa dữ liệu trên hệ thống lưu trữ
Ngoài ra còn có ảo hóa trên máy chủ, trên bộ nhớ, và các phương pháp ảo hóa đối xứng và không đối xứng
3.3.2 Giải pháp an ninh trong mạng SAN.
Về vấn đề an ninh truy cập mạng lưu trữ có thể chia ra các vấn đề chính cần quan tâm như sau :
An ninh thiết bị mạng và các cổng truy cập.
An ninh trên các giao diện kết nối (SNMP, Telnet, IP, …)
An ninh tài nguyên lưu trữ và các đơn vị nhớ.
Một số kĩ thuật an ninh trên thiết bị mạng SAN như : đóng kết cổng (port binding), đóng kết switch(switch binding), đóng kết mạng lưới SAN, phân vùng(zoning), mạng SAN ảo.
QUY TRÌNH THIẾT KẾ MẠNG LƯU TRỮ
Tổng quan về tiến trình thiết kế mạng lưu trữ
Mạng lưu trữ là một hệ thống máy tính phức tạp bao gồm nhiều thành phần khác nhau như mạng, quản lí lưu trữ,quản lí máy chủ,quản lí các ứng dụng, cơ sở dữ liệu và anh ninh trong mạng Do vậy khi thiết kế một mạng lưu trữ phải đảm bảo được tất cả các vấn đề của mạng đặt ra Xác định tài nguyên có thể cung cấp cho hệ thống bao gồm cả về con người và công nghệ Đặc biệt phải dự đoán phần nào xu hướng công nghệ và có kế hoạch cho sự phát triển trong tương lai.
4.1.1 Khảo sát các yêu cầu và xác định mục tiêu thiết kế. Đây là bước đầu tiên và cũng là bước quan trọng nhất trong việc thiết kế một mạng lưu trữ Đồng thời cũng làm rõ các yêu cầu của tổ chức cũng như yêu cầu về mặt công nghệ Cuối cùng các yêu cầu này giúp chọn lựa cách thiết kế phù hợp và các thành phần trong mạng SAN tương ứng Để xác định các yêu cầu của mạng SAN chính là việc đi tìm câu trả lời cho các câu hỏi sau :
Mức độ sẵn sàng : Những hạn chế của các ứng dụng trong những thời kì trước.Và những công việc hay ứng dụng nào cần được thực hiện mà không bị ngắt (ví dụ như việc phát triển hay cập nhật nguồn tài nguyên).
Dung lượng : yêu cầu về khả năng lưu trữ tăng như thế nào so với giới hạn khả năng lưu trữ của server Tổng dung lượng cần giới hạn được tăng lên mỗi năm Những ứng dụng mới nào được sử dụng và triển khai trong thời gian tới (ERP, CRM, ).
Khả năng thực hiện : Xác định mức độ thực hiện cao nhất đối với các ứng dụng.
Quản lí trong mạng: nhiệm vụ quản trị hiện thời nào là khó khăn với việc thiếu tài nguyên hay chính là vấn đề về tài nguyên trong mạng Và trong một khoảng thời gian (ví dụ là một năm)thì nó sẽ thế nào.Có nên tích hợp việc quản lí mạng lưu trữ này vào các cấu trúc lưu trữ hiện thời.
Sao lưu dữ liệu :Xác định các tham số nào cần quan tâm trong khi back-up dữ liệu Hoặc có thể back-up qua mạng LAN để giảm tắc ngẽn do vậy mà
Khôi phục lỗi : Trong trường hợp khẩn cấp những ứng dụng nào cần được truyền đến trung tâm dữ liệu để xử lí Nếu thay đổi ở trung tâm dữ liệu thì hệ thống sẽ thay đổi thế nào và khi đó khoảng cách đến trung tâm dữ liệu sơ cấp.
Khả năng sử dụng của server và hệ thống lưu trữ : Dữ liệu trong hệ thống lưu trữ luôn sẵn sàng nhưng trong một số ứng dụng tăng dữ liệu thì lại không thể truy nhập được Nếu có bất kì một giới hạn nào trong môi trường vật lí thì sẽ được giải quyết như thế nào.với những thiết bị vật lí cũ, dung lượng nhỏ thì khả năng củng cố bằng các thiết bị mới hơn như thế nào Các thiết bị dung lượng lớn hơn có dễ quản trị hơn va giảm sự ảnh hưởng của các dịch vụ.
Budget : khả năng kiểm soát mức sử dụng lưu trữ cho hệ thống trong thời điểm hiện tại Nếu giả thiết rằng có thể cải tạo ít nhất 30% của không gian lưu trữ.
Một quy trình thiết kế thông thường phải được quay vòng nhiều lần do các yêu cầu khách quan (thay đổi yêu cầu của hệ thống, phát sinh vấn đề từ thiết bị ) hoặc những nguyên nhân chủ quan (khó khăn trong quá trình thực hiện thiết kế…)
Thiết kế sơ đồ mạng logic
Thông tin sản phẩm Đánh giá dung lượng sử dụng hiện tại và tương lai Đánh giá hoạt động của máy chủ và phân vùng đối với các máy chủ có yêu cầu hiệu năng cao
Lựa chọn sản phẩm lưu trữ Đánh giá khả năng sử dụng của hạ tầng mạng sẵn có trong môi trường thiết kế mới
Lựa chọn giải pháp sao lưu, dự phòng và khôi phục hồi dữ liệu
Lựa chọn mô hình kết nối SAN và phát triển kết nối
Lựa chọn giao thức mạng và giải pháp sao lưu từ xa (nếu có)
Tính toán băng thông kết nối
Phân tích đặc điểm và tính năng của sản phẩm
Thông tin tương thích và hỗ trợ giữa các dòng sản phẩm
Sơ đồ mạng tổng thể
Phần mềm hỗ trợ và giải pháp đi kèm sản phẩm
Yêu cầu của các dịch vụ triển khai
Xu hướng sử dụng và mở rộng hệ thống
Yêu cầu về độ an toàn của hệ thống
Yêu cầu về hạ tầng mạng
Cơ sở hạ tầng sẵn có (máy chủ, kho lưu trữ, thiết bị mạng, )
Hình 4.1 Quy trình thiết kế mạng SAN.
Phân tích
Tiến trình tiếp cận thông tin bao gồm các bước :
Kiểm tra các tài nguyên sẵn có (phần cứng,phần mềm…).
Tìm hiểu các yêu cầu của mạng lưu trữ.
Xác định các dịch vụ và yêu cầu (về dung lượng, độ sẵn sàng,thời gian đáp ứng,…)
Dự đoán dung lượng sử dụng và kế hoạch hiệu năng.
Thực tế các yêu cầu đối với mạng lưu trữ phức tạp hơn do vậy những yêu cầu của các ứng dụng cũng như hệ thống mạng cần được tìm hiểu rõ hơn nữa như : kế hoạch phát triển của hệ thống, dự kiến tiến trình công việc như thế nào, đối với các ứng dụng đưa ra có cần sự hỗ trợ nào khác không…Tìm hiểu các thành phần trong mạng:máy chủ (loại máy chủ nào được sử dụng, thông số kĩ thuật, giao diện bus máy chủ, công cụ thực hiện dự phòng lỗi và clustering, yêu cầu an ninh và khôi phục đối với máy chủ…) đối với các thành phần lưu trữ (phương tiện lưu trữ sử dụng trong hệ thống, đặc điểm bộ đĩa, đĩa dự phòng, loại dữ liệu và bộ nhớ được chia sẻ giữa các máy chủ, bộ nhớ đệm, bộ đĩa phục vụ cho việc sao lưu từ xa )
Mạng lưu trữ khi sử dụng cho việc truy cập từ xa dặc biệt là qua mạng công cộng thì phải chú ý đến vấn đề an toàn dữ liệu Do đó cân phải chú ý đến:
Loại sao lưu và nhân bản dữ liệu nào được sử dụng.
Đặc điểm của dữ liệu được nhân bản và sao lưu.
Thời gian khôi phục dữ liệu trên bộ đĩa và khi nào thì cần.
Chính sách duy trì dữ liệu sao lưu. Đối với cơ sở mạng :
Topo mạng, loại cáp sử dụng.
Vấn đề chia sẻ băng thông giữa các dịch vụ.
Kế hoạch mở rộng hệ thống (thêm máy chủ, bộ nhớ, băng thông )
Loại truy cập, tích hợp các thiết bị sẵn có vào hệ thống
Trong quá trình theo dõi và giám sát hệ thống cần phải chú ý đến nhữngthay đổi cũng như bất thường trong mạng để kịp thời ứng phó và xử lí.
4.2.2 Các ứng dụng triển khai trên hệ thống mạng.
Hoạt động của các ứng dụng có tính chất quyết định đến mô hình tổ chức của mạng lưu trữ Các loại dịch vụ khác nhau yêu cầu đến hiệu năng của hệ thống khác nhau Một số loại ứng dụng thường gặp như :
Cá ứng dụng xử lí trực tuyến khối lượng người truy cập lớn,yêu cầu độ chính xác cao Với loại ứng dụng này cần thiết kế mô hình cụm máy chủ Truy cập đường vào/ra với hệ thống lưu trữ và qua nhiều đường kết nối đến kho lưu trữ, tránh sự phụ thuộc vào một thiết bị.
Các ứng dụng quản trị dữ liệu cần mức độ an toàn dữ liệu cao cần được thiết kế liên kết với hệ thống dự phòng tốt.
Các ứng dụng điều khiển, quản lí hệ thống lưu trữ được triển khai trên hệ thống các máy chủ riêng tốt nhất là kết hợp với các ứng dụng sao lưu dữ liệu.
Loại ứng dụng Truy cập theo đối tượng Truy cập theo khối Truy cập theo file
Lấy và lưu dữ liệu ● ● ●
Dự phòng và khôi phục ● ●
Tính toán hiệu năng cao ● ●
Xử lý trực tuyến OLTP ●
Chức năng văn phòng và quản lý nhóm ● ●
Liên quan đến ảnh và tài liệu
Bảng 4.1 Đánh giá về các loại ứng dụng và phương pháp truy nhập
4.2.3 Quy hoạch dung lượng cho hiện tại và tương lai.
Dung lượng của mạng lưu trữ không chỉ là dung lượng của tài nguyên nhớ mà bao gồm cả khả năng xử lí của CPU, dung lượng bộ đệm, khả năng truyền dẫn thông tin của mạng Nếu dung lượng của mạng không cao, hiệu năng sẽ thấp ngược lại khi hiệu năng của mạng cao sẽ thúc đẩy việc sử dụng các thiết bị và ứng dụng dung lượng cao Trong một hệ thống mạng lưu trữ, bộ lưu trữ trung tâm là trái tim của hệ thống Hiệu năng của hệ thống mạng lưu trữ được quyết định rất nhiều bởi khả năng của bộ lưu trữ trung tâm do đó việc lựa chọn bộ lưu trữ trung tâm đóng vai trò vô cùng quan trọng với hoạt động của hệ thống trong tương lai Một trong những yếu tố để lựa chọn bộ lưu trữ là dung lượng nhớ tối đa mà nó hỗ trợ Để có được thông số này, cần tiến hành khảo sát và đánh giá dung lượng sử dụng của toàn hệ thống trong thời điểm sử dụng và khoảng thời gian tương lai.
Khi tính toán dung lượng lưu trữ dựa trên các ứng dụng sẵn có của doanh nghiệp đang triển khai và các ứng dụng dự định triển khai Đây là một việc khó khăn và phức tạp do nó còn liên quan đến mức độ phát triển của doanh nghiệp, đặc biệt là đối với các doanh nghiệp lấy hệ thống lưu trữ làm công cụ trực tiếp phát triển sản phẩm kinh doanh Hoạt động khảo sát và tính toán dung lượng sử dụng cần kết hợp chặt chẽ với doanh nghiệp làm chủ hệ thống Mặc dù yêu cầu công việc tính toán dung lượng càng đạt độ chính xác cao càng tốt nhưng người thiết kế cần xác định một thực tế : “việc tính toán không thể kì vọng vào con số chính xác hoàn toàn, ngay cả bản thân doanh nghiệp làm chủ hệ thống cũng không thể đảm bảo chắc chắn về kế hoạch sử dụng và phát triển hệ thống của họ” Do đó trong quá trình tính toán nên đưa ra nhiều tính huống và khả năng phát triển khác nhau Kết quả của quá trình tính toán cần được nhân lên với hệ số phát triển (tùy vào quy mô doanh nghiệp, có thể 2 hoặc 3 lần).
Việc tính toán dung lượng cũng có ích cho hiệu quả đầu tư hệ thống ban đầu. Các bộ lưu trữ trung tâm thường cho phép bổ sung nóng ổ đĩa cứng một cách nhanh chóng, do đó ban đầu chỉ cần thiết kế dung lượng đủ nhu cầu sử dụng, việc mở rộng thêm có thể bổ sung sau này Khi hoạch định dung lượng của hệ thống còn cần phải quan tâm đến các vấn đề:
Dung lượng nhớ cần thiết, vị trí của các bộ lưu trữ và hiệu suất sử dụng.
Số lượng thiết bị nhớ, switch, cổng, …
Băng thông cần thiết trên các đường kết nối, hiệu suất sử dụng, các vị trí có thể gây nút cổ chai.
Dung lượng nhớ đệm là bao nhiêu, mức độ ảnh hưởng với yêu cầu của ứng dụng thế nào.
4.2.4 Lựa chọn các thiết bị cho mạng.
Máy chủ Các thông tin cần khảo sát và đánh giá trên máy chủ gồm :
Dịch vụ cần triển khai trên máy chủ Khi xác định các dịch vụ này thì có thể thiết kế đường truy nhập cho máy chủ.
Hệ điều hành của máy chủ: các thiết bị mạng và bộ lưu trữ hỗ trợ nhiều hệ điều hành khác nhau nhưng không phải là tất cả Khi xác định hệ điều hành giúp lựa chọn thiết bị phù hợp.
Khả năng xử lí của máy chủ.
Trong một mạng lưu trữ máy chủ tiếp nhận thông tin từ nhiều nguồn khác nhau, với mạng càng lớn và sử dụng nhiều ứng dụng thì lưu lượng đếnmáy chủ càng lớn và phức tạp Mà mỗi thông tin lại có một yêu cầu thời gian xử lí riêng, và khả năng đáp ứng của máy chủ Khi so sánh khối lượng thông tin được xử lí bởi máy chủ với dung lượng cần thiết của đương bus và giao diện cần tính đến hệ số sử dụng giữa lí thuyết và thực tế.
Hệ thống kết nối bao gồm các yếu tố về băng thông, cấu trúc topo mạng. Việc tính toán băng thông của đường truyền trên toàn bộ hệ thống mạng cần thực hiện sau khi đã đưa ra mô hình logic của mạng lưu trữ Mô hình logic của mạng lưu trữ có thể chia ra các phân vùng để tính toán và xây dựng băng thông:
Phân vùng truy cập : các máy tính người sử dụng đầu cuối hoặc các đường kết nối truy cập từ xa đến kho lưu trữ Khi càng đến gần kho lưu trữ thì yêu cầu băng thông càng lớn do đảm bảo cho nhiều đường truyền hoạt động cùng lúc.
Phân vùng biên của hệ thống mạng SAN : các đường truyền này yêu cầu băng thông lớn để đảm bảo cho khối lượng vào/ra của máy chủ.
Phân vùng lõi của mạng SAN : Các đường truy cập giữa các SAN switch về kho lưu trữ trung tâm.
Với topo mạng SAN đã trình bày ở phần 3.2 so sánh các topo và trường hợp ứng dụng :
Topo mạng Trường hợp áp dụng Đặc điểm
Kết nối nhiều khu vực với nhau, có thể tăng quy mô mạng theo số cổng trên các switch kết nối. Để đảm bảo tính sẵn sàng cao, cần có lưới kết nối dự phòng Số lượng đường kết nối giữa các switch phụ thuộc vào tổng lưu lượng trên mạng mà các dịch vụ yêu cầu
Chạy ứng dụng heartbeat,cluster,với nhiều khu vực địa lý phân tán, tính mở rộng đơn giản. Đây là trường hợp thông dụng cho kết cấu mạng lưu trữ mang tính cục bộ cũng như môi trường phân tán, việc mở rộng mạng phụ thuộc vào số cổng sẵn có của thiết bị.
Sử dụng để hợp nhất các mạng SAN với nhau, tạo thêm các đường dự phòng giữa các khu vực hoặc thiết bị.
Giải pháp hợp nhất các mạng lưu trữ
Khi yêu cầu về mạng lưu trữ ngày càng cao, các ứng dụng ngày càng đa dạng và phức tạp thì một loại hình mạng lưu trữ có thể không đáp ứng được tất cả các yêu cầu đó Chính vì vậy việc kết hợp các mạng lưu trữ ra đời nhằm đảm bảo kết nối các công nghệ với nhau đồng thời đạt hiệu quả chi phí và quản lí tốt nhất.
4.3.1 Giải pháp hợp nhất SAN với DAS.
Một số hệ thống sử dụng mô hình lưu trữ DAS từ trước, và điều đó hạn chế khả năng tận dụng tài nguyên lưu trữ Việc chuyển đổi DAS sang SAN sẽ mở rộng khả năng sử dụng kho lưu trữ, các máy chủ khác nhau có thể sử dụng kho lưu trữ của nhau Mô hình sau sẽ biểu diễn việc chuyển đổi từ DAS sang SAN
Hình 4.4 Chuyển đổi DAS sang SAN
Kho lưu trữ thay vì kết nối trực tiếp với hệ thống máy chủ sẽ được tách ra và kết nối với các switch SAN Thiết bị switch làm nhiệm vụ trung gian kết nối giữa máy chủ và kho lưu trữ.
4.3.2 Hợp nhất nhiều mạng SAN.
Hợp nhất nhiều mạng SAN để mở rộng quy mô mạng Các mạng SAN đều có sẵn switch, việc mở rộng thực hiện bằng cách kết nối các switch này với kho dữ liệu chung, hoặc kết nối trung gian qua một SAN switch khác.
Hình 4.5 Kết nối trực tiếp đến kho dữ liệu và dự phòng
Hình 4.6 Kết nối thông qua SAN switch
4.3.3 Hợp nhất các mạng lưu trữ SAN qua WAN và MAN.
Kết hợp nhiều mạng lưu trữ quy mô MAN với nhau được tổng quát hóa qua mô hình sau :
Hình 4.7 Mô hình kết hợp MAN và WAN
Các mô hình MAN kết nối với nhau bằng đường quang sử dụng công nghệDWDM, với cách khoảng cách lớn có sử dụng SONET/SDH Các công nghệ khác nhau kết nối qua các gateway FC switch giao tiếp với mạng IP bằng giao thứcFCIP (Fibre Channel over IP) hoặc iSCSI.
Phát triển mở rộng mạng SAN
Sự phát triển mạnh mẽ của dữ liệu trong các nghành kinh tế cộng với vấn đề về băng thông có đủ sức trên nền IP hay WDM.Với mạng SAN mở rộng người dùng cuối có thể trực tiếp truy nhập đến trung tâm dữ liệu tại bất kì môi trường nào : trường học, khu đô thị hay một vùng rộng lớn Thách thức khi mở rộng mạng SAN là tốc độ truy nhập, độ tin cậy và dung lượng trong mỗi trung tâm dữ liệu Khi mở rộng mạng SAN điều quan trọng là phải giữ được cấu hình mạng gốc theo mục đích thiết kế Nếu thay đổi cấu trúc của mạng thì có thể chuyển sang một cấu trúc mạng khác không đáp ứng được yêu cầu của mạng hiện tại Mạng SAN thường được mở rộng theo : địa lí, dung lượng, …
4.4.1 Mở rộng về mặt dung lượng.
Mỗi thiết bị lưu trữ, server hay thiết bị mạng trong mạng lưu trữ có một địa chỉ để nhận dạng Tùy thuộc vào công nghệ được sử dụng mà số lượng thiết bị trong một mạng lưu trữ có sự khác nhau Chẳng hạn với công nghệ Fibre Channel triển khai cấu hình dạng vòng hỗ trợ tối đa 127 thiết bị.
Số lượng địa chỉ khả dụng trong một mạng có thể tăng lên bằng cách sử dụng các thiết bị chuyển mạch SAN theo cấu trúc phân tầng: kết nối một hoặc nhiều cổng của một thiết bị chuyển mạch tầng trên với các thiết bị chuyển mạch tầng dưới Khi muốn nâng cấp dung lượng lưu trữ của mạng, có thể gắn thêm thiết bị chuyển mạch vào các tầng dưới.
Hình 4.8 Kết nối các thiết bị chuyển mạch kiểu phân cấp
Khi cần truyền các lưu lượng dữ liệu lưu trữ giữa mạng lưu trữ và các loại mạng khác hoặc các bus lưu trữ, thì sử dụng các thiết bị định tuyến SAN Các thiết bị này cung cấp các dịch vụ biên bao gồm chuyển đổi địa chỉ, chuyển đổi giao thức và báo hiệu, đệm dữ liệu, và có khả năng giao dịch tốt với tất cả các phần tử khác trong mạng lưu trữ cũng như các phần tử trong các mạng khác hoặc bus lưu trữ.
4.4.2 Mở rộng theo khoảng cách.
Mạng lưu trữ có thể hoạt động với tốc độ cao trên khoảng cách lớn hơn nhiều so với công nghệ bus lưu trữ Sử dụng công nghệ truyền dẫn nối tiếp, thông tin có thể được truyền đi trên cáp truyền dẫn dài hơn, đồng thời còn có thể chuyển tiếp sang các kết nối đường dài (bridge over wide area link) Chiều dài kết nối lớn tạo thuận lợi trong lắp đặt và bố trí thiết bị, quan trọng hơn nó cho phép phân tán các phân hệ lưu trữ trên những khu vực khác nhau nhằm mục đích bảo vệ (protection) và tạo sự sẵn sàng (availability) cho dữ liệu.
Hình 4.9 Khả năng mở rộng khoảng cách lớn
Thực hiện sao chép từ xa để bảo vệ dữ liệu khi có sự cố xảy ra tại một khu vực cũng như nâng cao độ sẵn sàng của dữ liệu Một số kĩ thuật hỗ trợ việc mở rộng mạng SAN theo khoảng cách là : dùng FC ở khoảng cách xa (bằng cách dùng máy thu phát sóng dài hoặc sóng ngắn)hoặc dùng WDM (hỗ trợ đối với cả tốc độ 1Gbps và 2Gbps) Tùy theo khoảng cách mở rộng mà chọn các đầu kết nối khác nhau:GBIC,SFP Đối với thiết bị WDM được dùng để mở rộng khoảng cách giữa hai FC switch Các thiết bị này trong suốt đối với các switch và không làm tăng thêm số hop mà chỉ xem xét việc tương thích giữa các thiết bị để tăng thêm bộ đệm trên đường truyền còn lại.