Có thể truyền đồng thời dữ liệu, âm thanh và hình ảnh số hoá trên cả mạng LAN và mạng WAN.SONET Synchronous Optical Network Một chuẩn dùng cho các kết nối quang học, xây dựng bởi hãng Ex
Trang 1LỜI CẢM ƠN
Trong quá trình tìm hiểu , thực hiện để hoàn thành đồ án, tôi đã gặp không ít khó
khăn, nhưng tôi luôn nhận được sự động viên, khích lệ của giảng viên, TS Nguyễn Minh
Nhật Thầy đã giúp đỡ tôi rất nhiều trong quá trình thực hiện, hướng dẫn tận tình trong
cách thức và phương pháp thực hiện cũng như hỗ trợ tôi trong việc tìm tài liệu.
Để có được những kết quả trong đồ án này, tôi xin gửi lời cảm ơn sâu sắc đến
giảng viên, TS Nguyễn Minh Nhật khoa Công nghệ thông tin trường Đại Học Duy
Trang 2LỜI CẢM ƠN 1
MỤC LỤC 2
DANH MỤC THUẬT NGỮ 4
DANH MỤC HÌNH 5
LỜI NÓI ĐẦU 7
CHƯƠNG I 9
TỔNG QUAN VỀ CÁC PHƯƠNG PHÁP LƯU TRỮ 9
1.1 GIỚI THIỆU VỀ MẠNG LƯU TRỮ (STORAGE AREA NETWORKS) 9
1.2 GIỚI THIỆU MỘT SỐ GIẢI PHÁP MẠNG LƯU TRỮ HIỆN NAY 10
1.2.1 Giải pháp lưu trữ DAS (Direct Attached Storage) 10
1.2.2 Giải pháp lưu trữ NAS (Network Attached Storage) 11
1.2.3 Giải Pháp lưu trữ SAN (Storage Area Network) 14
1.3 ƯU NHƯỢC ĐIỂM CỦA CÁC HỆ THỐNG LƯU TRỮ DAS, NAS, SAN 19
1.3.1 Hệ thống Direct Attached Storage - DAS 19
1.3.2 Hệ thống Network Attached Storage - NAS 19
1.3.3 Hệ thống Storage Area Network - SAN 20
CHƯƠNG II 23
GIẢI PHÁP MẠNG LƯU TRỮ SAN 23
2.1 GIỚI THIỆU MẠNG LƯU TRỮ STORAGE AREA NETWORK (SAN) 23
2.2 CÁC DẠNG CỦA MẠNG LƯU TRỮ 24
2.3 CÁC THÀNH PHẦN CỦA MẠNG LƯU TRỮ - SAN COMPONENTS 26
2.3.1 Hệ thống máy chủ 26
2.3.2 Kết nối SAN 29
2.3.3 Các thiết bị kết nối SAN 35
2.3.4 Hệ thống lưu trữ 36
2.4 KIẾN TRÚC CỦA STORAGE AREA NETWORK (SAN) 41
2.4.1 Kết nối trực tiếp điểm – điểm (Poin to Point topology) 43
2.4.2 Topology Arbitrated Loop 43
2.4.3 Topology SAN Fabric 44
2.4.4 Topology dự phòng 49
Trang 32.5 ỨNG DỤNG TRONG STORAGE AREA NETWORK (SAN) 51
2.6 QUẢN LÝ STORAGE AREA NETWORK (SAN) 54
2.7 LƯU TRỮ DỮ LIỆU DỰA TRÊN NGUYÊN LÝ PHÂN MỨC 57
2.7.1 Tiered-storage 57
2.7.2 Informate Lifecycle Management 60
2.8 SAO LƯU PHỤC HỒI DỮ LIỆU TRONG MẠNG LƯU TRỮ 62
2.9 ẢO HÓA HỆ THỐNG LƯU TRỮ (STORAGE VIRTUALIZATION) 65
2.10 MỘT SỐ THIẾT BỊ STORAGE AREA NETWORK (SAN) 67
2.10.1 IBM BladeCenter S Server 67
2.10.2 IBM BladeCenter PS700, PS701, và PS702 69
2.10.3 IBM System x3850 X5 72
CHƯƠNG III 74
MÔ PHỎNG HỆ THỐNG SAN TRÊN MÔI TRƯỜNG CLUSTER 74
3.1 GIỚI THIỆU MÔI TRƯỜNG CLUSTERS 74
3.1.1 Giới thiệu mạng Clusters 74
3.1.2.Cấu trúc của mạng Clusters 75
3.1.3 Nguyên tắc hoạt động của Cluster 77
3.1.4 Cluster nhiều địa điểm phân tán 78
3.1.5 Tối ưu hoá các thiết bị lưu trữ trên cluster 79
3.1.5 Tính mở rộng của mạng Clusters 81
3.1.6 Kết luận 83
3.2 GIỚI THIỆU KỊCH BẢN 84
3.2.1 CÁC BƯỚC THỰC HIỆN 84
3.2.3 KẾT QUẢ DEMO 102
KẾT LUẬN 103
TÀI LIỆU THAM KHẢO 104
Trang 4DANH MỤC THUẬT NGỮ
SCSI Small Computer System Interface Một chuẩn giao diện dùng để kết nối các
FCIP Fibre Channel over IP Giao thức Kênh quang sử dụng TCP/IPiFCP Internet Fibre Channel Protocol
bị”
FC-AL Fibre Channel-Arbitrated Loop Chuẩn giao diện nối tiếp F mới
SSA Serial Storage Architecture Giao diện lớp vật lý, có thể sử dụng với
SCSI
ESCON Enterprise Systems Connection Một giao diện kết nối dữ liệu dược đưa ra
bởi IBM năm 1990Bus-and-Tag Bus-and-Tag Interface Là một giao diện cho phép kết nối một kênh
Bus and Tag tới một điểm không tương thích như TCP/IP Printer hoặc một
PC/Server HIPPI High-Performance Parallel
Interface lượng lớn dữ liệu lên đến hàng tỷ bit/s trên Một chuẩn Point-to-Point để truyền một
một khoảng cách tương đối ngắn.ISL Inter-Switch Lịnk Một giao diện kết nối độc quyền của Cisco
Kết nối Point-to-Point
DWDM Dense Wavelength Division
Multiplexer Bộ ghép kênh quang theo bước sóng.ATM Assynchronous Transfer Mode Chế độ truyền không đồng bộ Có thể truyền
đồng thời dữ liệu, âm thanh và hình ảnh số hoá trên cả mạng LAN và mạng WAN.SONET Synchronous Optical Network Một chuẩn dùng cho các kết nối quang học,
xây dựng bởi hãng Exchange Hiệp hội tiêu chuẩn (ECSA) cho viện Tiêu chuẩn Quốc
gia Mỹ (ANSI)SNIA Storage Networking Industry
Association
Hiệp hội các nhà sản xuất và người tiêu dùng các sản phẩm kết nối mạng lưu trữ, với mục tiêu là công nghệ tiếp nối mạng lưu trữ
và ứng dụng Được hợp nhất vào 12/2007SNMWG Storage Network Management
Working Group
Tổ chức được thành lập để tập trung vào các ngành công nghiệp xây dựng chuẩn giao
Trang 5DIMM Dual in-line memory module Bao gồm một loạt các module bộ nhớ truy
cập ngẫu nhiên tích hợp được gắn trên mạch
in
DANH MỤC HÌNH
Hình 1 Mô hình thiết bị lưu trữ gắn trực tiếp 7
Hình 1.1 Mô hình DAS (tổng quan) 10
Hình 1.2 Mô hình NAS (tổng quan) 12
Hình 1.3 Mô hình NAS (tổng quan) 13
Hình 1.4 Mô hình SAN (tổng quan) 15
Hình 1.5 Một mô hình SAN 16
Hình 1.6 So sánh NAS và SAN 18
Hình 2.1 Hình mô tả khái quát SAN 23
Hình 2.2 các thành phần trong mạng SAN 26
Hình 2.3 Giao diện kết nối bộ vi xử lý vào thiết bị lưu trữ 27
Hình 2.4 Giao diện kết nối bộ vi xử lý pSeries vào thiết bị lưu trữ 28
Hình 2.5 Thiết kế phần cứng iSeries 29
Hình 2.6 Mô hình backup Tape Internal 40
Hình 2.7 Topology điểm – điểm 43
Hình 2.8 Topology Arbitrated Loop 43
Hình 2.9 Topology chuyển mạch nối tầng 45
Hình 2.10 Liên kết giữa các chuyển mạch trong Topology lưới 45
Hình 2.11 Liên kết giữa các chuyển mạch trong Topology lưới 46
Hình 2.12 Mạng SAN dựa trên 4 Building-Block và 7 chuyển mạch liên kết 47
Hình 2.14 Mạng SAN trở thành Metropolitan Are SAN sử dụng DWDM 48
Hình 2.15 Mạng SAN trở thành Wide Are SAN sử dụng ATM qua SONET 48
Hình 2.16 Topology Remote mirroring sử dụng Fibre Channel 50
Hình 2.17 Topology Remote mirroring sử dụng WAN cho đường nối ở xa 50
Hình 2.18 Các ứng dụng SAN 51
Hình 2.19 Chia sẻ không gian lưu trữ và chia sẻ dữ liệu 51
Trang 6Hình 2.22 So sánh các mức lưu trữ on-line, near-line và off-line 59
Hình 2.23 Tầm quan trọng của dữ liệu thay đổi theo thời gian 60
Hình 2.24 Sao lưu qua mạng SAN 63
Hình 2.25 Sao lưu qua mạng SAN, giảm thiểu vai trò của máy chủ backup 64
Hình 2.26 Mô hình chức năng của sản phẩm ảo hóa lưu trữ IBM SVC 66
Hình 2.27 Máy chủ IBM BladeCenter S 67
Hình 2.28 Máy chủ PS702, PS701 và PS700 69
Hình 2.29 Máy chủ IBM System x3850 X5 72
Hình 3.1 Hệ thống cluster có 2 ứng dụng hoạt động song song trên mỗi node 76
Hình 3.2 Hai hệ thống cluster độc lập chứa 2 ứng dụng khác nhau 76
Hình 3.3 Hai node Active được dự phòng bởi node Passive 77
Trang 7LỜI NÓI ĐẦU
Trước đây hệ thống máy tính lớn thường được sử dụng để quản lý tập trung các dịch vụ dữ liệu Ở những hệ thống này thiết bị lưu trữ được gắn trực tiếp vào các kênh vào/ra của máy chủ Máy chủ độc quyền truy xuất và quản lý tất cả thiết bị lưu trữ gắn trực tiếp vào chúng Khi đó, các ứng dụng hoặc các máy trạm chỉ có thể truy xuất dữ liệu một cách gián tiếp thông qua mạng
Hình 1 Mô hình thiết bị lưu trữ gắn trực tiếp
Mô hình “thiết bị lưu trữ gắn trực tiếp” hoạt động hiệu quả trong một thời gian dài, đặc biệt trong môi trường xí nghiệp vừa và nhỏ Tuy nhiên khi áp dụng mô hình này cho các doanh nghiệp lớn (doanh nghiệp đang sử dụng các ứng dụng có lượng dữ liệu luân chuyển lớn và có nhiều yêu cầu đặc biệt) thì mô hình trên bộc lộ nhiều hạn chế
Những hạn chế của mô hình “thiết bị lưu trữ gắn trực tiếp” cũng chính là những lý
do thúc đẩy công nghệ lưu trữ đi sang một thế hệ mới, thế hệ “mạng lưu trữ” Mạng lưu trữ có tiềm năng được ứng dụng rộng rãi bởi những ưu điểm sau:
o Mạng lưu trữ đưa ra khả năng mở rộng, cho phép kết nối hàng ngàn thiết bị lưu trữ phân tán trong phạm vi rộng lớn
Trang 8chiếm dụng băng thông của mạng cục bộ và không phải trung chuyển qua những máy chủ.
o Mạng lưu trữ cho phép cấu hình lại hoặc bảo trì hệ thống lưu trữ mà không yêu cầu dừng hoạt động của cả hệ thống
o Mạng lưu trữ cung cấp một giải pháp quản lý tập trung năng lực lưu trữ
Những năm đầu phát triển, thị trường SAN không được chú ý nhiều vì những yêu cầu cao khi cài đặt, vận hành, cũng như đầu tư Tuy nhiên nhiều năm trở lại đây công nghệ SAN đã được áp dụng nhiều tại Việt Nam, cũng như giải quyết được mọi yêu cầu cao khi triển khai một hệ thống mạng lưu trữ, không những đã được áp dụng mà còn phát triển mạnh ở các doanh nghiệp lớn
Đồ án tập trung tìm hiểu cơ bản công nghệ SAN, và các công nghệ liên quan như Cluster…Qua đó xây dựng mô phỏng một mô hình đơn giản để cho thấy cái nhìn tổng quan về công nghệ SAN Cấu trúc đồ án bao gồm:
Chương 1: “ Tổng quan về các công nghệ lưu trữ” giới thiệu về các công nghệ lưu trữ trước SAN và những tiềm năng của SAN
Chương 2: “ Giải pháp mạng lưu trữ SAN” giới thiệu các khái niệm cơ bản, các thành phần chính, các ứng dụng trong mạng SAN, việc quản lý và khai thác mạng SAN
Chương 3: “ Mô phỏng hệ thống SAN trên môi trường Cluster” sẽ triển khai demo
hệ thống mạng lưu trữ đơn giản dựa trên những kiến thức thu được
Cuối cùng, phần “Kết luận” tổng hợp lại những nghiên cứu chính của luận văn, giới thiệu một số hướng phát triển của SAN
Trang 9CHƯƠNG I TỔNG QUAN VỀ CÁC PHƯƠNG PHÁP LƯU TRỮ
1.1 GIỚI THIỆU VỀ MẠNG LƯU TRỮ (STORAGE AREA NETWORKS)
Xét tổng quan về phương diện kết nối, điểm khởi đầu của quá trình phát triển công nghệ lưu trữ là khi các máy tính và máy chủ nhỏ được trang bị các ổ đĩa trong của riêng chúng Với cách lưu trữ này, dung lượng lưu trữ không được lớn, thường chỉ có khả năng đáp ứng nhu cầu của người sử dụng đầu cuối
Bước phát triển tiếp theo là khi các máy chủ có kết nối riêng đến thiết bị lưu trữ bên ngoài của mình (có thể là đĩa cứng hoặc băng từ) qua đường kết nối hoạt động theo giao thức
SCSI (Small Computer System Interface) Mỗi máy tính/máy chủ chỉ có quyền kiểm soát, quản
trị thiết bị lưu trữ ngoài của chính mình Với cách kết nối và quản lý cục bộ như vậy, rất khó có thể xây dựng được những hệ thống dữ liệu có dung lượng cao, chưa nói đến việc không có được khả năng quản trị tập trung từ xa
Một hướng phát triển khác là khi thiết bị lưu trữ được thiết kế để dữ liệu trên đó có thể
được truy nhập qua mạng LAN thông thường Điển hình là các thiết bị NAS (Network Attached
Storage) chứa dữ liệu tập trung và cho phép chia sẻ dữ liệu ở mức file Mặc dù đã phần nào giải
quyết được vấn đề dung lượng và quản lý tập trung, nhưng việc truyền tải dữ liệu giữa thiết bị có nhu cầu sử dụng và thiết bị lưu trữ xảy ra trên hạ tầng mạng LAN thông thường, dùng giao thức mạng TCP/IP, gây hạn chế tốc độ truyền tải, dẫn đến hiệu năng hoạt động của cả hệ thống không được cao
Những nhược điểm về tốc độ và hiệu năng được đẩy lùi trong bước phát triển tiếp theo
với sự xuất hiện của cộng nghệ thiết lập mạng lưu trữ riêng biệt SAN (Storage Area Network)
Mặc dù có thể tận dụng mạng IP để truyền tải luồng dữ liệu của mạng lưu trữ, điển hình là sự
phát triển của các giao thức như iSCSI (Internet SCSI), FCIP (Fibre Channel over IP), iFCP (Internet Fibre Channel Protocol).
Trang 101.2 GIỚI THIỆU MỘT SỐ GIẢI PHÁP MẠNG LƯU TRỮ HIỆN NAY
1.2.1 Giải pháp lưu trữ DAS (Direct Attached Storage)
1.2.1.1 Giới thiệu DAS
Direct Attached Storage ( DAS ) là hệ thống lưu trữ mà trên đó các HDD , thiết bị nhớ được lưu trữ trực tiếp vào Server , nó thích hợp cho mọi nhu cầu nhỏ đến cao cấp nhất và khả năng chạy cũng cực nhanh
Một Server với những HDD bên trong , 1 Client với các HDD bên trong và truy xuất trực tiếp đến HDD của nó thì đó chính là DAS
Hình 1.1 Mô hình DAS (tổng quan)
1.2.1.2 Lợi ích khi sử dụng DAS (Direct Attached Storage)
Việc đầu tư ban đầu cho giải pháp kết nối trực tiếp DAS sẽ ít tốn kém hơn Đây là điểm thuận lợi cho các nhà quản trị IT với ngân sách hạn chế có thể nhanh chóng nâng cao dung lượng lưu trữ mà không cần lập kế hoạch, chi phí và độ phức tạp cao như hệ thống lưu trữ mạng
Trang 11DAS cũng có thể xem là một giải pháp tạm thời cho những kế hoạch chuyển sang
hệ thống lưu trữ mạng trong tương lai Đối với những công ty có dự báo nhu cầu dữ liệu tăng nhanh, DAS bị hạn chế về khả năng mở rộng Trên quan điểm hiệu quả về chi phí và quản trị, các giải pháp lưu trữ mạng thích hợp hơn cho những yêu cầu mở rộng sau này
Các doanh nghiệp mà sau cùng sẽ chuyển sang hệ thống lưu trữ mạng có thể bảo
vệ vốn đầu tư của mình cho các hệ thống DAS truyền thống Một lựa chọn là nối DAS vào mạng thông qua các thiết bị bridge, cho phép các nguồn tài nguyên hiện hữu được sử dụng trong một môi trường mạng mà không phải chi phí ngay lập tức cho hệ thống lưu trữ mạng Khi quá trình chuyển tiếp hoàn tất, DAS vẫn có thể được sử dụng cục bộ để lưu trữ các dữ liệu không quan trọng
1.2.2 Giải pháp lưu trữ NAS (Network Attached Storage)
1.2.2.1 Giới thiệu NAS
Network Atteched Storage ( NAS ) là công nghệ lưu trữ mà theo đó các thiết bị lưu trữ được gắn trực tiếp vào mạng IP và sử dụng các giao thức chia sẻ file để cho phép các thiết bị trên mạng IP truy cập vào
Tính năng :
o Thiết bị lưu trữ này được truy cập ở cấp độ file thông qua NFS hoặc CIFS
o Thiết bị được lưu trữ qua mạng IP
o Có thể Share dữ liệu giữa các Server
Trang 12Các thiết bị NAS cũng được gán các địa chỉ IP cố định và được người dùng truy nhập thông qua sự điều khiển của máy chủ Trong một số trường hợp, NAS có thể được truy cập trực tiếp không cần có sự quản lý của máy chủ NAS cung cấp khả năng chia sẻ tài nguyên lưu trữ cho nhiều người dùng đồng thời Bên cạnh đó, NAS cho phép thực hiện mở rộng về dung lượng lưu trữ khi nhu cầu sử dụng tăng cao.
Hệ thống lưu trữ mạng ra đời nhằm giải quyết các thách thức gắn liền với cơ sở hạ tầng dựa trên máy chủ như DAS Hệ thống lưu trữ nối mạng NAS là một thiết bị chuyên dụng, bao gồm đĩa cứng và phần mềm quản lý, được dành riêng cho việc phục vụ các tập tin trên mạng Với 2 chức năng là chia sẻ tập tin và phục vụ ứng dụng trong mô hình DAS, một máy chủ có khả năng làm chậm hệ thống mạng NAS làm giảm nhẹ các khả năng lưu trữ và phục vụ tập tin của máy chủ này, mang lại nhiều sự linh hoạt trong việc truy xuất dữ liệu
Việc lắp đặt, cấu hình hệ thống tương đối dễ dàng vì các nhà cung cấp đã lập trình thiết bị này một cách hoàn hảo sao cho khi khởi động thiết bị, chúng sẽ nhận ra môi trường điều hành của chúng, khả năng tương thích với các hệ thống truy cập tên/mật khẩu hiện có và tương thích với các hệ thống chia sẻ file, tận dụng khả năng lưu trữ với dung lượng lớn và các ứng tích hợp sẵn là những điểm mạnh của hệ thống NAS
Các thiết bị quản lý gồm có một máy tính có cài đặt hệ điều hành NAS ví dụ như FreeNAS hoặc các phiên bản hệ điều hành UNIX đơn giản
1.2.2.2 Chức năng giải pháp lưu trữ NAS (Network Attached Storage)
Trang 13Hình 1.3 Mô hình NAS (tổng quan)
Các tính năng độ tin cậy cao như RAID, các ổ đĩa và thành phần có thể thay nóng trở thành tiêu chuẩn, thậm chí trong các hệ thống NAS nhỏ Các hệ thống tầm trung có khả năng cung cấp các tính năng bảo vệ dữ liệu cao hơn như replication và mirroring nhằm bảo đảm tính liên tục trong kinh doanh NAS cũng có ích cho các doanh nghiệp đang tìm cách thống nhất các tài nguyên DAS nhằm khai thác hiệu quả hơn Vì các tài nguyên không thể được chia sẻ trong DAS, các hệ thống này có thể đang sử dụng ít hơn 50% dung lượng hiện có
Các hệ thống NAS có thể cung cấp dung lượng lưu trữ đến hàng terabytes mà vẫn chiếm rất ít không gian, nâng cao khả năng sử dụng hiệu quả không gian của trung tâm
dữ liệu
Khi dung lượng tiếp tục tăng, các doanh nghiệp có yêu cầu mở rộng cao sẽ càng nhận thấy tính hiệu quả về kinh tế cùa NAS so với DAS Hàng loạt các hệ thống NAS cũng có thể được quản lý tập trung, tiết kiệm thời gian và công sức
Một điểm quan trọng khác cho các doanh nghiệp vừa và lớn là khả năng chia sẻ dữ liệu không đồng nhất Với DAS, mỗi máy chủ có hệ điều hành riêng của mình, vì vậy không
có một hệ thống lưu trữ chung nào trong một môi trường bao gồm các máy trạm Windows, Mac và Linux
Các hệ thống NAS có thể tích hợp vào bất kỳ môi trường nào và phục vụ các tập
Trang 14lưu trữ và lấy lại trên hệ thống NAS ở dạng tập tin truyền thống NAS cũng dựa trên các giao thức mạng tiêu chuẩn như TCP/IP, FC và CIFS.
1.2.2.3 Lợi ích khi sử dụng NAS (Network Attached Storage)
NAS là một lựa chọn cho các công ty đang tìm kiếm một giải pháp đơn giản và hiệu quả về chi phí nhằm đạt được sự truy xuất dữ liệu nhanh chóng cho hàng loạt người dùng
ở mức tập tin Lợi điểm của NAS là tốc độ và năng suất NAS phổ biến trong thị phần các doanh nghiệp nhỏ và vừa Đối với các công ty nhỏ, NAS là một giải pháp “plug-and-play”, dễ cài đặt, triển khai và quản lý, thậm chí không cần nhân viên IT
1.2.3 Giải Pháp lưu trữ SAN (Storage Area Network)
1.2.3.1 Giới thiệu SAN
Storage Area Network ( SAN ) là một mạng được thiết kế cho việc thêm các thiết
bị lưu trữ cho máy chủ một cách dễ dàng như: Disk Aray Controllers, hay Tape Libraries
Và các máy chủ khi kết nối với SAN sẽ hiểu như là một khối HDD đang chạy trên cục bộ
Với những ưu điểm nổi chội SAN đã trở thành một giải pháp rất tốt cho lưu trữ thông tin cho doanh nghiệp hay tổ chức SAN cho phép kết nối từ xa tới các thiết bị lưu trữ trên mạng như Disks và Tape drivers Các thiết bị lưu trữ trên mạng, hay các ứng dụng chạy trên đó được thể hiện trên máy chủ như một thiết bị của máy
Việc truyền dữ liệu từ Server đến hệ thống lưu trữ SAN được sử dụng dựa trên các cổng quang để truyền dữ liệu : 1 GBb/s Fiber Channel , 2 GBb/s Fiber Channel , 4 GBb/s Fiber Channer , 8 GBb/s Fiber Channer , 1 GBb/s iSCSI ,
Chi phí triển khai hệ thống SAN cực kỳ đắt , nó đòi hỏi phải dùng các thiết bị Fiber Channel Networking, Fiber Channel Switch,
Trang 15Hình 1.4 Mô hình SAN (tổng quan)
Trang 161.2.3.2 Chức năng SAN
Hình 1.5 Một mô hình SAN
Trong khi DAS hay NAS được tối ưu cho việc chia sẻ dữ liệu ở cấp độ tập tin, điểm mạnh của SAN là ở khả năng di chuyển các khối dữ liệu lớn Điều này đặc biệt quan trọng cho các ứng dụng yêu cầu băng thông rộng như cơ sở dữ liệu, xử lý hình ảnh
và giao dịch Cấu trúc phân bố của SAN cũng đem lại tốc độ và tính sẵn sàng cao hơn các môi trường lưu trữ khác Bằng việc cân bằng tải động qua hệ thống mạng, SAN truyền tải
dữ liệu nhanh, giảm độ chậm trễ và tải cho các máy chủ Lợi điểm này cho phép một số lượng lớn người dùng có thể truy xuất dữ liệu đồng thời mà không tạo ra các điểm nghẽn mạch trên mạng cục bộ và các máy chủ
1.2.3.4 Lợi ích khi sử dụng SAN
Dễ dàng chia sẻ lưu trữ và quản lý thông tin, mở rộng lưu trữ dễ dàng thông qua quá trình thêm các thiết bị lưu trữ vào mạng không cần phải thay đổi các thiết bị như máy chủ hay các thiết bị lưu trữ hiện có
Trang 17Ứng dụng cho các hệ thống Data centrer và các Cluster Mỗi thiết bị lưu trữ trong mạng SAN được quản lý bởi một máy chủ cụ thể.
Trong quá trình quản lý của SAN sử dụng Network Attached Storage (NAS) cho phép nhiều máy tính truy cập vào cùng một file trên một mạng Và ngày nay có thể tích hợp giữa SAN và NAS tạo nên một hệ thống lưu trữ thông tin hoàn thiện
SAN được thiết kế dễ dàng cho tận dụng các tính năng lưu trữ, cho phép nhiều máy chủ cùng chia sẻ một thiết bị lưu trữ
Một ứng dụng khác của SAN là khả năng cho phép máy tính khởi động trực tiếp từ SAN mà chúng quản lý Điều này cho phép dễ dàng thay các máy chủ bị lỗi khi đang sử dụng và có thể cấu hình lại cho phép thay đổi hay nâng cấp máy chủ một cách dễ dàng và
dữ liệu không hề ảnh hưởng khi máy chủ bị lỗi Và quá trình đó có thể chỉ cần nửa giờ để
có một hệ thống Data Centers Và được thiết kế với tốc độ truyền dữ liệu cực lớn và độ
an toàn của hệ thống được coi là vấn đề hàng đầu
SAN cung cấp giải pháp khôi phục dữ liệu một cách nhanh chóng bằng cách thêm
và các thiết bị lưu trữ và có khả năng khôi phục cực nhanh dữ liệu khi một thiết bị lưu trữ
bị lỗi hay không truy cập được
Các hệ thống SAN mới hiện nay cho phép (duplication) sao chép hay một tập tin được ghi tại hai vùng vật lý khác nhau (clone) cho phép khôi phục dữ liêu cực nhanh
Thiết bị lưu trữ SAN storage cho phép khắc phục các nhược điểm đồng thời bổ sung và tăng cường nhiều tính năng cần thiết cho các hệ thống lưu trữ
Tăng tính mở rộng: Cho phép nhiều server, cluster server hơn đồng thời kết nối và
dùng chung không gian lưu trữ
Tăng tính lưu động của hệ thống: cho phép các hoạt động như đồng bộ hóa dữ liệu
giữa các trung tâm cơ sở dữ liệu, di dời dữ liệu sang các nền tảng phần cứng khác
LAN-free backups: cho phép gửi dữ liệu trục tiếp đến các thiết bị sao lưu trong
SAN mà không thông qua LAN
Server-free backups: dòng dữ liệu trong quá trình sao lưu dữ liệu được truyền tải
trực tiếp giữa các thiết bị sao lưu bên trong SAN Điều này giúp loại bỏ tài nguyên CPU
Trang 18phối, thu hồi và thay đổi không gian lưu trữ cho các server mà không phải dừng các server này như đối với các hệ thống lưu trữ đĩa cứng truyền thống
SAN cung cấp các phương pháp mới cho việc bổ sung thêm tài nguyên lưu trữ cho các server Các phương pháp mới này cũng giúp tăng cường hiệu suất và nâng cao tính sẳn sàng của toàn bộ hệ thống Ngày nay, SAN được dùng chủ yếu để kết nối các hệ thống lưu trữ và hệ thống sao lưu dự phòng cho nhiều server và được dùng bởi các cluster server cho mục đích nâng cao tính chịu lỗi và tính sẳn sàng của hệ thống thông tin doanh nghiệp
Phân biệt SAN và NAS: dựa trên phương thức trao đổi dữ liệu theo file hay khối
(block) NAS truyền tải các file qua các giao thức hướng file như NFS (Network File System) hay CIFS (Common Internet File System) trong khi SAN truyền tải các khối bằng giao thức hướng khối như SCSI-3.
Hình 1.6 So sánh NAS và SAN
Trang 191.3 ƯU NHƯỢC ĐIỂM CỦA CÁC HỆ THỐNG LƯU TRỮ DAS, NAS, SAN
1.3.1 Hệ thống Direct Attached Storage - DAS
o Về lâu dài, khi nâng cao hệ thống dung lượng này thì dữ liệu sẽ bị phân đoạn và phân tán trên các hệ thống khác nhau, khó cho việc quản trị Xét về mặt tổng thể sẽ làm tăng chi phí lưu trữ trên toàn bộ hệ thống mạng
1.3.2 Hệ thống Network Attached Storage - NAS
Ưu điểm:
o Tận dụng được khả năng lưu trữ với dung lượng lớn và các ứng dụng tích hợp sẵn là một điểm mạng của hệ thống NAS
o Cài đặt tương đối dễ dàng, khả năng tương thích cao
o Các thiết bị NAS tự quản lý các chức năng hệ thống file nên chúng không cần đến máy chủ để thực hiện chức năng này Các mạng sử dụng các thiết
bị DAS được gắn với máy chủ sẽ yêu cầu máy chủ quản lý các chức năng
hệ thống file Đây là điểm mạnh của NAS, NAS sẽ giải phóng máy chủ để
Trang 20file Điều này cũng có nghĩa là thiết bị NAS sẽ đơn giản hơn trong việc cấu hình và bảo trì cho các môi trường thực thi nhỏ vì chúng không yêu cầu máy chủ chuyên dụng.
Nhược điểm
o NAS không thể mở rộng một cách dễ dàng
o Các hệ thống NAS được sử dụng trong các mạng phát triển nhanh thường không đủ khả năng quản lý lưu lượng tăng, thậm chí nếu chúng có thể quản
lý dung lượng lưu trữ
o Hiệu suất của NAS phụ thuộc nhiều vào tốc độ và lưu lượng của mạng và dung lượng bộ nhớ đệm trên chính thiết bị hoặc trên máy tính NAS
o Khả năng thực thi của NAS bị giới hạn khi có quá nhiều người dùng hoặc
có quá nhiều các tác vụ I/O và yêu cầu năng lực xử lý quá lớn của CPU
1.3.3 Hệ thống Storage Area Network - SAN
Ưu điểm:
o Dễ dàng chia sẻ lưu trữ và quản lý thông tin
o Mở rộng lưu trữ dễ dàng thông qua quá trình thêm các thiết bị lưu trữ vào mạng không cần phải thay đổi các thiết bị như máy chủ hay các thiết bị lưu trữ hiện có
o Cho phép nhiều máy chủ cùng chia sẻ một thiết bị lưu trữ
o Cho phép thay đổi hay nâng cấp máy chủ một cách dễ dàng và dữ liệu không hề ảnh hưởng khi máy chủ bị lỗi
o Các hệ thống SAN cũng có nhiều ưu điểm hơn so với các hệ thống NAS Cho ví dụ, nó cho phép dễ dàng thay thế một máy chủ bị lỗi trong hệ thống SAN, trong khi đó việc thay thế một thiết bị NAS dù có hay không được nhóm với các thiết bị NAS khác là rất khó khăn Thêm vào đó, cũng dễ dàng hơn nhiều trong việc phân phối theo địa lý các mảng bên trong một hệ
Trang 21thống SAN Kiểu phân phối theo địa lý này thường rất có giá trong việc chống cũng như khắc phục thảm họa.
Trang 22o Ưu điểm lớn nhất của các hệ thống SAN là chúng cung cấp cách thức quản
lý đơn giản, khả năng mở rộng cao, linh hoạt, backup và truy cập dữ liệu được cải thiện Với lý do này, các cấu hình SAN đang trở thành phổ biến hơn cả cho các doanh nghiệp lớn thực sự quan tâm đến vấn đề lưu trữ dữ liệu
Trang 23CHƯƠNG II
GIẢI PHÁP MẠNG LƯU TRỮ SAN2.1 GIỚI THIỆU MẠNG LƯU TRỮ STORAGE AREA NETWORK (SAN)
Mạng lưu trữ SAN (Storage Area Network) được định nghĩa là một mạng dành
riêng liên kết giữa các máy chủ và thiết bị lưu trữ Nó có cấu trúc tương tự mạng cục bộ
(LAN) nhưng tách biệt khỏi mạng cục bộ Máy chủ và các thiết bị lưu trữ gọi là các nút (node) trong mạng lưu trữ.
Hình 2.1 Hình mô tả khái quát SAN
Mạng lưu trữ là giải pháp mới, kết nối các thiết bị lưu trữ với máy chủ SAN sử dụng những tiến bộ trong công nghệ mạng nhằm nâng cao băng thông, hiệu năng thực thi
và độ sẵn sàng cao cho hệ thống lưu trữ Mạng lưu trữ được sử dụng để kết nối: các mạng
đĩa được chia sẻ (Shared Storage Aray), các cụm máy chủ (Cluster Server), các đĩa hay ổ băng từ của máy tính lớn (MainFrame Disk or Tape) với các máy chủ hoặc máy trạm
Đơn giản, mạng lưu trữ là một mạng thông thường được tạo nên từ giao diện các thiết bị
Trang 24không chiếm băng thông của hệ thống mạng Mạng lưu trữ thể hiện một hướng chia sẻ không gian lưu trữ mới, cho phép nhiều máy chủ cùng chia sẻ một không gian lưu trữ Mạng lưu trữ hỗ trợ ba kiểu trao đổi dữ liệu:
o Máy chủ tới thiết bị lưu trữ: là kiểu kết nối truyền thống, mạng lưu trữ có
ưu điểm lớn là cho phép nhiều máy chủ truy xuất tuần tự hoặc cùng lúc tới một thiết bị lưu trữ
o Máy chủ tới máy chủ: sử dụng mạng lưu làm đường truyền thông giữa các máy chủ
o Thiết bị lưu trữ tới thiết bị lưu trữ: cho phép truyền tải dữ liệu giữa các thiết
bị lưu trữ mà không có sự can thiệp của máy chủ Điều này giúp cho dữ liệu được truyền tải nhanh hơn đồng thời không tốn thời gian xử lý của CPU
Sử dụng giải pháp lưu trữ SAN mang đến những lợi ích cơ bản sau đây:
o Cải thiện hơn đối với những ứng dụng sẵn có: lưu trữ độc lập với các ứng dụng và truy cập thông qua nhiều đường dẫn dữ liệu với độ tin cậy tốt hơn, sẵn sàng và khả năng phục vụ sẽ tốt hơn
o Tập trung và hợp nhất lưu trữ: quản lý đơn giản, khả năng mở rộng, linh hoạt và sẵn sàng
o Vì mạng lưu trữ riêng biệt so với mạng nội bộ nên cho phép sao chép, sao lưu dữ liệu từ xa để bảo vệ khi có thiên tai và chống lại các cuộc tấn công nguy hiểm
2.2 CÁC DẠNG CỦA MẠNG LƯU TRỮ
SAN được xây dựng với thiết kế dành riêng cho việc lưu trữ và truyền thông tin
Nó cung cấp khả năng truyền dữ liệu với tốc độ lớn với độ an toàn cao hơn các giao thức khác như NAS
Hầu hết các công nghệ SAN là mạng cáp quang (Fiber Channel Networking) với các thiết bị lưu trữ sử dụng các ổ đĩa SCSI Một dạng cụ thể là Fibre Channel SAN được xây dựng bởi Fibre Channel Switch được kết nối tới các thiết bị thông qua hệ thống cáp
Trang 25quang Ngày nay hầu hết các hệ thống SAN đều sử dụng giải pháp định tuyến Fibre Channel, và mang lại khả năng mở rộng lớn cho cấu trúc SAN cho phép kết hợp các hệ thống SAN lại với nhau Tuy nhiên hầu hết quá trình đó đều với mục đích dữ liệu tập trung và truyền với tốc độ cực cao với khoảng cách xa hơn thông tầng vật lý là cáp quang, switch quang
Một dạng khác của SAN là sử dụng giao thức iSCSI, nó sử dụng giao thức SCSI trên nền tảng TCP/IP Trong dạng này, các switch tương tự như Ethernet Switchs Chuẩn iSCSI được giới thiệu năm 2003 và được triển khai rộng lớn trong quá trình lưu trữ mạng (lưu trữ không yêu cầu tốc độ lớn) và từ khi ứng dụng cáp quang trong quá trình truyền
dữ liệu mang lại hiệu năng lớn cho iSCSI Ngày nay hầu hết các hệ thống isSCSI sử dụng cáp quang trong quá trình truyền dữ liệu và sử dụng giao thức NAS như CIFS và NFS
Một dạng khác của iSCSI là ATA-over-Ethernet hay giao thức AoE được xây dựng sử dụng giao thức ATA trên khung nền tảng Ethernet Trong khi giao thức Ethernet như AoE không thể định tuyến và cung cấp các hiệu năng khác nhau
Kết nối với SAN sẽ có một hay nhiều máy chủ và một hay nhiều các thiết bị lưu trữ khác nhau Trong FC SAN máy chủ cũng sử dụng cáp quang để truyền dữ liệu (host bus adapter and Optical fibre) iSCSI SAN sử dụng giao thức Ethernet bình thường thông qua card mạng hay TOE card
Tùy theo nghi thức truyền tải dòng dữ liệu SCSI, có thể chia SAN thành 2 loại:
Fibre Channel SAN (FC-SAN): Fibre channel được thiết kế để dành riêng cho
việc truyền tải dữ liệu dạng khối (tương phản với mạng IP truyền tải dữ liệu ở mức độ file) Ngày nay, fibre channel được dùng chủ yếu cho mục đích truyền tải dòng dữ liệu SCSI trong các hệ thống SAN và các hệ thống SAN dùng fibre channel được gọi là FC-SAN
IP-SAN: Người ta đã định nghĩa một giao thức mới gọi là iSCSI để cho phép
dòng dữ liệu SCSI được đóng gói và truyền tải trên mạng TCP/IP truyền thống Một mạng IP dành riêng cho mục đích này được gọi là IP-SAN
Trang 262.3 CÁC THÀNH PHẦN CỦA MẠNG LƯU TRỮ - SAN COMPONENTS
Một SAN được xây dựng dựa trên cơ sở kết nối các thiết bị lưu trữ và máy chủ lại với nhau Trong phần này trình bày về các hệ thống máy chủ, các thành phần, cách thức kết nối
Hình 2.2 các thành phần trong mạng SAN
2.3.1 Hệ thống máy chủ
Máy chủ SAN là những phần tử tính toán được gắn trực tiếp vào mạng SAN Máy chủ SAN có nhiệm vụ quản lý và trừu tượng hóa thiết bị lưu trữ Máy chủ SAN có thể hoạt động trên nhiều hệ điều hành khác nhau như Windows NT, UNIX, OS/390 Một mạng SAN có thể có nhiều máy chủ SAN hoạt động trong một môi trường hỗn hợp
2.3.1.1 Mainframe servers
Đơn giản là một máy chủ lớn và duy nhất, và có xử lý đa khối với hiệu suất cao và
có khả năng nâng cấp và phát triển thêm hệ thống Mainframes có một vai trò quan trọng với khả năng lưu trữ tùy thuộc vào các doanh nghiệp có khả năng đầu tư vào hệ thống lưu trữ của mình
IBM eServer zSeries (trước đây được gọi là kiến trúc S/390 ®) là một bộ xử lý (s)
và thiết lập hệ điều hành lớn Trong quá khứ, zSeries máy chủ có hỗ trợ nhiều hệ điều hành khác nhau, như là z / OS, OS/390 ®, VM, VSE, và TPF, đã được tăng cường qua
Trang 27nhiều năm Để xử lý các thiết bị lưu trữ và các kết nối cũng đã phát triển từ một bus và thẻ giao diện ESCON các kênh, và bây giờ là FICON kênh.
Hình 2.3 Giao diện kết nối bộ vi xử lý vào thiết bị lưu trữ
Do các kiến trúc khác nhau, và vô cùng chặt chẽ và tích hợp dữ liệu nên yêu cầu
về quản lý và việc thực hiện các FICON đã được một số phần đằng sau của FCP trên các
hệ thống mở Ngoài ra để FICON cho những hệ điều hành zSeries truyền thống, IBM nhứng bộ tiếp hợp kênh sợi có thể thực thi trên hệ điều hành linux
2.3.1.2 UNIX-based servers
Ban đầu được thiết kế cho thống máy tính công suất cao, chẳng hạn như mainframes, các hệ điều hành UNIX ngày hôm nay là dựa trên một loạt các nền tảng phần cứng, từ Linux khác nhau, dựa trên máy tính dành cho quy mô lớn của sự phát triển mạng mẽ của ngành công nghệ thông tin
IBM eServer pSeries ® dòng máy chủ, chạy một hệ điều hành UNIX gọi là AIX, cung cấp các bộ xử lý để lưu trữ giao diện, bao gồm cả SCSI, SSA,và sợi, Kênh Các SSA interconnection có chủ yếu được sử dụng cho đĩa kho chứa Fibre Channel, các adapter có khả năng kết nối vào và băng đĩa
Trang 28Hình 2.4 Giao diện kết nối bộ vi xử lý pSeries vào thiết bị lưu trữ
Các nhà cung cấp hệ thống UNIX khác nhau trên thị trường triển khai các biến thể khác nhau của các Hệ điều hành UNIX, từng có một số phụ kiện duy nhất, và thường xuyên hỗ trợ hệ thống tập tin khác nhau như: Tạp chí hệ thống tập tin (JFS), Tạp chí tăng cường hệ thống tập tin (JFS2), và Andrew File System (AFS ®) Các máy server lưu trữ tương tương tự với pSeries, như được hiển thị trong Hình 2-5
2.3.1.3 WINDOWS-based servers
Dựa trên các báo cáo của nhiều nhà phân tích liên quan đến tốc độ tăng trưởng trong các máy chủ Windows trên thị trường (số lượng và kích thước của máy chủ Windows), Windows sẽ trở thành thị trường lớn nhất cho việc triển khai giải pháp SAN Xem thêm chi tiết và Windows Máy chủ sẽ lưu trữ nhiệm vụ quan trọng mà các ứng dụng sẽ được hưởng lợi từ các giải pháp SAN, chẳng hạn như băng đĩa và pooling, băng chia sẻ, multipathing, và sao chép từ xa.Việc xử lý để giao diện lưu trữ trên máy chủ Series ® (IBM Intel ® dựa trên bộ xử lý có hỗ trợ của Microsoft ® hệ điều hành Windows) là tương tự như hỗ trợ trên máy chủ Unix, bao gồm cả SCSI và Fibre Channel
2.3.1.4 Other servers
Các kiến trúc hệ thống iSeries ™ được định nghĩa như một interface của máy tính
cao cấp (high-level), gọi tắt là Technology Independent Machine Interface (TIMI), trong
đó cô lập các ứng dụng (và nhiều hệ điều hành) từ thực tế hệ thống phần cứng
Trang 29Bộ vi xử lý chính và các bộ vi xử lý của các thiết bị I/O được liên kết bằng cách sử dụng một hệ thống bus, bao gồm Systems Product Division (SPD), và cũng có thể là Peripheral Component Interconnect (PCI).
Hình dưới tóm tắt sự đa dạng các module trong kiến trúc iSeries
Hình 2.5 Thiết kế phần cứng iSeries
Một số kiến trúc đặc trưng của các máy chủ iSeries phân biệt hệ thống này với các
hệ thống khác trong vô số các hệ thống thường được sử dụng trong các ngành công nghiệp Các tính năng này bao gồm:
o Công nghệ có giao diện độc lập
o Đối tượng dựa trên các hệ thống thiết kế
Lớp cấp thấp (Lower level layers)
Lớp này tương đương với các tầng data-link, physical và network trong mô hình mạng OSI
Trang 30là để áp dụng trong lĩnh vực siêu máy tính nhưng sau này kênh cáp quang đã thành chuẩn kết nối cho mạng lưu trữ (SAN), tín hiệu Fibre Channel có thể được truyền tải trên cả cặp dây cáp đồng xoắn hoặc cáp quang.
Bảng 2.1 Các loại kênh cáp quang
Tên Tốc độ kết nối (gbit/s) Thông lượng (Mb/s)
Topo mạng Fibre Channel :
Có 3 topo chính của Fibre Channel mô tả các phương thức kết nối các cổng với nhau Một cổng trong thuật ngữ Fibre Channel chỉ bất kỳ thực thể nào mà truyền và nhận tín hiệu trên mạng và không nhất thiết tương ứng với một cổng vật lý Cổng thường được triển khai trong các thiết bị như tủ lưu trữ sử dụng đĩa cứng, card giao tiếp quang trên máy chủ, bộ chuyển mạch kênh cáp quang
Point-to-Point (FC-P2P) Hai thiết bị được kết nối trực tiếp tới nhau Đây là topo đơn
giản nhất nhưng cũng giới hạn nhất
Trang 31Arbitrated loop (FC-AL) Trong thiết kế này, các thiết bị được nối thành một
vòng tròn, tương tự như topo token ring trong mạng IP Bổ sung hoặc tháo gỡ một thiết bị khỏi vòng sẽ gây gián đoạn cho toàn bộ các thiết bị còn lại Một thiết bị hỏng cũng sẽ làm vòng bị đứt hỏng Thông thường, người ta sử dụng một hub Fibre Channel để nối nhiều thiết bị với nhau và loại bỏ thiết bị hỏng để tránh nhược điểm nêu trên Vòng lặp cũng có thể được tạo ra thông qua việc nối mỗi cổng tới cổng tiếp theo tạo thành vòng tròn Một vòng lặp tối thiểu phải có hai cổng Trong trường hợp đó, về kết nối sẽ tương tự như FC-P2P nhưng về giao thức thì khác biệt hoàn toàn
Switched fabric (FC-SW) Tất cả các thiết bị hay vòng lặp được kết nối tới bộ
chuyển mạch Fibre Channel, tương tự như triển khai mạng Ethernet hiên đại Bộ chuyển mạch quản lý tình trạng của mạng fabric và cung cấp kết nối tối ưu
Bảng 2.2 So sánh giữa các Topo của Fibre Channel
Thuộc tính Point –to- point Arbitrated loop Swiched fabric
Hổ trợ tốc độ kết
Chuyển gói tin Theo thứ tự Theo thứ tự Không bảo đảm
Truy cập tới
phương tiện dành riêng Được điều khiển dành riêng
Trang 32Các tầng Fibre Channel :
Fibre Channel là một giao thức phân tầng gồm 5 tầng khác nhau, cụ thể:
o FC0 Tầng vật lý bao gồm cáp, cổng kết nối quang (giao diện kết nối điện, cách
đấu nối đầu cáp v.v
o FC1 Tầng kết nối dữ liệu thực hiện mã hóa và giải mã tín hiệu theo cách 8b/10b
(chuyển tín hiệu từ 8bit thành 10bit để đảm bảo không có quá 3 bit không hoặc 3 bit một liền nhau tránh rủi ro lỗi khi truyền tín hiệu với khoảng cách xa)
o FC2 Tầng mạng, được định nghĩa trong chuẩn FC-PI-2 bao gồm phần lõi của
Fibre Channel và định nghĩa cơ bản về giao thức Fibre Channel
o FC3 Tầng dịch vụ chung, một tầng mỏng cung cấp các dịch vụ như đăng nhập,
đăng xuất, trạng thái hoặc mã hóa như RAID
o FC4 Tầng giao thức: hỗ trợ các giao thức khác như SCSI có thể được truyền qua
FC2 FC0, FC1, và FC2 còn được gọi là FC-PH, các tầng vật lý của Fibre Channel
Bộ định tuyến (router) Fibre Channel hoạt động tới tầng FC4 bộ chuyển mạch hoạt động tới tầng FC2 còn hub chỉ hoạt động ở FC0 Các sản phẩm Fibre Channel hoạt động ở tốc độ 1 Gbit/s, 2 Gbit/s, 4 Gbit/s, 8 Gbit/s và 10 Gbit/s
SCSI ( Small Computer System Interface )
Tương tự EIDE, SCSI là bus điều khiển dòng dữ liệu (I/O) giữa bộ xử lý và thiết
bị ngoại vi (thông dụng nhất chính là đĩa cứng) Nhưng khác EIDE, SCSI nối vào bus PCI và ISA thông qua host adapter - thiết bị không giữ chức năng điều khiển mà chỉ điều phối, liên kết thiết bị SCSI thành chuỗi luận lý Bộ điều khiển SCSI thực sự nằm trên mạch của từng ổ đĩa cứng
Nếu xét về số lượng thiết bị quản lý, SCSI thực sự mạnh vì có thể quản lý đến 8 thiết bị (tính cả host adapter); trong khi IDE chỉ quản lý được 2 ổ đĩa cứng và EIDE hỗ trợ 4 thiết bị Hơn nữa, giao tiếp SCSI còn thích hợp với nhiều chủng loại thiết bị: ổ đĩa cứng, ổ CD-ROM, ổ CD-R, ổ quang, máy in, máy quét, bộ chuyển đĩa, card mạng,
Trang 33Lớp trung cấp (Midle level layers)
Phần này bao gồm các giao thức thể hiện ở các tầng Transport và Session trong
mô hình mạng cơ bản OSI
iSCSI (Internet SCSI)
iSCSI là một giao thức cho phép hai host có thể gửi các lệnh SCSI trên mạng TCP/IP Bằng cách thực hiện này, chúng ta vẫn có thể sử dụng SCSI nhưng giải phóng được bản thân khỏi các hạn chế trong việc nối cáp SCSI truyền thống thay vì sử dụng LAN để kết nối với các máy tính SCSI của bạn và máy chủ đến khu vực lưu trữ SCSI
iSCSI là một kiểu mạng lưu trữ – storage area network (SAN) và nó được so sánh một cách điển hình với Fibre Channel (FC) – một đối thủ cạnh tranh đắt giá hơn rất nhiều của nó
Với iSCSI, giả sử có một client Client này sử dụng phần mềm khởi tạo để kết nối đến máy chủ lưu trữ (được gọi là target) Tuy bộ khởi tạo phần mềm iSCSI client có trong Windows Vista và Windows Server 2008, nhưng iSCSI target (máy chủ) vẫn thường có giá cả chi phí rất cao
FCIP (Fibre Channel over IP)
Fibre Channel over IP (FCIP) cũng được biết đến như là một đường hầm Fibre Channel hay đường hầm lưu trữ Nó là một phương pháp cho phép các thông tin Fibre Channel được truyền tải thông qua đường hầm sử dụng giao thức ip Bởi vì phần lớn hiện nay các doanh nghiệp đều có sẵn cơ sở hạ tầng là mạng IP cho nên việc sử dụng FCIP mang đến những hiệu quả cao về chi phí, lắp đặt cũng như bảo trì
FCIP đóng gói các khối dữ liệu Fibre Channel sau đó truyền đi qua một TCP socket Dịch vụ TCP/IP được dùng để thiết lập kết nối tới SANs từ xa Việc quản lý , bảo trì, vận hành và xử lý việc quá tải, dữ liệu mất mát, đều thao tác dựa vào dịch vụ TCP/IP cho nên nó không có bất kỳ ảnh hưởng nào đến cấu trúc của dịch vụ Fibre Channel
iFCP (Internet Fibre Channel Protocol)
Internet Fibre Channel Protocol (iFCP) là một cơ chế truyền dữ liệu đến và từ
Trang 34thể sẽ được sử dụng với giao thức Fibre Channel hiện tại chẳng hạn như FCIP.
iFCP là một giao thức gateway-to-gateway, và không chỉ đơn giản đóng gói khối
dữ liệu Các thiết bị Gateway được sử dụng như là phương tiện truyền thông giữa các điểm đầu cuối FC
Lớp cao cấp (Higher level layers)
Phần này thể hiện cho tầng Presentation và Application
Server-attached storage
Là phương pháp dễ nhất để gắn các thiết bị lưu trữ vào một máy chủ Phương pháp này mang lại hiệu quả về chi phí ở mức tối thiểu Về nguyên lý, là gắn trực tiếp thiết bị lưu trữ vào bus của máy chủ bằng cách sử dụng một adapter interface, và các thiết bị lưu trữ đó chỉ đi theo (dành riêng) cho riêng máy chủ mà nó gắn vào Máy chủ sẽ tự kiểm soát các thiết bị vào ra, tự theo dõi, giám sát và điều khiển các thiết bị đó Việc sử dụng phương pháp này để liên kết giữa thiết bị lưu trữ và máy chủ hiện nay không được sử dụng phổ biến vì càng có nhiều nhược điểm về hiệu năng và hỗ trợ thấp các kiểu sao lưu,
dự phòng
Network Attached Storage
NAS giống một máy chủ mạng từ đó các máy trạm có thể truy cập để nhận file dữ liệu Hệ thống lưu trữ đính kèm có thể mang tên một ổ đĩa hoặc được gọi là một thiết bị lưu trữ từ xa Thông thường hệ điều hành sử dụng một giao thức như NFS (Network File System) hoặc CIFS (Common Internet File System) để phát hiện, truy nhập và giao tiếp
dữ liệu với thiết bị lưu trữ Cả hai giao thức NFS và CIFS đều giao tiếp thông qua Ethernet Người sử dụng sẽ được phép truy cập một thiết bị cụ thể nào đấy thông qua việc đăng nhập tên và mật khẩu
Các thiết bị NAS cần thiết để lưu trữ các ứng dụng lớn, chỉ một mục đích duy nhất
mà bạn kết nối vào mạng Những ứng dụng thực hiện tốt một nhiệm vụ bởi việc truyền file nhanh chóng NAS là sự lựa chọn tốt nhất đối với các loại ứng dụng chia sẻ dữ liệu trên Unix và Window NT
Trang 35Tuy nhiên, NAS cũng có giới hạn Tốc độ ổ đĩa mạng không bằng ổ đĩa cứng cục bộ: Tốc độ truyền tải trên mạng (trong khoảng 11 đến 100 Mb/giây) chậm hơn nhiều lần tốc độ truyền tải của ổ đĩa cứng gắn trong lẫn gắn ngoài (đạt 480 Mb/giây với giao tiếp USB 2.0), ngoại trừ trường hợp mạng thuộc loại gigabit (1.000 Mb/giây) Tuy vậy, đa phần thiết bị NAS hiện nay đủ nhanh cho yêu cầu sao lưu và chia sẻ máy in trong nhóm nhỏ.
2.3.3 Các thiết bị kết nối SAN
Giống như mạng LAN, SAN thường sử dụng một số thiết bị như Extenders, Mux, Hubs, Routers, Switchs, Directors để kết nối giữa các thành phần SAN Trong giải pháp
mạng SAN cụ thể, người ta có thể sử dụng nhiều loại thiết bị và kiến trúc kết nối khác nhau để đạt được hiệu quả tốt nhất
Các thiết bị kết nối SAN
o Thiết bị điều hợp (Host Bus Adapter): HBA là thiết bị kết nối giữa thiết bị chủ
quản (thiết bị lưu trữ hay máy chủ) với mạng SAN và chức năng của nó là biến đổi những tín hiệu song song từ bus của thiết bị lưu trữ hay của máy chủ sang dạng tín hiệu tuần tự để gửi vào mạng SAN
Một HBA có thể có nhiều cổng giao tiếp cùng hay khác loại nhằm cung cấp thêm kết nối với mạng SAN Cũng tương tự, một thiết bị chủ quản có thể được gắn một hoặc nhiều thiết bị điều hợp cùng hay khác loại
o Thiết bị kéo dài (Extenders): Thiết bị kéo dài được sử dụng để kéo dài khoảng
cách cho phép giữa các nút trong mạng SAN Về mặt vật lý, thiết bị kéo dài là một
bộ khuyếch đại lại tín hiệu
o Bộ trộn (Multiplexors): bộ trộn được sử dụng để tận dụng hiệu quả của đường
kết nối băng thông rộng bằng cách trộn dữ liệu luân phiên từ nhiều nguồn khác nhau vào một kết nối duy nhất Bộ trộn còn có nhiều ưu điểm khác: cho phép nén
dữ liệu, sửa lỗi, nâng cao tốc độ truyền và khả năng ngắt nhiều kết nối một lúc
Trang 36các nút này cùng chia sẻ băng thông nên hiệu quả đạt được không cao như bộ chuyển mạch.
o Bộ định tuyến (Routers): bộ định tuyến cho thiết bị lưu trữ khác với bộ định
tuyến ở mạng thông thường Dữ liệu được định tuyến sử dụng các giao thức định tuyến cho thiết bị lưu trữ như FCP hay SCSI trong khi mạng thông thường sử dụng các giao thức thông điệp như TCP/IP Đường truyền dữ liệu trong các thiết
bị lưu trữ giống như đường truyền thông điệp trong mạng thông thường nhưng nội dung truyenf sẽ chứa những thông tin riêng của giao thức
o Brigdes: Cầu thường được sử dụng để kết nối những đoạn mạng LAN/SAN hoặc
những mạng có giao thức khác nhau
o Gateways: Cổng mạng dùng để kết nối hai hoặc nhiều mạng có giao thức không
giống nhau Thiết bị này thường được dùng để kết nối giữa LAN và WAN SAN
sử dụng cổng mạng để mở rộng mạng thông qua mạng WAN
o Bộ chuyển mạch (Switchs): Bộ chuyển mạch là một trong những thiết bị được sử
dụng nhiều nhất Bộ chuyển mạch có nhiều ưu điểm như: cung cấp khả năng kết nối đến một lượng lớn thiết bị, băng thông lớn, giảm thiểu tắc nghẽn, dễ mở rộng
Vì bộ chuyển mạch hỗ trợ kiểu kết nối tới một điểm bất kỳ nên phần mmeefm quản lý bộ chuyển mạch có thể đặt tùy chọn kết nối riêng cho từng cổng Một số công ty lớn sử dụng dư thừa bộ chuyển mạch hoặc cấu hình nhiều bộ chuyển mạch song song nhằm tăng băng thông và khả năng chịu lỗi
o Bộ định hướng (Director): như bộ chuyển mạch nhưng được sử dụng với giao
diện kết nối ESCON
2.3.4 Hệ thống lưu trữ
Hệ thống lưu trữ là thành phần chủ chốt trong mạng SAN, quyết định phần lớn vào hiệu năng của một SAN Phần này đề cập đến các khái niệm như RAID, Tape , các công nghệ lưu trữ, sao lưu hệ thống tiên tiến mà hiện nay các doanh nghiệp thường triển khai
Trang 372.3.4.1 Raid
RAID là chữ viết tắt của Redundant Array of Independent Disks Ban đầu RAID
được sử dụng như một giải pháp phòng hộ vì nó cho phép ghi dữ liệu lên nhiều đĩa cứng cùng lúc Về sau RAID đã có nhiều biến thể cho phép không chỉ đảm bảo an toàn dữ liệu
mà còn giúp gia tăng đáng kể tốc độ truy xuất dữ liệu từ đĩa cứng
Hầu hết các SAN hiện tại đều dùng hệ thống RAID như là thiết bị lưu trữ chính Những hệ thống này cung cấp một nền tảng lưu trữ lý tưởng cho các mạng lưu trữ SAN hiện đại Trước hết, hệ thống SAN cung cấp sự bảo vệ dữ liệu hay còn gọi là kháng lỗi trong trường hợp những thành phần lưu trữ hoặc đường dẫn nhập xuất I/O có sự cố Thậm chí ngay cả khi những thành phần cơ bản nhất, như đĩa cứng, bị hư hỏng Những đặc tính tin cậy khác vẫn có giá trị trong các hệ thống RAID hiện đại bao gồm các hệ thống làm mát, nguồn cung cấp, bộ điều khiển và thậm chí mạch giám sát Đặc điểm này cho phép dữ liệu lúc nào cũng sẳn sàng trong SAN Những hệ thống RAID hiện đại cho phép kết nối trực tiếp đến các thiết bị lưu dự phòng
Dưới đây là năm loại RAID được dùng phổ biến:
RAID 0
Đây là dạng RAID đang được người dùng ưa thích do khả năng nâng cao hiệu suất trao đổi dữ liệu của đĩa cứng Đòi hỏi tối thiểu hai đĩa cứng, RAID 0 cho phép máy tính ghi dữ liệu lên chúng theo một phương thức đặc biệt được gọi là Striping
Ví dụ: có 8 đoạn dữ liệu được đánh số từ 1 đến 8, các đoạn đánh số lẻ (1,3,5,7) sẽ được ghi lên đĩa cứng đầu tiên và các đoạn đánh số chẵn (2,4,6,8) sẽ được ghi lên đĩa thứ hai Để đơn giản hơn, ta có thể hình dung có 100MB dữ liệu và thay vì dồn 100MB vào một đĩa cứng duy nhất, RAID 0 sẽ giúp dồn 50MB vào mỗi đĩa cứng riêng giúp giảm một nửa thời gian làm việc theo lý thuyết Từ đó có thể dễ dàng suy ra nếu có 4, 8 hay nhiều đĩa cứng hơn nữa thì tốc độ sẽ càng cao hơn.
Tuy nghe có vẻ hấp dẫn nhưng trên thực tế, RAID 0 vẫn ẩn chứa nguy cơ mất dữ liệu Nguyên nhân chính lại nằm ở cách ghi thông tin xé lẻ vì như vậy dữ liệu không nằm hoàn toàn ở một đĩa cứng nào và mỗi khi cần truy xuất thông tin (ví dụ một file nào đó),
Trang 38đại, sản phẩm phần cứng khá bền nên những trường hợp mất dữ liệu như vậy xảy ra không nhiều
Có thể thấy RAID 0 thực sự thích hợp cho những người dùng cần truy cập nhanh khối lượng dữ liệu lớn, ví dụ các game thủ hoặc những người chuyên làm đồ hoạ, video
số
RAID 1
Đây là dạng RAID cơ bản nhất có khả năng đảm bảo an toàn dữ liệu Cũng giống như RAID 0, RAID 1 đòi hỏi ít nhất hai đĩa cứng để làm việc Dữ liệu được ghi vào 2 ổ giống hệt nhau (Mirroring) Trong trường hợp một ổ bị trục trặc, ổ còn lại sẽ tiếp tục hoạt động bình thường Ta có thể thay thế ổ đĩa bị hỏng mà không phải lo lắng đến vấn đề thông tin thất lạc Đối với RAID 1, hiệu năng không phải là yếu tố hàng đầu nên chẳng có
gì ngạc nhiên nếu nó không phải là lựa chọn số một cho những người say mê tốc độ Tuy nhiên đối với những nhà quản trị mạng hoặc những ai phải quản lý nhiều thông tin quan trọng thì hệ thống RAID 1 là thứ không thể thiếu Dung lượng cuối cùng của hệ thống RAID 1 bằng dung lượng của ổ đơn (hai ổ 80GB chạy RAID 1 sẽ cho hệ thống nhìn thấy duy nhất một ổ RAID 80GB)
RAID 0+1
Hệ thống RAID kết hợp 0+1 là, tổng hợp ưu điểm của cả hai “đàn anh là RAID0
và RAID1” Tuy nhiên chi phí cho một hệ thống kiểu này khá đắt, bạn sẽ cần tối thiểu 4 đĩa cứng để chạy RAID 0+1 Dữ liệu sẽ được ghi đồng thời lên 4 đĩa cứng với 2 ổ dạng Striping tăng tốc và 2 ổ dạng Mirroring sao lưu 4 ổ đĩa này phải giống hệt nhau và khi đưa vào hệ thống RAID 0+1, dung lượng cuối cùng sẽ bằng ½ tổng dung lượng 4 ổ, ví dụ bạn chạy 4 ổ 80GB thì lượng dữ liệu “thấy được” là (4*80)/2 = 160GB
RAID 5
Đây có lẽ là dạng RAID mạnh mẽ nhất cho người dùng văn phòng và gia đình với
3 hoặc 5 đĩa cứng riêng biệt Dữ liệu và bản sao lưu được chia lên tất cả các ổ cứng Đoạn
dữ liệu số 1 và số 2 sẽ được ghi vào ổ đĩa 1 và 2 riêng rẽ, đoạn sao lưu của chúng được ghi vào ổ cứng 3 Đoạn số 3 và 4 được ghi vào ổ 1 và 3 với đoạn sao lưu tương ứng ghi
Trang 39vào ổ đĩa 2 Đoạn số 5, 6 ghi vào ổ đĩa 2 và 3, còn đoạn sao lưu được ghi vào ổ đĩa 1 và sau đó trình tự này lặp lại, đoạn số 7,8 được ghi vào ổ 1, 2 và đoạn sao lưu ghi vào ổ 3 như ban đầu.
Như vậy RAID 5 vừa đảm bảo tốc độ có cải thiện, vừa giữ được tính an toàn cao Dung lượng đĩa cứng cuối cùng bằng tổng dung lượng đĩa sử dụng trừ đi một ổ Tức là nếu ta dùng 3 ổ 80GB thì dung lượng cuối cùng sẽ là 160GB
JBOD
JBOD (Just a Bunch Of Disks) thực tế không phải là một dạng RAID chính thống,
nhưng lại có một số đặc điểm liên quan tới RAID và được đa số các thiết bị điều khiển RAID hỗ trợ
JBOD cho phép ta gắn bao nhiêu ổ đĩa tùy thích vào bộ điều khiển RAID của mình (dĩ nhiên là trong giới hạn cổng cho phép) Sau đó chúng sẽ được “tổng hợp” lại thành một đĩa cứng lớn hơn cho hệ thống sử dụng
Ví dụ ta cắm vào đó các ổ 10GB, 20GB, 30GB thì thông qua bộ điều khiển RAID
có hỗ trợ JBOD, máy tính sẽ nhận ra một ổ đĩa 60GB
Tuy nhiên, lưu ý là JBOD không hề đem lại bất cứ một giá trị phụ trội nào khác: không cải thiện về hiệu năng, không mang lại giải pháp an toàn dữ liệu, chỉ là kết nối và tổng hợp dung lượng mà thôi
Nhiều hệ thống RAID hiện nay kết hợp với chuẩn giao diện nối tiếp mới gọi là
Fibre Channel-Arbitrated Loop (FC-AL) Nó là giao diện tùy chọn cho hệ thống RAID,
và hiện nay là một giao diện rất phổ biến FC-AL có khả năng cung cấp thông lượng dữ liệu lên đến MBps (trong cấu hình dual-loop) trong khi cho phép hệ thống RAID hoặc những thiết bị ngoại vi khác nằm cách Host 10 km Giao diện cũng hỗ trợ kết nối lên đến
126 ổ đĩa hoặc thiết bị khác trên một bộ điều khiển đơn (SCSI chuẩn thường là 7 hoặc 15
ổ đĩa) FC-AL có thể họat động ở cấu hình single hoặc dual-loop Kiến trúc dual-loop cung cấp dự phòng I/O bằng cách hỗ trợ hai kênh I/O riêng biệt cho mỗi thiết bị
Trang 40Hình 2.6 Mô hình backup Tape Internal
Đây là công nghệ backup đơn giản và gọn nhẹ Khi backup xong có thể cấp băng tape tại một nơi khác đề phòng rủi ro xảy ra tại vị trí đó thì có ngay băng tape để phục hồi lại dữ liệu mà ta cần, loại lưu trữ này cho phép ta lưu trữ trong thời gian dài nhưng dữ liệu luôn ở trang thái offline phải thao tác một số bước ta mới có thể dùng lại dữ liệu được
Công nghệ backup băng từ có đầy đủ các sản phẩm sau:
o Tape drive (Thay băng tape bằng tay khi băng tape đầy dữ liệu)
DAT Drivers: là công nghệ tầm thấp thường dùng cho các doanh nghiệp
nhỏ với độ tin cậy và chi phí thấp
LTO (LTO1-200GB, LTO2-400GB, LTO3-800GB, LTO4-1.6TB) Ultrium Drivers: có dạng Half Height và Full Height là loại cao cấp hơn DAT với
băng tape dung lượng lớn hơn và hiệu suất cao hơn
o Tape Autoloader: Được thiết kế theo kiểu nạp băng tape tự động (cho các
băng tape trăng vào khe ổ tape sau đó băng nào đầy thì tự động thay băng mới vào để backup tiếp dữ liệu) Tape Autoloader có các lợi ích sau: