5. Phương pháp nghiên cứu
1.5.3.2. Các giải pháp không nhận biết địa phương
Từ năm 2001, ngày càng nhiều các giải pháp không nhận biết địa phương được đề xuất. Chúng không xem xét số truy nhập bộ nhớ cache trong việc đánh giá hiệu suất của hệ thống web. Do đó, các yếu tố khác được đề cập đến trong các chính sách này như đánh giá mức độ sử dụng tài nguyên của các loại yêu cầu khác nhau, việc đưa ra tiêu chuẩn QoS trong việc cung cấp dịch vụ, hoặc việc kiểm soát truy nhập trong giải pháp cân bằng tải.
Khi chỉ xét nội dung của các yêu cầu gửi đến, chính sách nhận biết client (CAP Client-aware Policy), thu được kết quả hiệu suất tốt khi phục vụ nội dung và bảo mật Web động. Khi các yêu cầu được phân loại phụ thuộc vào tác động dự kiến sẽ có trên các tài nguyên máy chủ, CAP sẽ phân phối các quyết định tùy thuộc vào loại dịch vụ theo yêu cầu của chúng. Trạng thái của các máy chủ không được tính đến trong giải pháp này. Tất cả máy chủ của cluster cung cấp cho các loại hình dịch vụđược xem xét.
Chính sách thích ứng nhận biết thông điệp Message-Aware Adaptive (MAA) xét nội dung của các yêu cầu đến và lấy một số số liệu từ các chuyển mạch web cho phép để ước tính tải của các máy chủ web. Đây là một chính sách lập lịch được phát triển để thực hiện trong mạng hướng ứng dụng - Application Oriented Networking (AON) - sản phẩm của Cisco Systems. Chính sách này phân biệt giữa các loại thông điệp và cân bằng tải dựa trên tiêu thụ tài nguyên của chúng. Do đó, khi yêu cầu đến hệ thống, sự ước lượng thời gian hoàn thành sẽ được tính toán và máy chủ có thời gian phục vụ ít nhất sẽđược chọn để phục vụ yêu cầu.
Chính sách khác giám sát thông tin thu được từ các máy chủ web của cluster để có quyết định phân phối. Đây là trường hợp của sự phân phối yêu cầu thích ứng mờ -
Fuzzy Adaptive Request Distribution (FARD). Đây là một kỹ thuật cân bằng tải nhận biết nội dung ước lượng thời gian phản ứng của từng yêu cầu trong mỗi máy chủ của cluster bằng cách sử dụng kỹ thuật ước lượng mờ. Dựđoán này dựa trên một số số liệu thu được từ các máy chủ, như CPU, đĩa và tải liên kết truyền thông. Chính sách FARD chọn máy chủ với thời gian phản ứng được ước tính thấp nhất để tham dự các yêu cầu. So với LARD và WRR trong một mẫu thử nghiệm, FARD cải thiện hiệu suất hơn, đặc biệt trong môi trường không đồng nhất.
Một nghiên cứu khác cũng lấy được thông tin hiệu suất bằng cách giám sát các ứng dụng chạy trên các node là kỹ thuật cân bằng tải thích ứng - Adaptive Load
tính mở rộng trong một hệ thống đa cluster. Thiết bị front-end của hệ thống là chuyển mạch Web layer-4 mà cân bằng tải bằng cách sử dụng DR và NAT, phân phối nhận biết nội dung được thực hiện từ các node của cluster. ALBM được so sánh với LVS sử dụng RR, LC và các thuật toán lập lịch WLC.
Các yêu cầu QoS trong một số chính sách lấy được thông tin giám sát từ các máy chủ Web. Chiến lược cân bằng tải nhận biết QoS mang tên Extended Fewest Server Processes First (E-FSPF). Chúng kết hợp chính sách lập tiến trình trong các máy chủ web, có xem xét mức độ ưu tiên của các yêu cầu, với kỹ thuật cân bằng tải ở thiết bị front-end của hệ thống, sẽ gửi yêu cầu đến máy chủ web với số ít nhất các tiến trình có mức độưu tiên cao hơn hoặc bằng.
Một hệ thống phân phối web khác có tên Gage cân tải trong một tập hợp các máy chủ web và hỗ trợ QoS. Sử dụng một thiết bị front-end ghép kết nối TCP với máy chủ được lựa chọn trong kiến trúc một chiều. Chiếm dụng tài nguyên được xem như là thước đo QoS và đảm bảo SLA bằng việc phân bổ các nguồn tài nguyên đa hệ thống. Các yêu cầu được phân phối theo thuật toán WRR.
Khi cân bằng tải theo QoS, thông thường các chính sách điều khiển truy nhập áp dụng để tránh sự sụp đổ đột ngột của các máy chủ do sự gia tăng yêu cầu. Thuật toán cân bằng tải nhận biết nội dung kiểm soát truy nhập nhận biết QoS được đặt tên IQRD. Giám sát các máy chủ web để tựđộng tính toán năng lực còn lại của hệ thống web. Các yêu cầu được phân loại phụ thuộc vào nguồn tài nguyên mà chúng chiếm dụng tại các node máy chủ và được gán cho các node dựa trên tình trạng tải của các máy chủđó. So sánh IQRD với CAP và WRR, mặc dù IQRD có chi phí hoạt động cao hơn, nó vẫn cải thiện hiệu suất của hệ thống về thời gian phản ứng và băng thông.
ADAPTLOAD xem xét lưu lượng động. Theo chính sách ADAPTLOAD, không có các xử lý ban đầu cho các yêu cầu động, nghiên cứu ảnh hương của sự tự tương quan (autocorrelation) đến quá trình hiệu suất của các chính sách cân bằng tải và đề
xuất một kỹ thuật không cân bằng tải, cố gắng giảm bớt sự tự tương quan của các kích thước tập tin được yêu cầu. Chính sách đó gọi là D_EQAL. Trong trường hợp này, mục tiêu cho nhận biết địa phương ít rõ ràng hơn trong ADAPTLOAD, đây là lý do để xem
D_EQAL như giải pháp không nhận biết địa phương.
Vì nó không thể biết được tải khi thực hiện các kịch bản (script) liên quan đến việc cải tiến máy chủ web, giám sát tải của các máy chủ thông qua thuật toán hoạt động trong chuyển mạch Web layer-4. Nếu các máy chủ đang tham dự cùng một số yêu cầu thì chuyển mạch web cân bằng các yêu cầu theo thuật toán RR. Bộ chuyển sẽ gửi các yêu cầu kế tiếp tới máy chủ ít tải nhất trong cluster khi các giá trị tải của các máy chủ không bằng nhau. Các kết nối duy trì khi sử dụng HTTP/1.1 được xem xét đến, vì thế trong trường hợp máy chủ mục tiêu đối với một yêu cầu là máy chủ khác thích hợp hơn máy chủđang được kết nối thì giao thức chuyển giao TCP được sử dụng để di chuyển các kết nối đến máy chủ thích hợp đảm bảo khả năng mở rộng và QoS.
1.6. Tổng kết chương I
Chương I tổng kết các kỹ thuật cân bằng tải đã được phát triển và phân loại cân bằng tải dựa trên các giao thức OSI. Các kỹ thuật cân bằng tải không nhận biết nội dung đã được phát triển rộng rãi và cũng đã được coi là các sản phẩm thương mại (một sốđã được rút khỏi thị trường).
Các giải pháp cân bằng tải nhận biết nội dung phổ biến hơn (chủ yếu là vì chúng giới thiệu sự khác biệt nhiều trong khối lượng tải và phân phối chính xác hơn đối với các yêu cầu), khắc phục những nhược điểm của chúng. Một số các hạn chế liên quan đến khả năng mà chuyển mạch Web layer-7 sẽ trở thành node cổ chai “bottleneck” của hệ thống và cũng như là các khó khăn phân tách các yêu cầu khi sử dụng giao thức HTTP/1.1. Những vấn đề này được giải quyết bằng cách sử dụng chuyển mạch web nội
Các chính sách nhận biết địa phương đã được nghiên cứu rộng rãi trong những năm đầu của thập niên 2000, với mục đích khai thác các lợi ích hiệu suất bộ nhớ cache trong các máy chủ Web. Hầu hết các thuật toán chỉ xem xét nội dung web tĩnh. Khối lượng nội dung trang Web động khá phức tạp đối với cân bằng tải tương tự như việc không dễđoán trước số lần phục vụ các kịch bản có thể tạo ra nội dung động. Ngoài ra chi phí tạo ra một trang web động là tốn kém hơn về hiệu suất hơn so với chi phí phục vụ các trang web tĩnh và rất khó để đo lường hoặc dựđoán. Điều này vẫn là một trong những vấn đề mở cần nghiên cứu thêm.
Tính chất mới “Freshness” của các thông tin thu được từ các máy chủ web mà thuật toán sử dụng để đưa ra quyết định cân bằng tải cũng là một vấn đề đã được nghiên cứu kỹ hơn, như hầu hết các đề xuất được mô tảở đây không xem xét các khả năng thông tin tải là cũ.
(0) (1) (2) (3) (4) (5) (6) (7)
LARD 98 Y N N Y 7 TCP Hand-Off
extLARD 99 Y N Y Y 7 TCP Hand-Off
HACC 99 Y Y N N 7 TCP Splicing
FLEX 01 Y N N Y 3 DNS Load balancing
WARD 01 Y N Y Y 4 RR-DNS, Multi TCP Hand-off
TAP2 01 Y N N N 7 TCP Connection Binding
PRESS 01 Y N Y Y 4 TCP Hand-Off
EQUILOAD 01 Y N N N ? Không xác định
ADAPTLOAD 01 Y N N N ? Không xác định
E-PSPF 02 N N N N 7 TCP Splicing
FARD 03 N Y N N 7 TCP Connection Binding
GAGE 03 N N N Y 7 TCP Splicing
BCB & SAA 03 Y N Y Y 7 TCP Hand-Off
Cyclone 04 Y N Y Y 4 Socket Clonning
ALBM 04 N Y N N 4 DR & NAT
ADAPTLOAD V2 05 Y Y N Y 7 Không xác định
D_EQAL 06 N N N ? ? Không xác định
Weblins 06 Y N N Y 4 TCP Hand-Off
Around k-Bounded 06 N Y Y Y 4 TCP Hand-Off
NPSSM 06 N N N Y 7 Không xác định
CAWLL 07 N Y Y Y 7 Mutilple TCP ReBuilding
xLARD/R 07 Y N Y Y 7 Mutilple TCP ReBuilding
CWARD/FR 08 Y N Y Y 7 Mutilple TCP ReBuilding
MAA 08 N Y N Y 7 Không xác định
IQRD 08 N Y N N 7 Không xác định
Bảng 2.3: Các đặc điểm chính sách phân phối yêu cầu nhận biết nội dung
(0) : Chính sách (4) : Phân tách yêu cầu với HTTP/1.1 (1) : Năm đề xuất (5) : Kiến trúc một chiều
(2) : Nhận biết vùng (6) : Lớp chuyển mạch Web. (3) : Có phục vụ nội dung động (7) : Kỹ thuật cân bằng tải
CHƯƠNG II: ĐIỀU KHIỂN TRUY NHẬP VÀ BURSTINESS
TRONG HỆ THỐNG WEB
Chương này mô tảđặc tính lưu lượng truy nhập Internet thiết lập tình huống xem xét việc nghiên cứu phát hiện và giám sát tính burstiness. Một số kỹ thuật điều khiển truy nhập quan trọng cũng được mô tả trong chương này.
2.1. Giới thiệu
Cộng đồng Internet đang phát triển liên tục và cần phải có các nghiên cứu hiệu năng cần thiết để có được thời gian đáp ứng tốt hơn cho người sử dụng web. Hiệu suất của máy chủ web có thể bị ảnh hưởng nghiêm trọng khi có một sự gia tăng đột ngột yêu cầu truy nhập các trang web. Điều này dẫn đến cần có nghiên cứu các đặc tính lưu lượng truy nhập Internet để xác định các giải pháp kỹ thuật tránh tắc nghẽn trong các máy chủ Web khi nó không thể tham dự tất cả các yêu cầu gửi đến. Để duy trì hiệu suất của một hệ thống web, xét hai khả năng:
- Khả năng phòng ngừa: Giám sát các thuộc tính liên quan đến lưu lượng tới tại các máy chủ web và thiết lập một số chính sách tránh được tình trạng quá tải. Do đó, cần nghiên cứu, phân tích, đánh giá các đặc tính của lưu lượng truy nhập web được đề cập trong chương này, đối phó với tính burstiness của lưu lượng truy nhập web.
- Giám sát tài nguyên: Giám sát một số số liệu hiệu suất tài nguyên hệ thống của web một cách liên tục để chắc chắn các dịch vụ được bảo đảm. Hơn nữa trong trường hợp áp dụng các mức độ QoS được xem xét, giám sát này dẫn đến quyết định lập kế hoạch và kiểm soát những quết định cho phép các yêu cầu của người sử dụng với SLA cao được tham dự nhanh và chính xác hơn những yêu cầu với SLA thấp và cũng để từ chối yêu cầu mức ưu tiên thấp khi các máy chủ đang
Để tìm hiểu cụ thể về vấn đề trên, chương này được phân thành các nội dung: - Các đặc điểm lưu lượng mạng ảnh hưởng tới Web server.
- Tính burstiness.
- Các chính sách điều khiển truy nhập. - Tổng kết chương.
2.2. Các ảnh hưởng của lưu lượng đối với Web Server
Khi lưu lượng truy nhập web/lần đến thông thường tuân theo phân phối heavy- tailed, việc duy trì hiệu suất của hệ thống web một cách bình thường khó khăn hơn và phân phối một cách dễ hơn nếu điều này được dự đoán trước. Do đó, máy chủ Web không quá tải sẽ tiếp nhận được các yêu cầu mới, vấn đề tắc nghẽn sẽđược giải quyết.
Điều này xảy ra, khi máy chủ đạt đến giới hạn số lượng kết nối nó có thể xử lý. Thậm chí, máy chủ chưa đạt đến giới hạn này, nếu yêu cầu của client cho một kết nối được chấp nhận, thời gian đáp ứng cho yêu cầu có thể trễ lâu vì các yêu cầu xếp hàng chờ đợi để được phục vụ bởi hệ thống Web. Vấn đề sẽ đơn giản hóa đáng kể trong trường hợp các hệ thống web đã tiếp nhận yêu cầu đến theo phân phối cố định. Điều này không thể áp dụng trên lưu lượng Web. Hơn nữa, cách hoạt động của lưu lượng Internet là dựa trên các mô hình bursty, nên việc theo dõi và kiểm soát của burstiness trong tỉ lệđến là điều cần thiết để đảm bảo một phản ứng tốt từ hệ thống.
Các nhà cung cấp dịch vụ Internet đề nghị nhiều mức QoS để hỗ trợ mức độ ưu tiên khác nhau cho những người dùng khác nhau. Các chính sách truy nhập thường được áp dụng khi tình trạng ùn tắc nghiêm trọng. Điều này dẫn đến thách thức trong việc đáp ứng được hiệu năng đối với các loại yêu cầu khác nhau tại mọi thời điểm.
Trong các phần tiếp theo, chúng ta xem xét các nghiên cứu các vấn đề liên quan đến phát hiện burstiness và kiểm soát truy nhập trong một hệ thống web.
2.3. Tính truyền loạt (Burstiness) trên Internet
Tính truyền loạt – Burstiness: Khi các yêu cầu truy nhập tới hệ thống máy chủ Web, thì hiện tượng truyền loạt chưa xảy ra trong hữu hạn số kết nối nào đó. Tuy nhiên, khi xét trong cùng một thời điểm, nếu số lượng yêu cầu truy nhập tới hệ thống máy chủ Web tăng đột biến, đó là hiện tượng truy nhập đồng loạt hay tính truyền loạt. Đây là một trong những nguyên nhân quan trọng gây tắc nghẽn hệ thống Web.
Khi xảy ra hiện tượng burstiness, khả năng tắc nghẽn hệ thống cực lớn. Do đó việc phát hiện tính burstiness được xem là vấn đề quan trọng trong việc duy trì và cải thiện hiệu năng của hệ thống. Tính burstiness được phát hiện trong một số trường hợp:
- Dựa trên lưu lượng mạng. - Dựa trên giao thức TCP. - Trong cơ sở dữ liệu. - Dựa trên số lần phục vụ.
2.3.1. Phát hiện tính truyền loạt dựa trên lưu lượng mạng
Nhà tiên phong mô hình burstiness trong một mạng là Wang. Phân tích mối quan hệ giữa tính biến động (jitter) và burstiness trong các truyền thông thời gian thực. Trong bài báo của Wang, các kỹ thuật phát hiện burstiness được định nghĩa cho các gói dữ liệu riêng lẻ. Tác giả xác định burstiness của gói “m” khi đo đạc thời gian biểu thị khoảng cách giữa thời gian tới thực tế và ngưỡng thời gian đến của gói m, vì các máy chủ thường xử lý từng gói với một tốc độ không đổi.
Việc phát hiện Burstiness dựa trên tỷ lệ lưu lượng và tính độc lập của các gói dữ liệu riêng biệt được xác định như là phân số (fraction) của thời gian khi tỷ lệ tới khe thời gian vượt quá mức tới trung bình. Trong trường hợp đó, việc giám sát tính
burstiness được thực hiện bằng cách lập lịch khe thời gian cốđịnh. Trong mục 3.3, mô tả chi tiết việc xác định yếu tố burstiness.
Một số nghiên cứu dự đoán lưu lượng truy nhập có thể làm giảm suy hao tiềm tàng và suy hao hiệu năng trong các máy chủ Web. Sử dụng phép ngoại suy tuyến tính (linear extrapolation) như là một kỹ thuật và trạng thái dự báo mà kỹ thuật này dùng để phát hiện burstiness không phải là một hướng tốt. Tuy nhiên, nhìn chung ngay cả các thuật toán dựđoán đơn giản cũng có khả năng dự báo đáng kể.
Tính chất burstiness được phát hiện thông qua tỷ lệ lưu lượng trung bình và tỷ lệ cao điểm mỗi giây. Cần phải xác định đặc tính phi tuyến về quan hệ giữa hai biến sốđể mô hình biến thể trong tỷ lệ lưu lượng đó thể hiện burstiness. Kỹ thuật phát hiện