5. Bố ục cc ủa luận ỏn
4.3.3 Lớp lưu lượng
Trong kỹ thuật phõn loại lưu lượng, cỏc lớp lưu lượng cú thể được định nghĩa là lưu lượng của từng ứng dụng hoặc là lưu lượng của một nhúm cỏc ng ứ
dụng cú đặc tớnh tương tự nhau. Việc lựa chọn lớp lưu lượng là 1 ứng dụng hay 1 nhúm ứng dụng phụ thuộc vào mục đớch nghiờn cứu, tuy nhiờn trong đa phần cỏc bài toỏn kỹ thuật mạng như cung c p ch t lấ ấ ượng d ch v (QoS), dị ụ ự bỏo l u lư ượng mạng, đỏnh giỏ cơ chế chia sẻ tài nguyờn mạng hay đ ềi u khiển truy nhập thỡ việc phõn biệt được lưu lượng củ ừa t ng nhúm ứng d ng tụ ương tự nhau là đủ mà khụng yờu cầu phải phõn biệt đến lưu lượng của từng ng dứ ụng cụ thể.
Ngoài ra, theo thực nghiệm của nghiờn cứu sinh, thỡ thuật toỏn phõn loại lưu lượng bằng cỏch học tự động sẽ hoạt động chậm đỏng kể nếu ti n hành phõn bi t ế ệ
lưu lượng của từng ứng dụng, đặc biệt khi dữ ệ đ li u o cú kớch thước l n. C ng cú th ớ ũ ể
giải quyết v n ấ đề suy gi m hi u su t này b ng cỏch l y m u lu ng l u lả ệ ấ ằ ấ ẫ ồ ư ượng để
giảm số lượng luồng cần x lý c a d li u o, tuy nhiờn khi ú l i nóy sinh v n ử ủ ữ ệ đ đ ạ ấ đề
Đối với m t s nghiờn c u nh t ộ ố ứ ấ định ch cỉ ần định ngh a m t s ớt l p l u ĩ ộ ố ớ ư
lượng, vớ dụ khi nghiờn cứu cơ chế phỏt hiện tấn cụng trờn mạng thỡ người ta chỉ
cần hai lớp lưu lượng là lưu lượng bỡnh thường và lưu lượng lạ (do cú tấn cụng ).
Đồng thờ ũi c ng cú nhi u nghiờn c u ([59]) thỡ s lề ứ ố ớp l u lư ượng định ngh a l i r t ĩ ạ ấ
nhiều, lu n ỏn này ậ đểđảm b o thu t toỏn phõn lo i ả ậ ạ đạt được độ chớnh xỏc cao, giảm thời gian phõn loại và cũng do hạn chế của dữ liệu đo (thiếu một số ứ ng dụng ngang hàng), nghiờn cứu sinh định nghĩa 6 lớp lưu lượng phổ biến nhất trờn mạng Internet và cú biểu hiện hoạt động tương tự nhau (xột trờn khớa cạnh đặc tớnh l u lư ượng) như
trong bảng 4-3.
Bảng 4-3 Danh sỏch cỏc lớ ưp l u lượng
TT Lớp lưu lượng Gốm cỏc ứng dụng Ứng dụng mẫu
1 Lớp l u l ng tư ượ ương tỏc telnet, ssh, rlogin 23/telnet 2 Lớp l u lư ượng truyền dữ liệu ftp, dịch v t i nh c/video ụ ả ạ 20/ftp-data 3 Lớp l u lư ượng thời gian thực Realmedia, Windows media
player, Vocaltec (voip)
7070/Realmedia streaming 4 Lớp l u lư ượng giao dịch dns, https 53/dns 5 Lớp l u lư ượng thư đ ệ i n tử Imap, pop3, smtp 25/smtp 6 Lớp l u lư ượng web www 80/http
- Lớp lưu lượng tương tỏc: bao gồm l u lượng c a cỏc ng d ng yờu c u người ư ủ ứ ụ ầ dựng thực hiện nhiều thao tỏc mang tớnh tương tỏc với hệ thống đầu cu i, như ố cỏc ứng d ng truy nh p t xa ho c cỏc c ng giao di n web tương tỏc, vv... ụ ậ ừ ặ ổ ệ - Lớp lưu lượng truyền dữ liệ : bao gồu m l u lượng c a nh ng ng d ng thường ư ủ ữ ứ ụ
truyền m t lượng l n d li u qua m ng mà khụng yờu c u tớnh th i gian th c, ộ ớ ữ ệ ạ ầ ờ ự như cỏc ứng dụng ftp, cập nhật phần mềm, tải nhạc và phim, vv...
- Lớp lưu lượng thời gian thự : bao gồc m l u lượng c a cỏc ng d ng a phương ư ủ ứ ụ đ tiện hoạ động trong thời gian thực, như hột i ngh truy n hỡnh, video streaming, ị ề đ ệi n tho i IP, vv... ạ
- Lớp lưu lượng giao dịch: bao gồm l u lượng c a cỏc ng dụư ủ ứ ng ho t động theo ạ kiểu yờu cầu / đỏp ứng và thường mỗi lần chỉ truyền một lượng nhỏ lưu lượng như ứ ng dụng dns, https hay ứng dụng truy nhập cơ sở dữ ệ li u phõn tỏn (sqlnet, oracle).
- Lớp lưu lượng web: sở dĩ nghiờn c u sinh để lưứ u lượng web (c ng 80) riờng ổ một lớp là do sự phổ biến của nú trờn mạng Internet và ngoài ra theo thực
nghiệm của nghiờn cứu sinh thỡ lưu lượng web vừa cú thể xếp vào lớp tương tỏc vừa cú thể xếp vào lớp giao dịch.
- Lớp lưu lượng thư đ ện tử bao gồ i : m l u lượng c a t t c cỏc ng d ng thư ư ủ ấ ả ứ ụ đ ệi n t , v n cú đặc tớnh truy n lượng d li u bộ và khụng yờu c u th i gian ử ố ề ữ ệ ầ ờ thực.
Cỏc nhúm lưu lượng này được xõy dựng với tiờu chớ là cú sự khỏc biệt rừ ràng giữa chỳng với nhau, đ ềi u này đảm bảo rằng trong quỏ trỡnh phõn loại mỗi một ứng dụng chỉ được ỏnh xạ vào một lớp duy nhất nhằm giảm thiểu xỏc suất phõn loại sai.
Để đặc tớnh hoỏ từng nhúm l u lư ượng này yờu cầu ph i cú m t t p dả ộ ậ ữ ệ li u mẫu cho mỗi lớp để từ đ ú thu t toỏn hậ ọc s tỡm ra t p cỏc thu c tớnh ẽ ậ ộ đặc trưng đại diện cho lớp tương ứng. Luận ỏn này tạo tập dữ liệu mẫu dựa trờn thụng sốcổng ứng d ngụ , tuy nhiờn như đ ó trỡnh bày ở phần đầu chương, số hiệu cổng ng dứ ụng khụng cho kết quả phõn loại cỏc ứng dụng một cỏch tin cậy trong đ ềi u kiện mạng Internet hiện nay. Để vượt qua trở ng i này nghiờn c u sinh ch n ra cho m i l p ạ ứ ọ ỗ ớ
một ứng dụng đại diện (bảng 4-6), theo cỏc nguyờn tắc là: - Ứng dụng được chọn phải thể hiện rừ ràng đặc tớnh của lớp
- Được sử dụng r ng rói trờn m ng Internet hi n nay và cú t lộ ạ ệ ỉ ệ ph n tr m l n ầ ă ớ
trong tập dữ liệu o đ
- Và cuối cựng là ứng d ng ph i cú s hi u c ng giao th c thu c phụ ả ố ệ ổ ứ ộ ạm vi ph ổ
biến (0-1023) hoặc đó được đăng ký v i IANA (1024-49151). ớ
Để trỏnh tỡnh trạng giỏ tr c ng ng d ng khụng ph n ỏnh ỳng ng d ng ị ổ ứ ụ ả đ ứ ụ đại diện, cỏc tập dữ liệ đu o (bảng 4-1) sử ụ d ng trong vi c t o d li u m u ệ ạ ữ ệ ẫ được ch n là ọ
2 tập dữ liệu đó được xử lý kỹ trờn mạng Internet và 2 tập dữ liệu đo trong mụi trường kiểm soỏt được là mạng ISP/IXP của cụng ty EVN Telecom.