Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 21 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
21
Dung lượng
608,71 KB
Nội dung
http://www.ebook.edu.vn Giới thiệu bộ giao thức tcp/ip TATA Jsc. - CIC Trang 33 Phần 2 Giới thiệu bộ giao thức TCP/IP Mục lục: I. Nhìn lại một số công nghệ mạng 35 II. Khái niệm và mô hình mạng Internet 38 III. Sự thành công của Internet: giao thức IP và TCP 42 IV. World Wide Web (WWW) và siêu văn bản HyperText 49 http://www.ebook.edu.vn Nhìn lại một số công nghệ mạng TATA Jsc. - CIC Trang 35 Giới thiệu bộ giao thức TCP/IP i. Nhìn lại một số công nghệ mạng Việc kết nối mạng có thể phân chia thành hai lớp: circuit-switched (chuyển mạch), và packet - switched(chuyển gói). Một ví du địa chỉển hình về mạng chuyển mạch là mạng điện thoại hay các tổng đài con. Nói về chuyển mạch ta lai còn nghe về chuyển mạch số để phân biệt với chuyển mạch tơng tự. (ví dụ, tổng đài con của viện là tổng đài tơng tự gồm ba trung kế.) Các mạng chuyển gói thờng dùng để nối các máy tính với nhau và có một cách tiếp cận hoàn toàn khác. Thông tin thờng đợc chia thành các gói nhỏ (khoảng vài trăm byte). Các gói này, ngoài thành phần thông tin ra, còn có phần địa chỉ đến. Qua đó, các máy tính nằm trên đờng mà gói thông tin qua sẽ nhân biết là có phải gửi cho mình hay không. Tính lợi hại của phơng án ? Hay: Các máy tính có thể tận dụng một đờng truyền nào đó mà gửi các gói thông tin(không cần một trật tự nào vì các gói đều có địa chỉ). Dở: Nếu đờng truyền quá tải thì các máy tính phải chờ. Thực ra điểm dở này sẽ không còn là một vấn đề nếu vận tốc đờng truyền cực lớn. Bây giờ ta xét qua hai kỹ nghệ thờng dùng trong mạng cục bộ, đó là Ethernet và ProNET Token Ring. 1. Kỹ nghệ Ethernet http://www.ebook.edu.vn Nhìn lại một số công nghệ mạng TATA Jsc. - CIC Trang 36 Kỹ nghệ này đợc công ty Xerox PARC sáng tạo ra vào đầu những năm 1970 các máy tính đợc kết nối vào một đờng truyền đơn tuyến, đờng này đợc gọi là Bus. Vận tốc truyền trên bus thờng là 10 Mbps. đờng truyền này có thể là cáp đồng trục (loại 10base5 - loại dây to, 10Base2 - loại nhỏ) và có thể là loại dây nh dây điện thoại (10BaseT). Để gửi một gói thông tin, đầu tiên máy tính phải " nghe" xem đờng truyền có rỗi hay không. Nếu rỗi thì máy tính đó bắt đầu truyền gói thông tin của mình. Cách truyền này có tên gọi là Carries Sense Multiple Access with Collision Detect (CSMA/CD). Độ dài của thông tin có một giới hạn trên và một giới hạn dới. Nh vậy, thời gian truyền của một gói thông tin bị giới hạn. Do đó, các máy tính khác có cơ hội để gửi gói thông tin của mình. Khi hai hay nhiều máy tính cùng gửi thông tin lên đờng truyền thì có thể xảy ra đụng độ (collision). Lúc này thông tin bị nhiễu, các gói thông tin không còn giá trị gì. Vì vậy các máy gửi bắt buộc phải gửi lại. Rõ ràng là rất có khả năng lại bị đụng độ. Ethernet xử lý đụng độ rất thông minh, ngời ta gọi là thuật toán exponential backoff. Đầu tiên, khi gặp đụng độ ta chờ một khoảng thời gian ngẫu nhiên. Sau đó, nếu vẫn gặp đụng độ, tăng gấp đôi khoảng thời gian chờ. Cấu trúc của một gói thông tin Ethernet: Preamble Destination Address Source Address FameType Fame Data CRC 64 bits 48 bits 48 bits 16 bits 368-12000 bits 32 bits http://www.ebook.edu.vn Nhìn lại một số công nghệ mạng TATA Jsc. - CIC Trang 37 Cấu trúc này có hai điểm u việt nổi bật: 1) với 48 bit địa chỉ, tất cả các card Ethernet đều có địa chỉ phân biệt trên toàn cầu (IEEE phân chia địa chỉ). Hơn nữa, nó còn có thêm hai chế độ: broadcast, multicast. Đây là những ý tởng rất độc đáo mà Internet sau này sử dụng triệt để. 2) Các gói thông tin kiểu này có tính seft-identifying. Tính chất này rất hữ ích khi có nhiều giao thức trong một môi trờng. 2. Kỹ nghệ ProNET Token Ring Dựa trên kết quả nghiên cứu của các trờng đại học, công ty proteon Incorporated đã đa ra kết cấu vòng nh trên. Vận tốc truyền cũng là 10 Mbps. Các gói thông tin đợc truyền từ máy nọ sang máy kia theo một chiều nhất định và có tên là token passing. Chú ý là cấu trúc vòng trên không phải là một đờng liên tục mà dây đợc nối theo từng cặp máy. Giao diện của mỗi máy làm việc theo chế độ: copy mode, transmit mode và recovery mode. - Copy mode: nhận một gói thông tin và gửi sang máy tiếp theo ( các điểm 11, 12, và 14). - Transmit mode: giữ token, gửi một gói thông tin và kiểm tra xem đã gửi đợc cha (điểm 13). - Recovery mode: Để kiểm tra việc mất gói thông tin, ngời ta dùng hai đồng hồ, một dùng cho gói tin và một dùng cho token. Nếu quá giờ một trong hai đồng hồ trên thì điểm đó chuyển sang chế độ này. Chú ý là khi một điểm rơi vào recovery mode thì một điểm thứ hai cũng có thể rơi vào recovery mode. Ngời ta áp dụng thuật toán exponetial backoff để thoát ra khỏi tình trạng này. IBM token passing dùng kiểu hình vòng ở trong và hình sao ở ngoài. http://www.ebook.edu.vn Khái niệm v mô hình mạng internet TATA Jsc. - CIC Trang 38 Dạng thức của một gói thông tin ProNET: Start of Msg Dest Address Src Address Fame Type Fame Data End of Msg Parlty Refuse 10 bits 8 bits 8 bits 24 bits 0-16352 bits 9 bits 1 bits 1 bits Sự khác biệt cơ bản của dạng thức này so với Ethernet là địa chỉ. Địa chỉ của ProNET là địa chỉ mềm, đi liền với máy chứ không địa chỉ liền với card và cao nhất cũng chỉ có 256 máy trong một mạng. ii. Khái niệm v mô hình mạng Internet Chúng ta vừa đề cập đến 2 kỹ nghệ trong các mạng cục bộ. Đơng nhiên ngời ta dùng rất nhiều các kỹ nghệ khác nhau, kể cả những biến hoá của hai kỹ nghệ trên. Đủ thấy tính phức tạp khi nối các mạng với nhau. Mục tiêu của Internet là giấu các chi tiết kỹ thuật, mà thật ra các chi tiết này không cần thiết đối với ngời sử dụng. Giao diện của một đặt ở đây http://www.ebook.edu.vn Khái niệm v mô hình mạng internet TATA Jsc. - CIC Trang 39 Vấn đề thứ hai là phải đa ra một địa chỉ, sao cho mỗi máy trên toàn cầu đợc định vị một cách duy nhất. Các máy tính nối hai mạng với nhau đợc gọi là Internet Gateway hay Router (xem hình vẽ trên). Trách nhiệm của các Gateway là gửi một gói thông tin từ mạng này sang mạng khác. Gateway không để ý đến các máy lẻ. Và tất cả các mạng đều bình đẳng. IP Addresses 8 16 24 31 Class A 0 netid hostid Class B 10 netid hostid Class C 110 netid hostid Class D 1110 multicast address Class E 11110 reserver for future use Chú ý cách lập địa chỉ này: vừa có thể chỉ định một máy nào đó, vừa cxó thể chỉ định một mạng nào đó. Địa chỉ mạng: hostid = 0s Broadcast: hostid=ls Multicast: lớp địa chỉ D. Hai loại địa chỉ này có ý nghĩa rất cao trong thông tin. Với điạ chỉ broadcast, ta có thể gửi một gói thông tin đến tất cả các thành viên trong mạng nào đó (điều này cũng có thể gây ra nguy hiểm). Một trong những ứng dụng quan trọng của multicast là thành lập các nhóm tin và nhóm thảo luận chuyên đề, các nhóm làm việc ảo. Một thành viên có thể tham gia nhiếu nhóm và mỗi một nhóm có thể có thể có một số lợng tuỳ ý các thành viên. Việc cung cấp địa chỉ mạng đợc thực hiện bởi một uỷ ban có tên là The Internet Assigned Numbers Authority (IANA). Một số địa chỉ IP đặc biệt : 127.0.0.0 là địa chỉ cho chính một máy(localhost). Thông thừng một máy chỉ sử dụng 1 địa chỉ IP. Tuy nhiên, có một số máy có nhiều địa chỉ IP nh các gateways. Nếu dùng DHCP thì một máy có thể có địa chỉ IP thay đổi theo phiên làm việc: đây là trờng hợp khá phổ biến đối với các ISP. Các địa chỉ dùng cho Proxy: http://www.ebook.edu.vn Khái niệm v mô hình mạng internet TATA Jsc. - CIC Trang 40 ắ Class A: 10.0.0.0 10.255.255.255 ắ Class B: 172.16.0.0 172.31.255.255 ắ Class C: 192.168.0.0 192.168.255.255 IP subnet và mặt nạ mạng (mask) Do sự phát triển không ngừng, một số mạng, sau một thời gian phát triển có thể có nhu cầu chia nhỏ hơn (đặc biệt nh lớp A và lớp B) Hình thức chia: (neitid, hostid) => (neitid, subneitid, hostid); Hình thc thay đổi này chỉ có ý nghĩa cuc bộ, đối với bên ngoài thì vẫn coi nh chỉ có một mạng; Ngời ta dùng mặt nạ để tách phần địa chỉ mạng ra khỏi một địa chỉ IP: A=>0xFF000000, B=>0xFFFF0000, C=> 0xFFFFFF00; Tổng quát hoá các trờng hợp trên: có thể đa ra một mặt nạ bất kỳ, các bit 1 sẽ ứng với địa chỉ mạng và các bit 0 ứng với địa chỉ hostid. Chú ý: chuẩn Internet không yêu cầu là các bit 1 phải nằm liên tục với nhau. Tuy nhiên, trên thực tế chúng ta nên chọn các bit 1 nằm liên tục với nhau. ánh xạ địa chỉ IP sang địa chỉ vật lý(ARP) Địa chỉ IP là địa chỉ logic, còn khi truyền tin thì phải dùng địa chỉ vật lý: vì vậy, câng phải có phơng thức lập chuyển đổi 1-1 giữa địa chỉ vật lý và địa chỉ IP; Chú ý rằng trong mạng Internet, các máy có vai trò bình đẳng nh nhau nên không có một máy nào phải chịu trách nhiệm chung cả: phải có một phơng thức nào đó để các máy không phụ thuộc lẫn nhau. Address Resolution Protocol(ARP) dùng để giải địa chỉ IP sang địa chỉ vật lý; Phơng thức: A dùng broascasst hỏi ai có địa chỉ IP x; máy B có địa chỉ IP x sẽ trả lời A; Để tránh dùng quá nhiều broadcast, các máy thờng dùng cache để lu tạm bảng trong phiên làm việc. ánh xạ địa chỉ vật lý sang địa chỉ IP (RARP) Đây là vấn đề ngợc với ARP: cho địa chỉ vật lý, tìm địa chỉ IP tơng ứng; http://www.ebook.edu.vn Khái niệm v mô hình mạng internet TATA Jsc. - CIC Trang 41 Cách làm tơng tự nh ARP: máy broadcast địa chỉ vật lý xx mà máy Server(chứa bảng IP) sẽ trả lời máy A địa chỉ IP tơng ứng). Cấu hình mạng nào cần đến RARP: các máy không có đĩa; khi khởi động máy, máy A cần biết địa chỉ IP của mình là gì. BOOTP thờng đợc dùng cho lúc khởi động của các máy không có đĩa cứng Các máy không có đĩa thờng phải dựa vào một máy chủ để tại chơng trình khởi động máy về máy chính mình. http://www.ebook.edu.vn World wide web (www) v siêu văn bản hypertext TATA Jsc. - CIC Trang 42 iii. Sự thnh công của Internet: giao thức IP v TCP Đối với ngời sử dụng thì Internet giống nh một mạng ảo, nối tất cả các máy tính trên toàn cầu, giống nh chỉ là chỉ trong một mạng thôi, chứ không phải là liên kết của nhiều mạng khác nhau. Cách tiếp cận của vấn đề của những ngời tạo ra Internet nh trong hình vẽ dới đây, (ngoài lề: phần lớn họ là những ngời làm việc trên Unix) Application Service Reliable Transport Service Connectionless Packet Deliver Service Nếu ta đem so sánh OSI 7 lớp thì triết lý ở đây hoàn toàn khác. Đối với ISO thì truyền dẫn giữa hai điểm bất kỳ đều phải đợc kiểm tra kỹ càng và chắc chắn (reliable). Chính cái điểm tởng nh đáng tin cậy này lại là điểm cản trở chính cho việc phát triển mạng ( không có một mạng máy tính toàn cầu nào theo chuẩn ISO). Internet protocol (IP) Ngợc lại, IP, giao thức thấp nhất của Internet, thì: Unreliable(không tin cậy): vì việc chuyển một gói thông tin từ điểm A đến điểm B không có gì đảm bảo là đến nơi. Conectionless(bút liên quan): giả sử có một bản tin X gồm ba gói thông tin A, B, C. Ba gói này khi gửi qua IP thì chúng đợc xử lý hoàn toàn độc lập với nhau, không có một sự ràng buộc nào giữa chúng. Best effort deliver( với cố gắng cao nhất): đơng nhiên phần mềm của mạng phải cố gắng cao nhất để đa cá gói thông tin đi đến nơi về đến chốn ( trong Internet còn các giao thức kiểm tra phần mềm). Việc gửi gói thông tin qua IP giống nh việc gửi th qua đờng bu điện. Không ai dám đảm bảo th không bị thất lạc. Nếu hôm nay ta gửi lá th A, rồi ngày mai ta gửi lá th B đến cùng một địa chỉ cũng không ai dám đảm bảo rằng là th A sẽ đến trớc lá th B. Và tất nhiên ngành bu điện họ vẫn hứa là họ đem hết sức mình ra để phục vụ nhân dân !. http://www.ebook.edu.vn World wide web (www) v siêu văn bản hypertext TATA Jsc. - CIC Trang 43 Một gói thông tin còn có điểm tệ hại hơn là nó có thể bị lặp nhiều lần. Tại sao lại giảm độ tin cậy xuống nh vậy, điểm lợi của nó ở đâu ? Đó là: giải phóng gánh nặng cho phần mềm. Sau khi một gói IP đã ra khỏi một điểm nào đó, phần mềm của điểm này không cần quan tâm đến nó nữa. Nếu chúng ta đã từng viết phần mềm cho truyền tin thì đây là một lợi thế không nhỏ. Chúng hãy tởng tợng là để gửi một byte từ một nút nọ sang một nút kia đều chạy một chơng trình kiểm tra khổng lồ thì tốc độ truyền sẽ bị giảm xuống một cách thảm hại. Packet header Data Area Header có nhiều thành phần, nhng có bốn thành phần quan trọng: 3) Indentification 4) Fragment Offset 5) Source IP Address 6) Destination IP Address Cấu trúc trên đây cho phép khôi phục lại bản gốc của thông tin từ các gói nhỏ và cho phép nhiều chơng trình trên một máy có thể liên lạc vói Internet cùng một lúc. Transmission Control Protocol (TCP) Mức IP có thể chấp nhận thông tin bị mất, có thể đến không theo thứ tự và có thể bị lặp nhiều lần. Một trong những phơng án để giảm lỗi là giao trách nhiệm đó cho mức ứng dụng. Tuy nhiên, nh vậy sẽ dẫn đến là tất cả ứng dụng trên mạng đều phải có các đơn thể khử lỗi. Internet cung cấp một dịch vụ trao hàng có đản bảo. Điều đó có nghĩa là bên gửi và bên nhận sẽ đợc thông báo là hàng đến nơi an toàn hay không. Đây là cơ sở cho việc xây dựng giao thức truyền có điều khiển (TCP). Quan điểm của Internet là cung cấp một giao thức tchồng lên giao thúc IP với 5 đặc trng: 7) Truyền theo dòng dữ liệu(stream orientation): nghĩa là hết byte này đến byte khác, không cần quan tâm đến sự phân chia gói ở mức IP. 8) Tạo mạch nối đo(victual circuit conection): ở múc IP, các gói thông tin có thể đi theo nhiều con đờng khác nhau để đến đích. Tỵa mức TCP, ngời sử dụng có thể hình dung nh là cá dòng dữ liệu liên tục và nối trực tiếp. [...]... có các lợc đồ khác nh: file, gopher, wais, news, telnet, mail Phần tiếp theo là phần tên máy Đối với Việt Nam, phần kết của tên sẽ là: vn Chú ý cách đặt tên theo quy ớc của ISO http://www.ebook.edu.vn Trang 51 World wide web (www) v siêu văn bản hypertext TATA Jsc - CIC Phần cuối cùng là phần đờng dẫn đến một file nào đó Trình Web Server là trình thờng trú bộ nhớ trong, dới UNIX thờng đợc gọi là daemon... phía trên hđh) có thể chạy các chơng trình Java; Nếu một chơng trình Java đợc tải về từ một trang Web và chạy trên máy Client thì chơng trình đó có tên gọi là Java Applet; Nếu applet chạy trên server thì có tên gọi serverlet; HotJava là tên gọi bộ duyệt có khả năng xử lý applet; http://www.ebook.edu.vn Trang 52 World wide web (www) v siêu văn bản hypertext TATA Jsc - CIC Java Beans là các đơn thể Java... các máy ở trong mạng; DHCP hỗ trợ các chức năng sau: Cấp phát tự động: mỗi máy sẽ đợc gán thờng trực một địa chỉ IP Cấp phát mềm dẻo: cấp đc IP trong một khoảng thời gian nhất định; cơ chế này cho phép sử dụng lại các đc IP đã đợc cấp phát nhng không dùng nữa Cấp phát thủ công: do quản trị viên chịu trách nhiệm Có thể có nhiều DHCP server trên cùng một mạng; mỗi một server quản lý một vùng đc IP... bởi một URL (Universal Resource Locator - điểm xác định trang Web) Thờng File này đợc viết trong ngôn ngữ HTML và bộ duyệt đầu tiên sử lý file này nh là một file văn bản bình thờng Khi nó gặp một tham chiếu (là một URL) thì nó gửi một request (một yêu cầu cung cấp tin) đến địa chỉ tơng ứng Tại địa điểm đấy đã có một Web Server đợi sẵn (tam dịch là trình quản lý các trang Web) Sau khi nhận đợc yêu cầu... hành đa nhiệm, có nhiều qúa trình cùng chạy, có thể có nhiều quá trình nh vậy có nhu cầu truyền tin, khi các gói tin đợc gửi đến thì phải có cơ chế nào đó để phân biệt các gói tin thuộc quá trình nào Nh vậy, trên cùng một máy, có có nhiều đầu điểm kết nối và các gói tin phải có địa chỉ của quá trình nhận Tuy nhiên, trên máy này không thể biết đợc máy kia đàn chạy quá trình nào Rõ ràng, phải có cách... yêu cầu cùng một lúc (thờng là mô hình Client/Server computing đối với mỗi yêu cầu của Cilent, trình Web Server sẽ cho phát sinh một thread qui trình mới Sau khi kết thúc thread này sẽ tự khử) Các trình Web Server trớc đây đợc xây dựng trên UNIX, nay cũng có trên PCs Thông thờng thờng một Web Server quản lý nhiều th mục gồm nhiều trang Web Bản thân mỗi một cá nhân hay công ty có nối với máy Internet... hypertext TATA Jsc - CIC Nếu tên để phẳng nh cách làm của WINS thì chỉ thích hợp với số lợng nhỏ các máy, (thực chất là ánh xạ giữa địa chỉ IP và tên) Máy làm quản trị sẽ trở nên rất nặng nề khi số lợng máy tăng lên Trớc đây toàn bộ tên đợc quản lý bởi InterNIC, có một file tên host.txt Các máy khác muốn lấy danh sách thì dùng FTP lấy file đó về máy tính của mình để kiểm tra Sau đó việc quản trị tên... của cuốn Nghệ thuật lập trình lại thấy Knuth có tham chiếu đến một công trình toán học của Fibonaci đợc lu ở th viện hoàng gia của Thuỵ Điển thì ta lại có dịp đọc văn bản đó bằng cách nháy lên phần tham chiếu Cứ nh thế ta có thể ngao du trên khắp thế giới hành tính bằng phơng tiện siêu văn bản http://www.ebook.edu.vn Trang 49 World wide web (www) v siêu văn bản hypertext TATA Jsc - CIC Trên đây chỉ bớc... khởi thuỷ của siêu văn bản Hiện nay, với bộ trình duyệt Netscape Navigator hoặc Internet Explorer, chúng ta có thể xem đợc ảnh, nghe nhạc và thậm chí xem đợc phim Ngoài ra, nó còn tích hợp đợc các dịch vụ khác nh E-mail, FTP, Remote Login, lập trình Java Trong tơng lai gần bộ này sẽ còn đợc cải tiến và nâng cấp http://www.ebook.edu.vn Trang 50 TATA Jsc - CIC World wide web (www) v siêu văn bản hypertext... làm sao mà thực hiện đợc điều đó? Có mấy thành phần cơ bản sau đây để cấu thành: Mạng Internet - để liên kết tất cả các điểm trên thế giới lại với nhau Bộ duyệt chẳng hạn nh Netscape Navigator hoặc Internet Explorer Một ngôn ngữ cho siêu văn bản, nh HTML (Hyper Text Markup Language) Các Web Servers HTML là một ngôn ngữ cho siêu văn bản, trong đó có một phần dùng để mô tả liên kết từ một văn bản từ . mô hình mạng internet TATA Jsc. - CIC Trang 40 ắ Class A: 10.0.0.0 10 .25 5 .25 5 .25 5 ắ Class B: 1 72. 16.0.0 1 72. 31 .25 5 .25 5 ắ Class C: 1 92. 168.0.0 1 92. 168 .25 5 .25 5 IP subnet và mặt nạ mạng (mask). công nghệ mạng Việc kết nối mạng có thể phân chia thành hai lớp: circuit-switched (chuyển mạch), và packet - switched(chuyển gói). Một ví du địa chỉển hình về mạng chuyển mạch là mạng điện. công: do quản trị viên chịu trách nhiệm Có thể có nhiều DHCP server trên cùng một mạng; mỗi một server quản lý một vùng đc IP riêng biệt; tuy nhiên, các server này không đợc quản lý các vùng