BÀI TIỂU LUẬN hệ PHÂN tán

24 470 0
BÀI TIỂU LUẬN hệ PHÂN tán

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Tiểu luận: Hệ Phân Tán GVHD: PGS.TS Lê Văn Sơn MỤC LỤC LỜI MỞ ĐẦU .2 CHƯƠNG I: KHẢ NĂNG PHÂN TÁN CỦA HỆ ĐIỀU HÀNH UNIX 3 CHƯƠNG II: THUẬT TOÁN QUẢN LÝ NHIỀU BẢN SAO 8 CHƯƠNG III: BÀI TẬP .19 KẾT LUẬN .23 TÀI LIỆU THAM KHẢO .24 HVTH: Trương Thị Minh Hậu Trang 1 Tiểu luận: Hệ Phân Tán GVHD: PGS.TS Lê Văn Sơn LỜI MỞ ĐẦU Nhân loại đang bước vào một thời đại mới, thời đại của xã hội thông tin và nền kinh tế tri thức được hình thành trên cơ sở phát triển và ứng dụng rộng rãi công nghệ thông tin (CNTT) và truyền thông. Cuộc cách mạng thông tin cùng với quá trình toàn cầu hóa đang ảnh hưởng sâu sắc đến mọi lĩnh vực trong đời sống kinh tế - xã hội, đưa con người chuyển nhanh từ xã hội công nghiệp sang xã hội thông tin, từ kinh tế công nghiệp sang kinh tế tri thức, ở đó năng lực cạnh tranh phụ thuộc chủ yếu vào năng lực sáng tạo, thu thập, lưu trữ, xử lý và trao đổi thông tin. Vì vậy, một xu hướng kỹ thuật mới được phát triển, đó là xu hướng phân tán các thành phần tạo nên hệ tin học theo hướng tiếp cận nơi sử dụng và sản xuất thông tin gọi là hệ tin học phân tán. Hệ tin học phân tánhệ thống rất đa dạng, đa diện, phức tạp về mặt cấu trúc, là vùng tri thức hiện đại; là một lĩnh vực nghiên cứu mới hứa hẹn nhiều triển vọng; đã và đang thu hút sự chú ý, quan tâm của các nhà nghiên cứu, các chuyên gia CNTT trên toàn thế giới. Trong phạm vi nhỏ của đề tài tiểu luận đã chọn, tôi trình bày về vấn đề quản lý sao chép nhiều bản sao nhằm cho phép một trạm rút lui theo ý muốn ra khỏi mạng, rồi lại vào lại trong mạng và cập nhật bản sao vốn có của mình. Ngoài ra đề tài cũng xem xét khả năng phân tán thông tin trong hệ điều hành Unix. Mặc dù đã nghiên cứu kỹ phần lý thuyết để có được cách giải quyết bài tập đúng đắn, phù hợp với yêu cầu đề tài, nhưng tôi không thể tránh khỏi những sai sót, kính mong được sự đóng góp ý của thầy giáo hướng dẫn và các anh chị trong lớp để bài tiểu luận được hoàn thiện tốt hơn. Tôi xin chân thành cảm ơn! Học viên thực hiện: Trương Thị Minh Hậu HVTH: Trương Thị Minh Hậu Trang 2 Tiểu luận: Hệ Phân Tán GVHD: PGS.TS Lê Văn Sơn CHƯƠNG I: KHẢ NĂNG PHÂN TÁN CỦA HỆ ĐIỀU HÀNH UNIX I.1 Những vấn đề chung I.1.1 Định nghĩa. Một số khái niệm cơ bản của Hệ tin học phân tán Hệ tin học phân tán hay nói ngắn gọn là hệ phân tán (Distributed System) là hệ thống xử lý thông tin bao gồm nhiều bộ xử lý hoặc bộ vi xử lý nằm tại các vị trí khác nhau và được liên kết với nhau thông qua phương tiện viễn thông dưới sự điều khiển thống nhất của một hệ điều hành[1]. Nói đến hệ tin học phân tán, hiện nay có rất nhiều ý kiến khác nhau về nguyên tắc xây dựng hệ. Như vậy khả năng phân tán cũng là một khái niệm chưa mang tính nhất quán. Tuy nhiên trong phạm vi nghiên cứu này ta xem khả năng phân tán là việc phân tán quá trình xử lí thông tin và thực hiện công việc đó trên các trạm xa nhau. Để đánh giá khả năng phân tán ta đánh giá hệ trên các khả năng cụ thể sau: Chia sẻ tài nguyên: Mạng máy tính có thể dùng chung tài nguyên. Một tiến trình trên một trạm nào đó có thể yêu cầu được cung cấp tài nguyên dùng chung ở một trạm khác. Liên lạc: Khi hệ thống được mắc nối với nhau, các thực thể của hệ có thể trao đổi thông tin cho nhau. Tin cậy: Một trạm của hệ bị sự cố không làm cho toàn hệ bị ảnh hưởng, mà ngược lại, công việc của trạm đó được phân cho các trạm khác đảm nhiệm. Ngoài ra trạm bị sự cố có thể tự động phục hồi lại các trạng thái trước khi bị sự cố hay trạng thái ban đầu của nó. Tăng tốc: Một tính toán lớn nào đó, nếu chỉ sử dụng một trạm thì thời gian trả về kết quả sẽ rất lớn. Tính toán này sẽ được chia nhỏ và thực hiện song song trên các trạm. Một trong những tư tưởng lớn của Hệ tin học phân tánphân tán hóa các quá trình xử lý thông tin và thực hiện công việc đó trên các trạm xa nhau. Hệ tin học phân tán thực hiện hàng loạt các chức năng phức tạp, nhưng cơ bản nhất là đảm bảo cung cấp cho người sử dụng (NSD) khả năng truy cập có kết quả đến các tài nguyên vốn có và rất đa dạng của hệ thống như là những tài nguyên dùng chung. Các đặc điểm cơ bản của tất cả các hệ tin học phân tán là: HVTH: Trương Thị Minh Hậu Trang 3 Tiểu luận: Hệ Phân Tán GVHD: PGS.TS Lê Văn Sơn 1. Thời hạn truyền thông tin trong hệ không giống nhau, các thông điệp có thể bị mất trong quá trình chuyển tải, các thông điệp có thể được truyền kép và hệ thống có thể rơi vào sự cố. 2. Một (hay nhiều) máy tính cấu thành của hệ phân tán có thể bị sự cố và hoạt động của toàn hệ trở nên kém hiệu quả. I.1.2 Hệ điều hành Unix Năm 1965, Viện công nghệ Massachusetts (MIT: Massachusetts Institute of Technology) và Phòng thí nghiệm Bell của hãng AT&T thực hiện dự án xây dựng một hệ điều hành có tên gọi là Multics (MULTiplexed Information and Computing Service) với mục tiêu tạo lập được một hệ điều hành phủ trên vùng lãnh thổ rộng (hoạt động trên tập các máy tính được kết nối), đa người dùng, có năng lực cao về tính toán và lưu trữ. Dự án nói trên thành công ở mức độ hết sức khiêm tốn và người ta đã biết đến một số khiếm khuyết khó khắc phục của Multics. Năm 1969, Ken Thompson, một chuyên viên tại phòng thí nghiệm Bell, người đã tham gia dự án Multics, cùng Dennics Richie viết lại hệ điều hành đa-bài toán trên máy PDP-7 với tên là UNICS (UNiplexed Information and Computing Service). Trong hệ điều hành UNICS, một số khởi thảo đầu tiên về Hệ thống tập tin đã được Ken Thompson và Dennis Ritchie thực hiện. Đến năm 1970 hệ điều hành được viết trên assembler cho máy PDP-11/20 và mang tên là UNIX. Năm 1973, Richie và Thompson viết lại nhân của hệ điều hành UNIX trên ngôn ngữ C, và hệ điều hành đã trở nên dễ dàng cài đặt tới các loại máy tính khác nhau; tính chất như thế được gọi là tính khả chuyển (portable) của UNIX. Hãng AT&T phổ biến chương trình nguồn UNIX tới các trường đại học, các công ty thương mại và chính phủ với giá không đáng kể. Năm 1982, hệ thống UNIX-3 là bản UNIX thương mại đầu tiên của AT&T. Năm 1983, AT&T giới thiệu Hệ thống UNIX-4 phiên bản thứ nhất trong đó đã có trình soạn thảo vi, thư viện quản lý màn hình được phát triển từ Đại học Tổng hợp California, Berkley. HVTH: Trương Thị Minh Hậu Trang 4 Tiểu luận: Hệ Phân Tán GVHD: PGS.TS Lê Văn Sơn Giai đoạn 1985-1987, UNIX-5 phiên bản 2 và 3 tương ứng được đưa ra vào các năm 1985 và 1987. Trong giai đoạn này, có khoảng 100.000 bản UNIX đã được phổ biến trên thế giới, cài đặt từ máy vi tính đến các hệ thống lớn. Đầu thập kỷ 1990. UNIX-5 phiên bản 4 được đưa ra như là một chuẩn của UNIX. Đây là sự kết hợp của các bản sau: - AT&T UNIX-5 phiên bản 3, - Berkley Software Distribution (BSD), - XENIX của MicroSoft, - SUN OS. Trong thời gian gần đây (khoảng năm 1997) một số phiên bản mới của UNIX được giới thiệu và phổ biến trên Internet. I.2 Khả năng phân tán của hệ điều hành Unix Dựa vào những khả năng và nguyên lý của một hệ tin học phân tán đã nêu, ta tìm hiểu các khả năng phân tán hệ điều hành Unix thông qua cơ chế socket. Ống là cơ chế liên lạc liên tiến trình rất đặc trưng cho hệ điều hành Unix và cho phép trao đổi các luồng thông tin một chiều và khá ổn định giữa hai tiến trình. Nó được coi là một tập tin giống như tập tin bình thường khác với một vài điểm ngoại lệ sau: STT Đặc điểm khác với các tập tin bình thường. 1 Không có tên trong hệ thống quản lý các tập tin 2 Sử dụng lời gọi hệ thống Pipe 3 Kính cỡ của ống cố định (4.096 ô nhớ) 4 Khi một tiến trình ghi vào ống đã đầy ta dừng tiến trình này lại 5 Tất cả dữ liệu trong ống được đọc hết, việc ghi được bắt đầu của tập tin 6 Các ống không phải là các bộ nhớ đệm di chuyển 7 Dữ liệu của ống thường ghi Cache HVTH: Trương Thị Minh Hậu Trang 5 Tiểu luận: Hệ Phân Tán GVHD: PGS.TS Lê Văn Sơn Trong UNIX, người ta sử dụng ống như là trường hợp đặc biệt của cơ chế socket. Thông thường, trên cùng một máy, một ống chỉ được sử dụng để cho hai tiến trình liên lạc với nhau thông qua lời gọi hệ thống fork. Cơ chế socket còn có thể áp dụng cho các tiến trình không ở trong tình trạng liên lạc với nhau. Mỗi socket được sử dụng chỉ trong một vùng. Các tiến trình liên lạc với nhau trong cùng một vùng và sử dụng cùng một kiểu định khuôn địa chỉ. Hình I.1 mô tả chức năng của các loại socket Hình I.1. Các loại Socket Công cụ hỗ trợ mạng máy tính. Hệ thống hỗ trợ mạng máy tính bằng các giao thức DARPA, Internet UDP, TCP, IP và ICMP trên một bình diện rộng của các giao diện mạng Ethernet, vòng tròn Jeton, ARPANET. Các cấu trúc phân tầng của hệ cho phép: 1. Thêm vào mạng các giao thức mới. 2. Tổ chức công việc trên mạng thông qua các socket. Trong môi trường mạng máy tính theo mô hình ISO 7 lớp, thông thường các dữ liệu được truyền giữa các tầng với nhau thông qua các giao thức thích nghi cho các giao diện socket. Tóm lại giữa 2 tầng kề nhau luôn luôn tồn tại một giao diện tầng, giữa 2 tầng tương ứng của hai hệ thống liên lạc luôn luôn sử dụng một loại giao thức. Các dữ liệu mạng được truyền từ tầng này đến tầng khác và giữa hai tầng tương ứng. HVTH: Trương Thị Minh Hậu Trang 6 Tiểu luận: Hệ Phân Tán GVHD: PGS.TS Lê Văn Sơn Hình I.2 cho ta thấy tương quan giữa hai mô hình ISO và UNIX Hình I.2. Tương quan giữa các mô hình mạng HVTH: Trương Thị Minh Hậu Trang 7 Tiểu luận: Hệ Phân Tán GVHD: PGS.TS Lê Văn Sơn CHƯƠNG II: THUẬT TOÁN QUẢN LÝ NHIỀU BẢN SAO II.1 Sự cần thiết sử dụng nhiều bản sao Trong các hệ phân tán, việc trao đổi các thông tin từ xa là một vấn đề đáng được quan tâm. Trong các hệ này, từng hệ thống cục bộ đều có thể lưu trữ một bản sao của tất cả các thông tin liên quan đang ở trong tất cả các hệ cục bộ khác. Sự tồn tại nhiều bản sao trong một hệ phân tán có các đặc điểm sau: Cập nhật thông tin diễn ra ở 1 trạm nào đó cần phải được tiến hành cho tất cả các trạm và không được bỏ sót 1 trạm nào. Trong khoảng thời gian làm “tươi” thông tin phải đảm bảo sao việc truy vấn dữ liệu cho kết quả kịp thời hay đặt tả được truy vấn trong trạng thái “treo”. Cần phải tránh trường hợp các thao tác trên 2 bản sao khác nhau nhưng chứa cùng một thông tin được truy cập bởi 2 hay nhiều yêu cầu dẫn đến không gắn bó. Hai vấn đề nêu trên xác định về các ràng buộc đối với vấn đề gắn bó dữ liệu. Đảm bảo sự gắn bó này điều kiện đủ là phải tuân thủ trình tự nào đó cho tất cả các bản sao, các cập nhật thông tin. Khi nghiên cứu về hệ phân tán chúng ta thấy rằng thời gian truy cập trung bình vào hệ thông tin phân tán có thể được rút ngắn, trong một số trường hợp, nhờ vào phương pháp nhân nhiều bản và được gọi là nhân nhiều bản sao của một đối tượng thông tin. Ta cần phân biệt hai trường hợp khác nhau được thể hiện sau đây. HVTH: Trương Thị Minh Hậu Trang 8 Tiểu luận: Hệ Phân Tán GVHD: PGS.TS Lê Văn Sơn Trường hợp 1: Ta xét 1 hệ thống đa xử lý với bộ nhớ chung như hình II.1 sau đây: Hình II.1. Đa xử lý với bộ nhớ chung Mỗi một bộ xử lý đều có bộ nhớ cục bộ của mình, hay còn gọi là cache, được dùng để sao chép lại các vùng đang làm việc của bộ nhớ chung. Một chương trình thể hiện thuật toán thay thế đảm nhiệm nhiệm vụ làm mới các bộ nhớ cục bộ. Trường hợp có nhiều bộ xử lý muốn truy cập vào cùng một đối tượng, ta sử dụng như là sự tham chiếu đến phiên bản của đối tượng tìm thấy trong bộ nhớ chung. Hình II.2 mô tả 1 hệ truy cập từ xa thông qua 1 máy server duy nhất: Hình II.2. Hệ truy cập từ xa thông qua máy server HVTH: Trương Thị Minh Hậu L L L L B cb B cb B cb B cb B ch B ch Bộ xử lý Bộ nhớ cục bộ (e) Bộ nhớ chung (e) L L L L B cb B cb B cb B cb B ch B ch Bộ xử lý Bộ nhớ cục bộ (e) Bộ nhớ chung (e) Máy Client Hệ thống viễn thông Hệ thống viễn thông L L Máy Server Trang 9 Tiểu luận: Hệ Phân Tán GVHD: PGS.TS Lê Văn Sơn Ở đây, một đối tượng được đưa vào trên một trạm xác định và được quản lý bởi một server cục bộ trên trạm này. Khi một tiến trình ở xa muốn sử dụng đối tượng, nó phải bắt đầu bằng yêu cầu server cho một bản sao thông qua hệ thống viễn thông. Sau khi sử dụng xong, tiến trình phải gửi lại cho server một phiên bản đã được sửa đổi của đối tượng. Các trường hợp thể hiện trong các hình vẽ II.1 và II.2 xét theo chức năng là giống nhau. Đó là trường hợp một bản duy nhất của đối tượng là một đặc quyền. Trường hợp 2: Xét hệ thống đối xứng như hình II.3 sau: Hình II.3. Hệ thống đối xứng Tại đây, tất cả các bản đóng vai trò đối xứng. Công việc được tiến hành theo kiểu này cho phép rút ngắn thời gian truy cập, nếu số lần truy cập để đọc lớn hơn số lần truy cập để ghi và vì lý do thuận lợi sử dụng theo nghĩa có sẵn để dùng. Điều này đặt ra cho chúng ta nhiều vấn đề cần giải quyết, đó là các lần ghi thông tin hay gọi là HVTH: Trương Thị Minh Hậu L L L L e e Hệ thống viễn thông Hệ thống viễn thông L L e e L L e e e e L L e e L L e e Trang 10 . hướng phân tán các thành phần tạo nên hệ tin học theo hướng tiếp cận nơi sử dụng và sản xuất thông tin gọi là hệ tin học phân tán. Hệ tin học phân tán là hệ. Một số khái niệm cơ bản của Hệ tin học phân tán Hệ tin học phân tán hay nói ngắn gọn là hệ phân tán (Distributed System) là hệ thống xử lý thông tin bao

Ngày đăng: 26/12/2013, 11:09

Từ khóa liên quan

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan