HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG - LẠI XUÂN PHONG NGHIÊN CỨU CÁC HỆ THỐNG FILE PHÂN TÁN VÀ ỨNG DỤNG Chuyên ngành: Hệ thống thông tin Mã số: 60.48.01.04 TÓM TẮT LUẬN VĂN THẠC SĨ HÀ NỘI - NĂM 2014 Luận văn hoàn thành tại: HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG Người hướng dẫn khoa học: TS HOÀNG XUÂN DẬU Phản biện 1: TS Hà Hải Nam Phản biện 2: TS Trần Đăng Hưng Luận văn bảo vệ trước Hội đồng chấm luận văn thạc sĩ Học viện Công nghệ Bưu Viễn thông Vào lúc: ngày tháng năm Có thể tìm hiểu luận văn tại: - Thư viện Học viện Công nghệ Bưu Viễn thông MỞ ĐẦU Lý chọn đề tài Cùng với phát triển mạng máy tính, việc quản lý, lưu trữ xử lý thông tin ngày không thực máy tính đơn lẻ trước Các hệ thống thông tin cần xây dựng từ máy tính kết nối với qua mạng tốc độ cao Hệ thống file phân tán (Distributed File System) hệ thống quản lý lưu trữ file xây dựng sở mạng máy tính, file quản lý lưu trữ nhiều máy tính mạng Hệ thống file phân tán có ưu điểm vượt trội so với hệ thống file tập trung (hệ thống file máy tính), dung lượng lưu trữ lớn, độ tin cậy cao, khả chịu lỗi cao, hỗ trợ tốc độ truy cập cao cho nhiều người dùng đồng thời Tuy có nhiều ưu điểm vượt trội, chi phí lắp đặt vận hành tương đối cao, nên thống file phân tán chưa sử dụng rộng rãi doanh nghiệp tổ chức có quy mô vừa nhỏ Trong điều kiện hạ tầng công nghệ thông tin yếu Việt Nam, hầu hết doanh nghiệp tổ chức có quy mô vừa nhỏ sử dụng máy chủ riêng rẽ để quản lý lưu trữ thông tin Phương pháp có ưu điểm chi phí thấp, không đảm bảo dung lượng, tính tin cậy tốc độ truy nhập cho nhiều người dùng Do vậy, việc nghiên cứu sâu hệ thống file phân tán ứng dụng hiệu vào doanh nghiệp tổ chức có quy mô vừa nhỏ yêu cầu thực tế cấp thiết Đây lý chọn đề tài Mục đích nghiên cứu : - Nghiên cứu tổng quan hệ thống file phân tán, kỹ thuật xây dựng hệ thống file phân tán - Xây dựng mô hình ứng dụng thử nghiệm hệ thống file phân tán cho doanh nghiệp vừa nhỏ - Cài đặt thử nghiệm hệ thống file phân tán dựa DFS MS Windows 2008 Server - Ứng dụng hệ thống file phân tán cân tải Windows 2008 Server cho ứng dụng web Đối tượng phạm vi nghiên cứu: - Đối tượng nghiên cứu: Một số hệ thống file phân tán điển hình - Phạm vi nghiên cứu: Nghiên cứu hệ thống file phân tán ứng dụng thực tế Phương pháp nghiên cứu: - Phương pháp nghiên cứu lý thuyết với thực nghiệm phân tích, đánh giá kết 3 Chương - TỔNG QUAN VỀ HỆ THỐNG FILE PHÂN TÁN 1.1 Khái niệm hệ thống file hệ thống file phân tán 1.1.1 Khái niệm hệ thống file Hệ thống file (File System) phương pháp tổ chức lưu trữ file liệu chúng, thường thực hệ điều hành Hệ thống file cho phép người sử dụng dễ dàng tìm kiếm truy nhập file 1.1.2 Khái niệm hệ thống file phân tán Hệ thống file phân tán (Distributed File System - DFS) hệ thống file hỗ trợ chia sẻ files tài nguyên mạng 1.2 Lịch sử phát triển Một số mốc phát triển hệ thống file phân tán: - 1980s: Chia sẻ file dùng đĩa mềm (copy – vận chuyển – copy) -1980s: Chia sẻ file dùng giao thức FTP, cần lần copy user phải biết địa vật lý ftp server - SPRITE Network OS: phát triển vào năm 1980 ĐH University of California at Berkerly, Mỹ - Năm 1983: Andrew File System (AFS) phát triển ĐH Carnegie Mellon với hỗ trợ hãng IBM, Mỹ - Năm 1985: Sun NFS hãng Sun Microsystems phát triển -Đầu năm 1990s: Hệ thống file CODE phát triển Đây AFS - ZEBRA: Được phát triển vào đầu năm 1990 ĐH University of California at Berkerly, Mỹ - HARP: Được phát triển vào đầu năm 1990 ĐH MIT, Mỹ 4 - Lustre: Là DFS mã mở, có khả kết hợp hàng chục ngàn nút cung cấp dung lượng lưu trữ đến petabytes Phiên 1.80 phát hành vào tháng năm 2009 1.3 Các yêu cầu hệ thống file phân tán Các yêu cầu hệ thống file phân tán bao gồm: tính suốt, hiệu năng, khả chịu lỗi khả mở rộng 1.4 Các kỹ thuật đặt tên file hệ thống file phân tán Các kỹ thuật thực việc đặt tên file hệ thống file phân tán bao gồm: Dịch tên đường dẫn, Tên nhận dạng có cấu trúc, Thông tin gợi ý hint Các chế mount 1.4.1 Dịch tên đường dẫn (Pathname translation) Dịch tên đường dẫn ánh xạ từ file sang tên nhận dạng mức thấp thường thực thủ tục tìm kiếm đệ quy 1.4.2 Tên nhận dạng có cấu trúc (Structured Identifiers) Mỗi tên nhận dạng có cấu trúc chuỗi bit, thường gồm thành phần: - Phần đầu dùng để nhận dạng đơn vị thành phần chứa file - Phần lại nhận dạng file cụ thể đơn vị thành phần 1.4.3 Thông tin gợi ý (Hint) Hint kỹ thuật thường sử dụng ánh xạ vị trí (location mapping) DFS 1.4.4 Các chế mount (Mount mechanism) Cơ chế mount việc kết hợp hệ thống file từ xa vào hệ thống file cục để tạo thành cấu trúc tên toàn cục 1.5 Kết chương Chương trình bày khái niệm chung hệ thống file phân tán: khái niệm yêu cầu hệ thống file phân tán Ngoài ra, sơ lược lịch sử phát triển kỹ thuật thực việc đặt tên hệ thống file phân tán trình bày