3.1.4.1 Đặt vấn ñề
Theo ñịnh nghĩa và các tính chất của hệ phân tán (Trình bày tại chương 2), hệ
phân tán gồm nhiều server kết nối với nhau thông qua ñường truyền viễn thông. Ưu
ñiểm lớn nhất của hệ phân tán ña server ñó là ta có thể chia sẽ tài nguyên giữa các trạm và tăng khả năng xử lý ñồng thời. Điều này sẽ làm giảm thời gian xử lý thông tin rất nhiều. query results search Query parser Search Engine
Ranking Index file results
51
Giả sử ta chia máy tìm kiếm ra thành nhiều máy tìm kiếm nhỏñặt tại các server trong hệ thống phân tán. Kho dữ liệu index file cũng ñược chia nhỏ và phân tán tại các trạm. Khi một yêu cầu người dùng ñược chuyển tới, hệ thống sẽ thông báo cho tất cả các trạm thực hiện truy vấn vào kho index file riêng của mình và gửi kết quả
lại cho hệ thống, hệ thống sẽ tổng hợp, sắp xếp kết quả và chuyển cho người dùng.
Hình 3. 2 Các bước hoạt ñộng của máy tìm kiếm ứng dụng hệ phân tán
3.1.4.2 Kết luận
Như vậy, thời gian xử lý của hệ thống sẽ tỉ lệ nghịch với số lượng các trạm trong hệ thống, số lượng các trạm càng tăng thì thời gian xử lý càng giảm. Ứng dụng hệ phân tán ña server vào máy tìm kiếm ta có thể giải quyết ñược các vấn ñề
sau: SE (2) SE (1) SE (n) Ranking Display result Send request Beging End
52
i. Kho dữ liệu index file ñược phân tán tại tất cả các trạm trong hệ dung lượng kho dữ liệu index file tại mỗi trạm giảm xuống tương ứng với số
lượng trạm trong hệ.
ii. Tất cả các trạm ñồng thời cùng tham gia vào việc xử lý thông tin Tăng cấu hình của hệ thống lên tương ứng với số lượng trạm trong hệ.
iii. Tăng băng thông, tối ưu khoảng cách ñường truyền của hệ thống iv. Giảm số lượng và dung lượng gói tin cần truyền tại mỗi trạm.
Như vậy ứng dụng hệ phân tán ña server sẽ giảm thời gian xử lý của máy tìm kiếm một cách ñáng kể.