Sự hình thành và tìm kiếm mặc định của máy tìm kiếm ODP

Một phần của tài liệu Tìm kiếm thông tin trên mạng Internet: Hướng dẫn thực hành - Phần 2 (Trang 62 - 64)

CHƯƠNG 6 MÁY TÌM KIẾM AOL

7.1. Khái quát vài nét về máy tìm kiếm ODP

7.1.1. Sự hình thành và tìm kiếm mặc định của máy tìm kiếm ODP

Theo Wikipedia, dự án thư mục mở (Open Directory Project,ODP), còn được biết tới với tên DMOZ (viết tắt của directory.mozilla.org, - tên miền gốc của dự án), là một dự án thư mục website đa ngôn ngữ mởđược điều hành và hoạt động bởi cộng đồng các tình nguyện viên làm nhiệm vụ biên tập nội dung.Dmoz sử dụng việc một hệ thống phân cấp thư mục để liệt kê các website. Các website có chủ đề tương tự nhau có thể được liệt kê vào các thư mục mà có thể chứa các thư mục nhỏ hơn. Chặng đường tồn tại và phát triển của DMOZ được diễn ra trong một thời gian dài và đã kết thúc vào năm 2017 khi chuyển hẳn giao diện tìm kiếm sang địa chỉ: http://www.odp.org.

DMOZ được thành lập tại Hoa Kỳ vào năm 1998 bởi Rich Skrenta và Bob Truel , lúc này cả hai đều là kỹ sư cho Sun Microsystems. Chris Tolles là người đứng đầu tiếp thị các sản phẩm bảo mật mạngtại Sun Microsystems cũng là người đồng sáng lập Gnuhoo (tiền thân của DMOZ) cùng với Bryn Dole và Jeremy Wenokur. Cấu trúc danh mục ban đầu của thư mục Gnuhoo dựa trên cấu trúc của các nhóm tin Usenet rồi tồn tại từ trước.Thư mục Gnuhoo được phát hành vào ngày 5 tháng 6 năm 1998.

Sau khi Richard Stallman phản đối việc sử dụng "Gnu" trong tên, Gnuhoo đã được đổi thành NewHoo. Tuy nhiên, Yahoo! sau đó phản đối việc sử dụng "Hoo" trong tên, do đó, cái tên được đề xuất thay là ZURL. Trước khi chuyển sang ZURL, NewHoo đã được Netscape Communications Corporation mua lại vào tháng 10 năm 1998 và trở thành Dự án Thư mục Mở. Netscape đã phát hành dữ liệu Open Directory theo Giấy phép Thư mục Mở. Netscape đã được AOL mua lại ngay sau đó và DMOZ là một trong những tài sản được đưa vào vụ mua lại.

Vào thời điểm Netscape đảm nhận quản lý, Dự án Thư mục Mở có khoảng 100.000 URL được lập chỉ mục với sự đóng góp từ khoảng 4500 biên tập viên. Vào ngày 5 tháng 10 năm 1999, số lượng URL được DMOZ lập chỉ mục đã đạt một triệu. Theo ước tính khơng chính thức, các URL trong DMOZ đánh số 1,6 triệu vào tháng 4 năm 2000, vượt qua các URL trong thư mục của Yahoo!. DMOZ đã đạt được các mốc mốc lập chỉ mục hai triệu URL vào ngày 14 tháng 8 năm 2000, ba triệu danh sách vào ngày 18 tháng 11 năm 2001 và bốn triệu vào ngày 3 tháng 12 năm 2003. Tính đến tháng 4 năm 2013, đã có 5.169.995 trang web được liệt kê trong hơn 1.017.500 danh mục. Vào ngày 31 tháng 10 năm 2015, có 3.996.412 trang web được liệt kê trong 1.026.706 danh mục.

Vào tháng 1 năm 2006, DMOZ đã bắt đầu xuất bản các báo cáo trực tuyến để thông báo cho công chúng về sự phát triển của dự án. Báo cáo đầu tiên được bao gồm trong năm 2005. Báo cáo hàng tháng được phát hành sau đó cho đến tháng 9 năm 2006. Các báo cáo này cung cấp thông tin chi tiết hơn về chức năng của thư mục so với các thống kê được đơn giản hóa được cung cấp trên trang đầu của thư mục. Số lượng danh sách và danh mục được trích dẫn trên trang chủ bao gồm các danh mục "Kiểm

tra" và "Dấu trang" nhưng chúng không được bao gồm trong vùng chứa RDF được cung cấp cho người dùng. Có khoảng 7330 biên tập viên hoạt động trong tháng 8 năm 2006. 75.151 biên tập viên đã đóng góp vào thư mục kể từ ngày 31 tháng 3 năm 2007. Kể từ tháng 4 năm 2013, số lượng người biên tập đóng góp đã tăng lên 97.584.

Vào ngày 20 tháng 10 năm 2006, máy chủ chính của DMOZ bị lỗi nghiêm trọng đã ngăn các biên tập viên làm việc trên thư mục cho đến ngày 18 tháng 12 năm 2006. Trong thời gian đó, một thư mục cũ hơn được hiển thị cho công chúng. Vào ngày 13 tháng 1 năm 2007, các biểu mẫu Đề xuất trang web và Danh sách cập nhật lại được cung cấp. Để tránh bị gián đoạn trong tương lai, hệ thống đã lưu trú trên cấu hình dự phịng của hai máy chủ Intel từ đó trở đi. Giao diện của trang web đã được nâng cấp vào năm 2016, mang nhãn hiệu "DMOZ 3.0" nhưng AOL đã ngưng nó vào năm sau.

Khi DMOZ trở nên nổi tiếng hơn, hai thư mục web lớn khác do các tình nguyện viên biên soạn và được tài trợ bởi Go.com và Zeal nổi lên, cả hai hiện tại đều khơng cịn tồn tại. Mơ hình chỉnh sửa của DMOZ đã trực tiếp truyền cảm hứng cho ít nhất ba dự án tình nguyện mở khác: trang web âm nhạc MusicMoz, một thư mục nhà hàng nội dung mở được gọi là ChefMoz và một bách khoa toàn thư được gọi là Open Site. Cuối cùng, theo Larry Sanger, DMOZ là một phần của nguồn cảm hứng cho dự án Nupedia, trong đó Wikipedia phát triển. Tuy nhiên, DMOZ đã đóng cửa vào ngày 17 tháng 3 năm 2017 vì AOL khơng cịn muốn hỗ trợ dự án nữa. Hiện nay, máy tìm kiếm DMOZ đã chuyển hẳn hoạt động sang địa chỉ http://www.odp.org

Một phần của tài liệu Tìm kiếm thông tin trên mạng Internet: Hướng dẫn thực hành - Phần 2 (Trang 62 - 64)

Tải bản đầy đủ (PDF)

(97 trang)