6. Phương thức được sử dụng để tạo bảng xếp hạng. Đơn vị để phân tích là tên miền các trường đại học, vì thế chỉ có các trường và trung tâm nghiên cứu với tên miền web độc lập được nhận dạng. Nếu một trường đại học có nhiều hơn một tên miền, hai hoặc nhiều tên miền sẽ được sử dụng với các địa chỉ khác nhau. Khoảng 5-10% các trường không có trang web độc lập, hầu hết chúng nằm ở các nước đang phát triển. Danh mục của Webometrics không chỉ bao gồm các trường đại học mà còn cả các trung tâm giáo dục cấp cao theo đề nghị của UNESCO. Tên và địa chỉ được tập hợp từ cả các nguồn trong nước và quốc tế như sau:
Universities Worldwide univ.cc
All Universities around the World
www.bulter.nl/universities/
Braintrack University Index www.braintrack.com
Canadian Universities www.uwaterloo.ca/canu
UK Universities www.scit.wlv.ac.uk/ukinfo
US Universities www.utexas.edu/world/univ/state
diện của trang Web. Vì thế, cách tốt nhất là xây dựng thứ hạng kết hợp các nhóm chỉ tiêu làm thước đo cho các biểu hiện khác nhau. Web Impact Factor (WIF) - các tác nhân ảnh hưởng trên web - dựa trên phân tích liên kết bao gồm số liên kết inlink bên ngoài và số các trang trên website, theo tỉ lệ 1:1 giữa tính hiển thị và kích thước. Tỉ lệ này được sử dụng để xếp hạng nhưng còn có thêm hai chỉ tiêu cho thành phần kích thước: Số tài liệu được xác định bằng số file giàu thuộc tên miền đó, và số các xuất bản được tập hợp trong cơ sở dữ liệu của Google Schoolar. Khi chúng đã được xác định, có 4 chỉ tiêu được đưa ra một cách định lượng theo kết quả cung cấp bởi 4 công cụ tìm kiếm như sau:
Kích thước (S). Số các trang tìm được từ bốn công cụ: Google, Yahoo, Live Search và Exalead. Với mỗi công cụ, các kết quả được chuẩn hóa theo logarit về 1 đối với giá trị lớn nhất. Từ đó, với mỗi tên miền, kết quả cực đại và cực tiểu được loại trừ và mỗi tổ chức giáo dục được gán thứ hạng theo giá trị tổng hợp.
Sự hiện diện (V). Tổng số các liên kết từ bên ngoài tới trang web đó (inlink) theo một site có thể được chỉ rõ ràng bởi Yahoo Search, Live Search và Exalead. Với mỗi công cụ, các kết quả được chuẩn hóa theo logarit bằng 1 của giá trị lớn nhất và được kết hợp trong việc định thứ hạng.
Các file giàu (R). Sau khi xác định mối liên hệ về liên lạc học thuật và hoạt động xuất bản, xét theo các định dạng khác nhau, các dạng file sau được lựa chọn: Adobe Acrobat (.pdf), Adobe PostScript (.ps), Microsoft Word (.doc) and Microsoft Powerpoint (.ppt). Các dữ liệu này được trích bởi Google và trộn kết quả mỗi loại sau khi chuẩn hóa theo logarit với cùng cách thức như trên.
Thư tịch nghiên cứu (Sc). Google Scholar cung cấp số bài báo và các trích dẫn theo mỗi tên miền. Các kết quả từ cơ sở dữ liệu Scholar được biểu
diễn như là các bài báo, báo cáo và các dạng ấn bản khoa học khác.
Các thứ hạng được kết hợp theo biểu thức mà mỗi loại lại có trọng số riêng:
Webometrics Rank (position) =
4*RankV+2*RankS+1*RankR+1*RankSc
7. Liên quan và thẩm định các chỉ tiêu: Sự lựa chọn của các chỉ tiêu được thực hiện theo một số tiêu chuẩn, một số hướng tới chất lượng và sức mạnh về học thuật và tổ chức nhưng một số khác nhằm cổ động xuất bản trên Web và cho phép truy cập mở. Việc bao hàm tổng số các trang trong cách tính được dựa trên cơ sở công nhận một thị trường toàn cầu mới về thông tin học thuật. Một hiện diện trang web mạnh mẽ và chi tiết cung cấp mô tả chính xác cấu trúc và hoạt động của một trường đại học có thể thu hút giới sinh viên và nhà khoa học trên toàn thế giới. Số các liên kết từ bên ngoài tới trang web là đánh giá về hiện diện và ảnh hưởng của các tài liệu đã xuất bản, và mặc dù việc cải tiến các liên kết là rất đa dạng, ý nghĩa của nó cũng tương tự như là các trích dẫn về báo cáo khoa học. Sự thành công của việc tự lưu trữ và các sáng kiến trong việc kết hợp các bộ lưu trữ khác có thể được biểu diễn “thô” thông qua các file giàu và các dữ liệu từ các học giả. Số lượng lớn các tài liệu theo dạng pdf và doc được hiểu là trong đó không chỉ chứa các báo cáo về quản trị và hành chính mà còn có các tài liệu khoa học. Các file PostScript và Powerpoint thì rõ ràng là có liên quan đến các hoạt động về học thuật.
8. Xác định hiệu quả theo tham chiếu với các đầu vào khi có thể. Dữ liệu ở các đầu vào có liên quan khi chúng phản ánh các điều kiện tổng thể theo các thiết lập cho trước và khả dụng thường xuyên hơn. Đo lường các tác động cung cấp đánh giá chính xác hơn vị thế và / hoặc chất lượng của trường đại học hoặc các chương trình. Đưa ra một tương quan tốt hơn là việc của tương lai, còn hiện tại, bảng xếp hạng hướng tới sự quan tâm hơn tới các
chiến lược chưa hoàn hảo, các chính sách không thỏa đáng và các thực thi không tốt trong việc xuất bản web, trước khi cố gắng để có được một viễn cảnh toàn diện hơn.
9. Định lượng các chỉ tiêu khác: hướng phát triển hiện tại và tương lai. Các quy tắc hiện tại cho chỉ tiêu để xếp hạng được mô tả theo mô hình trọng số đã được kiểm tra và công bố trên các tạp chí khoa học. Nhiều nghiên cứu sẽ còn được thực hiện về chủ đề này, nhưng mục đích cuối cùng là phát triển một hệ thống bao gồm các dữ liệu định lượng thêm, đặc biệt là các chỉ tiêu dạng bibliometric và scientometric.