ỨNG DỤNG MÔ HÌNH MARKOV TRONG THUẬT TOÁN GOOGLE PAGERANK

9 18 0
ỨNG DỤNG MÔ HÌNH MARKOV TRONG THUẬT TOÁN GOOGLE PAGERANK

Đang tải... (xem toàn văn)

Thông tin tài liệu

Pagerank: là thuật toán trên google dùng để đánh giá quy tính của trang web thông qua việc xem xét số lượng, kết quả, chất lượng của các trang liên kết đến nó. Giá trị Pagerank hình thành từ thuật toán toán học dựa trên biểu đồ trang web: các trang web được coi như các đỉnh và các đường link là các cạnh. Mỗi đường link tới trang web sẽ được tính như 1 sự hỗ trợ làm tăng thêm giá trị Pagerank. Giá trị Pagerank của trang được định nghĩa đệ quy và phụ thuộc vào số lượng và giá trị của các trang mà có link dẫn đến trang đó. Một trang web có chứa nhiều link liên kết từ các trang web có giá trị PageRank cao thì giá trị PageRank của trang đó cũng sẽ cao.

ĐẠI HỌC QUỐC GIA THÀNH PHỐ HỒ CHÍ MINH TRƯỜNG ĐẠI HỌC BÁCH KHOA - BÁO CÁO BÀI TẬP LỚN MƠN HỌC: ĐẠI SỐ TUYẾN TÍNH TÊN ĐỀ TÀI: ỨNG DỤNG MƠ HÌNH MARKOV TRONG THUẬT TỐN GOOGLE PAGERANK GVHD: Đặng Văn Vinh Bùi Thị Khuyên LỚP: L01 NHÓM: 09 TP HCM, 28/11/2021 Lớp: L01 Nhóm: 09 Danh sách thành viên: STT HỌ VÀ TÊN MSSV Đặng Hoàng Tiền 2112443 Nguyễn Trương Thu Thảo 2114809 Nguyễn Tri Hưng 2111408 Nguyễn Huy Bình 2110818 Ngơ Minh Hiếu 2111186 Cao Hà Thị Ngọc Tuyết 2115202 Nguyễn Đắc Tùng 2112615 LỜI MỞ ĐẦU Lời đầu tiên, nhóm em xin cảm ơn thầy Đặng Văn Vinh cô Bùi Thị Khuyên giảng dạy tận tình hỗ trợ chúng em trình học tập mơn Đại Số Tuyến Tính Trong khoảng thời gian vừa qua, chúng em tiến việc tiếp thu kiến thức mới, rèn luyện khả tự học, tự tìm hiểu học Trong thời gian làm tập lớn, chúng em nhận thấy tầm quan trọng làm việc nhóm, tạo mối quan hệ với thành viên nhóm lớp Đây kĩ quan trọng cho tương lai chúng em sau Đây lần chúng em tiếp xúc với tập lớn này, sử dụng phần mềm kiến thức Chúng em cố gắng trau chuốt cho phần báo cáo, thiếu sót mặt kinh nghiệm kiến thức nên có lẽ cịn nhiều sai sót Vì vậy, chúng em mong thầy xem xét, góp ý bảo thêm Chúng em xin cảm ơn thầy cô nhiều Mục lục: Câu 1: Ứng dụng mơ hình Markov thuật toán Google pagerank… I.Định nghĩa II.Mô tả III.Thuật toán IV.Yếu tố Damping Câu 2: Viết chương trình sử dụng thuật toán Tài liệu tham khảo Câu 1: Ứng dụng mơ hình Markov thuật tốn Google Pagerank I.Định nghĩa Pagerank: thuật toán google dùng để đánh giá quy tính trang web thơng qua việc xem xét số lượng, kết quả, chất lượng trang liên kết đến Mục đích Pagerank gì? • Đánh giá tầm quan trọng tương đối website tồn hệ thống world wide web (WWW) • ‘Đo’ tầm quan trọng tương đối liên kết tập hợp trang web • Áp dụng cho tập hợp văn có trích dẫn đối ứng liên kết cụ thể giúp người đọc phân biệt đâu trang web chưa thông tin liên quan xác với tìm kiếm II Mơ tả: Giá trị Pagerank hình thành từ thuật tốn toán học dựa biểu đồ trang web: trang web coi đỉnh đường link cạnh Mỗi đường link tới trang web tính hỗ trợ làm tăng thêm giá trị Pagerank Giá trị Pagerank trang định nghĩa đệ quy phụ thuộc vào số lượng giá trị trang mà có link dẫn đến trang Một trang web có chứa nhiều link liên kết từ trang web có giá trị PageRank cao giá trị PageRank trang cao III Thuật toán: Pagerank phân bố xác suất, sử dụng để thể khả người click chuột ngẫu nhiên vào đường link tới trang web cụ thể Xác suất có giá trị từ đến 1, trang web có Pagerank 0.5 có 50% hội click vào link đến trang web Mơ tả thuật tốn cách đơn giản hóa: Giả sử nhóm gồm trang web: A, B, C, D liên kết từ trang đến khơng tính, trang web có đường dẫn đến trang web khác Giá trị Pagerank trang ban đầu cho nhau.Giả sử giá trị ban đầu cho trang 0,25 Pagerank chuyển từ trang đến trang khác đường link, bước tính giá trị chia cho tất liên kết Nếu liên kết hệ thống từ trang B, C D tới A, liên kết chuyển giá trị 0,25 Pagerank A tính lần tiếp theo, tổng cộng 0,75 PR(A)= PR(B) + PR(C) + PR(D) Khác với ví dụ trên, B có liên kết đến trang C A, D có link đến ba trang Như bước tiếp theo, trang B chuyển tải nửa giá trị mình, tương đương với 0.125 tới trang A 0.125 tới trang C Khi trang D có liên kết trỏ đi, có nghĩa chuyển 1/3 giá trị mình, tương đương với 0.083 tới A Như vậy: Hay: Giá trị Pagerank trang u tính sau: Giá trị PageRank trang u phụ thuộc vào giá trị Pagerank trang v có chứa set Bu (tập hợp có chứa trang có link đến trang u), chia cho số L (v) link từ trang v IV DAMPING: Người dùng click ngẫu nhiên vào web dùng lại Xác suất người dùng tiếp tục click bước gọi yếu tố Damping Cơng thức Pagerank có tính đến yếu tố damping sử dụng mơ hình người dùng cảm thấy chán sau vài lần click chuyển đến vài trang web khác cách ngẫu nhiên Như vậy: Công thức sử dụng mơ hình người dùng ngẫu nhiên cảm thấy chán sau click chuyển đến số trang ngẫu nhiên.Giá trị Pagerank thể hội mà người dùng ngẫu nhiên chuyển đến Page cách Click vào đường Link Khi tính Pagerank, Page khơng có Link trỏ trang khác giả định có Link trỏ đến tất Page tập văn Và giá trị Pagerank chia cho trang khác Nói cách khác, để cơng với Website có Outbound Link.Thì truy cập ngẫu nhiên thêm vào tất Page Website Nó thực với xác suất d=0,85.Được tính người dùng sử dụng đánh dấu tính trình duyệt Câu 2: Viết chương trình sử dụng thuật tốn VD: Ta cho sơ đồ biểu diễn liên kết trang web sau: • Dựa vào sơ đồ định nghĩa ma trận Markov, ta viết ma trận kề M trọng số sau: • Ta gọi x1, x2, x3, x4 giá trị Pagerank trang web A, B, C, D tương ứng Ta tiến hành đánh giá giá trị PG (gọi tắt Pagerank) trang web A tổng tỉ số giá trị PG mà trang web khác liên kết với A số lần trang web liên kết đến trang khác • Từ đó, ta có: x1= x2/3 có trang web B liên kết đến A trang B liên kết với ba trang khác: • Tương tự vậy: x2= x1/3+x3/1+x4/2 … • Từ kiện đó, ta thu hệ phương trình: AX = X • Với ma trận A sau: *Code matlab tính giá trị Pagerank theo cơng thức: ➔ Từ ta suy bảng xếp hạng giá trị Pagerank hay cịn gọi mức độ uy tín trang web dựa vào sơ đồ cho là: B>C>D>A • Tài liệu tham khảo: https://vi.wikipedia.org/wiki/PageRank https://famemedia.edu.vn/google-pagerank/ https://gtvseo.com/pagerank-la-gi/#yeu-to-damping Giáo trình Đại số tuyến tính – Thầy Đặng Văn Vinh ... 1: Ứng dụng mơ hình Markov thuật tốn Google pagerank? ?? I.Định nghĩa II .Mô tả III .Thuật toán IV.Yếu tố Damping Câu 2: Viết chương trình sử dụng thuật. .. dụng thuật tốn Tài liệu tham khảo Câu 1: Ứng dụng mơ hình Markov thuật toán Google Pagerank I.Định nghĩa Pagerank: thuật tốn google dùng để đánh giá quy tính trang web thông qua việc... trị PageRank trang cao III Thuật tốn: Pagerank phân bố xác suất, sử dụng để thể khả người click chuột ngẫu nhiên vào đường link tới trang web cụ thể Xác suất có giá trị từ đến 1, trang web có Pagerank

Ngày đăng: 22/12/2022, 21:19

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan