Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 11 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
11
Dung lượng
261,12 KB
Nội dung
!"# $%" &%'()* &+,"+-".'/ .012 "'/34 )567'/ 346-8 68 +/349:0!;6 <=!.%> ? @ A ? B @ "C;DE3FD "C;DE3FD B%0 G)H3I <.0C'/34 <.0CA:J'/34 KLMKM "C;N O9;6( O9;6( P;QR6F S,<=!.7A)H3IH • N:)'()A76T:U676T:;0)7 3I3'.D1HR, • G)C;H3I).0-Q):32AV6W7A).0C =I)XY>Z)HD[\],"!I)^Q .<.;_?07?0\D!.0C0J'., • `:=D;aJ-3'.D ).:76J:6830.H D 3D Q8:08[\bCc. d,&1H3I7I)6: • +R6'eH0H3I6(71H3I^:6T5H R6FAJ9:WP9:1Z\fgg0_h] • +V)a=!FJ8e;?@A?B@I).0C*)'( )_.<.;_?07@6.\\X<.0A ?Bc.H &:0i?@A?B@ "C;* Z\jggg] +R6'eH0H3IZhggg] <.0C<.0A[ `$ 6 Q <=!?@A?B@6 8e;.;'/;:;"@ D ?B@ f,"W3Q'/34 • "W3Q'/34)56).0- • "W3Q'/3468 • g'e6 • Xkg,hAXSlg,fAXd • • <.0CA:J76 A:J3Hm(mL • • Cho đồ thị G(V,E,W) trong đó: – V là tập các đỉnh hay các trang Web – E là tập các cạnh (có link) – W là ma trận trọng số của các cạnh – Tập nhãn L ={văn hóa, giáo dục, luật pháp, thể thao,…} – V l : Tập nút đã được gán nhãn (y 1 ,y 2 ,…,y l ) – V u = V\V l : Tập nút chưa được gán nhãn • Xây dựng mô hình gán nhãn cho các đỉnh chưa được gán nhãn V u . Bài toán phân loại Web n,&C6.012 "C;* Z\jggg] 2 <.0C:2[o %(6 A:Jm3'e:2L V l V u jS jd jf jn S d j n f G:J:2c.Q3#pbH: 3#q6D(, "H.0C.3Fo g 4:C;3#% 6 D % .6P; o S ko g o k,o [S 756C;Qb:3#. 3F, +.16F6P;7:0ic.opQa, [...]...5 Thực nghiệm, kết quả • • • Áp dụng bài toán cho tập học là webkb gồm hơn 5000 trang web Kết quả : Độ chính xác : . cạnh – Tập nhãn L ={văn hóa, giáo dục, luật pháp, thể thao,…} – V l : Tập nút đã được gán nhãn (y 1 ,y 2 ,…,y l ) – V u = VV l : Tập nút chưa được gán nhãn • Xây dựng mô hình gán nhãn cho các. VV l : Tập nút chưa được gán nhãn • Xây dựng mô hình gán nhãn cho các đỉnh chưa được gán nhãn V u . Bài toán phân loại Web n,&C6.012 "C;* Zjggg] 2 <.0C:2[o %(6