Minh h a trên đây s d ng CSS thu n, không các ph n t <b> và <i> l i th i (và th a nh n các l p CSS i và b đ c đnh ngh a trong m u (style sheet) đ áp d ng các thu c tính CSS font-style: italic và font-weight: bold, theo th t đnh s n). Trong th c t , XHTML MP bao g m các ph n t <b>, <i>, <big>,và
<small> giúp cho vi c đnh d ng ch ti n l i.
L u ý nh ng đi m khác nhau sau đây gi a HTML và XHTML MP [12]: ̇ HTML không phân bi t ch hoa, ch th ng trong các th tên (tag
name). XHTML thì l i phân bi t d ng ch trong tên t t c các ph n t và thu c tính. Hi n nay, tên c a t t c các ph n t trong XHTML MP là ch th ng.
̇ Trong c t HTML, th <li> đ u tiên thi u th đóng </li> c a nó. T t c các ph n t c n ph i đ c đóng l i trong XHTML.
̇ Các th <b> và <i> không đ c l ng nhau trong mã HTML, vi c l ng nhau này l i không đ c dùng trong XHTML MP.
̇ D u nháy không bao quanh giá tr c a thu c tính href trong mã HTML. Giá tr các thu c tính trong XHTML luôn luôn ph i n m trong d u nháy đ n ho c kép.
̇ T t c các th r ng trong XHTML ph i đ c “seft-closing” (t đóng); ví d , <br/> có m t d u / đóng bên trong th đ ch ra r ng s không có th đóng </br> t ng ng. Nó c ng đ c áp d ng nhi u th khác nh <hr/>, <input/>,...
̇ Các c p giá tr thu c tính không th b gi m thi u nh chúng có th trong HTML. Trong HTML, khi m t thu c tính có th mang ch m t giá tr , nó đ c phép b qua giá tr .
Ví d bên trong ph n t HTML <form> đo n mã sau:
<option value=”somevalue” selected>
thu c tính “selected” v a đ c c c ti u hoá.
Trong ví d trên, trình duy t HTML cho r ng ph n tu ch n nên đ c hi n th là “selected”. Tuy nhiên, XHTML l i yêu c u ph i cung c p c tên thu c tính và giá tr c a nó, ngay c khi ch có m t giá tr đ c cho phép:
<option value="somevalue" selected="selected">
Lu t này c ng đ c dùng cho cho các ph n t khác. Ví d :
<input type="radio" ... checked="checked" /> <input type="checkbox" ... checked="checked" /> <dl compact="compact">
Các trình duy t HTML có th x lý đ c nh ng s m h , không rõ ràng v i nh ng tài li u không đúng theo chu n HTML. Tuy nhiên m i th trong XHTML đ u ph i đ c rõ ràng vì nó đ c tuân theo các lu t cú pháp nghiêm ng t c a XML.
Các tr ng nh p v n b n h tr thu c tính CSS -wap-input-format đ đnh ngh a ki u nh p, ví d *N cho ki u nh p s . i u này s giúp ng i dùng tránh vi c chuy n đ i qua l i gi a các ki u nh p.
2.6.2. S khác nhau gi a XHTML và WML 1.x
S khác bi t gi a XHTML MP và WML 1.3 bao g m nh ng đi m sau đây[12]: ̇ Các không gian tên (namespace) c a XML không đ c s d ng
trong WML 1.3, nh ng nó l i đ c dùng trong XHTML. Namespace m c đnh đ c dùng là XHTML.
̇ Trong XHTML MP, ph n t root d ng WML <wml> đã đ c lo i b . Thay vào đó là ph n t c a XHTML là <html> luôn đ c dùng nh là root.
̇ Trong các mô-đun XHTML thì m i th t XHTML Basic, ph n t <hr>, thu c tính <style>, các ph n t <b>, <big>, <I>, và <small> đ c dùng đ n.
̇ Ph n t <head> đ c dùng b t bu c trong XHTML MP, th nh ng nó l i là tu ch n trong WML 1.3.
̇ Ph n t WML <element> không đ c dùng đ n trong XHTML MP. ̇ Ph n t WML <card> c ng không đ c s d ng trong XHTML
MP, mà thay vào đó là <body>. Ch có th có duy nh t m t ph n t <body> trong m i file, không gi ng nh <card> trong WML 1.x.3 Các đo n neo (fragment anchor) đ c s d ng đ liên k t đ n m t ph n khác thu c cùng m t trang, sau đó ng i s d ng có th quay tr v v trí ban đ u c a mình b ng cách s d ng thanh cu n trên trang. Ví d nh đo n code sau đây:
<a href="#h">Help</a> ...
<a name="h">Help text</a>
Liên k t đ u tiên s xu t hi n là Help và khi nó đ c ch n s ngay l p t c s chuy n đ n ph n trang v i anchor có tên “h”.
Thu c tính WML order không đ c dùng trong XHTML MP.
Các s ki n trong WML không đ c h tr trong XHTML MP, ví d nh :
<do>, <ontimer>, <onenterforward>, <onenterbackward>, <onevent>, <onpick>, <go>, <pre>, <noop> và <postfield>.
Trình duy t Nokia Mobile Browser có m t đi m đ c bi t là th ng đ t các liên k t quan tr ng vào trong ph n menu Options c a đi n tho i (các nhà s n xu t khác nhau có th s d ng nh ng h th ng menu khác t ng ng c a mình). i v i Nokia Mobile Browser, t t c các liên k t và các nút Submit đ u ch a thu c tính accesskey,thu c tính này đ c t đ ng thêm vào menu Option. Nhãn dùng trong menu Options là n i dung nh ng đ m c c a ph n t <a> (hay n u nó ch ch a m t hình nh, khi đó s là giá tr thu c tính alt c a img, hay là value c a nút Submit. Ph n ch s b b đi n u nh c n ph i đi u ch nh l i menu cho v a.
c đi m này b o đ m r ng ng i luôn có th s d ng các n i k t m t cách nhanh chóng, mà không c n quan tâm đ n là chúng n m đâu trong trang hi n hành. c đi m hay t ng đ ng (và th m chí còn đ n gi n h n) ph n t <do> trong WML 1.x.
S là h p l trong WML khi các ph n t <table> n m bên trong các đo n v n. Th nh ng đi u này l i là không h p l trong chu n XHTML. Tuy nhiên, nh m đ h tr cho s chuy n đ i gi a t WML 1.3 sang WML 2.0 các b ng n m bên trong đo n v n đ c cho phép dùng trong XHTML MP, và Nokia Mobile Browser có h tr tính n ng này.
Ph n t <pre> có th bao g m các ph n t đi u khi n trên form nh <input> và <select>. Các ph n t này là không h p l trong XHTML. Tuy nhiên, nh m đ bi n đ i t WML 1.3 sang XHTML MP, các ph n t bên trong <pre> đ u đ c cho phép trong XHTML MP, và Nokia Mobile Browser h tr .
Các ph n t nh p li u không đ c h tr các thu c tính format c a WML (dùng đ vi c nh p ký t ). Thay vào đó là s d ng m t đ c tính m i là CSS –wap- input-format, đ c tính này có cùng cú pháp v i thu c tính format c a WML.
S luôn là m t ý ki n hay khi x lý các giá tr form trên server, và n u nh có l i x y ra, quay tr l i form v i các giá tr đ c ch p nh n và m t thông đi p nh m đ hi u ch nh l i.
V i XHTML MP, thu c tính accesskey đ c h tr trong các ph n t <a>, <input>, <label> và <textarea>. Tuy nhiên, c ng ph i l u ý là accesskey có th không đ c h tr trong t t c các thi t b .
Ph n t đnh d ng <u> c a WML không đ c h tr trong XHTML MP. M t cách đ c đ ngh đ th c hi n đ c đi u này trong XHTML MP là dùng m t l p CSS, b ng cách đnh ngh a theo cách nh sau trong m u ngoài (external style sheet):
.u {text-decoration:underline}
Sau đó s d ng ph n t span v i m t l p đ s d ng ki u này; ví d :
<span class="u">This is underlined</span>
Các ph n t WML 1.x khác không đ c h tr trong XHTML MP. Di n đàn v WAP đã đ nh ngh a m t nhánh m r ng dành cho XHTML MP g i là WML 2.0. WML 2.0 bao g m các ph n t “t ng h p” c a WML 1.x (ch ng h n nh : <wml:card>, <wml:do>, v.v...), chúng đ c t đ ng d ch sang WML 2.0 nh vào các WAP gateway. Do Nokia Mobile Browser có h tr s n WML 1.x, nên vi c biên d ch s là không c n thi t [11] [12].
WML 1.x XHTML Mobile Profile và CSS S chu n hoá Chu n này đ c phát tri n
b i WAP Forum
Chu n này đ c phát tri n b i W3C và đ c s ch p nh n c a OMA Hi n th n i dung trên thi t b N i dung và cách trình bày đ c đnh ngh a trong cùng m t tài li u, đi u này khi n cho vi c hi n th b bi n đ i trên các thi t b khác nhau.
N i dung và cách trình bày đ c đ nh ngh a trong trong các tài li u riêng, do đó cùng m t n i dung s th hi n theo cáchkhác nhau nh vào các b ng đ nh d ng khác nhau.
Mã hoá n i dung N i dung c n đ c mã hoá thành d ng nh phân
Không c n mã hoá
H tr màu s c Ch h tr các nh màu, không h tr cho font ch , màu n n và các đ ng vi n… y đ các đi u khi n màu s c h tr font ch , màu n n và đ ng vi n…v i CSS trên các thi t b có h tr màu. B ng 2.6-2: Nh ng khác nhau ph bi n gi a XHTML MP v i CSS và WML 1.x 2.7. Các giao th c chuy n t i WML và XHTML
WAP 1.2.1 c ng nh các site dành cho thi t b di đ ng đ c c u hình đ có th nh n bi t và x lý các n i dung đ c vi t b ng WML 1.x. WML c n m t WAP gateway đ mã hóa WML và WMLScript tr c khi nó đ c g i trên đ ng truy n (th ng là sóng lan truy n trong không khí) đ n thi t b di đ ng đ u cu i. N i dung đ c mã hóa sang d ng nh phân đ c g i là WBXML.
Hình 2.7-1: S truy n t i n i dung WML
Không gi ng nh n i dung WML, các n i dung đ c vi t b ng XHTML không c n ph i đ c mã hóa t i WAP gateway mà s chuy n th ng đi mà không thay đ i gì c . B i vì các n i dung WML đang t n t i v n còn h u d ng trong m t th i gian n a nên các trình duy t h tr chu n WAP 2.0 có th hi n th c các n i dung XHTML MP và WML 1.x. Nh ng trình duy t nh th đ c g i là trình duy t ch đ kép (dual-mode browser).
Hình 2.7-3: S truy n t i ph i h p WML và XHTML
2.8. Cu c cách m ng c a trình duy t WAP
Chính s hi u qu c a chu n WAP 2.0, các thi t b c m tay mà c th là các th h đi n tho i di đ ng m i g n đây đã đ y m nh h tr WAP 2.0. Nokia là m t trong nh ng nhãn hi u hàng đ u v i ph n l n các model đi n tho i có h tr WAP 2.0.
Các th h trình
duy t WAP Các đ c đi m và tính n ng chính
Màn hình tr ng đen
S d ng chu n WML, WAP stack
Giá c a d ch v đ c tính trên th i gian truy c p.
Th i gian k t n i/thi t l p cao (15-30 giây cho trang đ u tiên)
Màn hình màu
Công ngh m ng GPRS, WAP Push, Cookies Giá c a d ch v đ c tính trên dung l ng s d ng
Th i gian k t n i nhanh (<3s cho trang đ u tiên)
Màn hình màu kích th c l n h n, đ phân gi i và s màu cao h n
Công ngh WAP CSS, TCP/IP stack
Kh n ng hi n th hình nh và đi u khi n cao D dàng chuy n đ i n i dung đ phù h p v i các thi t b di đ ng khác nhau
H tr caching giúp t c đ truy c p d ch v cao h n
Có th download các file kích th c l n.
B ng 2.8-1: Cu c cách m ng trình duy t WAP trên các th h đi n tho i di
V i kh n ng thích ng cao, XHTML h a h n s thúc đ y l ng thông tin trao đ i thông qua các thi t b di đ ng.
PH N II.
CÔNG C TÌM KI M SEARCH ENGINE
Ch ng 3. T NG QUAN V MÁY TÌM KI M
3.1. S l c v máy tìm ki m
Máy tìm ki m là m t công c r t h u ích giúp ng i dùng s d ng ngu n tài nguyên trên Internet m t cách hi u qu nh t. D a vào máy tìm ki m con ng i có th tìm đ c r t nhi u thông tin liên quan đ n m i ngành, m i l nh v c. M t h th ng tìm ki m thông tin bao g m 3 mô-đun c b n:
̇ Thu th p thông tin t internet.
̇ Phân tích, l ng hoá và rút trích thông tin c n thi t đ l u tr vào c s d li u h th ng
̇ Ti p nh n yêu c u t ng i s d ng, th c hi n tìm ki m trong c s d li u và tr k t qu v cho ng i s d ng.
M i mo-đun có nhi u cách ti p c n khác nhau, nên m t h th ng tìm ki m c ng s có ph ng th c x lý và ho t đ ng khác nhau.
3.2. Phân lo i máy tìm ki m
Theo David P.Habib và Robert L.Barriot[6] có b n lo i công c tìm ki m t t c , đó là:
̇ Công c tìm ki m th m c (A directory search tool): tìm thông tin theo ch đ , đó là d ng tìm phân c p.
̇ Công c máy tìm ki m : tìm thông tin theo t khoá.
̇ Công c máy tìm ki m cùng v i th m c: tìm ki m d a trên c ch đ và t khoá .
̇ Công c máy tìm ki m meta: s d ng k t qu t các máy tìm ki m khác.
Vì m c tiêu chính c a đ tài là nghiên c u v công c máy tìm ki m nên ph n sau ch trình bày chi ti t hai lo i, đó là máy tìm ki m meta và máy tìm ki m thông th ng.
3.2.1. Máy tìm ki m meta
Không gi ng nh nh ng máy tìm ki m thông th ng khác, máy tìm ki m meta không có c s d li u riêng c ng nh không có h th ng l p ch m c tài li u và robot. Chính vì v y máy tìm ki m meta ho t đ ng d a vào c s d li u c a nh ng h th ng khác. Ti p nh n câu truy v n c a ng i dùng, d a vào c s d li u c a nh ng h th ng khác ch n ra nh ng tài li u có đ t ng thích cao (c n ph i ch n bao nhiêu, ph i ch n th nào tu vào đ c đi m c a t ng h th ng c th ) và tr k t qu cho ng i dùng[3][4].
Trong m t máy tìm ki m meta, ta nh p t khoá c n tìm vào, nó s chuy n t đó đ ng th i đ n nhi u máy tìm ki m cá nhân, trong m t vài giây, ta nh n k t qu tr v t t t c nh ng máy tìm ki m đ c truy v n.
Ý t ng c a vi c tìm ki m meta thì r t t t, s ti t ki m nhi u th i gian b i vi c tìm ki m ch m t n i và không c n đ n vi c s d ng và h c m t s máy tìm ki m khác nhau.
Có ba lo i c a máy tìm ki m meta vào th i đi m này[3]:
̇ Tr c tiên, nh ng công c máy tìm ki m meta s d ng cho vi c đào sâu trong nhi u ngu n tài nguyên, v i kh n ng hùng m nh giúp tìm nh ng gì c n thi t n m trong k t qu tìm ki m. Các công c d ng này[3] là:
Công c tìm ki m meta Công c th c hi n Kh n ng nâng cao K t qu hi n th SurfWax http:// www.surfwax.com/ Vào b tìm ki m và ch n t m t danh sách c a các máy tìm ki m g m: AOL, Alltheweb, , Excite, Google, Hotbot, MSN, NBCi, Opendirectory, Yahoo! Có th tr n v i educational, US Govt tools, ngu n tin t c ho c nhi u lo i khác. Ch p nh n “ “, +/-. M c đnh là AND gi a các t . K t qu có th đ c s p x p theo đ chính
xác,ho c theo th t tiêu đ A-Z.