1. Trang chủ
  2. » Luận Văn - Báo Cáo

đồ án tốt nghiệp xây dựng mô hình mở rộng truy vấn trong truy xuất thông tin văn bản

251 1K 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 251
Dung lượng 2,42 MB

Nội dung

ĐẠIHỌCQUỐCGIATP.HCMTRƯỜNGĐ ẠIHỌCBÁCHKHOATP.HCMNGUYỄNCHÁNHTHÀNH XÂYDỰNGMÔHÌNHMỞRỘNGTRUYVẤNTR ONGTRUYXUẤTTHÔNGTINVĂNBẢN LUẬNÁNTIẾNSĨKỸTHUẬT TP.HỒCHÍMINH–2010... ĐẠIHỌCQUỐCGIATP.HCMTRƯỜNGĐ

Trang 1

ĐẠIHỌCQUỐCGIATP.HCMTRƯỜNGĐ ẠIHỌCBÁCHKHOATP.HCM

NGUYỄNCHÁNHTHÀNH

XÂYDỰNGMÔHÌNHMỞRỘNGTRUYVẤNTR ONGTRUYXUẤTTHÔNGTINVĂNBẢN

LUẬNÁNTIẾNSĨKỸTHUẬT

TP.HỒCHÍMINH–2010

Trang 2

ĐẠIHỌCQUỐCGIATP.HCMTRƯỜNGĐ ẠIHỌCBÁCHKHOATP.HCM

NGUYỄNCHÁNHTHÀNH

XÂYDỰNGMÔHÌNHMỞRỘNGTRUYVẤNTRO NGTRUYXUẤTTHÔNGTINVĂNBẢN

Trang 3

Tôicamñoanrằngnộidungcủaluậnánnàylàkếtquảnghiêncứucủabảnth ân Tấ

gốcmộtcáchrõràngtừdanhmụctàiliệuthamkhảotrongluậnán.Nhữngñónggóptrongluậnánlàkếtquảnghiêncứucủatácgiảñãñượccôngbốtrongcácbàibáokhoahọctrongphần“Cáccôngtrìnhkhoahọc”củaluậnánvàchưañượccôngbốtrongbấtkỳcôngtrìnhkhoahọcnàokhác

Tácgiảluậnán

NguyễnChánhThành

Trang 4

Trongquátrìnhhoànthànhluậnánnày,tôiñãñượccácthầycônơicơsởñàotạo giúpñỡtận tình, cơquannơicông táctạomọiñiều kiện thuậnlợivàbạnbèc ù n g giañìnhthườngxuyênñộngviênkhíchlệ

LuậnánnàykhôngthểhoànthànhtốtnếukhôngcósựtậntìnhhướngdẫnvàsựgiúpñỡquíbáucủaPGS.TS.PhanThịTươi,giáoviên hướngdẫnmàtôitônvinhvàmuốnñượcbàytỏlòngbiếtơnsâusắcnhất

Tôicũngmu ốnñượ cbà ytỏlòngb iếtơnñốivớitậpthểcác thầycôkhoa KhoahọcvàKỹthuậtMáy tínhtrườngĐạihọcBáchkhoa TP.HồChíMinhñãgiúpñỡvàtạoñiềukiệnchotôirấtnhiềutrongquátrìnhhọctậpvànghiêncứuởKhoa;ñặcbiệtPGS.TS.CaoHoàngTrụ,PGS.TS.DươngTuấnAnh,PGS.TS.ĐỗPhúcvàTS.ĐặngTrầnKhánhñãcónhữnglờikhuyênquýgiátrongquátrìnhlàmN C S vàviếtluậnánnày;cảmơnPhòngquảnlýSauĐạihọcvềsựhỗtrợcácthủtụchoànthànhluậnán

vàngườithân,ñãhỗtrợñ ộ ngviênvàtạomọiñ iềukiệnthuậnlợichotôitrongsu ốtquátrình hoànthànhk h ó a họcNCS

Cuốicùngtôi cảmơnanhNgô Hùng Phương cùngtấtcảbạnbè,ñặcbiệtcáct h àn h v i ê n t r o n g n h ó m n g h i ê n c ứuB K -

N L P ( t h u ộct r ườngĐ ạ ih ọcB á c h k h o a Tp.HCM)ñãgópnhiềuýkiếnthiếtthựcvàcónhữnglờiñộngviênkhíchlệquýbáugi úptôivượtquakhókhănvàhoànthànhtốtluậnán

TácgiảluậnánNguyễnChánhThành

Trang 5

Trongtruyxuấtthôngtin(InformationRetrieval,IR),donhữngyếutốkhácnhau

,người sửdụng thườngdùng cáctruyvấndạngñơngiản biểu diễnyêucầucầnt ì m Việcnàydẫnñếnkếtquảtìmñượckhôngñápứngñủnhu cầumongmuốn,h oặcchấtlượngthấp.Doñó,mởrộngtruyvấnlàvấnñềcầnthiết,ñểtừñógiúphệt h ốngtruyxuấtthông tin có thêmthôngtin theo ngữcảnh nhằmcảitiến các kếtquảtruyvấn.Thôngtintheongữcảnhcóthểthuñượctừnhữngthôngtinphảnhồiliênquan,

vềnhómthểhiện, thuộc tính, kháiniệmvà quan A,vàtươngñương(equivalence),hoặcpháttriểnmộtmôhìnhmớivềmạngngữn gh ĩad ự atrênnh ữngquanhệt rí ch dẫnt ừWordNetnhưq u a n hệthượngdanh( hypernymy),h ạdanh( hyponymy)…

hệrờirạc(disjointness),IS-cùngmộtsốquanhệñượcñịnhnghĩathêmnhưchúgiải(gloss),chủñềvàmiền(domain).

Luậnánnàyñềxuấtphươngphápmởrộngtruyvấndựatrêncơsởbảnthểhọc(onto logy-

basedqueryexpansion).Đểthựchiệnmụctiêutrên,luậnánphảigiảiquyếtcácvấnñềchính:

(1)ñềxuấtcơsởlýthuyếtvềcácmôhình mởrộngtruyvấnd ựatrên ontology;(2)p h á t triểnvà huấnluyệnontologybằngphươngphápkhait h á c khongữliệusẵncóvàphươngpháprúttríchdữliệutừWordNet;

(3)ñềxuấtphươngpháphoànthiệnvàmởrộngtruyvấn.Phầnthựcnghiệmcủaluậnánñượct i ếnhànhchongônngữtiếngAnhdựatrênnguồndữliệuvàtruyvấntiếngAnhtừnguồ

nTREC(TextREtrievalConference)trongmộtsốlĩnhvực.Cáckếtquảthựcn g h i ệmp

hảnánhtínhkhảthicủanhữngphươngphápñềxuấttrongluậnán,ñồngthờichothấynhiềutriểnvọngpháttriểncủacácñềxuấtlýthuyếttrongluậnán

Trang 6

MỤCLỤC

MỤCLỤC i

DANH MỤCCÁCBẢNG iii

DANH MỤCCÁCHÌNH v

DANHMỤCCÁCGIẢITHUẬT vii

DANHMỤCCÁCTỪVIẾTTẮT viii

Chương1 GIỚITHIỆU 1

1.1 Độngcơnghiêncứu 1

1.2 Mụctiêuvàphạmvinghiêncứu 5

1.3 Đónggópchínhcủaluậnán 8

1.4 Cấutrúccủaluậnán 10

1.5 Cácquyước 13

1.6 Tómtắtnộidungluậnán 13

Chương2 CÁCNGHIÊNCỨULIÊNQUAN 14

2.1 Giớithiệu 14

2.2 Cácnghiêncứuliênquantrongnước 15

2.3 Cácnghiêncứuvềontology 19

2.4 Cácnghiêncứuvềmởrộngtruyvấn 23

2.5 KhaithácdữliệutừWordNet 39

2.6 Tómlược 44

Chương3 XÂYDỰNGNỀNTẢNGHỆTHỐNG 46

3.1 Giớithiệu 46

3.2 BàitoánXâydựngontologyvàbàitoánHoànchỉnhmởrộngtruyvấn 46

3.3 Cácmôhìnhchobàitoánmởrộngtruyvấn 60

3.4 Mẫunhậndạngcụmdanhtừ 65

3.5 Phươngphápthựcnghiệmvàñánhgiá 70

3.6 Nguồndữliệuthựcnghiệm 74

3.7 Tómlược 88

Chương4 XÂYDỰNGONTOLOGYOOMP 90

4.1 Giớithiệu 90

4.2 XâydựngontologyOOMP 90

4.3 Phươngpháphuấnluyệndựatrênkhongữliệu 95

4.4 PhươngpháphuấnluyệndựatrênWordNet 100

4.5 CơchếtựhuấnluyệncủaontologyOOMP 107

4.6 Cácứngdụngcủaontologyvàquanhệ 109

4.7 Tómlược 110

Chương5 HOÀNCHỈNHVÀRÚTGỌNTRUYVẤN 112

5.1 Giớithiệu 112

Trang 7

5.2 Hoànchỉnhvàrútgọntruyvấn 113

5.3 Kiểmtracụmdanhtừhoànchỉnh 114

5.4 Tạocụmdanhtừhoànchỉnh 121

5.5 Tạocụmdanhtừrútgọn 122

5.6 Hoànchỉnhcụmdanhtừ 123

5.7 Giảithuậtrútgọnthànhphầncụmdanhtừ 135

5.8 Tómlược 140

Chương6 MỞRỘNGTRUYVẤN 142

6.1 MởrộngtruyvấnchoñộngcơtìmkiếmtrênWeb 142

6.2 Mởrộngtruyvấnchohệthốngtruyxuấtthôngtincósẵn 153

6.3 Tómlược 165

Chương7 KẾTLUẬN 167

7.1 Cáckếtquảñạtñược 167

7.2 Hướngpháttriển 171

7.3 Lờikết 172

CÁCCÔNGTRÌNHKHOAHỌCCỦATÁCGIẢ 174

TÀILIỆUTHAMKHẢO 177 PhụlụcA TómlượcvềWordNet a

PhụlụcB CấutrúccụmdanhtừtiếngAnh c

PhụlụcC DanhmụctừloạitiếngAnh g

PhụlụcD.

DanhmụcluậtsinhdạngcụmdanhtừcủavănphạmtiếngAnhxâyd ựngdựatrênTreeBank i PhụlụcE Tínhchấtảnh-tạoảnhtrongtoánhọc o

PhụlụcF CấutrúcñịnhdạngtàiliệuTREC p

PhụlụcG Tổchứccơsởdữliệucủathựcnghiệmtrongluậnán s

Trang 8

DANHMỤCCÁCBẢNG

Bảng3.1 Danhsáchmãlỗi quyước 57

Bảng3.2.Cáctrườnghợpliênkếtgiữaqvàq’ñểtính(q|q') 63

Bảng3.3.Cáctrườnghợpliên kết giữaqvàq’ñểtính(q') 63

Bảng3.4.Tậpluậtsinhtiếng Anh liênquan cụmdanhtừ(nguồn[2]) 67

Bảng3.5.Danhsáchmẫucơbảnñặctảcụmdanhtừ 68

Bảng3.6.ThốngkêthànhphầndữliệutừTREC 76

Bảng3.7.Danhsáchtậpchỉmụcxâydựngtừnguồndữliệutrongbảng3.6 78

Bảng3.8.Thốngkêmụctừ, tài liệuvàliên kết củanguồndữliệu 79

Bảng3.9.Thốngkêcáctàiliệu liên quan theonguồndữliệu 81

Bảng3.10.Danhsáchmẫusửdụngtrongthựcnghiệm 83

Bảng3.11.Thốngkêcụmdanhtừphân biệtrúttríchtừkhongữliệutiếngAnh 84

Bảng4.1.Thốngkêsốlượngcụm danhtừtheodạngmẫu 98

Bảng4.2.Dữliệudựtuyểnrút tríchñượctronggiải thuậtCB-KBT 99

Bảng4.3.Dữliệudựtuyểnrút tríchñượctronggiải thuậtCB-KBT 99

Bảng4.4.Cácthốngkêchodữliệuhuấnluyện 100

Bảng4.5.DanhmụcphânlớptừvựngsửdụngtrongWordNet 105

Bảng4.6.ThốngkêcácmụctừdùngtrongquátrìnhhuấnluyệnWB-BKT 106

Bảng4.7.DữliệuñượcrúttríchtừWordNettronggiảithuậtWB-KBT 106

Bảng4.8.Cácthốngkêchodữliệuhuấnluyện 106

Bảng4.9.DữliệubổsungtạobởigiảithuậtA-KBT 108

Bảng5.1.ThốngkêvềthờigianthựcthicủagiảithuậtCNPV 117

Bảng5.2.CáctrườnghợpxửlýtronggiảithuậtCNPVtheodạnglỗi 117

Bảng5.3.CáctrườnghợpxửlýtronggiảithuậtCNPVtheodạnglỗivàmẫu 118

Bảng5.4.Sốliệuthốngkêcácphầntửphântíchtrunggian 120

Bảng5.5.ThốngkêvềthờigianthựcthicủagiảithuậtNPC 129

Bảng5.6.ThốngkêcáctrườnghợpxửlýtronggiảithuậtNPCtheodạnglỗi 130

Bảng5.7.ThốngkêcáctrườnghợpxửlýtronggiảithuậtNPCtheodạngmẫu 130

Bảng5.8.ThốngkêcácphầntửphântíchtrunggiancủagiảithuậtNPC 131

Trang 9

Bảng5.9.KếtquảthựcnghiệmcủagiảithuậtCNPGtrêndữliệutrunggiancủagiảithuậtN P C 131

Bảng5.10.PhântíchkếtquảthựcnghiệmcủagiảithuậtNPC 133

Bảng5.11.SosánhkếtquảcủaphươngpháptìmkiếmthôvàNPC 134

Bảng5.12.ThốngkêvềthờigianthựcthicủagiảithuậtNPMR 137

Bảng5.13.ThốngkêcácphầntửphântíchtrunggiancủagiảithuậtNPMR 137

Bảng5.14.KếtquảthựcnghiệmcủagiảithuậtRNPGtrêndữliệutrunggiancủagiảithuậtN P M R .137

Bảng5.15.PhântíchkếtquảthựcnghiệmcủagiảithuậtNPMR 139

Bảng5.16.SosánhkếtquảcủaphươngpháptìmkiếmthôvàNPMR 140

Bảng6.1.ThốngkêvềthờigianthựcthicủagiảithuậtSNPE 148

Bảng6.2.ThốngkêcáctrườnghợpxửlýtronggiảithuậtSNPEtheodạnglỗi 148

Bảng6.3.ThốngkêcácphầntửphântíchtrunggiancủagiảithuậtSNPE 149

Bảng6.4.KếtquảthựcnghiệmcủagiảithuậtCNPGtrêndữliệutrunggiancủagiảithuậtS N P E 149 Bảng6.5.PhântíchkếtquảthựcnghiệmcủagiảithuậtSNPE 151

Bảng6.6.SosánhkếtquảcủaphươngpháptìmkiếmthôvàSNPE 153

Bảng6.7.ThốngkêsốliệuthựcnghiệmtronggiảithuậtSIC 160

Bảng6.8.Sốliệuchitiếtcủatậpsi_TermLinktạoratừgiảithuậtSIC 161

Bảng6.9.Thốngkêkếtquảtrongtậpsi_TermLinktạoratừgiảithuậtSIC 161

Bảng6.10.Sosánhkếtquảthựcnghiệm1 163

Bảng6.11.Sosánhkếtquảthựcnghiệm2 164

Bảng6.12.Sosánhkếtquảthựcnghiệm3 165

Trang 10

DANHMỤCCÁC HÌNH

Hình1.1.Mốiquanhệgiữamôhìnhcủaluậnánvàhệthốngtruyxuấtthôngtin 6

Hình1.2.Tóm tắtphânbốnộidungcácvấnñềtrìnhbàytrongluận án 13

Hình2.1.TổchứchệthốngWordNetphiênbản3.0(*) 41

Hình2.2.Cấu trúcontologyvềhìnhảnh củaS.Zinger 43

Hình2.3.ĐồthịquanhệngữnghĩacủaBoris 43

Hình3.1.QuanhệkếthợpOMP 55

Hình3.2.Vídụvềcâyphântích(hìnhb)ñượcxâydựngtừquanhệROMP(hìnha) 56

Hình3.3.ĐồthịngữnghĩaGcó phânlớp 59

Hình3.4.Tổchứcphân cấpcácmôhình 61

Hình3.5.Vídụvềñặctảcác mẫutrongJAPE 70

Hình3.6.Tỉlệphânbốcácmụctài liệu 76

Hình3.7.CàiñặtchứcnăngxâydựngchỉmụcchodữliệudạngXML 77

Hình3.8.Tổchứclưutrữvậtlýcủacáctậpchỉmục 78

Hình3.9.Tổchứccơsởdữliệu lưu trữthôngtincủacácchỉmục 79

Hình3.10.Càiñặt chứcnăngnạpdữliệu chỉmụcvào cơsởdữliệu 80

Hình3.11.Thốngkêsốlượngtài liệu liên quanxácñịnhñược 81

Hình3.12.Tỉlệtàiliệu liênquanxácñịnhñược 82

Hình3.13.Thốngkêtậpmẫusửdụngtrongthựcnghiệm 82

Hình3.14.Tỉlệchọnlọccụm danhtừhợplệtheochiềudài cụm danhtừ 85

Hình3.15.Kếtquảrúttríchcụm danhtừhợplệtronghuấnluyện 85

Hình3.16.Tổchứclưutrữcụm danhtừrúttríchtừcácnguồndữliệu 86

Hình3.17.PhânbổcụmdanhtừtrongtậpTRAINING_DATAtheodạngmẫu 86

Hình3.18.PhânbổcụmdanhtừtrongtậpTEST_DATAtheocácnhómmẫu 87

Hình4.1.CấutrúcmứcluậnlýcủaontologyOOMP 91

Hình4.2.Cấu trúcontologyOOMPvềtổchứccơsởdữliệu quanhệ 91

Hình4.3.ĐặctảluậnlýchocấutrúcontologyOOMP 92

Hình4.4.CácphươngpháphuấnluyệnontologyOOMP 95

Hình4.5.Phươngpháphuấnluyện dựatrênkhongữliệu 95

Hình4.6.QuanhệRmñượcxâydựngtừquanhệholonymytrongWordNet 101

Trang 11

Hình4.8.QuanhệRpñượcxâydựngtừquanhệattributetrongWordNet 101

Hình4.9.QuanhệRmñượcxâydựngtừquanhệsimilartrongWordNet 101

Hình4.10.QuanhệRmvàRpñượcxâydựngtừquanhệsimilartrongWordNet 102

Hình4.11.QuanhệRpñượcxâydựngtừquanhệsimilartrongWordNet 102

Hình4.12.TổchứcdữliệucủaWordNetphiênbản3.0 104

Hình4.13.ThốngkêsốlượngcácquanhệtrongWordNet 104

Hình5.1.Môhìnhhệthốnghoànchỉnhvàrútgọntruyvấn 113

Hình5.2.CáctrườnghợpxửlýtronggiảithuậtCNPVtheodạnglỗivàmẫu 120

Hình5.3.Thốngkêcáctrườnghợpxửlýtheodạnglỗiởmứcchitiết 129

Hình5.4.CàiñặtchứcnăngtìmkiếmchotruyvấnsinhtừgiảithuậtNPC 132

Hình5.5.Thốngkêsốliệucácñộñotheonguồndữliệu 132

Hình5.6.Thốngkêsốlượngkếtquảthựcnghiệmtheonguồndữliệu 133

Hình5.7.CàiñặtchứcnăngtìmkiếmchotruyvấnsinhtừgiảithuậtNPMR 138

Hình5.8.Thốngkêsốliệucácñộñotheonguồndữliệu 139

Hình5.9.Thốngkêsốlượngkếtquảthựcnghiệmtheonguồndữliệu 140

Hình6.1.Môhìnhhệthốngmởrộngtruyvấnvớiñộngcơtìmkiếmthôngtin 143

Hình6.2.CàiñặtchứcnăngtìmkiếmchotruyvấnsinhtừgiảithuậtSNPE 150

Hình6.3.Thốngkêsốlượngkếtquảthựcnghiệmtheonguồndữliệu 152

Hình6.4.Thốngkêsốliệucácñộñotheonguồndữliệu 152

Hình6.5.Minhhọatínhchất(6.1) 154

Hình6.6.Ứngdụngtínhchất(6.1)vàomởrộngkếtquảtìmkiếm 155

Hình6.7.Môhìnhhệthốngmởrộngtruyvấnkếthợphệthốngtruyxuấtthôngtindựngsẵn 155

Hình6.8.Môhìnhtổchứcchỉmụchướngngữnghĩa 156

Hình6.9.Sosánhsốliênkếttạothànhtheonguồndữliệu 162

Hình6.10.Sosánhtỉlệliênkếttạothànhtheonguồndữliệu 162

Hình7.1.Phươngphápthựchiệncủavấnñề4 172

Trang 12

DANHMỤCCÁCGIẢITHUẬT

Giảithuật4.1.Huấnluyệnontologydựatrênkhongữliệu 96

Giảithuật4.2.HuấnluyệnontologydựatrênWordNet 103

Giảithuật4.3 Huấnluyệnontologytựñộng 107

Giảithuật5.1.Kiểmtracụmdanhtừhoànchỉnh 114

Giảithuật5.2 Tạocụmdanhtừhoànchỉnh 121

Giảithuật5.3.Tạo cụmdanhtừrútgọn 122

Giảithuật5.4.Hoànchỉnhcụmdanhtừ 123

Giảithuật5.5 Rútgọn thànhphầncụmdanhtừ 135

Giảithuật6.1.Mởrộngcụmdanhtừtươngñương 144

Giảithuật6.2 Tạochỉmụchướng ngữnghĩa 157

Giảithuật6.3 Tìmkiếmkếthợp 158

Trang 13

DANHMỤCCÁCTỪVIẾTTẮT

STT Từviếttắt DiễngiảitiếngAnh DiễngiảitiếngViệt

Cross-LanguageInformationRetrieval

Inverse-DocumentFrequency

Tầnsuấtnghịchñảotàiliệu

Object-Member-Property CơsởtrithứccủaĐốitượng-Thànhphần-Tínhchất

Trang 14

t i n t h ểh i ệnt r o n g n g ô n n g ữt i ếngA n h chi ếmtỉlệñángkể.Đặcbiệttrongnhữngnămgầnñây,nhucầutruycậptintứctrênWebcủangườidânViệtnamrấtcao(theo[4],giaiñoạn1997-

2007internetViệtN a m ñ ãl i ê n t ụcp h á t t r i ểnvớik h o ảng1 8 t r i ệun g ườit h a m g

i a s ửd ụng,t ươngñương2 1 % d â n s ố)x u ấtp h á t t ừc á c n h u cầuc h ủyếun h ưx e m t i

ainternet

cònñượcgọilàWorldWideWeb,viếtgọnlàWWWhayWeb

Trang 15

kếtquảcầnthiếtnhưmongmuốncũngnhưhiệusuấtcủachúngcòncómộtsốgiớih ạnnhấtñịnh.

Nguyênnhânchủyếuảnhhưởngñếnvấnñềnàylà:

Ngữnghĩacủatàiliệubịmấtñidocáchbiểudiễntruyvấndướidạngmộttậpcáctừkhóa

− Yêucầuthôngtin(truy

vấn)củangườisửdụngthườngchỉbaogồmmộtvàit ừkhóacốtlõi,khôngthểhiệnñủngữnghĩacầnthiết

Ngườisửdụngkhôngcungcấpñủthôngtintruyvấncầnthiếtchoñộngcơt ìm kiếm

Độngcơtìmkiếmthôngtinhoạtñộngdựatrêncơchếsotrùngtừkhóavàch ưaquant â m ñúngmứcñ ế nyếutốn gữn g h ĩatrong t ươngt ác vàhỗt r ợngườidùng

− Ngườisửdụnggặpkhókhăntrongvi ệcdiễnñạtnộidungcủavấnñềcầntìm

Ngườisửdụngkhôngnhậnñượcmộtkếtquảtrảlờitrọnvẹnhoànchỉnh(dùch ỉcầnởmứctómlượcngắngọn)nhưmong muốnvềmộtvấnñềcầntìm

Trang 16

Thiếumộthệthốngtìmkiếmthôngtinnhanhvàlinhhoạtñểkhôngchỉcót hểtìmcácthôngtintrongtàiliệutiếngAnh(nhưtruyềnthống)vàtiếngViệtt h e o cơchếsotrùngtừkhóa,màcòncóthểtrảlờicáccâuhỏicủangườisửd ụng(trongphạmvixácñịnhchotiếngViệt)

− Hệthốngchưathựcsựñủmạnhñểnhậnbiếtngữnghĩacủatruyvấn

Trang 17

Từcác phântích trên,chúngta nhậnthấynguyênnhân

chínhlàcáchệthốngtìmkiếmthôngtinchưañủmạnhnênkếtquảñưarakhôngthểhỗtrợ ngườidùngnh ưmongñợi.Truyvấncủangườidùngcũngchưaphảnánhñầyñủngữnghĩa ñểh ỗtrợchocácquátrìnhtìmkiếmvàtruyxuấtthôngtinñượctốthơn.Vìvậy,việcbổsung

ngữnghĩavàotruyvấnbanñầucủangườidùnglàyêucầucầnthiết

MộtbàitoánkinhñiểntronglĩnhvựcTruyxuấtthôngtinlàMởrộngtruyvấn.

Đólàquátrìnhbổsungmộtsốtừvàotruyvấncủangườidùng

nhằmtạoracáctruyvấnmớitươngñồngngữnghĩa.Bàitoánnàylàvấnñềñượcquantâmvìnócót h ểloạibỏnhậpnhằngngữnghĩacủatruyvấntrongngônngữtựnhiên,cũngnhưkhắcphụcnhững

hạnchếcủaviệcsửdụngtừkhóañểthểhiệnmộtkháiniệmthôngtin.KrovetzvàCroft[109]ñãquansátthấyphầnlớncáclợiíchthuñượctrongviệct ì m kiếmthôngtincóñộtruyhồicaophụthuộcvàoviệcsotrùngcáctừkhóa.Đốivớiviệcmởrộngtruyvấn,hệthốngxácñịnhngữnghĩatruyvấnñượcchínhxáchơn,ñiềuñóchophépk ếtquảtruyvấntốthơn.Thôngqua kếtquảtruyvấnmởrộng,ngườidùngcóthểhọctậpcáchphátbiểutruyvấnrõràngvàchínhxáchơnñểt h u ñượccáckếtquảhữuích

sẽbổsungvàoñómộtsốtừhaythuậtngữl iê nquanvàtạoradạngtruyvấnmớicóthểbaophủthông tinr ộnghơn.Nhưvậy,tàiliệumongñợiñểthunhậnsẽnhiềuhơndẫnñếntỉlệbaophủthô ng tintănglêntươngứng.Quátrìnhthêmnhữngthuậtngữnàycóthểthựchiệnb ằ

trợgiúp.Việcmởrộngtruyvấnbằngtaydựav ào sựamhiểuvàthànhthạocủaconngườiñểñưaraquyếtñịnh,nhằmnhúngcáct h u ậtngữvàotruyvấnmới.Trongtrườnghợpmởrộngtựñộngtruyvấn,cáctrọngsốñượctínhchotấtcảcácthuậtngữnhằmgiúphệthốngthêmnhữngthuậtngữcótr ọngsốcaonhấtvàotruyvấnbanñầu.Cáchàmtínhtrọngsốkhácnhauñưaran hữngkếtquảkhácnhau,doñóhiệusuấtcủaviệctruyvấnphụthuộcvàocáchthứct í

n h cáctrọngsố.Vớidạngmởrộngtruyvấncóngườidùngtrợgiúp,hệthốngsẽsinhracácthuậtngữphùhợpchoviệcmởrộngtruyvấnvàngườidùngtựchọnmộtsốtrongcácthuậtngữñóñểthêmvào

Trang 18

Vấnñềcốtlõicủabàitoánmởrộngtruyvấnlàxácñịnhcáctừthíchhợpñểthêmvàotruyvấncủan gườidùng Nhi ềung hi ên cứuñượ ccôn gb ốvềmởrộngtruyvấntrongñóhướngñếnviệcsửdụngthôngtinngữcảnhñểxácñịnhcáctừcầnthêmmộtcáchhợplý.Thô

ngtintheongữcảnhcóthểthuñượctừcácthôngtinphảnhồiliênquan(relevancefe edback),từcáctừñồnghiện(co-

occurrenceterm)v àtrongthờigiangầnñâylàtừcácmôhìnhtrithứcnhưbảnthểhọc(ontolog y).

Hiệnnay,thôngtinliênquanngữcảnhcủatruyvấnlàmộtvấnñềñangñượccácn h à n

g h i ê n c ứuk h a i t h á c n h ằmc ảit i ếnq u á t r ì n h truyx u ấtt h ô n g t i n T h e o Finkelstein[92]ngữcảnhchưacóñịnhnghĩachuẩnxác,nhưngtheo[124]thìcóhaiñịnhn

ghĩavềngữcảnh.Địnhnghĩathứnhấttheongônngữhọc“ngữcảnhlàcácphầncủabàil uậnbaoquanhtừhayñoạnvănvàcóthểlàmsángtỏnghĩacủa

nó” b Địnhnghĩathứhaidựatrêntìnhhuống“cácñiềukiệntươngquantrongñó

mộtñ iềug ì ñ ót ồnt ạih a y x ảyra” c.T ừñ ó,mộtn h ậnñ ị nhc h u n g l à t h ô n g q u a tươngtáccủangườidùnglênhệthốngtruyxuấtthôngtin,ngữcảnhtươngứngsẽbaogồmnhữngthôngtinliênquanñếnnhữnghànhñộng,nhữngquyếtñịnhcủangườidùng

Ngữcảnhtrongtruyxuấtthôngtinbaogồmnhiềuvấnñềtrongñócómởr ộngtruyvấn.Một khókhănlàlàmsao biểudiễnñượcnghĩa củatruyvấn bằng

cáct h u ậtngữ( term)mộtc á c h chính xác Dovậy,m ởr ộngtruyvấnchop hép ngườid

ùngthựchiệntìmkiếmthôngtinbằngtruyvấnmớicócácthuậtngữlàsựbiếnñổihìnhthái

ngữmớiñượcthêmvàotruyv ấnnhờkếtquảkhửnhậpnhằngnghĩacủatruyvấnbanñầu.Nhiềuphươngphápti ếpcậnkhácnhauñượcñềxuấthướngñếnviệcmởrộngtruyvấn.Trongñó,cónhiềunghiêncứuhướngñếnviệcsửdụngontologyñểhỗtrợsuyluậnngữcảnhchocáct r u y vấnn h ậpn h ằng.C ác k h á i n i ệmtrong o n t o l o g y ñượ cd ù n g ñ ể k h ửn hậpn h ằngngữnghĩacủatừvàhỗtrợñểmởrộngtruyvấn.Việcmởrộngtruyvấnñạtthànhcôngởmộtmứcñộnhấtñịnh nhưng vẫncòn nhiều vấnñềcần cảithiện vềkỹ

b Nguyên

văn:“thepartsofadiscoursethatsurroundawordorpassageandcanthrowlightonitsmeaning”

c Nguyên

văn:“theinterrelatedconditionsinwhichsomethingexistsoroccurs”

Trang 19

thuật,giao diệnhoặc giảithuậtñểxácñịnhngữnghĩamộtcáchchínhxáchơntừ

ñócảitiếnkếtquảtruyvấn

Từtầmquantrọngvềtínhhiệuquảcủaquátrình truyxuấtthôngtin(trênint

ernet),cùngvớihướnggiảiquyếtlàmsaoñểhệthốngIRcóthểhiểunhiềuhơnv à thông minhhơnkhixửlýtruyvấnbanñầucủangườidùng,thìyêucầuvềmộth ệthốngtruyxuấtt

hôngtincókhảnăngtạoranhữngtruyvấntươngñồnghoặccùngmụctiêulàbàitoánquantrọng.Doñó,thôngquanhữngkhảosátphântíchnêutrên,

quantrọngmàluậnánnàynghiêncứuvàñềxuấtphươngphápgiảiquyết

1.2 Mụctiêuvàphạmvinghiêncứu

Từñộngcơnghiêncứunêutrên,luậnánñềxuấtmộtsốphươngphápmởrộngtruyvấnbanñầucủangườidùng.Đâylàvấnñềcốtlõivàñồngthờilàmụctiêunghiêncứucủaluậnán

Mỗiphươngphápñềucóưu,nhượcñiểmcùngvớinhữngcôngtrìnhnghiêncứuvàcácthựcnghiệmliênquan.Từviệckhảosátphântíchnhữngphươngphápnày(xemchương2 ), dựatr ên nh ữnggiảiphá pk h ảthiñãñư ợ ccôngb ốtr ên thếgiới,hướngtiếpcậnchínhcủaluậnánlàmởrộngtruyvấnsửdụngcơsởtrithứckhôngtươngtáckhongữliệu

Đểluậnánmangtínhkhảthicảvềlýthuyếtlẫnthựctiễnvàmanglạikếtq u ảnhưmong muốn,tácgiảñãthựchiện:

Trang 20

(a) Nghiêncứuvàpháttriểncơsởlýthuyếtcủaphươngpháptiếpcậnmớicho việcmởrộngtruyvấn,trêncơsởkếthợpvớiontologyd.

Xuất:

Cáccâutruy vấn:

- dạngcụm danhtừ,

- ñãñượcmởr ộngcódạng

truyvấnhoàn chỉnh.

(B)

Độngcơt

ìmkiếmt hôngtin

Kếtquảtrảv ề(tậptàiliệ u)

chỉcódanhtừñơn)ñượcxửlýñ ể trảvềtậpcáccâutruyvấnñãñượcmởrộng(cụmdanhtừcód ạngtruyvấnhoànch ỉnh e).Trongphạmviluậnán,dựatrêngiảipháprúttríchcáctừñặctrưngcốtlõi

d Khái

niệmontologycònñượcdiễndịchlà“câyphảhệtrithức”hay“cơsởtrithức”

e Tham

khảothêmñịnhnghĩa3.10-Truyvấnhoànchỉnh,mục3.2.6,chương3.

Trang 21

[149]),câutruyvấnbanñầucủangườidùngñượctiềnxửlýñểlo ạibỏcácthànhphầnkhô

nhữngthànhphầnchínhthỏañ iềukiệntruyvấnhoànchỉnh.Điềuñósẽgiúpgiảmñượcñộphứctạphaydạngb i ểudiễnph ứchợpcủatr uy vấn,ñồngthờic ò n giúpñả mbảot ín

hd u y nhấtc ủat ừngthànhphầntrongtruyvấnthỏañiềukiệntruyvấnhoànchỉnh.

engine).Đâyl à mộtbộphậnquantrọngcủahệthốngTruyxuấtThôngtin(InformationRe trieval).Độngcơtìmkiếmthôngtingiảiquyếtbavấnñềcốtlõilàmôhìnhbiểud i ễnvănbả

n,thuậttoántìmkiếmsotrùngtừkhóa-ñốisánhngữnghĩatươngứngvớicáctruyvấnvàcơchếlọckếtquảtruyxuất.Hiệntạitrênthếgiớicónhữngñộ ngcơtìmkiếmthôngtinnổitiếngnhưGoogle,Yahoo,MicrosoftBing…

Tuynhiên,nghiêncứucủaluậnánchỉsửdụngnhữngñộngcơnàynhưmộtcôngcụhỗtrợviệctìmkiếmthôngtinchotruyvấnñãmởrộngbằngphươngphápxửlýcủal u ậnánvàkhôngñặtmụctiêunghiêncứubavấnñềnêutrên.Vìvậyluậnánñãkhôngtrìnhbàybavấnñềnày

Trang 22

f Tham

khảophầngiớithiệucủachương4vềlýdosửdụngnguồntàiliệutiếngAnhtrongthựcnghiệm.

Trang 23

f f

công,mộtontologycóchấtlượngñượctạothànhsẽgiúpcungcấpnhiềukhảnăngchọnlựachocácthôngtinhơn,ñểbổsungvàotừkhóabanñầucủangườidùng,d ẫnñếnviệcnângcaochấtlượngcủaviệcmởrộngtruyvấn.Việcgiảiquyếtbàitoán nàyñượctrìnhbàychitiếttrongchương4củaluậnán

Bàitoán2-Xâydựngphươngpháphoànchỉnhmởrộngtruyvấn

Dựatrênontologyởbàitoán1,nghiêncứuxâydựngphươngpháptiếpcậnmớichoviệcmởrộngtruyvấnnhằmtạotruyvấnkếtquảcódạngtruyvấnhoànc h ỉnh(biểudiễnởdạngcụmdanhtừvềmặtngônngữhọc)vàxâydựngcácgiảithuật

trìnhbàychit i ếttừngphầncủanhữngphươngphápgiảiquyếtbàitoánnày

Luậnánchủyếutậptrungxửlýtruyvấnngắnvớibathànhphầnnênkhôngnghiêncứuvấnñềngữcảnhcủacâutruyvấn.Vàthựctếviệcnghiêncứuvềngữnghĩacủacụmtừvàcâucóảnhhưởngcủangữcảnhlàvấnñềrấtkhóvàhiệnnayc ũngñangñượcnhiềunhàkhoahọcquantâm,làlĩnhvựckhácnằmngoàiphạmvicủaluậnán

1.3 Đónggópchínhcủaluậnán

Cácvấnñềnghiêncứucủaluậnánñãcómộtsốñónggópmớivềmặtkhoahọctừphươngphápluậnñếngiảiphápthựchiện:

nngữtựnhiên).Ngoàira,từgócñộtoánhọc,việcxâydựngcáclớpñồngdạng(liênquanñến nhómcácñốitượng,nhómcácthànhphầnñặctrưng

Trang 24

MQE , MQE , MQE , MQE

vànhómcáctínhchấtñặctrưng g)từcácquanhệnêutrênsẽgiúpchoviệcphânloại

ñốitượnghiệuquảhơn.Côngtrình[ii],[iv],

[v]và[ix]h ñãgiớithiệuphươngphápxácñịnhcácquanhệcùngñịnhnghĩacủanhữngkháiniệmnày

Phầnñónggópnàysẽkhôngthựcsựñầyñủnếukhôngcócácñịnhnghĩa

OB

IR IR OBP IR OB IR OBP cùngkhá in i ệmtruyvấnh o à n chỉnh,câyphântíchvàdạngñồthịngữnghĩadotácgiảñềxuất,liênquanñếnviệcmôh ìn h hóabàitoánmởrộngtruyvấn

*Đóngg ó p thứhai:ñ ề x u ấtmôh ì n h o n t o l o g y O O M P c ù n g c á c p h ươngp

.Ngoàira,từgócñộngônngữhọc,cácthànhphầncủaontologyOO M P ñược phân

Trang 25

g Tham

khảothêmhình3.3,trang59vềcáclớpnày.

h Tham

khảothêmphầnCáccôngtrìnhkhoahọc.

Trang 26

KiểmtratínhhoànchỉnhcủacụmdanhtừtiếngAnhtheoquanñiểmngônn g ữhọctínhtoán(ứngdụngtronglĩnhvựcxửlýngônngữtựnhiên:truyxuấtthôngtin,rúttríchthôngtin,tómlượcnộidungvănbản)

− Hoànchỉnhvàmởrộngcụmdanhtừtươngñương(ứngdụngtronglĩnhvựcxửlýngôn ngữtựnhiên:truyxuất thông tin, rút trích thông tin,tómlượcnộidungvănbản)…

Cácphươngphápvàgiảithuậtliênquanñếnñónggópnàyñượcgiớithiệut ro n g

[ii],[v]và[ix].

*Đóngg ó p thứt ư:P h ươngp h á p x â y d ựngc h ỉm ụch ướngn g ữn g h ĩa( Se

manticIndexCreation,SIC)thôngquaviệcmởrộngcấutrúcchỉmụcñểlưutrữt h êm thông

tinliênquanngữnghĩañế nontologyxácñịnh.Đâychínhlàcầun ốigi úptriểnkhainhữngnghiêncứulýthuyếtvàoứngdụngthựctiễntronglĩnhvựctruyxuấtt hô ng ti n.Kếtquảth uñ ư ợ ctừp h ươngphá pnàytạot i ềnñề chon h i ềunghiêncứuứngdụngliên

quanñếntruyxuấtthôngtin.Phươngphápnàyñượctrìnhnày trongcôngtrình[iv]vàñượcphát triểntrong[iii]và[viii].

Nhữngkếtquảñạtñượcnàyñồngthờiñượcápdụngchocôngtrình[xii]vàdựñịnhá pdụngchocôngtrình[xiii].

1.4 Cấutrúccủaluậnán

Luậnánñượcchiathànhbảychươngvàbảyphụlục.Chương1trìnhbàymụct

iêu,phạmvivàn hữngñónggópchính củaluậnán;giớithiệucấutrúccủal u ậnán;liệtkêcácquiướcvềkýhiệuviếttắtvàtêncácthuậtngữởdạngtiếngnướcngoài.Tron

Trang 27

gmỗichươngtiếptheo,từchương2ñếnchương6ñềucóphầngiớithiệuvàphầntómlược.Chương7làkếtluậncủaluậnán

Trang 28

ậnán.Chươngnàytrìnhbàymộtbứctranhtổngquancáchướngnghiêncứuvềvấnñềmởrộngtruyvấn,ñặcbiệtlàhướngkếthợpontology,nhữngưunhượcñiểmcủacácphươngphápnghiêncứuhiệnnay

Chương3trìnhbàycơsởtoánhọcñểpháttriểnmôhìnhmởrộngtruyvấnc ù n g m

ộts ốñ ề x u ấtv ềl ý t h u y ếtl i ê n q u a n ñ ế nh ướngn g h i ê n cứuc ủal u ậná n Nhữngñềxuấtl ýthuyếtñượ ct rì nh bàytheotừngkhái ni ệmthôngqua các ñịnhn g h ĩa,tínhchấtvàvídụminhhoạ.PhầnkhảosátWordNetñượctrìnhbàytrongc h ươngnàybaogồmcấutrúctổchứcvàcáctínhnăngcũngnhưưukhuyếtñiểm.V i ệcvậndụngngônngữhọctínhtoánvàoñềxuấtmẫunhậndạngcụm

danhtừcủatácgiảñượctrìnhbàychitiếtởcuốichươngñểlàmnổibậttậpluậtsinhcủamẫu.Kếtquảnhữngñềxuấtvềcácphươngphápñãñượccôngbốtrongbáocáokhoahọ

Trang 29

trọngảnhhưởngtíchcựcñếnvấnñềlàmñầyñủthôngtinhơnchomộttruyvấn.Cònphương pháprútgọntruyvấn sẽgópphầntạonênmộttruyvấn côñọngnhưngvẫnñầyñủthông

iệutrong[iv]và[ix].Ngoàira[iii]và[viii]trìnhbàycácpháttriểntừhướngtiếpcậnc hỉmụchướngngữnghĩañểápdụngchocôngtrình[xiii].

Chương7làphầntổngkết,trongñótrìnhbàytómlượckếtquảluậnánvàn h ữngñ

ề n g h ịh ướngn g h i ê n c ứut r o n g t ươngl a i , l i ê n q u a n ñ ế nl u ậná n N g o à i nhữn

gkếtquảnêutrongcácchươngtrênñãñượctrìnhbàytrongcôngtrình[xii],nhữngkế tquảbướcñầucủahướngnghiêncứutiếptheocũngñượcgiớithiệutrong[i ] ,[iii],[vii],[viii],

[x],[xi]vàdựñịnhápdụngchocôngtrình[xiii].

trìnhbàytómlượcvềWordNet.PhụlụcBgiớithiệucấutrúccụmdanhtừtiếngAnh.PhầnphụlụcCv à DlầnlượttrìnhbàydanhmụccáctừloạitiếngAnhvàtậpluậtsinhtrongvănp

h ạmtiếngAnhd ựatrênPennT r e e B a n k Ph ụlụcE tó mlượckiếnth ứcvềk h á i n i ệmảnhvàtạoảnhcủaánhxạtrongtoánhọc.PhụlụcFgiớithiệucấutrúcñịnhd ạngtàiliệutrongn gu ồntàiliệuTR EC P h ầncuốilàphụlụcGc un g cấpsơñồminhhoạvềtổchứccơsởdữliệuthựcnghiệmcủaluậnán

Trang 30

1.5 Cácquyước

CáckháiniệmhaythuậtngữñượcsửdụngtrongluậnánñượcñồngthờighicảbằngtiếngViệtvàtiếngAnh(hoặckýhiệuviếttắttươngứngnếucó)ởlầnliệtk ê ñầutiêntrongluậnán,sauñóchúngsẽñượcdùngthốngnhấttheomộttêngọitiếngViệthaytiếngAnh

1.6 Tómtắtnộidungluậnán

TruyvấntiếngAnh

(dạngcụmdanhtừ)

Bàitoán2A:mởrộngtruyvấndự atrênontologyOOMP Bàitoán2B:mởrộng

(Ch.5:gt.NPMR)

Tạotruyvấnrútgọn(b)

(Ch.5:gt.CNPG)

Bàitoán1:xâydựngo ntologyOOMP

OntologyOOMP

(Ch.4:gt.CB-KBT,

truyvấndựatrên ontologyOOMP (cụcbộ)

Tìm kiếm mởrộng

(Ch.6:gt.HS)

Xâydựngchỉmụch

ư ớ n g ngữnghĩa Hoànchỉnhtruyvấn

(Ch.5:gt.NPC) Mởrộngtruyvấn(Ch.6:gt.SNPE) gt.WB-KBT,gt.A-KBT)

Mộtphầnkếtquảcôngbốtrong[ i

i ] , [iv],[v]và[ix]

(Ch.6:gt.SIC)

Mộtphầnkếtquảcôngbốtr ong[iv],[ix]

Trang 31

CÁCNGHIÊNCỨULIÊNQUAN

2.1 Giớithiệu

Nộidungtrongchương2làphântíchmộtsốnghiêncứuliênquanñếnluậnán theohướngmởrộngtruyvấndựatrênontologyvàkhaithácWordNetñểphụcvục h o v i ệc

h u ấnl u y ệnontology.M ụcñ íchc ủav i ệcp h â n t í c h n h ằmx á c ñ ị nhnhữngưuñiểmcủacácnghiêncứucóảnhhưởngtíchcựcñếnhướngnghiêncứuc ủaluậnáncũngnhưnhữnghạnchếvàcáckhókhăn,ñểtừñóluậnánñưaracácgiảiphápnhằmgiảmthiểunhữngtácñộngkhôngtíchcực

Trongc h ươngn à y , phần2 2 t r ì n h bàyt ó m l ượcv ềc á c n g h i ê n cứut r o n g nướccóliênquanñếnluậnán.Phần2.3giớithiệumộtsốnghiêncứuvềontologyv à nhữn

g vấnñềliênquanñồng thờicung cấpcác kiếnthức tổngquanvềontology,ñ ể từñólàmcơsởchoviệcpháttriểnontologycủañốitượng–

thuộctính–tínhc h ấtñặ ct r ưng(OntologyofO bje ct – Member –

Property ,OO MP )ñềxuấttrong c h ương4.Phần2.4sẽñặtvấnñềvềbàitoánmởrộngtru

yvấntheomộtsốcáchtiếpc ậnkhácnhauñểlàmrõcơsởlýthuyếtcủaphươngphápmởr

ộngtruyvấndựatr ê n

ontology(ontology-basedqueryexpansion )cũngnhưsựñónggópcủao n t o l o g y trongviệcgiảiquyếtbà

itoánmởrộngtruyvấn.Vớicấutrúcvànộidungñ ư ợ ctrìnhbàynhưtrênsẽñưañếnphươngpháphoànchỉnhmởrộngtruyvấnmàl u ận ánñềxuất trong chương 5 và6 Cuối cùng

sáttiếpt h e o vềvấnñềkhaithácdữliệuvàquanhệngữnghĩatrongWordNetñểhuấnluyệnd ữl

i ệuc h o o n t o l o g y chuyênd ụng.T h ô n g q u a p h ầnn à y , t á c g i ảs ẽl à m s á n g t ỏp h ư

ơngpháphuấnluyệnontologyOOMPcủaluậnántrongchương4.

Trang 33

− ViệnCôngnghệThôngtinViệtnam:

Trang 34

n t o l o g y và xửl ý n g ô n n g ữt ựn h i ê n v à o v i ệcx á c ñ ị nhc á c c ụmtừñ ặ ct r ưngtrongmộtcâuvănbản.Trongphươngphápxửlý,họñãkhaithácWikipediat i ếngViệtñểphụcvụviệcxâydựngmộtdanhmụctừtiếngViệtñồngthờihỗtrợhuấnluyệnontologyViO&ViDic.Kếtquảñạtñượccủanhómnàytươngñốikhảq u a n vớiñ ộ c h í n h x á c 8 9 6 % v

à ñ ộ b a o p h ủ8 7 8 % t r ê n t ậpd ữl i ệut h ửn g h i ệm2 07 9câutruyvấn

trongngônngữtiếngViệt.Mộtñịnh

hướngnghiêncứumànhómn ày cầnthựchiệntrongtươnglailàviệcmởrộngkhảnăngxửlýchocâutruyvấnd à i haycódạngphứctạp.Mộtsốkếtquảkháctừnhómnàygồmcôngtrình[2][3][ 5 ] [6][23][24](trongcácnăm2007-2009)và[133](năm2009-

Trang 35

KIMKBMdựatrêncơsởlýthuyếtvềcácnghiêncứuvàthựcthểcó têncùngnhữngquanhệngữnghĩatươngứngcùngnền tảngSesamecùngcơchếphòngchống lỗi kháchiệuquả.Từcơsởnày,kết quảtừ[63]ñã phát triển theomột

Trang 36

tiếpcậnkhaithácdữliệutừWikipedianhằmphụcvụb ài toánkhửnhậpnhằngtựñộngchothựcthểcótên.Đâylàmộttrongnhữngñịnhh ướngmớicủanhómnày.Côngtrình[131](năm2008)khảosátcáchướngnghiênc ứuk h á c n h a u v ềmởr ộngmôh ì n h k h ô n g g i a

n v é c

-t ơ-t r o n g l ĩnhv ực-truyx u ấ-t-th ôn g-t i n , -t ừñ óñ ề x u ấ-tmởr ộngc h o môh ì n h này-t h ô n

g q u a v i ệck ếthợpvớio n t o l o g y theohướngxửlýthôngtinvềthựcthểcótên.SosánhvớiLucene,mô hì n h nàyñạtñượcnhiềuưuñiểmhơntrongviệctruyxuấtvănbản,biểudiễnvănbảnvàtruyvấn.Mộtnghiêncứukháccủanhómnàylà[132]

(năm2008)ñềxuấtmộtphươngphápchuyểnñổitruyvấndạngngônngữtựnhiênsangdạngbiểudiễnñồ thịýniệm,ñểtừñótìmkiếmthôngtintrongontologynhằmphụcvụviệctìmk i ếmhướngngữnghĩa.ViệcthựcnghiệmchophươngphápnàybướcñầuñượctiếnhànhtrêntậpdữliệuTREC2002cùngTREC2007vàñangñượcmởrộng

Nghiêncứu[85]củaNhóm3quantâmxửlýbảomậtchocâychỉmụcdữliệuthông qua việc cảitiến hệthốngdựa trêncác tính chất dữliệu Quañó chothấyv ai tròquan trọng của hệthống chỉmụccùng nhữngkhảnăng cảitạo vàtáicấutrúchệthốngchỉmụctrongmộthệthốngthôngtin

Trongnăm2008và 2009,Nhóm4cónghiên cứu[26][32][33][34][35][36][37][38][39]

[40]và[41]theohướngứngdụngxửlýngônngữtựnhiênvàov i ệcpháttriểnhệthốngtruyxuấtthôngtin(xuyênngônngữ)vàhệthốnghỏiñáph ỗtrợtiếngViệt.Cáckếtquảñạtñượccủanhómnàychothấymộttriểnvọngrấtlớntrongviệcứngdụngxửlýngônngữtựnhiênvàocáclĩnhvựckhácnhau

Côngtrình[128]củanhómThànhTrầntậptrungtheohướngthưviệnsốvớimộthướngtiếpcậnñềxuấtvềtruyvấnthôngtinchuyênbiệtdựatrênontologyñểx ửlýtruyvấnởdạngtựnhiêndựatrênñồthịýniệm.Kếtquảthựcnghiệmchothấyñâylàphươngphápcónhiềutriểnvọngtrongviệcmanglạikếtquảtìmkiếmt ốthơnchongườisửdụng

Mộtnghiêncứukhác,

[47],củanhómDungTranvềhướngrúttríchthôngtintro nglĩnhvựcchămsócsứckhỏe.N

ghiêncứunàysửdụngontologyñểphụcvụgiảithuật“SemanticElementsExtractin g”và“NewSemanticElementsLearning”,

Trang 37

giữakháiniệmv à môtả,tênbệnhtừcáctrangweb.ThựcnghiệmcủahọtrêndữliệutiếngViệtchothấyphươngpháptốiưuvớiviệckhaithácthôngtinvàlàmgiàuontologycó

ñ ộ chínhxáccao

Cácnghiêncứugầnñâycủanhóm4ñềutậptrungxửlýnhữngbàitoáncontrong

loạivănbản.C ô n gtrình[104]ñềxuấtmộthệthốnggomnhómñồthịdựatrênphươngphápgomnhómt ài l i ệut ươngtựv à t ừñ ór ú t t r í c h c á c ý t ưởngc h í n h Đ âyl à m ộth ướngn g h

i ên cứukhámớivềrúttríchthôngtinthôngquaviệcsửdụngñồthịñểbiểudiễncáctàiliệuvàquanhệngữnghĩanhằmkhắcphụccácnhượcñiểmcủanhữnggiảip h áp truyềnth ốngnhưvịtrí từ,quanhệnghĩagiữacáct ừ…

o n g ữl i ệus o n g n g ữñ ể k h ửn h ậpn h ằngt r o n g b ướcchuyểnn g ữd ựat r ê n t ừñ iển.K ếtq u ảt h ửn g h i ệmc ủac ô n g t r ì n h nàyc h o thấy

Trang 38

Nghiêncứu[64]củanhómHoàngHữuHạnhởĐạihọcHuếvềkhungứngdụngng

ữnghĩaquảnlýthôngtincụcbộ(SemaDesk)theohướngứngdụngcáckếtquảnghiêncứuvề

Webngữnghĩa.Hướngtiếpcậncủahọbaogồmthựchiệnphântíchvàchúgiảichotruyvấncủangườidùng,từñókếthợptìmkiếmmởrộngkếtqu ảdựatrênontologyvàkếthợp

-KBThuấnluyệnontologyOOMPtrongchương4củaluậnán.

2.3 Cácnghiêncứuvềontology

Phầnnàytrìnhbàycáckháiniệmvềontologyvànhữngnghiêncứuliênquann h ằmlàmrõhơncácưuñiểmvàhạnchếcủaontologyvàkhảnăngápdụngchúngv ào luậnán

2.3.1 Kháini¾mveontology

Kháin i ệmo nt ol og y ñ ượ cn h i ềun h ó m n g h i ê n c ứuñ ị nhn g h ĩa.N ăm2 00 2,

B a t e s ñềxuấtrằngmộtontologysẽñượcmôtảmộtcáchchínhxáchơn(như)là

Trang 39

“mộtsựphânloại,cáctừñiểnchuyênngànhhaylàtậpcácnhómkháiniệm”i.Mộtñ ị nhngh

ĩakháccủaontologylàsựphânloại,cácdanhmụccủacácthuậtngữchỉm ục,haycáccụ mthuậtngữkháiniệm j(tríchtừnguồn[30]).Mộtontologylàmộtmôhìnhcủathựctế,nhưngtựnókhônglàthựctế.Bates(trongcôngbố[93]năm20 02 )cũngñềnghịdùngmộtkhá

iniệmmớithayontology.Theoñó,hệthốngnênñư ợ cgánmộtnhãnm ôtảchính xác hơ

thuộctrênngữcảnhthíchhợp.Ontologylàmộttổchứcchặtchẽvàtoàndiệnvềmộthoặcvàimiềntrithức,baogồmcácthựcthểtươngứngtrongmiềnñóvàcácmốiquanhệgiữachúng

Trongngànhkhoahọcmáytính,ontologylàmộtkhodữliệubiểudiễnmộtt ậpcác

kháiniệmvàcácquanhệ,dùngñểmôtả,ñịnhnghĩacáctínhchấtcủamiền(domain).Ontolo

gycungcấpnhữngtừvựngvàcáchbiểudiễnthôngtincầnthiết,p hùhợpchoviệcgiaotiếptườngminhtrongmộtmiềntrithức

Ontologycảitiếntínhchínhxáctrongtìmkiếmthôngtinmờvàlàmchoviệcñốithoại

giảicâutruyvấncủangườidùngthôngquaviệcxửlýnhậpnhằngvàxácñịnhngữcảnh.Trongngônngữtựnhiên,mộttừcóthểcónhiềunghĩaphụthuộcvàongữcảnh.Theoñó,ontologycót h ểcungcấpngữcảnhliênquanñểhỗtrợxácñịnhnghĩaphùhợpchotừ.Trongmộth ệt h ốngm á y t í n h , n g ữc ảnhc ó t h ểñ ư ợ cb i ểud i ễnhayr à n g b u ộcbởimột

i Nguyên

văn:“aclassification,thesaurusorasetofconceptclusters”

j Nguyên

văn:“classification,listsofindexingterms,orconcepttermclusters”

Trang 40

ontology,vìthếmôhìnhontologyhiệuquảtrongviệcxửlýnhậpnhằngvềnghĩac ủatừtrongmộtcâubấtkỳ.

2.3.2 Tínhchatvàcácvanñeliênquanñenontology

Cácontologycódạngtổngquát(generalontology )hoặcdạngchuyênbiệt( s pecificontology).WordNet,EuroWordNetvàCyclàcácvídụcủaontologytổngquát.

Nhiềuontologychuyênbiệtñãñượcxâydựng,vídụnhưontologyvềykhoav à luậtpháp.Trong[99],năm2003Bucklandphânbiệtbakiểuontologylà:

− Ontologytiênñề:chứacáckhái niệmtrừutượngñượchợplý hoátừcác

biệngiải(reasoning);

Ontologythuậtngữ:baogồmcấutrúccủacáckháiniệmtừvựng(lexicalisedconcep ts).

nàykhôngnêubậtñượckếtquảthựcnghiệm liênquan, nhưngkết quảcủanghiên

Ngày đăng: 19/08/2014, 17:22

Nguồn tham khảo

Tài liệu tham khảo Loại Chi tiết
[2] Nguyễn Chớ Hiếu. Mụ hỡnh khai thỏc ủặc tớnh ngụn ngữ ủớch nhằm xỏc ủịnh cỏc cụm danh từ cơ sở tương ứng Anh-Việt, Luận án tiến sĩ. Đại học Quốc gia Tp.Hồ Chí Minh. 2007 Sách, tạp chí
Tiêu đề: Mụ hỡnh khai thỏc ủặc tớnh ngụn ngữ ủớch nhằm xỏc ủịnh cỏc cụmdanh từ cơ sở tương ứng Anh-Việt
[3] Nguyễn Chí Hiếu, Phan Thị Tươi, Nguyễn Xuân Dũng, Nguyễn Quang Châu. Sử dụng kỹ thuật Pruning vào bài toỏn xỏc ủịnh từ loại. Tạp chớ Phỏt triển Khoa học &Công nghệ, tập 8, số 11, 14-23, 2005 Sách, tạp chí
Tiêu đề: Sử dụng kỹ thuật Pruning vào bài toỏn xỏc ủịnh từ loại
[5] Nguyễn Quang Chõu, Phan Thị Tươi. Nhận diện cụm từ ủặc trưng ngữ nghĩa trong tiếng Việt. Tạp chí Bưu chính Viễn thông và Công nghệ thông tin, số 19, 2/2008 Sách, tạp chí
Tiêu đề: Nhận diện cụm từ ủặc trưng ngữ nghĩa trongtiếng Việt
[6] Nguyễn Quang Chõu, Phan Thị Tươi, Cao Hoàng Trụ. Tự ủộng rỳt trớch cỏc cụm danh từ Anh - Việt từ kho ngữ liệu song ngữ. Kỹ yếu hội thảo khoa học Quốc gia lần II “Nghiên cứu cơ bản và Ứng dụng công nghệ thông tin” (FAIR’2005), Đại học Bách khoa Tp.HCM, Việt nam, 23-24/9/2005 Sách, tạp chí
Tiêu đề: Tự ủộng rỳt trớch cỏc cụm danh từ Anh - Việt từ kho ngữ liệu song ngữ". Kỹ yếu hội thảo khoa học Quốc gia lầnII “Nghiên cứu cơ bản và Ứng dụng công nghệ thông tin
[7] Thông tấn xã Việt nam. Thị trường internet Việt Nam: Bùng nổ và hấp dẫn. [online]. http://www.vnagency.com.vn/TrangChu/VN/tabid/58/itemid/225519/ Sách, tạp chí
Tiêu đề: Thị trường internet Việt Nam: Bùng nổ và hấp dẫn
[8] Vũ Ngọc Tỳ. Nghiờn cứu ủối chiếu trật tự từ Anh-Việt trờn một số cấu trỳc cỳ phỏp cơ bản, Luận án PTS Ngữ văn. ĐHQG Hà nội. 1996.Tiếng Anh Sách, tạp chí
Tiêu đề: Nghiờn cứu ủối chiếu trật tự từ Anh-Việt trờn một số cấu trỳc cỳ phỏpcơ bản
[9] Abraham Bernstein, Esther Kaufmann, Christian Kaiser, Christoph Kiefer. Ginseng, A Guided Input Natural Language Search Engine, for Querying Ontologies. Jena User Conference. Bristol. UK. 2005 Sách, tạp chí
Tiêu đề: Ginseng,A Guided Input Natural Language Search Engine, for Querying Ontologies
[10] Alain Leger, Aarno Lehtola and Victor Villagra. MKBEEM — Developing Multilingual Knowledge-Based Marketplace. ERCIM News No.46, July 2001 [online] http://www.ercim.org/publication/Ercim_News/enw46/leger.html Sách, tạp chí
Tiêu đề: MKBEEM — DevelopingMultilingual Knowledge-Based Marketplace
[11] Alan F. Smeaton, Cornelis Joost van Rijsbergen. The retrieval effects of query expansion on a feedback document retrieval system. Computer Journal, Volume 26 Issue 3, pp.239–246. 1983 Sách, tạp chí
Tiêu đề: The retrieval effects of queryexpansion on a feedback document retrieval system
[12] Alexander M. Robertson, Peter Willett. A comparison of spelling-correction methods for the identification of word forms in historical text databases. Literary and Sách, tạp chí
Tiêu đề: A comparison of spelling-correction methods for the identification of word forms in historical text databases
[14] Anne Sihvonen, Pertti Vakkari. Subject knowledge improves interactive query expansion assisted by a thesaurus. Journal of Documentation, Volume 60, Issue 6, pp.673–690. 2004. ISSN: 0022-0418 Sách, tạp chí
Tiêu đề: Subject knowledge improves interactive queryexpansion assisted by a thesaurus
[17] Baziz Mustapha, Boughanem Mohand,Aussenac-Gilles Nathalie. Conceptual indexing based on document content representation information context: nature, impact, and role. In 5th International Conference on Conceptions of Library and Information Sciences No5, Glasgow, Volume. 3507, pp.171-186 , ROYAUME-UNI.UK (04/06/2005) Sách, tạp chí
Tiêu đề: Conceptualindexing based on document content representation information context: nature,impact, and role
[18] Bentaallah Mohamed Amine, Malki Mimoun. WordNet based Multilingual Text Categorization. INFO COMP – Journal of Computer Science, Volume 6 Number 4, pp.52-59.. 2007. [online] http://www.dcc.ufla.br/infocomp/artigos/v6.4/art07.pdf[19] Bernardo Magnini, Manuela Speranza. Merging global and specialized linguisticontologies. In Proceedings of the workshop Ontologies and Lexical Knowledge bases (Ontolex-2002), LREC-2002, pp.43–48, 2002 Sách, tạp chí
Tiêu đề: WordNet based Multilingual TextCategorization". INFO COMP – Journal of Computer Science, Volume 6 Number 4,pp.52-59.. 2007. [online] http://www.dcc.ufla.br/infocomp/artigos/v6.4/art07.pdf [19] Bernardo Magnini, Manuela Speranza. "Merging global and specialized linguistic"ontologies
[20] Bodo Billerbeck, Justin Zobel. Questioning query expansion: an examination of behaviour and parameters. ACM International Conference Proceeding Series.Proceedings of the 15th Australasian database conference, Volume 27, pp.69-76.Dunedin, New Zealand. 2004 Sách, tạp chí
Tiêu đề: Questioning query expansion: an examination ofbehaviour and parameters
[21] Boris Gelfand, Marilyn Wulfekuhler, William F. Punch III. Automated Concept Extraction from Plain text. AAAI 1998 Workshop on Text Categorization. 1998.[online] http://garage.cse.msu.edu/papers/GARAGe98-07-02.pdf Sách, tạp chí
Tiêu đề: Automated ConceptExtraction from Plain text
[22] Bruce R. Schatz, Eric H. Johnson, Pauline A. Cochrane, Hsinchun Chen. Interactive term suggestion for users of digital libraries: using subject thesauri and co- occurrence lists for information retrieval. International Conference on Digital Sách, tạp chí
Tiêu đề: Interactiveterm suggestion for users of digital libraries: using subject thesauri and co-occurrence lists for information retrieval
[23] Chau Q. Nguyen, Tuoi T. Phan. An Ontology-Based Approach for Key Phrase Extraction. Proceedings of the Joint Conference of the 47th Annual Meeting of the ACL and the 4th International Joint Conference on Natural Language Processing of the AFNLP. [online] http://aclweb.org/anthology-new/P/P09/P09-2046.pdf Sách, tạp chí
Tiêu đề: An Ontology-Based Approach for Key PhraseExtraction
[24] Chau Q.Nguyen, Tuoi T.Phan, Tru H.Cao. Vietnamese Proper Noun Recognition.Proceedings of the 4th IEEE International Conference on Computer Science, Research, Innovation & Vision for the Future, February 12-16,2006 Ho Chi Minh City, Vietnam Sách, tạp chí
Tiêu đề: Vietnamese Proper Noun Recognition
[25] Ching Kang Cheng, Xiaoshan Pan. Using perception in managing unstructured documents. Crossroads, Volume 10, Issue 2 (Winter 2003), pp.5–5. 2003. ISSN:1528-4972 Sách, tạp chí
Tiêu đề: Using perception in managing unstructureddocuments
[26] Chinh Trong Nguyen, Dang Tuan Nguyen. A New Model of English-Vietnamese Bilingual Information Retrieval System. International Conference on Information Technology (ICIT 2009), Venice, Italy, October 28-30, 2009 Sách, tạp chí
Tiêu đề: A New Model of English-VietnameseBilingual Information Retrieval System

HÌNH ẢNH LIÊN QUAN

Hình 1.1. Mối quan hệ giữa mô hình của luận án và hệ thống truy xuất thông tin - đồ án tốt nghiệp xây dựng mô hình mở rộng truy vấn trong truy xuất thông tin văn bản
Hình 1.1. Mối quan hệ giữa mô hình của luận án và hệ thống truy xuất thông tin (Trang 21)
Hỡnh 1.2. Túm tắt phõn bố nội dung cỏc vấn ủề trỡnh bày trong luận ỏn - đồ án tốt nghiệp xây dựng mô hình mở rộng truy vấn trong truy xuất thông tin văn bản
nh 1.2. Túm tắt phõn bố nội dung cỏc vấn ủề trỡnh bày trong luận ỏn (Trang 28)
Hình 2.1. Tổ chức hệ thống WordNet phiên bản 3.0 (*) - đồ án tốt nghiệp xây dựng mô hình mở rộng truy vấn trong truy xuất thông tin văn bản
Hình 2.1. Tổ chức hệ thống WordNet phiên bản 3.0 (*) (Trang 56)
Hình 2.3. Đồ thị quan hệ ngữ nghĩa của Boris - đồ án tốt nghiệp xây dựng mô hình mở rộng truy vấn trong truy xuất thông tin văn bản
Hình 2.3. Đồ thị quan hệ ngữ nghĩa của Boris (Trang 58)
Hỡnh 3.2. Vớ dụ về cõy phõn tớch (hỡnh b) ủược xõy dựng từ quan hệ R OMP  (hỡnh a) 3.2.6 Truy van hoàn chính - đồ án tốt nghiệp xây dựng mô hình mở rộng truy vấn trong truy xuất thông tin văn bản
nh 3.2. Vớ dụ về cõy phõn tớch (hỡnh b) ủược xõy dựng từ quan hệ R OMP (hỡnh a) 3.2.6 Truy van hoàn chính (Trang 71)
Bảng 3.2. Cỏc trường hợp liờn kết giữa q và q’ ủể tớnh ℘(q | q' ) - đồ án tốt nghiệp xây dựng mô hình mở rộng truy vấn trong truy xuất thông tin văn bản
Bảng 3.2. Cỏc trường hợp liờn kết giữa q và q’ ủể tớnh ℘(q | q' ) (Trang 80)
Hỡnh 3.7. Cài ủặt chức năng xõy dựng chỉ mục cho dữ liệu dạng XML - đồ án tốt nghiệp xây dựng mô hình mở rộng truy vấn trong truy xuất thông tin văn bản
nh 3.7. Cài ủặt chức năng xõy dựng chỉ mục cho dữ liệu dạng XML (Trang 97)
Bảng 3.7. Danh sách tập chỉ mục xây dựng từ nguồn dữ liệu trong bảng 3.6 - đồ án tốt nghiệp xây dựng mô hình mở rộng truy vấn trong truy xuất thông tin văn bản
Bảng 3.7. Danh sách tập chỉ mục xây dựng từ nguồn dữ liệu trong bảng 3.6 (Trang 98)
Hình 3.8. Tổ chức lưu trữ vật lý của các tập chỉ mục - đồ án tốt nghiệp xây dựng mô hình mở rộng truy vấn trong truy xuất thông tin văn bản
Hình 3.8. Tổ chức lưu trữ vật lý của các tập chỉ mục (Trang 98)
Hình 3.9. Tổ chức cơ sở dữ liệu lưu trữ thông tin của các chỉ mục - đồ án tốt nghiệp xây dựng mô hình mở rộng truy vấn trong truy xuất thông tin văn bản
Hình 3.9. Tổ chức cơ sở dữ liệu lưu trữ thông tin của các chỉ mục (Trang 99)
Thống kờ số lượng tài liệu này ủược trỡnh bày trong cột (5) bảng 3.8. - đồ án tốt nghiệp xây dựng mô hình mở rộng truy vấn trong truy xuất thông tin văn bản
h ống kờ số lượng tài liệu này ủược trỡnh bày trong cột (5) bảng 3.8 (Trang 100)
Hình 3.13. Thống kê tập mẫu sử dụng trong thực nghiệm - đồ án tốt nghiệp xây dựng mô hình mở rộng truy vấn trong truy xuất thông tin văn bản
Hình 3.13. Thống kê tập mẫu sử dụng trong thực nghiệm (Trang 102)
Bảng 3.10. Danh sách mẫu sử dụng trong thực nghiệm - đồ án tốt nghiệp xây dựng mô hình mở rộng truy vấn trong truy xuất thông tin văn bản
Bảng 3.10. Danh sách mẫu sử dụng trong thực nghiệm (Trang 103)
Hình 3.16. Tổ chức lưu trữ cụm danh từ rút trích từ các nguồn dữ liệu - đồ án tốt nghiệp xây dựng mô hình mở rộng truy vấn trong truy xuất thông tin văn bản
Hình 3.16. Tổ chức lưu trữ cụm danh từ rút trích từ các nguồn dữ liệu (Trang 106)
Hình 4.4. Các phương pháp huấn luyện ontology OOMP - đồ án tốt nghiệp xây dựng mô hình mở rộng truy vấn trong truy xuất thông tin văn bản
Hình 4.4. Các phương pháp huấn luyện ontology OOMP (Trang 115)
Hỡnh 4.7. Quan hệ R m  ủược xõy dựng từ quan hệ meronymy trong WordNet - đồ án tốt nghiệp xây dựng mô hình mở rộng truy vấn trong truy xuất thông tin văn bản
nh 4.7. Quan hệ R m ủược xõy dựng từ quan hệ meronymy trong WordNet (Trang 121)
Hỡnh 4.10. Quan hệ R m  và R p  ủược xõy dựng từ quan hệ similar trong WordNet - đồ án tốt nghiệp xây dựng mô hình mở rộng truy vấn trong truy xuất thông tin văn bản
nh 4.10. Quan hệ R m và R p ủược xõy dựng từ quan hệ similar trong WordNet (Trang 122)
Hỡnh 4.11. Quan hệ R p  ủược xõy dựng từ quan hệ similar trong WordNet - đồ án tốt nghiệp xây dựng mô hình mở rộng truy vấn trong truy xuất thông tin văn bản
nh 4.11. Quan hệ R p ủược xõy dựng từ quan hệ similar trong WordNet (Trang 122)
Hình 4.12. Tổ chức dữ liệu của WordNet phiên bản 3.0 - đồ án tốt nghiệp xây dựng mô hình mở rộng truy vấn trong truy xuất thông tin văn bản
Hình 4.12. Tổ chức dữ liệu của WordNet phiên bản 3.0 (Trang 124)
Bảng 5.3. Các trường hợp xử lý trong giải thuật CNPV theo dạng lỗi và mẫu - đồ án tốt nghiệp xây dựng mô hình mở rộng truy vấn trong truy xuất thông tin văn bản
Bảng 5.3. Các trường hợp xử lý trong giải thuật CNPV theo dạng lỗi và mẫu (Trang 139)
Bảng 5.5. Thống kê về thời gian thực thi của giải thuật NPC - đồ án tốt nghiệp xây dựng mô hình mở rộng truy vấn trong truy xuất thông tin văn bản
Bảng 5.5. Thống kê về thời gian thực thi của giải thuật NPC (Trang 150)
Bảng 5.6. Thống kê các trường hợp xử lý trong giải thuật NPC theo dạng lỗi - đồ án tốt nghiệp xây dựng mô hình mở rộng truy vấn trong truy xuất thông tin văn bản
Bảng 5.6. Thống kê các trường hợp xử lý trong giải thuật NPC theo dạng lỗi (Trang 151)
Hỡnh 5.4. Cài ủặt chức năng tỡm kiếm cho truy vấn sinh từ giải thuật NPC - đồ án tốt nghiệp xây dựng mô hình mở rộng truy vấn trong truy xuất thông tin văn bản
nh 5.4. Cài ủặt chức năng tỡm kiếm cho truy vấn sinh từ giải thuật NPC (Trang 153)
Hỡnh 6.2. Cài ủặt chức năng tỡm kiếm cho truy vấn sinh từ giải thuật SNPE - đồ án tốt nghiệp xây dựng mô hình mở rộng truy vấn trong truy xuất thông tin văn bản
nh 6.2. Cài ủặt chức năng tỡm kiếm cho truy vấn sinh từ giải thuật SNPE (Trang 171)
Hình 6.5. Minh họa tính chất (6.1) - đồ án tốt nghiệp xây dựng mô hình mở rộng truy vấn trong truy xuất thông tin văn bản
Hình 6.5. Minh họa tính chất (6.1) (Trang 175)
Hình 6.7. Mô hình hệ thống mở rộng truy vấn kết hợp hệ thống truy xuất thông tin  dựng sẵn - đồ án tốt nghiệp xây dựng mô hình mở rộng truy vấn trong truy xuất thông tin văn bản
Hình 6.7. Mô hình hệ thống mở rộng truy vấn kết hợp hệ thống truy xuất thông tin dựng sẵn (Trang 176)
Hình 6.6. Ứng dụng tính chất (6.1) vào mở rộng kết quả tìm kiếm - đồ án tốt nghiệp xây dựng mô hình mở rộng truy vấn trong truy xuất thông tin văn bản
Hình 6.6. Ứng dụng tính chất (6.1) vào mở rộng kết quả tìm kiếm (Trang 176)
Hình 6.8. Mô hình tổ chức chỉ mục hướng ngữ nghĩa - đồ án tốt nghiệp xây dựng mô hình mở rộng truy vấn trong truy xuất thông tin văn bản
Hình 6.8. Mô hình tổ chức chỉ mục hướng ngữ nghĩa (Trang 177)
Hỡnh 7.1. Phương phỏp thực hiện của vấn ủề 4 - đồ án tốt nghiệp xây dựng mô hình mở rộng truy vấn trong truy xuất thông tin văn bản
nh 7.1. Phương phỏp thực hiện của vấn ủề 4 (Trang 193)

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w