1. Trang chủ
  2. » Luận Văn - Báo Cáo

Tìm kiếm ngữ nghĩa ứng dụng trên lĩnh vực edoc

152 242 0
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 152
Dung lượng 2,2 MB

Nội dung

Luận văn, khóa luận, chuyên đề, tiểu luận, quản trị, khoa học, tự nhiên, kinh tế

1 LI CM N u tiên, chúng em xin gi li cm n n Thy, Cô khoa Công ngh Thông tin trng i hc Khoa hc T nhiên ã tn tình dy d, dìu dt chúng em sut bn nm i hc. Chúng em cm n Cô Phm Th Bch Hu, ngi tn tình hng dn, giúp , ng viên chúng em hoàn thành lun vn này. Cui cùng, chúng con cm n Ba, M và nhng ngi thân ã khích l, h tr, ng viên chúng con trong thi gian hc tp, nghiên cu  có c thành qu nh ngày nay. Tháng 7 nm 2005 Sinh viên Phm Th M Phng – T Th Ngc Thanh 2 NHN XÉT CA GIÁO VIÊN HNG DN …………………………………………………………………………………… …………………………………………………………………………………… …………………………………………………………………………………… …………………………………………………………………………………… …………………………………………………………………………………… …………………………………………………………………………………… …………………………………………………………………………………… …………………………………………………………………………………… …………………………………………………………………………………… …………………………………………………………………………………… …………………………………………………………………………………… …………………………………………………………………………………… …………………………………………………………………………………… …………………………………………………………………………………… ………………………………………………………………………………… …………………………………………………………………………………… Ngày…… tháng……nm 2005 Ký tên  tài: Tìm kim ng ngh a ng d!ng trên l nh vc eDoc 0112274 – Phm Th M Phng - 3 - 0112398 – T Th Ngc Thanh NHN XÉT CA GIÁO VIÊN PHN BIN …………………………………………………………………………………… …………………………………………………………………………………… …………………………………………………………………………………… …………………………………………………………………………………… …………………………………………………………………………………… …………………………………………………………………………………… …………………………………………………………………………………… …………………………………………………………………………………… …………………………………………………………………………………… …………………………………………………………………………………… …………………………………………………………………………………… …………………………………………………………………………………… …………………………………………………………………………………… …………………………………………………………………………………… …………………………………………….……………………………………… …………………………………………………………………………………… …………………………………………………………………………………… …………………………………………………………………………………… …………………………………………………………………………………… …………………………………………………………………………………… …………………………… Ngày…… tháng……nm 2005 Ký tên  tài: Tìm kim ng ngh a ng d!ng trên l nh vc eDoc 0112274 – Phm Th M Phng - 4 - 0112398 – T Th Ngc Thanh MC LC M U .10 Chng 1 : TNG QUAN .11 1.1. "t v#n  11 1.2. Bài toán gii quyt . 13 1.3. Hng tip cn . 14 Chng 2 : C S LÝ THUYT 17 2.1. Chin lc tìm kim thông tin c$a các b tìm kim (Search Engine) . 17 2.1.1. Mt s search engine thông d!ng: . 17 2.1.2. Chin lc tìm kim 32 Nguyên lý hot ng 34 2.2. Semantic Web 34 2.2.1. Khái nim . 34 2.2.2. Kin trúc 36 2.2.3. Các thách thc "t ra cho Semantic web . 37 2.2.4. So sánh web và web ng ngh a 41 2.2.5. Các khái nim liên quan . 42 2.2.6. Ontology 44 2.2.7. Rdf . 46 2.3. eDoc . 55 2.3.1. Tìm hiu eLearning 55 2.3.2. Tìm hiu eLib . 61 2.3.3. Tìm hiu eDoc . 68 2.4. Mt s v#n  trong x% lí ngôn ng t nhiên: . 71 2.4.1. V#n  trong vic x% lí vn bn: 72 2.4.2. V#n  x% lí ng ngh a: . 72 2.4.3. Phân loi vn bn (Text Classification) . 82 Chng 3 : MÔ HÌNH VÀ GII THUT 84 3.1. Công ngh tìm kim ng ngh a trên th gii hin nay: . 84 3.2. Các bc xây dng mt ng d!ng semantic search engine: 91 3.3.1. Xây dng kin trúc Web ng ngh a: 92 3.3.2. Lp ch& m!c ng ngh a tim tàng: . 93 3.3. Mô hình  ngh cho ng d!ng tìm kim ng ngh a trên l nh vc eDoc . 96 3.4. Các gii thut s% d!ng . 100 3.4.1. Gii thut x% lý tài liu: . 100 3.4.2. Gii thut rút trích siêu d liu: . 102 3.4.3. Gii thut phân loi l nh vc cho tài liu: 104 3.4.4. Gii thut x% lí câu truy v#n: . 104 Chng 4 : CHNG TRÌNH NG DNG 105 4.1. Gii thiu chng trình ng d!ng: 105 4.2. Kin trúc c$a ng d!ng: . 105 4.3. Mô t phm vi ng d!ng 107 4.3.1. Mô t bài toán: . 107  tài: Tìm kim ng ngh a ng d!ng trên l nh vc eDoc 0112274 – Phm Th M Phng - 5 - 0112398 – T Th Ngc Thanh 4.3.2. Xác nh yêu cu: 107 4.4. Xây dng ng d!ng: 108 4.4.1. Thit k d liu: . 108 4.4.2. Thit k x% lý: 110 4.5. Kt qu chng trình . 112 4.6. Thc nghim chng trình 114 Chng 5 : KT LUN 118 5.1. ánh giá kt qu nghiên cu . 118 5.1.1. 'u im . 118 5.1.2. Khuyt im: 119 5.2. Hng phát trin 119 TÀI LIU THAM KHO .120 I. Lun vn, lun án: 120 II. Sách, eBooks: . 120 III. Website: . 122 PH LC 124 1. Cú pháp RDF: 124 2. RDF Gateway: . 129 2.1. Kin trúc c$a RDF Gateway: . 130 2.2. Tính nng (Features) 132 3. H thng nhãn ng ngh a: 138 3.1. Nhãn ng ngh a c bn cho danh t: . 139 3.2. Nhãn ng ngh a c bn cho ng t: . 141 3.3. Nhãn ng ngh a c bn cho tính t: . 142 3.4. H thng nhãn ng ngh a LDOCE 142 4. H c s tri thc ng ngh a t vng WordNet 144 4.1. H thng nhãn ng ngh a c$a danh t: 144 4.2. H thng nhãn ng ngh a c$a ng t: 149  tài: Tìm kim ng ngh a ng d!ng trên l nh vc eDoc 0112274 – Phm Th M Phng - 6 - 0112398 – T Th Ngc Thanh DANH MC CÁC BNG Bng 1 : Bng hng dn nhanh v cách s dng mt s search engine ph bin . 28 Bng 2: S lc v các c trng c a mt s search engine thông dng trên Internet 32 Bng 3 : Các lp trong RDF 54 Bng 4:Các thuc tính c a RDF . 55 Bng 5: Danh sách các ngh!a và ràng buc c a các t" th#c trong câu . 77 Bng 6 Mô t c s$ d% li&u cho 'ng dng 110 Bng 7 Các module c a chng trình 110 Bng 8 Module eDocSearch 111 Bng 9 Module eDocSearch 111 Bng 10 Các câu truy v(n th nghi&m . 115 Bng 11 Thng kê l!nh v#c khoa h)c máy tính . 116 Bng 12 Thng kê l!nh v#c ngh& thu*t. . 116 Bng 13: Nhãn ng% ngh!a c bn cho danh t" 140 Bng 14: Nhãn ng% ngh!a c bn cho ng t" 142 Bng 15 : Nhãn ng% ngh!a c bn cho tính t" . 142 Bng 16: H& thng nhãn ng% ngh!a LDOCE 144 Bng 17:S# phân lp danh t" trong WordNet 148  tài: Tìm kim ng ngh a ng d!ng trên l nh vc eDoc 0112274 – Phm Th M Phng - 7 - 0112398 – T Th Ngc Thanh DANH MC CÁC HÌNH Hình 1: Giao di&n c a Google . 18 Hình 2: Giao di&n c a Yahoo 19 Hình 3: Giao di&n c a Ask Jeeves 20 Hình 4: Giao di&n c a AllTheWeb . 21 Hình 5: Giao di&n c a Teoma . 22 Hình 6: Giao di&n HotBot . 23 Hình 7: Giao di&n c a Altavista 24 Hình 8: Giao di&n c a Lycos . 25 Hình 9: Kin trúc t+ng c a Semantic web . 36 Hình 10: Mt Ontology n gin . 46 Hình 11: Mô hình d% li&u RDF . 51 Hình 12 : Tiêu chu,n ánh giá tính bo m*t c a eDoc 71 Hình 13 Các quan h& cú pháp và ràng buc ng% ngh!a . 76 Hình 14 Cây quyt -nh trong vi&c ch)n ngh!a phù hp. 78 Hình 15: Dòng c s$ tìm kim Web . 91 Hình 16: Mô hình  ngh- cho 'ng dng tìm kim ng% ngh!a trên l!nh v#c eDoc 97 Hình 17: Qui trình x lý c a t+ng search engine 99 Hình 18: Gii thu*t x lý tài li&u: 100 Hình 19: Gii thu*t rút trích siêu d% li&u 103 Hình 20: S . d% li&u quan h& c a 'ng dng 108 Hình 21: Giao di&n chính c a 'ng dng 112 Hình 22: Giao di&n kt qu tìm kim c a 'ng dng . 113 Hình 23: Giao di&n qun lí tài nguyên . 113 Hình 24: Kin trúc c a RDF Gateway . 130 Hình 25: Giao di&n c a RQF Query Analyzer 136  tài: Tìm kim ng ngh a ng d!ng trên l nh vc eDoc 0112274 – Phm Th M Phng - 8 - 0112398 – T Th Ngc Thanh DANH MC CÁC T/ VIT T0T eDoc Electronic document eLib Electronic library eLearning Electronic learning www World Wide Web URI Uniform Resource Identifier URL Uniform Resource Locator HTTP Hypertext Transfer Protocol RDF Resources Descriprion Framework OIL Ontology Inference Language OWL Ontology Web Language XML eXtensible Markup Language  tài: Tìm kim ng ngh a ng d!ng trên l nh vc eDoc 0112274 – Phm Th M Phng - 9 - 0112398 – T Th Ngc Thanh DANH MC CÁC THUT NG1 Class Lp Property Thuc tính Metadata Siêu d liu Subject Ch$ , ch$ ng Title Tiêu  Namespace Không gian tên Predicate V ng Triple B ba (subject, predicate, object)  tài: Tìm kim ng ngh a ng d!ng trên l nh vc eDoc 0112274 – Phm Th M Phng - 10 - 0112398 – T Th Ngc Thanh M( )U Hin nay, hu ht các h thng tìm kim trên Internet u i theo hng truyn thng ó là tìm kim theo t khoá ( key word ). Theo cách tìm kim này, khi ta gõ vào t cn tìm, các h thng tìm kim s* hin th các tài liu mà trong nó có cha t khoá cn tìm. Do ó, kt qu tr ra là mt danh sách r#t nhiu các tài liu, mà có th các tài liu này không liên quan gì n ni dung ta cn tìm. Và ôi khi các h thng này không a ra ht các tài liu cn thit, tc là tha tài liu không cn thit nhng li thiu h+n nhng tài liu quan trng khác. V#n  "t ra là ta phi xây dng mt h thng tìm kim nh th nào  khc ph!c hin trng nêu trên ?  gii quyt v#n  này, ta cn xây dng h thng tìm kim sao cho áp ng y $ thông tin mà ngi dùng mong mun, ngh a là phi xây dng h thng tìm kim theo ng ngh a da trên thông tin ngi dùng a vào. T nhn thc trên chúng em quyt nh chn  tài: Tìm kim ng% ngh!a 'ng dng trên l!nh v#c eDoc (nhng tài liu in t% ting Anh) vi m!c ích tìm hiu và xây dng mt công c! tìm kim theo ng ngh a  có th tìm kim thông tin chính xác và y $,  có th hn ch c phn nào v#n  tìm kim theo t khoá c$a các search engine hin ti. Các i tng nghiên cu liên quan n  tài: eDoc, Semantic Web, RDF, OWL, Metadata,…. Trong phm vi  tài, vì thi gian thc hin ngn, nên chúng em ch& th% nghim chng trình tìm kim trong mt s l nh vc: Khoa hc máy tính (Computer Science), Ngh thut (Art). Hai l nh vc này có v, nh không liên h vi nhau nhng thc t vn có nhng trng hp cn phi phân bit, ví d! nh tài liu v “ngh thut lp trình” (“Art of programming”) thì phi phân tài liu v l nh vc khoa hc máy tính ch không phi ngh thut …. Tóm li, ng d!ng mà chúng em xây dng ch& tìm kim thông tin trong các l nh vc nêu trên. Tuy nhiên, ng d!ng có th d- dàng m rng ra nhiu l nh vc còn li. . trên Internet u i theo hng truyn thng ó là tìm kim theo t khoá ( key word ). Theo cách tìm kim này, khi ta gõ vào t cn tìm, các h thng tìm. thng tìm kim theo ng ngh a da trên thông tin ngi dùng a vào. T nhn thc trên chúng em quyt nh chn  tài: Tìm kim ng% ngh!a 'ng dng trên

Ngày đăng: 04/08/2013, 15:43

HÌNH ẢNH LIÊN QUAN

Hình 1: Giao di & n ca Google - Tìm kiếm ngữ nghĩa ứng dụng trên lĩnh vực edoc
Hình 1 Giao di & n ca Google (Trang 18)
Hình 2: Giao di & n ca Yahoo - Tìm kiếm ngữ nghĩa ứng dụng trên lĩnh vực edoc
Hình 2 Giao di & n ca Yahoo (Trang 19)
Hình 3: Giao di & n ca AskJeeves - Tìm kiếm ngữ nghĩa ứng dụng trên lĩnh vực edoc
Hình 3 Giao di & n ca AskJeeves (Trang 20)
Hình 4: Giao di & n ca AllTheWeb - Tìm kiếm ngữ nghĩa ứng dụng trên lĩnh vực edoc
Hình 4 Giao di & n ca AllTheWeb (Trang 21)
Hình 5: Giao di & n ca Teoma - Tìm kiếm ngữ nghĩa ứng dụng trên lĩnh vực edoc
Hình 5 Giao di & n ca Teoma (Trang 22)
Hình 6: Giao di & n HotBot - Tìm kiếm ngữ nghĩa ứng dụng trên lĩnh vực edoc
Hình 6 Giao di & n HotBot (Trang 23)
Hình 7: Giao di & n ca Altavista - Tìm kiếm ngữ nghĩa ứng dụng trên lĩnh vực edoc
Hình 7 Giao di & n ca Altavista (Trang 24)
Hình 8: Giao di & n ca Lycos - Tìm kiếm ngữ nghĩa ứng dụng trên lĩnh vực edoc
Hình 8 Giao di & n ca Lycos (Trang 25)
Web ng ngh ac xây d ng theo mô hình kin trúc phâ nt ng g1m có 7 t ng, các t ng nh  sau:  - Tìm kiếm ngữ nghĩa ứng dụng trên lĩnh vực edoc
eb ng ngh ac xây d ng theo mô hình kin trúc phâ nt ng g1m có 7 t ng, các t ng nh sau: (Trang 36)
Hình 10: Mt Ontology ngin 2.2.7.Rdf  - Tìm kiếm ngữ nghĩa ứng dụng trên lĩnh vực edoc
Hình 10 Mt Ontology ngin 2.2.7.Rdf (Trang 46)
Mô hình d% li & u RDF (RDF Data Model): - Tìm kiếm ngữ nghĩa ứng dụng trên lĩnh vực edoc
h ình d% li & u RDF (RDF Data Model): (Trang 50)
Hình 11: Mô hình d% li & u RDF - Tìm kiếm ngữ nghĩa ứng dụng trên lĩnh vực edoc
Hình 11 Mô hình d% li & u RDF (Trang 51)
eLearning hay còn gi là Online Learning, chu5n cho t# tc các hình th cc $a vi c h c.   - Tìm kiếm ngữ nghĩa ứng dụng trên lĩnh vực edoc
e Learning hay còn gi là Online Learning, chu5n cho t# tc các hình th cc $a vi c h c. (Trang 55)
Hình 1 2: Tiêu chu,n ánh giá tính bo m*t ca eDoc - Tìm kiếm ngữ nghĩa ứng dụng trên lĩnh vực edoc
Hình 1 2: Tiêu chu,n ánh giá tính bo m*t ca eDoc (Trang 71)
Hình 13 Các quanh & cú pháp và ràng b uc ng% ngh!a - Tìm kiếm ngữ nghĩa ứng dụng trên lĩnh vực edoc
Hình 13 Các quanh & cú pháp và ràng b uc ng% ngh!a (Trang 76)
[IPRO]NP [enterV [anDET oldADJ bankN]NP]VP và cây cú pháp nh hình di ây: - Tìm kiếm ngữ nghĩa ứng dụng trên lĩnh vực edoc
enter V [anDET oldADJ bankN]NP]VP và cây cú pháp nh hình di ây: (Trang 76)
Hình 14 Cây quy t- nh trong vi & c ch)n ngh!a phù hp. - Tìm kiếm ngữ nghĩa ứng dụng trên lĩnh vực edoc
Hình 14 Cây quy t- nh trong vi & c ch)n ngh!a phù hp (Trang 78)
trên tr ng ng ngh ac $a cá ct có t ns xu#t hin cao, mô hình Maximum Entropy, d a trên lý thuy t t p thô, …  - Tìm kiếm ngữ nghĩa ứng dụng trên lĩnh vực edoc
tr ên tr ng ng ngh ac $a cá ct có t ns xu#t hin cao, mô hình Maximum Entropy, d a trên lý thuy t t p thô, … (Trang 83)
Hình 15: Dòng c s$ tìm ki mWeb - Tìm kiếm ngữ nghĩa ứng dụng trên lĩnh vực edoc
Hình 15 Dòng c s$ tìm ki mWeb (Trang 91)
Hình 16: Mô hình ngh- cho 'ng d ng tìm k im ng% ngh!a trên l!nh v#c eDoc Web Browser:   - Tìm kiếm ngữ nghĩa ứng dụng trên lĩnh vực edoc
Hình 16 Mô hình ngh- cho 'ng d ng tìm k im ng% ngh!a trên l!nh v#c eDoc Web Browser: (Trang 97)
Hình 17: Qui trình x lý cat +ng search engineInternet  - Tìm kiếm ngữ nghĩa ứng dụng trên lĩnh vực edoc
Hình 17 Qui trình x lý cat +ng search engineInternet (Trang 99)
Hình 18: G ii thu*t x lý tài li & u:eDoc  - Tìm kiếm ngữ nghĩa ứng dụng trên lĩnh vực edoc
Hình 18 G ii thu*t x lý tài li & u:eDoc (Trang 100)
Hình 19: G ii thu*t rút trích siêu d% li & u S% d!ng các tag chính:   - Tìm kiếm ngữ nghĩa ứng dụng trên lĩnh vực edoc
Hình 19 G ii thu*t rút trích siêu d% li & u S% d!ng các tag chính: (Trang 103)
Hình 20: S. d% li & u quanh & ca 'ng d ng - Tìm kiếm ngữ nghĩa ứng dụng trên lĩnh vực edoc
Hình 20 S. d% li & u quanh & ca 'ng d ng (Trang 108)
Hình 21: Giao di & n chính ca 'ng d ng - Tìm kiếm ngữ nghĩa ứng dụng trên lĩnh vực edoc
Hình 21 Giao di & n chính ca 'ng d ng (Trang 112)
Hình 22: Giao di & nkt qu tìm k im ca 'ng d ng Giao di n qu n lí tài nguyên:  - Tìm kiếm ngữ nghĩa ứng dụng trên lĩnh vực edoc
Hình 22 Giao di & nkt qu tìm k im ca 'ng d ng Giao di n qu n lí tài nguyên: (Trang 113)
Hình 23: Giao di & n q un lí tài nguyên - Tìm kiếm ngữ nghĩa ứng dụng trên lĩnh vực edoc
Hình 23 Giao di & n q un lí tài nguyên (Trang 113)
Hình 24: Kin trúc ca RDF Gateway - Tìm kiếm ngữ nghĩa ứng dụng trên lĩnh vực edoc
Hình 24 Kin trúc ca RDF Gateway (Trang 130)
Hình 25: Giao di & n ca RQF Query Analyzer. - Tìm kiếm ngữ nghĩa ứng dụng trên lĩnh vực edoc
Hình 25 Giao di & n ca RQF Query Analyzer (Trang 136)

TỪ KHÓA LIÊN QUAN

TRÍCH ĐOẠN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w