Báo Cáo Bài Tập Lớn Môn Chuyên Đề Công Nghệ Đề Tài Semantic Web.pdf

Thông tin mà ta thu được trực tiếp trên Web có thể trả lời các câu hỏi này nhưng đòi hỏi con người phân tích ý nghĩa của dữ li u và s liên quan c a nó vệ ự ủ ới yêu c u ầ đề ra, không th

Trang 1

TRƯỜNG ĐẠI H C CÔNG NGH Ọ Ệ

ĐẠ I H C QU C GIA HÀ N I Ọ Ố Ộ

-o0o -

BÁO CÁO BÀI T P L N Ậ Ớ

MÔN CHUYÊN ĐỀ CÔNG NGHỆ

Đề tài: Semantic Web

Giảng viên b môn: ộ Th y Lê S ầ ỹ Vĩnh

Các thành viên trong nhóm:

Ngô Đình Ngọc Quang - 19021355 (Nhóm trưở ng)

Mai Công Danh - 19021233

Vũ Mạnh Cường – 19021230

Trang 2

1

Mục l c ụ

I Gi ới thi u ệ

II Semantic Web

1 T ổng quan v Semantic Web ề

2 S ự ra đời c a Semantic Web ủ

3 Semantic Web là gì

4 Semantic Web mang l i nh ng gì? ạ ữ

5 Ki ến trúc của Semantic Web

5.1 L ớp Unicode & URI (Uniform Resource Identifier)

3.2 Yêu cầu chức năng

3.3 Yêu cầu phi chức năng

3.4 Mô hình Use Case

3.5 Mô t Use Case ả

IV Demo mộ ố t s chức năng củ a ph ần mềm

Trang 3

I Gi ới thi u ệ

M t sộ ố chuyên gia Internet tin tưởng r ng th h web k ti p web 3.0 s th c hi n các ằ ế ệ ế ế – ẽ ự ệnhiệm vụ giống như việc bạn tìm kiếm các bộ phim, các món ăn tại các quán gần đó được nhanh hơn và dễ dàng hơn Thay vì phải th c hi n nhi u tìm ki m, b n ch cự ệ ề ế ạ ỉ ần đánh vào đó một ho c hai ặcâu ph c tứ ạp hơn trong trình duyệt web 3.0, còn l i web s th c hiạ ẽ ự ện toàn bộ các công vi c còn l i ệ ạcho b n Cho ví d , b n có th ạ ụ ạ ể đánh “Tôi muốn xem m t b ộ ộ phim hay và sau đó đi ăn tại m t nhà ộhàng ăn ngon Lựa chọn của tôi là gì?” Trình duyệt web 3.0 sẽ phân tích sự đáp trả của bạn, tìm kiếm trên Internet những câu trả l i có thờ ể và sau đó trả ề kết quả cho bạn v

Tuy nhiên đó không phải là tất cả Các chuyên gia còn tin tưởng rằng trình duyệt web 3.0 còn có th th c hi n nh ng công vi c giể ự ệ ữ ệ ống như một người tr lý Khi b n tìm ki m trên web, ợ ạ ếtrình duyệt s biẽ ết được nh ng gì b n quan tâm Càng s d ng web, trình duy t càng bi t nhi u v ữ ạ ử ụ ệ ế ề ềbạn và càng ngày b n c n phạ ầ ải đưa ra các câu hỏi hơn Cuối cùng là b n có thạ ể h i trình duy t m ỏ ệ ởcác câu h i giỏ ống như “Tôi nên đi đâu cho bữa trưa?” Khi đó trình duyệt s c v n cho b n nh ng ẽ ố ấ ạ ữ

gì b n thích và không thích, lạ ấy địa điểm bạn đang ở và sau đó gợi ý một danh sách các nhà hàng Khái niệm “Semantic Web” đã được Tim Berners-Lee định nghĩa như sau “Semantic Web như : một s m r ng c a web hi n tự ở ộ ủ ệ ại mà trong đó thông tin được xử lí một cách tự động b ng máy ằtính, làm cho máy tính và con người có th h p tác v i nhau ể ợ ớ “Vớ ự ới s l n m nh và khạ ả năng lưu trữ thông tin ngữ nghĩa, Semantic Web sẽ tr thành mở ột thế hệ web cho tương lai, thế hệ web mà chúng ta đang chờ đợi Trong báo cáo này nhóm em trình bày về Semantic Web và ứng dụng Bicycle Sharing

II Semantic Web

1 T ổng quan v Semantic Web ề

Web ngữ nghĩa là một th h Web mế ệ ới, đang được phát triển và sẽ xuất hiện trong tương lai g n H th ng Web m i này s thay th h th ng Web hi n t i ầ ệ ố ớ ẽ ế ệ ố ệ ạ song không có nghĩa là mộ ệt h thống hoàn toàn khác hệ thống Web hiện tại Web ngữ nghĩa được phát triển trên hệ thống Web hiện tại bằng cách bổ sung thêm ngữ nghĩa cho các tài nguyên Web mà máy có thể ểu và tăng hikhả năng xử lý tự động

2 S ự ra đờ ủa Semantic Web i c

- World Wide Web (gọi tắt là Web ) đã trở thành một kho tàng thông tin kh ng lổ ồ của nhân loại và là một môi trường chuy n t i thông tin không th thiể ả ể ếu được trong thời đại công nghi p ệ4.0 S ph bi n và khự ổ ế ối lượng kh ng l ổ ồ các tài nguyên thông tin trên Web, điều này làm nảy sinh vấn đề là làm thế nào để tìm ki m chính xác tài nguyên mình mong muế ốn, để khai thác được thông tin trên Web m t cách hi u qu , mà c th là làm th nào để máy tính có th tr ộ ệ ả ụ ể ế ể ợgiúp x lý tử ự động được chúng Mu n vố ậy, trước h t máy tính ph i hiế ả ểu được thông tin trên các tài li u Web, trong khi th h Web hi n t i ệ ế ệ ệ ạ thông tin được bi u diể ễn dướ ại d ng ch con ỉngười mới đọc hiểu được

Trang 4

3

- Những vấn đề này đã thúc đẩy s ự ra đờ ủa ý tưởi c ng Web ng ữ nghĩa (Semantic Web), một thế hệ m i cớ ủa Web, mà chính cha đẻ ủa World Wide Web là Tim Berners- c Lee đề xuất vào năm 1998 Với mục đích là thông tin sẽ do máy xử lý, Semantic Web ẽ làm cho các dịch vụ sthông minh hơn Ví dụ: Môi giới thông tin, tác nhân tìm kiếm, bộ lọc thông tin v.v Những dịch v thông minh trên h th ng web giàu ng ụ ệ ố ữ nghĩa như thế ch c h n s ắ ẳ ẽ vượt trội hơn những phiên b n s n có hi n t i c a các d ch v này ả ẵ ệ ạ ủ ị ụ

3 Semantic Web là gì?

Semantic Web không là Web riêng bi t mà là m t s m r ng c a Web hi n t i, theo cách ệ ộ ự ở ộ ủ ệ ạthông tin được xác định ý nghĩa tốt hơn, nó cho phép máy tính và người cộng tác với nhau tốt hơn

Semantic Web được hình thành từ ý tưởng của Tim Berners-Lee, người phát minh ra WWW (World Wide Web), URI (Uniform Resource Identification), HTTP, và HTML Semantic Web là m t mộ ạng lưới các thông tin được liên k t sao cho chúng có thế ể được x lý ử

dễ dàng b i các máy tính phở ở ạm vi toàn cầu Nó được xem là cách mô tả thông tin rất hiệu quả trên World Wide Web, và cũng được xem là một cơ sở dữ liệu có khả năng liên kết toàn cầu Semantic Web là một phương pháp cho phép định nghĩa và liên kế ữ liệu một cách có t dngữ nghĩa hơn nhằm phục vụ cho máy tính có thể “hiểu” được Semantic Web còn cung cấp một môi trường chia sẻ và xử lý dữ liệu tự động bằng máy tính

- Ví dụ: Gi sử ta cần so sánh giá để chọn mua một bó hoa hay ta c n tra c u catalog c a ả ầ ứ ủcác hãng ch t o xế ạ e khác nhau để tìm ra thi t b thay th cho các b ph n b ế ị ế ộ ậ ị hư hỏng c a ủ

xe Volvo 740 Thông tin mà ta thu được trực tiếp trên Web có thể trả lời các câu hỏi này nhưng đòi hỏi con người phân tích ý nghĩa của dữ li u và s liên quan c a nó vệ ự ủ ới yêu c u ầ

đề ra, không th xử lý tự ng b ng máy tính V i Semantic Web ta có th gi i quy t v n ể độ ằ ớ ể ả ế ấ

đề này b ng 2 cách: ằ

- Thứ nhất: Nó s mô t chi ti t d liẽ ả ế ữ ệu Do đó một chương trình xử lý không c n quan tâm ầđến các định dạng (format), hình ảnh, quảng cáo trên một trang Web tìm ra s liên để ựquan c a thông tin ủ

- Thứ hai: Semantic Web cho phép chúng ta tạo ra một file mô tả mối liên hệ gi a các tữ ập

dữ liệu khác nhau Ví dụ: Ta có th tể ạo m t liên k t semantic gi a cộ ế ữ ột mã quốc gia code’ trong cơ sở dữ liệu (database) với trường ‘zip’ ở trên giao di n (form) nh p li u ệ ậ ệnếu chúng có chung ý nghĩa Điều này cho phép máy tính theo các đường kết nối và tích hợp d liữ ệu t nhiừ ều nguồn khác nhau Ý tưởng liên kết các nguồn khác nhau (tài liệu, hình ảnh, con người, khái niệm,…) cho phép chúng ta m r ng Web thành mở ộ ột môi trường mới v i t p các m i quan h mớ ậ ố ệ ới gi a các ngu n d li u, t o ra các m i liên h ng c nh ữ ồ ữ ệ ạ ố ệ ữ ả(contextual relationship), điều mà Web hiện tại chưa làm được

‘zip-Tim Berners-Lee đã đưa ra hai vấn đề ủ c a web ngữ nghĩa, đó là tạo cho Web m t môi ộtrường c ng tác tộ ốt hơn và vấn đề thứ hai là máy có thể hi u và x lý tự ng các thông tin ể ử độtrên Web Hình 1 bi u di n cái nhìn b n ch t ngu n g c Web c a Tim Berners-Lee Cái nhìn ể ễ ả ấ ồ ố ủ

Trang 5

này rất ph c tứ ạp và ph c tứ ạp hơn nhiều so v i vi c l c ra các trang HTML t các d ch v Web ớ ệ ọ ừ ị ụhiện tại Nhưng trong hình này, có các mối quan hệ giữa các thông tin như: "includes",

"describes", "rote", đây là các mối quan hệ giữa các tài nguyên mà trong web hi n t i không ệ ạ

có Và chính các quan h ệ này đưa vào web ngữ nghĩa là cần thiết, để máy có th hi u và x lý ể ể ửthông tin tự động trên web Các quan hệ này được g i là các siêu d li u Công nghọ ữ ệ ệ để có được các siêu d li u này là công ngh RDF (Resource Description Framework) ữ ệ ệ

H nh 1 M ột đề xu t ngu n g c Web v i CERN ấ ồ ố ớ

Để có thể t o ra web có d li u mà máy có thể x lý được, trước h t ph i ạ ữ ệ ử ế ả thay đối mô hình trong cách chúng ta nghĩ về d li u T ữ ệ ừ trước đến nay, d li u b khoá ngay trong các ữ ệ ị ứng d ng ụ

độc quy n D liề ữ ệu được coi như thứ yếu để xử lý dữ liệu Thái độ không đúng này bộc lộ những sai sót cơ bản trong luận cứ gốc bằng việc thiết lập sự phụ thuộc giữa xử lý và d li u ữ ệHay nói cách khác, ph n m m t t thì hoàn toàn ph thu c vào d li u t t V i các h tính toán ầ ề ố ụ ộ ữ ệ ố ớ ệchuyên nghi p thì ngay khi bệ ắt đầu th c hi n, vự ệ ấn đề ữ ệ d li u là r t quan tr ng, nó phấ ọ ải được xác minh và b o v V i Web, XML và xu th Web ngả ệ ớ ế ữ nghĩa đang nổi lên thì có sự thay đổi

Trang 6

5

của s c mứ ạnh đang di chuyể ừ các ứng dụng sang dữ liệu Vấn đề này cũng cho chúng ta n tmấu chốt để ể hi u Web ng ữ nghĩa Con đường để máy có th x lý d li u ch y u là t o ra d ể ử ữ ệ ủ ế ạ ữliệu thông minh hơn chứ không phải là các xử lý thông minh Hình 2 biểu diễn sự phát triển tính thông minh c a d li u theo th i gian ủ ữ ệ ờ

H nh 2 Sơ đồ phát tri n trí thông minh c a d li u ể ủ ữ ệHình 2 ch ra s phát tri n liên t c c a tính thông minh d li u có b n b c quan tr ng B n b c ỉ ự ể ụ ủ ữ ệ ố ậ ọ ố ậnày bi u di n t d li u có tính thông minh th p nhể ễ ừ ữ ệ ấ ất đến d liữ ệu đã có thông tin đủ ng ữ nghĩa đểmáy th c hi n suy lu n v nó ự ệ ậ ề

Văn bản và cơ sở dữ liệu (bậc này là ti n XML)ề

Bậc đầu tiên, h u h t d li u bầ ế ữ ệ ở ậc này đượ ở ữu độc s h c quy n cho m t ng d ng Do ề ộ ứ ụvậy tính thông minh là nằm trong ứng dụng đó chứ không phải là trong dữ liệu

Tài li u XML v i mi n ệ ớ ề đơn

Ở b c này, d liậ ữ ệu đạt được là: ng dứ ụng độ ậc l p v i mi n riêng Bây gi , d liớ ề ờ ữ ệu đủthông minh để có thể di chuyển giữa các ứng dụng trong một miền đơn Ví dụ: các chuẩn XML trong công nghiệp chăm sóc sức kho , công nghi p b o hi m, ho c công nghi p bẻ ệ ả ể ặ ệ ất động s n ảCác phân lo i và tài li u v i các b t v ng h n hạ ệ ớ ộ ừ ự ỗ ợp

Trong b c này, d li u có th ậ ữ ệ ể được so n t ạ ừ đa miền và được phân l p chính xác theo m t ớ ộnguyên t c phân lo i có th b c Th c t , s phân lắ ạ ứ ậ ự ế ự ớp đó có thể đượ ử ụng đểc s d khám phá d ữliệu Các quan hệ đơn giản giữ các l p có thớ ể được s dử ụng để quan h và do vệ ậy, ta có d li u ữ ệ

Trang 7

kết hợp Như vậy, dữ li u bây gi ệ ờ thông minh đủ để khám phá d ễ dàng và được k t h p m t cách ế ợ ộhợp lý v i dớ ữ liệu khác

Các ontology và các lu t l p lu n ậ ậ ậ

Trong m c này, d li u m i có th ứ ữ ệ ớ ể được suy ra t nh ng d liừ ữ ữ ệu đã có theo các luật logic Thực chất, dữ liệu bây gi ờ thông minh đủ để được mô tả v i các quan hớ ệ c thụ ể và các dạng hình thức phức tạp Điều này cho phép kết h p ho c tái kợ ặ ết h p dợ ữ liệu nguyên thuỷ nhiều hơn và sựphân tích v d li u mề ữ ệ ịn hơn Một ví d v s ph c t p c a d li u là vi c chuy n t ng tài ụ ề ự ứ ạ ủ ữ ệ ệ ể ự độliệu trong một miền này sang một tài liệu tương đương trong một miền khác mỞ ức này, ta có thể soạn một định nghĩa mới trên Web ngữ nghĩa, máy có thể xử lý các tài liệu web có dữ liệu thông minh Hơn nữa, ta có thể định nghĩa dữ liệu thông minh vì dữ liệu nó độc lập với ứng dụng, có thể soạn, phân l p và l y m t ph n c a các h thông tin l n ớ ấ ộ ầ ủ ệ ớ hơn

Như vậy, việc xây dựng web ngữ nghĩa chủ yếu tập trung xây dựng hệ thống web có dữ liệu thông minh Dữ liệu thông minh ở đây không có nghĩa là gắn liền v i trí tuớ ệ nhân tạo, không phải là cho máy học hiểu các từ ngữ của con người hay máy xử lý được ngôn ngữ tự nhiên mà nó thông minh b i vi c t ch c l a ch n dở ệ ổ ứ ự ọ ữliệu bi u di n trong ngôn ng ể ễ ữ được cấu trúc để máy có thể hiểu Và sau đây chúng ta tìm hiểu về kiến trúc của web ngữ nghĩa

4 Semantic Web mang l i nh ng gì? ạ ữ

a Máy có thể hiểu được thông tin trên Web

Internet ngày nay d a hoàn toàn vào n i dung Web hi n hành chự ộ ệ ỉ cho con người đọc ch ứkhông dành cho máy hi u Semantic Web s cung cể ẽ ấp ý nghĩa cho máy hiểu

Ví d : ụ

‘The Beatles là m t ban nh c n i ti ng c a thành ph Liverpool ộ ạ ổ ế ủ ố ’

‘John Lennon là m t thành viên c a The Beatles.’ ộ ủ

‘ ảB n nhạc “Hey Dude” do nhóm The Beatles trình bày.’

Những câu như thế này có thể hiểu bởi con người nhưng làm sao chúng có thể được hiểu bởi máy tính? Semantic Web là tất cả nh ng gì vữ ề cách tạo một Web mà cả người và máy có thể hiểu Người dùng tin s v n có thông tin trình bàẽ ẫ y theo cách trước đây, nhưng đối v i máy ớtính, Semantic Web s làm cho máy hiẽ ểu được nghĩa và tìm ra thông tin chính xác hơn Web hiện hành Bây giờ, máy không phải suy luận d a vào ng pháp và các ngôn ngự ữ ữ đánh dấu (Markup Language) n a vì c u trúc ng ngh a cữ ấ ữ ĩ ủa văn bản (text) th c sự ự đã chứa nó r i ồ

b Thông tin được tìm kiếm nhanh chóng và chính xác hơn

Với Semantic Web, việc tìm kiếm sẽ dễ dàng n u mế ọi thứ được đặt trong ngữ cảnh Ý tưởng chính yếu là toàn b ng cộ ữ ảnh mà người sử dụng được biết đến M c tiêu c a Semantic ụ ủWeb là phát tri n các tiêu chuể ẩn và kĩ thuật để giúp máy hi u nhiể ều thông tin trên Web, để

Trang 8

7

máy tìm ra các thông tin dồi dào hơn, tích hợp, duy t d li u, và tệ ữ ệ ự động hóa các thao tác Với Semantic Web, chúng ta không những nhận được những thông tin chính xác hơn khi tìm kiếm thông tin từ máy tính, mà máy tính còn có thể tích h p thông tin t nhiợ ừ ều nguồn khác nhau, bi t so sánh các thông tin v i nhau ế ớ

c Dữ liệu liên kết động

Với Semantic Web, chúng ta có th k t hể ế ợp các thông tin đã được mô t và giàu ng ả ữ nghĩa với bất kì nguồn dữ liệu nào Ví d : Bụ ằng cách thêm các metadata (siêu dữ li u) cho các tài ệliệu khi tạo ra nó, chúng ta có thể tìm kiếm các tài liệu mà metadata cho biết tác giả là Eric Miller Cũng thế, với metadata chúng ta có thể tìm kiếm chỉ những tài liệu thuộc loại tài liệu nghiên c u ứ

Với Semantic Web, chúng ta không ch cung c p các URI cho tài liỉ ấ ệu như đã làm trong quá khứ mà còn cho con người, các khái niệm, các mối liên hệ Như trong ví dụ trên, bằng cách cung cấp những định danh duy nh t cho mấ ỗi con người như vai trò của ‘tác giả’ và khái ni m ệ

‘tài li u nghiên cệ ứu’, chúng ta đã làm rõ người ở đây là ai và mối quan h tương ứng c a ệ ủngười này v i m t tài liớ ộ ệu nào đó Ngoài ra, bằng cách làm rõ người mà chúng ta đang đề c p, ậchúng ta có th phân bi t nh ng tài li u c a ể ệ ữ ệ ủ Eric Miller ớ v i nh ng tài li u c a nhữ ệ ủ ững người khác Chúng ta cũng có thể kết hợp những thông tin đã được mô tả ở nhiều site khác nhau đểbiết thêm thông tin về người này nhở ững ngữ cảnh khác nhau Ví dụ như vai trò của anh ta

ra sao khi anh ta là tác gi , nhà qu n lý, nhà phát tri n ả ả ể

5 Ki ến trúc của Semantic Web

Semantic Web là m t t p hộ ậ ợp/một ch ng (stack) các ngôn ng T t c các l p c a Semantic Web ồ ữ ấ ả ớ ủđượ ửc s dụng đểđảm bảo độ an toàn và giá trị thông tin trở nên t t nh t ố ấ

Trang 9

H nh 3 Ki n trúc Semantic Web ế

Lớp Unicode & URI: Bảo đảm việc sử dụng tập kí tự quốc tế và cung cấp phương tiện

nhằm định danh các đối tượng trong Semantic Web URI đơn giản chỉ là một định danh Web giống như các chuỗi bắt đầu bằng “http” hay “ftp” mà bạn thường xuyên thấy trên mạng (ví dụ:http://www.cadkas.com) Bất kỳ ai cũng có thể tạo một URI, và có quyền sở hữu chúng Vì vậy chúng đã hình thành nên một công nghệ nền tảng lý tưởng để xây dựng một hệ thống mạng toàn cầu thông qua đó

Lớp XML cùng với các định nghĩa về namespace(vùng tên gọi) vàschema (lược đồ) bảo đảm rằng chúng ta có thể tích hợp các định nghĩa Semantic Web với các chuẩn dựa trên XML khác

Lớp RDF [RDF] và RDFSchema [RDFS]: ta có thể tạo các câu lệnh (statement) để mô

tả các đối tượng với những từ vựng và định nghĩa của URI, và các đối tượng này có thể được tham chiếu đến bởi những từ vựng và định nghĩa của URI ở trên Đây cũng là lớp

mà chúng ta có thể gán các kiểu (type) cho các tài nguyên và liên kết Và cũng là lớp quan trọng nhất trong kiến trúc Semantic Web

Lớp Ontology: hỗ trợ sự tiến hóa của từ vựng vì nó có thể định nghĩa mối liên hệ giữa

các khái niệm khác nhau Một Ontology (bản thể luận trong logic) định nghĩa một bộ từ vựng mang tính phổ biến & thông thường, nó cho phép các nhà nghiên cứu chia sẻ thông tin trong một hay nhiều lĩnh vực

Lớp Digital Signature được dùng để xác định chủ thể của tài liệu (ví dụ: tác giả hay : nhan đề của một loại tài liệu)

Các lớp Logic, Proof, Trust: Lớp logic cho phép viết ra các luật (rule) trong khi lớp proof (thử nghiệm) thi hành các luật và cùng với lớp trust (chấp nhận) đánh giá nhằm quyết định nên hay không nên chấp nhận những vấn đề đã thử nghiệm

5.1 L ớp Unicode & URI (Uniform Resource Identifier)

Trang 10

9

Unicode: ch ỉđơn thuần là m t b ng mã chuộ ả ẩn chung có đủ các ký t ự để th ng nh t s giao ố ấ ựtiếp trên tất cả các quốc gia, đáp ứng tính nhất quán toàn cầu c a web ủ

Một URI (Uniform Resource Identifier) là m t kí hi u nh n dộ ệ ậ ạng Web đơn gi n C th , ả ụ ể

nó là m t xâu ngộ ắn cho phép nh n dậ ạng tài nguyên Web như: với các xâu bắt đầu v i "http:" ớhoặc "ftp:" mà chúng ta thường thấy trên World Wide Web Bất kỳ một người nào cũng có thể tạo một URI, và s hở ữu chúng và chúng là một công nghệ cơ sở để xây d ng m t h ự ộ ệthống Web toàn cầu Hệ thống World Wide Web được xây d ng trên chúng và b t kự ấ ỳ cái

gì mà có một URI thì được coi là "trên Web"

URL (Uniform Resource Locator) là m t dộ ạng đặc bi t c a URI, c th nó là mệ ủ ụ ể ột địa ch ỉtrên m ng URIref (URI reference) là m t URI cùng v i m t ph n nh n d ng tu ý cu i ạ ộ ớ ộ ầ ậ ạ ỳ ở ố

Ví d , ta có m t URIref : "http://www.example.org/Books#Ontology" bao g m m t URI: ụ ộ ồ ộhttp://www.example.org/Books" và m t ph n nh n d ng ộ ầ ậ ạ "Ontology" được cách nhau bởi

đố ợitư ng] Trong đó, chủ đề là tài nguyên mà được mô tả bằng thu c tính và đối tượng ộThuộc tính thể ệ hi n m i quan h gi a ủ đề và đối tượ Còn đối tượ ở đây có thể là ố ệ ữ ch ng ngmột tài nguyên ho c m t giá trặ ộ ị Ba thành phần trên trong RDF đều là các URI

H nh 4 B ba RDF ộ

Trang 11

5.2 RDFS (RDF Schema)

RDFS là m t ngôn ngộ ữ ontology đơn giản c a web ngủ ữ nghĩa, được coi là m t ngôn ng ộ ữ

cơ sở của web ngữ nghĩa RDFS là ngôn ngữ mô tả bộ từ vựng trên các bộ ba RDF Nó cung c p các công vi c sau: ấ ệ

- Định nghĩa các lớp tài nguyên

5.5 T ầng Proof

Tầng này đưa ra các luật để suy luận Cụ thể từ các thông tin đã có ta có thể suy ra các thông tin m i Ví d : A là cha cớ ụ ủa B, A là em trai C thì khi đó ta có thông tin mới là C là bác của B Để có được các suy luận này thì cơ sở là FOL (First-Order-Logic) Và tầng này hi n nay các nhà nghiên cệ ứu đang xây dựng các ngôn ng lu t ữ ậcho nó như: SWRL, RuleML

5.6 T ầng Trust

bảo x là xanh, một người khác lại nói x không xanh, như thế Web ng ữ nghĩa là không đáng tin c y? Câu tr l i ậ ả ờ ở đây được xem xét trong các ng c nh M i ữ ả ỗ ứng d ng trên ụ

Trang 12

11

web ng ữ nghĩa sẽ có một ngữ c nh c th , chính vì th các mả ụ ể ế ệnh đề trên có thể n m ằ

đềđó vẫn đúng, đáng tin cậy trong ngữ cảnh của nó Để có được sự chứng minh về

độ tin cậy thì các lập luận được áp dụng là không đơn điệ và có các cơ chế ểm u kitra ch ng minh k t h p v i công ngh chứ ế ợ ớ ệ ữ ký điệ ử đển t xác nhận độ tin c y Các ậngôn ng ch ng minh là ngôn ng cho ta ch ng minh m t mữ ứ ữ ứ ộ ệnh đề là đúng hay sai

6 Ứng dụng của Semantic Web

a) Xây dựng các bộ máy tìm tin

Vấn đề hiện nay là đa số các bộ máy tìm tin đều thực hiện cho phép người sử dụng có thể tạo các câu truy vấn gồm các từ khóa tìm kiếm để nhận về kết quả mong muốn Tuy nhiên, phương pháp này gặp hai vấn đề chính sau đây:

Mỗi từ khóa có thể có một hay nhiều ý nghĩa tùy theo từng ngữ cảnh và bộ máy tìm kiếm không thể hiện mối quan hệ giữa các từ khóa với nhau

Có thể các thông tin cùng ý nghĩa với thuật ngữ trong biểu thức tìm của người sử dụng

sẽ không tồn tại trong kết quả tìm

Ví dụ: ta cần tìm thông tin về người trưởng bộ môn công nghệ thông tin của MIT, ta gõ: “MIT information technology chair” vào Google, nhưng kết quả thu được là không chính xác Nguyên nhân của việc tìm kiếm thất bại là do: Từ khoá “MIT” có nhiều ý nghĩa Ngoài ra, máy tìm không thể hiểu mối liên hệ giữa các từ khoá: MIT, information technology và chair Nếu bộ máy tìm kiếm được tích hợp tri thức để hiểu được ý nghĩa của các từ, thì rất có thể nó cho ta kết quả chính xác hơn, lúc đó việc tìm kiếm sẽ dựa trên khái niệm (concept) chứ không phải theo từ khóa (keyword)

b) Ứng dụng công nghệ ngữ nghĩa trong thư viện số

Thư viện số phải thường xuyên xử lý một lượng lớn thông tin từ các dạng tài liệu số Phần lớn chúng được rút ra từ thư viện truyền thống, được tập trung biên tập lại thành nguồn thông tin sẵn dùng cho một nhóm người liên quan bằng cách quét bài báo, sách, tài liệu… Bằng cách này đã làm hạn chế lợi thế của các hệ thống máy tính hiện đại và gây khó khăn cho quá trình xử lý sau này Áp dụng công nghệ semantic web ****chúng ta có thể nghiên cứu và phát triển hệ thống thư viện số có thể thực hiện xử lý, lưu trữ, tìm kiếm và phân tích tất cả các kiểu thông tin số Công nghệ ngữ nghĩa cho phép miêu tả đối tượng, thiết lập các lược đồ cần thiết trong các dạng của ontologies cho các định danh của các đối tượng số Mục tiêu chính là làm cho thao tác

Trang 13

giữa các phần có thể xử lý thông minh, nhất quán, mạch lạc tương tự các lớp của đối tượng số và các dịch vụ.

Ứng dụng ontologies trong việc mô tả hệ thống thư mục: Thông thường một thư viện

số sử dụng dữ liệu mô tả có cấu trúc để mô tả hệ thống thư mục tuy nhiên các trường trong dữ liệu mô tả lại không được định nghĩa ngữ nghĩa một cách đầy đủ, việc ứng dụng ontologies trong thư viện số không những thực hiện lưu trữ dữ liệu mô tả để mô

tả hệ thống thư mục mà còn mô tả được nội dung của nó Thay vì trong trường hợp một quyển sách được lưu trữ trong thư viện số chúng ta có thể tách riêng cấu trúc từng chương của nó, cung cấp mô tả cho mỗi chương và thực hiện lưu trữ mối quan hệ của các chương khác nhau Bằng việc sử dụng tư tưởng cấu trúc của ontologies và sử dụng

tư tưởng này trong việc mô tả dữ liệu, chúng ta cung cấp một tầng tổng quát dữ liệu

mô tả và nội dung

Một trong những ứng dụng quan trọng nữa chúng ta có thể thấy hệ thống dữ liệu của thư viện số rất lớn và đa dạng nó thường phục vụ cho nhiều tổ chức, cá nhân vào nhiều mục đích khác nhau, trong khi đó dữ liệu chủ yếu thuộc vào hai dạng là dữ liệu có cấu trúc (trong database) và dữ liệu phi cấu trúc (các nguồn lấy từ web) Một vấn đề dăt ra

là làm thế nào để các ứng dụng sử dụng được đồng thời cả hai loại dữ liệu này, bởi vì trên thưc tế mỗi ứng dụng chỉ sử dụng một loại dữ liệu có cấu trúc hoặc phi cấu trúc Chúng ta có chuẩn chung phục vụ cho hầu hết các loại ứng dụng đó là sử dụng XML (Extensible Markup Laguage), nó được xem là nền tảng công nghệ của semantic web

Nó sẽ là cầu nối thực hiện chuẩn hoá các nguồn dữ liệu, từ đó có thể phục vụ cho mọi loại ứng dụng

c) Khung làm việc để quản lý tri thức

Semantic Web là một hệ nền nhiều hứa hẹn cho việc phát triển các hệ thống quản lý tri thức Tuy nhiên, vấn đề ở đây là làm thế nào biểu diễn tri thức ở dạng thức máy có thể hiểu được, để tri thức cần thiết có thể được tìm thấy bởi các máy tìm (search engine) Chúng ta sử dụng giải pháp quản lý tri thức dựa trên định dạng tương thích RDF để biểu diễn các luật và dựa trên một kỹ thuật mới để chú giải các nguồn tri thức bằng cách

sử dụng các câu điều kiện Giải pháp là dựa trên các công cụ Semantic Web đang tồn tại Điểm thuận lợi chính là sự thúc đẩy khả năng tìm kiếm tri thức với độ chính xác cao, cũng như khả năng truy cập cấu tạo các nguồn tri thức cần thiết cho việc giải quyết một vấn đề nào đó Dạng thức này có thể được biểu diễn bằng cách dùng các câu lệnh If–Then (statement If-Then), được thiết lập theo cách suy diễn (inference) và ủy quyền (trust) trên Semantic Web Các statement (câu lệnh) điều kiện có thể được dùng để lập chỉ mục nội dung các tài nguyên Web một cách nhiều ý nghĩa hơn so với liên kết các từ khóa, khái niệm hay metadata (siêu dữ liệu) Điều này có thể sẽ hình thành các truy vấn dựa trên ngữ cảnh hơn, tăng cường độ chính xác trong tìm kiếm tri thức Ví dụ: Trong vấn đề định chỉ mục tài liệu, dù có hay không có tài liệu được định chỉ mục bằng từ khóa aspirin (thuốc aspirin) và headache (bệnh đau đầu), cách aspirin trị headache hay aspirin gây ra

Tiêu đề	Semantic Web
Tác giả	Ngô Đình Ngọc Quang, Mai Công Danh, Vũ Mạnh Cường
Người hướng dẫn	Thầy Lê Sỹ Vĩnh
Trường học	Trường Đại Học Công Nghệ Đại Học Quốc Gia Hà Nội
Chuyên ngành	Công Nghệ
Thể loại	báo cáo

Định dạng
Số trang	26
Dung lượng	5,49 MB