Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 29 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
29
Dung lượng
763,03 KB
Nội dung
Chương Giới Thiệu 1.1 Web có Ngữ Nghĩa Tháng 12/1991, hội nghị Hypertext ‟91 San Antonio, lần Tim Berners-Lee đưa khái niệm World Wide Web Phát minh xem cột mốc làm thay đổi cách giao tiếp c a ngư i với liệu Internet, kéo theo đ i c a trình duyệt Web Mosaic (1993) hay Netcape (1995) Thay cho thao tác ph c tạp dịng lệnh, ngư i truy cập hình ảnh đồ họa, di chuyển trang Web cú click chuột World Wide Web bùng nổ sau Từ số lượng khiêm tốn ban đầu, hàng triệu trang Web đ i làm cho Internet tr thành kho liệu khổng lồ hỗn độn Hệ lụy kéo theo việc tìm kiếm thơng tin Web tr nên khó khăn Con ngư i thư ng xuyên phải đối đầu với lượng lớn thông tin không hợp lý không liên quan trả từ kết tìm kiếm Nguyên nhân lý giải cho thực tế xuất phát từ đơn giản c a Web tại, cản tr phát triển thơng tin c a Trong mơ hình này, máy tính làm nhiệm vụ g i nhận liệu thể thông tin dạng thô mà ngư i đọc hiểu Kết tất yếu ngư i phải làm nhiệm vụ suy luận, tổng hợp rút trích thơng tin cần Điều đặc thách th c để khai thác thông tin Web cách hiệu quả, mà cụ thể làm để máy tính trợ giúp xử lý tự động chúng Muốn vậy, Web phải có khả mơ tả vật theo cách mà máy tính “hiểu” Động từ “hiểu” có ý nghĩa hạn chế Trong điều kiện tại, dùng để khả máy tính phân tích cấu trúc liệu, xác định xem liệu thuộc loại từ có hành động thích hợp [1] Lấy ví dụ, có u cầu tìm kiếm với từ khóa “Bill Clinton”, máy tính mà cụ thể ng dụng chạy máy tính cần thể kết cho biết Clinton cựu tổng tổng thống Mỹ, ch tổng thống Mỹ hay ngư i có tên Bill Clinton khác Thách th c thúc đẩy đ i c a ý tư ng “Web có ngữ nghĩa”, hệ c a Web mà lộ trình c a Tim Berners-Lee phát thảo từ năm 1998 Theo Lee, “Web có ngữ nghĩa mở rộng Web mà thơng tin định nghĩa rõ ràng cho người máy tính làm việc với cách hiệu hơn” [2] Theo đó, mục tiêu c a Web ngữ nghĩa phát triển chuẩn chung công nghệ, cải tiến Web cách thêm vào lớp ngữ nghĩa để máy tính hiểu thông tin Web nhiều hơn, tăng cư ng khả rút trích thơng tin cách tự động, tích hợp liệu Có thể hình dung số lợi ích c a Web ngữ nghĩa so với Web qua số điểm sau: Máy tính hiểu thơng tin Web: Web ngữ nghĩa định nghĩa khái niệm bổ sung quan hệ dạng máy tính hiểu Do đó, việc tìm kiếm, đánh giá, xử lý, tích hợp thơng tin tiến hành cách tự động GIOI THIEU SEMANTIC WEB & ONTOLOGY | Do An 1 Thơng tin tìm kiếm nhanh chóng xác hơn: với Web ngữ nghĩa, máy tính xác định thực thể thuộc lớp hay thuộc tính cụ thể dựa ngữ cảnh ch a Do thu hẹp khơng gian tìm kiếm cho kết nhanh, xác Khả suy luận thông minh: dựa vào luật suy diễn s tri th c thực thể, máy tính có khả sinh kết luận ng dụng Web tương lai trả l i câu hỏi kiểu như: “Tổng thống thứ 42 Hoa Kỳ bình thường hóa quan hệ với nước vào năm 1995?” Dữ liệu liên kết động: thay cách liên kết sử dụng hyperlink tĩnh Web cũ, Web ngữ nghĩa liên kết liệu từ nhiều nguồn khác cách hiệu dựa định danh c a tài nguyên (URI) quan hệ chúng Cách liên kết đơi cịn gọi liên kết siêu liệu (meta data) 1.2 Kiến Trúc Web Ngữ Nghĩa Để có khả trên, Web ngữ nghĩa cần hạ tầng chặt chẽ với nhiều lớp hỗ trợ bên Mỗi lớp có vai trị định: lớp Unicode URI nhằm đảm bảo việc sử dụng tập ký hiệu quốc tế xác định tài nguyên mạng Kế đến lớp XML (Extensible Markup Language), cung cấp cú pháp chung không ràng buộc ngữ nghĩa cho tài liệu có cấu trúc, làm s cho trao đổi liệu Web Bên trên, lớp XML SCHEMA định nghĩa cấu trúc tài liệu XML, cho phép m rộng XML kiểu liệu Tiếp theo XML Schema lớp Hình 1.1 Kiến trúc Web ngữ nghĩa RDF (Resource Description Framework), cung (nguồn: www.w3.org) cấp cấu trúc mô tả đối tượng hay tài nguyên mạng quan hệ chúng RDF cho phép gán kiểu cho tài nguyên làm tảng cho Ontology nói phần RDF Ontology hai thành phần quan trọng kiến trúc Web ngữ nghĩa Kế đến, lớp RDF SCHEMA cung cấp phương tiện để đặc tả từ vựng mơ tả tính chất quan hệ tài nguyên RDF Lớp mô hình phân cấp ONTOLOGY định nghĩa từ vựng dùng để mơ tả thuộc tính, lớp miền ngữ vựng định Cuối cùng, Lớp LOGIC cung cấp luật suy diễn, PROOF sử dụng luật c a lớp Logic để kiểm tra tính đắn c a suy diễn Hai lớp kiến trúc thể rõ góc độ ngữ nghĩa cung cấp cho mơ hình khả suy luận thơng minh Lớp TRUST giai đoạn phát triển, nhằm mục đích đánh giá m c độ tin cậy định có nên tin tư ng cớ từ kết suy luận hay khơng Thơng thư ng Trust hàm lượng giá áp dụng tập thông tin, thông tin có giá trị lượng giá cao chọn cho mục đích đó, ví dụ để thể kết tìm kiếm chẳng hạn GIOI THIEU SEMANTIC WEB & ONTOLOGY | Do An 1.3 Thực Thể có Tên Theo Thomas B Passin, tác giả sách “Explorer‟s guide to the Semantic Web”, Web ngữ nghĩa phạm trù khơng dễ nắm bắt liên quan đến nhiều vấn đề ph c tạp logic, ngữ nghĩa, trí tuệ nhân tạo Nhưng đơn giản xuất phát từ khái niệm thực thể có tên Thực thể có tên ngư i, tổ ch c, nơi chốn đối tượng khác tham khảo đến tên [3] Thực thể có tên khác mặt chất lẫn ngữ nghĩa với từ chỗ dùng để cá thể riêng biệt từ dùng để khái niệm, quan hệ, thuộc tính nói chung Lấy ví dụ câu: “Washington tổng thống nước Mỹ” Washington thực thể có tên “tổng thống”, “nước” từ vựng Trong tài liệu, thực thể có tên tạo nên phần quan trọng ý nghĩa c a tài liệu Do đó, nhúng ngữ nghĩa vào Web ngồi việc phân tích cú pháp câu, ngữ nghĩa cho từ vựng địi hỏi phải có bước xác định ngữ nghĩa cho thực thể có tên Từ “ngữ nghĩa” có ý nghĩa hạn chế, ám việc thực thể thuộc lớp hay thuộc tính cụ thể định nghĩa từ trước Đây việc ph c tạp b i ngữ nghĩa cho thực thể có tên địi hỏi tri th c giới thực Nếu thực thể khơng có s tri th c khơng thể có kết luận khác thực thể xem khơng có ngữ nghĩa Bên cạnh vấn đề có liên quan đến s tri th c nói trên, thực tế thực thể có nhiều tên khác thực thể khác lại có tên Điều gây nhập nhằng việc suy luận thực thể xác thuộc lớp hay thuộc tính Và đó, làm ảnh hư ng lớn đến kết suy luận Trong tình này, Web ngữ nghĩa phải có khả phân tích ngữ cảnh ch a thực thể cách tự động, cần thiết có thêm vài dẫn trực tiếp từ ngư i để thu giảm khơng gian tìm kiếm tăng m c độ tin cậy kết suy luận Tr lại ví dụ trên, tên “Washington” dùng để tổng thống th c a Hoa Kỳ, dùng để th c a nước ngư i có tên khác Cách thông thư ng ng dụng hỏi ngư i dùng muốn thể kết trư ng hợp Đơi khi, sử dụng hàm lượng giá để dự đoán thực thể có khả rơi vào trư ng hợp mà ngư i dùng yêu cầu 1.4 Tài Nguyên Web Thuật ngữ “tài nguyên” hay “resource” Web phạm trù rộng lớn dùng để đối tượng tìm thấy Web khái niệm, từ vựng, thực thể, tính chất quan hệ đối tượng Tài nguyên Web liệu c a trang Web đó, mục tiêu nghiên c u c a Web ngữ nghĩa Tài nguyên Web khái niệm rộng thực thể có tên Và thực thể có tên, tài nguyên đặc tên khác có nhiều tài nguyên chất khác lại có tên Điều nảy sinh yêu cầu định danh tài nguyên định danh Các tài nguyên khác có định danh khác Định danh gọi URI (Uniform Resource Identifier) Một ví dụ URI: www.somesite.com/rdf-syntax-ns#Statement Trong đó, Statement tài nguyên thuộc lớp rdf-syntax-ns tìm thấy trang Web www.somesite.com Ký tự „#‟ gọi identifier fragment (mẩu định danh) GIOI THIEU SEMANTIC WEB & ONTOLOGY | Do An Chương RDF – Cấu Trúc Biểu Diễn Tri Thức 2.1 RDF(Resource Description Framework) 2.1.1 Giới thiệu RDF RDF (Resource Description Framework) hay khung mô tả tài nguyên, tảng cho việc biểu diễn liệu lĩnh vực Web có ngữ nghĩa Thơng tin biễu diễn theo mơ hình RDF phát biểu (statement) dạng cấu trúc ba (triple) gồm ba thành phần là: (subject,predicate,object) Trong đó: Subject đối tượng mơ tả đóng vai trò ch thể Predicate (còn gọi property) kiểu thuộc tính hay quan hệ Object giá trị thuộc tính hay đối tượng c a ch thể nêu Object giá trị nguyên th y (literal) số nguyên, chuỗi, tài nguyên Ví dụ sau minh họa cho triple : subject object (person-1 , name , An ) Hình 2.1 - Object tài nguyên giá trị nguyên thủy, subject predicate bắt buộc phải tài nguyên predicate Đây phát biểu mơ tả ch thể person-1 có kiểu thuộc tính name với giá trị An.Phát biểu tạm hiểu là: person-1 có tên An 2.1.2 RDF hệ liệu truyền thống Trong hệ s liệu truyền thống, thông tin lưu trữ dạng bảng Trong đó, hàng (tuple) khơng có giới hạn số lượng thành phần Ví dụ : Person ID Name Phone Email City District Person-1 An 0909 213 456 an@gmail.com HCM TB Person-2 Bình 0979 831 054 binh@gmail.com HCM PN Tuple: (Person-2, “An”, “0979213456”, an@gmail.com, “HCM”, “TB”) Ngược lại, lưu trữ liệu dạng RDF lại đòi hỏi bảng phải chia nhỏ để lưu trữ theo cấu trúc ba Ví dụ: GIOI THIEU SEMANTIC WEB & ONTOLOGY | Do An Person ID Name Person-1 An Person-2 Bình Triple : (Person-1,Name,“An”) Person ID Person-1 Person-2 Phone 0909 213 456 0979 831 054 Triple : (Person-1,Phone,“0909213456”) Có thể liệt kê số ưu điểm c a việc lưu trữ liệu RDF so với liệu truyền thống là: Tổ ch c liệu đơn giản, đồng nên thông tin dễ dàng thêm bớt chỉnh sửa Cấu trúc ba giúp cho thông tin dễ truy xuất b i hệ thống suy luận, tìm kiếm ngữ nghĩa Cũng nh mà xử lí RDF suy luận thơng tin khơng có hệ liệu Chia sẻ liệu mạng dễ dàng nh đồng nhất, 2.2 Trực Quan Hóa RDF Đồ thị cách sinh động đễ biểu diễn thông tin RDF Dùng đồ thị cảm thấy thông tin thể rõ ràng dễ hình dung Một đồ thị biểu diễn RDF bao gồm nút (đỉnh) cung Mỗi nút tài nguyên (resource) giá trị nguyên th y (literal), cung tượng trưng cho predicate Ta ánh xạ ba ví dụ sang lược đồ sau : Phone 0909213456 Person-1 Hình 2.1 - Person-1 có điện thoại 0909213456 Triple: (Person-1,Phone,“0909213456”) Khi biễu diễn đồ thị, ta thư ng dùng hình tròn eclipse để biểu diễn tài nguyên, hình chữ nhật biểu diễn cho giá trị nguyên th y ví dụ trên, giá trị nguyên th y chuỗi kí tự “0909213456” Bây gi giả sử thuộc tính Phone c a ví dụ có giá trị tài nguyên có URI www.somesite.com/rdf-Phone-ns#phone_1 chẳng hạn URI gán cho tên Phone_1 Ta biểu diễn lại đồ thị sau Phone Person-1 Phone_1 Hình 2.2 - Biểu diễn RDF bẳng đồ thị 2.2.1 Chủ thể với nhiều thuộc tính Nếu một ch thể mô tả b i nhiều phát biểu với thuộc tính khác Chẳng hạn ch thể Person-1 có thuộc tính Name, Phone, Mail, City, District… ta biểu diễn sau : GIOI THIEU SEMANTIC WEB & ONTOLOGY | Do An 0909213456 Phone Name Person-1 Email District Hình 2.3 - Minh họa cho chủ thể có nhiều thuộc tính An an@gmail.com City HCM TB ví dụ trên, ta khơng thấy City District có mối quan hệ với Nhưng thực tế ngược lại, ngư i sống nơi thành phố tương ng phải quận Để khắc phục điều này, ta thêm vào đồ thị nút có hai thuộc tính City, District Phone Name Person-1 Email 0909213456 An an@gmail.com Adrress City District HCM Hình 2.4 - Minh họa b-node, nút tượng trưng cho địa person-1 TB Person-1 có Adrress tài ngun khơng định danh(nút trống), tài nguyên lại ch thể c a hai phát biểu khác Bây gi ta thêm thuộc tính cho nút trống để xác định kiểu cho tài ngun (xem hình 2.5) HCM Person-1 Hình 2.5 - Gán kiểu address cho b-node type TB adrress 2.2.2 Một số nút đặc biệt Có nhiều trư ng hợp muốn nói tài nguyên mà thân tập hợp gồm nhiều tài ngun khác Mơ hình RDF có định nghĩa ba kiểu tài nguyên đặc biệt để hỗ trợ trư ng hợp : Bag: ch a đựng tập tài nguyên không cần th tự Sequence : ch a đựng tập tài nguyên có th tự Alternative : ch a đựng lựa chọn cho tài ngun Xét ví dụ, hiệu sách có bán loại sách lịch sử, tốn… ta dùng kiểu tài GIOI THIEU SEMANTIC WEB & ONTOLOGY | Do An nguyên bag để đại diện cho tập loại sách, loại sách khơng cần phải theo th tự Các thuộc tính c a bag gán nhãn rdf :_1, rdf :_2,… BookShop sell rdf:_1 Math bag rdf:_2 Hình 2.6 - Tập loại sách nhà sách History Để mô tả tài ngun bóng đèn có thuộc tính trạng thái mà có hai giá trị mở đóng , ta dùng kiểu tài nguyên alternative để biểu diễn Light state On rdf:_1 alternative rdf:_2 Hình 2.7 - Hai lựa chọn cho trạng thái bóng đèn Off Bây gi đến loại tài nguyên đặc biệt rdf:statement Đây loại tài nguyên dùng để mô tả ba Xem ví dụ trước ta thấy ba ch thể c a phát biểu giá trị c a thuộc tính b i ba tài nguyên Để làm điều ta tạo tài nguyên có thuộc tính subject, predicate, object Tài nguyên tạo tượng trưng cho phát biểu, gi làm ch thể giá trị thuộc tính cho phát biểu Tài nguyên tạo gán kiểu rdf :Statement để hệ thống hiểu phát biểu Ta tạm dịch đồ thị hình 2.8 bên sang ngơn ngữ tự nhiên sau: Có thứ có kiểu rdf:statement , có chủ thể Person-1 với thuộc tính Name có giá tr ị ’An’ Với cách biễu diễn này, từ sau ta muốn có phát biểu ba (person-1,name,An) cần tạo nút có cung nố i đến nút trống hình type Person-1 rdf:statement predicate subject Name Hình 2.8 - Nút trống tượng trưng cho phát biểu object An GIOI THIEU SEMANTIC WEB & ONTOLOGY | Do An 2.3 Chia sẻ liệu RDF Như biết, mơ hình RDF thể nhiều ưu điểm việc biễu diễn thơng tin Chính cần phải có cách th c chung để truyền tải liệu RDF internet Đó RDF/XML syntax W3C đưa năm 1999 Đây ngơn ngữ dựa XML, bao gồm tập quy tắc từ vựng để hỗ trợ cho biễu diễn thơng tin RDF 2.3.1 RDF/XML syntax RDF/XML gây khó khăn cho ngư i học b i có nhiều cách biểu diễn phát biểu, phần URI dùng để định danh cho tài nguyên tương đối dài khó đọc, khó viết Tuy nhiên vấn đề xử lí cách dùng XML namespace Khai báo namespace Việc sử dụng namespace giúp cho tài liệu RDF ngắn gọn dễ đọc ngư i thiết kế Chẳng hạn ta có địa „http://www.semantic.vn/2009/01/rdf-syntax-ns#‟ Nếu ta gán cho namespace ví dụ xmlns:rdf, từ sau ta việc dùng rdf:phone thay cho http://www.semantic.vn/2009/01/rdf-syntax-ns#phone Định danh chủ thể Chúng ta dùng cú pháp sau để biểu diễn triple : {subject,predicate,object} Ví dụ : {person-1, name, An} {person-1, phone, 0909213456} Và biểu diễn ví dụ tài liệu RDF : Thuộc tính rdf :about dùng để định URI c a resource, #person-1 cho ta biết person-1 khai báo tài liệu (trong ví dụ không person1 khai báo đâu) Nếu person-1 khơng khai báo phải đưa URI c a vào để sử dụng dùng namespace để đại diện cho URI Chúng ta dùng thuộc tính rdf :ID để gán định danh cho tài nguyên : đây, tài nguyên http://www.semantic.vn/2009/01/rdf-syntax-ns#person-1 định danh b i person-1 Thuộc tính ID giúp cho sử dụng tài nguyên person-1 mà khơng phải dùng lại URI c a dài dòng mà ph c tạp GIOI THIEU SEMANTIC WEB & ONTOLOGY | Do An 2.4 ng dụng c a RDF 2.4.1 Trình duyệt Mozilla Đây trình duyệt mềm dẻo cấu hình hệ thống Những tập tin cấu hình thư ng lưu trữ dạng XML dùng mơ hình RDF để lưu trữ thơng tin cấu hình c a ngư i dùng Mozilla dùng RDF để mô tả thông tin email thành phần c a mail 2.4.2 RSS (Rich Site Summary) Đây công nghệ dùng blog Nó giúp cho blog biết đến nhanh b i thông tin blog RSS cập nhật truyền tải nhanh chóng mạng Các thơng tin lưu trữ theo mơ hình RDF, blog liên kết với nhau, có tin t c xử lí RDF suy dẫn tin t c truyền tải đến blog khac Nh mà tin t c lan tải nhanh blog 2.4.3 Hệ thống thư mục Dublin Core Đây hệ thống giúp mơ tả thư mục siêu liệu Nó có ý nghĩa thiết thực b i giúp cho ngư i xây dựng hệ thống tài liệu cho riêng theo cách phân cấp Dublin Core xây dựng theo nhiều cách, số dùng RDF 2.4.4 Haystack : Quản lí thơng tin cá nhân Đây đồ án c a phịng nghiên c u Khoa Học Máy Tính c a học viện cơng nghệ Massachusets Nó hỗ trợ cho ngư i dùng xây dựng quản lí thông tin cá nhân email, web page, tài liệu, lịch, nhiều thơng tin khác…một cách có phân loại tốt Giúp cho ngư i dùng tìm lại tài liệu, thơng tin cách nhanh chóng, hiệu Với cách hoạt động vậy, RDF lựa chọn tốt B i RDF tảng cho việc tìm kiếm ngữ nghĩa, thơng tin nhanh chóng hiệu Haystack lúc phát hành hoạt động chậm đầu tư phát triển GIOI THIEU SEMANTIC WEB & ONTOLOGY | Do An Chương Ontology – Mơ Hình Phân Loại Tri Thức 3.1 Cơ Bản Sự Phân Loại Như nói, nhúng ngữ nghĩa vào Web khơng thể thiếu việc xác định ngữ nghĩa cho tài nguyên Web, mà cụ thể cần xác định tài ngun thuộc lớp nào, có tính chất phân biệt Do đó, u cầu đặc cần có chế tự động để máy tính phân loại tài nguyên Điều liên quan đến ngành khoa gọi Taxonomy: khoa học nguyên lý chung c a phân loại học Có hai phương pháp phân loại hình thức khơng hình thức Cách phân loại mà ngư i sử dụng hàng ngày gọi khơng hình th c, b i phân loại đơi khơng xác khơng cần xác Ví dụ, nói Vũng Tàu thành phố phía Nam hay thành phố thuộc Nam Trung Bộ chẳng Trong đó, cách phân loại hình th c sử dụng cần xác, ví dụ ngành khoa học phân loại tự động hệ thống máy tính Phương pháp phân loại hình th c mục tiêu đề cập phần Các hệ thống phân loại theo kiểu hình th c chia làm hai dạng dựa cấu trúc phân loại mà sử dụng Đó phân loại phân cấp (classification hierarchy) phân loại phân nhóm (classification groups) Phân loại phân cấp dựa cấu trúc phân cấp như: danh sách phân cấp phân cấp Trong phân loại phân nhóm dựa phân mục (categories) Hiện nay, hai hình th c sử dụng để phân loại tài nguyên lĩnh vực Web ngữ nghĩa 3.2 Phân Loại Phân Cấp Phân loại phân cấp sử dụng số cấu trúc phân cấp danh sách phân cấp phân cấp Trong đó, danh sách phân cấp cách đơn giản tự nhiên ngư i lẫn máy tính Một danh sách phân cấp thư ng bắt đầu với thực thể lớn sau dẫn thực thể nhỏ số cách trực quan đơn giản viết thụt vào, in nghiêng ám thực thể nhỏ phận c a thực thể lớn Trong máy tính, danh sách phân cấp thư ng mảng danh sách liên kết mà danh sách nhỏ phần tử danh sách lớn Một ví dụ danh sách phân cấp: Châu Á Việt Nam Nhật Bản GIOI THIEU SEMANTIC WEB & ONTOLOGY | Do An 10 3.6 Xây Dựng Ontology Có nhiều phương pháp khác để xây dựng Ontology, nhìn chung phương pháp thực hai bước là: xây dựng cấu trúc lớp phân cấp định nghĩa thuộc tính cho lớp Trong thực tế, việc phát triển Ontology để mô tả miền cần quan tâm công việc không đơn giản, phụ thuộc nhiều vào công cụ sử dụng, tính chất, quy mơ, thư ng xun biến đổi c a miền quan hệ ph c tạp Những khó khăn địi hỏi cơng việc xây dựng Ontology phải trình lặp lặp lại, lần lặp cải thiện tinh chế dần sản phẩm ch quy trình khung với cơng đoạn tách r i Ngồi ra, cơng việc xây dựng Ontology cần phải tính đến khả m rộng miền quan tâm tương lai, khả kế thừa hệ thống Ontology có sẵn, tính linh động để Ontology có khả mô tả tốt quan hệ ph c tạp giới thực Nội dung chương đề cập đến số nguyên tắc c a việc xây dựng Ontology qua các công đoạn cụ thể sau [4]: Xác định miền quan tâm phạm vi c a Ontology Xem xét việc kế thừa Ontology có sẵn Liệt kê thuật ngữ quan trọng Ontology Xây dựng lớp cấu trúc lớp phân cấp Định nghĩa thuộc tính quan hệ cho lớp Định nghĩa ràng buộc thuộc tính quan hệ c a lớp Tạo thực thể cho lớp Bước 1, Xác định miền quan tâm phạm vi Ontology: Giống công đoạn đặc tả khác, đặc tả Ontology bắt đầu việc trả l i câu hỏi mang tính phân tích để nhận diện xác u cầu Thơng thư ng, yêu cầu hệ thống Ontology mô tả miền quan tâm nhằm phục vụ s tri th c việc giải mục đích chuyên biệt Do đó, câu hỏi thư ng là: Ontology cần mô tả miền nào? Ontology phục vụ cho mục đích chuyên biệt gì? Cơ sở tri thức Ontology trả lời câu hỏi gì? Ontology nhằm vục vụ đối tượng nào? Ai người xây dựng, quản trị Ontology? Nhìn chung, câu trả l i cho câu hỏi dạng thư ng xuyên thay đổi suốt trình lặp xây dựng Ontology Nhất có thay đổi mục đích cần bổ sung tính việc sử dụng s tri th c Tuy nhiên, việc trả l i xác câu hỏi bước lặp giúp giới hạn phạm vi thực c a mơ hình cần mơ tả dự trù kỹ thuật sử dụng trình phát triển Lấy ví dụ, dự trù khả xảy khác biệt ngôn ngữ ngư i phát triển ngư i sử dụng Ontology phải bổ sung chế ánh xạ (mapping) qua lại thuật ngữ ngôn ngữ khác Hoặc giả sử Ontology cần xây dựng có ch c xử lý ngôn ngữ tự nhiên, ng dụng dịch tài liệu tự động cần thiết phải có kỹ thuật xác định từ đồng nghĩa chẳng hạn GIOI THIEU SEMANTIC WEB & ONTOLOGY | Do An 15 Sau phát thảo phạm vi Ontology dựa việc trả l i câu hỏi trên, ngư i thiết kế trả l i câu hỏi mang tính đánh giá, qua tiếp tục tinh chỉnh lại phạm vi c a hệ thống cần xây dựng Các câu hỏi dạng thư ng dựa s tri th c c a Ontology gọi câu hỏi kiểm chứng khả (competency question): Ontology có đủ thơng tin để trả lời cho câu hỏi quan tâm sở tri thức hay không? Câu trả lời sở tri thức đáp ứng mức độ, yêu cầu người sử dụng? Các ràng buộc quan hệ phức tạp miền quan tâm biểu diễn hợp lý chưa? Bước 2, Xem xét việc kế thừa Ontology có sẵn: cơng đoạn thư ng hay sử dụng để giảm thiểu công s c xây dựng Ontology Bằng cách kế thừa Ontology tương tự có sẵn, ngư i xây dựng thêm bớt lớp, quan hệ lớp, thực thể để tinh chỉnh tùy theo mục đích c a Ngồi ra, việc sử dụng lại Ontology có sẵn quan trọng cần tương tác ng dụng khác Lý ng dụng cần phải hiểu lớp, thực thể, quan hệ c a để thuận tiện việc trao đổi thông thông tin Vấn đề xây dựng Ontology cách kế thừa hệ thống có sẵn liên quan đến tốn ph c tạp trộn (merging) Ontology Như nói mục trước, tên khái niệm định nghĩa Ontology giống chúng dùng để mơ tả loại vật hồn tồn khác Trong đó, xảy trư ng hợp ngược lại, tên khái niệm khác mô tả vật Và vấn đề làm để bổ sung quan hệ, thuộc tính có sẵn vào hệ thống Tuy nhiên, hầu hết Ontology sử dụng ngành khoa học máy tính nói chung Web ngữ nghĩa nói riêng xây dựng hệ thống xây dựng quản trị Ontology Có thể kể tên số cơng cụ, chẳng hạn: Sesame, Protégé, Ontolingua, Chimaera, OntoEdit, OidEd Hiện nay, đa số phần mềm hỗ trợ ch c tự động trộn Ontology chí khác định dạng với Mặc dù vậy, m c đó, ngư i xây dựng cần phải kiểm tra lại cách th cơng, có lẽ công việc ph c tạp Hiện có nhiều Ontology chia sẻ Web Có thể kể số Ontology tiếng như: UNSPSC (www.unspsc.org) Chương trình phát triển c a Liên Hiệp Quốc hợp tác với tổ ch c Dun & Bradstreet nhằm cung cấp thuật ngữ c a sản phẩm dịch vụ thương mại [4] Các Ontology lĩnh vực thương mại khác như: RosettaNet (www.rosettanet.org), DMOZ (www.dmoz.org), eClassOwl, Open Biological, BioPax lĩnh vực sinh vật học, UMLS lĩnh vực mạng ngữ nghĩa, GO (Gene Ontology), WordNet (đại học Princeton) Bước 3, Liệt kê thuật ngữ quan trọng Ontology: Đây bước ích hữu, làm tiền đề cho hai bước xây dựng cấu trúc lớp phân cấp định nghĩa thuộc tính cho lớp Cơng đoạn bắt đầu việc liệt kê tất thuật ngữ xuất miền quan tâm (có thể đồng nghĩa chồng nhau) tên khái niệm, quan hệ, thuộc tính Ví dụ, thuật ngữ xuất ví dụ Ontology sinh vật chương trước là: động vật, thực vật, hạt kín, chim, thú, cộng sinh, cạnh tranh Thông thư ng, thuật ngữ danh từ tr thành lớp, tính từ tr thành thuộc tính, cịn động từ quan hệ lớp GIOI THIEU SEMANTIC WEB & ONTOLOGY | Do An 16 Bước 4, Xây dựng lớp cấu trúc lớp phân cấp: Như nói, hai bước quan trọng c a công việc xây dựng Lớp gốc Ontology Nhiệm vụ c a bước định nghĩa lớp từ số thuật ngữ liệt kê bước 3, sau xây dựng cấu trúc lớp phân cấp theo quan hệ lớp chaLớp trung lớp theo phương pháp phân loại đề cập gian chương Lớp vị trí cao cấu trúc có m c độ tổng quát cao Vị trí thuộc lớp gốc, lớp trung gian, Lớp cuối lớp Lớp lớp triển khai biểu thực thể Hình 4.1: Cấu trúc lớp phân cấp Quan hệ thực thể c a lớp với lớp cha mơ hình phân cấp quan hệ “is-a” Nghĩa thực thể c a lớp “là-một” thực thể c a lớp cha Nhìn chung, có nhiều hướng tiếp cận khác cho vấn đề xây dựng cấu trúc lớp phân cấp Có thể kể ba hướng sau: Hướng xây dựng từ xuống (top-down): bắt đầu lớp có m c độ tổng quát cao nhất, sau triển khai dần đến lớp Hướng xây dựng từ lên (bottom-up): Ngược với hướng xây dựng cấu trúc lớp phân cấp từ xuống, hướng bắt đầu việc xác định lớp cho cụ thể nhất, sau tổng quát hóa đến lớp gốc Cách kết hợp (combination): cách kết hợp hai hướng xây dựng Đầu tiên chọn lớp bật miền quan tâm, sau tổng quát hóa cụ thể hóa cấu trúc mong muốn Bước 5, Định nghĩa thuộc tính quan hệ cho lớp: Bản thân lớp nhận bước thuật ngữ phân biệt với tên gọi Về bản, chúng chưa đ để phục vụ cho việc biểu diễn tri th c Muốn vậy, thuộc tính c a lớp cần định nghĩa Thuộc tính c a lớp thông tin bên c a lớp, mô tả khía cạnh c a lớp dùng để phân biệt với lớp khác Thuộc tính chia làm nhiều loại khác nhau: Về mặt ý nghĩa, thuộc tính chia làm hai loại: thuộc tính bên (intrinsic property) thuộc tính bên ngồi (extrinsic property) Thuộc tính bên mơ tả tính chất nội bên vật, ví dụ: chất, lượng, cấu tạo Trong đó, thuộc tính bên ngồi mơ tả phần biểu c a vật, ví dụ: màu sắc, hình dạng Về mặt giá trị, thuộc tính chia làm hai loại: thuộc tính đơn (simple property) thuộc tính phức (complex property) Thuộc tính đơn giá trị đơn ví dụ: chuỗi, số , cịn thuộc tính ph c ch a tham khảo đến đối tượng khác Một ý quan trọng bước việc lớp kế thừa tồn thuộc tính c a tất cha Do đó, cần phải xem xét thuộc tính định nghĩa lớp thuộc m c cao hay chưa Thuộc tính nên định nghĩa tính chất riêng c a lớp xét mà không biểu lớp cao GIOI THIEU SEMANTIC WEB & ONTOLOGY | Do An 17 Bước 6, Định nghĩa ràng buộc thuộc tính quan hệ lớp: Các ràng buộc giới hạn giá trị mà thuộc tính nhận Hai ràng buộc quan trọng thuộc tính lượng số (cardinality) kiểu (type) Ràng buộc lượng số quy định số giá trị mà thuộc tính nhận Hai giá trị thư ng thấy c a ràng buộc đơn trị (single) đa trị (multiple) Ràng buộc Nhưng số phần mềm cịn cho phép định nghĩa xác khoảng giá trị c a Hình 4.2: Ràng buộc lượng số Ràng buộc th hai kiểu Về bản, kiểu mà thuộc tính nhận là: chuỗi, số, boolean, liệt kê kiểu thực thể Riêng kiểu thực thể có liên quan đến hai khái niệm gọi là: miền (domain) khoảng (range) Khái niệm miền dùng để lớp (hay lớp) mà thuộc tính thuộc Trong đó, khoảng lớp (hay lớp) làm kiểu cho giá trị thuộc tính kiểu thực thể Lấy ví dụ, lớp động vật hình 4.1 có thuộc tính “loại thức ăn” thuộc kiểu thực thể (cỏ cây, côn trùng ) Lúc này, miền c a loại th c ăn động vật, sinh vật Cịn khoảng c a lớp cỏ, cây, Bước 7, Tạo thực thể cho lớp: Đây bước cuối khép lại vòng lặp xây dựng Ontology Cơng việc lúc tạo thực thể cho lớp gán giá trị cho thuộc tính Nhìn chung, thực thể tạo nên nội dung c a s tri th c vấn đề quan tâm lĩnh vực Web ngữ nghĩa 3.7 Tổng Kết Như nội dung chương giới thiệu mơ hình phân loại thư ng hay sử dụng, làm quen với khái niệm Ontology, vai trị c a Ontology quy trình xây dựng Ontology hồn chỉnh theo chu trình lặp tinh chế sản phẩm Nhìn chung, hướng tiếp cận c a chương phương pháp xây dựng trực quan công cụ Tuy nhiên, thân công cụ sử dụng lớp bên để mơ tả Ontology theo cách máy tính hiểu được, lớp ngơn ngữ Ontology Trong chương tiếp theo, giới thiệu số ngôn ngữ phổ biến lĩnh vực Ontology RDFS, OWL, DAML + OIL, GIOI THIEU SEMANTIC WEB & ONTOLOGY | Do An 18 Chương Ngôn Ngữ Ontology 4.1 RDFS (RDF-Schema) 4.1.1 Giới thiệu RDFS RDFS hay RDF-Schema, ngơn ngữ Ontology Nó phát triển tầng c a RDF thân RDF-Schema RDF, m rộng từ RDF bổ sung thêm tập từ vựng để hỗ trợ cho việc xây dựng Ontology dễ dàng Như biết, ngôn ngữ RDF giúp cho thông tin thể dạng ba theo mơ hình RDF ch thơng tin chưa thể mặt ngữ nghĩa B i vậy, xây dựng RDFS điều cần thiết để hình thành nên ngữ nghĩa cho thơng tin, s để xây dựng cơng cụ tìm kiếm ngữ nghĩa RDFS RDF có mối liên hệ tương đối gần gũi nên đôi lúc ta gọi ngôn ngữ RDF/RDFS Hình 4.1 cho phân biệt RDFS với RDF : Literal range range Phone ID domain domain Staff Member involves range domain subClassOf subPropertyOf Academic Staff isTaughtBy domain Hình 4.1 - So sánh RDF RDFS subClassOf subClassOf Course Lecturer type isTaughtBy AI GIOI THIEU SEMANTIC WEB & ONTOLOGY | Do An Quan Thanh Tho Assistant RDFS RDF 19 Trong hình vẽ thấy, tầng RDF biểu diễn thông tin dạng ba Đến tầng RDFS, thông tin phân loại rõ ràng Chẳng hạn Quan Thanh Tho có kiểu Lecturer Lecturer lớp c a Academic Staff v.v… 4.1.2 Các lớp thuộc tính RDF/RDFS RDF/RDFS định nghĩa 13 lớp rdfs :Resource (Chỉ định tài nguyên) rdfs :Class (Dùng để kh i tạo lớp) rdfs :Literal (Lớp giá trị nguyên thủy: chuỗi, số nguyên…) rdfs :XMLLiteral rdfs :Container rdfs :ContainerMembershipProperty rdf :Property (Cho biết tài nguyên thuộc lớp thuộc tính - property) rdf :Statement (Cho biết tài nguyên thuộc lớp phát biểu - statement) rdf :Bag rdf :Seq rdf :Alt rdf :list (Lớp danh sách RDF) rdf :Container Và số thuộc tính : rdf :type rdfs :subClassOf rdfs:subPropertyOf rdfs:domain rdfs :range rdfs:label rdfs:comment rdf :member rdf :first rdf :rest rdfs :seeAlso rdfs :isDefinedBy rdf :value rdf :subject rdf :predicate rdf :object (Xác định kiểu cho tài nguyên) (Cho biết ‘lớp của’) (‘Thuộc tính của’ thuộc tính) (Chỉ định vùng) (Chỉ định tầm vực) (Gán nhãn cho tài nguyên) (Chú thích) (Thành viên lớp chứa - container) (Phần tử danh sách RDF) (Danh sách phần tử lại) (Các thông tin bổ sung) (Được định nghĩa b i) (Gán giá trị cho chủ thể) (Chủ thể phát biểu) (Thuộc tính phát biểu) (Giá trị thuộc tính phát biểu) Với lớp thuộc tính liệt kê đây, RDF/RDFS đ mạnh để xây dựng ontology Tuy nhiên thân cịn ch a đựng nhiều hạn chế chưa hỗ trợ tốt mặt suy luận, chưa có ràng buộc kiểu lượng số …mà ngôn ngữ hệ sau khắc phục (chúng ta bàn điều phần OWL) Các lớp thuộc tính thư ng dùng RDF/RDFS ch yếu : Resource, Class, Property, type, label, subClassOf, subPropertyOf, domain, range Trong domain miền tài ngun sử dụng thuộc tính đó, cịn range phạm vi giá trị gán cho thuộc tính Ví dụ ta có lớp thuộc tính hasChild domain c a hasChild lớp Person, cịn range lớp số nguyên dương chẳng hạn(số từ tr lên v.v…) GIOI THIEU SEMANTIC WEB & ONTOLOGY | Do An 20 4.1.3 Ví dụ xây dựng ontology với RDFS Chúng ta dùng cú pháp sau để biễu diễn cho phát biểu (statement): {subject,predicate,object} Nếu có nhiều thuộc tính cho ch thể thì: {subject, {predicate1, object1} {predicate2, object2} } Nếu có nút trống (blank node) biểu diễn sau : {subject, predicate, {predicate-of-bnode,object-of-bnode} } Một tài nguyên bắt đầu b i dấu # chẳng hạn #resource_1 có nghĩa tài nguyên khai báo tài liệu mà xây dựng ontology Sau muốn sử dụng tài ngun ta dùng #resource _1 ch không cần phải lấy URI c a cho ph c tạp, khó nhìn Bây gi vào xây dựng Ontology đơn giản, Ontology xây dựng tóm gọn sơ đồ hình 4.1: {rdfs:Class {rdf:ID,"StaffMember"} {rdf:resource, “http://www.semantic.vn/2009/01/rdf-schema#StaffMember"} } {rdfs:Class {rdf:about,"AcademicStaff"} {rdfs:subClassOf, "# StaffMember"} } {rdfs:Class {rdf:about,"Lecturer"} {rdfs:subClassOf, #AcademicStaff} } {rdfs:Class {rdf:ID,"Course"} {rdf:resource, “http://www.semantic.vn/2009/01/rdf-schema#Course"} } {rdf:Property { rdf:ID,"phone"} {rdfs:domain, #staffMember} {rdfs:range ,"http://www.semantic.vn/ 2009/01/rdf-schema#Literal"} } {rdf:Property { rdf:ID,"ID"} {rdfs:domain, #staffMember} {rdfs:range ,"http://www.semantic.vn/ 2009/01/rdf-schema#Literal"} } GIOI THIEU SEMANTIC WEB & ONTOLOGY | Do An 21 {rdf:Property { rdf:ID,"involve"} {rdfs:domain, #Course} {rdfs:range ,#AcademicStaff} } {rdf:Property { rdf:ID,"isTaughtBy"} {rdfs:domain, #Course} {rdfs:range ,#AcademicStaff} {rdf:subPropertyOf, “involve”} } … Từ Ontology xây dựng ta vẽ sơ đồ phân cấp tài nguyên sau : Staff Member Academic Staff Lecturer Course Nhìn sơ đồ ta thấy có hai tài ngun StaffMember Course Các lớp AcademicStaff Lecturer thừa kế từ StaffMember 4.2 OWL (Ontology Web Language) OWL ngơn ngữ ontology mạnh, đ i sau RDFS nên biết kế thừa lợi c a ngôn ngữ đồng th i bổ sung thêm nhiều yếu tố giúp khắc phục hạn chế c a RDFS OWL giúp tăng thêm yếu tố logic cho thông tin khả phân loại, ràng buộc kiểu lượng số tương đối mạnh Chúng ta tìm hiểu sơ qua lớp thuộc tính c a OWL để thấy ưu điểm c a OWL so với RDFS Classes Properties owl:AllDifferent owl:Class owl:DataRange owl:DataTypeProperty owl:DeprecatedProperty owl:DeprecatedClass owl:FunctionalProperty owl:InverseFunctionalProperty owl:Nothing owl:ObjectProperty owl:Ontology owl:Restriction owl:SymmetricProperty owl:allValuesFrom owl:backwardCompatibleWith owl:cardinality owl:complementOf owl:distinctMembers owl:differentFrom owl:disjointWith owl:equivalentClass owl:equivalentProperty owl:hasValue owl:imports owl:incompatiblewith owl:intersectionOf GIOI THIEU SEMANTIC WEB & ONTOLOGY | Do An owl:TransitiveProperty owl:inverseOf owl:maxCardinality owl:minCardinality owl:oneOf owl:onProperty owl:priorVersion owl:sameAs owl:sameIndividualAs owl:someValuesFrom owl:subClassOf owl:unionOf owl:versionInfo 22 Trong OWL có thêm số thuộc tính hỗ trợ suy luận ràng buộc Hỗ trợ suy luận Tính chất bắt cầu Nếu có lớp thuộc tính „contain‟ gán cho thuộc tính owl :transitivePropertive thuộc tính „contain‟ có tính chất bắt cầu Giả sử ta có thơng tin A contain B B contain C, hệ thống tự suy luận thông tin khác A contain C Và biểu diễn thuộc tính contain OWL : {owl:TransitiveProperty {rdf:ID,"contain"} } Tính chất đảo ngược Nếu A có thuộc tính hasParent B, suy B có thuộc tính hasChild A {owl:OjectProperty {‘df:ID, hasChild } {owl:inverseOf, #hasParent} } Hỗ trợ ràng buộc Ràng buộc kiểu : Giả sử ta có lớp Human, thừa kế từ hai lớp Man Woman Ta muốn đối tượng thuộc lớp Man khơng thể thuộc lớp Woman ngược lại {owl :Class {rdf :about, #Man} {owl :disjointWith, #Woman} } Ràng buộc lượng số : Ta muốn ngư i có cha mẹ T c thuộc tính hasParent ln gán số lượng {owl :Restriction {owl :onProperty, #hasParent} {owl :cardinality, 2} } Trên vài ví dụ mà RDFS làm Rõ ràng OWL có nhiều ưu điểm việc xây dựng hệ thống ontology thơng minh có phân loại tốt Với đặc điểm đó, OWL ngày tr thành ngơn ngữ ontology th c cho việc xây dựng phát triển hệ thống Semantic Web GIOI THIEU SEMANTIC WEB & ONTOLOGY | Do An 23 4.3 DAML + OIL DAML + OIL kết từ hai dự án nghiên c u độc lập với DAML (DARPA Agent Markup Language) OIL (Ontology Inference Layer) nhằm khắc phục hạn chế kiểu liệu ngơn ngữ Ontology trước RDF, RDFS DAML + OIL (gọi tắt DAML) ngôn ngữ đánh dấu cho tài nguyên Web, có hỗ trợ suy luận Ngôn ngữ xây dựng có kế thừa từ chuẩn c a W3C XML, RDF, RDFS, Một số điểm đáng ý c a ngôn ngữ là: Cho phép giới hạn kiểu liệu định nghĩa XML Schema hay b i ngư i dùng Trong DAML, thuộc tính nhận giá trị nhiều khoảng khác nhau, tạo nên tính uyển chuyển việc mơ tả liệu Cho phép định nghĩa thuộc tính unique để xác định đối tượng Cho phép mô tả quan hệ hoán đổi bắc cầu DAML sau tiếp tục tr thành tảng cho ngôn ngữ Ontology khác OWL DAML giống với OWL (ngoại trừ tên số thuật ngữ, cú pháp sửa đổi), nhiên khả mô tả ràng buộc Theo thống kê, có khoảng triệu phát biểu DAML từ 20,000 Website Internet vào năm 2002 [1] GIOI THIEU SEMANTIC WEB & ONTOLOGY | Do An 24 Chương Công Cụ Xây Dựng Quản Trị Ontology 5.1 Giới thiệu Về mặt lý thuyết, ngư i xây dựng quản trị Ontology khơng cần cơng cụ hỗ trợ, thay vào thực trực tiếp ngôn ngữ Tuy nhiên, cách th hai khơng khả thi Ontology có kích thước lớn cấu trúc ph c tạp Thêm vào đó, việc xây dựng quản trị Ontology khơng đòi hỏi việc tạo cấu trúc lớp phân cấp, định nghĩa thuộc tính, ràng buộc , mà cịn bao hàm việc giải toán liên quan Có nhiều tốn liên quan đến hệ thống Ontology như: Trộn hai hay nhiều Ontology Chuẩn đoán phát lỗi Kiểm tra tính đắn đầy đ Ánh xạ qua lại Ontology Suy luận Ontology Sao lưu phục hồi Ontology Xóa, sửa tinh chỉnh thành bên Ontology Tách biệt Ontology với ngôn ngữ sử dụng (DAML, OWL, ) Những khó khăn khiến cơng cụ tr thành thành phần thiếu, định đến chất lượng c a hệ thống Ontology Hiện có nhiều cơng cụ có khả hỗ trợ ngư i thiết kế giải toán liên quan Có thể kể số như: Sesame, Protégé, Ontolingua, Chimaera, OntoEdit, OidEd Nội dung chương đề cập đến hai công cụ Protégé Chimaera Các cơng cụ cịn lại đề cập phạm vi c a viết khác 5.2 Protégé Protégé phần mềm mã nguồn m Java tiếng Protégé nghiên c u phát triển từ năm 1998 b i nhóm nghiên c u c a Mark Musen, ĐH Stanford nhằm quản lý thông tin lĩnh vực sinh y học Đây dự án nhận quan tâm tài trợ từ nhiều tổ ch c, có Bộ Quốc Phịng Mỹ Mã nguồn Protégé tìm thấy website: http://smi-protege.stanford.edu/repos/protege/owl/trunk GIOI THIEU SEMANTIC WEB & ONTOLOGY | Do An 25 Hiện tại, Protégé có phiên 3.4 Phiên Beta 4.0 phát triển thử nghiệm song song b i hợp tác CO-ODE (Cooperative Ontologies Programme) đại học Stanford [5] Các ưu điểm c a Protégé là: Hỗ trợ đầy đ ba phiên c a ngôn ngữ OWL OWL-Full, OWL-Lite OWL-DL Nh sử dụng mơ hình hướng đối tượng c a ngôn ngữ Java, Protégé tỏ hiệu việc mơ hình lớp, thực thể, quan hệ Giao diện thiết kế trực quan có tính tương tác cao Ngư i sử dụng định nghĩa thành phần c a Ontology trực tiếp từ form Cho phép biểu diễn trực quan Ontology dạng sơ đồ Cho phép xây dựng Ontology từ nhiều nguồn khác Protégé tự động lưu tạm c a Ontology Nếu có lỗi phát sinh trình thao tác Ontology cũ tự động phục hồi Ngư i thiết kế chuyển qua lại hai Ontology ch c Revert to a Previous Version Active Current Version Cung cấp ch c tìm kiếm lỗi, kiểm tra tính quán đầy đ c a Ontology Để sử dụng, ngư i thiết kế chọn ch c Run Ontology Test Check Consistency Cho phép lớp thuộc tính c a Ontology sử dụng Namespace khác mà cần sử dụng URL để tham khảo Để sử dụng, chọn ch c Move Resource to Namespace Hỗ trợ suy luận trực tiếp Ontology dựa Interface chuẩn DL Implementation Group (DIG) Hỗ trợ sinh mã tự động Protégé cho phép chuyển Ontology thành mã nguồn RDF/XML, OWL, DIG, Java, EMF Java Interfaces, Java Schema Classes Các mã nhúng trực tiếp vào ng dụng đầu vào cho thao tác Ontology cần Cung cấp đầy đ chuẩn giao tiếp cho Plug-in Tuy nhiên, Protégé thể số hạn chế không cho phép truy vấn phần s tri th c dẫn tới việc không quản lý hiệu s tri th c có kích thước lớn, chưa hỗ trợ kết nối trực tiếp với số hệ quản trị s tri th c phổ biến Sesame [3], Hình 5.1: Giao diện Protégé 3.4 GIOI THIEU SEMANTIC WEB & ONTOLOGY | Do An 26 5.3 Chimaera Chimaera ng dụng khác phát triển b i đại học Stanford, với mục đích ban đầu nhằm giải hai vấn đề là: trộn Ontology chuẩn đốn lỗi, phân tích tính qn Ontology phân tán [6] Có thể tìm thơng tin liên quan đến Chimaera địa chỉ: www.ksl.stanford.edu/software/chimaera, sử dụng tại: http://www-ksl-svc.stanford.edu:5915 Một số điểm đáng ý c a Chimaera là: Chimaera ng dụng chạy Web, hỗ trợ thao tác với 15 định dạng Ontology bao gồm: ANSI KIF, Ontolingua, Protégé, CLASSIC, iXOL, OKBC Riêng hai chuẩn RDF DAML hỗ trợ th i gian tới [6] Chimaera tích hợp sẵn ch c chỉnh sửa Ontology, đặc biệt có thêm ch c kéo thả phím tắt nh sử dụng đoạn mã Javascript nhúng vào trình duyệt [7] Tuy nhiên, so với ng dụng GUI Windows/UNIX cịn nhiều hạn chế Chimaera có ch c phân tích, hỗ trợ ngư i dùng chuẩn đoán kiểm tra Ontology Việc kiểm tra bao gồm kiểm tra tính đầy đ (thuộc tính thực thể tham khảo đến lớp quan hệ chưa định nghĩa s tri th c), kiểm tra cú pháp, kiểm tra ngữ nghĩa, phát chu trình (các lớp tham khảo lẫn theo chu trình) Kết thể dạng test log Hiện Chimaera cố gắng tích hợp thêm lớp ngơn ngữ dạng luật phép ngư i dùng đặc tả phương th c kiểm tra theo ý muốn Hình 5.2: Chimaera hỗ trợ hầu hết định dạng Ontology GIOI THIEU SEMANTIC WEB & ONTOLOGY | Do An 27 Chương Tổng Kết 6.1 Xu Hướng Phát Triển Những năm gần ch ng kiến xuất c a nhiều ng dụng sử dụng kết nghiên c u lĩnh vực Web ngữ nghĩa Ontology Chẳng hạn việc sử dụng cấu trúc ba c a RDF để biểu diễn, lưu trữ liệu phục vụ cho suy luận Hay việc sử dụng Ontology cho hệ thống phân mục Internet, thương mại điện tử, xử lý ngơn ngữ tự nhiên, Có thể kể số ng dụng tiêu biểu như: [9] Tìm kiếm: Swoogle, Hakia, VN-KIM, Falcon, Sindice, Go3R Suy luận: Pellet, RacerPro, FaCT++, Ontobroker, Ontotext, SHER, Oracle 11g, Trình duyệt: Disco, Tabulator, Zitgist, OpenLink Viewer, Thương mại điện tử: Amazon, Web: Youtube, Yahoo News, Wikipedia, Công cụ phát triển: Protégé, Jena, SWI-Prolog, SemanticWorks, RDFLib, Phần mềm chuyển đổi: FlickUrl, Jpeg2Pdf, Triplr, GRDDL, Nhìn chung, hướng c a lĩnh vực Web ngữ nghĩa th i gian tới khơng có nhiều thay đổi Nghĩa nhiệm vụ c a ng dụng phân tích cấu trúc liệu, xác định liệu thuộc kiểu từ có hành động thích hợp Sự khác biệt c a Web ngữ nghĩa tương lai khả tự động hóa thơng minh, mà kết c a phụ thuộc nhiều vào lĩnh vực trí tuệ nhân tạo: logic, đánh giá (trust), ngữ nghĩa, hình th c, 6.2 Kết Luận Như vậy, viết trình bày khái niệm coi then chốt c a lĩnh vực Web có ngữ nghĩa Đó RDF Ontology Trong thực tế, cịn có mn vàn vấn đề khác liên quan đến hướng Song song với kết nghiên c u lý thuyết, ng dụng c a ngày rộng rãi, vượt ngồi phạm vi c a ngành khoa học máy tính Web ngữ nghĩa gi đánh giá bước tiến làm thay đổi cách th c đối tượng giao tiếp với liệu Internet Đằng sau hệ c a Web ngữ nghĩa chưa có câu trả l i xác đáng Tuy nhiên khẳng định giá trị mà mang lại khơng mà ch ng kiến với hệ c a World Wide Web GIOI THIEU SEMANTIC WEB & ONTOLOGY | Do An 28 6.3 L i Cảm Tạ Cuối cùng, xin g i l i cảm ơn đến thầy – PGS-TS Cao Hồng Trụ tận tình hướng dẫn trình tìm hiểu đề tài Xin cảm ơn hai bạn Viết Nghi Kim Kha chia sẻ hiểu biết vấn đề mà nhóm gặp phải thực viết Tháng 5/2009, Võ Hoàng Nguyên, Hoàng Lê Quân GIOI THIEU SEMANTIC WEB & ONTOLOGY | Do An 29