1. Trang chủ
  2. » Luận Văn - Báo Cáo

Một phương pháp gióng hàng Ontology trong OWL-DL

10 22 0

Đang tải... (xem toàn văn)

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 10
Dung lượng 363,14 KB

Nội dung

Trong bài báo này tác giả tìm hiểu phương pháp gióng hàng ontology (ontology alignment) trên ngôn ngữ OWL-Lite và OWL-DL. Trên cơ sở khảo sát công cụ OLA (Owl Lite Alignment) với kĩ thuật ánh xạ OWL Lite ontology, chúng tôi đề xuất một phương pháp tính độ tương tự của các thành phần giữa các OWL-DL ontology.

JOURNAL OF SCIENCE OF HNUE FIT., 2013, Vol 58, pp 28-37 This paper is available online at http://stdb.hnue.edu.vn MỘT PHƯƠNG PHÁP GIÓNG HÀNG ONTOLOGY TRONG OWL-DL Đỗ Thị Ngọc Khang1 Phạm Thị Anh Lê2 Trường THPT Trung Giã, Khoa Công nghệ Thông tin, Trường Đại học Sư phạm Hà Nội Email: lepta@hnue.edu.vn Tóm tắt Trong báo chúng tơi tìm hiểu phương pháp gióng hàng ontology (ontology alignment) ngôn ngữ OWL-Lite OWL-DL Trên sở khảo sát công cụ OLA (Owl Lite Alignment) với kĩ thuật ánh xạ OWL Lite ontology, đề xuất phương pháp tính độ tương tự thành phần OWL-DL ontology Phương pháp tính độ tương tự thực thành phần ontology cụ thể thử nghiệm việc xây dựng hệ thống OWL-DL Alignment (ODA) Đánh giá thực nghiệm cho thấy hệ thống đạt kết với độ tương tự có mức xác cao Từ khóa: Gióng hàng ontology, OWL-DL Giới thiệu Trong thực tế, nhiều hệ tri thức sử dụng ontology cách tiếp cận để biểu diễn tri thức theo định dạng có cấu trúc Con người ln có nhu cầu chia sẻ tái sử dụng tri thức từ nhiều nguồn khác Tái sử dụng tri thức bước quan trọng trình thiết kế ontology Khi xây dựng ontology, người ta tìm khái niệm, tiên đề, cá thể, từ ontology có chủ đề để sử dụng lại Tuy nhiên, ontology lại có cách biểu diễn tri thức khác nhau, tùy thuộc vào ứng dụng cụ thể Do đó, phương pháp tìm kiếm khái niệm tương đồng phần mô tả cặp ontology cần thiết Các phương pháp gọi ánh xạ (mapping) hay gióng hàng (alignment) ontology Nhiều kĩ thuật alignment [2] nghiên cứu thực như: đánh giá dựa nhãn thực thể ontology (gọi tắt thực thể), dựa vào cấu trúc nội thực thể, cấu trúc quan hệ (độ tương tự tính dựa việc phân tích vị trí chúng đồ thị) Một số phương pháp sử dụng phổ biến: ANCHORPROMPT (Noy et al., 2001), IF-MAP (Kalfoglou et al., 2003), ASCO (Bach et al., 2004), GLUE (Doan et al., 2004), QOM (Ehrig et al., 2004a) OLA (Euzenat et al., 2004b) Các phương pháp biểu diễn ontology theo định dạng ngôn ngữ đánh dấu (xml, RDF(S), OWL-Lite2) Ngoài ra, phương pháp đánh giá độ tương tự nhiều dựa cấu trúc ontology OLA cơng cụ sử dụng thuật tốn cho việc tính tốn độ tương tự hai ontology sử dụng ngôn ngữ OWL-Lite [4] Thuật 28 Một phương pháp gióng hàng Ontology OWL-DL tốn gióng hàng ontology OLA thực với bốn bước Đầu tiên, xây dựng mơ hình đồ thị OL-graph [2] biểu diễn ontology OWL-Lite Bước 2, tính tốn độ tương tự nội (id, label) cặp đối tượng xét Bước 3, tính tốn độ tương tự cấu trúc cặp dựa vào độ tương tự láng giềng cấp Bước 4, tính độ tương tự tổng thể dựa độ tương tự nội độ tương tự cấu trúc tính áp dụng đối tượng là: lớp thuộc tính Mặt khác, biết, OWL Lite có hạn chế khả biểu diễn tri thức [8] Trong đó, OWL-DL phiên sử dụng phổ biến tính biểu đạt ngơn ngữ hỗ trợ việc lập luận hiệu Từ phân tích chức OLA chủ yếu hỗ trợ OWL Lite ontology, đề xuất phương pháp gióng hàng ontology ngơn ngữ OWL DL 2.1 Nội dung nghiên cứu Gióng hàng ontology 2.1.1 Khái niệm ontology Trong khoa học máy tính, ontology định nghĩa biểu diễn hình thức cho tập hợp khái niệm thuộc lĩnh vực quan hệ khái niệm Cụ thể hơn, ontology cung cấp từ vựng chung bao gồm khái niệm, thuộc tính quan trọng, mô tả khái niệm thuộc tính phức tạp Các ontology thường miêu tả: cá thể (thể hiện), lớp (khái niệm), thuộc tính quan hệ [1] Khái niệm (lớp) biểu diễn nhóm, bộ, tập hợp đối tượng đối tượng trừu tượng - biểu diễn giá trị ràng buộc Ví dụ: AccommodationRating biểu diễn lớp tất mức tiêu chuẩn chất lượng chỗ Cá thể thành phần ontology Tham khảo ví dụ ontology du lịch, lớp AccommodationRating hiện: OneStarRating (Một sao), TwoStarRating (Hai sao), ThreeStarRating (Ba sao) Mỗi cá thể thể lớp Thuộc tính dùng để mơ tả tính chất, đặc điểm cá thể (lớp) ontology Một thuộc tính lớp hay cá thể Ví dụ như: cá thể HaNoi có thuộc tính: HaNoi Capital (là thủ đơ) FourSeasons (có đủ mùa) WestLake (Hồ Tây) Quan hệ đối tượng ontology cho biết đối tượng liên hệ với đối tượng khác Chẳng hạn, ontology chứa khái niệm Accommodation khái niệm Thing liên hệ quan hệ Điều cho ta biết Accomodation mơ hình thay cho Thing Để biểu diễn thành phần ontology, người ta sử dụng ngơn ngữ ontology Trong lĩnh vực web ngữ nghĩa, có nhiều ngôn ngữ XML, RDF, DAML+OIL, OWL 29 Đỗ Thị Ngọc Khang, Phạm Thị Anh Lê Trong đó, OWL ngơn ngữ phổ biến nhất, có phiên khác nhau: OWL-Lite, OWL-DL OWL-FULL Trong báo này, giới thiệu OWL-DL [8] Chúng tơi trình bày ngắn gọn cú pháp ngơn ngữ qua ví dụ sau: Phần mô tả lớp AccommodationRating cá thể HaNoi đề cập phần biểu diễn cú pháp trừu tượng ngôn ngữ OWL-DL sau: Namespace(p =< http://www.semanticweb.org/ontologies/2012/4/travel2.owl# #>) Ontology( < http://www.semanticweb.org/ontologies/2012/4/travel2.owl# #> Class(p:AccommodationRating) SubClassOf (owl:Thing) EnumeratedClass (p:AccommodationRating p:OneStarRating p:ThreeStarRating p:ThreeStarRating) Individual (p: HaNoi) p:HaNoi type(p:Capital) value (p:hasAccomodation p:FourSeasons) value (p:hasPart p:WestLake) Đoạn mã sử dụng thành phần OWL-DL là: Class cho phép định nghĩa tài nguyên lớp khái niệm cho tài nguyên khác, subClassOf cho phép định nghĩa cấu trúc phân cấp lớp, EnumeratedClass cho phép mô tả lớp tương đương với lớp tập cá thể, Individual cho phép định nghĩa tài nguyên cá thể, type cho phép mô tả cá thể thuộc loại (lớp) có, value cho phép mơ tả mối quan hệ cá thể với lớp (thể hiện) 2.1.2 Gióng hàng ontology Như biết, bước trình thiết kế ontology tái sử dụng liệu ontology có Tuy nhiên, thực tế, nhiều ontology có chủ đề tồn khác biệt quy cách đặt tên, cấu trúc thiết kế Các phương pháp gióng hàng nhằm tìm cặp thực thể tương đồng ontology [3] OLA phần mềm xây dựng để đánh giá độ tương tự OWL Lite ontology Sau phân tích ontology OWL API, OLA sinh hai đồ thị OL-graph [2] Với OL-graph, nút biểu diễn thành phần: lớp, đối tượng, số, kiểu liệu; cạnh đồ thị biểu diễn quan hệ nút Độ tương tự thực thể (cặp nút) hai đồ thị xét dựa hai yếu tố: kiểu thành phần mà nút biểu diễn (độ tương tự ngôn ngữ) phần mô tả cho nút đó: lớp cha, con, thuộc tính cạnh gắn nhãn kiểu quan hệ liên kết nút xét với nút có quan hệ với (độ tương tự cấu trúc) Tuy nhiên, việc áp dụng OLA cho OWL DL ontology chưa phù hợp với số cú pháp: EquivalentClasses, EnumeratedClass, EquivalentProperties, SameIndividual Hơn nữa, thuật tốn tính độ tương tự OLA không xét tới độ tương tự láng giềng cấp thể độ tương tự lớp, thuộc tính bỏ qua cá thể File mơ tả kết đầu chưa phù hợp với hệ soạn thảo ontology thông dụng Từ hạn chế trên, đề xuất phương pháp đánh giá độ tương tự cho thành phần ontology với ngôn ngữ mô tả OWL-DL Hệ thống ODA mà chúng tơi xây dựng sở thuật tốn OLA có tham khảo phương pháp gióng hàng ontology với cặp ontology sử dụng ngôn ngữ mô tả OWL-DL OAEI đánh giá năm 2011, kết hợp 30 Một phương pháp gióng hàng Ontology OWL-DL với số điều chỉnh: bổ sung đánh giá độ tương tự cho mệnh đề mơ tả thuộc tính lớp tương đương, sử dụng thuật toán Hunggary để chọn cặp đối tượng cho tổng số độ tương tự hai ontology lớn tạo lại mẫu file chứa kết phù hợp để hiệu chỉnh với hệ soạn thảo ontology thông dụng Tên gọi hệ thống là: OWL-DL Alignment Sau bước kĩ thuật mà sử dụng 2.2 Gióng hàng OWL-DL ontology Trong phần này, chúng tơi xây dựng hệ thống ODA gióng hàng ontology ngôn ngữ OWL-DL Hệ thống thực ba bước bản: xây dựng đồ thị RDF (O-graph), tính độ tương tự cặp thực thể đưa kết cặp thực thể tương đồng (sử dụng thuật toán Hungary) 2.2.1 Xây dựng đồ thị RDF Đầu tiên, biểu diễn ontology đồ thị RDF sử dụng công cụ Jena api [5] Trong Jena, tồn thơng tin biểu diễn tập RDF cấu trúc liệu gọi “mơ hình” Mơ hình đồ thị RDF chứa tập nút RDF liên kết với cạnh quan hệ có gắn nhãn Mỗi quan hệ theo hướng Ví dụ: example:ijd travel:name "HaNoi" travel:type “Capital” hiểu tài ngun example:ijd có thuộc tính travel:name với giá trị "HaNoi" Mơ hình giống đồ thị có hướng với kiểu nút bản: URI Literal (các giá trị thuộc tính) Các tài ngun thường mơ tả URI Cịn cạnh đồ thị gán nhãn tên thuộc tính Như vậy, cạnh đồ thị phát biểu (statement) gồm 3: subject nút khởi đầu cạnh, predicate thuộc tính hay quan hệ gắn nhãn cho cạnh object nút kết thúc tài nguyên (resource) giá trị (literal) Jena api cung cấp số phương thức để trích lấy thành phần cản ontology Tuy nhiên, mô tả trả kết mong muốn Với thành phần lớp tương đương thuộc tính tương đương, api khơng trả đầy đủ danh sách lớp, thuộc tính ràng buộc kèm theo (nếu có); với danh sách lớp, thuộc tính cha không trả danh sách cấp 1, cấp 2, mà trộn lẫn vào chung tập hợp; thuộc tính kiểu, danh sách cá thể tương tự khác biệt cá thể lớn trả thiếu lớp danh sách đầy đủ Do đó, ta cần xây dựng lại phương thức để đảm bảo thực bước sau thuật tốn Việc tính tốn độ tương tự cặp thực thể có nhiều độ đo Trong hệ thống ODA, qua thử nghiệm đánh giá, sử dụng độ tương tự ngôn ngữ, độ tương tự láng giềng độ tương tự tổng thể 2.2.2 Độ tương tự ngơn ngữ Có nhiều thuật tốn cho phép đo độ tương tự ngôn ngữ như: kĩ thuật dựa xâu (string-based), dựa khoảng cách Hamming, dựa tài nguyên ngôn ngữ, Ở đây, sở tham khảo [6] sử dụng: độ tương tự LEVENSHTEIN dùng để đo độ tương tự tên đối tượng; độ tương tự Q-GRAM dùng để đo độ tương tự comment đối tượng 31 Đỗ Thị Ngọc Khang, Phạm Thị Anh Lê ontology; độ tương tự JARO-WINKLER đo độ tương tự nhãn (label) đối tượng Hàm SIMCL (dùng ba thuật toán - tùy theo kiểu thành phần tương ứng), trọng số gán cho phần descriptor IID Độ tương tự ngơn ngữ cho: lớp, thuộc tính thể (class, properties instance) tính: Với lớp, thể ta xét nhãn, thích (label comment) tên lớp (thể hiện); thuộc tính ta xét bổ sung phần độ tương tự cho type (character), cho tổng trọng số (độ tương tự) Riêng trường hợp lớp tương đương với lớp xét (có thể kèm ràng buộc) độ tương tự ngơn ngữ cho thành phần tính sau: Nếu phần mô tả lớp tương đương đơn giản tên lớp tương đương không ràng buộc, ta xét bình thường với thuộc tính khác Cịn mệnh đề phức hợp, ta tiến hành lọc mệnh đề danh sách lớp tương đương, sau thực sinh mệnh đề tương đương với mệnh đề xét cho thuộc tính owl:intersectionOf (and), owl:unionOf (or), owl:oneOf (tập hợp) có tính chất giao hốn Xét ví dụ: Phần mã mô tả trên: “Accomodation and has_Rating some OneStarRating, TwoStarRating” Và mệnh đề tương đương với mệnh đề sau: “has_Rating some OneStarRating, TwoStarRating and Accomodation; has_Rating some” “TwoStarRating , OneStarRating and Accomodation; Accomodation and has_Rating some TwoStarRating, OneStarRating” Sau thực xong bước ta tiến hành đánh giá độ tương tự mệnh đề Chúng tơi sử dụng thuật tốn Q-GRAM similarity, thuật tốn thích hợp để đo độ tương tự xâu dài, lọc lấy cặp mệnh đề có độ tương tự lớn tính vào độ tương tự cặp đối tượng Với độ tương tự láng giềng cấp 2, ta khơng xét láng giềng lớp có ràng buộc kèm theo, xét láng giềng lớp ràng buộc đối sánh độ tương tự ngơn ngữ cho phần mơ tả lớp tương đương có ràng buộc sau sinh mô tả tương đương dựa theo quy tắc trình bày Ta thấy rằng, độ tương tự ngôn ngữ thành phần quan trọng chưa đủ để đánh giá độ tương tự đối tượng Do vậy, tiến hành đo độ tương tự láng giềng 32 Một phương pháp gióng hàng Ontology OWL-DL 2.2.3 Độ tương tự láng giềng Trọng số gán cho độ tương tự ngôn ngữ IIC cho láng giềng IIL Độ tương tự láng giềng tính độ tương tự ngôn ngữ cặp nút độ tương tự cấu trúc cặp nút Các nút láng giềng tổ chức theo cấu trúc category (nút có kiểu): có hai cấp láng giềng Láng giềng cấp 1: láng giềng trực tiếp class, instances properties Chúng có quan hệ trực tiếp với nút xét Các ontology kiểu đưa vào nhóm Láng giềng cấp (khơng trực tiếp): có quan hệ trực tiếp với nút xét mục láng giềng cấp 1, tính tương tự với láng giềng cấp Cơng thức tính dựa hàm MSim [6] với vectơ VN1 VN2 ứng với ontology (N1 N2 ): ′ (i,i′ )∈P airs(E,E ′ ) SimCLS (i, i ) M ax(|E|, |E ′ |) ′ M sim(E, E ) = (2.1) Trong đó, SimCLS độ tương tự ngôn ngữ cặp (i, i′ ) tập (E, E ′ ), thành phần kiểu tương ứng hai ontology xét Tổng độ đo SimCLS giá trị lớn độ đo SimCLS theo cặp (i, i′ ) Max(|E|, |E ′ |) số phần tử tập lớn hai tập E E ′ xét Độ tương tự láng giềng tính theo công thức: SimN = ( i∈(1,2) ( V i (E,E ′ ) (E,E ′ ) M Sim(E, E ′ ))) (2.2) Ở đó, i mức (level), IIV IIV gán mặc định giá trị 0.8 0.2 tương ứng Tỉ lệ II(E,E ′ ) tính tùy theo kiểu nhóm láng giềng Bước chúng tơi tính độ tương tự tổng thể cho cặp đối tượng 2.2.4 Độ tương tự tổng thể Độ tương tự tổng thể hai cặp đối tượng tính dựa độ tương tự ngơn ngữ độ tương tự láng giềng SimA (e1 , e2 ) = SimCL (e1 , e2 ) + CL SimN (e1 , e2 )[3] (2.3) N Với IICL IIN hệ số tương ứng cho IICL + IIN = Lúc ta có độ tương tự cặp đối tượng, làm để đối tượng nhóm A ontology chọn đối tượng nhóm A ontology cho tổng độ tương tự hai nhóm cao Nếu điều thỏa mãn độ tương tự cặp đối tượng nhóm lọc cặp có độ tương tự lớn Để thực điều đó, chúng tơi sử dụng thuật tốn Hungary 2.2.5 Thuật tốn Hungary Bài tốn phát biểu sau: Có m đối tượng nhóm ontology (đánh số 1, ,m), n đối tượng nhóm ontology (đánh số 1, ,n) Mỗi đối tượng nhóm có độ tương tự định với đối tượng nhóm Ta cần ghép cặp đối tượng cho độ tương tự c[i, j] >= r (giá trị ngưỡng) Cần ghép đối tượng nhóm với đối tượng nhóm cho tổng độ tương tự đạt giá trị lớn Để giải tốn trên, chúng tơi xây dựng đồ thị hai phía đầy đủ G = (XU Y, E) (với X = {x[1], x[2], , x[m]} Y = {y[1], y[2], , y[n]}) ma trận C kích cỡ m × n 33 Đỗ Thị Ngọc Khang, Phạm Thị Anh Lê có C[i, j] = trọng số cạnh nối cặp đỉnh x[i] y[j] Giả thiết C[i, j] >= r (r giá trị ngưỡng) (với i, j) Trước áp dụng thuật toán Hungary, ta chuyển ma trận C thành ma trận D quy tắc giá trị phần tử D giá trị phần tử lớn ma trận C trừ giá trị thời phần tử Việc tìm ghép đầy đủ trọng số nhỏ ghép cặp đối tượng cần tìm Định lí 1: Loại bỏ khỏi G cạnh trọng số lớn Nếu cạnh có trọng số cịn lại tạo ghép k cạnh G ghép cần tìm Định lí 2: Với đỉnh x[i], ta cộng thêm số ∆ (dương hay âm) vào tất cạnh liên thuộc với x[i] (tương đương với việc cộng thêm ∆ vào tất phần tử thuộc hàng i ma trận C) khơng ảnh hưởng tới ghép đầy đủ có trọng số nhỏ Như vậy, ta thấy ý tưởng thuật toán là: Từ đồ thị G, ta tìm chiến lược cộng trừ cách hợp lí trọng số cạnh liên thuộc với đỉnh để đồ thị mà có cạnh trọng số khơng âm, cạnh trọng số đồ thị chứa ghép đầy đủ k cạnh [7] Cuối cùng, thực định dạng lại file theo mẫu phù hợp Phần tiếp theo, chúng tơi trình bày số đánh giá từ số liệu đầu vào thử nghiệm hệ thống 2.3 Thử nghiệm Hình Cặp ontology t1.owl t2.owl xây dựng Protégé Chúng xây dựng hệ thống thử nghiệm để thực gióng hàng ontology với cặp ontology biểu diễn ngôn ngữ OWL-DL sử dụng hệ soạn thảo Protégé Hệ thống viết ngôn ngữ lập trình java soạn thảo NetBean có sử dụng số thư viện như: jena api (hỗ trợ tạo đồ thị rdf), simmetrics (gói thư viện hỗ trợ tính tốn độ tương tự số độ thường gặp như: LEVENSHTEIN, Q-GRAM JARO-WINKLER) kĩ thuật sử dụng gióng hàng cho ontology sử dụng ngơn ngữ mô tả OWL-DL Hệ thống cho phép người dùng chọn hai OWL-DL ontology khác có chủ đề Cụ thể, sử dụng hai file biểu diễn hai ontology chủ đề du lịch: t1.owl t2.owl Sau đó, chúng tơi chọn giá trị ngưỡng cho độ tương tự tính Khi kích hoạt chức “Alignment”, hệ thống tiến hành tính độ tương tự cặp đối tượng kiểu 34 Một phương pháp gióng hàng Ontology OWL-DL hai ontology xuất file RDF (cho phép mở hiệu chỉnh hệ soạn thảo Protégé) gồm cặp đối tượng hai ontology với độ tương tự tương ứng đạt giá trị ngưỡng có cấu trúc sau: thay Hình 2.Mẫu file kết sinh ODA Hình Mẫu file kết sinh OLA Dễ thấy, nội dung file phần mơ tả RDF gồm: subject lớp, cá thể, thuộc tính; predicate subClassOf (với subject lớp), subPropertyOf (với subject thuộc tính) sameAs (với subject cá thể); object lớp (với subject lớp), cá thể (với subject cá thể) thuộc tính (với subject thuộc tính) Cách mơ tả dễ hiểu với người dùng, việc hiệu chỉnh đảm bảo phù hợp với công cụ trợ giúp tạo ontology từ hai ontology ban đầu Kèm theo với thuộc tính kiểu liệu float có giá trị độ tương tự cặp đối tượng xét Sau mẫu minh họa: 0.9800000190734863 Đoạn mã mô tả lớp has_Rating travel2.owl thuộc tính lớp has_Rating travel1.owl với độ xác đạt 0.9800000190734863 Nếu muốn hai lớp tương đương với độ xác 0.9800000190734863 ta cần bổ sung đoạn mã mơ tả lớp has_Rating travel1.owl thuộc tính lớp has_Rating travel2.owl với độ xác đạt 0.9800000190734863 Kết thu cho thấy: hệ thống có xét láng giềng mức đánh giá độ tương tự đối tượng nên độ xác cao Xem bảng với cặp: Hoatdong Activity Đối với lớp có cha khơng có hệ thống ưu tiên lớp lớp cha nên độ tương tự giảm xuống chút so với OLA Xét cặp: Safari Safari bảng Với lớp có lớp cha lớp con, lớp cha hệ thống xét không quan trọng danh sách lớp nên độ tương tự tính hệ thống lớn so với độ tương tự tính OLA Xét cặp Adventure Adventure bảng Với hai lớp có chung phần lớp tương đương hệ thống ưu tiên cho phần 35 Đỗ Thị Ngọc Khang, Phạm Thị Anh Lê mơ tả cao cho thuộc tính khác Xét trường hợp cặp Rating Phanloai bảng Phần cá thể, hệ thống tiến hành đối sánh đánh giá độ tương tự bảng Bảng Độ tương tự số đối tượng mẫu tính ODA OLA t1.owl Accommodation Safari Adventure Phanloai Hoatdong Camp TwoStarRating ThreeStarRating OneStarRating VungTau Samson Contact Beach Has_City Has_Rating Dichden t2.owl Accommodation Safari Adventure Rating Activity Camtrai TwoStarRating ThreeStarRating OneStarRating Accomodation Samson Contact Beach HasCity hasRating Destination OLA 1.0 0.937 0.79 Khơng tính Khơng tính 0.6 Khơng tính Khơng tính Khơng tính Khơng tính Khơng tính 1.0 0.8981818181818182 1.0 0.7390909090909092 0.49090909090909085 ODA 0.6623176336288452 0.865600049495697 0.9056875705718994 0.5390900373458862 0.4767000377178192 0.6483891010284424 0.5779600143432617 0.5779600143432617 0.5779600143432617 0.9869091510772705 0.9869091510772705 0.6801999807357788 0.9465892314910889 0.9226250648498535 0.5769439935684204 0.6290644407272339 Trong phần đánh giá độ tương tự ngơn ngữ, có nhiều thuật tốn để thực cơng việc theo kinh nghiệm [6] thì: LEVENSHTEIN similarity (thuật tốn desktop) dùng để đo độ tương tự tên đối tượng; Q-GRAM similarity dùng để đo độ tương tự comment đối tượng ontology; JARO-WINKLER similarity đo độ tương tự nhãn (label) hai đối tượng phù hợp Đồng thời nên thiết lập tỉ lệ name, comment label tùy theo đối tượng có đủ ba thành phần hay khơng Nếu có đủ ba thành phần tỉ lệ: name (buộc có): comment: label là: 0.8 : 0.1 : 0.1 Đối với tỉ lệ độ tương tự ngôn ngữ độ tương tự láng giềng, láng giềng có vai trị quan trọng nên đặt tỉ lệ 0.3: 0.7 Các láng giềng chia thành nhóm khác Chúng đề xuất đặt trọng số cho nhóm dựa mức độ quan trọng nhóm Như vậy, chúng tơi nhận thấy với số điều chỉnh, hệ thống ODA đánh giá độ tương tự cho lớp có ràng buộc equivalent Class xét độ tương tự láng giềng cấp bổ sung vào độ tương tự đối tượng xét để kết xác Kết trả cặp đối tượng cho tổng độ tương tự nhóm lớn Kết luận Trên sở tìm hiểu kĩ thuật gióng hàng cho cặp ontology sử dụng ngôn ngữ mô tả OWL-Lite OWL-DL, bước đầu đề xuất phương pháp tính độ tương tự thành phần cặp OWL-DL ontology Kết đánh giá hệ thống gióng hàng ontology lĩnh vực du lịch, đạt kết tốt so với OLA Tuy nhiên, hệ thống tồn hạn chế sau: phần lớp equivalent có ràng buộc 36 Một phương pháp gióng hàng Ontology OWL-DL đối sánh dạng mệnh đề mơ tả xét cho lớp, chưa có chức hỗ trợ suy luận; Cịn với thuộc tính đối tượng, chưa xét tới mệnh đề tương đương có ràng buộc Ngồi ra, phần tính độ tương tự ngôn ngữ, hệ thống chưa xét tới độ tương tự wordnet Chúng đề xuất bổ sung cách sử dụng thư viện wordnet xét thêm vào phần độ tương tự ngôn ngữ Nếu độ tương tự wordnet lớn lấy độ tương tự thay Phần thiết lập trọng số cho thành phần láng giềng dựa kinh nghiệm tác giả, chưa có đánh giá so sánh với lựa chọn khác Để chọn hệ số tốt, ta cần khảo sát liệu lớn để tìm nhóm láng giềng quan trọng Tuy nhiên, với liệu lớn để duyệt toàn hai mức láng giềng tốn nhiều thời gian Chúng thấy cần cải tiến cách duyệt truy xuất sở liệu lớn để bảo đảm tính tối ưu cho hệ thống Trong thời gian tới, bổ sung thêm nhiều độ đo để tính độ tương tự ngôn ngữ để đảm bảo hiệu cao hơn; cải tiến hiệu thuật tốn tính toán độ tương tự; nghiên cứu việc lựa chọn hệ số láng giềng cho phù hợp để đảm bảo tính tối ưu cho kết tính tốn TÀI LIỆU THAM KHẢO [1] Gruber, R, A Translation, 1993 Approach to Portable Ontology Specification Knowledge Acquisition 5, pp 199-200 [2] J Euzenat, P Valtchev, 2004 Similarity-based ontology alignment in OWL-Lite, Université du Québec Montréal ACEI, pp 333-343 [3] Marc Ehrig 2007 Ontology Alignment Bridging the Semantic Gap Springer [4] Patrizia Ghislandi, ISBN 978-953-51-0475-9, 2013 Hard cover Publisher: InTech eLearning Theories, Design, Software and Applications, 73 [5] The core RDF API, http://jena.apache.org/documentation/rdf/ Copyright c 2011-2012 The Apache Software Foundation, Licensed under the Apache License, Version 2.0 [6] Sami ZGHAL1, Marouen KACHROUDI, Sadok BEN YAHIA and Engelbert MEPHU NGUIFO - OACAS: results for OAEI 2011 [7] Lê Minh Hoàng, Giải thuật lập trình 1999 - 2002, 283 - 300 [8] Marek Obitko, http://www.obitko.com/tutorials/ontologies-semantic-web/owl-dl-semantics.html, Department of Cybernetics, Faculty of Electrical Engineering Czech Technical University, Prague, Czech Republic, 2007 ABSTRACT An Ontology Alignment method in OWL-DL This paper presents the alignment method of ontologies (Ontology Alignment) in OWL-Lite and OWL-DL We study the OLA (Owl Lite Alignment) tool with a mapping method for OWL-Lite ontologies As a result, we propose a method for computing the similarity of components between OWL-DL ontologies This method is performed on the specific ontology components and is tested by an OWL-DL Alignment (ODA) system Experimental evaluation shows that the result of our system achieved were highly accurate 37 ... OLA có tham khảo phương pháp gióng hàng ontology với cặp ontology sử dụng ngôn ngữ mô tả OWL-DL OAEI đánh giá năm 2011, kết hợp 30 Một phương pháp gióng hàng Ontology OWL-DL với số điều chỉnh: bổ.. .Một phương pháp gióng hàng Ontology OWL-DL tốn gióng hàng ontology OLA thực với bốn bước Đầu tiên, xây dựng mơ hình đồ thị OL-graph [2] biểu diễn ontology OWL-Lite Bước... thuật gióng hàng cho cặp ontology sử dụng ngôn ngữ mô tả OWL-Lite OWL-DL, bước đầu đề xuất phương pháp tính độ tương tự thành phần cặp OWL-DL ontology Kết đánh giá hệ thống gióng hàng ontology

Ngày đăng: 14/11/2020, 08:04

TỪ KHÓA LIÊN QUAN

w