Các bảng, các thuộc tính, khóa chính được ánh xạ thành các đối tượng của các lớp đặc biệt dùng để mô tả các đặc trưng của một cơ sở dữ liệu quan hệ và được lưu thành một tập tin lược đ[r]
(1)MƠ HÌNH HĨA TRI THỨC CHO MỘT CƠ SỞ DỮ LIỆU QUAN HỆ
BẰNG ONTOLOGY WEB LANGUAGE
Huỳnh Tuấn Anha*
aKhoa Công nghệ Thơng tin, Trường Đại học Nha Trang, Khánh Hịa, Việt Nam
Lịch sử báo
Nhận ngày 10 tháng 01 năm 2017 | Chỉnh sửa ngày 10 tháng 04 năm 2017 Chấp nhận đăng ngày 11 tháng 05 năm 2017
Tóm tắt
Trong báo này, chúng tơi trình bày phương pháp mơ hình hóa tri thức sở liệu quan hệ Ontology Web Language (OWL) Kết đạt bao gồm luật chuyển đổi liệu từ sở liệu quan hệ sang Ontology Axiom bổ sung ngữ nghĩa cho cơ sở liệu quan hệ Dựa luật này, liệu mơ hình quan hệ chuyển đổi thành ba RDF/OWL cho ứng dụng Sematic web
Từ khóa: Mapping; Ontology; OWL; Relational Database; RDF; RDFS; Semantic web
1 GIỚI THIỆU
Sematic web, hay gọi Web 3.0, biểu diễn trang web có nội dung mà máy tính hiểu Trong Sematic web, liệu lưu trữ ba RDF/OWL hay cịn gọi Ontology Các thơng tin lưu trữ Ontology xem sở liệu có khả liên kết tồn cầu OWL hình thức đặc tả liên kết liệu cách có ngữ nghĩa máy tính hiểu xử lý liệu cách tự động Ngoài ra, liệu ứng dụng Semantic web chia sẻ phạm vi toàn cầu Dữ liệu ứng dụng Semantic web truy vấn từ nhiều nguồn tích hợp lại với cách trực tiếp Tuy nhiên, phần lớn liệu ứng dụng hệ web lại lưu trữ sở liệu quan hệ Do đó, toán quan trọng tạo Ontology từ liệu web có sở liệu quan hệ
(2)
Trong báo này, tiếp tục phát triển nghiên cứu Huỳnh (2015), chúng tơi trình bày bổ sung, hồn thiện luật chuyển đổi từ sở liệu quan hệ sang Ontology Các bổ sung bao gồm luật chuyển đổi số mối kết hợp thành thuộc
tính owl: TransitiveProperty, luật chuyển đổi bảng liệu kết hợp (bảng liệu có
thành phần khóa khóa ngoại), luật chuyển đổi ghi thành Ontology Bài báo có cấu trúc sau: Mục giới thiệu mở đầu, nghiên cứu liên quan trình bày Mục Mục trình bày khái niệm sở liệu quan hệ OWL Ontology Mục trình bày luật chuyển đổi sở liệu quan hệ sang Ontology Ví dụ minh họa luật chuyển đổi trình bày Mục Phần đánh giá luật trình bày Mục
2 CÁC NGHIÊN CỨU LIÊN QUAN
Ayoub, Mohamed, Ilias (2015) đề xuất cách ánh xạ sở liệu quan hệ tới Ontology sẵn có mà giữ nguyên cấu trúc sở liệu Các bảng, thuộc tính, khóa ánh xạ thành đối tượng lớp đặc biệt dùng để mô tả đặc trưng sở liệu quan hệ lưu thành tập tin lược đồ có
tên “Abstract.OWL” Dữ liệu sở liệu quan hệ sau rút trích thành
tập tin RDF theo qui tắc tập tin lược đồ Ontology cần thiết xây dựng
các mệnh đề “CONSTRUCT” thực truy vấn “SPARQL” từ liệu RDF trung
gian
Raji Nadine (2007); Sufeng, Haiyun, Mei, Huaiwei (2010); Mallede, Marir, Vassilev (2013) đề xuất cách mô tả sở liệu quan hệ thành Ontology Trước hết, sở liệu quan hệ mô tả thành Ontology Các bảng mô tả thành lớp, thuộc tính mơ tả thành DataType Property Các thuộc tính khóa ngoại mơ tả thành Object Property có tính tương hỗ Tuy nhiên, hầu hết đề xuất chủ yếu trọng đến mô tả bảng, mối kết hợp sở liệu, việc chuyển đổi liệu đơn giản chuyển ghi thành đối tượng
(3)tri thức có Bên cạnh lớp, thuộc tính mơ tả sở liệu quan hệ, cần phải bổ sung thêm lớp hỗ trợ việc suy luận như: Suy luận bắc cầu, suy luận tương hỗ, suy luận xác định đối tượng Việc chuyển đổi đối tượng phải trọng đến tri thức riêng lĩnh vực mơ hình hóa khơng đơn chuyển đổi ghi thành đối tượng
3 CƠ SỞ DỮ LIỆU VÀ ONTOLOGY
Trong phần này, giới thiệu số khái niệm sở liệu OWL Ontology Mục 3.1 3.2 Dựa vào đặc tính tương đồng hai, chúng tơi trình bày bổ sung số luật chuyển đổi từ mơ hình quan hệ sang Ontology Mục Ngoài ra, luật chuyển đổi mối kết hợp thành thuộc tính
owl:TransitiveProperty, owl:propertyChainAxiom, owl:inverseOf bổ sung để hỗ trợ việc suy luận ứng dụng Semantic web Ontology
3.1 OWL Ontology
OWL ngơn ngữ mơ hình hóa tri thức, thiết kế để trình bày, trao đổi tri thức lĩnh vực cụ thể OWL xem ngôn ngữ đa mạnh mẽ để mô hình hóa lĩnh vực định tri thức nhân loại Kết tiến trình mơ hình hóa Ontology - Là thuật ngữ biểu diễn tri thức Một số khái niệm OWL là:
• Axioms: Các mệnh đề mà OWL Ontology biểu diễn Một Axiom OWL đánh giá
• Entities (Các thực thể): Các phần tử sử dụng để đối tượng giới thực
• Expressions (Các biểu thức): Sự kết hợp thực thể để hình thành biểu diễn phức tạp
(4)lớp tổ chức theo phân cấp thơng qua việc định nghĩa lớp
con Ví dụ: Lớp Động_Vật lớp Lớp Sinh_Vật
• Properties (Các thuộc tính): Cịn gọi mối kết hợp (relations) dùng để
biểu diễn đặc tính đối tượng (object) hay mối liên hệ đối
tượng, ví dụ John Kết_hơn Marry hay John Sinh_năm 1980 Trong OWL,
thuộc tính chia làm hai loại: DataType Properties dùng để gán
giá trị liệu cho đối tượng Object Properties dùng để biểu diễn mối
kết hợp đối tượng Trong OWL, khác với sở liệu ngơn ngữ lập trình hướng đối tượng, thuộc tính định nghĩa độc lập với lớp Khi chúng sử dụng, đối tượng nhận biết thuộc
lớp dựa vào chủ thể (domain) giá trị (range) thuộc tính
• Restriction (ràng buộc): Các Ontology mô tả ràng buộc giá trị (range)
của thuộc tính ràng buộc chủ thể (domain) thuộc
tính
3.2 Cơ sở liệu quan hệ
Cơ sở liệu quan hệ mơ hình liệu dựa lý thuyết quan hệ Một sở liệu tổ chức thành bảng, bảng bao gồm nhiều thuộc tính
• Bảng liệu: Tập hợp liệu có tập thuộc tính, liệu thường biểu diễn thông tin đối tượng
• Thuộc tính: Dùng để mơ tả đặc tính đối tượng Mỗi thuộc tính phải
có kiểu liệu gọi domain Thuộc tính sở liệu quan hệ chia thành dạng: 1) Thuộc tính thơng thường; 2) Thuộc tính thành phần khóa chính; 3) Thuộc tính khóa ngoại Các thuộc tính dạng
và xem thuộc tính dạng DataType Property OWL, cịn
các thuộc tính dạng tương đồng với Object Property OWL
(5)có thể bao gồm: Ràng buộc khóa; Ràng buộc toàn vẹn; Ràng buộc miền liệu thuộc tính; Ràng buộc liệu; Trigger
3.3 Một sốđịnh nghĩa ký hiệu 3.3.1 Các ký hiệu
• Ω tập bảng sở liệu D T bảng thuộc tập Ω.
• PK(T) tập thuộc tính làm khóa bảng T
• FK(T) tập thuộc tính khóa ngoại bảng T
• FK(Ti, Tj) khóa ngoại, tên FK, bảng Tj tham chiếu đến khóa
của bảng Tj
• A(T) tập thuộc tính khơng phải khóa khóa ngoại bảng
T Ta ký hiệu A thuộc tính xsdIRI(A) IRI kiểu liệu xsd
tương ứng với kiểu liệu thuộc tính A
• t(T) tập ghi bảng liệu T; t ghi, t.A giá trị
thuộc tính A liệu t
3.3.2 Các định nghĩa
Định nghĩa (Bảng quan hệ nhị phân): Một bảng T gọi bảng quan hệ
nhị phân PK(T) = FK(T) Card(FK(T)) = 2 và A(T) =
Tập bảng quan hệ nhị phân ký hiệu ΩB
Định nghĩa (Bảng chuyên biệt hóa): Một bảng T gọi bảng chuyên biệt hóa
của bảng TP có khóa ngoại FK(T, TP) khóa ngoại
khóa T
Ký hiệu bảng T bảng chuyên biệt hóa bảng TP là: T isa TP Tập bảng
(6)Định nghĩa (Bảng kết hợp): Một bảng T gọi bảng kết hợp khơng
phải bảng quan hệ nhị phân FK(T)PK(T) Card(FK(T)2
Tập bảng kết hợp ký hiệu ΩR
Cơ sở liệu quan hệ đề cập đến báo sở liệu quan hệ đạt chuẩn Các bảng bảng quan hệ nhị phân bảng kết hợp có khóa có số thuộc tính
4 CÁC LUẬT CHUYỂN ĐỔI TỪCƠ SỞ DỮ LIỆU QUAN HỆ SANG
ONTOLOGY
Trong mục này, chúng tơi trình bày luật chuyển đổi sở liệu quan hệ sang Ontology Các khơng gian tên cài đặt cách thích hợp trường hợp chuyển đổi khác Trong báo này, đề xuất không gian
tên IRI sau:
• IRI tiền tố lớp, đối tượng, thuộc tính chuyển đổi:
@prefix pre: <IRI sở liệu>
• IRI lớp chuyển đổi: pre:Tên bảng liệu
IRI thuộc tính khơng phải khóa ngoại: pre: Tên bảng + "-" + Tên thuộc tính
• IRI thuộc tính chuyển đổi từ khóa ngoại:
pre:Tên Bảng + "-" + Tên thuộc tính + "_" + Tên bảng tham chiếu
• Mỗi individual chuyển đổi từ liệu có IRI:
pre: Tên bảng + "ID_" + Định danh liệu
(7)chuyển đổi Để cho đơn giản, luật sau chúng tơi khơng thêm prefix pre phía
trước tên lớp hay tên thuộc tính OWL Ví dụ: Declaration (DataProperty (proName, C,
xsd: string)) khai báo thuộc tính proName có domain lớp C range
xsd:string
Các luật: 1, 3, 5, 11, 12, 13 kế thừa từ kết Zhou ctg (2010), luật 2, 4, kế thừa từ Huỳnh (2015) Luật: 6, 7, 8, 10, 14 luật đề xuất báo
• Luật Chuyển đổi bảng liệu
)) ( ( )
(T Declaration Class T
T B
• Luật 2. Chuyển đổi bảng chuyên biệt hóa
) , ( )
(T isa TP SubClassOf T TP
T
• Luật Chuyển đổi thuộc tính khơng phải khóa khóa ngoại
sdIRI(A))) (T-A, T, x
n( Declaratio A(T)
A DataProperty
• Luật Chuyển đổi khóa gồm thuộc tính
)) xsdIRI(A) T, A, erty(T n(DataProp Declaratio ) (T 1) )) (Card(PK(T PK(T) S A
Tùy chọn: [HasKey(T, T-A)]
Việc sử dụng tùy chọn HasKey tùy thuộc vào mục đích ứng dụng ý nghĩa
trường khóa PK Nếu PK khóa tự nhiên số chứng minh nhân dân, lái
xe , ta nên sử dụng tùy chọn HasKey cho mục đích suy luận đồ thị RDF
hỗ trợ cho việc suy luận SameAs liệu RDF tích hợp từ nhiều nguồn sau Nếu
PK khóa giả (artificial key), tức khóa phục vụ mục đích phân biệt liệu
trong bảng, tùy chọn HasKey bỏ qua Chú ý khóa bảng chun biệt