Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 26 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
26
Dung lượng
0,96 MB
Nội dung
ĐẠI HỌC ĐÀ NẴNG TRƯỜNG ĐẠI HỌC SƯ PHẠM NGUYỄN THỊ PHƯƠNG THẢO PHÁT TRIỂN MƠ HÌNH TRUY VẤN DỮ LIỆU TÙY CHỌN DỰA TRÊN NGỮ NGHĨA CỦA CÂU TRUY VẤN NL2SQL-SPARQL: TRƯỜNG HỢP CÂU TRUY VẤN INSERT, UPDATE Chuyên ngành : Hệ thống thông tin Mã số : 61.49.01.04 TĨM TẮT LUẬN VĂN THẠC SĨ HỆ THỐNG THƠNG TIN Đà Nẵng – Năm 2017 Cơng trình hồn thành TRƯỜNG ĐẠI HỌC SƯ PHẠM - ĐHĐN Người hướng dẫn khoa học : TS HOÀNG THỊ THANH HÀ Phản biện : TS Nguyễn Trần Quốc Vinh Phản biện : TS Nguyễn Quang Thanh Luận văn bảo vệ trước Hội đồng chấm Luận văn tốt nghiệp thạc sỹ chuyên ngành Hệ thống thông tin họp Đại Học Sư phạm vào ngày 30 tháng năm 2017 Có thể tìm hiểu luận văn : - Trung tâm Học liệu, Đại Học Đà Nẵng trường Đại học Sư phạm - Thư viện Khoa Tin học, Trường Đại học Sư phạm, ĐHĐN MỞ ĐẦU Tính cấp thiết đề tài Workflow hay tiến trình q trình tự động hóa cơng việc, phần tồn Trong q trình đó, tài liệu, thông tin hay nhiệm vụ đƣợc truyền từ đối tƣợng tham gia sang đối tƣợng khác để hành động tuân theo tập hợp quy tắc định Một vấn đề đặt nghiên cứu tiến trình lập liệu cá nhân việc thực thi phân tán tiến trình bao gồm nhiều cơng cụ thực thi cục bộ, đƣợc gọi máy thực thi Nguyên tắc cô lập không cho phép truy cập vào liệu cá nhân máy thực thi ngƣời khác Lấy ví dụ lĩnh vực y tế, xem xét tiến trình điều trị bệnh tim mạch, tiến trình có nhiều đối tƣợng tham gia nhƣ bệnh nhân, bác sĩ điều trị, bác sĩ phẩu thuật, trung tâm xét nghiệm, trung tâm chẩn đốn hình ảnh Các đối tƣợng khơng tập trung địa điểm, không chia sẻ hạ tầng thơng tin liệu điều trị họ phân tán Dữ liệu điều trị nằm nhiều địa điểm khác dƣới nhiều hình thức khác nhau, ví dụ nhƣ có sở liệu MySQL, liệu ngữ nghĩa RDF, hay tổ chức MongoDB Nhiều hình thức sở liệu gây khó khăn cho hệ thống ngƣời dùng muốn truy vấn vào kho liệu mà họ cần tra cứu, chẳng hạn bác sĩ điều trị muốn truy vấn liệu từ trung tâm xét nghiệm chẳng hạn Để giúp ngƣời dùng truy vấn cách dễ dàng với mơ hình sở liệu, mà phổ biến sở liệu ngữ nghĩa sở liệu quan hệ, [5] tác giả đề xuất mơ hình truy vấn liệu tùy chọn dựa ngữ nghĩa câu truy vấn, mơ hình đề xuất giải pháp truy vấn hai mơ hình CSDL CSDL quan hệ CSDL ngữ nghĩa với câu truy vấn ngôn ngữ tự nhiên Tuy nhiên báo [5] phát triển mô hình với từ điển ngữ nghĩa giới hạn cho câu truy vấn SELECT, để mở rộng khả ứng dụng mơ hình thực tế, đề xuất lựa chọn đề tài: “Phát triển mô hình truy vấn liệu tùy chọn dựa ngữ nghĩa câu truy vấn NL2SQL-SPARQL: Trường hợp câu truy vấn insert, update” Mục tiêu Mục tiêu đề tài phát triển hồn thiện mơ hình NL2SQL - SPARQL để thực thi truy vấn đa dạng nhƣ INSERT, UPDATE, truy vấn ngôn ngữ tự nhiên Để thoả mãn mục tiêu cần đạt đƣợc mục tiêu cụ thể sau: - Nắm vững cách tổ chức & truy vấn mơ hình sở liệu phổ biến - Nắm vững ngôn ngữ truy vấn SPARQL sở liệu ngữ nghĩa RDF - Nắm vững cách chuyển đổi từ câu truy vấn tự nhiên theo cấu trúc cho trƣớc sang câu truy vấn mơ hình sở liệu - Nền tảng có khả đƣa câu truy vấn đề nghị tƣơng ứng với cấu trúc loại sở liệu lựa chọn Đối tƣợng phạm vi nghiên cứu 3.1 Đối tượng nghiên cứu Đối tƣợng nghiên cứu - Cách tổ chức cú pháp truy vấn liệu mơ hình sở liệu phổ biến nhƣ: Cơ sở liệu ngữ nghĩa, sở liệu quan hệ - Cách chuyển đổi từ câu truy vấn ngôn ngữ tự nhiên sang câu truy vấn ngữ nghĩa - Ngôn ngữ truy vấn SQL mô hình sở liệu quan hệ - Ngôn ngữ truy vấn SPARQL Web ngữ nghĩa 3.2 Phạm vi nghiên cứu Trong khuôn khổ luận văn thuộc loại nghiên cứu, giới hạn nghiên cứu vấn đề sau: - Giới hạn chuyển đổi câu truy vấn INSERT UPDATE từ SPARQL sang loại sở liệu lựa chọn Phƣơng pháp nghiên cứu Phƣơng pháp lý thuyết - Tiến hành thu thập nghiên cứu tài liệu có liên quan đến đề tài Phƣơng pháp thực nghiệm - Thực xây dựng hệ thống từ kết nghiên cứu lý thuyết đáp ứng mục tiêu đặt - Kiểm tra, thử nghiệm, nhận xét đánh giá kết Kết dự kiến 5.1 Lý thuyết Hoàn thiện đƣợc mơ hình NL2SQL-SPARQL để thực thi truy vấn đa dạng nhƣ INSERT, UPDATE truy vấn ngôn ngữ tự nhiên 5.2 Thực tiễn Mô hình thực nghiệm cho kết nhƣ dự kiến Bố cục luận văn Luận văn dự kiến tổ chức thành chƣơng nhƣ sau: Chƣơng 1: TỔNG QUAN VỀ CÁC MƠ HÌNH CƠ SỞ DỮ LIỆU CHƢƠNG 2: NGÔN NGỮ TRUY VẤN CƠ SỞ DỮ LIỆU QUAN HỆ VÀ CƠ SỞ DỮ LIỆU NGỮ NGHĨA CHƢƠNG 3: PHÁT TRIỂN HỆ THỐNG TRUY VẤN DỮ LIỆU TÙY CHỌN DỰA TRÊN NGỮ NGHĨA CỦA CÂU TRUY VẤN CHƢƠNG TỔNG QUAN VỀ CÁC MƠ HÌNH CƠ SỞ DỮ LIỆU Chƣơng trình bày tổng quan về: khái niệm sở liệu mơ hình sở liệu liên quan trực tiếp tới luận văn, tổ chức cấu trúc câu truy vấn sở liệu quan hệ SQL sở liệu ngữ nghĩa SPARQL 1.1 CƠ SỞ DỮ LIỆU LÀ GÌ? Cơ sở liệu (Database), viết tắt CSDL DB, tập hợp liệu có quan hệ logic với nhau, dễ dàng chia sẻ đƣợc thiết kế nhằm đáp ứng nhu cầu sử dụng tổ chức, cá nhân * Vai trò CSDL? Ngày nay, CSDL trở thành phần thiếu hoạt động đời sống hàng ngày Mỗi ngày, bạn sử dụng nhiều CSDL khác nhau, nhiều lần khác nhƣng lại khơng nhận điều 1.1 Vị trí CSDL hệ thống 1.2 PHÂN LOẠI CÁC MƠ HÌNH CƠ SỞ DỮ LIỆU Mơ hình liệu tập hợp tích hợp khái niệm để mơ tả thao tác liệu, mối quan hệ mơ hình liệu ràng buộc liệu tổ chức 1.2.1 Cơ sở liệu ngữ nghĩa Tim Berners-Lee đề xuất kiến trúc lớp cho web ngữ nghĩa mà thƣờng đƣợc biểu diễn sơ đồ 1.2: Kiến trúc lớp Web ngữ g ĩa Hình 1.2 cho thấy lớp web ngữ nghĩa, mơ tả lớp thiết kế Web ngữ nghĩa tầm nhìn 1.2.2 Cơ sở liệu quan hệ Cơ sở liệu quan hệ tập hợp quan hệ tiêu chuẩn hóa với tên gọi quan hệ riêng biệt [15] Các dạng chuẩn hóa sở liệu quan hệ - Chuẩn hoá trình tách bảng (phân rã) thành bảng nhỏ dựa vào phụ thuộc hàm - Các dạng chuẩn dẫn để thiết kế bảng CSDL - Mục đích chuẩn hố loại bỏ dƣ thừa liệu lỗi thao tác dƣ thừa lỗi thao tác liệu (Insert, Delete, Update) - Nhƣng chuẩn hoá làm tăng thời gian truy vấn Dạng chuẩn – 1NF Dạng chuẩn – 2NF Dạng chuẩn – 3NF Dạng chuẩn BCNF 1.2.3 Cơ sở liệu hƣớng đối tƣợng Dù có nhiều ngơn ngữ hƣớng đối tƣợng, đa số CSDL hƣớng đối tƣợng dựa C++ Lựa chọn tính hiệu thơng dụng C++ CHƢƠNG NGÔN NGỮ TRUY VẤN CƠ SỞ DỮ LIỆU QUAN HỆ VÀ CƠ SỞ DỮ LIỆU NGỮ NGHĨA Chƣơng tìm hiểu kĩ tổ chức cấu trúc câu truy vấn sở liệu quan hệ SQL sở liệu ngữ nghĩa SPARQL 2.1 NGÔN NGỮ TRUY VẤN TRONG CƠ SỞ DỮ LIỆU QUAN HỆ 2.1.1 Giới thiệu Ngôn ngữ truy vấn liệu (Structured Query Language SQL) cho phép ngƣời khai thác CSDL (chuyên nghiệp không chuyên) sử dụng để truy vấn thông tin cần thiết CSDL Ngôn ngữ quản lý liệu (Data Control Language - DCL) cho phép ngƣời quản trị hệ thống thay đổi cấu trúc bảng liệu, khai báo bảo mật thông tin cấp quyền hạn khai thác CSDL cho ngƣời sử dụng 2.1.2 Câu truy vấn SQL Tập hợp câu lệnh truy vấn SQL đƣợc chia thành nhóm với mục đích nhƣ sau: - Kiểm soát truy cập: GRANT, REVOKE - Quản lý phiên làm việc: CONNECT, SET - Định nghĩa liệu: CREATE, ALTER, DROP - Thao tác liệu: UPDATE, SELECT, INSERT, DELETE - Quản lý giao dịch: COMMIT, ROLLBACK, LOCK TABLE - Câu lệnh nhập xuất - Câu lệnh thủ tục: CALL a Câu lệnh SELECT Cú pháp chung câu lệnh SELECT có dạng: SELECT [ALL | DISTINCT][TOP n] danh_sách_ch ọn [INTO tên_bảng_mới] FROM danh_sách_bảng/khung_nhìn [W ERE điều_kiện] [GROUP BY danh_sách_cột] [ AVING điều_kiện] [ORDER BY cột_sắp_xếp] [COMPUTE danh_sách_hàm_gộp [BY danh_sách_cột]] b Câu lệnh INSERT Có hai dạng cú pháp cho lệnh INSERT INTO SQL nhƣ sau: INSERT INTO TABLE_TEN (cot1, cot2, cot3, cotN)] VALUES (giatri1, giatri2, giatri3, giatriN); Ở đây, cot1, cot2, cotN tên cột bảng mà bạn muốn chèn liệu Bạn khơng cần xác định tên cột truy vấn SQL bạn thêm giá trị cho tất cột bảng Nhƣng bạn nên đảm bảo thứ tự giá trị giống nhƣ thứ tự cột bảng Cú pháp lệnh INSERT INTO nhƣ sau: INSERT INTO TABLE_TEN VALUES (giatri1,giatri2,giatri3, giatriN); b Câu lệnh UPDATE Cú pháp truy vấn UPDATE với mệnh đề WHERE nhƣ sau: UPDATE ten_bang SET cot1 = giatri1, cot2 = giatri2 , cotN = giatriN WHERE [dieu_kien]; c Câu lệnh DELETE Cú pháp câu lệnh nhƣ sau: DELETE FROM tên_bảng [FROM danh_sách_bảng] [WHERE điều_kiện] 2.2 NGÔN NGỮ TRUY VẤN TRONG CƠ SỞ DỮ LIỆU NGỮ NGHĨA 2.2.1 Giới thiệu Cơ sở liệu ngữ nghĩa ngôn ngữ giao thức truy vấn tiêu chuẩn cho Dữ liệu Mở Liên kết web sở liệu đồ họa ngữ nghĩa (còn đƣợc gọi RDF triplestore - RDF) SPARQL, viết tắt Giao thức SPARQL Ngôn ngữ Truy vấn RDF tiếng Anh, “SPARQL Protocol And RDF Query Language”, cho phép ngƣời sử dụng truy vấn thông tin từ sở liệu nguồn liệu đƣợc ánh xạ tới RDF 2.2.2 Mơ hình RDF Cú pháp tổng qt SPARQL-SELECT đƣợc liệt kê nhƣ sau: 10 động Từ khóa GRAPH dùng để định đồ thị hoạt động đồ thị đƣợc đặt tên Dataset nằm truy vấn Định nghĩa RDF Dataset không hạn chế mối quan hệ đồ thị đƣợc đặt tên đồ thị mặc định Thơng tin đƣợc lặp lặp lại đồ thị khác Có hai ý ta cần xem xét: - Để có thơng tin đồ thị mặc định phải bao gồm thông tin gốc đồ thị đƣợc đặt tên - Nên bao gồm thông tin đồ thị đặt tên đồ thị mặc định 2.3 KẾT CHƢƠNG Hệt nhƣ SQL cho phép ngƣời sử dụng truy xuất sửa đổi liệu sở liệu quan hệ, SPARQL cung cấp chức y hệt cho sở liệu đồ họa NoSQL nhƣ GraphDB Hơn nữa, truy vấn SPARQL đƣợc thực thi sở liệu mà đƣợc xem nhƣ RDF thơng qua phần mềm trung gian (middleware) Ví dụ, sở liệu quan hệ đƣợc yêu cầu truy vấn với SPARQL việc sử dụng phần mềm ánh xạ sở liệu quan hệ sang RDF - RDB2RDF (Relational Database to RDF) Đây làm cho SPARQL trở thành ngơn ngữ mạnh mạnh để tính tốn, lọc, tổng hợp có chức truy vấn tiếp (subquery) Tƣơng phản với SQL, truy vấn SPARQL không bị ràng buộc phải làm việc bên sở liệu: Các truy vấn liên đoàn (Federated queries) truy cập nhiều kho liệu (các điểm cuối) Hệ là, SPARQL vƣợt qua đƣợc ràng buộc tìm kiếm cục đặt Sức mạnh SPARQL với mềm dẻo RDF dẫn tới chi phí phát triển thấp mà việc pha trộn 11 kết từ nhiều nguồn liệu dễ dàng CHƢƠNG PHÁT TRIỂN HỆ THỐNG TRUY VẤN DỮ LIỆU TÙY CHỌN DỰA TRÊN NGỮ NGHĨA CỦA CÂU TRUY VẤN Trong chƣơng này, luận văn phát triển mơ hình truy vấn liệu với đầu vào câu truy vấn NNTN đầu câu truy vấn liệu tùy chọn trƣờng hợp câu truy vấn Insert Update Đồng thời, chƣơng trình bày xây dựng cài đặt mơ hình hệ thống đề xuất để thực nghiệm đánh giá mơ hình 3.1 ĐẶT VẤN ĐỀ 3.2 MƠ HÌNH CÂU TRUY VẤN NNTN SANG SQL VÀ SPARQL Mơ hình hệ thống tổng quan kế thừa bƣớc 12 hai quy trình hệ thống đƣợc xây dựng trƣớc đó: - Quy trình chuyển đổi câu truy vấn NNTN có cấu trúc sang câu truy vấn SQL: phân tích câu, xác định loại câu truy vấn, thành phần câu truy vấn đó, từ tạo thành câu truy vấn SQL - Quy trình từ câu truy vấn SQL sang câu truy vấn SPARQL: phân tích câu truy vấn SQL, ánh xạ sang câu truy vấn SPARQL Đồng thời tích hợp hai quy trình vào mơ hình để giải mục đích truy vấn liệu tùy chọn dựa ngữ nghĩa câu truy vấn 3.2.1 Cấu trúc câu truy vấn NNTN kỹ thuật xử lý 3.2.2 Chuyển đổi sang câu truy vấn Insert Dựa vào tìm hiểu cấu trúc, thành phần câu truy vấn INSERT chƣơng I, thấy thành phần câu gồm: Insert into: phía sau từ khóa Insert into định tên bảng muốn thêm hàng Values: sau từ khóa From danh sách giá trị hàng cần thêm Select expression: Trả dòng giá trị cần thêm vào bảng đích ả g 3.2 Danh sách từ giá trị tươ g tro g t p ần câu INSERT Từ khóa Từ khóa tương ứng SQL “insert”, “add”, “append”, “enter”, “insertion”, “get into”, “sell into”, “entered into”, “join in”, “join into” Insert into “values”, “include”, “worth”, “scope”,”fair value”, “import” Values “put”, “initialize”,”fill”, “introduce”, “selective”, “select show” Select expression Bƣớc 1: Xác định thành phần câu truy vấn Insert 13 NNTN có cấu trúc tƣơng ứng với cấu trúc câu truy vấn SQL Bƣớc 2: Sau xác định đƣợc thành phần câu truy vấn, sử dụng kỹ thuật ánh xạ thuộc tính, bảng có tên gọi NNTN với từ điển đƣợc xây dựng để xác định tên đƣợc quy định CSDL Cuối tiến hành tổng hợp thành phần xác định đƣợc câu truy vấn để tạo thành câu truy vấn SQL hoàn chỉnh 3.2.3 Chuyển đổi sang câu truy vấn UPDATE Bƣớc 1: Xác định thành phần câu truy vấn Update NNTN có cấu trúc tƣơng ứng với cấu trúc câu truy vấn SQL Bƣớc 2: Xác định thành phần câu truy vấn NNTN có cấu trúc tƣơng ứng với cấu trúc câu truy vấn SQL Câu truy vấn UPDATE Dựa vào tìm hiểu cấu trúc, thành phần câu truy vấn SELECT chƣơng I, thấy thành phần câu gồm: Update: phía sau từ khóa Update xác định tên bảng muốn cập nhật Set: sau từ khóa Set nhiều mệnh đề đƣợc gán giá trị cho cột bảng Where: sau từ khóa Where biểu thức tìm kiếm dùng để lọc hàng liệu trả Để xác đinh thành phần câu UPDATE, mơ hình sử dụng kỹ thuật ánh xạ từ vào từ điển để tìm vị trí thành phần câu UPDATE truy vấn NNTN Bộ từ điển đƣợc xây dựng nhƣ Bảng 3.2 14 ả g 0.1 Danh sách từ giá trị tươ g tro g t p ần câu SELECT Từ khóa Từ khóa tương ứng SQL “update”, “amend”, “modernize”, “refresh”, “refurbish”, “rejuvenate”, “renew”, “renovate”, “restore”, “revise” Update “set”, “values”, “funtion”, “column reference” Set “filter”, “for”, “during”, “with”, “where” Where 3.3 GIỚI THIỆU VỀ FRAMEWORK APACHE OPENNLP VÀ GENERAL SQL PARSER OpenNLP đƣợc bắt đầu phát triển vào năm 2000 Jason Baldridge Gann Bierner Các thƣ viện Apache OpenNLP thƣ viện Java phục vụ cho việc xử lý văn NNTN Nó bao gồm nhiều thành phần hỗ trợ nhiệm vụ NLP phổ biến nhất, ví dụ nhƣ tách từ, phân chia câu, gán nhãn từ loại, trích xuất thực thể có tên, phân tích cú pháp, phân giải đồng tham chiếu Những nhiệm vụ cần thiết để xây dựng dịch vụ xử lý văn nâng cao OpenNLP bao gồm liệu ngẫu nhiên cực đại thuật toán Perceptron dựa học máy 3.4 CÀI ĐẶT MƠ HÌNH ĐÃ ĐỀ XUẤT Dựa vào mơ hình hệ thống tổng quan phần giới thiệu framework hỗ trợ nhiệm vụ chuyên biệt hệ thống, luận văn xây dựng nên sơ đồ cài đặt giải pháp chi tiết nhƣ Hình 3.7 15 3.5 KẾT QUẢ CHƢƠNG TRÌNH 3.5.1 Cơ sở liệu dùng cho thực nghiệm Cơ sở liệu đƣợc xây dựng đơn giản để kiểm tra việc chuyển đổi câu truy vấn tự nhiên có cấu trúc sang câu truy vấn SQL SPARQL Mục đích sở liệu lƣu trữ thông tin liên hệ (contact) chứa thông tin gồm họ tên, địa số điện thoại nhà, địa số điện thoại nơi làm việc, địa mail Cơ sở liệu quan hệ CSDL quan hệ đƣợc xây dựng với tên bảng đối tƣợng liên hệ (contact), với thuộc tính có khóa id, bảng contact đƣợc biểu diễn nhƣ sau: contact (id, name, prename, homeaddress, hometelephone, workaddress, worktelephone, email) Cơ sở liệu ngữ nghĩa CSDL ngữ nghĩa đƣợc xây dựng tƣơng tự nhƣ CSDL quan hệ gồm class contact, với thuộc tính liệu (data properties) tƣơng tự thuộc tính đƣợc biểu diễn CSDL quan hệ 16 3.5.2 Hệ thống thực nghiệm NL2SQL-SPARQL Tác nhân: Ngƣời dùng Ca sử dụng - Truy vấn CSDL NNTN có cấu trúc: ngƣời dùng muốn truy vấn liệu, ngƣời dùng nhập câu truy vấn NNTN chọn mô hình CSDL - Truy vấn liệu mySQL: ngƣời dùng muốn truy vấn CSDL mySQL - Truy vấn liệu RDF: ngƣời dùng muốn truy vấn CSDL RDF - Cấu hình CSDL mySQL: muốn kết nối tới CSDL mySQL, ngƣời dùng cần cấu hình thơng số nhƣ: hostname, username, password, database name - Cấu hình CSDL RDF: cấu hình đƣờng dẫn tới tập tin lƣu trữ CSDL RDF - Tạo câu truy vấn SQL: ca sử dụng thực phân tích câu truy vấn NNTN có cấu trúc để sinh câu truy vấn SQL - Tạo câu truy vấn SPARQL: ca sử dụng thực phân tích câu truy vấn SQL để sinh câu truy vấn SPARQL - Kết nối CSDL mySQL: thực kết nối tới CSDL mySQL dựa thông tin đƣợc cấu hình - Kết nối CSDL RDF: thực kết nối tới CSDL RDF dựa đƣờng dẫn đƣợc cấu hình 17 đồ ca sử dụng c ươ g tr Trƣớc chƣơng trình đƣợc thực thi cần vài tham số để thiết lập kết nối tới CSDL mySQL CSDL RDF Thiết lập thông tin dùng để kết nối mySQL: hostname, cổng kết nối, tên CSDL, username, password để kết nối sở liệu 3.9 Giao diện cấu sở liệu mySQL 18 - Thiết lập đƣờng dẫn tới file liệu RDF nh 3.10 Giao diện cấu sở liệu RDF Giao diện NL2SQL-SPARQL nhƣ Hình 3.11 chứa: - Một nhóm nút cho phép chọn kết sinh câu truy vấn NNTN SQL SPARQL, chọn hai nút thơng tin cấu hình CSDL tƣơng ứng; - Giao diện nhập câu truy vấn NNTN, có chứa số mẫu câu truy vấn có sẵn Bên cạnh có danh sách chứa từ khóa gợi ý cho ngƣời dùng để nhập câu truy vấn NNTN; - Giao diện chứa câu kết câu truy vấn đƣợc sinh ra; - Bảng chứa kết truy vấn CSDL; - Các nút thực thi add "contact" with "Last Name" = "Thảo", "First Name" is "Nguyễn Phƣơng", "Email" = nguyenphuongthao2012@gmail.com INSERT INTO contact (name, prename, email) VALUES ('Thảo', 'Nguyễn Phƣơng', 'nguyenphuongthao2012@gmail.com') 19 3.11 Giao diện chuyể đổi sang SQL 3.12 Giao diện chuyể đổi sang SQL 20 PREFIX contact: INSERT DATA { contact:contact9 contact:name 'Thảo'; contact:prename 'Nguyễn Phƣơng'; contact:email 'nguyenphuongthao2012@gmail.com' } H nh 0.12 Giao diện chuyển đổi sang SPARQL update "contact" for "Email" is "nguyenphuongthao2012 @gmail.com" set "Last Name" is "Hoa" UPDATE contact SET name = 'Hoa' WHERE email = 'nguyenphuongthao2012@gmail.com' 21 3.13 Giao diện chuyể đổi sang SQL với câu lệnh Update PREFIX contact: DELETE ?x contact:name ?name INSERT ?x contact:name 'Hoa' WHERE{ ?x contact:email 'nguyenphuongthao2012@gmail.com'} 22 3.14 Giao diện chuyể đổi sang SPARQL Kiểm tra lại liệu 3.11 Giao diện kiểm tra lại liệu 23 3.6 KẾT CHƢƠNG Chƣơng luận văn trình bày tốn u cầu đặt việc thực truy vấn INSERT, UPDATE dựa ngữ nghĩa câu truy vấn, đề xuất mơ hình tổng quan để giải tốn đặt Từ câu truy vấn ngôn ngữ tự nhiên có cấu trúc, phân tích tạo câu truy vấn SQL, từ câu truy vấn SQL chuyển đổi sang câu truy vấn SPARQL Đồng thời luận văn trình bày framework Apache OpenNLP framework General SQL Parser, áp dụng framework vào trình xử lý hệ thống nhƣ mơ tả Hình 3.7 Và liệt kê hàm xử lý đƣợc cài đặt chƣơng trình KẾT LUẬN Kết đạt đƣợc Mục tiêu đề tài phát triển hồn thiện mơ hình NL2SQL - PARQL để thực thi truy vấn INSERT, UPDATE truy vấn ngôn ngữ tự nhiên Để thực mục tiêu đề ra, tơi tiến hành tìm hiểu hệ thống chuyển đổi câu truy vấn ngôn ngữ tự nhiên sang câu truy vấn SQL chuyển đổi câu truy vấn SQL sang câu truy vấn SPARQL để tìm bƣớc thực chung hệ thống Từ bƣớc thực chung đó, phát triển mơ hình hệ thống truy vấn liệu tùy chọn dựa ngữ nghĩa câu truy vấn để thực thi truy vấn INSERT, UPDATE Luận văn tiến hành xây dựng hệ thống cài đặt ngôn ngữ Java, đồng thời sử dụng công cụ Apache OpenNLP để hỗ trợ việc thực bƣớc phân tích NNTN Sau đó, sử dụng kỹ thuật từ điển để tìm từ tƣơng ứng để xây dựng câu truy vấn SQL cho CSDL quan hệ Trong trƣờng hợp ngƣời dùng muốn chuyển 24 đổi câu truy vấn NNTN thành câu truy vấn SPARQL cho CSDL ngữ nghĩa, mơ hình sử dụng tích hợp General SQL Parser để hỗ trợ việc phân tích câu truy vấn SQL, sau xây dựng câu truy vấn cho CSDL ngữ nghĩa Mơ hình đƣợc thực nghiệm hệ thống NL2SQL-SPARQL NL2SQL-SPARQL thử nghiệm thành công việc sinh câu truy vấn INSERT, UPDATE sang mơ hình CSDL quan hệ sang CSDL ngữ nghĩa Hƣớng phát triển đề tài Hệ thống NL2SQL-SPARQL sử dụng kỹ thuật từ điển, hiệu hệ thống phụ thuộc nhiều vào từ vựng từ điển, khó khăn lớn vấn đề hệ thống xử lý ngôn ngữ tự nhiên Việc mở rộng từ điển phân tích sâu ngữ nghĩa câu truy vấn NNTN hƣớng nghiên cứu luận văn Hệ thống thực chuyển đổi câu truy vấn ngôn ngữ tự nhiên sang câu truy vấn SQL dạng đơn giản câu lệnh INSERT, UPDATE Vì vậy, hƣớng tới tơi khắc phục hạn chế khả chuyển đổi câu truy vấn từ ngôn ngữ tự nhiên sang câu truy vấn SQL Mở rộng từ điển áp dụng NL2SQLSPARQL cho loại câu truy vấn lại Cuối cùng, việc mở rộng mơ hình để hỗ trợ thêm nhiều loại mơ hình CSDL khác ngồi CSDL quan hệ CSDL ngữ nghĩa, đồng thời hỗ trợ câu truy vấn NNTN tiếng Việt hƣớng phát triển phát triển khác luận văn Trong tƣơng lai, cố gắng cải thiện hạn chế, mở rộng chức để áp dụng hệ thống vào thực tế, nhằm phục vụ cho phát triển hệ thống chuyển đổi câu truy vấn ngơn ngữ tự nhiên có cấu trúc sang dạng câu truy vấn thích hợp với hệ thống sở liệu ... MƠ HÌNH CƠ SỞ DỮ LIỆU CHƢƠNG 2: NGÔN NGỮ TRUY VẤN CƠ SỞ DỮ LIỆU QUAN HỆ VÀ CƠ SỞ DỮ LIỆU NGỮ NGHĨA CHƢƠNG 3: PHÁT TRIỂN HỆ THỐNG TRUY VẤN DỮ LIỆU TÙY CHỌN DỰA TRÊN NGỮ NGHĨA CỦA CÂU TRUY VẤN... điển ngữ nghĩa giới hạn cho câu truy vấn SELECT, để mở rộng khả ứng dụng mô hình thực tế, tơi đề xuất lựa chọn đề tài: Phát triển mơ hình truy vấn liệu tùy chọn dựa ngữ nghĩa câu truy vấn NL2SQL-SPARQL: ... pháp truy vấn liệu mơ hình sở liệu phổ biến nhƣ: Cơ sở liệu ngữ nghĩa, sở liệu quan hệ - Cách chuyển đổi từ câu truy vấn ngôn ngữ tự nhiên sang câu truy vấn ngữ nghĩa - Ngôn ngữ truy vấn SQL mơ hình