Web 2.0 đã đạt được những thành tựu rất đáng kể trong việc nâng cao tính tương tác cũng như đẩy nhanh tốc độ xử lý đáp ứng yêu cầu của người dùng. Tuy nhiên trong xã hội thông tin đương đại nhu cầu của người dùng không dừng lại ở việc cải thiện tốc độ mà còn phải cải thiện chất lượng xử lý của trang web theo yêu cầu ngày càng nâng cao. Web 3.0 (Web Semantic) ra đời nhằm đáp ứng những yêu cầu về chất lượng đó. Với đặc điểm chính là nâng cao khả năng chia sẻ tài nguyên và tăng “sự hiểu biết” trong quá trình xử lý dữ liệu của máy tính. Web Semantic đã đi sâu vào phân tích và định hướng dữ liệu, đồng thời hỗ trợ phát triển ứng dụng Web Semantic trên nhiều lĩnh vực khác nhau. Một trong những lĩnh vực thế mạnh của Web Semantic là xử lý và tìm kiếm thông tin. Việc phân tích và định hướng nội dung lưu trữ cho phép chúng ta xây dựng những cơ sở dữ liệu phục vụ tìm kiếm chính xác hơn, tinh gọn hơn.
ĐẠI HỌC QUỐC GIA TP HỒ CHÍ MINH TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN KHOA CÔNG NGHỆ THÔNG TIN LÊ HỒNG DANH – 16C12005 ĐỒ ÁN MÔN HỌC GVHD: TS PHẠM NGUYỄN CƯƠNG TP.HCM – 07/2017 MỤC LỤC CHƯƠNG MỞ ĐẦU 1.1 Lý chọn đề tài 1.2 Mô tả toán CHƯƠNG CÔNG CỤ XÂY DỰNG WEB NGỮ NGHĨA 2.1 Mơ hình sở liệu 2.2 Xây dựng ontology công cụ Protege 2.2.1 Tạo lớp ontology tư vấn việc làm 2.2.2 Tạo thuộc tính cho lớp 2.2.3 Tạo mối quan hệ cho lớp 2.2.4 Tạo thể cho lớp .7 2.2.5 Tạo thể cho thuộc tính 2.3 Sử dụng công cụ D2RQ để mapping sỡ liệu quan hệ CHƯƠNG PUBLISH DỮ LIỆU TRONG ĐỊNH DẠNG NGỮ NGHĨA RDF 10 3.1 Sử dụng công cụ protégé xuất file định dạng RDF .10 3.2 Sử dụng công cụ D2RQ để xuất file RDF sử dụng D2R Server để publish liệu định dạng web ngữ nghĩa 11 CHƯƠNG KẾT LUẬN 12 CHƯƠNG MỞ ĐẦU 1.1 Lý chọn đề tài Web 2.0 đạt thành tựu đáng kể việc nâng cao tính tương tác đẩy nhanh tốc độ xử lý đáp ứng yêu cầu người dùng Tuy nhiên xã hội thông tin đương đại nhu cầu người dùng không dừng lại việc cải thiện tốc độ mà phải cải thiện chất lượng xử lý trang web theo yêu cầu ngày nâng cao Web 3.0 (Web Semantic) đời nhằm đáp ứng yêu cầu chất lượng Với đặc điểm nâng cao khả chia sẻ tài nguyên tăng “sự hiểu biết” trình xử lý liệu máy tính Web Semantic sâu vào phân tích định hướng liệu, đồng thời hỗ trợ phát triển ứng dụng Web Semantic nhiều lĩnh vực khác Một lĩnh vực mạnh Web Semantic xử lý tìm kiếm thơng tin Việc phân tích định hướng nội dung lưu trữ cho phép xây dựng sở liệu phục vụ tìm kiếm xác hơn, tinh gọn Theo tổng cục thống kê, tỉ lệ thất nghiệp lao động Việc Nam có tỉ lệ tương đối cao Mặt dù, có nhiều doanh nghiệp nước nước ngồi có nhu cầu tuyển dụng nhiều Câu hỏi đặt để thông tin việc làm đến với người lao động nhanh xác, người tìm việc khơng cần phải công với thông tin việc làm không phù hợp Đó điều trăn trở người tìm việc làm công ty, doanh nghiệp tuyển dụng 1.2 Mơ tả tốn Tìm kiếm việc làm hệ thống đánh giá quan trọng cho người lao động Hiện nay, có nhiều hệ thống hỗ trợ cho người tìm việc hiệu mang lại chưa cao Dựa vào thực tế đó, ta nghiên cứu web ngữ nghĩa xây dựng hệ thống tư vấn việc làm cho người lao động Rất nhiều liệu có giá trị nằm sở liệu quan hệ Chúng chiếm hầu hết trang web tư vấn việc làm nguồn liệu tự nhiên cho Web ngữ nghĩa Trong cài đặt doanh nghiệp, tích hợp sở liệu việc làm khác thường động lực để áp dụng RDF Do đó, làm cho sở liệu quan hệ tiếp cận hệ thống dựa RDF vấn đề quan trọng Hệ thống cho ta nhập thơng tin cá nhân cần thiết để tư vấn cơng việc phù hợp với lực họ đồng thời đưa thông tin tư vấn liên quan đến cơng ty có nhu cầu tuyển dụng việc làm Ngồi ứng dụng cịn cho phép chúng tìm nhập từ khóa liên quan đến ngành nghề cơng việc từ từ khóa CHƯƠNG CÔNG CỤ XÂY DỰNG WEB NGỮ NGHĨA Trong phần này, sử dụng công cụ Protege để xây dựng ontology cho tốn cơng cụ D2RQ cung cấp mơi trường tích hợp với nhiều tùy chọn để truy cập liệu quan hệ bao gồm "RDF dumps" truy cập dựa HTML SPARQL với D2RQ Server Các ánh xạ xác định người dùng, cho phép kết hợp ngữ nghĩa miền q trình ánh xạ 2.1 Mơ hình sở liệu Hình 1.Mơ hình sở liệu tốn 2.2 Xây dựng ontology cơng cụ Protege Vấn đề xây dựng ontology trương tự cách người dùng nhập liệu vào sở liệu Ở đây, tất liệu cấu trúc phân tách khai báo thơng qua cơng cụ Các đối tượng ontology class, properties, individuals xem xét điền đầy đủ thơng tin cách cụ thể khả khai thác sau thuận tiện Tải cài đặt công cụ Protégé 4.3 để xây dựng ontology cho hệ thống tư vấn việc làm Hình Thông tin đường dẫn tải công cụ protégé Hình Giao diện protégé 2.2.1 Tạo lớp ontology tư vấn việc làm Trong hệ thống có lớp sau: Ta vào tab Class hierarchy để thêm class CongTy : Công ty CongViec : Công việc LoaiLD : Loại lao động YeuCauLD : Yêu cầu lao động ChiTietYCLD : Chi tiết yêu cầu lao động Xem hình bên dưới: Hính Các lớp ontology 2.2.2 Tạo thuộc tính cho lớp Các thuộc tính thể mối quan hệ lớp, đối tượng liệu với quan hệ với liệu Ta vào tab Data property hierarchy để thêm thuộc tính cho class Domains (intersection) chọn lớp mà chứa thuộc tính đó, Ranges kiểu giá trị thuộc tính Tạo thuộc tính cho lớp cơng ty: Hình Tạo thuộc tính cho lớp Trong đó: phải thêm vào đủ thuộc tính lớp CongTy(MaCT, TenCT, Email, DiaChi) Tương tự tạo thuộc tính cho lớp cơng việc có thuộc tính MaCV, TenCV, MucLuong Lớp YeuCauLD có thuộc tính MaPhieuYC, NgayDKLD, LinhVucHD, MaCT Lớp ChiTietYCLD có thuộc tinh MaPhieuYC, MaLoaiLD, SoLuong Lớp LoaiLD có thuộc tính MaLoaiLD, TrinhDo, Chuyenmon, NgoaiNgu, MaCV 2.2.3 Tạo mối quan hệ cho lớp Chúng ta vào tab Object Properties tạo mối quan hệ lớp lại với Trong phần topObjectProperty thêm có mối quan hệ với lớp khác Trong Domains (intersection) chọn tên lớp cần quan hệ, bắt buộc phải vào Inverse of tạo tên khác chọn lớp quan hệ Hình Tạo mối quan hệ lớp 2.2.4 Tạo thể cho lớp Truy cập vào tab Individuals để tạo thể lớp Hình Các thể lớp • Lớp CongTy : Cơng_ty_1, Cơng_ty_2, Cơng_ty_3, Công_ty_4, Công_ty_5 Tương tự vậy, tất lớp Số thể tùy thuộc vào liệu lớp 2.2.5 Tạo thể cho thuộc tính Truy cập vào Data property assertions để tạo thể tương ứng với dòng liệu Hình Thuộc tính thể lớp Cơng ty Sau hồn tất ta có ontology việc làm sau: ta xem trực tiếp Protégé tab OntoGraf Hình Ontology vừa tạo protégé Hình Mơ hình Ontology vừa tạo xem trực tuyến 2.3 Sử dụng công cụ D2RQ để mapping sỡ liệu quan hệ Truy cập vào trang web http://d2rq.org download d2rq-08.1.zip d2rq0.8.1.tar.gz để download cơng cụ D2RQ Hình 10 Link download D2RQ Download XAMP cài đặt để tạo máy chủ web server tích hợp sẵn Apache, PHP, MySQL, FTP Server, Mail Server cơng cụ phpMyAdmin Hình 11 Sử dụng XAMP để làm web server Sử dụng sở liệu có hệ thống tư vấn việc làm chạy, tùy theo sở liệu chạy hệ sở liệu có driver phù hợp Cách sử dụng công cụ D2RQ sau: Giải nén file d2rq-08.1.zip chạy command line trỏ tới thư mục giải nén d2rq Hình 12 Màn hình command line trỏ tới thư mục giải nén d2rq Mapping tất table database việc làm sử dụng câu lệnh sau generate-mapping -u root -o vieclam.ttl jdbc:mysql://localhost/vieclam Trong đó: - root tài khoản kết nối vào database; - vieclam.ttl file mapping tạo từ sở liệu quan hệ - jdbc:mysql://localhost driver mysql - vieclam tên sở liệu quan hệ Như ta map tất liệu mà không cần phải tạo ontology mà sữ dụng web ngữ nghĩa cho trường hợp Ở đây, mapping theo ý muốn mình, chia cột bảng tùy vào cấu hình câu lệnh D2RQ CHƯƠNG PUBLISH DỮ LIỆU TRONG ĐỊNH DẠNG NGỮ NGHĨA RDF 3.1 Sử dụng công cụ protégé xuất file định dạng RDF Khi sử dụng công cụ protégé publish liệu định dạng ngữ nghĩa RDF Từ giao diện protégé chọn filesave save as sau hộp thoại để lựa chọn đinh dạng ngữ nghĩa, chọn định dạng RDF/XML chọn đường dẫn để lưu file 10 Hình 13 Giao diện xuất file dịnh dạng RDF protégé 3.2 Sử dụng công cụ D2RQ để xuất file RDF sử dụng D2R Server để publish liệu định dạng web ngữ nghĩa Sử dụng câu lệnh để xuất file định dạng RDF D2RQ sau: dump-rdf -f RDF/XML-ABBREV -b http://localhost:2020/ -o vieclam.rdf vieclam.ttl Trong đó: - RDF/XML-ABBREV định dạng RDF cần xuất vieclam.rdf file RDF cần tạo vieclam.ttl file mà xuất theo định dạng D2RQ Khi muốn publish trực tiếp liệu sở quan hệ không cần phải xuất file RDF, người dùng thay đổi liệu sở liệu quan hệ tự động publish Bằng cách sử dụng D2R Server sau: d2r-server port 1988 -u root jdbc:mysql://localhost/vieclam Trong đó: - 1988 port web server chạy - Root tài khoản kết nối tới sở liệu quan hệ - jdbc:mysql://localhost drive mysql - vieclam database 11 Hình 14 Cơ sở liệu quan hệ public D2R Server Hình 15 Giao diện sử dụng ngôn ngử truy vấn SPARQL CHƯƠNG KẾT LUẬN Qua đồ án tơi nghiên cứu trình bày vấn đề then chốt lĩnh vực web ngữ nghĩa, sâu vào vấn đề quan trọng tạo ontology RDF, cung cấp hệ thống mã hóa đơn giản quán hỗ trợ người sử dụng tìm kiếm truy hồi thơng tin cách hiệu Tuy nhiên, đồ án cịn dở dang chưa hồn thành giai đoạn cuối viết giao diện hoàn chỉnh để người dùng tìm kiếm trực quan Trong thời gian tới, để hồn thiện ứng dụng mà tơi phát triển, xây dựng ontology hồn chỉnh tìm kiếm việc làm, nhằm giúp cho người tìm việc tìm kiếm công việc phù hợp với thân Tương lại tích hợp tích hợp tất ontology lại với để mở rộng tận dụng hết ưu điểm cơng nghệ tìm kiếm web ngữ nghĩa 12