Nghiên cứu web ngữ nghĩa ứng dụng xây dựng hệ thống xuất bản trực tuyến cho nhà xuất bản thông tin và truyền thôn

13 135 0
Nghiên cứu web ngữ nghĩa ứng dụng xây dựng hệ thống xuất bản trực tuyến cho nhà xuất bản thông tin và truyền thôn

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Header Page of 126 BỘ GIÁO DỤC VÀ ĐÀO TẠO Công trình hoàn thành ĐẠI HỌC ĐÀ NẴNG ĐẠI HỌC ĐÀ NẴNG NGUYỄN TIẾN SỸ Người hướng dẫn khoa học: PGS.TS LÊ VĂN SƠN Phản biện 1: TS Nguyễn Thanh Bình NGHIÊN CỨU WEB NGỮ NGHĨA ỨNG DỤNG XÂY DỰNG HỆ THỐNG XUẤT BẢN TRỰC TUYẾN CHO NHÀ XUẤT BẢN THÔNG TIN VÀ TRUYỀN THÔNG Phản biện 2: PGS.TS Lê Mạnh Thạnh Chuyên ngành: KHOA HỌC MÁY TÍNH Mã số: 60.48.01 Luận văn bảo vệ trước Hội đồng chấm Luận văn tốt nghiệp thạc sĩ kỹ thuật họp Đại học Đà Nẵng vào ngày 21 tháng năm 2012 TÓM TẮT LUẬN VĂN THẠC SĨ KỸ THUẬT Có thể tìm hiểu luận văn tại: Trung tâm Thông tin - Học liệu, Đại học Đà Nẵng Đà Nẵng - Năm 2012 Footer Page of 126 Trung tâm học liệu, Đại học Đà Nẵng Header Page of 126 MỞ ĐẦU Vì việc nghiên cứu triển khai ứng dụng thực tiễn Web ngữ nghĩa hướng nghiên cứu mang tính chất thời đại giai đoạn Chính chọn đề tài “Nghiên cứu Web ngữ nghĩa ứng dụng xây dựng hệ thống Xuất Trực tuyến cho Nhà xuất Thông tin Truyền thông” Với mục đích ứng dụng CNTT mà cụ thể Web ngữ nghĩa vào lĩnh vực xuất nói chung Nhà xuất Thông tin Truyền thông nói riêng Lý chọn đề tài Trước đây, nói đến xuất người ta hình dung việc xuất sách, tạp chí, báo… giấy Tiến bước, người ta xuất sách không dạng giấy mà dạng sách điện tử, in đĩa CD, VCD DVD Nhưng dù dạng sách giấy hay dạng sách điện tử đĩa, nhược điểm loại hình xuất thông tin chậm, khó tìm kiếm cần, chi phí sản xuất tốn khó bảo quản Trong bối cảnh Internet phổ biến toàn giới, lĩnh vực xuất trực tuyến ngày trở nên hấp dẫn So với xuất giấy, đĩa, xuất trực tuyến có ưu điểm rõ rệt giảm thiểu chi phí, tốc độ cập nhật thông tin, dễ dàng tìm kiếm qua công cụ tìm kiếm Bên cạnh người sử dụng công giữ gìn thông tin họ cần mà cần họ tìm đến nhà xuất trực tuyến để lấy thông tin Vì vậy, việc xây dựng hệ thống xuất trực tuyến môi trường Web yêu cầu cấp thiết Với chất công nghệ Web việc khai phá nội dung Web, vấp phải nhiều vấn đề khó khăn cần xây dựng tảng công nghệ Web mới, thích hợp cho khai thác nguồn thông tin liệu khổng lồ World Wide Web Đó tảng máy tính dễ dàng xử lý liệu cung cấp Web hay nói cách khác máy hiểu tài nguyên Web Từ thực tế Semantic Web hay Web ngữ nghĩa đời Web ngữ nghĩa thực chất mở rộng Web hành nhằm mục đích khai thác tốt công nghệ Web Sự mở rộng Web ngữ nghĩa việc thêm vào Web hành yếu tố ngữ nghĩa, phép máy tính khai thác khai thác tốt thông tin Web thuận tiện để máy tính người làm việc cách cộng tác Footer Page of 126 Mục tiêu nghiên cứu Mục tiêu đề tài nghiên cứu Semantic Web Nghiên cứu kiến thức tảng Semantic Web bao gồm: Kiến trúc, khái niệm, ứng dụng điển hình, công cụ ngôn ngữ để xây dựng ứng dụng Semantic Web Nghiên cứu xuất xuất trực tuyến, Xây dựng hệ thống xuất trực tuyến môđun hỗ trợ tìm kiếm ngữ nghĩa sách điện tử cho hệ thống Đối tượng phạm vi nghiên cứu - Nghiên cứu tổng quan về: Semantic Web, XML, Ontology RDF, Semantic Search Engine, Protégé… - Tìm hiểu lĩnh vực xuất bản, xuất Trực tuyến Đề xuất quy trình xuất Trực tuyến với Semantic Web Phương pháp nghiên cứu - Thu thập, tìm hiểu, phân tích tài liệu thông tin có liên quan đến luận văn - Tìm hiểu Semantic Web: Khái niệm, kiến trúc, ứng dụng điển hình, XML, Ontology, RDF… ngôn ngữ để xây dựng ứng dụng Semantic Web - Tìm hiểu quy trình để xây dựng ứng dụng với Web ngữ nghĩa - Tìm hiểu lĩnh vực xuất bản, quy trình xuất bản, quy trình xuất trực tuyến Header Page of 126 - Triển khai xây dựng quy trình xuất trực tuyến với Web ngữ nghĩa Chương TỔNG QUAN VỀ WEB NGỮ NGHĨA - Đưa nhận xét đánh giá kết Ý nghĩa khoa học thực tiễn Ý nghĩa khoa học: - Tìm hiểu trình bày kiến thức Semantic Web - Tìm hiểu trình bày kiến thức xuất trực tuyến - Đề xuất phương pháp, giải pháp để giải toán: xây dựng quy trình xuất trực tuyến Ý nghĩa thực tiễn: - Ứng dụng Semantic Web để xây dựng môt quy trình xuất trực tuyến, mà cụ thể là: Ontology sách điện tử môđun tìm kiếm thông tin loại sách có liệu - Đưa mô hình công cụ hiệu với quy trình xuất trực tuyến Cấu trúc luận văn Luận văn chia thành chương, cụ thể sau: Chương 1: Tổng quan Web ngữ nghĩa: Giới thiệu vấn đề tổng quan tổng quan Web ngữ nghĩa, kiến trúc Web ngữ nghĩa, ontology phần quan trọng Web ngữ nghĩa ứng dụng Web ngữ nghĩa 1.1 Giới thiệu Web ngữ nghĩa 1.1.1 World Wide Web hạn chế Web chứa đựng lượng liệu khổng lồ số hóa Mạng toàn cầu thực công cụ có giá trị việc tìm kiếm phổ biến ý tưởng kiến thức Tháng 8-2005, Google tuyên bố ghi nhận 8,2 tỷ trang web 2,1 tỷ hình ảnh Những số đầy ấn tượng Nhưng phần tảng băng Có thực tế thông tin mạng chưa sử dụng cách trực tiếp có hiệu Những trang web thiết kế dành cho người cho máy tính, vậy, ý nghĩa nội dung chứa đựng trang web phải tiếp nhận người xem chúng, đọc tài liệu HTML nhìn thấy tên đường dẫn siêu liên kết 1.1.2 Sự đời Web ngữ nghĩa 1.1.2.1 Khái niệm Tim Berners-Lee (Người phát minh Web): “Bước đặt liệu Web theo định dạng mà máy tính hiểu được, chuyển thành định dạng mà máy tính hiểu Điều tạo loại Web gọi Web ngữ nghĩa - Web liệu mà xử lý trực tiếp gián tiếp máy tính” Chương 2: Kiến trúc hệ thống Xuất trực tuyến với Web ngữ nghĩa: Giới thiệu vấn đề tổng quan xuất trực tuyến đề xuất kiến trúc hệ thống xuất trực tuyến với Web ngữ nghĩa 1.1.2.2 Web ngữ nghĩa mang lại gì? Chương 3: Triển khai xây dựng Hệ thống xuất trực tuyến cho Nhà xuất Thông tin Truyền thông: Giới thiệu vấn đề để xây dựng hệ thống xuất trực tuyến với web ngữ nghĩa như: xây dựng ontology cho tài nguyên sách, CSDL, mô hình Use-Case, xây dựng môđun tìm kiếm sách điện tử thiết kế hình hệ thống 1.2 Giới thiệu sơ lược Ontology Footer Page of 126 1.1.3 Hoạt động W3G Web ngữ nghĩa 1.2.1 Định nghĩa Ontology Ontology cung cấp từ vựng chung dùng để mô tả lĩnh vực nghĩa loại đối tượng hay khái niệm hữu, với thuộc tính quan hệ chúng lời đặc tả cho nghĩa từ từ vựng Header Page of 126 Các thành phần Ontology:  Các cá thể (Individuals): Các cá thể thành phần bản, tảng Ontology  Các lớp (Classes): lớp nhóm, tập hợp đối tượng trừu tượng Chúng chứa cá thể, lớp khác, phối hợp hai  Các thuộc tính (Properties): Các đối tượng Ontology mô tả thông qua việc khai báo thuộc tính chúng Mỗi thuộc tính có tên giá trị thuộc tính Các thuộc tính sử dụng để lưu trữ thông tin mà đối tượng có  Các mối quan hệ (Relation): Một mối quan hệ thuộc tính có giá trị đối tượng Ontology 1.2.2 Vai trò Ontology Danh sách phân tích vai trò Ontology ngữ cảnh ứng dụng Web có ngữ nghĩa  Chia sẻ hiểu biết chung ứng dụng người  Cho phép sử dụng lại tri thức  Đưa giả thiết rõ ràng miền  Phân tách tri thức lĩnh vực với tri thức thao tác  Phân tích tri thức lĩnh vực Phân tích hình thức khái niệm, cần thiết cho việc tái sử dụng mở rộng Ontology 1.2.3 Ontology Web Ngữ nghĩa Các Ontology đóng vai trò then chốt việc cung cấp ngữ nghĩa mà máy hiểu cho tài nguyên Web ngữ nghĩa Nó cung cấp từ vựng chung bao gồm khái niệm, thuộc tính quan trọng định nghĩa khái niệm thuộc tính Ngoài từ vựng, Ontology cung cấp ràng buộc, ràng buộc coi giả định sở ý nghĩa mong muốn từ vựng, sử dụng miền mà giao tiếp người hệ thống ứng dụng phân tán khác Footer Page of 126 Đặc biệt, Ontology sử dụng để đặc tả ý nghĩa tài nguyên Web (thông qua thích) cách xác nhận tài nguyên trường hợp cụ thể số khái niệm quan trọng hay khẳng định tài nguyên có quan hệ với tài nguyên khác thông qua số thuộc tính quan trọng định nghĩa Ontology Từ vựng Ontology biểu diễn khái niệm quan hệ đặt tên định nghĩa khái niệm biểu diễn giới thiệu tương đương 1.2.4 Các ngôn ngữ công cụ hỗ trợ xây dựng Ontology 1.2.4.1 RDF (Resource Description Framework) 1.2.4.2 RDFS (RDF-Schema) 1.2.4.3 Ngôn ngữ Web Ontology 1.2.4.4 Protégé Protégé phần mềm mã nguồn mở Java tiếng Protégé nghiên cứu phát triển từ năm 1998 nhóm nghiên cứu Mark Musen, ĐH Stanford nhằm quản lý thông tin lĩnh vực sinh y học Đây dự án nhận quan tâm tài trợ từ nhiều tổ chức, có Bộ Quốc Phòng Mỹ Protégé có hai phiên OWL API Phiên Protégé - API có tảng từ OKBC (Open Knowledge Base Connectivity) OKBC ứng dụng lập trình giao tiếp thực truy xuất liệu thông minh Phiên Protégé-OWL phát triển dựa hai yêu cầu Đầu tiên yêu cầu định nghĩa đối tượng quan hệ tồn chúng Sau yêu cầu xây dựng đặc điểm kỹ thuật phục vụ ý tưởng chia sẻ thông tin Các đối tượng xây dựng Protégé là:  Classes – Tổ chức quan hệ tham chiếu kiểu thực thi  Axioms – Mô hình câu lệnh  Instances – Các thể hiện, thành phần đối tượng  Domain – Giới hạn ontology  Vocabulary – Các lớp khai báo Header Page of 126 10 1.3 Kiến trúc web ngữ nghĩa 1.4.2.2 QName cách sử dụng 1.3.1 Mô hình kiến trúc Web ngữ nghĩa 1.4.2.3 Mô hình RDF Mô hình RDF gồm ba đối tượng sau: Tài nguyên (Resources): Là tất mô tả biểu thức RDF Thuộc tính (Properties): Thuộc tính, đặc tính, quan hệ dùng để mô tả tính chất tài nguyên Phát biểu (Statements): Mỗi phát biểu gồm ba thành phần sau:  Subject (Tài nguyên): Địa hay vị trí tài nguyên muốn mô tả  Predicate (Vị ngữ): Xác định tính chất tài nguyên  Object (Bổ ngữ): Có thể giá trị nguyên thủy tài nguyên Mỗi phát biểu (subject, predicate, object) gọi ba (triple) Ví dụ: Xét phát biểu: “Sỹ có anh Minh” Phát biểu phân thành phần sau: Subject (Sỹ), Predicate hasBrother (có anh) Object (Minh) Một tập hợp RDF Triple gọi đồ thị: Hình 1.4 Kiến trúc Web ngữ nghĩa 1.3.2 Các lớp mô hình kiến trúc Web ngữ nghĩa 1.3.2.1 Lớp Unicode URI 1.3.2.2 Lớp XML + NS + xmlschema 1.3.2.3 Lớp liệu RDF + RDFSchema 1.3.2.4 Ontology Vocabulary 1.3.2.5 Lớp Logic 1.3.2.6 Lớp Proof lớp Trust 1.3.2.7 Lớp Digital signatures 1.4 RDF – Nền tảng Web ngữ nghĩa 1.4.1 Giới thiệu RDF RDF thành phần quan trọng Semantic Web, đặt XML, RDF sử dụng cú pháp XML để biểu diễn thông tin (RDF/XML) Thông qua định dạng này, thông tin RDF trao đổi dễ dàng hệ thống máy tính hệ điều hành hay ngôn ngữ lập trình ứng dụng khác Predicate Subject Object Hình 1.5 Mối quan hệ thành phần triple Phát biểu mô hình hóa đồ thị có hướng sau: http://localhost:8080/owls.owl#Sỹ http://localhost:8080/owls.owl#hasBrother http://localhost:8080/owls.owl#Minh 1.4.2 Các khái niệm RDF 1.4.3 Ngôn ngữ XML 1.4.2.1 Namespace cách khai báo 1.4.4 Cấu trúc RDF/XML Footer Page of 126 Header Page of 126 11 1.4.4.1 Cú pháp RDF/XML 1.4.4.2 RDF Container 1.4.5 RDF Collection 1.4.6 RDF Schema 1.4.6.1 Giới thiệu RDF Schema 1.4.6.2 Định nghĩa class(lớp) 1.4.6.3 Định nghĩa property(thuộc tính) 1.4.7 Truy vấn liệu Semantic Web 1.5 Các ứng dụng Web ngữ nghĩa 1.5.1 Các lĩnh vực ứng dụng 1.5.1.1 Semantic Search Engines Vấn đề đa số Search Engines có thuộc loại Keyword Search Engine Cơ chế chúng định kì duyệt Web để phát thay đổi, lập mục thay đổi Người sử dụng tạo câu truy vấn gồm từ khóa mục để nhận kết mong muốn Tuy nhiên, phương pháp gặp hai vấn đề sau đây:  Một từ khóa có hay nhiều ý nghĩa tùy theo ngữ cảnh Search Engine mối quan hệ từ khóa với  Các trang Web có ý nghĩa với câu truy vấn người sử dụng không tồn kết trả Nếu Search Engine tích hợp tri thức để hiểu ý nghĩa từ, cho ta kết xác hơn, lúc việc tìm kiếm dựa khái niệm (concept) theo từ khóa (keyword) 1.5.1.2 Khung làm việc để quản lý tri thức 1.5.2 Semantic Search Engine 1.5.2.1 Giới thiệu Semantic Search Engine Footer Page of 126 12 Search Engine ứng dụng quan trọng Thực tế cho thấy có nhiều Search Engines & xây dựng chúng đóng vai trò quan trọng Internet Search Engines Google, AOL, Yahoo, Altavista, MSN,… vô số Intranet Search Engines trường học, công ty, tổ chức,… Ngoài ra, có Search Engines khác tích hợp phần mềm Semantic Search Engine máy tìm kiếm dựa vào ngữ nghĩa quan điểm Semantic Web, mô tả ưu điểm Semantic Search Engine Semantic Search Engine khắc phục khuyết điểm Search Engine truyền thống (Keyword Search Engine) 1.5.2.2 So sánh Search Engine truyền thống Semantic Search Engine Search Engine truyền thống: Không thể tìm tài nguyên thích hợp cách hiệu vì:  Những tài liệu người dùng muốn tìm sử dụng thuật ngữ khác  Những lỗi tả biến thể từ ngữ xem thuật ngữ khác môi trường máy tính  Search Engine xử lý trang HTML cách thông minh Sematic Search Engine:  Một viễn cảnh lĩnh vực tri thức (knowledge domain) tốt  Cho phép tìm kiếm thông tin dựa nội dung tài liệu  Thông tin tìm kiếm trả xác phù hợp (tìm tài liệu mà ta tìm thấy dùng Search Eninge truyền thống) Header Page of 126 13 Chương KIẾN TRÚC CỦA HỆ THỐNG XUẤT BẢN TRỰC TUYẾN VỚI WEB NGỮ NGHĨA 2.1 Giới thiệu hệ thống xuất trực tuyến 2.1.1 Khái niệm, Ưu Nhược điểm Hệ thống Xuất Trực tuyến 2.1.1.1 Khái niệm Theo từ điển tiếng Việt Wikipedia định nghĩa: “Xuất trực tuyến hình thức phân phối ẩn phẩm kỹ thuật số thông qua mạng Internet Xuất trực tuyến gắn liền với xuất điện tử” 2.1.1.2 Ưu điểm Hệ thống Xuất Trực tuyến Những ưu điểm hệ thống xuất trực tuyến:  Tiết kiệm chi phí  Phổ biến tác phẩm với phạm vi rộng  Xuất trực tuyến sinh động  Thời gian đáp ứng nhanh  Marketing thuận tiện  Thanh toán nhanh  Không có hàng tồn truy cập trực tiếp đến doanh số bán hàng  Chỉnh sửa dễ dàng 2.1.1.3 Nhược điểm Hệ thống Xuất Trực tuyến Các nhược điểm hệ thống xuất trực tuyến:  Dễ vi phạm quyền  Chế tài cho xuất điện tử chưa rõ ràng  An toàn liệu bảo mật thông tin  Giải tranh chấp  Thanh toán điện tử gặp nhiều trở ngại 2.1.2 Cơ sở pháp lý Xuất Trực tuyến 2.1.3 Các hình thức xuất 2.1.3.1 Xuất dạng in 2.1.3.2 Xuất dạng công nghệ số Footer Page of 126 14 2.1.4 Nhu cầu xây dựng Hệ thống Xuất Trực tuyến 2.1.4.1 Thị trường nội dung Internet 2.1.4.2 Thị trường nội dung di động 2.1.4.3 Phát triển nội dung số Việt nam 2.1.4.4 Thị trường nội dung số tương lai 2.2 Xuất trực tuyến với Web ngữ nghĩa 2.2.1 Quy trình tổng quát xây dựng ứng dụng với Web ngữ nghĩa 2.2.1.1 Xây dựng Ontology Quy trình phát triển Ontology quy trình gồm nhiều bước, nhiên chưa có phương pháp chuẩn hóa để phát triển Ontology Quy trình phát triển gồm bước Stanford Center for Biomedical Informatics Research đưa (Đây nhóm phát triển phần mềm Protégé để trình diễn xoạn thảo Ontology):  Bước 1: Xác định lĩnh vực phạm vi Ontology  Bước 2: Xem xét việc sử dụng lại Ontology có sẵn  Bước 3: Liệt kê thuật ngữ quan trọng  Bước 4: Xác định lớp phân cấp lớp  Bước 5: Xác định thuộc tính  Bước 6: Xác định giới hạn thuộc tính, kiểu giá trị  Bước 7: Tạo thể / thực thể 2.2.1.2 Tạo ngữ nghĩa với RDF 2.2.1.3 Phân loại Ontology có theo lĩnh vực 2.2.1.4 Xây dựng Siêu liệu 2.2.1.5 Truy vấn liệu 2.2.2 Kiến trúc hệ thống xuất trực tuyến với web ngữ nghĩa 2.2.2.1 Giới thiệu Kiến trúc hệ thống xuất trực tuyến với Web ngữ nghĩa kết hợp hài hòa thống quy trình xuất trực tuyến quy trình xây dựng ứng dụng với Web ngữ nghĩa Từ kết hợp hình thành quy trình rõ ràng đồng thời xác định yêu cầu như: Các bước thực hiện, phương tiện, công cụ cho trình xây dựng ứng dụng Header Page of 126 15 2.2.2.2 Xây dựng mô hình tổng quát 16 Xây dựng sách điện tử (E-Book): Công đoạn việc xây dựng hệ thống xuất trực tuyến với Web ngữ nghĩa xây dựng CSDL dạng sách điện tử (E-Book) Việc xây dựng kho sách điện tử cho hệ thống tiến hành từ ba nguồn liệu chính:  Kho sách có: Kho sách có NXB TTTT  Liên kết với NXB: Liên kết với NXB khác  Xuất sách mới: Chu trình đời sách điện tử giống chu trình đời sách truyền thống: Đăng ký nội dung thảo, biên tập chế bản, đăng ký mã số xuất bản, định xuất tạo thành sách điện tử Tạo ứng dụng với Web ngữ nghĩa: Việc xây dựng siêu liệu kết hợp từ việc xây dựng ontology cho tài nguyên “sách” thông tin sách điện tử chứa CSDL hệ thống Sau tạo dựng Ontology cho tài nguyên sách tiến hành tạo ngữ nghĩa cho tài nguyên kết hợp với sách điện tử để tạo thành file lưu trữ dạng RDF/XML Tạo ứng dụng: Sau có siêu liệu tiến hành xây dựng ứng dụng tương ứng với chức hệ thống xuất trực tuyến với web ngữ nghĩa 2.3 Các yêu cầu để xây dựng ứng dụng 2.3.1 Các yêu cầu lưu trữ liệu 2.3.2 Các yêu cầu công cụ 2.3.3 Các yêu cầu chức Hình 2.4 Mô hình tổng quát hệ thống xuất trực tuyến với web ngữ nghĩa Footer Page of 126 2.3.3.1 Chức đăng ký xuất trực tuyến 2.3.3.2 Chức cập nhật tài nguyên 2.3.3.3 Chức tìm kiếm 2.3.3.4 Chức xem chi tiết thông tin 2.3.3.6 Chức thống kê số liệu 2.3.4 Các yêu cầu phi chức Header Page of 126 17 18 Chương TRIỂN KHAI XÂY DỰNG HỆ THỐNG XUẤT BẢN TRỰC TUYẾN CHO NHÀ XUẤT BẢN THÔNG TIN VÀ TRUYỀN THÔNG Ontology cho tài nguyên sách điện tử xây dựng dựa hai thành phần bản: 3.1 Giới thiệu Nhà xuất Thông tin Truyền thông Nhà xuất Thông tin Truyền thông (ICPublisher), tiền thân Nhà xuất Bưu điện, thành lập ngày 12/8/1997 theo Quyết định số 463/QĐ-TCCB Tổng cục trưởng Tổng cục Bưu điện sau Bộ Bưu viễn thông Năm 2008, với đời Bộ Thông tin Truyền thông, nhằm đáp ứng nhiệm vụ trị khẳng định định hướng phát triển đơn vị Nhà xuất Bưu điện đổi tên thành Nhà xuất Thông tin Truyền thông theo Quyết định số 1882/QĐ-BTTTT ngày 17/12/2008 Bộ trưởng Bộ Thông tin Truyền thông Nhà xuất Thông tin Truyền thông đơn vị nghiệp trực thuộc Bộ Thông tin Truyền thông Ngay từ thành lập NXB định hướng phục vụ đối tượng bạn đọc sử dụng tri thức khoa học, công nghệ, kỹ thuật, nghiệp vụ, kinh tế pháp luật lĩnh vực: Thông tin đối ngoại, Điện tử, Viễn thông, Công nghệ thông tin, Báo chí, xuất bản, Phát thanh, truyền hình, Bưu chính, Văn hóa - Xã hội, Văn học nghệ thuật, Kinh tế - Quản trị Kinh doanh, Ngoại ngữ, Từ điển 3.2 Xây dựng Ontology cho Tài nguyên Sách điện tử 3.2.1 Quy trình phát triển Ontology cho tài nguyên sách điện tử Ontology cho tài nguyên sách điện tử mô hình liệu biểu diễn lĩnh vực xuất trực tuyến, sử dụng để suy luận đối tượng lĩnh vực xuất trực tuyến mối quan hệ chúng Quy trình phát triển Ontology bao gồm bước (Stanford Center for Biomedical Informatics Research đề xuất) Footer Page of 126  Chuẩn Dublin Core: Là chuẩn dùng để mô tả liệu Metadata nhằm khai thác tài liệu thư viện Website thông qua mạng Internet Chuẩn Dublin Core bao gồm 15 yếu tố thiết lập từ hội thảo mang tầm cỡ quốc tế mang ý nghĩa kết hợp ngành khoa học: Thư viện, tin học, bảo tàng, mã hoá văn lĩnh vực khác có liên quan 15 yếu tố cảu chuẩn Dublin Core liệt kê cụ thể sau: Nhan đề (Title), tác giả (Creator), đề mục (Subject), mô tả (Description), xuất (Publisher), tác giả phụ (Contributor), ngày tháng (Date), loại hình (Type), mô tả vật lý (Format), định danh tư liệu (Identifier), nguồn gốc (Source), ngôn ngữ (Language), liên kết (Relation), nơi chứa (Coverage), quyền (Rights)  Được dùng lĩnh vực xuất bản: Nên thuật ngữ phải thuật ngữ dùng lĩnh vực xuất Các thuật ngữ quan trọng Ontology xác định cụ thể sau: Sách điện tử, nhan đề, tác giả, đề mục, mô tả, NXB, tác giả phụ, thời gian, loại hình, mô tả vật lý, định danh tư liệu, nguồn gốc, ngôn ngữ, liên kết, nơi chứa, quyền, thảo, thông tin đối ngoại, Điện tử - Viễn thông, Công nghệ thông tin, Báo chí - Xuất bản, Phát - Truyền hình, Bưu chính, Văn hóa - Xã hội, Văn học nghệ thuật, Kinh tế - Quản trị Kinh doanh, Ngoại ngữ, Từ điển, Họ, Tên, Ngày sinh, Giới tính, Nghề nghiệp, Địa chỉ, Điện thoại, chứa trong, xuất bởi, có tác giả là… Ngôn ngữ ontology chia thuộc tính thành hai loại khác thuộc tính quan hệ thuộc tính liệu, xác định cụ thể sau: Header Page 10 of 126 19  Thuộc tính quan hệ: Có thông tin, có tác giả, có nhà xuất bản, thuộc kho sách, thuộc nhà xuất bản, thuộc danh mục  Thuộc tính liệu: Có tên sách, có nội dung, thuộc lĩnh vực, có nội dung trích yếu, có lời giới thiệu, có lời nói đầu, có mục lục, có khổ sách, có số trang, có giá sách, có mã số ISBN, có số ĐKQĐXB, có số QĐXB, có mã số đăng ký quyền, có tên nhà xuất bản, có thời gian gửi thảo, có thời gian nộp lưu chiểu, thuộc ngôn ngữ, có nguồn gốc xuất xứ, có số CMND, có Họ tên, có ngày sinh, có quê quán, có giới tính,có nghề nghiệp, có địa chỉ, có điện thoại, có học hàm, có học vị, có email 20 3.2.3 Sử dụng Protégé thiết kế ontology Ontology cho tài nguyên “Sách điện tử” thiết kế công cụ Protégé 3.4.8 (Có API hỗ trợ cho việc xây dựng công cụ làm giàu sau này) thực qua bước cụ thể sau:  Bước 1: Tạo Ontology “Sách điện tử”  Bước 2: Tạo lớp ràng buộc  Bước 3: Tạo thuộc tính quan hệ  Bước 4: Tạo cá thể  Bước 5: Cấu trúc phân cấp Ontology “Sách điện tử” 3.2.2 Mô tả Ontology sách điện tử Hình 3.1 Ontology mô tả tài nguyên sách điện tử Footer Page 10 of 126 Hình 3.7 Mô hình phân cấp lớp Ontology “Sách điện tử” Header Page 11 of 126 21 3.3 Mô hình Ca sử dụng (Use - Case) 3.3.1 Danh sách tác nhân (Actor) 3.3.2 Danh sách ca sử dụng 3.3.3 Lược đồ mô hình ca sử dụng 22 3.5 Ứng dụng tìm kiếm theo ngữ nghĩa hệ thống 3.5.1 Mô hình tìm kiếm theo ngữ nghĩa hệ thống Mô hình tìm kiếm theo ngữ nghĩa cho tài nguyên sách điện tử môđun tìm kiếm hệ thống xuất trực tuyến (hình 3.10): 3.4 Cơ sở liệu cho hệ thống 3.4.1 Mô hình CSDL SQL sever Hình 3.10 Mô hình tìm kiếm theo ngữ nghĩa hệ thống Web Browser: Đóng vai trò giao tiếp với người dùng CSDL cho hệ thống: CSDL sau tổng hợp từ hệ thống ánh xạ vào Ontology Môđun tìm kiếm: Đây chức tìm kiếm chương trình chương trình thực thao tác sau:  Tổ chức lưu trữ Ontology, theo quan hệ, thuộc tính Ontology để hiển thị thông tin theo dạng phân cấp  Thực truy vấn yêu cầu người dùng Ontology trả kết cho Web Browser địa điểm theo yêu cầu người dùng Hình 3.9 Mô hình CSDL hệ thống 3.4.2 Danh sách bảng liệu 3.4.3 Chi tiết thông tin bảng liệu Footer Page 11 of 126 3.5.2 Xây dựng ứng dụng tìm kiếm theo ngữ nghĩa cho hệ thống 3.5.2.1 Ánh xạ CSDL hệ thống vào Ontology cho tài nguyên “Sách điện tử” Một tài nguyên Sách điện tử sau hoàn thiện nội dung hệ thống tổng hợp rút trích thông tin cần thiết CSDL ánh xạ vào individual (cá thể) Ontology tài nguyên Header Page 12 of 126 23 “Sách điện tử” Các thông tin cần thiết cần rút trích thuộc tính liệu: Danh mục, lĩnh vực, nội dung tóm tắt, giá sách, quyền, mã số sách, lời nói đầu, lời giới thiệu, mục lục, số trang, khổ sách, mã vạch, ISBN, nhà xuất bản, thời gian nhận thảo, nộp lưu chiểu, ngôn ngữ, thảo, nguồn gốc, biên soạn, biên dịch , họ tên, ngày sinh, CMND, quê quán, giới tính, nghề nghiệp, địa chỉ, điện thoại, học hàm, học vị, Email, tác giả, tác giả phụ Quá trình nhập individual (cá thể) vào Ontology thực công cụ Protégé 3.5.2.2 Truy xuất liệu ontology sang giao diện web Quá trình truy xuất liệu Ontology sang giao diện web trình điền đầy quan hệ ứng dụng tạo cho ứng dụng có thông tin hai chiều Quá trình thực theo thuật toán: Thuật toán: Bước 1: Mở tệp tin chứa ontology Bước 2: Đọc tất Properties có khai báo Symmetric Property đưa vào danh sách đối chiếu Bước 3: Duyệt qua tất đỉnh Ontology Nếu đỉnh có chứa quan hệ cần điền đầy theo danh sách đối chiếu (Bước 2) Điền thông tin quan hệ, ngược lại Quay lại xét cho đỉnh vừa điền Bước Ngược lại bỏ qua bước Bước 4: Đóng truy cập vào Ontology 3.5.2.3 Tìm kiếm Chức tìm kiếm dựa vào từ khóa tên sách điện tử thông tin sách điện tử Các bước tìm kiếm thực theo thuật toán mô tả cụ thể theo bước sau: Footer Page 12 of 126 24 Thuật toán: Bước 1: Duyệt tìm tất tên sách liên quan đến từ khóa tên sách yêu cầu truy vấn Bước 2: Nếu có tên sách thỏa mãn Bước thực hiện: Đọc Object Properties thỏa Bước Bước 3: Xác định lớp có Properties nằm Bước 2: Duyệt qua individual (Cá thể) lớp vừa xác định Kiểm tra tính quan hệ các thể để đưa giá trị liên quan Bước 4: Hiển thị kết 3.5.2.4 Tìm kiếm nâng cao Ngoài chức tìm kiếm hệ thống hỗ trợ chức tìm kiếm nâng cao Các bước tìm kiếm nâng cao thực theo thuật toán mô tả cụ thể theo bước sau: Thuật toán: Bước 1: Đọc tất thông tin có liên quan với tất yêu cầu liệu tìm kiếm Bước 2: Nếu kết Bước không rỗng, nghĩa tìm thông tin cần tìm Đọc tất thông tin có quan hệ với danh sách Bước theo quan hệ danh sách với yêu cầu tìm kiếm quan hệ ràng buộc Bước 3: Hiển thị kết tìm kiếm 3.6 Thiết kế hình 3.6.1 Màn hình hệ thống 3.6.2 Màn hình đăng ký 3.6.3 Màn hình đăng ký nội dung xuất 3.6.4 Màn hình cập nhật nội dung xuất 3.6.5 Màn hình tìm kiếm tài nguyên E-Book 3.6.6 Màn hình hiển thị kết tìm kiếm Header Page 13 of 126 25 KẾT LUẬN Trong bối cảnh nhu cầu ứng dụng công nghệ thông tin tăng, Internet phổ biến toàn giới, việc ứng dựng CNTT vào lĩnh vực đời sống mà đặc biệt lĩnh vực xuất nhu cầu cấp thiết Việc xây dựng hệ thống xuất trực tuyến ngày trở nên hấp dẫn So với xuất giấy, đĩa, xuất trực tuyến có ưu điểm rõ rệt giảm thiểu chi phí, tốc độ cập nhật thông tin, dễ dàng tìm kiếm qua công cụ tìm kiếm yahoo, google, livesearch Bên cạnh người sử dụng công giữ gìn thông tin họ cần mà cần họ tìm đến nhà xuất trực tuyến để lấy thông tin Trong khuôn khổ luận án tốt nghiệp này, người thực tìm hiểu, nghiên cứu trình bày khái niệm Web ngữ nghĩa, sách điện tử, xuất trực tuyến ứng dụng web ngữ nghĩa để xây dựng hệ thống xuất trực tuyến xây dựng thử nghiệm thành công hệ thống xuất trực tuyến Kết đạt được:  Tìm hiểu trình bày kiến thức Web ngữ nghĩa  Tìm hiểu trình bày kiến thức xuất trực tuyến  Tìm hiểu trình bày kiến thức “Sách điện tử”  Xây dựng kiến trúc hệ thống xuất trực tuyến với Web ngữ nghĩa  Xây dựng Ontology cho lĩnh vực xuất mà cụ thể cho tài nguyên “Sách điện tử”  Ứng dụng web ngữ nghĩa xây dựng hệ thống xuất trực tuyến cho Nhà xuất Thông tin Truyền thông, mà cụ thể xây dựng môđun tìm kiếm cho hệ thống Hạn chế:  Mặc dù có nhiều cố gắng nỗ lực nghiên cứu thời gian cho phép, Web ngữ nghĩa công nghệ Footer Page 13 of 126 26 tương đối bên cạnh xuất trực tuyến lĩnh vực hoàn toàn nên không tránh khỏi thiếu sót  Chưa tìm hiểu sâu nghiên cứu vấn đề bảo mật Web ngữ nghĩa để ứng dụng vào việc bảo mật hệ thống xuất trực tuyến  Chưa xây dựng sách quản lý quyền, toán điện tử cho hệ thống xuất trực tuyến gặp nhiều trở ngại  Chưa xây dựng hoàn thiện tối ưu hóa chức tìm kiếm, đăng ký xuất quản lý xuất hệ thống xuất trực tuyến Hướng phát triển đề tài:  Nghiên cứu sâu chế bảo mật công nghệ Web ngữ nghĩa để ứng dụng vào việc bảo mật hệ thống xuất trực tuyến  Nghiên cứu sâu lĩnh vực thương mại điện tử mà đặc biệt việc toán điện tử để hoàn thiện chức phát hành sách điện tử cho hệ thống xuất trực tuyến  Nghiên cứu phương pháp nhằm hoàn thiện chức tìm kiếm, đăng ký xuất quản lý xuất cho hệ thống xuất trực tuyến  Nghiên cứu phương pháp để ánh xạ CSDL hệ thống vào Ontology cho tài nguyên “Sách điện tử” thực cách tự động Việc nghiên cứu đề tài giúp nắm xu việc nghiên cứu triển khai ứng dụng thực tiển Web ngữ nghĩa hướng nghiên cứu mang tính chất thời đại giai đoạn Và từ áp dụng CNTT mà cụ thể Web ngữ nghĩa vào lĩnh vực xuất để xây dựng hệ thống xuất trực tuyến ... KHAI XÂY DỰNG HỆ THỐNG XUẤT BẢN TRỰC TUYẾN CHO NHÀ XUẤT BẢN THÔNG TIN VÀ TRUYỀN THÔNG Ontology cho tài nguyên sách điện tử xây dựng dựa hai thành phần bản: 3.1 Giới thiệu Nhà xuất Thông tin Truyền. .. Ứng dụng web ngữ nghĩa xây dựng hệ thống xuất trực tuyến cho Nhà xuất Thông tin Truyền thông, mà cụ thể xây dựng môđun tìm kiếm cho hệ thống Hạn chế:  Mặc dù có nhiều cố gắng nỗ lực nghiên cứu. .. thống xuất trực tuyến với Web ngữ nghĩa 1.1.2.2 Web ngữ nghĩa mang lại gì? Chương 3: Triển khai xây dựng Hệ thống xuất trực tuyến cho Nhà xuất Thông tin Truyền thông: Giới thiệu vấn đề để xây dựng

Ngày đăng: 06/05/2017, 12:04

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan