Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 73 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
73
Dung lượng
2,11 MB
Nội dung
1 ĐẠI HỌC ĐÀ NẴNG TRƯỜNG ĐẠI HỌC BÁCH KHOA TRẦN THỊ HỒNG NHUNG XÂY DỰNG HỆ THỐNG HỖ TRỢ TƯ VẤN THIẾT KẾ NHÀ DÂN DỤNG DỰA TRÊN SEMANTIC WEB LUẬN VĂN THẠC SĨ KỸ THUẬT Đà Nẵng - Năm 2017 ĐẠI HỌC ĐÀ NẴNG TRƯỜNG ĐẠI HỌC BÁCH KHOA TRẦN THỊ HỒNG NHUNG XÂY DỰNG HỆ THỐNG HỖ TRỢ TƯ VẤN THIẾT KẾ NHÀ DÂN DỤNG DỰA TRÊN SEMANTIC WEB Chuyên ngành: Khoa học máy tính Mã số: 60.48.01.01 LUẬN VĂN THẠC SĨ KỸ THUẬT Người hướng dẫn khoa học: PGS.TS VÕ TRUNG HÙNG Đà Nẵng - Năm 2017 i LỜI CAM ĐOAN Tôi cam đoan cơng trình nghiên cứu riêng tơi Các số liệu, kết nêu luận văn trung thực chưa công bố công trình khác Tác giả luận văn Trần Thị Hồng Nhung ii TÓM TẮT LUẬN VĂN XÂY DỰNG HỆ THỐNG HỖ TRỢ TƯ VẤN THIẾT KẾ NHÀ DÂN DỤNG Học viên: Trần Thị Hồng Nhung Chuyên ngành: Khoa học máy tính Mã số: 60.48.01 Khóa: 31 Trường Đại học Bách khoa - ĐHĐN Tóm tắt - Hiện nay, giới có nhiều hệ thống hỏi-đáp tự động hỗ trợ cho người dùng Tuy nhiên, hệ thống hầu hết hỏi đáp ngôn ngữ tiếng Anh Nhu cầu xây dựng hệ thống hỗ trợ cho người dùng Việt muốn đặt câu hỏi vấn đề cần thiết có ích, điển hình vấn đề lĩnh vực tư vấn, thiết kế nhà dân dụng Luận văn tập trung nghiên cứu xây dựng “Hệ thống hỗ trợ tư vấn thiết kế nhà dân dụng dựa Semantic web” nhằm cụ thể hóa nhu cầu Hệ thống cho phép người dùng nhập vào câu hỏi hay từ khóa tiếng Việt thuộc lĩnh vực tư vấn thiết kế nhà dân dụng Tiếp đến tiến hành phân tích câu hỏi/từ khóa đó, thực việc tách từ tiếng Việt cần thiết Dựa vào từ khóa có sau tách từ, hệ thống thực truy vấn liệu ontology trả kết cho người dùng thơng qua thư viện Jena Nếu khơng có từ khóa thỏa mãn yêu cầu tìm kiếm, hệ thống thơng báo khơng tìm người dùng nhập lại câu hỏi/từ khóa khác Từ khóa - Xử lý ngôn ngữ tự nhiên, tách từ tiếng Việt, web ngữ nghĩa, hệ thống hỗ trợ, tư vấn thiết kế, nhà dân dụng BUILDING AN ADVISORY SUPPORT SYSTEM FOR THE DESIGN OF CIVIL HOUSES Abstract – Currently, the world has many question-answer system automatically support the user However, these systems are in English language Before the demand for support Vietnamese user when to ask questions about an issue that is very necessary and useful, such as the problems in the field of consultancy and design of civil houses This thesis forcuses on the building an "advising support system of the design of civil houses" The system allows users to ask a question in a Vietnamese or a keyword concerning in the field of consultancy and design of civil houses The system will analyze the Vietnamese question/keyword of the user, then, the system will the Vietnamese word segmentation if necessary Basing on the keywords after the segmentation, the system will query data on ontology database and returns the result for the user through Jena library If no keyword is suitable for searching criteria, the system will alert no result found, and the user will reenter the other question/keyword Keywords - Natural language processing, Vietnamese word segmentation, semantic web, support systems, consultancy and design, civil houses iii MỤC LỤC LỜI CAM ĐOAN i TÓM TẮT LUẬN VĂN ii MỤC LỤC iii DANH MỤC CÁC TỪ VIẾT TẮT vi DANH MỤC CÁC BẢNG vii DANH MỤC CÁC HÌNH viii MỞ ĐẦU 1 Lý chọn đề tài Mục tiêu nhiệm vụ Đối tượng phạm vi nghiên cứu Giả thiết nghiên cứu Phương pháp nghiên cứu Ý nghĩa khoa học thực tiễn đề tài Bố cục luận văn CHƯƠNG TỔNG QUAN VỀ SEMANTIC WEB 1.1 TỔNG QUAN WEB NGỮ NGHĨA 1.1.1 Sự đời Semantic Web 1.1.2 Khái niệm 1.2 KIẾN TRÚC CỦA SEMANTIC WEB 1.2.1 Giới thiệu 1.2.2 Vai trò tầng 1.2.2.1 Tầng Unicode URI 1.2.2.2 Tầng XML 1.2.2.3 Tầng RDF RDFS (RDF schema) 1.2.2.4 Tầng Ontology vocabulary 1.2.2.5 Tầng Logic 1.2.2.6 Tầng Proof 1.2.2.7 Tầng trust 1.2.3 Ontology 1.2.3.1 Khái niệm 1.2.3.2 Yêu cầu sử dụng Ontology 11 1.2.3.3 Vai trò Ontology 11 1.2.3.4 Các thành phần Ontology 12 1.2.3.5 Ngôn ngữ OWL 13 iv 1.2.4 Quy trình xây dựng Semantic Web 13 1.2.5 Công cụ phát triển Semantic Web 15 1.2.5.1 Công cụ phát triển Ontology 15 1.2.5.2 Công cụ kết nối thao tác với Ontology 18 1.2.5.3 Công cụ tách từ 24 CHƯƠNG PHÂN TÍCH THIẾT KẾ HỆ THỐNG 28 2.1 TỔNG QUAN VỀ NHÀ Ở 28 2.1.1 Khái niệm 28 2.1.2 Đặc điểm thiết kế kiến trúc nhà dân dụng 28 2.1.3 Giải pháp tổ chức liên hệ giao thông nhà 29 2.1.4 Phân loại nhà 29 2.1.4.1 Phân loại dựa vào hình thức tổ chức đáp ứng công 29 2.1.4.2 Phân loại dựa theo độ cao 30 2.1.4.3 Phân loại dựa theo đối tượng phục vụ ý nghĩa xã hội 30 2.1.4.4 Các phận cần có hộ 31 2.2 PHÂN TÍCH HỆ THỐNG TRA CỨU THÔNG TIN THIẾT KẾ NHÀ DÂN DỤNG 33 2.2.1 Giới thiệu 33 2.2.2 Mô tả ứng dụng 33 2.2.3 Phân tích hệ thống 34 2.2.3.1 Các yêu cầu lưu trữ 34 2.2.3.2 Các yêu cầu giao diện 35 2.2.3.3 Các yêu cầu chức 35 2.2.3.4 Các yêu cầu phi chức 35 2.2.4 Thiết kế hệ thống 36 2.2.4.1 Mơ hình đề xuất 36 2.2.4.2 Mơ hình use-case cho đối tượng người sử dụng hệ thống 37 2.2.4.3 Đặc tả use-case phân hệ người sử dụng 38 2.2.4.4 Đặc tả use-case phân hệ người quản trị hệ thống 39 CHƯƠNG PHÁT TRIỂN ỨNG DỤNG 42 3.1 TỔNG QUAN HỆ THỐNG 42 3.2 PHÁT TRIỂN ỨNG DỤNG 43 3.2.1 Xây dựng Ontology 43 3.2.2 Xây dựng Website tìm kiếm 47 3.2.2.1 Xây dựng giao diện ứng dụng 47 3.2.2.2 Xây dựng máy tìm kiếm 48 3.2.2.3 Các công cụ, thư viện, phần mềm sử dụng phát triển ứng dụng 52 3.3 ĐÁNH GIÁ KẾT QUẢ CỦA HỆ THỐNG 52 v KẾT LUẬN 54 DANH MỤC TÀI LIỆU THAM KHẢO 56 QUYẾT ĐỊNH GIAO ĐỀ TÀI BẢN SAO KẾT LUẬN CỦA HỘI ĐỒNG, BẢN SAO NHẬN XÉT CỦA CÁC PHẢN BIỆN vi DANH MỤC CÁC TỪ VIẾT TẮT STT Từ viết tắt Diễn giải CSDL Cơ sở liệu DAML DARPA Markup Language HTML HyperText Markup Language HTTP HyperText Transfer Protocol IRI Internationalized Resource Identifier ISO International Standards Organization IWS Institute of Web Science OIL Ontology Inference Layer OWL Web Ontology Language 10 RDF Resource Description Framework 11 RDFS Resource Description Framework Schema 12 SGML Standard Generalized Markup Language 13 SWSE Semantic Web Search Engine 14 URI Uniform Resource Identifier 15 URL Uniform Resource Locator 16 WWW World Wide Web vii DANH MỤC CÁC BẢNG Số hiệu Tên bảng Trang bảng 1.1 3.1 So sánh điểm khác biệt tiếng Việt Tiếng Anh Một số thuật ngữ quan trọng thiết kế nhà dân dụng 24 44 viii DANH MỤC CÁC HÌNH Số hiệu Tên hình hình Trang 1.1 Một đề xuất nguồn gốc Web với CERN 1.2 Kiến trúc Web ngữ nghĩa 1.3 Bộ ba RDF 1.4 Mô tả suy luận ngang cấp Web Semantic 10 1.5 Mô tả suy luận ngược Web Semantic 10 1.6 Giao tiếp đồ hoạ Protégé 17 1.7 Mơ hình quan hệ nút cạnh 21 1.8 Mơ hình xử lý tiếng Việt JvnTextPro 25 1.9 Tách từ theo phương pháp so khớp tối đa 27 2.1 Mơ hình hệ thống 34 2.2 Mơ hình hoạt động hệ thống đề xuất 36 2.3 Mơ hình use-case đặc tả chức người dùng hệ thống 37 2.4 Mơ hình use-case đặc tả chức người quản trị hệ thống 38 2.5 Đặc tả chức tìm kiếm thơng tin 38 2.6 Đặc tả chức xem thông tin chi tiết 39 2.7 Chức Thêm tài nguyên 40 2.8 Chức Xóa tài nguyên 40 2.9 Chức Cập nhật tài nguyên 41 3.1 Kiến trúc tổng thể hệ thống 43 3.2 Các lớp ứng dụng 45 3.3 Các thuộc tính ứng dụng 46 3.4 Các cá thể ứng dụng 47 3.5 Giao diện tìm kiếm hệ thống 48 3.6 Quy trình truy xuất liệu Bộ máy tìm kiếm 49 3.7 Kết tìm kiếm theo từ khóa 50 49 Hình 3.6 Quy trình truy xuất liệu Bộ máy tìm kiếm Kết thực chức tìm kiếm Chức tìm kiếm đơn giản dựa vào từ khóa tên thông tin nhu cầu mong muốn người dùng Người dùng nhập chuỗi tìm kiếm liên quan thiết kế nhà như: phòng ngủ, phịng khách, ban cơng, lơ gia… Sau hệ thống tiến hành việc tách từ tiếng Việt, sau sử dụng từ làm từ khóa để thực việc tìm kiếm ontology 50 Hình 3.7 Kết tìm kiếm theo từ khóa Một vấn đề khó khăn tìm kiếm Ontology từ khóa tìm kiếm phải giống tên thuộc tính hay tài nguyên Ontology Ứng dụng sử dụng tiếng Việt nên việc tìm kiếm gặp khó khăn độ xác khơng cao Cho nên để tìm kiếm tiếng Việt hệ thống cần phải thực việc tách câu truy vấn hay chuỗi từ khóa nhập vào thành từ đơn lẻ có nghĩa việc tìm kiếm trở nên xác Trong khuôn khổ luận văn tác giả sử dụng phần mềm VnTokenizer để thực việc tách từ để dùng cho việc truy xuất Ontology Việc tách từ thực đơn giản sau: Khai báo mảng chuỗi: String[] tokenArrayString; Khai báo thực thể tách từ: VietTokenizer tokenizer = new VietTokenizer(); Thực tách từ: tokenArrayString = tokenizer.tokenize(value); Kết trả sau tách từ mảng chuỗi, phần tử chữ tiếng Việt 51 Website xây dựng theo mơ hình MVC, nhấp chọn vào nút tìm kiếm trang tìm kiếm, liệu gửi tới Controller để xử lý, từ Controller u cầu Mơ hình xử lý tìm kiếm xử lý đợi kết để trả cho máy khách Ở Jena làm nhiệm vụ tiếp nhận liệu yêu cầu nhiệm vụ kết nối với Ontology để tìm kiếm liệu Việc sử dụng Jena hệ thống minh họa cụ thể sau: Mở đọc tập tin Ontology: String file = " / /ontology/House_29-6-17.owl"; Model data = ModelFactory.createDefaultModel(); Model model = ModelFactory.createDefaultModel(); InputStream in ; try { in = FileManager.get().open( file ); data.read(in, ""); } catch (Exception e ) { } Tạo tài nguyên (Resource) thêm vào thuộc tính (Properties): Resource configuration=model.createResource(); configuration.addProperty(ReasonerVocabulary.PROPru leMode, "forward"); configuration.addProperty(ReasonerVocabulary.PROPru leSet, " / /rules/rule.rules"); Reasoner reasoner = GenericRuleReasonerFactory.theInstance().create(con figuration); Ở quy tắc suy luận lưu tập tin rule.rules, hệ thống thực đọc quy tắc thêm vào thuộc tính Tài ngun Tạo mơ hình suy luận: infModel=ModelFactory.createInfModel(reasoner,data) ; Liệt kê Subject Tài nguyên với thuộc tính tham số vào: 52 ResIterator searchResult=null; searchResult=model.listSubjectsWithProperty(null,key word); Liệt kê tất ba hay Statement: StmtIterator SearchResult=model.listStatements (res,searchProperty,(RDFNode)null); while(SearchResult.hasNext()) { result=SearchResult.nextStatement() getObject().toString(); } 3.2.2.3 Các công cụ, thư viện, phần mềm sử dụng phát triển ứng dụng Phần mềm Eclipse Juno Ngôn ngữ lập trình Java, JSP, Servlet Ngơn ngữ truy vấn liệu RDF: SPARQL Thư viện mã nguồn mở Jena Thư viện nguồn mở VnTokenizer Trình duyệt IE, Google Chrome, Firefox,… 3.3 Đánh giá kết hệ thống Trong chương này, luận văn sử dụng phần mềm Protégé số phần mềm khác xây dựng thành công hệ thống hỗ trợ, tư vấn thiết kế nhà dân dụng Tuy nhiên, thiết kế nhà công việc khơng phải đơn giản, cần phải có chuyên gia thiết kế hỗ trợ, tư vấn hệ thống hồn thiện đưa vào sử dụng Để hỗ trợ tư vấn đa dạng phong phú thể loại yêu cầu cần phải xây dựng liệu ontology đa dạng Trong khuôn khổ luận văn, tác giả thu thập 50 tài liệu thiết kế nhà, 100 mẫu thiết kế nhà, 100 vẽ chi tiết, 50 mơ hình nhà làm liệu thử nghiệm Để hệ thống đa dạng đưa hệ thống vào thực tế, liệu thường xuyên cập nhật để hỗ trợ tốt cho người có nhu cầu Máy tìm kiếm Google, hay Yahoo… áp dụng Semantic web vào cơng cụ tìm kiếm mình, nhiên cơng cụ tìm kiếm chung chung tất thứ có tồn Internet, dùng hai cơng cụ để tìm kết trả nhiều, người dùng lại phải dị tìm thông tin cần dùng rừng liệu Hệ 53 thống khơng có tham vọng thay cho Google hay Yahoo mà công cụ hỗ trợ thêm cho người dùng chuyên ngành thiết kế, xây dựng dân dụng Việc phát triển ứng dụng semantic bước đầu ghi nhận kết khả quan Hệ thống giải vấn đề đặt ra, đáp ứng nhu cầu tìm kiếm cách nhanh chóng, xác, cung cấp cách có hiệu thơng tin cần thiết thiết kế kiến trúc nhà Qua người dùng có số kiến thức chung nhà ở, để có ngơi nhà khơng đẹp mà cịn tiện dụng, người sống nhà có sức khỏe thái độ tốt, mối quan hệ công việc làm ăn có thuận lợi nhờ vào việc áp dụng phong thủy tốt, hợp cho gia chủ nhà 54 KẾT LUẬN Kết luận Ngày với lượng thông tin khổng lồ Internet lượng người có nhu cầu truy cập tìm kiếm, tra cứu ngày tăng đáng kể, công nghệ Semantic Web đời tạo bước phát triển cho hệ Web Công nghệ Semantic Web giúp cho người thêm ngữ nghĩa vào tài liệu ngơn ngữ mà máy tính hiểu Điều làm cho máy tính hiểu thơng tin Web, từ giúp việc tìm kiếm nhanh chóng xác Với cơng nghệ Semantic Web liệu Web định nghĩa liên kết theo cách mà máy tính hiểu khơng cho mục đích hiển thị mà cịn cho mục đích tự động, tích hợp tái sử dụng liệu qua ứng dụng khác Semantic Web thật mạng lại nhiều thuận lợi để thật hiểu rõ nắm vững Semantic Web điều khơng dễ dàng Trong q trình thực luận văn tham khảo thông tin báo, sách, tạp chí nguồn khác Internet, với hướng dẫn tận tình Thầy Võ Trung Hùng hoàn thành yêu cầu đặt Việc phát triển ngày nhanh liệu văn xây dựng Ontology theo lĩnh vực vấn đề tất yếu Vì luận văn tập trung nghiên cứu xây dựng thành công Ontology thiết kế kiến trúc nhà dân dụng phần mềm protégé 4.1, ứng dụng công nghệ Semantic Web xây dựng hệ thống tư vấn thiết kế nhà dân dụng đạt kết ban đầu 1.1 Về lý thuyết Trong luận văn nêu nét đặc trưng sở lý thuyết Semantic Web, nghiên cứu RDF, cách thức xây dựng Ontology ngôn ngữ OWL thành phần quan trọng Semantic Web, cho thấy khả hiệu sử dụng cao hệ Web Luận văn cịn đưa cơng cụ cần thiết để phát triển ứng dụng Semantic Web hiệu Song song với việc giải vấn đề giao tiếp người máy, đa dạng thông tin nhu cầu cần thiết sử dụng thơng tin hiệu quả, nhanh chóng tổ chức cá nhân Đặc biệt, với xu hướng đưa ứng dụng lên Web Semantic Web ngày trở nên thực tiễn Nghiên cứu ngơn ngữ lập trình JSP, Servlet, Java, sử dụng gói thư viện hỗ trợ nhúng vào chương trình Nắm rõ cách xây dựng, lưu trữ thơng tin đối tượng Semantic Web 55 1.2 Về ứng dụng Xây dựng demo tìm kiếm thông tin nhà Việc phát triển ứng dụng giúp đỡ người dân có nhu cầu xây dựng nhà Với ứng dụng sử dụng mơ hình lưu trữ liệu có ngữ nghĩa nên việc tìm kiếm xác Ứng dụng người dùng cần nhập từ khóa tương ứng thiết kế nhà ở: kiểu nhà, phòng ngủ, ban cơng….hệ thống hiển thị theo từ khóa nhập vào để tham khảo Về kết thực nghiệm ứng dụng phát triển hệ thống hỗ trợ tư vấn thiết kế nhà dân dụng chứng minh tảng lý thuyết nghiên cứu kết hợp mơ hình phát triển công cụ hỗ trợ phát triển với cơng nghệ Java, hồn tồn xây dựng thành cơng ứng dụng Web 3.0.Ứng dụng cịn chứng minh tính vượt trội cơng nghệ Web 3.0 với công nghệ Web xây dựng trước Ứng dụng đưa chức có tính chất minh họa cho phần lý thuyết thể mô ý tưởng mà chưa có đầu tư nhiều chất lượng hình ảnh giao tiếp, giao diện trang Web với người sử dụng Hướng phát triển đề tài Luận văn khép lại với kết đạt yêu cầu đề tài đặt Tuy nhiên qua q trình thực đề tơi nhận thấy nhiều vấn đề khác liên quan đến lĩnh vực cần quan tâm như: Hệ thống hỗ trợ tư vấn thiết kế nhà dân dụng tảng để phát triển hệ thống tra cứu thơng tin lĩnh vực khác có liên quan Triển khai ứng dụng thực tế, mơi trường Internet để hệ thống có điều kiện hỗ trợ tốt cho nhiều người mong muốn ban đầu Ứng dụng cần có từ điển từ đồng nghĩa phong phú lĩnh vực mà ứng dụng hỗ trợ giúp cho việc tìm kiếm theo ngữ nghĩa đạt kết tốt 56 DANH MỤC TÀI LIỆU THAM KHẢO Tài liệu tiếng Anh [1] Grigoris Antoniou and Frank Van Harmelen A Semantic Web Primer MIT Press, 2004 [2] T Berners – Lee, J Hendler, O Lassila The Semantic Web Scientific American, vol.248, 2001, 28 – 37 [3] Toby Segaran, Colin Evans, Jamie Taylor Programming The Semantic Web O’Reilly – Media, July 2009 [4] Tom Gruber Ontology Entry in the Encyclopedia of Database Systems, Ling Liu and M Tamer Özsu (Eds.), Springer-Verlag, 2008 Tài liệu tiếng Việt [5] Võ Trung Hùng Bài giảng Xử lý ngôn ngữ tự nhiên Ban Khoa học Công Nghệ, Đại học Đà Nẵng [6] Nguyễn Thanh Bình Bài giảng phân tích thiết kế hệ thống hướng đối tượng Đại học Đà Nẵng, 2007 [7] Cao Vũ Đàm Phương pháp luận nghiên cứu khoa học NXB KH&KT, Hà Nội, 2003 [8] Võ Hoàng Nguyên, Hoàng Lê Quân Giới thiệu Web Semantic & Ontology 5/2009 [9] Hoàng Hữu Hạnh Web ngữ nghĩa: Những thách thức hướng tiếp cận Tạp chí Khoa học, Đại học Huế, Số 48, 2008 [10] Phạm Khánh Thiện Ứng dụng Web semantic để xây dựng hệ thống tra cứu thơng tin về văn hóa Tây Nguyên Luận văn thạc sĩ kỹ thuật, Đại học Đà Nẵng, 2011 [11] Nguyễn Thúc Duy Anh, Nguyễn Thị Khánh Hịa Nghiên cứu, tìm hiểu xây dựng ứng dụng với Web ngữ nghĩa Luận văn cử nhân tin học, Đại học Khoa học tự nhiên TP HCM, 2005 [12] Nguyễn Trần Trọng Ứng dụng Web ngữ nghĩa xây dựng hệ thống trợ giúp học tập cho học sinh bậc Trung học Phổ thông Luận văn thạc sĩ kỹ thuật, Đại học Đà nẵng, 2011 [13] Lê Thị Thanh Tâm, Hoàng Hữu Hạnh, Lê Mạnh Thạnh Nghiên cứu triển khai Linked Data cho ứng dụng Web ngữ nghĩa Tạp chí khoa học, Đại học Huế, Số 65, 2011 [14] Từ Minh Phương, Trịnh Hữu Kiên Công cụ hỗ trợ tạo ngữ nghĩa trang Web sử dụng kỹ thuật tách thơng tin từ văn Tạp chí Bưu Viễn thơng [15] Nguyễn Cơng Nhật Web ngữ nghĩa Thư viện số Tạp chí Thư viện Việt Nam 57 [16] Nguyễn Đức Thiềm Kiến trúc nhà Nhà xuất xây dựng, Hà Nội 2006 [17] L H Phương, N T M Huyền TV Ho (2010), A hybrid approach to word segmentation of Vietnamese texts, http://mim.hus.vnu.edu.vn/phuonglh/node/33