KỸ THUẬT NÂNG CAO HIỆU QUẢ TRA CỨU SÁCH TẠI THƯ VIỆN TRƯỜNG CAO ĐẲNG KINH TẾ CÔNG NGHỆ TP.HCM

107 215 0
KỸ THUẬT NÂNG CAO HIỆU QUẢ TRA CỨU SÁCH TẠI THƯ VIỆN TRƯỜNG CAO ĐẲNG KINH TẾ CÔNG NGHỆ TP.HCM

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Header Page of 137 i CHUẨN Y CỦA HỘI ĐỒNG BẢO VỆ LUẬN VĂN  Luận văn tựa đề “KỸ THUẬT NÂNG CAO HIỆU QUẢ TRA CỨU SÁCH TẠI THƯ VIỆN TRƯỜNG CAO ĐẲNG KINH TẾ CÔNG NGHỆ TP.HCM” Phan Văn Út thực nộp nhằm thỏa yêu cầu tốt nghiệp Thạc sĩ ngành Khoa Học Máy Tính Ngày bảo vệ luận văn, TP.HCM, ngày 21 tháng 11 năm 2015 Chủ tịch Hội đồng Người hướng dẫn PGS.TS Trần Công Hùng Học viện công nghệ Bưu Viễn Thơng Ngày PGS.TS Đỗ Văn Nhơn Đại học Công Nghệ Thông tin TpHCM tháng năm 2015 Ngày Viện Đào Tạo Sau Đại Học GS TSKH Hoàng Văn Kiếm Ngày tháng nă m 2015 Footer Page of 137 tháng năm 2015 Header Page of 137 ii LÝ LỊCH CÁ NHÂN - Họ tên: Phan Văn Út - Ngày sinh: 10 tháng 08 năm 1985 - Nơi sinh: Bình Định - Tốt nghiệp PTTH Trường Trung học phổ thơng Tam Quan, Hồi Nhơn, Bình Định, năm 2004 Tốt nghiệp Đại học ngành Tin học Trường Đại học Văn Lang, Thành phố - Hồ Chí Minh - Q trình cơng tác: Nơi cơng tác Thời gian Năm 2009 đến Chức vụ Trường CĐ Kinh tế - Công nghệ Nhân viên Trung tâm Tp HCM thông tin thư viện - Địa liên lạc: 482/2 Khu phố 3A, Phường Thạnh Lộc, Quận 12, Tp HCM - Điện thoại: 0902.051.560 - Email: phanvanut1008@gmail.com Footer Page of 137 Header Page of 137 iii LỜI CAM ĐOAN Tôi xin cam đoan đề tài “Kỹ thuật nâng cao hiệu tra cứu sách Thư viện trường cao đẳng Kinh tế công nghệ TPHCM” cơng trình nghiên cứu tơi Ngồi trừ tài liệu tham khảo trích dẫn luận văn này, tơi cam đoan tồn phần hay phần nhỏ luận văn chưa công bố sử dụng để nhận cấp nơi khác Khơng có sản phẩm/nghiên cứu người khác sử dụng luận văn mà không trích dẫn theo quy định Tp Hồ Chí Minh, ngày 25 tháng 10 năm 2015 Tác giả luận văn Phan Văn Út Footer Page of 137 Header Page of 137 iv LỜI CẢM ƠN Xin cho tơi gửi lịng biết ơn đến Thầy PGS.TS Đỗ Văn Nhơn – người hướng dẫn luận văn cho Trong suốt thời gian thực luận văn, Thầy tận tình hướng dẫn có lời khun, đóng góp q báu, giúp cho tơi định hướng hồn thành mục tiêu đề Tơi xin chân thành tỏ lòng biết ơn đến quý Thầy, Cơ tận tình giảng dạy cho tơi suốt năm học qua chương trình đào tạo Thạc sĩ khoa học máy tính, Trường Đại học quốc tế Hồng Bàng Cho tơi gửi lịng biết ơn trân trọng đến người lãnh đạo quan, tạo điều kiện thuận lợi để công tác học tập Xin cảm ơn tất bạn bè động viên, giúp đỡ đóng góp cho tơi nhiều ý kiến q báu, qua giúp chúng tơi hồn thiện cho đề tài Và cuối cùng, không quên gửi lời cảm ơn đến tác giả báo cáo nghiên cứu khoa học mà tham khảo tìm hiểu cho đề tài Luận văn hoàn thành với số kết định nhiên khơng tránh khỏi thiếu sót Kính mong cảm thơng đóng góp ý kiến từ q thầy cô bạn Một lần xin chân thành cảm ơn! Thành phố Hồ Chí Minh, ngày 25 tháng 10 năm 2015 Người thực Phan Văn Út Footer Page of 137 Header Page of 137 v NHẬN XÉT CỦA GIẢNG VIÊN HƯỚNG DẪN Tp Hồ Chí Minh, ngày Footer Page of 137 tháng năm 2015 Header Page of 137 vi NHẬN XÉT CỦA GIẢNG VIÊN PHẢN BIỆN Tp Hồ Chí Minh, ngày Footer Page of 137 tháng năm 2015 Header Page of 137 vii NHẬN XÉT CỦA GIẢNG VIÊN PHẢN BIỆN Tp Hồ Chí Minh, ngày Footer Page of 137 tháng năm 2015 Header Page of 137 viii NHẬN XÉT CỦA HỘI ĐỒNG PHẢN BIỆN Tp Hồ Chí Minh, ngày Footer Page of 137 tháng năm 2015 Header Page of 137 ix MỤC LỤC CHUẨN Y CỦA HỘI ĐỒNG BẢO VỆ LUẬN VĂN i LÝ LỊCH CÁ NHÂN ii LỜI CAM ĐOAN iii LỜI CẢM ƠN iv MỤC LỤC ix DANH MỤC CÁC HÌNH VẼ, ĐỒ THỊ xii DANH MỤC CÁC BẢNG xiii DANH SÁCH CÁC KÝ HIỆU, CHỮ VIẾT TẮT xiv TÓM TẮT xv ABSTRACT xvii MỞ ĐẦU xviii CHƯƠNG 1: TỔNG QUAN VỀ ĐỀ TÀI 1.1 Giới thiệu tổng quan vấn đề nghiên cứu 1.1.1 Nhu cầu thực trạng tìm kiếm theo ngữ nghĩa kho tài liệu 1.1.2 Khảo sát số giải pháp ứng dụng tìm kiếm ngữ nghĩa kho tài liệu 1.2 Mục tiêu phạm vi nghiên cứu 1.3 Phương pháp nghiên cứu 1.4 Ý nghĩa khoa học thực tiễn đề tài 1.5 Nội dung thực CHƯƠNG CƠ SỞ LÝ THUYẾT 2.1 Giới thiệu tìm kiếm thơng tin 2.1.1 Khái niệm 2.1.2 Cấu trúc hệ thống tìm kiếm thơng tin 2.1.3 Đánh giá hệ thống tìm kiếm thông tin 2.2 Các mơ hình phương pháp tìm kiếm thơng tin 10 2.2.1 Mơ Hình Boolean 11 Footer Page of 137 Header Page 10 of 137 x 2.2.2 Mơ hình Boolean cải tiến (Advanced Boolean Model ) 12 2.2.3 Mơ Hình Khơng Gian Vector(Vector Space Model) 14 2.2.4 Latent Semantic Indexing - LSI 15 2.2.5 Áp dụng xử lý ngôn ngữ tự nhiên 17 2.3 Ontology 20 2.3.1 Định nghĩa 20 2.3.2 Vai trò ontology 21 2.3.3 Các thành phần ontology 22 2.3.4 Phân loại ontology 23 2.3.5 Các ứng dụng dựa Ontology 26 2.4 Các phương pháp tính độ tương đồng ngữ nghĩa khái niệm 27 CHƯƠNG MƠ HÌNH VÀ GIẢI PHÁP 37 3.1 Một mơ hình ontology cho ngữ nghĩa tài liệu 37 3.2 Xây dựng đồ thị keyphrase biểu diễn nội dung 40 3.2.1 Đánh trọng số đồ thị keyphrase biểu diễn tài liệu 40 3.2.2 Gán nhãn đồ thị keyphrase biểu diễn tài liệu 42 3.2.3 Trọng số đồ thị keyphrase biểu diễn câu truy vấn 44 3.3 Độ tương đồng ngữ nghĩa hai keyphrase 49 3.4 Độ tương đồng ngữ nghĩa hai đồ thị keyphrase 55 3.5 Xây dựng mơ hình cách thức lưu trữ, tìm kiếm theo ngữ nghĩa 58 3.5.1 Mơ hình Cơ sở liệu DB phục vụ việc lưu trữ 58 3.5.2 Tổ chức lưu trữ tài liệu theo ngữ nghĩa 60 CHƯƠNG CÀI ĐẶT THỬ NGHIỆM VÀ ĐÁNH GIÁ 63 4.1 Thiết kế hệ thống thử nghiệm 63 4.1.1 Mục tiêu ứng dụng 63 4.1.2 Yêu cầu chức hệ thống 63 4.1.3 Cấu trúc hệ thống 65 4.1.4 Các thiết kế xử lý 68 4.2 Kết thử nghiệm 71 Footer Page 10 of 137 Header Page 93 of 137 73 CHƯƠNG KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN 5.1 Kết đạt luận văn So với mục tiêu ban đầu đề ra, luận văn thực hoàn thành nội dung nghiên cứu Luận văn đưa nhiều cải tiến có hiệu kỹ thuật biểu diễn ngữ nghĩa xử lý tính tốn độ tương đồng ngữ nghĩa tài liệu câu truy vấn Những cải tiến đề luận văn trực tiếp khắc phục hạn chế kỹ thuật tìm kiếm ngữ nghĩa, giúp tăng cường đáng kể hiệu tìm kiếm theo ngữ nghĩa Luận văn đề xuất phương pháp xử lý biểu diễn câu truy vấn thành đồ thị keyphrase có trọng số giúp xác định xác u cầu tìm kiếm người dùng Điều tăng cường đáng kể khả xử lý câu truy vấn hệ thống, cải thiện tính hiệu q trình tìm kiếm Bên cạnh đó, trọng số cho đồ thị keyphrase biểu diễn tài liệu luận văn điều chỉnh đáng kể dựa kết khảo sát từ thực tiễn Các cơng thức tính trọng số xác khơng góp phần tăng độ xác cho tốn tìm kiếm ngữ nghĩa mà việc xếp kết tìm kiếm hiệu gần với yêu cầu người dùng 5.2 Những hạn chế đề tài Các kỹ thuật đề xuất luận văn phụ thuộc nhiều vào mơ hình phương pháp biểu diễn đề xuất cơng trình [1] Do đó, cịn mang số hạn chế mơ hình mơ hình ontology chưa biểu diễn hết tri thức lĩnh vực, chưa có phương pháp tích hợp, chia sẻ ontology mà phụ thuộc nhiều vào việc xây dựng ontology hồn tồn thủ cơng với kinh nghiệm chun gia, khiến cho việc mở rộng kết lĩnh vực, miền tri thức khác đạt vơ khó khăn Bên cạnh việc biểu diễn tài liệu thành đồ thị keyphrase phải thực bán thủ công hạn chế khả áp dụng giái pháp Hiện ứng dụng thử nghiệm truy vấn đơn giản, cần Footer Page 93 of 137 Header Page 94 of 137 74 phải xét đến tất dạng truy vấn khác đặc biệt ngôn ngữ tự nhiên, phát triển ngôn ngữ qui ước, việc bắt lỗi chặt chẽ mặt cú pháp Phần demo chương trình cịn chức năng, chưa ý đến tiện ích cho người dùng, số phần hệ thống đề cập mà chưa cài đặt 5.3 Hướng phát triển Tiếp tục phát triển, hồn thiện mơ hình biểu diễn tri thức, biểu diễn ngữ nghĩa tài liệu, mơ hình tổ chức lưu trữ kho tài liệu theo ngữ nghĩa Vấn đề biểu diễn liệu CSDL cịn cải tiến thêm Nghiên cứu qui trình thiết kế xây dựng ứng dụng nguyên lý Nghiên cứu thuật tốn nhằm hỗ trợ tìm kiếm nhanh chóng hơn, dễ dàng hơn, cho kết xác với nhu cầu tìm kiếm người dùng Nghiên cứu công cụ hỗ trợ tự động, tự động hóa cao tốt khâu xử lý chẳng hạn mơ hình giải pháp rút trích tự động keyphrase từ tài liệu sở lai ghép phối hợp mơ hình có, kỹ thuật xác suất thống kê, máy học, kỹ thuật xử lý ngôn ngữ tự nhiên Nghiên cứu giải pháp lĩnh vực tìm kiếm ngữ nghĩa để tìm khả phá bỏ giới hạn tìm kiếm lĩnh vực, miền tri thức định Đưa đến giải giải pháp xây dựng kho tài liệu đa ngành, đa lĩnh vực Footer Page 94 of 137 Header Page 95 of 137 75 TÀI LIỆU THAM KHẢO [1] Huỳnh Thị Thanh Thương (2012), Nghiên cứu mơ hình tổ chức kỹ thuật tìm kiếm có ngữ nghĩa kho tài nguyên học tập lĩnh vực CNTT, Luận văn Thạc sĩ, Trường đại học Khoa Học Tự Nhiên TP.HCM [2] Nguyễn Thị Thanh Hà, Nguyễn Trung Hiếu (2005), Xây dựng hệ thống tìm kiếm thơng tin tiếng việt dựa mục từ ghép, Luận văn thạc sĩ, Trường ĐH Khoa học tự nhiên TP Hồ Chí Minh [3] Nguyễn Thị Lan Phương (2006), Tìm hiểu Search Engine ứng dụng thuật toán đối sách đa mẫu cho hệ thống tìm kiếm thơng tin mạng, Luận văn thạc sĩ, Trường ĐH Bách khoa Hà Nội [4] Lê Thúy Ngọc (2008), Xây dựng hệ thống tìm kiếm thơng tin theo hướng tiếp cận ngữ nghĩa, Luận văn thạc sĩ, Trường đại học Khoa Học Tự Nhiên TP.HCM [5] Huỳnh Tấn Đạt (2005), So trùng mờ đồ thị tri thức, Luận văn thạc sĩ, Trường đại học Bách Khoa TP.HCM [6] Hồ Bảo Quốc (2012), Giới thiệu tìm kiếm thông tin, Bài báo khoa học, Trường ĐH Khoa học tự nhiên TP Hồ Chí Minh [7] Nguyễn Thị Bảo Trâm (2005), Thiết kế thực dịch vụ Ontology hỗ trợ thư viện số, Luận văn thạc sĩ, Trường đại học Khoa Học Tự Nhiên TP.HCM [8] Nguyễn Thị Thanh Hà, Nguyễn Trung Hiếu (2005), Xây dựng hệ thống tìm kiếm thơng tin tiếng việt dựa mục từ ghép, Luận văn thạc sĩ, Trường ĐH Khoa học tự nhiên TP Hồ Chí Minh [9] Do, VanNhon, ThanhThuong T Huynh, and TruongAn PhamNguyen (2013),"Semantic representation and search techniques for document retrieval systems." In Intelligent Information and Database Systems, pp 476-486 Springer Berlin Heidelberg Footer Page 95 of 137 Header Page 96 of 137 76 [10] Ayse Goker, John Davies (2009), Information Retrieval: Searching in the 21st Century, John Wiley anh Sons [11] Christopher D Manning, Prabhakar Raghavan and Hinrich Schutze (2008), Introduction to Information Retrieval, Cambridge University Press, edition [12] Henrik Bulskov Styltsvig (2006), Ontology-based Information Retrieval, A dissertation Presented to the Faculties of Roskilde University in Partial Fulfillment of the Requirement for the Degree of Doctor of Philosophy [13] Dublin core ® Metadata Initative, Dublin Core Metadata Element Set, Version 1.1, 2010, http://dublincore.org/documents/2010/10/11/dces/ Footer Page 96 of 137 Header Page 97 of 137 PL PHỤ LỤC SƠ ĐỒ MƠ TẢ TÀI NGUN Sơ đồ mơ tả tài ngun học tập điện tử 15 yếu tố xây dựng theo chuẩn từ vựng Dublin Core bổ sung thêm thành phần đặc trưng thể cấu trúc thông tin ngữ nghĩa loại tài liệu sau: Các thuộc tính chung: 1) Nhan đề (Title): Nhan đề tài liệu, tên nguồn thông tin thường tác giả nhà xuất đặt cho tài liệu 2) Tác giả (Creator): Tác giả tài liệu, bao gồm tác giả cá nhân tác giả tập thể chịu trách nhiệm nội dung 3) Chủ đề (Subject): Chủ đề tài liệu đề cập dùng để phân loại tài liệu, thể từ vựng có kiểm sốt 4) Mơ tả (Description): Tóm tắt, mơ tả nội dung tài liệu Có thể bao gồm tóm tắt, thích, mục lục, đoạn văn để làm rõ nội dung 5) Nhà xuất (Publisher): Cơ quan, tổ chức chịu trách nhiệm tạo lập, xuất nguồn thông tin định dạng thực 6) Tác giả phụ (Contributor): Tên người tham gia cộng tác đóng góp vào nội dung tài liệu, cá nhân, tổ chức 7) Ngày tháng (Date): ngày tháng có liên quan đến việc tạo lập, xuất hay công bố tài liệu 8) Loại tài liệu (Type): Mô tả loại tài liệu Dùng thuật ngữ mô tả phạm trù kiểu: báo, báo cáo, sách, từ điển 9) Khổ mẫu (Format): Mô tả trình bày vật lý tài liệu, bao gồm; vật mang tin, kích cỡ độ dài, kiểu liệu (.doc, html, jpg, xls, phần mềm ) 10) Định danh (Identifier): Các thông tin định danh tài liệu, nguồn tham chiếu đến, chuỗi ký tự để định vị tài nguyên: URL (Uniform Resource Locators), URN (Uniform Resource Name), ISBN (International Standard Book Footer Page 97 of 137 Header Page 98 of 137 PL Number), ISSN (International Standard Serial Number), SICI (Serial Item & Contribution Identifier), 11) Nguồn (Resource): Các thông tin xuất xứ tài liệu, tham chiếu đến nguồn mà tài liệu mơ tả trích ra/tạo ra, nguồn là: URL, URN, ISBN, ISSN 12) Ngơn ngữ (Language): Các thông tin ngôn ngữ, mô tả ngơn ngữ tài liệu 13) Liên kết (Relation): Mô tả thông tin liên quan đến tài liệu khác, định danh cho nguồn thứ hai mối quan hệ với tài liệu hành Yếu tố thể kết nối nguồn tài liệu có liên quan, dùng đường dẫn (URL), URN, ISBN, ISSN 14) Diện bao quát (Coverage): Các thông tin liên quan đến phạm vi, quy mô mức độ bao quát tài liệu Phạm vi địa điểm, khơng gian thời gian, tọa độ 15) Bản quyền (Right): Các thơng tin liên quan đến tình trạng quyền, kết nối tới thơng tin tình trạng quyền dịch vụ cung cấp thông tin quyền cho tư liệu 16) Keyphrases: Danh sách keyphrase biểu diễn nội dung tài liệu Một biểu diễn tài liệu chứa thơng tin mơ tả cần có thêm thành phần biểu diễn nội dung tài liệu Nội dung tài liệu biểu diễn cấu trúc đơn giản danh sách keyphrase hay đồ thị keyphrase giàu ngữ nghĩa Cấu trúc thông tin loại tài liệu Dựa sở phân loại tài nguyên học tập, loại tài nguyên có chức sử dụng khác nên cấu trúc thông tin loại khác Ngồi thuộc tính chung mơ tả tài nguyên học tập điện tử nêu trên, loại tài liệu cịn gộp chứa vài thuộc tính đặc thù riêng nhằm diễn đạt chi tiết cấu trúc thơng tin loại hình tài liệu Các thành tố đặc thù Footer Page 98 of 137 Header Page 99 of 137 PL coi yếu tố mở rộng thể thơng qua khung mã hóa cụ thể sau: 1) Syllabus (đề cương môn học) Loại tài nguyện mô tả chi tiết môn học đó, thơng tin thể syllabus bao gồm:  Course Information: Thông tin tổng quan môn học như: đơn vị giảng dạy, danh sách giảng viên, nhận xét đánh giá sinh viên quan chức cấp  Course Description: Mô tả khái quát môn học  Course Objective: Mục tiêu môn học, mô tả khối lượng kiến thức truyền đạt qua môn học  Prerequisites: Các yêu cầu cần thiết để theo học Có thể bao gồm: mơn học tiên quyết, kiến thức tảng, yêu cầu trang thiết bị, thời gian, v.v  Grading: Phương pháp đánh giá, kiểm tra cho điểm học viên  Policy: Các quy chế học vụ liên quan  Course Calendar: Thời gian biểu cho môn học, lịch trình giảng dạy chi tiết 2) Sách điện tử: bao gồm sách giáo khoa/giáo trình, sách tham khảo Sách giáo khoa tài liệu sử dụng giảng dạy Mỗi sách giáo khoa có liên hệ trực tiếp đến môn học, nên gắn liền với đề cương mơn học Sách tham khảo cung cấp kiến thức chuyên ngành, liên quan đến nhiều môn học khác không gắn kết với syllabus cụ thể Sách điện tử thường bao gồm thơng tin:  Preface: Lời nói đầu, lời giới thiệu tác giả sách đến người đọc  Table of Content (Mục lục): Danh sách phần, chương, đề mục lớn sách Thường kèm theo số trang  Index: Danh mục thuật ngữ đề cập sách thích cho thuật ngữ Đôi danh mục liệt kê hình vẽ bảng biểu có sách  References: Danh sách tài liệu tham khảo đến trình viết sách Footer Page 99 of 137 Header Page 100 of 137 PL 3) Slide giảng: Slide trình chiếu phục vụ cho việc giảng dạy, phần lớn trường hợp, slide soạn dựa nội dung sách Slide thường khơng có cấu trúc trình bày cố định 4) Audio ghi âm giảng: Phần ghi âm lời giảng giảng viên lớp Loại tài ngun khơng có cấu trúc trình bày cố định Thơng thường giảng ghi âm thành nhiều tệp tin âm riêng biệt cho buổi giảng Các ghi âm tất buổi suốt khóa học tập hợp lại phát hành chung Trong số trường hợp, loại tài nguyên đính kèm theo transcript đánh máy lại nội dung ghi âm 5) Video ghi hình giảng: Tương tự Audio ghi âm giảng, khác có thêm phần video ghi hình giảng viên lúc giảng 6) Hướng dẫn thực hành hướng dẫn sử dụng thiêt bị/công cụ/phần mềm cần dùng học tập/giảng dạy Hướng dẫn thường không tuân theo cấu trúc trình bày cố định, đơi viết thành sách hồn chỉnh, đơi đơn giản ghi chép thao tác cần thực hành theo thứ tự 7) Luận văn đại học/khóa luận tốt nghiệp, luận văn/luận án sau đại học: Luận văn đầy đủ tiêu chuẩn phải có người trực dõi, hướng dẫn phải bảo vệ thành công trước hội đồng chấm luận văn trường Các thuộc tính luận văn bao gồm:  Giáo viên hướng dẫn thông tin hội đồng bảo vệ  Đơn vị quản lý: Thông tin trường đại học nơi nhận luận văn nộp đến  Lời nhận xét giảng viên hướng dẫn, giảng viên phản biện luận văn, bao gồm ý kiến nhận xét đánh giá cho điểm cua riêng giảng viên luận văn  Điểm số nhận xét cuối hội đồng  Mục lục: Danh sách chương, đề mục, điểm lớn luận văn, kèm theo số trang cho mục  References: Danh sách tài liệu mà tác giả tham khảo sử dụng trình thực luận văn Footer Page 100 of 137 Header Page 101 of 137 PL  Glossary: Danh mục thuật ngữ, hình ảnh, bảng biểu xuất luận văn, kèm theo số trang lần xuất 8) Paper - Bài báo khoa học: Kết cơng bố cơng trình nghiên cứu khoa học Được đăng tải tạp chí khoa học kỷ yêu hội thảo Cấu trúc Paper bao gồm:  Abstract: Mô tả khái quát nội dung trình bày báo  Keywords: Các từ khóa thể chủ đề báo  References: Danh sách tài liệu tham khảo trình nghiên cứu đề cập đến báo 9) Đề tài nghiên cứu khoa học  Đơn vị quản lý đề tài  Thông tin hội đồng nghiệm thu đề tài  Kết nghiệm thu 10) Đồ án môn học: Bản báo cáo đĩa CD mã nguồn đồ án mà  Thông tin môn học (tên môn học, nội dung phần kiến thức liên quan đồ án, v.v )  References: Danh sách tài liệu tham khảo đến trình thực đồ án 11) Đề thi môn học:  Barem điểm: Thang điểm cụ thể cho câu hỏi đề thi  Nội dung kiến thức: kiểm tra đề thi - xem đề cương ôn tập đề thi  Quy chế kiểm tra: quy định thông tin thời gian làm bài, thiết bị/tài liệu đem vào phòng thi, yêu cầu giải, v.v  Mục đích: Mục tiêu đề thi, nhận xét chuyên gia độ khó đề 12) Bài tập giải môn học Tập hợp dạng tập, giải, tập hợp câu hỏi, trả lời kiến thức môn học 13) Đáp án: Lời giải cho nhiều câu hỏi đề thi/bài tập Footer Page 101 of 137 Header Page 102 of 137 PL Hướng dẫn đánh giá: Hướng dẫn người đọc so sánh nội dung đáp án với nội dung lời giải người đọc cho câu hỏi MƠ HÌNH CSDL CỦA KHO TÀI LIỆU Hình 2.1: Tổ chức CSDL kho tài liệu  Bảng publisher: chứa thông tin nhà xuất (NXB) tài liệu, bao gồm trường mô tả sau: Field Footer Page 102 of 137 Mô tả Header Page 103 of 137  PL idPublisher thông tin định danh NXB name tên NXB website địa chỉwebsite NXB Bảng author: chứa thông tin liên quan đến tác giả tài liệu: Field Mô tả idAuthor thông tin định danh tác giả Name tên tác giả dob thông tin ngày sinh tác giả website địa chỉwebsite tác giả nationality quốc tịch tác giả, ghi theo quy ước chuẩn ISO 3166-1  Bảng category: chứa thông tin mục đích sử dụng tài liệu: Field Mơ tả idCategory thơng tin định danh name mục đích sử dụng tài liệu Có mục đích việc sử dụng tài liệu bao gồm: - Tài liệu giảng dạy: mang nội dung giáo khoa, phục vụ công tác giảng dạy, chẳng hạn như: giảng điện tử, sách giáo khoa, sách nâng cao, … - Tài liệukiểm tra/đánh giá: Mang nội dung liên quan đến việc kiểm tra đánh giá q trình giảng dạy ví dụ như: đề thi mẫu, giải mẫu, … - Tài liệu tra cứu: Được sử dụng chủ yếu công tác nghiên cứu, tham khảo chuyên môn, nội dung loại tài liệu chưa chuẩn hóa thành giáo khoa  Bảng type: lưu thơng tin loại hình (dạng) tài liệu với thuộc tính: Field Mơ tả idType thông tin định danh name tên loại tài liệu idCategory thơng tin mục đích sử dụng tài liệu, tham chiếu khóa ngoại đến bảng category Footer Page 103 of 137 Header Page 104 of 137 PL detail_table_name tên table lưu thông tin đặc thù loại tài liệu Ta phân loại dạng tài liệu theo mục đích sử dụng sau: - Tài liệu giảng dạy: sách giáo khoa, sách tham khảo, slide giảng, video ghi hình giảng, audio ghi âm giảng, hướng dẫn sử dụng công cụ, cookbook tutorial - Tài liệu kiểm tra/đánh giá: đề kiểm tra mẫu, tập, đáp án hướng dẫn đánh giá - Tài liệu nghiên cứu/tham khảo: đồ án mơn học, khóa luận/ luận văn đại học, luận văn thạc sĩ, luận án tiến sĩ, báo khoa học, báo cáo kỹ thuật, đề tài NCKH, kỷ yếu hội thảo/Tạp chí khoa học  Bảng document: bảng chứa thông tin liên quan trực tiếp đến tài liệu bảng quan trọng CSDL, bao gồm yếu tố theo sơ đồ mô tả tài nguyên trên: Field Mô tả idDocument title thông tin định danh tiêu đề tài liệu, trích xuất trực tiếp từ tài liệu nhà xuất tài liệu, tham chiếu khóa ngoại đến bảng publisher dạng/loại hình tài liệu, tham chiếu khóa ngoại đến bảng type định dạng tài liệu chủ đề tài liệu, đồng thời cho biết tài liệu lưu đâu thư mục quy chuẩn, tham chiếu khóa ngoại đến bảng directory người trực tiếp đóng góp tài liệu vào hệ thống, tham chiếu khóa ngoại đến bảng MEMBER giới thiệu/mơ tả tài liệu Thông tin người tải tài liệu lên hệ thống nhập ngày tài liệu thêm vào hệ thống ngày tài liệu xuất Thông tin trích xuất từ tài ngun người tải lên idPublisher idType format idSubject idMember description date added date_publish Footer Page 104 of 137 Header Page 105 of 137 PL language file_name source link_image rights coverage keyphrase_list keyphrase_graph kg_id  tài nguyên nhập vào ngôn ngữ sử dụng tài liệu Tên tập tin tài liệu lưu thơng tin vị trí lưu trữ tài nguyên bên hệ thống (địa đường dẫn tài liệu) Ở mục lưu tên file tập tin không cần thiết phải lưu toàn đường dẫn theo cấu trúc thư mục Lý phần đường dẫn đến file tài ngun khơng cố định, thay đổi linh động trình xây dựng ta cần cố định đường dẫn, phần lại cần gán thêm tên file vào bên để tạo thành đường dẫn đầy đủ lưu thông tin đường dẫn đến trang bìa loại tài liệu Mục linh động số tài liệu khơng có trang bìa bị hỏng thơng tin quyền mà người sử dụng hệ thống có tài liệu thơng tin giới hạn không gian hay thời gian đề cập tài liệu Danh sách keyphrase đặc trưng ngữ nghĩa tài liệu Đồ thị keyphrase biểu diễn tài liệu Danh sách keyphrase đặc trưng tài liệu Bảng relationship: thể mối liên hệ tài liệu kho, gồm trường: Field Mô tả thông tin định danh tên gọi mối quan hệ cho biết quan hệ có tham số hay khơng Mô tả mối quan hệ ngôn ngữ tự nhiên, mô tả tham số quan hệ is_reflexive cho biết quan hệ phản xạ hay không oposite_direction_name Nếu quan hệ X định nghĩa không phản xạ, thuộc tính chứa tên quan hệ X’ cho D1 X D2 D2 X’ D1 idRelationship name hasParameter Description Footer Page 105 of 137 Header Page 106 of 137  PL 10 Bảng document_author: bảng phụ thể mối liên hệ tài liệu tác giả tài liệu Field Mô tả idDocument thông tin định danh tài liệu, tham chiếu khóa ngoại đến bảng document tin định danh tác giả, tham chiếu khóa ngoại đến bảng author idAuthor  Bảng document_relationship: bảng phụ thể mối liên hệ loại tài nguyên với Field Mô tả idSource thông tin định danh tài liệu thứ nhất, tham chiếu khóa ngoại đến bảng document idTarget thông tin định danh tài liệu thứ hai, tham chiếu khóa ngoại đến bảng document idRelation thơng tin định danh loại quan hệ mà tài liệu có liên quan đến nhau, tham chiếu khóa ngoại đến bảng relationship parameter  tham số quan hệ Các bảng *_detail: lưu thông tin đặc thù loại tài liệu Ngồi thuộc tính chung mơ tả tài nguyên bảng document, loại tài liệu gộp chứa vài thuộc tính đặc thù riêng nhằm diễn đạt chi tiết cấu trúc thông tin loại hình tài liệu  Bảng type_structure: Để tiện việc xử lý, ta có bảng type_structure lưu trữ thông tin trường liệu bảng *_detail Mỗi field bảng *_detail tương ứng với records bảng type_structure Các thông tin lưu trữ bảng type_structure bao gồm: Footer Page 106 of 137 Header Page 107 of 137 PL 11 Field Mô tả Thông tin xác định loại tài liệu, xác định tên cụ thể bảng *_detail field_name Tên “field” bảng *_detail field kết hợp với id_type làm thành khóa type_structure display_name Tên ngôn ngữ tự nhiên hiển thị cho người dùng loại siêu liệu mà “field” lưu trữ Description Mô tả cho “field” search_for_keyphrase cho biết tài liệu tải lên hệ thống có cần tiến hành tìm rút trích keyphrase từ thông tinh “field” hay không id_type Footer Page 107 of 137 ... 137 iii LỜI CAM ĐOAN Tôi xin cam đoan đề tài ? ?Kỹ thuật nâng cao hiệu tra cứu sách Thư viện trường cao đẳng Kinh tế cơng nghệ TPHCM” cơng trình nghiên cứu tơi Ngồi trừ tài liệu tham khảo trích dẫn... tài liệu học tập sinh viên thư viện trường cao đẳng Kinh tế công nghệ TpHCM 1.3 Phương pháp nghiên cứu Xuất phát từ việc phân tích phương pháp kỹ thuật có, đặc biệt kỹ thuật đề xuất [1], luận văn... kiếm Ứng dụng giải pháp nghiên cứu, hướng tới việc xây dựng hệ thống quản lý kho tài nguyên học tập lĩnh vực CNTT phạm vi thư viện Trường cao đẳng Kinh tế công nghệ TpHCM Luận văn đặt mục tiêu

Ngày đăng: 27/06/2017, 14:39

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan