Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 211 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
211
Dung lượng
3,63 MB
Nội dung
PGS.TS ĐOÀN PHAN TÂN HỆ THỐNG TÌM TIN NHÀ XUẤT THÀNH PHĨ HỒ CHÍ MINH 2010 LỜI NĨI ĐẦƯ Giáo trình “Hệ thống tìm tin” biên soạn nhằm cung cấp ihừng kiến Ihức bàn hệ thống lìm tin cho sinh viên chuyên igành thông tin - Ihư viện Nội duno giáo trình bao gồm bảy chương sau: Chương 1: Tống quan hệ ihống tìm tin; Chi*one Hệ thốiì cơng Ci \í: ]ý ngC' nghĩa ;rong hệ thống lìm tin; Chương 3: Tồ chức thơ ns tin hệ thống tìm tin; Chương 4; Thiết kế hệ thống tìm tin; Chương 5: Hệ thốne tìm tin thủ cơng; Chương 6: Hệ Ihổng lìm tin tự động hóa; Chương 7: Đánh Ìá hiệu hoạt động hệ thống tìm tin Giáo trình biên soạn lần đầu nên khơng tránh khỏi hừng Ihiếu sót Rất mong nhận ý kiến đóng góp ồng nghiệp bạn đọc đổ giáo trình hồn thiện irong hững lần tái Xin chân thành cảm ơn đồng nghiệp khoa T h viện 'hông lin học, T m n g Đại học Khoa học xã hội Nhân văn )HQG TP HỒ Chí Minh, PGS.TS Đồn Phan Tân ThS VTnh )uốc Báo nhiệt lình giúp đỡ có nhiều ý kiến đóng góp cho lIC giíi iro n g q u Irình biên soạn íỉìáo trình 77’ ỉỉ C h í Mình, ihúng 12 năm 2009 * - - * '1 ác gia BẢNG CÁC TỪ VIẾT TẮT AACR Q uy tăc biên mục Anh - M ỳ (Anglo - American Cata oguing Rule) CSDL C sỡ dừ liệu CQTT C quan Ihông tin DDC Khung phân loại thập phân Devvey (Dewey Decimal Classification) DC Yếu tố siêu dừ !iệu côt lõi Dub in (Dub in Core) HTTT Hệ thống tìm lin H T T TTĐ H Hệ thống tìm tin tự động hóa LCSH B ảng đề mục chủ đề T h viện Quốc hội Mỹ (Library o f Congress Subject Headings) MARC Biên mục đọc máy (Machine Readab e Cataloging) MLCC M ục ục chừ M L PL vlục lục phân loại NNTT '^gơn ng tìm tin O PA C M ục ục công cộng truy cập tiTỊC tuyến (On ine Pub ic Access Calalog) TĐTC T điển từ chuẩn Chương TỔNG QUAN VỀ HỆ T H ốN G TÌM TIN 1.1 Tìm tin 1.1.1 K hái niêm tìm tin Khái niệm t'ip tin nhiều tác giả đề cận đến nhiều tài liệu lĩnh \ ự c khác nh thông tin học, thư viện học, khoa học m áy tín h Sau mộí sổ định nghĩa tìm tin T h e o TC V N 5453-1991, tìm tin trình lựa chọn đưa từ m ột tập hợp tài liệu hay mảng tin nhừng tài liệu, thơng tin thích hợp với nội dung yêu cầu tin [8 C ác tác giá cuổn “C sớ thông tin học” Viện Thông tin VINITI đưa định nghĩa ‘T ì m tin tập hợp công đoạn thực với mục đích tìm nhừng tài liệu có chứa thơng tin định (sau cung cấp tài iiệu cùa chúng) với mục đích cung cấp số liệu cụ thể đề trá lời câu hòi định ti*irớc” [24 Theo C.T Meadow, thuật ngữ tìm tài Hệiỉ, tìm dừ kiện, chọỉì lọc d liệu ĩìw tin sử dụng để irình tìm tài liệu đáp ứng yêu cầu lin (tìm tài liệu) lìm thơng lin trực tiếp (ba dạng tìm sau cùng) Vì vậy, “T im Ún trình tìm kiếm mảng tin tài liệu chứa thơng lin việc tìm kiếm khơng phụ thuộc vào chất, loại thơng tin cần lìm phương thức sử dụng thơng lin ” [22 Theo B c Vickery, tìm tin trình lựa chọn ihông lin từ mảng lin [31 ''ỉhừng định nghĩa Irên cho Ihấy cách diền đại khúc có thống tương đối tác giả ý nghĩa ihưật ngừ tìm tin Như vậy, tìm tin thuật ngữ chuns sử dụng để phản ánh trình tìm kiếm tài liệu thông tin cần thiếl mảng tin Việc tìm kiểm tài liệu thơng tin cần thiết Ihực cách chọn lọc thường đòi hòi nhiều cơng sức, thời gian chi phí T hư viện ví dụ điển hình tồ chức chuyên phục vụ cho việc tìm kicm thơng tin cách chọn lọc Một neười dủng tin đến thư viện khơng pnài để đọc tồn tài liệu co irong thư viện mà đề tìm tài liệu thông tin cách chọn lọc nhằm thỏa mãn nhu cầu tin Phương pháp hiệu để tìm tài liệu thơng tin,cần thiết ihư viện đọc q ua tài liệu thư viện Tuy n h iên , thực tế không thề áp dụng phương pháp số lượng lài liệu thư viện thường lớn nên việc đọc tất lài liệu để chọn nhừng tài liệu cần Ihiếí khơng khả thi Vì vậy, người ta sừ dụng phưưng pháp tìm tin khác, tìm tin theo đặc tính nội dung ’ngắn gọn theo đặc tính hình thức cúa tài liệu Có thể xem tìm tin q irình truyền thơng mội cách gián liếp tác giả người tạo lập biểu ghi với nhĩrng người sử dụng thông tin Các neôn n ^ừ kênh hộ thống truyền thông khác với hệ thống truyền ihông khác n hư truyền thông đại chúng truyền thông tiỊTc tiếp Các ngôn n gữ sử dụng hệ thống tmyền thơng có Ihể ngơn ng tìm tin và/hoặc ngơn ngữ tự nhiên Còn kênh truyền thơng cơng cụ tìm tin hệ thổng mục lục, bảng tra, sờ liệu Nói cách khác, tìm tin ]à trình tương tác giừa người sừ dụng màng tin thông qua công cụ tìm tin khác 1.1.2 Q uá trình tìm tin Tìm tin trình c a người liên quan mậ^ ihiét vói V’ệc h ọ c ^ập v giả’ vấn đề Quá trình tìm tin bắt đầu với nhu cầu tin người sử dụng Để đạt mục tiêu n h giải vấn đề, trả lời câu hòi cụ thề để thỏa mãn lính ham hiểu biết, người dùng tin cần thông tin nhanh ngắn gọn thông tin đẩy đủ chi tiết Trong hình ỉ l sơ đồ trình tìm tin M ặc dù trơng rấl đơn giản thực chất, trình lìm tin bao gồm nhiều qui trình phức tạp Một sổ qui trình qui trình cơng nghệ liên quan đến hệ thống tìm tin, giao diện người sử d ụ ng Các qui trình khác liên quan đến bán chất đặc trưng nội dung Ihông tin người dùng tin cụ thể Thời gian thực mức độ phức tạp trình tìm tin phụ thuộc vào khà nhận Ihức, trình độ nhu cầu tin người dùng tin Q uá trình tìm tin trình tương tác phụ thuộc vào nàng cúa người dùng tin, phản hồi từ hệ thống tìm tin định c ủ a người dùng tin hành động dựa phán hồi Các chi úél nhu cầu tin ban đầu người sử dụng có thố thay đổi Các nhu cầu tin ban đầu thường điều sau người tìm tin biết nhiều vấn đề lìm kiếm thơng qua tương lác với hệ thống tìm tin Vì vậy, trình tìm tin tiếp lục đến người dùng lin có thơng lin thỏa mãn nhu cầu tin điều chỉnh C ơn g nghệ thích hợp, chẳng hạn hệ Ihống lìm tin giao diện người sử dụn g thích hợp, thúc đẩy q trình khơng phải vấn đề bàn trình tìm tin phụ thuộc nhiều vào người dùn g tin nhu cầu tin cùa người dùng tin chất, số lượng đa dạng thơng tin ^ H ình 1.1 Sff q trình tìm tin 10 cúa tồn tài liệu tìm Nẻu số lượng tài liệu tìm lớn Ihì tốt yêu cầu người sử dụng đánh giá phần tài liệu lùy chọn (Ví dụ, khoảng 20 - 25 tài liệu) lừ kết q uả tìm Các đánh giá mức độ thích hợp ghi lại phiếu đánh giá kèm theo lừng tài liệu Lý tưởng !à nguời sừ dụng đánh giá theo thang điểm với ba mức độ (1- Có giá trị cao; 2- Có giá trị khơng cao 3- hồn tồn khơng có giá trị) lý giài định J X c định h ệ số đầy đủ Việc xác định hệ số đầy đú khó nhiều so với xác định hệ số xác Hệ số đầy đủ hoàn hào hệ số xác định dựa nghiên cứu đánh giá người sử dụn g toàn mảng tài liệu Điều chi thực tình thử nghiệm định, qui mô vốn tài liệu khơng q lớn Ví dụ, Cleverdon đă thừ nghiệm thành công m ả n g tin gồm 1400 tài liệu với 200 yêu cầu tin, cho kết ma trận mức đ ộ t h í c h h ợ p y ê u cầu t i n / t i l i ệ u k í c h thước 1400 X 200 Tuy n h i ê n , Irong phần lớn tình ihực tế, việc nghiên cứu toàn mãng tin khơng khả thi Vì vậy, phải tìm phương pháp khả ihi để đánh giá hệ số đầy đủ [20 Một phương pháp đánh giá hệ số đầy đủ thực việc tìm tin đồng thời hệ thống khác, thường hệ thống lớn Hệ số đầy đủ hệ thống thử đánh giá cách so sánh với hệ số đầy đủ hệ thống Ihứ hai Phương pháp chi mang tính chất so sánh khơng cho giá trị thực cúa số đầy đủ Phương pháp sử dụng với nhừng thành công định nhiều thử nghiệm phương pháp sử dụn g “yêu cầu tin 197 chuấn bị trước” dựa tài liệu biết trước diện hệ thống (được gọi tài liệu khởi điểm - sotrce documents) Theo phương pháp này, người thực đánh giá ỵêu cầu người sử dụng đưa yêu cầu tin thực tế để làm c sở \ác định tiêu chí xác Sau nhận yêu cầu tin từ người sừ dụng, người đánh giá đưa cho người sừ dụng lài liệu khởi điểm chọn cách ngẫu nhiên từ m ột phận kho tài liệu tương thích với vấn đề người sử dụng đo quan tâm Sau đó, người sử dụng yêu cầu xác lập yêu cầu tin cho tài liệu khởi điểm kết q tìm thích hợp u cầu tin Việc tìm tin theo u cẩu chuẩn bị sằn đươc thực giống n h u tìm yêu cầu tin thực tế Tất kết tìm lựa chọn ngẫu nhiên lừ kết tìm c u n g cấp cho người đặt yêu cầu tin để đánh giá mức độ thích hợp tài liệu Bằng cách này, hệ số xác xác định cho yêu cầu tin chuẩn bị im ớc Hệ số đầy đủ đánh giá cho n hóm yêu cầu tin chuẩn bị sằn theo tương quan giừa tài liệu khởi điểm tìm với tổng số tài liệu (Irong hệ Ihổng) G iả sừ, có 100 yêu cầu tin chuẩn bị iniớc, yêu cầu tin dựa tài liệu khởi điểm Nếu kết 70 tìm có tài liệu khởi điểm tương ứng khẳng định mức độ đầy đủ hệ thống tìm 70%, hộ số đầy đú theo tươ ng quan với nhóm gồm 100 tài liệu thích hợp 70/100 7.3.4 G iai đoạn 4: Phân tích kết thử nghiệm Kết qu ả thử nghiệm bao gồm hai loại dừ liệu: 1) Các dừ liệu chất lượng hoạt động hệ thống tìm tin 2) Các d ữ liệu nhừng thất bại tìm tin 198 Sau thực thừ nghiệm với hệ thống, m ộl nhừng công việc đầu liên phải thực làm rõ tổng hợp kết mức độ tìm tin đầy đù xác C ó hai cách lính hệ số đầy đủ xác trung bình cho ỉoạt yêu cầu tin thử nghiệm Cách thứ cộng kết (hệ số đầy đủ xác) tất cà tìm riêng lẻ, sau chia cho tổng số tìm để có hệ số đầy đủ hệ số xác trung bình Cách thứ hai tính tổng số tài liệu tìm tất tìm để có giá trị trung bình hệ số đầy đủ xác Ví dụ, tồng số tài liệu tìm 100 tìm thử nghiệm 1000 tài liệu, có 800 tài liệu xem lĩi thích hợp hệ số xác trưng bình 80% Mồi cách tính có ưu điểm hạn chế, nhimg dừ liệu thử nghiệm tương đối đồng kết thu hai trường hợp khơng có khác biệt lớn Điều quan trọng cách tính sử dụng suốt qu trình thực chương trình thử nghiệm phải cố định T ự thân hệ sổ đ ầy đủ xác có giá trị K hông the sử đụng ng để so sánh đặc trưng hệ thống khác đặc điểm tài liệu yêu cầu tin, yêu cầu người sử dụng mức độ tìm tin đầy đủ xác, thời gian lìm tin mức độ tham gia người sử dụng vào qu trình tìm tin Sau tính hệ số đầy đủ xác, bước phân tích nguyên nhân tin độ ồn (nhiều tin) tìm tin Phân tích thất bại ỉchi tìm tin khía cạnh gây tranh cãi nhiều cùa chương trình đánh giá Đối với mồi trường hợp thất bại, cẩn nghiên cứu yếu tố sau: - Toàn văn tài liệu; - M ầu lìm tài liệu; 199 - Yêu cầu tin; - Biểu thức tìm thực hiện; - Đánh giá người sử dụng, đặc biệt nhửng lời giải Ihích tài liệu xem khơng thích hợp (khi nghiên cứu độ ồn) Các nguyên nhân mồi thất bại nghiên cứu sè xác định dựa sở phân tích nguyên nhân ihất bại iiệl kê Phần lơn nguyên nhân thất bại có liên quan đến qui trình đánh chi số tìm tin, ngơn ngừ đánh số, q trình tìm tin, q trình xử lý máy tính tư ơng tác người sử dụng hệ thống - Thất bại tìm tin chất lượng n sơn ng ữ tìm tin chưa cao: chât lượng ngơn ngừ lìm tin sừ dụn g đê đánh chì số (sau cọi ngơn ngữ đánh chí số) yếu tố có tác động quan trọng đến hiệu hệ thống tìm tin Chiến lược tìm tin chất lượng đánh số thấp làm giám hiệu hệ thống tìm tin, kỳ thuật đánh chi số tìm tin lốt khơng Ihể bù đắp cho nhược điểm cùa ngơn ngữ đánh chi số Nói cách khác, người thực c ô n g việc đánh số tìm tin chi đạt kết quà m ứ c độ tương thích với khả ngôn ngữ đánh chi số Hai hạn chế chủ yếu ngôn ngừ đánh chi số dẫn đến thấl bại tìm tin bao gồm: 1) Các thuật ngừ cùa ngơn ngừ đánh chí sổ chưa đủ đặc trưng, 2) Mối quan hệ thuật ngừ kh ô n g rõ ràng xác M ức độ đặc trưng thấp ngơn ngừ đánh số dẫn đến tượng lin nhiễu tin (độ ồn) tìm lin S ự khơng rõ ràng xác mối quan hệ thuật ngừ dẫn đến 200 nhiễu tin lìm tin Mất tin mức đ ộ đặc trưng ngôn ngữ đánh chi số thấp có nghĩa chủ đề cần tìm số khía cạnh cùa khơng phàn ánh irong từ vự ng đầu vào hệ thống - Thất bại tìm lin hạn chế c ủ a q trình đánh số: Có thể chia nguyên nhân cùa thất bại thành hai loại 1) D o lỗi người đánh số 2) D o định số lượng trung bình thuật ngừ dùng để m tả tài liệu đánh số (mức độ đánh chi sổ đầy đủ) Nguyên nhân lồi người đánh chi số cỏ ihề chia thành: i) Bó sót ihuật ngừ thuật ngừ cần thiết để mô tả chủ đề quan trọng đề cập tài liệu 2) Sừ dụng thuật ngữ khơng thích hợp với nội dung tài liệu Việc bò sót thuật ngừ thường dẫn đến irường hợp tin, việc sử dụng thuật ngữ khơng thích hợp (nghĩa đánh chi số khơng xác) dẫn đển tiuờ ng hợp tin nhiều tin Giữa trường hợp mấi tin lồi người đánh số việc đánh chi số khơng đầy đú có khác biệt sau: Người đánh số bò sót thuật ngừ: chủ đề đề cập tài liệu hồn tồn khơng phán ánh đánh chí sổ M ức độ đầy đ ủ việc đánh số khơng cao: khía cạnh khơng quan trọng cùa nội dung tài liệu không thề đánh chí số Các lồi bò sót Ihuật ngừ phát thực chương trình đánh giá khó phát chế độ hoạt động bình Ihường cùa hệ thống 201 - Thất bại k h i tìm tin hạn chế trình tìm lin: Có :hể chia ngun nhân dẫn đến thất bại thành ba loại 1) Sử dụng thuật ngừ khơng thích hợp chiến lược lỉm sai, 2) D o mức độ đặc trưng và/hoặc đầy đủ sử d ụ n g tronơ chiến lược tìm 3) Bỏ sót thuật ngữ kết hợp Ihuật ngừ bỏ sót khía cạnh u cầu tin xây dựng biểu thức tìm Việc bỏ sót thuật ngừ cần thiết trons biểu thứb lim dẫn đến tin sử dụng thuật n g ữ không thích họp dẫn đến nhiều tin Nhiều trường hợp tin nhiều lin hên quan đến mức độ đầy đủ và/hoặc đặc trưng biểu thức tìm tin Thay đổi mức độ đầy đủ đặc trưng yếu tố c chiến lược tìm tin Biểu thức tìm tin khơng đầy đủ cụ thể lài liệu tim nhiều, hệ số tìm tin thay đổi theo hướng hệ sổ đầy đù tăng hệ số xác giảm Biểu thức tìm tin đầy đủ biểu thức tất khái niệm người sử dụng yêu cầu mức độ (mặc dù không thiếi inức độ cụ thể yêu cầu tin xác định) Tương tự, biểu thức tìm tin chi tiết dẫn đến tin, biểu thức tìm tin khơng chi tiết dẫn đến nhiều lin - Thất bại tìm tin hạn chế tương tác giừa người sử dụng hệ thống: Sự tương tác người sử dụng hệ thống không tổ chức tốt trờ thành ngun nhân tượng lin nhiễu tin, đặc biệt hệ thống lớn Kết đánh giá hệ thống M E D LA R S cho thấy 25 % tiuờ ng hợp tin 17% nhiều tin nguyên nhân M ất tin tương tác không hợp lý giừa người sử dụng hệ thống có nghĩa yêu cầu tin xác định đặc trưng so với lĩnh vực người sử dụng quan tâm Nhiễu tin tương tác không hợp lý có nghĩa 202 yêu cầu tin xác định tống quát so với nhu cầu tin thực tế dẫn đến kết quà tìm lài liệu khơng có giá trị người sử đụng 7.3.5 Giai đ oạn 5: Tổng họp kết thử nghiệm xác định biện pháp hoàn thiện hệ thống Mục đích chương trình đánh giá hiệu hệ thống tìm tin tìm giải pháp để nâng cao hiệu hoạt động hệ thống Vì vậy, nhiệm vụ giai đoạn dựa kết đánh giá để xác đinh nhừiig hạn chễ quan trọng nệ thống đưa biện pháp hoàn thiện hệ thống Đ e nâng cao hiệu hoạt động hệ thống tìm tin, áp dụng biện oháp liên quan đến yếu tố khác ngơn ngừ tìm tin sừ dụng để đánh chì số, qui trình đánh số, chiến lược tìm tin, tương lác giừa người sử dụng hệ thống Các biện pháp hoàn thiện hệ thống phải xác định dựa điều kiện thực tế cùa hệ thống để bảo đảm tính khả thi biện pháp 203 TÀI LIỆU THAM KHẢO % I Tài liệu tiếng Việt C ao Minh Kiểm, Siêu liệu - khái niệm phân loại.- Tạp chí Thơng tin tư liệu, No 3, 2003.- tr.1-8 Đoàn Phan Tán Thơng tin học.-H., 2006.- 385tr Đồn Phan Tân Tin học hoạt động thông tin-thư viện.H ,2 0 -2 tr Iwê Văn Viết, c ẳ m nang nghề thư việiỊ.-H,: Văn hóa T hò ng tin, 2001.-630tr Nguyễn Hừu Hùng Thông tin: T lý luận đến thực tiễn.- H.; Vãn hóa thơng tin 2005.- 834 tr Phan H uy Quế Mô nội dung tài liệu bầng từ khóa; tài liệu hướng dẫn,- H., 2001 Tạ Thị Thịnh Phán loại tài liệu.- H., 1998.- 221 tr T C V N 5453-1991: Hoạt động thông tin tư liệu - Thuật ngữ khái niệm bản,- H., 1991 Trần Mạnh Tuấn Sản phẩm dịch vụ thông lin, Ihư viện.- H., 1998.- 324 tr 10 Trần Thị Bích Hồng, C ao Minh Kiểm Tra cửu thông tin hoạt động thư viện thông tin.- H., 2004.- 311 tr I ỉ Bộ từ khóa/Thư viện Quốc gia Việt Nam." H., 2005 12 Vũ Văn Sơn Giáo trình biên mục m ô tả.- H., 2000.- 284 tr 204 II Tài liệu nước 13 ChoNvdhury G Introduction to m o d e m iníormation retrieval.London: Facet Publishing, 2004,- 474p 14 Cleveriand D Introdưction to Indexing and Abstracting.- rd edition.- Engỉewood: Libraries ưnlim ited, Inc., 2001.- 283p ]5, Giliarevski R s Sovremennaia intormatika: nauka, texnologia, deiatelnosch.- Malskva, 1997.- 212 tr (Tiếng Nga) 16 Gates J,K Guide to the use of libranes and Ìnf 0rmati 0ii sources." 7''’ ed New York, McGraw-Hill, Inc 1994.- 304p 17 Harvey D.R Organising Knovvledge in a global society; principles and praclice in libraries and iníormation centres.NevvSouth Wales: Charles Sturt Univ., 1999.- 375p 18 Kochlanek T Library Information Systems; From Library Automation to Disiributed InĩoiTnation Access Solutions,Westpoi1: Libraries Unlimiled, 2002.- 287p 19 Kowaỉski G Iníormaiion Retrielval Systems: Theory and Implementation.- Boston: Kluwcr Academic Publisher, 1997.280p 20 Lancaster F w Inĩormation Retricval Systems: charactcristics, tesling and evaluaúon.- 2"^ ed.- NewYork: John Wiley, 1979 21 Libraries in the Age o f Aulomation: Protcssionai Librarian.- NevvYork: A Reader for the Knowlcdge Industry Publicalions, Inc., 1986.- 159p 22 Mcadow Charles T The analysis of Infoĩmalion Systems.- 2"^^ ecl.-LosAnaelcs: John Wiley, 1973 205 23 Meadow Charles T Text Iníromation Systems.- New York: Academic Press, Inc 1992,- 302p 24 Mikhailov A.I Osnovư i n í o i T n a t i k i ' M.: Nauka, 1969.- 306 tr (Tiếng Nga) 25 Olson H.A Subject Analy&is in Online Catalogs.- 2nd cd.Englewood; Libraries Unlimited, 2001.-333p 26 Online Dictionary of Library and Information Science ODILIS: http://lu.com/odilis 27 Taylor A.G The organization of iníormation.- 2"“^ ec.- Westport: Libraries ưnlimited, 2004.- 417p 28 Taylor A.G Classification.- W ynar’s Revised Introduction Ninth Ed to Cataloging -Westport; and Libraries Unlimited, 2004.- 563p 29 Rovvley J.E Organizing Knowledge,- ed England: Ashgate, 19 92 -509p 30 Saffady w Ih Introduclion to Automation for Librarians.- ecl - Chicago: American Library Association, 1999.- 339p 31 Vickery B c Iníormation Science in Theory and Practice.London; Butterwoiths, ,-385p 32 W eb OPAC Interfaces: an overview /B.Ramesh Babu and Ann ’Brienl.- The Electronic Library, Vol.18, No5, 2000.- p.316327 33 Zakharov v p Informacionưe sistemư (dokumentalnưi poisk).Saint Peterburg, 2002.- lííótr (Tiếng Nga) 206 MỤC LỤC L Ờ I N Ó I Đ Ầ U .3 C h n g T Ố N G Q U A N V È H Ệ T H Ĩ N G T Ì M T I N 1.1 T ÌM T I N 1.1.1 Khái niệm tìm t i n 1.1.2 Q u t n n ! i l ì m LÌn Ì Các dạng tìm t i n l i 1.2 H Ệ T H Ó N G T Ì M T I N 12 1.2.ỉ M ột số khái n i ệ m 12 1.2.2 M ục đích hệ thống tìm tin 17 1.2.3 Chức hệ thống tìm tin yêu cầu hệ thống tìm tin 17 1.2.4 Thành phần hệ thống lìm tin 20 1.2.5 Các loại hệ thống tìm t i n 22 Chuìg HỆ THỐNG CƠNG c ụ x LÝ NGỪ N G H ĨA T R O N G CÁC HỆ T H Ĩ N G T Ì M T I N 27 2.1 KHÁI NIỆM HỆ THỐNG CÔNG c ự x LÝ N G Ừ N G H Ĩ A 27 2.2 N G Ô N N G Ừ T ÌM T I N 28 2.2 l Khái niệm ngơn ngữ tìm tin 28 2.2.2 Các loại ngôn ngữ tìm tin ( N N T T ) .30 207 2.2.3 Ngôn ngừ phân lo i 31 2.2.4 Ngơn ngữ tìm tin từ k h ó a 42 2.2.5 Ngơn ngữ tìm tin đề mục chủ đề ( Đ M C Đ ) 50 2.3 C Á C QUI T Ẳ C VÀ KHÔ M Ã U M Ô TÀ T H Ư M Ụ C 53 2.3.1 Qui tắc mô tà thư mục quốc tế I S B D 53 2.3.2 Qui tẳc biên mục Anh - M ỹ 55 2.3.3 Khổ mẫu M A R C 56 2.4 NGÔN NGỦ' M ổ TẢ TÀI LIỆU Đ IỆ N T Ử 57 2.4.1 Ngôn n e S G M L .57 2.4.2 Ngôn ngữ H T M L 59 2.4.3 Ngôn ngữ X M L .59 2.5 SIÊU D ũ ' LIỆU (M E T A D A T A ) 60 2.5.1 Khái n i ệ m 60 2.5.2 Sơ đồ siêu dừ liệu 63 2.5.3 Các loại siêu liệ u 64 2.5.4 Một số sơ đồ siêu liệu phổ b i ế n 67 C h n g T Ò C H Ứ C T H Ô N G T I N T R O N G HỆ THỐNG TÌM TIN 73 3.1 M A TR Ậ N TÀ I LIỆƯ/THƯẬT N G Ữ 75 3.2 T Ố C H Ứ C T H Ô N G TIN T H E O s ĐỊ TƯ N T Í N H 77 3.3 TỒ CHỬC THÔNG TIN THEO s Đ ĐẢO 80 3.4 TĨ CHỨC THƠNG TIN THEO s Đ KỂT HƠP 82 208 C h u n g i H I É T K É H Ệ T U Ố N G T Ì M T I N .91 4.1 T Ồ N G Q U A N VÈ THIÉT K É HỆ T H Ố N G TÌM T I N 91 4.2 Q U Y T R ÌN H T H IÉ T KÉ HỆ T H Ố N G TÌM T I N 94 4.2.1 Giai đoạn 1: Xác định mục tiêu yêu cầu hệ th ố n g 94 4.2.2 Giai đoan 2: Thiết kế cấu trúc tồng qt hệ thống mơ hình mầu (pro totype) 101 4.2.3 Giai đoạn 3: Vận hành đánh giá mơ hình m ẫ u .103 4.2.4 Giai đoạn 4: Hoàn chỉnh thiết kế hệ thống vận hành hệ thống sở kết thử n g h i ệ m 105 4.2.5 Giai đoạn 5: Kiểm tra, đánh giá hệ th ố n g 106 Chuolig HỆ THỐNG TÌM TIN THỦ C Ơ N G 107 5.1 HỆ T H Ố N G M ỤC L Ụ C 107 5.1.1 Khái n iệ m Ỉ07 5.1.2 Chức mục lục 108 ỉ.3 Các hình thức mục ỉục thủ c ô n g 109 5.1.4 Tiêu chí đánh giá chất lượng mục lụ c 110 5.1.5 Các thành phần hệ thống mục l ụ c 11 5.1.6 Hệ thống mục lục chừ 112 5.1.7 Hệ thống mục lục phân lo i ] 20 5.1.8 Mục lục chủ đ ề 124 5.2 CÁC B ộ PH IẾU T H Ư M Ụ C 126 209 5.2.1 Bộ phiếu tra cứu c h í n h 126 5.2.2 Các phiếu chuyên đ ề 127 5.2.3 Các phiếu theo loại hình tài liệu 127 5.3 CÁ C B ộ PHỈẾƯ D K I Ệ N 127 5.3.1 Bộ phiếu sản phẩm, thiết b ị 128 5.3.2 Bộ phiếu kiện vật l i ệ u 128 5.3.3 Bộ phiếu quy trình cơng nghệ sáng k iế n 128 Chương HỆ THĨNG TÌM TIN TỤ ĐỘNG H Ó A 129 6.1 KHÁI Q U Á T VÈ H Ệ T H Ố N G T ÌM TIN T ự Đ Ộ N G H Ó A 129 6.1.1 Khái n i ệ m 129 6.1.2 Phân loại hệ thống tìm tin tự động h ó a 132 6.2 C Á C C H Ử C NĂNG C Ử A H Ệ T H Ố N G T ÌM TIN T ự Đ Ộ N G H Ó A .133 6.2.1 Tìm tin 133 6.2.2 Hiển thị kểt q u ả 140 6.2.3 Các chức k h c 145 6.3 C SỞ DO' l i ệ u ( C S D L ) 148 6.3.1 Một số khái niệm c b ả n 148 6.3.2 Các loại C S D L 153 6.3.3 Xây dựng C S D L 155 6.3.4 Các tiêu chí đánh giá C S D L 159 6.4 O P A C 160 6.4.1 Khái n i ệ m 160 6.4.2 Các tính cùa O P A C 160 210 6.4.3 u điểm hạn chế O P A C 163 6.4.4 Các hệ O P A C .170 6.4.5 Xây dựng O P A C 180 Chương ĐÁNH GIÁ HIỆU QUẢ HOẠT ĐỘNG C Ủ A H Ệ« T H Ĩ N G T Ì M T I N 184 7.1 CÁC TĨÊƯ C H Í Đ Á N H G IÁ H IỆ U Q U À CỦA HỆ T H Ố N G T Ì M T I N 185 7.1.1 Hệ số x c 185 7.1.2 Hệ sổ đầy đ ủ 186 7.1.3 Thời gian đáp ứng yêu cầu t i n 187 7.1.4 Chi phí lao động để thực việc tìm tin ỉ 88 7.1.5 Hình thức cung cấp kết quà t ì m 188 7.1.6 Thành phần vốn tài l i ệ u 189 7.2 CẤC Y Ể U T Ố T Á C Đ Ộ N G Đ Ế N H IỆU Q U Ả CỦA M Ộ T H Ệ T H Ố N G T ÌM T I N 191 7.3 LẬP C H Ư Ơ N G T R ÌN H Đ Á N H GIÁ H IỆU Q U Ả H O Ạ T Đ Ộ N G C Ủ A HỆ T H Ố N G TÌM T I N 191 7.3.1 Giai đoạn 1: Xác định vấn đề càn đánh g i 192 7.3.2 Giai đoạn 2; Chuẩn bị thử nghiệm kết trả lời câu hòi đặt r a 195 7.3.3 Giai đoạn 3: Thực thừ ng hiệm 195 7.3.4 Giai đoạn 4: Phân tích kết thử n g h iệ m 198 7.3.5 Giai đoạn 5: T hợp kết thử nghiệm xác định biện pháp hoàn thiện hệ t h ố n g 203 TÀI LIỆU T H A M K H Ả O .204 il ... ioại hệ thống tìm lin tư liệu hệ thống tìm tin dừ kiện Hệ thống tìm lin tư liệu hệ thống tìm tin xây dựng để tìm cung cấp thông tin tài liệu tài liệu Hệ thống tìm tin tư liệu đáp ứng yêu cầu tin. .. quan hệ ihống tìm tin; Chi*one Hệ thốiì cơng Ci í: ]ý ngC' nghĩa ;rong hệ thống lìm tin; Chương 3: Tồ chức thô ns tin hệ thống tìm tin; Chương 4; Thiết kế hệ thống tìm tin; Chương 5: Hệ thốne tìm. .. tin tài liệu thực mức độ tiTTỜng liêng biệl Trên thực tế, hệ thống tìm tin thư viện kết lỢp số hệ thống tìm tin tư liệu tìm tin dừ kiện, Đặc điểm chung lớn hệ thống tìm tin tư liệu hệ thống tìm