Tìm hiểu ngôn ngữ XML một số ứng dụng trong lĩnh vực thông tin thư viện

65 335 1
Tìm hiểu ngôn ngữ XML  một số ứng dụng trong lĩnh vực thông tin   thư viện

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Tìm hiểu ngôn ngữ XML - Một số ứng dụng lĩnh vực Thông tin - Thư viện MỞ ĐẦU Tính cấp thiết đề tài Trong xã hội thông tin ngày nay, thông tin yếu tố quan trọng bậc hoạt động đời sống, ngành nghề xã hội Sự bùng nổ thông tin khiến cho thông tin trở thành nguồn tài nguyên khổng lồ mà người cần nỗ lực để làm chủ Một yếu tố thúc đẩy việc sản sinh thông tin với khối lượng ngày lớn mạng Internet, đồng thời mạng Internet công cụ hữu hiệu để lưu trữ truyền tải thông tin Với hệ thống World Wide Web khổng lồ, người dễ dàng tìm kiếm, nắm bắt, trao đổi thông tin từ khắp nơi giới World Wide Web (hiểu ngắn gọn “Web”) tập hợp tài liệu siêu văn liên kết với truy cập thông qua mạng Internet Với trình duyệt Web, ta xem trang Web chứa đầy đủ văn bản, hình ảnh, âm thanh,… di chuyển qua lại sử dụng siêu liên kết (hyperlinks) Các trang Web tạo lập nên nhờ ngôn ngữ đánh dấu, mà biết đến nhiều ngôn ngữ đánh dấu siêu văn - HTML (HyperText Markup Language) HTML phương tiện để mô tả cấu trúc thông tin văn tài liệu cách hiển thị văn dạng đường link, đầu mục, đoạn văn, danh sách,… HTML viết dạng thẻ (tags) đặt cặp dấu ngoặc nhọn < > Tuy nhiên, HTML có hạn chế định Với HTML, người sử dụng dừng lại việc xem tài liệu họ thao tác với chúng, tạo lập chúng theo định dạng mong muốn Với thực tế HTML có nhiều hạn chế, SGML lại phức tạp ứng dụng, vào cuối năm 90, nhà nghiên cứu sáng tạo ngôn ngữ đánh dấu mở rộng XML (eXtensible Markup Language) Tính linh hoạt khả ứng dụng cao giúp cho XML nhanh chóng chấp nhận nhà chuyên môn Phùng Thanh Vân K50 Thông tin - Thư viện Tìm hiểu ngôn ngữ XML - Một số ứng dụng lĩnh vực Thông tin - Thư viện (W3C - World Wide Web Consortium định hình HTML thành ứng dụng XML với kết XHTML) Hiện nay, XML ứng dụng rộng rãi nhiều lĩnh vực, lĩnh vực Thông tin - Thư viện áp dụng XML để hoàn thiện công tác Từ thực tế này, sinh viên ngành Thông tin - Thư viện, nghĩ việc nghiên cứu XML ứng dụng hoàn toàn cần thiết Chính vậy, lựa chọn thực đề tài “Tìm hiểu ngôn ngữ XML Một số ứng dụng lĩnh vực Thông tin - Thư viện” Mục đích nghiên cứu Việc nghiên cứu đề tài trước hết giúp tìm hiểu cách khái quát XML, ứng dụng nói chung đặc biệt lĩnh vực Thông tin - Thư viện Từ việc hiểu cách thức tạo lập tiện ích ứng dụng ngôn ngữ đánh dấu, đưa số giải pháp, kiến nghị giúp nâng cao hiệu sử dụng lĩnh vực Thông tin - Thư viện Phạm vi nghiên cứu Vấn đề XML vấn đề rộng lớn, với XML, nhiều ứng dụng tiện ích tạo ra, tùy biến theo mong muốn cá nhân, lĩnh vực ngành nghề cụ thể Chính vậy, với thời gian tìm hiểu có hạn, phạm vi trình bày Khóa luận, nêu khái niệm bản, cấu trúc, cách hiển thị tài liệu XML trình duyệt số ứng dụng XML lĩnh vực Thông tin - Thư viện Phương pháp nghiên cứu Để thực Khóa luận này, mặt phương pháp luận sử dụng phương pháp nghiên cứu tài liệu phương pháp hỏi ý kiến chuyên gia Tài liệu tìm kiếm chủ yếu trang web, đặc biệt trang web Thư viện Quốc hội Mỹ Sau thu thập, tham khảo tài liệu ngôn ngữ XML, thực phương pháp khảo sát, đánh giá, so sánh với tình hình sử dụng thực tế số lĩnh vực đặc biệt lĩnh vực Thông tin - Thư viện Phùng Thanh Vân K50 Thông tin - Thư viện Tìm hiểu ngôn ngữ XML - Một số ứng dụng lĩnh vực Thông tin - Thư viện Đóng góp lý luận thực tiễn Khóa luận Thực đề tài Khóa luận này, hy vọng có đóng góp sau: - Khái quát cung cấp cho người đọc thông tin loại ngôn ngữ đánh dấu nói chung ngôn ngữ đánh dấu mở rộng XML nói riêng, với tình hình phát triển ứng dụng chúng - Giới thiệu vài ứng dụng quan trọng XML lĩnh vực Thông tin - Thư viện đưa kiến nghị nhằm đẩy mạnh việc ứng dụng, nâng cao hiệu loại ngôn ngữ Việt Nam Bố cục Khóa luận Phần nội dung Khóa luận gồm chương sau:  Chương Tổng quan ngôn ngữ đánh dấu - Markup Language Chương nêu tổng quan khái niệm việc sử dụng số loại ngôn ngữ đánh dấu bản, sâu vào ngôn ngữ đánh dấu siêu văn HTML  Chương Ngôn ngữ đánh dấu mở rộng - XML Chương sâu tìm hiểu ngôn ngữ XML, cấu trúc, thành phần ngôn ngữ  Chương Một số ứng dụng XML lĩnh vực Thông tin - Thư viện Chương giới thiệu số ứng dụng XML hoạt động Thông tin - Thư viện: MARC XML, METS, MODS  Chương Đánh giá kiến nghị Phùng Thanh Vân K50 Thông tin - Thư viện Tìm hiểu ngôn ngữ XML - Một số ứng dụng lĩnh vực Thông tin - Thư viện CHƯƠNG TỔNG QUAN VỀ NGÔN NGỮ ĐÁNH DẤU MARKUP LANGUAGE Ngôn ngữ đánh dấu tập hợp ghi cho văn mô tả cách chúng cấu trúc, trình bày, định dạng Ngôn ngữ đánh dấu dạng viết tay dạng mã đánh dấu sử dụng hệ thống xử lý văn máy tính Ví dụ điển hình ngôn ngữ đánh dấu Ngôn ngữ đánh dấu siêu văn - HTML, số giao thức World Wide Web Dưới khái niệm số loại ngôn ngữ đánh dấu 1.1 Ngôn ngữ đánh dấu tổng quát - GML GML (Generalized Markup Language) ngôn ngữ định dạng tài liệu IBM, mô tả tài liệu mặt cấu trúc tổ chức, phần nội dung mối quan hệ chúng GML cho phép mô tả phần tài liệu theo thứ bậc đề mục: Tên phần/chương, đoạn văn đó, danh mục, bảng biểu,… GML tảng để phát triển loại ngôn ngữ đánh dấu sau 1.2 Ngôn ngữ đánh dấu tổng quát chuẩn - SGML SGML (Standard Generalized Markup Language) phát triển lên từ GML Năm 1986, SGML tổ chức ISO công nhận chuẩn lưu trữ chuyển đổi liệu (ISO 8879:1986) SGML thân ngôn ngữ tư liệu, ngôn ngữ dùng để đặc tả ngôn ngữ khác, nói cách khác, SGML loại siêu ngôn ngữ hay siêu liệu (metadata) SGML thiết kế với mục đích để chia sẻ liệu đọc máy từ hệ thống sang hệ thống khác mà không bị liệu Nó sử Phùng Thanh Vân K50 Thông tin - Thư viện Tìm hiểu ngôn ngữ XML - Một số ứng dụng lĩnh vực Thông tin - Thư viện dụng việc in ấn xuất Tuy nhiên, việc sử dụng SGML phức tạp phải tốn nhiều công sức để thực nên SGML không mở rộng áp dụng mục đích sử dụng thông thường 1.3 Ngôn ngữ đánh dấu siêu văn - HTML 1.3.1 Khái quát chung HTML (HyperText Markup Language) loại ngôn ngữ đánh dấu trội cho trang Web Như định nghĩa trên, HTML cung cấp phương tiện để mô tả cấu trúc thông tin văn tài liệu cách hiển thị văn dạng đường link, đầu mục, đoạn văn, danh sách,… Giống với SGML, HTML sử dụng thẻ (tags) đặt cặp dấu ngoặc nhọn < > Các thẻ HTML tập hợp nhỏ SGML HTML ngôn ngữ đánh dấu trọng nhiều đến cách thức trình bày tài liệu mà trọng cấu trúc, ngữ nghĩa tài liệu Cấu trúc trang HTML có dạng sau: Tiêu đề trang web Phần thân trang web Thẻ tài liệu HTML Thẻ báo cho trình duyệt biết điểm khởi đầu tài liệu HTML Thẻ cuối tài liệu , thẻ báo cho trình duyệt biết điểm kết thúc văn Phùng Thanh Vân K50 Thông tin - Thư viện Tìm hiểu ngôn ngữ XML - Một số ứng dụng lĩnh vực Thông tin - Thư viện Đoạn chữ nằm hai thẻ thông tin header, xác định phần mở đầu tài liệu Đoạn chữ nằm cặp thẻ tiêu đề văn Dòng tiêu đề xuất trạng thái trình duyệt web Đoạn chữ nằm cặp thẻ nội dung văn bản, thể trình duyệt Các thẻ HTML không phân biệt chữ viết hoa chữ viết thường Có thể thêm vào thuộc tính cho thẻ HTML Những thuộc tính cung cấp thông tin thành phần HTML trang Web Ví dụ: báo cho trình duyệt biết màu trang màu đỏ Thuộc tính luôn kèm cặp name-value với cú pháp: name=“value” 1.3.2 Cú pháp thẻ HTML Thẻ cấu trúc:  HTML Cặp thẻ sử dụng để xác nhận tài liệu tài liệu HTML Toàn nội dung tài liệu đặt cặp thẻ Cú pháp: Nội dung tài liệu  HEAD Thẻ Head sử dụng để xác định phần mở đầu cho tài liệu Cú pháp: Phần mở đầu tài liệu (Header) Phùng Thanh Vân K50 Thông tin - Thư viện Tìm hiểu ngôn ngữ XML - Một số ứng dụng lĩnh vực Thông tin - Thư viện  TITLE Cặp thẻ xác định tiêu đề tài liệu, sử dụng phần mở đầu tài liệu, tức phải nằm phạm vi giới hạn cặp thẻ HEAD Cú pháp: Tiêu đề tài liệu  BODY Cặp thẻ dùng để xác định phần nội dung (phần thân) tài liệu Trong phần thân chứa thông tin định dạng định để đặt ảnh cho tài liệu, màu nền, đặt lề,… Những thông tin đặt phần tham số thẻ Cú pháp bản: Phần nội dung Bắt đầu từ HTML 3.2, có nhiều thuộc tính sử dụng thẻ BODY Một số thuộc tính sau: - BACKGROUND: Đặt ảnh làm cho văn Giá trị tham số (đặt sau dấu “=”) URL file ảnh - BGCOLOR: Đặt màu cho trang hiển thị Nếu hai tham số BACKGROUND BGCOLOR có giá trị trình duyệt hiển thị màu trước, sau tải ảnh lên - TEXT: Xác định màu chữ cho văn bản, kể đề mục - ALINK, VLINK, LINK: Xác định màu sắc cho siêu liên kết văn Thẻ định dạng khối: Phùng Thanh Vân K50 Thông tin - Thư viện Tìm hiểu ngôn ngữ XML - Một số ứng dụng lĩnh vực Thông tin - Thư viện  Thẻ P Thẻ

sử dụng để định dạng đoạn văn Cú pháp:

Nội dung đoạn văn bản

 Các định dạng đề mục HTML hỗ trợ mức đề mục Ở đây, đề mục dẫn định dạng mặt Logic, tức trình duyệt thể đề mục khuôn dạng thích hợp Có thể trình duyệt font chữ 14 sang trình duyệt khác font chữ 20 Đề mục cấp cao giảm dần đến cấp Văn đề mục cấp hay cấp thường có kích thước nhỏ văn thông thường Dưới thẻ dùng để dịnh dạng văn dạng đề mục: … : Định dạng đề mục cấp … : Định dạng đề mục cấp … : Định dạng đề mục cấp … : Định dạng đề mục cấp … : Định dạng đề mục cấp … : Định dạng đề mục cấp  Thẻ xuống dòng BR Thẻ thẻ đóng tương ứng , có tác dụng chuyển sang dòng Nội dung văn tài liệu HTML trình duyệt Web thể liên tục, khoảng trắng liền nhau, ký tự Tab, ký tự xuống dòng coi khoảng trắng Để xuống dòng tài liệu, ta phải sử dụng thẻ  Thẻ PRE Phùng Thanh Vân K50 Thông tin - Thư viện Tìm hiểu ngôn ngữ XML - Một số ứng dụng lĩnh vực Thông tin - Thư viện Thẻ dùng để giới hạn đoạn văn định dạng sẵn Văn hai thẻ thể giống hệt chúng đánh vào, ví dụ dấu xuống dòng đoạn văn giới hạn thẻ giữ nguyên ý nghĩa chuyển sang dòng (trình duyệt không coi chúng dấu cách) Cú pháp: Văn định dạng Các thẻ định dạng danh sách: Cú pháp:
  • Mục thứ
  • Mục thứ hai
Có bốn kiểu danh sách: - Danh sách không xếp (hay không đánh số):
    - Danh sách có xếp (hay có đánh số):
      , mục danh sách xếp thứ tự - Danh sách thực đơn: - Danh sách phân cấp: Với nhiều trình duyệt, danh sách phân cấp danh sách thực đơn giống danh sách không đánh số, dùng lẫn với Với thẻ OL, cú pháp sau:
      1. Mục thứ
      2. Mục thứ hai Phùng Thanh Vân K50 Thông tin - Thư viện Tìm hiểu ngôn ngữ XML - Một số ứng dụng lĩnh vực Thông tin - Thư viện
      3. Mục thứ ba
      Trong đó: TYPE =1: Các mục xếp theo thứ tự 1, 2, 3… =a: Các mục xếp theo thứ tự a, b, c… =A: Các mục xếp theo thứ tự A, B, C… =i: Các mục xếp theo thứ tự i, ii, iii… =I: Các mục xếp theo thứ tự I, II, III… Ngoài thuộc tính START= xác định giá trị khởi đầu cho danh sách Thẻ
    1. có thuộc tính TYPE= xác định ký hiệu đầu dòng đứng trước mục danh sách Thuộc tính nhận giá trị: disc (chấm tròn đậm); circle (vòng tròn); square (hình vuông) Các thẻ định dạng ký tự:  Các thẻ định dạng in ký tự - , : Chữ in đậm - : Chữ in nghiêng - … : Chữ gạch chân - … : Đánh dấu đoạn văn cặp thẻ định nghĩa từ Chúng thường in nghiêng thể kiểu đặc biệt - … , … : Chữ gạch ngang thân - … : In chữ lớn bình thường cách tăng kích thước Font thời lên Việc dùng thẻ lồng tạo nên Phùng Thanh Vân K50 Thông tin - Thư viện 10 Tìm hiểu ngôn ngữ XML - Một số ứng dụng lĩnh vực Thông tin - Thư viện Includes bibliographical references (p 291-312) and index Journalism Political aspects United States. United States Politics and government 20th century. Mass media Political aspects United States. Television and politics United States. Press and politics United States. Talk shows United States. PN4888.P6 A48 1999 071/.3 0801486394 (pbk : acid-free, recycled paper) 99042030 Phùng Thanh Vân K50 Thông tin - Thư viện 51 Tìm hiểu ngôn ngữ XML - Một số ứng dụng lĩnh vực Thông tin - Thư viện DLC 990730 20000406144503.0 11761548 MODS cung cấp 20 phần tử cấp cao để mô tả đầy đủ yếu tố tài liệu Nhìn ví dụ thấy phạm vi nội dung phần tử cấp cao nhận biết rõ ràng qua tên chúng Các phần tử lớn bọc chia thành phần tử hẹp với phạm vi ngữ nghĩa cụ thể Phần tử cấp cao:  titleInfo  note  name  subject  typeOfResource  classification  genre  relatedItem  originInfo  identifier  language  location  physicalDescription  accessCondition  abstract  part  tableOfContents  extension  targetAudience  recordInfo Phần tử gốc: mods modsCollection Dưới xin đưa nét số phần tử quan trọng số phần tử kể titleInfo (thông tin nhan đề): Phùng Thanh Vân K50 Thông tin - Thư viện 52 Tìm hiểu ngôn ngữ XML - Một số ứng dụng lĩnh vực Thông tin - Thư viện Đây phần tử cấp cao bắt buộc phải có Là phần tử cha phần tử con: title (nhan đề chính), subtitle (nhan đề phụ), partNumber (số thứ tự tập), partName (tên tập) nonSort (yếu tố không xếp); đó, title bắt buộc Phần tử cuối cùng, nonSort, phần nhan đề tính ký tự không xếp vào lập mục titleInfo bổ sung thêm số thuộc tính như: rõ loại nhan đề nhập vào biểu ghi (nhan đề hay nhan đề song song), ngôn ngữ biên mục… name (thông tin trách nhiệm): Tương đương với trường Creator (người tạo lập) Contributor (người đóng góp) Dublin Core, phần tử name sử dụng để ghi tên cá nhân tổ chức chịu trách nhiệm việc tạo lập nội dung trí tuệ tài liệu, để ghi tên người đóng góp phần vào (ví dụ: làm minh họa, in ấn…) Đi kèm có thuộc tính type tên tên tác giả cá nhân hay tập thể, tên hội nghị Tên phân chia thành họ tên ghi vào với dạng thức cấu trúc, phục vụ cho mục đích hiển thị Vai trò tác giả định theo nhiều cách ghi, theo bảng mã tác giả (như bảng mã MARC) văn thường Mô tả nguyên văn theo tài liệu dùng để mô tả tác giả cách chi tiết hơn, đặc điểm MARC originInfo (thông tin xuất bản): originInfo phần tử cha khác, cho thông tin nguồn gốc tài liệu thông tin xuất Các phần tử cho thông tin thời gian bắt đầu tài liệu, thời gian xuất thời gian tạo lập tài liệu (trong trường hợp tài liệu tài liệu viết tay, không xuất bản) Khu vực cho ghi thông tin nhà xuất bản, lần xuất bản, tài liệu tài liệu chuyên khảo hay Phùng Thanh Vân K50 Thông tin - Thư viện 53 Tìm hiểu ngôn ngữ XML - Một số ứng dụng lĩnh vực Thông tin - Thư viện tiếp tục, định kỳ xuất Siêu liệu nhập khu vực mang tính mở rộng linh hoạt Một số phần tử như: place (nơi xuất bản), publisher (nhà xuất bản), dateIssued (thời gian xuất bản), dateCreated (thời gian tạo lập), dateValid (thời gian có giá trị), dateModified (thời gian chỉnh sửa), edition (lần xuất bản), frequency (tần suất) physicalDescription (Mô tả vật lý): physicalDescription phần tử cha, chứa nhiều phần tử cho phép mô tả đặc điểm vật lý tài liệu Nhiều phần tử số phù hợp mô tả tài liệu điện tử, gồm có: - internetMediaType: mô tả kiểu liệu - reformattingQuality: mô tả chất lượng (mức độ xử lý, độ phân giải…) - digitalOrigin: cho biết thông tin tài liệu dạng số từ đầu hay số hóa, định dạng lại Các phần tử khác: - form: dạng tài liệu - extent: thông tin số trang, minh họa… - note: thông tin khác đặc điểm vật lý tài liệu subject (Chủ đề): Phần tử subject dùng để mô tả nội dung trí tuệ tài liệu cách sử dụng thuật ngữ chủ đề Phần tử subject chia nhỏ thành phần tử phụ xác định loại khác thuật ngữ chủ đề: phụ đề nội dung, phụ đề địa lý, hay phụ đề thời gian Phùng Thanh Vân K50 Thông tin - Thư viện 54 Tìm hiểu ngôn ngữ XML - Một số ứng dụng lĩnh vực Thông tin - Thư viện Phần tử phụ hierarchicalGeographic xác định hệ thống thứ bậc thuật ngữ chủ đề địa lý, từ khái quát (như Châu lục) đến cụ thể (như Thành phố) Một phần tử phụ khác, cartographic, cho phép mô tả chi tiết tọa độ không gian, với tỉ lệ phép chiếu dùng cho đồ Nhìn chung, MODS cung cấp thuật ngữ đa dạng linh hoạt cho việc mô tả chủ đề Extension (Mở rộng): Mặc dù MODS cung cấp phần tử rộng nhiều so với Dublin Core, xảy khả không đáp ứng đủ tất yêu cầu siêu liệu cho tài liệu Trong trường hợp đó, MODS tạo điều kiện thuận lợi cho việc mở rộng phần tử cách cho phép liệu ghi lược đồ khác gắn vào biểu ghi MODS Những liệu thêm mô tả không gian tên XML khác (namespace) Các phần tử MODS khác:  typeOfResource: Loại tài liệu mô tả (văn bản, đồ, tài liệu đa phương tiện…)  genre: thể loại, thuật ngữ mô tả chi tiết so với typeOfResource  language: mô tả ngôn ngữ tài liệu, sử dụng mã ngôn ngữ  abstract: tóm tắt nội dung tài liệu  tableOfContents: mục lục nội dung tài liệu, mô tả trực tiếp đưa liên kết (link) đến danh mục  targetAudience: thuật ngữ xác định đối tượng người sử dụng (ví dụ: người lớn, thiếu niên…), lấy từ danh mục có kiểm soát MARC  note: phần tử dành cho việc ghi thêm thông tin liên quan mà không đưa vào phần tử khác Phùng Thanh Vân K50 Thông tin - Thư viện 55 Tìm hiểu ngôn ngữ XML - Một số ứng dụng lĩnh vực Thông tin - Thư viện  classification: số phân loại, lấy từ LCC DDC  identifier: số định danh (như ISBN ISSN)  location: mã xếp giá, tới vị trí tài liệu  accessRestriction: thông tin mức độ hạn chế truy cập tài liệu, bao gồm thông tin quyền  recordInfo: thông tin việc tạo lập biểu ghi MODS, gồm ngày tháng tạo lập, số kiểm soát… CHƯƠNG ĐÁNH GIÁ VÀ KIẾN NGHỊ Đẩy mạnh ứng dụng công nghệ thông tin vào hoạt động nghề nghiệp giúp cho ngành Thông tin - Thư viện nước ta thực chuẩn hóa nghiệp vụ Các công nghệ áp dụng để tăng cường khả trao đổi nguồn liệu sở liệu khác cấu trúc ngôn ngữ Giai đoạn đầu tin học hóa hoạt động nghiệp vụ thư viện, chuẩn MARC nói chung MARC 21 nói riêng đóng vai trò quan trọng, tạo hiệu Phùng Thanh Vân K50 Thông tin - Thư viện 56 Tìm hiểu ngôn ngữ XML - Một số ứng dụng lĩnh vực Thông tin - Thư viện xã hội không nhỏ, đáp ứng nhu cầu lưu trữ tìm kiếm thông tin Tuy nhiên, trình sử dụng, MARC bộc lộ nhiều hạn chế như: - Quá phức tạp cho người sử dụng không đào tạo sâu nghiệp vụ thư viện - Có nhiều khổ mẫu MARC khác - Thiếu tính linh hoạt - Rất chậm cần thay đổi - Không phù hợp để mô tả tài liệu số nguồn thông tin từ Web Môi trường thông tin dần thay đổi, từ tài liệu vật lý sang nguồn tin điện tử, từ biểu ghi thư mục sang nguồn thông tin web, từ tài liệu cố định không thay đổi đến thông tin cập nhật nhanh chóng, tức Nguồn thông tin phong phú dần vượt khỏi mức độ kiểm soát thư viện, việc tiếp cận tới chúng cần qua giao diện yêu cầu cao đặt công tác thư viện Với MARC, công việc thực hiện, công nghệ đại xuất với ngôn ngữ XML tỏ hiệu nhiều Nếu MARC ngôn ngữ đánh dấu dành cho thông tin thư mục XML ngôn ngữ đánh dấu vượt trội nhiều áp dụng loại liệu Ưu XML so với MARC kể đến: - Thay định dạng ngôn ngữ mặc định UTF-8, ngôn ngữ sử dụng XML đa dạng, cần gắn thuộc tính xml:lang cho phần tử tài liệu - Tính mở rộng - Khả liên thông - Xử lý tốt liệu thư mục mang tính thứ bậc - Cho phép liên kết liệu Phùng Thanh Vân K50 Thông tin - Thư viện 57 Tìm hiểu ngôn ngữ XML - Một số ứng dụng lĩnh vực Thông tin - Thư viện - Tăng cường khả chia sẻ liệu - Nhanh chóng trở thành định dạng liệu phổ biến cho nguồn thông tin web Việc sử dụng XML mở nhiều hội cho lĩnh vực thư viện: - Dữ liệu tạo lần xuất với nhiều định dạng khác - Biểu ghi thư mục xem trực tiếp trình duyệt web, máy tìm tin - Biểu ghi chuyển đổi XML MARC mà không bị liệu - Các nguồn tin truyền thống hợp với kho liệu phát triển nhanh chóng văn số, sở liệu, biểu ghi siêu liệu TS Hoàng Lê Minh phát biểu tham luận “Giải pháp công nghệ hỗ trợ Liên thông” Lễ kỷ niệm năm thành lập Liên hiệp Thư viện trường Đại học khu vực phía Nam nhấn mạnh tầm quan trọng việc ứng dụng giải pháp công nghệ nguồn mở chuẩn mở việc xây dựng kho liệu mở để quản lý chia sẻ thông tin Internet đặc biệt lưu ý XML lựa chọn tất yếu để thay cho MARC bối cảnh Việt Nam XML công nghệ mới, song với khả ứng dụng cao khẳng định vai trò nhiều lĩnh vực có lĩnh vực Thông tin - Thư viện Các thư viện giới, đặc biệt Thư viện Quốc hội Mỹ ứng dụng công nghệ đạt nhiều thành tựu lớn thúc đẩy phát triển hoạt động thư viện Đối với Việt Nam, điều kiện phát triển chưa cao kinh phí hạn chế nên việc ứng dụng XML lĩnh vực Thông tin - Thư viện chưa phổ biến Phùng Thanh Vân K50 Thông tin - Thư viện 58 Tìm hiểu ngôn ngữ XML - Một số ứng dụng lĩnh vực Thông tin - Thư viện Với số hiểu biết có sau nghiên cứu thực Khóa luận này, xin đưa số kiến nghị sau: - Về công nghệ: Đầu tư kinh phí máy móc, trang thiết bị đại, nâng cao hiệu hoạt động, đồng thời tăng cường vốn tài liệu thư viện, đặc biệt dạng tài liệu điện tử, tài liệu số Lựa chọn ứng dụng công nghệ phù hợp với tình hình phát triển thư viện nước ta, đặc biệt lưu ý đến XML công nghệ ưu việt chứng minh từ nhiều nước giới Nên sử dụng MARC XML Schema đơn giản MARC DTD, cho phép trao đổi thông tin nguồn khác kỹ thuật khác Phát triển tập hợp siêu liệu XML, tạo điều kiện thuận lợi cho việc chia sẻ thông tin với ứng dụng bên khác - Về người: Tăng cường đào tạo đội ngũ cán trình độ tin học nghiệp vụ chuyên môn, nhanh chóng tiếp cận sử dụng công nghệ đại Giao lưu học hỏi kinh nghiệm với nước tiên tiến giới, khảo sát mô hình thư viện thấy cách thức tổ chức hoạt động, vận hành hệ thống thư viện họ Mời ý kiến đóng góp chuyên gia nước việc lựa chọn công nghệ phù hợp, áp dụng đạt hiệu cao Phùng Thanh Vân K50 Thông tin - Thư viện 59 Tìm hiểu ngôn ngữ XML - Một số ứng dụng lĩnh vực Thông tin - Thư viện KẾT LUẬN Sự đời ngôn ngữ đánh dấu nói chung ngôn ngữ đánh dấu mở rộng - XML nói riêng làm thay đổi rõ rệt lĩnh vực công nghệ thông tin lĩnh vực khác ứng dụng XML, với kế thừa ưu điểm khắc phục nhược điểm SGML HTML, trở thành ngôn ngữ đánh dấu linh hoạt với nhiều tính mở rộng phù hợp với mục đích sử dụng Lĩnh vực Thông tin - Thư viện lĩnh vực ứng dụng thành công ngôn ngữ đánh dấu mở rộng XML Thư viện Quốc hội Hoa Kỳ nghiên cứu biến đổi trở thành công cụ đặc trưng cho ngành Thông tin - Thư viện Về khía cạnh biên mục đại, khổ mẫu thư mục sử dụng XML làm khuôn dạng để mã hóa trường thông tin siêu liệu tư liệu biên mục, ví dụ như: Dublin Core, MARC XML, MODS, METS, ONIX, TEI… Phùng Thanh Vân K50 Thông tin - Thư viện 60 Tìm hiểu ngôn ngữ XML - Một số ứng dụng lĩnh vực Thông tin - Thư viện XML công nghệ mới, với nhiều tính ưu việt nên ứng dụng nhiều thư viện giới Song, Việt Nam việc ứng dụng công nghệ chưa phổ biến Việc ứng dụng công nghệ thông tin quan trọng, giúp cho hệ thống thư viện Việt Nam kéo lại gần với thư viện giới Hy vọng tương lai không xa, thư viện Việt Nam tiếp cận, sử dụng công nghệ XML ứng dụng công nghệ nói chung để nâng cao chất lượng hoạt động phục vụ DANH MỤC TÀI LIỆU THAM KHẢO Nguyễn Phương Lan (2001), XML - Nền tảng ứng dụng, NXB Giáo dục, Hà Nội Vũ Văn Sơn (2002), Bản dịch Cấu trúc khổ mẫu biên mục MARC 21 đầy đủ Trần Thị Quý - Đỗ Văn Hùng (2007), Tự động hóa hoạt động Thông tin - Thư viện, Đại học Quốc gia Hà Nội, Hà Nội KS Phú Hưng - Quang Anh (2008), Sổ tay HTML JavaScript, NXB Hồng Đức, Hà Nội Nguyễn Thị Nhuần (2005), XML ứng dụng hoạt động thư viện, Khóa luận tốt nghiệp, Trường Đại học Khoa học Xã hội Nhân văn - Đại học Quốc gia, Hà Nội Simon ST Laurent, XML - A primer, MIS:Press, New York Richard Gartner (2003), MODS: Metadata Object Description Schema Wikipedia Phùng Thanh Vân K50 Thông tin - Thư viện 61 Tìm hiểu ngôn ngữ XML - Một số ứng dụng lĩnh vực Thông tin - Thư viện http://en.wikipedia.org/ XML from the inside out http://www.xml.com/ 10.Introducing XML http://www.itwriting.com/xmlintro.php 11.XML Tutorial http://www.w3schools.com/xml/default.asp 12.MARC Standards http://www.loc.gov/marc/ 13.Getting Started with XML: A manual and Workshop http://infomotions.com/musings/getting-started/getting-started.html 14.METS: An overview and Tutorial http://www.loc.gov/standards/mets/METSOverview.v2.html 15.Outline of Elements and Attributes in MODS Version 3.3 http://www.loc.gov/standards/mods/mods-outline.html Phùng Thanh Vân K50 Thông tin - Thư viện 62 Tìm hiểu ngôn ngữ XML - Một số ứng dụng lĩnh vực Thông tin - Thư viện MỤC LỤC MỞ ĐẦU 1 Tính cấp thiết đề tài Mục đích nghiên cứu Phạm vi nghiên cứu Phương pháp nghiên cứu Đóng góp lý luận thực tiễn Khóa luận Bố cục Khóa luận CHƯƠNG TỔNG QUAN VỀ NGÔN NGỮ ĐÁNH DẤU - MARKUP LANGUAGE 1.1 Ngôn ngữ đánh dấu tổng quát - GML 1.2 Ngôn ngữ đánh dấu tổng quát chuẩn - SGML 1.3 Ngôn ngữ đánh dấu siêu văn - HTML Phùng Thanh Vân K50 Thông tin - Thư viện 63 Tìm hiểu ngôn ngữ XML - Một số ứng dụng lĩnh vực Thông tin - Thư viện 1.3.1 Khái quát chung 1.3.2 Cú pháp thẻ HTML CHƯƠNG NGÔN NGỮ ĐÁNH DẤU MỞ RỘNG - XML 12 2.1 Quá trình phát triển 12 2.2 Các phần tài liệu XML 13 2.3 Tài liệu XML 14 2.3.1 Tài liệu XML hợp khuôn dạng (Well-formed document) 14 2.3.2 Tài liệu XML hợp lệ (Valid document) 19 2.3.3 Bộ phân tích XML (XML Parser) 21 2.3.4 Bộ kiểm tra XML (XML Validator) 23 2.3.5 CSS XSL 24 2.4 Bảng định kiểu CSS XSLT 24 2.4.1 Hiển thị tài liệu XML với CSS 24 2.4.2 Chuyển đổi XML với XSLT 28 2.5 XML HTML 29 CHƯƠNG MỘT SỐ ỨNG DỤNG XML TRONG LĨNH VỰC THÔNG TIN - THƯ VIỆN 31 3.1 MARC XML 31 3.1.1 MARC DTD 32 3.1.2 MARC XML DTD 33 3.2 Chuẩn mã hóa truyền tải siêu liệu - METS 35 3.2.1 Khái quát METS 35 3.2.2 Các thành phần METS 37 3.3 Lược đồ mô tả phần tử siêu liệu - MODS 46 3.3.1 Khái quát MODS 46 3.3.2 Vận hành MODS 49 Phùng Thanh Vân K50 Thông tin - Thư viện 64 Tìm hiểu ngôn ngữ XML - Một số ứng dụng lĩnh vực Thông tin - Thư viện CHƯƠNG ĐÁNH GIÁ VÀ KIẾN NGHỊ 56 KẾT LUẬN 60 DANH MỤC TÀI LIỆU THAM KHẢO 61 Phùng Thanh Vân K50 Thông tin - Thư viện 65 ... sử dụng thực tế số lĩnh vực đặc biệt lĩnh vực Thông tin - Thư viện Phùng Thanh Vân K50 Thông tin - Thư viện Tìm hiểu ngôn ngữ XML - Một số ứng dụng lĩnh vực Thông tin - Thư viện Đóng góp lý luận... K50 Thông tin - Thư viện 30 Tìm hiểu ngôn ngữ XML - Một số ứng dụng lĩnh vực Thông tin - Thư viện CHƯƠNG MỘT SỐ ỨNG DỤNG XML TRONG LĨNH VỰC THÔNG TIN - THƯ VIỆN 3.1 MARC XML Như biết, khổ mẫu... sâu tìm hiểu ngôn ngữ XML, cấu trúc, thành phần ngôn ngữ  Chương Một số ứng dụng XML lĩnh vực Thông tin - Thư viện Chương giới thiệu số ứng dụng XML hoạt động Thông tin - Thư viện: MARC XML,

Ngày đăng: 19/07/2017, 18:30

Từ khóa liên quan

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan