sử dụng để định dạng đoạn văn Cú pháp:
Nội dung đoạn văn bản
Các định dạng đề mục HTML hỗ trợ mức đề mục Ở đây, đề mục dẫn định dạng mặt Logic, tức trình duyệt thể đề mục khn dạng thích hợp Có thể trình duyệt font chữ 14 sang trình duyệt khác font chữ 20 Đề mục cấp cao giảm dần đến cấp Văn đề mục cấp hay cấp thường có kích thước nhỏ văn thông thường Dưới thẻ dùng để dịnh dạng văn dạng đề mục: … : Định dạng đề mục cấp … : Định dạng đề mục cấp … : Định dạng đề mục cấp … : Định dạng đề mục cấp … : Định dạng đề mục cấp … : Định dạng đề mục cấp Thẻ xuống dòng BR Thẻ khơng có thẻ đóng tương ứng , có tác dụng chuyển sang dịng Nội dung văn tài liệu HTML trình duyệt Web thể liên tục, khoảng trắng liền nhau, ký tự Tab, ký tự xuống dòng coi khoảng trắng Để xuống dòng tài liệu, ta phải sử dụng thẻ Thẻ PRE Phùng Thanh Vân K50 Thông tin - Thư viện Tìm hiểu ngơn ngữ XML - Một số ứng dụng lĩnh vực Thông tin - Thư viện Thẻ dùng để giới hạn đoạn văn định dạng sẵn Văn hai thẻ thể giống hệt chúng đánh vào, ví dụ dấu xuống dịng đoạn văn giới hạn thẻ giữ nguyên ý nghĩa chuyển sang dịng (trình duyệt khơng coi chúng dấu cách) Cú pháp: Văn định dạng Các thẻ định dạng danh sách: Cú pháp:- Mục thứ
- Mục thứ hai
- - Danh sách có xếp (hay có đánh số):
- Mục thứ
- Mục thứ hai Phùng Thanh Vân K50 Thơng tin - Thư viện Tìm hiểu ngơn ngữ XML - Một số ứng dụng lĩnh vực Thông tin - Thư viện
- Mục thứ ba
- có thuộc tính TYPE= xác định ký hiệu đầu dịng đứng trước mục danh sách Thuộc tính nhận giá trị: disc (chấm tròn đậm); circle (vòng tròn); square (hình vng) Các thẻ định dạng ký tự: Các thẻ định dạng in ký tự - … , … : Chữ in đậm - … : Chữ in nghiêng - … : Chữ gạch chân - … : Đánh dấu đoạn văn cặp thẻ định nghĩa từ Chúng thường in nghiêng thể kiểu đặc biệt - … , … : Chữ gạch ngang thân - … : In chữ lớn bình thường cách tăng kích thước Font thời lên Việc dùng thẻ lồng tạo nên Phùng Thanh Vân K50 Thơng tin - Thư viện 10 Tìm hiểu ngơn ngữ XML - Một số ứng dụng lĩnh vực Thông tin - Thư viện Includes bibliographical references (p 291-312) and index Journalism Political aspects United States. United States Politics and government 20th century. Mass media Political aspects United States. Television and politics United States. Press and politics United States. Talk shows United States. PN4888.P6 A48 1999 071/.3 0801486394 (pbk : acid-free, recycled paper) 99042030 Phùng Thanh Vân K50 Thông tin - Thư viện 51 Tìm hiểu ngơn ngữ XML - Một số ứng dụng lĩnh vực Thông tin - Thư viện DLC 990730 20000406144503.0 11761548 MODS cung cấp 20 phần tử cấp cao để mô tả đầy đủ yếu tố tài liệu Nhìn ví dụ thấy phạm vi nội dung phần tử cấp cao nhận biết rõ ràng qua tên chúng Các phần tử lớn bọc chia thành phần tử hẹp với phạm vi ngữ nghĩa cụ thể Phần tử cấp cao: titleInfo note name subject typeOfResource classification genre relatedItem originInfo identifier language location physicalDescription accessCondition abstract part tableOfContents extension targetAudience recordInfo Phần tử gốc: mods modsCollection Dưới xin đưa nét số phần tử quan trọng số phần tử kể titleInfo (thông tin nhan đề): Phùng Thanh Vân K50 Thông tin - Thư viện 52 Tìm hiểu ngơn ngữ XML - Một số ứng dụng lĩnh vực Thông tin - Thư viện Đây phần tử cấp cao bắt buộc phải có Là phần tử cha phần tử con: title (nhan đề chính), subtitle (nhan đề phụ), partNumber (số thứ tự tập), partName (tên tập) nonSort (yếu tố khơng xếp); đó, title bắt buộc Phần tử cuối cùng, nonSort, phần nhan đề tính ký tự khơng xếp vào lập mục titleInfo bổ sung thêm số thuộc tính như: rõ loại nhan đề nhập vào biểu ghi (nhan đề hay nhan đề song song), ngơn ngữ biên mục… name (thông tin trách nhiệm): Tương đương với trường Creator (người tạo lập) Contributor (người đóng góp) Dublin Core, phần tử name sử dụng để ghi tên cá nhân tổ chức chịu trách nhiệm việc tạo lập nội dung trí tuệ tài liệu, để ghi tên người đóng góp phần vào (ví dụ: làm minh họa, in ấn…) Đi kèm có thuộc tính type tên tên tác giả cá nhân hay tập thể, tên hội nghị Tên phân chia thành họ tên ghi vào với dạng thức khơng có cấu trúc, phục vụ cho mục đích hiển thị Vai trò tác giả định theo nhiều cách ghi, theo bảng mã tác giả (như bảng mã MARC) văn thường Mơ tả ngun văn theo tài liệu dùng để mô tả tác giả cách chi tiết hơn, đặc điểm khơng có MARC originInfo (thông tin xuất bản): originInfo phần tử cha khác, cho thông tin nguồn gốc tài liệu thông tin xuất Các phần tử cho thông tin thời gian bắt đầu tài liệu, thời gian xuất thời gian tạo lập tài liệu (trong trường hợp tài liệu tài liệu viết tay, không xuất bản) Khu vực cho ghi thông tin nhà xuất bản, lần xuất bản, tài liệu tài liệu chuyên khảo hay Phùng Thanh Vân K50 Thông tin - Thư viện 53 Tìm hiểu ngơn ngữ XML - Một số ứng dụng lĩnh vực Thông tin - Thư viện tiếp tục, định kỳ xuất Siêu liệu nhập khu vực mang tính mở rộng linh hoạt Một số phần tử như: place (nơi xuất bản), publisher (nhà xuất bản), dateIssued (thời gian xuất bản), dateCreated (thời gian tạo lập), dateValid (thời gian có giá trị), dateModified (thời gian chỉnh sửa), edition (lần xuất bản), frequency (tần suất) physicalDescription (Mô tả vật lý): physicalDescription phần tử cha, chứa nhiều phần tử cho phép mô tả đặc điểm vật lý tài liệu Nhiều phần tử số phù hợp mô tả tài liệu điện tử, gồm có: - internetMediaType: mơ tả kiểu liệu - reformattingQuality: mô tả chất lượng (mức độ xử lý, độ phân giải…) - digitalOrigin: cho biết thông tin tài liệu dạng số từ đầu hay số hóa, định dạng lại Các phần tử khác: - form: dạng tài liệu - extent: thông tin số trang, minh họa… - note: thông tin khác đặc điểm vật lý tài liệu subject (Chủ đề): Phần tử subject dùng để mơ tả nội dung trí tuệ tài liệu cách sử dụng thuật ngữ chủ đề Phần tử subject chia nhỏ thành phần tử phụ xác định loại khác thuật ngữ chủ đề: phụ đề nội dung, phụ đề địa lý, hay phụ đề thời gian Phùng Thanh Vân K50 Thông tin - Thư viện 54 Tìm hiểu ngơn ngữ XML - Một số ứng dụng lĩnh vực Thông tin - Thư viện Phần tử phụ hierarchicalGeographic xác định hệ thống thứ bậc thuật ngữ chủ đề địa lý, từ khái quát (như Châu lục) đến cụ thể (như Thành phố) Một phần tử phụ khác, cartographic, cho phép mô tả chi tiết tọa độ không gian, với tỉ lệ phép chiếu dùng cho đồ Nhìn chung, MODS cung cấp thuật ngữ đa dạng linh hoạt cho việc mô tả chủ đề Extension (Mở rộng): Mặc dù MODS cung cấp phần tử rộng nhiều so với Dublin Core, xảy khả khơng đáp ứng đủ tất yêu cầu siêu liệu cho tài liệu Trong trường hợp đó, MODS tạo điều kiện thuận lợi cho việc mở rộng phần tử cách cho phép liệu ghi lược đồ khác gắn vào biểu ghi MODS Những liệu thêm mô tả không gian tên XML khác (namespace) Các phần tử MODS khác: typeOfResource: Loại tài liệu mô tả (văn bản, đồ, tài liệu đa phương tiện…) genre: thể loại, thuật ngữ mô tả chi tiết so với typeOfResource language: mô tả ngôn ngữ tài liệu, sử dụng mã ngơn ngữ abstract: tóm tắt nội dung tài liệu tableOfContents: mục lục nội dung tài liệu, mơ tả trực tiếp đưa liên kết (link) đến danh mục targetAudience: thuật ngữ xác định đối tượng người sử dụng (ví dụ: người lớn, thiếu niên…), lấy từ danh mục có kiểm sốt MARC note: phần tử dành cho việc ghi thêm thông tin liên quan mà không đưa vào phần tử khác Phùng Thanh Vân K50 Thơng tin - Thư viện 55 Tìm hiểu ngôn ngữ XML - Một số ứng dụng lĩnh vực Thông tin - Thư viện classification: số phân loại, lấy từ LCC DDC identifier: số định danh (như ISBN ISSN) location: mã xếp giá, tới vị trí tài liệu accessRestriction: thông tin mức độ hạn chế truy cập tài liệu, bao gồm thông tin quyền recordInfo: thông tin việc tạo lập biểu ghi MODS, gồm ngày tháng tạo lập, số kiểm soát… CHƯƠNG ĐÁNH GIÁ VÀ KIẾN NGHỊ Đẩy mạnh ứng dụng công nghệ thơng tin vào hoạt động nghề nghiệp giúp cho ngành Thông tin - Thư viện nước ta thực chuẩn hóa nghiệp vụ Các cơng nghệ áp dụng để tăng cường khả trao đổi nguồn liệu sở liệu khác cấu trúc ngơn ngữ Giai đoạn đầu tin học hóa hoạt động nghiệp vụ thư viện, chuẩn MARC nói chung MARC 21 nói riêng đóng vai trị quan trọng, tạo hiệu Phùng Thanh Vân K50 Thông tin - Thư viện 56 Tìm hiểu ngơn ngữ XML - Một số ứng dụng lĩnh vực Thông tin - Thư viện xã hội không nhỏ, đáp ứng nhu cầu lưu trữ tìm kiếm thơng tin Tuy nhiên, q trình sử dụng, MARC bộc lộ nhiều hạn chế như: - Quá phức tạp cho người sử dụng không đào tạo sâu nghiệp vụ thư viện - Có nhiều khổ mẫu MARC khác - Thiếu tính linh hoạt - Rất chậm cần thay đổi - Không phù hợp để mô tả tài liệu số nguồn thông tin từ Web Môi trường thông tin dần thay đổi, từ tài liệu vật lý sang nguồn tin điện tử, từ biểu ghi thư mục sang nguồn thông tin web, từ tài liệu cố định không thay đổi đến thông tin cập nhật nhanh chóng, tức Nguồn thơng tin phong phú dần vượt khỏi mức độ kiểm soát thư viện, việc tiếp cận tới chúng cần qua giao diện yêu cầu cao đặt công tác thư viện Với MARC, công việc thực hiện, cơng nghệ đại xuất với ngôn ngữ XML tỏ hiệu nhiều Nếu MARC ngôn ngữ đánh dấu dành cho thông tin thư mục XML ngơn ngữ đánh dấu vượt trội nhiều áp dụng loại liệu Ưu XML so với MARC kể đến: - Thay định dạng ngôn ngữ mặc định UTF-8, ngôn ngữ sử dụng XML đa dạng, cần gắn thuộc tính xml:lang cho phần tử tài liệu - Tính mở rộng - Khả liên thơng - Xử lý tốt liệu thư mục mang tính thứ bậc - Cho phép liên kết liệu Phùng Thanh Vân K50 Thông tin - Thư viện 57 Tìm hiểu ngơn ngữ XML - Một số ứng dụng lĩnh vực Thông tin - Thư viện - Tăng cường khả chia sẻ liệu - Nhanh chóng trở thành định dạng liệu phổ biến cho nguồn thông tin web Việc sử dụng XML mở nhiều hội cho lĩnh vực thư viện: - Dữ liệu tạo lần xuất với nhiều định dạng khác - Biểu ghi thư mục xem trực tiếp trình duyệt web, máy tìm tin - Biểu ghi chuyển đổi XML MARC mà không bị liệu - Các nguồn tin truyền thống hợp với kho liệu phát triển nhanh chóng văn số, sở liệu, biểu ghi siêu liệu TS Hoàng Lê Minh phát biểu tham luận “Giải pháp công nghệ hỗ trợ Liên thông” Lễ kỷ niệm năm thành lập Liên hiệp Thư viện trường Đại học khu vực phía Nam nhấn mạnh tầm quan trọng việc ứng dụng giải pháp công nghệ nguồn mở chuẩn mở việc xây dựng kho liệu mở để quản lý chia sẻ thông tin Internet đặc biệt lưu ý XML lựa chọn tất yếu để thay cho MARC bối cảnh Việt Nam XML công nghệ mới, song với khả ứng dụng cao khẳng định vai trị nhiều lĩnh vực có lĩnh vực Thông tin - Thư viện Các thư viện giới, đặc biệt Thư viện Quốc hội Mỹ ứng dụng công nghệ đạt nhiều thành tựu lớn thúc đẩy phát triển hoạt động thư viện Đối với Việt Nam, điều kiện phát triển chưa cao kinh phí cịn hạn chế nên việc ứng dụng XML lĩnh vực Thơng tin - Thư viện cịn chưa phổ biến Phùng Thanh Vân K50 Thông tin - Thư viện 58 Tìm hiểu ngơn ngữ XML - Một số ứng dụng lĩnh vực Thông tin - Thư viện Với số hiểu biết có sau nghiên cứu thực Khóa luận này, tơi xin đưa số kiến nghị sau: - Về công nghệ: Đầu tư kinh phí máy móc, trang thiết bị đại, nâng cao hiệu hoạt động, đồng thời tăng cường vốn tài liệu thư viện, đặc biệt dạng tài liệu điện tử, tài liệu số Lựa chọn ứng dụng cơng nghệ phù hợp với tình hình phát triển thư viện nước ta, đặc biệt lưu ý đến XML cơng nghệ ưu việt chứng minh từ nhiều nước giới Nên sử dụng MARC XML Schema đơn giản MARC DTD, cho phép trao đổi thông tin nguồn khác kỹ thuật khác Phát triển tập hợp siêu liệu XML, tạo điều kiện thuận lợi cho việc chia sẻ thông tin với ứng dụng bên khác - Về người: Tăng cường đào tạo đội ngũ cán trình độ tin học nghiệp vụ chun mơn, nhanh chóng tiếp cận sử dụng cơng nghệ đại Giao lưu học hỏi kinh nghiệm với nước tiên tiến giới, khảo sát mơ hình thư viện thấy cách thức tổ chức hoạt động, vận hành hệ thống thư viện họ Mời ý kiến đóng góp chuyên gia nước ngồi việc lựa chọn cơng nghệ phù hợp, áp dụng đạt hiệu cao Phùng Thanh Vân K50 Thơng tin - Thư viện 59 Tìm hiểu ngôn ngữ XML - Một số ứng dụng lĩnh vực Thông tin - Thư viện KẾT LUẬN Sự đời ngơn ngữ đánh dấu nói chung ngơn ngữ đánh dấu mở rộng - XML nói riêng làm thay đổi rõ rệt lĩnh vực công nghệ thông tin lĩnh vực khác ứng dụng XML, với kế thừa ưu điểm khắc phục nhược điểm SGML HTML, trở thành ngôn ngữ đánh dấu linh hoạt với nhiều tính mở rộng phù hợp với mục đích sử dụng Lĩnh vực Thơng tin - Thư viện lĩnh vực ứng dụng thành công ngôn ngữ đánh dấu mở rộng XML Thư viện Quốc hội Hoa Kỳ nghiên cứu biến đổi trở thành cơng cụ đặc trưng cho ngành Thơng tin - Thư viện Về khía cạnh biên mục đại, khổ mẫu thư mục sử dụng XML làm khn dạng để mã hóa trường thông tin siêu liệu tư liệu biên mục, ví dụ như: Dublin Core, MARC XML, MODS, METS, ONIX, TEI… Phùng Thanh Vân K50 Thông tin - Thư viện 60 Tìm hiểu ngơn ngữ XML - Một số ứng dụng lĩnh vực Thông tin - Thư viện XML cơng nghệ mới, với nhiều tính ưu việt nên ứng dụng nhiều thư viện giới Song, Việt Nam việc ứng dụng công nghệ chưa phổ biến Việc ứng dụng công nghệ thông tin quan trọng, giúp cho hệ thống thư viện Việt Nam kéo lại gần với thư viện giới Hy vọng tương lai khơng xa, thư viện Việt Nam tiếp cận, sử dụng công nghệ XML ứng dụng cơng nghệ nói chung để nâng cao chất lượng hoạt động phục vụ DANH MỤC TÀI LIỆU THAM KHẢO Nguyễn Phương Lan (2001), XML - Nền tảng ứng dụng, NXB Giáo dục, Hà Nội Vũ Văn Sơn (2002), Bản dịch Cấu trúc khổ mẫu biên mục MARC 21 đầy đủ Trần Thị Quý - Đỗ Văn Hùng (2007), Tự động hóa hoạt động Thông tin - Thư viện, Đại học Quốc gia Hà Nội, Hà Nội KS Phú Hưng - Quang Anh (2008), Sổ tay HTML JavaScript, NXB Hồng Đức, Hà Nội Nguyễn Thị Nhuần (2005), XML ứng dụng hoạt động thư viện, Khóa luận tốt nghiệp, Trường Đại học Khoa học Xã hội Nhân văn - Đại học Quốc gia, Hà Nội Simon ST Laurent, XML - A primer, MIS:Press, New York Richard Gartner (2003), MODS: Metadata Object Description Schema Wikipedia Phùng Thanh Vân K50 Thơng tin - Thư viện 61 Tìm hiểu ngôn ngữ XML - Một số ứng dụng lĩnh vực Thông tin - Thư viện http://en.wikipedia.org/ XML from the inside out http://www.xml.com/ 10.Introducing XML http://www.itwriting.com/xmlintro.php 11.XML Tutorial http://www.w3schools.com/xml/default.asp 12.MARC Standards http://www.loc.gov/marc/ 13.Getting Started with XML: A manual and Workshop http://infomotions.com/musings/getting-started/getting-started.html 14.METS: An overview and Tutorial http://www.loc.gov/standards/mets/METSOverview.v2.html 15.Outline of Elements and Attributes in MODS Version 3.3 http://www.loc.gov/standards/mods/mods-outline.html Phùng Thanh Vân K50 Thơng tin - Thư viện 62 Tìm hiểu ngôn ngữ XML - Một số ứng dụng lĩnh vực Thông tin - Thư viện MỤC LỤC MỞ ĐẦU 1 Tính cấp thiết đề tài Mục đích nghiên cứu Phạm vi nghiên cứu Phương pháp nghiên cứu Đóng góp lý luận thực tiễn Khóa luận Bố cục Khóa luận CHƯƠNG TỔNG QUAN VỀ NGÔN NGỮ ĐÁNH DẤU - MARKUP LANGUAGE 1.1 Ngôn ngữ đánh dấu tổng quát - GML 1.2 Ngôn ngữ đánh dấu tổng quát chuẩn - SGML 1.3 Ngôn ngữ đánh dấu siêu văn - HTML Phùng Thanh Vân K50 Thông tin - Thư viện 63 Tìm hiểu ngơn ngữ XML - Một số ứng dụng lĩnh vực Thông tin - Thư viện 1.3.1 Khái quát chung 1.3.2 Cú pháp thẻ HTML CHƯƠNG NGÔN NGỮ ĐÁNH DẤU MỞ RỘNG - XML 12 2.1 Quá trình phát triển 12 2.2 Các phần tài liệu XML 13 2.3 Tài liệu XML 14 2.3.1 Tài liệu XML hợp khuôn dạng (Well-formed document) 14 2.3.2 Tài liệu XML hợp lệ (Valid document) 19 2.3.3 Bộ phân tích XML (XML Parser) 21 2.3.4 Bộ kiểm tra XML (XML Validator) 23 2.3.5 CSS XSL 24 2.4 Bảng định kiểu CSS XSLT 24 2.4.1 Hiển thị tài liệu XML với CSS 24 2.4.2 Chuyển đổi XML với XSLT 28 2.5 XML HTML 29 CHƯƠNG MỘT SỐ ỨNG DỤNG XML TRONG LĨNH VỰC THÔNG TIN - THƯ VIỆN 31 3.1 MARC XML 31 3.1.1 MARC DTD 32 3.1.2 MARC XML DTD 33 3.2 Chuẩn mã hóa truyền tải siêu liệu - METS 35 3.2.1 Khái quát METS 35 3.2.2 Các thành phần METS 37 3.3 Lược đồ mô tả phần tử siêu liệu - MODS 46 3.3.1 Khái quát MODS 46 3.3.2 Vận hành MODS 49 Phùng Thanh Vân K50 Thông tin - Thư viện 64 Tìm hiểu ngơn ngữ XML - Một số ứng dụng lĩnh vực Thông tin - Thư viện CHƯƠNG ĐÁNH GIÁ VÀ KIẾN NGHỊ 56 KẾT LUẬN 60 DANH MỤC TÀI LIỆU THAM KHẢO 61 Phùng Thanh Vân K50 Thông tin - Thư viện 65 ... thực tế số lĩnh vực đặc biệt lĩnh vực Thông tin - Thư viện Phùng Thanh Vân K50 Thơng tin - Thư viện Tìm hiểu ngơn ngữ XML - Một số ứng dụng lĩnh vực Thơng tin - Thư viện Đóng góp lý luận thực... Thông tin - Thư viện 30 Tìm hiểu ngơn ngữ XML - Một số ứng dụng lĩnh vực Thông tin - Thư viện CHƯƠNG MỘT SỐ ỨNG DỤNG XML TRONG LĨNH VỰC THÔNG TIN - THƯ VIỆN 3.1 MARC XML Như biết, khổ mẫu MARC... hoạt động Thông tin - Thư viện: MARC XML, METS, MODS Chương Đánh giá kiến nghị Phùng Thanh Vân K50 Thông tin - Thư viện Tìm hiểu ngơn ngữ XML - Một số ứng dụng lĩnh vực Thông tin - Thư viện CHƯƠNG
- , mục danh sách xếp thứ tự - Danh sách thực đơn: - Danh sách phân cấp: Với nhiều trình duyệt, danh sách phân cấp danh sách thực đơn giống danh sách khơng đánh số, dùng lẫn với Với thẻ OL, cú pháp sau: