Trong vài thập niên qua chúng ta đã và đang chứng kiến sự bùng nổ thông tin, lượng tài liệu gia tăng nhanh chóng. Thêm vào đó là xu hướng hợp tác hóa, quốc tế hóa diễn ra mạnh mẽ đòi hỏi các cơ quan thông tin thư viện cần đẩy mạnh hợp tác. Để có thể hợp tác và có thể tiếp cận một cách thuận lợi các thông tin thư mục thì vấn đề đặt ra cho các cơ quan thông tin thư viện là phải chuẩn hóa công tác biên mục
BÀI ĐIỀU KIỆN MÔN: THƯ VIỆN SỐ ĐỀ TÀI: MARC 21 VÀ MARC XML MỤC LỤC CHƯƠNG : KHỔ MẪU BIÊN MỤC MARC 21 1.1 1.2 1.3 Khái quát khổ mẫu biên mục MARC 21…………………………… 1.1.1 MARC ? 1.1.2 Khổ mẫu biên mục MARC 21………………………………… Cấu trúc khổ mẫu biên mục đọc máy MARC 21……………………… 1.2.1 Cấu trúc biểu ghi……………………………………………… 1.2.2 Chỉ định nội dung……………………………………………… 1.2.3 Các trường MARC 21…………………………… Những đặc trưng khổ mẫu biên mục MARC 21………… CHƯƠNG 2: MARC- XML………………………………………………… 2.1 Tổng quan XML 2.2 MARC – XML CHƯƠNG 1: KHỔ MẪU MARC 21 1.1 Khái quát khổ mẫu Marc 21 1.1.1 MARC gì? *Khái niệm Trong vài thập niên qua chứng kiến bùng nổ thông tin, lượng tài liệu gia tăng nhanh chóng Thêm vào xu hướng hợp tác hóa, quốc tế hóa diễn mạnh mẽ địi hỏi quan thông tin thư viện cần đẩy mạnh hợp tác Để hợp tác tiếp cận cách thuận lợi thông tin thư mục vấn đề đặt cho quan thơng tin thư viện phải chuẩn hóa cơng tác biên mục Năm 1960 với cố gắng tổ chức tiêu chuẩn quốc tế ISO/TC 46 hỗ trợ cử Hiệp hội Thư viện Quốc tế (IFLA), quy tắc mô tả thư mục theo tiêu chuẩn quốc tế ISBD biên soạn ISBD tập hợp quy trình trình bày liệu thư mục theo quy định chặt chẽ với dấu hiệu dung để xác định chúng Nó phân chia liệu thư mục thành vùng vùng với thuyết minh đủ xác vùng Trong nỗ lực nhằm chuẩn hóa cơng tác biên mục, ngồi quy tắc mơ tả thư mục ISBD cịn có số quy tắc tổ chức khác AFNOR nước nói tiếng Pháp, biên soạn xuất tập sách hướng dẫn việc ghi thư mục Trong nước nói tiếng Anh có quy tắc mơ tả thư mục Anh- Mỹ AACR2( )…tạo thuận lợi cho việc sử dụng mục lục để tìm tài liệu Những năm 60 kỷ XX, tin học ứng dụng vào hoạt động thư viện khiến cho nghề thư viện có thay đổi lượng chất hoạt động thư viện gắn với hoạt động thông tin, công tác lưu trữ thông tin gắn với công tác thơng tin thư mục, biên mục tự động hóa Trong trình biên mục tự động, quy tắc mô tả thư mục theo tiêu chuẩn quốc tế ISBD chưa hồn tồn thích nghi với xử lý tin học Các phương pháp xử lý tin học đòi hỏi liệu phải cấu trúc hóa để máy tính nhận biết liệu thư mục, dẫn khơng phải tn theo quy trình chặt chẽ mà cịn phải trình bày theo khổ mẫu thống Biên mục đọc máy xuất vào năm 1966 với khổ mẫu MARC Thư viện Quốc hội Mỹ MARC từ viết tắt thuật ngữ tiếng Anh “ Machine readable cataloguing” Thuật ngữ có nghĩa biên mục đọc máy ” khổ mẫu biên mục đọc máy dịch đầy đủ từ thuật ngữ Machine readable cataloguing format Theo giáo trình tin học hoạt động thơng tin thư viện PGS.TS Đồn Phan Tân khổ mẫu MARC định nghĩa mơ tả có cấu trúc riêng, dành riêng cho liệu đưa vào máy tính điện tử *Vai trị Trong vài thập niên qua MARC trở thành cộng cụ thiếu hoạt động biên mục tự động Dó cơng cụ cần thiết để chuẩn hóa biên mục, chuẩn hóa việc tổ chức lưu trữ liệu Những dẫn khổ mẫu MARC dấu hiệu quy ước giúp chương trình đọc biểu ghi xử lý liệu yêu cầu, MARC xếp trình bày theo quy tắc định, đảm bảo khả truy nhập, lưu trữ liệu tìm tin máy tính Nghĩa khổ mẫu biên mục đọc máy xây dựng giúp thư viện xây dựng CSDL tư liệu thư viện, qua tạo nên bước chuyển biến lớn hoạt động quản lý tài liệu tra tim tài liệu Đây thành cơng lớn q trình ứng dụng cơng nghệ thơng tin cơng tác lưu trữ tìm kiếm tài liệu, gắn với q trình thực tự động hóa cơng tác biên mục q trình xử lý thơng tin Nếu trước công tác biên mục diễn cách thủ công nhiều thời gian biên mục cán thư viện phải đồng thời thể thông tin thư mục phiếu mô tả, đồng thời phải xử lý lại thơng tin để tạo lập thư mục nay, từ CSDL thông tin thư mục cần xử lý cập nhật lần, lưu trữ hình thức thơng tin mã hóa, mã sổ máy mà sử dụng cho nhiều mục đích khác Vì vậy, nói biên mục đọc máy giải kịp thời hạn chế: giảm bớt thao tác trùng lặp, tiết kiệm thời gian cho cán thư viện việc xử lý tài liệu, quản lý, phổ biến, trao đổi tài liệu Cụ thể MARC diễn đạt chi tiết thành tờ khai Worsheet, tờ khai thể trường cần nhập tin thông tin để nhập máy Khi có tờ khai Worsheet, cán thư viện đưa liệu mô tả vào khai hoạt động xử lý tiền máy Thông tin sau xử lý tiền máy nhập máy với chương trình tạo lập máy tính, thơng tin lưu giữ, hình, in ấn, tra cứu, cập nhật…theo yêu cầu thư viện, qua tạo bước thay đổi việc tìm kiếm tài liệu bạn đọc Bạn đọc có phương thức để tra tìm tài liệu nhanh chóng thuận lợi Hơn việc xây dựng CSDL cịn giúp thư viện trao đổi thơng tin thư mục, giới thiệu CSDL mạng thông tin trực tuyến, mở rộng không gian tra cứu cho bạn đọc, bạn đọc tra cứu tài liệu thông tin thư mục cần thiết mạng thông tin chung mạng Interet CSDL kết nối mạng Tóm lại khổ mẫu biên mục đọc máy MARC công cụ thiếu trình biên mục tự động Khổ mẫu cho phép máy tính xếp lựa chọn liệu biên mục theo quy tắc thống Nói cách khác MARC cho phép thư viện chuẩn hóa liệu biên mục, tích hợp trao đổi liệu, mở rộng phương thức tiếp cập tra tìm tài liệu thuận lợi Chính MARC phương tiện thích hợp nhanh chóng đưa thư viện xích lại gần 1.1.2 Khổ mẫu MARC21 Khổ mẫu MARC 21 thức đời từ năm 1997 Là khổ mẫu biên mục đời sau, song chất MARC 21 không thay đổi , bước phát triển khổ mẫu MARC Năm 1964, Thư viện Quốc hội Mỹ bắt đầu triển khai dự án thử nghiệm MARC, nhằm phân phối hàng tuần băng đọc máy cho 16 thư viện chọn lọc Các thư viện xử lý băng đọc máy qua phương tiện thiết bị máy tính thân họ, với yêu cầu chung lúc sản xuất mục lục máy Năm 1967, dự án nối tiếp MARC II thực với tham gia ban đầu khoảng 50 thư viện đặt mua băng đọc máy Phương án MARC II thức đời vào năm 1968 đưa khái niệm quan trọng trao đổi liệu vật mang tin từ tính Cùng năm đó, Thư mục Quốc gia Anh bắt đầu hoạt động sau phát triển hệ thống MARC Anh băng đọc máy phân phối cho thư viện năm 1969 MARC II khắc phục số hạn chế MARC I, làm cho khổ mẫu biểu ghi linh hoạt mềm dẻo MARC II sử dụng trường có độ dài thay đổi, biểu ghi chứa khối lượng thông tin lớn (6.000) ký tự số lượng đáng kể yếu tố liệu Ngồi thơng tin có mơ tả thư mục đầy đủ theo AACR2, cịn có thêm nhiều trường ký hiệu phân loại thập tiến Dewey ký hiệu phân loại Thư viện Quốc hội Mỹ(LCC), số chủ đề,… Tất yếu tố sử dụng làm điểm truy cập (access point) MARC II dành chỗ cho thơng tin bổ sung có tính chất cục ký hiệu xếp giá phụ trạng vốn tài liệu thư viện cụ thể Khổ mẫu MARC sử dụng cho nhiều loại hình tài liệu như: sách, xuất phẩm nhiều kỳ, đồ, tài liệu điện tử,… MARC không thông dụng phạm vi hai nước Anh, Mỹ sử dụng với cải biên định nước như: Úc, Canada, Pháp, Đức, Ha Lan, Nhật, Nam Phi,… Sau chỉnh lý vào năm 1968, khổmẫu MARC sở cho đời hàng loạt khổ mẫu quốc gia CANMARC Canada, UKMARC Anh, INTERMARC Pháp, AUSMARC Úc, IBERMARC Tây Ban Nha, UNIMARC Hiệp hội Thư viện Thế giới (IFLA) soạn thảo, MARC Mỹ gọi USMARC,… Năm 1997, Thư viện Quốc hội Mỹ Thư viện Quốc gia Canada thống USMARC CANMARC để tạo thành MARC 21 (Format MARC for 21st century - khổ mẫu MARC dùng cho kỷ 21) Từ đến nay, MARC 21 trở thành khổ mẫu tiếng sử dụng rộng rãi giới chuẩn quốc tế lĩnh vực thông tin – thư viện Một khối lượng khổng lồ biểu ghi theo MARC 21 lưu trữ trao đổi thông tin qua mục lục liên hợp Hoa Kỳ (800 triệu biểu ghi), mạng OCLC (50 triệu biểu ghi), Thư viện Quốc hội Hoa Kỳ(20 triệu biểu ghi) Hầu hết hệ quản trị thư viện lớn nhỏ thị trường sử dụng MARC 21 lựa chọn chủ yếu Mới hệ thống ISSN quốc tế định sử dụng MARC 21 làm sở để biên mục trao đổi liệu xuất phẩm định kỳ phạm vi toàn cầu Hai nhóm chịu trách nhiệm MARC 21 là: - Uỷ ban Thông tin Thư mục Đọc máy (Machine Readable Bibliographic Information committee – MARBI) ALA - Uỷ ban Tư vấn MARC: gồm đại diện thư viện quốc gia, tổ chức thư mục, nhóm cung cấp dịch vụ sản phẩm (bán hàng) Cùng năm 1997, Thư viện quốc hội Mỹ ban hành tài liệu “MARC 21 – Những đặc tả cho cấu trúc biểu ghi, mã ký tự phương tiện trao đổi” Cơ quan ban hành Văn phòng Phát triển mạng chuẩn MARC (Office of Network development and MARC standard) MARC 21 gồm phần hoàn chỉnh hỗ trợ bổ sung lẫn để hồn chỉnh việc biên mục kiểm sốt liệu: - MARC 21 format for classification data: khổmẫu MARC 21 cho liệu phân loại - MARC 21 format for holdings data: khổmẫu MARC 21 cho dữliệu vốn tài liệu - MARC 21 format for community information: khổmẫu MARC 21 cho thông tin cộng đồng - MARC 21 Format for Bibliographic Data (khổ mẫu MARC 21 cho liệu thư mục, phần nước ta tiến hành ứng dụng) - MARC 21 Format for Community Information (khổ mẫu MARC 21 cho thơng tin cộng đồng) Ngồi cịn có tài liệu hỗ trợ khác như: - MARC 21 code list for countries: danh mục mã nước - MARC 21 code list for geographic: danh mục mã khu vực địa lý - MARC 21 code list for languages: danh mục mã ngôn ngữ - MARC 21 code list for organization: danh mục mã tổ chức - MARC 21 code list for relators, sources and descriptive conventions: danh mục mã cho yếu tố liên quan, nguồn quy ước mô tả - MARC 21 specifications for record structure, character sets and exchange media: đặc tả cấu trúc biểu ghi, chuỗi ký tự phương tiện trao đổi Bên cạnh MARC 21 khơng ngừng mở rộng phạm vi ứng dụng liên kết Mặc dù thành phần MARC 21 có thêm nhiều thành viên khổ mẫu thư mục MARC 21 giữ ngun vai trị chủ đạo Khổ mẫu có cấu trúc hồn thiện, có ưu điểm đặc điểm bật thu hút quan tâm cộng đồng thư viện giới nói chung thư viện Việt Nam nói riêng Để ln giữ vai trị khổ mẫu trao đổi có tính chất quốc tế kỷ 21, MARC 21 ln có thay đổi hồn thiện Trong trình phát triển, MARC 21 xác định cho tiêu chí riêng để phát triển, là: - Đảm bảo mục đích khổ mẫu: chuẩn để trình bày trao đổi thơng tin, không áp đặt chuẩn lưu trữ liệu bên hệ thống chuẩn trình bày liệu, việc trình bày liệu quy định riêng hệ thống riêng biệt sử dụng MARC 21 - Cấu trúc khổ mẫu: đảm bảo thành phần cấu trúc biểu ghi, định nội dung nội dung liệu, ứng dụng chuẩn quốc gia Mỹ ANSIZ39.2, ISO 2709, AACR2 - Thông tin lưu trữ biểu ghi: thông tin lưu trữ biểu ghi MARC lưu trữ dạng ký tự ASCH Biểu ghi trao đổi mã hóa theo ký tự bảng mã ASCH mở rộng Những nguyên tắc đảm bảo cho MARC 21 phát triển mà đảm bảo tính thống khơng khả tương thích 1.2 Cấu trúc khổ mẫu MARC 21 Biểu ghi MARC 21 gồm thành phần , xây dựng theo tiêu chuẩn quốc gia Mỹ quy định MARC 21 thể cụ thể phần biểu ghi Phần I: cấu trúc biểu ghi - Đầu biểu - Danh mục Các trường điều khiển - Các trường Các trường liệu Phần II: Chỉ định nội dung Bao gồm ký tự quy ước chức thông tin kiện: Trường mã trường Chỉ định Các dấu hiệu phân cách Chỉ thị thực yêu cầu Phần III: Nội dung liệu biểu ghi Nội dung liệu biểu ghi thông tin cung cấp từ tài liệu, thông qua tờ khai Worsheet nhập máy Khi thông tin đưa vào máy thông tin mã hóa Ký hiệu mã hóa MARC 21 bao gồm chữ cái, chữ số ký tự quy ước Bản chất biểu ghi MARC thiết kế mà theo liệu xếp, biểu diễn theo quy tắc định, đảm bảo khả truy nhập, xuất hay lưu trữ liệu tìm liệu máy tính điện tử Ngồi MARC 21 cịn có hệ thống bảng mã hóa ký hiệu xây dựng theo tiêu chuẩn quốc tế có tính chất sử dụng thống nhất, kế thừa phát triển từ USMARC bao gồm: - Bảng mã tên quốc gia - Bảng mã khu vực địa lý - Bảng mã ngôn ngữ số bảng định danh khác… 1.2.2 Cấu trúc biểu ghi MARC 21 Một biểu ghi MARC 21 thường có phần chính: đầu biểu, danh mục trường Đầu biểu (leader) Đầu biểu biểu ghi MARC 21 bao gồm phần tử cho phép chương trình xử lý phần lại biểu ghi (thư mục, trường…) Đầu biểu chuỗi liên tục gồm 24 ký tự ứng với 24 vị trí, vị trí gán cho ý nghĩa xác định thể mã (chữ in thường, chữ số khoảng trống) cho ta biết thông tin trạng thái thuộc tính biểu ghi: Vị trí 00 - 04 : Độ dài biểu ghi: Độ dài biểu ghi số lượng ký tự toàn biểu ghi, kể ký hiệu kết thúc trường kết thúc biểu ghi Do có vị trí, độ dài tối đa biểu ghi 99999 Dữ liệu thường máy tính tự động chuẩn bị liệu để trao đổi Vị trí 05 : Trạng thái biểu ghi: Sử dụng mã sau để thị tình trạng biểu ghi sau: c = Biểu ghi sửa đổi (corrected record) d = Biểu ghi bị xóa (deleted record) n = Biểu ghi (new record) Vị trí 06 : Loại biểu ghi a = Văn (bao gồm tài liệu in, vi phim, vi phiếu, điện tử đọc dạng chữ viết) c = Bản nhạc in d = Bản nhạc viết tay e = Tài liệu đồ in f = Tài liệu đồ vẽ tay g = Tài liệu chiếu hình hay video ( phim cuộn, phim đèn chiếu (slide), giấy chiếu trong, phim nhựa, băng đĩa ghi hình…) i = Băng đĩa ghi âm nhạc (như ghi âm phát biểu, tiếng nói…) j = Băng đĩa ghi âm nhạc k = Tài liệu đồ họa hai chiều (ảnh, vẽ thiết kế,…) l = Tài liệu điện tử, tài liệu tên nguồn điện tử m = Tài liệu đa phương tiện (multimedia) o = Bộ tài liệu (kit), chứa tập hợp chứa nhiều thành phần dạng khác p = Tài liệu hỗn hợp r = Vật thể nhân tạo hình khối, vật chế tác đồ vật ba chiều tự nhiên t = Bản thảo viết tay Vị trí 07: Cấp thư mục a = Cấp phân tích (Analytic): Biểu ghi tài liệu mô tả nằm tài liệu khác: Bài trích từ tuyển tập báo chí m = Cấp chuyên khảo (Monographic): Biểu ghi sách tập hay nhiều tập s = Cấp xuất nhiều kỳ (serial): Biểu ghi tạp chí, báo, niên giám, tùng thư 1XX Tiêu đề mơ tả 2XX Nhan đề, lần xuất bản, địa xuất 3XX Mô tả vật lý 4XX Thông tin tùng thư 5XX Phụ 6XX Các tiêu đề bổ sung theo chủ đề 7XX Các tiêu đề bổ sung khác 8XX Các tiêu đề bổ sung tùng thư Các trường liệu chứa thông tin mô tả thư mục xây dựng chi tiết sở tuân theo quy tắc biên mục ISBD AACR2 Các thông tin thư mục khổ mẫu MARC 21 chi tiết hơn, cụ thể phong phú nội dung thông tin ISBD Dưới phần trích trường liệu 300 - Mô tả vật lý Chỉ thị: hai đề khơng xác định thị dùng dấu # Mã trường con: $a Số trang (R) $b Các mô tả vật lý khác (NR) $c Khổ (R) $e Tài liệu kèm theo (NR) $f Dạng đơn vị tài liệu kèm theo (R) $g Cỡ đơn vị (R) Ví dụ: 300 ## $a144p ;$c23 cm 300 ## $a1 score (16 p.) ;$c29 cm 300 ## $a11v :$bill ;$c24 cm 300 $c12 in ## $a1 sound disc (20 min.) :$banalog, 33 1/3 rpm, stereo ; - Trong đó, nhãn trường 300 với tên trường Physical Description - mô tả vật lý - Kí hiệu R Repeatable lặp - có nghĩa trường xuất lần biểu ghi - Trường quy mơ tài liệu ví dụ trang, có minh hoạ hay khơng (R) Trường dùng cho tài liệu kèm lặp (NR) Trong khổ mẫu MARC 21 không liệu chi tiết mà nội dung liệu nhập để xử lý thông tin thư mục quy định chặt chẽ Hơn trường có quy định thị trường Ví dụ: Trường 440: Tùng thư/ tiêu đề bổ sung nhan đề Trường sử dụng thông tin tùng thư trùng khớp tiêu đề mô tả bổ sung tùng thư Đối với số hệ thống, trường bao gồm ISSN xuất thông tin tùng thư, mà hệ thống tự động bỏ qua tiêu đề tùng thư Chỉ thị: Chỉ thị không xác định Chứa đựng ký tự trống # Chỉ thị thứ 2: Các ký tự bắt đầu không xếp Số lượng ký tự bắt đầu không xếp Các trường con: $a Nhan đề $n Số phần tác phẩm $p Tên phần tác phẩm $v Số tập/định danh $x ISSN (NR) Trường 490: Tùng thư (R) Được sử dụng thông tin tùng thư không giống với tiêu đề bổ sung tùng thư, có thơng tin tùng thư phần mơ tả nội dung, khơng địi hỏi phải làm tiêu đề bổ sung tùng thư Trường 600: Tiêu đề mô tả bổ sung theo chủ đề- tên người (R) Mô tả theo tên chủ đề dẫn tố tên cá nhân Chỉ thị thứ nhất: dạng tên làm dẫn tố Tên thánh Tên riêng Họ Chỉ thị thứ hai: hệ thống đề mục chủ đề/ từ điển từ chuẩn Đề mục chủ đề TVQH Mỹ Đề mục chủ đề TVQH Mỹ dành cho tài liệu thiếu nhi Đề mục chủ đề y học … Mã trường con: $a Tên người $b Số thứ tự $c Tước hiệu chức vụ kèm $d Năm có liên quan … Nhìn chung trường có quy định cụ thể nội dung biên mục nhập liệu kết thúc trường khổ mẫu MARC 21 có ký hiệu kết thúc trường mã kết thúc trường thơng báo cho máy tính điểm kết thúc máy tính nhận diện liệu xác Riêng khối trường 9XX thông tin nội xây dựng tùy thuộc vào CSDL quy định đơn vị thư viện sử dụng Các khối trường chứa thông tin như: người biên mục, ngày nhập tin, người hiệu đính, chỉnh sửa…Các loại khổ mẫu MARC 21 tuân thủ cấu trúc này, có khác đối tượng biên mục mục đích kiểm soát liệu khổ mẫu MARC 21 *Một số bảng mã hóa ký hiệu phụ trợ cho MARC 21 BẢNG MÃ MỘT SỐ QUỐC GIA THEO CHUẨN MARC 21 ag Achentina bu Bulgary at Australia br Miến điện au Áo cb Campuchia ay Nam cực xxc Canađa bg Bănglađét cc Trung Quốc be Bỉ ch Trung Hoa (cộng hồ ) bn Bosnia Hexegơvina ci Croatia dk Đan Mạch cu Cuba ua Ai cập sr Cộng hoà Séc enk Anh pl Ba Lan fj Fiji po Bồ Đào Nha fi Phần Lan rm Rumani fr Pháp ru Liên bang Nga gw Đức si Singapo gr Hy Lạp xo Slovakia hu Hungary sa Nam Phi ii Ấn Độ ce Sri Lanka io Inđônêxia ne Hà Lan ie Ai len nz Niu zi Lân is Ixraen xx it Italia sw ja Nhật sz Thuỵ sĩ kn Bắc Triều Tiên th Thái Lan ko Hàn Quốc xxu Hoa Kỳ ls Lào vp Các nơi khác lv Latvia Việt Nam li Lithuania yu Nam Tư xn Maxedonia my Malaixia mm Malta Chưa biết chưa xác định Thuỵ Điển BẢNG MÃ KHU VỰC THEO CHUẨN MARC 21 a Châu Á cl Mỹ La tinh a-ab Bănglađét d Các nước phát triển a-bn Borneo e Châu Âu a-br Miến Điện e-fr Pháp a-bt Bhutan e-gr Hy lạp a-bx Brunây e-gx Đức a-cb Campuchia e-it Italia a-cc Trung Quốc e-ne Hà Lan a-cc-hk Hồng Kông (TQ) e-ru Liên Bang Nga a-ce Sri lanka e-sp Tây Ba Nha a-ch Đài Loan e-sw Thuỵ Điển a-li Ấn Độ e-sz Thuỵ Sỹ a-io Inđônêxia e-uk Vương quốc Anh a-ja Nhật Bản e-uk-en Anh a-ko Nam Triều Tiên ec Trung Âu a-kr Hàn Quốc ee Đông Âu a-ls Lào ew Tây Âu a-my Malaixia f Châu phi a-ph Phi lippin f-ke Kênya a-pk Pakistan f-nr Nigênia a-pp Tân ghi nê f-sa Nam Phi a-si Singapo f-tz Tanzania a-th Thái Lan f-ua Ai Cập a-vt Việt Nam fw Tây Phi ae Đông Nam Á i Ấn Độ Dương af Vịnh Thái lan ma Các nước A rập ag Sông Mêkông n Bắc Mỹ Đông Dương n-cn Canađa am Malaya n-us Hoa Kỳ as Đông nam nc Trung mỹ az Nam Á p Thái Bình Dương b Các nước liên hiệp Anh po Châu Đại Dương s Nam Mỹ w Các vùng nhiệt đới t Nam cực xa Đông bán cầu u Australasia xb Bắc bán cầu u-at Australia xc Nam bán cầu n-nz Niu zi lân xd Tây bán cầu BẢNG MÃ NGÔN NGỮ THEO CHUẨN MARC 21 afr Tiếng châu phi khm Tiếng khơ me alb Tiếng Anbani kor Tiếng Triều tiên ara Tiếng A rập lao Tiếng Lào arc Tiếng xyri lat Tiếng Latinh arm Tiếng Acmêni lav Tiếng Latvi (vùng Ban bel Tiếng Bê rut lit Tiếng Lituani ben Tiếng Băng gan mac Tiếng Maxêđôni bul Tiếng Bungary may Tiếng Mã lai cat Tiếng Catalan mul Tiếng đa ngôn ngữ chi Tiếng Trung quốc nor Tiếng Nauy cze Tiếng Séc pan Tiếng panabi dan Tiếng Đan mạch per Tiếng Ba tư tích) dut Tiếng Hà lan pol Tiếng Ba Lan egy Tiếng Ai cập por Tiếng Bồ Đào Nha eng Tiếng Anh rum Tiếng Rumani enm Tiếng Anh trung rus Tiếng Nga est Tiếng estoni san Tiếng Phạn fij Tiếng Fiji sco Tiếng Scốt len fin Tiếng Phần lan slo Tiếng Slôvác fre Tiếng Pháp slv Tiếng Xlôven geo Tiếng Goergi spa Tiếng Tây Ba Nha ger Tiếng Đức srd Tiếng Thuỵ Điển grc Tiếng Hy lạp cổ tgl Tiếng Tagalog gre Tiếng Hy lạp đại tam Tiếng Tamin heb Tiếng Hê brơ (Do thái cổ) tha Tiếng Thái hin Tiếng Hindi tib Tiếng Tây tạng hun Tiếng Hungary tur Tiếng Thổ nhĩ kỳ ice Tiếng Ailen ukr Tiếng Ukraina ind Tiếng Inđônêxia urd Tiếng Hinđu (pakistan) ita Tiếng Ý vie Tiếng Việt Nam jpn Tiếng Nhật yid Tiếng I dít (Đức cổ) 2.3 Những đặc trưng MARC 21 Trong bối cảnh mà khoa học công nghệ phát triển không ngừng với gia tăng tài liệu, thơng tin nhanh chóng hết biên mục đọc máy trở thành yêu cầu tất yếu thư viện toàn giới nhờ có biên mục đọc máy mà hoạt động tự động hóa việc lưu trữ tìm kiếm thơng tin diễn dễ dàng nhanh chóng Để đáp ứng đòi hỏi thư viện, khổ mẫu biên mục khơng ngừng thay đổi có hoàn thiện khổ mẫu USMARC cố hồn thiện vượt khn khổ khổ mẫu quốc gia, đường thay đổi để trở thành khổ mẫu trao đổi chung quốc tế, USMARC CANMARC tạo MARC 21 MARC 21 mang đặc trưng bản: Thứ nhất, MARC 21 xây dựng dựa USMARC nên chất khơng thay đổi, nói MARC 21 đổi tên USMARC có điều loại bỏ số trường lạc hậu thêm vào số trường định phù hợp Thư viện QH Mỹ xây dựng MARC 21 với mục đích trở thành khổ mẫu biên mục đọc máy chung cho kỷ 21, MARC 21 nhận bảo trợ tuyệt đối quan thông tin thư viện hàng đầu giới như: ủy ban thư mục đọc máy MARBI (Machine Readable Bibliorgraphic Information Commttee) ủy ban tư vấn MARC (MARC Advisory commttee) Chính bảo trợ làm sở đảm bảo cho tính lâu dài ổn định khổ mẫu MARC 21 phát huy tất đặc tính ưu việt USMARC khơng ngừng mở rộng để trở thành khổ mẫu phạm vi toàn cầu Thứ hai, MARC 21 có khả biên mục linh hoạt cho nhiều loại hình khác thư viện( với mã quy định) bao gồm: - BK (book): sách, tài liệu chuyên khảo dạng văn CF (computer files): tệp tin máy tính MP (map): đồ MU(music): nhạc SE (continuing resource): xuất phẩm nhiều kỳ VM (visual materials): tài liệu trực quan AV (mixed materials): tài liệu hỗn hợp Thứ ba, trường MARC 21 sử dụng nhiều trường thị rõ ràng, trường điều khiển trường có độ dài cố định, trường số tất trường cịn lại điều khiển nhận dạng liệu sở thị trường Đây đặc trưng bật MARC 21 cho phép việc quản lý liệu cách cụ thể, độc lập tương đối việc truy cập tới vùng, nội dung cụ thể dễ dàng hơn, nhiên hạn chế đến q trình xử lý thông tin Thứ tư, MARC 21 xây dựng với chức khổ mẫu trao đổi thông tin, nên áp dụng chuẩn cho câu trúc biểu ghi là: khổ mẫu trao đổi thông tin ANSIZ39.2, chuẩn tương hợp với ISO 2709 (chuẩn áp dụng cho UNIMARC) Ngồi MARC 21 cịn có hệ thống bảng trợ ký hiệu hỗ trợ đầy đủ như: - MARC 21 Format for Authory Data (khổ mẫu MARC 21 cho liệu tác giả) - MARC 21 Format for Bibliographic Data (khổ mẫu MARC 21 cho liệu thư mục, phần nước ta tiến hành ứng dụng) - MARC 21 Format for Classification for Data (khổ mẫu MARC 21 dành cho liệu phân loại) - MARC 21 Format for Community Information (khổ mẫu MARC 21 cho thông tin cộng đồng) - MARC 21 Format for Holdings Data (khổ mẫu MARC 21 cho liệu vốn tư liệu) - USMARC code list for organization (danh mục tổ chức) - USMARC code list for relator, sources, and descriptive conventions( danh mục mã cho yếu tố liên quan, nguồn quy ước mô tả) CHƯƠNG 2: MARC XML 2.1 Tổng quan XML Ngày mà công nghệ thông tin phát triển mạnh mẽ u cầu trao đổi thơng tin khơng cịn dừng lại dạng thư tịch mà cấp cao hình ảnh, hình ảnh động, âm thanh, điện tử…và MARC đảm đương dạng cao cấp Vì XML đời thực sứ mệnh Vậy XML gì? XML (Xtensible Markup Language): ngôn ngữ tạo cấu trúc liệu văn phát triển từ đầu năm 1996 dựa theo tận dụng điểm mạnh chuẩn SGML (Standard Generalized Markup Language: coi siêu ngơn ngữ có khả sinh ngơn ngữ khác), kinh nghiệm có từ ngơn ngữ HTML (HyperText Markup Language) SGML phát triển cho việc định cấu trúc nội dung tài liệu điện tử tổ chức ISO (International Organization for Standardization) chuẩn hóa năm 1986 SGML IBM đưa phát triển W3C (World Wide Web Consortium: tổ chức độc lập định tiêu chuẩn cho định dạng Web, máy chủ ngôn ngữ), đặc tả XML lại Netscape, Microsoft thành viên dự án Text Encoding Intiative (TEI) xây dựng Tổ chức W3C XML Special Interest Group có đại diện từ 100 công ty nhiều chuyên gia mời khác W3C thức thơng qua chuẩn XML vào tháng 2/1998 XML hệ thống có luật dùng cho việc thiết kế khổ mẫu (format) cho văn giúp tạo cấu trúc cho liệu Trong thực tế XML ngôn ngữ lập trình, XML giúp máy tính dễ dàng tạo liệu, đọc liệu, trao đổi liệu làm cho cấu trúc liệu trở nên rõ ràng dễ hiểu hơn, ngồi XML cịn mở rộng, có tảng hồn tồn độc lập hỗ trợ tính quốc tế hóa, nội địa hóa XML hỗ trợ hồn tồn unicode Trong thực tế thân ngơn ngữ XML có nguồn gốc giống ngơn ngữ định dạng siêu văn HTML (HyperText Markup Language) từ chuẩn ngơn ngữ định dạng văn tổng qt có cấu trúc SGML Mỗi văn XML sử thẻ (tags), từ đặt ngoặc với ‘’ (mở đóng) dùng thuộc tính tên gọi phần tử (element) với mẫu name= “value” Trong HTML đặc biệt ý tới thẻ (tag) thuộc tính (attribute) có ý nghĩa phần văn thẻ hiển thị trình duyệt XML sử dụng thẻ để phân định ranh giới đoạn liệu coi việc đọc xử lý liệu hoàn toàn nhiệm vụ ứng dụng Nhưng khác với ngôn ngữ HTML, số lượng tên gọi phần tử XML không hạn chế XML văn không giống với loại văn thơng thường mà ta đọc Các chương trình dùng để tạo liệu cấu trúc hóa thơng thường lưu liệu đĩa cứng, sử dụng khuôn dạng text hay nhị phân Một thuận lợi khuôn dạng văn cho phép người đọc đọc với soạn thảo văn tùy thích Các khn dạng văn cho phép tìm lỗi dễ dàng ứng dụng Giống HTML file XML file văn tạo với mục đích đề đọc, đọc thấy cần thiết Tuy nhiên XML có điểm khơng HTML, luật dùng XML hạn chế, cần qn thẻ, hay thuộc tính khơng kèm với nội dung làm cho toàn file XML ngừng hoạt động, lỗi file HTML bỏ qua XML xem ngơn ngữ mạnh HTML mang lại thông tin đầy đủ liệu XML cung cấp “siêu liệu” metadata hay gọi “dữ liệu liệu” (data about data) XML cho phép nhà phát triển quản trị công nghệ thơng tin mơ tả thơng tin có liên quan tới nguồn thông tin khác Đây phương pháp khai thác thông tin lý tưởng môi trường trao đổi thông tin từ máy chủ ứng dụng từ ứng dụng với Cấu trúc chặt chẽ XML (nội dung đặt thẻ metadata) cho phép ứng dụng dễ dàng tìm kiếm sử dụng nội dung tạo Môi trường tài liệu XML trở thành kho liệu hỏi-đáp (query data repository) tương tự sở liệu Ngôn ngữ XML giải pháp tích hợp cho vấn đề trao đổi liệu tự động kho thông tin mạng Internet Ưu điểm XML - Dữ liệu độc lập ưu điểm XML Do XML dùng để mô tả liệu dạng text nên tất chương trình đọc XML - Dễ dàng đọc phân tích liệu, nhờ ưu điểm mà XML dùng để trao đổi liệu chương trình - Dễ dàng để tạo file XML - Lưu trữ cấu hình cho web site - Sử dụng cho phương thức Remote Procedure Calls (RPC) phục vụ web service Cấu trúc XML Gồm phần: - Document Prolog: lưu trữ metadata XML gồm phần: khai báo XML khai báo kiểu liệu XML Phần khai báo XML (XML declararion) bao gồm thông tin version XML, charset, encoding… Phần khai báo kiểu liệu XML (DTD) dùng để khai báo cấu trúc thẻ dùng XML - Root element hay gọi Document Element: chứa tất phần tử nội dung phần tử XML phải có thẻ mở thẻ đóng Cú pháp XML cho phần tử: nội dung Ví dụ: ?xml version="1.0" encoding="utf-8" standalone="yes"?> 2002-6-14 Helen Mooney 1 2 4 1 2.2 MARC -XML Tại lại gọi MARC- XML? Như biết, chuẩn phiếu mục lục 3x5 inch chuẩn MARC hai cổ thụ mang đến vinh quang lớn lịch sử biên mục học giới Nhưng theo quy luật, phải thay cũ Sự suy tàn hai đánh dấu hai mốc phát triển quan trọng lịch sử biên mục: - Khi máy tính đời – hệ thống mục lục máy tính trực tuyến thay cho hệ thống mục lục phiếu; - Khi bùng nổ việc sử dụng thơng tin điện tử hay xác thư viện số đời – biểu ghi mục lục số hóa, tài liệu số hóa địi hỏi truy cập qua hệ thống mục lục Khi chuyển từ hệ thống mục phiếu sang hệ thống mục lục máy tính, người ta khơng muốn phải dứt bỏ tủ phiếu mà ta dày công tạo dựng từ năm sang năm khác mà viện đủ lý để giữ lại, nhiều lúc tỏ thừa Ngoài nhiều thư viện phải giữ lại tủ phiếu chưa hồi cố hết số sách kho chuyển sang tin học hóa, chẳng hạn Thư viện đại học lớn nước Mỹ Harvard Thư viện đại học Cambgidge nước Anh sử dụng tủ phiếu để tra cứu tài liệu cũ Ngay Thư viện Quốc hội Hoa kỳ có tòa đại sảnh để chứa hàng trăm tủ phiếu mục lục để ghi nhớ thời vinh quang Ngày số phận MARC tương tự Ngoại trừ cách giải quyết liệt Thư viện Quốc gia Y học từ bỏ MARC chuyển hẳn 10 triệu biểu ghi sang XML từ năm 2001, thư viện lớn khác kể Thư viện Quốc hội Hoa Kỳ theo đường nước đơi, phần lớn lý kinh phí nên họ sử dụng MARC cho biểu ghi thư tịch kèm theo metadata Điều áp dụng cho tất MARC kể MARC 21, có tên MARC-XML hay MARC 21-XML Một cách khách quan, hình dung MARC-XML hai cổng nhà Cổng MARC kèm theo giao thức Z39.50 cổng sử dụng từ trước đến để trao đổi biểu ghi thư tịch – hay nói cách khác thơng tin dạng thư tịch cổng XML trao đổi tất dạng thơng tin Cổng XML trở thành cổng chuẩn hóa để trở thành tiêu chuẩn cho tất nhà Chiếc cổng MARC trở thành cổng phụ, dùng để tiếp nối việc trao đổi bên ngồi với thơng tin dạng thư tịch, giống có hệ thống máy tính người ta giữ lại tủ phiếu có người chưa thích nghi với cách tra cứu máy tính họ thích dùng tủ phiếu Mơ hình kiến trúc MARC – XML (Có thể chuyển đổi MARC 21(2709) sang/từ khổ mẫu MARC 21( XML) XML khác) ... CANMARC Canada, UKMARC Anh, INTERMARC Pháp, AUSMARC Úc, IBERMARC Tây Ban Nha, UNIMARC Hiệp hội Thư viện Thế giới (IFLA) soạn thảo, MARC Mỹ gọi USMARC,… Năm 1997, Thư viện Quốc hội Mỹ Thư viện. .. USMARC CANMARC tạo MARC 21 MARC 21 mang đặc trưng bản: Thứ nhất, MARC 21 xây dựng dựa USMARC nên chất khơng thay đổi, nói MARC 21 đổi tên USMARC có điều loại bỏ số trường lạc hậu thêm vào số trường... ghi thư tịch kèm theo metadata Điều áp dụng cho tất MARC kể MARC 21, có tên MARC- XML hay MARC 21- XML Một cách khách quan, hình dung MARC- XML hai cổng nhà Cổng MARC kèm theo giao thức Z39.50 cổng