1. Trang chủ
  2. » Thể loại khác

TIÊU CHUẨN VIỆT NAM : QUẢN LÝ TÀI LIỆU - ĐỊNH DẠNG TỆP TÀI LIỆU ĐIỆN TỬ CHO BẢO QUẢN LÂU DÀI PHẦN 1: SỬ DỤNG PDF 1.4 (PDF/A-1)

37 4 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Nội dung

TCVN T I Ê U C H U ẨN Q U Ố C G I A TCVN xxxx-1:202x ISO 19005-1:2005 Xuất lần Dự thảo QUẢN LÝ TÀI LIỆU - ĐỊNH DẠNG TỆP TÀI LIỆU ĐIỆN TỬ CHO BẢO QUẢN LÂU DÀI PHẦN 1: SỬ DỤNG PDF 1.4 (PDF/A-1) Document management - Electronic document file format for long-term preservation Part 1: Use of PDF 1.4 (PDF/A-1) HÀ NỘI - 202X TCVN xxxx-1:202x Mục lục Trang Lời nói đầu Lời giới thiệu Phạm vi áp dụng Tài liệu viện dẫn Thuật ngữ định nghĩa Ký hiệu 10 Cấp độ phù hợp 11 5.1 Tổng quan 11 5.2 Phù hợp cấp độ A 11 5.3 Phù hợp cấp độ B 11 5.4 Trình đọc phù hợp 11 6.Yêu cầu kỹ thuật 12 6.1 Cấu trúc tệp 12 6.2 Đồ họa 14 6.3 Phông chữ 16 6.4 Độ suốt 19 6.5 Chú giải 19 6.6 Hành động 20 6.7 Siêu liệu 20 6.8 Cấu trúc logic 26 6.9 Mẫu tương tác 29 Phụ lục A (Tham khảo) Tóm tắt phù hợp PDF/A-1 30 Phụ lục B (Tham khảo) Thực hành tốt cho PDF/A 34 Thư mục tài liệu tham khảo 36 TCVN xxxx-1:202x Lời nói đầu TCVN xxxx-1:202x hồn tồn tương đương với ISO 19005-1:2005 TCVN xxxx-1:202x Thư viện Quốc gia Việt Nam biên soạn, Bộ Văn hóa, Thể thao Du lịch đề nghị, Tổng cục Tiêu chuẩn Đo lường Chất lượng thẩm định, Bộ Khoa học Công nghệ công bố Bộ TCVN xxxx:202x (ISO 19005) Quản lý tài liệu - Định dạng tệp tài liệu cho bảo quản lâu dài bao gồm phần: - TCVN xxxx-1:202x (ISO 19005-1:2005) Phần 1: Sử dụng PDF 1.4 (PDF/A-1); - TCVN xxxx-2:202x (ISO 19005-2:2011) Phần 2: Sử dụng ISO 32000-1 (PDF/A-2); - TCVN xxxx-3:202x (ISO 19005-3:2012) Phần 3: Sử dụng ISO 32000-1 với hỗ trợ cho tệp nhúng (PDF/A-3) - TCVN xxxx-4:202x (ISO 19005-4:2020) Phần 4: Sử dụng ISO 32000-2 (PDF/A-4) TCVN xxxx-1:202x Lời giới thiệu PDF định dạng số để trình bày tài liệu Các tệp PDF tạo nguyên mẫu PDF, chuyển dạng từ định dạng điện tử từ giấy, vi dạng, cứng khác Các doanh nghiệp, phủ, thư viện, quan lưu trữ, tổ chức cá nhân toàn giới sử dụng PDF để trình bày phần yếu nội dung thông tin quan trọng Phần lớn thông tin cần lưu giữ khoảng thời gian dài; số cần lưu trữ vĩnh viễn Những tệp PDF phải có khả sử dụng truy cập qua nhiều hệ công nghệ Việc sử dụng truy cập vào đối tượng tương lai phụ thuộc vào trì hình thức trực quan đặc tính bậc cao chúng, tính tổ chức logic trang, phần đoạn, dịng văn có khả tự khôi phục theo trật tự đọc tự nhiên, đa dạng quản lý, bảo quản mơ tả siêu liệu Tập đồn Adobe cơng khai đặc tả PDF Tuy nhiên, nhiều trường hợp, chất đặc trưng phong phú định dạng đòi hỏi phải bổ sung ràng buộc sử dụng nhằm phù hợp với việc bảo quản lâu dài tài liệu điện tử Mục đích phần ISO 19005 định nghĩa định dạng tệp dựa PDF, gọi PDF/A, cung cấp chế trình bày cho tài liệu điện tử theo cách thức bảo quản hình thức trực quan chúng theo thời gian, không phụ thuộc vào công cụ hệ thống sử dụng để tạo, lưu trữ kết xuất tệp Mục đích thứ hai phần ISO 19005 cung cấp khung tham chiếu ghi lại bối cảnh lịch sử tài liệu điện tử dạng siêu liệu bên tệp phù hợp Một mục đích khác phần ISO 19005 để định nghĩa khung trình bày cấu trúc logic thơng tin ngữ nghĩa khác tài liệu điện tử bên tệp phù hợp Những mục tiêu thực cách định danh thành phần PDF sử dụng được, hạn chế mẫu sử dụng chúng, tệp PDF/A phù hợp Tự thân, PDF/A không thiết phải đảm bảo hình thức trực quan nội dung phản ánh xác tài liệu nguồn ban đầu sử dụng để tạo tệp phù hợp; Ví dụ q trình tạo tệp phù hợp thay phông chữ, chỉnh sửa lại văn bản, giảm chất lượng ảnh sử dụng tính nén có tổn hao Các tổ chức cần đảm bảo tệp phù hợp biểu diễn xác tài liệu nguồn ban đầu cần đặt yêu cầu bổ sung trình tạo tệp phù hợp yêu cầu áp dụng phần ISO 19005 Ngoài ra, điều quan trọng tổ chức thực thi sách thực hành liên quan đến việc kiểm tra tệp phù hợp liên quan đến việc kiểm tra tệp phù hợp để có hình thức trực quan xác Phần ISO 19005 nên sử dụng phần cấu thành môi trường lưu trữ điện tử tổ chức để lưu giữ tài liệu lâu dài Việc thực thi thành công phần ISO 19005 cho mục đích lưu trữ phụ thuộc vào: - yêu cầu lưu giữ môi trường lưu trữ tổ chức, sách thủ tục quản lý hồ sơ định TCVN 7420-1:2004 (ISO 15489-1:2001), [4]; - yêu cầu điều kiện bổ sung cần thiết để đảm bảo tính tồn tài liệu điện tử đặc điểm chúng theo thời gian, bao gồm, không giới hạn ở, yêu cầu định nghĩa bởi: TCVN xxxx-1:202x ↓ ISO 14721; ↓ ISO/TR 15801, [10]; ↓ ISO/TR 18492, [12]; ↓ ISO 18509-1, [13] ; ↓ ISO 18509-2, [14]; - trình đảm bảo chất lượng cần thiết để xác minh phù hợp với yêu cầu điều kiện áp dụng; ví dụ: chế độ kiểm tra để xác minh chất lượng tính tồn vẹn liệu nguồn chuyển đổi Phần ISO 19005 quy định việc phát triển ứng dụng khác để đọc, kết xuất, ghi xác nhận tệp phù hợp Các ứng dụng khác kết hợp khả khác để chuẩn bị, diễn giải xử lý tệp phù hợp dựa nhu cầu mà nhà cung cấp ứng dụng nhận biết Tuy nhiên, điều quan trọng cần ý ứng dụng phù hợp phải có khả đọc xử lý thích hợp tất tệp tuân thủ cấp độ phù hợp định Tài liệu xem Phần ISO 19005 nhằm tạo phần tương lai, phần cung cấp khả tương thích với phiên tương lai đặc tả PDF mà không kết xuất tài liệu ứng dụng dựa PDF Phiên 1.4 lỗi thời Các thuật ngữ sau, đề cập đến đặc tả phần, khuyến nghị đề cập đến đặc tả tên ISO đầy đủ không sử dụng: - “PDF/A” - từ đồng nghĩa cho hệ thống tiêu chuẩn ISO 19005; - “PDF/A-1” - từ đồng nghĩa cho ISO 19005-1; - “PDF/A-1a” - từ đồng nghĩa cho ISO 19005-1 cấp độ phù hợp A; - “PDF/A -1b” - từ đồng nghĩa cho ISO 19005-1 cấp độ phù hợp B Phần ISO 19005, kết hợp với Tài liệu viện dẫn PDF Đặc tả XMP, tháng 1-2004, cung cấp đầy đủ thông tin để diễn giải tệp PDF/A phù hợp Tài liệu viện dẫn PDF chứa tuyên bố từ Tập đồn Adobe liên quan tới quyền sở hữu trí tuệ sẵn sàng cho phép sử dụng vĩnh viễn, miễn phí quyền, khơng độc quyền để thúc đẩy việc sử dụng PDF Adobe cung cấp cho ISO tuyên bố tương tự liên quan tới Đặc tả XMP Nói chung, sử dụng Tài liệu viện dẫn PDF Đặc tả XMP để tạo ứng dụng đọc, ghi xử lý tệp PDF/A theo cách khác Các khiếu nại sáng chế liên quan đến ứng dụng đọc, kết xuất, ghi xử lý tệp PDF/A theo cách khác nằm phạm vi phần ISO 19005 NPES AIIM (các tổ chức phát triển tiêu chuẩn cơng nhận) trì phiên liên tục ghi ứng dụng để hướng dẫn nhà phát triển người sử dụng phần ISO 19005 Những ghi ứng dụng có sẵn trang Cả NPES AIIM giữ lại tài liệu viện dẫn, tài liệu điện tử công khai, không thuộc tham chiếu dẫn ISO cụ thể phần ISO 19005 TIÊU CHUẨN QUỐC GIA TCVN xxxx-1:202x TCVN xxxx-1:202x Quản lý tài liệu - Định dạng tệp tài liệu điện tử cho bảo quản lâu dài - Phần 1: Sử dụng PDF 1.4 (PDF/A-1) Document management - Electronic document file format for long-term preservation Part 1: Use PDF 1.4 (PDF/A-1) Phạm vi áp dụng Phần ISO 19005 định sử dụng Định dạng Tài liệu Di động (PDF) 1.4 cho bảo quản lâu dài tài liệu điện tử Phần áp dụng cho tài liệu có chứa kết hợp liệu ký tự, raster vector Phần ISO 19005 không áp dụng cho: - trình cụ thể để chuyển đổi tài liệu giấy điện tử sang định dạng PDF/A; - thiết kế kỹ thuật cụ thể, giao diện người sử dụng, việc thực thi chi tiết hoạt động kết xuất; - phương pháp vật lý cụ thể để lưu trữ tài liệu chẳng hạn phương tiện điều kiện bảo quản; - yêu cầu phần cứng máy tính và/ hệ điều hành Tài liệu viện dẫn Các tài liệu viện dẫn sau cần thiết cho việc áp dụng tiêu chuẩn Đối với tài liệu có ghi năm cơng bố áp dụng nêu Đối với tài liệu không ghi năm cơng bố áp dụng phiên nhất, bao gồm sửa đổi, bổ sung (nếu có) ISO/IEC 646 Công nghệ thông tin - Bộ ký tự mã ISO bit để trao đổi thông tin CHÚ THÍCH 1: Mã hóa ký tự định nghĩa ISO/IEC 646 tương đương với ANSI X3.4 (ASCII) [5] ECMA-6 [6] ISO/IEC 9541-1, Công nghệ thông tin - Trao đổi thông tin phông chữ - Phần 1: Kiến trúc ISO/IEC 10646-1, Công nghệ thông tin - Bộ ký tự tổng hợp mã hóa nhiều octet (UCS) - Phần 1: Cấu trúc Mặt phẳng đa ngữ CHÚ THÍCH 2: Các giá trị mã ký tự định nghĩa ISO/IEC 10646-1 tương đương với giá trị mã Unicode [22] ISO 14721, Dữ liệu không gian hệ thống truyền thông tin - Hệ thống lưu trữ thơng tin mở - Mơ hình tham chiếu ISO 15930-4, Công nghệ đồ họa - Chuẩn bị trao đổi liệu số sử dụng PDF - Phần 4: Trao đổi toàn liệu CMYK in màu PDF 1.4 (PDF/X-1a) Định dạng ngày thời gian, Chú thích W3C, ngày 15 tháng năm 1997 Sẵn có Internet Bản đính cho tài liệu viện dẫn PDF, ấn lần thứ 3, ngày 18 tháng năm 2003 Sẵn có Internet Ngơn ngữ đánh dấu mở rộng (XML), 1.0 (Ấn lần thứ 3) Khuyến nghị W3C, ngày tháng năm 2004) Sẵn có Internet TCVN xxxx-1:202x ICC.1:1998-09, Định dạng tệp cho Hồ sơ Màu sắc, Liên minh Màu sắc Quốc tế Sẵn có Internet ICC.1A: 1999-04, Phụ lục Spec ICC.1: 1998-09, Liên minh Màu sắc Quốc tế Sẵn có Internet Tài liệu viện dẫn PDF: Định dạng tài liệu di động Adobe, phiên 1.4, Tập đoàn Adobe - ấn lần thứ (ISBN 0-201-75839-3) Sẵn có Internet RDF/XML Đặc tả Cú pháp (đã sửa đổi), Khuyến nghị W3C, ngày 10 tháng năm Sẵn có Internet Thẻ định danh ngôn ngữ, RFC 1766, tháng năm 1995 Sẵn có Internet Đặc tả XMP, tháng năm 2004, Tập đồn Adobe Sẵn có Internet CHÚ THÍCH 3: AIIM NPES (các tổ chức phát triển tiêu chuẩn công nhận) trì tài liệu viện dẫn khơng phải ISO, tài liệu điện tử công khai Thuật ngữ định nghĩa Trong tiêu chuẩn sử dụng thuật ngữ định nghĩa sau 3.1 Cấp độ phù hợp (Conformance level) Bộ nhận dạng hạn chế yêu cầu mà tệp trình đọc phải tuân thủ [ISO 15930-4] 3.2 Bảng đối chiếu (Cross reference table) Cấu trúc liệu PDF chứa độ lệch byte phần bắt đầu đối tượng gián tiếp tệp 3.3 Từ điển (Dictionary) Bảng tập hợp chứa cặp khóa-giá trị, định tên giá trị thuộc tính cho đối tượng, thường sử dụng để thu thập kết hợp thuộc tính đối tượng phức tạp với [ISO 15930-4] 3.4 Tài liệu điện tử (Electronic document) Biểu diễn điện tử tập hợp định hướng trang liệu văn bản, đồ họa siêu liệu hữu ích để định danh, hiểu kết xuất liệu đó, in lại giấy vi dạng quang học mà không làm nội dung thông tin 3.5 Dấu cuối tệp tin (End-of-file marker) Chuỗi năm ký tự %% EOF đánh dấu phần cuối tệp PDF TCVN xxxx-1:202x 3.6 Dấu cuối dòng (End-of-line marker) Dấu hết dòng EOL (EOL marker) Một hai chuỗi ký tự đánh dấu kết thúc dòng văn bản, bao gồm ký tự CARRIAGE RETURN (oDh) ký tự LINE FEED (oAh) ký tự CARIAGE RETURN theo sau ký tự LINE FEED 3.7 Phông chữ (Font) Bộ sưu tập nhận dạng đồ họa chữ tượng hình phần tử đồ họa khác [ISO 15930-4] 3.8 Chữ tượng hình (Glyph) Biểu tượng đồ họa rút gọn để nhận biết cách độc lập với thiết kế cụ thể [TCVN 11643:2016] 3.9 Hồ sơ ICC (ICC profile) Hồ sơ màu sắc phù hợp với đặc tả ICC phần phụ [ICC.1:1998-09] [ICC.1A:1999-04] 3.10 Trình đọc tương tác (Interactive reader) Trình đọc yêu cầu cho phép người tương tác suốt q trình xử lý phần mềm CHÚ THÍCH: Cơng cụ hiển thị tệp ví dụ trình đọc tương tác; xử lý hình ảnh raster ví dụ trình đọc khơng tương tác 3.11 Phù hợp cấp độ A (Level A conformance) Cấp độ phù hợp bao gồm tất yêu cầu phần ISO 19005 3.12 Phù hợp cấp độ B (Level B conformance) Cấp độ phù hợp bao gồm tất yêu cầu phần ISO 19005 hình thức trực quan tài liệu điện tử, khơng phải đặc tính cấu trúc ngữ nghĩa chúng 3.13 Lâu dài (Long term) Khoảng thời gian đủ dài để đánh giá tác động việc thay đổi công nghệ, bao gồm hỗ trợ cho phương tiện liệu mới, cộng đồng người sử dụng thay đổi, kéo dài không thời hạn tương lai thông tin lưu trữ kho lưu trữ [ISO 14721] TCVN xxxx-1:202x 3.14 PDF Định dạng tài liệu di động (Portable Document Format) Định dạng tệp định nghĩa Tài liệu viện dẫn PDF Bản đính [ISO 15930-4] 3.15 Trình đọc (Reader) Ứng dụng phần mềm có khả đọc xử lý tệp cách thích hợp [ISO 15930-4] 3.16 Ký tự khoảng trống (Space character) Ký tự xâu văn sử dụng để biểu thị khoảng trống trắng chỉnh hình toán hạng toán tử biểu diễn văn CHÚ THÍCH: Các ký tự khoảng trống thường bao gồm HORIZONTAL TABULATION (U+0009), LINE FEED (U+000A), VERTICAL TABULATION (U+000B), FORM FEED (U+000C), CARRIAGE RETURN (U+000D), SPACE (U+0020), NOBREAK SPACE (U+00A0), EN SPACE (U+2002), EM SPACE (U+2003), FIGURE SPACE (U+2007), PUNCTUATION SPACE (U+2008), THIN SPACE (U+2009), HAIR SPACE (U+200A), ZERO WIDTH SPACE (U+200B) IDEOGRAPHIC SPACE (U+3000) 3.17 Ký tự khoảng trống trắng (White-space character) NULL (00h), HORIZONTAL TABULATION (09h), LINE CARRIAGE RETURN (0Dh) ký tự SPACE (20h) FEED (0Ah), FORM FEED (0Ch), 3.18 Trình ghi (Writer) Ứng dụng phần mềm có khả ghi tệp [ISO 15930-4] 3.19 Lược đồ mở rộng XMP (XMP extension schema) Lược đồ XMP phù hợp không định nghĩa Đặc tả XMP hay phần ISO 19005 3.20 Gói XMP (XMP packet) Trình bao bọc có cấu trúc cho siêu liệu XMP hóa nhúng nhiều định dạng tệp khác Ký hiệu Tốn tử PDF, từ khóa PDF, tên khóa từ điển PDF tên xác định trước khác viết phông chữ sans serif đậm; toán hạng toán tử PDF giá trị khoá từ điển viết chữ sans in nghiêng phơng chữ serif VÍ DỤ: Giá trị mặc định cho khóa TR2 10 TCVN xxxx-1:202x 6.7.4 Bình thường hóa Tất lược đồ XMP phải định nghĩa quy tắc bình thường hóa áp dụng cho đặc tính chúng Đối với tất đặc tính siêu liệu định nghĩa lược đồ cung cấp quy tắc tiêu bình thường hóa, giá trị thuộc tính nhập, lưu giữ lại theo kiểu bình thường hóa định nghĩa lược đồ để tạo điều kiện trao đổi hỗ trợ diễn giải quán siêu liệu trình đọc phù hợp 6.7.5 Mào đầu XMP Các bytes encoding thuộc tính mã hóa khơng sử dụng mào đầu gói XMP CHÚ THÍCH: Cả bytes thuộc tính encoding không tán thành Đặc tả XMP 6.7.6 Yếu tố định danh tệp Một tệp phù hợp phải có nhiều đặc tính siêu liệu để biểu thị đặc điểm, phân loại cách định danh tệp khác Phần ISO 19005 không ủy thác sơ đồ định danh cụ thể Các yếu tố định danh bên ngoài, Mã số tiêu chuẩn quốc tế cho sách (ISBN) [1] Mã nhận dạng đối tượng kỹ thuật số (DOI) dựa nội bộ, chẳng hạn Mã định danh toàn cầu/ Định danh đơn phổ dụng (GUID/UUID) định nơi đến khác suốt quy trình hoạt động Các yếu tố định danh bao gồm thơng qua sử dụng đặc tính xmp:Identifier; sử dụng đặc tính xmpMM:DocumentID, xmpMM:VersionID xmpMM:RenditionClass; sử dụng từ lược đồ mở rộng Bất kỳ hệ thống định danh sử dụng lâu dài miễn đặc tính tuân thủ yêu cầu XMP phần ISO 19005 Nếu tệp phù hợp bị thay đổi theo cách nào, cách bổ sung điểm truy cập xmpMM:History mơ tả 6.7.7, định danh thay đổi khóa ID từ điển đoạn giới thiệu tệp phải hiệu chỉnh mô tả Tài liệu viện dẫn PDF 9.3 CHÚ THÍCH: URI khơng gian tên XML cho tiền tố xmp ; URI không gian tên cho tiền tố xmpMM 6.7.7 Thông tin nguồn gốc tệp Để mô tả hành động người sử dụng cấp độ cao thực để tạo, chuyển đổi khởi tạo tệp phù hợp, hành động phải ghi lại đặc tính xmpMM:History Mỗi hành động ghi lại là: - Các trường action, parameters when định; - Trường SoftwareAgent định; - Trường instanceID định CHÚ THÍCH 1: URI khơng gian tên XML cho tiền tố xmpMM CHÚ THÍCH 2: Các ứng dụng có yêu cầu kiểm tra cụ thể cần ghi lại loại hành động bổ sung hành động chi tiết bổ sung hành động hành động định nghĩa lược đồ XMP xác định trước Ví dụ loại bổ sung hành động bao gồm hành động thay đổi hình thức tài liệu, lấy mẫu xuống thay phơng chữ Ví dụ chi tiết bổ sung bao gồm định danh đại lý tác nhân xúi giục thực hành động mơi trường mà hành động xảy Trong trường hợp nguồn ban đầu giấy, vi dạng tệp điện tử chuyển đổi thành tệp phù hợp, xmpMM:History nên mơ tả q trình cấp độ cao (ví dụ chuyển đổi từ PDF 1.4 sang PDF/A1); thay đổi nội dung chức tệp (ví dụ: JavaScript nhúng đối tượng âm không giữ lại); xử lý siêu liệu tồn từ trước (ví dụ: tất giá trị từ điển 23 TCVN xxxx-1:202x thông tin tài liệu chuyển đổi thành XMP); khía cạnh quan trọng khác trình chuyển đổi Đối với tất tệp phù hợp, cho dù tạo tự nhiên cách chuyển đổi từ nguồn giấy, vi dạng định dạng điện tử khác, xmpMM:History phải mô tả tất quy trình làm việc cấp độ cao (ví dụ mơ tả hoạt động thực hiện); trích dẫn đến sách điều chỉnh việc xử lý tệp (ví dụ nhan đề thị thức theo tệp thu thập, xử lý sử dụng); tên phiên công cụ phần mềm; vấn đề khác cần thiết để biểu thị bối cảnh việc tạo sử dụng tệp Trong trường hợp đặc tính siêu liệu XMP bị thay đổi bị xóa tệp di chuyển qua vịng đời nó, xmpMM:History nên mô tả thay đổi cách bao gồm điểm truy cập trường parameters định tên đặc tính giá trị trước chúng Khuyến nghị áp dụng cho tất đặc tính siêu liệu ngoại trừ thân xmpMM:History Đặc tính siêu liệu bị xóa, trường action điểm truy cập xmpMM:History pdfa:deleted 6.7.8 Lược đồ mở rộng Tất lược đồ mở rộng sử dụng tệp phù hợp phải có phần mơ tả chúng nhúng tệp dòng siêu liệu định nghĩa 6.7.2 Các mô tả định sử dụng Lược đồ vùng chứa lược đồ mở rộng PDF/A định nghĩa điều Một lược đồ mở rộng lược đồ XMP không định nghĩa Đặc tả XMP Nếu lược đồ định nghĩa 6.7.8 sử dụng, tất trường định nghĩa định nghĩa lược đồ có mặt bảng tương ứng 6.7.8 Lược đồ vùng chứa lược đồ mở rộng định nghĩa Bảng sử dụng không gian tên URI Tiền tố không gian tên lược đồ yêu cầu pdfaExtension Bảng - Lược đồ vùng chứa lược đồ mở rộng PDF/A Đặc tính pdfaExtension:schemas Loại giá trị Bag Schema Hạng Bên Mô tả Vùng chứa cho tất mô tả lược đồ mở rộng nhúng Loại lược đồ định nghĩa Bảng cấu trúc XMP có chứa lược đồ mở rộng URI Không gian tên trường (URI vùng tên trường) Tiền tố không gian tên trường yêu cầu pdfaSchema Bảng - Loại giá trị lược đồ PDF/A Tên trường pdfaSchema:schema pdfaSchema:namespaceURI pdfaSchema:prefix pdfaSchema:property pdfaSchema:valueType Loại giá trị Văn URI Văn seq Property seq ValueType Mô tả Mô tả tùy chọn lược đồ URI không gian tên lược đồ Tiền tố không gian tên lược đồ ưu tiên Mô tả đặc tính lược đồ Mơ tả loại giá trị lược đồ cụ thể Loại Property định nghĩa Bảng cấu trúc XMP có chưa mơ tả đặc tính lược đồ URI khơng gian tên trường Tiền tố không gian tên trường yêu cầu pdfaProperty 24 TCVN xxxx-1:202x Bảng - Loại giá trị đặc tính PDF/A Tên trường pdfaProperty:name pdfaProperty:valueType Loại giá trị Mơ tả Văn Tên đặc tính Lựa chọn mở văn Loại giá trị đặc tính, lấy từ Đặc tả XMP loại giá trị lược đồ mở rộng PDF/A nhúng Lựa chọn đóng văn Hạng thuộc tính: bên bên ngồi Văn Mơ tả đặc tính pdfaProperty:category pdfaProperty:description Các giá trị cho pdfaProperty:valueType phải loại giá trị định nghĩa Đặc tả XMP loại giá trị tùy chỉnh định nghĩa lược đồ mở rộng Loại ValueType định nghĩa Bảng cấu trúc XMP chứa mô tả tất loại giá trị đặc tính sử dụng lược đồ mở rộng nhúng không xác định Đặc tả XMP URI không gian tên trường Tiền tố không gian tên trường bắt buộc pdfaType Bảng - Loại giá trị ValueType PDF/A Tên trường pdfaType:type pdfaType:namespaceURI pdfaType:prefix pdfaType:description pdfaType:field Loại giá trị Văn URI Văn Văn seq Field Mô tả Tên loại giá trị đặc tính URI khơng gian tên trường loại giá trị đặc tính Tiền tố khơng gian tên trường loại giá trị ưu tiên Mô tả loại giá trị đặc tính Mơ tả tùy chọn trường cấu trúc Loại Trường định nghĩa Bảng cấu trúc XMP có chứa mơ tả trường loại giá trị đặc tính URI khơng gian tên trường Tiền tố không gian tên trường bắt buộc pdfaField Bảng - Loại giá trị trường PDF/A Tên trường pdfaField:name pdfaField:valueType pdfaField:description Loại giá trị Văn Lựa chọn mở văn Văn Mô tả Tên trường Loại giá trị trường, lấy từ Đặc tả XMP lược đồ mở rộng loại giá trị PDF/A nhúng Mơ tả trường 6.7.9 Tính hợp lệ Tất nội dung tất gói MXP hình thành tốt định nghĩa Ngơn ngữ Đánh dấu Mở rộng (XML) 1.0 (Xuất lần thứ 3), 2.1 RDF/XML Đặc tả Cú pháp (đã sửa đổi), Nếu có thể, thời điểm trình ghi tạo ghi lại tệp phù hợp tất nội dung gói XMP tệp phải xác nhận giá trị 6.7.10 Siêu liệu phơng chữ Cho tất chương trình phơng chữ Type , Type TrueType nhúng, từ điển dịng tệp phơng chữ nhúng phải bao gồm điểm truy cập Metadata có giá trị dòng siêu liệu XMP Các phần tử siêu liệu XMP sau phải cung cấp: dc:title, đưa giá trị khóa FontName từ phơng chữ từ điển trình mơ tả phơng chữ; dc:rights, đưa tuyên bố quyền; xmpRights:Marked, với giá trị Boolean true; xmpRights:Owner, đưa chủ sở hữu phông 25 TCVN xxxx-1:202x chữ; xmpRights:UsageTerms, đưa tuyên bố điều khoản cấp phép mà phông chữ sử dụng Siêu liệu XMP bổ sung bao gồm tùy ý trình ghi tệp CHÚ THÍCH 1: Thơng tin quyền phơng chữ hữu ích để bảo tồn định danh phạm vi quyền sở hữu trí tuệ người nắm giữ quyền phơng chữ Mặc dù nhiều phông chữ nhúng tuyên bố quyền điều khoản cấp phép phông chữ, thực hành/ thơng lệ thống Do đó, có lợi yêu cầu biểu diễn rõ ràng tuyên bố quyền tệp phù hợp Mặc dù điều thừa, ngăn cản cần thiết số hệ thống tương lai để có khả phân tích cú pháp thơng qua cấu trúc bên riêng biệt chương trình phơng chữ CHÚ THÍCH 2: URI khơng gian tên XML cho tiền tố xmp http://ns.adobe.com/xap/1.0/>; URI không gian tên cho tiền tố xmpRights 6.7.11 Phiên định danh cấp độ phù hợp Phiên PDF/A cấp độ phù hợp tệp định sử dụng lược đồ mở rộng Định danh PDF/A định nghĩa điều nhỏ Lược đồ nhận dạng xác định Bảng sử dụng URI không gian tên Tiền tố không gian tên lược đồ yều cầu pdfaid Bảng - Lược đồ định danh PDF/A Đặc tính pdfaid:part pdfaid:amd pdfaid:conformance Loại giá trị Hạng Lựa chọn mở số Bên nguyên Lựa chọn mở văn Bên Lựa chọn đóng Bên văn Mô tả Định danh phiên PDF/A Định danh sửa đổi PDF/A tùy ý Cấp độ phù hợp PDF/A: A B Giá trị pdfaid:part số phần ISO 19005 mà tệp tuân thủ Nếu tệp tuân theo phiên ISO 19005 xác định sửa đổi cho phần, giá trị pdfaid:amd số năm sửa đổi, phân tách dấu hai chấm Một tệp phù hợp Cấp độ A định giá trị pdfaid:conformance A Một tệp phù hợp Cấp độ B định giá trị pdfaid:conformance B Giá trị đặc tính pdfaid:part, pdfaid:amd pdfaid:conformance không tự chúng xác định phù hợp với phần ISO 19005 Việc xác định phù hợp thực tế phải thực định Điều 6.8 Cấu trúc logic 6.8.1 Tổng quan Điều nhỏ 6.8 ứng dụng cho tệp đáp ứng phù hợp cấp độ A Đối với phù hợp cấp độ B yêu cầu 6.8 bỏ qua Mục đích yêu cầu 6.8.2 đến 6.8.8 đảm bảo khôi phục nội dung văn tệp phù hợp dạng chuỗi từ định nghĩa theo thứ tự đọc tự nhiên ngôn ngữ mà chúng viết Tương tự, đảm bảo ký tự riêng lẻ từ khơi phục theo thứ tự đọc tự nhiên chúng Hơn nữa, yêu cầu cho phép khôi phục thông tin ngữ nghĩa cấp độ cao liên quan đến cấu trúc logic tài liệu Trình ghi PDF/A-1 khơng thêm thơng tin cấu trúc ngữ nghĩa khơng có mặt rõ ràng ẩn ý tài liệu nguồn với mục đích đạt phù hợp Ví dụ thơng tin cấu trúc cấp bậc, đặc tả ngôn ngữ tự nhiên, mơ tả thay thế, thích phi văn bản, văn thay mở rộng chữ viết tắt từ viết tắt 26 TCVN xxxx-1:202x CHÚ THÍCH: Sẽ khơng thích hợp để trình ghi tạo thông tin cấu trúc ngữ nghĩa sử dụng q trình tự động mà khơng có xác thực thích hợp 6.8.2 PDF gắn thẻ 6.8.2.1 Tổng quan Một tệp phù hợp cấp độ A đáp ứng yêu cầu đặt cho PDF gắn thẻ PDF Tài liệu viện dẫn PDF 9.7 CHÚ THÍCH: PDF gắn thẻ định nghĩa quy ước cho việc khai báo mơ tả rõ ràng khía cạnh cấu trúc logic nội dung tài liệu 6.8.2.2 Từ điển thông tin đánh dấu Từ điển thư mục tài liệu bao gồm từ điển MarkInfo với điểm truy cập Marked đó, có giá trị true CHÚ THÍCH: Cài đặt biểu thị tệp tuân thủ quy ước PDF gắn thẻ 6.8.3 Đồ tạo tác 6.8.3.1 Tổng quan Các đặc trưng phân trang chạy đầu trang số trang, đặc trưng bố cục thẩm mỹ quy tắc thích cuối trang hình cơng cụ hỗ trợ sản xuất dấu cắt màu phải định phân trang, bố cục tạo trang mô tả Tài liệu viện dẫn PDF 9.7.2 6.8.3.2 Ngắt chữ Đối với ngôn ngữ hệ thống thảo thường sử dụng ký tự khoảng trống để biểu thị ngắt chữ, hạn chế bổ sung phải áp dụng Trong xâu biểu diễn, ngắt chữ phải biểu thị rõ ràng diện nhiều ký tự khoảng trống tất chữ đơn lẻ xâu biểu diễn Nếu chữ kết thúc đường ranh giới xâu biểu diễn, nhiều ký tự khoảng trống trắng phải chèn vào cuối xâu biểu diễn Ghi nhớ chữ đơn mở rộng thành hai nhiều xâu biểu diễn; Ngắt chữ biểu thị diện rõ ràng nhiều ký tự khoảng trống, không đường ranh giới xâu biểu diễn Cho mục đích biểu thị ngắt chữ, chuỗi gồm hai nhiều ký tự khoảng trống liên tiếp tương đương mặt ngữ nghĩa với ký tự khoảng cách 6.8.3.3 Cấp bậc cấu trúc Cấu trúc logic tệp phù hợp mô tả cấp bậc cấu trúc gắn vào điểm truy cập StructTreeRoot từ điển thư mục tài liệu, mô tả Tài liệu viện dẫn PDF 9.6 Mỗi từ điển phần tử cấu trúc cấp bậc cấu trúc nên có điểm truy cập Type với giá trị tên StructElem Trình ghi tệp phù hợp phải nỗ lực để chụp lại cấp bậc cấu trúc logic tài liệu tới mức độ chi tiết tốt có thể, sử dụng loại cấu trúc tiêu chuẩn để nhóm phần tử, phần tử cấu trúc khốicấp, phần tử dạng đoạn, phần tử danh sách, phần tử bảng, phần tử cấu trúc cấp nội tuyến, phần tử liên kết phần tử minh họa, định nghĩa Tài liệu viện dẫn PDF 9.7.4, đến mức tối đa CHÚ THÍCH: Mơ tả rõ ràng cấu trúc logic tài liệu chứng tỏ có giá trị cho nỗ lực tương lai để phục hồi giá trị ngữ nghĩa đầy đủ tài liệu cho mục đích kết xuất di chuyển (migration) sang định dạng liệu khác 27 TCVN xxxx-1:202x 6.8.3.4 Loại cấu trúc Định nghĩa phần tử cấu trúc khối-cấp phải tuân theo mơ hình có cấu trúc mạnh mẽ mơ tả Tài liệu viện dẫn PDF 9.7.4 Tất loại cấu trúc phi tiêu chuẩn phải ánh xạ tới loại tiêu chuẩn tương đương chức gần nhất, mô tả Tài liệu viện dẫn PDF 9.7.4, từ điển vai trò ánh xạ rễ cấu trúc Ánh xạ gián tiếp; đồ vai trò loại phi tiêu chuẩn ánh xạ trực tiếp tới loại phi tiêu chuẩn khác, nhiên ánh xạ phải kết thúc dạng loại tiêu chuẩn 6.8.4 Đặc tả ngôn ngữ tự nhiên Ngôn ngữ tự nhiên mặc định cho tất văn tệp phải định điểm truy cập Lang từ điển thư mục tài liệu Tất nội dung văn tệp khác với ngôn ngữ mặc định phải biểu thị cách sử dụng đặc tính Lang đính kèm với chuỗi nội dung đánh dấu điểm truy cập Lang từ điển phần tử cấu trúc, mô tả Tài liệu viện dẫn PDF 9.8.1 Nếu điểm truy cập Lang có mặt từ điển thư mục tài liệu từ điển phần tử cấu trúc danh sách đặc tính, giá trị yếu tố định danh ngôn ngữ định nghĩa RFC 1766, Thẻ để định danh ngôn ngữ, mô tả Tài liệu viện dẫn PDF 9.8.1 Tất xâu mã hóa Unicode có ngơn ngữ khơng phải ngôn ngữ mặc định tự nhiên cho tệp ngôn ngữ tự nhiên định nghĩa phần tử cấu trúc bao bọc chuỗi nội dung đánh dấu phải biểu thị ngôn ngữ chúng sử dụng chuỗi bên mơ tả Tài liệu viện dẫn PDF 3.8.1 CHÚ THÍCH: Sự phân biệt từ nước ngồi với ngơn ngữ từ nước kết hợp cách sử dụng phổ biến ngôn ngữ vấn đề rắc rối Mục đích yêu cầu phép giải thích ngữ nghĩa rõ ràng tương lai nội dung văn 6.8.5 Mô tả thay Tất phần tử cấu trúc mà nội dung khơng có dạng tương tự văn tự nhiên xác định trước, ví dụ hình ảnh, công thức , phải cung cấp mô tả văn thay sử dụng điểm truy cập Alt từ điển phần tử cấu trúc, mô tả Tài liệu viện dẫn PDF 9.8.2 CHÚ THÍCH: Các mơ tả thay cung cấp mô tả dạng văn bổ sung hỗ trợ việc giải thích phù hợp nội dung phi văn mờ đục 6.8.6 Chú giải phi văn Đối với loại giải không hiển thị văn bản, khóa Contents từ điển giải phải định mô tả thay nội dung giải dạng người đọc 6.8.7 Văn thay Tất phần tử cấu trúc dạng văn trình bày theo cách khơng tiêu chuẩn, ví dụ: ký tự tùy chỉnh đồ họa nội tuyến, phải cung cấp văn thay sử dụng điểm truy cập ActualText từ điển phần tử cấu trúc, mô tả Tài liệu viện dẫn PDF 9.8.3 CHÚ THÍCH: Văn thay cung cấp văn tương đương để hỗ trợ việc giải thích phù hợp biểu diễn mờ đục, khác thường thành phần văn 6.8.8 Mở rộng chữ viết tắt từ viết tắt Tất thực thể chữ viết tắt từ viết tắt nội dung văn phải đặt chuỗi nội dung đánh dấu thẻ Span có đặc tính E cung cấp mở rộng văn chữ viết tắt từ viết tắt mô tả Tài liệu viện dẫn PDF 9.8.4 28 TCVN xxxx-1:202x CHÚ THÍCH: Việc mở rộng chữ viết tắt từ viết tắt cung cấp tương đương văn để hỗ trợ việc giải thích phù hợp danh pháp mờ đục 6.9 Mẫu tương tác Mục đích yêu cầu điều nhỏ để đảm bảo rõ ràng kết xuất trường mẫu Trình đọc phù hợp không sử dụng trường mẫu để thay đổi cách biểu diễn kết xuất trang nội dung tệp lúc Một từ điển giải Widget từ điển Trường không chứa khóa A AA Cờ NeedAppearances mẫu tương tác khơng có mặt false Mọi trường mẫu có từ điển hình thức liên kết tới liệu trường Một trình đọc phù hợp kết xuất trường theo từ điển hình thức mà khơng liên quan tới liệu mẫu CHÚ THÍCH: Yêu cầu từ điển hình thức đảm bảo kết xuất đáng tin cậy mẫu 29 TCVN xxxx-1:202x Phụ lục A (Tham khảo) Tóm tắt phù hợp PDF/A-1 A.1 Tổng quan Thông tin từ A.1 đến A.3 cung cấp tiện lợi để thu nhìn tổng quan nhanh chóng phạm vi khác biệt yêu cầu PDF/A-1 từ yêu cầu Tài liệu viện dẫn PDF Tuy nhiên, phụ lục không nhằm mục đích danh sách bao hàm tồn yêu cầu PDF/A1 Tuyên bố tiêu chuẩn tất yêu cầu PDF/A-1 tìm thấy Điều từ đến Trong trường hợp có khác biệt thông tin trình bày bảng phụ lục tham khảo văn tiêu chuẩn, văn tiêu chuẩn coi thể tuyên bố dứt khoát yêu cầu Bảng A.1 A.2 liệt kê toán tử PDF 1.4, đối tượng khóa bên đối tượng mà yêu cầu phần ISO 19005 thay đổi từ Tài liệu viện dẫn PDF cho mục đích phù hợp PDF/A-1 Các bảng biểu thị trạng thái tốn tử, đối tượng khóa, điều tiêu chuẩn mà trạng thái định nghĩa Các giá trị biểu tượng sử dụng bao gồm: ↓ u cầu Tốn tử, đối tượng khóa yêu cầu tệp phù hợp ↓ Cấm Toán tử, đối tượng khóa bị cấm tệp phù hợp ↓ Hạn chế Tốn tử, đối tượng khóa xuất tệp phù hợp, tuân theo ràng buộc cụ thể việc sử dụng, nội dung giá trị ↓ Khuyến nghị Toán tử, đối tượng khóa nên xuất tệp phù hợp ↓ Bỏ qua Toán tử, đối tượng khóa nên xuất tệp phù hợp bị bỏ qua trình đọc phù hợp Nếu tham chiếu tới đối tượng từ điển PDF bao gồm bảng, khóa bên đối tượng khơng liệt kê rõ ràng tất khóa bên đối tượng cháu, có, kế thừa trạng thái chúng từ đối tượng bảng Một đối tượng cháu đối tượng khác, gọi ông bà, điều kiện sau đây: - đối tượng giá trị khóa đối tượng ơng bà; - ơng bà mảng đối tượng phần tử mảng đó; - đối tượng cháu cháu đối tượng ơng bà A.2 Tốn tử Tất toán tử định nghĩa Tài liệu viện dẫn PDF để sử dụng dòng Contents bao gồm tệp phù hợp, tùy theo điều kiện Bảng A.1 30 TCVN xxxx-1:202x Bảng A.1 - Trạng thái toán tử Toán tử Trạng thái CS cs K k RG rg ri Tốn tử khơng định nghĩa tham chiếu PDF Hạn chế Hạn chế Hạn chế Hạn chế Hạn chế Hạn chế Hạn chế Cấm Điều nhỏ 6.2.3 6.2.3 6.2.3 6.2.3 6.2.3 6.2.3 6.2.9 6.2.10 A.3 Đối tượng khóa Tất đối tượng khóa xác định Tài liệu viện dẫn PDF bao gồm tệp phù hợp, tùy theo điều kiện điều kiện Bảng A.2 Một số yêu cầu khóa liên quan tới cặp khóa/giá trị cụ thể Trong trường hợp giá trị liên quan theo khóa Bảng A.2 - Đối tượng trạng thái khóa Đối tượng AcroForm Action Annot Khóa (và giá trị) NeedAppearances N NOP S Named S ImportData S JavaScript S Launch S Movie S ResetForm S SetState S Sound AA CA Contents Subtype FileAttachment Subtype Sound Subtype Movie Từ điển danh mục đặc tính đồ tạo tác Trạng thái Hạn chế Cấm Hạn chế Cấm Điều nhỏ 6.9 6.6.1 6.6.1 6.6.1 Cấm 6.6.2 Hạn chế 6.5.3 Khuyến nghị (Phù hợp cấp độ A 6.8.6 giải phi văn bản) Cấm 6.5.2 Khuyến nghị (Phù hợp cấp độ A) 6.8.3 31 TCVN xxxx-1:202x Bảng A.2 (tiếp theo) Đối tượng Catalog CMap ExtGState Field dictionary Filespec Filters Font Font (Subtype CIDFontType0 or CIDFontType2) Font (Subtype CIDFontType0) Font (Subtype TrueType) Khóa (và giá trị) AA Lang Metadata Names OCProperties OutputIntents StructTreeRoot CIDSystemInfo WMode BM CA ca HT SMask TR TR2 AA EF LZWDecode FontDescriptor ToUnicode Type Widths CIDSystemInfo CIDtoGIDMap Encoding MarkInfo Metadata CharSet CIDSet FontFile or FontFile2 or FontFile3 S Marked true Page AA Dịng tệp phơng chữ FontDescriptor Group 32 Cấm Khuyến nghị (Phù hợp cấp độ A) Yêu cầu Hạn chế Cấm Hạn chế Khuyến nghị (Phù hợp cấp độ A) Hạn chế Hạn chế Hạn chế Hạn chế Hạn chế Bỏ qua Hạn chế Cấm Hạn chế Cấm Cấm Cấm Yêu cầu (trừ Type ) Yêu cầua (Phù hợp cấp độ A) Hạn chế Bỏ qua Hạn chế Điều nhỏ 6.6.2 6.8.4 6.7.2 6.1.11 6.1.13 6.2.2 6.8.3.3 6.3.3.3 6.3.3.1 6.4 6.4 6.4 6.2.8 6.4 6.2.8 6.2.8 6.6.2 6.1.11 6.1.10 6.3.4 6.3.8 6.3.2 6.3.6 6.3.3.1 Hạn chế 6.3.3.2 Cấm (Nếu phông chữ biểu tượng) Hạn chế (Nếu phông chữ không biểu tượng) Khuyến nghị Yêu cầu Yêu cầu (nếu CIDFont) Yêu cầu 6.3.7 Hạn chế Yêu cầu (Phù hợp Cấp độ A) 6.4 6.8.2.2 Cấm 6.6.2 Trạng thái 6.7.10 6.3.5 6.3.5 6.3.5 TCVN xxxx-1:202x Bảng A.2 (kết thúc) Đối tượng Khóa (và giá trị) Từ điển mục đích đầu DestOutputProfile PDF/A S Từ điển mở rộng 6.8.8 6.8.4 Type StructElem Encrypt ID Subtype PS Group OPI Ref Alternates Cấm Cấm Cấm 6.2.5 6.2.6 6.2.4 Intent OPI SMask Hạn chế Cấm Hạn chế 6.2.4 6.2.4 6.4 Alternate F FDecodeParams FFilter ICCBased Từ điển phần tử cấu ActualText trúc Alt XObject (Subtype Image) a Hạn chế Hạn chế Điều nhỏ 6.2.2 6.2.2 Khuyến nghị (Phù hợp Cấp độ A) Khuyến nghị (Phù hợp Cấp độ A 6.8.4 nội dung ngôn ngữ phi mặc định) Bỏ qua Cấm Cấm Cấm Hạn chế Khuyến nghị (Phù hợp Cấp độ A phần tử phi văn bản) Khuyến nghị (Phù hợp Cấp độ A phần tử phi văn bản) Yêu cầu (Phù hợp Cấp độ A) Cấm Yêu cầu Cấm Hạn chế E Lang Từ điển dòng Trailer Trailer XObject XObject (Subtype Form) Trạng thái 6.2.3.2 6.1.7 6.1.7 6.1.7 6.2.3.2 6.8.7 6.8.5 6.8.3.3 6.1.3 6.1.3 6.2.5 6.4 Có ba trường hợp miễn trừ cụ thể tình trạng xác định 6.3.8 33 TCVN xxxx-1:202x Phụ lục B (Tham khảo) Thực hành tốt cho PDF/A B.1 Sử dụng siêu liệu XMP Không khuyến nghị sử dụng siêu liệu XMP cấp độ tệp khơng có đảm bảo siêu liệu bảo quản phù hợp với đặc tính Trong trường hợp siêu liệu XMP diện, ưu tiên chuyên đổi chúng thành XMP, nhúng chúng vào tệp, mô tả chuyển đổi đặc tính xmp:History Đặc tính xmp:History nên sử dụng để biểu thị phần tử XMP chưa chuyển đổi Sự thất bại bảo quản siêu liệu dẫn đến vấn đề định vị, diễn giải, quản lý xác thực tệp tương lai, dẫn tới làm giảm hủy bỏ giá trị lưu trữ tệp B.2 Các yếu tố định danh ngôn ngữ tự nhiên Ngôn ngữ phải nhận dạng sử dụng yếu tố định danh đăng ký ISO 639-1[7] , TCVN 72171:2007 (ISO 03166-1:2006) [3] IANA[17] Yếu tố định danh cá nhân nên sử dụng ngôn ngữ khơng có yếu tố định danh định nghĩa bên ISO 639-1, ISO 3166-1 đăng ký IANA Trong trường hợp ngôn ngữ thực không xác định, yếu tố định danh x-unknow nên sử dụng CHÚ THÍCH: Việc sử dụng yếu tố định danh ISO 639-1[7] , TCVN 7217-1:2007 (ISO 03166-1:2006) [3] đăng ký IANA định nghĩa RFC 1766, Thẻ để định danh ngôn ngữ, mà PDF sử dụng tảng cho yếu tố định danh ngôn ngữ ISO 639-2[24] định nghĩa yếu tố định danh ngôn ngữ ba chữ không phép theo RFC 1766 B.3 Khuyến nghị cho việc chụp chuyển đổi tài liệu sang PDF/A Đối với mục đích bảo quản lưu trữ, tuyên bố Thực hành tốt cung cấp khuyến nghị cho trình chụp chuyển đổi tài liệu sang dạng PDF/A để đảm bảo tệp phù hợp giữ nguyên chất lượng tính tốn vẹn hồ sơ Các viện lưu trữ tổ chức khác với yêu cầu bảo quản lâu dài nên khuyến khích việc sử dụng phù hợp Mức độ A mô tả 5.1 phần hướng dẫn bổ sung điều TCVN 7420-1:2004 (ISO 15489-1:2001)[4], 7.1, rõ “để hỗ trợ hoạt động kinh doanh liên tục, tuân thủ môi trường pháp lý cung cấp trách nhiệm giải trình cần thiết, tổ chức nên tạo trì hồ sơ xác thực, đáng tin cậy, sử dụng bảo vệ tính tồn vẹn hồ sơ theo thời gian theo u cầu” Mơi trường pháp lý để gửi tài liệu đến viện lưu trữ tổ chức bao gồm yêu cầu, tiêu chuẩn sách tài liệu điện tử quy định quy tắc chất lượng tài liệu độ phân giải ảnh tối thiểu, hạn chế nén trình bị cấm, làm thay đổi hủy bỏ liệu phê duyệt Cho mục đích bảo quản lưu trữ, chất lượng tính tồn vẹn tài liệu tạo theo yêu cầu pháp lý yêu cầu quy định này, tiêu chuẩn ứng dụng sách tổ chức phải giữ nguyên chúng chụp chuyển đổi sang PDF/A Để đáp ứng nhu cầu lưu trữ nguy cấp, trình chụp chuyển đổi PDF/A nên chép nội dung xác chất lượng tài liệu nguồn tệp phù hợp Những ví dụ sau hướng dẫn phát triển phần mềm thực điều 34 TCVN xxxx-1:202x - Trình ghi tệp phù hợp khơng nên sử dụng tính nén có tổn hao, lấy mẫu con, lấy mẫu xuống q trình khác khơng làm thay đổi nội dung làm giảm chất lượng liệu nguồn tệp phù hợp - Phần mềm khơng thay văn tìm kiếm, dựa nhận dạng ký tự quang học, cho văn gốc quét bên hình ảnh ánh xạ-bit tài liệu quét sang tệp phù hợp từ giấy chuyển đổi sang tệp phù hợp từ định dạng hình ảnh CHÚ THÍCH: Các q trình nhận dạng ký tự quang học làm liệu thơng qua việc diễn giải khơng xác ký tự quét 35 TCVN xxxx-1:202x THƯ MỤC TÀI LIỆU THAM KHẢO [1] TCVN 6380:2007 (ISO 02108:2005) Thông tin tư liệu - Mã số tiêu chuẩn Quốc tế cho sách [2] TCVN 6909:2001 công nghệ thơng tin - Bộ mã kí tự tiếng Việt 16-bit Bộ Khoa học Công nghệ Môi trường ban hành (phù hợp với ISO/IEC 10646-1:2000) [3] TCVN 7217-1:2007 (ISO 03166-1:2006) Mã thể tên vùng lãnh thổ nước Phần 1: Mã nước [4] TCVN 7420-1:2004 (ISO 15489-1:2001) Thông tin tư liệu - Quản lý hồ sơ - Phần 1: Yêu cầu chung [5] ANSI X3.4, Information Systems - Coded Character Sets - 7-Bit American National Standard Code for Information Interchange (7-Bit ASCII) [6] ECMA-6, 7-Bit coded Character Set, Available from Internet [7] ISO 639-1, Codes for the representation of names of languages - Part 1: Alpha-2 code [8] ISO/IEC 10646-2:2001, Information technology - Universal Multiple-Octet Coded Character Set (UCS) - Part 2: Supplementary Planes [9] ISO/IEC 14492:2001, Information technology - Lossy/lossless coding of bi-level images NOTE This International Standard is equivalent to ITU-T Recommendation T.88, Information technology - Coded representation of picture and audio information - Lossy/lossless coding of bi-level images [10] ISO/TR 15801, Electronic imaging - Information stored electronically - Recommendations for trustworthiness and reliability [11] ISO 15930-6, Graphic technology - Prepress digital data exchange using PDF - Part 6: Complete exchange of printing data suitable for colour-managed workflows using PDF 1.4 (PDF/X-3) [12] ISO/TR 18492, Long-term preservation of electronic document-based information [13] ISO 18509-1, Electronic archival storage - Specifications relative to the design and operation of information processing systems in view of ensuring the storage and integrity on recordings stored in these systems - Part 1: Long term access strategy [14] ISO 18509-2, Electronic archival storage - Specifications relative to the design and operation of information processing systems in view of ensuring the storage and integrity on recordings stored in these systems - Part 2: Technical specifications [15] ITU-T Recommendation T.4, Standardization of Group facsimile terminals for document transmission [16] ITU-T Recommendation T.563, Terminal characteristics for Group facsimile apparatus [17] Language Tags, IANA Available from Internet [18] Namespaces in XML 1.1, W3C Recommendation, February 4, 2004 Available from Internet [19] PDF Reference: Adobe Portable Document Format, Version 1.5, Adobe Systems Incorporated - 4th edition Available from Internet 36 TCVN xxxx-1:202x [20] RFC 1950, ZLIB Compressed Data Format Specification version 3.3, May 1996 Available from Internet [21] RFC 1951, DEFLATE Compressed Data Format Specification version 1.3, May 1996 Available from Internet [22] The Unicode Standard, Unicode Consortium Available from Internet [23] Unicode Standard Annex #15, Unicode Normalization Forms, Unicode Consortium, 17 April 2003 Available from Internet [24] ISO 639-2, Codes for the representation of names of languages - Part 2: Alpha-3 code 37

Ngày đăng: 26/06/2023, 00:52

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w