DỮ LIỆU ĐẶC TẢ
Các khái niệm và định nghĩa
Văn bản là thông tin được tạo ra, nhận được, sửa đổi tường minh bởi cơ quan hoặc cá nhân tuân thủ các yêu cầu nghiệp vụ của cơ quan
1.1.2 Văn bản số (Văn bản điện tử)
Văn bản số là dữ liệu số được hình thành một cách tường minh từ các hoạt động của cơ quan nhà nước hoặc được tạo ra từ việc số hóa tài liệu gốc (scan từ giấy) Văn bản số là đơn vị tài liệu của cơ sở dữ liệu
Hệ thống văn bản là tập hợp các văn bản đƣợc tổ chức và đƣợc quản lý
1.1.4 Lập chỉ mục ngƣợc (revert indexing)
Lập chỉ mục ngƣợc là quá trình tạo lập các điểm truy nhập để lấy ra bản ghi hoặc của thông tin trong hệ thống
Metadata là những thông tin mô tả các đặc tính của dữ liệu nhƣ nội dung, định dạng, chất lƣợng, điều kiện và các đặc tính khác nhằm tạo thuận lợi cho quá trình tìm kiếm, truy nhập, quản lý và lưu trữ dữ liệu (Thông tư số 24/2011/TT-
Hồ sơ là một tập tài liệu có liên quan với nhau về một vấn đề, một sự việc, một đối tƣợng cụ thể hoặc có đặc điểm chung, hình thành trong quá trình theo dõi, giải quyết công việc thuộc phạm vi chức năng, nhiệm vụ của Cơ quan, tổ chức, cá nhân (Trích Điều 2, Luật lưu trữ)
Kho dữ liệu số là nơi lưu trữ các dữ liệu văn bản điện tử, có khả năng truy cập dữ liệu theo các nghi thức chuẩn, dữ liệu có thể đƣa vào và lấy ra dễ dàng
Trong luận văn này, các thuật ngữ “Văn bản„,“Hệ thống văn bản„ được xem là tương đương với thuật ngữ „Bản ghi“, „Hệ thống bản ghi“ Do vậy, việc dùng thuật ngữ „văn bản“ hay „bản ghi“ và thuật ngữ „hệ thống văn bản“ hay „hệ thống bản ghi“ là được hiểu như nhau.
Các chuẩn mực tham khảo áp dụng
ANSI/NISO Z 39.85-2001 Chuẩn Dublin Core (Tập yếu tố Dublin Core đƣợc Tổ chức Chuẩn Quốc tế ̣(ISO) chấp thuận ngày 26 tháng 2 năm 2003)
Dublin Core là chuẩn dùng để mô tả dữ liệu trong các thẻ siêu dữ liệu nhằm khai thác các tài liệu trong thƣ viện và trên các web thông qua internet
Tập hợp yếu tố dữ liệu đặc tả Dublin Core này đƣợc gọi là “cốt lõi” (core) vì nó đƣợc thiết kế đơn giản và chỉ bao gồm 15 yếu tố mô tả cốt lõi nhất Các yếu tố siêu dữ liệu Dublin Core có những ƣu điểm sau:
+ Tạo lập và sử dụng dễ dàng: Cho phép những người không chuyên nghiệp có thể tạo các bản ghi mô tả đơn giản cho các tài nguyên thông tin và truy xuất chúng trên môi trường mạng một cách dễ dàng
+ Ngữ nghĩa dễ hiểu, sử dụng đơn giản: Việc khai thác thông tin trên mạng internet diện rộng thường gặp trở ngại bởi những sự khác nhau về thuật ngữ và sự mô tả thực tế Dublin Core Metadata giúp những người dò tìm thông tin không chuyên có thể tìm thấy vấn đề mình quan tâm bằng cách hỗ trợ một tập hợp các phần tử thông dụng mà ngữ nghĩa của chúng đƣợc hiểu phổ biến
+ Phạm vi phổ biến: Tập hợp các phần tử Dublin Core Metadata lúc đầu đƣợc phát triển bằng tiếng Anh, nhƣng hiện nay nó đƣợc câp nhật thêm với khoảng 25 ngôn ngữ khác nhau
+ Tính mở rộng: Những nhà phát triển Dublin Core đã cung cấp một cơ chế cho việc mở rộng tập các phần tử Dublin Core, phục vụ nhu cầu khai thác các tài nguyên bổ sung Các phần từ Metadat từ những tập các phần tử khác nhau có thể liên kết với metadata của Dublin Core Điều này cho phép các tổ chức khác nhau có thể dùng các phần tử Dublin Core để mô tả thông tin thích hợp cho việc sử dụng tài nguyên trên Internet
+ Giúp nâng cao độ chính xác của định chỉ số + Có khả năng liên tác (Interoperability), sử dụng lẫn nhau + Mở rộng thuận lợi
Mỗi yếu tố Dublin Core đƣợc đặt tên (Element Name) và quy định nhãn (label) để sử dụng ghi vào trong thẻ meta Mỗi yếu tố đƣợc định nghĩa cụ thể để mô tả đối tƣợng và có chú thích rõ ràng Yếu tố dữ liệu đặc tả là thuộc tính đƣợc sử dụng để mô tả tài nguyên thông tin Mỗi yếu tố dữ liệu đặc tả có thể có một hoặc nhiều yếu tố con Các yếu tố siêu dữ liệu Dublin Core bao gồm:
(1) Nhan đề (Title): Nhan đề của tài liệu
(2) Tác giả (Creator): Tác giả của tài liệu, bao gồm cả tác giả cá nhân và tác giả tập thể
(3) Chủ đề (Subject): Chủ đề tài liệu đề cập dùng để phân loại tài liệu Có thể thể hiện bằng từ, cụm từ/(Khung chủ đề), hoặc chỉ số phân loại/ (Khung phân loại)
(4) Tóm tắt (Description): Tóm tắt, mô tả nội dung tài liệu Có thể bao gồm tóm tắt, chú thích, mục lục, đoạn văn bản để làm rõ nội dung
(5) Nhà xuất bản (Publisher): Nhà xuất bản, nơi ban hành tài liệu có thể là tên cá nhân, tên cơ quan, tổ chức, dịch vụ
(6) Tác giả phụ (Contributor): Tên những người cùng tham gia cộng tác đóng góp vào nội dung tài liệu, có thể là cá nhân, tổ chức
(7) Ngày tháng (Date): Ngày, tháng ban hành tài liệu Có thể dùng chuẩn ISO
8601 (http://www.w3.org/TR/NOTE-datetime)
(8) Loại (kiểu) (Type): Mô tả bản chất của tài liệu Dùng các thuật ngữ mô tả phạm trù kiểu: trang chủ, bài báo, báo cáo, từ điển
(9) Khổ mẫu (Format): Mô tả sự trình bày vật lý của tài liệu, có thể bao gồm; vật mang tin, kích cỡ độ dài, kiểu dữ liệu (.doc, html, jpg, xls, phần mềm )
(10) Định danh (Identifier): Các thông tin về định danh tài liệu, các nguồn tham chiếu đến, hoặc chuỗi ký tự để định vị tài nguyên: URL (Uniform Resource Locators) (bắt đầu bằng http://), URN (Uniform Resource Name), ISBN (International Standard Book Number), ISSN (International Standard Serial Number), SICI (Serial Item & Contribution Identifier),
(11) Nguồn (Resource): Các thông tin về xuất xứ của tài liệu, tham chiếu đến nguồn mà tài liệu hiện mô tả đƣợc trích ra/tạo ra, nguồn cũng có thể là: đường dẫn (URL), URN, ISBN, ISSN
(12) Ngôn ngữ (Language): Các thông tin về ngôn ngữ, mô tả ngôn ngữ chính của tài liệu:
(13) Liên kết (Relation): Mô tả các thông tin liên quan đến tài liệu khác có thể dùng đường dẫn (URL), URN, ISBN, ISSN
(14) Diện bao quát (Coverage): Các thông tin liên quan đến phạm vi, quy mô hoặc mức độ bao quát của tài liệu Phạm vi đó có thể là địa điểm, không gian hoặc thời gian, tọa độ
(15) Bản quyền (Right): Các thông tin liên quan đến bản quyền của tài liệu
Một số tiêu chuẩn ISO về quản lý bản ghi bằng metadata:
ISO 23081 - Records Management Processes - Metadata for record (Quá trình quản lý bản ghi – Dữ liệu đặc tả bản ghi)
ISO 15489-1, 15489-2 Information and documentation – Record management (Thông tin và tài liệu – Quản lý bản ghi)
ISO 15386:2003 - Chuẩn metadata quản lý hệ thống các bản ghi dựa trên Chuẩn Dublin Core Đối với tạo lập metadata, Đề tài đã xây dựng Chuẩn metadata quản lý hệ thống các bản ghi dựa trên Chuẩn Dublin Core ISO 15386:2003 kết hợp với tài liệu ISO 23081-1, 23081-2 Record management processes – Metadata for record và dựa trên kinh nghiệm quốc tế trong xây dựng dữ liệu đặc tả (metadata) quản lý văn bản ở một số nước trên thế giới.
Ứng dụng metadata cho quản lý văn bản ở một số nước
Ở quy mô quốc gia , các nước Úc, Newzealand, Mỹ, Anh đều nghiên cứu và đưa ra các tiêu chuẩn tạo lập và lưu trữ dữ liệu số sử dụng chung cho đa ngành, đa lĩnh vực Cụ thể:
AGLS Metadata - Chuẩn áp dụng metadata cho chính phủ Úc
AGRkMS - Australian Government Recordkeeping Metadata Standard (Chuẩn metadata lưu trữ bản ghi chính phủ Úc) Địa chỉ: http://www.naa.gov.au/records-management/a-z/index.aspx
QRKMS - Queensland Recordkeeping Metadata Standard and Guideline
GC RMMS - Government of Canada Records Management Metadata Standard Địa chỉ: http://www.collectionscanada.gc.ca
The New Zealand Government Locator Service (NZGLS) Metadata Element Set Địa chỉ: http://www.inst-informatica.pt/servicos/informacao-e- documentacao/biblioteca-digital/infraestrutura-do-software/gestao- de-dados-e-informacao/nzgls-element-set-2-1.pdf
1.3.1 Chuẩn metadata của Chính phủ Úc (AGLS Metadata)
Chính phủ Australia đã xây dựng tập các yếu tố metadata và hướng dẫn áp dụng metadata cho các cơ quan chính phủ, gọi tắt là AGLS metadata, là sổ tay áp dụng metadata của Chính phủ Australia (Australia Government implementation Manual: AGLS Metadata), phiên bản 2.0 năm 2006
Mục đích của việc sử dụng chuẩn AGLS Metadata trong các cơ quan Chính phủ Australia là bảo đảm mọi người tìm kiếm thông tin về Chính phủ Australia trên Web có đƣợc truy cập nhanh và hiệu quả đến các nguồn thông tin Sử dụng việc miêu tả chuẩn hóa metadata giúp cho các cơ chế tìm kiếm dựa trên web thực hiện việc tìm kiếm hiệu quả hơn, bảo đảm mọi người tìm kiếm thông tin về chính phủ có đƣợc các kết quả phù hợp và có nghĩa
Chuẩn AGLS Metadata có 19 yếu tố metadata (như thể hiện trong bảng 1.1) trong đó sử dụng 15 yếu tố của Dublin Core và đề xuất 04 yếu tố riêng là:
Chức năng (Function), Tính có sẵn (Availability), Khán giả (Audience), Luật định (Mandate)
Bảng 1.1 Chuẩn metadata của chính phủ Úc
Các Yếu tố dữ liệu đặc tả Quy định áp dụng
Subject Bắt buộc, nếu không có yếu tố Chức năng
Identifier Bắt buộc khi mô tả các dữ liệu trực tuyến
Publisher Khuyến nghị nên sử dụng
Coverage Khuyến nghị nên sử dụng
Bắt buộc khi phạm vi bao phủ của nội dung tài liệu không phải là toàn quốc
Language Khuyến nghị nên sử dụng
Bắt buộc khi tài liệu không phải tiếng Anh
Các yếu tố thêm so với chuẩn Dublincore
Function Bắt buộc nếu không có yếu tố Chủ đề
(Subject) Bắt buộc đối với tài nguyên thứ cấp
Availability Bắt buộc cho các tài liệu ngoại tuyến (offline)
(không có yếu tố Định danh)
Audience Khuyến nghị nên sử dụng
Bắt buộc khi đối tƣợng độc giả của tài liệu không phải là “tất cả”
Dựa trên chuẩn về Quản lý bản ghi (ISO 15489) và dữ liệu đặc tả bản ghi (ISO 23081), Úc đã xây dựng và ban hành Chuẩn metadata lưu trữ bản ghi của Chính phủ Úc phiên bản 2.0 Bản chuẩn dữ liệu đặc tả lưu trữ bản ghi này mô tả thông tin về các bản ghi và các bối cảnh trong đó bản ghi đƣợc thu thập và sử dụng Tiêu chuẩn này đƣợc xây dựng dựa trên mô hình đa thực thể, cho phép mô tả năm thực thể riêng biệt: Bản ghi (Record): Thông tin ở bất kỳ dạng nào đƣợc tạo ra, nhận đƣợc và duy trì nhƣ bằng chứng của tổ chức hoặc cá nhân, theo sự ràng buộc pháp lý hoặc trong các giao dịch nghiệp vụ Một bản ghi có thể bao gồm một tài liệu điện tử hay giấy hoặc một nhóm tài liệu tổng hợp, Tác nhân (Agent): Một thực thể pháp nhân, tổ chức hoặc cá nhân chịu trách nhiệm về việc thực hiện một số hoạt động nghiệp vụ, bao gồm các hành động trên bản ghi;
Nghiệp vụ (Business): Chức năng nghiệp vụ, hoạt động hoặc giao dịch đƣợc thực hiện hoặc giao cho một tổ chức hoặc các nhân viên của tổ chức; Luật và các qui định (Mandate): Một nguồn các yêu cầu nghiệp vụ, bao gồm các yêu cầu lưu trữ bản ghi và Relationship (Quan hệ): Mối liên hệ giữa hai hay nhiều thực thể có liên quan trong một nghiệp vụ và/hoặc bối cảnh lưu trữ bản ghi
Tập dữ liệu đặc tả lưu trữ bản ghi bao gồm 26 thuộc tính (Bảng 1.2), trong đó :
+ 8 thuộc tính là bắt buộc đối với một hoặc nhiều thực thể
+ 12 thuộc tính là có điều kiện, và sử dụng phụ thuộc vào loại thực thể đƣợc mô tả và bối cảnh trong đó các thực thể hoạt động
+ 6 thuộc tính còn lại là tùy chọn, và có thể được sử dụng trong trường hợp mô tả chi tiết hơn là cần thiết
Bảng 1.2 Metadata lưu trữ bản ghi của Chính phủ Úc phiên bản 2.0
TT Thuộc tính Định nghĩa Điều kiện sử dụng Đối tƣợng sử dụng
1 Entity Type Xác định loại thực thể đƣợc mô tả nhƣ:
2 Category Xác định loại hoặc khối liên kết cụ thể của
TT Thuộc tính Định nghĩa Điều kiện sử dụng Đối tƣợng sử dụng thực thể đƣợc mô tả nhƣ:
Series đối với thực thể Record, Work Group hoặc Person đối với thực thể Agent
3 Identifier Định danh duy nhất của thực thể
4 Name Tiêu đề hoặc tên đƣợc đặt cho thực thể
5 Date Range Thời gian bắt đầu và kết thúc liên quan đến thực thể
6 Description Mô tả thực thể Optional All
7 Related Entity Thực thể khác trong mối quan hệ
8 Change History Ghi nhận các thay đổi của các giá trị thuộc tính metadata của thực thể
9 Jurisdiction Đặc tả phạm vi quyền hạn mà trong đó thực
TT Thuộc tính Định nghĩa Điều kiện sử dụng Đối tƣợng sử dụng thể hoạt động, tồn tại
Một nhãn biểu thị trạng thái bảo mật của một Record, mandate hoặc business
11 Security Caveat Một cảnh báo rằng Record hoặc Mandate yêu cầu xử lý đặc biệt, và chỉ có người được xóa để xem nó có thể đƣợc truy cập
13 Rights Chính sách và các yêu cầu liên quan đến việc sử dụng và truy cập vào hồ sơ
14 Contact Thông tin liên hệ của tác nhân
15 Position Tên vị trí đƣợc nắm giữ
16 Language Ngôn ngữ đƣợc sử dụng cho một
TT Thuộc tính Định nghĩa Điều kiện sử dụng Đối tƣợng sử dụng bản ghi, hoặc đƣợc nói hoặc đƣợc sử dụng bởi một tác nhân trong việc thực hiện hoạt động nghiệp vụ
17 Converage Khả năng ứng dụng thẩm quyền, hoặc không gian và/hoặc chủ đề thời gian của thực thể
18 Key word Chủ đề của bản ghi hoặc các chức năng, hoạt động của cơ quan đƣợc ghi nhận bằng các văn bản
19 Disposal Thông tin về các quyền bản ghi hiện tại và các hoạt động xử lý có liên quan đến bản ghi
20 Formart Thông tin về khuôn dạng của tài liệu số
21 Extent Kích thước vật Mandatory Record
TT Thuộc tính Định nghĩa Điều kiện sử dụng Đối tƣợng sử dụng lý hoặc kích cỡ logic hoặc thời khoản của bản ghi
22 Medium Vật mang vật lý mà bản ghi số được lưu trữ
23 Integrity Check Phương pháp để xác định các bít tạo nên bản ghi số đã bị thay đổi trong quá trình truyền hoặc lưu trữ
24 Location Vị trí (vật lý hoặc hệ thống) hiện tại của bản ghi
25 Document form Dạng thức tài liệu
26 Precedence Một cơ chế mà theo đó tính nhạy cảm thời gian hiện tại của một bản ghi có thể đƣợc gắn cờ
Optional: Tùy chọn Conditional: Có điều kiện Mandate: Bắt buộc
1.3.2 Chuẩn metadata của chính phủ New zealand
Tập các thành tố metadata của New zealand (Phiên bản 2.1) xác định 19 thành tố được thiết kế để cải thiện việc phát hiện, thấy, truy nhập và tương hỗ của thông tin và dịch vụ trực tuyến Các yếu tố này có thể truy nhập đƣợc qua việc miêu tả chuẩn các nguồn dựa trên Web giúp cho người sử dụng xác định thông tin và dịch vụ mà họ yêu cầu
Tập thành tố metadata của Newzealand phức tạp hơn tập chuẩn Dublin Core Tập thành tố có chứa 4 thành tố mới giúp miêu tả nhiều loại nguồn hơn và cho phép miêu tả đầy đủ các nguồn Tuy nhiên Tập thành tố metadata của Newzealand hoàn toàn tương thích với tập yếu tố Dublin Core Tập các thành tố này đƣợc chia thành các nhóm có tính: Bắt buộc, bắt buộc có điều kiện, khuyến nghị nên sử dụng, tùy chọn Cụ thể
- Có 05 yếu tố thuộc nhóm Bắt buộc là: Người khởi tạo (Creator), Chức năng (Function), Chủ đề (Subject), Tên (Title), Dạng (Type)
- Có 03 yếu tố thuộc nhóm Bắt buộc có điều kiện là: Tính có sẵn, Yếu tố nhận biết, và Nhà xuất bản
+ Tính có sẵn (Availability): là yếu tố bắt buộc đối với cơ quan, dịch vụ hoặc tài liệu không trực tuyến; và tùy chọn đối với tài liệu trực tuyến
+ Yếu tố nhận biết (Identifier): là bắt buộc đối với nguồn trực tuyến, khuyến nghị nên sử dụng khi có thể Không sử dụng cho dịch vụ
+ Ban hành (Publisher): là bắt buộc đối với mọi tài liệu, nhƣng không áp dụng đối với dịch vụ
- Có 05 yếu tố là khuyến nghị nên sử dụng là: Độc giả (Audience), Ngày tháng (Date), Miêu tả (Description), Ngôn ngữ (Language), và Luật định (Mandate)
- Có 06 yếu tố khác là tùy chọn: Người cộng tác (Contributor), Độ phủ (Coverage), Định dạng (Format), Quan hệ (Relation), Các quyền (Rights), Nguồn (Source) Định nghĩa tóm tắt các yếu tố metadata của New Zealand
1 Tên (Title): Là tên của nguồn
2 Người khởi tạo (Creator): Là thực thể chịu trách nhiệm chính tạo nội dung của nguồn
3 Chủ đề (Subject): Là chủ đề của nội dung nguồn
4 Miêu tả (Description): Là giải trình về nội dung của nguồn
5 Nhà xuất bản (Publisher): Là thực thể chịu trách làm cho nguồn trở nên có sẵn
6 Người cộng tác (Contributor): Là thực thể chịu trách nhiệm đóng góp vào nội dung của nguồn
7 Ngày tháng (Date): Là ngày tháng liên quan đến sự kiện trong vòng đời của nguồn
8 Dạng (Type): Là bản chất hoặc thể loại nội dung của nguồn
9 Định dạng (Format): Là thể hiện vật lý hoặc số của nguồn
10 Yếu tố nhận biết (Identifier): là tham chiếu rõ ràng của nguồn trong một hoàn cảnh cụ thể
11 Nguồn (Source): Là tham chiếu đến nguồn mà từ đó nguồn hiện tại có đƣợc
12 Ngôn ngữ (Language): Là ngôn ngữ về nội dung tri thức của nguồn
13 Quan hệ (Relation): Là tham chiếu đến nguồn liên quan
14 Độ phủ (Coverage): Là mở rộng hoặc phạm vi đối với nội dung của nguồn
15 Các Quyền (Rights): Là thông tin về quyền đối với nguồn
Có 04 yếu tố mới so với chuẩn Dublin Core là:
1 Chức năng (Function): Là chức năng hoạt động của tổ chức mà nguồn liên quan đến
2 Tính có sẵn (Availability): Thể hiện cách mà nguồn có thể có đƣợc hoặc thông tin liên hệ để có đƣợc nguồn
3 Khán giả (Audience): Là tập hợp các thực thể mà nguồn hướng đến hoặc có ích
4 Luật định (Mandate): Là giấy chứng nhận cụ thể mà nguồn cần có khi tạo hoặc cung cấp.
MÔ HÌNH THỰC THỂ VÀ CÁC HOẠT ĐÔNG QUẢN LÝ VĂN BẢN TRONG CÁC CƠ QUAN NHÀ NƯỚC
Khung pháp lý hiện hành quy định về văn bản, văn bản điện tử
Để tăng cường sử dụng văn bản điện tử trên môi trường mạng phục vụ công tác QLNN của các CQNN từ Trung ương đến địa phương, góp phần cải cách hành chính và phát triển Chính phủ điện tử Đảng, Nhà nước đã chỉ đạo triển khai bằng việc ban hành các văn bản pháp luật thể hiện ý đồ, mục tiêu QLNN và ý chí, quyền lực của Nhà nước nhằm điều chỉnh các quan hệ thông qua hệ thống văn bản pháp luật, cụ thể:
- Văn kiện Đại hội đại biểu toàn quốc lần thứ XI Đảng Cộng sản Việt Nam Chiến lƣợc phát triển kinh tế - xã hội 2011 – 2020
- Quyết định 246/2005/QĐ-TTg ngày 06/10/2005 của Thủ tướng Chính phủ về phê duyệt chiến lƣợc phát triển CNTT và truyền thông Việt Nam đến năm
2010 và định hướng đến năm 2020
- Quyết định 1605/QĐ-TTg ngày 27/8/2010 của Thủ tướng Chính phủ về Chương trình quốc gia về ƯD CNTT trong hoạt động của CQNN giai đoạn 2011 – 2015
- Quyết định 1755/QĐ-TTg ngày 22/9/2010 của Thủ tướng Chính phủ về Đề án “Đưa Việt Nam sớm trở thành nước mạnh về CNTT-TT”
- Chỉ thị 15/CT-TTg ngày 22/5/2012 của Thủ tướng Chính phủ về tăng cường sử dụng VBĐT trong hoạt động của CQNN
- Chỉ thị số 34/2008/CT-TTg về tăng cường sử dụng hệ thống thư điện tử trong hoạt động của các cơ quan Nhà nước
- Luật công nghệ thông tin 67/2006/QH11 ngày 29/6/2006
- Luật lưu trữ 01/2011/QH13 ngày 11/11/2011
- Nghị định 64/2007/NĐ-CP ngày 10/4/2007 của Chính phủ về Ứng dụng CNTT trong hoạt động của CQNN
- Nghị định 01/2013/NĐ-CP ngày 03/01/2013 của Chính phủ về Quy định chi tiết thi hành một số điều của Luật Lưu trữ
- Thông tư 07/2012/TT-BNV ngày 22/11/2012 của Bộ Nội vụ về Hướng dẫn quản lý văn bản, lập hồ sơ và nộp lưu hồ sơ, tài liệu vào Lưu trữ cơ quan
- Nghị định số 110/2004/NĐ-CP của Chính phủ về công tác văn thư lưu trữ Xét từ góc độ thể hiện ý đồ, mục tiêu QLNN, Chiến lƣợc phát triển kinh tế - xã hội 2011 – 2020 ( 1 ) chỉ rõ một trong những biện pháp Nâng cao hiệu lực, hiệu quả QLNN bảo đảm thực hiện thắng lợi Chiến lƣợc này là Đẩy mạnh việc ứng dụng CNTT trong quản lý và điều hành của hệ thống hành chính nhà nước các cấp Chiến lƣợc phát triển CNTT và truyền thông Việt Nam đến năm 2010 và định hướng đến năm 2020 ( 2 ) xác định một trong những nội dung chiến lược xây dựng Chính phủ điện tử là Đảm bảo hệ thống chỉ đạo, điều hành, trao đổi thông tin thông suốt, kịp thời từ Trung ương đến các Bộ, cơ quan ngang Bộ, cơ quan thuộc Chính phủ và các tỉnh, thành phố trực thuộc Trung ương; trên 50% các văn bản được lưu chuyển trên mạng; 100% các cơ quan của Chính phủ có trang thông tin điện tử với đầy đủ thông tin về hoạt động của cơ quan, pháp luật, chính sách, quy định, thủ tục hành chính, quy trình làm việc, các dự án đầu tư, đấu thầu và mua sắm… Chương trình cũng xác định Các dự án ưu tiên cấp quốc gia về xây dựng nền tảng cho phát triển Chính phủ điện tử là: Chuẩn hoá hệ thống lưu trữ và trao đổi thông tin điện tử trong các CQNN; Xây dựng mô hình điển hình đổi mới và tin học hoá các quy trình điều hành, quản lý hành chính của cơ quan quản lý hành chính; Chương trình quốc gia về ứng dụng CNTT trong hoạt động của CQNN giai đoạn 2011 – 2015 ( 3 ) nhằm cụ thể hóa các Chiến lƣợc trên đã đặt ra mục tiêu cụ thể trong ứng dụng CNTT trong nội bộ CQNN là 60% các văn bản, tài liệu chính thức trao đổi giữa các CQNN được trao đổi hoàn toàn dưới dạng điện tử Chương trình giao Bộ Thông tin và Truyền thông chủ trì thực hiện 2 dự án, nhiệm vụ: (1) Hệ thống thông tin quản lý văn bản tích hợp trong toàn quốc cho các cơ quan Chính phủ; và (2) Hỗ trợ nhân rộng mô hình ƯD CNTT điển hình cấp tỉnh, thành phố trực thuộc Trung ương, cấp quận, huyện ( 4 ) Đề án “Đƣa Việt Nam sớm trở thành nước mạnh về CNTT-TT ( 5 ) cũng cụ thể hóa các Chiến lƣợc trên trong Ứng dụng hiệu quả CNTT trong CQNN, doanh nghiệp và xã hội với Nhiệm vụ Triển khai hệ thống quản lý văn bản tích hợp trên toàn quốc phục vụ việc chỉ đạo điều hành thông suốt từ Trung ương đến địa phương
Xét từ góc độ thể hiện ý chí, quyền lực Nhà nước nhằm điều chỉnh các quan hệ thông qua hệ thống văn bản pháp luật, Nghị định số 64/2007/NĐ-CP ngày 10/4/2007 của Chính phủ về ứng dụng CNTT trong hoạt động của CQNN đã quy định: Người đứng đầu CQNN ở các cấp có trách nhiệm chỉ đạo việc ƯD CNTT vào xử lý công việc, tăng cường sử dụng VBĐT, từng bước thay thế văn bản giấy
1 Văn kiện Đại hội đại biểu toàn quốc lần thứ XI Đảng Cộng sản Việt Nam
2 Quyết định số 246/2005/QĐ-TTg ngày 06/10/2005 của Thủ tướng Chính phủ
3 Quyết định số 1605/QĐ-TTg ngày 27/8/2010 của Thủ tướng Chính phủ
4 Phụ lục III - Quyết định số 1605/QĐ-TTg ngày 27/8/2010 của Thủ tướng Chính phủ về Chương trình quốc gia về ƯD CNTT trong hoạt động của CQNN giai đoạn 2011 - 2015
5 Quyết định số 1755/QĐ-TTg ngày 22/9/2010 của Thủ tướng Chính phủ trong quản lý, điều hành và trao đổi thông tin; VBĐT gửi đến CQNN phải được sao lưu trong hệ thống lưu trữ điện tử; và CQNN có trách nhiệm sử dụng chữ ký điện tử để xác nhận VBĐT cuối cùng Chỉ thị số 15/CT-TTg ngày 22/5/2012 của
Thủ tướng Chính phủ về tăng cường sử dụng văn bản điện tử trong hoạt động của CQNN nêu rõ Thực hiện Nghị định số 64/2007/NĐ-CP ngày 10/4/2007 của Chính phủ về ứng dụng CNTT trong hoạt động của CQNN và các chương trình, kế hoạch ứng dụng CNTT đã được Thủ tướng Chính phủ phê duyệt, trong thời gian qua, các CQNN đã nỗ lực ứng dụng CNTT trong công tác quản lý, điều hành, trao đổi văn bản, tài liệu, hướng tới nâng cao hiệu quả hoạt động và bước đầu đạt đƣợc những kết quả quan trọng Tuy nhiên, so với các yêu cầu đặt ra, các CQNN vẫn chƣa tận dụng hiệu quả các điều kiện hiện có để thực sự tạo nên một môi trường làm việc điện tử hiện đại, minh bạch, giảm giấy tờ, tiết kiệm chi phí, thời gian Nhiều CQNN đã đƣợc đầu tƣ hạ tầng kỹ thuật, các hệ thống quản lý văn bản và điều hành, hệ thống thƣ điện tử, nhƣng phần lớn các văn bản vẫn đƣợc trao đổi bằng hình thức giấy tờ truyền thống gây lãng phí thời gian và chi phí, công tác xử lý, điều hành công việc qua mạng của lãnh đạo các cấp rất ít đƣợc thực hiện Để khắc phục tình trạng này, nhằm tăng cường sử dụng văn bản điện tử như một hoạt động cải cách hành chính, phát triển Chính phủ điện tử, chuyển từ phương thức làm việc chủ yếu dựa trên giấy sang phương thức làm việc qua mạng với văn bản điện tử, Thủ tướng Chính phủ chỉ thị: Các Bộ, cơ quan ngang Bộ, cơ quan thuộc Chính phủ, Ủy ban nhân dân tỉnh, thành phố trực thuộc Trung ƣơng có trách nhiệm a) Tăng cường sử dụng văn bản điện tử trong hoạt động nội bộ của mỗi CQNN, trong đó triển khai việc số hóa các văn bản, tài liệu lưu trữ để phục vụ việc tra cứu, tìm kiếm và xử lý thông tin của cán bộ, công chức, viên chức qua mạng; b) Tăng cường sử dụng văn bản điện tử trao đổi giữa các CQNN với nhau, hoặc giữa CQNN với các cơ quan, tổ chức, doanh nghiệp, cá nhân khác, trong đó khi gửi hoặc phát hành văn bản giấy các cơ quan phải gửi kèm theo bản điện tử qua mạng (các loại tài liệu, văn bản hành chính đã đƣợc xác thực bằng chữ ký số và gửi qua mạng thì không phải gửi thêm văn bản giấy); c) Bảo đảm các điều kiện sử dụng văn bản điện tử trong hoạt động của CQNN, trong đó bảo đảm các hệ thống quản lý văn bản và điều hành quản lý, lưu trữ đầy đủ các văn bản điện tử phục vụ xử lý, điều hành công việc và tra cứu thông tin qua mạng
Trong thực tế triển khai, các yêu cầu pháp lý và công nghệ, biện pháp áp dụng cũng đã đƣợc quy định Điều 38 - Nghị định số 64/2007/NĐ-CP quy định: văn bản điện tử gửi đến CQNN phải được sao lưu trong hệ thống lưu trữ điện tử; văn bản điện tử của CQNN phải được đưa vào hồ sơ lưu trữ theo cách bảo đảm tính xác thực, an toàn và khả năng truy nhập văn bản điện tử đó Điều này đã chỉ ra, CQNN phải có hệ thống lưu trữ điện tử đối với văn bản điện tử đến và phải lập hồ sơ lưu trữ đối với văn bản điện tử đi Điều 13 – Luật Lưu trữ ( 6 ) ghi rõ Tài liệu lưu trữ điện tử là tài liệu được tạo lập ở dạng thông điệp dữ liệu hình thành trong quá trình hoạt động của cơ quan, tổ chức, cá nhân được lựa chọn để lưu trữ hoặc được số hóa từ tài liệu lưu trữ trên các vật mang tin khác; Điều 4 – Nghị định số 01/2013/NĐ-CP quy định ( 7 ): Tài liệu lưu trữ điện tử hình thành trong quá trình hoạt động của cơ quan, tổ chức phải được lập hồ sơ, lựa chọn và bảo quản theo nghiệp vụ lưu trữ và kỹ thuật CNTT trong hệ thống quản lý tài liệu điện tử Điều này chỉ ra: Phải có hệ thống quản lý tài liệu điện tử đối với Tài liệu lưu trữ điện tử, trong đó có văn bản điện tử được đưa vào hồ sơ lưu trữ Nói cách khác, những điều này đã chỉ ra: CQNN phải có hệ thống lưu trữ điện tử đối với các loại văn bản điện tử đến, đi và phát sinh trong chính CQNN đó
Hơn nữa, Điều 38 - Nghị định số 64/2007/NĐ-CP cũng quy định: Việc sao lưu hoặc các biện pháp tiếp nhận khác phải chỉ ra được thời gian gửi và phải kiểm tra được tính toàn vẹn của văn bản điện tử; văn bản điện tử của CQNN phải được đưa vào hồ sơ lưu trữ theo cách bảo đảm tính xác thực, an toàn và khả năng truy nhập văn bản điện tử đó Điều 13 – Luật Lưu trữ quy định: Tài liệu lưu trữ điện tử phải đáp ứng các tiêu chuẩn dữ liệu thông tin đầu vào, bảo đảm tính kế thừa, tính thống nhất, độ xác thực, an toàn và khả năng truy cập; được bảo quản và sử dụng theo phương pháp chuyên môn, nghiệp vụ riêng biệt Điều 4, 5 - Nghị định số 01/2013/NĐ-CP quy định: Hệ thống quản lý tài liệu điện tử phải bảo đảm các yêu cầu kỹ thuật để tài liệu lưu trữ điện tử có tính xác thực, toàn vẹn, nhất quán, an toàn thông tin, có khả năng truy cập ngay từ khi tài liệu được tạo lập;
Tài liệu lưu trữ điện tử hình thành từ việc số hóa tài liệu lưu trữ trên các vật mang tin khác phải đáp ứng các tiêu chuẩn dữ liệu thông tin đầu vào Nhƣ vậy, những điều này chỉ ra: Việc tạo lập, lưu trữ, xử lý, trao đổi và bảo mật văn bản điện tử, trong đó có văn bản điện tử hình thành từ việc số hóa văn bản giấy đòi hỏi phải sử dụng thiết bị và công nghệ phần cứng, phần mềm phù hợp và đảm bảo yêu cầu kỹ thuật về xác định thời gian gửi, tính toán vẹn, tính xác thực, tính nhất quán, tính kế thừa, an toàn thông tin, khả năng truy nhập ngay từ khi đƣợc tạo lập, tiêu chuẩn dữ liệu thông tin đầu vào, phương pháp chuyên môn và nghiệp vụ riêng biệt
Mặt khác, trong Nghị định số 64/2007/NĐ-CP, Điều 35 về giá trị pháp lý
6 Điều 13 (Quản lý tài liệu lưu trữ điện tử) –Luật Lưu trữ số 01/2011/QH13 do Quốc hội nước Cộng hoà xã hội chủ nghĩa Việt Nam khoá XIII, kỳ họp thứ 2 thông qua ngày 11/11/2011.
7 Điều 4 (Tài liệu lưu trữ điện tử hình thành trong quá trình hoạt động của cơ quan, tổ chức) - Chương II (Quản lý tài liệu lưu trữ điện tử) – Nghị định số 01/2013/NĐ-CP ngày 03/01/2013 của Chính phủ quy định chi tiết thi hành một số điều của Luật Lưu trữ. của văn bản điện tử quy định: văn bản điện tử phù hợp với pháp luật về giao dịch điện tử có giá trị pháp lý tương đương với văn bản giấy trong giao dịch giữa các CQNN; văn bản điện tử gửi đến CQNN không nhất thiết phải sử dụng chữ ký điện tử nếu văn bản đó có thông tin về người gửi, bảo đảm tính xác thực về nguồn gốc và sự toàn vẹn của văn bản Điều 40 về sử dụng chữ ký điện tử quy định: CQNN có trách nhiệm sử dụng chữ ký điện tử để xác nhận văn bản điện tử cuối cùng;
Chữ ký điện tử của CQNN phải đáp ứng các yêu cầu của pháp luật về giao dịch điện tử
Theo “Báo cáo Ứng dụng Công nghệ thông tin 2012” của Cục Ứng dụng Công nghệ thông tin - Bộ Thông tin và Truyền thông, thực hiện Chỉ thị của Thủ tướng Chính phủ, một số cơ quan, đơn vị đã ban hành những văn bản pháp lý nhằm thúc đẩy, quy định và hướng dẫn về việc tăng cường sử dụng văn bản điện tử trong hoạt động của CQNN Đối với các Bộ, cơ quan ngang Bộ tiêu biểu có
Bộ Y tế, Ngân hàng nhà nước Việt Nam, Bộ Xây dựng, Bộ Thông tin và Truyền thông, Bộ Kế hoạch và Đầu tƣ, Bộ Giao thông vận tải, Bộ Tài chính… Đối với các tỉnh, thành phố trực thuộc Trung ương tiêu biểu có tỉnh Bình Phước, thành phố Đà Nẵng, thành phố Hải Phòng, thành phố Hà Nội… Qua gần một năm triển khai, thực hiện, các cơ quan, đơn vị đã bước đầu tạo được môi trường làm việc điện tử hiện đại, tiết kiệm chi phí, thời gian, góp phần tích cực trong việc cải cách hành chính và nâng cao hiệu quả công việc, tăng tính công khai, minh bạch trong quản lý điều hành công việc Đồng thời, thay đổi nhận thức của lãnh đạo, cán bộ, công chức, viên chức về phương thức làm việc Cụ thể, các cơ quan, đơn vị đã tăng cường sử dụng hệ thống thư điện tử để trao đổi các loại văn bản; chú trọng hơn trong việc nâng cấp hệ thống quản lý văn bản, điều hành và hồ sơ lưu trữ, giám sát nhằm mục đích từng bước chuyển sang giao dịch bằng văn bản điện tử Ngoài ra, đối với những văn bản nội bộ - các cơ quan, đơn vị đã quán triện và sử dụng tối đa Cổng thông tin điện tử, hệ thống quản lý văn bản và hệ thống thƣ điện tử để gửi, nhận văn bản Tỉ lệ văn bản được trao đổi trên môi trường mạng đã tăng đáng kể…
Tuy nhiên cho đến nay, ngoài Thông tƣ số 03/2013/TT-BTTTT ngày 22/01/2013 của Bộ Thông tin và Truyền thông quy định áp dụng tiêu chuẩn, quy chuẩn kỹ thuật đối với Trung tâm dữ liệu; Thông tƣ số 01/2011/TT-BTTTT ngày 04/01/2011 của Bộ Thông tin và Truyền thông công bố Danh mục tiêu chuẩn kỹ thuật về ứng dụng CNTT trong CQNN; Thông tƣ số 24/2011/TT-BTTTT ngày 20/9/2011 của Bộ Thông tin và Truyền thông quy định về việc tạo lập, sử dụng và lưu trữ dữ liệu đặc tả trên trang thông tin điện tử hoặc cổng thông tin điện tử của CQNN; Thông tƣ số 19/2011/TT-BTTTT ngày 01/7/2011 của Bộ Thông tin và
Truyền thông quy định về áp dụng tiêu chuẩn định dạng tài liệu mở trong CQNN;
Nghị định số 26/2007/NĐ-CP ngày 15/02/2007 của Chính phủ quy định chi tiết thi hành Luật Giao dịch điện tử về chữ ky số và dịch vụ chứng thực chữ ky số và Thông tƣ số 09/2011/TT-BCT ngày 30/3/2011 quy định về việc quản lý, sử dụng chữ ký số, chứng thƣ số và dịch vụ chứng thực chữ ký số trong giao dịch điện tử của Bộ Công thương, hiện chưa có văn bản pháp quy nào quy định về chuẩn trao đổi dữ liệu điện tử giữa các CQNN từ Trung ương tới địa phương trên môi trường mạng; về các chức năng cơ bản và quy trình trao đổi, lưu trữ, xử lý tài liệu điện tử (các loại văn bản điện tử như tài liệu, văn bản, báo cáo và các văn bản hành chính khác); về trách nhiệm của các cơ quan, tổ chức, cá nhân trong quá trình xử lý công việc trong hệ thống quản lý tài liệu điện tử Để đảm bảo thực hiện việc trao đổi VBĐT giữa các CQNN, Chương trình quốc gia về ứng dụng CNTT trong hoạt động của CQNN giai đoạn 2011 – 2015 xác định nội dung Bảo đảm môi trường pháp lý bao gồm: Xây dựng quy định về quy trình trao đổi, lưu trữ, xử lý văn bản điện tử trên toàn quốc ; và Xây dựng, ban hành các chuẩn trao đổi dữ liệu điện tử giữa các CQNN Điều 4 - Nghị định số 01/2013/NĐ-CP xác định: Bộ Nội vụ, Bộ Thông tin và Truyền thông quy định các chức năng cơ bản; quy trình trao đổi, lưu trữ, xử lý tài liệu điện tử; trách nhiệm của các cơ quan, tổ chức, cá nhân trong quá trình xử lý công việc trong hệ thống quản lý tài liệu điện tử; Chỉ thị số 15/CT-TTg chỉ đạo Bộ Thông tin và Truyền thông có trách nhiệm: Trong năm 2013, trình Thủ tướng Chính phủ ban hành các quy định cụ thể về việc sử dụng, trao đổi văn bản điện tử đối với tài liệu, văn bản, báo cáo và các văn bản hành chính khác giữa các CQNN từ Trung ƣơng tới địa phương trên môi trường mạng; Hoàn chỉnh hệ thống tiêu chuẩn, quy chuẩn kỹ thuật về chữ ký số và ứng dụng CNTT trong CQNN;… Xây dựng lộ trình bắt buộc thực hiện việc gửi hồ sơ điện tử kèm theo hồ sơ trình giấy tại các cấp từ
Hiện trạng sử dụng hệ thống quản lý văn bản trong các cơ quan nhà nước
Trong những năm gần đây, nhiều cơ quan nhà nước đã được đầu tư hạtầng kỹ thuật, các hệ thống quản lý văn bản và điều hành, hệ thống thƣ điện tử, nhƣng trong thực tế - phần lớn các văn bản vẫn đƣợc trao đổi bằng hình thức giấy tờ truyền thống gây lãng phí thời gian và chi phí, công tác xử lý, điều hành công việc qua mạng của lãnh đạo các cấp rất ít đƣợc thực hiện Để khắc phục tình trạng này và tăng cường sử dụng văn bản điện tử như một hoạt động cải cách hành chính, phát triển Chính phủ điện tử; đồng thời chuyển từ phương thức làm việc chủ yếu dựa trên giấy sang phương thức làm việc qua mạng với văn bản điện tử, ngày 22/5/2012, Thủ tướng Chính phủ đã ký ban hành chỉ thị số 15/CT-TTg về việc tăng cường sử dụng văn bản điện tử trong hoạt động của cơ quan nhà nước
Tại Chỉ thị, Thủ tướng Chính phủ đã yêu cầu các các đơn vị từ cấp đơn vị trực thuộc tại các Bộ, từ cấp sở, ban, ngành, quận, huyện tại các địa phương trở lên phải sử dụng thư điện tử để tăng cường sử dụng văn bản điện tử trong hoạt động nội bộ của mỗi cơ quan; tăng cường sử dụng văn bản điện tử trao đổi giữa các cơ quan nhà nước với nhau, hoặc giữa cơ quan nhà nước với các cơ quan, tổ chức, doanh nghiệp, cá nhân Trong đó chỉ thị đã chỉ rõ các loại văn bản phải trao đổi qua môi trường mạng (thư điện tử, trang/cổng thông tin điện tử) là: Giấy mời họp nội bộ; tài liệu phục vụ họp; văn bản để biết, để báo cáo; thông báo chung của cơ quan; các tài liệu cần trao đổi trong quá trình xử lý công việc; các văn bản quy phạm pháp luật và các loại thông tin khác nêu tại Nghị định số 4/2011/ Đ-CP ngày 13/6/2011 của Chính phủ qu định về việc cung cấp thông tin và dịch vụ công trực tuyến trang trang thông tin điện tử hoặc cổng thông tin điện tử của cơ quan nhà nước Cùng với quy định về trao đổi văn bản điện tử, Thủ tướng cũng chỉ đạo các cơ quan nhà nước phải bảo đảm các điều kiện sử dụng văn bản điện tử trong hoạt động của cơ quan nhà nước bằng cách tận dụng hạ tầng kỹ thuật và các phần mềm hiện có Bên cạnh đó, các cơ quan nhà nước cũng phải từng bước triển khai ứng dụng chữ ký số trong các hệ thống thông tin theo nhu cầu thực tế nhằm thay thế dần việc bắt buộc gửi văn bản giấy có chữ ký và dấu qua đường bưu điện bằng việc gửi văn bản điện tử có chữ ký số qua mạng
Thực hiện Chỉ thị của Thủ tướng Chính phủ, một số cơ quan, đơn vị đã ban hành những văn bản pháp lý nhằm thúc đẩy, quy định và hướng dẫn về việc tăng cường sử dụng văn bản điện tử trong hoạt động của cơ quan nhà nước Đối với các Bộ, cơ quan ngang Bộ tiêu biểu có Bộ Y tế, Ngân hàng nhà nước Việt Nam, Bộ Xây dựng, Bộ Thông tin và Truyền thông, Bộ Kế hoạch và Đầu tƣ, Bộ Giao thông vận tải, Bộ tài chính… Đối với các tỉnh, thành phố trực thuộc trung ương tiêu biểu có tỉnh Bình Phước, thành phố Đà Nẵng, thành phố Hải Phòng, thành phố Hà Nội, …
Qua gần 1 năm triển khai, thực hiện, các cơ quan, đơn vị đã bước đầu tạo được môi trường làm việc điện tử hiện đại, tiết kiệm chi phí, thời gian, góp phần tích cực trong việc cải cách hành chính và nâng cao hiệu quả công việc, tăng tính công hai, minh bạch trong quản lý điều hành công việc Đồng thời, thay đổi nhận thức của lãnh đạo, cán bộ, công chức, viên chức về phương thức làm việc
Cụ thể, các cơ quan, đơn vị đã tăng cường sử dụng hệ thống thư điện tử để trao đổi các loại văn bản; chú trọng hơn trong việc nâng cấp hệ thống quản lý văn bản, điều hành và hồ sơ lưu trữ, giám sát nhằm mục đích từng bước chuyển sang giao dịch bằng văn bản điện tử Ngoài ra, đối với những văn bản nội bộ - các cơ quan, đơn vị đã quán triệt và sử dụng tối đa cổng thông tin điện tử, hệ thống quản lý văn bản và hệ thống thƣ điện tử để gửi, nhận văn bản Tỉ lệ văn bản được trao đổi trên môi trường mạng đã tăng đáng kể
Số liệu tổng hợp về việc triển khai, sử dụng hệ thống Quản lý văn bản và điều hành qua mạng tại các Bộ, cơ quan ngang Bộ[8]
Bảng 2.1 Tình hình triển khai hệ thống Quản lý văn bản điều hành tại các Bộ, cơ quan ngang Bộ
TT Tên Bộ, cơ quan ngang Bộ
Tỉ lệ đơn vị thuộc, trực thuộc đã triển khai
Tỉ lệ đơn vị thường xuyên sử dụng
2 Bộ Giáo dục và Đào tạo 100% 100% 100% 100%
3 Bộ Giao thông vận tải 100% 100% 100% 100%
5 Ngân hàng nhà nước Việt Nam 100% 100% 100% 100%
6 Bộ Tài nguyên và Môi trường 100% 100% 100% 100%
8 Bộ Thông tin và Truyền thông 100% 100% 91,4% 90,0%
9 Bộ Lao động, Thương binh và 100% 100% 60,0% 95,0%
TT Tên Bộ, cơ quan ngang Bộ
Tỉ lệ đơn vị thuộc, trực thuộc đã triển khai
Tỉ lệ đơn vị thường xuyên sử dụng
16 Bộ Kế hoạch và Đầu tƣ 60,6% 62,5% 100% 100%
Bộ Nông nghiệp và Phát triển nông thôn 60,3% 83,3% 100% 85,0%
Bộ Văn hóa, Thể thao và Du lịch 58,8% 7,4% 100% 30,0%
20 Bộ Khoa học và công nghệ 25,0% 15,4% 100% -
* Ghi chú: Dấu “-” là thể hiện không có số liệu
Hình 2.1 Biểu đồ tỉ lệ trung bình số đơn vị thuộc, trực thuộc các Bộ, cơ quan ngang Bộ đã triển khai, sử dụng hệ thống Quản lý văn bản điều hành năm 2011-
Qua số liệu tại Bảng 3.2 và biểu đồ cho thấy: trong năm 2012, việc triển khai, sử dụng hệ thống Quản lý văn bản điều hành đƣợc các cơ quan rất chú ý và tiếp tục đầu tư triển khai Các Bộ như Bộ Công thương, Bộ Xây dựng, Bộ
Y tế, Bộ Văn hóa, thể thao và Du lịch và Ủy ban Dân tộc đã có nỗ lực lớn trong việc triển khai ứng dụng tới các đơn vị thuộc, trực thuộc
Tỉ lệ trung bình các đơn vị thuộc, trực thuộc của các Bộ, cơ quan ngang
Bộ đƣợc triển khai hệ thống đạt 83,5%, tăng nhẹ với năm 2011 (81,1%) Số
Bộ, cơ quan ngang Bộ triển khai hoàn toàn (đạt tỉ lệ 100%) ở năm 2012 ít hơn, chỉ có 9/22 đơn vị so với năm 2011 là 11/22 đơn vị [8]
Trong số các đơn vị đƣợc triển khai, tỉ lệ trung bình các đơn vị thuộc, trực thuộc thường xuyên sử dụng ứng dụng này trong năm 2012 đạt 90,9%, lớn hơn năm 2011 là 4,2% Số các cơ quan có 100% đơn vị thuộc, trực thuộc thường xuyên sử dụng cũng cao hơn năm 2011, có 14/22 cơ quan (đạt 63,6%) [8]
Trong năm 2012, tỉ lệ văn bản đƣợc chuyển hoàn toàn trong môi trường mạng tăng đối với các văn bản chuyển ra ngoài (2012: 34,2%, 2011:
28,0%), và giảm với văn bản đƣợc chuyển trong nội bộ so với năm 2011 (2012: 47,8%, 2011: 51,8%) Điều này được thể hiện cụ thể số liệu bên dưới
Về số lượng văn bản chuyển hoàn toàn trong môi trường mạng với các cơ quan bên ngoài hoàn toàn, trong số 22 cơ quan Bộ và ngang Bộ, không có cơ quan nào đạt mức 100% văn bản được chuyển qua môi trường mạng dù hầu hết các cơ quan nà đều tăng cường trao đổi văn bản qua mạng [8]
Nếu so sánh giữa tỉ lệ văn bản đi/đến đƣợc chuyển hoàn toàn trên môi trường mạng trong nội bộ cơ quan và với các cơ quan bên ngoài, tỉ lệ các cơ quan thực hiện trao đổi văn bản với cơ quan bên ngoài đạt từ 80% trở lên cao hơn so với trao đổi văn bản trong nội bộ cơ quan Điều này đƣợc mô tả trong biểu đồ bên dưới [8]
Bảng 2.2 Hiện trạng trao đổi văn bản trên môi trường mạng tại các Bộ và cơ quan ngang Bộ
TT Tên Bộ, cơ quan ngang Bộ
Tỉ lệ van bản đi/đến đƣợc chuyển hoàn toàn trên môi trường mạng
Nội bộ cơ quan Cơ quan bên ngoài Tổng thể
Bộ Giáo dục và Đào tạo 60.0% 60.0% 60.0% 60.0% 50.0%
Bộ Văn hóa - Thể thao và Du lịch 55.0% 20.0% 45.0% 10.0% 10.0%
TT Tên Bộ, cơ quan ngang Bộ
Tỉ lệ van bản đi/đến đƣợc chuyển hoàn toàn trên môi trường mạng
Nội bộ cơ quan Cơ quan bên ngoài Tổng thể
9 Bộ Giao thông vận tải 47.8% 41.6% 42.6% 35.7% 24.0%
Bộ Nông Nghiệp và Phát triển nông thôn 30.0% 60.0% 10.0% 20.0% 8.0%
Bộ Lao động, Thương binh và Xã hội 20.0% 20.0% 10.0% 10.0% 18.0%
Bộ Tài nguyên và Môi trường 5.0% 5.0% 10.0% 10.0% 10.0%
Bộ Kế hoạch và Đầu tƣ - - - 100.0% 21.0%
Bộ Khoa học và công nghệ 15.0% 85.0% - 85.0% 20.0%
* Ghi chú: Dấu “-” là thể hiện không có số liệu
Hinh 2.2 Biểu đồ tỉ lệ trung bình văn bản đi/đến được chuyển hoàn toàn qua môi trường mạng tại các Bộ, cơ quan ngang Bộ năm 2011-2012
Trong năm 2012, có 44/63 (69,8%; 2011: 21/63 (33,3%)) tỉnh, thành đã hoàn thành việc triển khai ứng dụng hệ thống quản lý văn bản điều hành tới 100% các sở, ban, ngành; có 40/63 (63,5%; 2011: 25/63 (39,7%)) tỉnh, thành đã hoàn thành việc triển khai ứng dụng tới 100% các quận huyện Để đạt đƣợc thành công này, nhiều tỉnh, thành đã rất nỗ lực trong việc triển khai, đặc biệt là các tỉnh: Thái Nguyên, Bạc Liêu, Bình Định, Bình Thuận, Hƣng Yên, Hải Dương, Phú Yên, Tiền Giang, Gia Lai Năm 2011, tỉ lệ triển khai ứng dụng của các tỉnh này ở sở, ban, ngành và quận, huyện rất thấp nhƣng đến năm
2012, tất cả những tỉnh này đều hoàn thành việc triển khai hệ thống tới 100% đơn vị [8] Đối với việc chuyển văn bản hoàn toàn qua môi trường mạng, trong năm
2012, tỉ lệ trung bình số lƣợng văn bản đƣợc chuyển trong nội bộ Ủy ban nhân dân và nội bộ các Sở, ban, ngành tại các tỉnh, thành phố trực thuộc rung ƣơng tăng 4,2% và 8,8% so với năm 2011 (UBND: 2011: 52,3%; 2012: 56,5%;
Sở, ban, ngành: 2011: 37,6%; 2012: 46,4%) Tuy nhiên, tỉ lệ văn bản đƣợc chuyển hoàn toàn qua môi trường mạng giữa Ủy ban nhân dân tỉnh thành, phố với các cơ quan bên ngoài lại giảm 1,4% so với năm 2011 (2011: 25,4%; 2012:
24,0%) Số liệu về hiện trạng tỉ lệ văn bản đƣợc chuyển hoàn toàn qua môi trường mạng tại các tỉnh, thành phố trực thuộc trung ương năm 2011-2012[8]
Mô hình hoá hoạt động quản lý văn bản trong các cơ quan nhà nước
Văn bản hình thành trong hoạt động của cơ quan bao gồm văn bản do cơ quan ban hành và văn bản của các cơ quan khác hoặc cá nhân khác gửi tới, sau khi đã giải quyết xong cần đƣợc lập thành hồ sơ để tiếp tục sử dụng trong hoạt động quản lý của cơ quan và phục vụ các yêu cầu nghiên cứu khác Hồ sơ là một thuật ngữ đƣợc sử dụng khá phổ biến trong công tác hành chính văn phòng và công tác lưu trữ; các hồ sơ được lưu trữ, duy trì và quản lý theo quy định của pháp luật và quy định của cơ quan
Mô hình hóa hoạt động nghiệp vụ của cơ quan đƣợc thể hiện nhƣ sau:
Hình 2.3 Mô hình hóa hoạt động nghiệp vụ
Các thực thể bao gồm:
1 Bản ghi: Là văn bản, tài liệu đƣợc sinh ra trong quá trình thực hiện hoạt động nghiệp vụ (gọi là thực thể Bản ghi);
2 Người hoặc tổ chức trong môi trường thực hiện các nghiệp vụ (gọi là thực thể Tác nhân);
3 Các giao dịch nghiệp vụ (gọi là thực thể Nghiệp vụ); nghiệp vụ quản lý bản ghi là một đại diện của Nghiệp vụ
Khi tác nhân (con người) thực hiện nghiệp vụ, họ tạo ra các tài liệu và các tài liệu này đƣợc quản lý để phục vụ cho việc sử dụng sau này; đồng thời các tài liệu này là bằng chứng của các giao dịch nghiệp vụ Nghiệp vụ ở đây đƣợc hiểu rất rộng bao gồm tất cả các loại hoạt động của cơ quan, tổ chức, xã hội
Tác nhân thực hiện nghiệp vụ trong các bối cảnh của tổ chức và xã hội bị chi phối bởi các ràng buộc bên trong và bên ngoài (ví dụ: tập tục xã hội, pháp luật, tiêu chuẩn, quy định, chính sách ) Các ràng buộc thiết lập người chịu trách nhiệm, và chi phối hoạt động xã hội và tổ chức, bao gồm cả việc tạo ra các tài liệu đầy đủ và chính xác Các tài liệu xác thực của hoạt động xã hội và tổ chức cung cấp bằng chứng về hoạt động đó
Một hệ thống quản lý lưu trữ bản ghi chủ yếu liên quan đến ba lớp thực thể - thực thể Bản ghi (Record entity), thực thể Nghiệp vụ (Business entity), thực thể Tác nhân (People/Agent entity) cùng với các ràng buộc bên trong và bên ngoài liên quan tới các thực thể Bản ghi, Tác nhân, Nghiệp vụ và chi phối mối quan hệ giữa chúng
Các lớp thực thể trong hệ thống quản lý lưu trữ bản ghi được phân thành các tầng khác nhau trong khối liên kết Phân loại các tầng của lớp thực thể đƣợc thể hiện nhƣ sau:
Bản ghi Tác nhân Nghiệp vụ Nghiệp vụ quản lý bản ghi
Thực thể Đơn vị hồ sơ (Item)
Chuỗi giao dịch (Transaction sequence) Tập (File)
Cá nhân/ thiết bị (Person/instrument)
Hoạt động/tiến trình (Activity/Process)
Qui trình nghiệp vụ (Bus.rule)
Chính sách cơ quan (Policies) Pháp luật
Hình 2.4 Phân tầng lớp thực thể
Sơ đồ trên trình bày Tổng quan/chi tiết các liên kết giữa các lớp thực thể lưu trữ tài liệu và các lớp con của chúng Các lớp con (Sub-classes) bao gồm các tầng của khối liên kết các thực thể lưu trữ tài liệu Sơ đồ không minh họa các mối quan hệ giữa các lớp con
Sơ đồ chỉ đƣa ra những tầng nhất định của các khối liên kết Các áp dụng riêng lẻ có thể sử dụng các khối liên kết khác nếu cần thiết tùy vào môi trường nghiệp vụ, yêu cầu của cơ quan, tổ chức Tuy nhiên, khi thông tin liên quan đến metatdata cho việc quản lý văn bản là đƣợc trao đổi giữa các hệ thống nó cần có các tầng cố định trong khối liên kết mà đƣợc trình bày trong cùng một cách thức ở các hệ thống trao đổi metadata
Thực thể Tác nhân (People/Agents)
Thực thể Tác nhân là thực thể sử dụng hệ thống thông tin thực hiện các hoạt động nghiệp vụ, làm phát sinh ra tài liệu và sử dụng các tài liệu cho các mục đích khác nhau trong công việc
Lớp thực thể Tác nhân đƣợc phân tầng thành 04 mức nhƣ sau:
- Nhóm làm việc/Đơn vị tổ chức
Bảng 2.3 Phân tầng lớp thực thể Agent
Tầng Tên trong khối liên kết Các khía cạnh môi trường nghiệp vụ đƣợc đƣa ra
Cá nhân thực hiện các giao dịch nghiệp vụ
Một nhóm người thực hiện các giao dịch nghiệp vụ với mục đích quản lý để đạt đƣợc kết quả công việc
Tổ chức đƣợc ủy thác để thực hiện chức năng
Nhóm các cơ quan liên quan với các chức năng ngoài theo nghĩa các mục đích xã hội mức cao
Thực thể Tác nhân sử dụng hệ thống thông tin đƣợc hệ thống xác thực và phân quyền để truy cập vào chức năng và thực hiện các hoạt động nghiệp vụ
Thực thể Tác nhân có các thông tin (thuộc tính) mô tả sau:
- Category: Là Cá nhân hoặc Tổ/Nhóm hoặc Cơ quan
- Ngày tạo lập (trong hệ thống thông tin)
- Địa chỉ Hộp thƣ làm việc (Địa chỉ hộp thƣ tại Văn thƣ Cơ quan)
- Địa chỉ liên hệ (email)
- Thông tin liên quan (relationship)
Thực thể Bản ghi (Record)
Lớp thực thể Bản ghi đƣợc phân tầng thành 04 mức nhƣ sau:
- Khối liên kết bản ghi
- Hệ thống lưu trữ bản ghi/Lưu trữ cơ quan
Bảng 2.4 Phân tầng lớp thực thể Record
Tầng Tên trong khối liên kết tin
Các khía cạnh môi trường nghiệp vụ đƣợc đƣa ra
1 Record (Đơn vị tin) Đơn vị riêng lẻ nhỏ nhất cần đƣợc quản lý nhƣ một thực thể Các Record có thể chứa các thành phần, các thành phần của Item đƣợc quản lý nhƣ một thực thể đơn trong hệ thống
2 Transaction sequence (Chuỗi giao dịch)
Một chuỗi các Item, đƣợc liên kết về mặt vật lý hay liên kết thực, cho thấy một giao dịch nhất quán đem lại một kết quả cụ thể
3 File (Tập) Một chuỗi các Item, đƣợc liên kết về mặt vật lý hay liên kết thực, mà làm minh bạc hành động nghiệp vụ của tổ chức Mỗi một Item riêng lẻ trên File có mối quan hệ với các Item khác File có thể ở dạng vật lý hay dạng điện tử
4 Series (Loạt) Một tập các bản ghi dữ liệu về hoạt động nghiệp vụ đƣợc tạo và duy trì bởi một cơ quan hay một cá nhân, nó là một chuỗi số, chuỗi theo thứ tự abc, chuối theo thứ tự thời gian, hoặc chuỗi có thể nhận biết khác
5 Archive (Kho) Toàn bộ các bản ghi dữ liệu của một tổ chức hay cá nhân tạo thành kho dữ liệu
6 Archives (Tổng kho) Nhóm các kho dữ liệu tạo thành tổng kho
Thực thể Văn bản có các thuộc tính sau:
Category (Record | Transaction sequence | File | Series | Archive | Archives)
Pháp nhân/CCVC (mã số định danh của Pháp nhân/CCVC)
Nghiệp vụ (mã số định danh nghiệp vụ)
Thực thể Nghiệp vụ (Business)
Lớp thực thể nghiệp vụ đƣợc phân tầng thành 04 mức nhƣ sau:
Bảng 2.5 Phân tầng lớp thực thể Business
Tầng Tên trong khối liên kết
Các khía cạnh môi trường nghiệp vụ đƣợc đƣa ra
(Giao dịch nghiệp vụ) Đơn vị nhỏ nhất của hoạt động nghiệp vụ
Các công việc chính đƣợc thực hiện bởi một tổ chức để hoàn thành mỗi chức năng của họ Hoạt động / quá trình xử lý cần dựa trên một nhóm gắn kết các giao dịch đƣa ra một kết quả duy nhất
Tầng Tên trong khối liên kết
Các khía cạnh môi trường nghiệp vụ đƣợc đƣa ra
Các chức năng đại diện cho những trách nhiệm chính mà đƣợc quản lý bởi một tổ chức để thực hiện các mục tiêu của tổ chức
Các chức năng là toàn bộ các hoạt động của tổ chức
Một quyền hạn hay trách nhiệm xã hội tồn tại bên ngoài một tổ chức Một môi trường cung cấp bối cảnh xã hội rộng hơn mà trong đó các chức năng nghiệp vụ của tổ chức đƣợc thực hiện
Hoạt động nghiệp vụ đều là chuỗi các tác vụ Mỗi tác vụ thực hiện đều có
Tác nhân (cán bộ/tổ chức) chịu trách nhiệm
Mỗi tác vụ, nhiệm vụ, qui trình đều được Cơ quan mô tả tường minh và đƣợc sử dụng để thực hiện nghiệp vụ của Cơ quan Mỗi tác vụ, công việc, qui trình nhƣ vậy đều phải đƣợc mô tả bằng một số thông tin ( Metadata nghiệp vụ ) sau:
Định danh tác vụ/nhiệm vụ/qui trình
Tên tác vụ/nhiệm vụ/qui trình
Category (Transaction hoặc Hoạt động/Chức năng)
Quyền thực hiện (cho các Tác nhân nào)
Thông tin liên quan (relationship)
Các thực thể có mối quan hệ với nhau như sau:
- Tác nhân - Bản ghi: Truy cập, sử dụng bản ghi, lưu trữ bản ghi
- Tác nhân - Nghiệp vụ: Thực hiện hoạt động/nghiệp vụ, phát sinh bản ghi
- Nghiệp vụ - Bản ghi: Lưu trữ, quản lý bản ghi Ở đây, hệ thống các bản ghi đƣợc xem là hệ thống các văn bản, tài liệu
DỮ LIỆU ĐẶC TẢ DÙNG CHO QUẢN LÝ VĂN BẢN ĐIỆN TỬ
Hệ thống quản lý văn bản
Một hệ thống quản lý văn bản đầy đủ phải chứa đựng các yếu tố của ba lớp thực thể - thực thể Bản ghi (Record entity), thực thể Nghiệp vụ (Business entity), thực thể Tác nhân (People/Agent entity) cùng với các ràng buộc (Luật) bên trong và bên ngoài liên quan tới các thực thể đó và chi phối mối quan hệ giữa chúng
Thực thể Nghiệp vụ quản lý bản ghi là lớp con của lớp thực thể Nghiệp vụ
Các thực thể có thể là một phần của thực thể khác theo ý nghĩa vật lý hay ý nghĩa logic là kết quả của việc liên kết, phân cấp, phân loại, Ví dụ một tài liệu trong một file, một file trong một hộp, một giao dịch trong một quá trình, một người trong một cơ quan Mỗi tổ chức nên có những quy tắc về các thực thể nào có thể là một phần của thực thể kia Môi trường nghiệp vụ có thể được đưa ra khác nhau trong các hệ thống nghiệp vụ phụ thuộc vào các yêu cầu của tổ chức
Hệ thống quản lý văn bản đƣợc thiết kế để quản lý các văn bản đòi hỏi các metadata hỗ trợ cho các tiến trình quản lý Một yêu cầu quan trọng của metdata đối việc quản lý văn bản là phải biểu diễn được văn bản trong môi trường nghiệp vụ, thu nhận bằng chứng của mối quan hệ giữa các thực thể và liên kết nó với các đối tƣợng bản ghi khác
Metadata cho mỗi tầng trong khối liên kết trong một thực thể có thể là khác nhau Trong đó có một số các yếu tố là có thể là có chung trong tất cả các tầng, và một số các yếu tố là chỉ có ở trong từng tầng cụ thể của khối liên kết
Metadata có thể đƣợc kế thừa từ một tổng thể cao hơn cho một tổng thể thấp hơn Khái niệm được minh họa cụ thể trong hình bên dưới: Đối tượng metadata metadata metadata Kế thừa
Thừa kế đóng một vai trò quan trọng trong việc quản lý các văn bản Đây là một kĩ thuật để đảm bảo tính nhất quán của thuộc tính metadata, và các thuộc tính đƣợc định nghĩa ở tầng cao hơn không cần thiết đƣợc lặp lại cho các tầng ở cấp dưới.
Dữ liệu đặc tả quản lý văn bản
Các hoạt động chính đối với văn bản nói chung và văn bản điện tử nói riêng bao gồm: Tạo lập văn bản, lưu trữ văn bản, xử lý văn bản và trao đổi văn bản Trong phạm vi nghiên cứu của đề tài sẽ đi sâu vào phân tích hai công đoạn tạo lập và lưu trữ văn bản, là các hoạt động tạo nên hạ tầng cơ sở dữ liệu để thực hiện các thao tác và hoạt động khác trên dữ liệu Văn bản sử dụng trong cơ quan hành chính có 2 loại:
• Văn bản hành chính: Là văn bản đã hoàn chỉnh, được người có thẩm quyền ký, đƣợc cơ quan xác thực (con dấu) Văn bản hành chính có chữ ký và con dấu, có giá trị pháp lý để trao đổi giữa các cơ quan, tổ chức
Văn bản hành chính có thể tồn tại dưới 2 dạng: Văn bản có con dấu và chữ ký truyền thống và văn bản có chữ ký điện tử Văn có chữ ký và con dấu truyền thống tồn tại dưới 2 dạng: Bản gốc và bản sao
• Văn bản soạn thảo: Là văn bản đang trong quá trình hoàn thiện, chƣa được người có thẩm quyền ký và cơ quan xác thực
Văn bản điện tử trong các cơ quan đƣợc định nghĩa là Thông điệp dữ liệu ở dưới dạng điện tử Trong cơ quan hành chính, thông điệp dữ liệu này có các yếu tố hành chính phân biệt với văn bản điện tử thông thường (văn bản thông thường như tệp text một bài báo đang viết), được sử dụng trong các cơ quan hành chính đƣợc gọi là văn bản hành chính điện tử
Vậy Văn bản hành chính điện tử là Thông điệp dữ liệu có đầy đủ các thông tin hành chính (người/cơ quan ban hành), được xác thực Như vậy, theo Nghị định 79 thì bản sao điện tử của Văn bản hành chính có kèm theo các thông tin về: Cán bộ sao y, Cơ quan sao y, Thời điểm sao y là các văn bản hành chính điện tử
Hệ thống thông tin/tin học, phần mềm phục vụ nghiệp vụ hành chính của một Cơ quan (quản lý, tạo lập, lưu trữ, xử lý, trao đổi văn bản…) về bản chất, là một công cụ, do đó nó là một thành phần của hoạt động nghiệp vụ hành chính
Do vậy, nó phải tuân thủ và hoạt động nhƣ một thành phần của hệ thống hành chính, phải đáp ứng đầy đủ các qui định tại các văn bản pháp luật/ văn bản do cơ quan có thẩm quyền qui định
Trong nội dung này, đề tài cố gắng phản ánh mô hình hoạt động nghiệp vụ của cơ quan với sự tập trung chủ yếu vào đối tƣợng thực thể là Văn bản
Văn bản hành chính trong hoạt động nghiệp vụ hành chính cũng chỉ là một thành phần (quan trọng), nghiệp vụ hành chính liên quan chủ yếu đến Tác nhân (Cán bộ công chức, viên chức và Nghiệp vụ (Nhiệm vụ, qui trình thủ tục…) để thực hiện chức năng của Cơ quan
Mối liên quan giữa Tác nhân (cán bộ công chức viên chức/Phòng/ban/Tổ/Nhóm), Nghiệp vụ và Văn bản đƣợc thể hiện rõ trong Hình nêu trên
Dữ liệu văn bản đƣợc phát sinh ra khi thực hiện các giao dịch nghiệp vụ
Dữ liệu phát sinh có đặc điểm sau: a) Dữ liệu phát sinh là kết quả của một hành động nghiệp vụ (event history) b) Dữ liệu phát sinh đƣợc tạo ra để có kế hoạch tiếp tục sử dụng cho mục đích trong tương lai (event plan) c) Dữ liệu phát sinh nằm trong chuỗi giao dịch (Transaction sequence) d) Dữ liệu phát sinh nằm trong hoạt động nghiệp vụ cụ thể cơ quan (File) e) Dữ liệu phát sinh nằm trong bộ phận chức năng (Series) f) Dữ liệu phát sinh nằm trong một đơn vị/ cơ quan: (Archive) g) Dữ liệu phát sinh nằm trong một phạm vi rộng lớn hơn: (Archives) h) Vị trí (location) của bản ghi đƣợc hình thành
Hệ thống quản lý văn bản liên quan đến ba thực thể chính là Agent, Business, Record Do vậy, dữ liệu đặc tả quản lý văn bản (metadata) phải thể hiện đƣợc các mối quan hệ của các thực thể này đối với văn bản (Record) Dữ liệu đặc tả tạo lập và lưu trữ văn bản có thể được tổ chức thành các nhóm, các nhóm chính bao gồm: định danh, tạo lập văn bản, lưu trữ văn bản, quan hệ văn bản, quyền đối với văn bản, Trong mỗi nhóm gồm nhiều thành tố metadata
3.2.1 Dữ liệu đặc tả tạo lập văn bản
Căn cứ Nghị định 110/2004/NĐ-CP về công tác văn thƣ, văn bản hành chính có các trường hợp thể hiện sau:
Hiện nay, tại hầu hết tất cả các cơ quan, bản gốc văn bản là bản giấy Để văn bản sử dụng được trong hệ thống phần mềm, cơ quan tiến hành một bước tin học hóa văn bản gốc để có đƣợc một văn bản hành chính điện tử trong hệ thống
Căn cứ Nghị định 79, bản sao y bản gốc cần phải chứa đựng các thông tin xác thực về:
(4) Bản sao nội dung (scan)
Là văn bản trong quá trình soạn thảo Khái niệm này đƣợc chuyển đổi sang hệ thống phần mềm thành một văn bản đang soạn thảo Một bản thảo văn bản hành chính thông thường luôn có các yếu tố hành chính kèm theo như:
Người chủ trì soạn thảo, Nội dung soạn thảo (đang thực hiện nhiệm vụ được giao nào) các cán bộ tham gia soạn thảo, cán bộ nào soạn thảo nội dung gì, thời gian soạn thảo
Căn cứ Nghị định 110/2004/NĐ-CP, Hệ thống phần mềm phải lưu và xác thực đƣợc các thông tin sau:
Nhiệm vụ được người có thẩm quyền giao (nằm trong Qui trình/Tác vụ đang thực hiện hoặc một nhiệm vụ mới)
Cán bộ chủ trì soạn thảo
Thời gian soạn thảo (Thời gian bắt đầu, thời gian kết thúc)
Độ mật của văn bản
Độ khẩn của văn bản
Nội dung văn bản: Văn bản hành chính điện tử soạn thảo (có thể là một tệp *.doc, một bảng tính *.xls, một dòng Text, hay đơn giản chỉ là một tin nhắn SMS)
Tra cứu văn bản dựa trên dữ liệu đặc tả
Hầu hết mọi người đã quen thuộc với việc sử dụng các bảng chỉ mục trong một cuốn sách Đó là một phần thường đặt ở cuối mỗi cuốn sách, và khi bạn muốn tìm một từ chẳng hạn nhƣ từ chỉ mục, bạn sẽ tìm trong phần bảng chỉ mục từ đó và nó sẽ chỉ cho bạn các trang có liêu quan tới từ chỉ mục Việc sử dụng bảng chỉ mục giúp chúng ta có thể tìm đƣợc các thông tin mong muốn mà không cần phải tìm kiếm trên từng trang của cuốn sách Đương nhiên, với một cuốn sách thì chúng ta vẫn có thể đọc lướt qua từng trang của cuốn sách để tìm kiếm thông tin mong muốn Tuy nhiên, với các thông tin được lưu trữ trong máy tính, kích thước của chúng là hàng gigabyte với hàng triệu trang tài liệu Vì thế, việc duyệt qua các dữ liệu này đối với con người là không thể hay thậm chí nếu được thực hiện bằng máy móc cũng sẽ tốn rất nhiều chi phí và thời gian nếu các thông tin không được đánh chỉ mục Với các lý do này, Các hệ thống lưu trữ và truy vấn thông tin tự động cần phải có khả năng đánh chỉ mục các dữ liệu của mình
3.3.1 Các công nghệ đánh chỉ mục 3.3.1.1 Các khái niệm
Xây dựng một chỉ mục cho một tài liệu không chỉ là việc trích xuất các từ và xây dựng một dữ liệu có cấu trúc dựa trên sự xuất hiện của chúng Các từ phải được phân tích/mổ xẻ trước khi đặt vào một cấu trúc file chỉ mục nào đó Quá trình này đƣợc biết đến nhƣ là chuẩn hóa item (item normalization)
Nói cách khác, đó chính là quá trình lấy ra đơn vị nhỏ nhất của tạo liệu (trong hầu hết các trường hợp đó là các từ) để xây dựng lên một cấu trúc dữ liệu có thể tìm kiếm đƣợc Các từ đƣợc định nghĩa là các biểu tƣợng (là ký tự hoặc số) đƣợc phân cách bởi các biểu tƣợng liên từ (ví dụ nhƣ là khoảng trắng) Một hệ thống tìm kiếm phải đƣa ra quyết định dựa trên việc xử lý các từ, số và các liên từ này
Các tài liệu không chỉ đơn giản đƣợc tạo bởi các từ, chúng đƣợc tập hợp từ các processing token Việc xác định các processing token chính là phần việc đầu tiên của chuẩn hóa item Việc miêu tả các đặc điểm của tokens hay diễn giải nghĩa của các từ chủ chốt (terms) đƣợc xử lý sau khi việc chuẩn hóa đƣợc hoàn thành
Bước tiếp theo trong quá trình chuẩn hóa item là áp dụng danh sách từ phân cách (stop list) vào tập hợp các processing token Danh sách từ phân cách là danh sách các từ mà có ít hoặc không có giá trị trong việc tìm kiếm (ví dụ trong tiếng anh các từ able, about, after, allow, became, been, before, certainly, clearly, enough, everywhere, …) Các từ này thường có ảnh hưởng ít đến việc phân biệt các khái niệm hay các chủ đề trong khi tìm kiếm Từ quan điểm nén dữ liệu, danh sách phân cách sẽ loại bỏ việc xử lý các từ không cần thiết và làm giảm kích thước của chỉ mục đồng thời giảm lượng thời gian và không gian cần thiết để xây dựng cấu trúc dữ liệu có thể tìm kiếm Tuy nhiên, không gian lưu trữ cho danh sách phân cách là không đáng kể so với không gian lưu trữ tổng thể của chỉ mục, vì vậy không gian lưu trữ tiết kiệm được là không đáng kể
3.3.1.2 Cấu trúc file đảo ngƣợc (Inverted File Structure - IFS)
Cấu trúc file đảo ngƣợc đƣợc sử dụng rất rộng rãi trong các hệ thống truy vấn thông tin hay các hệ thống CSDL Chúng bao gồm 3 thành phần đƣợc dùng để xác định tài liệu nào ứng với từ chủ chốt (term) nào trong chỉ mục Thay vì tìm kiếm một từ chủ chốt nào đó trên toàn bộ cơ sở dữ liệu về tài liệu, IFS sắp xếp các thông tin vào một danh sách rút gọn các từ chủ chốt (term), với mỗi một từ chủ chốt (term) sẽ có một tập hợp các tài liệu tương ứng nào đó Việc tìm kiếm này tương tự như khi bạn muốn tìm thông tin về một ngọn núi A trong một cuốn sách tham khảo về địa lý, bạn có thể giở lần lƣợt các trang của cuốn sách để tìm thông tin về ngọn núi hoặc bạn có thể kiểm tra phần chỉ mục trước Phần chỉ mục sẽ chỉ cho bạn biết những trang nào có thông tin về ngọn núi A đó
Trong cả 2 trường hợp, bạn đều có thể tìm được thông tin bạn cần, tuy nhiên cách sau sẽ nhanh hơn rất nhiều
Nhƣ đã nêu ở trên, Có 3 thành phần trong IFS:
File tài liệu (document file): là nơi mỗi tài liệu đƣợc gán một con số định danh duy nhất Đồng thời tất cả các khái niệm (processing tokens) bên trong tài liệu cũng đƣợc xác định (trích xuất) và đặt vào trong thành phần này
Từ điển (dictionary): là một danh sách đƣợc sắp xếp của tất cả các từ chủ chốt (term) duy nhất cùng với một con trỏ đến danh sách đảo ngược(inversion list)
Danh sách đảo ngược (inversion list): bao gồm các con trỏ để trỏ các từ chủ chốt đến các tài liệu tương ứng có chứa các từ đó (Ví dụ trong một chỉ mục của cuốn sách, con trỏ chính là số trang nơi mà từ chủ chốt có thể đƣợc tìm thấy) Để hiểu rõ hơn từng thành phần trong IFS, chúng ta sử dụng bài thơ tiếng anh sau làm ví dụ minh họa:
There once was a searcher named Hanna Who needed some info on manna She put “rye” and “wheat” in her query
Along with “potato” or “cranbeery”
But no mention of “sourdough” or “banana”
Instead of rye, cranberry, or wheat The results had more spiritual meat
So Hanna was not pleased, Nor was her hunger eased, 'Cause she was looking for something to eat
File tài liệu (document file)
Bước đầu tiên trong việc tạo IFS là trích xuất các từ chủ chốt (term) có thể cần dùng trong chỉ mục và gán cho mỗi tài liệu một con số duy nhất Ví dụ với bài thơ trên, để đơn giản, mỗi dòng trong bài thơ trên sẽ đươc coi là một tài liệu (Hình 3.4)
1 There once was a searcher named Hanna
2 Who needed some info on manna
3 She put “rye” and “wheat” in her query
4 Along with “potato” or “cranbeery”
5 But no mention of “sourdough” or
6 Instead of rye, cranberry, or wheat
7 The results had more spiritual meat
8 So Hanna was not pleased,
9 Nor was her hunger eased,
10 'Cause she was looking for something to eat
Hình 3.3 Danh sách các tài liệu
Chú ý rằng chúng ta không chỉ bỏ đi các dấu chấm, dấu phẩy, mà các từ thông dụng mà có ít giá trị trong việc tìm kiếm cũng không đƣợc đƣa vào chỉ mục Điều này dẫn tới việc giảm đáng kể số lƣợng từ đƣợc đánh chỉ mục Với việc loại bỏ nhƣ vậy ta có bảng 3.5
Bảng 3.5 Danh sách các tài liệu sau khi loại bỏ các từ không cần thiết
Số tài liệu Từ chủ chốt
10 không có từ chủ chốt
Danh sách từ điển (Document list)
Bước thứ 2 là trích xuất các từ chủ chốt (term) và tạo ra một từ điển có thể tìm kiếm được của các từ chủ chốt (term) Thông thường, để cho việc tìm kiếm đƣợc dễ dàng thuận lợi, các từ chủ chốt (term) đƣợc sắp xếp theo thứ tự alphabet Tuy nhiên, có thể có cách sắp xếp khác để nhằm mục đích tích kiệm thời gian và không gian Ngoài ra, các processing tokens có thể đƣợc chia nhỏ tới mức từng ký tự với các cấu trúc dữ liệu chuyên biệt mà có thể đem lại hiệu suất cao hơn trong việc tìm kiếm 2 cấu trúc dữ liệu đƣợc biết đến nhiều nhất cho việc xử lý từ điểm là N-grams và PAT tree Đôi khi, danh sách từ điển có thể chỉ rõ cả số lần xuất hiện của từ chủ chốt trong tài liệu Danh sách từ điển cho ví dụ trên đƣợc mô tả trong bảng 3.6
Bảng 3.6 Danh sách từ điển
Từ chủ chốt Tần suất banana 1 cranb 2
Hanna 2 hunger 1 manna 1 meat 1 potato 1 query 1 rye 2 sourdough 1 spiritual 1 wheat 2
Danh sách đảo ngƣợc (Inversion List)
Bước cuối cùng trong việc xây dựng một IFS là kết hợp danh sách từ điển với danh sách tài liệu để hình thành cái gọi là danh sách đảo ngược(inversion list) Danh sách đảo ngược sẽ trỏ đến một hoặc nhiều tài liệu tương ứng khi một từ chủ chốt (term) Thêm vào đó, để có thể chỉ ra chính xác hơn các tài liệu cần truy vấn, danh sách đảo ngƣợc đƣợc xây dựng để có thể trỏ tới khu vực hoặc phần trong tài liệu nơi mà từ chủ chốt (term) đƣợc sử dụng Bảng 3.7 mô tả một danh sách đảo ngƣợc bao gồm cả tài liệu và vị trí của từ chủ chốt (term) trong tài liệu đó Ví dụ, từ “wheat” sẽ xuất hiện đầu tiên trong tài liệu thứ 3 tại ví trí thứ 5 (từ thứ 5 ở trong dòng thứ 3)
Bảng 3.7 Danh sách đảo ngược
Từ chủ chốt Tài liệu/Vị trí banana (5,7) cranb (5,5);(6,4)
Hanna (1,7);(8,2) hunger (9,4) manna (2,6) meat (7,6) potato (4,3) query (3,8) rye (3,3);(6,3) sourdough (5,5) spiritual (7,5) wheat (3,5);(6,6)
Danh sách đảo ngƣợc có thể trở nên phức tạp hơn khi máy tìm kiếm cần phải hỗ trợ việc tìm kiếm các cụm từ liên tục Một cụm từ liên tục đƣợc dùng khi một nhóm từ kết hợp với nhau được yêu cầu bởi người dùng Ví dụ, khi ta cần tìm kiếm một cụm từ “banana bread” có nghĩa là ta chỉ muốn tìm những tài liệu nào mà có từ “banana” đi liền ngay sau từ “bread” Nếu một danh sách đảo ngược lưu trữ vị trí của mỗi từ, thì những chúng có thể đưa ra được những quyết định nhƣ vậy Tất nhiên, đây là những tính năng hữu dụng và nhiều hệ thống có thể làm đƣợc, tuy nhiên để làm đƣợc điều đó thì các hệ thống phải đánh đổi bằng dung lượng lưu trữ lớn hơn và sự tính toán phức tạp hơn
Với một tập hợp các tài liệu, không chỉ có một hệ thống file đảo ngƣợc đƣợc tạo ra Các IFS riêng biệt có thể đƣợc phát triển cho các vùng hay có phần khác nhau của tài liệu chẳng hạn nhƣ phần tiêu đề hay tóm tắt nội dung Một hệ thống file đảo ngƣợc có thể đƣợc xây dựng chỉ cho phần các tác giả với một số luật lệ đặc biệt nào đó chẳng hạn nhƣ không có danh sách phần cách (stop list) Điều này cho phép người dùng có thể tìm kiếm nhanh hơn trên những trường riêng biệt trong CSDL
3.3.1.3 Các cấu trúc file khác