Cơ sở kỹ thuật

Một phần của tài liệu (LUẬN văn THẠC sĩ) nghiên cứu xây dựng phòng đọc ảo phục vụ khai thác sử dụng tài liệu lưu trữ ở việt nam (Trang 59)

CHƢƠNG 2 : CƠ SỞ NGHIÊN CỨU XÂY DỰNG PHÒNG ĐỌC ẢO

2.3. Cơ sở kỹ thuật

Cơ sở kỹ thuật đóng vai trị quan trọng trong việc tạo lập và vận hành phòng đọc ảo bởi đây là loại phòng đọc được sử dụng hồn tồn trong mơi trường mạng. Để phịng đọc ảo có thể phát huy được tác dụng của mình đối với cơng tác tổ chức khai thác, sử dụng TLLT, khi xây dựng cần phải có cơ sở hạ tầng kỹ thuật như sau:

Một là, cổng thông tin điện tử đăng tải dữ liệu để người sử dụng tiếp

cận với phịng đọc ảo. Đối với hình thức khai thác, sử dụng TLLT thơng qua

phịng đọc ảo thì cổng thơng tin điện tử, cụ thể là giao diện của cổng thông tin sẽ là nơi duy nhất mà độc giả có thể tiếp cận tài liệu phục vụ mục đích của

mình. Cổng thơng tin điện tử của phòng đọc ảo sẽ cho phép xây dựng nội dung thông tin từ nhiều nguồn khác nhau cho nhiều đối tượng sử dụng, xác định cách thức hiển thị thông tin cho người dùng và cung cấp các khả năng quản trị, người dùng có thể đăng ký trở thành thành viên của phòng đọc ảo.

Hai là, hệ thống máy chủ đủ mạnh để có thể lưu trữ, bảo quản dữ liệu, cung cấp dữ liệu cho người sử dụng và quản lý người dùng. Máy chủ (Server) là một máy tính được kết nối với một mạng máy tính hoặc Internet, có năng lực xử lý cao và trên đó người ta cài đặt các phần mềm để phục vụ cho các máy tính khác truy cập để yêu cầu cung cấp các dịch vụ và tài nguyên. Như vậy, về cơ bản, máy chủ cũng là một máy tính, nhưng được thiết kế với nhiều tính năng vượt trội hơn, năng lực lưu trữ và xử lý dữ liệu cũng lớn hơn máy tính thơng thường rất nhiều. Máy chủ thường được sử dụng cho nhu cầu lưu trữ và xử lý dữ liệu trong một mạng máy tính hoặc trên mơi trường Internet. Đối với một phịng đọc ảo phục vụ khai thác, sử dụng TLLT thì máy chủ là nền tảng của việc lưu trữ, bảo quản dữ liệu, cung cấp thông tin TLLT cũng như các dịch vụ khác trên Internet tới người sử dụng.

Ba là, phần mềm quản lý hệ thống. Phần mềm quản lý hệ thống phục vụ

xây dựng phòng đọc ảo cần đáp ứng các yêu cầu chức năng và yêu cầu tính năng kỹ thuật. Trong đó,

 Về yêu cầu chức năng:

- Quản lý danh mục: Cho phép người sử dụng tạo lập, quản lý các danh mục của hệ thống như danh mục tên loại văn bản (quyết định, báo cáo, chỉ thị, công văn...), khung phân loại thông tin (gồm các danh mục chia theo từng chuyên đề như "Những vấn đề chung", "Quân sự" "Ngoại giao", "Tôn giáo", "Vật giá"... ), danh mục hồ sơ...

- Quản lý các CSDL cơ quan lưu trữ (các cơ quan lưu trữ từ trung ương đến địa phương kết nối CSDL với TTLTQG III); CSDL phơng/cơng trình/sưu tập lưu trữ (Ví dụ: các phơng/cơng trình/sưu tập được thống kê trong Sách chỉ dẫn các phông lưu trữ bảo quản tại TTLTQG III); CSDL hồ sơ (các hồ sơ thuộc các phông lưu trữ); CSDL văn bản (các văn bản thuộc một hồ sơ) với các thao tác như nhập dữ liệu, tìm kiếm, báo cáo thống kê, kết nối dữ liệu...

- Quản trị người dùng: Cấp quyền cập nhật (nhập mới, sửa, xoá), quyền khai thác sử dụng CSDL cho người sử dụng. Đối với người quản trị nội dung của phòng đọc ảo, phần mềm cho phép các đối tượng có quyền nhập thêm, sửa đổi và xóa các thơng tin chung/tài liệu thông qua tài khoản đã được cấp. Đối với người sử dụng phịng đọc, độc giả được chia thành 2 nhóm (độc giả tự do và độc giả đăng ký tài khoản thành viên của phòng đọc) và mỗi nhóm đều có quyền tiếp cận thơng tin ở các mức độ khác nhau.

- Quản trị hệ thống: Cho phép thiết lập tham số cấu hình cho kết nối máy in, CSDL, thiết lập tham số chế độ làm việc, chế độ nhật ký lượt truy cập phòng đọc ảo hoặc lượt đọc/tải tài liệu..., đăng nhập/đăng xuất tài khoản thành viên của độc giả.

 Về yêu cầu tính năng kỹ thuật:

- Phần mềm phải có kiến trúc, thiết kế mở để dễ dàng nâng cấp đáp ứng sự mở rộng về quy mô ứng dụng đối với các quy trình nghiệp vụ, số lượng người tham gia hệ thống, dung lượng lưu trữ dữ liệu...;

- Mơ hình hệ thống phải cho phép khả năng cài đặt theo mơ hình máy chủ ứng dụng và máy chủ cơ sở dữ liệu;

- Có cơng cụ để sao lưu dữ liệu định kỳ và đột xuất, có cơ chế phục hồi dữ liệu khi hệ thống gặp sự cố;

- Có khả năng lưu trữ được nhiều dạng dữ liệu khác nhau như dữ liệu có cấu trúc, dữ liệu phi cấu trúc được lưu trữ dưới dạng tệp gắn kèm (dữ liệu tệp văn bản, dữ liệu phim, ảnh, âm thanh...);

- Đáp ứng khả năng an tồn, bảo mật thơng tin theo nhiều mức:

+ Bảo mật mức hệ điều hành: Phân quyền truy nhập máy chủ/bảo trì hệ thống và quyền chạy các chương trình ứng dụng;

+ Quyền truy nhập Web: Kiểm soát quyền truy cập tới một phần nào đó của một khơng gian Web.

+ Bảo mật mức CSDL: Ngăn chặn các truy cập dữ liệu trái phép; Kiểm soát phần đĩa sử dụng; Kiểm soát nguồn tài nguyên hệ thống sử dụng; Theo dõi quá trình truy cập của người sử dụng.

Ba mức độ bảo mật trên thuộc hệ thống bảo mật dựa trên các giải pháp công nghệ. Việc kết hợp hệ thống bảo mật này với mức bảo mật dựa trên các quy định hành chính đặc biệt là các quy định của pháp luật về khai thác sử dụng TLLT, sẽ đáp ứng khả năng an toàn và bảo mật thông tin tài liệu của phòng đọc ảo.

- Giao diện được thiết kế thân thiện với người dùng, bố cục giao diện hợp lý giúp cho các thao tác nhập và tra cứu dữ liệu nhanh và thuận tiện;

- Bảo đảm nguyên tắc cung cấp dữ liệu đầu ra cho các hệ thống thông tin khác và chấp nhận đầu vào từ các hệ thống thông tin khác theo chuẩn XML, phục vụ quá trình trao đổi dữ liệu.

Bốn là, mạng Internet băng thông rộng. Internet là một hệ thống thơng

tin tồn cầu có thể được truy nhập cơng cộng gồm các mạng máy tính được liên kết với nhau. Hệ thống này truyền thơng tin theo kiểu nối chuyển gói dữ liệu (packet switching) dựa trên một giao thức liên mạng đã được chuẩn hóa

(giao thức IP). Hệ thống này bao gồm hàng ngàn mạng máy tính nhỏ hơn của các cơ quan, tổ chức, doanh nghiệp và của người dùng cá nhân trên tồn cầu. Mạng Internet sẽ đóng vai trị quan trọng trong việc đưa thông tin tài liệu lưu trữ hịa nhập vào hệ thống thơng tin toàn cầu phục vụ mọi đối tượng với ưu điểm là không giới hạn về khoảng cách địa lý. Tuy nhiên, để có thể thực hiện được điều này thì điều kiện đủ ở đây chính là sử dụng mạng Internet băng thơng rộng. Băng thơng có tên quốc tế là bandwidth, là thuật ngữ được dùng để chỉ lưu lượng của tín hiệu điện được truyền qua thiết bị truyền dẫn trong một giây là bao nhiêu. Có thể hiểu rằng, nếu băng thơng lớn sẽ cho phép số lượng lớn người truy cập cổng thông tin điện tử cùng lúc. Ngược lại, nếu băng thông hẹp (băng thơng nhỏ) thì cổng thơng tin điện tử trở thành "đường làng", hạn chế lượng truy cập cùng một thời thời điểm.

Năm là, các thiết bị công nghệ chuyên dụng như máy tính, máy quét, thiết bị lưu trữ, máy in... Nếu như phòng đọc truyền thống cần đến những trang thiết bị mang tính đơn giản và ít bị chi phối bởi yếu tố cơng nghệ thì phịng đọc ảo lại đòi hỏi các thiết bị hiện đại, phức tạp và chun sâu về cơng nghệ. Bởi lẽ, phịng đọc ảo được vận hành và sử dụng hồn tồn trên máy tính và trong mơi trường mạng. Hơn nữa, thành phần nịng cốt của phịng đọc là nội dung thơng tin TLLT phần lớn lại được tạo lập thơng qua việc số hóa tài liệu truyền thống. Quy trình này địi hỏi một hệ thống các thiết bị như máy quét, máy tính, thiết bị lưu trữ...

2.4. Kinh nghiệm của nƣớc ngồi

2.4.1. Phịng đọc ảo áp dụng tại Lưu trữ quốc gia Mỹ (The United State of America)

Trong hai thập kỷ qua, Hoa Kỳ luôn là một trong những quốc gia dẫn đầu thế giới trong việc phát minh, khám phá, sáng tạo khoa học - kỹ thuật và

nghiên cứu khoa học. Ngay từ những năm cuối của thế kỷ XX, quốc gia này cũng đã sáng kiến và đầu tư kinh phí lớn cho phát triển thư viện số. Họ sớm ý thức được rằng Internet và đặc biệt là công nghệ web, là cơng cụ truyền thơng hữu hiệu nhất tính, cho đến nay trong lịch sử văn minh nhân loại, là xa lộ để truyền tải, giao lưu, chia sẻ và sáng tạo các dữ liệu - thông tin - tri thức không giới hạn của nhân loại. Trong bối cảnh như vậy, lưu trữ cũng là lĩnh vực được ứng dụng công nghệ thông tin nhằm phát triển theo hướng hiện đại hóa, trong đó nổi trội là hình thức tổ chức khai thác, sử dụng TLLT qua phòng đọc ảo. Phòng đọc ảo thuộc lưu trữ quốc gia Mỹ là cổng thông tin trực tuyến công khai chứa tài liệu và thông tin về tài liệu của Lưu trữ Mỹ. Đây thực chất là một trang web tìm kiếm thơng tin thuộc www.archives.gov của Mỹ và cho phép tìm kiếm tất cả thông tin/tài liệu thuộc các trang web khác của www.archives.gov. Mục đích của phịng đọc ảo là giúp người dùng có thể tìm kiếm các dạng thơng tin khác nhau bao gồm: tài liệu bản văn thuộc cơ sở dữ liệu của phòng đọc ảo; các bản kê tài liệu và bản mô tả chi tiết tài liệu thuộc "Danh mục TLLT phục vụ nghiên cứu"; tài liệu về các nhà cầm quyền, các cơ quan tổ chức liên quan; thông tin trên các trang web thuộc Archives.com và các Thư viện tổng thống...

Phòng đọc ảo đầu tiên được xây dựng và trong thời gian qua đã cho phép tiếp cận gần 1 triệu tài liệu thuộc lưu trữ quốc gia Mỹ. Đây là những tài liệu mà độc giả không thể tiếp cận ở bất cứ một cổng thông tin trực tuyến nào khác (trừ trường hợp trực tiếp sử dụng tài liệu tại phòng đọc truyền thống). Đối tượng phục vụ của phịng đọc ảo là cơng dân Mỹ và tất cả độc giả nước ngồi có nhu cầu khai thác, sử dụng tài liệu thuộc lưu trữ quốc gia Mỹ. Đối tượng sử dụng rộng rãi cho thấy mục tiêu phát huy tối đa giá trị của TLLT, góp phần vào kho tri thức chung của nhân loại.

Về cách thức sử dụng, độc giả có thể tìm kiếm, xem và tải về các tài liệu thuộc danh mục cho phép khai thác trực tuyến. Khác với một số website yêu cầu đăng ký tài khoản trực tuyến để có thể tiếp cận với bản tồn văn của tài liệu (sau khi đọc bản tóm tắt nội dung tài liệu), phòng đọc ảo thuộc lưu trữ quốc gia Mỹ cho phép xem và tải về không cần điều kiện đăng ký tài khoản. Khi thực hiện tìm kiếm trên giao diện của phịng đọc ảo, các kết quả tìm kiếm sẽ bao gồm 2 cấp độ: cấp độ 1 là các nguồn chứa tài liệu liên quan đến từ khóa, cấp độ 2 là các tài liệu/thơng tin về tài liệu cụ thể thuộc các nguồn ở cấp độ 1. Chẳng hạn, khi thực hiện tìm kiếm bằng từ khóa "Vietnam", kết quả tìm kiếm sẽ truy xuất tổng số 111.041 kết quả, trong đó gồm:

+ 11.696 tài liệu thuộc kho cơ sở dữ liệu của phịng đọc ảo

+ 88.260 bản mơ tả chi tiết tài liệu (độc giả có thể sử dụng tài liệu theo chỉ dẫn nguồn)

+ 1.474 tài liệu thuộc các trang web của Archives.gov + 4.255 tài liệu thuộc các Thư viện tổng thống

+ 5.356 tài liệu về các nhà cầm quyền, cơ quan tổ chức có liên quan đến từ khóa

Với cách thức cung cấp thơng tin như vậy, phịng đọc ảo sẽ phục vụ nhu cầu tìm kiếm thơng tin lưu trữ liên quan đến một vấn đề, cụ thể nhất là một từ khóa một cách hồn chỉnh nhất có thể.

Hình 2.1: Giao diện của phòng đọc ảo áp dụng tại Mỹ

2.4.2. Phòng đọc ảo áp dụng tại Lưu trữ quốc gia Úc (Australia)

Tài liệu phông lưu trữ quốc gia Úc bắt nguồn từ tài liệu của Chính phủ Úc và Liên bang Úc thời trước, bao gồm tài liệu thể hiện chức năng, nhiệm của của Chính phủ liên quan tới các lĩnh vực khác nhau của đời sống xã hội. TLLT được phát huy giá trị qua nhiều hình thức tổ chức khai thác, sử dụng khác nhau nhằm phục vụ nhu cầu chính đáng của cơng dân. Trong đó, tổ chức sử dụng TLLT qua phịng đọc ảo là một trong những hình thức hiện đại và mang lại hiệu quả cao nhất.

Trước hết cần xác định rằng, phòng đọc ảo được đề cập ở đây là một công cụ trực tuyến tạo điều kiện cho việc sử dụng tài liệu của Lưu trữ quốc

trong quá trình nghiên cứu và giảng dạy. Phòng đọc ảo tạo điều kiện cho giáo

viên và sinh viên tiếp cận các nguồn tài liệu cấp 1 theo chuyên đề thay vì tiếp cận tài liệu một cách rời lẻ trong sách vở như trước đây. Ngồi ra, chức năng của phịng đọc cũng cho phép độc giả tìm hiểu những nguyên tắc và kinh nghiệm khi nghiên cứu tài liệu lưu trữ - một loại hình tài liệu có những đặc thù riêng trong sắp xếp, tổ chức tài liệu với những thuật ngữ chuyên ngành như phông, đơn vị bảo quản, hồ sơ...

Như vậy, khái niệm phòng đọc ảo trên và mục đích của việc thiết lập phòng đọc này đã cho thấy đối tượng chủ yếu mà phịng đọc ảo hướng đến chính là học sinh/sinh viên và giáo viên. Đây là đối tượng độc giả có nhu cầu sử dụng tài liệu cho học tập và nghiên cứu và giảng dạy và cũng là đối tượng được đánh giá cao góp phần vào sự thành cơng của mục tiêu đưa TLLT hỗ trợ đắc lực cho lĩnh vực giáo dục.

Về tài nguyên thông tin, tư liệu trong cơ sở dữ liệu của phòng đọc ảo là một phần nhỏ trong khối tài liệu của Lưu trữ quốc gia và đã được số hóa tồn bộ - những tài liệu số này cho phép độc giả có thể nhìn thấy mọi dấu vết trên tài liệu gốc. Cơ sở dữ liệu có được sau q trình số hóa và đưa ra phục vụ là 6,5 triệu đơn vị bảo quản (chiếm khoảng 10% tổng số khối tài liệu), 15 triệu trang tài liệu được số hóa và khoảng 90.000 bức ảnh. [22] Mặc dù số lượng tài liệu tồn tại trong phòng đọc ảo này chỉ chiếm 10% tổng số tài liệu của lưu trữ quốc gia Úc nhưng tất cả các tài liệu này (thuộc các chủ đề khác nhau) đều bao gồm 1 bảng mơ tả chi tiết về chính tài liệu và được liên kết với khối tài liệu lưu trữ quốc gia Úc. Sự liên kết này tạo điều kiện cho độc giả có nhu cầu khai thác thêm các tài liệu liên quan thuộc phông lưu trữ quốc gia Úc nhưng khơng được đưa vào phịng đọc ảo.

Hình 2.2: Giao diện của phòng đọc ảo áp dụng tại Úc

Phòng đọc ảo thuộc Lưu trữ quốc gia Úc có hai tính năng chính: Lựa chọn nhanh (Quick Picks) và Nghiên cứu tài liệu (Document Studies). Đây cũng là hai cơng cụ tìm kiếm trong phòng đọc ảo (được đưa vào hệ thống trong thời gian gần đây) không phải là ý tưởng sáng tạo mới mà chúng làm cho các nguồn tài liệu truyền thống có thể được tiếp cận theo một cách thức mới. "Lựa chọn nhanh" là tìm kiếm một tài liệu độc lập - có thể là một bức thư, một quyết định của Nội các, giấy chứng nhận quyền công dân, một bức ảnh... Những tài liệu này có thể là một trang tài liệu cụ thể từ khối tài liệu của Lưu trữ quốc gia hoặc từ một chủ đề cụ thể. Công cụ "Nghiên cứu tài liệu" cũng cho phép khai thác tài liệu theo chủ đề và là tài liệu của Lưu trữ quốc gia nhưng được thiết kết theo đơn vị bảo quản, hồ sơ, hoặc phơng tài liệu. Hình

Một phần của tài liệu (LUẬN văn THẠC sĩ) nghiên cứu xây dựng phòng đọc ảo phục vụ khai thác sử dụng tài liệu lưu trữ ở việt nam (Trang 59)