Nghiên cứu một số vấn đề khác

Một phần của tài liệu (LUẬN văn THẠC sĩ) tổng thuật các công trình nghiên cứu khoa học về ứng dụng công nghệ thông tin trong công tác lưu trữ ở việt nam (Trang 104 - 114)

CHƢƠNG 1 : KHÁI QUÁT CÁC CÔNG TRÌNH NGHIÊN CỨU KHOA HỌC

3.2. Đề xuất một số vấn đề cần tiếp tục nghiên cứu

3.2.4. Nghiên cứu một số vấn đề khác

Nhằm hƣớng đến xây dựng một nền lƣu trữ hiện đại thì việc triển khai ứng dụng CNTT trong công tác lƣu trữ phải thực hiện một cách đồng bộ và triệt để. Chẳng hạn: để xây dựng một CSDL TLLT quốc gia, thì việc số hóa TLLT phải song song với việc xây dựng CSDL, ứng dụng các phần mềm quản lý và khai thác

TLLT ở các TTLTQG, lƣu trữ lịch sử địa phƣơng và các cơ quan lƣu trữ khác phải thống nhất và thực hiện một cách đồng bộ, hiệu quả. Bên cạnh đó, các nhà khoa học cũng nhƣ các cơ quan quản lý về lƣu trữ cần tăng cƣờng, đẩy mạnh nghiên cứu các vấn đề mới trong lý luận và thực tiễn áp dụng công nghệ hiện đại vào công tác lƣu trữ nói chung. Ngoài những vấn đề ở trên, tác giả đề xuất một số hƣớng nghiên cứu liên quan đến ứng dụng CNTT trong công tác lƣu trữ.

3.2.4.1. Ứng dụng công nghệ thực tại ảo

Thao tác với các tài liệu đã đƣợc số hóa từ phía ngƣời sử dụng thƣờng nhàm chán và phức tạp khi có lƣợng thông tin lớn dẫn đến mất kiểm soát tổng thể mục tài liệu. Điều này dẫn đến giảm hiệu suất sử dụng TLLT. Trong những năm gần đây, sự phát triển của CNTT, đặc biệt là lĩnh vực đồ họa đã khai sinh ra công nghệ AR (Augmented Reality - Thực tại tăng cƣờng). Tuy đã thâm nhập rất nhanh chóng vào cuộc sống con ngƣời nhƣng các ứng dụng mới chỉ dừng lại ở giải trí, khoa học và giáo dục. Việc áp dụng công nghệ này ngƣời dùng với smartphone có thể đọc thông tin một cách trực quan và sinh động qua cách tổ chức và hiển thị thông tin thời gian thực. Sự kết hợp giữa AR và công tác lƣu trữ sẽ tận dụng đƣợc công nghệ để hiển thị tài liệu đƣợc lƣu trữ theo một cách hoàn toàn mới. Ví dụ: Ngƣời sử dụng muốn tìm tài liệu A hoặc duyệt các tài liệu trên một giá sách. Ngƣời dùng sẽ cài ứng dụng và ứng dụng sẽ hiển thị thông tin bổ sung khi ngƣời dùng chỉ vào một tài liệu cụ thể. Ngƣời dùng thậm chí không cần mở tài liệu cũng có thể nắm đƣợc nội dung tổng thể của tài liệu. Theo tìm hiểu của tác giả, việc ứng dụng công nghệ thực tại ảo vào công tác tra tìm và hiển thị thông tin về tài liệu lƣu trữ là có khả năng. Tuy nhiên, điều kiện ứng dụng nhƣ thế nào?, hiệu quả và những rủi ro ra sao?... Cần các nhà khoa học quan tâm nghiên cứu thêm.

3.2.4.2. Ứng dụng công nghệ web mới (HTML 5)

Phƣơng thức truyền thống và hiệu quả nhanh nhất trong việc phổ biến thông tin đến ngƣời dùng trong kỷ nguyên Internet chính là sử dụng nền tảng Web. Tuy nhiên, các hệ thống với các công nghệ web cũ thiếu tính hấp dẫn và hiệu suất sử dụng thấp. Việc tìm hiểu các nền tảng web mới và ứng dụng, cập nhật bổ sung tính năng mới trên nền dữ liệu đã có là việc rất cần thiết. HTML 5 là công nghệ web mới nhất với các tính năng hỗ trợ mạnh cho giao diện, hoạt họa, điều khiển và tích hợp các ứng dụng nhƣ: game, google map, video player…Nhờ đó khi thiết kế trang web với HTML5 sẽ đem lại trải nghiệm về giao diện và tƣơng tác mới và hấp dẫn hơn rất nhiều so với các trang web công nghệ cũ. Công nghệ này rất hữu ích trong việc thiết kế các trang thông tin điện tử của các TTLTQG hay lƣu trữ lịch sử tỉnh; thiết

kế, xây dựng phòng đọc ảo hoặc các triển lãm TLLT trực tuyến…Ví dụ: Ngƣời dùng có thể tƣơng tác với các TLLT nhƣ thể trên một thƣ viện thật, khi nhấn vào các tài liệu sẽ có hiệu ứng và thông tin hiển thị ra một cách cuốn hút. Ngoài ra, chúng ta có thể thiết kế thêm các dịch vụ hiện đại khác nhƣ thanh toán điện tử, cập nhật thông tin, hay hỗ trợ ngƣời dùng chia sẻ thông tin trên các mạng xã hội một cách dễ dàng. Công nghệ web này đã đƣợc nhiều nƣớc tiên tiến trên thế giới áp dụng, chẳng hạn nhƣ: trang web của Lƣu trữ Quốc gia Singapore, Anh, Mỹ…Vấn đề đặt ra hiện nay đó là: Tại sao rất nhiều cơ quan lƣu trữ ở Việt Nam chƣa có website riêng? Một số Chi cục Văn thƣ Lƣu trữ tỉnh đã có website nhƣng còn đơn giản, thiếu hấp dẫn. Việc ứng dụng công nghệ web mới HTML 5 ở Việt Nam có khả thi hay không? có thể ứng dụng ở những đâu? Điều kiện ứng dụng ra sao?... cần có những nghiên cứu tiếp theo để giải quyết, làm rõ vấn đề trên.

3.2.4.3. Lập trình, phát triển trên nền điện thoại thông minh

Ngày nay, điện thoại thông minh đã trở thành vật bất ly thân đối với rất nhiều ngƣời. Việc thiết lập các ứng dụng điện thoại là một phần mở rộng của các dịch vụ lƣu trữ hiện đại. Đó là một phần tất yếu và khi đƣợc áp dụng sẽ đem lại hiệu quả cao. Ví dụ: TTLTQG I có thể phát triển ứng dụng trên nền di động cho việc tra cứu và thực hiện thao tác mƣợn/trả hay mua/bán, in ấn các hồ sơ TLLT mà họ sở hữu. Với một ứng dụng, ngƣời dùng có thể dễ dàng tìm kiếm tài liệu theo danh mục, trả tiền online cho các tài liệu mà mình cần sử dụng, quét mã code để xác định hạn phải trả, hay bấm nút để in tài liệu trực tiếp qua máy in. Ứng dụng trên nền di động sẽ có hiệu quả không kém các triển khai trên nền web và giúp quảng bá TLLT rộng rãi, cho đa dạng đối tƣợng hơn. Hiện tại, có hai nền tảng chính là IOS và Android. Việc xây dựng ứng dụng trên hai nền tảng này không quá phức tạp và tốn kém, các ứng dụng có thể dễ dàng kết hợp với hệ thống trên nền web nhƣ là một phần mở rộng với dữ liệu thống nhất. Qua nhiều nguồn thông tin mà tác giả tìm hiểu, hiện nay trong công tác lƣu trữ mới chỉ có phần mềm lƣu trữ dữ liệu (lƣu trữ đám mây) đƣợc xây dựng trên nền điện thoại di động (phổ biến nhƣ: Dropbox, Google Drive, Box, Copy…), các ứng dụng khác còn rất khiêm tốn. Khả năng ứng dụng công nghệ này ở Việt Nam nhƣ thế nào? điều kiện và phƣơng pháp ứng dụng ra sao?...cần có sự quan tâm nghiên cứu của nhà khoa học để làm rõ.

3.2.4.4. Công nghệ nhận dạng ký tự quang học (OCR)

Công nghệ nhận dạng ký tự quang học (OCR – Optical Character Recognition), là một công nghệ hỗ trợ việc chuyển các hình ảnh của chữ viết tay hoặc đánh máy từ các máy quét thành các văn bản tài liệu. Bản chất của công nghệ

là dựa trên việc nhận dạng mẫu, trí tuệ nhân tạo và thị lực máy. Các công nghệ trên đƣợc tích hợp vào một phần mềm duy nhất.

Điểm đặc biệt là hiện tại đã có các phần mềm nhận dạng đƣợc các ký tự văn bản tiếng Việt. Các văn bản dạng giấy đƣợc quét trực tiếp từ các thiết bị nhƣ máy quét và đƣợc xử lý, sau đó đƣa ra định dạng tệp tin của Microsoft Word, Excel,... Ví dụ: Phần mềm VnDOCR 4.0.

Dựa trên nền tảng mã nguồn mở, các nhà phát triển còn triển khai một dự án ORC cho tiếng Việt và đƣợc gọi là VietORC do Google tài trợ. Phần mềm hỗ trợ đa dạng các định dạng dữ liệu đầu vào nhƣ PDF, TIFF, JPEG, GIF, PNG và BMP.

Hãng ABBYY đã hỗ trợ việc nhận dạng ký tự quang học học cho tiếng Việt với phần mềm có độ chính xác trong nhận dạng đạt đƣợc 99% với sự hỗ trợ của định dạng dữ liệu đầu vào rất phong phú: PDF, TIFF, JPEG, GIF, PNG, BMP, PCX, DCX, DjVu... Tƣơng tự, đầu ra của phần mềm có thể đƣợc lƣu trữ trên: Microsoft Word, Microsoft Excel, HTML, TXT, XML, PDF, PDF 2 lớp; trong đó định dạng PDF 2 lớp là một định dạng hoàn hảo cho việc lƣu trữ và khai thác tài liệu. Với định dạng này, ngƣời đọc có thể đọc trung thực ảnh gốc nhờ lớp ảnh bên trên, các công cụ tìm kiếm có thể tìm kiếm toàn văn trên văn bản nhờ lớp text nhận dạng đƣợc bên dƣới.

Công nghệ nhận dạng ký tự quang học có vai trò rất lớn trong việc xây dựng các lƣu trữ điện tử. Việc số hóa và lƣu trữ trực tiếp các tài liệu lƣu trữ đã đƣợc số hóa tốn dung lƣợng tƣơng đối lớn, để tối ƣu hơn chúng ta sử dụng phần mềm nhận dạng ký tự quang học để tách dạng text (văn bản) ra khỏi hình ảnh, giúp cho việc khai thác và sử dụng tài liệu lƣu trữ điện tử hiệu quả hơn.

3.2.4.5. Công nghệ xử lý và phục chế ảnh

Trong công tác số hóa tài liệu lƣu trữ, các tài liệu thông thƣờng sẽ đƣợc quét thông qua máy quét hoặc qua các thiết bị chụp ảnh để lƣu thành dữ liệu dạng số để lƣu trữ trực tiếp hoặc qua các bƣớc xử lý nâng cao hơn (Nhận dạng chữ viết).

Hiện tại công nghệ xử lý ảnh đã rất phát triển với nhiều nghiên cứu về thuật toán và kỹ thuật lọc ảnh. Thông thƣờng, để việc sử dụng tài liệu số có hiệu quả thì các tài liệu đƣợc quét hay chụp phải rõ ràng. Tuy nhiên, trong quá trình thực hiện, các hình ảnh này có thể bị mờ do nhiều yếu tố: Máy quét có độ phân giải thấp, xô lệch, máy ảnh lấy nét sai. Với hiện tƣợng này, chúng ta có thể sử dụng một số phần mềm để khắc phục. Ví dụ: SmartDeblur.

Sau khi có đƣợc một hình ảnh có chất lƣợng tốt, đôi khi chúng ta muốn chỉnh sửa hình ảnh đó kỹ hơn. Ví dụ, cắt bỏ phần thừa, xoay lại ảnh,… Để thực hiện các

thao tác này chúng ta có thể sử dụng một số phần mềm miễn phí đơn giản hơn so với Photoshop (phần mềm trả phí).

Ví dụ: Free Image Editor, phần mềm này có các tính năng nhƣ:

- Chỉnh sửa và khôi phục ảnh gốc nhanh chóng chính xác, hiệu quả mạnh mẽ. - Hỗ trợ nhiều định dạng file ảnh: JPEG, JPEG2000, JP2, J2K, JPC, TIFF, PNG, BMP, PCX, DIB, RLE, TGA, TARGA, VDA, ICB, VST, PIX, PBM, PGM, PPM, WBMP, GIF, WMF, EMF, ICO, CUR, CRW, CR2, NEF, RAW, PEF, RAF, X3F, BAY, ORF, SRF, MRW, DCR, PSD, MultiPage TIF, GIF, AVI...

- Chiếm ít bộ nhớ hệ thống và CPU: Không làm ảnh hƣởng tới các tiến trình khác của hệ thống.

- Giao diện đơn giản, dễ sử dụng.

- Tích hợp nhiều công cụ xử lý ảnh chuyên nghiệp: chỉnh sửa, thay đổi kích thƣớc, màu sắc, xoay ảnh, lật ảnh, cắt ảnh, loại bỏ mắt đỏ...

Công nghệ xử lý và phục chế ảnh sẽ góp phần quan trọng trong công tác tu bổ và phục chế các tài liệu lƣu trữ ảnh, qua đó sẽ thúc đẩy chất lƣợng của các tài liệu lƣu trữ ảnh, tạo điều kiện tối ƣu cho đầu vào khi sử dụng phần mềm nhận dạng ký tự quang học.

Nhƣ vậy, những vấn đề nêu trên mới chỉ là những hiểu biết ban đầu của tác giả, nhằm gợi mở, định hƣớng cho các nhà khoa học tiếp tục nghiên cứu, cần có những công trình nghiên cứu sâu hơn, giải quyết triệt để các vấn đề đã đặt ra.

TIỂU KẾT CHƢƠNG 3

Ở chƣơng 3, tác giả đã dựa trên những kết quả nghiên cứu về ứng dụng CNTT trong công tác lƣu trữ từ chƣơng 2, bàn luận về những vấn đề chƣa đƣợc thống nhất hoặc còn nhiều tranh cãi, đồng thời đề xuất một số vấn đề cần tiếp tục nghiên cứu. Các công trình NCKH đã đóng góp không nhỏ cho hệ thống cơ sở lý luận công tác lƣu trữ nói chung và ứng dụng CNTT trong các lĩnh vực của lƣu trữ nói riêng. Qua các công trình mà tôi đã đề cập có thể thấy: Phần lớn các kết quả nghiên cứu đã thống nhất ở nhiều nội dung, trong đó có các thuật ngữ liên quan; khả năng ứng dụng CNTT; về nội dung nghiên cứu; các giải pháp công nghệ và điều kiện để ứng dụng CNTT trong công tác lƣu trữ; bên cạnh đó còn nhiều vấn đề cần đƣợc các nhà khoa học tiếp tục nghiên cứu làm rõ. Đối với những thuật ngữ chƣa thống nhất nhƣ: TLĐT, TLLTĐT; các giải pháp công nghệ nhƣ điện toán đám mây, quy trình số hóa TLLT…rất cần sự vào cuộc của các nhà khoa học, tiếp tục nghiên cứu để làm rõ và thống nhất.

Hơn nữa, tác giả đề xuất biện pháp triển khai ứng dụng CNTT trong công tác lƣu trữ ở Việt Nam; đồng thời đề xuất một số vấn đề mới nhƣ: Nghiên cứu xây dựng kho lƣu trữ thông minh; về triển lãm TLLT trực tuyến; đề xuất một số giải pháp công nghệ mới có khả năng ứng dụng vào công tác lƣu trữ nhƣ: Ứng dụng công nghệ thực tại ảo hỗ trợ tra cứu, hiển thị dữ liệu; Ứng dụng công nghệ web mới (HTML 5) trong tổ chức, quản lý và tra cứu tài liệu trên nền web; Lập trình, phát triển trên nền điện thoại thông minh - ứng dụng trong tổ chức khai thác, sử dụng TLLT; Công nghệ nhận dạng ký tự quang học (OCR); Công nghệ xử lý và phục chế ảnh…

KẾT LUẬN

Nghiên cứu khoa học về ứng dụng CNTT trong công tác lƣu trữ đã đƣợc tiến hành triển khai từ rất sớm: đầu những năm 90 của thế kỷ XX. Cho đến nay, các công trình NCKH trong lĩnh vực này có khối lƣợng tƣơng đối lớn, với nhiều thể loại phong phú, đề cập đến nhiều nội dung đa dạng khác nhau. Mặc dù đã có một số báo cáo tại các Hội thảo khoa học khái quát tình hình nghiên cứu về công tác lƣu trữ nói riêng và ứng dụng CNTT trong công tác văn thƣ – lƣu trữ nói chung; tuy nhiên, chƣa có tác giả nào giải quyết bài toán tổng thuật và đề cập đến phạm vi rộng nhƣ đề tài luận văn của tôi.

Dựa trên những mục tiêu đã đặt ra, đề tài của tôi đã giải quyết đƣợc những vấn đề chính sau đây: Làm rõ những khái niệm, thuật ngữ đƣợc sử dụng chủ yếu trong luận văn. Tổng quan các công trình NCKH về ứng dụng CNTT trong công tác lƣu trữ (số lƣợng, loại hình, thời gian, tác giả thực hiện, nội dung và phƣơng pháp nghiên cứu). Tiếp đến, tác giả hệ thống và phân tích các kết quả nghiên của 50 công trình nghiên cứu (chọn lọc) về ứng dụng CNTT trong công tác lƣu trữ bao gồm: Những thuật ngữ liên quan; khả năng ứng dụng CNTT; tầm quan trọng; nội dung; các giải pháp công nghệ và điều kiện để ứng dụng CNTT trong công tác lƣu trữ; những tài liệu, tƣ liệu đƣợc các công trình sử dụng. Phần cuối cùng, tác giả bàn luận về những vấn đề đã đƣợc nghiên cứu nhƣng chƣa thống nhất; đồng thời đề xuất một số vấn đề cần tiếp tục nghiên cứu liên quan đến việc ứng dụng CNTT trong công tác lƣu trữ ở Việt Nam; tuy nhiên các đề xuất của tác giả chỉ mang tính định hƣớng, trên thực tế đòi hỏi những nghiên cứu chuyên sâu khác.

Tóm lại, đề tài luận văn thạc sỹ của tôi đã chứng minh đƣợc giả thuyết (thứ hai) mà tôi đặt ra là đúng: Ở Việt Nam đã có nhiều công trình NCKH và các công trình này đã giải quyết được một số vấn đề về ứng dụng CNTT trong công tác lưu trữ, nhưng vẫn còn nhiều vấn đề chưa được giải quyết. Mong rằng trong thời gian tới, các nhà khoa học sẽ dành sự quan tâm nghiên cứu hơn nữa, góp phần lấp đầy những “khoảng trống” trong nghiên cứu về ứng dụng CNTT trong công tác lƣu trữ ở Việt Nam, thúc đẩy mục tiêu và quá trình xây dựng, phát triển một nền lƣu trữ hiện đại./.

TÀI LIỆU THAM KHẢO A. Tài liệu tiếng Việt

1. Bộ Chính trị (2000), Chỉ thị số 58-CT/TW ngày 17/10/2000 về đẩy mạnh ứng dụng khoa học công nghệ thông tin phục vụ sự nghiệp công nghiệp hóa, hiện đại hóa.

2. Bộ Nội vụ (2012),Quyết định số 579/QĐ-BNV ngày 27/6/2012 về Phê duyệt Quy hoạch ngành Văn thƣ Lƣu trữ đến năm 2020, tầm nhìn đến 2030.

3. Bộ Quốc phòng Australia (1995), Cải tiến công tác quản lý tài liệu điện tử, Canberra (bản dịch).

4. Quốc Bình, Trƣơng Văn (2005), Từ điển giải thích thuật ngữ Công nghệ thông tin Anh – Anh – Việt, NXB Thống kê, Hà Nội, tr.573-574.

Một phần của tài liệu (LUẬN văn THẠC sĩ) tổng thuật các công trình nghiên cứu khoa học về ứng dụng công nghệ thông tin trong công tác lưu trữ ở việt nam (Trang 104 - 114)