Những yếu tố tác động đến chất lượng ảnh số

Một phần của tài liệu Nghiên cứu triển khai số hóa tài liệu lưu trữ đang bảo quản tại Cục Lưu trữ Quốc gia Lào (Trang 40)

8 Bố cục của đề tài

1.4.4 Những yếu tố tác động đến chất lượng ảnh số

Chất lượng của ảnh số phụ thuộc vào 6 yếu tố cơ bản đó là: + Tình trạng của tài liệu (Condition of records)

+ Độ phân giải, độ ngưỡng và độ sâu màu (Resolution, Threshold and Bit depth)

+ Hiệu chỉnh ảnh (Image Enhancement)

+ Quá trình nén và định dạng file (Compression and File Format) + Thiết bị sử dụng và hiệu suất của thiết bị đó (System Performance) + Quyết định của người vận hành (Operator Judgement)

Những ảnh hưởng của các yếu tố này đối với chất lượng ảnh số sẽ được trình bày lần lượt dưới đây:

1.4.4.1 Tình trạng của tài liệu

Tình trạng của tài liệu được chia thành 2 bộ phận: tình trạng về vật lý và tình trạng về nội dung thông tin của tài liệu. Cả 2 bộ phận này đều tác động đến chất lượng của ảnh, phương pháp xử lý và các vấn đề khác. Đối với tình trạng vật lý của tài liệu, phần lớn là vật mang tin trên giấy bị rách, thủng, mốc, ố vàng, giòn, gỉ… những yếu tố này làm cho giấy bẩn khiến cho độ tương phản của giấy bị giảm xuống, giảm khả năng phản quang của giấy đối với máy quét… tác động đến chất lượng của ảnh quét.

43

Đối với tình trạng nội dung thông tin của tài liệu, phần lớn là chữ mờ, mực bị phai do chất lượng bảo quản không đảm bảo, chất lượng bản thân mực, tác động của sự hư hỏng, xuống cấp của vật mang tin… đã khiến cho nội dung thông tin bị mờ nhạt hoặc mất đi một phần hoặc tất cả. Đối với tài liệu hư hỏng nặng cả về tình trạng vật lý lẫn nội dung thông tin thì dù quét tài liệu với độ phân giải cao, kỹ thuật hiệu chỉnh ảnh… thì cũng rất khó có thể làm cho chất lượng nó tốt hơn, thậm chí không thể áp dụng phương pháp quét ảnh.

Thông qua những vấn đề đã nêu trên, có thể nói rằng tình trạng của tài liệu là một trong những yếu tố hàng đầu tác động trực tiếp, đầu tiên đến chất lượng ảnh quét. Vì vậy, trước khi lựa chọn tài liệu để số hóa, chúng ta phải tiến hành khảo sát, đánh giá tình trạng tài liệu một cách khách quan để đề ra biện pháp xử lý phù hợp trong từng trường hợp cụ thể.

1.4.4.2 Độ phân giải, độ ngưỡng và độ sâu màu

Trong một văn bản, nội dung thông tin là yếu tố quan trọng nhất. Khi số hóa, chúng ta phải đảm bảo rằng tất cả những nội dung trong bản văn phải được thể hiện đầy đủ nhất, kể cả những nét chữ nhỏ nhất, có ý nghĩa đối với bản văn đó. Do đó, việc xác định độ phân giải bao nhiêu là phù hợp để đảm bảo ảnh đầu ra có chất lượng tối ưu đã được đặt ra cuối thế kỳ XX. Độ phân giải được đo bằng tổng số điểm ảnh được thể hiện trên mỗi inch vuông – DPI (Dots per inch). Tức là nếu tổng số điểm ảnh trên mỗi inch lớn bao nhiêu thì độ sắc nét của các chi tiết nhỏ trên bề mặt của tài liệu càng được biểu hiện rõ nét bấy nhiều.

Ví dụ: hình dưới đây, các ký tự được quét với độ phân giải khác nhau sẽ cho độ nét, chi tiết thông tin ít nhiều khác nhau. Chúng ta sẽ thấy rằng ký tự được quét với độ phân giải 600 dpi cho chi tiết ảnh sắc nét, đầy đủ hơn các ký tự được quét với độ phân giải thấp. Tuy nhiên, việc tăng độ

44

phân giải cao đến mức độ nhất định thì chi tiết của ảnh số cũng không cải thiện được bao nhiêu, thậm chí chỉ tăng dung lượng của file ảnh số đó.

Ngoài độ phân giải thì độ ngưỡng7

và độ sâu màu8 vẫn là 2 yếu tố ảnh hưởng đến chất lượng ảnh. Đối với ảnh đen trắng, độ phân giải và độ ngưỡng là hai yếu tố ảnh hưởng đến chất lượng ảnh. Đối với ảnh xám và màu, độ phân giải và độ sâu màu là hai yếu tố ảnh hưởng đến chất lượng ảnh. Việc đặt chuẩn độ phân giải, độ ngưỡng và độ sâu màu phù hợp sẽ giúp chúng ta rất nhiều trong việc cân bằng giữa chất lượng và năng suất đầu ra của ảnh số theo mục tiêu đã đặt ra; ước tính được nguồn kinh phí đầu tư như: phương tiện thiết bị để quét, lưu trữ, hiển thị, chuyển dữ liệu…; nguồn nhân lực; thời gian tiến hành và nhiều thứ khác liên quan đến quá trình thực hiện của chuỗi số hóa. Vì vậy, việc lựa chọn kỹ thuật phù hợp để quét tài liệu lưu trữ chủ yếu phụ thuộc vào mục tiêu đặt ra đối với chất lượng sản phẩm số, khả năng về tài chính, nguồn nhân lực và thời gian.

1.4.4.3 Hiệu chỉnh ảnh

Đây là quá trình cải thiện chất lượng ảnh quét. Đối với những tài liệu có tình trạng vật lý và nội dung thông tin kém một phần hoặc tất cả như: giấy bị rách, vết ố vàng, vết gỉ, bụi bẩn, độ tương phản của giấy với

7

Độ ngưỡng (Threshold) là thuật ngữ được dùng trong kỹ thuật quét đen trắng để chỉ một điểm trên thước đo mà tại đó các giá trị thể hiện màu xám được dịch thành các điểm ảnh trắng hoặc đen.

8

Độ sâu màu (Bit depth) được xác định bằng số lượng chữ số nhị phân được sử dụng để thể hiện mỗi điểm ảnh.

Dpi cần thiết Độ phân giải Chất lƣợng ảnh số

Khi độ phân giải tăng đến mức độ nhất định thì chất lƣợng ảnh vẫn không đổi

Hình 1.10:Tác động của độ phân giải với độ nét của chữ và độ phân giải cần thiết khi quét

45

nội dung thông tin thấp (hình ảnh quá tối khiến cho khó đọc…), chữ mờ… khiến cho chất lượng sau khi quét thấp. Để giải quyết vấn đề này các phần mềm kèm theo máy quét và phần mềm hỗ trợ về đồ họa (Adobe Photoshop, MS Photo Editor…) đã cho phép nhà chuyên môn có thể tiến hành hiệu chỉnh hình ảnh với khả năng không hạn chế trong thế giới ảnh số. Tùy theo mức độ tình trạng tài liệu sẽ đòi hỏi cách thức hiệu chỉnh ảnh ít nhiều, đơn giản hoặc phức tạp khác nhau để nâng cao chất lượng ảnh phù hợp theo yêu cầu. Tuy nhiên, khi áp dụng những phần mềm để hiệu chỉnh ảnh đối với tài liệu lưu trữ cần phải rất thận trọng về chi tiết, nội dung thông tin chứa trong nguyên bản. Việc hiệu chỉnh ảnh không được làm thay đổi đi nội dung ban đầu của tài liệu, chỉ cho phép nâng cao chất lượng hiển thị của nó tốt hơn như: tăng độ nét, đậm của chữ, điều chỉnh độ sáng, độ tương phản, độ ngưỡng để giảm vết ố vàng, vết bẩn… và một số kỹ thuật hiệu chỉnh khác. Đối với ảnh quét tài liệu lưu trữ, phổ biến được tạo thành 3 bản: bản master, bản phát sinh và bản hiển thị trên trang web (thumbnail image). Mỗi bản sẽ có yêu cầu về mức độ hiệu chỉnh khác nhau như:

+ Bản master: được tạo ra nhằm mục đích để bảo quản, bảo hiểm dự phòng đối với nguyên bản gốc và in với yêu cầu chất lượng cao, đồng thời là cơ sở để tạo bản phát sinh và bản hiển thị trên trang web. Do đó bản master là bản có chất lượng ảnh cao nhất được quét với độ phân giải cao (kích thước ảnh lớn) và lưu với định dạng file ổn định (TIFF), không nén (Non-compression) để lưu chi tiết hình ảnh đầy đủ nhất. Cho nên, yêu cầu hiệu chỉnh đối với bản này là ít hơn so với hai bản kia, phần lớn chỉ tăng độ sáng tối vì phải đảm bảo độ trung thực nhất có thể đối với nguyên bản gốc.

+ Bản phát sinh: Bản phát sinh là bản được tạo trên cơ sở bản master bởi phần mềm chuyên dụng để phù hợp yêu cầu sử dụng với chất lượng chấp nhận được. Thông thường bản này được hiệu chỉnh nhiều hơn các điểm khuyết tật, hạn chế, cả hình thức lẫn nội dung để phù hợp với yêu

46

cầu sử dụng khác nhau như: tẩy xóa những vết bẩn, ố vàng, tăng giảm độ sáng, độ tương phản, độ ngưỡng, màu sắc… nhưng vẫn đảm bảo về độ trung thực của thông tin. Phần lớn các bản phát sinh được lưu với nhiều định dạng file khác nhau như: JPEG, PDF/A… nén mất hoặc không mất ở những mức độ nhất định theo yêu cầu đặt ra. Phiên bản này được đưa vào tổ chức khai thác sử dụng cho độc giả.

+ Bản hiển thị: được tạo ra trên cơ sở của bản phát sinh nhằm mục đích hiển thị, quảng cáo tài liệu trên trang web vì kích thước nhỏ, giúp cho việc tải thông tin, hình ảnh trên trang web nhanh chóng hơn. Yêu cầu hiệu chỉnh đối với bản này không nhiều, phần lớn là thay đổi định dạng file ảnh trên cơ sở của bản phát sinh thành định dạng file như: GIF, JPG với độ phân giải là 72 ppi và nén.

Cần lưu ý rằng tất cả những công việc, chi tiết về hiệu chỉnh ở mỗi phiên bản cần phải được ghi chép và lưu trữ để làm bằng chứng, căn cứ khi có sự nâng cấp hệ thống phần cứng, phần mềm sau này hoặc yêu cầu sử dụng tài liệu đó. Điều này sẽ giúp độc giả biết được mức độ chính xác của nội dung thông tin của bản số hóa đối với nguyên bản gốc mà họ đang dùng.

Hình 1.11:Tác động của việc hiệu chỉnh ảnh quét

(Tăng độ tương phản của văn bản mờ (Trái) trong chế độ Multiplay hòa trộn (bên phải) bằng phần mềm Photoshop)

Hai bên đều được quét cùng độ phân giải và độ ngưỡng, nhưng ảnh ở bên tay phải được hiệu chỉnh độ nét chữ với lệnh Sharpen trong phần mềm máy quét.

47

1.4.4.4 Quá trình nén và định dạng file

Quá trình nén và lưu file ảnh với định dạng khác nhau có ảnh hưởng đến chất lượng của ảnh quét. Mục đích của phương pháp nén file ảnh là nhằm giảm kích thước của file ảnh để phù hợp với mục đích sử dụng khác nhau. Do phần lớn bản master thường có kích thước lớn không phù hợp với mục đích truy cập, chuyển dữ liệu qua mạng, hiển thị trên thiết bị điện tử có cấu hình thấp, khai thác trên trang web hoặc các mục đích khác. Có 2 cách nén: nén mất (lossless compression) và nén không mất (lossy compression). Nén không mất phù hợp với mục đích lưu trữ, đòi hỏi chất lượng ảnh cao như: ảnh phẫu thuật, bản vẽ kỹ thuật vì không làm giảm chất lượng ảnh. Đối với nén mất phù hợp với mục đích chuyển dữ liệu qua mạng, giảm dung lượng lưu trữ trong ổ đĩa hoặc các mục đích khác không đòi hỏi chất lượng ảnh cao. Tuy nhiên, chúng ta cần lưu ý trong việc áp dụng những phần mềm nén đối với tài liệu lưu trữ, vì hiện tại có rất nhiều phần mềm nén ảnh cho chất lượng ảnh không giống nhau, có thể dẫn đến làm giảm chất lượng của ảnh.

Việc lưu ảnh với định dạng file khác nhau cũng ảnh hưởng đến chất lượng ảnh mặc dù quét ở độ phân giải, độ sâu màu cao. Ví dụ: quét tài liệu với độ phân giải 300 dpi, với độ sâu màu 24 bit. Nếu lưu với dạng file TIFF thì chất lượng ảnh sẽ cao hơn so với lưu với dạng file JPEG, đồng thời kích thước ảnh lưu dạng file TIFF cũng cao hơn so với dạng file JPEG. Riêng khi quét tài liệu lưu trữ cần lưu ý việc áp dụng cách nén và chọn định dạng file như:

- Đối với ảnh master thường được quét với độ phân giải cao và không nén hoặc nén không mất, lưu dưới dạng file TIFF.

- Đối với ảnh phát sinh được hiệu chỉnh trên cơ sở bản master bằng phần mềm hiệu chỉnh ảnh (như Photoshop…) để nén ảnh và thay đổi định dạng phù hợp với mục đích sử dụng khác nhau như: lưu với dạng file: JPEG, PDF/A... nén mất với mức độ chất lượng nhất định.

48

- Đối với bản hiển thị (Thumbnail) được hiệu chỉnh trên cơ sở bản phát sinh bằng phần mềm hiệu chỉnh ảnh để nén ảnh và thay đổi định dạng file phù hợp với mục đích sử dụng như: GIF, JPG…

Hình 1.12: Ảnh hưởng của quá trình nén và định dạng file ảnh

Qua trình bày, chúng ta sẽ thấy rằng cách nén và lựa chọn định dạng file cũng là một trong những yếu tố ảnh hưởng đến chất lượng của ảnh. Vì vậy, khi quét tài liệu lưu trữ đòi hòi cách xử lý, áp dụng các phương pháp khác nhau, phù hợp với từng phiên bản (bản master, phát sinh và hiển thị) để đáp ứng yêu cầu quản lý và sử dụng được xác định.

1.4.4.5 Thiết bị sử dụng và hiệu suất của thiết bị

Thiết bị là một trong những bộ phận quan trọng trong chuỗi số hóa. Trong hệ thống các thiết bị trong chuỗi số hóa bao gồm hai phần cơ bản: phần cứng và phần mềm. Cả hai bộ phần này có mối liên hệ tác động lẫn nhau. Thông thường chuỗi số hóa đầy đủ gồm có 6 phần cứng và phần mềm đi kèm như:

- Máy quét/máy chụp ảnh số

- Máy tính

Bản master lưu dạng file TIFF, không nén, kích thước ảnh là 26.8 MB. (Do kích thước ảnh thực quá lớn nên không thuận lợi khi đưa vào luận văn, ảnh này chỉ mang tính chất minh họa)

Bản phát sinh lưu với dạng file JPEG, nén mất, kích thước ảnh là 774 KB.

Bản hiển thị với dạng file GIF, nén mất 50%, kích thước ảnh là 6.42 KB.

49 - Thiết bị lưu trữ

- Hệ thống mạng

- Máy in

Hiệu suất của các thiết bị trên cũng phải có sự tương đương, thích hợp với nhau trong chuỗi số hóa. Nếu một thiết bị có hiệu suất thấp còn các thiết bị khác thì cao, chúng sẽ ảnh hưởng đến hiệu suất của quy trình vận hành chung. Ví dụ: trang bị máy quét chất lượng cao, đắt tiền nhưng cấu hình máy tính lại thấp, khiến cho việc xử lý ảnh chậm.

Vì vậy, mục đích sử dụng sản phẩm đầu ra sẽ quyết định đến mức độ, cấu hình, khả năng của phần cứng, phần mềm trong chuỗi số hóa. Việc thiếu tính toán đầy đủ, khách quan về sản phầm đầu ra đối với phần cứng, phần mềm sẽ ảnh hưởng tiêu cực tới chất lượng ảnh nói riêng, tới sự thành bại của dự án số hóa nói chung.

1.4.4.6 Quyết định của người vận hành

Ngoài phần thiết bị số hóa thì con người cũng là một trong những yếu tố rất quan trọng quyết định đến chất lượng đầu ra của sản phẩm ảnh số9. Các thiết bị trong chuỗi số hóa chỉ đóng vai trò giúp con người tạo được những sản phẩm đã được xác định theo các lệnh điều khiển. Nhưng chúng có đạt được mức độ chất lượng cao hay thấp lại phụ thuộc vào yếu tố quyết định của con người, bởi vì con người là người tạo ra chúng, đồng thời là đối tượng sử dụng chúng.

Có thể nói rằng việc đánh giá chất lượng ảnh số đạt hay không đạt là do quyết định của con người. Nhưng con người luôn luôn có tính chủ quan xen kẽ trong quá trình quyết định. Cho nên với tình trạng tâm lý, kinh nghiệm xử lý ảnh… khác nhau sẽ cho kết quả quyết định khác nhau. Do đó, trong quá trình tiến hành số hóa, những trung tâm lưu trữ tiên tiến đã trang bị các công cụ để giúp cho người vận hành có khả năng quyết định hợp lý. Các công cụ đó chủ yếu bao gồm: bản hướng dẫn quy trình

9 Tài liệu sau khi đã được quét sẽ trở thành file ảnh số trong môi trường điện tử hay còn được gọi là sản phẩm đầu ra.

50

quét tài liệu, bảng tiêu chuẩn đánh giá chất lượng ảnh... Những công cụ này sẽ giúp người vận hành trong quá trình quét như: trình tự quét, đánh giá chất lượng qua màn hình, in ra hoặc so sánh giữa chất lượng ảnh quét với bản gốc. Việc kiểm tra chất lượng ảnh được tiến hành ở các mức độ khác nhau. Đối với những tài liệu quý hiếm, rách hoặc tình trạng vật lý kém thì việc kiểm tra chất lượng được thực hiện một cách tỉ mỉ, đầy đủ để đảm bảo tất cả các chi tiết quan trọng của thông tin đạt được chất lượng như bản gốc. Đối với những tài liệu bình thường hoặc tình trạng vật lý còn tốt thì được kiểm tra từ khoảng 10%-20% của tổng số lượng ảnh được quét để tiết kiệm kinh phí lao động. Bởi lẽ việc kiểm tra chi tiết từng ảnh quét một là việc rất tốn kém về thời gian lao động, đồng nghĩa với chi phí

Một phần của tài liệu Nghiên cứu triển khai số hóa tài liệu lưu trữ đang bảo quản tại Cục Lưu trữ Quốc gia Lào (Trang 40)

Tải bản đầy đủ (PDF)

(120 trang)