Chương này sẽ trình bày về những khái niệm và thuật ngữ cơ bản; ảnh hưởng của độ phân giải, số bit và độ nén đến chất lượng ảnh; các đặc tính của văn bản và những yếu tố khác ảnh hưởng đ
Trang 1GIÁO TRÌNH
KỸ THUẬT SỐ HÓA TÀI LIỆU
Trang 2Mục lục
Kỹ thuật số hoá
Chương 1: Khái quát lý thuyết
Chương 2: Khái quát kỹ thuật
Chương 3: Nghiên cứu trường hợp
Chương 4: Tạo siêu dữ liệu: từ các ảnh số đến cơ sở dữ liệu của các tư liệu Chương 5: Sử dụng các dịch vụ ảnh
Trang 3Chương này sẽ trình bày về những khái niệm và thuật ngữ cơ bản; ảnh hưởng của độ phân giải, số bit và độ nén đến chất lượng ảnh; các đặc tính của văn bản và những yếu tố khác ảnh hưởng đến quá trình chuyển đổi chất lượng và lựa chọn cho quá trình số hoá
Định nghĩa
Ảnh số là các "ảnh điện tử" được quét từ các tài liệu gốc Một ảnh số có thể thể hiện chính xác nội dung, bố cục và cách trình bày của văn bản gốc bao gồm kiểu chữ, chú thích và ảnh minh hoạ
Quá trình quét
Một ảnh số được lấy mẫu và vẽ dưới dạng một hệ thống các điểm hay các nguyên tố ảnh được gọi là các pixel Mỗi pixel thể hiện một đơn vị màu (đen, trắng hoặc các gam màu khác) và về mặt số được biểu diễn dưới dạng các mã nhị phân (mã chỉ gồm các số 0 và/ hoặc 1) Các chữ số nhị phân (bit) trong mỗi pixel được ghi theo một trình tự nhất định trong máy tính, hoặc được rút gọn thành một công thức toán học Các số nhị phân này sẽ được máy tính dịch và đọc để tạo ra một hình ảnh analog hiện trên màn hình hoặc bản in
Các ảnh số khác với các dạng tệp điện tử khác Mặc dù cũng được gọi là
"ảnh mành" ("raster image") hoặc "ảnh nhị phân" ("bitmapped
Trang 4image") song ảnh số khác với các ảnh vectơ ở chỗ đồ hoạ của chúng
không được thể hiện dưới dạng các đường thẳng và đường cong toán học xác định mà được thể hiện dưới dạng hệ thống các điểm Ảnh vectơ nhìn chung là có thể được tạo ra với kích cỡ và độ chính xác bất kỳ, còn chất lượng của ảnh số lại phụ thuộc vào độ phân giải được ấn định từ trước khi quét
Khác với các tệp văn bản chữ - số như ASCII, các ảnh số là những tệp
"câm" bởi vì thông tin chứa trong đó không thể duyệt hoặc điều chỉnh được Tuy nhiên, chúng lại có thể được sử dụng làm tệp nguồn để tạo ra các tệp văn bản có thể đọc được thông qua các chương trình nhận dạng chữ quang học (ORC) Độ chính xác của những chương trình như vậy vô cùng khác nhau, tuỳ thuộc vào thuộc tính của nguyên bản và các ảnh số được quét
Tổng hợp các khả năng kỹ thuật
Mặc dù kỹ thuật ảnh số đã được biết đến từ khá lâu nhưng nó mới bắt đầu được sử dụng rộng rãi từ thập niên 1990, khi những tiến bộ kỹ thuật cho ra đời những hình ảnh rõ nét hơn, chi phí thấp hơn và khả năng truy cập cao hơn Các nhân tố đã tạo ra những điều kiện thuận lợi đó là:
- Sự phát triển kỳ diệu của máy tính cá nhân
- Các hệ thống mạng rộng lớn có tốc độ cao trở nên phổ biến
- Chi phí kỹ thuật giảm, đặc biệt là trong việc lưu trữ
Trang 5- Sự ra đời của các máy quét có độ phân giải cao
- Sự xuất hiện của kiến trúc phục vụ khách hàng và mạng quốc tế
(World Wide Web)
Lợi ích của ảnh số
Ảnh số mang những đặc điểm ưu việt hơn hẳn ảnh analog về mặt độ nét,
độ chính xác, độ trung thực so với nguyên bản, chi phí bộ nhớ và khai thác
Trong lưu trữ
+ trung thực so với nguyên bản
- tương đương với kỹ thuật ánh sáng thấu kính
- thay đổi được kích cỡ ảnh
Trang 6- cơ sở kỹ thuật thay đổi nhanh chóng
- đang ở giai đoạn giao thời nên phải chấp nhận cả những cái truyền thống và những cái mới
- chịu nhiều sức ép về mặt pháp luật, trong đó có luật bản quyền
- chưa có các tiêu chuẩn cụ thể
- chất lượng và khả năng của các phần cứng, phần mềm rất không đồng nhất
- có những yêu cầu cao về sao chép, lưu trữ và di nhập
- nhu cầu và khả năng của các cơ sở lưu trữ chưa cao
Trang 7- thiếu tính ổn định và sự hỗ trợ của các hãng dịch vụ
Khi nào vượt qua được những trở ngại này, kỹ thuật ảnh số sẽ bước vào giai đoạn thực nghiệm tại các cơ sở văn hoá Tuy nhiên, các cơ sở này hiện nay đã có cơ hội để tạo điều kiện phát triển cho kỹ thuật mới này theo hướng đáp ứng được những nhu cầu cụ thể của họ Sự tăng số
lượng thư viện và cơ sở lưu trữ hiện đang giúp kỹ thuật ảnh số tiến đến gần những mục đích hiện nay và trong tương lai Song vì tiềm lực của các cơ sở còn hạn chế, các dự án đều phải được xây dựng một cách cẩn thận nhằm đảm bảo cho khả năng thành công cao nhất và hạn chế thất bại Điều này đòi hỏi các cơ sở phải đặt ra những mục tiêu không quá tham vọng, dựa trên cơ sở đã hiểu biết đầy đủ về những thuộc tính của các văn bản sẽ được quét, các thao tác phức tạp của quá trình quét và mọi mặt hữu dụng của ảnh số
Quét ảnh: chuyển từ analog sang số
Các thuộc tính của tư liệu
Khi quét ảnh số phải tính toán đến các quy trình kỹ thuật liên quan đến việc chuyển từ ảnh analog sang ảnh số cũng như các thuộc tính của
chính các văn bản gốc như: kích thước, mức độ chi tiết, thang màu Các văn bản có thể được định tính bằng các quy trình kỹ thuật được sử dụng
để tạo ra nó, bao gồm các phương pháp bằng tay, bằng máy, chụp ảnh hay mới nhất là điện tử Hoặc toàn bộ các văn bản bằng giấy hoặc bằng phim có thể được chia thành 4 loại sau:
Trang 8+ Bản văn/Dòng (Text/line art): Gồm những hình ảnh đồng màu có ranh giới rõ ràng, thường đơn sắc, có thể được tạo ra bằng tay, máy chữ hoặc máy in, bao gồm: bản văn, bản viết tay, đồ thị, bản khắc gỗ, văn bản được đánh máy hay in laser, bản thiết kế, bản đồ và bản chép nhạc
+ Tông màu chuyển tiếp (Continuous tone): Những văn bản gồm các gam chuyển tiếp nhau, có thể đơn sắc hoặc đa sắc, bao gồm ảnh chụp, một số loại tranh (như bản phác hoạ bằng chì, tranh màu nước) và các tác phẩm đồ hoạ có các thuộc tính gam chuyển tiếp như bản khắc đồng,
in đá, in chụp
+ Nửa tông hoặc kiểu nửa tông (Halftone or halftone-like): Những hình ảnh tạo thành từ các điểm hoặc đường nằm cách đều, có thể đơn hoặc đa sắc, bao gồm những ảnh đồ hoạ được tạo thành từ các nét hoặc đường kẻ song song sít nhau nằm cách đều, ví dụ bản chạm khắc hoặc khắc axit
+ Hỗn hợp (Mixed): Tổng hợp cả 3 loại văn bản trên, đơn hoặc đa sắc, bao gồm báo, tạp chí, sách có tranh minh hoạ
Ba loại kỹ thuật quét
+ "đen trắng" ("bitonal"): một pixel gồm một số nhị phân thể hiện màu trắng hoặc đen, thích hợp với các loại bản văn và một số loại nửa tông
+ "dải xám" ("grayscale"): một pixel gồm nhiều số nhị phân thể hiện các gam màu xám khác nhau, thích hợp với các văn bản gam chuyển tiếp đen trắng, nửa tông, hỗn hợp và một số bản viết tay
Trang 9+ "màu" ("color"): một pixel gồm nhiều số nhị phân thể hiện các màu sắc khác nhau, thích hợp với tất cả các loại văn bản trong đó màu sắc giữ vai trò quan trọng
Chất lượng ảnh số được quét chịu ảnh hưởng của:
+ độ phân giải và ngưỡng
đề mấu chốt khi quét ảnh là phải xác định được độ phân giải vừa đủ để thể hiện được tất cả những chi tiết quan trọng của nguyên bản
Ngưỡng (threshold) là thuật ngữ được dùng trong kỹ thuật quét đen trắng để chỉ một điểm trên thước đo mà tại đó các giá trị thể hiện màu xám được dịch thành các pixel trắng hoặc đen Điểm này thường nằm trong khoảng từ 0 đến 255 Dưới đây là ví dụ về ảnh hưởng của các
Trang 10ngưỡng khác nhau lên bản đánh máy được quét ở cùng một độ phân giải
Trong kỹ thuật quét đen trắng, độ phân giải và ngưỡng là mấu chốt của chất lượng ảnh Kỹ thuật này phù hợp nhất với các văn bản có độ tương phản cao như bản văn, đồ hoạ Những văn bản gam chuyển tiếp hoặc có
độ tương phản thấp như ảnh chụp cần đến kỹ thuật quét dải xám hoặc nhiều màu Trong 2 loại kỹ thuật quét này, độ phân giải và số bit là 2 yếu
tố cấu thành nên chất lượng ảnh
Số bit (bit depth) được xác định bằng số lượng chữ số nhị phân được sử dụng để thể hiện mỗi pixel Số bit càng lớn thì càng nhiều sắc màu được thể hiện Dải biến động (dynamic range) là thuật ngữ chỉ toàn bộ mức biến đổi các gam màu - được đo bằng mật độ kế- từ vùng sáng nhất đến vùng tối nhất của văn bản Các vật liệu trong suốt có dải biến động rộng hơn, do đó thể hiện được nhiều gam màu hơn các vật liệu phản quang Khả năng bắt được tất cả các sắc màu của máy quét, bao gồm những chi tiết trong vùng sáng và vùng tối, phụ thuộc vào dải biến động của máy và
số bit Máy quét drum thường bắt màu tốt nhất và máy quét flatbed thường bắt màu kém nhất (Xem chương 2 và chương 6) Số bit tăng lên
sẽ ảnh hưởng đến độ phân giải cần thiết, kích thước tệp và phương pháp nén
Chỉnh sửa ảnh (Image enhancement) là quá trình cải thiện chất lượng ảnh Tuy nhiên, việc chỉnh sửa rất có thể sẽ ảnh hưởng đến độ trung thực của ảnh Chỉnh sửa còn làm tăng chi phí quét ảnh Các đặc điểm
Trang 11chỉnh sửa điển hình có thể được thực hiện trong quá trình quét hoặc trong phần mềm biên tập ảnh gồm lọc (filter), các đường cong tái tạo tông màu (tonal reproduction curves) và quản lý màu (color
management) Dưới đây là ví dụ về sử dụng bộ lọc ở một bản viết tay được quét với cùng một ngưỡng và độ phân giải, và một bức ảnh được
"hiệu chỉnh" bằng chương trình biên tập ảnh
Nén (Compression) làm giảm kích thước tệp trong quá trình xử lý, lưu trữ và chiếu ảnh Chất lượng ảnh có thể bị ảnh hưởng bởi kỹ thuật nén
và mức độ nén
Thiết bị sử dụng và hiệu suất của nó qua thời gian sẽ ảnh hưởng đến chất lượng hình ảnh Những công nghệ quét khác nhau có ảnh hưởng rõ rệt đến sản phẩm và độ chính xác của kỹ thuật xác định chuẩn chất lượng sẽ được trình bày ở phần sau Vì vậy, những đòi hỏi của các nhà sản xuất về các khả năng của hệ thống (độ phân giải, số bit, các kỹ thuật chỉnh sửa, sản lượng đầu vào, tuổi thọ phần cứng, độ tin cậy) cần phải được xem xét cẩn thận Bạn hãy đảm bảo rằng những yêu cầu về chất lượng ảnh đã được đáp ứng bằng cách kiểm tra các sản phẩm qua màn hình và giấy, sử dụng kết hợp các vị trí kiểm tra kỹ thuật và các mẫu nguyên bản
Tính hợp lý và cẩn trọng của người điều hành cùng với các phương tiện quét có ảnh hưởng rất lớn đến chất lượng hình ảnh thu được Những quyết định hợp lý của người điều hành là vô cùng quan trọng khi quét đen trắng vì ở đó chất lượng ảnh hoàn toàn phụ thuộc vào ngưỡng và độ
Trang 12phân giải Quá trình quét xám phụ thuộc ít hơn vào những quyết định
đó Tuy nhiên, vẫn cần phải thực hiện thường xuyên một chương trình bảo hiểm chất lượng ảnh để kiểm tra sản phẩm của mọi kỹ thuật quét
Đảm bảo ghi được đầy đủ thông tin
Trường Đại học Cornell đã áp dụng một nguyên tắc quét ảnh đảm bảo chất lượng và tính thực dụng cao nhất với chi phí thấp nhất Các yêu cầu
về lưu trữ, khai thác và tính kinh tế đòi hỏi phải có một tệp số chủ
(digital master) chứa đầy đủ mọi thông tin có trong nguyên bản Chuyển đổi bằng kỹ thuật số hay analog chỉ là các cách khác nhau để ghi lại nội dung thông tin chứa trong nguyên bản dưới dạng cất giữ hay trưng bày Còn về mặt giá trị thực hay giá trị nhân văn thì bản copy chỉ có thể đại diện chứ không thể thay thế được nguyên bản
Lưu trữ
Nếu ảnh số được sử dụng với mục đích lưu trữ thì chất lượng ảnh là yếu
tố quan trọng, bởi vì nó sẽ được sử dụng để thay thế cho nguyên bản, còn nguyên bản sẽ được cất giữ ở một nơi khác, trong môi trường phù hợp
Số lượng ảnh phải đủ để giảm hoặc loại bỏ hoàn toàn khả năng người đọc dùng đến nguyên bản
Ảnh số có thể thay thế nguyên bản trong một số trường hợp nhất định, ví
dụ khi nguyên bản là sách dễ hư hỏng Khi đó ảnh số phải mang được đầy đủ những thông tin quan trọng của nguyên bản để có thể đáp ứng được mọi yêu cầu về nghiên cứu, pháp luật và tài chính Như sẽ nói ở
Trang 13phần sau, các tiêu chuẩn và thông lệ đối với việc bảo quản các tư liệu vi phim phải được đặt ra để xác định các yêu cầu về chất lượng trong số hoá
Khai thác
Ảnh số là công cụ để thuận tiện hoá việc khai thác, nhưng trong mọi trường hợp, một ảnh số không thể thoả mãn được tất cả các nhu cầu của người sử dụng Một tệp số chủ cần được tạo ra và sử dụng để nhân bản hàng loạt hình ảnh vì các nguyên nhân sau:
- với những khả năng khác nhau của máy tính, tất cả các nhu cầu sử dụng có thể được đáp ứng thông qua các bản phái sinh
- các yêu cầu và khả năng về in ấn, hiển thị và xử lý ảnh vô cùng đa dạng
- khó có thể cùng một lúc đáp ứng được tất cả các nhu cầu về sự hoàn chỉnh, chi tiết của ảnh và tốc độ xử lý
- quá trình quét càng tốt thì chất lượng bản phái sinh càng tốt
- những đòi hỏi của người sử dụng ngày càng cao, phải có đủ các tệp số chủ để cung cấp cho những ứng dụng trong tương lai
Chi phí
Chi phí sản xuất những ảnh số có chất lượng cao sẽ ít hơn chi phí dành cho những ảnh chất lượng thấp và không đáp ứng được những yêu cầu lâu dài Tạo ảnh số là một công việc tốn kém; chi phí vào nhân lực và
Trang 14việc tìm kiếm, chuẩn bị, kiểm tra và ghi kỹ hiệu thông tin số cao hơn nhiều so với chính chi phí quét ảnh Trong những năm tới, giá quét và lưu ảnh sẽ hạ xuống và làm giảm bớt sự chênh lệch nói trên
Chất lượng ảnh cao không đồng nghĩa với độ phân giải và số bit cao nhất, mà chính là sự phù hợp giữa quá trình quét ảnh với nội dung của nguyên bản và quét ở mức độ đảm bảo bắt được đúng những thông tin
đó, không nhiều hơn cũng không ít hơn Bằng cách đó, có thể tránh được khả năng phải quét lại ảnh sau này; chi phí cho lưu trữ và di nhập thông tin không phải là nhỏ nhưng ở mức độ hợp lý và có thể được bù lại bằng giá trị lâu dài của thông tin số Giá trị đó nên được xác định bằng nội dung tri thức chứa trong các ảnh số chứ không bị hạn chế bởi những phán quyết về mặt kỹ thuật tại thời điểm quét
Độ phân giải, kích thước tệp và chất lượng ảnh
Độ phân giải thường được đo bằng số lượng điểm thể hiện ảnh trên một insơ vuông(ký hiệu: insơ = in hoặc ")
Ví dụ: 100 điểm/ in (dpi) = 100 x 100 (1002)
hay 10 000 điểm/ in2
200 dpi = 2002 hay 40 000 điểm/ in2
Chú ý: Cấp số nhân tăng nhanh hơn cấp số cộng Số lượng điểm được sử dụng ở độ phân giải 200 dpi gấp 4 lần số lượng điểm được sử dụng ở độ phân giải 100 dpi
Trang 15Quan hệ giữa độ phân giải và kích thước tệp
Tổng số điểm được sử dụng trên bề mặt ảnh được xác định bằng cách nhân chiều cao ảnh với chiều rộng và dpi2 Trong kỹ thuật quét đen trắng, 1 số nhị phân (bit) thể hiện 1 pixel Khi chuyển đổi, kích thước tệp chứa ảnh được tính bằng byte, mỗi byte được cấu thành từ 8 bit Do đó,
để tính kích thước tệp chứa ảnh được quét bằng kỹ thuật đen trắng theo byte, ta lấy tổng số bit (h w dpi2) chia cho 8
Công thức 1: xác định kích thước tệp của ảnh đen trắng:
Ví dụ kích thước của tệp quét một trang giấy viết thư (khổ 8,5'x11') với
dộ phân giải 100 dpi là 116.875 byte
So sánh với tệp văn bản giãn dòng đơn chứa một trang giấy viết thư có kích thước 2000 đến 3000 byte
Do các tệp ảnh số thường có kích thước lớn, người ta thường dùng một
số đơn vị rút gọn của byte như:
1 KB = 1000 byte
1 MB = 1 000 000 byte = 1000 KB
1 GB = 1 000 000 000 byte = 1000 MB
Trang 16Kích thước pixel, kích thước vật lý và dpi
Nguyên bản được xác định bằng kích thước vật lý và mức độ chi tiết của
nó, còn một ảnh số được xác định bằng kích thước pixel, "kích thước vật lý" và dpi Máy quét, máy in và màn hình cũng được mô tả bằng 3 thuộc tính này Bạn có thể hình dung chúng như những hình chữ nhật gồm các pixel xếp theo hàng và cột, trong đó:
- kích thước pixel tính = số pixel nằm theo hàng ngang x số pixel nằm theo cột dọc (màn hình VGA có kích thước pixel 640 x 480)
- kích thước vật lý được đo bằng không gian tính bằng insơ theo chiều ngang và chiều thẳng đứng mà các pixel đó chiếm (phần lớn các máy quét flatbed đều thích hợp với các văn bản có kích thước 8,5" x 14")
- dpi thể hiện số lượng pixel trên 1 insơ
Các máy quét flatbed quét ở một độ phân giải đặt sẵn với các tư liệu có kích thước khác nhau nhưng không vượt quá 11" x 17" ở loại thiết bị này, mảng quét (scanning array) được đặt ở kích thước cố định đó, và tất
cả các văn bản phù hợp với máy đều được quét ở cùng một độ phân giải (dpi) được đặt sẵn đó Độ phân giải sẽ chỉ thay đổi khi thiết định dpi được thay đổi, ví dụ, chuyển từ 300 dpi lên 600 dpi
Ví dụ: Máy quét được đặt ở độ phân giải 300 dpi trên mảng quét 11" x 17" Kích thước pixel của máy được xác định bằng cách nhân tích số của
độ phân giải và kích thước pixel thứ nhất (300 x 11) với tích số của độ phân giải và kích thước pixel thứ hai (300 x 17), ta có kết quả là là 3300 x
Trang 175100 Nếu đặt lại độ phân giải ở mức 600 dpi, kích thước pixel của máy quét sẽ là (600 x11) x (600 x 17) = 6600 x 10200
Các máy quét khác, trong đó có camera số, không đặt sẵn độ phân giải Các camera số có kích thước pixel đặt sẵn (ví dụ 2000 x 3000) nhưng không có tấm ép (platen) cố định Về mặt lý thuyết thì loại máy này có thể quét được văn bản ở mọi kích cỡ Camera số hoạt động tương tự như máy quay vi phim Kích thước pixel của mảng quét được điều chỉnh theo kích thước vật lý của nguyên bản bằng cách tăng hoặc giảm khoảng cách giữa camera và tư liệu (hoặc sử dụng một thấu kính khác) Do đó, độ phân giải sẽ thay đổi theo các kích thước khác nhau của các tư liệu Nếu
tư liệu có kích thước nhỏ, độ phân giải có thể ở mức cao Khi kích thước
tư liệu tăng lên, khoảng cách giữa camera và tư liệu đó cũng phải tăng lên, làm tăng khoảng cách giữa các pixel và vì vậy độ phân giải sẽ giảm
Ví dụ, một tư liệu kích thước 4x5 in có độ phân giải thích hợp lớn gấp 10 lần độ phân giải thích hợp của tư liệu kích thước 40 x 50 in với cùng một kích thước pixel
Xác định dpi từ kích thước pixel
Để xác định dpi từ kích thước pixel, trước hết ta phải xét tỉ lệ cạnh
(aspect ratio) của cả vật liệu nguồn và mảng pixel của máy quét Tỉ lệ cạnh là đại lượng liên hệ giữa các số đo cạnh của một hình chữ nhật Trong trường hợp một văn bản, tỉ lệ cạnh là tỉ lệ giữa chiều cao và chiều rộng Còn đối với một camera số thì đại lượng này thể hiện quan hệ giữa kích thước pixel theo chiều này với kích thước kia Mối quan hệ giữa tỉ lệ
Trang 18cạnh của nguyên bản và kích thước pixel của camera sẽ ảnh hưởng đến cách tính dpi Để đạt được dpi cao nhất khi quét toàn bộ một văn bản thì kích thước vật lý của văn bản đó phải nằm trong giới hạn kích thước pixel của camera (hay chính là nằm gọn trong khu vực quét)
Vì hình ảnh có thể được xoay sau khi đã xử lý nên định hướng tư liệu (theo chiều nằm ngang hay dựng đứng) không phải là một khâu trong quá trình quét Tư liệu có thể được đặt ở theo một trong hai hướng trên trong camera số Có thể tạo được một tư liệu kích thước lớn ở các độ phân giải cao hơn bằng cách quét từng phần văn bản đó và xếp hoặc đính các ảnh rời rạc vào với nhau sau khi đã xử lý
Công thức 2: Xác định các tỷ lệ cạnh khi quét:
Ví dụ 1: Xét một văn bản có kích thước 4 x 6 in được quét với mảng quét
2000 x 3000 pixel Tỉ lệ cạnh của tư liệu sẽ = 6/ 4 = 1,5; tỉ lệ cạnh của mảng quét = 3000/ 2000 = 1,5 Vì có cùng tỉ lệ cạnh nên văn bản sẽ trùm khít mảng quét, và toàn bộ mảng quét được sử dụng để quét văn bản (Khi hai tỉ lệ cạnh như trên không trùng nhau, hai hình chữ nhật tạo thành do văn bản và mảng quét sẽ không trùng khớp và hoặc chỉ có một phần mảng quét được sử dụng, hoặc chỉ có một phần văn bản được quét Xem các ví dụ 2 và 3)
Trang 19Ví dụ 2: Xét trường hợp tư liệu có tỉ lệ cạnh nhỏ hơn tỉ lệ cạnh của mảng quét Một văn bản có kích thước giấy viết thư sẽ có tỉ lệ cạnh là 11/ 8,5 = 1,29 Nếu được quét bằng camera số có tỉ lệ cạnh 3072/ 2048 = 1,5 thì kích thước của văn bản sẽ nhỏ hơn mảng quét (Hình vuông có tỉ cạnh = 1) Nếu kích thước pixel thứ nhất của camera được đặt để quét chiều rộng của văn bản thì chiều chiều dài của văn bản sẽ ngắn hơn cạnh thứ hai của pixel Toàn bộ văn bản sẽ được quét nhưng chỉ có một phần
Khi nào văn bản và mảng quét đã phù hợp với nhau thì độ phân giải để quét toàn bộ văn bản có thể được xác định bằng cách chia kích thước pixel của máy quét (xem công thức số 3) Công thức tương tự có thể được
sử dụng để tính độ phân giải hữu hiệu khi quét phim của một văn bản bằng kỹ thuật quét trượt Lưu ý là bạn phải sử dụng kích thước thật của nguyên bản chứ không phải kích thước của phim (Xem chương 7)
Công thức 3: xác định độ phân giải từ kích thước pixel của máy quét:
Trang 20Xác định độ phân giải cần thiết để bắt được đầy đủ thông tin
Chúng ta đã biết làm thế nào để xác định độ phân giải và kích thước tệp
từ kích thước pixel, song làm thế nào để biết liệu độ phân giải đó có phù hợp để bắt được đầy đủ thông tin trong nguyên bản hay không? Tại Cornell, chúng tôi đã xây dựng một phương pháp đặt chuẩn để tính toán các yêu cầu về độ phân giải khi tạo ra và hiển thị ảnh số, trong đó áp dụng những tiêu chuẩn về chất lượng ảnh của công nghiệp vi đồ hoạ Xác định chuẩn số là gì?
Xác định chuẩn số là một thủ tục không thể thiếu để dự đoán về sản phẩm
- trước hết là xác định rõ các thuộc tính của tư liệu nguồn và các nhu cầu
sử dụng hiện thời cũng như trong tương lai
- xác định các nhân tố trong các biến số liên quan (cả chủ quan lẫn
khách quan)
- sử dụng những công thức bắt nguồn từ vi đồ hoạ
Trang 21- cần sự khẳng định
Bằng cách xác định chuẩn số, ta có thể:
- đưa ra những phán quyết đáng tin cậy
- xác định và thu hẹp phạm vi lựa chọn
- xác định những nhu cầu ở mức vĩ mô
- hiểu đúng thông tin các nhà kinh doanh đưa ra để quảng cáo
- hợp tác về mặt dịch vụ và sản phẩm
- đầu tư một cách hiệu quả
- đặt ra được những mục tiêu có tính khả thi
Áp dụng các tiêu chuẩn ảnh analog vào ảnh số
Các chỉ số cổ điển về độ phân giải và chất lượng
Công nghiệp vi đồ hoạ đã xây dựng những tiêu chuẩn để đánh giá chất lượng hình ảnh dựa trên Chỉ số chất lượng (ANSI/AIIM MS23 - 1991) Chỉ số chất lượng (QI- Quality Index) là đại lượng liên hệ giữa độ phân giải của hệ thống và độ nét của văn bản Đại lượng này liên quan đến số
đo chiều cao của những kí tự nhỏ nhất trong văn bản, gồm cả các dấu trên và dưới, được gọi là "cao x" Trong kỹ thuật vi phim, QI được tính bằng tích số của cao x (kí hiệu là h) với p - số cặp dòng loại nhỏ nhất trên bảng kiểm tra kỹ thuật chuẩn được máy quay phân giải (Xem hình 1)
Trang 22Chỉ số chất lượng được sử dụng để dự báo mức chất lượng của hình ảnh, gồm các mức: thấp (3,6); trung bình (5,0) và cao (8,0)
Công thức 4: Chỉ số chất lượng cổ điển:
và cho biết nhiều phân tích đã được tiến hành để tìm ra sự khác nhau giữa các cách bắt chi tiết của máy quay vi phim và máy quét Trường Đại học Cornell đánh giá cao ý kiến trên và đã thực nghiệm sử dụng phương pháp này trong vòng 5 năm để khẳng định các kết quả nghiên cứu sau khi đã chuyển đổi hơn 1 triệu ảnh
Để chuyển đổi giữa độ phân giải ảnh chụp và ảnh số, ta phải tiến hành các bước sau:
- thiết lập các mức chất lượng ảnh tương ứng với nhau
- hợp lý hoá hệ thống đo ( chuyển từ U.S sang hệ mét)
- tương ứng các điểm với các cặp đường
Trang 23- điều chỉnh "sự đọc lệch"(trong kỹ thuật quét đen trắng)
1 Thiết lập các mức chất lượng ảnh tương đương
Việc đầu tiên là phải đặt ra các mức chất lượng có thể chấp nhận được trong việc quét ảnh số dựa trên mô hình tiêu chuẩn được AIIM áp dụng đối với vi phim Các ảnh phóng đại ở các độ phân giải khác nhau của các chữ được số hoá dưới đây được so sánh với các chữ được chụp bằng vi phim với QI ở các mức thấp (3,6), trung bình (5,0) và cao (8,0) Theo đánh giá của Cornell thì các ảnh trên có sự tương ứng về mức chất
lượng Lưu ý rằng sự thay đổi các mức chất lượng trong kỹ thuật quét đen trắng thể hiện ở các cấu trúc hình răng cưa - thường được gọi là
"aliasing" hay "jaggies" Còn trong kỹ thuật vi phim và quét xám, chất lượng ảnh giảm thể hiện ở chỗ các nét chữ mờ
2 Hợp lý hoá hệ thống đo: chuyển từ điểm/ in sang điểm/ mm
Khi đã thiết lập được những mức độ tương ứng về chất lượng ảnh số, ta cần phải tính đến sự khác nhau giữa các cách đo độ phân giải Độ phân giải số được đo bằng số điểm trên 1 in, còn độ phân giải của ảnh chụp hay còn gọi là độ phân giải cổ điển được đo bằng số cặp dòng trên 1 mm (p) Để tính QI dựa vào độ phân giải, ta phải đổi các đơn vị từ in sang
mm và điểm sang cặp dòng 1mm » 0,039 in, vì vậy số điểm trên 1mm (dpm) » 0,039 x dpi Để xác định số điểm trên số mm chiều cao của kí tự,
ta phải nhân độ phân giải với 0,039 lần chiều cao (h) của kí tự (công thức 5)
Trang 24Công thức 5: Xác định số điểm trên 1 kí tự:
dpm = 0,039 dpi x h
3 Tương ứng giữa số điểm và số cặp dòng
Đường kính của một điểm = chiều ngang của một đường (xem hình 1, tr 13) Vì vậy trong bài tập thực hành số 3, 3,9 điểm sẽ tạo ra 1mm kí tự, xấp xỉ với 4 đường hay 2 cặp dòng/ mm và QI = 2
Theo tiêu chuẩn đối với chỉ số chất lượng cổ điển, QI = 2 không cho chất lượng ảnh cao Qua đó chúng ta có thể dự đoán được rằng độ phân giải
100 dpi là không không đủ để thể hiện tốt 1mm kí tự Điều này được thấy trong hình bên
Chú ý: Nếu chỉ có độ phân giải qui định chất lượng ảnh thì QI = 8 đạt được với ảnh được thể hiện bằng ít nhất 16 điểm trên 1mm chiều cao kí
tự
Do đường kính của một điểm tương đương với chiều ngang của một đường nên hai điểm mới tương đương với một cặp dòng, nghĩa là số điểm trên 1mm phải được chia đôi thì mới tương ứng với số cặp dòng trên 1mm
Đến đây chúng ta đã nắm được 3 bước trong việc áp dụng QI cổ điển để xác định QI số trong kỹ thuật quét đen trắng
Nhớ lại rằng trong kỹ thuật vi phim, QI = p x h Tương ứng ta có:
Trang 25Từ đó ta có công thức tính độ phân giải dpi=2QI/0,0039
4 Điều chỉnh sự đọc lệch trong kỹ thuật quét đen trắng
Trong công thức trên, dpi là độ phân giải ở đầu vào của máy tính Ví dụ, nếu QI = 8 cần cho một tư liệu gồm những ký tự có kích thước từ 1mm trở lên, thì độ phân giải cần thiết là (2x8)/ (0,039x1) = 410 Tuy nhiên, do các lỗi lấy mẫu cùng với sự không ăn khớp giữa bộ phận dò (detector) của máy quét và chi tiết ảnh, được gọi là "sự đọc lệch"
("misregistration"), độ phân giải ở đầu vào của máy quét đen trắng thường không nhất quán với độ phân giải ở đầu ra Trường Đại học Cornell đã áp dụng giải pháp được AIIM TR26- 1993 đưa ra: tăng độ phân giải đầu vào lên ít nhất 50% để bù vào "sự đọc lệch" Trong ví dụ trên, độ phân giải 410 có thể được tăng 50%, tức là lên 615 dpi Phần tăng này là cần thiết dù máy quét có hay không sử dụng độ phân giải
"thực" hay "nội suy" (Xem chương 2 về máy quét.) Sự đọc lệch là một vấn đề đặc biệt khó giải quyết khi xử lý những hoạ tiết đều đặn như các đối tượng phân giải chuẩn (standard resolution targets) (xem hình trang sau) hay các văn bản nửa tông và kiểu nửa tông (xem bản khắc dưới) Vì vậy, ANSI/ AIIM MS 44-1998 đã tuyên bố rằng các mô hình kiểm tra tiêu chuẩn độ phân giải không nên áp dụng với những máy quét có độ phân giải từ 600 dpi trở xuống
Mô hình kiểm tra độ phân giải
Trang 26Các công thức về độ phân giải (trong kỹ thuật quét đen trắng)
Khi đọc lệch và các lỗi lấy mẫu có khả năng xảy ra, công thức cơ bản để tính độ phân giải của máy tính trong kỹ thuật quét đen trắng biến thành: dpi = [(2 x QI)/ (h x 0,039)] x 1,5
Công thức này có thể được giản ước thành: dpi = 3 QI / 0,039 h Từ công thức cơ bản này, chúng ta có các công thức tính h và QI
Công thức 6: Tính độ phân giải theo chuẩn trong quét đen trắng:
Trang 27dpi = 3QI / 0.039h
Bảng 1 cung cấp những ước lượng về độ phân giải cần thiết đối với các mức chất lượng ảnh và cao x khác nhau Bảng 2 cho biết mối quan hệ giữa kích thước điểm, cao x và QI trong số hoá với đánh giá bằng mắt thường về các kiểu chữ thường được sử dụng trong in ấn thương mại trong thế kỷ 19 và đầu thế kỷ 20 Các chỉ số chất lượng số được tính cho quá trình quét các trang mẫu ở độ phân giải 600 dpi 1 bit, và đánh giá được dựa vào một báo cáo tổng kết về các ảnh in Xerox Docutech 600 dpi được phóng đại 5 lần Nhìn chung những đánh giá này khẳng định
QI số là một chỉ thị chính xác về chất lượng ảnh
Bảng 1: ước lượng độ phân giải cần thiết trong kỹ thuật quét đen trắng
0,5 mm 554 dpi 769 dpi 1231 dpi
1,0 mm 277 dpi 385 dpi 615 dpi
1,5 mm 185 dpi 256 dpi 410 dpi
Trang 282,0 mm 138 dpi 192 dpi 308 dpi
2,5 mm 111 dpi 154 dpi 246 dpi
Số bit, kích thước tệp, độ nén và chất lượng ảnh
Kỹ thuật quét đen trắng thích hợp nhất với những tư liệu có độ tương phản cao như các bản văn in Đối với những văn bản có gam chuyển tiếp hay nhiều màu thì kỹ thuật quét dải xám và nhiều màu phù hợp hơn Như đã nói từ đầu chương, trong quá trình quét, các gam màu được đại diện bằng số lượng chữ số nhị phân được sử dụng để thể hiện mỗi pixel, gọi là số bit (bit depth) Số bit càng lớn thì dải biến động của thông tin màu càng lớn
Ảnh đen trắng (bitonal image) được thể hiện bằng những pixel chỉ gồm 1 bit, chỉ mang 2 giá trị, hay 2 mức độ (chữ số 0 thể hiện màu đen, chữ số 1 thể hiện màu trắng) Khi số lượng chữ số nhị phân tăng lên, các giá trị màu khác có thể được biểu hiện
Trang 29Ảnh xám (grayscale image) được đại diện bằng những pixel gồm từ 2 đến 8 bit Sự kết hợp 2 bit trong 1 pixel tạo ra 4 tổ hợp: 00, 01, 10 và 11 Nếu 00 biểu hiện màu đen và 11 biểu hiện màu trắng, thì 01 biểu hiện màu xám sẫm và 10 biểu hiện màu xám nhạt Số bit ở đây chỉ là 2 nhưng giá trị màu, hay mức độ màu được biểu hiện là 22 = 4 Với số bit là 8, tức
là một tổ hợp 8 chữ số nhị phân thể hiện một thông tin màu, ta có 28 =
256 giá trị màu Với chừng đó giá trị màu được phân bố hợp lý, mọi
thông tin của thang màu xám đều có thể được biểu hiện Một số máy tính hiện nay quét ảnh màu xám ở mức 10 bit hoặc hơn và đưa ra sản phẩm 8 bit để hợp hơn với mắt thường Hơn nữa, tương tự như quét ảnh đen trắng với yếu tố đọc lệch, để đạt được một mức độ xám nhất định ở đầu
ra thì mức độ xám ở đầu vào phải cao hơn để bù vào yếu tố "nhiễu" thường gặp ở các máy quét
Ảnh màu (color image) điển hình thường có số bit từ 8 đến 24 Số chữ số nhị phân trong một ảnh màu 24 bit được chia thành 3 nhóm: 8 bit thể hiện màu đỏ, 8 bit thể hiện màu xanh lá cây và 8 bit thể hiện màu xanh
lơ Các tổ hợp khác giữa những số nhị phân này thể hiện các màu sắc khác "Màu thực" cần đến 24 chữ số nhị phân, tức 224 = 16,7 triệu giá trị màu Tương tự như trường hợp ảnh màu xám, để có sản phẩm đúng màu 24 bit cần sử dụng số bit màu cao hơn Một số máy quét ngày nay
sử dụng màu 30 bit hoặc hơn để đưa ra sản phẩm 24 bit
bảng 2: ảnh của một số kiểu chữ phổ biến trong in ấn thương nại thế kỷ
19 và 20 ở 600 dpi 1-bít
Trang 30Số gam màu thể hiện được tương ứng với một vài số bit thường gặp như sau:
21 = 2 28 = 256
22 = 4 224 = 16,7 triệu
Trang 3124 = 16
Trong một ảnh đen trắng, mỗi pixel được đại diện bởi 1 số nhị phân; trong một ảnh "đủ màu xám" (full grayscale), mỗi pixel được đại diện bằng 8 số nhị phân Như vậy ảnh xám có số bit lớn hơn ảnh đen trắng 8 lần và do đó có kích thước tệp lớn hơn 8 lần Mỗi pixel của một ảnh
"màu thực" (true color) chứa 24 số nhị phân, vì vậy kích thước tệp của
nó lớn hơn tệp ảnh 1 bit 24 lần và lớn hơn tệp ảnh 8 bit 3 lần Để xác định kích thước tệp của các ảnh xám hoặc ảnh màu, ta sử dụng công thức được cải biến từ công thức tính của ảnh đen trắng:
công thức 7: xác định kích thước tệp ảnh xám hoặc ảnh màu:
Số gam màu thể hiện được tương ứng với một vài số bit thường gặp như sau:
Nén (Compression)
Như chúng ta đã biết, kích thước tệp ảnh số khá lớn nên thường gây khó khăn cho hoạt động máy tính và mạng của nhiều hệ thống Các kỹ thuật nén được sử dụng để giảm bớt kích thước tệp ảnh số, tạo điều kiện cho lưu trữ, xử lý và chuyển tải Song kiểu nén và mức độ nén cũng sẽ ảnh hưởng đến chất lượng ảnh
Trang 32Có rất nhiều kỹ thuật nén Một số chỉ được sử dụng với những loại ảnh nhất định (ví dụ: chỉ với ảnh 1 bit), hoặc với những loại ảnh nhất định (ví dụ: chỉ với đĩa compact ảnh của Kodak) Có rất nhiều kỹ thuật nén có thể sử dụng với các ảnh đen trắng, ảnh xám và ảnh màu Về tính đặc hiệu của các kỹ thuật nén được sử dụng rộng rãi ngày nay, các bạn có thể tham khảo tài liệu Encyclopedia of Graphics File Formats (Bách khoa thư về các cấu hình đồ hoạ) của James D Murray và William
vanRyper (O'Reilly & Associates, 1994)
Nhìn chung, tất cả các kỹ thuật nén đều dựa vào các thuật toán phức tạp, chuyên biệt để rút gọn các chuỗi mã số nhị phân của một ảnh chưa nén thành ký hiệu toán học Có thể chia thành 2 loại kỹ thuật nén chính:
1 Nén không mất (lossless compression): Một số hệ thống nén có các thông tin được lặp dưới dạng một thuật toán để có thể được đọc ngược (hay "giải nén" - "decompressed") một cách chính xác với ảnh gốc Loại nén này được gọi là "nén không mất" vì không có một thông tin nào bị
bỏ đi trong quá trình nén Nén không mất ban đầu được sử dụng với ảnh đen trắng Ảnh bên lề trái là một ví dụ về loại kỹ thuật nén không mất
2 Nén mất (lossy compression): Các hệ thống nén khác sử dụng một phương tiện nào đó để xác định thông tin nào không quan trọng và có thể bị dung hoà hoặc loại bỏ mà ảnh hưởng không đáng kể đến chất
lượng ảnh Ví dụ, mắt thường nhạy cảm với các thông tin về quang hơn với các thông tin về màu, vì vậy một số kỹ thuật nén hay thiên về loại bỏ
Trang 33các thông tin màu Loại kỹ thuật nén này được gọi là "nén mất" vì ảnh
đã được nén không còn giống hệt ảnh gốc nữa Nén mất được sử dụng trong quét xám và màu, đặc biệt với những ảnh phức tạp đến mức việc rút gọn thông tin gần như không có ý nghĩa trong việc thu nhỏ tệp
Đối với các tệp số chủ, tốt nhất là nên sử dụng kỹ thuật nén không mất, sau đó sử dụng các kỹ thuật nén mất phù hợp với từng dạng tệp phái sinh sao cho đảm bảo được tốc độ và chất lượng hiển thị cao Bạn có thể
sử dụng nhiều loại kỹ thuật nén chuẩn và không chuẩn, song tốt nhất bạn nên chọn loại chuẩn và phổ biến, không nên chọn một loại quá đặc hiệu, dù nó có khả năng nén hiệu quả hơn mà lại ảnh hưởng đến chất lượng ảnh ít hơn đôi chút, vì rất có thể bạn sẽ không sử dụng được nó lâu dài Nếu bạn sử dụng những kỹ thuật nén không chuẩn để quét ảnh, hãy cân nhắc xem liệu ảnh đó có khả năng di nhập vào một dạng hoặc kỹ thuật nén khác hay không, ví dụ như trường hợp đĩa compact ảnh
Kodak (ảnh Pac)
Khi lựa chọn kỹ thuật nén, bạn cũng nên cân nhắc đến các thuộc tính của nguyên bản Một số kỹ thuật như ITU Group 4 được thiết kế cho nén bản văn, trong khi một số loại khác như JPEG và ảnh Pac lại được thiết kế để nén dưới dạng tranh "thiên nhiên" Đối với các văn bản hỗn hợp (ví dụ ảnh chụp có thuyết minh), thì cần phải cân nhắc (Xem các ảnh hưởng của JPEG lên bản văn trong các ví dụ trang 25.)
Các kỹ thuật nén đen trắng, xám và màu thông dụng
Các kỹ thuật nén đen trắng, xám và màu thông dụng
Trang 34+ Với tệp số chủ và tệp phái sinh quét đen trắng
- International Telecommunications Union (Hiệp hội Viễn thông Quốc tế), ITU T.6 (Nhóm 4) chuẩn (trước đây là CCITT 84b-1998); ANSI/ AIIM MS53-1993 chuẩn khi chuyển đổi giữa các ảnh thuộc nhóm 4; nén không mất
- Joint Bi-level Image Group (JBIG) (ISO 11544), nén không mất
+ Với tệp số chủ và tệp phái sinh quét xám / màu
- Lempel-Ziv-Welch (LZW), không chuẩn nhưng được sử dụng rộng rãi; chỉ thích hợp với quét đen trắng, nén không mất
- Joint Photographic Experts Group (JPEG) (ISO 10918-1), được coi là không mất đến mức 2-3:1, nhưng mất ở các mức cao hơn; mức độ ứng dụng của JPEG phụ thuộc vào sở thích về chất lượng của người sử dụng
- Kodak Image Pac, không chuẩn nhưng được sử dụng rộng rãi trong công nghiệp, nén không mất "theo chuẩn mắt thường"
Do kích thước tệp ảnh nén thay đổi theo loại và mức độ nén; độ phân giải, số bit và dạng tệp chứa ảnh quét; và mức độ phức tạp của nguyên bản, ta không thể dự đoán được một tỉ số chính xác Nói cách khác, ta không để đòi hỏi người bán máy quét cung cấp một tỉ số nén toàn bộ cụ thể, ví dụ 5:1 Công thức số 8 là công thức ước lượng kích thước của một tệp nén dựa vào các mức nén trung bình giả sử và các hệ thống chuẩn
Trang 35Cornell đã tìm ra giới hạn của tỉ số nén không mất trung bình của quét các trang văn bản ở mức 600 dpi 1-bit Giới hạn đó nằm trong khoảng từ 5:1 đối với các ảnh phức tạp nhất đến 40:1 đối với các bản văn đơn giản Phát hiện này dựa vào thử nghiệm sử dụng kỹ thuật nén ITU nhóm 4 cho các ảnh TIFF 5.0 Ước lượng về yêu cầu lưu trữ dựa vào tỉ số trung bình giả sử là 20:1 đối với các trang văn bản ở những thử nghiệm đầu tiên trên các mẫu ảnh xám được quét tại trường, ảnh JPEG dường như không mất chi tiết khi nhìn bằng mắt thường ở độ nén 8:1 đối với bản văn/ dòng và ở độ nén từ 10 đến 15:1 đối với các ảnh gam chuyển tiếp công thức 8: đánh giá kích thước tệp chứa ảnh nén
Ảnh hưởng của dải xám và nén đến độ phân giải
-chất lượng ảnh phụ thuộc vào tổ hợp dải xám và độ phân giải
- đọc lệch không phải là một yếu tố quan trọng đối với dải xám
- độ phân giải đầu vào = độ phân giải đầu ra
- ảnh hưởng của độ nén lên chất lượng ảnh
- tính độ phân giải cần thiết khi quét 8-bit
- chuỗi số hoá
Trang 36- nghiên cứu tại Thư viện của Quốc hội và Cornell
Các công thức tính chỉ số chất lượng số trong kỹ thuật quét đen trắng có thể được áp dụng vào kỹ thuật quét xám (và màu), nhưng cần phải điều chỉnh rất nhiều Với mỗi pixel gồm nhiều số nhị phân, quét xám dường như dịch các ký tự cũng như những chi tiết khác của văn bản một cách trung thực hơn quét đen trắng ở cùng một độ phân giải Ví dụ, Cornell
đã tìm ra rằng để đạt được QI = 8 khi quét đen trắng có bù vào sự đọc lệch, cần 24 điểm trên 1mm chiều cao ký tự (615 dpi) Với quét xám, chỉ cần 12 điểm trên 1 mm chiều cao ký tự (308 dpi) Trong quét xám, độ phân giải đầu vào dường như là một chỉ thị chính xác để tính được độ phân giải đầu ra nếu như các tệp không bị nén hoặc bị nén không mất theo tiêu chuẩn mắt thường bằng kỹ thuật JPEG
Các công thức về độ phân giải (trong quét xám)
Những công thức sau đây được sử dụng để dự tính những độ phân giải trong quét xám tương ứng với các mức chất lượng như ở quét đen trắng Các công thức này dành cho ảnh chưa nén, hoặc nén không mất theo tiêu chuẩn mắt thường
Công thức 9: xác định độ phân giải theo chuẩn trong quét xám:
dpi = 1,5QI / 0,039h
QI = 0,039dpi x h /1,5
h = 1,5QI / 0,039dpi
Trang 37Bảng 3: ước lượng độ phân giải cần thiết trong kỹ thuật quét xám 8-bít
và nén không mất JPEG
0,5 mm 277 dpi 385 dpi 615 dpi
1,0 mm 138 dpi 192 dpi 308 dpi
Trang 38
Nghiên cứu tiếp theo, bắt đầu từ Thư viện của Quốc hội (Các nhân tố ảnh) và một số nơi khác cho thấy quét xám có khả năng bắt được nhiều loại tư liệu nguồn mà các máy quét đen trắng chưa xử lý được Ví dụ, quét xám cần cho các bản viết tay, ảnh gam chuyển tiếp, và các trang văn hư hỏng quá nhiều hoặc không đồng đều Ngoài ra nó còn bắt được các văn bản nửa tông hoặc kiểu nửa tông mà quét đen trắng nâng cao cũng không cho được sản phẩm thoả đáng ở cùng một độ phân giải, sự
bổ sung màu xám vào các bản văn với kỹ thuật quét xám có thể cải thiện chất lượng ảnh, nhưng chỉ khi màu xám được dịch ở đầu ra hoặc được
sử dụng để tăng độ phân giải ở quá trình in
Tuy nhiên, những phát hiện ban đầu từ các thử nghiệm ở Cornell cho thấy ngay cả khi thêm màu xám, vẫn nên lựa chọn độ phân giải 400 dpi ở đầu vào để bù vào nén, như vậy các ký tự và các chi tiết nhỏ sẽ được dịch tốt hơn
Bảng 4 đưa ra một số kết quả thử nghiệm quét các ký tự 0,6mm (chữ đậm, nghiêng 4 pt) từ máy quét AIIM Scanner Test Chart Bạn để ý rằng theo chuẩn mắt thường thì các mức độ chất lượng ảnh đạt được như nhau (ở mức trung bình) với ảnh không nén 300 8-bit , ảnh 400 8-bit nén 10:1 và ảnh 6001-bit nén 9:1 Trong khi đó, với kích thước 8,3 MB, ảnh 300 8-bit lớn hơn ảnh 400 8-bit xấp xỉ 6 lần và lớn hơn ảnh 600 1-bit
17 lần Nếu chất lượng như nhau, kích thước tệp và độ nén là 2 yếu tố cần cân nhắc khi tạo một tệp số chủ Vì vậy, theo ý kiến của Cornell thì nên sử dụng quét đen trắng với bản văn/ dòng bất kỳ khi nào có thể
Trang 39Bảng 4: Chất lượng ảnh và kích thước tệp với quét đen trắng và quét xám bằng máy quét AIIM scaner Test chart #2
Trang 40"h" là số đo toàn bộ một chi tiết, tức là phần nhỏ nhất có ý nghĩa đối với nội dung của tư liệu Chi tiết của tư liệu thường được cấu thành từ
những phần nhỏ hơn, ví dụ như đường kính của một nét chữ Số đo "h"
là chiều cao tính bằng mm của toàn bộ một chi tiết chứ không phải là số
đo của những tiểu phần của nó