Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 24 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
24
Dung lượng
186,72 KB
Nội dung
Chuyểndạngtàiliệudễdànghơnvớicôngnghệsố
Paul Conway
- Trưởng phòng, Phòng Bảo quản, Thư viện
Trường Đại học Yale
Tóm tắt
Bài viết này nhằm ba mục đích. Trước tiên, bài viết định
nghĩa các côngnghệsố dưới góc độ của truyền thông và mã
hoá. Tiếp theo, bài viết trình bày những thành ph
ần then chốt
của một hệ thống côngnghệ ảnh số (digital imaging system)
và những bước quan trọng nhất trong quá trình tạo hình ảnh
số. Cuối cùng, bài viết nêu ra một số vấn đề lớn cần phải l
ưu
ý khi các th
ư viện và trung tâm lưu trữ chuyển từ quá trình
thử nghiệm côngnghệsố sang sử dụng nó như một công cụ
để chuyển đổi cách thức hoạt động của mình.
Mục lục
Nh
ững khái niệm cơ bản về kỹ thuật số
Sản phẩm và quá trình tạo hình ảnh số
Nh
ững vấn đề cần lưu ý
Giới thiệu
Chúng ta đang sống trong một thế giới số. Kỹ thuật số hiện
hữu ở mọi nơi. Số bàn phím nhiều hơn cả số nhân viên văn
phòng. Ai cũng có riêng một trang Web. Không còn ai phải
đem theo tiền mặt. Những từ như "bitslag", "jitterati",
"NIMQ" và "CGIJoe" xuất hiện trong những câu chuyện
thường ngày. Những nhà tỷ phú côngnghệ dường như sở
hữu những bản sao kỹ thuật số của tất cả những kho tàng
nghệ thuật. Đối với các thư viện và trung tâm lưu tr
ữ, lo ngại
dường như càng tăng lên rằng nếu chúng ta không áp dụng
kỹ thuật số, không hoà mình vào kỹ thuật số, không tư duy
kỹ thuật số thì chúng ta đang tự giam mình trong một bảo
tàng giấy khổng lồ.
Thế nhưng, thách thức lớn nhất mà chúng ta gặp phải có lẽ
không phải là đi theo côngnghệsố mà phải là xây dựng một
ngôn ngữ chung để mô tả những biến đổi có tác động phi
thường như vậy tới cuộc sống hàng ngày của chúng ta. Một
vốn từ chung là yếu tố then chốt để xây dựng một xã hội
hành động và một tầm nhìn chung về tương lai giữa những
người đang gánh trách nhiệm lưu giữ các nguồn lực văn hoá
của đất nước. Jim Taylor và Watts Wacker chỉ ra rằng "Nếu
nhìn lại lịch sử, giá trị thực sự đọng lại từ cuốn Những xu
hướng lớn (Megatrends) của Naisbitt và Làn sóng thứ ba
(Third Wave) của Toffler's hoá ra lại là từ ngữ chứ không
phải thế giới quan". Không đâu mà từ ngữ lại đángđể bàn
hơn là trong cách nhìn của chúng ta về vị trí của công tác
bảo quản trong thế giới số mà chúng ta đang sống.
Nh
ững khái niệm cơ bản về kỹ thuật số
ở mức độ cơ bản nhất, các côngnghệsố là một sự tiếp nối
cách thức mà từ xưa đến nay chúng ta giao tiếp với nhau.
Nhu c
ầu giao tiếp tạo ra động cơ và cơ s
ở hợp lý cho sự phát
triển của đủ loại công nghệ. Thế giới số ngày nay gắn liền
với việc sáng tạo, chia sẻ và sử dụng thông tin dưới dạng số.
Thông tin số hoá là những dữ liệu được cấu trúc và xử lý,
lưu trữ và nối mạng, được trả tiền và được bán.
Thông tin nằm ở nhiều dạng khác nhau. Một trong những
cách phân biệt các dạng này là phân biệt giữa thông tin
tượng hình và thông tin mã hoá. Chúng ta hãy mô tả điều
này bằng cách nhìn vào rất nhiều cách biểu diễn chữ cái phổ
biến nhất trong bảng chữ cái Latinh - chữ cái E - bắt đầu với
những biểu tượng sơ khai của bảng chữ cái in.
Một bài học lịch sử
Thời kỳ từ phát minh của Guntenberg vào gi
ữa thế kỷ 15 cho
đến năm 1500 thường được gọi là sơ kỳ. Vào thời kỳ này,
các nhà in và nhà làm sách phải tốn khá nhiều công sức để
làm cho sản phẩm của mình - từ kiểu chữ, định dạng đến
trình bày - có bề ngoài và cách sử dụng giống như những
cuốn sách viết tay của những thế kỷ trước. Chỉ đến khi lý
thuyết về bảng chữ cái và lý thuyết về sách xuất hiện vào
khoảng thời kỳ mà tác phẩm cổ điển của Geofroy Tory được
thể hiện trên cấu trúc bảng chữ cái Latinh, những nhà làm
sách mới có thể bắt đầu tận dụng được phát kiến côngnghệ
của Gutenberg.
Sơ đồ 1 là minh hoạ của chữ hoa "E" trong tác phẩm Champ
Leury của Tory năm 1529 được viết nhằm phát triển lý
thuyết về bảng chữ cái trên cơ sở các bộ phận của cơ thể
người và những nguyên lý cơ bản của Ơ-clit (Euclid). ở đây,
chữ cái "E" là một mẫu vẽ bằng mực trên giấy.
Thế giới được định hình bằng các chuỗi số 1 và số 0 vốn tồn
tại đã từ rất lâu. ý tưởng về máy tính số bắt nguồn từ hơn
300 trước đây trong bộ óc đầy sáng tạo của nhà toán học
người Đức Gottfried Wilhelm von Leibnitz. Năm 1679,
Leibnitz tưởng tượng ra một thiết bị mà trong đó các con số
nhị phân được thể hiện bằng những hạt nhỏ hình cầu, tuần
hoàn trong một cỗ máy như kiểu máy trong trò chơi b
ắn đạn,
được điều khiển bởi một dạngsơ khai của phiếu đục lỗ. Ông
mô tả một hệ thống số hoàn chỉnh mà trong đó tất cả các
phép tính đều có thể biểu diễn bằng những tập hợp của số 1
và số 0 - cách tiếp cận giống hệt cách mà các côngnghệsố
ngày nay đang sử dụng.
Chúng ta đang sống trong kỷ nguyên sơ khai của kỹ thuật số
- thời kỳ được đánh dấu bằng những nỗ lực thầm lặng nhằm
làm tạo ra những sản phẩm kỹ thuật số có hình thức và tính
năng giống như những sản phẩm côngnghệ tương tự
(analog) cùng loại. Nhưng chỉ khi nào chúng ta xây dựng
được một lý thuyết về biểu diễn thông tin dạngsố chúng ta
mới có thể khai thác hết sáng tạo toán học của Leibnitz.
Ngày nay, lý thuy
ết đó đang được hình thành.
Sơ đồ 2 là một mẫu chữ tượng hình khác - ch
ữ Braille. ở đây
chữ cái "e" được biểu diễn bằng những dấu chấm nổi to và
nhỏ theo những đường kẻ có thể cảm nhận được. Cũng cần
lưu ý rằng cùng một mẫu chữ có thể được hiểu hoặc là chữ
"E" hoặc là số "5" tuỳ thuộc ngữ cảnh của mẫu chữ đó được
sử dụng. Ngữ cảnh cũng là ý tưởng rất quan trọng đối với
việc biểu diễn thông tin dưới dạng số. Đối với chữ Braille,
nếu bạn biết ngữ cảnh và hiểu được mẫu chữ, việc giao tiếp
sẽ nhanh chóng và hiệu quả.
Ngôn ng
ữ Ký hiệu của Mỹ sử dụng dấu hiệu làm biểu tư
ợng.
Đó là ngôn ngữ mà người ta kết hợp hình dáng và c
ử chỉ của
bàn tay để truyền đạt ý nghĩa. Hình dáng mà không có c
ử chỉ
mới chỉ là một nửa của quá trình (truyền tin). Giao tiếp phụ
thuộc vào việc cùng hiểu ý nghĩa của cả hai thành phần đó
của ngôn ngữ. Sơ đồ 3 là sự thể hiện dưới dạng tĩnh của chữ
cái "E".
Tuy nhiên, trong hiệu lệnh bằng cờ, cách thức cử động lại
chính là biểu tượng. Việc chuyển đổi từ một sự kết hợp giữa
cờ và tay sang một sự kết hợp khác tạo ra một sự liên kết
thông tin. Sơ đồ 4 là một hình thức biểu diễn khác dư
ới dạng
tĩnh của chữ cái "E". Những lý thuyết về truyền thông kỹ
thuật sốđang hình thành vẫn chưa giải thích đầy đủ về
những giác quan khác nhau mà chúng ta thường sử dụng để
giao tiếp trực tiếp - đó là những đặc điểm tinh tế của ngôn
ngữ hành động, cử chỉ và giọng điệu. Và khi truy
ền thông kỹ
thuật số càng trở nên tinh vi, sự phụ thuộc của nó vào máy
móc là một trở ngại lớn.
Mặc dù vậy, một số hình thức đầu tiên của truyền thông trực
tiếp hiện đại qua những khoảng cách lớn lại mang đặc trưng
của kỹ thuật số. Sơ đồ 5 là một ví dụ về Máy điện báo bằng
hình
ảnh của George Murray từng truyền tin từ Luân Đôn tới
Deal bắt đầu từ năm 1794. Hệ thống này bao gồm các bục
nổi được đặt đối xứng ngang nhau. Trên mỗi bục nổi này có
một bảng lớn gồm sáu lỗ vòng tròn l
ớn có thể đóng bằng các
các cửa sập bằng gỗ - khá là giống với các kiểu chữ Braille -
do một nhân viên đã qua đào tạo điều khiển. Các báo cáo
cho th
ấy một thông điệp có thể truyền dọc một chuỗi 15 trạm
trong vòng vài phút. Nhưng hãy thử tưởng tượng xem cần
tổng số bao nhiêu nhân viên hành chính để vận hành hệ
thống như vậy!
Con đường phát triển từ Điện báo Hình ảnh tới truyền thông
kỹ thuật số hiện đại được đánh dấu bằng những chuyển đổi
liên tiếp từ biểu tượng sang mã số. Samuel F.B. Morse phát
minh ra mã số gồm các dấu chấm và gạch ngang làm ngôn
ngữ cho máy điện báo của ông. Radio - hay điện báo không
dây - cũng bắt nguồn từ mong muốn mở rộng truyền thông
kỹ thuật số của Morse tới những nơi mà đường dây không
thể với tới được. ứng dụng đầu tiên của côngnghệ tương tự
sử dụng các sóng liên tục là việc truyền các dấu chấm và
gạch ngang của tín hiệu Morse tới các tàu trên biển. Việc m
ã
hoá chữ cái E bằng mã 01100101 trong bảng mã ASCII hiện
nay bắt nguồn từ các lý thuyết của Leibnitz và côngnghệ
thực tiễn của Samuel Morse hơn là bắt nguồn từ côngnghệ
phát thanh và truyền hình.
Mã hoá bằng số - một số khái niệm cơ bản
Hệ thống kỹ thuật số (digital) sử dụng các con sốđể biểu
diễn một đối tượng cụ thể hoặc một ý tưởng trừu tượng. Số
hoá (digitization) là quá trình chuyển đối tượng hoặc ý tư
ởng
đó thành một mã số. Giới hạn của côngnghệ kỹ thuật số là
hệ thống mã hoá chỉ sử dụng hai con số - số 1 và số 0 - vì
vậy mà ta có khái ni
ệm nhị phân (binary). Mỗi vị trí số trong
hệ thống là một bit. Trong thế giới số bit là vật chất; chúng
chiếm không gian; chúng cần thời gian để di chuyển từ vị trí
này sang vị trí khác. Người ta có thể đếm và mô tả được một
tập hợp các bit, giống bất cứ một thứ nào khác. Cách phổ
biến nhất để đếm các bit trong một hệ thống là sử dụng
"byte" hay tám bit, mặc dù côngnghệ máy tính đã không
còn sử dụng byte như là một đối tượng độc lập từ hàng thập
kỷ trước đây.
- Kỹ thuật số (digital): sử dụng các con sốđể thể hiện các
đối tượng khác nhau
- Phân tích dữ liệusố (digitalize): xử lý tín hiệu điện tim,
một cách điều trị bệnh tim
- Số hoá (digital): chuyển một đơn vị đo lường tỷ biến sang
một mô tả dưới dạngsố
- Nhị phân (binaray): một hệ thống số trong đó mỗi con số
được biểu diễn bằng luỹ thừa của 2 chỉ sử dụng hai con số là
0 và 1.
- Bit: con số nhị phân
- Byte: 8 bit
Một ảnh ánh xạ bit là một bức ảnh số được tạo bởi các dòng
liên tục của các bit trong một khung lư
ới. Trong một bức ảnh
số, một bit thường được coi là m
ột điểm sáng (pixel), viết tắt
của cụm từ "picture element". Giống như các đối tượng, các
ảnh số được mô tả thông qua ba đặc trưng: độ phân giải,
khoảng động và kích thước điểm sáng.
Thời gian gần đây, khái niệm thứ tư, giá trị tín tông màu
(tonal value), được áp dụng để mô tả đặc trưng c
ủa một "ảnh
số", một thuật ngữ gây nhầm lẫn về sự thể hiện dư
ới dạngsố
của một bức ảnh, ví dụ như ảnh chụp. Một ảnh ánh xạ bit là
một kiểu trình bày mã hoá dạngsố chứ không phải là một
biểu tượng được mã hoá dạngsố như là chữ cái mà chúng ta
có thể nhận ra qua một bảng chữ cái.
- Độ phân giải (resolution): số điểm sáng (cả chiều ngang và
chiều dọc) làm nên một bức ảnh
- Khoảng động (dynamic range): số màu hoặc hoặc sắc thái
đậm nhạt có thể có trong một bức ảnh cụ thể
- Kích thước điểm sáng (pixel size): phần của lư
ới điểm sáng
mà một máy quét (scanner) có thể nhận biết và mã hoá được.
- Tông màu (tone): mức độ mà một bức ảnh chuyểntải các
khoảng độ chói của một cảnh gốc.
Độ phân giải là số điểm sáng (hay số chấm) đư
ợc sử dụng để
mã hoá một đoạn 2,54 cm (1 inch) theo chiều ngang và/hoặc
chiều đứng. Hãy quan sát một mẩu giấy kẻ dùng để vẽ biểu
đồ. Số các khối nhỏ trong một inch liên tiếp hướng lên hoặc
xuống của tờ giấy chính là độ phân giải. Số điểm sáng trong
một đoạn nhỏ càng nhiều thì độ phân giải càng lớn và các
kiểu hình ảnh hiển thị càng chính xác hơn trên một bề mặt
nào đó có thể biểu diễn được dưới dạng số. Mô tả một bức
ảnh bằng 300 điểm chấm trên một inch (dots per inch - dpi)
nghĩa là 300 điểm sáng được sử dụng để thể hiện mỗi inch
chạy ngang trên bề mặt. Đôi khi người ta (nhầm lẫn) cho
rằng một bức ảnh có 300 điểm sáng theo chiều ngang cũng
sẽ được biểu diễn bởi 300 dòng theo chiều đứng. Cấu trúc
thực tế của một khung lưới số phụ thuộc vào năng lực của
thiết bị quét hình.
Sơ đồ 6 là một chữ cái e cao 3 mm ở độ phân giải 600 dpi
được quét từ vi phim âm bản tại Thư viện Đại học Yale. L
ưu
ý r
ằng mẫu chữ mã hoá bằng số chiếm khoảng 4900 bit
trong máy tính sovới 8 bit cần để dùng cho các biểu tượng
mã hoá bằng của bảng mã ASCII.
Khoảng động chỉ số lượng mầu hoặc các sắc thái đậm nhạt
(shades of gray) có thể có trong một bức ảnh cụ thể. Khoảng
động đôi khi còn được gọi là "độ sâu" và thường được thể
hiện bằng số bit trên một điểm sáng. Trong chế độ quét ảnh
lưỡng sắc, số màu sắc ứng với mỗi điểm sáng được làm tròn
thành 0 (trắng) hoặc 1 (đen). Mỗi bit thông tin được dùng để
[...]... vô số các kho tàiliệu phức tạp và đa dạng thích hợp đểchuyển sang dữ liệusố Các nguồn đa dạng về kích cỡ, định dạng, chất liệu và điều kiện bảo quản; các nguồn có thể chủ yếu dưới dạng chữ; tàiliệu có thể có ảnh minh hoạ mà bản thân các ảnh minh hoạ này có thể rất đa dạng về tính chất Các nguồn cũng có thể có những nội dung quan trọng được in màu Không phải tất cả việc chuyển đổi dữ liệu sang dạng. .. côngnghệ Các côngnghệsố là một tập hợp công cụ đưa ra rất nhiều lựa chọn và rất ít giải pháp Có lẽ hợp lý hơn cả là nên phân biệt giữa các dự án côngnghệ ảnh số nhằm thử nghiệm các năng lực của côngnghệ (và kết quả là sự học hỏi) với những dự án làm thay đổi thực sự về chất các chiến lược quản lý thông tin của chúng ta Kiểm soát (Control) Liệu nó có phải là một từ bốn chữ cái (Ctrl)? Côngnghệ số. .. lộn với chúng nếu muốn các dự án số hoá của họ có giá trị lâu dài Sau đây là năm vấn đề vượt khỏi tầm những đặc trưng của côngnghệ ảnh số Công nghệCôngnghệ ảnh số là con voi hay chỉ là cái đuôi con voi? Các công ty chào bán côngnghệ ảnh số thường ưa dùng thuật ngữ "giải pháp" để mô tả giá trị các sản phẩm của họ Thuật ngữ này hàm ý rằng khách hàng xác định vấn đề của mình và mua một giải pháp về công. .. việc chuyểndạng một cuốn sách, một tập bản thảo, một phim âm bản hoặc một cuộn vi phim không phức tạp và không lắt léo Các đối tượng nguồn phù hợp cho việc chuyểndạng được lựa chọn và chuẩn bị để quét; việc chuyểndạng được thực hiện thông qua côngnghệ quét hình chuyển các tín hiệu ánh sáng phản chiếu thành dữ liệu số; việc truy cập dữ liệusố này được thực hiện bằng cách thể hiện các dữ liệusố đã... phẩm sốCôngnghệ là một trong những mắt xích yếu nhất trong toàn bộ hệ thống Côngnghệchuyểndạng giờ đây có khả năng tạo ra dữ liệu lớn hơn nhiều sovới khả năng có thể hiển thị một cách hữu dụng của phần lớn các màn hình máy hính hiện nay Sơ đồ 7 là một minh hoạ dạng biểu đồ của các thành phần trong mô hình xử lý Quan trọng là cần nhận thấy rằng sự phức tạp của một hệ thống côngnghệ ảnh số chỉ... việc sắp xếp các tài liệu gốc (bao gồm cả việc tiến hành các biện pháp bảo quản trước hoặc sau khi chuyển dạng) là một vấn đề hoàn toàn khác Suy cho cùng, mục đích của sản phẩm số bị chi phối bỏi các mục tiêu tiếp cận tài liệu, trong khi đó việc bảo quản các tài liệu gốc cần được quyết định dựa trên nhu cầu bảo quản những nguồn tài liệu này Những vấn đề đặt ra Tàiliệu này đã nêu ra một số vấn đề những... những kỳ vọng của họ đối với chất lượng của các sản phẩm côngnghệ ảnh số được tạo thành từ nhiều nguồn tàiliệu khác nhau Chất lượng là giá trị mà chúng ta gia tăng thêm vào các sản phẩm ảnh côngnghệsố Mặc dù vẫn còn tồn tại những vấn đề quan trọng về thước đo chất lượng, những trở ngại đối với việc đạt được chất lượng lại dường như không nằm ở chính bản thân côngnghệ Đúng hơn là chi phí để tạo ra... chúng ta đang sống Lựa chọn Các kho tàiliệusố của chúng ta vô dụng hay hữu dụng? Lựa chọn là yếu tố trung tâm của các ứng dụng côngnghệ số; việc lựa chọn côngnghệ mới chỉ là bước khởi đầu Lựa chọn nội dung cũng không kém phần quan trọng Không giống như các chiến lược xây dựng kho tàiliệu của các thư viện và trung tâm lưu trữ truyền thống, những chiến lược dẫn đến một quyết sách đối với việc thu... cùng Bảo vệ tàiliệu gốc ứng dụng cơ bản nhất của côngnghệsố vào thư viện hoặc trung tâm lưu trữ là nhằm tạo ra những bản sao dạngsố có đủ chất lượng để có thể dùng tham khảo thay thế cho việc tra tìm cẩu thả các tàiliệu gốc Các tệp tin tham khảo là ảnh của các bộ sưu tập ảnh, các tập bài cắt báo dùng hoặc các tệp hồ sơ mỏng cho phép định danh từng tàiliệu đơn lẻ cần nghiên cứu sâu hơn là các ví... côngnghệ thay đổi nhanh chóng Côngnghệ ảnh số không chỉ là một lựa chọn chuyểntàiliệu sang dạng khác Côngnghệ ảnh liên quan đến việc chuyển đổi khái niệm định dạng, chứ không chỉ nhằm tạo ra một bức tranh chính xác về một cuốn sách, một tài liệu, một tấm ảnh, hoặc một bản đồ lên một phương tiện khác Cũng như việc sáng chế ra ống chân không mở ra một dạng truyền thông đại chúng hoàn toàn mới - phát . Chuyển dạng tài liệu dễ dàng hơn với công nghệ số
Paul Conway
- Trưởng phòng, Phòng Bảo quản, Thư. có nhiều vô số
các kho tài liệu phức tạp và đa dạng thích hợp để chuyển
sang dữ liệu số. Các nguồn đa dạng về kích cỡ, định dạng,
chất liệu và điều