IV. Khía cạnh xã hội của chữ viết
3. Mật độ thông tin ngôn ngữ
Khác với hình ảnh hay âm thanh (lời nói), ngơn ngữ thuộc phần vật chất không thể tri nhận được mà không thông qua kí hiệu. Khi giao tiếp bằng ngơn ngữ, thơng tin mà chúng ta tri nhận không phải ở dạng nhị phân kiểu “có” và “khơng” mà nó cịn ở dạng siêu ngôn ngữ (métalinguistique). Thông qua ngôn ngữ ta không chỉ biết cái gì, việc gì, như thế nào.. mà cịn biết được ít nhiều về cảm xúc, quan điểm, vị thế xã hội.. của người đối thoại, về ngữ cảnh giao tiếp, mức độ trang trọng, chủ đề, mục đích.. của cuộc hội thoại. Thông tin ngôn ngữ do vậy không thểđo bằng đơn vịthông tin thông thường là bit mà phải được do bằng đơn vị ngôn ngữ nhỏ nhất có nghĩa: hình vị.
Mật độ thơng tin ngôn ngữ cho ta biết mức độ phân bố của thơng tin ngơn ngữở các hệ thống kí hiệu của nó. Trong lời nói, nó sẽđược tính bằng tổng số hình vịtương ứng trên tổng số đơn vị nhỏ nhất của một chuỗi lời nói là âm tố (âm tiết). Đối với chữ viết, nó được tính bằng tổng số hình vịtương ứng trên tổng sốđơn vị nhỏ nhất của một chuỗi kí tự là tự tố (kí tự).
Bảng dưới đây cho biết mật độ thông tin ngôn ngữ của một số hệ chữ khảo sát trên một đoạn væn tiếng Việt có 41 chữ (khơng tính dấu cách, dấu câu). Vì tiếng Việt thuộc loại hình đơn lập nên 41 chữtương đương với 41 hình vị
Hệ chữ Mật độ thông tin ngôn ngữ
Latin 41/143 ≈ 0,287
Tengwar 41/90 ≈ 0,456
36
Đoạn đầu tiên trong Tuyên ngôn độc lập của nước Việt Nam DCCH viết bằng 3 hệ chữ. Từ trên xuống: chữ latin, chữ tengwar và chữ hán Từ những thơng số trên, có thể thấy chữ latin có mật độ thơng tin ngơn ngữ thấp nhất (≈0,3), chữ Hán có mật độ thơng tin ngơn ngữ cao nhất (=1). Điều này đồng nghĩa để truyền tải một lượng thông tin ngôn ngữnhư nhau, chữ hán sử dụng ít số kí tựhơn chữ latin, thông tin ngôn ngữđược tri nhận nhanh hơn; đểlưu trữ cùng một lượng thông tin ngơn ngữ, vỉn bản chữ hán tốn ít bộ nhớ thiết bịhơn vỉn bản chữ latin, thơng tin ngơn ngữđó cũng được truyền tải với tốc độ nhanh hơn trên cùng một hạ tầng... Điều này lý giải tại sao những người chơi game kiểu speedrun thường chọn chạy bản tiếng Nhật, tiếng Trung hoặc các tiếng dùng chữ Hán của game hơn là chọn tiếng Anh hay các tiếng dùng chữlatin khác để nâng cao thành tích. Việc các tiếng dùng chữ latin tồn tại nhiều kiểu viết tắt qua tin nhắn cũng có l{ do tương tự: viết tắt khi nhắn tin không những giúp thơng điệp được mã hố nhanh hơn mà cịn giúp tin nhắn đó được gửi đi nhanh hơn, tiết kiệm được thời gian và chi phí dịch vụ phải trả cho nhà mạng..
Đại lượng này có { nghĩa nhiều trong nghiên cứu chữ viết hơn là lời nói. Nó giúp ta tính tốc độ truyền tải thơng tin qua các hệ thống kí hiệu của ngơn ngữcũng như giúp ta phán đốn quy luật phát triển của các hệ thống kí hiệu này, từđó đưa ra định hướng để chủđộng sửa đổi cải tiến
37
các chính sách, tháo dỡ các rào cản xã hội trong việc phát triển ngôn ngữ và các hạ tầng thông tin của một quốc gia..