c. Địa danh là nơi l−u trữ tài liệu
2.3. Kết quả nghiên cứu
1. Phân tích mẫu nghiên cứu
Lựa chọn mẫu khảo sát:
Các CSDL và số l−ợng biểu ghi cụ thể lựa chọn nghiên cứu ở từng cơ quan.
Ph−ơng pháp tiến hành:
Sau khi tạo một format nhằm rút ra các tr−ờng có chứa địa danh trong từng CSDL, ta in toàn bộ các biểu ghi này ra theo format vừa xây dựng sang tệp văn bản (TXT).
Xử lý các tệp in này bằng cách nhặt ra chỉ các địa danh, ta sẽ có danh sách địa danh trong từng CSDL, ở từng cơ quan khảo sát.
Với một số tr−ờng hợp, có thể khảo sát CSDL đã chọn bằng cách kết hợp với ấn phẩm thông tin-một sản phẩm từ các CSDL này.
Mặt khác, cũng tìm hiểu xem ở các cơ quan này có Quy định nào về địa danh hay ch−a. Và thực tế, nếu đã có, thì nó có đ−ợc tuân thủ khi xử lý tài liệu hay không? Tại sao?
Bằng cách xử lý các danh sách này, ta có tổng quan về việc sử dụng địa danh trong các CSDL t− liệu nghiên cứu.
2. Kết quả nghiên cứu
1). Hiện ch−a có một tiêu chuẩn hoặc tài liệu quy định thống nhất nào về địa danh đ−ợc ban hành và sử dụng phục vụ cho xử lý thông tin của các cơ quan thông tin t− liệu ở Việt Nam.
2). Địa danh còn ch−a đ−ợc chú ý trong khi xử lý tài liệu. Có cơ quan ch−a quan tâm đến địa danh, và do đó bỏ qua việc xử lý dữ liệu này. Thí dụ: tại Viện TTKHXH, chỉ có một số rất ít biểu ghi có xử lý địa danh, hầu nh− ở những tài liệu này, địa danh có ngay trên nhan đề tài liệu.
3). Với các CSDL của các cơ quan đã quan tâm đến địa danh, (nh− Trung tâm TTKHCNQG, Th− viện quốc gia Việt Nam..), địa danh cũng không đ−ợc xử lý thống nhất và chính xác giữa các cơ quan khác nhau, giữa các CSDL trong cùng một cơ quan, thậm chí giữa các biểu ghi trong cùng một CSDL.
Sự không thống nhất này thể hiện nh− sau:
Về mặt chính tả:
- Viết hoa và viết th−ờng:
Thí dụ: Hải Phòng, Hải phòng, hải phòng
- Đánh dấu chính tả:
Thí dụ: Thanh Hóa, Thanh Hoá
Về tính chính xác:
- Có dấu liên kết và không có dấu liên kết:
Thí dụ: Thừa Thiên- Huế, Thừa Thiên Huế
- Giữa các chữ C và K:
Thí dụ: Bắc Cạn, Bắc Kạn
Thí dụ: Đắk Lắk, Đăk Lăk
- Có dấu và không có dấu ^:
Thí dụ: Bà Rịa-Vũng Tàu, Bà Rịa-Vũng Tầu
Về viết tắt:
- Viết tắt và không viết tắt:
Thí dụ: Thành phố Đà Nẵng, TP. Đà Nẵng
- Có dấu chấm và không có dấu chấm sau từ viết tắt:
Thí dụ: TP. Hồ Chí Minh, TP Hồ Chí Minh, T.P. Hồ Chí Minh
Về việc viết cụm từ chỉ loại địa danh:
+ Có và không có từ chỉ tên chung của địa danh:
Thí dụ: Tỉnh Thái Bình, Thái Bình
Thành phố Việt Trì, Việt Trì Thị xã Hà Đông, Hà Đông
Quần đảo Tr−ờng Sa, Tr−ờng Sa
+ Có và không có từ chỉ vùng/miền:
Thí dụ: Miền đông Nam Bộ, Đông Nam Bộ
Vùng đông Bắc, Đông Bắc
+ Có và không có từ chỉ h−ớng:
Thí dụ: Tả ngạn Sông Hồng, Sông Hồng
Hiện nay, có một số tài liệu về viết địa danh nói chung và địa danh Việt Nam nói riêng do một số cơ quan trong n−ớc biên soạn phục vụ cho hoạt động chuyên môn của mình. Cụ thể là:
+ Tổng cục B−u điện có Danh mục tên tỉnh/thành phố với tên viết tắt và mã t−ơng ứng sử dụng cho b−u chính và điện thoại trong n−ớc.D−ới góc độ xử lý, l−u trữ và trao đổi thông tin danh sách này có những hạn chế sau đây:
- Danh sách này ch−a đầy đủ về địa danh hành chính (chỉ có tên tỉnh/thành phố)
- Tên viết tắt ch−a thật thông dụng và thuận tiện cho ng−ời xử lý thông tin cũng nh− ng−ời tìm tin và có những điểm không t−ơng thích với TCVN 4743-89. Xử lý thông tin. Mô tả th− mục tài liệu. Yêu cầu chung và quy tắc biên soạn.
Thí dụ:
+ Nơi xuất bản Hà Nội đ−ợc ghi là H. (TCVN 4743-89), còn theo quy định viết tắt của Tổng cục B−u điện thì Hà Nội là HNI.
+ Bộ Giáo dục có Quy định về chính tả tiếng Việt và về thuật ngữ tiếng Việt trong các sách giáo khoa, đ−ợc ban hành kèm theo Quyết định số 240/QĐ ngày 5-3-1984 của Bộ tr−ởng Bộ giáo dục, song quy định này khá phức tạp, đôi chỗ ch−a thống nhất, lại không thuận lợi cho việc xử lý và tìm tin.
Thí dụ: Theo Quy định này, các tên phiên âm từ tiếng dân tộc ít ng−ời thì chỉ viết hoa chữ cái dầu ở mỗi bộ phận của tên, giữa các tiếng trong cùng một bộ phận có gạch nối. Thí dụ: Sông Sê-san, Núi Chơ-hơ-rông. Điều này gây phức tạp và không phù hợp với truyền thống xử lý tài liệu trong hầu hết các cơ quan thông tin t− liệu hiện nay. (Núi Chơ Hơ Rông).
+ Nhà xuất bản Bản đồ sử dụng địa danh hành chính theo Danh mục các đơn vị hành chính Việt Nam của Nhà xuất bản thống kê. Tuy nhiên do mục đích cung cấp thông tin về các đơn vị hành chính, nên địa danh đ−ợc viết đầy đủ tối
đa. Thí dụ: Thành phố Đà Nẵng, Thị xã Phủ lý..., không đảm bảo tính đơn giản thuận tiện cho ng−ời xử lý thông tin và ng−ời dùng tin. Mặt khác, việc thả dấu tiếng Việt trong danh mục này không phù hợp với cách viết chính tả của tiếng Việt hiện đại là t−ơng hợp với Unicode. Thí dụ: Tỉnh Thanh Hóa, Tỉnh Khánh Hòa (theo danh mục) nên viết trong các CSDL t− liệu là Thanh Hoá, Khánh Hoà.
Nh− vậy, các tài liệu trên đều ch−a thể đáp ứng yêu cầu thống nhất về viết địa danh Việt Nam trong xử lý, l−u trữ và trao đổi thông tin của Hệ thống TTKHCNQG.