CHƯƠNG 2 : ĐÁNH GIÁ VỀ TỪ ĐIỂN VIỆT – VIỆT SOHA TRATU
2.3. Cấu trúc vi mô của từ điển Việt – Việt Soha Tratu
2.3.3. Phân biệt nghĩa
Trước tiên, cần phải phân biệt từ đa nghĩa (polysemy) và từ đồng tự (homograph). Hầu hết các đơn vị từ vựng, nhất là những đơn vị thường dùng đều là đa nghĩa. Về cách lựa chọn các nghĩa trong từ đa nghĩa, phải tương ứng và phù hợp với việc lựa chọn các đơn vị mục từ trong từ điển. Việc sắp xếp nghĩa của từ đa nghĩa được căn cứ vào cấu trúc nội bộ của từ, quan hệ giữa các nghĩa, hơn nữa còn là vấn đề kĩ thuật biên soạn từ điển. Ví dụ như căn cứ vào từ nguyên, vào sự phát triển logic của từ để sắp xếp từ cụ thể đến trừu tượng, từ chính đến phụ. Bên cạnh cách sắp xếp như vậy, cịn có thể sắp xếp theo
quan điểm lịch sử như nghĩa xuất hiện đầu tiên là nghĩa gốc, đối lập với các nghĩa sau (nghĩa phái sinh). Hoặc sắp xếp theo quan điểm ngôn ngữ như sẽ có nghĩa trội và các nghĩa khác phát triển theo sau (nghĩa trội là nghĩa rộng, trung tính, ít phụ thuộc vào ngữ cảnh, gợi lên ở người nghe sự liên tưởng đầu tiên tới tổ hợp âm thanh vừa nhắc tới).
Từ đồng tự là hai từ có cách viết giống nhau. Từ đồng tự cũng là một dạng của đồng âm dị nghĩa (homonym), tức là những từ có cùng dạng nhưng nghĩa khác nhau, khơng liên quan gì với nhau, ví dụ: bear (con gấu) và bear (mang) là đồng âm dị nghĩa với nhau. Trong tiếng Việt, viết giống nhau (tức từ đồng tự) thì sẽ đọc giống nhau (tức từ đồng âm dị nghĩa), nhưng khơng có chuyện ngược lại.
Từ điển Việt – Việt Soha Tratu là một từ điển trực tuyến. Chính vì vậy, việc tách riêng mỗi đơn vị đồng âm thành từng mục từ riêng là một việc khơng hợp lí. Với mỗi từ chỉ đưa ra một kết quả tra cứu. Trong kết quả đó sẽ được liệt kê tất cả các từ đa nghĩa, từ đồng tự có thể có của một từ. Việc tách riêng mỗi đơn vị đồng âm sẽ gây ra sự lộn xộn, khó khăn cho người tra cứu từ điển. Đây cũng là điểm khác biệt với các từ điển giấy thông thường khác. Chẳng hạn khi tra cứu từ (100) Đường sẽ cho ra kết quả như sau:
Danh từ
chất kết tinh có vị ngọt, được chế từ mía hoặc củ cải đường
ngọt như đường nhà máy đường
Tính từ
(hoa quả) thuộc loại có vị ngọt
cam đường bưởi đường
Danh từ
lối đi nhất định được tạo ra để nối liền hai địa điểm, hai nơi
phá núi mở đường tìm đường tiến thân
Đồng nghĩa: đàng
- khoảng không gian phải vượt qua để đi từ một địa điểm này đến một địa điểm khác
đường còn xa đi đường vòng đường chim bay
- cái nối liền hai địa điểm, làm phương tiện truyền đi, chuyển đi cái gì đó
đường ống dẫn dầu làm lại đường cống
đường thông tin bị gián đoạn
- (Khẩu ngữ) miền, trong quan hệ đối lập trong không gian với một miền khác
ở nơi đường rừng
"Mình về với Bác đường xi, Thưa giùm Việt Bắc khơng ngi nhớ Người." (THữu; 39)
- hình tạo nên do một điểm chuyển động liên tục
đường thẳng đường cong đường gấp khúc
- vạch, vệt do một vật chuyển động tạo ra
đường cày
đường kim mũi chỉ
đường bóng căng và hiểm
- cơ quan có chức năng dẫn vào cơ thể hoặc dẫn ra ngồi những chất nhất định nào đó, nói chung
đường hơ hấp đường tiêu hố
- cách thức tiến hành hoạt động để đạt đến mục đích
liệu đường mà làm ăn tìm đường tháo chạy
- mặt, phương diện nào đó trong đời sống con người
đường con cái muộn màng thành đạt về đường công danh
Có thể thấy, khơng có sự phân tách mục từ ở cả từ đa nghĩa và từ đồng tự. Tất cả đều được xếp chung vào một mục từ. Tuy nhiên, việc xếp chung vẫn có những quy tắc nhất định như xếp từ có nghĩa cụ thể trước, từ có nghĩa trừu tượng sau. Việc này khác hẳn với các từ điển giấy thông thường khác, đơn cử như Từ điển tiếng Việt của Hoàng Phê. Đối với từ “đường”, Hoàng Phê đã chia thành 2 mục từ khác nhau như sau:
đường1 I d. Chất kết tinh vị ngọt, thường chế từ mía hoặc củ cải đường. Ngọt như đường. II t. (dùng trong tên gọi một số hoa quả). Thuộc loại có vị ngọt. Cam đường*. Bưởi
đường*. đường2 d. 1 Lối đi nhất định được tạo ra để nối liền hai địa điểm, hai nơi. Con đường qua làng. Đường xe lửa. Đi đường biển. Đường vào vũ trụ. Ăn bát cơm dẻo nhớ nẻo đường đi (tng.). Con đường tiến thân (b.). 2 Khoảng không gian phải vượt qua để đi
từ một địa điểm này đến một địa điểm khác. Đường còn xa. Những ngày đi đường. Tiếng
lành đồn xa, tiếng dữ đồn xa, Tiếng lành tiếng dữ đồn ba ngày đường (cd.). 3 Cái nối liền
hai địa điểm làm phương tiện truyền đi, chuyển đi cái gì đó. Đường ống dẫn dầu. Đường
cống. Đường mương. Đường điện thoại từ huyện xuống xã. 4 (kng.; dùng hạn chế trong
một số tổ hợp). Miền, trong quan hệ đối lập trong không gian với một miền khác. Đường ngược. Chuyện đường rừng. 5 (chm.) Hình tạo nên do một điểm chuyển động liên tục. Đường thẳng. Đường cong. Đường cao của tam giác. 6 Vạch, vệt do một vật chuyển
động tạo nên. Đường cày. Đường đạn. Đường kim mũi chỉ. 7 Cơ quan có chức năng dẫn vào cơ thể hoặc dẫn ra ngoài những chất nhất định nào đó (nói khái quát). Bệnh đường
ruột. Đường hô hấp. 8 Cách tiến hành hoạt động để đạt đến mục đích. Liệu đường làm ăn. Tìm đường tẩu thốt. Đường đi nước bước*. 9 Mặt, phương diện nào đó trong đời
sống con người. Muộn màng về đường tình duyên. Việc nước, việc nhà, cả hai đường đều
trọn vẹn. Cay đắng trăm đường.
Như vậy, trong Từ điển tiếng Việt của Hồng Phê, ơng tách “đường” ra thành hai mục là đường1 và đường2 để thể hiện từ đồng tự. Và sau đó, trong mỗi mục từ sẽ được chia nhỏ thành những mục khác để thể hiện từ đa nghĩa.
Tiểu kết:
Đối với mỗi từ điển, các nhà biên soạn phải xây dựng hệ thống tiêu chí riêng phục vụ cho việc lựa chọn mục từ trong từ điển. Và từ điển Việt - Việt Soha Tratu cũng vậy, từ điện được xây dựng theo quan điểm mỗi tiếng là một từ để lựa chọn mục từ. Những đơn vị đưa vào từ điển phải được lựa chọn dựa trên tỉ lệ phù hợp giữa các từ cổ, từ cũ, từ thải loại, tiếng lóng, tiếng địa phương, từ chuyên ngành so với vốn từ toàn dân, từ phổ biến. Bên trong mỗi mục từ, nội dung giải thích sẽ được cân nhắc kĩ lưỡng những thông tin nào cần đưa vào, những thông tin nào không, cách giải thích như thế nào và các ví dụ ra sao, … đều tùy thuộc vào quan điểm nhất quán của nhà làm từ điển sao cho phù hợp với đối tượng mà họ muốn hướng đến. Do đó, trong từ điển Việt - Việt Soha Tratu đã nhất quán theo tiêu chí xem mỗi tiếng là một từ và đối tượng hướng đến là dành cho tất cả mọi người sử dụng tra từ trực tuyến.
Từ điển Việt – Việt Soha Tratu có 36.862 từ và được đóng góp nội dung từ hơn 30.000 thành viên, do đó ln được cập nhật từ thường xuyên để có thể đáp ứng độ phổ biến và độ thơng dụng của từ. Tuy nhiên, do số lượng mục từ lớn và số lượng thành viên đóng góp nội dung cho từ điển nhiều nên có thể có rất nhiều từ địa phương, từ cổ, từ chuyên ngành, từ vay mượn hay từ mới… dựa theo cảm trực giác cá nhân của người đóng góp (hay của nhiều tác giả), vì vậy, khơng thể đưa hết vào bảng từ mà phải lựa chọn theo độ phổ biến từ trên xuống theo tính tự động hoặc cần được kiểm duyệt trước khi cập nhật. Để thiết lập nên một quyển từ điển có tính nhất qn, các nhà từ điển học không chỉ quan tâm đến việc lựa chọn các mục từ sao cho phù hợp, đồng nhất mà bên cạnh đó
cịn phải chú ý đến vấn đề sắp xếp các từ ấy sao cho hợp lý. Việc sắp xếp từ trong từ điển cũng là một vấn đề khá quan trọng, vì từ điển thì vơ cùng đa dạng và mỗi từ điển lại có cách sắp xếp khác nhau dựa theo mỗi hệ chữ viết của từng ngôn ngữ khác nhau. Đối với vấn đề này, từ điển Việt – Việt Soha Tratu vẫn chưa có cách sắp xếp nhất quán và thích hợp.
Việc xem xét hết cách dùng của một từ để người biên soạn từ điển có cách định nghĩa phù hợp cho từng nghĩa và kèm theo ví dụ minh họa cho cách dùng đó. Lựa chọn ra những câu ví dụ đắt giá và chỉ ra cách sử dụng từ sao cho linh hoạt. Tuy nhiên, ở tiêu chí này, từ điển Việt – Việt Soha Tratu đã không đáp ứng được u cầu, như những gì đã phân tích ở phần câu ví dụ, có đến 78% tần suất xuất hiện của câu ví dụ nhưng chúng ta có thể thấy nhiều câu ví dụ khơng nhất qn với từ đầu mục.
Trong cấu trúc vi mô của từ điển, xét 100 từ được lấy ngẫu nhiên đó thì có 100% các từ đều có trường chính tả và định nghĩa. Đây chính là 2 trường thơng tin quan trọng, không thể thiếu trong một hệ thống từ điển. Cụ thể, việc lựa chọn một từ đầu mục tốt cho từ điển đã được chúng tơi trình bày ở mục cấu trúc vĩ mô. Đối với phần định nghĩa của từ, cách định nghĩa phụ thuộc vào từ loại, lĩnh vực, mục đích sử dụng và đối tượng sử dụng của từ điển.
Khi xây dựng một từ điển trực tuyến, vấn đề về tính tự động của từ điển rất dễ để nhận thấy, nhìn chung từ điển Việt – Việt Soha Tratu đã làm khá tốt điều này. Tuy nhiên vẫn cịn sót lại vài trường hợp tính tự động khơng được thực thi như chúng tơi đã trình bày ở trên.
Tóm lại, để có thể đánh giá được từ điển có tốt hay khơng ta dựa vào 3 tiêu chí là tính nhất quán, tính hệ thống và tính tự động. Quan những phân tích về bố cục, câu trúc vi mô và cấu trúc vĩ mô ở trên thì trong từ điển Việt – Việt Soha Tratu tính nhất quán được thể hiện ở mức tương đối, nhất quán theo quan điểm mỗi tiếng là một từ, nhưng lại khơng nhất qn về thanh điệu vì ở mỗi mục thanh điệu lại sắp xếp khác nhau không theo một trật tự nhất định nào. Bên cạnh đó, tính hệ thống ở các mục từ có mối liên kết với các đơn vị mục từ, chúng liên kết với nhau như quan hệ đồng nghĩa, trái nghĩa, trường từ vựng, dẫn xuất và kể cả khẩu ngữ, phương ngữ cũng được đưa vào, ngoài ra các nghĩa trong một
từ đa nghĩa được xếp theo hướng phát triển logic. Nhưng tính hệ thống lại khơng có trong sắp xếp từ, thay vì theo bảng chữ cái tiếng Việt (a, ă, â, b, c,…) thì lại theo bảng chữ cái tiếng Anh (từ a đến z) sau đó chèn các chữ cái phụ vào cuối bảng chữ cái theo a- z đó. Cuối cùng là tính tự động, vì là từ điển trực tuyến nên các mục từ được sắp xếp theo alphabet, có trật tự từ rồi tiếp đến là các mẫu kế tự được trình bày thống nhất theo một bố cục nhất định. Ngược lại, tính tự động cũng khơng thể đảm bảo được về mặt hình thức, xuất hiện nhiều trường hợp câu ví dụ khơng được trình bày như các ví dụ khác như là khơng in nghiêng và không làm nhạt màu.
Vì vậy, để xây dựng được một từ điển tốt và chất lượng, chúng ta cần phải xác định rõ đối tượng sử dụng, nhu cầu sử dụng, để từ đó đề ra tiêu chí lựa chọn mục từ và thu thập kho ngữ liệu phù hợp với lĩnh vực, thể loại, vùng miền… Sau đó, chúng ta phải xử lý tốt kho ngữ liệu đó, vì ranh giới từ của tiếng Việt phức tạp và mơ hồi nên việc xác định ranh giới từ và kho từ vựng là điều cần thiết để xây dựng từ điển. Và việc này sẽ phục vụ hầu hết các công đoạn trong việc xây dựng từ điển như xây dựng bảng từ với vốn từ phù hợp với trình độ và mục đích của người sử dụng, lựa chọn nghĩa và cách dùng phù hợp,… Ngoài ra, đối với một từ điển trực tuyến, việc trau chuốt về mặt hình thức là rất cần được xem trọng. Tất cả những điều này sẽ làm nên chất lượng của một từ điển, vì một từ điển tốt phải đáp ứng và phù hợp với nhu cầu của người sử dụng.
CHƯƠNG 3: ƯU ĐIỂM VÀ HẠN CHẾ CỦA TỪ ĐIỂN VIỆT – VIỆT SOHA TRATU
Qua các đánh giá cụ thể ở chương 2, chúng tôi rút ra được một số ưu điểm và hạn chế nổi bật của từ điển Việt – Việt Soha Tratu sau: