CHƢƠNG 2 CƠ SỞ DỮ LIỆU
2.1. NGUYÊN TẮC LỰA CHỌN
Các đơn vị ngôn ngữ ở mọi cấp độ ln tồn tại nhƣ những tín hiệu - tín hiệu đặc biệt. Hình tiết tiếng Việt là đơn vị nhƣ vậy. Những liên hệ giữa hai mặt: âm thanh và ngữ nghĩa của các hình tiết tiếng Việt đã, đang đƣợc nghiên cứu, đánh giá và xem xét dƣới nhiều góc độ với những tiêu chí khác nhau. Trong luận văn này, chúng tơi quan tâm tới cả hai loại hình tiết: hình tiết độc lập và hình tiết phụ thuộc (khơng độc lập). Hình tiết độc lập là các hình tiết hoạt động và đƣợc sử dụng hoàn toàn độc lập nhƣ những từ đơn, ví dụ: nước,
cây, buồn, chạy, đẹp, à, ừ... Hình tiết phụ thuộc là những hình tiết đƣợc tồn tại
trong các cấu trúc từ ghép, từ láy. Các hình tiết loại này đƣợc chia thành hai loại nhỏ: 1/.các hình tiết có khả năng hoạt động độc lập và đƣợc sử dụng tự do nhƣ các từ đơn, song vì chúng tồn tại trong các cấu trúc từ ghép và từ láy nên lúc này chúng có tƣ cách là các yếu tố cấu tạo từ, ví dụ: đất và nước trong đất nước, đen trong đen nhánh, buồn trong buồn xo... 2./ các hình tiết phụ thuộc
hồn tồn – hồn tồn khơng có khả năng hoạt động độc lập, ví dụ: lắc trong
xa lắc, thỗn và thện trong thỗn thện, xì trong đen xì... Nhƣ vậy, có thể thấy, tƣ
liệu đầu vào của luận văn sẽ là tất cả những hình tiết có thể có trong hệ thống âm thanh và chữ viết tiếng Việt.
Mặt khác, liên hệ về âm và nghĩa của các hình tiết tiếng Việt là một vấn đề phức tạp. Từ lâu, việc phân tích từ vựng học theo những tiêu chí nhất định đã sắp xếp các đơn vị từ vựng vào các nhóm. Đƣa tiêu chí ngữ nghĩa lên trƣớc tiên để đánh giá và phân nhóm từ ngữ, có hiện tƣợng đồng nghĩa và hiện tƣợng trái nghĩa; đƣa tiêu chí ngữ âm lên trƣớc tiên, có hiện tƣợng đồng âm; đƣa tiêu chí hình thức chữ viết vào xem xét, có hiện tƣợng đồng tự... Luận văn của chúng tôi xem xét vấn đề trên đồng thời cả hai tiêu chí âm thanh và ngữ nghĩa, do đó những hình tiết đƣợc khảo sát lại phải một lần nữa đƣợc lựa chọn để thoả mãn đồng thời cả hai tiêu chí âm và nghĩa.
Tóm lại, các đơn hình tiết đƣợc khảo sát trong luận văn của chúng tơi đƣợc lựa chọn theo hai nhóm nguyên tắc:
- Nhóm 1: nhóm nguyên tắc đầu vào.
- Nhóm 2: nhóm nguyên tắc làm thoả mãn tƣ liệu.
2.1.1. Nhóm nguyên tắc 1
2.1.1.1. Nhƣ đã nói ở trên, tƣ liệu đầu vào của luận văn sẽ là tất cả những hình tiết có thể có trong hệ thống âm thanh và chữ viết tiếng Việt. Do đó, để đảm bảo sự đầy đủ tƣơng đối về mặt số lƣợng các hình tiết chúng tơi sử dụng cuốn Từ điển tiếng Việt (Viện Ngơn ngữ học, 2000) làm cơ sở chính để thống kê.
2.1.1.2. Song nếu chỉ xét riêng trên bình diện âm thanh thì các hình tiết đƣợc khảo sát phải là những hình tiết có hình thức âm thanh hợp với khả năng và cách phát âm của ngƣời Việt. Do đó, chúng tơi sẽ khơng đƣa vào trong tƣ liệu những hình tiết có cách phát âm không phù hợp với thói quen phát âm của ngƣời Việt. Cụ thể đó là từ của các ngôn ngữ dân tộc thiểu số, ví dụ:
H’mơng, Siu black, … từ của các ngôn ngữ nƣớc ngồi chƣa nhập hệ, ví dụ:
maketing, bolling, …
2.1.1.3. Trong hệ thống từ vựng của bất cứ ngôn ngữ nào cũng không tránh khỏi hiện tƣợng vay mƣợn. Sự vay mƣợn thƣờng đƣợc nhắc tới đó là sự vay mƣợn từ của ngơn ngữ ngồi, đƣợc nhập hệ và trở thành đơn vị từ vựng chính thức của ngơn ngữ đƣợc tiếp nhận. Song sự vay mƣợn còn phải kể tới sự vay mƣợn từ của một phƣơng ngữ (chủ yếu lầ tên gọi các sản vật của riêng địa phƣơng nào đó) và đƣợc sử dụng phổ biến trong từ vựng tồn dân, ví dụ:
mãng cầu, măng cụt, hủ tiếu… Trong luận văn của chúng tôi cũng quan tâm
tới cả những đơn vị nhƣ vậy.
Nhƣ vậy, dựa trên 3 nguyên tắc thuộc nhóm nguyên tắc 1, nguồn tƣ liệu đầu vào của luận văn là tất cả những hình tiết độc lập và phụ thuộc đƣợc sử dụng phổ biến trong giao tiếp hàng ngày của ngƣời Việt đƣơng đại.
2.1.2. Nhóm nguyên tắc 2
Dựa vào nhóm nguyên tắc 1, chúng ta sẽ có một số lƣợng vơ cùng lớn các hình tiết song khơng phải tất cả chúng là những đơn vị có quan hệ với nhau về âm và nghĩa hoặc mối quan hệ âm và nghĩa của chúng không thuộc địa hạt luận văn quan tâm. Nhóm nguyên tắc 2 đảm bảo cho những đơn vị đƣợc lựa chọn khảo sát thoả mãn yêu cầu.
2.1.2.1. Trƣớc hết lựa chọn những đơn vị có sự giống nhau hoặc gần giống nhau về nghĩa. Sự giống nhau hoặc gần giống nhau về âm và nghĩa của các đơn vị đƣợc lựa chọn có nhiều cấp độ:
- Những đơn vị có nghĩa hồn tồn nhƣ nhau nhƣng đƣợc sử dụng không nhƣ nhau trên phƣơng diện phạm vi và mức độ sử dụng. Ví dụ: giở quẻ và trở quẻ là hai từ có nghĩa hồn tồn trùng nhau. Song giở quẻ là từ thuộc nhóm từ vựng tồn dân cịn trở quẻ thuộc nhóm từ vựng địa phƣơng; vinh dự
và vinh diệu cũng là hai từ có nghĩa hồn tồn nhƣ nhau song vinh dự đƣợc sử dụng phổ biến còn vinh dự lại thuộc lớp từ cổ, ít đƣợc sử dụng
- Những đơn vị có nghĩa nhƣ nhau song đƣợc sử dụng ở những thể loại phong cách khác nhau. Ví du: hảo hán và hảo hớn là hai từ có nghĩa hồn
tồn trùng nhau. Song hảo hán là từ trung hoà về phong cách, cịn hảo hớn
thuộc phong cách khẩu ngữ; giữ gìn và giữ giàng cũng là hai đơn vị nhƣ vậy,
giữ gìn là đơn vị trung hồ về phong cách còn giữ giàng lại là đơn vị thuộc
lớp từ ngữ văn chƣơng.
- Những đơn vị có nghĩa nhƣ nhau song không nhƣ nhau trong khả năng kết hợp. Ví dụ, hai từ bồng và bế có nghĩa nhƣ nhau, song khả năng kết hợp của chúng trong cấu tạo các đơn vị thuộc cấp độ cao hơn lại khơng nhƣ nhau. Chúng ta có thể nói bế con, bồng con, bế ẵm, bồng ẵm song chỉ có thể nói bồng súng mà khơng thể nói *bế súng. Hai từ gầm và gậm với nghĩa là
khoảng trống kể từ mặt đất đến đáy của một số đồ vật đƣợc xây dựng hoặc kê lên trên thì gầm có khả năng kết hợp rộng rãi hơn gậm. Chúng ta có kết hợp
gầm bàn, gậm bàn; gầm giường, gậm giường; gầm cầu thang song khơng có kết hợp *gậm cầu thang; gầm cầu, *gậm cầu.
- Những đơn vị có nét nghĩa sắc thái khác nhau. Ví dụ dơ và nhơ đều có chung nét nghĩa nhƣ bẩn, song nhơ có thêm nét nghĩa chỉ sự xấu xa về phẩm
chất, tƣ cách, còn dơ có nét nghĩa là khơng biết hổ thẹn. Hai từ cành và nhành có nghĩa nhƣ nhau song nhành là từ dùng để chỉ những cành non, mềm mại.
2.1.2.2. Song nếu chỉ lựa chọn đối tƣợng khảo sát theo nguyên tắc nghĩa ở trên thì mới chỉ dừng lại ở sự phân tích nghĩa từ vựng. Đơn vị đƣợc chọn để khảo sát trong luận văn còn đƣợc xét trên tiêu chuẩn ngữ âm. Và chúng tôi đặt tiêu chuẩn ngữ nghĩa và ngữ âm ngang nhau trong khi lựa chọn đơn vị khảo sát. Nhƣ vậy luận văn sẽ chỉ quan tâm tới những đơn vị có nghĩa giống nhau hoặc gần giống nhau song lại phải có sự tƣơng ứng nhất định về hình thức - đặc điểm ngữ âm. Các đơn vị này phải có sự tƣơng ứng về đặc điểm ngữ âm của ít nhất một bộ phận nào đó của cấu trúc âm tiết. Có một số trƣờng hợp tƣơng ứng ngữ âm xảy ra trên thực tế, song trong luận văn này chúng tôi quan tâm trƣớc hết tới ba trƣờng hợp:
- Khác nhau ở âm đầu, các bộ phận khác (tƣơng đối) đồng nhất, ví dụ:
hóp, lóp; bạ, vạ; giương, trương...
- Khác nhau ở phần vần, các bộ phận khác (tƣơng đối) đồng nhất, ví dụ: hứng, hóng; luồn, lịn; búi, bối, bới...
- Khác nhau ở thanh điệu, các bộ phận khác (tƣơng đối) đồng nhất, ví du: hẻm, hẽm, hồ, hoạ, phà, phả...
Xét về hình thức âm thanh của các đơn vị ngơn ngữ tức là xét tới thói quen phát âm các đơn vị ngơn ngữ đó của ngƣời bản ngữ, của tuyệt đại bộ phận ngƣời trong xã hội. Do đó, bên cạnh việc sử dụng cuốn Từ điển tiếng Việt của Viện Ngôn ngữ học, 2000 làm nguồn tƣ liệu chính. Bên cạnh đó chúng tơi cũng sử dụng thêm một số cuốn từ điển phƣơng ngữ: Từ điển phƣơng ngữ Nam bộ, Từ điển tiếng Nghệ để đƣa vào khảo sát một số các
cách phát âm đã đƣợc sử dụng phổ biến trong một số địa phƣơng lớn nào đó và có từ tƣơng ứng trong ngơn ngữ tồn dân, ví dụ: dơ trong phƣơng ngữ
Nam có nghĩa nhƣ vơ ở phƣơng ngữ Trung hay vào trong nhóm từ vựng tồn dân; du tƣơng ứng với dâu;… Chúng tôi cũng đƣa vào tƣ liệu những cách phát âm đã rất phổ biến trong ngơn ngữ tồn dân song chƣa đƣợc đƣa vào từ điển, ví dụ: với với nghĩa nhƣ mới trong các kết hợp đi mới, ăn mới; ngúng ngoảy với nghĩa nhƣ ngúng nguẩy;... Ngồi ra chúng tơi cịn sử dụng các ví
dụ trong những cuốn sách viết về phƣơng ngữ, các bài báo viết về phƣơng ngữ để đƣa vào tƣ liệu của mình.
2.1.2.3. Trong tiếng Việt có một số âm vị khác nhau song đƣợc phát âm nhƣ nhau ở một số địa phƣơng (kể cả ở phƣơng ngữ Hà Nội - phƣơng ngữ đƣợc coi là chuẩn), do đó, dẫn đến hiện tƣợng trong tiếng Việt có một số lƣợng lớn các hình tiết có hình thức âm thanh nhƣ nhau song hình thức chữ viết khác nhau, ví dụ: chây, trây; trí mạng, chí mạng; sù sì, xù xì… Mặt khác, tiếng Việt cịn có những âm vị duy nhất song lại đƣợc văn tự hoá bằng những con chữ khác nhau do đó một điều tất yếu xảy ra là chúng có hình thức âm thanh nhƣ nhau song chữ viết lại khác nhau. Đây là những yếu tố chỉ khác nhau ở hình thức chữ viết cịn âm và nghĩa trùng nhau hồn tồn, ví dụ: bút kí,
bút ký; dùi, giùi;... Tìm hiểu về hiện tƣợng này cũng là một việc làm rất thú vị
song trong khuôn khổ luận văn này chúng tôi chƣa thể đi sâu tìm hiểu.