“Bảng 100 từ cơ bản Swadesh” là Bảng từ cơ bản thông dụng trên thế giới. Ứng dụng Bảng này trong việc truy tìm từ nguyên tiếng Việt có thể phát hiện ra mối quan hệ giữa tiếng Việt và các thứ tiếng khác trong khu vực Châu Á thuộc ngữ hệ Nam Á, ngữ hệ Nam ðảo hay cả với ngữ hệ Hán Tạng. Thực ra 100 từ cơ bản này là 100 khái niệm, trên cơ sở đó có thể quy nạp, tổng kết hàng ngàn lớp từ vựng cơ bản khác trong tiếng Việt, từ đó có cái nhìn toàn diện hơn, chính xác hơn về nguồn gốc tiếng Việt.
TẠP CHÍ KHOA HỌC, ðại học Huế, Số 66, 2011 GÓP PHẦN XÁC ðỊNH NGUỒN GỐC TIẾNG VIỆT QUA “BẢNG 100 TỪ CƠ BẢN SWADESH” Võ Trung ðịnh Trường ðại học Ngoại ngữ, ðại học Huế TÓM TẮT “Bảng 100 từ Swadesh” Bảng từ thông dụng giới Ứng dụng Bảng việc truy tìm từ ngun tiếng Việt phát mối quan hệ tiếng Việt thứ tiếng khác khu vực Châu Á thuộc ngữ hệ Nam Á, ngữ hệ Nam ðảo hay với ngữ hệ Hán Tạng Thực 100 từ 100 khái niệm, sở quy nạp, tổng kết hàng ngàn lớp từ vựng khác tiếng Việt, từ có nhìn tồn diện hơn, xác nguồn gốc tiếng Việt ðặt vấn ñề Về vấn ñề xác ñịnh nguồn gốc tiếng Việt, kể từ mốc 1852 J.R Logan nghiên cứu Ethnology of the Indo-Pacific Islands lần xếp tiếng Việt vào dịng Mơn-Khmer, họ Nam Á quan điểm ñược nhiều người chấp nhận trở thành quan ñiểm thống cho nhà nghiên cứu lịch sử tiếng Việt Như giáo sư Nguyễn Tài Cẩn Giáo trình lịch sử ngữ âm tiếng Việt (sơ thảo) ñã rằng, tiếng Việt “là ngôn ngữ thuộc nhóm Việt Mường, tiểu chi ViệtChứt (vẫn thường gọi tiểu chi Việt-Mường) nằm khối Việt-Katu thuộc khu vực phía ðơng ngành Mon-Khmer, họ Nam Á” [1, trang 332], cho dù quãng thời gian sau tiếng Việt có mối quan hệ ảnh hưởng sâu đậm với tiếng Hán, quan hệ tiếp xúc quan hệ thân thuộc Tuy nhiên, ngồi quan điểm thống đó, tiếng Việt cịn nhiều học giả khác xếp vào ngữ hệ khác nhau, trình sinh sống di trú cư dân Việt cổ, tổ tiên ñã tiếp xúc vay mượn nhiều ngôn ngữ khu vực Tiêu biểu học giả người Pháp H Maspéro cơng trình Nghiên cứu lịch sử ngữ âm tiếng An Nam-Các âm ñầu (Étude sur la phonétique historique de la langue Annamite Les initiales, 1912) sau nghiên cứu tiếng Hán Việt, tiếng Mường, tiếng Thái số ngơn ngữ Mơn-Khmer khác ñưa nhận xét “hệ thống ñiệu làm cho tiếng Việt khác với ngôn ngữ Môn-Khmer ñó quan trọng ñể tách khỏi ngơn ngữ Mơn-Khmer biết đến ngơn ngữ khơng điệu Hệ thống ñiệu tiếng Việt ñã ñược hình thành dựa nguyên tắc chung tiếng Hán, tiếng Thái ngơn ngữ Tạng Miến, thống với hệ tiếng Thái cổ, tiếng Việt phải ñược quy vào họ 45 Thái” [1, trang 336] Có nhiều nhà ngơn ngữ học tán thành quan điểm W.Schmidt (1926), K.Wuff (1934), R.Shafer (1942)… Nhà ngôn ngữ học trứ danh Trung Quốc Vương Lực theo quan ñiểm Năm 1939 ông ñến Hà Nội nghiên cứu tiếng Việt, sau mắt cơng trình Nghiên cứu tiếng Hán Việt Do chịu ảnh hưởng sâu sắc lớp từ Việt gốc Hán tiếng Việt nên Vương Lực ñã xếp tiếng Việt vào “ngữ hệ Hán Tạng, ngữ tộc Hán Thái” [2, trang 25] Một nhà nghiên cứu khác Bình Ngun Lộc xếp tiếng Việt vào họ ngôn ngữ Nam ðảo Trong hai Nguồn gốc Mã Lai dân tộc Việt Nam (Sài Gòn, 1972) Lột trần Việt ngữ (Sài Gịn, 1973) ơng ñã có so sánh tương ứng từ vựng tiếng Việt với ngôn ngữ khác họ Nam ðảo, từ nhiều lần đưa kết luận tiếng Việt “ñã mượn ñến 40% danh từ Mã Lai Nam Dương” [3, trang 383] Tuy quan ñiểm có nhiều mức độ sai khác nhau, nhận định khiến đặt vấn đề xác minh nguồn gốc tiếng Việt khơng thể khơng xét đến yếu tố Tày-Thái, yếu tố gốc Hán yếu tố Nam ðảo lớp từ vựng tiếng Việt ngày Vấn ñề ñặt ñây sử dụng phương pháp việc xác ñịnh nguồn gốc tiếng Việt? Bởi ñối với loại ngôn ngữ nào, ba hệ thống lớn ngữ âm, từ vựng, ngữ pháp tiểu hệ thống có diễn biến khác lịch sử, có yếu tố bảo tồn lâu dài bên cạnh yếu tố bị ñi nhanh chóng thay yếu tố khác, tuyệt đối khơng thể có đồng mặt diễn biến ngơn ngữ Do vậy, việc xác định cho ñược phương pháp nghiên cứu ñáng tin cậy ñiều tối quan trọng Phương pháp nghiên cứu “Mỗi từ có lịch sử nó”, cách nhìn nhận trường phái Phương ngữ học (dialectology) [4, trang 315] Nhận ñịnh nghĩ thấy ñúng, vấn ñề ñặt ñi nghiên cứu lịch sử từ nào? Trong phương pháp so sánh ñối chiếu nay, phương pháp so sánh-lịch sử giúp phát thân thuộc ngôn ngữ mặt cội nguồn ðây phương pháp thông qua ñối sánh mặt ngữ âm, từ vựng ngữ pháp hai nhiều phương ngữ ngôn ngữ thân thuộc ñể rút quy luật diễn biến, từ xác định nguồn gốc ngơn ngữ Phương pháp dựa yếu tố tĩnh phân bố từ vựng ñể xem xét yếu tố ñộng trình diễn biến từ, sản sinh từ nghĩa mới, tiêu vong lớp từ cũ nghĩa cũ… Ngoài ra, phương pháp xem xét ñặc ñiểm phân bố mặt ñồng ñại quy luật diễn biến mặt lịch ñại từ mục nhóm từ có trường nghĩa Do vậy, phương pháp phân tích trường nghĩa khơng thể thiếu xác ñịnh nguồn gốc từ F de Saussure Giáo trình ngơn ngữ học đại cương hai dạng quan hệ, quan hệ ngang (quan hệ tuyến tính, quan hệ ngữ đoạn) quan hệ dọc (quan hệ liên tưởng, quan hệ hệ hình) Theo hai dạng quan hệ có hai loại 46 trường nghĩa: trường nghĩa ngang (trường nghĩa tuyến tính) trường nghĩa dọc (trường nghĩa liên tưởng) Chúng ta nên sử dụng trường nghĩa dọc (bao gồm trường nghĩa biểu vật trường nghĩa biểu niệm) ñể khảo sát xác định từ ngun A.G.Haudricourt phân tích nhóm từ cụ thể (nhóm từ phận thể mắt, tai mũi, miệng, răng, lưỡi, cổ, tay…) ñã cho thấy “sự tương ứng từ vựng tiếng Việt ngôn ngữ Môn-Khmer tương ứng mang tính chất cội nguồn, khác với tương ứng tiếng Việt với ngôn ngữ Thái” [5, trang 96] ðể xác định ngơn ngữ có quan hệ đồng ngun đồng tộc, phải có số lượng từ ñồng nguyên ñáng kể ñể chứng minh Ngôn ngữ học lịch sử (historical linguistics) dựa lớp từ vựng so sánh đối chiếu để “quyết định ngơn ngữ có chung tổ tiên, đó, có ngữ hệ nào, tiến hành phục ngun để vạch đặc tính ngơn ngữ gốc khơng ghi (các tiền ngơn ngữ), nhận diện thay ñổi khác khiến ngôn ngữ mẹ phân tách thành số ngôn ngữ con” [6, trang 294] A G Haudricourt nhấn mạnh trường hợp xếp loại nguồn gốc tiếng Việt “cái ñịnh từ vựng bản” [7, trang 20] Tuy nhiên, việc xác ñịnh cho ñược ñâu lớp từ vựng bản, ñâu lớp từ vựng vay mượn hay từ vựng văn hóa thực khơng dễ dàng Do q trình phát triển, có nhiều ngơn ngữ bị phân hóa thành nhiều nhóm, nhiều dịng ngơn ngữ khác Tiếng Việt không ngoại lệ Công việc nhà ngôn ngữ học lịch sử truy ngun ngơn ngữ cho ngơn ngữ nguồn đó, “bà mẹ” sản sinh dịng ngơn ngữ sau này, từ tiến hành quy nạp chúng vào chi, họ, ngành khác dựa mức ñộ thân thuộc nhiều hay Khi tiến hành nghiên cứu so sánh-lịch sử, chưa xác ñịnh ñược ñâu cội nguồn, đâu vay mượn nhóm từ vựng giống hai hay nhiều ngơn ngữ, chưa đủ ñiều kiện ñể xác ñịnh quan hệ họ hàng thân thuộc chúng Tuy nhiên, A G Haudricourt thừa nhận ngơn ngữ khơng có biến hóa hình thái tiếng Việt có vay mượn từ vựng Do vậy, nhà nghiên cứu muốn ñạt ñược mục ñích phân loại số từ tương ứng hai hay nhiều ngôn ngữ, từ mang tính cội nguồn, từ mang tính vay mượn, phải xem xét chúng theo nhóm từ vựng có ý nghĩa trọn vẹn, tức sử dụng phương pháp phân tích trường nghĩa nói Bảng 100 từ Swadesh Morris Swadesh (1909-1967) nhà ngơn ngữ học người Mỹ Ơng đề nghị phương pháp xác ñịnh thời gian tách rời (length of separation) hai ngôn ngữ nguồn, cách tìm từ thay đổi so sánh số vốn từ ðây tảng ngành ngôn ngữ học gọi Glottochronology (mơn học xác định tuổi ngơn ngữ), hay cịn gọi “phương pháp Ngữ thời học, vắn tắt phương pháp Swadesh” [8, trang 8] Chính phương pháp đưa ngơn ngữ học, ngành theo truyền thống khoa học nhân văn, trở nên ngành ngôn ngữ định lượng (quantitative linguistics) đem mơn đến gần ngành khoa học xác khác 47 GS Nguyễn Tài Cẩn giáo trình Lịch sử ngữ âm tiếng Việt (sơ thảo) vận dụng có phê phán phương pháp Swadesh, phương pháp xuất phát từ quan niệm cho rằng, qua thời gian, việc thay từ vựng cổ từ vựng việc xảy theo quy luật chung cho ngơn ngữ Theo thống kê tính tốn số lượng nhiều ngôn ngữ, phương pháp ñưa cách xác ñịnh sau: qua 1000 năm số lượng từ kho từ vựng ngơn ngữ bị 15%, cịn lại 85% Như vậy, hai ngơn ngữ hay hai phương ngữ A, B gốc tách khoảng 1.000 năm, bảng từ vựng chúng giữ lại 74% chung (85% 85%=74%); tách 2.000 năm, số từ vựng chung cịn lại chiếm khoảng 55% (74% 74%=55%); tách 4.000 năm, số từ vựng chung lại chiếm khoảng 30% (55% 55%=30%); tách 8.000 năm, số từ vựng chung cịn lại hơn, chiếm khoảng 9% (30% 30%=9%) Qua 8000 năm lượng từ chung rút tới mức khơng thể xác lập mối quan hệ nguồn gốc hai ngôn ngữ Swadesh năm 1952 ñề xuất Bảng 200 từ 200 từ có sở ơng phân tích, quy nạp ngơn ngữ châu Âu, châu Mỹ, châu Phi châu Úc Ban ñầu ông cho 200 từ lớp từ ổn định tất ngơn ngữ, q trình nghiên cứu sau đó, ơng nhận thấy có nhiều từ Bảng vay mượn qua lại lẫn nhau, năm 1955 ông rút gọn lại 100 từ Ý đồ ơng muốn có ranh giới dứt khốt vấn đề vay mượn hay khơng vay mượn, nhiên sau theo khảo sát số nhà nghiên cứu Bảng 100 từ có số từ vay mượn, nhiều so với Bảng 200 từ Có thể nói Bảng 100 từ xác định lớp từ vựng ổn định ngơn ngữ trở thành Bảng 100 từ thơng dụng giới khảo sát nguồn gốc từ Vì ứng dụng Bảng 100 từ Swadesh vào truy nguyên gốc tích tiếng Việt trở nên thuận tiện cho nghiên cứu so sánh ñối chiếu với Bảng 100 từ ngôn ngữ khác mà khảo sát trước ðiều cần lưu ý Swadesh khảo sát ngơn ngữ Ấn Âu Vì vậy, áp dụng vào ngơn ngữ vùng châu Á nói chung ðơng Nam Á nói riêng, nơi liên tục xảy di cư hội tụ tộc người, nơi mà tiếp xúc chi nhóm ngơn ngữ xảy thường xuyên lâu dài, áp dụng phương pháp địi hỏi phải nghiên cứu quan điểm so sánh đa ngữ có nhìn khoa học nguồn gốc tiếng Việt F de Saussure Giáo trình ngơn ngữ học ñại cương (1916) ñã dành chương Ngôn ngữ học địa lý phân tích rõ ngun nhân tạo nên khác biệt lịch sử diễn biến ngôn ngữ, tìm hiểu vấn đề địa lý liên quan tới Bởi vì, “mối liên hệ lịch sử phát triển, tức mặt thời gian, với môi trường phát triển, tức mặt không gian, liên hệ có tính chất phát triển nào” [9, trang 334] Như nói trên, nhận thức chung ña số nhà ngôn ngữ tiếng Việt thuộc ngữ hệ Nam Á, đó, dấu vết từ vựng họ ngơn ngữ 48 tiếng Việt coi cội nguồn, ngơn ngữ khác coi ngôn ngữ láng giềng ngôn ngữ thân thuộc Quan hệ tiếng Việt với ngôn ngữ láng giềng quan hệ tiếp xúc vay mượn lẫn nhau, vị trí địa lý q gần nhau, tiếp xúc lâu dài cư dân vùng miền xảy thời gian dài Tuy nhiên, điều mà khiến cho lớp từ vựng ñược coi vay mượn đơi thực khó xác định, vơ hình trung coi yếu tố cội nguồn Ví dụ theo số kết nghiên cứu nay, nhận định tiếng ViệtMường ñã có tiếp xúc lâu dài với ngôn ngữ thuộc họ Nam ðảo Chứng tiếp xúc vốn từ tiếng Việt lớp từ cổ xưa có nguồn gốc Mã Lai-ða đảo (xem thêm mục 4.3) Bởi thời gian tiếp xúc xa xưa, khó kết luận ngơn ngữ vay mượn ngơn ngữ nào, khó nói từ bản, cổ xưa từ vay mượn từ ðây khó khăn lớn nhất, gây nhiều tranh cãi xác ñịnh nguồn gốc tiếng Việt, tranh cãi gần suốt 200 năm chí xem cịn chưa ngã ngũ… Từ lúc lý thuyết Swadesh ñời có khảo cứu từ ngơn ngữ khác giới cho thấy kết tương ñối khả quan sử dụng có số lợi ích thiết thực thành tựu đáng kể Tuy nhiên có nhiều tranh luận tiền ñề lý thuyết này, tốc ñộ thay ñổi ngôn ngữ không ñều ñặn Có q nhiều yếu tố ảnh hưởng đến thay ñổi ngôn ngữ biến cố lịch sử xã hội (chiến tranh xâm lược, thơn tính đất đai, cách mạng…), mốc thời gian thay ñổi số Mặc dù vậy, Bảng 100 từ Swadesh coi Bảng chuẩn cho việc xác ñịnh từ vựng tất ngôn ngữ Bảng tạm chia thành nhóm sau: a Nhóm vật tượng thiên nhiên Mặt trời (sun); Mặt trăng (moon); Sao (star); Nước (water); Mưa (rain); Mây (cloud); ðá (stone); Cát (sand); ðất (earth); 10 Núi (mountain); 11 ðường (path); 12 Lửa (fire); 13 Khói (smoke); 14 Tro (ash); 15 ðêm (night) b Nhóm phận thể người 16 ðầu (head); 17 Tóc (hair); 18 Mắt (eye); 19 Mũi (nose); 20 Răng (tooth); 21 Lưỡi (tongue); 22 Tai (ear); 23 Miệng (mouth); 24 Cổ (neck); 25 Tay (hand); 26 Bụng (belly); 27 Vú (breasts); 28 Chân (foot); 29 Da (skin); 30 Tim (heart); 31 Gan (liver); 32 Xương (bone); 33 ðầu gối (knee); 34 Máu (blood); 35 Thịt (flesh) c Nhóm động thực vật 36 Chim (bird); 37 Cá (fish); 38 Chó (dog); 39 Chí/Rận (louse); 40 Cây (tree); 41 Hạt (seed); 42 Lá (leaf); 43 Gốc/Rễ (root); 44 Vỏ (bark); 45 Dầu/Mỡ (grease); 46 Trứng (egg); 47 ðuôi (tail); 48 Sừng (horn); 49 Lông (feather); 50 Móng 49 (claw) d Nhóm động tác 51 Ăn (eat); 52 Uống (drink); 53 Cắn (bite); 54 Nói (say); 55 Nhìn (see); 56 Nghe (hear); 57 Biết (know); 58 Ngủ (sleep); 59 Chết (die); 60 Giết (kill); 61 ði (walk); 62 Bay (fly); 63 Bơi (swim); 64 ðến (come); 65 Ngồi (sit); 66 ðứng (stand); 67 Nằm (lie); 68 Cho/Tặng (give); 69 ðốt (burn) e Nhóm tính chất trạng thái 70 Mới (new); 71 Tốt/ðẹp (good); 72 Nóng (hot); 73 Lạnh (cold); 74 ðầy (full); 75 Khô (dry); 76 ðỏ (red); 77 Xanh (green); 78 Vàng (yellow); 79 Trắng (white); 80 ðen (black); 81 To/Lớn (big); 82 Nhỏ/Bé (small); 83 Dài (long); 84 Nhiều (many); 85 Tròn (round) f Nhóm cịn lại 86 Một (one); 87 Hai (two); 88 Tôi (I); 89 Chúng (we); 90 Anh/Bạn (you); 91 ðây/Này (this); 92 Kia/ðó (that); 93 Ai (who); 94 Gì/Cái (what); 95 Người (person); 96 ðàn bà (woman); 97 ðàn ông (man); 98 Tên (name); 99 Không (not); 100 ðều/Toàn (all) Khảo sát sơ tương đồng với tiếng Việt với ngơn ngữ vùng ngữ hệ ðông Nam Á Bảng 100 từ Trong trình tìm hiểu lịch sử tiếng Việt, có nhiều học giả sử dụng lớp từ vựng ñể nghiên cứu quan hệ thân thuộc hai hay nhiều ngơn ngữ có liên quan, ñó ñại ña số từ ñược ñề xuất có xuất Bảng 100 từ Swadesh 4.1 Chứng minh nguồn gốc Nam Á tiếng Việt H Maspéro cơng trình tiếng Nghiên cứu lịch sử ngữ âm tiếng An Nam Những phụ âm ñầu xem xét mặt từ vựng ñã nhiều từ tiếng Việt tương ứng với tiếng Mơn-Khmer, ví dụ từ vật tượng thiên nhiên (ñất, núi, ñá, cát, mưa, gió, nước…), phận thể (chân, cằm, mặt, mũi, tóc, răng…), tên súc vật, cỏ (cá, trâu, chí, chim, chó, thịt, cây, rễ, gốc, lúa…); từ liên quan ñến người (mẹ, bố, con, cháu, mày, nó…), hành động (đi, chạy, ngửi, chiên, thui, cầm, cắn…); hệ số ñếm (một, hai, ba, bốn, năm) Tổng cộng ơng so sánh tất 185 từ tiếng Việt với ngôn ngữ Môn-Khmer ngơn ngữ Thái ơng đưa kết luận có 87 từ tương đương với ngơn ngữ Mơn-Khmer 98 từ cịn lại thuộc ngơn ngữ Thái Giáo sư Trần Trí Dõi cho từ ơng Maspéro dẫn không túy từ thuộc lớp từ bản, mà có nhiều từ thuộc lớp từ văn hóa Vì ơng rút gọn lại cịn 39 từ tương ứng với ngơn ngữ Mơn-Khmer 21 từ tương ứng với ngôn ngữ Thái, “chỉ có 60/187 từ Maspéro sử dụng từ thuộc 50 lớp từ ngơn ngữ.” [5, 83] Qua kiểm tra hầu hết 60 từ ñều nằm Bảng 100 từ Swadesh, thuận tiện cho quy nạp, thống kê sau GS Nguyễn Ngọc San cơng trình Tìm hiểu tiếng Việt lịch sử từ trang 121 đến 134 liệt kê hàng trăm từ có gốc Môn-Khmer qua thời kỳ So sánh với Bảng 100 từ Swadesh (chưa tính từ thuộc trường nghĩa) có đến gần nửa gốc Mơn-Khmer Kết trùng khớp với khảo sát sơ với Bảng 100 từ sau so sánh đối chiếu với nhiều ngơn ngữ thuộc nhóm Mơn-Khmer có đến 50% từ vựng có nguồn gốc Mơn-Khmer ðiều củng cố thêm quan điểm cho tiếng Việt thuộc dịng Mơn-Khmer ngữ hệ Nam Á 4.2 Các từ có gốc Tày-Thái Như nói trên, Maspéro tiếng Việt có nhiều từ tương đương với tiếng Thái, mà ơng đưa kết luận lưỡng lự nguồn gốc tiếng Việt, “tiếng tiền Việt sinh từ hỗn hịa phương ngữ Mơn-Khmer, phương ngữ Thái ngơn ngữ thứ ba cịn chưa biết, sau tiếng Việt ñã vay mượn số lượng lớn từ Hán Nhưng ngơn ngữ có ảnh hưởng định ñể tạo cho tiếng Việt trạng thái ñại (tức có điệu ơng nghiên cứu) chắn, theo ý tôi, ngôn ngữ Thái, tơi nghĩ tiếng Việt phải ñược xếp vào họ Thái” [5, trang 89] Mặc dù quan ñiểm Maspéro sau ñã ñược A.G.Haudricourt chứng minh lại cịn nhiều khiếm khuyết ơng bước ñầu ñược số từ gốc Thái tiếng Việt GS Nguyễn Ngọc San nhận ñịnh rằng, “sự hịa đúc tiếng MonKhmer tiếng Tày-Thái cổ hình thành ngơn ngữ Việt Mường chung lưu lại tầng Tày-Thái đáng kể Tuy nhiên xác ñịnh nguồn gốc TàyThái từ tiếng Việt khơng dễ dàng gì” [8, trang 135] Theo nhận định nhiều nhà ngơn ngữ học dân tộc học từ tiếng Việt gốc Tày-Thái phần nhiều thuộc văn minh lúa nước Tiêu biểu cho quan ñiểm ý kiến GS Phạm ðức Dương, ơng cho “một điều quan trọng cần nhấn mạnh nhìn vào lớp từ vựng hệ thống từ hoạt ñộng tự nhiên, thể hoạt ñộng người, số đếm… ngơn ngữ tiền ViệtMường có từ văn hóa săn bắt, hái lượm hệ thống canh tác nương rẫy, lớp từ vựng văn minh nơng nghiệp lúa nước hồn tồn khơng có Trong hệ thống từ ngơn ngữ Việt-Mường lại có chung gốc với ngôn ngữ Tày-Thái” [10, trang 129-130] Kết luận GS Phạm ðức Dương nhận ñược nhiều ý kiến đồng tình ủng hộ có ý kiến cho chưa thực thuyết phục Bởi để khẳng ñịnh từ vựng phản ánh văn minh nông nghiệp lúa nước hồn tồn khơng có ngơn ngữ thời kỳ tiền Việt-Mường cần phải thống kê đầy ñủ chứng minh thêm GS Trần Trí Dõi cho từ quan trọng văn lúa nước từ “ruộng/đồng” lại 51 có gốc gác thời kỳ tiền Việt-Mường Từ việc phân tích nhiều từ vựng khác ơng nhận định “tiếng Việt giai đoạn tiền Việt-Mường dường có lớp từ vựng văn minh nơng nghiệp lúa nước Do khơng thể chờ đến thời kỳ Việt-Mường chung cộng ñồng cư dân Việt biết ñến kỹ thuật canh tác này.” [5, trang 230] GS Nguyễn Ngọc San cho biết thêm, “trong bảng thống kê từ TàyThái trước người ta cịn đưa vào từ gốc Hán” [8, trang 137] Sau loại từ gốc Hán, ơng đưa danh sách 100 từ Việt gốc Tày-Thái ðối chiếu với Bảng 100 từ Swadesh, số lượng từ trùng khớp có vài từ, ví dụ: này\đây, chóc (chim chóc), nhận (ra)/nhìn (thấy), tất (cả)/sất/tuốt; số từ quan hệ thân thuộc dùng cho xưng hô như: bố/bủ/bọ, mợ… ðiều cho thấy kết luận Maspéro tiếng Việt có gốc Thái hồn tồn khơng xác Chỉ nói rằng, yếu tố Tày-Thái góp phần làm thay đổi sâu sắc diện mạo văn hóa người Việt vào thời tiền sử sơ sử, góp phần làm phong phú người Việt có từ thời kỳ văn hóa ðơng Sơn 4.3 Các từ có họ Nam ðảo Ngữ hệ Nam ðảo (Austronesian) hay cịn gọi Mã Lai-ða đảo (MalayoPolynesian) họ ngôn ngữ lớn, phân bố quần đảo Indonesia, Philippines, số khu vực ðơng Dương, ðài Loan, Châu ðại Dương Có khoảng 800 ngôn ngữ khác thuộc họ Nam ðảo Ở Việt Nam, ngơn ngữ dân tộc Chăm, Êđê, Gia Rai, Ra Glai, Churu cư trú tỉnh Nam Trung Bộ Cao nguyên Trung thuộc ngữ hệ Trong khu vực cịn cư trú dân tộc Kơ Ho, Mnông, Xtiêng, Mạ, Chơ Ro, Ba Na, Xơ ðăng, Hrê…, ngôn ngữ dân tộc lại thuộc họ Nam Á Chính địa bàn cư trú dân tộc ñan xen với nhau, có nhiều từ tương đồng chúng khiến cho việc phân định rạch rịi nguồn gốc ngơn ngữ hồn tồn khơng đơn giản Như nói phần 3, tiếng Việt có q trình tiếp xúc lâu dài với ngôn ngữ Nam ðảo lên đến hàng ngàn năm, vị trí địa lý gần nhau, cư dân sinh sống xen kẽ với nhau, từ vay mượn chúng Ngồi số lượng 175 từ gốc Mã Lai Bình Ngun Lộc liệt kê so sánh (nhưng ơng khơng phân biệt nhóm dân tộc Nam ðảo, nhóm Nam Á), năm 1992, báo Từ Nam Á tiếng Việt, tác giả Hồ Lê với cách làm tương tự (cho từ Việt gồm ngôn ngữ Môn-Khmer lẫn ngôn ngữ Nam ðảo ngơn ngữ Thái) liệt kê 193 từ tiếng Việt mà theo ơng từ Việt, có nhiều từ có Bảng 100 từ Swadesh, ví như: anh/eng (Danaw: êl, Riang: êq, Palaung: yêo, Wa: eql, Vu, Son Tailoi: êk); ăn (Khmer: chya, Palaung: ham, Sakai: chaa, Xơñăng, Kơho, Bahna: sa, Khasi: bsa, Laha: ăn/kuôn, Thái: kun, Li: khan, Indonesia: pangan…) [11, trang 110] Theo khảo sát sơ chúng tơi, Bảng 100 từ Swadesh, có 20-25 từ có nguồn gốc Nam ðảo Một số ví dụ tiêu biểu: 52 Mặt trời (sun) Tiếng Indonesia: mata hari, tiếng Aceh: mata ur , tiếng MalayTagalog (PMT): mata haraj… có ý nghĩa so sánh “mắt trời” [12, trang 116] “Mặt trời” tiếng Việt số từ song tâm tiết, đọc trại “mắt trời”, bảo lưu ý nghĩa nhóm ngơn ngữ Tiếng Kam-Tai (PKT) đọc *pra*blan, vay mượn ý nghĩa “mắt trời” từ tiếng Nam ðảo [4, trang 248] Mặt trăng (moon) “Mặt trăng” tiếng Việt cách nói dựa theo từ “mặt trời”, thực vốn từ đơn âm tiết “trăng” Tiếng Indonesia: bulan, tiếng Aceh: bul , tiếng Gialai: blan, PMT: bulan, PKT *C-blin [12, trang 117] GS Ngô An Kỳ sau phân tích âm song tiết *pl-, *bl-, *m-l- tiếng ðồng ðài Nam ðảo cổ với âm đơn *N- tiếng Hán Thượng cổ cịn đưa nhận định “từ 月*Nat (nguyệt, mặt trăng) có nguồn gốc từ tiếng ðồng ðài, Nam ðảo”, từ rút kết luận “tiếng Kam-Tai ngun thủy *C-blin xuất phát từ âm tiếng Nam ðảo cổ” [4, trang 315] Ngoài ra, theo khảo sát chúng tơi, cịn có từ khác có nguồn gốc từ tiếng Nam ðảo như: bụi, ñường, núi, ñêm, tai, mắt, lưỡi, bụng, trứng, uống, ăn, cắn, mất, ñứng, ni (này)… Như vậy, số lượng từ gốc Nam ðảo Bảng 100 từ Swadesh lớn, chiếm tới 20-25%, điều phản ánh thực tế GS Trần Trí Dõi chứng minh vào giai ñoạn phát triển ñầu tiên lịch sử tiếng Việt (cách ñây khoảng 1.000 năm trước Cơng ngun kỷ đầu sau Cơng nguyên), lúc tiếng tiền Việt-Mường tách khỏi khối Môn-Khmer để có lịch sử phát triển riêng, tiếng tiền Việt-Mường có tiếp xúc với ngơn ngữ thuộc họ Nam ðảo Và ơng có nhận định thêm “tính chất nhập nhằng khiến người ta khó xác ñịnh ngôn ngữ vay mượn ngôn ngữ Trong tương lai, túy xem xét từ vựng lịch sử tiếng Việt, chắn ñây vấn ñề thú vị ñầy rẫy khó khăn” [5, trang 162] 4.4 Các từ gốc Hán Như ñã nói trên, khảo sát nguồn gốc tiếng Việt, không nên so sánh song ngữ mà phải đặt mối quan hệ đa ngữ, đa chiều, ñây thứ tiếng Mon-Khmer, tiếng Tày-Thái, tiếng Nam ðảo chí tiếng Hán Tuy tiếng Hán tiếng Thái du nhập vào tiếng Việt thời kỳ thứ hai lịch sử phát triển tiếng Việt (thế kỷ I sau Công nguyên khoảng kỷ VIII-IX), hình thành lớp từ mà ñược nhà nghiên cứu gọi từ Hán-Việt cổ hay cổ HánViệt, “ñiều cần ý từ vay mượn tiếng Hán vào thời kỳ dường từ vốn từ tiếng Việt Chẳng hạn ñó từ ñầu, mả, mùa, mùi, buồng, bến, buồm…” [5, trang 172] Khảo sát Bảng 100 từ Swadesh có 10 từ có gốc Hán Ví dụ khảo sát đại từ nhân xưng Tôi (I) Chúng (we) bảng 100 từ, chúng tơi nhận thấy chúng có mối tương quan sau: 53 ðại từ nhân xưng ngơi thứ số “I” tiếng Việt có cách nói “tơi, ta, tau, tớ ” Trong “Tơi” (đọc trại “tui”) tương ứng với [tai2]-[dai4] “tớ” tương ứng với 卒[zu2], hai đại từ nhân xưng ngơi thứ tiếng Quảng ðông (Cantonese) tiếng Khách Gia (cịn gọi tiếng Hẹ, Hakka), hai ngơn ngữ thuộc ngữ hệ Hán Tạng Ý nghĩa hai từ tương đồng với ý nghĩa gốc từ “tơi tớ” tiếng Việt ðịa bàn cư trú tộc người gần sát Việt Nam, nằm mối tương quan Bách Việt Tiếng Mường ñọc [thơi] (bật hơi), tiếng Hmong đọc [Tub] (b âm cao, tương tự dấu sắc tiếng Việt) ðại từ nhân xưng thứ số nhiều “we” tiếng Việt có cách nói “chúng tơi, chúng ta, chúng tao, chúng tớ”; “bọn tôi, bọn tao…”; “tụi tao…” Trong tiền tố “chúng”, “bọn” “tụi” có nguồn gốc từ tiếng Hán Chúng 众: tiếng Khách Gia [chung]; Bọn 帮: tiếng Quảng ðông [bong]; Tụi 隊: tiếng Khách Gia [tui]… Hay từ ñầu, tim, gan (ñọc trại từ tâm, can), ơng (đàn ơng), bà (đàn bà)… từ vay mượn gốc Hán, ñây rõ ràng từ thuộc lớp từ Tuy nhiên xét mặt trường nghĩa chúng chưa mang tính hệ thống, đối chiếu với Bảng 100 từ số lượng ít, nhận định tiếng Việt có nguồn gốc Hán-Tạng hồn tồn khơng xác, tiếng Việt ngày có 70% số lượng từ vựng từ Hán-Việt, từ rõ ràng thuộc lớp từ vựng văn hóa du nhập vào tiếng Việt giai ñoạn muộn hơn, không thuộc lớp từ vựng Kết luận Do khn khổ báo có hạn nên liệt kê phân tích chi tiết từ nguyên 100 từ Bảng từ Swadesh Tuy nhiên dựa vào kết nghiên cứu học giả ñi trước so sánh đối chiếu sau này, tạm ñưa nhận ñịnh sau: Với số lượng áp ñảo 50% từ Bảng 100 từ Swadesh có gốc tích từ ngơn ngữ trực hệ dịng Mơn-Khmer, kết luận tiếng Việt có nguồn gốc thuộc họ Nam Á, dịng Mơn-Khmer hồn tồn có sở thuyết phục Mở rộng nghiên cứu thêm Bảng 200 từ Swadesh, nhận thấy số lượng từ chiếm đa số Có thể nói, từ gốc Môn-Khmer lớp từ vựng tiếng Việt nhiều tảng tiếng Việt GS Nguyễn Ngọc San cịn nhận định thêm rằng, “để tái lập nhằm khẳng ñịnh nguồn gốc từ gốc Mon-Khme tiếng Việt, người ta sử dụng đến phương pháp Ngữ thời học, chí ngược nguồn gốc thời Mon-Khme lên tới Nam Á Tất nhiên số từ gốc Nam Á vừa chung cho Mon-Khme vừa chung cho tiểu chi khác, ví dụ số đếm một, hai, ba, bốn từ bay, bú, mũi, mắt, mày (ñại từ)…” [8, trang 118] Như GS Nguyễn Ngọc San ñã bước ñầu áp dụng phương pháp 54 Swadesh việc xác ñịnh nguồn gốc từ vựng, khơng nói rõ cụ thể so sánh với Bảng 100 từ hay Bảng 200 từ, ñối chiếu với từ ông ñưa thấy chúng đa phần có xuất Bảng thống kê Swadesh Một nguồn gốc khác từ vựng tiếng Việt mà không nhắc tới lớp từ có gốc Nam ðảo cổ Với số lượng khoảng 25% từ có xuất Bảng 100 từ, mốc thời gian chúng xa xưa lớp từ gốc Nam Á, thuộc từ ngơn ngữ Vì khó quy chúng vào lớp từ vay mượn hay lớp từ văn hóa Nhận định xác diện mạo lớp từ địi hỏi phải có so sánh đối chiếu nhiều với ngôn ngữ trực hệ ngữ hệ Nam ðảo có liên quan đến tiếng Việt, ví dụ tiếng Chăm chẳng hạn Chúng ta nhắc tới liên quan hay vay mượn tiếng Việt tiếng Chăm, có địa danh gốc Chăm tồn lãnh thổ Việt Nam, phần nhiều nằm vùng Nam Trung Bộ Tuy nhiên, thử ñi sâu vào so sánh số từ Bảng 100 từ với từ gốc Chăm, ví dụ: bay (Chăm: pơr), mơi (Chăm: cabơi)… thấy chúng có tương ứng thú vị Việc nhận ñịnh ñúng ñắn chất tương ứng giúp hiểu rõ lịch sử tiếng Việt mối tương quan với tiếng Nam Á Nam ðảo Sự du nhập lớp từ vựng gốc Tày-Thái gốc Hán vào tiếng Việt muộn so với gốc Môn-Khmer gốc Nam ðảo, chiếm thiểu số Bảng 100 từ ðiều cho thấy rằng, ñây lớp từ vay mượn sau Tuy nói vay mượn xét chất từ khái niệm vốn từ ngơn ngữ (có lẽ lý mà chúng có xuất Bảng 100 từ Swadesh) Có ñiều mà nhà nghiên cứu ñang tranh luận ngôn ngữ vay mượn ngôn ngữ Ví dụ pnar (cái ná) vốn thuộc gốc Nam Á Từ tiếng Hán ñã vay mượn sớm, viết 弩, lúc tiếng Hán có ngun âm a trịn mơi nên phải đọc từ thành [no], từ lúc du nhập lại vào tiếng Việt tạo từ “nỏ” bên cạnh từ “ná” có Sau kỷ thứ X từ lại ñược ñọc theo âm Hán Việt tạo từ “nỗ” [8, trang 116] Trong trình tìm hiểu lịch sử tiếng Việt, không nên bỏ qua phương ngữ Việt Nam, nguồn liệu sinh động phong phú cho cơng tác nghiên cứu Trong đó, phương ngữ Bắc Trung Bộ chẳng hạn, “nguồn cung cấp tư liệu giúp có sở chắn để giải thích nhiều tượng có từ thời Việt-Mường” [5, trang 135] Ví dụ khảo sát Bảng 100 từ, cần mở rộng khảo sát thêm từ ñịa phương khác, chẳng hạn như: cây-kơn, chí-chấy, đầutrốc, này-ni… Kết hợp nhiều phương pháp nghiên cứu khác với việc ứng dụng Bảng 100 từ Swadesh cho nhìn khoa học hơn, tồn diện hình thành vốn từ tiếng Việt, phương pháp sản sinh từ diệt vong lớp từ cổ giai đoạn lịch sử tiếng Việt Trên sở đó, 55 có nhận định sâu sắc hơn, xác bình diện Từ nguyên học (etymology) tiếng Việt xu hướng phát triển tiếng Việt sau TÀI LIỆU THAM KHẢO [1] Nguyễn Thiện Giáp, Lược sử Việt ngữ học, tập I, Nxb Giáo dục, 2008 [2] 王力, 汉语史稿, 中华书局, (Vương Lực, Hán ngữ sử cảo, Trung Hoa thư cục), 2002 [3] Bình Nguyên Lộc, Nguồn gốc Mã Lai dân tộc Việt Nam, Nxb Lá Bối, Sài Gòn, 1975 [4] 吴安其, 汉藏语同源研究, 中央民族大学出版社, (Ngô An Kỳ, Hán Tạng ngữ ñồng nguyên nghiên cứu, Trung ương Nhân dân ðại học Xuất xã), 2002 [5] Trần Trí Dõi, Giáo trình lịch sử tiếng Việt (sơ thảo), Nxb ðại học Quốc gia Hà Nội, 2007 [6] Nguyễn Thiện Giáp, 777 Khái niệm Ngôn ngữ học, Nxb ðại học Quốc gia Hà Nội, 2010 [7] A G Haudricourt, Vị trí tiếng Việt ngôn ngữ Nam Á, Ngôn ngữ, số 1, 1991 [8] Nguyễn Ngọc San, Tìm hiểu tiếng Việt lịch sử, Nxb ðại học Sư phạm Tp HCM, 2003 [9] Ferdinand de Saussure, Giáo trình ngơn ngữ học đại cương (1916), Nxb Khoa học Xã hội, Hà Nội, 1973 [10] Phạm Ngọc, Phạm ðức Dương, Tiếp xúc ngôn ngữ ðông Nam Á, Viện ðông Nam Á xuất bản, Hà Nội, 1983 [11] Hồ Lê, Từ Nam Á tiếng Việt, Tiếng Việt ngôn ngữ dân tộc phía Nam, Nxb Khoa học Xã hội, Hà Nội, 1992 [12] 吴安其,南岛语分类研究, 商务印书馆, 北京, (Ngô An Kỳ, Nam ðảo ngữ phân loại nghiên cứu, Thương Vụ ấn thư quán, Bắc Kinh), 2009 SYSTEMATICALLY IDENTIFYNING THE HISTORY OF VIETNAMESE FORMATION BY APPLYING “SWADESH 100-WORD LIST” Vo Trung Dinh College of Foreign Languages, Hue University SUMMARY The “Swadesh 100-word list” is the most common kernel word list in the world Applying this word list to researching Vietnamese etymology, we could find out the relationship 56 between Vietnamese and some other languages in Asia such as those belonging to the Austroasiatic, Austronesian and Sino-Tibetan families In fact, these 100 kernel words are 100 concepts, from which we could gather thousands of basic vocabulary in Vietnamese as a foundation, so that we would take an overall and more exact vision on the history of Vietnamese formation 57 ... cứu Bảng 100 từ có số từ vay mượn, nhiều so với Bảng 200 từ Có thể nói Bảng 100 từ ñã xác ñịnh ñược lớp từ vựng ổn ñịnh ngôn ngữ ñã trở thành Bảng 100 từ thông dụng giới khảo sát nguồn gốc từ. .. xác định nguồn gốc từ vựng, khơng nói rõ cụ thể so sánh với Bảng 100 từ hay Bảng 200 từ, ñối chiếu với từ ơng đưa thấy chúng đa phần có xuất Bảng thống kê Swadesh Một nguồn gốc khác từ vựng tiếng. .. Có thể nói, từ gốc Mơn-Khmer lớp từ vựng tiếng Việt nhiều tảng tiếng Việt GS Nguyễn Ngọc San cịn nhận định thêm rằng, “ñể tái lập nhằm khẳng ñịnh nguồn gốc từ gốc Mon-Khme tiếng Việt, người ta