Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 176 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
176
Dung lượng
7,55 MB
Nội dung
ĐẠI HỌC QUỐC GIA THÀNH PHỐ HỒ CHÍ MINH ĐẠI HỌC KHOA HỌC XÃ HỘI VÀ NHÂN VĂN BỘ MÔN NGƠN NGỮ HỌC CƠNG TRÌNH NGHIÊN CỨU KHOA HỌC SINH VIÊN CẤP TRƯỜNG NĂM 2019 ĐỀ TÀI: ỨNG DỤNG KHO NGỮ LIỆU SONG NGỮ HOA – VIỆT TRONG GIẢNG DẠY TIẾNG VIỆT CHO NGƯỜI HOA Nhóm sinh viên thực hiện: Chủ nhiệm: Lưu Thị Cẩm Thu Thành phố Hồ Chí Minh, tháng năm 2019 ĐHQG-HCM Trường ĐHKHXH&NV Ngày nhận hồ sơ Mẫu: SV 00 Do P.QLKH-DA ghi ĐỀ TÀI NGHIÊN CỨU KHOA HỌC SINH VIÊN CẤP TRƯỜNG NĂM HỌC 2018 – 2019 Tên đề tài: ỨNG DỤNG KHO NGỮ LIỆU SONG NGỮ HOA - VIỆT TRONG GIẢNG DẠY TIẾNG VIỆT CHO NGƯỜI HOA Thành phần tham gia thực đề tài TT Họ tên Chịu trách nhiệm LƯU1 THỊ CẨM THU Chủ nhiệm Tham gia Tham gia Tham gia Tham gia Điện thoại Email 0907124016 luucamthu.gmtoeic@gmail.com Hồ sơ gồm TT Tên văn Thuyết minh đề tài Văn khác TP.HCM, tháng năm 2019 Có Khơng ĐẠI HỌC QUỐC GIA THÀNH PHỐ HỒ CHÍ MINH TRƯỜNG ĐẠI HỌC KHOA HỌC XÃ HỘI VÀ NHÂN VĂN LƯU THỊ CẨM THU ĐỀ TÀI NGHIÊN CỨU KHOA HỌC SINH VIÊN CẤP TRƯỜNG 2018 - 2019 Tên đề tài: ỨNG DỤNG KHO NGỮ LIỆU SONG NGỮ HOA-VIỆT TRONG GIẢNG DẠY TIẾNG VIỆT CHO NGƯỜI HOA KHOA/ BỘ MÔN: NGÔN NGỮ HỌC NGÀNH: NGÔN NGỮ HỌC NGỮ LIỆU Người hướng dẫn: PGS TS Đinh Điền Chuyên môn: Tin học, Ngôn ngữ học Đơn vị công tác: Trung tâm Ngơn ngữ học Tính tốn Khoa Cơng nghệ thông tin, Đại học Khoa học Tự nhiên – ĐHQG TPHCM THÀNH PHỐ HỒ CHÍ MINH, 2019 MỤC LỤC DANH MỤC BẢNG, DANH MỤC HÌNH, DANH MỤC BIỂU ĐỒ TÓM TẮT NỘI DUNG ĐỀ TÀI MỞ ĐẦU 1 Lý chọn đề tài Tổng quan tình hình nghiên cứu 2.1 Tình hình nghiên cứu quốc tế 2.2 Tình hình nghiên cứu nước Mục tiêu nghiên cứu Nội dung, đối tượng phạm vi nghiên cứu 4.1 Nội dung 4.2 Đối tượng phạm vi nghiên cứu Phương pháp nghiên cứu 6 Ý nghĩa khoa học thực tiễn 6.1 Ý nghĩa khoa học 6.2 Ý nghĩa thực tiễn 7 Cấu trúc đề tài CHƯƠNG 1: CƠ SỞ NGÔN NGỮ HỌC TRONG VIỆC XÂY DỰNG KHO NGỮ LIỆU 10 1.1 Tổng quan ngôn ngữ học ngữ liệu 10 1.1.1 Lược sử q trình hình thành phát triển ngơn ngữ học ngữ liệu 10 1.1.2 Giới thiệu ngôn ngữ học ngữ liệu 11 1.1.3 Giới thiệu ngữ liệu 12 1.1.4 Các dạng ngữ liệu 14 1.2 Cơ sở lý luận ngôn ngữ học ngữ liệu 19 1.2.1 Đối tượng nghiên cứu ngôn ngữ học ngữ liệu lời nói 19 1.2.2 Ngơn ngữ học ngữ liệu nghiên cứu mặt chức ngôn ngữ 21 1.2.3 Ngôn ngữ học ngữ liệu khai thác kho ngữ liệu đương đại 24 1.2.4 Cơ sở lý thuyết xác suất thống kê 26 1.3 Cơ sở xây dựng ngữ liệu 26 1.3.1 Sự định hướng 27 1.3.2 Tiêu chí chọn mẫu 27 1.3.3 Tính tự nhiên kích cỡ kho ngữ liệu 27 1.3.4 Tính đại diện 28 1.3.5 Tính cân 29 1.4 Xây dựng ngữ liệu song ngữ 31 1.4.1 Các vấn đề xây dựng kho ngữ liệu 31 1.4.2 Tiêu chí chọn mẫu ngữ liệu song ngữ 32 TIỂU KẾT 32 CHƯƠNG 2: XỬ LÝ KHO NGỮ LIỆU SONG NGỮ HOA-VIỆT 34 2.1 Tiền xử lý ngữ liệu 34 2.1.1 Thu thập ngữ liệu 34 2.1.2 Chuẩn hóa ngữ liệu 37 2.1.3 Làm ngữ liệu 42 2.2 Tách câu, tách từ, gán nhãn ngữ liệu 43 2.2.1 Tách câu 43 2.2.2 Tách từ 44 2.2.3 Gán nhãn từ loại 45 2.3 CLC Parallel Corpus Tool 46 2.3.1 Giới thiệu CLC Parallel Corpus Tool 46 2.3.2 Các chức CLC Parallel Corpus Tool 47 TIỂU KẾT 49 CHƯƠNG 3: ỨNG DỤNG KHO NGỮ LIỆU SONG NGỮ HOA- VIỆT TRONG GIẢNG DẠY TỪ VỰNG – NGỮ NGHĨA TIẾNG VIỆT CHO NGƯỜI HOA 51 3.1 Khảo sát xây dựng bảng từ tiếng Việt thông dụng cho người Hoa 51 3.2 Khảo sát nghĩa từ 55 3.2.1 Khảo sát nghĩa danh từ “mặt” 55 3.2.2 Khảo sát nghĩa động từ “đánh” 57 3.2.3 Kết khảo sát nghĩa danh từ “mặt” động từ “đánh” 59 3.3 Chọn từ theo ngữ cảnh 61 3.3.1 Ngữ cảnh từ 穿 61 3.3.2 Ngữ cảnh từ 戴 62 3.4 Xác định từ gốc Hán Việt 62 3.5 Đối chiếu phương tiện vai người nói tiếng Hoa tiếng Việt 63 3.5.1 Phạm vi đối chiếu 64 3.5.2 Khái niệm 64 3.5.3 Điểm tương đồng 65 3.5.4 Điểm dị biệt 65 3.5.5 Kết đối chiếu phương tiện vai người nói trong tiếng Hoa tiếng Việt (trừ tên riêng) 71 TIỂU KẾT 76 CHƯƠNG 4: ỨNG DỤNG KHO NGỮ LIỆU SONG NGỮ HOA- VIỆT TRONG GIẢNG DẠY NGỮ PHÁP – NGỮ NGHĨA TIẾNG VIỆT CHO NGƯỜI HOA 78 4.1 Đối chiếu điểm tương đồng dị biệt trật tự thành phần câu tiếng Hoa tiếng Việt 78 4.1.1 Phạm vi đối chiếu 78 4.1.2 Điểm tương đồng 78 4.1.3 Điểm dị biệt 80 4.2 Đối chiếu cách dùng hư từ (từ chức năng) tiếng Hoa tiếng Việt 84 4.2.1 Phạm vi đối chiếu 85 4.2.2 Điểm tương đồng 85 4.2.3 Điểm dị biệt 86 4.3 Đối chiếu danh lượng từ (cá thể) tiếng Hoa với loại từ tương đương tiếng Việt 91 4.3.1 Các quan niệm 91 4.3.2 Phạm vi đối chiếu 93 4.3.3 Điểm tương đồng 94 4.3.4 Điểm dị biệt 95 4.3.5 Kết đối chiếu danh lượng từ 张,条 hai nhóm danh lượng từ với loại từ tương đương tiếng Việt 102 TIỂU KẾT 105 KẾT LUẬN – KIẾN NGHỊ 107 DANH MỤC TÀI LIỆU THAM KHẢO PHỤ LỤC BÀI BÁO KHOA HỌC (ISBN: 978-604-974-145-6) DANH MỤC BẢNG Trang Bảng 1.1 BNC dạng ngôn ngữ viết (chứa khoảng 100 triệu từ) 30 Bảng 1.2 BNC dạng ngơn ngữ nói 30 Bảng 2.1 Thống kê số câu theo lĩnh vực 34 Bảng 2.2 Thống kê số lượng từ theo lĩnh vực ngôn ngữ 35 Bảng 2.3 Thống kê chiều dài trung bình câu theo lĩnh vực ngơn ngữ 36 Bảng 2.4 Các ngoại lệ chuẩn hóa ngữ liệu 40 Bảng 2.5 Gán nhãn từ loại 45 Bảng 3.1 So sánh số lượng từ ngữ cung cấp số giáo trình 51 tiếng Việt sơ cấp Bảng 3.2 Khảo sát khả xuất 1000 từ tiếng Việt thông dụng 52 kho ngữ liệu song ngữ Hoa – Việt Bảng 3.3 Thống kê tần số 1000 từ thông dụng kho ngữ liệu song 53 ngữ Hoa – Việt Bảng 3.4 Thống kê nghĩa danh từ “mặt” động từ “đánh” 59 Bảng 3.5 Thống kê 20 từ gốc Hán kho ngữ liệu 62 Bảng 3.6 Thống kê phương tiện vai người nói số đơn 75 tiếng Hoa tiếng Việt Bảng 3.7 Thống kê phương tiện vai người nói số phức 75 tiếng Hoa tiếng Việt Bảng 4.1 Thống kê cách sử dụng trợ từ động thái 着 với phương tiện biểu thị 90 tương đương tiếng Việt Bảng 4.2 Các lớp danh từ 92 Bảng 4.3 Thống kê danh lượng từ 张 loại từ tương đương tiếng Việt 103 Bảng 4.4 Thống kê danh lượng từ 条 loại từ tương đương tiếng Việt 104 DANH MỤC HÌNH Trang Hình 1.1 Các dạng ngữ liệu 14 Hình 1.2 Ngữ liệu song ngữ Hoa-Việt (CVC) dóng hàng thủ cơng mức câu (sentence alignment) dóng hàng tự động mức từ (word alignment) 17 Hình 1.3 Ngữ liệu song ngữ Hàn-Việt (KVC) dóng hàng thủ cơng mức câu (sentence alignment) dóng hàng tự động mức từ (word alignment) 17 Hình 1.4 Khảo sát cách dùng từ 比较 25 Hình 2.1 Ngữ liệu sau chuẩn hóa 39 Hình 2.2 Xóa câu trùng 43 Hình 2.3 Tách từ tự động 44 Hình 2.4 Ngữ liệu 10 cột 47 Hình 2.5 Khảo sát cách dùng từ “chân" 48 Hình 2.6 Dóng hàng tự động 48 Hình 2.7 Thống kê ngữ liệu 49 Hình 3.1 Khảo sát nghĩa danh từ “mặt” 55 Hình 3.2 Khảo sát nghĩa động từ “đánh” 57 Hình 3.3 So sánh cách chuyển dịch từ 穿 sang tiếng Việt 61 Hình 4.1 Đối chiếu trật tự thành phần bổ ngữ mức độ 79 Hình 4.2 (a) Đối chiếu trật tự thành phần định ngữ 80 Hình 4.2 (b) Đối chiếu trật tự thành phần định ngữ 81 Hình 4.2 (c) Đối chiếu trật tự thành phần định ngữ 81 Hình 4.3 Đối chiếu trật tự thành phần trạng ngữ cách thức 82 Hình 4.4 Đối chiếu phó từ mức độ 很 85 Hình 4.5 So sánh cách chuyển dịch danh lượng từ 张 sang tiếng Việt 95 Hình 4.6 Ngữ liệu bị tách từ sai 106 DANH MỤC BIỂU ĐỒ Trang Biểu đồ 2.1 Thống kê số câu theo lĩnh vực (%) 34 Biểu đồ 2.2 Thống kê số lượng từ theo lĩnh vực ngôn ngữ 35 Biểu đồ 2.3 Thống kê chiều dài trung bình câu theo lĩnh vực ngôn ngữ 36 Biểu đồ 4.1 Cách sử dụng trợ từ động thái 着 tiếng Hoa 90 với phương tiện biểu thị tương đương tiếng Việt (%) Biểu đồ 4.2 Danh lượng từ 张 loại từ tương đương tiếng Việt (%) 104 Biểu đồ 4.3 Danh lượng từ 条 loại từ tương đương tiếng Việt (%) 105 TÓM TẮT NỘI DUNG ĐỀ TÀI Trong ba chương đề tài này, chúng tơi trình bày sở ngôn ngữ học việc xây dựng kho ngữ liệu, bước trình xử lý ngữ liệu mà đối tượng nghiên cứu kho ngữ liệu song ngữ Hoa – Việt, khai thác ứng dụng kho ngữ liệu bình diện từ vựng – ngữ nghĩa ngữ pháp – ngữ nghĩa Về lý thuyết Chúng quan niệm đối tượng nghiên cứu ngơn ngữ học ngữ liệu lời nói Nghĩa phải quan sát cách hành chức ngôn ngữ thực tế Điều đồng nghĩa trường phái nhấn mạnh đến mặt chức ngôn ngữ Để đem đến nhìn khách quan ngơn ngữ, quan tâm đến ngữ liệu đương đại Ngồi tiêu chí chung, xây dựng kho ngữ liệu chúng tơi trọng đến tính đại diện tính cân Nhưng làm để xác định kho ngữ liệu đảm bảo hai tiêu chí ln tốn khó cho người làm ngữ liệu Vì thế, người nghiên cứu phải xác định mục đích nghiên cứu nhằm đốn định kích cỡ kho ngữ liệu, từ có tiêu chí cụ thể để đáp ứng tính đại diện tính cân cho kho ngữ liệu Về xử lý ngữ liệu Trong đề tài, bước đầu xây dựng thành công kho ngữ liệu tổng cộng có 10063 cặp câu Q trình xử lý ngữ liệu gồm có: Thứ tiền xử lý ngữ liệu Tiền xử lý ngữ liệu có ba cơng đoạn nhỏ thu thập, chuẩn hóa, làm ngữ liệu Thu thập ngữ liệu bước để xác định tính đại diện tính cân cho kho ngữ liệu Sau ngữ liệu thu thập đáp ứng kích cỡ theo mục đích người nghiên cứu tiến hành chuẩn hóa làm ngữ liệu Thứ hai tách câu, tách từ gán nhãn thơng tin từ loại Nếu chuẩn hóa làm ngữ liệu để đảm bảo mặt hình thức tách câu nhằm đảm bảo mặt nội dung cho ngữ liệu Tách từ không giúp cho học viên xác định ranh giới từ mà quan trọng trực tiếp ảnh hưởng đến kết gán nhãn thông tin từ loại Khi tiếp cận kho ngữ liệu gán nhãn thông tin từ loại, nên xem nhãn từ loại thông tin bổ sung nhằm hỗ trợ trình học tập bị lệ thuộc vào nhãn 558 phát 26 0,02 1158 trai 0,01 559 chịu 26 0,02 1159 kẹt 0,01 560 tổ chức 26 0,02 1160 ngã 0,01 561 phút 26 0,02 1161 thú 0,01 562 kỹ thuật 26 0,02 1162 kết thúc 0,01 563 lưu học sinh 26 0,02 1163 hợp 0,01 564 gió 26 0,02 1164 ngược 0,01 565 hải sản 26 0,02 1165 thiệt 0,01 566 em gái 25 0,02 1166 tháp 0,01 567 25 0,02 1167 tương 0,01 568 đánh 25 0,02 1168 nữ 0,01 569 tan 25 0,02 1169 0,01 570 sai 25 0,02 1170 email 0,01 571 thật 25 0,02 1171 dán 0,01 572 quà 25 0,02 1172 phong cảnh 0,01 573 hộp 25 0,02 1173 chào mừng 0,01 574 cổ 25 0,02 1174 tiếp 0,01 575 giao 25 0,02 1175 chúc 0,01 576 vui vẻ 25 0,02 1176 vùng 0,01 577 văn hoá 25 0,02 1177 dạng 0,01 578 trước 25 0,02 1178 tương đối 0,01 579 vòng 25 0,02 1179 xe lửa 0,01 580 Trường Thành 25 0,02 1180 thua 0,01 581 leo 25 0,02 1181 học 0,01 582 25 0,02 1182 địa 0,01 583 tối qua 25 0,02 1183 tủ 0,01 584 triệu 25 0,02 1184 thể 0,01 585 tiến hành 25 0,02 1185 đùa 0,01 586 ăn 25 0,02 1186 diều 0,01 587 đương nhiên 24 0,02 1187 tiểu thuyết 0,01 588 bắt 24 0,02 1188 miệng 0,01 589 trang 24 0,02 1189 nguy hiểm 0,01 590 phận 24 0,02 1190 nấu ăn 0,01 591 cá 24 0,02 1191 khoa học 0,01 592 toàn 24 0,02 1192 nỡ 0,01 593 máy 24 0,02 1193 phổ thông 0,01 594 nằm 24 0,02 1194 thứ bảy 0,01 595 suy nghĩ 24 0,02 1195 thưởng thức 0,01 596 đăng ký 24 0,02 1196 km 0,01 597 vừa 24 0,02 1197 cảm động 0,01 598 rút 24 0,02 1198 kiếm 0,01 599 nóng 24 0,02 1199 giao thông 0,01 600 bác sĩ 24 0,02 1200 thẳng 0,01 ISBN: 978-604-974-145-6 786049 741456 Sách không bán Proceedings of the 4th International Conference Interdisciplinary Research in Linguistics and Language Education I CHI V I TI NG VI T D TRONG TI NG HOA LI U SONG NG HOA - VI T C m Thu* n Nguy n Quang Minh Tri t i h c Khoa h N i h c Qu c gia TP H t: Ti ng Vi p (isolating n ng (function m d bi t ng v m t t v ng - ng tt t cs d gi ts ti i chi gi a ti ng Vi t d li u song ng Hoa - Vi t V c i chi u s bi t v ng Hoa v i ti ng Vi t m u qu p c n truy n th c hi c , kho ng li u song ng Hoa - Vi T M , p i chi u Hoa - Vi t u Vi ih cn mv chi u v bi gi i t ) c c Kinh, T ih i chi c nh gi a ti i chi u gi i t ti n, gi m ng m ng ng Vi c quan tr ng ih cs i i thi u v i v i gi i t ti ng Vi t hi i (qua m t s S d ti ng Hoa th t d ti c Ngo i ng B c i c a Tr nH c n ch d ng m cs bi t v ng Vi t m i chi li u song ng Hoa - Vi t Ng li li i ti ng Hoa (t ng c gi a ti ng d a 797 c p - Gi i thi u kho ng li u song ng Hoa - Vi t * Email: luucamthu.gmtoeic@gmail.com 181 Linguistics and applied linguistics - - ng v - gi a ti m d bi t v ng Vi t gi a ti ng Vi t n Trong th li bi t, qua ph n m m ct nb ng vi t nghi ih i chi h c Ng li u t ng d D a m u qu c i chi i chi 2.1 Gi i thi u kho ng li u song ng Hoa - Vi t Kho ng li u song ng Hoa - Vi t (Computational Linguistics Center, g i t h c Qu H cung c p (theo gi li u a ng Kim T n) Ng li m kho t c d ch th ch c a C gi ng d y ti ng Vi t Nam) language), ti ng Vi h i h c Khoa h c T d ng c - i (chi ti ng Hoa sang ti ng Vi t b i n n (2016) ng d ng kho ng li u ti ng Vi t H i th o qu c t v Vi t Nam h c li u song ng v i ti ng Hoa ngu n (source : a th c am ng li u t kho ng li u c i tho i c a kho ng li : , , , , , , , : , Tr t : , , , , Gi i t : , c t i h i th tho i ti ng Hoa ti , , , , , , , , , , , , , , , , , , , , , , , , , t ph n , , , , , , , , , , , , , , , , , 182 Proceedings of the 4th International Conference Interdisciplinary Research in Linguistics and Language Education : , , , chi ti ng Hoa (t l xu t hi n s , ph bi , , , th c hi n vi i c s d ng ph bi n i chi u v i ti ng Vi hi am ts t ti ng Vi t ng ch cg ct b ct ,g i (2011) d ng m t s ch Ph n n n Truy c p t http://ngphuoctam.blogspot.com/2013/01/cach-su-dung-mot-so-hu-tu-trong-chu-han.html) - ti ng Hoa bao g , gi i t h Theo Nguy n Kim Th v ng Vi t - cl n l ng y u t n (1996) Ng ng Vi t i) ti ng Vi t bao g m: Ph t h c, (Vi N ng) ng i) ng t ch u v ng ng (Nguy n Kim Th n (1963) i) t b n Khoa h Theo Nguy Ti ng quen g hay t Nh tb i h c Qu , tr t ,t tb i h c Qu T ng v ), k t t , tr t n Ti ng Vi t gi a ti mt tb ng Vi t ch m ch m ng, xu t hi n 254 l ng th 2, chi m ch m ng 0.67% Bi u th m th pv Vi ts ng t : t kh e 183 Linguistics and applied linguistics : ng t t mu c h n , Vi t nh ts ch m a ti i ti ng , th ch th ch th Vi t v ng th c s d ng nhi u nh ng th th t hi n 20 l n, chi m 0.05% u th m t s v t, hi ng x , hi n t i ho ch th c m t th m m c Th i ti ng m ng k t h p v i ng k t h p v ti ng Vi t : + n th t t i ng t + Anh i , Vi ts ch th a ti ng Hoa i ti ng , 184 Proceedings of the 4th International Conference Interdisciplinary Research in Linguistics and Language Education ph ph nh ph bi n nh t ti ng Hoa hi i, xu t hi n 689 l n, chi m 1.82% u th s ph ng k t h p v Vi ph ng ng t : + n : ng t B 2.4 m d bi t v gi a ti t k tc ng Vi t bi n ti ng Hoa hi i: , , 2.4.1 Tr t k t c u nh ng + (do danh t ng Vi hi n nh ng c, gi m nh n) nh ng Tr t k t c u : lo i DEG1 quan h s h Vi ik tt tt bi u th "c a" ti ng m t l cao nh t 45% nh ng (danh t it )+ ng Vi nh ng : a David s tt bi u th quan h s h u ho bi u th t 185 Linguistics and applied linguistics ng Hoa ta th ng Vi nh ng c, cl ng sau th ng: lo bi u th s hi n ho tt , ti ng Vi m 31% ng m hi nh ng + ng Vi hi ng m hi + nh ng : B i (c lo relative-clause) Trong ti ng Vi m t m hi m 24% nh ng (C m ch - v ) + ng Vi quan h (in a hi n nh ng 186 Proceedings of the 4th International Conference Interdisciplinary Research in Linguistics and Language Education : n u ngon nh t r i a tr t k t c u i Vi t h c ti ng Hoa r t d b nh m l c u a tr t k t v , lo i 2.4.2 Tr t k t c u lo ti ng Vi t sau tr ng ng , ch t vi hi n ng Hoa: Tr ng ng + ng t m nh n) ng Vi t: Trun hi n ( Tr ng ng hi ng Hoa, tr ng ng ph xu t hi n nhi u v tr ng ng ng m hi + Tr ng ng c v ng ng Vi t : (Hi u bi ) Hi u bi 187 Linguistics and applied linguistics 2.4.3 Tr t k t c u lo c b ng , ch m hay k t qu , ti ng Vi t g th hi n ng t ng Vi m nh n) + + B ng hi n + B ng : B nh ct pr u - corpus-based): Hoa Hoa - c -based) - 188 Proceedings of the 4th International Conference Interdisciplinary Research in Linguistics and Language Education , K t qu u B ng ng T lo i m ch m ch th i gian ph nh ng i i chi u v i ti ng Vi t i t ch th i gian v ch m , V , ng t ng t Bi u th m cao B ng t ng t Bi u th m t s v t, Bi u th s hi ng x y nh c m t th m m c 0.67% T l xu t hi n ph 0.05% ph 1.82% m d bi t B ng 2.1.Tr t k t c u , , Tr t k t c u T lo i V Trong ti ng Hoa nh ng danh t + + Tr ng ng (do m nh n) nh n) + Trung ng t m ng t ng m nh n) + + B ng + Trong hi ti ng Vi t ( + hi n nh ng ng m hi + Tr ng ng Ho c Tr ng ng th hi n th hi n + B ng 189 Linguistics and applied linguistics Bi u th quan h s h u, s t Ch m t vi 1.96% T l xu t hi n c th c hi n ho qu 0.05% B ng 2.2 k t , tr 0.27% a tr t k t c u Stt T l Bi u th m i quan h s h u, ti ng Vi Bi u th s Trong m t m t, ti ng Vi , c m ch - v Bi Th o lu tt 45% hi n 31% nh ng , ti ng Vi hi n 24% a tr t k t c u xu t/ ki n ngh 5.1 Th o lu n Vi i chi li u song ng Hoa - Vi t ti ng Hoa v i ti ng Vi t d i m sau: m - i chi - Th c cm ts th Hoa - Vi t bi t nv ng ph n m m th lo i, thu n ti n cho vi ng ti ng Hoa d i chi ih t hi n 190 Proceedings of the 4th International Conference Interdisciplinary Research in Linguistics and Language Education m Vi nh t lo T l sai: th lo lo i c a ng li m k t c u ,s u ng xu t Vi c k p c n truy n th li u t ti n x li u, p ng li u t qu i nh y, kho ng li u n li u (thu th p ng li ch ng i chi u gi a i K t lu n B th t l xu t hi n ng Vi t T , ng d y li u song ng Hoa - Vi t, ti t s quy lu t s d ng ti ng Hoa t d ng m i ng vi c h c ngo i ng , d ch thu u 191 Linguistics and applied linguistics NXB (2017) i h c Qu i n (2016) ng d ng kho ng li u ti ng Vi t gi ng d y ti ng Vi H i th o qu c t v Vi t Nam h c t Nam Vi t hi Zhou) (2016) i (qua m t s gi i t ) Lu i chi u gi i t ti i i i v i gi i t ti ng n Trung (2011) M i d ng m t s ch Ph n n n Truy c p t : http://ngphuoctam.blogspot.com/2013/01/cach-su-dungmot-so-hu-tu-trong-chu-han.html u v ng Nguy n Kim Th n (1963) N i Nguy n (1996) Ng T Tr H n (2014) S d T ng Vi t NXB Khoa h ng Vi t.NXB nH i h c Qu c ti ng Hoa th t d n Ti ng Vi t NXB i i i NXB Tr , t NXB - ng CONTRASTIVE STUDY ON THE USAGE OF CHINESE AND VIETNAMESE FUNCTION WORDS BASED ON CHINESE-VIETNAMESE PARALLEL CORPORA Abstract: Chinese and Vietnamese languages belong to the same isolating typology; therefore, they have many similarities in lexico-grammar The main grammatical means of these two languages are based on the word order and the function words However, the usage of function words in these two languages has its own differences For this reason, in this paper, we will proceed a contrastive analysis study on the u sage of function wordsin Chinese and Vietnamese languages based on Chinese and Vietnamese parallel corpora With this approach, we will be able to observe and contrast visually and d position in Chinese vs Vietnamese sentences, to which extent the traditional approaches are hard to achieve Key words: Function words, Chinese-Vietnamese parallel corpora, Chinese-Vietnamese contrastive studies 192 ... thiệu kho ngữ liệu song ngữ Hàn - Việt, xử lý kho ngữ liệu song ngữ Hàn - Việt, khai thác kho ngữ liệu song ngữ Hàn -Việt Dựa báo lập số thao tác việc khai thác xử lý kho ngữ liệu song ngữ HoaViệt... thác ứng dụng kho ngữ liệu song ngữ Hoa - Việt (Chinese – Vietnamese Corpus viết tắt CVC) hỗ trợ người Hoa học tiếng Việt Kho ngữ liệu sử dụng để giảng dạy tiếng Việt cho người nước phù hợp dạy tiếng. .. ngôn ngữ Ngồi ra, chúng tơi giới thiệu nhãn gán cho tiếng Hoa tiếng Việt CHƯƠNG 3: ỨNG DỤNG KHO NGỮ LIỆU SONG NGỮ HOA - VIỆT TRONG GIẢNG DẠY TỪ VỰNG – NGỮ NGHĨA TIẾNG VIỆT CHO NGƯỜI HOA Trong