Bài viết không chỉ tổng kết và trình bày các vấn đề bản chất mang tính lí thuyết của ngôn ngữ học ngữ liệu trong việc giảng dạy ngôn ngữ, mà còn đưa ra các thí dụ minh hoạ cụ thể về việc
Trang 1XX NHỮNG VẤN ĐỀ CHUNG
XX
1 Khái niệm kho ngữ liệu và ngôn ngữ học ngữ liệu
Đã có không ít nhà nghiên cứu khẳng định rằng “kho ngữ liệu và việc nghiên cứu kho ngữ liệu đã làm nên cuộc cách mạng về nghiên cứu ngôn ngữ, và về các ứng dụng của ngôn ngữ trong vòng vài thập niên qua” [Hunston 2002:1] Mặc dù thuật ngữ ngôn ngữ học ngữ liệu (corpus
linguistics) và ngữ liệu (corpus) xuất hiện lần đầu tiên đầu những năm 1980 [Leech & Svartvik 1992:105] nhưng những nghiên cứu ngôn ngữ dựa vào ngữ liệu đã có lịch sử từ trước đó
Thuật ngữ “ngữ liệu” (corpus) trong ngành ngôn ngữ học được hiểu là một tập hợp văn bản viết hoặc lời nói đã được văn bản hoá (hay phiên âm) dùng làm cơ sở cho việc phân tích và miêu
tả ngôn ngữ học Theo Sinclair [1991], kho ngữ liệu là “một khối các văn bản ngôn ngữ tự nhiên được chọn làm đại diện cho một trạng thái hay biến thể của một ngôn ngữ”
Leech [1992:116] đưa ra một định nghĩa khá chặt chẽ như sau về khái niệm kho ngữ liệu : “cần phải nói thêm rằng các kho ngữ liệu điện tử là những tập hợp các văn bản một cách có tổ chức: chúng thường được xây dựng với các mục đích cụ thể định trước, và thường được xây dựng để (nói một cách thông dụng) đại diện cho một ngôn ngữ hay thể loại văn bản” Sinclair [1996] cũng chia sẻ với quan điểm trên của Leech và nhấn mạnh tầm quan trọng của tính đại diện như sau:
“Một kho ngữ liệu là một tập hợp các phân đoạn của ngôn ngữ được chọn lựa và sắp xếp theo các tiêu chí ngôn ngữ học một cách rõ ràng nhằm sử dụng như một mẫu của ngôn ngữ đó”
Trong hoàn cảnh hiện nay, một kho ngữ liệu có thể được hiểu theo một số cách hiểu sau:
- (nghĩa rộng) bất cứ khối văn bản nào của ngôn ngữ tự nhiên;
- (thông dụng) một khối văn bản máy đọc được;
- (nghĩa hẹp) một tập hợp nhất định các văn bản máy đọc được, là mẫu đại diện lớn nhất cho
một ngôn ngữ hay các loại biến thể (variety)
Về nguyên tắc thì bất cứ tập hợp lớn hơn một văn bản nào đều có thể gọi là một kho ngữ liệu
Từ “corpus” trong tiếng Latin đơn giản có nghĩa là khối (body), do vậy một kho ngữ liệu có thể được định nghĩa là một khối các văn bản bất kì Tuy nhiên thuật ngữ “corpus” khi được sử dụng trong văn cảnh ngôn ngữ học hiện đại thường dùng để định danh một cách chặt chẽ hơn lối định nghĩa giản đơn Theo đó, các thuộc tính sau được coi như các thuộc tính bất khả li của một kho ngữ liệu [McEnery & Wilson 2001:29]:
a tính mẫu và tính đại diện;
b kích cỡ nhất định;
c dạng thức máy tính đọc được (cũng gọi là dạng thức điện tử);
d một tham chiếu chuẩn
SỬ DỤNG KHO NGỮ LIỆU
TRONG GIẢNG DẠY TIẾNG VIỆT
PHẠM HIỂN*
* Cán bộ Viện Từ điển học và Bách khoa thư Việt Nam; NCS Khoa Ngôn ngữ học, Đại học Alberta, Canada.
Trang 2XXI
Bài viết này giới thiệu và đề xuất việc sử dụng kho ngữ liệu (corpus) trong việc dạy và học
tiếng Việt qua kinh nghiệm xây dựng, sử dụng và khai thác kho ngữ liệu tiếng Việt cũng như kinh nghiệm rút ra từ việc sử dụng, khai thác và phân tích dữ liệu các kho ngữ liệu tiếng Anh có chất lượng cao trong việc nghiên cứu và giảng dạy ngôn ngữ Bài viết không chỉ tổng kết và trình bày các vấn đề bản chất mang tính lí thuyết của ngôn ngữ học ngữ liệu trong việc giảng dạy ngôn ngữ, mà còn đưa ra các thí dụ minh hoạ cụ thể về việc sử dụng thực tế kho ngữ liệu trong giảng dạy tiếng Việt
2 Lí do sử dụng kho ngữ liệu trong giảng dạy tiếng Việt
Một khó khăn trong việc chuẩn bị và biên soạn tài liệu giảng dạy ngôn ngữ là phải thường xuyên cung cấp cho người học sản phẩm phản ánh chân thực ngôn ngữ đang được sử dụng trong đời sống thật nhất Các bài phê bình về tài liệu dạy tiếng truyền thống đã có lí khi chỉ ra rằng thông tin trong các tài liệu đó về sử dụng ngôn ngữ - đó có thể là thông tin về ngữ pháp, từ vựng hay hội thoại - thường dựa trên những ý kiến chưa được kiểm chứng bằng dữ liệu thực tế hay chỉ dựa trên cảm thức ngôn ngữ của người biên soạn tài liệu Đó nhiều khi là những thông tin thường không chính xác hoặc không thích hợp trong cuộc sống thực của ngôn ngữ Trong lĩnh vực dạy tiếng những năm 80 của thế kỉ XX đã nổi lên một “cuộc cách mạng” về tài liệu nguyên bản nhằm giải quyết vấn đề này bằng cách chủ trương sử dụng nhiều tài liệu gốc hơn, tức là những tài liệu được tạo ra không phải nhằm vào mục đích sử dụng trong lớp học Người ta giải thích rằng các tài liệu này sẽ giúp người học tiếp cận với các ví dụ của ngôn ngữ tự nhiên được lấy từ ngôn cảnh thực tế Gần đây hơn, với sự phát triển nhanh chóng của ngôn ngữ học ngữ liệu, việc xây dựng và
ứng dụng thành công nhiều cơ sở dữ liệu quy mô lớn hay các kho ngữ liệu (corpora) gồm các thể
loại ngôn ngữ gốc khác nhau đã mang lại một cách tiếp cận xa hơn đó là cung cấp cho người học các tài liệu giảng dạy phản ánh cách sử dụng ngôn ngữ thực [Sinclair & Renouf:1988]
Ngôn ngữ học ngữ liệu cho phép người dạy và người học tiếng tự tin rằng ngôn ngữ họ đang dạy và học là ngôn ngữ tự nhiên mà họ gặp ở ngoài lớp học - tức là ngôn ngữ trong đời sống thực của nó Chính ngôn ngữ học ngữ liệu sẽ cung cấp phương tiện cho giáo viên mang ngôn ngữ tự nhiên vào lớp học bằng cách hướng dẫn người học thực hành các hoạt động tương tác với ngôn ngữ thực Bên cạnh lí do được tiếp cận với các văn bản nguyên gốc, nhiều nghiên cứu về tiếp thu ngôn ngữ thứ hai đã chỉ ra rằng khi người học thực sự tham gia vào các hoạt động có ý nghĩa, chẳng hạn như các hoạt động thao tác tìm kiếm trên kho ngữ liệu cho phép họ vận dụng biến hoá ngôn ngữ, thì người học sẽ học được nhiều thông tin hơn, nhớ và lưu giữ thông tin lâu hơn và tốt hơn Ngôn ngữ học ngữ liệu giúp người học tiếng có được những hoạt động có ý nghĩa này Cũng như hầu hết những người bản ngữ nói tiếng khác, người bản ngữ nói tiếng Việt như tiếng mẹ đẻ thường chỉ chú ý đến các dạng thức sử dụng ngôn ngữ mang tính đánh dấu và bất thường hơn là các dạng thức sử dụng mang tính không đánh dấu và điển hình Với tư cách là người biên soạn tài liệu phục vụ việc giảng dạy tiếng Việt, chúng ta có thể ứng dụng nhiều kết quả của ngôn ngữ học ngữ liệu để khắc phục những khiếm khuyết trên bởi lẽ ngôn ngữ học ngữ liệu có thể cung cấp các thông tin sử dụng ngôn ngữ trong đời sống thực của nó Những thông tin này có thể sử dụng để xây dựng và phát triển tài liệu giảng dạy ngôn ngữ cũng như dùng để xây dựng các bộ đề kiểm tra khả năng sử dụng ngôn ngữ cho học viên
Hầu hết những người nói thành thạo một ngôn ngữ đều có một cảm thức khá chính xác và chắc chắn về một dạng thức nào đó có đúng ngữ pháp hay không Chẳng hạn, khi nghe “*Tôi ăn
Trang 3XXII NHỮNG VẤN ĐỀ CHUNG
XXII
không cơm” chúng ta biết rằng dạng thức đúng phải là “Tôi không ăn cơm” Tuy nhiên, khi phải trả lời câu hỏi, chẳng hạn như “năm động từ được sử dụng nhiều nhất trong hội thoại là những động từ nào?” thì dường như cảm thức của người bản ngữ lại khó đưa lại một câu trả lời chuẩn xác được Các ứng dụng và tìm kiếm ngữ liệu có thể dễ dàng và nhanh chóng nhận diện và cung cấp các khuôn mẫu hay dạng thức đồng xuất hiện theo các tình huống khác nhau
Trong các kết quả nghiên cứu về giảng dạy ngôn ngữ thứ hai gần đây, các nhà chuyên môn, từ giáo viên đến các chuyên gia khảo thí, đều thường xuyên khẳng định việc dành ưu tiên cho các tài liệu nguyên bản phản ánh ngôn ngữ trong các văn bản tự nhiên hơn là các ví dụ tự đặt ra Trong đó bao gồm các đặc trưng ngôn ngữ học như từ vựng và ngữ pháp dùng trong giảng dạy và kiểm tra [Byrd, 1995] Kho ngữ liệu và các phương pháp của ngôn ngữ học ngữ liệu có thể mang lại một nguồn văn bản tự nhiên, nguyên bản cho việc giảng dạy và học ngôn ngữ
Có thể nhận xét rằng một trong những vấn đề và cũng là chủ đề tranh luận trong việc sử dụng kho ngữ liệu trong giảng dạy ngôn ngữ nói chung và tiếng Việt nói riêng là tính nguyên
bản (authenticity) của tài liệu phục vụ cho việc giảng dạy và học tập ngôn ngữ Rõ ràng việc
thu thập dữ liệu để xây dựng kho ngữ liệu, tức là việc thu thập các ví dụ trong ngôn ngữ như nó vốn được sử dụng trong các văn cảnh tự nhiên là cần thiết nhưng cũng không hề đơn giản do vấp phải các vấn đề về xung đột lợi ích và bản quyền tác giả Các ví dụ trong các kho ngữ liệu cung cấp các khía cạnh và bình diện sử dụng khác nhau và hơn nữa chúng lại độc lập với các nhiệm vụ học tiếng Tức là, các ví dụ này nằm trong các ngữ cảnh nguyên bản của chúng, đa số chúng được soạn ra cho những đối tượng độc giả cụ thể, và thường là không phải ngay từ đầu chúng hướng đến những người học tiếng Do đó, khi người học tiếng được tiếp xúc với các thí
dụ trích rút từ kho ngữ liệu này, họ đang được tiếp cận với nguồn ngôn ngữ thực như nó đang
được sử dụng hàng ngày Chính điều này minh chứng cho cái gọi là tính nguyên bản mà chúng
ta đang tìm hiểu
3 Các phương pháp sử dụng kho ngữ liệu trong lớp dạy tiếng
Việc sử dụng kho ngữ liệu trong lớp dạy tiếng có thể được thực hiện theo một số phương pháp khác nhau Chẳng hạn, có thể tập trung vào các đặc trưng ngôn ngữ học của từng đơn vị hoặc tập trung vào đặc trưng chung của các văn bản hay biến thể ngôn ngữ thuộc cùng một thể loại như văn bản hành chính, văn bản thương mại, hay cũng có thể là các bài diễn thuyết Trong các phần dưới đây chúng tôi sẽ trình bày các phương pháp sử dụng kho ngữ liệu sau: (i) Lập danh sách tần số từ, (ii) Sử dụng dòng chỉ mục ngữ cảnh (concordance), (iii) Sử dụng bảng đồng hiện
từ vựng (collocation), và (iv) Lập khuôn cấu trúc câu
Cùng với các ứng dụng trong giảng dạy ngôn ngữ khác, việc học tiếng với sự trợ giúp của máy tính (CALL) bao gồm cả sử dụng các kho ngữ liệu ngôn ngữ cho phép người học trực tiếp
sử dụng kho ngữ liệu thông qua các bài tập có hướng dẫn hoặc qua các tài liệu được biên soạn
dựa vào các kho ngữ liệu, chẳng hạn như các dòng chỉ mục ngữ cảnh sau: [xem trang XXIII]
Hoạt động trên lớp này thường được biết đến với tên gọi “học hướng dữ liệu” (DDL) [xem thêm Johns 1986, 1991] Johns [2002:108] xem DDL là một quá trình trong đó “cho phép người học tiếng tiếp cận với dữ liệu trực tiếp giống như những người làm nghiên cứu ngôn ngữ học và mỗi học viên là một Sherlock Holmes” Thực tế đây là một phương pháp được nhiều người giảng dạy cũng như học tập ngôn ngữ thường dùng khi họ sử dụng kho ngữ liệu lớn nhất thế giới - mạng Internet, để tìm kiếm các ngữ cảnh thực tế bằng các cỗ máy tìm kiếm hiệu quả
Trang 4XXIII
Hình 1 Chỉ mục ngữ cảnh của từ chúng ta
Một dạng thông tin rất hữu ích cho người dạy và học tiếng là danh sách các từ có tần số sử dụng cao nhất Đây là cơ sở để rút ra danh sách từ cơ bản trong dạy tiếng Ý nghĩa chính của danh sách tần số là khám phá các từ có tần suất sử dụng thường xuyên nhất trong một ngôn ngữ Đối với người dạy và học tiếng, danh sách tần số cho phép họ sử dụng thời gian hiệu quả hơn bằng cách tập trung vào dạy và học các
từ mà học viên dường như chắc chắn sẽ
gặp phải trong đời sống thực Để có được
thông tin danh sách tần số từ, cách duy
nhất là phải dựa vào một kho ngữ liệu tin
cậy Dưới đây là danh sách tần số từ
tiếng Việt, với 2 thông tin từ đầu mục và
tần số thô xuất hiện trong toàn bộ kho
ngữ liệu, dựa trên kho ngữ liệu xấp xỉ
100 triệu từ
Thủ tục để tìm kiếm các ngữ đoạn
đồng xuất hiện chúng tôi sử dụng trong
bài này nhằm để rút ra các chuỗi lặp đi
lặp lại trong kho ngữ liệu là tạo ra các
chuỗi lặp gồm 2, 3, 4, 5, 6 từ sau đó sắp
những 1054607 về 551195 được 996418 ở 526722
Hình 2 Danh sách 20 từ có tần số cao nhất
Trang 5XXIV NHỮNG VẤN ĐỀ CHUNG
XXIV
xếp danh sách này theo tần số từ cao xuống thấp cho toàn bộ kho ngữ liệu xấp xỉ 100 triệu từ Vì
lí do kĩ thuật, một giới hạn tần số được đặt ra để hạn chế số lượng các ngữ đoạn có tần số thấp
Để phục vụ bài viết này, chúng tôi đặt ranh giới này là có tần số xuất hiện tối thiểu 400 lần trong toàn bộ kho ngữ liệu, tức là phải xuất hiện ít nhất 4 lần trên một triệu từ Biber et al., (1999) đặt giới hạn này là 10 lần trên một triệu từ và Cortes [2002; 2008] đặt 20 lần trên một triệu từ
Hình 3 Trích một số ngữ đoạn đồng xuất hiện (5-gram) có tần số cao
Vì sao chúng ta lại nên quan tâm đến các ngữ đoạn? Vì chúng là một chỉ dấu của người bản ngữ Nghiên cứu của Prodromou [2003, 2008] cho rằng lời nói của người bản ngữ có thể được phân biệt với lời nói của người sử dụng tiếng Anh thành công ở trình độ cao qua việc xem xét sự
có mặt hay không của các ngữ đoạn đồng xuất hiện thông dụng Prodromou biện luận rất thuyết
phục rằng các ngữ đoạn cốt lõi như sort of và you know được người nói trong cộng đồng văn hoá
nói tiếng Anh đánh giá là nó phản ánh tính cộng đồng sâu sắc giữa những người bản ngữ mà không phải người học tiếng nào, kể cả ở trình độ cao cấp, cũng có thể sử dụng thành thạo được
4 Biên soạn bài thực hành từ vựng dựa trên kho ngữ liệu
Nghiên cứu kho ngữ liệu có thể đóng một vai trò quan trọng trong việc đánh giá xem chúng ta
có đang dạy cho người học các từ mà họ sẽ cần tới trong đời sống hàng ngày hay không, từ đó chúng ta sẽ phát triển tài liệu dựa trên các kho ngữ liệu như thế nào Kết quả nghiên cứu của Nation [2007], Schmitt [2008] cho biết rằng để đọc một văn bản thành công ta cần phải biết khoảng 97 phần trăm từ trong văn bản đó Cũng từ nghiên cứu việc đọc các nhà nghiên cứu kết luận rằng khả năng đọc thạo và vốn từ vựng có liên quan chặt chẽ với nhau và có mối quan hệ qua lại Càng đọc nhiều thì càng học được nhiều từ vựng mới, và càng biết nhiều từ vựng thì đọc càng thuận lợi [Grabe 2009; Grabe & Stoller 2002] Chính thông tin này về nhu cầu đọc văn bản học thuật khẳng định thêm vai trò quan trọng của việc giảng dạy và hướng dẫn học từ vựng trong khi dạy tiếng
Nhờ có các nghiên cứu ngữ liệu chúng ta biết rằng việc đọc học thuật chủ yếu dựa vào danh
từ Dữ liệu từ kho ngữ liệu các văn bản học thuật cho thấy tỉ lệ danh từ cao hơn động từ nhiều Ngược lại, trong hội thoại hàng ngày, thậm chí cả trong các bài giảng học thuật trên lớp, việc sử dụng động từ và danh từ phân bố khá đều đặn [Biber 2006] Giáo viên có thể sử dụng thông tin này để thiết kế tài liệu bổ sung từ vựng đáp ứng tốt hơn nhu cầu của từng học viên Như vậy, tuy không loại bỏ việc học động từ, nhưng chúng ta nên chú trọng việc học danh từ trong phần hướng
tất cả những cái đó
tôi không hiểu tại sao
là một trong những người
không còn nghi ngờ gì
cho tất cả mọi người
những gì đã xảy ra
không còn cách nào khác
không bao giờ quên được
với tất cả mọi người
không thể nào quên được
ngày này qua ngày khác không thể tưởng tượng được không biết phải làm gì không biết làm thế nào không bao giờ trở lại tôi có cảm giác như như không có chuyện gì không biết bao nhiêu là muốn làm gì thì làm làm sao tôi có thể
không biết bao nhiêu lần chuyện gì đã xảy ra Đây là lần đầu tiên không bao giờ có thể
là lần đầu tiên tôi sinh ra và lớn lên tất cả mọi người đều
có một cái gì đó đây là lần đầu tiên lần đầu tiên trong đời
Trang 6XXV
dẫn từ vựng, bao gồm cả việc tiếp thu danh từ và cấu tạo danh từ, cho các học viên có nhu cầu
theo học đại học hoặc làm công việc nghiên cứu Chẳng hạn, qua việc hướng dẫn học viên tìm
hiểu nhóm các từ kết hợp với hai từ “việc” và “sự” vốn thường kết hợp trước động từ hoặc tính từ
để biến chúng thành danh từ trong tiếng Việt có thể gợi ý cho học viên khám phá cách sử dụng từ
ngữ trong thực hành tiếng Việt
5 Biên soạn bài thực hành ngữ pháp dựa trên kho ngữ liệu
Trên đây chúng ta đã thảo luận về các chứng cứ ngữ liệu sử dụng trong việc đưa ra các đặc
trưng và khuôn mẫu từ vựng vốn khó có thể nhận ra nếu chỉ dựa vào cảm thức ngôn ngữ
Trong phần này chúng ta sẽ tìm hiểu sâu thêm một bước đó là xem xét lối các từ kết hợp với
nhau để tạo thành các khuôn ngữ pháp riêng biệt qua việc chuẩn bị một bài thực hành ngữ pháp
dựa trên kho ngữ liệu
việc sự từ kết hợp sau từ kết hợp trước việc sự
Hình 4 Bảng các từ kết hợp sau và trước việc và sự với thông tin tần số xuất hiện
Trang 7XXVI NHỮNG VẤN ĐỀ CHUNG
XXVI
Một kho ngữ liệu có thể cho chúng ta biết nhiều điều khác nhau về ngữ pháp Nó có thể mở
rộng hiểu biết của chúng ta về các khái niệm và phạm trù ngữ pháp truyền thống, cụ thể là cung
cấp cho chúng ta nhiều thông tin hơn về sự phân bố các phạm trù này.
Một kho ngữ liệu có thể chỉ ra mối quan hệ quan trọng giữa ngữ pháp và từ vựng [xem Sinclair
1990; 1996; 1998] Một kho ngữ liệu cũng có thể cung cấp nhiều thông tin về một dạng thức quan
trọng và các khuôn ngữ nghĩa và từ vựng - ngữ pháp liên hệ với hình thức của nó Dưới đây
chúng tôi thử khám phá một trong những “kì quan” của tiếng Việt đó là tìm kiếm các chuỗi động
từ kết hợp với nhau trong cách sử dụng ngôn ngữ thực tế Kinh nghiệm giảng dạy cho thấy đây là
vấn đề gây nhiều bối rối cho học viên cấp cơ sở, nhưng có thể lại mang nhiều cảm hứng học tập
và khám phá cho học viên trình độ trung và cao cấp Có thể cần nhiều thảo luận về khái niệm
“động từ”, nhưng ở đây chúng tôi tạm lấy nền tảng giáo khoa dạy tiếng cũng như từ điển tiếng
Việt tiêu chuẩn để xác định các chuỗi bao gồm 5 động từ đi liền nhau trong tiếng Việt Thực tế
kết hợp với cái tần số kết hợp với con tần số kết hợp với chiếc tần số
Hình 5 Phân bố của các từ đi sau cái, con, chiếc với thông tin tần số xuất hiện
Trang 8XXVII
khi tìm hiểu, chúng tôi ghi nhận chuỗi động từ có con số cao hơn như vậy nhưng không có điều kiện trình bày ở đây
Hình 6 Một số thí dụ câu có kết cấu chuỗi 5 động từ đi liền nhau
6 Một vài hoạt động trên lớp sử dụng kho ngữ liệu
Phần này trình bày một số thí dụ hoạt động sử dụng hoặc khai thác dữ liệu từ kho ngữ liệu trong lớp học tiếng Các hoạt động có thể điều chỉnh để phù hợp với trình độ của học viên Người dạy có thể cải tiến, nâng cao nhằm đáp ứng được các mục tiêu giảng dạy của mình
Hoạt động 1 Nhận diện nghĩa và cách sử dụng qua ngữ cảnh: Hoạt động này có thể áp dụng
cho các phần dạy đọc và phần từ vựng cho học viên các trình độ khác nhau
Bước 1: Đề nghị học viên lấy 10 bài báo và tạo thành một kho ngữ liệu nhỏ của riêng
mình Sau đó chạy chương trình tìm kiếm các dòng chỉ mục ngữ cảnh
Bước 2: Cho học viên đọc các chỉ mục ngữ cảnh đó và đoán nghĩa của từ Sau đó gộp
nhóm các dòng chỉ mục có cùng nghĩa lại với nhau
Bước 3: Đặt câu với các từ vừa học được
Hoạt động 2 Tìm hiểu tần số sử dụng của từ
Bước 1: Cho học viên nhập 10 bài báo trên vào chương trình và tạo bảng danh sách tần số
của các từ sắp xếp theo trật tự ABC và sắp xếp theo tần số từ cao xuống xuống thấp
Bước 2: Đề nghị học viên đọc qua danh sách tần số trên và viết lại các từ không biết hoặc
không quen Xem các từ mình không biết nằm ở nửa trên hay nửa dưới của danh sách tần
số trên
Chú ý: Có thể thực hiện cả hai hoạt động 1 và 2 đồng thời Khi học viên nhận thấy từ mới
không biết nghĩa ở trong Hoạt động 2 thì có thể chuyển qua Hoạt động 1 để đoán nghĩa từ trong
ngữ cảnh
Trang 9XXVIII NHỮNG VẤN ĐỀ CHUNG
XXVIII
Hoạt động 3 Từ vựng trong các thể loại ngữ vực khác nhau: Hoạt động này yêu cầu học viên
hoặc giáo viên chuẩn bị trước các văn bản học thuật và các văn bản hội thoại (có thể lấy từ các cuộc hội thoại hàng ngày hay trên lớp)
Bước 1: Chia lớp thành 2 nhóm Đề nghị các học viên nhóm thứ nhất nhập 10 văn bản học
thuật và các học viên nhóm còn lại nhập 10 văn bản hội thoại vào chương trình Các học viên có thể chọn các văn bản khác nhau trong cùng thể loại được giao
Bước 2: Cho học viên tạo các danh sách tần số từ các văn bản mà họ đã chọn và sắp xếp
theo trật tự tần số, tức là các từ có tần số cao nhất sẽ đứng đầu danh sách
Bước 3: Đề nghị học viên viết 10 từ cho mỗi loại từ loại như danh từ, động từ, và tính từ Bước 4: Cho các học viên so sánh danh sách của họ với danh sách của các học viên khác
cùng nhóm xem có những từ nào trùng nhau và không trùng nhau Sau đó tập hợp lại thành một danh sách chung gồm 10 từ có tần số cao nhất trong toàn bộ nhóm, cũng theo từ loại
Bước 5: Cho học viên so sánh với các học viên khác thuộc nhóm còn lại, tức là nhóm học
viên chọn các văn bản thuộc các ngữ vực khác Thảo luận về sự khác nhau của danh sách
từ cùng nhóm và khác nhóm Tìm những từ nào giống nhau trong cả 2 nhóm
[Chú ý: Khi học viên gặp từ mới có thể cho họ làm Hoạt động 1 để đoán nghĩa từ trong ngữ cảnh]
7 Những điểm nên chú ý khi sử dụng kho ngữ liệu trên lớp
Có nhiều cách thức và hoạt động sử dụng kho ngữ liệu trong hoạt động giảng dạy và học tập,
ở trên lớp cũng như ở nhà, đã được nghiên cứu và áp dụng Tuy nhiên, chúng ta cũng cần chú ý tới một số nguyên tắc cơ bản dùng để xây dựng và phát triển tài liệu và các hoạt động giảng dạy tiếng Việt dựa trên ngữ liệu Reppen (2010, p 43) đã đề xuất một vài hướng dẫn chung cho việc
sử dụng kho ngữ liệu như những gợi ý ban đầu như sau:
- Có ý tưởng rõ ràng về chủ điểm muốn dạy;
- Chọn kho ngữ liệu phù hợp nhất cho bài giảng của mình;
- Khám phá toàn bộ, thấu đáo kho ngữ liệu phục vụ cho chủ điểm muốn dạy;
- Đảm bảo rằng các hướng đi là hoàn thiện và dễ thực hiện;
- Đảm bảo rằng các thí dụ tập trung vào chủ điểm muốn dạy;
- Cung cấp nhiều cách tương tác với tài liệu;
- Sử dụng nhiều dạng bài tập;
- Nếu sử dụng máy tính, nên có kế hoạch hoặc hoạt động thay thế trong trường hợp máy tính có vấn đề Chẳng hạn, có thể in trước một số danh sách tần số, chỉ mục ngữ cảnh, hoặc danh sách từ đồng hiện để cung cấp cho học viên trong trường hợp điều kiện kĩ thuật không cho phép ở lớp học
8 Kết luận
Khi sử dụng ngôn ngữ học ngữ liệu, hay cụ thể hơn là đưa các chứng cứ từ kho ngữ liệu vào lớp học tiếng, có lẽ cần xác định rõ vai trò kép của ngôn ngữ học ngữ liệu, đó là nó vừa là vấn đề cải tiến về mặt phương pháp, vừa là một vấn đề mang tính lí thuyết Kết hợp lại là một phương pháp giảng dạy mới Nhìn từ góc độ lí thuyết, việc diễn giải các cứ liệu ngôn ngữ quan sát được
Trang 10XXIX
sẽ dẫn tới định nghĩa mới về một đơn vị mang nghĩa mà vốn khó hoặc không thể nhận diện và quan sát được cụ thể bằng các phạm trù miêu tả truyền thống Từ góc độ phương pháp, định
nghĩa và đánh giá cho các đơn vị này trong khi tiến hành các hoạt động trên lớp sẽ mang lại cách
tiếp cận giao tiếp thực sự trong quá trình giảng dạy Như vậy, nhiệm vụ nhận diện các quy luật
sử dụng ngôn ngữ trở thành hiện thực cho cả học viên lẫn giáo viên
Trong môi trường lớp học, phương pháp của ngôn ngữ học ngữ liệu thích hợp cho học viên ở các trình độ khác nhau vì đây là cách học đi từ dưới lên (bottom-up) của ngôn ngữ, tức là những kinh nghiệm học được dù rất nhỏ để bắt đầu thực hành, và học viên sẽ tiến bộ nhanh hơn qua việc quan sát và thực hành
Những điều chúng ta đã xem xét ở trên chỉ ra rằng những hiểu biết mà học viên có thể rút ra được từ kho ngữ liệu có thể khác về chất so với những miêu tả trong các sách ngữ pháp nhà trường truyền thống Qua trang chỉ mục ngữ cảnh, việc nhận ra chức năng của một đơn vị và áp dụng nó trong thực tế sử dụng ngôn ngữ trở nên khá dễ dàng đối với giáo viên và học viên Tognini-Bonelli [2001:41] đã gọi các đơn vị mang nghĩa mới vốn được tạo ra bằng sự liên kết chặt chẽ giữa các khuôn từ vựng và ngữ pháp là “các khuynh hướng mới cho miêu tả ngôn ngữ học” Do đó, nếu chúng ta muốn dạy cho học viên giao tiếp theo cách tiếp cận mới này trong sử dụng ngôn ngữ thì chúng ta phải đưa ngữ liệu vào lớp học1.
THƯ MỤC THAM KHẢO
[1] Biber, D (1999) Longman grammar of spoken and written English New York: Longman
[2] Biber, D (2006) University language : a corpus-based study of spoken and written registers
Amsterdam ; Philadelphia: J Benjamins
[3] Byrd, P E (1995) Material Writer's Guide: Heinle & Heinle Publishers, International Thomson
Publishing Book Distribution Center, 7625 Empire Drive, Florence, KY 41042
[4] Cortes, V (2002) Lexical bundles in freshman composition In R Reppen, S Fitzmaurice & D
Biber (Eds.), Using Corpora to Explore Linguistic Variation (pp 131-145) Amsterdam: John
Benjamins
[5] Cortes, V (2008) A comparative analysis of lexical bundles in academic history writing in
English and Spanish Corpora, 3(1), 43-57
[6] Grabe, W (2009) Reading in a second language : Moving from theory to practice Cambridge ;
New York: Cambridge University Press
[7] Grabe, W., & Stoller, F L (2002) Teaching and researching reading Harlow: Longman
[8] Hunston, S (2002) Corpora in applied linguistics Cambridge, England ; New York: Cambridge
University Press
[9] Johns, T (1986) Micro-concord: A language learner's research tool System, 14(2), 151-162 doi:
Doi: 10.1016/0346-251x(86)90004-7
[10] Johns, T (1991) From printout to handout: Grammar and vocabulary learning in the context of
data-driven learning English Language Research Journal 4, 27-45
⇛ (Xem tiếp trang 54)
1 Bài viết này đã gửi tham gia Hội thảo Quốc tế: “Nghiên cứu và giảng dạy tiếng Việt lần thứ nhất” được tổ chức ngày 27-2-2011