Định lượng vốn từ cơ bản trong KNL TESoC

Một phần của tài liệu (LUẬN văn THẠC sĩ) nghiên cứu xây dựng kho ngữ liệu giáo khoa tiếng anh chuyên ngành xã hội học (Trang 103 - 107)

6. Cấu trúc của luận án

3.2.1. Định lượng vốn từ cơ bản trong KNL TESoC

3.2.1.1.Định lượng từ bị loại trong KNL TESoC

Một trong những chỉ số quan trọng phản ánh khả năng của người học để đạt được thành công trong học thuật là lượng từ (Goulden, 1990:342). Mặc dù KNL

TESoC được xây dựng trên cơ sở ngữ liệu mục tiêu mà sinh viên có thể tiếp cận nhưng mức độ sử dụng các đơn vị từ vựng trong KNL không như nhau. Xét từ nhiều góc độ, việc thu gọn lượng từ để có cái nhìn tổng thể về kiến thức từ vựng ở mỗi trình độ là rất cần thiết.

Mặc dù việc quyết định đâu là vốn từ cơ bản chủ yếu dựa vào yêu cầu học

tập (Goulden, 1990: 343-44), nhưng nhiều nghiên cứu về từ vựng cho thấy tính thường xuyên được coi là điều kiện tiên quyết trong quyết định vốn từ của người

học (Nation, 1990; Nation & Hirsh, 1992; Warring, 1997; Chung, 2003). Trong luận án, vấn đề này được xem xét từ hai phương diệ n: thường xuyên với tư cách là

kiến thức chung hay thường xuyên với tư cách là từ vựng trong học tiếng.

Trong KNL TESoC nói riêng và tư liệu học tiếng nói chung, các từ viết tắt, tên riêng, tên địa danh, tiền tố, hậu tố,... chiếm tỉ lệ không nhỏ. Chúng thiên về kiến

thức chung hơn là từ vựng của người học ngôn ngữ. Chẳng hạn, với tên viết tắt của

các quốc gia, tổ chức, không nhất thiết chỉ người học ngoại ngữ mới có thể biết. Tương tự với tên người, địa danh, các chức danh, các con số, hay các từ cảm thán cũng vậy. Do đó, các đơn vị từ vựng này được đặt ra ngoài vốn từ vựng tiếng Anh cơ bản mà KNL TESoC phân tích và nằm trong danh sách từ bị loại (Stoplist).

Từ phương diện tính thường xuyên của từ vựng học tiếng, các yếu tố như từ

ngoại lai, từ cổ, hoặc các hình thức phiên âm của từ,...không xuất hiện thường xuyên. Do đó, trong phân tích KNL TESoC, các từ này cũng được đưa vào danh

sách từ bị loại.

Nói tóm lại, trong KNL TESoC,các từ trong Danh sách từ bị loại được xác định bao gồm:

+ Các từ là tên viết tắt của quốc gia, tổ chức, tên khoa học: US, USSR, BBC, IBM, SAT, DNA,...

+ Các từ là tên riêng như tên người, tên địa danh như: Allie, Mark, George,

Rio de Janeiro, Roma,...

+ Các từ được viết ở dạng rút gọn theo qui ước như she’s, they’re, I’ve, I’d,

Mr, Mrs, Dr, Prof, OK, Hi,...

+ Các số đếm, số thứ tự, số điện thoại hay số năm như: 1, 2, 3, ...1st, 2nd, 3rd, 4th, 1950s,...

+ Các từ ngoại lai như: au revoir, merci,...

+Các từ cảm thán: oh, yeah,...

+Từ cổ hoặc các hình thức phiên âm như: husbonda, /haus/,...

Trên cơ sở Danh sách từ bị loại, chúng tôi thống kê số lượng từ không nằm

trong vốn từ cơ bản (Bảng 3.1). Thống kê cho thấysố lượng trong danh sách từ bị

loại chiếm một phần đáng kể, khoảng 6% trên toàn KNL TESoC. Ở giai đoạn cơ sở,

các yếu tố này chiếm tỉ lệ khá cao (từ 7,5-8,79%). Chúng làm phong phú thêm cho ngữ liệu của các giáo trình tiếng Anh giai đoạn cơ sở trong khi lượng từ cần học

trong các giáo trình này không nhiều. Ở SGK giai đoạn chuyên ngành, các yếu tố

trongDanh sách từ bị loại giảm hẳn. Số lượng từ trong vốn từ cơ bảncũng tăng lên đáng kể.

Bảng 3.1. Định lượng từ bị loại vàvốn từ cơ bảntheo hiện dạng Tổng hiện dạng Từ bị loại Vốn từ cơ bản Tỉ lệ giảm KNL cơ sở 1 68478 6020 62458 8,79% KNL cơ sở 2 92410 7413 84997 8,02% KNL cơ sở 3 108169 8119 100049 7,50% KNL chuyên ngành 1 121268 5365 115903 4,42% KNL chuyên ngành 2 137083 3808 133275 2,78%

Định lượng từ bị loại trong KNL TESoC giúp tính được vốn từ cơ bản thực

tế mà người học cần tiếp thu trong quá trình thụ đắc ngôn ngữ chuyên ngành. Thay vào số lượng 527.408 hiện dạng ban đầu trong KNL giáo khoa TESoC, số lượng

hiện dạng trong vốn từ cơ bản cần xử lý chỉ còn 496.682 hiện dạng. Tuy nhiên, nếu

chỉ xem xét số lượng hiện dạng trong KNL sẽ không thể xác định rõ ràng lượng từ

vựng thực sự trong chương trình sách giáo khoa. Do đó, chúng tôi tiến hành định lượng vốn từ cơ bản bằng một đơn vị “gọn nhẹ hơn”, đó là tổ từ.

3.2.1.2.Định lượng tổ từtrong vốn từ cơ bản

Như trên đã nói, hiện dạng không phản ánh lượng từ vựng mà người học cần tiếp thu. Trong một tập hợp văn bản,sự có mặt liên tục của một kiểu từ hay một từ hình không làm tăng số lượng từ mà người học cần bỏ công sức để nhận diện hay sử dụng. Nghiên cứu về tổ từ và phạm vi hoạt động của tổ từ trong tiếng Anh cho thấy

việc định lượng từ vựng bằng tổ từ mang đến cho người học một bức tranh thu nhỏ

về vốn từ cần dùng trong một phạm vi học tập. Các tổ từ bao gồm tổ từ chức năng

(functional words) hay còn gọi làhư từ (gồm đại từ, trợ động từ, giới từ, mạo từ,...; và các tổ từ từ nội dung (content words) còn gọi là thực từ (gồm danh từ, động từ,

Các tổ từ chức năng (hư từ)khôngđược tạo thành bởi nhiều từ hình và trong nhiều trường hợp, chúng có dạng đơn nhất, nhưng sự có mặt của chúng trong văn bản vẫn nằm trong vốn từ cơ bản mà người học cần biết. Mặc dầu vậy, sự lặp lại

quá thường xuyên của các tổ từ chức năng trong cácvăn bản khiến chúng nhiều khi được coi như các yếu tố đương nhiên. Một số nghiên cứu từ vựng sử dụng phần mềm phân tích của Heatley, Nation & Coxhead (2002), Tom Cobb (2013), các tổ từ này được xếp thành nhóm riêng,tách khỏi cáctổ từ nội dung(phụ lục 6).

Thống kê từ KNL TESoC cho thấy sự khác biệt rất lớn giữa vốn từ cơ bản

tính theo hiện dạng và tính theo tổ từ. Trong số 496.682 hiện dạng nằm trong vốn từ cơ bản của KNL TESoC, tổ từ thực tế chỉ chiếm 3,1% (15.792 tổ từ). 97% hiện

dạng còn lại thể hiện mức độ sử dụng nhiều hay ít của mỗi tổ từ thông qua số lần

xuất hiện của chúng trong văn bản.

Bảng 3.2. Tương quan giữa hiện dạng và tổ từ

Vốn từ cơ bản (hiện dạng) Vốn từ cơ bản (tổ từ) Tỉ lệ giữa tổ từ và hiện dạng Ngữ liệu cơ sở 1 62458 1699 2.72% Ngữ liệu cơ sở 2 84997 2206 2.60% Ngữ liệu cơ sở 3 100049 2785 2.78% NL chuyên ngành 1 115903 4347 3.75% NL chuyên ngành 2 133275 4755 3.57% 0 20000 40000 60000 80000 100000 120000 140000 NL cơ sở 1 NL cơ sở 2 NL cơ sở 3 Chuyên ngành 1 Chuyên ngành 2 Số tổ từ Số hiện dạng

Tỉ lệ giữa hiện dạng và từ tổ trong KNL TESoC cho thấy số lượng dạng từ và từ hình trong ngữ liệugiai đoạn chuyên ngành cao hơn hẳn so với SGK cơ sở. Tỉ

lệ tăng 0,85% (từ 2,72% - 3.57%) (Hình 3.2) cũng chứng tỏ độ phong phú về số lượng tổ từ trong SGK giai đoạn chuyên ngành cao hơn hẳn so với SGK giai đoạn cơ sở. Mức độ tăng gấp rưỡi số lượng tổ từtrong giáo trình giaiđoạn chuyên ngành

đòi hỏi sự đáp ứng cao hơn của người học trong tiếp thu vốn từ.

Số tổ từ 0 500 1000 1500 2000 2500 3000 3500 4000 4500 5000 NL cơ sở 1 NL cơ sở 2 NL cơ sở 3 NL chuyên ngành 1 NL chuyên ngành 2 Số tổ từ

Hình 3.2. Mức độ tăng tổ từ giai đoạn cơ sở và chuyên ngành

Trong điều kiện năng lực cũng như khả năng tiếp thu của người học ít thay đổi, việc tăng hẳn tỉ lệ đa dạng về từ vựng,đồng thời giảm đáng kể độ lặp từ trong SGK giai đoạn chuyên ngành có thể gây khó khăn, thậm chí áp lực cho sinh viên

trong tiếp thu kiến thức. Để giải quyết vấn đề về chênh lệch kiến thức từ vựng,việc xác định vốn từ trọng tâm là phương án ưu việt bởi nó vừa giúp người học tiếp thu

kiến thức vừa đảm bảo nội dung cơ bản cần học.

Một phần của tài liệu (LUẬN văn THẠC sĩ) nghiên cứu xây dựng kho ngữ liệu giáo khoa tiếng anh chuyên ngành xã hội học (Trang 103 - 107)

Tải bản đầy đủ (PDF)

(179 trang)