6. Cấu trúc của luận án
1.2. Cơ sở lý luận của luận án
1.2.2. Kho ngữ liệu giáo khoa
1.2.2.1. Khái niệm KNL giáo khoa
KNL giáo khoa (Textbook Corpora) được xác lập trên cơ sở “tập hợp ngữ liệu từ sách giáo khoa” (Gabrielatos, 2005: 5). Do tính chất của ngữ liệu sách giáo khoa, các KNL này đại diện cho phần ngôn ngữ tiếp nhận quan trọng mà người học
tiếp thu trong quá trình học tập. Đồng thời, xét về phương diện văn bản, chúng đại
diện cho kết cấu và ngôn ngữ chuẩn mực được sử dụng trong nhà trường. Do đó, các KNL giáo khoa đặc biệt phù hợp trong nghiên cứu giảng dạy tiếng Anh như một
ngoại ngữ trong môi trường phi bản ngữ. Chúng cũng được sử dụng để nghiên cứu
nội dung ngôn ngữ trong sách giáo khoa hay thiết kế sách giáo khoa nhưng phạm vi
phân tích chỉ giới hạn trong tư liệu được xác định trong tập hợp mục tiêu.
Do đó, có thể nói KNL giáo khoa (Textbook Corpora) là KNL được xây dựng
từ tập hợp ngữ liệu văn bản là sách và tài liệu giảng dạy trong một hay nhiều lĩnh
vực, đại diện cho sách giáo khoa được sử dụng trong lĩnh vực ấy. KNL giáo khoa được lưu trữ và xử lý dưới dạng điện tử, đáp ứng các tiêu chí thiết kế phù hợp với
mục đích nghiên cứu và được dùng làm cơ sở cho các nghiên cứu định lượng và
định tính về ngôn ngữ trong dạy và học tiếng.
KNL giáo khoa tập hợp ngữ liệu từ sách giáo khoa phân biệt với KNL giáo
khoa có tập hợp ngữ liệu ngoài sách giáo khoa nhưng được sử dụng cho mục đích xây dựng sách giáo khoa.
KNL dùng để xây dựng sách giáo khoa chú trọng đến các kết quả phân tích ngôn ngữ hướng tới thiết kế nội dung sách giáo khoa. Chúng không hạn chế ngôn ngữ trong phạm vi tư liệu giáo khoa mà có thể sử dụng ngôn ngữ tự nhiên hoặc ngôn ngữ người học, cả bút ngữ lẫn khẩu ngữ, để phục vụ mục đích tái hiện ngôn ngữ thực trong sách giáo khoavà tư liệu học tập. Với các thông tin về kiến thức gần
gũi với người học, bổ sung kiến thức trên những phương diện mà người học thường
mắc lỗi, đưa ra các ví dụ chân thực mà người học thường sử dụng, các KNL dành
nhiên, chính xác và cập nhật với việc lựa chọn các từ và cụm từ thông dụng nhất
cho từng chủ đề hay trình độ. Trong số những KNL dành cho thiết kế sách giáo
khoa, cần kể đển các KNL từ ngôn ngữ tự nhiên như Collins (1987), Cambridge English Corpus (2000s), Oxford English Corpus (2000s), hay các KNL từ ngôn ngữ người học như KNL quốc tế dành cho người học tiếng Anh (International Corpus of Learner English - ICLE) (Granger, 1990), KNL dành cho người học của Đại học
Cambridge (Cambridge Learner Corpus – CLC), KNL dành cho người học của
Longman (Longman Learners’ Corpus– LLC). Các KNL này có ảnh hưởng to lớn đến sự phát triển không ngừng của các sản phẩm tư liệu giáo khoa có uy tín của
Cambridge, Oxford, Collins Cobuild, Longmantừ trước đến nay.
KNL giáo khoa cũng phân biệt với các KNL chuyên phân tích phần mềm xử lý ngôn ngữ phục vụ thiết kế giáo khoa. Mặc dù cũng hướng tới sách giáo khoa nhưng chúng chú trọng đến cách thức, qui trình thu thập ngữ liệu, phương pháp đánh dấu, phân loại các nhóm tư liệu khác nhau sao cho phù hợp để truy xuất các
đặc điểm ngôn ngữ cho từng thiết kế, biên soạn nội dung theo tỉ lệ từ vựng, kỹ năng, hay ngữ pháp phù hợp với sách giáo khoa. Do đó, KNL giáo khoa đi theo hướng phần mềm chú giải tập trung vào đánh dấu và chú giải văn bản. Chúng sử
dụng nhiều kiểu đuôi (tag) và đánh dấu đa dạng theo các tầng. Chúng được phát triển gần đây trong xây dựng KNL TeMa hoặc Dự án EU LLP Backbone (2009- 2011)của Kurt Kohn thuộc Trường Đại học Tübingen của Đức(Kohn, 2013).
1.2.2.2. Cấu tạo KNL giáo khoa
Nhìn chung, các KNL giáo khoa đều được xây dựng đáp ứng mục tiêu nghiên cứu khá cụ thể ở một ngành, một lĩnh vực hoặc một nhóm chuyên ngành gần để tìm hiểu đặc điểm nổi bật hay tương đồng về ngôn ngữ. Lấy tập hợp ngôn ngữ là
sách và tư liệu giáo khoa, các Kho ngữ liệu giáo khoa đa dạng nhờ vào hướng chú giải và phân tích ngữ liệu khác nhau, phục vụ các mục tiêu nghiên cứu đa dạng
Với tính chất của một sản phẩm liên ngành, KNL giáo khoa kết hợp ba yếu
tố ngôn ngữ, công nghệ xử lý ngôn ngữ, các phân tích định lượng và định tính trong
giáo dục. Bên cạnh yếu tố ngôn ngữ, các tham số chú giải như chú giải từ loại, cấu
trúc cú pháp, dạng văn bản kết hợp với cácphân tíchđa dạng về từ vựng, ngữ pháp,
thiết kế văn bản, thể loại ngôn ngữ, siêu ngôn ngữ, hay tính toán định lượng kiến
thức (từ vựng, ngữ pháp, ngữ âm) không chỉ đáp ứng mục tiêu giảng dạy, thiết kế sách giáo khoa mà còn mang lại kết quả trong nghiên cứu ngôn ngữ, ngữ pháp,
phong cách, dạng văn bản. Ngay cả khi một KNL giáo khoa đã xácđịnh tập hợp
mục tiêu và xây dựng trên ngữ liệu cố định thì các tham số còn lại như công nghệ
chú giải và phân tích vẫn có thể thay đổi. Sự tương tác giữa các tham số thành lập,
sự linh hoạt trong áp dụng công nghệ xử lý hay các hướng phân tích ngữ liệu mang
lại các kết quả nghiên cứu trên những phương diện khác nhau. Hình 1.2. thể hiện sự đa dạng trong nghiên cứu KNL giáo khoa dưới tác động của tham số chú giải và
hướng phân tích.
Hình 1.2. Các tham số trong thiết kế KNL giáo khoa
Nói tóm lại, một KNL giáo khoa có thể giải quyết nhiều vấn đềvề đặc trưng kết cấu và nội dung ngôn ngữ trong phạm vi sách giáo khoavà giáo trình dạy tiếng như:
Kho ngữ liệu giáo khoa
Tập hợp ngữliệu Chú giải Phân tích
Sách giáo khoa Ngữ liệu văn bản Định lượng từ vựng
Từ loại Ngữ pháp Ngữ dụng Ngữ âm Ngữ pháp …. ……
+Nghiên cứu ngôn ngữ trong sách giáo khoa, tìm hiểu nghĩa ngữ cảnh, cách
sử dụng ngôn ngữ trong các loại bài tập kỹ năng, ngôn ngữ nói, viết, siêu ngôn
ngữ,...
+ Nghiên cứu từ vựng trên góc độ dạy và học tiếng gồm nghiên cứu vốn từ,
tần số sử dụng từ vựng, loại từ và phân bố loại từ, các kết hợp từ (collocation),
chuỗi đồng hiện(lexical bundles), hiện tượng đồng tự,đồng âm.
+ Nghiên cứu ngữ pháp trong sách giáo khoa: phân bố ngữ pháp, tần số sử dụng một số hiện tượng ngữ pháp đặc trưng.
+ Nghiên cứu kết cấu của sách giáo khoa như các dạng bài tập kỹ năng,tỉ lệ
vàphân bố các dạng bài trong sách giáo khoa.
Trong quá trình nghiên cứu, cho dù ngữ liệu không thay đổi, các tham số chú
giải và phân tích vẫn có thể biến đổi để đa dạng hóa mục đích nghiên cứu của KNL giáo khoa hay đa dạng hóa các nghiên cứu trên KNL giáo khoa.