Kho ngữ liệu giáo khoa

Một phần của tài liệu (LUẬN văn THẠC sĩ) nghiên cứu xây dựng kho ngữ liệu giáo khoa tiếng anh chuyên ngành xã hội học (Trang 44 - 47)

6. Cấu trúc của luận án

1.2. Cơ sở lý luận của luận án

1.2.2. Kho ngữ liệu giáo khoa

1.2.2.1. Khái niệm KNL giáo khoa

KNL giáo khoa (Textbook Corpora) được xác lập trên cơ sở “tập hợp ngữ liệu từ sách giáo khoa” (Gabrielatos, 2005: 5). Do tính chất của ngữ liệu sách giáo khoa, các KNL này đại diện cho phần ngôn ngữ tiếp nhận quan trọng mà người học

tiếp thu trong quá trình học tập. Đồng thời, xét về phương diện văn bản, chúng đại

diện cho kết cấu và ngôn ngữ chuẩn mực được sử dụng trong nhà trường. Do đó, các KNL giáo khoa đặc biệt phù hợp trong nghiên cứu giảng dạy tiếng Anh như một

ngoại ngữ trong môi trường phi bản ngữ. Chúng cũng được sử dụng để nghiên cứu

nội dung ngôn ngữ trong sách giáo khoa hay thiết kế sách giáo khoa nhưng phạm vi

phân tích chỉ giới hạn trong tư liệu được xác định trong tập hợp mục tiêu.

Do đó, có thể nói KNL giáo khoa (Textbook Corpora) là KNL được xây dựng

từ tập hợp ngữ liệu văn bản là sách và tài liệu giảng dạy trong một hay nhiều lĩnh

vực, đại diện cho sách giáo khoa được sử dụng trong lĩnh vực ấy. KNL giáo khoa được lưu trữ và xử lý dưới dạng điện tử, đáp ứng các tiêu chí thiết kế phù hợp với

mục đích nghiên cứu và được dùng làm cơ sở cho các nghiên cứu định lượng và

định tính về ngôn ngữ trong dạy và học tiếng.

KNL giáo khoa tập hợp ngữ liệu từ sách giáo khoa phân biệt với KNL giáo

khoa có tập hợp ngữ liệu ngoài sách giáo khoa nhưng được sử dụng cho mục đích xây dựng sách giáo khoa.

KNL dùng để xây dựng sách giáo khoa chú trọng đến các kết quả phân tích ngôn ngữ hướng tới thiết kế nội dung sách giáo khoa. Chúng không hạn chế ngôn ngữ trong phạm vi tư liệu giáo khoa mà có thể sử dụng ngôn ngữ tự nhiên hoặc ngôn ngữ người học, cả bút ngữ lẫn khẩu ngữ, để phục vụ mục đích tái hiện ngôn ngữ thực trong sách giáo khoavà tư liệu học tập. Với các thông tin về kiến thức gần

gũi với người học, bổ sung kiến thức trên những phương diện mà người học thường

mắc lỗi, đưa ra các ví dụ chân thực mà người học thường sử dụng, các KNL dành

nhiên, chính xác và cập nhật với việc lựa chọn các từ và cụm từ thông dụng nhất

cho từng chủ đề hay trình độ. Trong số những KNL dành cho thiết kế sách giáo

khoa, cần kể đển các KNL từ ngôn ngữ tự nhiên như Collins (1987), Cambridge English Corpus (2000s), Oxford English Corpus (2000s), hay các KNL từ ngôn ngữ người học như KNL quốc tế dành cho người học tiếng Anh (International Corpus of Learner English - ICLE) (Granger, 1990), KNL dành cho người học của Đại học

Cambridge (Cambridge Learner Corpus – CLC), KNL dành cho người học của

Longman (Longman Learners’ Corpus– LLC). Các KNL này có ảnh hưởng to lớn đến sự phát triển không ngừng của các sản phẩm tư liệu giáo khoa có uy tín của

Cambridge, Oxford, Collins Cobuild, Longmantừ trước đến nay.

KNL giáo khoa cũng phân biệt với các KNL chuyên phân tích phần mềm xử lý ngôn ngữ phục vụ thiết kế giáo khoa. Mặc dù cũng hướng tới sách giáo khoa nhưng chúng chú trọng đến cách thức, qui trình thu thập ngữ liệu, phương pháp đánh dấu, phân loại các nhóm tư liệu khác nhau sao cho phù hợp để truy xuất các

đặc điểm ngôn ngữ cho từng thiết kế, biên soạn nội dung theo tỉ lệ từ vựng, kỹ năng, hay ngữ pháp phù hợp với sách giáo khoa. Do đó, KNL giáo khoa đi theo hướng phần mềm chú giải tập trung vào đánh dấu và chú giải văn bản. Chúng sử

dụng nhiều kiểu đuôi (tag) và đánh dấu đa dạng theo các tầng. Chúng được phát triển gần đây trong xây dựng KNL TeMa hoặc Dự án EU LLP Backbone (2009- 2011)của Kurt Kohn thuộc Trường Đại học Tübingen của Đức(Kohn, 2013).

1.2.2.2. Cấu tạo KNL giáo khoa

Nhìn chung, các KNL giáo khoa đều được xây dựng đáp ứng mục tiêu nghiên cứu khá cụ thể ở một ngành, một lĩnh vực hoặc một nhóm chuyên ngành gần để tìm hiểu đặc điểm nổi bật hay tương đồng về ngôn ngữ. Lấy tập hợp ngôn ngữ là

sách và tư liệu giáo khoa, các Kho ngữ liệu giáo khoa đa dạng nhờ vào hướng chú giải và phân tích ngữ liệu khác nhau, phục vụ các mục tiêu nghiên cứu đa dạng

Với tính chất của một sản phẩm liên ngành, KNL giáo khoa kết hợp ba yếu

tố ngôn ngữ, công nghệ xử lý ngôn ngữ, các phân tích định lượng và định tính trong

giáo dục. Bên cạnh yếu tố ngôn ngữ, các tham số chú giải như chú giải từ loại, cấu

trúc cú pháp, dạng văn bản kết hợp với cácphân tíchđa dạng về từ vựng, ngữ pháp,

thiết kế văn bản, thể loại ngôn ngữ, siêu ngôn ngữ, hay tính toán định lượng kiến

thức (từ vựng, ngữ pháp, ngữ âm) không chỉ đáp ứng mục tiêu giảng dạy, thiết kế sách giáo khoa mà còn mang lại kết quả trong nghiên cứu ngôn ngữ, ngữ pháp,

phong cách, dạng văn bản. Ngay cả khi một KNL giáo khoa đã xácđịnh tập hợp

mục tiêu và xây dựng trên ngữ liệu cố định thì các tham số còn lại như công nghệ

chú giải và phân tích vẫn có thể thay đổi. Sự tương tác giữa các tham số thành lập,

sự linh hoạt trong áp dụng công nghệ xử lý hay các hướng phân tích ngữ liệu mang

lại các kết quả nghiên cứu trên những phương diện khác nhau. Hình 1.2. thể hiện sự đa dạng trong nghiên cứu KNL giáo khoa dưới tác động của tham số chú giải và

hướng phân tích.

Hình 1.2. Các tham số trong thiết kế KNL giáo khoa

Nói tóm lại, một KNL giáo khoa có thể giải quyết nhiều vấn đềvề đặc trưng kết cấu và nội dung ngôn ngữ trong phạm vi sách giáo khoavà giáo trình dạy tiếng như:

Kho ngữ liệu giáo khoa

Tập hợp ngữliệu Chú giải Phân tích

Sách giáo khoa Ngữ liệu văn bản Định lượng từ vựng

Từ loại Ngữ pháp Ngữ dụng Ngữ âm Ngữ pháp …. ……

+Nghiên cứu ngôn ngữ trong sách giáo khoa, tìm hiểu nghĩa ngữ cảnh, cách

sử dụng ngôn ngữ trong các loại bài tập kỹ năng, ngôn ngữ nói, viết, siêu ngôn

ngữ,...

+ Nghiên cứu từ vựng trên góc độ dạy và học tiếng gồm nghiên cứu vốn từ,

tần số sử dụng từ vựng, loại từ và phân bố loại từ, các kết hợp từ (collocation),

chuỗi đồng hiện(lexical bundles), hiện tượng đồng tự,đồng âm.

+ Nghiên cứu ngữ pháp trong sách giáo khoa: phân bố ngữ pháp, tần số sử dụng một số hiện tượng ngữ pháp đặc trưng.

+ Nghiên cứu kết cấu của sách giáo khoa như các dạng bài tập kỹ năng,tỉ lệ

vàphân bố các dạng bài trong sách giáo khoa.

Trong quá trình nghiên cứu, cho dù ngữ liệu không thay đổi, các tham số chú

giải và phân tích vẫn có thể biến đổi để đa dạng hóa mục đích nghiên cứu của KNL giáo khoa hay đa dạng hóa các nghiên cứu trên KNL giáo khoa.

Một phần của tài liệu (LUẬN văn THẠC sĩ) nghiên cứu xây dựng kho ngữ liệu giáo khoa tiếng anh chuyên ngành xã hội học (Trang 44 - 47)

Tải bản đầy đủ (PDF)

(179 trang)