Kho ngữ liệu TESoC trong thiết kế bài kiểm tra

Một phần của tài liệu (LUẬN văn THẠC sĩ) nghiên cứu xây dựng kho ngữ liệu giáo khoa tiếng anh chuyên ngành xã hội học (Trang 150 - 179)

6. Cấu trúc của luận án

4.5. Kho ngữ liệu TESoC trong thiết kế bài kiểm tra

Thiết kế bài kiểm tra có thể dựa vào kiến thứctừ vựng tích lũy trong phạm vi nhất địnhvà khai thác từ vựng trong phạm vi đó. Khi thiết kế một bài kiểm tra tiếng

Anh chuyên ngành 2 Xã hội học theo kiểu mới (xem Phụ lục 8), chúng tôi dùng kho ngữ liệu TESoC để định lượng kiến thức của bài đọc sao cho không vượt quá

phạm vi từ vựng trọng tâm. Bài đọc này được dùng để quyết định chủ đề chủ đạo

cần kiểm tra. Từ đó, xây dựng khung thiết kế với các bài tập theo định dạng đề thi

yêu cầu như bài lựa chọn phương án, điền khuyết, xây dựng câu, dịch thuật,... Một

bài lựa chọn (Multiple choice) có thể tận từ vựng của bài đọc để làm dẫn mục tìm kiếm câu, đoạn có trong kho ngữ liệu sao cho phù hợp để thiết kế câu hỏi về ngữ

pháp, từ vựng, cấu trúc và ngữ âm. Cũng như với bài đọc, quá trình nàyđòi hỏi điều

chỉnh từ vựng sao cho không vượt quá xa trọng tâm đã xácđịnh.

Để tiện cho việc so sánh về độ dài với một đề thi chuyên ngành XHH được

thiết kế năm 2008-2009, chúng tôi đưa ra thiết kế tương tự với độ dài không quá khác biệt với số hiện dạng là 914 ở đề thi 2016 so với 902 hiện dạng trong đề thi

2009. Mặc dù có độ dài không lớn hơn nhưng đề thi 2016 có số kiểu từ và tổ từ ít hơn hẳn, 351 kiểu từ nằm trong 274 tổ từ. Ở đề thi 2009, số kiểu từ là 437 nằm

trong 370 tổ từ.

Hai đề thi 2009 và 2016 cùng dùng chung một nhóm gồm 91 tổ từ, chiếm

59,3% tổng lượng hiện dạng có trong đề thi 2016. Tuy nhiên, số tổ từ còn lại có sự

khác biệt khá lớn.Trên cột hiển thị từ vựng chỉ riêng cóở mỗi đề thi (cột 1 và cột 3)

(Hình 4.11), có thể thấy từ vựng ở cột 1 thiên về nhóm từ cơ bản, trong khi từ vựng ở cột 3 lại thiên nhiều về chuyên ngành (có thể kiểm tra nhận định này trên chương

trình English Vocabulary Profile cũng trong trang Lextutor này) .

Khi so sánh hai đề thi với tổ từ trọng tâm được xác định từ KNL TESoC

(Hình 4.12, 4.13), đề thi 2016 có 875/914 hiện dạng nằm trong trọng tâm, chiếm

95,73%, trong số đó, tỉ lệ từ vựng chuyên ngành là 19,91%. Số tổ từ trọng tâm tương ứng là 247 tổ từ, chiếm90,15% lượng tổ từ được sử dụng trong đề thi.

Hình 4.12. So s ánh trọng tâm chu yên ngành củ a TESoC với đề thi 2016

Trong khi đó, đề thi 2009 có 837/902 hiện dạng nằm trong vốn từ trọng tâm

8,98%. Số lượng tổ từ trọng tâm tương ứng là 325 tổ từ, chiếm 87.84% tổng tổ từ trong đề thi.

So sánh lượng từ vựng nằm ngoài vốn từ trọng tâm của KNL TESoC, đề thi

2016 có số từ nằm ngoài trọng tâm là 4,27%, trong khiđó, con số nàyở đề thi 2009 là 7,21 %.

Trên thực tế, tùy vào mục đích biên soạn và lượng từ vựng cần kiểm tra, người biên soạn có thể tiếp tục so sánh ngữ liệu lấy vào với từ trọng tâm để thu hẹp

bớt lượng tổ từ, tăng hiện dạng hoặc kiểu từ hay giảm bớt các từ nằm ngoài trọng

tâm.

Hình 4.13. So s ánh trọng tâm chu yên ngành củ a TESoC với đề thi 2009

Nhìn chung, việc biên soạn đề thi chuyên ngành theo trọng tâm từ vựng được xác định từ chương trình học có nhiều lợi thế. Thứ nhất, nó đảm bảo kiểm tra đúng

kiến thức trọng tâm cần thiết mà chương trình học đưa ra, tránh dàn trải, gây khó khăn cho đối tượng bị kiểm tra. Thứ hai, đề thi 2016 có độ tập trung từ vựng cao hơn, độ phong phú từ vựng giảm khiến kiến thức không quá phức tạp, chi tiết. Thứ

ba, nó phản ánh đúng bản chất của một bài thi chuyên ngành thông qua nội dung

kiến thức phù hợp, được định lượng rõ ràng chứ không mang tính chủ quan, cảm

tính. Thứ tư, nó giúp xác định trìnhđộ của từng bài kiểm tra thông qua mức độ sử

dụng từ vựng chuyên ngành.

2.6. Tiểu kết

Chương bốn cho thấy KNL giáo khoa tiếng Anh chuyên ngành Xã hội học

có thể được ứng dụng hiệu quả trong giảng dạy ngoại ngữ. Các ứng dụng của KNL có thể chia thành hai loại: ứng dụng gián tiếp vàứng dụng trực tiếp.

Trong ứng dụng gián tiếp, KNL TESoC giúp tổng hợp trọng tâm từ vựng

thông qua thống kê tần số và phạm vi hoạt động của các yếu tố từ vựng. Trọng tâm

từ vựng có tần số cao nhất trong kho ngữ liệu và có phạm vi nhắc nhớ trên đa số các

tiểu kho. Nó đảm bảo lộ trình ghi nhớ từ phía người học vàđược sử dụng làm cơ sở để đánh giá giáo trình, tư liệu học tập và bài kiểm tra phù hợp trong chương trình giảng dạy.

Trong cácứng dụng trực tiếp, KNL TESoC được sử dụng để tính toán lượng

từ cần thiết trong tư liệu học hoặc xác định phạm vi từ vựng của tư liệu đó để đưa ra các phương án điều chỉnh phù hợp với mục tiêu giảng dạy. Đối với tư liệu cụ thể như giáo trình EAP, phân tích cho thấy lượng từ vựng không nhiều, tỉ lệ từ vựng cơ

sở và chuyên ngành cân đối (86,51 so với 13,49%) nhưng độ phong phú từ vựng cao hơn hẳn so với các giáo trình trong TESoC.Đây là điểm căn bản tạo ra độ khó

của giáo trình này.

Đối với việc đánh giá bài đọc, KNL TESoC xác định lượng từ nằm trong

trọng tâm, tính toán được lượng từ cơ sở và chuyên ngành. Trên cơ sở đó, đưa ra phương án thu hẹp lượng từ ngoài trọng tâm, giảm hoặc tăng từ cơ sở hoặc chuyên ngành theo ýđồ thiết kế bài đọc.

Trong ứng dụng xây dựng bài kiểm tra, TESoC giúp tìm kiếm và sử dụng

hợp lý các yếu tố từ vựng từ văn bản thực như cụm từ, câu, đoạn trong phạm vi ngôn ngữ mà nó tập hợp để đưa vào giảng dạy, học tập và thiết kế các bài kiểm tra

kỹ năng, kiểm tra từ vựng, ngữ âm, ngữ pháp,...một cách hiệu quả nhất. Nhờ có các

tiểu kho theo trìnhđộ, KNL TESoC định hướng sử dụng từ vựng trong phạm vi phù hợp để điều chỉnh độ khó của mỗi bài kiểm tra. Kiểm soát được lượng từ không vượt quá chương trình cho phép. Các thiết kế bài tập cũng dựa trên định hướng này mà phát triển hợp lý sao cho đảm bảo lượng từ nằm trong phạm vi cần học nhưng

cũng phù hợp với khả năng tiếp thu của người học.

Nhìn chung, trong giảng dạy và học tập thực tế, KNL TESoC được sử dụng để tìm hiểu và định lượng kiến thức và phạm vi từ vựng cần học, đánh giá trìnhđộ ,

độ khó của tư liệu học và giúp tính toán, điều chỉnh tư liệu học hợp trình độ, k hả năng tiếp thu của từng đối tượng người học. Nó là công cụ hữu hiệu đối với cả giáo

viên và học sinh trong việc định hướnggiảng dạy và học tập, xây dựng và phát triển tư liệu học phù hợp trìnhđộ.

KẾT LUẬN

Nghiên cứu KNL TESoCxác lập hệ tính chất liên ngành của NNHNL thông

qua tích hợp nội dung giảng dạy ngoại ngữ với nghiên cứu ngôn ngữ và công nghệ

xử lý ngôn ngữ tự nhiên thông qua các phần mềm máy tính. Nghiên cứu cho thấy tính ưu việt của Kho ngữ liệu trong phân tích và xử lý ngôn ngữ, đặc biệt là ngôn ngữ tự nhiên, theo hướng tự động. Đồng thời, quá trình phân tích ngữ liệu trong

KNL TESoC cũng chứng tỏ tính hiệu quả của công nghệ xử lý ngôn ngữ trong định lượng từ vựng phục vụ nghiên cứu tư liệu giáo khoa và giảng dạy tiếng Anh chuyên

ngành.

1. Về phương diện lý luận, luận án xác định Ngôn ngữ học ngữ liệu

(NNHNL) là một khoa học liên ngành được xây dựng trên hệthống phương pháp và

lý thuyết đặc thù để nghiên cứu các tập hợp ngữ liệu tự nhiên. Trên cơ sở đó, luận

án xác lập quan niệm về KNL giáo khoa được hình thành trên tập hợp ngữ liệu được xác định theo mục đích nghiên cứu, được lưu trữ, xử lý và nhận diện dưới

dạng điện tử, phục vụ nghiên cứu định lượng và định tính ngôn ngữ. Mô hình kết

hợp giữa tập hợp ngữ liệu mục tiêu với phần mềm máytính dùng để trình hiện, xử

lý và phân tích ngôn ngữ là cấu tạo của KNL máy tính hiện đại, trong đó có KNL

TESoC.

2. KNL TESoC được xây dựng trên nguyên tắc chung nhất là tái hiện nội dung sách giáo khoa tiếng Anh giảng dạy cho sinh viên chuyên ngành Xã hội học tại trường Đại học Khoa học Xã hội và Nhân văn, Đại học Quốc gia Hà Nội.

TESoC tương đối đồng nhất về thể loại, đảm bảo đáp ứng ba thuộc tính cơ bản của KNL là tính đại diện, tính cân đối và độ lớn phù hợp. Cấu trúc 3 bậc với 5 tiểu kho

của TESoC được xác lập dựa trên quyết định phạm vi tập hợp ngữ liệu, mục đích,

và nội dung nghiên cứu. KNL sử dụng mẫu toàn văn, thiết lập tổ chức trong kho

theo tầng bậc dựa vào loại văn bản và phạm vi sử dụng văn bản. KNL TESoC b ị chi

phối bởi 7 tiêu chí, gồm tiêu chí hình thức, cấu trúc KNL, tiêu chí mô tả văn bản (theo tiêu chí bên trong và bên ngoài), tiêu chí độ lớn của kho, số lượng văn bản

trong kho, tiêu chí mẫu đơn vị và tiêu chí chú giải. Qui trình thiết kế KNL TESoC được tiến hành từng bước, từ việc xác định tập hợp ngữ liệu mục tiêu và mẫu văn

bản theo tiêu chí bên ngoài cho đến việc cân nhắc độ dài và số lượng mẫu từ tiêu

chí bên trong, sau đó sắp xếp, đánh dấu, lưu trữ ngữ liệu trong kho, thiết kế (hoặc

lựa chọn) phần mềm chú giải và phân tích tương ứng để hiển thị KNL.

3. Trên cơ sở kết hợp lý thuyết xây dựng KNL giáo khoa với điều kiện học

tập và nghiên cứu thực tế ở Việt Nam, luận án đã xây dựng được KNL TESoC dành cho dạy và học tiếng Anh chuyên ngành Xã hội học. Đâ y là KNL đơn ngữ bằng

tiếng Anh có tập hợp ngữ liệu mục tiêu là toàn bộ giáo trình được định hướng sử

dụng trong giảng dạy chuyên ngành Xã hội học tại trường Đại học Khoa học Xã hội và Nhân Văn, Đại học quốc gia Hà Nội. Kho ngữ liệu có qui mô 527.408 hiện dạng

từ 6 tập sách giáo khoa tiếng Anh các trìnhđộ từ cơ sở đến chuyên ngành Xã hội

học đại cương và được tổ chức thành hai mảng, cân đối về hiện dạng để thuận lợi

cho việc so sánh từ vựng và cũng đảm bảo lượng từ tập trung nhất trong phạm vi

nghiên cứu. Tổ chức ngữ liệu trong TESoC được phân cấp với 5 tiểu kho, có độ lớn tăng dần về hiện dạng theo tỉ lệ thống nhất với các giáo trình cơ sở và có độ phong

phú từ vựng tương đối đồng đều.

KNL TESoC được lưu ở dạng thuần văn bản (plain text) và được đánh dấu theo tiểu kho và đơn vị mẫu.Các chú giải khác không thực hiện trực tiếp trên KNL mà được hiển thị trong quá trình xử lý trên các phần mềm như Range, Text Lex Compare từ trang Compleat Lexical Tutor (Lextutor) và AntConc. Từ đây, các

phương pháp thống kê được áp dụng để tính toán độ phong phú từ vựng, độ phân

tán, nhận định về chỉ số hapax trong các văn bản ngữ liệu, từ đó xác định danh sách

từ bị loại, trung vị, tần số chuẩn, điểm ngắt để phục vụ cho quá trình định lượng

trong KNL TESoC.

4. Quá trình phân tíchđịnh lượng từ vựng trong KNL TESoCđược tiến hành

để xác định vốn từ cơ bản trong KNL, vốn từ trọng tâm chuyên ngành Xã hội học

cần chú trọng trong giảng dạy thực tế. KNL TESoC xác định được 3.137 tổ từ trọng

tâm với 150 tổ từ chức năng và 2.987 tổ từ nội dung. Trong số đó, 1.764 tổ từ đã

được đưa vào các giáo trình từ giai đoạn cơ sở. Số tổ từ còn lại (1.373 tổ từ) có tần số sử dụng cao ở chuyên ngành hoặc đạt tần số tích lũy cao ở giai đoạn chuyên

có thể giúp người học đạt ngưỡng hiểu văn bản chuyên ngành Xã hội học đại cương ở mức ưu việt (96%). Ngoài ra, KNL TESoC cũng chỉ ra nhóm tổ từ một trìnhđộ có trong vốn từ cơ bản của KNL và chỉ ra hướng phân tích các đơn vị từ vựng này để

sử dụng trong các bậc học kế tiếp sau giai đoạn đại cương.

Việc định lượng kiến thức từ vựng trong KNL TESoC nói riêng và các KNL giáo khoa nói chung một mặt giúp hệ thống hóa kiến thức theo bậc học và mục đích học tập, hỗ trợ giảng dạy và học tập đi vào trọng tâm, đạt hiệu quả cao trong thời gian ngắn nhất, mặt khác giúp điều chỉnh độ khó trong sách giáo khoa và tư liệu

học, hỗ trợ quản lý nội dung giảng dạy và học tập, thiết kế bài tập và các bài kiểm

tra phù hợp với mục tiêu học tập. Xét từ khía cạnh thụ đắc ngôn ngữ, các phân tích

từ vựng trọng tâm cho thấy việc nâng cao vốn từ trong dạy và học có thể theo hướng mở rộng số lượng tổ từ hoặc tăng cường tích lũy lượng từ hình trong tổ.

Nghiên cứu KNL TESoC giúp nâng cao nhận thức của giáo viên trong việc lựa

chọn tài liệu giảng dạy, khai thác tư liệu sẵn có một cách hợp lý, hỗ trợ quá trình

tương tác giữa người dạy với người học, giữa người học và tư liệu thông minh (KNL trên máy tính),đặt ra nhu cầu trong thiết kế tích hợp các phần mềm xử lý ngữ

liệu nhanh gọn để đáp ứng qui trình xử lý ngôn ngữ tự nhiên trong giảng dạy.

5. Mặc dù tính ưu việt của KNL TESoC đã phần nào được chứng minh thông

qua sử dụng KNL và vốn từ trọng tâm trong điều chỉnh tư liệu học tập, nhưng vẫn

cần kiểm nghiệm và khẳng định điều này trên thực tế. KNL TESoC sẽ khẳng định

vai trò của nó trong giảng dạy và học tập tiếng Anh chuyên ngành Xã hội học trong môi trường giáo dục đa phương tiện và theo hướng quốc tế hóa hiện nay. Việc triển

khai nghiên cứu Kho ngữ liệu giáo khoa phục vụ giảng dạy tiếng Anhchuyên ngành

trong nước là khả thi và cần thiết đối với giáo dục đại học, đổi mới phương pháp

dạy và học, nâng cao khả năng tiếp cận công nghệ dạy học của giáo viên và học

sinh, hướng tới giảng dạy kết hợp với nội dung học tập có định hướng. Giảng dạy

tiếng Anh chuyên ngành cũng như nghiên cứu Kho ngữ liệu phục vụ dạy và học

tiếng cần có vị trí xứng đáng trong giáo dục đại học ở Đại học Quốc gia Hà Nội nói riêng và các trường đại học và cao đẳng nói chung.

DANH MỤC CÔNG TRÌNH KHOA HỌC CỦA TÁC GIẢ LIÊN QUAN ĐẾN LUẬN ÁN

1. Lâm Thị Hòa Bình (2007), EGEO 1 An advanced course for students of Geography, NXB Đại học Sư phạm, Hà Nội.

2. Lâm Thị Hòa Bình (2009), EGEO 2 - An Advanced course for students of

Geography,NXB Đại học Sư phạm, Hà Nội.

3. Lâm Thị Hòa Bình (2012), “Corpus Linguistics – A Trend in Compiling ESP Documents for College and University Students in Vietnam”, Asia-Pacific

Corpus Linguistics Conference, Auckland University, New Zealand, February

2012, pp. 122-125.

4. Lâm Thị Hòa Bình (2014 ),“Một số vấn đề về nhóm từ vựng tiếng Anh chuyên ngành từ góc độ ngôn ngữ học khối liệu”, Tạp chí Ngôn ngữ và Đời sống (11- 229), tr. 18-23.

5. Lâm Thị Hòa Bình (2015), “Đối chiếu ngữ nghĩa của thành tố COLD & HOT

trong tiếng Anh và tiếng Việt từ góc độ ngôn ngữ học khối liệu”, Tạp chí Từ điển học và Bách khoa thư (2-34), tr. 39-46.

6. Lâm Thị Hòa Bình (2016), “Ngôn ngữ học ngữ liệu: Từ khái niệm đến mục đích”, Tạp chí Từ điển học và Bách khoa thư (3-41), tr. 26-31.

Một phần của tài liệu (LUẬN văn THẠC sĩ) nghiên cứu xây dựng kho ngữ liệu giáo khoa tiếng anh chuyên ngành xã hội học (Trang 150 - 179)

Tải bản đầy đủ (PDF)

(179 trang)