1. Trang chủ
  2. » Luận Văn - Báo Cáo

Đề tài nghiên cứu khoa học: Nghiên cứu mô hình ngôn ngữ lớn và ứng dụng hỗ trợ giảng viên tạo ngân hàng câu hỏi môn học tại Học viện Ngân hàng

58 1 0
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Nghiên cứu mô hình ngôn ngữ lớn và ứng dụng hỗ trợ giảng viên tạo ngân hàng câu hỏi môn học tại Học viện Ngân hàng
Trường học Học viện Ngân hàng
Chuyên ngành Công nghệ thông tin và kinh tế số
Thể loại Đề tài nghiên cứu khoa học
Năm xuất bản 2023 - 2024
Thành phố Hà Nội
Định dạng
Số trang 58
Dung lượng 1,23 MB

Cấu trúc

  • 1. Lý do chọn đề tài (7)
  • 2. Mục tiêu nghiên cứu (8)
  • 3. Đối tượng nghiên cứu (9)
  • 4. Phương pháp nghiên cứu (9)
  • 5. Những kết quả chính đạt được (10)
  • 6. Bố cục đề tài (10)
    • 1.1. Trí tuệ nhân tạo và Mô hình ngôn ngữ lớn (12)
    • 1.2. Những ứng dụng của AI và LLM trong giáo dục (13)
    • 1.3. Định hướng xây dựng bài toán (14)
    • 1.4. Phát biểu bài toán (16)
    • 2.1. Quá trình phát triển của LLM (19)
    • 2.2. Khái niệm và công dụng của LLM (20)
    • 2.3. Các LLM nổi bật (23)
    • 2.4. Tiềm năng ứng dụng của LLM trong giáo dục (25)
    • 2.5. Khoảng trống nghiên cứu (27)
    • 3.2. Prompt Engineering và tầm quan trọng (31)
    • 3.3. Nghiên cứu mẫu Prompt trong việc tạo các dạng câu hỏi phổ biến (33)
    • 3.4. Nghiên cứu mẫu Prompt trong giáo dục (34)
      • 3.4.1. Đối với dạng câu hỏi trắc nghiệm (35)
      • 3.4.2. Đối với dạng đúng - sai (35)
      • 3.4.3. Đối với dạng bài tập (35)
    • 3.5. Áp dụng các mẫu Prompt tạo câu hỏi với môn Tài chính doanh nghiệp I (36)
      • 3.5.1. Lý do chọn môn Tài chính doanh nghiệp I (36)
      • 3.5.2. Tự đánh giá sơ bộ và tối ưu hóa sử dụng Chat GPT (36)
      • 3.5.3. Ứng dụng tạo đề kiểm tra tự động (38)
      • 3.5.4. Đánh giá chất lượng câu hỏi (39)
    • 4.1. Lí thuyết LangChain (43)
      • 4.1.1. Tổng quan về LangChain (43)
      • 4.1.2. Cách tạo Prompt trong LangChain (45)
    • 4.2. Xây dựng (46)
      • 4.2.1. Giải thích biểu đồ (46)
      • 4.2.2. Nguyên lí hoạt động luồng dữ liệu (47)
      • 4.2.3. Thảo luận (49)
  • KẾT LUẬN (11)
    • 1. Đóng góp (51)
    • 2. Hạn chế (52)
    • 3. Hướng phát triển tiếp theo (52)
  • TÀI LIỆU THAM KHẢO (54)
  • PHỤ LỤC (57)
    • 1. Bài kiểm tra mù (57)
    • 2. Ứng dụng demo tạo câu hỏi tự động (cần có API key để tạo) (58)

Nội dung

Đối tượng nghiên cứu Dựa theo mục tiêu nghiên cứu đã đề ra, đối tượng nghiên cứu chính của nhóm là: các mô hình ngôn ngữ lớn mã nguồn mở có hỗ trợ tiếng Việt, các kỹ thuật sử dụng promp

Mục tiêu nghiên cứu

Mục tiêu nghiên cứu chung của đề tài là ứng dụng mô hình ngôn ngữ lớn (LLMs) và các kỹ thuật Prompt để phát triển một ứng dụng tạo câu hỏi tự động tại Học viện Ngân hàng.

2.2 Mục tiêu nghiên cứu cụ thể

Từ mục tiêu nghiên cứu chung, nhóm đề ra 4 mục tiêu nghiên cứu cụ thể

Các mô hình ngôn ngữ lớn (LLMs) dựa trên các lý thuyết ngôn ngữ học và học máy, cho phép chúng hiểu và tạo ra văn bản tự nhiên Việc phân tích khả năng hỗ trợ của LLMs trong việc tạo câu hỏi kiểm tra cho thấy chúng có thể tạo ra các câu hỏi đa dạng và chính xác, giúp nâng cao hiệu quả đánh giá kiến thức Sự linh hoạt và khả năng tùy biến của LLMs cũng mang lại lợi ích trong việc thiết kế các bài kiểm tra phù hợp với nhu cầu học tập của từng đối tượng.

Chúng tôi nghiên cứu và phát triển các kỹ thuật sử dụng Prompt để LLMs có thể tạo ra các câu hỏi kiểm tra chất lượng cao, đặc biệt trong môn Tài chính doanh nghiệp I Mục tiêu của chúng tôi là tìm hiểu cách xây dựng Prompt hiệu quả, giúp LLMs sản xuất các câu hỏi phù hợp với nội dung và mục tiêu giảng dạy của môn học này.

- Đề xuất các phương án đánh giá mức độ hiệu quả của LLM trong tạo ngân hàng câu hỏi

Tại Học viện Ngân hàng, chúng tôi áp dụng các công cụ mã nguồn mở như LangChain, Streamlit và OpenAI API để thiết kế và phát triển một ứng dụng tạo câu hỏi tự động Ứng dụng này tích hợp các kỹ thuật Prompt đã được nghiên cứu và tối ưu hóa, cho phép người dùng nhập nội dung và nhận lại các câu hỏi kiểm tra một cách nhanh chóng và hiệu quả.

Phương pháp nghiên cứu

Để thực hiện bài nghiên cứu, nhóm nghiên cứu đã sử dụng kết hợp các phương pháp nghiên cứu sau:

Nhóm nghiên cứu của chúng tôi đã tiến hành phân tích sâu về ứng dụng của các mô hình ngôn ngữ lớn (LLM) trong giáo dục, đặc biệt là trong việc tạo câu hỏi thi Chúng tôi đã thu thập và đánh giá một khối lượng lớn tài liệu khoa học uy tín, bao gồm bài báo, báo cáo nghiên cứu và tạp chí chuyên ngành Qua đó, nhóm đã xác định ưu nhược điểm của từng loại LLM, so sánh hiệu quả và tính phù hợp với mục tiêu nghiên cứu Cuối cùng, dựa trên các kết quả này, chúng tôi đã chọn ra mô hình ngôn ngữ tối ưu nhất, đảm bảo khả năng tạo ra những câu hỏi chất lượng cao cho môn học Tài chính doanh nghiệp I.

Nhóm nghiên cứu đã tiến hành khảo sát và phân tích các mẫu câu lệnh tạo câu hỏi trên LLM Qua quá trình thử nghiệm các mẫu câu lệnh, nhóm đã đánh giá kết quả đầu ra và lựa chọn mẫu câu lệnh tối ưu nhất để xây dựng ngân hàng câu hỏi cho môn Tài chính doanh nghiệp I.

Nhóm nghiên cứu đã tạo ra ngân hàng câu hỏi gồm 100 câu hỏi cho môn Tài chính doanh nghiệp I, bao gồm 3 loại: trắc nghiệm, lựa chọn đúng/sai và bài tập tính toán Ngân hàng câu hỏi được thiết kế khoa học, phù hợp với nội dung học tập Sau khi tự đánh giá và lọc ra các câu hỏi trùng lặp và thiếu dữ kiện, nhóm đã tiến hành khảo sát với giảng viên và sinh viên tại Học viện Ngân hàng để đánh giá chất lượng bộ câu hỏi.

Nhóm nghiên cứu đã tiến hành nghiên cứu lý thuyết về các công cụ và nền tảng công nghệ phù hợp nhằm triển khai nhanh một sản phẩm demo trên nền web Sản phẩm demo này được thiết kế với mục tiêu đơn giản hóa quy trình tạo câu hỏi bằng cách sử dụng LLM.

10 giảng viên dễ dàng sử dụng và tạo ra ngân hàng câu hỏi chất lượng cao một cách nhanh chóng, hiệu quả.

Những kết quả chính đạt được

Các kết quả chính đạt được trong nghiên cứu của nhóm chúng tôi là:

Sau khi nghiên cứu và so sánh các mô hình ngôn ngữ lớn phổ biến như ChatGPT 3.5, Gemini, Bard, Bing và ChatGPT Plus, nhóm chúng tôi đã đánh giá dựa trên các tiêu chí về chi phí, tính năng và đầu ra Kết quả cho thấy ChatGPT 3.5 là mô hình ngôn ngữ lớn phù hợp nhất cho bài nghiên cứu này.

Chúng tôi đã phát triển và tối ưu hóa các mẫu Prompt để tạo câu hỏi kiểm tra tự động tại Học viện Ngân hàng, nhằm cải thiện chất lượng và đa dạng của các câu hỏi Qua quá trình phân tích và điều chỉnh, các mẫu Prompt hiệu quả đã được xây dựng Nghiên cứu mang tên “Ứng dụng kỹ thuật prompt để tối ưu kết quả đầu ra của mô hình ngôn ngữ lớn hỗ trợ việc học tập của sinh viên đại học” đã được công bố tại kỷ yếu Hội thảo “Sinh viên trong thời kỳ chuyển đổi số, đổi mới sáng tạo và khởi nghiệp” diễn ra vào tháng 5/2024 tại Học viện Ngân hàng.

- Đánh giá được chất lượng bộ câu hỏi một cách khách quan: Chúng tôi đã sử dụng

Cuộc khảo sát “Bài kiểm tra mù” nhằm xác định khả năng phân biệt giữa câu hỏi do ChatGPT 3.5 và con người tạo ra đã cho kết quả khả quan.

The initial findings of the research team have been accepted for publication in the proceedings of the AIQAM workshop, part of ICMR 2024 The paper is titled "A ChatGPT-based Approach for Question Generation in Higher Education."

Chúng tôi đã phát triển một ứng dụng demo tạo câu hỏi tự động, hỗ trợ giảng viên tại Học viện Ngân hàng, sử dụng công nghệ mã nguồn mở.

LangChain và Streamlit là công cụ hỗ trợ tạo câu hỏi tự động cho kiểm tra Ứng dụng này cho phép người dùng nhập nội dung và nhận câu hỏi kiểm tra nhanh chóng, đồng thời cung cấp tính năng tùy chỉnh để đáp ứng nhu cầu cụ thể của từng người dùng.

Bố cục đề tài

Trí tuệ nhân tạo và Mô hình ngôn ngữ lớn

Trong bối cảnh công nghệ phát triển nhanh chóng, trí tuệ nhân tạo (AI) đang thu hút sự chú ý với tiềm năng ứng dụng lớn Một trong những tiến bộ nổi bật là sự ra đời của các mô hình ngôn ngữ lớn (LLM) như ChatGPT, BingChat và Bard, được phát triển bởi OpenAI, Microsoft và Google Trong hai năm qua, các mô hình này đã phát triển mạnh mẽ và có ảnh hưởng sâu rộng đến lĩnh vực AI tạo sinh (Generative AI - GenAI) (Tuan et al., 2024).

Các mô hình ngôn ngữ lớn (LLM) là một phần của trí tuệ nhân tạo, sử dụng kỹ thuật học sâu để hiểu và tạo ra ngôn ngữ tự nhiên Chúng có khả năng nắm bắt ngữ cảnh và sắc thái trong giao tiếp, cho phép thực hiện nhiều nhiệm vụ như dịch thuật, tóm tắt, tạo văn bản và trả lời câu hỏi Kiến trúc Transformer giúp LLM xử lý lượng lớn dữ liệu văn bản, tạo ra phản hồi phù hợp và mạch lạc Tác động của LLM không chỉ dừng lại ở việc tạo văn bản mà còn cách mạng hóa nhiều ngành công nghiệp, như dịch vụ khách hàng với chatbot xử lý nhanh chóng nhiều câu hỏi, và trong chăm sóc sức khỏe, hỗ trợ chẩn đoán bệnh qua phân tích tài liệu y khoa Hơn nữa, LLM còn hỗ trợ trong lĩnh vực sáng tạo, giúp người viết phát triển ý tưởng và soạn thảo nội dung, từ đó tiết kiệm thời gian và công sức trong việc tạo ra nội dung chất lượng cao.

Giáo dục đang được cải thiện đáng kể nhờ vào những tiến bộ trong LLM, cho phép tích hợp các mô hình này vào hệ thống giáo dục để tạo ra trải nghiệm học tập cá nhân hóa cho học sinh LLM hỗ trợ trong việc xây dựng kế hoạch học tập tùy chỉnh, tạo câu hỏi thực hành và cung cấp phản hồi ngay lập tức về bài tập Sự cá nhân hóa này đáp ứng nhu cầu riêng biệt của từng học sinh, từ đó thúc đẩy quá trình học tập hiệu quả và hấp dẫn hơn Bên cạnh đó, LLM còn giúp tự động hóa các nhiệm vụ hành chính, cho phép giáo viên tập trung vào việc giảng dạy và tư vấn cho sinh viên, nâng cao trải nghiệm giáo dục tổng thể.

Những ứng dụng của AI và LLM trong giáo dục

Việc tích hợp AI và LLM trong giáo dục mở ra cơ hội cải thiện trải nghiệm học tập và quy trình giảng dạy Học viện Ngân hàng, như nhiều cơ sở giáo dục khác, gặp khó khăn trong việc đánh giá sinh viên do quy trình tốn thời gian trong việc tạo và chấm điểm Nghiên cứu này nhằm tự động hóa việc tạo ngân hàng câu hỏi kiểm tra bằng cách sử dụng LLM, giúp giảm khối lượng công việc cho giảng viên mà vẫn đảm bảo chất lượng đánh giá Hơn nữa, phát triển các mô hình LLM phù hợp với bối cảnh Việt Nam sẽ mang lại những công cụ và hiểu biết quý giá cho các tổ chức giáo dục trong khu vực (Igbokwe, 2023).

Tiềm năng của mô hình ngôn ngữ lớn (LLM) trong giáo dục là rất lớn, có khả năng cách mạng hóa quy trình giảng dạy và học tập LLM không chỉ giúp tạo ra câu hỏi kiểm tra mà còn hỗ trợ phát triển tài liệu giảng dạy toàn diện, thiết kế giáo án tương tác và cung cấp dịch vụ dạy kèm cá nhân hóa Việc tích hợp LLM có thể nâng cao khả năng tiếp cận và tính toàn diện trong giáo dục, đặc biệt là trong các lớp học quy mô lớn, nơi mà nhu cầu riêng biệt của từng học sinh khó được đáp ứng Bằng cách tự động hóa các công việc thường ngày và cung cấp hỗ trợ mục tiêu, LLM cho phép giáo viên tập trung vào việc phát triển tư duy phản biện và khuyến khích học tập hợp tác.

Mặc dù LLM có tiềm năng lớn, nhóm nghiên cứu của chúng tôi nhấn mạnh rằng việc công nhận khả năng tạo ra câu hỏi kiểm tra chất lượng cao là bước quan trọng để thu hút sự chú ý rộng rãi hơn Việc tự động tạo ngân hàng câu hỏi kiểm tra không chỉ giải quyết khó khăn cho giáo viên mà còn chứng minh tính chính xác và độ tin cậy của LLM trong việc tạo nội dung giáo dục đạt tiêu chuẩn học thuật Điều này có thể xây dựng niềm tin và sự quan tâm đến các ứng dụng rộng rãi của LLM trong giáo dục Hơn nữa, việc tích hợp LLM có thể nâng cao khả năng tiếp cận và tính toàn diện của giáo dục bằng cách phát triển tài nguyên giáo dục đa ngôn ngữ, hỗ trợ người không phải bản ngữ và thúc đẩy môi trường học tập hòa nhập, đặc biệt tại Việt Nam với nền tảng ngôn ngữ đa dạng.

LLM có khả năng tạo ra các nền tảng học tập thích ứng, giúp học sinh với phong cách và khả năng học tập khác nhau tiếp cận nền giáo dục chất lượng như nhau Điều này đảm bảo rằng giáo dục được điều chỉnh để đáp ứng nhu cầu đa dạng của học sinh (Dao, 2023).

LLM đang mở ra tiềm năng lớn cho giáo dục tại Việt Nam, vì vậy nghiên cứu này tập trung vào việc đánh giá năng lực và hạn chế của công nghệ này để đề xuất ứng dụng phù hợp trong bối cảnh giáo dục Việt Nam Nhóm nghiên cứu nhận thấy rằng LLM đã hỗ trợ đáng kể trong các hoạt động giảng dạy (Dao et al., 2023), nhưng việc kiểm tra và đánh giá học viên, một công việc tốn nhiều thời gian và công sức của giảng viên, vẫn chưa được nghiên cứu một cách sâu sắc.

Tiềm năng ứng dụng LLM trong giáo dục Việt Nam rất lớn, và nhóm nghiên cứu của chúng tôi muốn nhấn mạnh lợi ích tức thời của việc sử dụng LLM để tạo câu hỏi kiểm tra Bằng cách đáp ứng nhu cầu này tại Học viện Ngân hàng, chúng tôi mong muốn chứng minh giá trị thực tiễn của LLM, từ đó thúc đẩy sự chấp nhận và áp dụng rộng rãi hơn trong các lĩnh vực giáo dục khác Những hiểu biết từ nghiên cứu sẽ không chỉ mang lại lợi ích cho Học viện Ngân hàng mà còn trở thành nguồn tài nguyên quý giá cho các tổ chức giáo dục trong khu vực, góp phần xây dựng một bối cảnh giáo dục toàn diện và đổi mới.

Định hướng xây dựng bài toán

Tạo câu hỏi là một nhiệm vụ quan trọng trong xử lý ngôn ngữ tự nhiên (NLP), nhằm mục đích tạo ra các câu hỏi tự nhiên và mạch lạc Nhiều phương pháp cũng tìm cách phát triển các câu trả lời phù hợp hoặc sử dụng câu trả lời để hình thành câu hỏi Gần đây, nghiên cứu trong lĩnh vực này đã chủ yếu tập trung vào việc áp dụng các mô hình ngôn ngữ lớn (LLM) dựa trên kiến trúc Transformer, nhờ vào thành công nổi bật của chúng trong NLP.

Một trường hợp sử dụng rõ ràng của là các ứng dụng giáo dục Ví dụ: một hệ thống

Công nghệ QG mạnh mẽ giúp giảm thời gian giáo viên tạo nội dung giáo dục như bài tập về nhà, câu hỏi và bài kiểm tra, đồng thời phục vụ như công cụ thực hành cho sinh viên Tiềm năng của việc tạo câu hỏi giáo dục rất lớn, đặc biệt với sự phát triển của LLM Các nhà giáo dục ngày càng nhận ra giá trị của việc tái hình dung tài liệu hỗ trợ để nâng cao trải nghiệm học tập cho sinh viên Sự xuất hiện của công nghệ LLM hứa hẹn mang đến các phương pháp sư phạm đổi mới, thu hút người học và tạo điều kiện cho các phương pháp giảng dạy hiệu quả hơn.

15 pháp sư phạm mang tính cá nhân hóa và trải nghiệm vượt ra ngoài môi trường lớp học truyền thống

Nhóm nghiên cứu đề xuất tích hợp LLM vào giáo dục để nâng cao năng lực siêu nhận thức, giúp giáo viên xây dựng trải nghiệm học tập độc đáo Việc sử dụng LLM trong sách bài tập kỹ thuật số không chỉ thúc đẩy khả năng phản ánh siêu nhận thức mà còn phát triển tư duy phản biện LLM hỗ trợ học sinh ở mọi cấp độ trong Phân loại của Bloom, từ việc phân tích thông qua tóm tắt và so sánh các công trình học thuật đến việc tạo ra mô phỏng kịch bản trong môi trường ảo Sự kết hợp giữa trí tuệ nhân tạo và phương pháp sư phạm này nhằm phát triển kỹ năng tư duy phản biện và nâng cao các cấp độ nhận thức bậc cao hơn.

Hình 1: Thang phân loại Bloom cổ điển

Bảng 1: Hướng dẫn ứng dụng thang Bloom trong LLM

Cấp độ trong phân loại Bloom

Sự miêu tả Câu hỏi mẫu Ứng dụng LLM

Ghi nhớ Tiếp thu kiến thức Định nghĩa của … là gì?

Truy xuất dữ liệu, kiểm tra thực tế

Hiểu Giải thích ý tưởng hoặc khái niệm

Giải thích như thế nào?

Tóm tắt, diễn giải, làm rõ Áp dụng Sử dụng thông tin trong tình huống mới Được áp dụng như thế nào trong …?

Giải quyết vấn đề, kịch bản, ứng dụng thực tế

Phân tích Chia nhỏ thông tin Nguyên nhân của

Phân tích, so sánh và đối chiếu? Đánh giá Biện minh cho một quyết định hoặc hành động

Tại sao…tốt hơn…? Đánh giá, lập luận, đánh giá kịch bản

Tạo Tạo mã hoặc phối cảnh kiến trúc Điều gì sẽ xảy ra nếu

Mô phỏng kịch bản, phân tích dự đoán

Thực tế hiện nay cho thấy có rất ít tài liệu về việc triển khai các hệ thống giáo dục chất lượng (QG) Nguyên nhân có thể là do hiệu suất kém của các phương pháp cũ, sự cứng nhắc của hệ thống và thiếu niềm tin từ người dùng Một nghiên cứu đã chỉ ra rằng để hệ thống QG được áp dụng hiệu quả trong lớp học, nó cần phải đáp ứng nhu cầu của các nhà giáo dục Do đó, việc phát triển hệ thống QG giáo dục cần phải chú trọng đến ý kiến của người dùng cuối để đảm bảo tính khả thi và hiệu quả.

Phát biểu bài toán

Nghiên cứu về AI và các mô hình ngôn ngữ lớn (LLM) cho thấy tiềm năng to lớn trong việc cách mạng hóa giáo dục Các tiến bộ trong công nghệ như ChatGPT, BingChat và Bard không chỉ thể hiện khả năng xử lý ngôn ngữ giống con người mà còn mở ra những cơ hội mới để cải thiện thực tiễn giáo dục Tuy nhiên, ứng dụng thực tế của LLM trong giáo dục, đặc biệt trong việc phát triển công cụ đánh giá, vẫn còn nhiều khía cạnh chưa được khám phá (Abedi et al., 2023).

Việc tích hợp Mô hình Ngôn ngữ Lớn (LLM) vào hệ thống giáo dục giúp giảm tải công việc cho các nhà giáo dục bằng cách tự động hóa quá trình tạo ngân hàng câu hỏi kiểm tra.

Việc sử dụng LLM trong các tổ chức như Học viện Ngân hàng giúp tối ưu hóa quy trình tạo và chấm điểm đánh giá, tiết kiệm thời gian và công sức cho các nhà giáo dục Nhờ đó, họ có thể tập trung hơn vào giảng dạy và sự tham gia của sinh viên Hơn nữa, LLM có khả năng tạo ra các câu hỏi đa dạng và chất lượng cao, góp phần nâng cao chất lượng tổng thể của các đánh giá, đảm bảo tính toàn diện và thách thức.

Nghiên cứu của chúng tôi khám phá tiềm năng của Mô hình Ngôn ngữ Lớn (LLM) trong việc tạo ngân hàng câu hỏi kiểm tra tại Học viện Ngân hàng Chúng tôi sẽ đánh giá khả năng và hạn chế của LLM trong bối cảnh này, cung cấp những hiểu biết giá trị về ứng dụng thực tế của chúng Bằng cách phát triển các câu hỏi kiểm tra, nghiên cứu này không chỉ thiết lập nền tảng cho các ứng dụng LLM rộng rãi hơn trong giáo dục mà còn thể hiện lợi ích tức thì, khuyến khích việc khám phá thêm Nhóm tác giả đã thực hiện nghiên cứu ban đầu về khả năng ứng dụng của LLMs trong việc tạo ngân hàng câu hỏi kiểm tra tại Học viện Ngân hàng.

1 Nghiên cứu tổng quan về các mô hình ngôn ngữ lớn khả dụng hiện nay, qua đó đề xuất các mô hình có khả năng xử lý tiếng Việt, có thể tiếp cận rộng rãi với người dùng, phù hợp với điều kiện thực tế tại Học viện Ngân hàng

2 Lựa chọn một mô hình ngôn ngữ lớn phù hợp với đề tài Tìm hiểu các mẫu câu lệnh phổ biến để tương tác với mô hình đó, qua đó rút ra những câu lệnh hiệu quả cho việc tạo ngân hàng câu hỏi cho giáo dục mà cụ thể ở đây là môn Tài chính doanh nghiệp I tại Học viện Ngân hàng

3 Tạo một ngân hàng câu hỏi gồm khoảng 100 câu theo 3 loại câu hỏi: trắc nghiệm và lựa chọn đúng sai và bài tập môn Tài chính doanh nghiệp

4 Đánh giá chất lượng bộ câu hỏi được tạo từ LLMs với ý kiến nhận xét từ các giảng viên, chuyên gia trong lĩnh vực Tài chính doanh nghiệp tại Học viện Ngân hàng

5 Xây dựng “Bài kiểm tra mù” nhằm đánh giá một mô hình LLM, hướng tới đối tượng là sinh viên nhằm cân nhắc tính thực tiễn của việc ứng dụng LLMs đánh giá người học

6 Xây dựng thử nghiệm một ứng dụng tạo ngân hàng câu hỏi các môn học tại Học viên Ngân hàng

Nghiên cứu này nhằm mục đích rút ngắn khoảng cách giữa tiềm năng lý thuyết của Mô hình Ngôn ngữ Lớn (LLM) và việc áp dụng thực tế của chúng trong lĩnh vực giáo dục.

Nghiên cứu này trình bày 18 cách tập trung vào một vấn đề cụ thể, nhằm tự động hóa việc tạo ngân hàng câu hỏi kiểm tra Chúng tôi hy vọng sẽ chứng minh lợi ích rõ ràng của Mô hình Ngôn ngữ Lớn (LLM) và mở ra cơ hội ứng dụng rộng rãi hơn trong lĩnh vực giáo dục Kết quả nghiên cứu không chỉ mang lại lợi ích cho Học viện Ngân hàng mà còn cung cấp một khuôn khổ giá trị cho các tổ chức giáo dục khác đang tìm cách khai thác công nghệ AI và LLM.

CHƯƠNG 2: CƠ SỞ LÝ THUYẾT VỀ LLM

Quá trình phát triển của LLM

Mô hình ngôn ngữ (Language Model – LM) đã được nghiên cứu từ những năm 1950, bắt nguồn từ ứng dụng thông tin của Shannon về ngôn ngữ con người Vào thời điểm đó, ông đã đo lường mức độ của mô hình ngôn ngữ n-gram đơn giản để dự đoán và nén dữ liệu văn bản tự nhiên Những mô hình ban đầu này đã tạo nền tảng cho việc hiểu ngôn ngữ thông qua các phương pháp thống kê, mặc dù còn hạn chế về phạm vi và khả năng Tuy nhiên, sự phát triển của sức mạnh tính toán và tính sẵn có của dữ liệu đã mở đường cho các mô hình phức tạp hơn trong lĩnh vực này.

Tiến bộ trong lịch sử xử lý ngôn ngữ tự nhiên (NLP) đã chuyển từ các mô hình xác suất thống kê sang các mô hình tư duy ngôn ngữ, và sau đó là từ các mô hình ngôn ngữ được đào tạo trước (PLMs) đến các mô hình ngôn ngữ lớn (LLMs) Mặc dù các mô hình thống kê mang tính đột phá vào thời điểm đó, nhưng chúng chỉ có khả năng xử lý các nhiệm vụ cụ thể trong bối cảnh hạn chế Sự phát triển của các mô hình phức tạp hơn đã giúp nâng cao hiểu biết về cấu trúc ngôn ngữ PLMs đã tạo ra một bước nhảy vọt quan trọng bằng cách đào tạo trong môi trường tự giám sát trên kho dữ liệu rộng lớn, nhằm mục đích học tập tổng quát và rộng rãi Phương pháp này cho phép chia sẻ các cách trình bày đã học giữa các nhiệm vụ NLP khác nhau, từ đó nâng cao hiệu suất tổng thể.

Trong khi mô hình ngôn ngữ (LM) được đào tạo trong môi trường giám sát với nhiệm vụ cụ thể, mô hình ngôn ngữ tiên tiến (PLM) lại được đào tạo trong môi trường tự giám sát trên kho văn bản lớn, cho phép học tập rộng rãi và chia sẻ nhiệm vụ giữa các ứng dụng NLP khác nhau Sau khi tinh chỉnh cho các tác vụ cụ thể, PLM đã vượt qua hiệu suất của các mô hình ngôn ngữ truyền thống Sự gia tăng quy mô của PLM, với hàng chục đến hàng trăm tỷ tham số và tập dữ liệu huấn luyện từ nhiều GB lên TB, đã dẫn đến sự chuyển đổi thành mô hình ngôn ngữ lớn (LLM) với hiệu suất cao hơn (Zhang, 2024).

Kể từ khi ra đời, các mô hình ngôn ngữ thống kê đã trở thành nền tảng cho nhiều nghiên cứu trong lĩnh vực Xử lý ngôn ngữ tự nhiên (NLP) Các mô hình ngôn ngữ tiên tiến hơn đã được phát triển để thực hiện các nhiệm vụ đa dạng như nhận dạng giọng nói, dịch thuật và truy xuất thông tin Những mô hình này không chỉ xử lý các tác vụ phức tạp mà còn cung cấp phản hồi chính xác và phù hợp với ngữ cảnh nhờ vào khả năng hiểu sắc thái của ngôn ngữ con người Gần đây, các tiến bộ trong mô hình ngôn ngữ lớn (Large Language Model - LLM) đã được đạt được thông qua việc huấn luyện trên kho văn bản quy mô lớn.

20 mô Web đã mở rộng đáng kể khả năng của các mô hình ngôn ngữ (LLM) (Minaee et al.,

Sự gia tăng quy mô của các mô hình ngôn ngữ lớn (LLM) như GPT và BERT đã mang lại những cải tiến vượt bậc trong nhiều nhiệm vụ xử lý ngôn ngữ tự nhiên (NLP) Những mô hình này, nhờ vào kiến trúc đổi mới và khối lượng dữ liệu đào tạo khổng lồ, đã mở ra tiềm năng mới trong việc hiểu và tạo ngôn ngữ tự nhiên Chúng không chỉ thay đổi kỳ vọng về khả năng của mô hình ngôn ngữ mà còn xác định lại phạm vi ứng dụng của chúng Từ việc tạo ra văn bản mạch lạc đến phản hồi giống con người trong chatbot và tóm tắt tự động, LLM đang dẫn dắt sự tiến bộ trong lĩnh vực ngôn ngữ học tính toán và trí tuệ nhân tạo Khả năng xử lý thông tin lớn của chúng đã thúc đẩy các đột phá trong phân tích tình cảm và hệ thống đề xuất nội dung, thể hiện tác động sâu sắc của các mô hình tiên tiến này đối với công nghệ và xã hội.

Khái niệm và công dụng của LLM

Mô hình học máy LLM xử lý và tạo ra ngôn ngữ con người thông qua việc đào tạo trên khối lượng dữ liệu khổng lồ, sử dụng thuật toán học sâu để nhận diện các mẫu và sắc thái ngôn ngữ Với cơ chế tự chú ý, LLM có khả năng đánh giá tầm quan trọng của từng từ trong câu, từ đó tạo ra kết quả đầu ra mạch lạc và chính xác hơn theo ngữ cảnh Điều này đã cách mạng hóa cách tiếp cận của chúng ta đối với các hệ thống xử lý ngôn ngữ tự nhiên Hơn nữa, LLM có thể được tinh chỉnh cho các ứng dụng cụ thể, trở thành công cụ linh hoạt trong lĩnh vực NLP, không chỉ tạo văn bản cơ bản mà còn học các kỹ năng mới như viết sáng tạo và phân tích tình cảm (Minaee et al., 2024).

Hình 2: Kiến trúc Attention của LLM

(Nguồn - Attention Is All You Need)

LLM đã cách mạng hóa lĩnh vực NLP bằng cách sử dụng các bộ dữ liệu lớn để đào tạo mô hình thông qua quá trình học không giám sát, giúp mô hình hiểu và tạo ra ngôn ngữ với độ chính xác cao Những tiến bộ này đến từ nghiên cứu về kiến trúc máy biến áp, cho phép xử lý các phụ thuộc tầm xa trong văn bản Khả năng học đa nhiệm không giám sát của các mô hình ngôn ngữ đã mở ra những khả năng mới cho công nghệ NLP Sự cải tiến liên tục trong kiến trúc và kỹ thuật đào tạo đã giúp LLM thực hiện những nhiệm vụ trước đây không thể tưởng tượng, thiết lập các tiêu chuẩn mới trong ngành (Mửkander et al., 2023).

Khả năng của LLM giúp cải thiện khả năng tiếp cận thông tin bằng cách dịch các văn bản pháp lý hoặc y tế phức tạp sang ngôn ngữ dễ hiểu, từ đó thu hẹp khoảng cách giao tiếp Điều này rất quan trọng trong việc cung cấp thông tin về sức khỏe và quyền lợi cho những cá nhân không chuyên môn, giúp họ tiếp cận kiến thức một cách dễ dàng hơn Hơn nữa, LLM còn đóng vai trò thiết yếu trong việc nâng cao nhận thức và hiểu biết của cộng đồng.

Công cụ học tập tự tùy chỉnh nội dung theo trình độ của học sinh đã tạo ra hệ thống học tập thích ứng cá nhân hóa Những ứng dụng này không chỉ nâng cao trải nghiệm học tập mà còn giúp phổ biến kiến thức, chứng minh tiềm năng của LLM trong lĩnh vực giáo dục (Rebolledo Font De La Vall & González Araya, 2023).

LLM (Large Language Models) đã trở thành một hệ thống trí tuệ nhân tạo tiên tiến, có khả năng xử lý và tạo ra giao tiếp bằng văn bản mạch lạc cho nhiều nhiệm vụ khác nhau, đánh dấu cột mốc quan trọng trong nghiên cứu AI Sự phát triển này chứng minh tiềm năng của các mô hình học máy trong việc xử lý các tác vụ ngôn ngữ phức tạp, vốn trước đây chỉ thuộc về trí tuệ con người LLM đạt được khả năng hiểu và tạo ngôn ngữ nhờ vào việc đào tạo hàng tỷ tham số trên lượng lớn dữ liệu văn bản Khi LLM ngày càng được áp dụng rộng rãi, các vấn đề đạo đức và ý nghĩa xã hội trở nên cấp thiết, đặc biệt là khả năng dịch và đơn giản hóa văn bản phức tạp, góp phần vào tính toàn diện và khả năng tiếp cận Tuy nhiên, điều này cũng đặt ra mối lo ngại về quyền riêng tư, thành kiến và khả năng bị lạm dụng, do đó, cần có nghiên cứu và đối thoại liên tục trong cộng đồng khoa học để đảm bảo việc sử dụng các mô hình này một cách có trách nhiệm.

Chương trình đào tạo mở rộng cho phép LLM hiểu các mô hình ngôn ngữ tinh tế và thông tin ngữ cảnh, tạo ra phản hồi chính xác và phù hợp với ngữ cảnh, giúp tương tác trở nên tự nhiên và trực quan Khả năng khái quát hóa của LLM biến chúng thành công cụ mạnh mẽ cho nhiều ứng dụng, từ chatbot và trợ lý ảo đến phân tích tài liệu pháp lý và tạo nội dung tự động Việc tích hợp các hệ thống này vào công nghệ hàng ngày diễn ra liền mạch và hiệu quả, mang lại cuộc chuyển đổi cách mạng với LLM có hiệu suất gần giống con người trong nhiều nhiệm vụ LLM đã trở thành hệ thống trí tuệ nhân tạo tiên tiến, có khả năng xử lý và tạo ra văn bản giao tiếp mạch lạc cho nhiều ứng dụng khác nhau.

Tiềm năng của LLM không chỉ dừng lại ở các ứng dụng hiện tại mà còn mở ra khả năng phức tạp hơn trong tương lai Các nhà nghiên cứu đang nỗ lực nâng cao khả năng diễn giải và độ tin cậy của LLM, biến chúng thành những công cụ đáng tin cậy và hiệu quả hơn Sự phát triển của các mô hình này hướng tới một tương lai mà AI có thể cộng tác với con người một cách liền mạch hơn.

Các mô hình ngôn ngữ lớn (LLM) đang cung cấp hỗ trợ quan trọng trong quá trình ra quyết định và thúc đẩy sáng tạo Sự phát triển của LLM hứa hẹn sẽ tạo ra một làn sóng đổi mới, ảnh hưởng đến nhiều lĩnh vực và thay đổi cách chúng ta tương tác với công nghệ (Hadi et al., 2023).

Các LLM nổi bật

Kể từ khi phát hành ChatGPT vào tháng 11 năm 2022, các mô hình ngôn ngữ lớn (LLM) đã thu hút sự chú ý đáng kể nhờ vào hiệu suất vượt trội trong nhiều tác vụ ngôn ngữ tự nhiên Một ví dụ điển hình là GPT-4 của OpenAI, không chỉ phục vụ cho xử lý ngôn ngữ mà còn hỗ trợ các nhiệm vụ thực tế Hệ thống Co-Pilot của Microsoft có khả năng thực hiện các hướng dẫn của con người trong những nhiệm vụ phức tạp, bao gồm cả việc hình thành lập luận nhiều bước và trích xuất thông tin từ mạng.

Sự phát triển của các mô hình ngôn ngữ lớn như GPT-4 đã mang lại khả năng xử lý các tác vụ ngôn ngữ phức tạp, không chỉ giới hạn trong việc tạo văn bản và hội thoại Những mô hình này giờ đây có khả năng hiểu bối cảnh, sắc thái và tài liệu tham khảo văn hóa, làm cho chúng trở thành công cụ mạnh mẽ trong ngành Theo nghiên cứu của Naveed et al (2024), khả năng thích ứng với các nhiệm vụ mới đã tạo ra sự thay đổi lớn trong cách thức ứng dụng LLM, như hệ thống Co-Pilot của Microsoft, cho thấy khả năng thực hiện lý luận nhiều bước Những tiến bộ này chứng minh sự đầu tư vào nghiên cứu và phát triển nhằm nâng cao khả năng hiểu và phản hồi ngôn ngữ con người của các mô hình này.

Sự phát triển từ PLM lên LLM đánh dấu sự ra đời của rất nhiều chatbot được thể hiện trong hình 2

Hình 3: Sự phát triển của LLM và Chatbot

Mô hình GPT của OpenAI nổi bật toàn cầu nhờ tính năng đào tạo trước, cho phép dự đoán từ tiếp theo trong chuỗi văn bản dựa trên các từ trước đó, điều này rất quan trọng trong xử lý ngôn ngữ tự nhiên Ngoài GPT, còn có các mô hình khác như Gemini (trước đây là Bard), BingAI và LLaMA Đào tạo trước đã đóng vai trò then chốt trong các đột phá trong NLP, giúp các mô hình hiểu rõ sự phức tạp của ngôn ngữ và thực hiện nhiều nhiệm vụ một cách trôi chảy Quá trình này liên quan đến việc cung cấp cho mô hình một kho văn bản khổng lồ, từ đó giúp nó học hỏi và xây dựng sự hiểu biết sâu sắc về các mẫu ngôn ngữ.

Sản phẩm nổi bật nhất của OpenAI hiện nay là GPT-3.5, một trong những mô hình ngôn ngữ lớn (LLM) được đào tạo trước lớn nhất cho đến nay Với dữ liệu đào tạo phong phú, GPT-3.5 có khả năng thực hiện nhiều nhiệm vụ xử lý ngôn ngữ tự nhiên (NLP) chỉ với một vài ví dụ, đáp ứng nhu cầu người dùng một cách hiệu quả (Ray, 2023) Quá trình đào tạo mở rộng này giúp GPT-3.5 có khả năng khái quát ấn tượng từ những lời nhắc hạn chế và thực hiện các nhiệm vụ trong nhiều lĩnh vực khác nhau.

Năm 2023, dữ liệu đào tạo mạnh mẽ của GPT-3.5 đã chứng tỏ tính linh hoạt, cho phép đáp ứng nhiều yêu cầu người dùng và thúc đẩy nghiên cứu mở rộng khả năng của các mô hình NLP Với khối lượng dữ liệu lớn, các mô hình GPT tiên tiến có khả năng nhận diện và khái quát nhiều mẫu ngôn ngữ, bao gồm cú pháp, ngữ pháp và ngữ nghĩa Tại Việt Nam, VinAI thuộc VinGroup đã phát triển Phở GPT, một mô hình mã nguồn mở được huấn luyện với dữ liệu tiếng Việt, nhằm tạo ra khả năng hiểu và viết tự nhiên cho người Việt Vào ngày 27/12, VinBigdata cũng thuộc VinGroup đã ra mắt ứng dụng “ChatGPT phiên bản tiếng Việt” - ViGPT, phục vụ người dùng cuối Việc bản địa hóa các mô hình ngôn ngữ lớn (LLM) cho các ngôn ngữ và nền văn hóa cụ thể là bước quan trọng để công nghệ trở nên dễ tiếp cận và hiệu quả hơn toàn cầu Phát triển Phở GPT đánh dấu tiến bộ trong việc chuyển đổi LLM sang các ngôn ngữ không phải tiếng Anh, giúp hiểu rõ hơn các sắc thái và phong cách độc đáo của tiếng Việt.

Việc phát triển các mô hình ngôn ngữ khu vực tại Việt Nam, như ViGPT của VinBigdata, cho thấy nỗ lực đáng kể trong việc phục vụ người dùng nói tiếng Việt Những sáng kiến này không chỉ giúp vượt qua rào cản ngôn ngữ mà còn khẳng định tiềm năng toàn cầu của các mô hình ngôn ngữ lớn (LLM) trong việc mở rộng phạm vi tiếp cận và nâng cao tiện ích cho người dùng.

Tiềm năng ứng dụng của LLM trong giáo dục

LLM đã tạo ra sự thay đổi mạnh mẽ trong ngôn ngữ học tính toán và nhiều lĩnh vực khác nhờ khả năng xử lý tiên tiến Sự kết hợp giữa LLM và các ngành như tin sinh học, tài chính và luật đã mở ra những ứng dụng mới Trong tài chính, LLM đang cách mạng hóa việc phân tích dữ liệu thị trường bằng cách giải thích tài liệu và xu hướng phức tạp Trong lĩnh vực pháp lý, LLM tự động hóa phân tích án lệ, giảm tải công việc cho chuyên gia và nâng cao khả năng tiếp cận hỗ trợ pháp lý Ngoài ra, LLM còn hỗ trợ trong các ngành công nghiệp sáng tạo như viết kịch bản, sáng tác nhạc và thiết kế trò chơi, chứng tỏ sức mạnh biến đổi và tiềm năng đổi mới của chúng trong nhiều lĩnh vực khoa học và kỹ thuật.

Mô hình ngôn ngữ lớn (LLM) như GPT của OpenAI đã chứng tỏ khả năng vượt trội trong xử lý ngôn ngữ tự nhiên, với hiệu suất cao trong việc hiểu và tạo ra văn bản giống con người Thành công này đã kích thích một lượng lớn nghiên cứu về công nghệ LLM Sự phát triển nhanh chóng của công nghệ và những đột phá trong nghiên cứu khoa học đã tạo ra nhu cầu ngày càng tăng trong việc nhìn nhận bức tranh toàn cảnh về những tiến bộ trong nhiều lĩnh vực khác nhau (Naveed et al., 2024).

Các mô hình ngôn ngữ lớn (LLM) như GPT-4 của OpenAI đang trở thành công cụ hữu ích cho nhiều nhiệm vụ, bao gồm viết tài liệu, trình bày công việc, viết mã và chẩn đoán sức khỏe Những LLM đa phương thức này được tích hợp nhanh chóng vào các ứng dụng để nâng cao năng suất và cải thiện khả năng tương tác thông qua việc trả lời câu hỏi một cách hiệu quả.

26 ngữ với công nghệ (B Li et al., 2023) Do đó, LLM đã trở thành nền tảng cơ bản cho sự phát triển của giai đoạn mới trong công nghệ AI

Tiện ích của LLM đã mở rộng ra nhiều ứng dụng thực tế, ảnh hưởng trực tiếp đến hoạt động hàng ngày của con người Trong lĩnh vực tài liệu, LLM tự động hóa việc tạo hướng dẫn kỹ thuật và hướng dẫn sử dụng, giúp quy trình trở nên hợp lý và thông tin được cung cấp một cách nhất quán Các bài thuyết trình và báo cáo hiện nay được hỗ trợ bởi LLM, cho phép sắp xếp nội dung và đề xuất cải tiến dựa trên dữ liệu tương tác của khán giả Trong phát triển phần mềm, LLM hoạt động như một trợ lý mã hóa, cung cấp đề xuất và gỡ lỗi mã, nâng cao năng suất cho nhà phát triển Trong chăm sóc sức khỏe, LLM hỗ trợ chuyên gia y tế bằng cách đưa ra đánh giá sơ bộ dựa trên triệu chứng mô tả bằng ngôn ngữ tự nhiên Những tiến bộ này không chỉ nâng cao hiệu quả mà còn giúp dân chủ hóa công nghệ, cho phép người dùng tương tác với hệ thống phức tạp qua giao diện đàm thoại đơn giản Việc tích hợp LLM đa phương thức, như GPT-4, vào hệ thống điều khiển phụ càng chứng minh sự tương tác liền mạch giữa con người và AI, tạo điều kiện tăng năng suất thông qua xử lý ngôn ngữ tự nhiên.

Trong lĩnh vực giáo dục, LLM đang cách mạng hóa trải nghiệm học tập thông qua dịch vụ dạy kèm và hỗ trợ cá nhân hóa cho sinh viên Các mô hình này có khả năng thích ứng và khái quát hóa kiến thức, tạo ra môi trường học tập tương tác phù hợp với nhu cầu riêng của học sinh Chẳng hạn, LLM hỗ trợ học ngôn ngữ bằng cách tham gia thực hành đàm thoại và sửa lỗi ngữ pháp trong thời gian thực Đặc biệt trong giáo dục STEM, LLM giúp người học hiểu các khái niệm phức tạp bằng cách chia nhỏ thông tin thành những giải thích dễ hiểu Tác động của LLM đối với giáo dục được khẳng định qua các nghiên cứu thực nghiệm về kết quả học tập Ngoài khả năng khái quát hóa và thích ứng tốt hơn, LLM còn sở hữu những khả năng nổi bật như lý luận, lập kế hoạch, ra quyết định, và học tập trong nhiều bối cảnh khác nhau Những khả năng này xuất phát từ quy mô khổng lồ của LLM, giúp thu nạp và huấn luyện hiệu quả hơn (Minaee et al., 2024).

Với sự gia tăng quan tâm đến LLM trong giáo dục, nhiều nghiên cứu đã được thực hiện trên toàn cầu, trong đó một nghiên cứu của nhóm tác giả thuộc trường Đại học Luật Minnesota đã đánh giá hiệu suất của ChatGPT Nghiên cứu này tập trung vào việc trả lời 95 câu hỏi trắc nghiệm và 12 câu hỏi tự luận liên quan đến bốn môn học cấp đại học trong khoa luật Kết quả nghiên cứu đã chỉ ra những thông tin đáng chú ý về khả năng của ChatGPT trong lĩnh vực giáo dục.

ChatGPT đã đạt điểm C+ trong bài kiểm tra tương đương sinh viên đại học (Choi et al., 2023) và được thử nghiệm trong kỳ thi trung học ở Hà Lan môn Ngôn ngữ Anh, với kết quả trung bình là 7,18, tương đương với điểm trung bình của học sinh trung học tại đây (De Winter, 2023).

Nghiên cứu của tác giả Đào Xuân Quý đánh giá hiệu suất của LLM trong bài kiểm tra Sinh học THPT cho thấy ChatGPT đạt độ chính xác 71% với câu hỏi ghi nhớ và 61,82% với câu hỏi thông hiểu Kết quả này chứng tỏ khả năng của ChatGPT trong việc nắm bắt và làm sáng tỏ các khái niệm môn học (Xuan-Quy et al., 2023) Những nghiên cứu này nhấn mạnh tiềm năng của LLM như một công cụ giáo dục, có khả năng nâng cao phương pháp giảng dạy truyền thống và cung cấp trải nghiệm học tập cá nhân hóa, mở rộng.

Khoảng trống nghiên cứu

Nghiên cứu về Mô hình Ngôn ngữ Lớn (LLM) đã chỉ ra những hạn chế của công nghệ này, cần thiết phải có thêm nghiên cứu để khắc phục Các cải tiến cho LLM được đề xuất thông qua việc đào tạo theo nhiệm vụ cụ thể và mệnh lệnh tốt hơn Tuy nhiên, việc nâng cao khả năng của LLM để thực hiện các nhiệm vụ đa dạng với hiệu suất tương đương con người đòi hỏi thời gian đào tạo lâu dài, phần cứng mở rộng và chi phí vận hành cao (Naveed et al., 2024) Những thách thức này nhấn mạnh sự cần thiết phải tối ưu hóa chiến lược triển khai và đào tạo mô hình nhằm nâng cao hiệu quả và tiết kiệm chi phí Do đó, phát triển các mô hình nhẹ hơn mà vẫn duy trì hiệu suất cao và giảm nhu cầu tính toán là mục tiêu quan trọng của các nhà nghiên cứu để làm cho công nghệ LLM trở nên dễ tiếp cận hơn (Ding et al.).

Việc áp dụng LLM trong giáo dục gặp phải một số thách thức, trong đó điều quan trọng là cần thực hiện nhiều tinh chỉnh đáng kể với mô hình nền tảng để phù hợp với nhu cầu cụ thể của lĩnh vực này.

Việc đào tạo các mô hình ngôn ngữ lớn (LLM) để đáp ứng mục tiêu giáo dục là một thách thức lớn do yêu cầu đầu tư đáng kể về tính toán và chuyên môn kỹ thuật Để tùy chỉnh LLM cho mục đích giáo dục, cần có sự hợp tác liên ngành, kết hợp giữa phương pháp sư phạm, khoa học nhận thức và trí tuệ nhân tạo Hơn nữa, việc ứng dụng LLM trong giáo dục cần có giải pháp xử lý sự cố, vì đôi khi các mô hình này cung cấp thông tin không chính xác do hiện tượng ảo giác, mặc dù đã được đào tạo bài bản.

Mặc dù LLM có một số nhược điểm, nhưng nó cũng mở ra cơ hội nghiên cứu để phát triển các mô hình và chiến lược đào tạo hiệu quả hơn trong giáo dục Công nghệ này có khả năng thực hiện yêu cầu và phản hồi chính xác, vì vậy việc ứng dụng nó để hỗ trợ xây dựng câu hỏi kiểm tra và đánh giá kiến thức của sinh viên là cần thiết Việc tạo câu hỏi thủ công là một quá trình phức tạp, đòi hỏi kinh nghiệm và nguồn lực của nhiều giáo viên, điều này cản trở việc phát triển các hoạt động giáo dục khác Để giảm thiểu thời gian xây dựng câu hỏi và đáp ứng nhu cầu cung cấp câu hỏi mới liên tục, kỹ thuật tạo câu hỏi tự động (AQG) dựa trên AI đang được nghiên cứu tại nhiều quốc gia phát triển và đang phát triển.

Trong nghiên cứu về việc ứng dụng các mô hình ngôn ngữ lớn (LLMs) để tạo ngân hàng câu hỏi môn học, nhóm nghiên cứu nhận thấy rằng tỉ lệ ứng dụng LLMs trên thế giới rất cao, nhưng tại Việt Nam vẫn còn hạn chế Đặc biệt, chưa có nghiên cứu nào sử dụng LLM để tạo ngân hàng câu hỏi bằng tiếng Việt ở bậc đại học Do đó, nghiên cứu này sẽ khảo sát và so sánh các mô hình ngôn ngữ lớn hiện có, từ đó chọn ra mô hình phù hợp với điều kiện tại Học viện Ngân Hàng Chúng tôi sẽ tìm kiếm các mẫu câu lệnh (prompt) thích hợp cho môn Tài chính doanh nghiệp và khảo sát ý kiến của các chuyên gia Mục tiêu là xây dựng kỹ thuật prompt và áp dụng để tạo câu hỏi cho môn TCDN1, phù hợp với phạm vi của Học viện Ngân Hàng.

CHƯƠNG 3: LỰA CHỌN MÔ HÌNH NGÔN NGỮ LỚN, KỸ THUẬT PROMPT VÀ ÁP DỤNG TẠO NGÂN HÀNG CÂU HỎI

MÔN TÀI CHÍNH DOANH NGHIỆP I

▪ 3.1 Lựa chọn mô hình ngôn ngữ lớn

Trong bối cảnh hiện nay, nhiều mô hình ngôn ngữ lớn tiên tiến như ChatGPT, BingAI và Gemini đã xuất hiện và có thể ứng dụng rộng rãi trong giáo dục Mỗi mô hình mang theo những ưu điểm và nhược điểm riêng biệt Để lựa chọn mô hình ngôn ngữ lớn phù hợp với thực tế của Học viện Ngân hàng, chúng tôi đã tiến hành nghiên cứu và thu thập kết quả để so sánh các mô hình này.

Bảng 2: So sánh trực quan các mô hình ngôn ngữ lớn phổ biến hiện nay

(Nguồn - Nhóm tác giả - nghiên cứu cập nhật cuối cùng ngày 31/3)

Tính năng chính Đầu ra

Lập trình Xử lí hình ảnh Đọc file Kết nối

Miễn phí Không Cơ bản Không Không Không Khá tốt Trung tính, phổ thông

Gemini Miễn phí Không Có Có Không Có Trung bình

Sớm cập nhật Có Sớm cập nhật Có Kém

Thân thiện, nhưng đôi lúc hơi quá mức

Có Không Không Có Không Tốt Thân thiện, hữu ích

20$/thá ng Có Có Có Có Có Tốt

ChatGPT Plus và Claude là hai lựa chọn tiềm năng cho người dùng, nhưng ChatGPT Plus có mức phí cao là 20$/tháng, trong khi Claude lại bị hạn chế về mặt địa lý.

Mục tiêu chính của nghiên cứu này là xây dựng một ngân hàng câu hỏi, trong đó hai yếu tố quan trọng được xem xét là chất lượng đầu ra và tính sáng tạo của từng mô hình khi sử dụng cùng một loại đầu vào.

Hình 4: Xếp hạng các mô hình ngôn ngữ lớn

Theo bảng xếp hạng của Hugging Face, ChatGPT hiện là mô hình ngôn ngữ được xếp hạng cao nhất Sau khi so sánh hai bảng dữ liệu, nhóm nghiên cứu đã quyết định chọn ChatGPT làm mô hình cho nghiên cứu này.

Hình 5: Bảng giá API từ OpenAI

Với bảng giá API trên, để phù hợp với đề tài nghiên cứu và tài chính, nhóm nghiên cứu sẽ tiến hành sử dụng mô hình Chat GPT 3.5

ChatGPT 3.5 đã được nghiên cứu và chứng minh có khả năng tạo ra văn bản chất lượng cao, tương tự như văn bản do con người viết.

ChatGPT 3.5 hiện đang thu hút 180,5 triệu người dùng, trong đó có 100 triệu người dùng hoạt động hàng tuần và đạt 1,8 tỷ lượt truy cập trang web (Meer, 2024) Những con số này chứng tỏ mức độ phổ biến và độ tin cậy cao của công cụ này.

Prompt Engineering và tầm quan trọng

Prompt là phương pháp giao tiếp và tương tác với các mô hình ngôn ngữ lớn, nơi bạn chỉ cần nhập yêu cầu dưới dạng văn bản để nhận được câu trả lời từ LLM.

Hình 6: Nội dung kỹ thuật viết Prompt cơ bản

Khi bạn đưa ra một yêu cầu chung mà không áp dụng kỹ thuật Prompt, ChatGPT sẽ phản hồi bằng một câu trả lời có cấu trúc rõ ràng Trong câu đầu tiên, nó sẽ lặp lại câu hỏi của bạn để tạo sự liên kết và rõ ràng trong giao tiếp.

Bài viết này trình bày 32 từ đồng nghĩa và cung cấp câu trả lời chứa kiến thức ngôn ngữ Cuối cùng, lớp tóm tắt sẽ in đậm các ý chính, tóm gọn câu trả lời cốt lõi trong hai đến ba câu (Čavojský et al., 2023).

Hình 7: Ví dụ minh họa về yêu cầu gửi ChatGPT mà không sử dụng kỹ thuật viết

Hình 8: Kết quả ví dụ thực tế đúng với lý thuyết

Việc học Prompt là cần thiết và quan trọng, điều này đã được chứng minh qua khảo sát và phân tích dữ liệu từ hai nhóm đối tượng: những người có kỹ năng viết Prompt.

Trong một nghiên cứu, chúng tôi đã chia thành hai nhóm: một nhóm có kỹ năng viết Prompt và một nhóm không Cả hai nhóm đều được giao cùng một bài toán và yêu cầu lên ý tưởng cho một nhiệm vụ cụ thể Kết quả cho thấy sự khác biệt rõ rệt giữa hai nhóm trong khả năng tạo ra ý tưởng và giải quyết vấn đề.

Bảng 3: Đánh giá kết quả khảo sát chứng minh tầm quan trọng của Prompt

Tiêu chí Người có kĩ năng viết Prompt Người không có kĩ năng viết

Sự liên quan Đáp ứng chính xác yêu cầu, nội dung bám sát chủ đề, thông tin chính xác và đầy đủ

Nội dung lệch lạc chủ đề, thông tin lan man, thiếu kiểm chứng, tiềm ẩn sai sót và thiếu hụt

Sự chi tiết Cung cấp đầy đủ thông tin thiết yếu, giải thích rõ ràng, chi tiết, kèm theo ví dụ minh họa khi cần thiết

Thiếu hụt thông tin thiết yếu, giải thích mơ hồ, thiếu ví dụ minh họa cụ thể

Cấu trúc Sắp xếp logic, mạch lạc, dễ tiếp thu Chia nhỏ nội dung thành các phần hợp lý, mỗi phần có tiêu đề tóm tắt rõ ràng

Bố cục lộn xộn, thiếu logic, không có tiêu đề rõ ràng cho từng phần

Tính sáng tạo Sử dụng ngôn ngữ trau chuốt, sáng tạo, thu hút người đọc Đưa ra ý tưởng mới mẻ, độc đáo, khơi gợi cảm hứng

Ngôn ngữ đơn điệu, thiếu điểm nhấn, ý tưởng cũ kỹ, thiếu sáng tạo

Prompt không chỉ giúp AI cung cấp câu trả lời một cách toàn diện và chặt chẽ, mà còn tạo điều kiện cho người dùng dễ dàng tiếp cận và hiểu rõ nội dung từ những câu trả lời của AI.

Nghiên cứu mẫu Prompt trong việc tạo các dạng câu hỏi phổ biến

Theo hiểu biết hiện tại của chúng tôi, có rất nhiều mẫu Prompt như: TAG, RACE, RTF, CTF, … Ví dụ về một vài mẫu Prompt

Prompt: Bạn là sinh viên đại học, viết một bài luận tóm tắt về mô hình ngôn ngữ lớn

Để chuẩn bị cho bài đánh giá mạng máy tính sắp tới, hãy tạo một bài kiểm tra với nhiều câu hỏi và các lựa chọn trả lời Mỗi câu hỏi nên có các lựa chọn rõ ràng và đánh dấu câu trả lời đúng để người tham gia dễ dàng nhận biết Việc này không chỉ giúp người học ôn tập kiến thức mà còn nâng cao khả năng hiểu biết về mạng máy tính.

Việc áp dụng các mẫu prompt trong từng trường hợp cụ thể có thể gây khó khăn cho người dùng Để giải quyết vấn đề này, chúng tôi đề xuất tạo ra một prompt dựa trên nguyên lý và tư duy của con người, giúp người dùng không cần tìm kiếm thêm công thức viết prompt "hiệu quả" Qua nghiên cứu các mẫu prompt hiện có, chúng tôi đã lọc và tách ra thành những yếu tố cụ thể để dễ dàng áp dụng.

Bảng 4: Các yếu tố trong Prompt

Để sử dụng Chat GPT hiệu quả, bạn cần mô tả nhiệm vụ mà AI thực hiện, thường bắt đầu bằng các động từ như: Tạo, Làm, và các động từ khác Đây là phần thiết yếu trong hầu hết các prompt để đảm bảo AI hiểu rõ yêu cầu của bạn.

Context Cung cấp thông tin về bối cảnh và mục tiêu nhiệm vụ

Input Mô tả chi tiết đặc điểm bối cảnh

Format Chỉ rõ định dạng mong muốn cho đầu ra, thường là những quy chuẩn đã được thống nhất và sử dụng

Example Đưa ra ví dụ mẫu hướng dẫn cụ thể để hướng dẫn AI, thường cho vào trong ngoặc đơn

Trong bối cảnh giáo dục tại Học viện Ngân hàng, việc xác định rõ vai trò của AI là rất quan trọng Người dùng cần phân tích và lựa chọn các yếu tố phù hợp để đạt được đầu ra kỳ vọng Đề tài nghiên cứu của chúng tôi sẽ tập trung vào việc thử nghiệm và tìm ra mẫu Prompt tối ưu nhất cho việc tạo câu hỏi trong giáo dục.

Nghiên cứu mẫu Prompt trong giáo dục

Chúng tôi đã lựa chọn và kết hợp các yếu tố từ bảng 2, sau đó tự kiểm tra và đánh giá kết quả của các LLM Quá trình này bao gồm việc thêm hoặc loại bỏ các yếu tố để xác định ảnh hưởng của chúng đến chất lượng kết quả trả về.

Để tối ưu hóa kết quả, chúng tôi đã lựa chọn 35 quả trả về tốt nhất, giữ lại những yếu tố cần thiết và loại bỏ những yếu tố không cần thiết Qua đó, chúng tôi xác định được kiểu Prompt phù hợp nhất cho từng loại câu hỏi Độ chi tiết và cụ thể của Prompt càng cao, thì đầu ra từ LLM càng chính xác và đáp ứng đúng mong muốn.

3.4.1 Đối với dạng câu hỏi trắc nghiệm

Prompt:= Role + Task + Context + Format

Role: Bạn là giảng viên [tên môn học]

Task: Hãy tạo [số lượng câu hỏi] câu

Context: [tên dạng bài tập] nội dung về [tên nội dung]

Example: (Đây là ví dụ tôi muốn bạn bắt chước: [ví dụ cụ thể về dạng bài tập cần tạo]) Format: Trình bày output theo [tên định dạng]

3.4.2 Đối với dạng đúng - sai

Prompt:= Role + Task + Context + Example + Format

Role: Bạn là giảng viên [tên môn học]

Task: Giúp tôi tạo bài

Trong bài tập [tên dạng bài tập], có [số lượng nhận định] gồm [số nhận định đúng] nhận định đúng và [số nhận định sai] nhận định sai liên quan đến [tên nội dung] Tất cả nhận định được trình bày trong một đoạn Dòng xác định tính đúng/sai và giải thích cho từng nhận định sẽ được ghi ngay sau đó, bắt đầu bằng “TRẢ LỜI: ” (CHÚ Ý: Khoảng trắng sau dấu hai chấm) kèm theo đáp án và giải thích phù hợp.

3.4.3 Đối với dạng bài tập

Prompt:= Task + Context + Input + Tone

Task: Hãy tạo các bài tập với số liệu cụ thể

Context: Về [tên dạng bài toán]

Input: Đề bài bao gồm [dữ kiện đầu bài] [thông tin chi tiết]

Tone: Bài toán bạn viết với lời văn trong doanh nghiệp thực tế ([…])

Áp dụng các mẫu Prompt tạo câu hỏi với môn Tài chính doanh nghiệp I

3.5.1 Lý do chọn môn Tài chính doanh nghiệp I

Xây dựng ngân hàng câu hỏi là công cụ quan trọng giúp tổ chức kiểm tra và thi kết thúc học phần hiệu quả Dựa vào chuẩn đầu ra và nội dung bài học, chúng ta xác định các dạng câu hỏi phù hợp, được sắp xếp theo từng chương với các mức độ nhận thức khác nhau, phù hợp với mục tiêu và kiến thức bài học Chúng tôi tiến hành nghiên cứu tạo câu hỏi cho môn “Tài chính doanh nghiệp I” bằng mô hình ngôn ngữ lớn ChatGPT 3.5.

Đầu tiên, cần kiểm tra và đánh giá hiệu quả của các mẫu Prompt trong "Tài chính doanh nghiệp I" do có nhiều loại câu hỏi đa dạng như trắc nghiệm, nhận định đúng - sai và bài tập.

- Thứ hai, “Tài chính doanh nghiệp I” là học phần phổ biến, được sử dụng giảng dạy ở nhiều khoa trong học viện

Nhóm nghiên cứu đã có kiến thức cơ bản về lĩnh vực tài chính doanh nghiệp Để tiến hành nghiên cứu, chúng tôi kết hợp hiểu biết cá nhân và tài liệu tham khảo, bao gồm giáo trình "Tài chính doanh nghiệp I" do Lê Thị Xuân chủ biên và sách bài tập liên quan.

Khóa học "Tài chính doanh nghiệp I" tại Học viện Ngân Hàng đã tham khảo các chuẩn đầu ra, cấu trúc đề cương, đề kiểm tra và đề thi liên quan Chúng tôi đã xây dựng một ngân hàng câu hỏi bao gồm ba dạng câu hỏi phổ biến thường gặp trong các bài kiểm tra và thi học kỳ, cụ thể là trắc nghiệm, nhận định đúng – sai và bài tập.

3.5.2 Tự đánh giá sơ bộ và tối ưu hóa sử dụng Chat GPT Áp dụng những mẫu Prompt trên với Chat GPT, chúng tôi thực hiện tự đánh giá sơ bộ chất lượng câu hỏi do ChatGPT tạo ra và hoạt động của nó bằng việc thử nghiệm tạo mỗi loại câu hỏi với số lượng Bảng 3.2

Bảng 5: Số lượng thử nghiệm với mỗi dạng câu hỏi

Giá trị thời gian của tiền

Ra quyết định đầu tư EOQ

50 câu/chương 20 câu/chương 5 câu/dạng 5 câu/dạng 5 câu/dạng

Số lượng người đánh giá: 3

Bảng 6: Thông tin người đánh giá

T Họ tên Khoa Kiến thức với bộ môn / học phần

Hệ thống thông tin quản lí Đã hoàn thành

2 Đỗ Tiến Oanh Hệ thống thông tin quản lí Đã hoàn thành

4 Lê Anh Tú Tài chính Đang học

Chúng tôi áp dụng kiến thức cá nhân và kết hợp với một số mô hình ngôn ngữ khác để đánh giá kết quả đầu ra của ChatGPT 3.5.

3.5.2.2 Kết quả đánh giá hoạt động của ChatGPT

Chúng tôi thực hiện đánh giá tổng quan về kết quả của ChatGPT 3.5, với bảng đánh giá được cập nhật đến ngày 14/3/2024, phản ánh sự cải tiến liên tục của ChatGPT.

Bảng 7: Đánh giá chất lượng câu hỏi (Đơn vị: %)

Giá trị thời gian của tiền

Ra quyết định đầu tư EOQ

Tổng 230 câu 20 câu/chương 20 câu 20 câu 10 câu

Thiếu dữ kiện để giải 3,48 4 0 25 60

Hình 9: Câu hỏi thiếu dữ kiện để giải

Hình 10: Câu hỏi với nội dung trùng nhau

(Nguồn – Nhóm tác giả) 3.5.3 Ứng dụng tạo đề kiểm tra tự động

Chúng tôi tiến hành ví dụ đối với chương 2: Giá trị thời gian của tiền a Câu hỏi trắc nghiệm

Prompt: Bạn là giảng viên môn tài chính doanh nghiệp

Hãy tạo 10 câu lựa chọn phương án đúng nhất nội dung về giá trị thời gian của tiền (Đây là ví dụ mà tôi muốn bạn bắt chước:

Giả sử lãi suất danh nghĩa là 10%/năm, Lãi suất thực trong trường hợp nào sẽ nhỏ nhất

A Kỳ hạn nhập lãi 1 năm

B Kỳ hạn nhập lãi 6 tháng

C Kỳ hạn nhập lãi 3 tháng

D Kỳ hạn nhập lãi 1 tháng

Trình bày output theo Aiken Format b Câu hỏi nhận định đúng - sai

Prompt: Đóng vai trò là giảng viên môn tài chính doanh nghiệp

Giá trị thời gian của tiền là một khái niệm quan trọng trong tài chính Đầu tiên, tiền có giá trị hơn khi nó được đầu tư sớm, vì thời gian cho phép nó sinh lời Thứ hai, lạm phát có thể làm giảm giá trị thực của tiền theo thời gian Tuy nhiên, một số người cho rằng tiền không mất giá trị theo thời gian, điều này là sai Ngoài ra, việc giữ tiền mặt không sinh lời trong thời gian dài cũng không phải là một chiến lược tài chính khôn ngoan Cuối cùng, giá trị của tiền không thay đổi theo thời gian là một quan niệm sai lầm.

(Đây là ví dụ tôi muốn bạn bắt chước:

1 Khi thời điểm phát sinh khoản tiền càng sớm thì giá trị hiện tại và giá trị tương lai của nó sẽ càng cao

GIẢI THÍCH: Thời điểm phát sinh khoản tiền càng sớm, tức là thời điểm đó càng gần với thời điểm hiện tại.)

Tất cả các nhận định cần được trình bày trong cùng một đoạn Dòng xác định tính đúng sai của mỗi nhận định phải ngay sau đó, bắt đầu bằng "TRẢ LỜI: " (Lưu ý có khoảng trắng sau dấu hai chấm), tiếp theo là câu trả lời và giải thích phù hợp.

Dưới đây là các bài tập môn tài chính doanh nghiệp 1 liên quan đến giá trị thời gian của tiền:1 Bài toán 1: Giả sử bạn đầu tư 10 triệu đồng vào một dự án với lãi suất hàng năm là 8% Hãy tính giá trị tương lai của khoản đầu tư sau 5 năm Bài toán 2: Nếu bạn muốn có 20 triệu đồng trong 3 năm tới, hãy tính số tiền bạn cần đầu tư ngay hôm nay với lãi suất 10% mỗi năm.2 Bài toán 3: Một công ty dự kiến nhận được 50 triệu đồng trong 4 năm tới Hãy tính giá trị hiện tại của khoản tiền này với lãi suất 6% hàng năm Bài toán 4: Bạn có 15 triệu đồng và muốn biết nó sẽ trở thành bao nhiêu sau 10 năm nếu được đầu tư với lãi suất 5% mỗi năm.

Dạng 1: Giá trị của lượng tiền đơn

Dạng 2: Giá trị hiện tại của chuỗi tiền tệ đều

Dạng 3: Giá trị tương lai của chuỗi tiền tệ đều

Dạng 4: Lập kế hoạch trả nợ

Bài toán bạn viết với lời văn trong doanh nghiệp thực tế (tình huống thực tế, doanh nghiệp, người…)

3.5.4 Đánh giá chất lượng câu hỏi a Công cụ đánh giá:

Chúng tôi đã chuẩn bị hai nhóm ngân hàng câu hỏi: một nhóm gồm các câu hỏi do ChatGPT 3.5 tạo ra, và nhóm còn lại bao gồm các câu hỏi từ sách "Hệ thống câu hỏi lý thuyết và bài tập tài chính".

Học viện Ngân Hàng đã tiến hành khảo sát với 40 câu hỏi từ hai nhóm khác nhau, được trộn lẫn để tạo sự đa dạng Chúng tôi đã thiết kế một form khảo sát, trong đó mỗi câu hỏi đưa ra hai lựa chọn: một là do con người tạo ra và hai là do ChatGPT tạo ra.

Hình 11: Mẫu bài kiểm tra mù

(Nguồn – Nhóm tác giả) Đối tượng thực hiện: Sinh viên Học viện Ngân hàng b Kỳ vọng kết quả

Trong khảo sát, tỷ lệ hoàn thành học phần sẽ được phân chia thành hai nhóm: 60% gồm giảng viên và sinh viên đã hoàn thành hoặc đang hoàn thành, và 40% là những người chưa học hoặc không tham gia Sự phân bổ này tạo cơ hội cho việc phân tích đa chiều và đánh giá các kết quả khác nhau từ hai nhóm chính.

Nhóm nghiên cứu của chúng tôi kỳ vọng rằng hơn 60% số câu hỏi do ChatGPT chuẩn bị sẽ được dự đoán là do con người tạo ra Để hiểu rõ hơn về kết quả này, cần tiến hành phân tích chi tiết từng nhóm.

- Nhóm 1: Giảng viên khoa Tài chính Học viện Ngân hàng

- Nhóm 2: Sinh viên đã và đang hoàn thành học phần

● Đối với đối tượng là giảng viên: Phân tích nội dung câu hỏi, kiểm tra độ phù hợp với chương trình

Nhóm người đã hoàn thành học phần có thể phân tích nội dung câu hỏi, đánh giá mức độ khó và khả năng áp dụng kiến thức đã học để giải quyết vấn đề.

Từ đó chỉ ra những câu hỏi do ChatGPT tạo ra còn tồn tại

Lí thuyết LangChain

LangChain là một framework chuyên dụng cho việc triển khai các mô hình ngôn ngữ lớn (LLMs) trong ứng dụng thực tế Nó cung cấp các công cụ và thư viện mạnh mẽ, giúp các nhà phát triển dễ dàng tích hợp LLMs vào các ứng dụng của mình, từ chatbot thông minh đến hệ thống phân tích dữ liệu phức tạp.

LangChain cung cấp các module cho phép bạn quản lý nhiều khía cạnh cụ thể trong tương tác với lại LLMs, trong đó các module chính bao gồm (Non, 2023):

Model I/O là một module trong LangChain, cho phép tương tác với bất kỳ mô hình ngôn ngữ nào Nó thực hiện các tác vụ quan trọng như quản lý đầu vào cho mô hình và trích xuất thông tin từ đầu ra của mô hình đó.

Đầu vào được định nghĩa bằng Prompt, là tập hợp các hướng dẫn hoặc thông tin mà người dùng cung cấp, giúp mô hình ngôn ngữ hiểu rõ ngữ cảnh và tạo ra câu trả lời mạch lạc.

Phần xử lý trong LangChain bao gồm hai loại chính là Mô hình Ngôn ngữ LLMs, nhận một chuỗi đầu vào và trả về chuỗi kết quả, và Mô hình Chat, nhận danh sách tin nhắn chat và trả về một tin nhắn chat.

Module này cũng tích hợp các output parser, giúp chuyển đổi kết quả đầu ra từ văn bản thô thành thông tin có tổ chức và cấu trúc rõ ràng.

Retrieval là một yếu tố quan trọng trong việc tích hợp dữ liệu chuyên biệt của người dùng vào giai đoạn generation của mô hình ngôn ngữ thông qua Retrieval Augmented Generation (RAG) LangChain cung cấp nhiều chức năng hỗ trợ như document loaders, document transformers, mô hình nhúng văn bản và các thuật toán truy xuất, cùng với phương pháp lưu trữ dữ liệu dưới dạng vector, nhằm đảm bảo việc sử dụng dữ liệu hiệu quả và phù hợp với ngữ cảnh.

Hình 15: Sơ đồ Retrieval module

Chains là thành phần quan trọng trong việc thiết kế các xử lý phức tạp bằng cách kết nối các LLM với nhau hoặc với các thành phần khác Cách tiếp cận này không chỉ đơn giản mà còn hiệu quả, giúp phát triển các ứng dụng phức tạp và nâng cao khả năng bảo trì Một ví dụ về chuỗi đơn giản là quá trình lấy thông tin đầu vào từ người dùng, chuyển đổi thành định dạng của PromptTemplate, xử lý với LLM, và tổng hợp kết quả cuối cùng.

Agents đóng vai trò quan trọng trong việc ứng dụng và sử dụng LLM như một công cụ suy luận, giúp xác định thứ tự hành động một cách linh hoạt LangChain cung cấp nhiều loại Agents kết hợp với các Tools đa dạng, cho phép Agent tương tác với các tiện ích chung, Chains và các Agent khác, tạo nên một framework mạnh mẽ để xử lý các tác vụ phức tạp.

Memory là yếu tố quan trọng trong các ứng dụng giao diện đối thoại, giúp duy trì ngữ cảnh tương tác của người dùng bằng cách đưa luồng hội thoại trước đó vào mô hình ngôn ngữ lớn (LLM) LangChain cung cấp nhiều tiện ích để tích hợp memory vào hệ thống, hỗ trợ các hoạt động cơ bản như đọc và viết, đảm bảo hệ thống có thể truy cập vào các tin nhắn trước đó và duy trì cập nhật liên tục.

Callbacks là thành phần quan trọng giúp đăng ký các sự kiện để khai thác các giai đoạn khác nhau của LLM, hỗ trợ cho các tác vụ như logging, monitoring và streaming Các sự kiện này được kích hoạt bởi các CallbackHandler tương ứng với từng sự kiện đã đăng ký Ngoài ra, LangChain còn cung cấp một số handler tích hợp sẵn như StdOutCallbackHandler, giúp ghi lại tất cả các sự kiện trong quá trình thực thi.

4.1.2 Cách tạo Prompt trong LangChain

Để sử dụng LangChain với Python, bạn cần cài đặt phiên bản Python mới nhất và thực hiện lệnh sau: pip install langchain LangChain cung cấp một mẫu Prompt được tạo sẵn dưới dạng văn bản có cấu trúc, giúp người dùng dễ dàng triển khai.

LangChain yêu cầu ít nhất một tích hợp để hoạt động hiệu quả, với OpenAI là một ví dụ điển hình Để sử dụng các API LLM của OpenAI, người dùng cần tạo tài khoản trên trang web OpenAI và lấy khóa truy cập API Sau đó, hãy cài đặt gói Python của OpenAI bằng lệnh `pip install openai` và nhập khóa truy cập để kết nối với các API, như trong đoạn mã: `from langchain.llms import OpenAI` và `llm = OpenAI(openai_api_key=" ")`.

Nhập mẫu Prompt trong LangChain là bước quan trọng sau khi hoàn thành các bước cơ bản Đoạn mã sau đây minh họa cách thực hiện điều này: từ langchain import PromptTemplate, prompt_template = PromptTemplate.from_template(

"Tell me an {adjective} fact about {content}."

) prompt_template.format(adjective="interesting", content="zebras")

"Tell me an interesting fact about zebras."

Ngày đăng: 04/03/2025, 03:03

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN