1. Trang chủ
  2. » Luận Văn - Báo Cáo

tiểu luận đề tài ứng dụng công cụ fpt text to speech và invideo ai trong xây dựng học liệu số

34 0 0
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Nội dung

TÀI ỨNG DỤNG CÔNG CỤ FPT TEXT TO SPEECHVÀ INVIDEO AI TRONG XÂY DỰNG HỌC LIỆU SỐHỌC PHẦN: COMP1810 – TRÍ TUỆ NHÂN TẠO TRONG GIÁO DỤCSinh viên thực hiện: Nhóm 1ALớp học phần: COMP181001Giả

Trang 1

TÀI

ỨNG DỤNG CÔNG CỤ FPT TEXT TO SPEECHVÀ INVIDEO AI TRONG XÂY DỰNG HỌC LIỆU SỐ

HỌC PHẦN: COMP1810 – TRÍ TUỆ NHÂN TẠO TRONG GIÁO DỤC

Sinh viên thực hiện: Nhóm 1ALớp học phần: COMP181001

Giảng viên hướng dẫn: TS Trần Sơn Hải

Thành phố Hồ Chí Minh, ngày 27 tháng 12 năm 2023

Trang 3

MỤC LỤC

LỜI MỞ ĐẦU 4

NỘI DUNG 6

CHƯƠNG 1: KHÁI LƯỢC VỀ AI TRONG GIÁO DỤC 6

1 Khái niệm trí tuệ nhân tạo 6

2 Các ứng dụng trí tuệ nhân tạo 6

3 Trí tuệ nhân tạo trong giáo dục 8

CHƯƠNG 2: TÌM HIỂU VỀ CÔNG CỤ FPT TEXT TO SPEECH(VOICEMAKER.FPT.AI) VÀ CÔNG CỤ LÀM VIDEO INVIDEO AI 9

1 Công cụ text to speech Voicemaker.fpt.ai 9

1.1 Giới thiệu về công cụ FPT Text to Speech (Voicemaker.fpt.ai) 9

1.2 Cách sử dụng công cụ FPT Text to Speech 10

1.3 Nhận xét, đánh giá về công cụ FPT Text to Speech 15

2 Công cụ Invideo AI 16

2.1 Giới thiệu về công cụ làm video Invideo AI 17

2.2 Cách sử dụng công cụ làm video Invideo AI 17

2.3 Nhận xét, đánh giá về công cụ làm video Invideo AI 20

3 Khảo sát hai công cụ FPT Text to Speech (Voicemaker.fpt.ai) và công cụ làm video Invideo AI 21

CHƯƠNG 3: ỨNG DỤNG CÔNG CỤ FPT TEXT TO SPEECH(VOICEMAKER.FPT.AI) VÀ CÔNG CỤ LÀM VIDEO INVIDEO AITRONG XÂY DỰNG HỌC LIỆU 22

1 Học liệu Video “Buổi bình minh của cách mạng công nghiệp” – Bài 2 Cáchmạng công nghiệp– Chương trình sách giáo khoa Lịch sử và Địa lí 8 (Chân trờisáng tạo) 22

2 Học liệu Text to Speech “Bài học về cách mạng công nghiệp” – Bài 2 Cáchmạng công nghiệp– Chương trình sách giáo khoa Lịch sử và Địa lí 8 (Chân trờisáng tạo) 22

3 Mẫu khảo sát Đánh giá công cụ FPT Text to Speech và Invideo AI trongxây dựng bài học Lịch sử 8 – Bài 2: Cách mạng công nghiệp 23

KẾT LUẬN 26

TÀI LIỆU THAM KHẢO 27

Trang 4

LỜI MỞ ĐẦU

Thế giới đã và đang diễn ra cuộc cách mạng công nghiệp 4.0 Cuộc cáchmạng này dựa trên nền tảng công nghệ số và tích hợp tất cả các công nghệ thông minhvới các yếu tố cốt lõi là: trí tuệ nhân tạo (AI), vạn vật kết nối (IoT) và dữ liệu lớn (BigData) Cuộc cách mạng này đã tạo nên bước phát triển nhảy vọt chưa từng thấy củalực lượng sản xuất và năng suất lao động, làm thay đổi vị trí cơ cấu các ngành sảnxuất, tạo nên một thế giới kết nối, hình thành các mối quan hệ cộng tác, các ngành sảnxuất phi vật chất đặc biệt là giáo dục ngày càng được nâng cao với nội dung, tích chấthình thức lao động hoàn toàn khác biệt.

Có thể thấy được rằng, cuộc cách mạng công nghiệp 4.0 đã tác động mạnh mẽđến đời sống của chúng ta trên tất cả các lĩnh vực, các ngành nghề, đặc biệt là giáodục Sản phẩm của cuộc cách mạng này, trí tuệ nhân tạo (AI) ngày càng được ứngdụng rộng rãi trong các hoạt động giáo dục ở các lớp, các cấp học AI đáp ứng nhu cầuhọc tập ngày càng cao, hiện đại hơn, làm thay đổi nền giáo dục của thời đại trong giáodục vô cùng quan trọng Sự hợp nhất của AI với hệ thống học tập kỹ thuật số ngày naytạo nên khái niệm học tập hoàn toàn mới Trí tuệ nhân tạo trong giáo dục đã cáchmạng hóa các phương pháp học tập truyền thống.

Việc ứng dụng trí tuệ nhân tạo trong giáo dục đã mang lại nhiều lợi ích cho cảngười dạy lẫn người học, như: sáng tạo nội dung dạy học và học tập một cách thôngminh, các nhân hoá việc học tập và giảng dạy, tự động hoá các nhiệm vụ, tạo khả năngtruy cập thích ứng, duy trì tác động tích cực của việc dạy học từ xa, hỗ trợ 24/7 với AIđàm thoại, hệ thống các phần mềm AI tạo tác dụng tích cực trong các kì thi

Có thể khẳng định, Trí tuệ nhân tạo (AI) đã cách mạng hóa lĩnh vực giáo dục,mở ra một kỷ nguyên mới về trải nghiệm học tập sáng tạo và cá nhân hóa Với cácthuật toán tiên tiến và thông tin chuyên sâu dựa trên dữ liệu, AI đã biến đổi cácphương pháp giảng dạy truyền thống, trao quyền cho học sinh và các nhà giáo dục.

Chính vì vai trò đặc biệt quan trọng và ứng dụng rộng rãi của trí tuệ nhân tạo(AI) trong giáo dục đã thôi thúc chúng tôi thực hiện đề tài nghiên cứu này, nhằm: Thứnhất, tìm hiểu trí tuệ nhân tạo và ứng dụng của nó, đặc biệt là trên lĩnh vực giáo dục.

Trang 5

Thứ hai, giới thiệu về tính năng, cách sử dụng của 2 công cụ sử dụng trí tuệ nhân tạolà

Trang 6

FPT Text to Speech và Invideo AI nhằm hổ trợ các hoạt động giáo dục trong nhàtrường Thứ ba, thông qua các khảo sát đã thực hiện trước đó để đánh giá tính hiệuquả của 2 công cụ trên khi ứng dụng vào môi trường giáo dục.

Trang 7

Hiện nay trí tuệ nhân tạo (AI) có một số hướng phát triển phổ biến, bao gồm:– Xử lý hình ảnh (Computer Vision)

– Xử lý ngôn ngữ tự nhiên (Natural Language Processing)– Xử lý tín hiệu âm thanh (Audio Signal Processing)– Xử lý dữ liệu lớn

2 Các ứng dụng trí tuệ nhân tạo

Trí tuệ nhân tạo hay còn gọi là AI (Artificial Intelligence) là cụm từ khá quenthuộc trong thời đại công nghệ số hiện nay Khi đề cập đến trí tuệ nhân tạo (AI) chúngta thường suy nghĩ đến những công nghệ tân tiến, máy móc hiện đại hay những conrobots thông minh Sự xuất hiện của trí tuệ nhân tạo đã giải quyết được nhiều nhu cầucủa con người trong nhiều lĩnh vực khác nhau của đời sống xã hội từ y tế, giáo dục,quân sự, sản xuất đến kinh doanh…

Trang 8

Hình 1 Ứng dụng của trí tuệ nhân tạo

(Nguồn: https://www.tma.vn/Hoi-dap/Cam-nang-nghe-nghiep/Tri-Tue-Nhan-Tao-La-Gi-He-Lo-Top-10-Ung- Dung-Cua-Tri-Tue-Nhan-Tao/66349 )

- Y tế: Hiện nay, trí tuệ nhân tạo bắt đầu được sử dụng rộng rãi trong y tế đem

lại nhiều lợi ích cho ngành y tế như chẩn đoán bệnh lý; nghiên cứu, phát triểndược tính thuốc (AIDD); tối ưu hóa phác đồ điều trị cho từng cá nhân; chămsóc khách hàng khi khám bệnh ở các bệnh viện… Một số thiết bị phổ biếnđược tạo ra bởi trí tuệ nhân tạo trong lĩnh vực y tế như iWatch, Fibit,Healthy.io,…

- Giáo dục: Trí tuệ nhân tạo đóng vai trò vô cùng quan trọng trong giáo dục Trí

tuệ nhân tạo đã góp phần tạo nên khái niệm học tập hoàn toàn mới và làm thayđổi các phương pháp học tập truyền thống, cá nhân hóa việc học tập như cácứng dụng học tập Onluyen.vn hay Duolingo.

- Giải trí: AI còn tham gia vào ngành công nghiệp giải trí giúp các nhà sản xuất

chương trình và đài truyền hình đề xuất những chương trình phù hợp cho từngcá nhân dựa trên tìm kiếm gần đây của họ Trong lĩnh vực điện ảnh, AI giúptăng cường hiệu ứng kỹ thuật số trong phim, tiết kiệm chi phí, đẩy nhanh quátrình trước và sau sản xuất Chẳng hạn, ứng dụng xử lý ngôn ngữ tự nhiên

Trang 9

(NLP) dùng để cấu trúc các phân cảnh trong kịch bản hoặc lên lịch trình quayphim tối ưu

Trang 10

hơn Các ứng dụng Apple Music và Spotify sử dụng AI “để tìm hiểu về môhình tương tác của người dùng, từ đó giới thiệu thể loại nhạc phù hợp với đúngngười và đúng thời điểm.

- Sản xuất: Trong sản xuất, người ta có thể sử dụng trí tuệ nhân tạo để lập kế

hoạch, thiết kế sản phẩm, thay thế lao động cơ móc giúp cải thiện hiệu quả sảnxuất, đảm bảo an toàn cho người lao động, tối ưu hóa các chi phí mà vẫn đảmbảo được chất lượng sản phẩm.

- Nông nghiệp: Lĩnh vực nông nghiệp cũng là một trong những ngành ứng dụng

AI từ rất sớm Một số lợi ích mà trí tuệ nhân tạo đã mang lại cho ngành nôngnghiệp gồm có: Đưa ra dự báo thời tiết thông qua các bộ cảm biến IoT; sử dụngrobots, cảm biến và máy bay không người lái để đánh giá điều kiện trồng trọt,gieo trồng hạt giống cây trồng;…

3 Trí tuệ nhân tạo trong giáo dục

Trí tuệ nhân tạo trong giáo dục là ứng dụng trí tuệ nhân tạo trong giảng dạy Ởđây, trí tuệ nhân tạo sẽ thay đổi vai trò của người lái đò, hầu hết các quốc gia, mô hìnhgiáo dục truyền thống là giáo viên truyền đạt kiến thức và đóng vai trò là người dẫndắt, định hướng cho học sinh Tuy nhiên, hiện nay, ứng dụng trí tuệ nhân tạo tronggiáo dục sẽ đổi mới mô hình giảng dạy truyền thống ấy và phụ huynh lẫn học sinh sẽlà người quyết định con đường học vấn tương lai của chính mình.

Trí tuệ nhân tạo giúp sử dụng thời gian hiệu quả hơn Ra đời vào những năm 50của thế kỉ 20, chúng ta không thể phủ nhận rằng, kể từ khi đưa trí tuệ nhân tạo vàotrong giáo dục, việc dạy học trở nên hiệu quả hơn nhờ sự hỗ trợ của các thiết bị, ứngdụng học tập này “Quản lý ra quyết định” là một trong những công nghệ trên, nhờvào mô hình này, khối lượng công việc của giáo viên sẽ được giảm đi đáng kể Côngnghệ này vận hành dựa trên việc “nạp” các quy tắc và logic để sử dụng cho việc tậphuấn ban đầu, giúp các AI có khả năng tự điều chỉnh và thích nghi với các thay đổi.Từ đó, tiết kiệm được nhiều thời gian hơn, giúp giáo viên hoàn thành được nhiều côngviệc, đồng thời phân bổ thời gian cho các học sinh của mình hợp lý hơn.

Ngoài ra, TTNT còn giúp giáo viên đổi mới phương thức giảng dạy Nắm bắtđược những điểm tiện lợi từ các sản phẩm nghiên cứu của ngành khoa học Deep

Trang 11

Learning, hệ thống giáo dục cũng đưa trí tuệ nhân tạo vào trong giảng dạy dựa trênnền tảng các trợ lý ảo Siri, Cortana, hay Alexa của Google là một trong các trợ lý tuyảo nhưng mà không hề phi thực tế Đây là sản phẩm của mô hình Deep Learning vậnhành bằng cách thu thập các nghiên cứu phân tích tâm lý và hành vi của con người,thông qua đó, tương tác với người sử dụng bằng 3 hình thức: văn bản (đặc biệt là chatnhanh), giọng nói và hình ảnh.

Các sản phẩm AI khi đưa vào giáo dục luôn được thiết kế để dễ dàng sử dụngvà phổ biến rộng rãi, nhất là với các đối tượng như học sinh, sinh viên như ứng dụng

học tập Duolingo – nền tảng học ngôn ngữ miễn phí và đang rất phổ biến hiện nay ở

Việt Nam và cả thế giới với hơn 74 triệu người dùng hiện nay Duolingo sử dụng AIđể nhân cách hóa các bài học ngôn ngữ trên điện thoại và các thiết bị điện tử, ngườihọc có thể chọn nhân vật và học ở bất cứ đâu, bất cứ nơi nào, có thể học được nhiềuthứ tiếng cùng lúc Đồng thời, nó còn cung cấp tính năng dịch văn bản dựa trên

“crowdsourcing” giúp người học có thể vượt qua các bài học và dịch tài liệu, văn bản.Ngoài ra, Duolingo còn cung cấp chương trình kiểm tra, cấp chứng chỉ DuolingoEnglish Test và ứng dụng đọc viết cho trẻ em có tên Duolingo ABC.

CHƯƠNG 2: TÌM HIỂU VỀ CÔNG CỤ FPT TEXT TO SPEECH(VOICEMAKER.FPT.AI) VÀ CÔNG CỤ LÀM VIDEO INVIDEO AI

1 Công cụ text to speech Voicemaker.fpt.ai

1.1 Giới thiệu về công cụ FPT Text to Speech (Voicemaker.fpt.ai)

FPT Text to Speech (Voicemaker.fpt.ai) là một trong những giọng máy haygiọng AI mới nhất của FPT được nghiên cứu và phát triển với đội ngũ kỹ sư và cácnhà khoa học hàng đầu về công nghệ trí tuệ nhân tạo và xử lý giọng nói của ban côngnghệ tập đoàn FPT FPT Text to Speech là công nghệ chuyển đổi văn bản thành giọngnói tiếng Việt được FPT đưa vào sử dụng từ năm 2015 và liên tục cải tiến chất lượng.Công cụ này ngày càng được ứng dụng rộng rãi vào đời sống phục vụ đa dạng đốitượng và lĩnh vực FPT Text to Speech là sản phẩm được phát triển dành riêng chongười Việt dựa trên những nghiên cứu chuyên sâu về giọng nói đặc trưng của từngvùng miền Hiện nay, FPT Text to Speech cung cấp đầy đủ giọng nói đặc trưng ở cả 3miền với cả giọng

Trang 12

nam, giọng nữ và có thể điều chỉnh tốc độ đọc nhanh chậm, dễ dàng kiểm soát âmlượng đọc tùy nhu cầu và mục đích sử dụng công nghệ text to speech của FPT Côngnghệ AI này có khả năng phát âm rõ ràng các từ, ngắt nghỉ giữa dấu chấm dấu phẩymột cách chính xác làm cho câu đọc trở nên trôi chảy và tự nhiên hơn AI của FPT AIcó khả năng phản hồi nhanh chóng mọi yêu cầu của người dùng và đáp ứng nhu cầutải đột biến của hệ thống Công nghệ text to speech đã và đang được ứng dụng nhiềuvào thực tế nhằm hỗ trợ các hoạt động của con người như học ngoại ngữ, đọc báo chongười khiếm thị, tích hợp và các thiết bị thông minh điều khiển bằng giọng nói…Những ứng dụng tiềm năng của text to speech là vô hạn Trong tương lai gằn giọngđọc text to speech sẽ ngày càng tự nhiên và trở nên phổ biến hơn, hứa hẹn mang đếnnhững tiện ích cho đời sống con người.

Người dùng có thể sử dụng FPT Text to Speech miễn phí với giới hạn 100.000ký tự một tháng Ngoài ra FPT Text to Speech còn cung cấp gói mở rộng ký tự vớimức giá từ 500.000 VNĐ và gói doanh nghiệp cho các đối tượng có nhu cầu.

1.2 Cách sử dụng công cụ FPT Text to Speech

Để sử dụng công cụ FPT Text to Speech, người dùng chỉ cần truy cập vào trangweb https://fpt.ai/vi/FPT Text to Speech Giao diện trang web sẽ hiện lên như sau:

Trang 13

Người dùng có thể trải nghiệm thử khả năng của công cụ FPT Text to Speechbằng cách nhập nội dung vào ô văn bản, chọn giọng nói và tốc độ nói mong muốn.Sau đó, chọn tạo file và chờ đợi AI xử lý Tuy nhiên cách này không thể lưu lại hay tảixuống.

Để có thể lưu lại và tải xuống file âm thanh, người dùng chọn vào ô bắt đầutrên giao diện hoặc truy cập https://voicemaker.fpt.ai/ Người dùng sẽ được đưa đếntrang đăng nhập https://id.fptcloud.com/ Tại đây người dùng có thể đăng nhập nếu đãcó tài khoản hoặc đăng ký nếu chưa có tài khoản Để tạo tài khoản, người dùng điềncác thông tin bao gồm họ và tên, Email, tên tài khoản và mật khẩu Sau khi hoàn tất,chọn ô Sign Up, hệ thống sẽ hiện thông báo đã gửi mail xác nhận kích hoạt tài khoảnđến Email người dùng đăng ký.

Trang 14

Người dùng truy cập vào Email, chọn FPT Smart Cloud và kích hoạt tài khoản.Như vậy là người dùng đã có thể đăng nhập tài khoản để sử dụng FPT Text to Speech.Sau khi đăng nhập FPT Text to Speech sẽ hiện giao diện như sau, người dùng chọntạo dự án mới (phải chọn một dự án để bắt đầu sử dụng).

Sau khi chọn, người dùng sẽ được đưa đến trang webhttps://console.fpt.ai/getting-started để tạo Project (Dự án), bật API Text to Speech vàKích hoạt dự án.

Sau đó, quay trở lại trang https://voicemaker.fpt.ai/ hoặc vào mục Ứng dụng,chọn Voicemaker để bắt đầu sử dụng ứng dụng chuyển đổi văn bản thành giọng nói.

Trang 15

Nền tảng FPT Text to Speech hỗ trợ 2 ngôn ngữ là Tiếng Anh và Tiếng Việt.Chọn biểu tượng địa cầu trên góc phải màn hình để chọn ngôn ngữ sử dụng.

Để bắt đầu sử dụng người dùng dán liên kết trang web bất kì cần chuyển đổivăn bản thành giọng nói vào ô URL Ấn Xử lý để hệ thống bóc tách phần chữ cầnchuyển đổi trong trang web Kết quả, văn bản trên website mà bạn cần chuyển sanggiọng đọc sẽ xuất hiện trên giao diện chỉnh sửa.

Sau khi đã có văn bản, người dùng có thể nghe thử để chọn ra giọng đọc và tốcđộ phù hợp ở thanh trên cùng của giao diện chỉnh sửa.

Trang 16

Sau khi đã thiết lập giọng đọc chính cho cả văn bản với tốc độ phù hợp, ngườidùng có thể tiến hành chỉnh sửa văn bản đọc với các tính năng chuyên biệt và cụ thểhơn, để tạo ra một file âm thanh chất lượng cao đúng với nhu cầu sử dụng.

Với từ điển, người dùng có thể dạy máy phát âm các từ khó, từ nước ngoàibằng cách phiên âm sang cách đọc tiếng Việt.

Các giọng đọc của FPT Text to Speech đều có sự ngắt nghỉ tự nhiên, nhịpnhàng như giọng đọc thật của con người Tuy nhiên, với những đoạn người dùngmuốn máy nghỉ lâu hơn, người dùng có thể thêm thời gian nghỉ bằng cách thiết lậptính năng đó ở đây.

Để con trỏ sau từ người dùng muốn thêm thời gian nghỉ, ấn nút Nghỉ, sau đóđiều chỉnh thời gian nghỉ phù hợp với nhu cầu sử dụng bằng cách điền thời gian vào ôBreak time.

Trong cùng một bài đọc, người dùng có thể sẽ cần nhiều giọng đọc khác nhauđể đối thoại, hoặc làm nổi bật câu trích dẫn Người dùng có thể cài đặt giọng đọc khácbằng cách bôi đen đoạn cần sử dụng giọng đọc khác, click vào nút Chọn giọng khác,sau đó chọn giọng đọc và điều chỉnh tốc độ tùy theo nhu cầu sử dụng.

Trang 17

Để tìm kiếm một từ/cụm từ trong đoạn văn bản, nhập từ đó vào ô Tìm kiếm vàấn Tìm Văn bản sẽ bôi đậm tất cả các từ/cụm từ đó trong văn bản Người dùng có thểthay thế từ đó bằng cách nhập từ thay thế vào ô Thay thế.

Để tải file audio, ấn vào nút Chuyển thành giọng nói và chờ hệ thống xử lý Saukhi hệ thống xử lý xong, sẽ hiện ra giao diện như sau, người dùng ấn nút mũi tên đểtải xuống.

1.3 Nhận xét, đánh giá về công cụ FPT Text to Speech

Về ưu điểm, công cụ FPT Text to Speech sử dụng công nghệ tiên tiến để tạo ragiọng nói tự nhiên và chất lượng cao Công cụ này hổ trợ giọng nam lẫn nữ và chíngiọng nói ở ba miền đất nước Điều này giúp tạo ra trải nghiệm người dùng thú vị và

Ngày đăng: 11/06/2024, 09:07

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w