4.2.5.4 Thư viện chuyển văn bản thành giọng nói python
❖ pyttsx3 đọc tiếng anh
Chuyển văn bản thành giọng nói là q trình tạo ra giọng nói từ văn bản ngơn ngữ bình thường. Ở đây trong bài đăng này, tơi sẽ giới thiệu với bạn về mô-đun pyttsx3 , một trong những thư viện python tốt nhất để chuyển đổi văn bản thành giọng nói. Phần tốt nhất về thư viện này là nó hồn tồn ngoại tuyến, vì vậy bạn khơng cần phải có kết nối internet đang hoạt động để thư viện này hoạt động.
Để cài đặt thư viện này, bạn cần nhập lệnh sau vào thiết bị đầu cuối của mình.
SVTH: LÊ TRUNG KIÊN
pip install pyttsx3
Bây giờ chúng ta đã sẵn sàng để bắt đầu làm việc với thư viện này. Chuyển văn bản thành giọng nói
Đầu tiên, bạn cần nhập và khởi tạo pyttsx3. Tên biến là engine vì vậy nó sẽ được sử dụng trong tồn bộ mã để thiết lập tất cả các loại thuộc tính.
import pyttsx3
engine = pyttsx3.init()
Bây giờ, chúng ta chỉ cần sử dụng hàm và chuyển bất kỳ văn bản nào làm đối số.
engine.say("Hello Master!") engine.runAndWait()
Khi bạn thực thi mã, Bạn sẽ nghe thấy một giọng nói "Xin chào Chủ nhân!".
Thay đổi sang giọng nữ
Bạn có thể nhận thấy rằng giọng nói hiện tại là nam. Điều gì sẽ xảy ra nếu chúng ta muốn thay đổi kiểu giọng nói thành nữ? Đối với điều đó, chúng tơi sẽ sử dụng getPropery phương pháp để tìm nạp danh sách tất cả các giọng nói. Sau đó, chúng tơi sẽ sử dụng setProperty phương pháp để thay đổi giọng nói thành nữ.
voices = engine.getProperty('voices') engine.setProperty('voice', voices[1].id) engine.say("Hi, I am a female!")
engine.runAndWait()
Bây giờ bạn sẽ nghe thấy một giọng nữ thay vì nam.
Thay đổi tốc độ giọng nói
SVTH: LÊ TRUNG KIÊN
Giả sử rằng bạn thích một bài phát biểu có tốc độ nhanh hơn nhiều. Bạn có thể dễ dàng sử dụng thuộc tính tỷ lệ để sửa đổi tốc độ giọng nói.
rate = engine.getProperty('rate') engine.setProperty('rate', rate+50) engine.say("Rate has now increased.") engine.runAndWait()
Bây giờ bạn sẽ nhận thấy rằng bài phát biểu được nói có tốc độ nhanh hơn nhiều.
❖ Google TTS đọc tiếng việt
Đọc được tiếng việt thì ta bắt buộc phải dùng thư viện của Google hỗ trợ vì rất ít thư viện có thể chuyển được đầu ra thành tiếng việt.
Để cài đặt thư viện này, bạn cần nhập lệnh sau pip install gTTS.
pip install gTTS
Bắt đầu sử dụng:
from gtts import gTTS import playsound text = "Xin chào bạn"
output = gTTS(text,lang="vi", slow=False) output.save("output.mp3")
playsound.playsound('output.mp3', True)
4.2.6 Thư viện Pytorch 4.2.6.1 Giới thiệu về Pytorch
PyTorch là 1 thư viện Python-based hỗ trợ tạo ra các Deep Learning models và sử dụng chúng cho các ứng dụng khác nhau. Trên thực tế, PyTorch không chỉ là 1
SVTH: LÊ TRUNG KIÊN
thư viện Deep Learning, mà chính là 1 package về tính tốn khoa học (scientific computing).
PyTorch, tương tự như Python, nó được thiết kế tập trung vào tính dễ sử dụng và thậm chí người dùng có kiến thức lập trình rất cơ bản cũng có thể sử dụng nó trong các dự án có liên quan đến Deep Learning.
Cấu trúc dữ liệu cốt lõi được sử dụng trong PyTorch là Tensor. Tương tự numpy array, Tensor là 1 mảng n-chiều với các phần tử có cùng kiểu dữ liệu.
Để cài đặt thư viện này, bạn cần nhập lệnh sau pip install torch.