Skype trên Windows 48 !

Một phần của tài liệu Xây dựng hệ thống biến đổi giọng nói trên nền tảng di động - Iphone (Trang 47)

4.2.1. Môi trường

Ứng dụng trên Windows được thực nghiệm trên môi trường: - Phần cứng: Tốc độ 2x2.8 GHz, bộ nhớ 4GB RAM - Hệ điều hành: Windows 7 64 bit

- Phần mềm: Skype phiên bản 5.7

4.2.2. Cài đặt

Việc biến đổi giọng nói trên Skype được sử dụng thông qua Skype API, cấu trúc chương trình được mô tả như sau:

Hình 4.10: Class diagram của plugin cho Skype

4.2.3. Kết quả

Trong plugin cho Skype, ứng dụng Skype hoạt động tốt: - Các hiệu ứng có thể thực hiện ngay trong cuộc gọi - Có thể tuỳ chỉnh những hiệu ứng ngay trong cuộc gọi

Một số hình ảnh chương trình

Hình 4.11: Giao diện thêm hiệu ứng

4.3. Đánh giá ứng dụng 4.3.1. Ưu điểm

Về cơ bản, hệ thống đã thực hiện được các chức năng đề ra, hình thành một chương trình độc đáo:

- Có nhiều hiệu ứng hơn các chương trình hiện có. Hiện tại, ứng dụng nổi tiếng nhất trên iPhone – Voice Changer – có khoảng 18 hiệu ứng giọng nói và môi trường. Hệ thống đã cài đặt tất cả những hiệu ứng đã có trên Voice Changer và thêm vào một số hiệu ứng như tiếng mưa rơi, âm thanh đường phố, tiếng còi báo động...

- Cho phép tuỳ chỉnh những tham sốđể biến đổi giọng nói. Khi chọn một hiệu

ứng, người dùng có thể tuỳ chỉnh những tham số đầu vào nhằm biến đổi giọng nói cho phù hợp.

- Cho phép biến đổi giọng nói thời gian thực trên Skype. - Đánh giá của người dung dành cho hệ thống tương đối tốt.

4.3.2. Nhược điểm

- Do nền tảng iOS không cho can thiệp vào cuộc gọi nên ứng dụng trên iPhone chưa thể thực hiện biến đổi giọng nói trong thời gian thực với các cuộc gọi. - Hiện tại Skype chỉ cung cấp API cho các ứng dụng trên desktop nên plugin

KT LUN

Qua quá trình nghiên cứu đề tài Xây dựng hệ thống biến đổi giọng nói trên nền tảng di động – iPhone, tôi đã nghiên cứu và đưa ra phương pháp xây dựng hệ thống biến đổi giọng nói với nhiều tham số khác nhau. Những kết quả chính mà tôi đã đạt được và chưa

đạt được (kết quả hướng tới) có thểđược tổng kết dưới đây:

Những kết quả đạt được

Những kết quả chính luận văn đã đạt được là:

- Đánh giá và đưa ra cách tiếp cận phù hợp cho bài toán biến đổi giọng nói trên nền tảng di động.

- Đưa ra nhiều tham số nhằm biến đổi giọng nói sang nhiều hiệu ứng khác nhau.

- Xây dựng thành công một ứng dụng biến đổi giọng nói trên nền tảng di động – iPhone – với nhiều hiệu ứng khác nhau. Các thành phần của ứng dụng có tính độc lập cao, có thể tái sử dụng khi cần thiết.

- Xây dựng thành công một plugin Skype cho phép biến đổi giọng nói trong các cuộc gọi Skype.

Những kết quả hướng tới và hướng phát triển trong tương lai

Ngoài những kết quả đạt được, còn những vấn đề mà luận văn này chưa giải quyết

được. Điều này được thể hiện rõ qua phạm vi bài toán mà đề tài đặt ra. Trong tương lai, tôi sẽ tiếp tục nghiên cứu, mở rộng đề tài:

- Xây dựng hệ thống biến đổi giọng nói đa nền tảng như một plugin cho Skype. Hiện tại Skype cung cấp API cho những nền tảng desktop khác nhau. Để dễ

dàng trong việc phát triển về sau, cần viết lại lớp giao tiếp với các API này ở

mức độ trừu tượng hơn, nhằm dễ dàng cho việc porting giữa những thiết bị

- Tiếp cận theo hướng khác để can thiệp vào cuộc gọi của thiết bị di động, nhằm biến đổi giọng nói ngay trong cuộc gọi. Hiện tại nền tảng iPhone không cho phép can thiệp vào các API liên quan tới cuộc gọi. Dù vậy, việc này vẫn có thể thực hiện thông qua việc xây dựng hệ thống VoIP. Tuy nhiên việc xây dựng hệ thống này đòi hỏi rất nhiều thời gian và nằm ngoài phạm vi luận văn này nên đây được coi như một hướng nghiên cứu tương lai.

TÀI LIỆU THAM KHẢO Tiếng Anh

1. Patrick Bastien (2003), Pitch shifting and voice transformation techniques, TC- Helicon, Canada.

2. Frank Fallside (1985), Computer speech processing, Prentice Hall International, London.

3. Yoon Kim (May 1996), Voice Gender Transformation with a Modified Vocoder,

Stanford University, California.

4. Gordon E.Pelton (1993), Voice processing, McGraw Hill, New York.

5. Lawrence R.Rabiner, Ronald W.Schafer (1978), Digital processing of speech

signals, Prentice Hall, New Jersey.

6. Hui Ye, Steve Young, High quality Voice Morphing.

7. Hui Ye, Steve Young (2006), Quality-enhanced Voice Morphing using Maximum

Likelihood Transformations.

Các nguồn trên Internet

8. Apple Developer: https://developer.apple.com/

9. Nielsen (January 18th, 2012): More US Consumer Choosing Smartphones as Apple

Closes the Gap on Android: http://blog.nielsen.com/nielsenwire/consumer/more-

us-consumers-choosing-smartphones-as-apple-closes-the-gap-on-android/

10.Nyquist – Shannon sampling theorem:

http://en.wikipedia.org/wiki/Nyquist%E2%80%93Shannon_sampling_theorem 11.OpenAL: http://connect.creativelabs.com/openal/default.aspx 12.Wikipedia 1. http://en.wikipedia.org/wiki/IOS 2. http://en.wikipedia.org/wiki/Vocal_range 3. http://en.wikipedia.org/wiki/Voice_changer 4. http://en.wikipedia.org/wiki/Mean_opinion_score 13.Người viết tự thống kê trên http://itunes.apple.com/

Một phần của tài liệu Xây dựng hệ thống biến đổi giọng nói trên nền tảng di động - Iphone (Trang 47)

Tải bản đầy đủ (PDF)

(53 trang)