1. Trang chủ
  2. » Luận Văn - Báo Cáo

Tìm hiểu LPC trong xử lý tiếng nói

87 696 1

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 87
Dung lượng 1,3 MB

Nội dung

Tìm hiểu LPC xử lý tiếng nói Lời nói đầu Chương Ứng dụng LPC xử lý tiếng nói 33 Chương Xây dựng chương trình 75 Luận văn tốt nghiệp – Lê Trần Sự – HTTT&TT – K45 Tìm hiểu LPC xử lý tiếng nói Lời nói đầu Trong thời đại ngày nay, với phát triển mạnh mẽ khoa học kỹ thuật vấn đề trao đổi thông tin đa phương tiện ngày trở nên cần thiết, từ lúc đầu giao tiếp, tương tác thông qua văn giấy tờ, ngày nhu cầu sử dụng tiếng nói truyền thông, tương tác người máy trở nên cấp thiết Vì mà lĩnh vực kỹ thuật đời, xử lý tiếng nói Mặc dù xử lý tiếng nói đạt thành tựu đáng kể Các ứng dụng xử lý tiếng nói áp dụng nhiều lĩnh vực khác xã hội nhận dạng, tổng hợp tiếng nói, tương tác người máy, truyền thông, dạy học, ….Nhờ có xử lý tiếng nói mà người tạo máy móc thông minh hơn, có khả hiểu tiếng nói người giao tiếp với người thông qua lời nói Một phương pháp ứng dụng nhiều lĩnh vực xử lý tiếng nói phương pháp mã hóa dự đoán tính (LPC) Phương pháp LPC sử dụng phân tích tiếng nói, mã hóa tiếng nói, tổng hợp tiếng nói… Do chọn đề tài “Tìm hiểu phương pháp LPC xử lý tiếng nói” Nội dung đồ án gồm có ba chương • Chương 1: Tổng quan tiếng nói xử lý tiếng nói Chương nêu cách tổng quan vấn đề liên quan đến tiếng nói xử lý tiếng nói:  Giới thiệu tiếng nói, đặc trưng chế tạo tiếng nói người  Giới thiệu tổng quan đặc điểm, hoạt động số phép biến đổi hệ xử lý tín hiệu chung  Các phương pháp xử lý tiếng nói như: tổng hợp tiếng nói, mã hóa tiếng nói, phân tích tiếng nói Luận văn tốt nghiệp – Lê Trần Sự – HTTT&TT – K45 Tìm hiểu LPC xử lý tiếng nói • Chương 2: Ứng dụng LPC xử lý tiếng nói Chương đề cập tới phương pháp LPC xử lý tiếng nói  Trình bày sở phương pháp LPC  Ứng dụng LPC phân tích tiếng nói  Mô hình tổng hợp tiếng nói LPC • Chương 3: Xây dựng chương trình Chương giới thiệu chương trình xây dựng, kết đạt nêu nhận xét • Kết luận: Khái quát kết đạt Định hướng phát triển tiếp Luận văn tốt nghiệp – Lê Trần Sự – HTTT&TT – K45 Tìm hiểu LPC xử lý tiếng nói Chương Tổng quan tiếng nói xử lý tiếng nói 1.1 Tiếng nói đặc điểm tiếng nói Tiếng nói phương tiện trao đổi thông tin người Tiếng nói tạo từ tư người đạo trung khu thần kinh, mệnh lệnh phát sinh tiếng nói phát hệ thống phát âm thực nhiệm vụ tạo âm Tiếng nói mà người giao tiếp hàng ngày có chất sóng âm lan truyền không khí Sóng âm không khí sóng dọc sinh dãn nở không khí Tín hiệu âm tín hiệu biến thiên liên tục thời gian biên độ, có dải tần số rộng Tuy nhiên tai người nhận biết sóng âm có tần số khoảng 20 - 20000 (Hz) Những sóng âm có tần số lớn 20000 Hz gọi sóng siêu âm Những sóng có tần số nhỏ 20 Hz gọi sóng hạ âm Thực tế người ta hạn chế dải tần số tín hiệu tiếng nói khoảng từ 300 đến 3500 Hz Do đó, trình phân tích tổng hợp tiếng nói cần dùng số định tham số đủ để biểu diễn tín hiệu tiếng nói mà não người xử lý Hình 1.1 Mô trình truyền tiếng nói không khí Về chất vật lí, sóng âm, sóng siêu âm, sóng hạ âm không khác sóng học khác Sự phân biệt dựa vào khả cảm thụ sóng học tai người, đặc tính sinh lí tai người định Vì sóng âm phân biệt hai loại đặc tính đặc tính vật lý đặc tính âm học Luận văn tốt nghiệp – Lê Trần Sự – HTTT&TT – K45 Tìm hiểu LPC xử lý tiếng nói 1.1.1 Đặc tính vật lý âm Bản chất âm tiếng nói sóng học nên có tính chất sóng học Các tính chất sóng học mang ý nghĩa khác xét góc độ âm tiếng nói Tín hiệu âm tiếng nói tín hiệu ngẫu nhiên không dừng, nhiên đặc tính tương đối ổn định khoảng thời gian ngắn (vài chục mili giây) Trong khoảng thời gian nhỏ tín hiệu gần tuần hoàn, coi tuần hoàn 1.1.1.1 Độ cao (Pitch) Độ cao hay gọi độ trầm bổng âm tần số sóng học Âm phát độ cao định Độ trầm bổng âm phụ thuộc vào chấn động nhanh hay chậm phần tử không khí đơn vị thời gian định Nói cách khác, độ cao âm phụ thuộc vào tần số dao động Đối với tiếng nói, tần số dao động dây quy định độ cao giọng nói người người có độ cao giọng nói khác Độ cao nữ giới thường cao so với nam giới độ cao tiếng nói trẻ em cao so với nữ giới, điều tương tự tần số dây 1.1.1.2 Cường độ Cường độ độ to nhỏ âm thanh, cường độ lớn âm truyền xa môi trường có nhiễu Nếu xét góc độ sóng học cường độ biên độ dao động sóng âm, định cho lượng sóng âm Trong tiếng nói, cường độ nguyên âm phát thường lớn phụ âm Do thường dễ phát nguyên âm so với phụ âm Tuy nhiên tai người giá trị tuyệt đối cường độ âm I không quan trọng giá trị tỉ đối I so với giá trị I0 chọn làm chuẩn Người ta định nghĩa mức cường độ âm L logarit thập phân tỉ số I/I0: (đơn vị mức cường độ Ben - kí hiệu B) Luận văn tốt nghiệp – Lê Trần Sự – HTTT&TT – K45 Tìm hiểu LPC xử lý tiếng nói L (B ) = lg 1.1.1.3 I I0 Trường độ Trường độ hay độ dài âm phụ thuộc vào chấn động lâu hay nhanh phần tử không khí Cùng âm từ khác độ dài khác 1.1.1.4 Âm sắc Âm sắc sắc, sắc thái riêng âm, nội dung, độ cao nói người có âm sắc khác 1.1.2 Đặc tính âm học âm Tín hiệu tiếng nói tín hiệu tương tự biểu diễn cho thông tin mặt ngôn ngữ mô tả âm vị khác Tuỳ theo ngôn ngữ cụ thể mà số lượng âm vị nhiều hay Thông thường số lượng âm vị vào khoảng 20 – 30 nhỏ 50 ngôn ngữ Đối với loại âm vị mà có đặc tính âm khác Các âm vị chia thành hai loại nguyên âm phụ âm Tổ hợp âm vị tạo nên âm tiết Âm tiết đóng vai trò từ trọn vẹn mang ngữ nghĩa 1.1.2.1 Nguyên âm Nguyên âm tạo cộng hưởng dây dòng khí môn đẩy lên Khoang miệng tạo lập thành nhiều hình dạng định tạo thành nguyên âm khác Số lượng nguyên âm phụ thuộc vào ngôn ngữ định Mỗt nguyên âm đặc trưng formant đầu tiên, formant thường mang thông tin 1.1.2.2 Phụ âm Phụ âm tạo dòng khí hỗn loạn phát gần điểm co thắt đường dẫn âm cách phát âm tạo thành Dòng không khí chỗ đóng vòm Luận văn tốt nghiệp – Lê Trần Sự – HTTT&TT – K45 Tìm hiểu LPC xử lý tiếng nói miệng tạo phụ âm tắc Những phụ âm xát phát từ chỗ co thắt lớn âm tắc xát tạo từ khoảng Phụ âm có đặc tính hữu vô tuỳ thuộc việc dây có dao động để tạo thành cộng hưởng không Đặc tính phụ âm tuỳ thuộc vào tính chu kỳ dạng sóng, phổ tần số, thời gian tồn truyền dẫn âm 1.1.2.3 Tỷ suất thời gian Trong nói chuyện, khoảng nói chuyện khoảng nghỉ xen kẽ Phần trăm thời gian nói tổng số thời gian nói nghỉ gọi tỷ xuất thời gian Giá trị biến đổi tuỳ thuộc vào tốc độ nói từ ta phân loại thành nói nhanh, nói chậm hay nói bình thường 1.1.2.4 Hàm lượng thời gian ngắn Hàm lượng thời gian ngắn tiếng nói tính cách chia tín hiệu tiếng nói thành nhiều khung chứa N mẫu tính diện tích trung bình tổng mẫu tín hiệu khung Các khung đưa qua cửa sổ có dạng hàm sau: W ( n ) W( n ) =  0 Với ≤ n ≤ N Với n ≥ N Thông thường có ba dạng cửa sổ sử dụng cửa sổ chữ nhật, cửa sổ Hamming cửa sổ Hanning Cửa sổ chữ nhật: 1 W(n) =  0 Với ≤ n ≤ N Với n ≥ N Cửa sổ Hamming : 0.54 − 0.46 cos( n) Với1 ≤ n ≤ N W ( n) =  Với n ≥ N 0 Cửa sổ Hanning: 0.5 − 0.5 cos( n) W ( n) =  0 Với 1≤ n ≤ N Với n ≥ N Luận văn tốt nghiệp – Lê Trần Sự – HTTT&TT – K45 Tìm hiểu LPC xử lý tiếng nói Hàm lượng ngắn mẫu thứ m tính theo công thức sau : N −1 E m = ∑ { x( n + m ) ∗ W ( n )} n=0 Hàm lượng thời gian ngắn âm hữu thường lớn so với âm vô 1.1.2.5 Tần số vượt qua điểm không Tần suất vượt qua điểm không số lần biên độ tín hiệu tiếng nói vượt qua giá trị không khoảng thời gian cho trước Thông thường giá trị âm vô lớn âm hữu đặc tính ngẫu nhiên âm vô Do đo tần suất vượt qua điểm không tham số quan trọng để phân loại âm hữu âm vô 1.1.2.6 Phát điểm cuối Trong xử lý tiếng nói việc xác định bắt đầu xuất tín hiệu tiếng nói kết thúc trình nói cần thiết quan trọng Trong môi trường nhiều tiếng ồn (nhiễu ) môi trường nhiều người nói việc phát điểm kết thúc khó khăn Có nhiều phương pháp để phát điểm cuối tiếng nói Ví dụ phương pháp đơn giản sau : Lấy mẫu nhỏ nhiễu khoảng thời gian yên lặng trước bắt đầu nói Sử dụng hàm lượng thời gian ngắn để tính lượng cho mẫu Ngưỡng tiếng nói chọn giá trị lượng yên tĩnh lượng đỉnh Ban đầu giả thiết điểm cuối xuất điểm lượng tín hiệu vượt mức ngưỡng Để tính ước lượng này, người ta giả thiết so sánh chúng với giá trị vùng yên tĩnh Khi thay đổi phát tính toán tần suất suất ngưỡng giả thiết điểm cuối giả thiết lại điểm mà thay đổi xảy Luận văn tốt nghiệp – Lê Trần Sự – HTTT&TT – K45 Tìm hiểu LPC xử lý tiếng nói 1.1.2.7 Tần số Dạng sóng tiếng nói gồm hai phần: Phần gần giống nhiễu biên độ biến đổi ngẫu nhiên phần tuần hoàn Phần tín hiệu có tính chu kỳ chứa thành phần tần số có dạng điều hòa Tần số thấp tần số tần số dao động dây dây Đối với người nói khác nhau, tần số khác Tần số trẻ em thường cao so với người lớn nữ giới cao so với nam giới, Sau số giá trị tần số tương ứng với giới tính tuổi: Người nói Giá trị tần số Nam giới 80 – 200 Hz Nữ giới 150 – 450 Hz Trẻ em 200 – 600 Hz Đối với hai âm có cường độ, độ cao phân biệt tính tuần hoàn Một âm hữu có tín hiệu gần tuần hoàn phân tích phổ xuất vạch vùng tần số thấp Vạch đặc trưng cho tính tuần hoàn âm tần số âm Trong giao tiếp bình thường tần số thay đổi liên tục tạo nên ngữ điệu cho tiếng nói Hình mô tả tín hiệu miền thời gian phổ chúng (trên miền tần số) nguyên âm a, i, u đỉnh phổ tương ứng với tần số F0 Luận văn tốt nghiệp – Lê Trần Sự – HTTT&TT – K45 Tìm hiểu LPC xử lý tiếng nói Hình 1.2 Tín hiệu phổ tín hiệu 1.1.2.8 Formant Trong phổ tần số tín hiệu tiếng nói, đỉnh có biên độ cao xét khoảng (còn gọi cực trị địa phương) xác định formant Ngoài tần số, formant xác định biên độ dải thông chúng Về mặt vật lý tần số formant tương ứng với tần số cộng hưởng tuyến âm Trong xử lý tiếng nói tổng hợp tiếng nói để mô lại tuyến âm người ta phải xác định tham số formant loại âm vị, việc đánh giá, ước lượng formant có ý nghĩa quan trọng Tần số formant biến đổi khoảng rộng phụ thuộc vào giới tính người nói phụ thuộc vào dạng âm vị tương ứng với formant Đồng thời, formant phụ thuộc âm vị trước sau Về cấu trúc tự nhiên, tần số formant có liên hệ chặt chẽ với hình dạnh kích thước tuyến âm Thông thường phổ tần số tín hiệu có khoảng formant có formant ảnh hưởng quan trọng đến đặc tính âm vị, formant lại có ảnh hưởng song Các formant có giá trị tần số xê dịch từ vài trăm đến vài nghìn Hz Tần số formant đặc trưng cho nguyên âm biến đổi tuỳ thuộc vào người nói điều kiện phát âm định Mặc dù phạm vi tần số formant tương ứng với nguyên âm trùng lên vị trí formant không đổi xê dịch formant song song Ngoài formant, âm mũi có tần số bị suy giảm gọi phản formant (antiformant) Phản formant tạo nên luồng khí qua khoang mũi Các formant Luận văn tốt nghiệp – Lê Trần Sự – HTTT&TT – K45 10 Tìm hiểu LPC xử lý tiếng nói Thuật toán mã hoá tham số tiếng nói mô tả sau:  Đầu tiên tham số pitch voicing giải mã Nếu lỗi tham số giải mã mà không cần phải hoãn lại Khi voicing frame đặt Việc giải mã pitch thực nhờ phép nội suy tuyến tính, sau pitch làm trơn  Sau hệ số LPC làm trơn giải mã Trong việc giải mã A A2 thực cách nội suy LARs (Log Area Ratio) Còn A – A10 giải mã nhờ thực nội suy tuyến tính  Tiếp theo Gain giải mã nhờ thực nội suy Logarit  Cuối Gain hệ số LPC chuyển đổi từ số nguyên thành số thực  Trong trường hợp có lỗi tất bit tham số quan trọng bảo vệ mã Hamming làm trơn trung vị 3.4.2.4 Tổng hợp Khối tổng hợp nhận vào vector tham số đặc trưng cho frame tín hiệu tiếng nói ban đầu tổng hợp lại thành frame tín hiệu Việc tổng hợp diễn sau:  Tạo tín hiệu nguồn kích thích: việc tạo tín hiệu nguồn thực dựa vào voicing chu kỳ pitch:  Nếu frame tiếng nói (voiced): nguồn âm tạo từ chuỗi xung đơn vị tuần hoàn với chu kỳ pitch cho qua lọc thông thấp tần số cắt khoảng 100 Hz  Nếu frame tiếng nói (unvoiced): nguồn âm tạo nhiễu ngẫu nhiên (ở dùng hàm Gausse ngẫu nhiên)  Dựa vào hệ số Gain để xác định biên độ tín hiệu nguồn Luận văn tốt nghiệp – Lê Trần Sự – HTTT&TT – K45 73 Tìm hiểu LPC xử lý tiếng nói  Tổng hợp tín hiệu ban đầu cách cho tín hiệu nguồn kích thích qua lọc tổng hợp LPC mà xác định hệ số tiên đoán tuyến tính sau hiệu chỉnh để làm trơn tín hiệu tổng hợp Luận văn tốt nghiệp – Lê Trần Sự – HTTT&TT – K45 74 Tìm hiểu LPC xử lý tiếng nói Chương Xây dựng chương trình Sau tìm hiểu ứng dụng phương pháp dự đoán tuyến tính xử lý tiếng nói Trong chương trình bày việc xây dựng chương trình mô mô hình tạo tiếng nói LPC ứng dụng phương pháp dự đoán tuyến tính phân tích tiếng nói như: Dò tìm Formant, tìm F0 3.1 Mục đích Mục tiêu của chương trình đề xây dựng phần mềm có chức tổng hợp tiếng nói theo phương pháp LPC, ứng dụng phương pháp LPC dò tìm Formant, tìm F0 góp phần tìm hiểu phương pháp LPC xử lý tiếng nói Mục đích phần mềm bao gồm: - Ghi tín hiệu tiếng nói thành tệp dạng *.wav với tần số lấy mẫu, số bít mã hoá tuỳ chọn Thao tác tất file *.wav, cho phép cắt dán, thay đổi nội dung file tín hiệu Cung cấp công cụ cho phép nghe file wav Xác định Formant số tín hiệu tiếng nói Xác định thông số LPC như: hệ số dự đoán, sai số LPC Xây dựng mô hình tạo tiếng nói LPC Giao diện thân thiện, dễ sử dụng 3.2 Phân tích & lựa chọn giải pháp Để có kết xác cần phải lưu ý đến điều kiện phân tích như: phương pháp phân tích, tần số rời rạc, số bít mã hoá, bậc lọc dự đoán, dạng cửa sổ, tham số lọc hiệu chỉnh,… 3.2.1 Lựa chọn tần số lấy mẫu Để xử lý tín hiệu số nói chung xử lý tín hiệu tiếng nói tín hiệu liên tục cần phải rời rạc Tần số rời rạc lớn tín hiệu biểu diễn xác, phép xử Luận văn tốt nghiệp – Lê Trần Sự – HTTT&TT – K45 75 Tìm hiểu LPC xử lý tiếng nói lý cho kết xác Tuy nhiên, tần số lấy mẫu lớn số mẫu cần thiết để biểu diễn cho đoạn tín hiệu tương tự nhiều, yêu cầu nhớ lưu trữ số liệu khối lượng tính toán tăng lên Vì thế, phải chọn lựa tần số lấy mẫu cho việc biểu diễn tín hiệu tương tự rời rạc với tần số tối thiểu không bị thông tin, không gây tượng chồng phổ Theo định lý lấy mẫu Shannon tần số lấy mẫu phải lớn hai lần tần số cao tín hiệu Chúng ta biết chế tạo tín hiệu tiếng nói, với độ dài trung bình tuyến âm khoảng 17cm, năm formant nằm khoảng 250÷3800Hz Đối với tuyến âm ngắn hơn(đối với nữ giới trẻ em), vùng chứa formant cao chút không vượt 5000Hz Do đó, chọn tần số rời rạc khoảng 10000Hz Mối quan hệ tần số lấy mẫu độ dài tuyến âm biểu diễn theo công thức: Fs = M c (kHz ) 2L (4.1.1) đó: M: Bậc lọc C=34cm/s: Tốc độ truyền sóng tuyến âm L: Độ dài tuyến âm 3.2.2 Bộ lọc hiệu chỉnh Như trình bày phần lọc hiệu chỉnh, tốc độ âm lượng môn tán xạ môi đặc tính phổ bị suy giảm tương ứng khoảng 12dB/oct 6dB/oct Để loại bỏ ảnh hưởng ta dùng lọc có dạng (1-az -1), thường chọn bậc lọc a nằm khoảng 0.96 ≤ a ≤ 3.2.3 Hàm cửa sổ độ dài đoạn tín hiệu Sử dụng cửa sổ thời gian cần thiết phân tích tín hiệu việc lựa chọn hàm cửa sổ khác cho kết khác Tuy nhiên áp dụng phương pháp tiên đoán tuyến tính theo phương pháp covariance việc sử dụng cửa sổ gây nên ảnh hưởng không tốt Cửa sổ thời gian cần đảm bảo độ phân giải cao vùng tần số để Luận văn tốt nghiệp – Lê Trần Sự – HTTT&TT – K45 76 Tìm hiểu LPC xử lý tiếng nói tách thành phần phổ nằm cách khoảng tần số tối thiểu Ngoài đặc tính tách biên độ cần phải đảm bảo phân biệt rõ ràng thành phần phổ nằm dải Dạng cửa sổ độ dài ảnh hưởng lớn đến độ phân giải vùng tần số Trên thực tế có nhiểu kiểu cửa sổ đưa ra, nhiên quan tâm đến hai loại cửa sổ Hamming Hanning chúng cho kết tốt Hình 3.1 Phân đoạn tín hiệu tiếng nói Trên thực tế, thường sử dụng hàm cửa sổ Hamming với chiều dài đoạn tín hiệu lấy cửa sổ 30ms, tần số lấy mẫu 10Khz có 300 mẫu Và đoạn tín hiệu tiếng nói lấy cửa sổ cách đoạn 10ms 3.2.4 Bậc lọc đảo Ta thấy bậc lọc đảo liên quan đến hệ số đoán tuyến tính bậc lọc đảo chọn từ quan điểm thực tế yêu cầu hệ số tối thiểu đảm bảo mô hình hoá đặc trưng tín hiệu tiếng nói xác Từ công thức(4.1.1) ta thấy rằng: M = 2L Fs c (4.1.2) Như bậc lọc đảo tỉ lệ với tần số lấy mẫu Dùng lọc đảo có bậc cao kết phân tích xác Tuy nhiên, lấy bậc lọc đảo cao sảy tượng việc xác định formant có nhiều formant giả, bậc nhỏ lại gây tượng số formant Luận văn tốt nghiệp – Lê Trần Sự – HTTT&TT – K45 77 Tìm hiểu LPC xử lý tiếng nói Nếu tần số lấy mẫu 10Khz đoạn [0 F s] có khoảng formant, lựa chọn bậc lọc đảo 12 Tuy nhiên phụ nữ có tần số formant lớn khoảng 12-15%, chọn bậc lọc đảo 10 3.3 Chức chương trình Chương trình viết ngôn ngữ Visual C++ với chức minh họa theo hình 3.2 Hệ thống Đọc liệu file wav Ghi liệu file wav Phân tích LPC Mô hình tổng hợp Hiển thị liệu tín hiệu Phát liệu file wav Hình 3.2 Sơ đồ chức chương trình Đọc fileWav Do liệu tiếng nói lưu trữ chủ yếu dạng file wav, chương trình làm việc với file liệu file wav, nên chương trình phải có chức đọc liệu từ file wav Ghi fileWav Đối với hệ thống, việc xử lý với liệu có sẵn, hệ thống phải có chức tạo liệu Mặt khác hệ thống làm việc với liệu ghi dạng file wav, nên chương trình phải có chức cho phép ghi liệu dạng file wav Chương trình cho phép người sử dụng lựa chọn định dạng liệu tuỳ thích tần số lấy mẫu, số kênh, số bit mã hoá mẫu,… Luận văn tốt nghiệp – Lê Trần Sự – HTTT&TT – K45 78 Tìm hiểu LPC xử lý tiếng nói Phân tích LPC Chức phân tích tiến hành phân tích liệu tiếng nói tìm tham số đặc trưng cho tín hiệu tiếng nói ban đầu, trình phân tích tổng hợp thực theo mô hình tiên đoán tuyến tính (LPC), nên tham số voicing, pitch, gain hệ số LPC Ngoài ra, chương trình cho phép dùng phương pháp LPC phân tích tín hiệu tiếng nói như: tìm Formant, F0, xác định đường bao phổ Mô hình tổng hợp LPC Mô hình tổng hợp cho phép tạo tín hiệu tổng hợp từ nguồn kích thích (hữu vô thanh) Đồng thời phân tích phổ tín hiệu tổng hợp hiển thị điểm cực hàm truyền Ngoài ra, phần minh họa mô hình đường ống tổn hao Hiển thị liệu tín hiệu Chức hiển thị liệu tới người sử dụng, qua thấy cách trực quan dạng tín hiệu, phổ chúng từ so sánh độ xác hệ thống Phát liệu file wav Tiếng nói công cụ phục vụ cho trình giao tiếp người, người thu nhận hiểu thông tin cần thiết qua lời nói Vì hiển thị tín hiệu tiếng nói nhận biết dạng tín hiệu phần thông tin lời nói mà hiểu xác nội dung thực lời nói Vì chương trình cần phải có chức phát âm liệu âm thanh, qua hiểu xác nội dung thực tín hiệu đồng thời so sánh cách trực quan độ xác trình phân tích tổng hợp tín hiệu 3.4 Giao diện chương trình Giao diện chương trình sau Luận văn tốt nghiệp – Lê Trần Sự – HTTT&TT – K45 79 Tìm hiểu LPC xử lý tiếng nói Hình 3.3 Giao diện chương trình Trong chương trình phần mô mô hình tạo tiếng nói LPC có giao diện sau Hình 3.4 Giao diện mô đun Synthesis Luận văn tốt nghiệp – Lê Trần Sự – HTTT&TT – K45 80 Tìm hiểu LPC xử lý tiếng nói 3.5 Một số nhận xét đánh giá kết Phần trình bày kết mà chương trình đạt từ đánh giá tính xác chương trình Với thuật giải dựa phương pháp LPC để tìm Formant tần số F0 chương trình cho kết xác Hình 3.5 Hiển thị Formant F0 nguyên âm i với chương trình Với chương trình wave buffer Hình 3.6 Hiển thị Formant F0 nguyên âm i với Wave buffer Luận văn tốt nghiệp – Lê Trần Sự – HTTT&TT – K45 81 Tìm hiểu LPC xử lý tiếng nói Và ta tính phổ đường bao phổ đoạn tín hiệu cần phân tích Hình 3.7 Phổ đường bao phổ đoạn tín hiệu nguyên âm i Các hệ số LPC thông số khác tín hiệu tiếng nói đưa form sau Hình 3.8 Các tham số đoạn tín hiệu Dạng tín hiệu sau qua cửa sổ, sai số LPC hàm tự tương quan Luận văn tốt nghiệp – Lê Trần Sự – HTTT&TT – K45 82 Tìm hiểu LPC xử lý tiếng nói Hình 3.9 Dạng đoạn tín hiệu sau qua cửa sổ Hamming, sai số LPC hàm tự tương quan tín hiệu Với chương trình mô mô hình tạo tiếng nói LPC ta đạt kết sau Hình 3.10 Dạng tín hiệu tổng hợp phổ với nguồn kích thích tuần hoàn Luận văn tốt nghiệp – Lê Trần Sự – HTTT&TT – K45 83 Tìm hiểu LPC xử lý tiếng nói Hình 3.11 Tín hiệu tổng hợp phổ với nguồn kích thích không tuần hoàn Từ kết ta thấy với nguồn kích thích tuần hoàn phổ tín hiệu tổng hợp có dạng phổ vạch, với nguồn kích thích không tuần hoàn phổ tín hiệu tổng hợp phổ trắng Chương trình thể điểm cực hàm truyền H(z) Hình 3.12 Điểm cực hàm truyền H(z) Với |ki|[...]... Lê Trần Sự – HTTT&TT – K45 32 Tìm hiểu LPC trong xử lý tiếng nói Chương 2 Ứng dụng của LPC trong xử lý tiếng nói 1 Phương pháp dự đoán tuyến tính trong xử lý tiếng nói Một trong những công cụ mạnh được sử dụng trong việc phân tích tiếng nói là phương pháp phân tích dự đoán tuyến tính Phương pháp này vẫn là kỹ thuật chiếm ưu thế trong việc dò tìm các tham số cơ bản của tiếng nói như: tần số cơ bản, các... mẫu tín hiệu với tỉ lệ đủ lớn để xử lý Tất cả các quá trình xử lý lấy mẫu được chỉ rõ trong các tài liệu về xử lý tín hiệu số Luận văn tốt nghiệp – Lê Trần Sự – HTTT&TT – K45 19 Tìm hiểu LPC trong xử lý tiếng nói Biểu diễn tín hiệu tiếng nói Biểu diễn dạng Biểu diễn dạng sóng tham số Các tham số kích Các tham số của thích bộ máy phát âm Hình 1.9 Biểu diễn tín hiệu tiếng nói Phương pháp biểu diễn tín... Luận văn tốt nghiệp – Lê Trần Sự – HTTT&TT – K45 28 Tìm hiểu LPC trong xử lý tiếng nói 1.6 Tổng quan về tổng hợp tiếng nói 1.6.1 Giới thiệu chung Tổng hợp tiếng nói là quá trình tạo tiếng nói xuất phát từ biểu diễn ngữ âm của lời nói và cơ chế sản sinh ra tiếng nói .Trong đó các kỹ thuật tổng hợp tiếng nói được chia thành 2 loại chính : • Tổng hợp tiếng nói trực tiếp: là phương pháp tổng hợp dựa trên... truyền tải hoặc là xử lý có hiệu quả Trong trường hợp thứ nhất, mỗi mẫu tín hiệu được lượng tử hóa, mã hoá rồi truyền đi Luận văn tốt nghiệp – Lê Trần Sự – HTTT&TT – K45 21 Tìm hiểu LPC trong xử lý tiếng nói Bên thu nhận tín hiệu giải mã và thu được tín hiệu tương tự Tính thống kê của tín hiệu được bảo toàn sẽ ảnh hưởng quan trọng đến thuật toán lượng tử hoá Trong trường hợp xử lý tín hiệu, luật lượng... một ý nghĩa đặc biệt trong phân tích và xử lý, vì nó giúp ta đưa việc xử lý một hệ phức tạp về việc xử lý các hệ đơn giản, sau đó ta chỉ việc tổng hợp lại kết quả Vì thế ngay cả các hệ phi tuyến nhiều khi cũng được xấp xỉ thành các hệ tuyến tính để tiện cho việc xử lý Các hệ tuyến tính cũng được phân thành 2 loại là tuyến tính bất biến và tuyến tính thay đổi theo thời gian Trong xử lý tín hiệu thường... tham số của mô hình tạo tiếng nói này thường được phân loại thành các tham số kích thích và các tham số của bộ máy phát âm tương ứng Luận văn tốt nghiệp – Lê Trần Sự – HTTT&TT – K45 20 Tìm hiểu LPC trong xử lý tiếng nói Để áp dụng các phương pháp xử lý tín hiệu số cho tín hiệu tiếng nói chúng ta phải biểu diễn tín hiệu tiếng nói dưới dạng rời rạc Quá trình rời rạc hoá tín hiệu tiếng nói bao gồm các bước... diễn số tiếng nói Tín hiệu tiếng nói là tín hiệu tương tự, do đó khi biểu diễn tín hiệu tiếng nói trong môi trường tính toán tín hiệu số, việc biểu diễn và lưu trữ sao cho không bị mất mát thông tin là vấn đề rất quan trọng trong các hệ thống thông tin sử dụng tiếng nói Việc xem xét các vấn đề xử lý tín hiệu tiếng nói trong các hệ thống này được dựa trên ba vấn đề chính: - Biểu diễn tín hiệu tiếng nói... thấp hơn so với ở vùng tần số thấp hay ngược lại, trong trường hợp đó cần sử dụng toán tử tuyến tính để biến đổi tín hiệu Luận văn tốt nghiệp – Lê Trần Sự – HTTT&TT – K45 22 Tìm hiểu LPC trong xử lý tiếng nói 1.5 Tổng quan về mã hoá tiếng nói Trong một vài thập kỷ vừa qua, đã có rất nhiều kỹ thuật mã hoá nén tiếng nói được đưa ra, phân tích và phát triển Trong phần này tôi sẽ giới thiệu một số kỹ thuật... y(n) = T[x(n)] y(n) Luận văn tốt nghiệp – Lê Trần Sự – HTTT&TT – K45 13 Tìm hiểu LPC trong xử lý tiếng nói x(n) T[] Tác động Đáp ứng Hình 1.5 Mô hình hệ xử lý biến đổi tín hiệu vào x(n) thành tín hiệu ra y(n) Các hệ xử lý phân thành 2 loại là hệ tuyến tính và hệ phi tuyến Một hệ thống được gọi là tuyến tính nếu nó thoả mãn nguyên lý xếp chồng, tức là thoả mãn 2 tính chất sau: Tính tỷ lệ: T[a.x(n)] = a.T[x(n)]... ) * x ( n ) = ∞ ∑ x ( k ) h( n − k ) k = −∞ Trong xử lý tín hiệu tiếng nói, các hệ thống mà chúng ta quan tâm đều là hệ tuyến tính bất biến, do đó chúng ta có thể áp dụng các tính chất, kết quả của hệ tuyến tính bất biến để áp dụng vào việc khảo sát phân tích tín hiệu tiếng nói Luận văn tốt nghiệp – Lê Trần Sự – HTTT&TT – K45 14 Tìm hiểu LPC trong xử lý tiếng nói 1.2.2 Phép biến đổi Z Đối với tín hiệu

Ngày đăng: 23/06/2016, 17:16

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w