Nghiên cứu mã hóa thoại trong mạng thông tin di động thế hệ tiếp theo Nghiên cứu mã hóa thoại trong mạng thông tin di động thế hệ tiếp theo Nghiên cứu mã hóa thoại trong mạng thông tin di động thế hệ tiếp theo luận văn tốt nghiệp,luận văn thạc sĩ, luận văn cao học, luận văn đại học, luận án tiến sĩ, đồ án tốt nghiệp luận văn tốt nghiệp,luận văn thạc sĩ, luận văn cao học, luận văn đại học, luận án tiến sĩ, đồ án tốt nghiệp
BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI TRẦN THỊ HIỀN TRẦN THỊ HIỀN NGÀNH KỸ THUẬT ĐIỆN TỬ NGHIÊN CỨU Mà HÓA THOẠI TRONG MẠNG THÔNG TIN DI ĐỘNG THẾ HỆ TIẾP THEO LUẬN VĂN THẠC SĨ KHOA HỌC Kỹ thuật Điện tử KHOÁ 2008-2010 Hà Nội – Năm 2010 BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI - TRẦN THỊ HIỀN NGHIÊN CỨU Mà HĨA THOẠI TRONG MẠNG THƠNG TIN DI ĐỘNG THẾ HỆ TIẾP THEO Chuyên ngành : ĐIỆN TỬ VIỄN THÔNG LUẬN VĂN THẠC SĨ KHOA HỌC Kỹ thuật Điện tử NGƯỜI HƯỚNG DẪN KHOA HỌC : TS NGUYỄN HỮU TRUNG Hà Nội – Năm 2010 Luận văn cao hoc ĐTVT 2008-2010 Trần Thị Hiền LỜI CAM ĐOAN Tôi cam đoan rằng, ngoại trừ kết tham khảo từ tài liệu ghi rõ luận văn, phần trình bày luận văn tơi thực chưa có phần nội dung luận văn nộp để lấy cấp Hà nội, ngày 15 tháng 10 năm 2010 Trần Thị Hiền GVHD: TS Nguyễn Hữu Trung i Luận văn cao hoc ĐTVT 2008-2010 Trần Thị Hiền LỜI CẢM ƠN Tôi xin chân thành gửi lời cảm ơn sâu sắc đến thầy giáo TS Nguyễn Hữu Trung tận tình bảo hướng dẫn cho tơi kiến thức q báu để tơi hoàn thành luận văn Xin chân thành cảm ơn thầy cô khoa ĐTVT, Trung tâm đào tạo sau đại học Trường đại học Bách Khoa Hà Nội giúp tơi hồn thành nhiệm vụ mơn học suốt thời gian học trường GVHD: TS Nguyễn Hữu Trung ii Luận văn cao hoc ĐTVT 2008-2010 Trần Thị Hiền MỤC LỤC LỜI CAM ĐOAN .i LỜI CẢM ƠN ii DANH MỤC CÁC BẢNG vi DANH MỤC CÁC HÌNH VẼ .vii CÁC THUẬT NGỮ VIẾT TẮT ix MỞ ĐẦU CHƯƠNG 1: MẠNG VIỄN THÔNG THẾ HỆ TIẾP THEO 1.1 Khái niệm chung mạng viễn thông hệ 1.1.1 Định nghĩa 1.1.2 Đặc điểm mạng NGN .4 1.1.3 Những vấn đề cần quan tâm phát triển NGN 1.2 Kiến trúc mạng NGN 1.2.1 Nguyên tắc tổ chức mạng NGN 1.2.2 Cấu trúc logic mạng NGN .9 1.2.3 Cấu trúc vật lý 14 1.3 Các công nghệ 23 1.4 Các công nghệ chuyển mạch truyền dẫn 24 1.4.1 Các công nghệ chuyển mạch .24 1.4.2 Các công nghệ truyền dẫn 34 CHƯƠNG 2: LÝ THUYẾT Mà HÓA THOẠI 37 2.1 Các vấn đề mã hóa thoại 37 2.1.1 Mơ hình q trình tạo âm thoại 37 2.1.2 Các tính chất âm thoại 38 2.1.3 Các phương pháp mã hoá thoại 39 2.1.4 Các mục tiêu yêu cầu thuật toán mã hóa 42 2.2 Mã hóa âm thoại thơng tin di động .46 2.2.1 Dự đoán tuyến tính (LP) dựa mơ hình phát âm 46 2.2.2 Dự đoán thời gian ngắn (STP) dự đoán thời gian dài (LTP) 47 2.2.3 Bộ lọc nhấn cảm nhận 47 2.2.4 Một số loại mã hố thoại dùng thơng tin di động .48 GVHD: TS Nguyễn Hữu Trung iii Luận văn cao hoc ĐTVT 2008-2010 Trần Thị Hiền 2.3 Một số chuẩn mã hóa thoại thông dụng 49 2.3.1 Chuẩn mã hóa ITU-T 50 2.3.2 Chuẩn điện thoại số celluar Châu Âu 52 2.3.3 Chuẩn điện thoại số Bắc Mỹ .53 2.3.4 Chuẩn quốc phòng Mỹ (Điện thoại bảo mật) 54 2.3.5 Điện thoại vệ tinh 55 2.3.6 Đánh giá chất lượng chuẩn mã hóa 56 CHƯƠNG 3: ỨNG DỤNG Mà HĨA THOẠI TRONG MẠNG THƠNG TIN DI ĐỘNG NGN 60 3.1 Mã hố dự đốn tuyến tính phân tích tổng hợp .60 3.2 Dự đốn tuyến tính kích thích đa xung MPLP .61 3.3 Kích thích xung RPE .63 3.4 Dự đốn tuyến tính kích thích mã CELP .65 3.4.1 Chuẩn FS 1016 CELP 67 3.4.2 Dự đoán tuyến tính kích thích tổng vec tơ VSELP .68 3.4.3 Mã hóa 16kb/s CELP độ trễ thấp 69 3.5 Mơ hình kích thích hai trạng thái cổ điển thuật toán LPC-10 70 CHƯƠNG 4: PHÂN TÍCH TÍN HIỆU THOẠI BẰNG PHƯƠNG PHÁP DỰ ĐỐN TUYẾN TÍNH 72 4.1 Giới thiệu 72 4.2 Phân tích phổ thời gian ngắn 73 4.2.1 Biến đổi Fourier thời gian ngắn 73 4.2.2 Vai trò cửa sổ 73 4.3 Mô hình dự đoán tuyÕn tÝnh tÝn hiÖu tiÕng nãi .78 4.3.1 Mô hình máy phát âm 79 4.3.2 Xác định hệ số mô hình LPC 81 4.3.3 Quá trình phân tích mà hoá LPC thùc tÕ 90 4.4 Xác định chu kỳ tín hiệu (tần số bản) 92 4.5 Kết mơ mã hóa thoại phương pháp dự đốn tuyến tính LPC .94 4.5.1 Mục đích .94 GVHD: TS Nguyễn Hữu Trung iv Luận văn cao hoc ĐTVT 2008-2010 Trần Thị Hiền 4.5.2 Giao diện chương trình 95 4.5.3 Các kết thực nghiệm .96 KẾT LUẬN 101 TÀI LIỆU THAM KHẢO 103 GVHD: TS Nguyễn Hữu Trung v Luận văn cao hoc ĐTVT 2008-2010 Trần Thị Hiền DANH MỤC CÁC BẢNG Bảng 2.1 Các chuẩn mã hóa thoại băng hẹp ITU-T 50 Bảng 2.2 Các chuẩn mã hóa ETSI cho truyền thơng di động GMS .53 Bảng 2.3 Các chuẩn mã hóa TIA/EIA cho thông tin di động CDMA/TDMA Mỹ 54 Bảng 2.4 Các chuẩn mã hóa DoD ( Bộ quốc phịng Mỹ) 55 Bảng 2.5 Các chuẩn mã hóa thoại INMARSAT 56 Bảng 2.6 Thang điểm đánh giá trung bình MOS 57 Bảng 2.7 So sánh chuẩn mã hóa thoại .58 Bảng 4.1 So sánh phương pháp t×m tham sè LPC 90 GVHD: TS Nguyễn Hữu Trung vi Luận văn cao hoc ĐTVT 2008-2010 Trần Thị Hiền DANH MỤC CÁC HÌNH VẼ Hình 1.1 Mơ hình mạng hệ sau .5 Hình 1.2 Cấu trúc mạng hệ sau (góc độ mạng) Hình 1.3 Cấu trúc mạng dịch vụ NGN (góc độ dịch vụ) .10 Hình 1.4 Cấu trúc logic mạng NGN 10 Hình 1.5 Các thực thể chức 13 Hình 1.6 Cấu trúc vật lý mạng NGN 15 Hình 1.7 Các thành phần mạng 15 Hình 1.8 Cấu trúc Media Gateway .16 Hình 1.9 Cấu trúc SoftSwitch .18 Hình 1.10 Cấu trúc Server ứng dụng 21 Hình 1.11 Các xu hướng phát triển cơng nghệ mạng .24 Hình 1.12 Vị trí Softswitch kiến trúc phân lớp NGN 32 Hình 1.13 Cấu trúc chuyển mạch mềm .32 Hình 1.14 Kết nối MGC với thành phần khác mạng NGN .33 Hình 2.1 Mơ hình học quan phát âm người .37 Hình 2.2 Mơ hình dạng ống quan phát âm người 38 Hình 2.3 Chất lượng tiếng nói so với tốc độ bit mã hoá 39 Hình 2.4 Sơ đồ rút gọn q trình tạo tiếng nói 46 Hình 2.5 Quá trình tổng hợp phân tích mã hố tiếng nói 47 Hình 2.6 Biểu diễn hiệu ứng W(z) .47 Hình 2.7 Chất lượng tiếng nói chuẩn mã hóa ( Điểm MOS từ 2-5) 59 Hình 3.1 Sơ đồ khối mã hố phân tích tổng hợp điển hình .60 Hình 3.2 Phân tích theo MPLP 61 Hình 3.3 Phân tích theo RPE 64 Hình 3.4 Lưu đồ RPE-LTP cho chuẩn GSM 65 Hình 3.5 Phân tích tổng hợp theo CELP 66 Hình 3.6 Tổng hợp CELP cho chuẩn FS 1016 67 Hình 3.7 Tổng hợp VSELP 68 Hình 3.8 Mã hóa giải mã LD-CELP G.728 69 Hình 3.9 Bộ mã hóa – giải mã theo chuẩn FS 1015 71 GVHD: TS Nguyễn Hữu Trung vii Luận văn cao hoc ĐTVT 2008-2010 Trần Thị Hiền Hình 4.1 Dạng sóng tín hiệu tiếng nói hữu vơ 72 Hình 4.2 Tác động loại cửa sổ lên tín hiệu tiếng nói hữu 75 Hình 4.3 Tác động loại cửa sổ lên tín hiệu tiếng nói vơ 76 Hình 4.4 Tác động cửa sổ dài 40 mẫu lên tín hiệu hữu 77 Hình 4.5 Mô hình phát âm (tạo tiếng nói) 79 Hình 4.6: Dự đoán tiến dự đoán lùi (sử dụng i mẫu) 87 H×nh 4.7 Quan hệ bậc lọc tăng ích dự đoán .91 Hình 4.8 Đường bao phỉ cđa tÝn hiƯu qua c¸c bé läc LPC bËc kh¸c .92 Hình 4.9 Giao diện chương trình 96 Hình 4.10 Dạng sóng đầu tín hiệu tiếng nói gốc 97 Hình 4.11 Dạng sóng đầu tín hiệu tiếng nói LPC 98 Hình 4.12 Dạng sóng đầu tín hiệu tiếng nói tổng hợp 98 Hình 4.13 Dạng sóng đầu tín hiệu tiếng nói kích thích 99 Hình 4.14 So sánh dạng sóng đầu tín hiệu tiếng nói 99 GVHD: TS Nguyễn Hữu Trung viii Luận văn cao hoc ĐTVT 2008-2010 Trần Thị Hiền Như phương trình phân tích LPC giải sử dụng tiêu chuẩn lỗi bình phương trung bình nhỏ nhất, kết nhận phương pháp khác, ví dụ sử dụng phương pháp hiệu lớn Dự đốn tuyến tính phân tích tín hiệu tiếng nói thường sử dụng theo hướng - Tiến hành phân tích phổ thời gian ngắn tiếng nói - Xây dựng hệ thống phân tích - tổng hợp Các tham số đưa vào phương trình dự đốn qua cơng thức (4.08) xác định tham số hàm truyền đạt thiết bị giọng nói, đề xuất số phương án cấu trúc phân tích, tổng hợp để xây dựng tổng hợp thực hàm truyền thiết bị giọng nói Có thể nhận cấu trúc dạng trực hệ số hàm dự đốn Từ phía khác phân số (4.08) biến đổi thành tích nhận cấu trúc hình dạng tầng Trong tất trường hợp tham số tổng hợp liên tục đổi thay khung phân tích tiếng nói, để tránh hiệu ứng gắn liền với bước nhảy giá trị tham số Cần thiết thay đổi nhịp nhàng tham số với trợ giúp phép nội suy Khi chuyển từ đoạn tiếng nói sang đoạn khác Khi dạng tổng hợp trực tiếp nảy sinh tính tương ứng với lọc không ổn định, giá trị nguyên thuỷ đưa đến lọc ổn định Trong cấu trúc tầng độ ổn định bảo đảm đơn giản Sự xác định lại tham số tín hiệu kích thích hệ thống phân tích tổng hợp với dự đốn tuyến tính dựa sở nghiên cứu tín hiệu lỗi, nhận băng truyền tín hiệu tiếng nói gốc qua lọc với đặc tính ngược, làm xấp xỉ hàm truyền đạt thiết bị giọng nói, tín hiệu lỗi nhận xấp xỉ tín hiệu, kích thích dao động giọng nói Để xác định tham số tín hiệu kích thích áp dụng thuật tốn biết phân biệt tiếng nói vang hay khơng vang, đánh giá chu kỳ âm sở phân tích tương quan tín hiệu theo thời gian xem xét GVHD: Nguyễn Hữu Trung 88 Luận văn cao hoc ĐTVT 2008-2010 Trn Th Hin 4.3.3 Quá trình phân tích mà hoá LPC thực tế Khi tiến hành mà hoá phân tích LPC thực tế, có nhiều nhóm hệ số cần xác định Nhóm đặc trưng, tham số yếu tố ổn định cần cho phương pháp không khác nhau, có phương pháp lưới LM hay sử dụng hệ thống thời gian thực việc đảm bảo điều kiện ổn định quan trọng Tuy nhiên lựa chọn cửa sổ hợp lý thuật toán tốt xác phương pháp CM AM đảm bảo tính ổn định LM So sánh khối lượng nhớ lưu trữ khối lượng tính toán phương pháp cho bảng 4.1 Khi lượng tử hoá hệ số tính ổn định trì phạm vi định Nhóm hệ số thứ hai gồm bậc lọc p độ dài cửa sổ phân tích N Phương pháp hiệp Phương pháp tự Phương pháp lưới biến CM tương quan AM (mắt cáo) LM (Phân tích Cholesky) (Thuật toán Durbin) (Thuật toán Burg) Lưu tr÷ D÷ liƯu N1 N2 3N3 Ma trËn p2/2 P Cưa sỉ Khèi lỵng tÝnh toán (phép nhân) Tạo cửa sổ N2 Tương quan N1.p N2.p Giải ma trận p3 p2 5N3.p Bảng 4.1: So sánh phương pháp tìm tham số LPC Đối với mà hoá thoại, tín hiệu thường lấy mẫu với tần số 8KHz, phân tích phổ với bề rộng 4KHz Trong khoảng 4KHz, số lượng formant lớn xuất thường bậc lọc tối thiểu Thông thường ngêi ta sư dơng bé läc bËc 10 ®Ĩ sù cấu trúc formant đường bao phổ mô hình hoá cách xác (Tuy nhiên lọc bậc cao sử dụng GVHD: Nguyễn Hữu Trung 89 Luận văn cao hoc ĐTVT 2008-2010 Trn Th Hin hệ thống cần phân tích chi tiÕt h¬n, vÝ dơ theo chn ITU G.728 16kb/s sư dơng bé läc LPC bËc 50) Quan hƯ gi÷a tăng ích G lọc dự đoán LPC bậc p lọc biểu diễn hình 4.7 hình 4.8 đường bao phổ c¸c bé läc cã bËc kh¸c Tăng ích dự đoán G 10 2 10 12 14 16 18 20 22 24 26 28 Bậc p lọc LPC H×nh 4.7: Quan hệ bậc lọc tăng ích dự đoán Trong khung, tín hiệu coi dừng, để đảm bảo điều ta phải chọn kích thước khung phù hợp Để đạt vËy ngêi ta thêng chän kÝch thíc khung b»ng chiỊu dài vài chu kỳ, khoảng 16 - 32 ms Một hệ số liên quan điểm phân chia khung phân tích Nếu điểm phân chia rơi vào phần tín hiệu đoạn âm thoại gây ảnh hưởng đáng kể đến phân tích LPC Tuy nhiên thực tế phương pháp lựa chọn điểm phân chia thích hợp tối ưu, vấn đề giải dễ dàng Một giải pháp giai đoạn tiền xử lý tăng cường tín hiệu trước thực phân tích LPC, sử dụng khung cưa sỉ chång C¸c khung chång gióp chóng ta khắc phục vài hiệu ứng biên khung liệu phân tích LPC Phần GVHD: Nguyn Hu Trung 90 Luận văn cao hoc ĐTVT 2008-2010 Trần Thị Hiền chång cđa c¸c khung thêng chiÕm tư 10% ®Õn 20% ®é dµi khung Ngoµi cã thĨ néi suy hệ số LPC từ khung sang khung giúp làm mịn tín hiệu để khắc phục hiệu ứng độ p=0 10 12 16 20 24 Phỉ tÝn hiƯu tiếng nói gốc Hình Hình 4.8: Đường bao phổ cđa tÝn hiƯu qua c¸c bé läc LPC bËc kh¸c 4.4 Xác định chu kỳ tín hiệu (tần số bản) Việc ước lượng xác chu kỳ (pich) hay tần số lọc pitch quan trọng Trong mà hoá, lọc pitch thực dịch chứa giá trị mẫu kích thích khứ, nÕu chän c¸c béi sè cđa chu kú (pitch) cã thể không ảnh hưởng đến hoạt động dự đoán Đó chu kỳ chọn bội số quay ghi dịch để tạo N mẫu dự đoán, trì chu kỳ xác tín hiệu tiếng nói Hoạt động dự đoán bị ảnh hưởng bắt đầu đoạn tín hiệu thoại tín hiệu hữu Trong trường hợp ghi dịch chứa nhiều chu kỳ tín hiệu tuần hoàn, việc chọn giá trị chu kỳ điều gần Vì mà hoá mà lọc pitch sử dụng ghi dịch với trỏ biến đổi để trỏ đến mẫu kích thích trước (dự đoán thời gian dài) không cần thiết phải kiểm tra lỗi với trường hợp chọn phải bội số chu GVHD: Nguyễn Hữu Trung 91 Luận văn cao hoc ĐTVT 2008-2010 Trần Thị Hiền T¸c dơng cđa viƯc chän c¸c chu kỳ pitch ảnh hưởng lớn đến hoạt động mà hoá mà không sử dụng đến nhớ mô hình pitch (nghĩa không lọc đảo pitch) Khi mô hình hoá tín hiệu hữu thanh, khoảng chu kỳ (tần số bản) cho 2/ Như vậy, chu kỳ chọn hai lần chu kỳ thực, khoảng cách tần số hài 2/2 nghĩa phổ chứa gấp đôi số chu kỳ, tạo tín hiệu đầu thô Mặt khác, chu kú chän lµ íc sè cđa chu kú thùc tần số 2/(/2), kết phổ chứa nửa số chu kỳ xác Trong trường hợp cho ta âm đầu nhỏ nhẹ tiếng nói đàn ông nghe giống phụ nữ Một thông số quan trọng khác thay đổi chu kỳ từ khung sang khung khác Vì chu kỳ thay đổi không liên tục, âm tổng hợp bị đứt quÃng không liên tục Do vocoder không dùng chu kỳ pitch làm trỏ lọc miền thời gian, dùng làm tham số để mô hình hoá tín hiệu hữu thanh, cần ước lượng xác chu kỳ pitch cịng nh theo dâi sù thay ®ỉi cđa chu kú pitch tõ khung nµy sang khung kÕ tiÕp cho hợp lý liên tục Trong trường hợp nên áp dụng thuật toán ước lượng pitch để kiểm tra tránh khỏi lỗi nhân đồng thời theo dõi pitch để điều khiển hoạt động cách hiệu Sự đo lường xác tin cậy chu kỳ pitch tín hiệu thường gặp nhiều khó khăn nguyên nhân sau: - Dạng sóng kích thích từ môn không hoàn toàn xung có chu kỳ - Trong vài trường hợp, formant ống dẫn làm thay đổi đáng kể cấu trúc dạng sóng môn phát ra, việc xác định xác chu kỳ pitch gặp khó khăn - Phép đo tin cậy chu kỳ pitch bị giới hạn khó khăn cố hữu việc xác định xác thời điểm bắt đầu kết thúc chu kỳ khoảng hữu tín hiệu - Một khó khăn khác việc xác định chu kỳ pitch phân biệt đoạn tín hiệu vô hữu lượng thấp Trong nhiều trường hợp, đoạn độ hai thành phần tín hiệu không rõ ràng khó xác định GVHD: Nguyn Hu Trung 92 Luận văn cao hoc ĐTVT 2008-2010 Trần Thị Hiền - Trong ứng dụng thực tế tạp âm xung quanh gây tác động nghiêm trọng đến hoạt động phát pitch Đặc biệt môi trường thông tin di động có tạp âm tác động lớn Để khắc phục khó khăn trên, nhiều kỹ thuật tách chu kỳ đà nghiên cứu phát triển Các thuật toán tách chu kỳ pitch chia làm loại sau: - Tách chu kỳ sử dụng đặc tính tần số tín hiệu tiếng nói - Tách chu kỳ sử dụng đặc tính thời gian cđa tÝn hiƯu tiÕng nãi - T¸ch chu kú sư dụng đặc tính thời gian tần số tÝn hiƯu tiÕng nãi 4.5 Kết mơ mã hóa thoại phương pháp dự đốn tuyến tính LPC 4.5.1 Mục đích Chương trình mơ ứng dụng phần mềm Matlab 7.8 với liệu đầu vào file dạng *.WAV 16 bit MONO ( 1kênh PCM ) khơng nén, mẫu mã hóa 16 bit, với độ lớn từ -32767 đến 32768 Với điều kiện mặc định thực nghiệm sau, tần số lấy mẫu 8KHz ( 8000 mẫu giây), phân tích phổ với bề rộng 4KHz Lựa chọn kích thước khung phân tích 320 mẫu ( tương ứng với 40 ms) kích thước khung 80 mẫu (10ms) tức khung chứa khung Bậc lọc LPC 12 Tuy nhiên thông số đầu vào thay đổi người sử dụng để quan sát thay đổi tín hiệu phân tích Sau đọc file nguồn thơng số thiết lập, chọn nút chạy chương trình “Run Program” chương trình thực phân tích hiển thị kết quả: - Tín hiệu tiếng nói gốc đường màu đỏ - Tín hiệu LPC màu xanh da trời - Tín hiệu tổng hợp màu xanh (green) - Tín hiệu kích thích màu tím - Phát loa tín hiệu gốc tín hiệu tổng hợp GVHD: Nguyễn Hữu Trung 93 Luận văn cao hoc ĐTVT 2008-2010 Trần Thị Hiền Các tín hiệu biểu diễn so sánh đồ thị: so sánh hình ảnh tín hiệu so sánh tín hiệu theo thời gian Chúng ta quan sát tín hiệu cách click chuột vào dấu nhắc loại tín hiệu âm thoại 4.5.2 Giao diện chương trình Hình 4.9 giao diện chương trình, gồm cửa sổ biểu diễn đồ thị theo miền thời gian miền tần số tín hiệu, hiển thị tồn tín hiệu âm thoại đọc từ file Ta chọn hiển thị loại tín hiệu cách click vào loại tín hiệu muốn hiển thị Cửa sổ thứ hiển thị loại tín hiệu so sánh dạng hình ảnh tín hiệu với trục tung độ lớn đo theo Đêxiben (dB), độ lớn thay đổi tùy theo giọng âm thoại đưa vào, trục hoành trục tần số, với tần số lấy mẫu 4KHz Cửa sổ thứ hai hiển thị so sánh loại tín hiệu đầu vào theo thời gian, trục tung biên độ tín hiệu giá trị từ -1 đến 1, trục hoành trục thời gian số mẫu với mẫu 5ms tùy theo lượng thời gian tín hiệu âm thoại đầu vào Bên trái giao diện chương trình thiết lập điều khiển Các tham số bao gồm: - Độ lớn chu kỳ pitch (Pitch Measure) 10ms; - Chiều dài khung ( Frame Duration) 40ms; - Phần khung chồng (Frame Overlap) 75%; - Cỡ FFT (FFT Size) 1024 - Bậc lọc LPC 12 GVHD: Nguyễn Hữu Trung 94 Luận văn cao hoc ĐTVT 2008-2010 Trần Thị Hiền Hình 4.9: Giao diện chương trình Ngồi ta lựa chọn file tiếng nói (Speech File) với file dạng *.WAV file pitch tương ứng với file dạng *.mat Ta lựa chọn phổ tín hiệu hiển thị theo dạng cửa sổ: Hamming, Bartlett, Rectangular, Hanning Blackman Lựa chọn hiển thị tín hiệu tiếng nói gốc (original signal), tín hiệu LPC (LPC signal), tín hiệu tổng hợp (Synthetic signal), tín hiệu kích thích ( Excitation signal) Mỗi loại tín hiệu hiển thị với màu khác sau ta click vào loại đồ thị hiển thị dạng phổ tín hiệu Hai nút nhấn Play cho phép đọc lên giọng nói cần mã hóa Nút play1 cho giọng nói gốc khơng có tạp âm, nút nhấn play2 cho giọng nói chưa lọc tạp âm GVHD: Nguyễn Hữu Trung 95 Luận văn cao hoc ĐTVT 2008-2010 Trần Thị Hiền 4.5.3 Các kết thực nghiệm Chương trình hiển thị kết sau phân tích LPC Tín hiệu âm thoại thực phương pháp thủ công; sử dụng phần mềm ghi âm, lọc nhiễu chuyển sang file *.wav Sau chọn file tiếng *.wav đưa vào đầu vào tín hiệu kết đầu hiển thị Như hình 4.9, file tiếng đầu vào chọn ‘ s5.wav ’với file pitch tương ứng ‘ pp5.mat’ xác lập thơng số hình ấn nút ‘ Run Program’ Hiển thị tín hiệu tiếng nói gốc: Hình 4.10: Dạng sóng đầu tín hiệu tiếng nói gốc GVHD: Nguyễn Hữu Trung 96 Luận văn cao hoc ĐTVT 2008-2010 Trần Thị Hiền Hiển thị tín hiệu LPC: Hình 4.11: Dạng sóng đầu tín hiệu tiếng nói LPC Hiển thị tín hiệu tổng hợp: Hình 4.12: Dạng sóng đầu tín hiệu tiếng nói tổng hợp GVHD: Nguyễn Hữu Trung 97 Luận văn cao hoc ĐTVT 2008-2010 Trần Thị Hiền Hiển thị tín hiệu kích thích: Hình 4.13: Dạng sóng đầu tín hiệu tiếng nói kích thích So sánh tất tín hiệu: Hình 4.14: So sánh dạng sóng đầu tín hiệu tiếng nói GVHD: Nguyễn Hữu Trung 98 Luận văn cao hoc ĐTVT 2008-2010 Trần Thị Hiền Ta thấy khoảng thời gian tần số tín hiệu tiếng nói sau qua phân tích LPC cho phổ phẳng hơn, tín hiệu tiếng nói LPC hình 4.11 Hình 4.12 dạng phổ tín hiệu phân tích đoạn tiếng nói hỗn hợp, đoạn tín hiệu hữu thanh, vô độ Ta thấy biên độ tín hiệu biến đổi theo thời gian dao động nhỏ quanh giá trị giảm dần mức thời gian lớn phổ biến đổi chậm đỉnh nhọn Tín hiệu tổng hợp sau phân tích LPC giống với tín hiệu gốc so với tín hiệu sau phân tích LPC tín hiệu kích thích Sau nghe thử nhiều mẫu tín hiệu tiếng nói phát loa tín hiệu tổng hợp khơng khác so với tín hiệu gốc Ta thấy tuần hồn tín hiệu cách rõ ràng hình 4.10, hình 4.12 hình 4.13 Tuy nhiên đỉnh hài bội số tần số hình 4.13 hẹp nhọn Ngồi ra, ta nhận thấy cấu trúc formant bao gồm đỉnh lớn tần số 50 KHz đến đỉnh cịn lại có xu hướng biên độ giảm dần tần số cao tính thơng thấp tự nhiên xung mơn Các tín hiệu sau phân tích cho ta thấy giá trị hệ số tăng ích β lớn đoạn chuyển tiếp tín hiệu khoảng hữu β dao động quanh chu kỳ pitch τ liên tục Như vậy, tín hiệu tiếng nói sau qua phân tích LPC cho ta kết rõ rệt so sánh qua đường phổ tín hiệu loại tín hiệu tiếng nói đầu vào Kết cho ta thấy tất tín hiệu sau qua phân tích LPC mã hóa, đưa tham số đặc trưng để từ khơi phục lại tín hiệu có đặc trưng tín hiệu ban đầu Những kết thực nghiệm cho thấy kết với phần lớn lý thuyết trình bày phần đầu chương Tuy nhiên, chương trình hồn thành thời gian ngắn nên tránh khỏi thiếu sót hạn chế, mong nhận bảo thầy ý kiến đóng góp bạn để hồn thiện chương trình GVHD: Nguyễn Hữu Trung 99 Luận văn cao hoc ĐTVT 2008-2010 Trần Thị Hiền KẾT LUẬN Kết ứng dụng luận văn Mạng hệ sau NGN nghiên cứu, chuẩn hoá tổ chức viễn thông lớn giới nhằm đáp ứng nhu cầu tăng tính mở, tương thích linh hoạt để cung cấp đa dịch vụ, đa phương tiện với tính ngày mở rộng Tại Việt Nam, mạng viễn thông ngày phát triển để đáp ứng nhu cầu kinh tế hội nhập giới Luận văn nghiên cứu mã hóa thoại mạng thơng tin di động hệ tiếp theo, lĩnh vực có tính ứng dụng cao phổ biến Luận văn có nhìn tổng quan kỹ thuật mã hóa âm thoại, trình bày đầy đủ sâu cấu trúc mạng NGN sở lý thuyết làm phương tiện cho việc phân tích âm thoại sở để thiết kế mã hóa thoại Khi DSP với cơng nghệ đại ngày phát triển ngày thuận lợi thiết kế mã hóa tiếng nói Vì luận văn tài liệu tham khảo hữu ích cho quan tâm tìm hiểu lĩnh vực mã hóa thoại mạng di động NGN Bên cạnh luận văn cung cấp chương trình để kiểm nghiệm lý thuyết nêu sau tiếp tục phát triển chương trình để mơ phỏng, nghiên cứu kỹ thuật mã hóa Tuy nhiên kiến thức thời gian có hạn nên luận văn không tránh khỏi hạn chế Do lĩnh vực nghiên cứu rộng, mà nghiên cứu từ sở chưa thể tìm hiểu hết kỹ thuật mã hóa tiên tiến đại ngày Luận văn dừng lại số kỹ thuật bản, phương pháp mã hoá dự đoán tuyến tính LPC xây dựng dựa sở đặc tính thống kê tín hiệu tiếng nói với quan niệm tiếng nói q trình ngẫu nhiên dừng lý thuyết gia cơng tín hiệu số Việc mơ hình hố tín hiệu tiếng nói theo quan điểm dựa tham số tín hiệu dư thừa (sử dụng lọc) làm tốc độ mã hố tiếng nói giảm xuống cách đáng kể, chí xuống đến 2,4 kb/s thành cơng lớn Việc xây dựng thuật toán cho lọc phân tích, lọc tổng hợp cơng việc quan trọng, ngồi phải tính đến chọn khung tiếng nói bậc lọc để làm GVHD: Nguyễn Hữu Trung 100 Luận văn cao hoc ĐTVT 2008-2010 Trần Thị Hiền xác q trình mơ hình hố tham số tín hiệu tiếng nói dẫn đến giảm sai số giảm trễ, tất nhiên phương pháp cịn nhiều hạn chế phân tích Để nâng cao chất lượng hiệu mã hoá cần kết hợp LPC với phương pháp khác có nhiều phát triển sau mã hóa hóa dự đốn tuyến tính kích thích mã CELP, ngày có nhiều phiên tín hiệu kích thích VSELP ( kích thích vectơ tổng), ACELP ( kích thích mã đại số ), PAME ( mã hỗn hợp tự kích ứng với chu kỳ ) Ngồi ngày cịn nhiều kỹ thuật mã hóa tiên tiến mã hóa đa chế độ ( multi – mode), mã hóa kích thích đa giải MBE ( Multi Band Excitation ) hoạt động với tốc độ thấp mà tốc độ chấp nhận Các hướng phát triển đề tài - Nghiên cứu biện pháp để cải tiến thuật tốn mã hóa để giảm tốc độ bít mà đảm bảo chất lượng - Nghiên cứu phương pháp khắc phục hiệu ứng biên chuyển tiếp khung phân tích - Nghiên cứu mã hóa đại hệ thống thơng tin số ngày - Thiết kế chương trình mã hóa tiếng nói cho xử lý tín hiệu DSP Xử lý tình thực tế GVHD: Nguyễn Hữu Trung 101 Luận văn cao hoc ĐTVT 2008-2010 Trần Thị Hiền TÀI LIỆU THAM KHẢO Alan Mc Cree (2002), A kb/s Hybrid MELP/CELP Speech Coding Candidate for ITU Standardization, IEEE F J Owens (1993), Signal Processing of Speech, Macmilan, England.Neill Gordon E Pelton (1993), Voice Processing, McGraw-Hill, Singapore Peter Vary, Rainer Martin (2006), Digital Speech Transmission, John Wiley & Son, England The International Engineering Consortium, Next Generation Networks, Web ProForum Tutorials: http://www.iec.org Wai C Chu (2003), Speech Coding Algorithms, John Wiley & Son, England Wilkinson (2002), Next Generetion Network Services, John Wiley & Sons Ltd, England Khoa điện tử viễn thông, Bài giảng NGN, trường đại học Bách Khoa Hà Nội, Web: http://www.ebook.vn TS Nguyền Quý Minh Hiền, Mạng viễn thông hệ sau, , Viện khoa học kỹ thuật bưu điện GVHD: Nguyễn Hữu Trung 102 ... thuyết mã hóa thoại, vấn đề mã hóa thoại, mã hóa âm thoại thơng tin di động số chuẩn mã hóa thoại thông dụng tổ chức hợp chuẩn thiết lập Chương nói vấn đề mã hóa thoại ứng dụng mạng di động NGN... KHOA HÀ NỘI - TRẦN THỊ HIỀN NGHIÊN CỨU Mà HÓA THOẠI TRONG MẠNG THÔNG TIN DI ĐỘNG THẾ HỆ TIẾP THEO Chuyên ngành : ĐIỆN TỬ VIỄN THÔNG LUẬN VĂN THẠC SĨ KHOA HỌC Kỹ thuật Điện tử... Bảng 2.1 Các chuẩn mã hóa thoại băng hẹp ITU-T 50 Bảng 2.2 Các chuẩn mã hóa ETSI cho truyền thông di động GMS .53 Bảng 2.3 Các chuẩn mã hóa TIA/EIA cho thơng tin di động CDMA/TDMA Mỹ