Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 71 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
71
Dung lượng
3,49 MB
Nội dung
vi By THANH PHAM ậ QUANG HUYNH Submitted to the Department of Electrical and Electronics Engineering on April19, 2014 in partial fulfillment of the requirements for the degree of Master of Science in Electronics and Communication Engineering at the University of Technical Education Ho Chi Minh City Abstract Newapplicationsinvolvingspeechcodinghaveincreasedconsiderably. The field of speechcodinghasplayedan imp ortan t roleinmobilecommunication systems. Hence,researchand improv emen t ofspeechcodingmethodsare topromote the needs ofthemarket. Inthisthesis,wedevelopeda real-time speechcoder of the LPC- 10ealgorithm. The speechcoderisimplementedonTexas Instrumen ts TMS320C6713 DigitalSignal Processor(DSP) accordingtoLPC-10eFederal Stan dard 1015.Finally, Perceptual EvaluationofSpeech Quality(PESQ) algorithmis usedformeasuringthevoice qualit y . Keywords:Algorithm,LPC-10e,quality evaluation,andTMS320C6713. Thesis Supervisor: Assoc. Prof. Dr. Chien Hoang-Dinh Title: Assoc. Prof. MC LC LI CMăN iv vii Danh sách hình v ix Danh sách bng xi Các từ vit tt xii Chngă1 1 TNG QUAN V LƾNHăVC NGHIÊN CU 1 1.1 Gii thiu chung 1 1.2 Mã hóa ting nói 1 1.2.1 Mã hoá trên min thi gian 3 1.2.2 Mã hoá trên min tần s 4 1.2.3 Mã hoá ngun 5 1.2.3 Mã hoá lai 6 1.3 Phát triển b mã LPC-10e 7 1.4 Cấu trúc lunăvĕn 8 Chngă2 8 CăS LÝ THUYT 9 2.1 Tín hiu ting nói 9 2.1.1ăCăch phát âm ting nói 9 2.1.2ăĐặc tính âm học ting nói 11 2.1.3ăĐặc tính vt lý ting nói 13 2.1.3.3ăTrngăđ 15 2.1.3.4 Âm sc 15 2.1.3.5 Tần s vtăquaăđiểm không 15 2.1.3.6 Tần s căbn 15 2.1.3.7 Formant 16 2.1.4 Phân loi đnăgin dng sóng ting nói 17 2.2 S hóa ting nói 18 viii 2.3 Tổng quan v phân tích/tổng hp ting nói 19 2.3.1 Gii thiu chung 19 2.3.2 Phân tích LPC 20 2.3.3 Tổng hp ting nói 21 2.4ăPhngăphápăđánhăgiáăchấtălng thoi 24 2.4.1ăPhngăphápăđánhăgiáăch quan 24 2.4.2ăCácăphngăphápăsoăsánhăda trên mô hình giác quan 26 2.4.2.1 PhngăphápăPESQ 26 2.5 B xử lý tín hiu s TMS320C6713 27 2.6 Code composer studio(CCS) 30 2.7 Tổng quan v kit DSKTMS320C6713 32 2.7.1 B binăđổi AIC 23 33 2.7.3 McBSP (Multichannel Buffered Serial Port) 37 2.7.4 EDMA kt hp vi McBSP 37 2.7.5 Kỹ thut vào ra Ping Pong 38 2.7.6 Vn chuyển d liu kiểu Ping-Pong 40 2.7.7 Móc ni các cấu hình Ping-Pong 40 2.7.8 Lungăđiu khiển 41 2.7.9 Kỹ thut vào ra cho h thng 42 Chngă3 43 THC NGHIM TRÊN MATLAB 43 VÀ KIT TMS320C6713 43 3.1 Phân tích ting nói 43 3.2 Tổng hp ting nói 44 3.2.1 Tổng hp d đoánătuyn tính ca tín hiu hu thanh 45 3.2.2 Tổng hp ting nói ca âm vô thanh 51 3.3ăThayăđổi thông s caăchngătrìnhăMatlab 52 ix 3.3.1 Cách thc thc hin 52 3.3.1.1 Giọng Nam 52 3.3.1.2 Giọng n 53 3.4 Thc hin trên Kit TMS320C6713 55 3.5.1 Mã hóa 55 3.5.2 Gii mã 56 3.5.3 Kt qu thc hin trên Kit 57 Chngă4 58 KT LUN 58 4.1. Kt lun 58 4.2.ăHng phát triển 58 TÀI LIU THAM KHO 60 Danh sách hình v Hình 1.1: B mã ph thuc vào tcăđ bit và chấtălng [25] 3 Hình 1.2: H thng DPCM 4 Hình 1.3: Mô hình to tingănóiăđc sử dng bi mã hoá ngun 6 x Hình 1.4: Kin trúc ca mã hoá AbS. (a): Mã hoá. (b): Gii mã. 7 Hình 2.1: Cấu toăcácăcăquanăphátăraăơmăthanh 9 Hình 2.2: S hóa tín hiuătngăt 18 Hình 2.3: Lấy muăvƠălng tử hóa tín hiu thoi 19 Hình 2.4: Mô hình tổng hp ting nói bngăphngăphápăformant 22 Hình 2.5: Mô hình tổng hp ting nói bngăphngăphápăLPC 23 Hình 2.6: Mô hình tổng hp ting nói bngăphngăphápămôăphng ngun âm 23 Hìnhă2.7:ăLuăđ thut toán PESQ 27 Hình 2.8: Cấu trúc b xử lý DSP TMS320C6713 28 Hình 2.9: BSL cần cho CCS 32 Hình 2.10: Tổng quan phần cng board DSK TMS320C6713 33 Hình 2.11: Giao tip ngõ vào và ngõ ra ca các thit bị âm thanh và b Codec 34 Hình 2.12: Mô hình vào ra EDMA 35 Hìnhă2.13:ăTínhănĕngăđaăkênhăca EDMA 36 Hình 2.14: TCC vi các kênh EDMA khác nhau 36 Hình 2.15: Mô hình kt hp gia EDMA và McBSP 38 Hình 2.16: Các b đm Ping-Pong[2] 39 Hình 2.17: Ping-Pong Buffer và Linked Transfer 41 Hìnhă2.18:ăĐ thị thc thi các tin trình 42 Hìnhă3.1:ăSăđ khi phân tích ting nói 43 Hình 3.2: Dng sóng tín hiu 44 Hình 3.3: Phổ ca tín hiu ting nói 45 Hình 3.4: Dng sóng tín hiu khong 30s 45 Hình 3.5: Ni dung ca Frame 46 Hìnhă3.6:ăĐápăng tần s ca Inverse và b lọc tổng hp 47 Hìnhă3.7:ăĐápăng tần s ca b lọc tổng hp 47 Hìnhă3.8:ăĐiểm cc và Zero ca b lọc 48 Hình 3.9: Dng sóng ca d đoánăResidual 48 Hình 3.10: Periodogram ca d đoánăResidual 49 Hình 3.11: LPC excitation 49 Hình 3.12: Periodogram ca LPC excitation 50 Hình 3.13: Dng sóng ca âm "e" 50 Hình 3.14: Phổ tín hiu ca âm "e" 51 Hình 3.15: Dng sóng ca ting nói vô thanh 51 Hình 3.16: Mtăđ phổ công suất 52 Hìnhă3.17:ăSăđ khi mã hóa 55 xi Hìnhă3.18:ăSăđ khi gii mã 56 Danh sách bng Bng 2.1: Giá trị tần s căbnătngăng vi gii tính và tuổi 16 Bng 2.2: Bng MOS 25 Bng 2.3: Memory map ca TMS320C6713 29 xii Bng 3.1: Tcăđ xử lý(Namătrng thành) 53 Bng 3.2: BngăMOS(Namătrng thành) 53 Bng 3.3: Tcăđ xử lý(N trng thành) 54 Bng 3.4: Bng MOS(N trng thành) 54 Bng 3.5: Tính toán tcăđ bit 55 Bng 3.6: Kt qu thc nghim trên Kit 57 Các t vit tắt ITU InternationalTelecommunication Union Liênminhvin thôngquc t PCM Pulse CodeModulation Điuchmã xung xiii APCM Adaptive Pulse Code Modulation Điu ch mã xung thích nghi DPCM DifferentialPulse CodeModulation Điu ch mã xungvi phân ADPCM Adaptive Differential PulseCodeModulation Điu c h mãxungviphânthích nghi DM DeltaModulation Điuch Delta ADM AdaptiveModulationDelta ĐiuchDeltathích nghi APC Adaptive Predictive Coding Mãhoádđoánthích nghi LPC LinearPredictiveCoding Mãhóatuyn tính MOS MeanOpinionScore Điểmđánhgiátrungă bình PESQ Perceptual Evaluation ofSpeechQuality Đánhgiá nhn thcchấtlng thoi 1 Chng 1 TNG QUAN VLĨNH VC NGHIÊN CU 1.1 Gii thiu chung Mãhóatingnóilàngdngcalƿnhvcxửlýtínhiu,vicxửlýnàymcđíc h xétđnlàhiuqutrong victruyn ti vƠlutr. Vicmãhóatingnói, mc tiêu làgimtcđbit,ă nghƿaă lƠtcđbit trên migiây,trongă khiđóvn duy trìđchìnhdngcadngsóngbanđầu.Trongtrnghpnày,chấtă ă lng ca tingnóiđcđánhă giánhsau:stnhiên,dhiểu,vàsnhn dngkhi phát qualoa[3],[4]. Bng 1.1 phân loi b mã ting nói theo tcăđ bit. Bng 1. 1: Phân loi theo tcăđ bit Stt Phơnăloiă TcăđăBit 1 High bit-rate >15 kbps 2 Medium bit-rate 5ăđn 15 kbps 3 Low bit-rate 2ăđn 5 kbps 4 Very low bit-rate <2 kbps 1.2 Mã hóa ting nói Nhu cầu ca các h thngăthôngătinădiăđngănhăđin thoiădiăđngăđangătĕngă trongăvƠiănĕmăquaăvƠăđƣăcóăphátătriểnăvt bc ca các b mã vi tcăđ bit thấp. S raăđi ca b mã CELP(Code Excited Linear Prediction)[5] và s phát triển ca các phngăphápăkhác da trên b mƣăCELPăđƣăđóngăgópărất ln vào vic ci thin h thng mã hóa ting nói vi tcă đ bit thấp. Các b mƣă nƠyă đc giám sát bi ITU(International Telecommunications Union Telecommunication) và ISO(International Organization for Standardization). Không nhng có nhng b mã dùng cho mcăđíchădơnăs mà còn phát triển cho mcăđíchăquơnăs. Ví d nhăB Quc Phòng Mỹ DOD(Department of Defense) gầnă đơyă đƣă thôngă quaă b mã MELP(Mixed Excitation Linear Prediction) thay th b mã LPC-10. Chấtă lng 2 vt tri ca MELP(Mixed Excitation Linear Prediction), tuy nhiên thut toán MELP(MixedăExcitationăLinearăPrediction)ăcóăđ phc tpăhnănhiu so vi LPC- 10(gấp 6 lầnăMIPS(MillionăInstructionsăPerăSecond)).ăĐi vi mcăđíchădơnăs, có hai tùy chọn. Mt trong nhng la chọn này vi chấtă lng ting nói cao và đphc tp thut toán cao gingănhăMELP,ăđiu này cần có thi gian xử lý nhiu và phần cng phc tp. Mt la chọn khác vi chấtălng ting nói thấpăvƠăđ phc tp ca thut toán thấp thì ta dùng b mã cùng họ ca LPC. Hai s la chọn này, chúng ta phi tr giá gia chấtălng tingănóiăvƠăđ phc tp ca thutătoán.ăĐể ci thin nhng b mã hin nay, chúng ta cầnăxétăđn c hai yu t là chấtălngăvƠăđ phc tp.ăVƠăhaiăphngăphápăđcăđaăra,ăphngăpháp th nhất là gimăđ phc tp ca b mã có chấtălng ting nói cao, th hai là ci thin chấtălng ting nói ca b mã có chấtălng ting nói thấp. Kể từ khi họ LPCăđc phổ bin cho mcăđíchădơnăs vƠăđƣăcóănhiu h thng hotăđng da trên b mã này, ci thin chấtălng thì liăíchăhnălƠăc gng gim đ phc tp ca b mã. Nói cách khác, nhu cầu cho mt b mã ting nói vi tcăđ bit thấpăvƠăđ phc tp thấpăđể sử dng cho mcăđíchădơnăs, chẳng hnănhăting nóiăđápăng thi gian thc trên Internet[6], [7]. Trong mt vài thp kỷ vừaăqua,ăđƣăcóărất nhiu kỹ thut mã hoá nén ting nói đcăđaăra,ăphơnătíchăvƠăphátătriển. Trong phần này, chúng ta s gii thiu mt s kỹ thutăđangăđc sử dng hin nay, và mt s kỹ thut s đcădùngătrongătngă lai.ăThôngăthng thì mã hoá tingănóiăđc chia làm hai lpăđóălƠ:ămƣăhoáădng sóng(waveform coder) và mã hoá ngun(sourceăcoder)ă(hayăcònăđc gọi là mã hoá thông s). Mã hoá dngăsóngăđc thc hin tcăđ Bit cao và cho chấtălng mã hoá ting nói tt. Mã hoá ngun thc hin tcăđ Bit thấp,ănhngănóăcóăxuăhng to ra ting nói có chấtălng nhân to. Hin nay, mt lp mi ca mã hoá ting nói đc gọiălƠămƣăhoáălai(hybridăcoder),ăđơyălƠăkỹ thut mã hoá tổng hp caăphngă pháp mã hoá dng sóng và mã hoá ngun, nó cho chấtălng ting nói khá tt và thc hin tcăđ Bit trung bình. Hình 1.1 cho chúng ta thấyăđc b mã ph thuc vào tcăđ bit và chấtălng ting nói ca b mã. [...]... ng c th c nghi m trên phần c ng Hi n nay, trong bài báo [18] ngăpháp nén d a trên Compressive Sensing(CS), so sánh hi u suất ngăphápănƠyăv iăcácăph ngăphápăđ c nêu trên thì k t qu cho chúng ta thấy r ng: CS cho hi u suấtă caoă h nă v i cùng m t tỉ l nén. ă Đơyă cũngă lƠă m t ph ngăpháp nén m i và hi nănayăđangăđ phápănƠyăcũngăch aăđ c nghiên c u trên th gi i.ăVƠăph ngă c th c nghi m trên phần c ng Trong... c nghi m trên phần c ng Trong lu nă vĕnă nƠy,ă chúngă taă phátă triển thu t toán nén LPC-10e và th c nghi m trên Kit DSP320C6713.ăĐánh giá chấtăl ng ti ng nói d a trên tiêu chuẩn P.862 c a ITU 1.4 Cấu trúc lu n văn Lu năvĕnăg măcóă4ăch ng Ch ngă1:ăGi i thi u tổng quan Ch ngă2:ăC ăs lý thuy t Ch ngă3:ăTh c hi n trên Matlab và TMS320C6713 Ch ngă4:ăK t lu n Ch ng 2 8 C S LÝ THUY T 2.1 Tín hi u ti ng nói... standards G.729 8kb/s codec, G.723.1 5.3kb/s codec, và U.S.Federală Standardă FS1016).ă Đ i v i ph ngăphápănƠyănh căđiểm l n nhất là thu t toán ph c t p.ăCònăđ i v i bài báo 7 [16] tác gi đ aăraăph ngăpháp nén d a trên mã hóa tuy n tính(kỹ thu t nén suy hao) tỉ l nén đ n 95% để ti t ki măbĕngăthông.ăBƠiănƠyătácăgi phân tích nhăh c a t că đ nam(ng i l n) và n (ng b ngăMatlab,ăch aăđ đ xuất m tăph c a ph... xaăkhôngăngheăđ ng c a âm vô thanh rất nh và ti ng thì thào là do âm vô thanh t o nên 17 c do 2.2 S hóa ti ng nói Trong th c t , mã hóa d ng sóng c a tín hi u ti ng nói và video bao g m nhi u chi ti t và khía c nhăđ c nêu ra b i Jayant và Noll[10] Mã hóa d ng sóng không ph thu c vào d ng tín hi u Chính vì v y chúng ta sử d ng mã hóa d ng sóng cho tín hi u tho i, d li u, và th m chí âm nh c[19].ăĐi u này d... iănhau)ăđể tổng h p ti ng nói 19 ng Tổng h p d aă trên môă hình:ălƠă cácă ph ngă phápă tổng h pă d hình toán học và không có s tham gia c aăconăng i.ăCácăph trên các mô ngăphápăhayădùngă bao g m: -Tổng h păformant:ăph ngăphápănƠyăd a trên các lu tăxácăđịnh tần s c ăb n để tínhăraă3ăformantăđầu tiên f1, f2, f3để tổng h p ti ng nói -Tổng h păLPC:ăđơyălƠăph ngăphápăd a trên môăhìnhătiênăđoánătuy n tính, t c là... phần hài là b i s c a tần s c ăb n còn gọi là pitch và t căđ suy gi m c a chúng là 12dB/octave B máy phát âm c aă conă ng i ho tă đ ng gi ngă nh ă m t b c ngă h ng, khu chăđ i m t vài thành phần hài và làm suy gi m các thành phần hài còn l iăđể t o ra d ng sóng nguyên âm T că đ chuyểnă đ ng c a dây thanh ph thu c vào áp suất không khí trong phổi và s că cĕngă c a dây thanh C haiă đi uă nƠyă đ u có...Hình 1.1:B mã ph thu c vào t căđ bit và chấtăl ng[25] 1.2.1 Mã hoá trên mi n th i gian Mã hoá trên mi n th i gian th c hi n vi c mã hóa trên kho ng th i gian lấy m u c a tín hi u.ăCácăph ngăphápămƣăhoáătrongămi n th iăgianăth ngăđ c dùng g măcó:ăĐi u ch mƣăxung(PCM),ăđi u ch mã xung... khai thác m t s tính chất xác xuất tín hi u N u các thông s codecăđ tín hi uăđầu vào, v năduyătrìăđ Mã hóa d ngăsóngăđ c chấtăl c t iă uăhóaăchoăcácălo i c a ng t t cho các lo i tín hi u c chia làm hai lo i mã hóa tín hi u trên mi n th i gian và trên mi n tần s Vi c s hóa tín hi uăt ngăt đ Hình 2.2: S hóa tín hi uăt căđ aăra trên hìnhă2.2 ngăt Nh ngătácăđ ng th c t định lý lấy m u là khá quan trọng vì... phổi ch aă đầy không khí s đ că đẩy qua khí qu n và thanh môn Lu ng không khí s kíchă thíchă dơyă thanhă ơmă daoă đ ng và t o ra s phát âm Âm thanh này truy n ra ngoài quaăkhoangămũiăvƠăkhoangămi ng và các khoang này có tác d ngănh ăb lọc làm suy hao m t vài tần s khi các tần s nƠyăđiăqua Khoangămũi(nasalăcavity)ăcũngălƠăm t ng phát âm v i di n tích và chi u dài c định(kho ngă12cmăđ i v iăng iănamătr... các ngăc ăb n có chi u dài ng n(các ng hình tr )ăvƠăsauăđóăth c hi n tính toán trên các ng này 2.4 Ph ng pháp đánh giá chất l Cácăph ng tho i ngăphápăđánhăgiáăăchấtăl ng ti ngănóiăth ngăđ c tính toán từ tín hi uăbanăđầu so v i tín hi uăđầu ra b ng các mô hình toán học Nó không cầnăđ n s l ng nghe c aăconăng i, vì v y ít t n ti n và th i gian[22], [23] Vi căđánhăgiáănƠyă có vai trò quan trọng vì dịch . Trong lună vĕnă nƠy,ă chúngă taă phátă triển thut toán nén LPC-10e và thc nghim trên Kit DSP320C6713.ăĐánh giá chấtălng ting nói da trên tiêu chuẩn P.862 ca ITU. 1.4 Cấu trúc lun. thut toán PESQ 27 Hình 2.8: Cấu trúc b xử lý DSP TMS320C6713 28 Hình 2.9: BSL cần cho CCS 32 Hình 2.10: Tổng quan phần cng board DSK TMS320C6713 33 Hình 2.11: Giao tip ngõ vào và ngõ. mã. 3 Hình 1.1:B mã ph thuc vào tcăđ bit và chấtălng[25] 1.2.1 Mã hoá trên min thi gian Mã hoá trên min thi gian thc hin vic mã hóa trên khong thi gian lấy mu ca tín