1. Trang chủ
  2. » Tất cả

Thực hiện thuật toán nén thoại và thực nghiệm trên KIT TMS320C6713

71 337 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 71
Dung lượng 3,49 MB

Nội dung

vi By THANH PHAM ậ QUANG HUYNH Submitted to the Department of Electrical and Electronics Engineering on April19, 2014 in partial fulfillment of the requirements for the degree of Master of Science in Electronics and Communication Engineering at the University of Technical Education Ho Chi Minh City Abstract Newapplicationsinvolvingspeechcodinghaveincreasedconsiderably. The field of speechcodinghasplayedan imp ortan t roleinmobilecommunication systems. Hence,researchand improv emen t ofspeechcodingmethodsare topromote the needs ofthemarket. Inthisthesis,wedevelopeda real-time speechcoder of the LPC- 10ealgorithm. The speechcoderisimplementedonTexas Instrumen ts TMS320C6713 DigitalSignal Processor(DSP) accordingtoLPC-10eFederal Stan dard 1015.Finally, Perceptual EvaluationofSpeech Quality(PESQ) algorithmis usedformeasuringthevoice qualit y . Keywords:Algorithm,LPC-10e,quality evaluation,andTMS320C6713. Thesis Supervisor: Assoc. Prof. Dr. Chien Hoang-Dinh Title: Assoc. Prof. MC LC LI CMăN iv vii Danh sách hình v ix Danh sách bng xi Các từ vit tt xii Chngă1 1 TNG QUAN V LƾNHăVC NGHIÊN CU 1 1.1 Gii thiu chung 1 1.2 Mã hóa ting nói 1 1.2.1 Mã hoá trên min thi gian 3 1.2.2 Mã hoá trên min tần s 4 1.2.3 Mã hoá ngun 5 1.2.3 Mã hoá lai 6 1.3 Phát triển b mã LPC-10e 7 1.4 Cấu trúc lunăvĕn 8 Chngă2 8 CăS LÝ THUYT 9 2.1 Tín hiu ting nói 9 2.1.1ăCăch phát âm ting nói 9 2.1.2ăĐặc tính âm học ting nói 11 2.1.3ăĐặc tính vt lý ting nói 13 2.1.3.3ăTrngăđ 15 2.1.3.4 Âm sc 15 2.1.3.5 Tần s vtăquaăđiểm không 15 2.1.3.6 Tần s căbn 15 2.1.3.7 Formant 16 2.1.4 Phân loi đnăgin dng sóng ting nói 17 2.2 S hóa ting nói 18 viii 2.3 Tổng quan v phân tích/tổng hp ting nói 19 2.3.1 Gii thiu chung 19 2.3.2 Phân tích LPC 20 2.3.3 Tổng hp ting nói 21 2.4ăPhngăphápăđánhăgiáăchấtălng thoi 24 2.4.1ăPhngăphápăđánhăgiáăch quan 24 2.4.2ăCácăphngăphápăsoăsánhăda trên mô hình giác quan 26 2.4.2.1 PhngăphápăPESQ 26 2.5 B xử lý tín hiu s TMS320C6713 27 2.6 Code composer studio(CCS) 30 2.7 Tổng quan v kit DSKTMS320C6713 32 2.7.1 B binăđổi AIC 23 33 2.7.3 McBSP (Multichannel Buffered Serial Port) 37 2.7.4 EDMA kt hp vi McBSP 37 2.7.5 Kỹ thut vào ra Ping Pong 38 2.7.6 Vn chuyển d liu kiểu Ping-Pong 40 2.7.7 Móc ni các cấu hình Ping-Pong 40 2.7.8 Lungăđiu khiển 41 2.7.9 Kỹ thut vào ra cho h thng 42 Chngă3 43 THC NGHIM TRÊN MATLAB 43 VÀ KIT TMS320C6713 43 3.1 Phân tích ting nói 43 3.2 Tổng hp ting nói 44 3.2.1 Tổng hp d đoánătuyn tính ca tín hiu hu thanh 45 3.2.2 Tổng hp ting nói ca âm vô thanh 51 3.3ăThayăđổi thông s caăchngătrìnhăMatlab 52 ix 3.3.1 Cách thc thc hin 52 3.3.1.1 Giọng Nam 52 3.3.1.2 Giọng n 53 3.4 Thc hin trên Kit TMS320C6713 55 3.5.1 Mã hóa 55 3.5.2 Gii mã 56 3.5.3 Kt qu thc hin trên Kit 57 Chngă4 58 KT LUN 58 4.1. Kt lun 58 4.2.ăHng phát triển 58 TÀI LIU THAM KHO 60 Danh sách hình v Hình 1.1: B mã ph thuc vào tcăđ bit và chấtălng [25] 3 Hình 1.2: H thng DPCM 4 Hình 1.3: Mô hình to tingănóiăđc sử dng bi mã hoá ngun 6 x Hình 1.4: Kin trúc ca mã hoá AbS. (a): Mã hoá. (b): Gii mã. 7 Hình 2.1: Cấu toăcácăcăquanăphátăraăơmăthanh 9 Hình 2.2: S hóa tín hiuătngăt 18 Hình 2.3: Lấy muăvƠălng tử hóa tín hiu thoi 19 Hình 2.4: Mô hình tổng hp ting nói bngăphngăphápăformant 22 Hình 2.5: Mô hình tổng hp ting nói bngăphngăphápăLPC 23 Hình 2.6: Mô hình tổng hp ting nói bngăphngăphápămôăphng ngun âm 23 Hìnhă2.7:ăLuăđ thut toán PESQ 27 Hình 2.8: Cấu trúc b xử lý DSP TMS320C6713 28 Hình 2.9: BSL cần cho CCS 32 Hình 2.10: Tổng quan phần cng board DSK TMS320C6713 33 Hình 2.11: Giao tip ngõ vào và ngõ ra ca các thit bị âm thanh và b Codec 34 Hình 2.12: Mô hình vào ra EDMA 35 Hìnhă2.13:ăTínhănĕngăđaăkênhăca EDMA 36 Hình 2.14: TCC vi các kênh EDMA khác nhau 36 Hình 2.15: Mô hình kt hp gia EDMA và McBSP 38 Hình 2.16: Các b đm Ping-Pong[2] 39 Hình 2.17: Ping-Pong Buffer và Linked Transfer 41 Hìnhă2.18:ăĐ thị thc thi các tin trình 42 Hìnhă3.1:ăSăđ khi phân tích ting nói 43 Hình 3.2: Dng sóng tín hiu 44 Hình 3.3: Phổ ca tín hiu ting nói 45 Hình 3.4: Dng sóng tín hiu khong 30s 45 Hình 3.5: Ni dung ca Frame 46 Hìnhă3.6:ăĐápăng tần s ca Inverse và b lọc tổng hp 47 Hìnhă3.7:ăĐápăng tần s ca b lọc tổng hp 47 Hìnhă3.8:ăĐiểm cc và Zero ca b lọc 48 Hình 3.9: Dng sóng ca d đoánăResidual 48 Hình 3.10: Periodogram ca d đoánăResidual 49 Hình 3.11: LPC excitation 49 Hình 3.12: Periodogram ca LPC excitation 50 Hình 3.13: Dng sóng ca âm "e" 50 Hình 3.14: Phổ tín hiu ca âm "e" 51 Hình 3.15: Dng sóng ca ting nói vô thanh 51 Hình 3.16: Mtăđ phổ công suất 52 Hìnhă3.17:ăSăđ khi mã hóa 55 xi Hìnhă3.18:ăSăđ khi gii mã 56 Danh sách bng Bng 2.1: Giá trị tần s căbnătngăng vi gii tính và tuổi 16 Bng 2.2: Bng MOS 25 Bng 2.3: Memory map ca TMS320C6713 29 xii Bng 3.1: Tcăđ xử lý(Namătrng thành) 53 Bng 3.2: BngăMOS(Namătrng thành) 53 Bng 3.3: Tcăđ xử lý(N trng thành) 54 Bng 3.4: Bng MOS(N trng thành) 54 Bng 3.5: Tính toán tcăđ bit 55 Bng 3.6: Kt qu thc nghim trên Kit 57 Các t vit tắt ITU InternationalTelecommunication Union Liênminhvin thôngquc t PCM Pulse CodeModulation Điuchmã xung xiii APCM Adaptive Pulse Code Modulation Điu ch mã xung thích nghi DPCM DifferentialPulse CodeModulation Điu ch mã xungvi phân ADPCM Adaptive Differential PulseCodeModulation Điu c h mãxungviphânthích nghi DM DeltaModulation Điuch Delta ADM AdaptiveModulationDelta ĐiuchDeltathích nghi APC Adaptive Predictive Coding Mãhoádđoánthích nghi LPC LinearPredictiveCoding Mãhóatuyn tính MOS MeanOpinionScore Điểmđánhgiátrungă bình PESQ Perceptual Evaluation ofSpeechQuality Đánhgiá nhn thcchấtlng thoi 1 Chng 1 TNG QUAN VLĨNH VC NGHIÊN CU 1.1 Gii thiu chung Mãhóatingnóilàngdngcalƿnhvcxửlýtínhiu,vicxửlýnàymcđíc h xétđnlàhiuqutrong victruyn ti vƠlutr. Vicmãhóatingnói, mc tiêu làgimtcđbit,ă nghƿaă lƠtcđbit trên migiây,trongă khiđóvn duy trìđchìnhdngcadngsóngbanđầu.Trongtrnghpnày,chấtă ă lng ca tingnóiđcđánhă giánhsau:stnhiên,dhiểu,vàsnhn dngkhi phát qualoa[3],[4]. Bng 1.1 phân loi b mã ting nói theo tcăđ bit. Bng 1. 1: Phân loi theo tcăđ bit Stt Phơnăloiă TcăđăBit 1 High bit-rate >15 kbps 2 Medium bit-rate 5ăđn 15 kbps 3 Low bit-rate 2ăđn 5 kbps 4 Very low bit-rate <2 kbps 1.2 Mã hóa ting nói Nhu cầu ca các h thngăthôngătinădiăđngănhăđin thoiădiăđngăđangătĕngă trongăvƠiănĕmăquaăvƠăđƣăcóăphátătriểnăvt bc ca các b mã vi tcăđ bit thấp. S raăđi ca b mã CELP(Code Excited Linear Prediction)[5] và s phát triển ca các phngăphápăkhác da trên b mƣăCELPăđƣăđóngăgópărất ln vào vic ci thin h thng mã hóa ting nói vi tcă đ bit thấp. Các b mƣă nƠyă đc giám sát bi ITU(International Telecommunications Union Telecommunication) và ISO(International Organization for Standardization). Không nhng có nhng b mã dùng cho mcăđíchădơnăs mà còn phát triển cho mcăđíchăquơnăs. Ví d nhăB Quc Phòng Mỹ DOD(Department of Defense) gầnă đơyă đƣă thôngă quaă b mã MELP(Mixed Excitation Linear Prediction) thay th b mã LPC-10. Chấtă lng 2 vt tri ca MELP(Mixed Excitation Linear Prediction), tuy nhiên thut toán MELP(MixedăExcitationăLinearăPrediction)ăcóăđ phc tpăhnănhiu so vi LPC- 10(gấp 6 lầnăMIPS(MillionăInstructionsăPerăSecond)).ăĐi vi mcăđíchădơnăs, có hai tùy chọn. Mt trong nhng la chọn này vi chấtă lng ting nói cao và đphc tp thut toán cao gingănhăMELP,ăđiu này cần có thi gian xử lý nhiu và phần cng phc tp. Mt la chọn khác vi chấtălng ting nói thấpăvƠăđ phc tp ca thut toán thấp thì ta dùng b mã cùng họ ca LPC. Hai s la chọn này, chúng ta phi tr giá gia chấtălng tingănóiăvƠăđ phc tp ca thutătoán.ăĐể ci thin nhng b mã hin nay, chúng ta cầnăxétăđn c hai yu t là chấtălngăvƠăđ phc tp.ăVƠăhaiăphngăphápăđcăđaăra,ăphngăpháp th nhất là gimăđ phc tp ca b mã có chấtălng ting nói cao, th hai là ci thin chấtălng ting nói ca b mã có chấtălng ting nói thấp. Kể từ khi họ LPCăđc phổ bin cho mcăđíchădơnăs vƠăđƣăcóănhiu h thng hotăđng da trên b mã này, ci thin chấtălng thì liăíchăhnălƠăc gng gim đ phc tp ca b mã. Nói cách khác, nhu cầu cho mt b mã ting nói vi tcăđ bit thấpăvƠăđ phc tp thấpăđể sử dng cho mcăđíchădơnăs, chẳng hnănhăting nóiăđápăng thi gian thc trên Internet[6], [7]. Trong mt vài thp kỷ vừaăqua,ăđƣăcóărất nhiu kỹ thut mã hoá nén ting nói đcăđaăra,ăphơnătíchăvƠăphátătriển. Trong phần này, chúng ta s gii thiu mt s kỹ thutăđangăđc sử dng hin nay, và mt s kỹ thut s đcădùngătrongătngă lai.ăThôngăthng thì mã hoá tingănóiăđc chia làm hai lpăđóălƠ:ămƣăhoáădng sóng(waveform coder) và mã hoá ngun(sourceăcoder)ă(hayăcònăđc gọi là mã hoá thông s). Mã hoá dngăsóngăđc thc hin  tcăđ Bit cao và cho chấtălng mã hoá ting nói tt. Mã hoá ngun thc hin  tcăđ Bit thấp,ănhngănóăcóăxuăhng to ra ting nói có chấtălng nhân to. Hin nay, mt lp mi ca mã hoá ting nói đc gọiălƠămƣăhoáălai(hybridăcoder),ăđơyălƠăkỹ thut mã hoá tổng hp caăphngă pháp mã hoá dng sóng và mã hoá ngun, nó cho chấtălng ting nói khá tt và thc hin  tcăđ Bit trung bình. Hình 1.1 cho chúng ta thấyăđc b mã ph thuc vào tcăđ bit và chấtălng ting nói ca b mã. [...]... ng c th c nghi m trên phần c ng Hi n nay, trong bài báo [18] ngăpháp nén d a trên Compressive Sensing(CS), so sánh hi u suất ngăphápănƠyăv iăcácăph ngăphápăđ c nêu trên thì k t qu cho chúng ta thấy r ng: CS cho hi u suấtă caoă h nă v i cùng m t tỉ l nén. ă Đơyă cũngă lƠă m t ph ngăpháp nén m i và hi nănayăđangăđ phápănƠyăcũngăch aăđ c nghiên c u trên th gi i.ăVƠăph ngă c th c nghi m trên phần c ng Trong... c nghi m trên phần c ng Trong lu nă vĕnă nƠy,ă chúngă taă phátă triển thu t toán nén LPC-10e và th c nghi m trên Kit DSP320C6713.ăĐánh giá chấtăl ng ti ng nói d a trên tiêu chuẩn P.862 c a ITU 1.4 Cấu trúc lu n văn Lu năvĕnăg măcóă4ăch ng Ch ngă1:ăGi i thi u tổng quan Ch ngă2:ăC ăs lý thuy t Ch ngă3:ăTh c hi n trên Matlab và TMS320C6713 Ch ngă4:ăK t lu n Ch ng 2 8 C S LÝ THUY T 2.1 Tín hi u ti ng nói... standards G.729 8kb/s codec, G.723.1 5.3kb/s codec, và U.S.Federală Standardă FS1016).ă Đ i v i ph ngăphápănƠyănh căđiểm l n nhất là thu t toán ph c t p.ăCònăđ i v i bài báo 7 [16] tác gi đ aăraăph ngăpháp nén d a trên mã hóa tuy n tính(kỹ thu t nén suy hao) tỉ l nén đ n 95% để ti t ki măbĕngăthông.ăBƠiănƠyătácăgi phân tích nhăh c a t că đ nam(ng i l n) và n (ng b ngăMatlab,ăch aăđ đ xuất m tăph c a ph... xaăkhôngăngheăđ ng c a âm vô thanh rất nh và ti ng thì thào là do âm vô thanh t o nên 17 c do 2.2 S hóa ti ng nói Trong th c t , mã hóa d ng sóng c a tín hi u ti ng nói và video bao g m nhi u chi ti t và khía c nhăđ c nêu ra b i Jayant và Noll[10] Mã hóa d ng sóng không ph thu c vào d ng tín hi u Chính vì v y chúng ta sử d ng mã hóa d ng sóng cho tín hi u tho i, d li u, và th m chí âm nh c[19].ăĐi u này d... iănhau)ăđể tổng h p ti ng nói 19 ng Tổng h p d aă trên môă hình:ălƠă cácă ph ngă phápă tổng h pă d hình toán học và không có s tham gia c aăconăng i.ăCácăph trên các mô ngăphápăhayădùngă bao g m: -Tổng h păformant:ăph ngăphápănƠyăd a trên các lu tăxácăđịnh tần s c ăb n để tínhăraă3ăformantăđầu tiên f1, f2, f3để tổng h p ti ng nói -Tổng h păLPC:ăđơyălƠăph ngăphápăd a trên môăhìnhătiênăđoánătuy n tính, t c là... phần hài là b i s c a tần s c ăb n còn gọi là pitch và t căđ suy gi m c a chúng là 12dB/octave B máy phát âm c aă conă ng i ho tă đ ng gi ngă nh ă m t b c ngă h ng, khu chăđ i m t vài thành phần hài và làm suy gi m các thành phần hài còn l iăđể t o ra d ng sóng nguyên âm T că đ chuyểnă đ ng c a dây thanh ph thu c vào áp suất không khí trong phổi và s că cĕngă c a dây thanh C haiă đi uă nƠyă đ u có...Hình 1.1:B mã ph thu c vào t căđ bit và chấtăl ng[25] 1.2.1 Mã hoá trên mi n th i gian Mã hoá trên mi n th i gian th c hi n vi c mã hóa trên kho ng th i gian lấy m u c a tín hi u.ăCácăph ngăphápămƣăhoáătrongămi n th iăgianăth ngăđ c dùng g măcó:ăĐi u ch mƣăxung(PCM),ăđi u ch mã xung... khai thác m t s tính chất xác xuất tín hi u N u các thông s codecăđ tín hi uăđầu vào, v năduyătrìăđ Mã hóa d ngăsóngăđ c chấtăl c t iă uăhóaăchoăcácălo i c a ng t t cho các lo i tín hi u c chia làm hai lo i mã hóa tín hi u trên mi n th i gian và trên mi n tần s Vi c s hóa tín hi uăt ngăt đ Hình 2.2: S hóa tín hi uăt căđ aăra trên hìnhă2.2 ngăt Nh ngătácăđ ng th c t định lý lấy m u là khá quan trọng vì... phổi ch aă đầy không khí s đ că đẩy qua khí qu n và thanh môn Lu ng không khí s kíchă thíchă dơyă thanhă ơmă daoă đ ng và t o ra s phát âm Âm thanh này truy n ra ngoài quaăkhoangămũiăvƠăkhoangămi ng và các khoang này có tác d ngănh ăb lọc làm suy hao m t vài tần s khi các tần s nƠyăđiăqua Khoangămũi(nasalăcavity)ăcũngălƠăm t ng phát âm v i di n tích và chi u dài c định(kho ngă12cmăđ i v iăng iănamătr... các ngăc ăb n có chi u dài ng n(các ng hình tr )ăvƠăsauăđóăth c hi n tính toán trên các ng này 2.4 Ph ng pháp đánh giá chất l Cácăph ng tho i ngăphápăđánhăgiáăăchấtăl ng ti ngănóiăth ngăđ c tính toán từ tín hi uăbanăđầu so v i tín hi uăđầu ra b ng các mô hình toán học Nó không cầnăđ n s l ng nghe c aăconăng i, vì v y ít t n ti n và th i gian[22], [23] Vi căđánhăgiáănƠyă có vai trò quan trọng vì dịch . Trong lună vĕnă nƠy,ă chúngă taă phátă triển thut toán nén LPC-10e và thc nghim trên Kit DSP320C6713.ăĐánh giá chấtălng ting nói da trên tiêu chuẩn P.862 ca ITU. 1.4 Cấu trúc lun. thut toán PESQ 27 Hình 2.8: Cấu trúc b xử lý DSP TMS320C6713 28 Hình 2.9: BSL cần cho CCS 32 Hình 2.10: Tổng quan phần cng board DSK TMS320C6713 33 Hình 2.11: Giao tip ngõ vào và ngõ. mã. 3 Hình 1.1:B mã ph thuc vào tcăđ bit và chấtălng[25] 1.2.1 Mã hoá trên min thi gian Mã hoá trên min thi gian thc hin vic mã hóa trên khong thi gian lấy mu ca tín

Ngày đăng: 18/11/2020, 14:00

TỪ KHÓA LIÊN QUAN

TRÍCH ĐOẠN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN