Ng 3.3 :T căđ xử lý(N tr ng thành)

Một phần của tài liệu Thực hiện thuật toán nén thoại và thực nghiệm trên KIT TMS320C6713 (Trang 62)

D năđ n t căđ thayă đổi(tĕngălên).ăB ng 3.4 là k t qu đánhăgiáăb ng thu t toán PESQ, b ng này cho chúng ta thấy r ngăkhiăchúngătaătĕngăpăđ ngănghƿaăv i vi c chúng ta chấtăl ng ti ng nói.

B ng 3.3: T căđ xử lý(N tr ng thành) N N

Câu 1 Câu 2 Câu 3

B c Th iăgian(s) 10 0.2995 0.574263 0.4062 15 0.3083 0.58068 0.4379 18 0.3131 0.58483 0.4595 20 0.3164 0.58606 0.464 B ng 3.4: B ng MOS(N tr ng thành) MOS N Câu 10 15 18 20 1 2.4108 2.537 2.4032 2.4203 2 2.2109 2.3207 2.431 2.456 3 2.3651 2.3715 2.4813 2.561

3.4 Th c hi n trên Kit TMS320C6713

B ng 3.5: Tính toán t căđ bit

Tham s Tính toán

Sample rate 8000 samples/second Samples per segment 180 samples/segment

Segment rate =Sample Rate/ Samples per Segment Sample =Rate/ Samples per Segment

=(8000 samples/second)/(180 samples/second) Bit rate =Segment size * Segment Rate

= (54 bits/segment) * (44.44 segments/second) =2400 bits/second

Tổng s bit cần thi t cho từng segment là 54 bit.Chúng ta có t căđ lấy m u 8000Hză vƠă đ c chia thành 180m u/segment. Đi uă nƠyă cóă nghƿaă xấp xỉ 44.4segment và t căđ bitălƠă2400ăbits/sănh ătrongăb ng 3.5

3.5.1Mã hóa

S ăđ kh i c a b mƣăhóaăđ c thể hi n trên hình 3.17

1.Ngõ vào tín hi uăđ căđ aăquaăcửa sổ hamming v i overlap là 50% 2.Tín hi uăđ căđ aăquaăb lọc Pre-emphasis

3.Tính toán d li u cửa sổ b ngăph ngăphápăt t ngăquan.

4.H s LPCăđ c tìm b ng thu t toán Levinson-Durbin Recursion. 5.Segment ti ngănóiăđ c lọc b i h s LPCăđể có residue.

6.Xácăđịnh tín hi u ti ng nói là h u thanh hoặcăvôăthanh.ăQuáătrìnhănƠyăđ c th c hi n b i hai tham s .

7.T t ngăquanăc aăresidueăđ cădùngăđể xácăđịnh chu kǶ.

8.T, G, V/UV và h s LPCăđ c k t h p l i t o thành segment ti ngănói.ăNh ă v y, segment ti ngănóiăhoƠnătoƠnăđ c mã hóa.

3.5.2Gi i mã

S ăđ kh i c a b gi i mã đ c thể hi n trên hình 3.18

Hình 3.18:ăS ăđ kh i gi i mã

Ti ngănóiăđƣăđ c mã hóaăhoƠnătoƠnănh ătrênăhìnhă3.18, các thu t toán cần thi t có thểđ c th c hi năđể tái t o l i ti ng nói. K t qu cu i cùng s là ti ng nói đ c tổng h p có thể đ c truy n v iăítăbĕngăthôngănhất có thể n u cần thi t. Hy

vọng r ng ti ngănóiăđ c tổng h p tái t o là m t xấp xỉ hiểuăđ i v i tín hi u ti ng nóiăbanăđầu.ăCácăb căsauăđơyăgi i thu t toán gi i mã.

1.T o mô hình kích thích các h s LPCăđặcătr ngăchoăkhungăs ho tăđ ng nh ăm t b lọcăđ ng.ăMƠăđóălƠăđầu vào cho các b lọc là kích thích.

2.Đ i v i âm h u thanh, s kích thích s là m t tín hi uăđịnh kǶ c a tất c các điểm zero v i xung từngăgiaiăđo n.ăĐơyălƠăm tămôăhìnhăđ năgi n c a s kích thích. Đ i v i âm vô thanh, kích thích s chỉ đ năgi n là nhi u tr ng.

3.B lọcăng c s kích thích thông qua h s LPC. 4.Ngõ ra s đ căđ aăquaăb lọc de-emphasis.

5.Ngõ ra c a b lọc de-emphasis là phù h p v iănĕngăl ng G c a segment.

3.5.3K t qu th c hi n trên Kit

Tác gi th c hi n 3 câu d iăđơyătrênăng iănamătr ng thành và n tr ng thành.

1.Tr ngăĐ i HọcăS ăPh m Kỹ Thu t H Chí Minh 2.One two three four five six seven eight nine

3.University of Technical Education Ho Chi Minh City

Sau khi th c hi n trên Kit , tác gi khaithácthu tătoánăPESQăđể đánh giá chất l ng ti ng nói . K t qu nh ăb ng 3.6 k t qu th c nghi m trên Kit

B ng 3.6: K t qu th c nghi m trên Kit MOS MOS

Câu Nam N 1 1.6471 1.6108 2 1.7166 1.5585 3 1.7932 1.6611

B ng 3.6 cho chúng ta thấy r ng k t qu MOSăđ u l năh nă1.5.ăĐi u này phù h p v i tiêu chuẩn P.862 c a ITU-T.

Ch ng 4

K T LU N

4.1. K t lu n

Mã hóa d đoánătuy n tính là m t kỹ thu t phân tích/tổng h p ti ng nói và cũngălƠăkỹ thu t nén suy hao, kỹ thu t này s mô hình hóa b máy phát âm c a con ng iăđể t o ra ti ng nói và t căđ bit thấp 2400bits/s. V i tỉ l nén là 26.6:1. Trong lu nă vĕnă nƠy, tác gi pháttriểnth chi ntrênth igian th cđ iv ithu ttoán mãhóati ngnóiLPC-10e nh ăsau:

Tr c tiên, tác gi s mô ph ng trên Matlab. K t qu mô ph ngăđ c tác gi đánhăgiáăb ng cách hai cách. Th nhất,ăđoăth i gian xử lý thu t toán b ng máy vi tính, cách này cho chúng ta thấy r ngăkhiăchúngătaăthayăđổiăpătĕng,ăđ ngănghƿaăv i thu t toán s ph c t păh năthìăt căđ xử lýăthayăđổi(tĕngălên).ăTh hai, th c hi n đánhăgiáăchấtăl ng ti ng nói thông qua tiêu chuẩn P.862, thu t toán c a tiêu chuẩn này cho chúng ta thấy r ngă điểm MOS l nă h nă 1.5,ă đi u này phù h p theo tiêu chuẩn P.862 c a ITU-T.

Ti p theo, tác gi th c hi n trên Kit TMS320C6713, k t qu th c nghi măcũngă đ căđánhăgiáăquaăthu t toán PESQ, vƠăđiểm MOS l năh nă1.5,ăđi u này phù h p theo tiêu chuẩn P.862 c a ITU-T.

Cu i cùng tác gi so sánh gi a mô ph ng trên Matlab và th c nghi m trên Kit DSP TMS320C6713. K t qu cho chúng ta thấy r ng MOS mô ph ng trên Matlab caoăh năth c nghi m trên Kit

Ngoài ra, nghiên c u c a tác gi đƣă đ c chấp nh n t i The International Conference on Signal, Image Processing and Application ICSIA, July 6 - 7, Nottingham, U.K. vƠăđangăreviewăt i IEEE ICCE(The International Conference on Communications and Electronics) 2014 t iăĐƠăNẵng, Vi t Nam

4.2. H ng phát tri n

Đ tài "TH C HI N THU T TOÁN NÉN THO I VÀ TH C NGHI M TRÊNăKITăTMS320C6713"ăđ c phát triểnăthêmănh ăsau:

-Gi m t căđ bit xu ng thấpăh nă2400bits/s. -Nén tho i b ng các thu t toán khác.

TÀI LI U THAM KH O

[1]J.H.M.DanielJurafsky, SpeechandLanguageProcessing, 2nded.,2008.

[2]R.Chassaing, DigitalSignalProcessing

andApplicationswiththeC6713andC6416DSK, 2nded.pub-SV,2004.

[3]H.Magboub, N. Ali,M.Osman,andS.Alfandi,ắMultimediaspeech compressiontechniques,ẰinComputerScienceandInformationTechnology(ICCSIT ), 20103rdIEEEInternationalConferenceon,vol.9,2010,pp.498ậ502.

[4]S.Yeldener, A.Kondoz, and B.Evans,ă ắNaturală soundingă speech coder

operatingat 2.4 kb/s andbelow,ẰinWireless

Communications,1992.ConferenceProceedings., 1992IEEE InternationalConference onSelectedTopicsin,1992,pp.176ậ179.

[5]M. R. Schroeder and B. Atal,ăắCode-excitedlinearprediction(celp):High-quality speech at very lowbită rates,Ằină Acoustics,Speech,andSignal Processing,IEEE International Conference onICASSP’85.,vol.10,Apr1985,pp.937ậ940.

[6]D.Adami, C.Callegari, S.Giordano, M.Pagano,and F. Russo,ắOntheuseofcompressionalgorithmsforthe

classificationofipflows,ẰinPerformanceEvaluation ofComputer TelecommunicationSystems,2009. SPECTS2009.InternationalSymposiumon, vol.41,009,pp.355ậ360.

[7]M.A.Kohler, L.Supplee,andT.Tremain,ắProgresstowards anewgovernmentstandard

2400bpsvoicecoder,ẰinAcoustics,Speech,andSignalProcessing, 1995.ICASSP- 95.,1995InternationalConferenceon,vol.1,1995,pp.488ậ491vol.1.

[8]J.ă Max,ắQuantizing forminimumdistortion,ẰInformationTheory, IRETransactionson, vol.6,no.1,pp.7ậ12,1960.

[9]P.F.PanterandW.DITE,ắQuantizationdistortioninpulse-

countmodulationwithnonuniformspacingoflevels,ẰProceedingsoftheIRE,vol.39,no. 1,pp.44ậ48,1951. [10]P. N.NuggehallyS.Jayant,DigitalCodingofWaveforms:PrinciplesandApplicationstoS peechandVideo,1sted.Prentice-Hall,1984. [11]J.J.LiTan, DigitalSignalProcessingFundamentalsandApplications,2nded.AcademicPress, 2013.

[12]R.W.S.LawrenceR.Rabiner, DigitalProcessingofSpeechSignals,used.Prentice- Hall,1978.

[13]M.Nakhai and F.Marvasti,ắA4.1kb/shybridspeechcoder,ẰinCircuitsand Systems,1999.ISCAS’99.Proceedings ofthe1999IEEE InternationalSymposiumon,vol.3,Jul, 1999,pp.110ậ113vol.3.

[14]A.McCree,J.

Stachurski,T.Unno,E.Ertan,E.Paksoy,V.Viswanathan,A.Heikkinen, A.Ramo,S.Himanen,P.Blocher,andO.Dressler,ắA4kb/s

hybridmelp/celpspeechcoding candidateforitu

standardization,ẰinAcoustics,Speech, andSignalProcessing (ICASSP),2002IEEE InternationalConference on,vol.1,May2002,pp.Iậ629ậIậ632.

[15]U.Bhaskar andK.Swaminathan,ắLowbit-

ratevoicecompressionbasedonfrequency

domaininterpolativetechniques,ẰAudio,Speech,andLanguageProcessing, IEEETransactions on,vol.14,no.2,pp.558ậ576,2006.

[16]M.A.K.GuptaRajani and T.Vebhav,ắVocoder(lpc) analysisbyvariationofinput parametersandsignals,ẰISCAJournalofEngineering Sciences,vol.1,no.3,pp.57ậ 61,July, 2012.

[17]S.Ahmadi

andA.Spanias,ắNewalgorithmsforsinusoidalspeechcodingatlowbitrates,Ằ

inPersonalWirelessCommunications,1997IEEE InternationalConference on,1997,pp.57ậ61.

[18]A.K.J. S.K.Y.NarendraShukla,

AnilKumar,ắCompressivesensinginwirelessmobile communicationsystem at highdataratetransmission,Ằă inInternationalJournal ofEngineeringandTechnicalResearch (IJETR),vol.1,2013.

[19]D.Salomon,DataCompression:TheCompleteReference,2nded. Springer,2004.[Online].Available:

http://www.ecs.csun.edu/dxs/DC3advertis/Dcomp3Ad.html

[20]S.J.Orfanidis, Introductiontosignalprocessing,1sted.Pearson Education,2010. [21]J.W.LajosL.Hanzo,Clare Somerville,Voice andAudioCompression forWireless Communications,2nded. WileyIEEEPress, 2007.

[22]K.Kondo,Subjective

QualityMeasurementofSpeechItsEvaluationEstimationandApplications, 1sted. Springer, February6,2012.

[23]D.MilkovicandE.Zentner,ă ắQuality measuring methods ofcodedspeechinmobileradio

communicationsystems,ẰinAppliedElectromagneticsandCommunications,2005.I CECom2005.18thInternationalConferenceon,2005,pp.1ậ4.

[24]J.ă Gibson,ă ắSpeechcodingmethods, standards,andă applications,ẰăCircuits and SystemsMagazine on,IEEE,vol.5,no.4,pp.30ậ49,2005.

[25] A. M. Kondoz, Digital Speech: Coding for Low Bit Rate Communication Systems, 2nd ed. Wiley, 2004.

Một phần của tài liệu Thực hiện thuật toán nén thoại và thực nghiệm trên KIT TMS320C6713 (Trang 62)

Tải bản đầy đủ (PDF)

(71 trang)