Tài liệu tham khảo Mã hóa âm thanh amr
Trang 1I C M N
L i u tiên c a b n khóa lu n này cho phép em c bày t l i c m n sâu s ct i Th.S Tr n Ng c H ng, ng i ã t n tình h ng d n, ch b o em trong su t th igian em làm khóa lu n.
Em xin chân thành c m n sâu s c t i các th y cô giáo trong Tr ng i h cCông Ngh - HQGHN ã ch b o, d y d và cung c p nh ng ki n th c c b n vàchuyên môn trong su t 4 n m qua và t o u ki n thu n l i em hoàn thành b nkhóa lu n này.
Cu i cùng em xin g i l i c m n t i gia ình, b n bè ã nhi t tình giúp vàng viên em hoàn thành khóa lu n này.
Xin chúc th y cô giáo và các b n s c kh e, h nh phúc.
Hà n i, tháng 05 n m 2008
Trang 2TÓM T T N I DUNG
Khóa lu n t t nghi p này trình bày khái quát v ng d ng Adaptive Multi Rate(AMR) nâng cao ch t l ng cu c g i AMR c s d ng trong m ng n tho i tbào, nó cung c p ch t l ng ti ng nói t t nh t v i nh ng giá tr th p nh t v i vi c sd ng các k thu t ACELP, DTX, VAD và CNG AMR là b mã hóa âm thanh a t ccó th ho t ng 8 t c bit ngu n khác nhau: 12.2, 10.2, 7.95, 7.4, 6.7, 5.9, 5.15 và4.75kbps Không gi ng nh các b mã hóa âm thanh tr c ây trong GSM mà ho tng t c c nh và m c b o v l i là h ng s , thì các b mã hóa âm thanhAMR có th thích ng v i m c b o v l i c a i u ki n kênh truy n radio và kênhu l ng M t h th ng GSM s d ng mã hóa âm thanh AMR có th l a ch n kênhtruy n t i u (bán t c hay toàn t c) và ch mã hóa (t c bit ti ng nói và kênh) ph i h p t t nh t gi a ch t l ng ti ng nói và dung l ng h th ng.
Trang 3CHNG 1: GI I THI U V MÃ HÓA ÂM THANH AMR 8
1.1 Gi i thi u v mã hóa âm thanh trong thông tin ding 8
1.2 Gi i thi u v mã hóa âm thanh AMR 8
1.3 Miêu t ch c n ng c a AMR trong h th ng GSM 9
1.4 Gi i thi u v b mã hóa âm thanh AMR 10
CHNG 2: THU T TOÁN VÀ CÁC KH I CH C N NG TRONG AMR 13
2.1 Thu t toán doán tuy n tính kích thích theo mãi s ACELP 13
2.2.3 Các nguyên t c c a b mã hóa ti ng nói AMR 20
2.2.4 Nguyên t c c a b gi i mã âm thanh AMR .25
2.2.5 Ch c n ng c a b mã hóa 25
2.2.5.1 Quá trình ti n x lý (i v i t t c các ch) 25
2.2.5.2 Phép phân tích doán và quá trình lng t 26
2.2.5.3 Tính toán áp ng xung (cho t t c các ch) 34
2.2.5.4 Tính toán tín hi u m c tiêu (cho t t c các ch) 34
2.2.5.5 B ng mã thích nghi 35
2.2.5.6 B ng mã i s 37
2.2.5.7 Lng t hóa gia lng b ng mã thích nghi và cnh 42
Trang 42.2.6 Miêu t ch c n ng c a b gi i mã 46
2.2.6.1 Gi i mã và t ng h p ti ng nói 46
2.2.6.2 Quá trình h u x lý 50
2.2.7 S phân b bit chi ti t c a mã hóa a m c thích nghi 51
2.3 C u trúc khung mã hóa AMR 52
2.3.1 Khuôn d ng khung AMR mã hóa (AMR IF1) 52
2.3.1.1 AMR Header và thông tin b tr AMR 53
2.3.1.2 Khung lõi AMR 55
Trang 52.7 S che d u l i khi m t khung 80
CHNG 3: NG D NG AMR TRONG VI C NÂNG CAO CH T LNG CU CI C A M NG N THO I T BÀO 82
3.1 o ki m tra ch t lng tho i khi ng d ng AMR 82
3.1.1 Gi i thi u v tiêu chu n MOS 82
3.1.2 So sánh ch t l ng tho i khi s d ng AMR so v i khi s d ng EFR 83
3.2 ng d ng AMR trong vi c nâng cao ch t lng tho i m ng MobiFone 86
3.2.3.4 L u lng kênh i u khi n (lo i tr vi c gán ban u) (ERL) 97
3.2.3.5 T l chuy n giao thành công gi a các cell (%) 98
3.2.3.6 Nh n xét 99
T LU N 100
TÀI LI U THAM KH O 101
Trang 6NG CÁC T VI T T T VÀ THU T NG
sang s
phân thích nghi
nhi u
ng t
c u
Telecommunications Standardization Sector
T ch c vi n thông thgi i – Tiêu chu n vi n
Trang 7di ng
m ch công c ng
hi uTCH-
Traffic Channel Adaptive Full rate Speech Kênh l u l ng toàn t cti ng nói thích nghiTCH-
Traffic Channel Adaptive Half rate Speech Kênh l u l ng bán t cti ng nói thích nghi
ti ng nói
Trang 8CHNG 1: GI I THI U V MÃ HÓA ÂM THANH AMR
Trong thông tin di ng r ng d i t n có giá tr nh hàng hóa, do ó các b mãhóa ti ng nói óng vai trò quan tr ng không ch v i ch t l ng ti ng nói mà còn ph im b o chi m d ng ít b ng t n v i t c bit th p B mã hóa v i t c bit th p chokênh truy n b ng h p làm t ng dung l ng h th ng là yêu c u quan tr ng c a các nhàcung c p d ch v và c chú tr ng nghiên c u c bi t trong thông tin di ng Cácb mã hóa ti ng nói v c b n c chia làm 2 lo i chính là: Mã hóa d ng sóng và mãhóa ngu n (Vocoder).
- Mã hóa d ng sóng: là k thu t mã hóa và gi i mã liên t c bám theo d ng sóngc a tín hi u am thanh (mà ti ng nói ch là m t ph n trong ó), v nguyên t c chúngc thi t k c l p v i ngu n âm nên ch t l ng ti ng nói không ph thu c vào cáclo i ngu n tín hi u, ki u mã này có u i m ch ng nhi u t t, k thu t không ph c t pvà r , song h s nén tín hi u không th t s cao, thu c lo i này có PCM, ADPCM,DM, APC….
- Mã hóa ngu n d a trên s mô ph ng ngu n âm c th ( i t ng chính ây làti ng nói c a con ng i c nghiên c u tr c các c tính khai thác các kh n ngnén mã), k thu t này ph c t p, có tr cao, giá thành t song bù l i có h s nénl n và cho t c bit mã hóa th p.
1.2 Gi i thi u v mã hóa âm thanh AMR.
AMR là s k t h p c bi t v i h th ng di ng toàn c u GSM GSM là hth ng chuy n m ch c xu t phát t Châu Âu vào nh ng n m 1980 và c s d ng
r t nhi u n c Châu Âu Nhi u công ty di ng n c M và nhi u n c khôngthu c Châu Âu c ng s d ng công ngh GSM.
AMR là ph ng pháp mã hóa ti ng c phát tri n trên c s CELP is (ACELP) và c ti p nh n cho p ng pháp mã hóa ti ng c a GSM vào
m 1998.
AMR thích ng v i nhi u lo i kênh truy n khác nhau AMR có th t uch nh b ng cách thêm vào các bit giúp s a l i khi u ki n kênh truy n kém,
Trang 9trong khi v n cung c p t ng s bit nh nh t trong u ki n kênh truy n t t.i u này có ngh a là AMR có nhi u bit có th mã hóa ti ng nói h n là các b mãhóa khác.
AMR là b mã hóa âm thanh a t c và nó có th ho t ng 8 t c bit:12.2, 10.2, 7.95, 7.4, 6.7, 5.9, 5.15 hay 4.75 kbps Thêm vào ó, b mã hóa cthi t k cho phép chuy n m ch khung không liên t c b i khung c s gi a các ch
1.3 Miêu t ch c n ng c a AMR trong h th ng GSM
Mã hóa âm thanh AMR bao g m m t t p các ch mã hóa âm thanh t c c nh cho ho t ng toàn t c và ho t ng bán t c, có kh n ng cung c pchuy n m ch gi a các ch khác nhau tùy thu c vào i u ki n l i truy n M ich s cung c p m t m c b o v l i khác nhau qua vi c dành phân ph it ng s bit có th (22,8 kbps trong toàn t c và 11,4 kbps trong bán t c) gi a mãhóa ngu n và mã hóa kênh.
T c bit th c t c s d ng cho m i khung ti ng nói thì ph thu c vàocác i u ki n t n t i c a kênh truy n Thu t toán thích nghi mã hóa s l a ch nt c ti ng nói t i u (hay ch mã hóa) nh ch t l ng c a kênh truy n Ch
mã hóa t t nh t s c l a ch n trong i u ki n truy n kém và trong i uki n truy n t t thì ch mã hóa s cung c p ch t l ng t t nh t Ch mã hóathích h p c l a ch n tùy thu c vào k t qu o ch t l ng c a kênh truy nc th c hi n trong MS và trong m ng và thông tin v b ng t n g i qua giaodi n không khí cùng v i d li u.
Trang 10Hình 1.1: Shi n th các thông tin chính truy n qua giao di n h th ng.
Theo c hai h ng, các khung d li u ti ng nói c k t h p v i ch s chmã hóa c s d ng bên nh n l a ch n úng gi i mã kênh và gi i mã ngu n.Trong m ng, ch s ch mã hóa ph i c g i t i TRAU vì th mà gi i mã ngu nphù h p c l a ch n.
kênh truy n, nh n d ng mã hóa t t nh t i v i u ki n truy n ã t n t i và g ithông tin này t i MS qua giao di n không khí.
Thích nghi mã hóa theo tuy n xu ng, MS ph i c l ng ch t l ng kênh truy nvà g i thông tin ch t l ng t i m ng, nó có th c ánh x trong m ng v i ch mã
M i link có th s d ng ch mã hóa khác nhau nh ng b t bu c c 2 link ph is d ng cùng ch kênh (là toàn t c ho c bán t c).
Ch kênh c l a ch n b i ch c n ng qu n lý tài nguyên vô tuy n c a m ng.
1.4 Gi i thi u v b mã hóa âm thanh AMR
B mã hóa ti ng AMR bao g m b mã hóa ti ng a t c, m t b u khi n t c ngu n ph i h p v i b tách tích c c ti ng nói và h th ng t o t p âm thích h p và
ch che ch n l i ch ng l i nh h ng c a truy n l i và m t các gói d li u.
Trang 11M t b mã hóa ti ng a t c là m t b n m ch tích h p mã hóa âm thanh v i 8 t c ngu n t 4.75kbps n 12.2kbps, và cho phép ch mã hóa t p âm n n t c th p Bmã hóa ti ng có th chuy n t c c a nó v i khung ti ng nói 20ms trên 1 l nh u khi n.Hình 1.2 mô t các kh i ch c n ng x lý ti ng nói Trong hình này, các c mk thu t thích h p c ch ra cho m i kh i ch c n ng Trong hình 1.2, các ph n âmthanh bao g m chuy n i t tín hi u t ng t sang tín hi u s và chuy n t tín hi us sang tín hi u t ng t , ch ra các b c hoàn thành ti ng nói gi a tín hi u âm thanhvào/ra thi t b ng i s d ng (UE) và giao di n s c a m ng.
Hình 1.2.T ng quan các kh i ch c n ng x lý âm thanh.
Gi i thích các ký hi u trong hình:
1) 8 bit lu t A hay lu t µ PCM, t c l y m u là 8000 m u/giây.2) 13 bit ng u PCM, t c l y m u là 8000 m u/giây.3) C phát hi n tích c c ti ng nói VAD.
4) Khung ti ng nói c mã hóa, 50 khung/giây, s bit/khung ph thu c vào ch
Trang 12mã hóa AMR.
5) Khung miêu t chèn im l ng SID.
6) TX_TYPE, 2 bit, m t trong 2 bit ch s thông tin có ích n u chúng mangthông tin v ti ng nói hay thông tin v SID.
7) Các bit thông tin c g i n m ng truy c p 3G.8) Các bit thông tin nh n c t m ng truy c p 3G.
9) RX_TYPE, lo i khung nh n c ã c l ng t hóa thành 3 bit.
Trong hình 1.2, b mã hóa ti ng lây tín hi u vào nó là 13 bit PCM ng u t bph n âm thanh c a UE hay c a m ng, t m ng PSTN 8 bit theo lu t A hay lu t µ cchuy n i thành 13 bit PCM ng u Ti ng c mã hóa t i l i ra b mã hóa là các góivà c g i t i giao di n c a m ng T i n i nh n thì tín hi u c chuy n ng c l i.
Ánh x chi ti t gi a các kh i tín hi u vào là 160 m u ti ng nói theo khuônd ng là 13 bit PCM ng u c các kh i mã hóa (trong ó s l ng các bit thì
m u ti ng nói s c khôi ph c l i B ng mã hóa theo d oán tuy n tính kíchthích theo mã i s a t c.
M t mã hóa âm thanh AMR c a UE s h tr t t c t c ngu n c cho b ng 1.1 d i ây.
Chú ý:
1) Các khung SID gi nh liên t c c truy n i
2) GSM-EFR là Enhanced Full Rate Speech Mã hóa 3GPP TS 26.0903) IS-641 là TIA/EIA IS-641 TDMA Enhanced Full Rate Speech Codec.4) PDC-EFR là ARIB 6.7kbps Enhanced Full Rate Speech Codec.
Trang 13CHNG 2: THU T TOÁN VÀ CÁC KH ICH C N NG TRONG AMR
2.1.1 LPC t ng h p ti ng nói
Mã d báo tuy n tính LPC là m t ph ng pháp m i khác hoàn toàn v i PCM,DPCM và ADPCM tái h ng s các tín hi u t ng t Ph ng pháp này dùng b l cngang (hay các m ch l c s t ng ng) c ng các thành ph n ph t ng h p cácd ng sóng theo yêu c u Các tham s c a d ng sóng t ng h p c s hóa truy n ithay vì tín hi u th c s Xét hi u qu các k t qu n u quá trình t ng h p chính xáchoàn toàn v i ti n trình t ng t Vì ã có các thông s v ti ng nói, LPC c bi tthích h p v i t ng h p ti ng nói và t o ti ng nói.
Hình 2.1 T ng h p ti ng nói
Hình 2.1 mô t m t quá trình t ng h p ti ng nói bao g m 2 ngu n phát uvào, m t b khu ch i thay i l i, và m t b l c ngang trong vòng h i ti p.l i c a b khu ch i và b l c t ng nhánh c u ch nh nh d ng tính ch t âmthanh (di n t) trên gi i âm t n Nh ng ti ng không có âm c t o b ng n i v ingu n phát nhi u tr ng Nh ng ti ng có âm c n i vào ngu n phát dãy xung nv i các t n s thích h p v i các cao
N u các b l c có kho ng 10 nhánh l i, và các tham s c thu th pkho ng 10 n 25ms, quá trình t ng h p ti ng nói r t d dàng m c dù có th nó
i gi
Trang 14Hình 2.2 H th ng LPC m ch phát
Hình 2.3 H th ng LPC m ch thu
Xét h th ng phát LPC nh hình 2.2 Các giá tr m u c a ti ng nói u vàoc phân tích tìm ra các tham s t ng h p, toàn b các giá tr ra so sánh v i uvào Các k t qu sai khác c mã hóa theo các giá tr tham s t tín hi u s ctruy n B thu trong hình 2.3 dùng các giá tr tham s và sai s l ng t tái t o l id ng sóng âm thanh.
T mã LPC hoàn ch nh có kho ng 80 bit - 1 bit chuy n i tr ng h pcó âm ho c không có âm, 6 bit cho cao , 5 bit cho l i khu ch i, 6 bit chot ng l i c a 10 nhánh và m t vài bít phát hi n l i Ghi nh n các tham s m i10 - 25ms t ng ng l y m u t n s 40 – 100Hz, vì th LPC òi h i t c bit kho ng 3000 – 8000bps Vi c gi m áng k t c bit làm cho LPC có kh
ng thay th trong l l c c i ti n ch t l ng c a t ng h p ti ng nói cho truy nthông tho i.
2.1.2 Khuy n ngh G.729 và thu t toán ACELP.
ITU-T ã phát hành khuy n ngh G.729 vào n m 1996, c bi t n nh m t bmã hóa ti ng nói ch t l ng cao, tr th p và t c 8kbps.
Thu t toán c d a trên k thu t mã hóa d báo tuy n tính kích thích theo mãi s ACELP.
kh i c a thu t toán ACELP c ch ra hình i ây:
Trang 15Hình 2.4 S kh i G.729
B mã hóa này d a trên m t ki u mã hóa CELP và s d ng m t k thu t t ngh p phân tích xác nh các vector t o kích thích t t nh t mà làm gi m thi uc s méo tr ng s c m giác ti ng nói ban u và ti ng nói t o ra b ng ph ngpháp t ng h p.
Phân tích d oán tuy n tính LP c th c hi n tr c tiên, và tín hi u ti ngnói c bi u di n b ng các h s d oán tuy n tính ã c tính toán Các h sLPC ã c l ng t hóa c s d ng trong b l c t ng h p c a coder này Skích thích c a b l c này bao g m hai ph n: m t là vector b ng mã thích ng nh mtái t o c u trúc di n t c a âm thanh gi ng nói, và hai là vector b ng mã c nhnh m tái t o âm thanh câm Hai vector c a b ng mã ã chia t l b i nh ng l iriêng c a chúng xây d ng s kích thích c a b l c t ng h p Ti ng nói ã t ngh p c t o và có méo t i thi u liên quan n ti ng nói g c và các vector b ngmã ã tìm là nh ng cái t t nh t.
Thông th ng, s ph c t p tính toán thu t toán cho CELP là khá l n, nh t là khitìm ki m kích thích t t nh t B i v y, thu t toán ACELP s d ng các k thu t mã hóavà c u trúc b ng mã c bi t ó là h t nhân c a thu t toán nh sau: phân tích LP vàng t hóa LSP s s ng l ng t hóa vector v i d báo trung bình d ch chuy n liênkhung; tìm ki m di n t v i các chi n l c hai t ng bao g m phân tích chu k óng
Trang 16và chu k m ; c u trúc i s c a b ng mã c nh làm n gi n hóa th t c tìm ki mc a nó; và c u trúc ph c h p c a các l i (c 2 cho b ng mã thích ng và b ng mãc nh) b ng mã l ng t vector, mà c ng có th t o ra s n gi n hóa có th b ivi c áp d ng m t th t c ch n l a tr c.
Ti ng nói ã qua c a s s(n) c s d ng tính toán các h s LPC LPC thuc sau ó c chuy n i sang các c p ph v ch LSP cho m c ích l ng t hóavector, các tham s LSP t ng ng liên quan n khuôn m u c a hình bao ph ti ngnói và mô t tr c ti p nh ph ng n k Nh th , các sai s c a tham s trên t n sônào ó ch nh h ng ph ti ng nói xung quanh m t n s này và có nh h ng m tít lên các t n s khác Trong khi các h s LPC không có s liên quan t ng ng nhth , các tham s LSP có th làm t ng hi u qu vector c l ng t hóa và n i suym t cách t ng i Theo các thu c tính c m giác c bi t c a thính giác con ng i,các tham s LSP có quan h v i s phân ph i t n s nh y c m c c p phát nhi u bitn, trong khi các tham s khác t ng ng v i s phân ph i t n s ít nh y c m c
Trang 17c p phát ít bit gi m t ng s bit mã hóa.
N u chính xác c a l ng t hóa LSP không v a , ch t l ng c a ti ng nóigi i mã s gi m áng k Nh th m t c a b ng mã c l n c c n n và s ph c t ptìm ki m và các bit t ng lên ng th i Trong xem xét trên, l ng t hóa vector hait ng v i d báo MA th t chuy n m ch l n th 4 c s d ng gi m c c a b ngmã và ph c t p v i vi c c p phát bit ít h n T ng th nh t s d ng l ng t hóavector 10 chi u v i 7 bit, và t ng th 2 là l ng t hóa vector tách 10 bit v i hai b ngmã hóa 5 chi u H n n a, 1 bit c phân ph i cho s l a ch n các h s d báo MA.
2.1.4 Tìm b ng mã thích ng và di n t.
B mã hóa mang n nhi u m c ph c t p trong tính toán, c bi t là khi tìmki m b ng mã thích ng và b ng mã c nh V i m c ích n gi n hóa, m t l i vàohai t ng c a ra trong tìm ki m b ng mã thích ng và các th t c c ch ratrong hình d i ây:
t ng th nh t, phân tích chu k m c c l ng m i l n cho t ng khung10ms M c dù s tìm ki m là n gi n và tr di n t c l ng t c là r t thô,th t c là thi t y u thu h p ph m vi tìm ki m và n gi n h n nhi u s ph c t p khitìm di n t.
Nh th ng biên c a chu k óng tìm ki m di n t gi i h n Xung quanh trdi n t chu k m , phân tích chu k óng c th c hi n cho m i subframe 5ms v iphân gi i 1/3 trong kho ng 191 842
3+3 và s nguyên duy nh t trong kho ng 85 ÷ 143.Và tr t i u c xác nh b i t i thi u hóa trung bình bình ph ng sai s tr ng sgi a ti ng nói g c và ti ng nói khôi ph c u này t c b i c c i hóa s h ngsau:
Trang 18( )( )( )
( )( )
x n y nR k
yk(n) = yk-1(n-1) + u(-k)h(n) v i n = 39,…,0.v i h(n) là áp ng xung c a b l c t ng h p tr ng s
Các tham s b ng mã thích ng là các ch s t ng ng v i tr và l i nào ó.Trong l i vào b ng mã thích ng th c thi b l c di n t kích thích c l p cáctr ít h n dài khung con Vi c s d ng các tr nh t o cho quá trình x lý này trgiá t trong quá trình tìm t ng Do ó kích thích v t quá th i gian di n t c kéodài b i ph n d LP trong quá trình tìm ki m Th t c này là n gi n h n và cho th ynó t o ra các k t qu gi ng nhau sau khi so v i vi c s d ng b ng mã thích ng cho
c s d ng k t sinh vector b ng mã thích ng.
2.1.5 Tìm b ng mã cnh.
M t b ng mã i s c bi t v i 17 bit c s d ng cho kích thích b ng mã cnh, các vector c a nó có 40 chi u.
B ng mã s d ng m t cách s p x p hoán v xung n cài xen ISSP (Interleavedsingle-pulse permutation), và t ó m i vector ch a 4 xung khác 0 v i các biên ±1trên các v trí c th a nh n ch ra trong b ng d i ây:
Tìm ki m b ng mã c nh c ng c th c hi n trên m i subframe và d i côngth c o sai s tr ng s trung bình bình ph ng N u Ck là vector b ng mã c nh thk, thì vector t t nh t c tìm ki m b i vi c tìm th y biên và v trí b n xung 0 cunó mà c c i hóa theo phân s sau:
Trang 19(( ) ( ))k
d n c nC
== ∑
v i t bi u th hoán v , d(n) là tín hi u t ng quan c a tín hi u ích h(n), và làma tr n liên quan n h(n).
C u trúc i s c a b ng mã c nh cho phép th t c tìm ki m nhanh h n, ngi n, và b nh nh h ng ít h n Ngoài ra, tr c khi tìm tín hi u d(n) c tách ralàm hai ph n: giá tr tuy t i c a nó và d u c a nó t trên biên c a xung trêncùng v trí Sau ó các công th c liên quan khác c ch nh s a phù h p v i quátrình n gi n hóa Và m t chi n l c t p trung c s d ng n gi n hóa h nn a b i thi t l p m t ch ng trình ng ng tính tr c và m t liên k t u khi n tr ckhi vòa tìm ki m chu k sau cùng.
2.1.6ng t hóa vector c a các l i
K ti p là các l i l ng t hóa vector cho óng góp b ng mã thích ng và cnh 7 bit và d báo MA c áp d ng i v i l i b ng mã c nh L ng t hóanói chung này cung c p m t s ti t ki m kho ng 2 bit so v i l ng t hóa vô h ng.D a trên nh ng so sánh không chính th c, cho th y r ng l ng t hóa này không a rab t k gi m sút áng k c a ch t l ng ti ng nói so v i các l i không l ng t hóa.
l i b ng mã thích ng và h s hi u ch nh c a l i b ng mã c nh cng t hóa vector B ng mã l ng hóa t vector s d ng m t c u trúc liên h p 2t ng M i t ng g m b ng mã 2 chi u và t ng u tiêng s d ng b ng mã GA v i 3 bit,và t ng hai bao g m m t b ng mã GB 4 bit Thành ph n u tiên c a t ng vector trongm i b ng mã mô t l i b ng mã thích ng ã l ng t hóa và thành ph n th 2 môt h s hi u ch nh l i b ng mã c nh ã l ng t hóa.
C u trúc c bi t có th làm n gi n tìm ki m b ng mã b ng cách áp d ng m tth t c l a ch n tr c T c hai b ng mã, m t n a ch s tham d t t nhât c ch nl a tr c tiên B ng mã GA có 8 vector, v i thành ph n th 2 th ng l n h n thànhph n th nh t trong khi 16 vector t b ng mã GB có hoàn c nh ng c l i Trong tht c ch n tr c, b n vector v i các thành ph n th hai g n v i l i b ng mã c nh
n tr c c l a ch n t b ng mã t ng th nh t và 8 vector c l a ch n t b ngmã t ng th 2, các thành ph n th nh t g n v i l i b ng mã thích ng h n.
Có th th y c sau khi ch n l a tr c, s l ng thành ph n tham d nh h nnhi u và ph c t p c ng gi m xu ng Sau ó trong kho ng nh h n, nó tìm t h p
Trang 20t t nh t c a hai ch m c t i thi u hóa sai s trung bình bình ph ng.
- Thi t b l y m u và gi m u t i t n s 8 kHz.
- Phép chuy n i t ng t - s c bi u di n b ng 13 bit.2) Chuy n i s PCM ng b sang t ng t
- S chuy n i 13 bit/8 kHz PCM ng b sang t ng t- M t thi t b l u gi
- B l c tái t o bao g m hi u ch nh x/sin(x)- Thi t b u ch nh m c u ra.
- Tai nghe ho c loa.
Trong thi t b u cu i, ch c n ng A/D có th thu c:- Thông qua chuy n i tr c ti p PCM 13 bit u
- Ho c thông qua chuy n i hình th c lu t A ho c lu t 8 bit, d a trêncodec/b l c lu t A ho c lu t chu n d a trên gi i thi u c a ITU-T G.711 và G.714,tuân theo phép chuy n i 8 bit sang 13 bit.
V i quá trình D/A các ho t ng l i c áp d ng ng c l i
2.2.2 Chu n b các m u ti ng nói
D li u cho vào b mã hóa bao g m các m u v i gi i mã 13 bit liên ti p n mphía trái c a c a 1 t có 16 bit Ba bit kém quan tr ng nh t c thi t l p là “0” Bgi i mã cho ra d li u d i cùng nh d ng.
2.2.3 Các nguyên t c c a b mã hóa ti ng nói AMR
Mã hóa AMR bao g m 8 mã hóa ngu n v i các t c bit t 4,75 n 12,2 kbps.Mã hóa d a trên mô hình mã hóa d báo tuy n tính c kích thích mã CELP.S d báo tuy n tính b c 10 hay b l c t ng h p ng n h n c áp d ng nh sau:
Trang 21H z
B l c giác quan c bi t c s d ng trong k thu t tìm ki m “phân tích thôngqua t ng h p”nh sau:
2A(z/ )
A(z/ )
γγ
Trang 22v i A(z) là b l c ch a c l ng t hóa và 0 < γ2<γ1< 1 là các nhân t cótính tr c giác Các giá tr γ1 =0,9 (cho ch 12,2 và 10,2 kbps) hay γ1=0,94 cho t tc các ch và γ2=0,6 c s d ng Tr ng s c a b l c s d ng các thông s LPkhông c l ng t hóa.
B mã hóa ho t ng trên các khung ti ng nói v i 20ms t ng ng v i 160 m ut i t c l y m u là 8000 m u/giây V i m i 160 m u ti ng nói, tín hi u ti ng nóic phân tích rút ra các tham s c a mô hình CELP (các h s c a b l c LP, cácch s và t ng thêm c a b ng mã c nh và thích nghi) Nh ng tham s này cmã hóa và truy n i T i b gi i mã, nh ng tham s này s c gi i mã và ti ng nóic t ng h p thông qua vi c l c các tín hi u kích thích ã c xây d ng l i thôngqua b l c t ng h p LP.
Dòng tín hi u t i b mã hóa nh trên hình d i ây:
Trang 23S phân tích LP c th c thi hành 2 l n trên 1 khung v i ch 12.2kbit/s và 1l n cho các ch khác V i ch 12.2kbit/s, 2 t p h p tham s LP c chuy n isang các c p ph tuy n (LSP) và c l ng t hóa ng th i s d ng s l ng t hóama tr n tách (SMQ) 38bits V i các ch khác, t p n các tham s LP c chuy ni sang các c p và vector ph tuy n l ng t hóa thông qua s l ng t hóa vectortách Khung ti ng nói c chia thành 4 subframe v i m i frame là 5ms (t ng ngv i 40 m u) Các tham s b ng mã c nh và thích nghi c truy n theo m isubframe Các tham s c l ng t hóa và ch a c l ng t hóa ho c các phiênb n n i suy c s dùng tùy vào subframe M t tr pitch vòng l p m c cng trong m i subframe khác (ngo i tr các ch 5.15 và 4.75kbit/s c th chi n 1 l n trên m i frame) d a trên tín hi u ti ng nói c tr ng s giác quan.
Các thao tác c l p l i cho m i subframe:
Tín hi u ích x(n) c tính toán thông qua quá trình l c th ng d LP qua b l ct ng h p tr ng s W(z)H(z) v i các tr ng thái kh i u c a các b l c ã c c pnh t thông qua quá trình l c l i gi a ph n th ng d và s kích thích LP ( u nàyng ng v i phép x p x ph ng thông c a áp ng u vào 0 c a b l c t ng h pcó tr ng s t tín hi u ti ng nói c tr ng s ).
áp ng xung H(N) c a b l c t ng h p tr ng s c tính toán S phân tíchpitch vòng l p óng sau ó s c thi hành ( tìm ra tr và t ng pitch), sd ng hàm m c tiêu x(n) và áp ng xung h(n), thông qua vi c tìm ki m xung quanh
tr pitch l p óng Pitch phân s kho ng 1/6 ho c 1/3 c a 1 phân gi i m u (ph
Tín hi u m c tiêu x(n) c c p nh t qua vi c b i quá trình gom b ng mã thíchnghi (vector mã thích nghi ã l c), và m c tiêu m i x2(n) c s d ng trong vi c tìmki m b ng mã i s c nh ( tìm ra s i m i t i u).
S t ng thêm c a b ng mã c nh và thích nghi là nh l ng vô h ng v i 4 và5 bít t ng ng ho c vector nh l ng v i 6-7 bit (v i d báo trung bình ng (MA)áp d ng cho s t ng b ng mã c nh).
Cu i cùng, các b nh c a b l c c c p nh t (thông qua tín hi u kích thích ãnh tr c) cho vi c tìm ki m tín hi u ích trong subframe k ti p.
S phân b bit c a các ch mã hóa AMR nh b ng sau:
Trang 24B ng 2.2: Phân b bit trong các ch AMR
1st sub- 2nd sub- 3rd sub- 4th sub- Total per
Trang 25Trong m i khung ti ng nói 20 ms, 95, 103, 118, 134, 148, 159, 204 ho c 244 bitss c t o ra, t ng ng v i t c bit 4.75, 5.15, 5.90, 6.70, 7.40, 7.95, 10.2 hay12.2 kbps L u ý là các bít quan tr ng nh t (MSB) luôn luôn c g i i tr c tiên.
2.2.4 Nguyên t c c a b gi i mã âm thanh AMR.
Bi u lu ng tín hi u t i b gi i mã nh trong hình d i ây:
T i b gi i mã, d a trên ch ã ch n, các ch s ã truy n s c trích ra tlu ng bit nh n c Các ch s c gi i mã thu c các tham s c a b mã hóat i m i khung truy n i Nh ng tham s này là các vector LSP, các tr pitch m tph n, các codevector i m i, và t ng t c pitch và t ng t c i m i Các vectorLSP c chuy n i thành các h s c a b l c LP và n i suy ra thu c các b l cLP t i m i subframe Sau ó v i m i 40 m u thì:
- S kích thích c t o thành thông qua vi c thêm vào các codevector thíchnghi và i m i l y t l thông qua t ng thêm t ng ng.
- Ti ng nói c xây d ng l i thông qua quá trình l c s kích thích cho t i b l ct ng h p LP
Cu i cùng, tín hi u gi ng nói c tái t o c truy n t i 1 b l c thích nghitheo sau.
2.2.5 Ch c n ng c a b mã hóa
2.2.5.1 Quá trình ti n x lý (i v i t t c các ch)
Hai quá trình ti n x lý c áp d ng tr c cho quá trình mã hóa bao g m: L cthông cao và thu nh tín hi u.
Trang 26Gi m t l tín hi u bao g m quá trình chia tín hi u vào b i s m 2 gi m s cóth tràn trong thi hành i m c nh.
B l c thông cao n n ng a các thành ph n t n s th p không mong i M t bl c t n s c t 80 Hz c s d ng và c cho b i công th c sau:
S t t ng quan c a c a s ti ng nói c chuy n i thành các h s LP thôngqua thu t toán Levinson-Durbin Sau ó các h s LP s c ánh x vào mi n c pph tuy n cho các m c ích ng t hóa và phép n i suy Các h s l c ã n i suyng t hóa và ch a c l ng t hóa s c chuy n i ng c tr l i thành các hs l c LP ( c u trúc lên các b l c t ng h p và ph thêm c bi t t i m i subframe).
D báo ng n h n, ho c d báo tuy n tính, phép phân tích c thi hành m t l n trênm i khung ti ng nói s d ng phép ti p c n t ng quan t ng v i các c a s b t ix ng 30ms M t d báo c a 40 m u s c áp d ng trong tính toán t ng quan t ng.
Các t ng quan t ng c a c a s ti ng nói s c chuy n i thành các h sLP thông qua thu t toán Levinson-durbin Sau ó các h s này s c ánh x t imi n c p ph tuy n cho các m c ích l ng t hóa và phép n i suy Các h s l c ãn i suy l ng t hóa và ch a l ng t hóa s c chuy n i ng c thành các h sl c LP ( c u trúc thành các b l c t ng h p và có tr ng s t i m i subframe).
2.2.5.2.1 Phân c a s và tính toán t ng quan t ng
Phép phân tích LP c thi hành 2 l n trên m i frame s d ng 2 c a s b ti x ng khác nhau C a s u tiên có t tr ng t p chung vào 2 subframe và nó
Trang 27bao g m 2 n a c a c a s Hamming có các kích c khác nhau C a s c chob i bi u th c sau:
giá tr ( )1
L =160 và ( )2
L =180 c s d ng C a s th 2 có t tr ng t p chung tr isubframe th 4 và nó g m 2 ph n nh : ph n u tiên là 1 n a c a s Hamming vàph n th 2 là ¼ c a 1 vòng tròn hàm cosine C a s c cho nh sau:
i:
Trang 28T t ng quan c a c a s ti ng nói s’(n), n=0,…,239 và c tính toán b i:
Phép phân tích LP c thi hành m i l n trên m i frame có s d ng c a s b ti x ng C a s có tr ng s t p chung t i 4 subframe và bao g m 2 ph n: Ph n thnh t là 1 n a c a c a s Hamming và ph n th 2 là ¼ c a chu trình hàm cosin C as c cho d i ây v i các giá tr L1=200 và L2=40 c s d ng:
21
Trang 292.2.5.2.2 Thu t toán Levinson-Durbin algorithm (cho t t c các ch)
S d ng t t ng quan s a i r’ac(0)= 1.0001 rac(0) và r’ac(k)=rac(k)wlag(k),k=1,…10 và c s d ng thu c các h s b l c LP d ng tr c ti p ak,k=1,…,10 qua vi c gi i quy t t p các ph ng trình sau:
11 '
() /(1)
L i gi i cu i cùng cho b i aj= aj(10), j=1,…,10.
Các h s b l c LP s c bi n i sang phép bi u di n c p ph tuy n (LSP)cho m c ích ng t hóa và phép n i suy Các phép bi n i sang mi n LP và ng cl i sang mi n h s b l c LP s c di n t trong m c sau.
2.2.5.2.3 Phép chuy n i LP sang LSP (cho t t c các ch)
Các h s b l c LP ak, k =1,…,10 c bi n i sang bi u di n c p ph tuy n(LSP) cho m c ích l ng t hóa và phép n i suy V i 1 b l c LP b c 10, các LSP
Trang 30F z = A z −z− A z−
Các a th c '1( )
F z và '2( )
F z là i x ng và kh i x ng Có th ch ng minh là t tc nghi m c a nh ng a th c này u n m trên ng tròn n v và n m xen k
1( )
F z có g c là z=-1 ( =2 ) và '2( )
F z có g c z=1 ( =0) lo i b 2nghi m này chúng ta nh ngh a 2 a th c m i:
F1(z) = '1( )
F z /(1+z-1)và
F2(z) = '2( )
F z /(1-z-1)
M i a th c có nghi m trên ng tròn n v ( ji
e±ω ) b i v y, các a th c có thc vi t nh :
Khi c 2 a th c F1 và F2 là i x ng thì ch có duy nh t 5 h s u tiên c am i a th c là c n thi t cho tính toán Các h s c a nh ng a th c này thu cthông qua các quan h qui (v i i = 0 n 4):
F( ) = 2–j5 C(x).
Trang 31v i C(x)=T5(x) + f(1)T4(x) + F(2)T3(x)+f(3)T2(x) + f(4) T1(x) + f(5)/2
V i Tm (x) = cos(m ) là a th c Chebyshev b c m và f(i), i = 1, 5 K là các h sc a hàm F1(z) và F2(z) a th c C(x) c c l ng t i 1 giá tr th c x = cos( ) sd ng h th c qui:
C(x) = x 1- λ2 + f(5)/2;
v i các giá tr kh i t o là λ5=1 và λ6=0.
2.2.5.2.4 Phép chuy n i LSP sang LP (cho t t c các ch)
Khi các LSP c l ng t hóa và n i suy, chúng s c bi n i ng c l i vàomi n h s LP {ak} Phép bi n i vào mi n LP c th c hi n nh sau Các h s c aF1(z) và F2(z) d a vào vi c khai tri n các ph ng trình (1) và (2) và bi t tr c các LSP
ng t hóa và n i suy qi, i=1, 10 H th c qui sau dùng tính toán hàm f1(i):for i=1 to 5
f i = − q − f i− + f i−for j=i-1 down to 1
1( ) 1( ) 2 2 1 1i ( 1) 1( 2)
f j = f j − q − f j− + f j−end
Trang 32F z và '2( )
si
Trang 33o bi n d ng LSP có t tr ng c dùng trong quá trình l ng t hóa.Thông th ng, v i m t vector LSP u vào f và 1 vector l ng t hóa t i m k, k
∧,quá trình l ng t hóa c ti n hành thông qua vi c tìm ki m ch s k làm t i ti uhóa bi u th c:
d báo r(n) c cho tr c b i:r(n) = z(n) – p(n)
v i p(n) là vector LSF c d oán t i khung n D báo MA b c 1 u tiên sd ng trong:
( )(1),1, ,10
p n =α r n∧ − j=v i r nj(1)
Trang 34ng t hóa t ng ng v i 7 – 9 bits nh trong b ng d i ây:
o m c bi n d ng LSP có t tr ng c a ph ng trình (4) v i ph ng trình (5)c áp d ng trong quá trình l ng t hóa.
2.2.5.3 Tính toán áp ng xung (cho t t c các ch)
áp ng xung, h(n) c a b l c t ng h p c tính toán cho m i subframe ápng xung này c n thi t cho vi c tìm ki m các b ng mã thích nghi và c nh áp ngxung h(n) c tính toán b ng cách l c vector các h s c a b l c A(z/ )γ1 m r ngb i các s 0 thông qua 2 b l c 1
A (z)∧ và
2.2.5.4 Tính toán tín hi u m c tiêu (cho t t c các ch)
Tín hi u m c tiêu cho vi c tìm ki m b ng mã thích nghi th ng c tính toán
tr ngH z( )W(z)=A(z/ ) /γ1 A z A z∧( ) ( /γ2)
t tín hi u ti ng nói có t tr ng sw(n). i u nàyc th c hi n d a trên m t c s subframe.
M t th t c t ng ng cho vi c tính toán tín hi u m c tiêu, c s d ng trongtài li u này là l c tín hi u th ng d LP resLP(n) qua vi c k t h p b l c t ng h p
1A (z)
∧ và b l c o t tr ng
A(z/ 1)A(z/)
γ Sau khi xác nh c s kích thích dành chosubframe, các tr ng thái g c c a các b l c này s c c p nh t b ng thông qua quátrình l c s khác nhau gi a s d và s kích thích LP.
Tín hi u d resLP(n) là c n thi t cho vi c tìm ki m vector m c tiêu c ng cdùng trong vi c tìm ki m b ng mã thích nghi m r ng b m kích thích ã qua.Vi c này s n gi n hóa th t c tìm ki m b ng mã thích nghi l y ra các tr nh
Trang 35n kích th c subframe là 40 s c nói rõ trong m c ti p theo Ph n d LP ccho b i:
Các tham s b ng mã thích nghi (hay các tham s cao) là tr và m c t ngc a b l c cao Trong ti p c n b ng mã thích nghi thi hành b l c cao, skích thích c l p l i có các tr nh h n dài c a subframe Trong b c tìmki m, s kích thích c m r ng thông qua ph n d LP n gi n vi c tìm ki mvòng l p óng.
Trong subframe th nh t và th 3, m t tr cao m t ph n c dùng v i phângi i: 1/6 trong d i [173/6, 943/6] và các s nguyên ch có trong d i [95,143] V i cácsubframe th 2 và th 4, m t gi i cao 1/6 luôn c s d ng trong d i [T1– 53/6,T1 + 43/6] v i T1 là s nguyên g n nh t v i tr cao m t ph n c a subframe tr c
ó (th 1 và th 3), b ch n b i 18…143.
Phép phân tích cao vòng l p óng c th c hi n xung quanh các c l ng cao l p m trên c s c a 1 subframe Trong subframe th 1 (3) d i Top ± 3, gi ih n b i 18…143, s c tìm ki m V i các subframe khác, phép phân tích cao l póng c th c hi n quanh cao s nguyên c l a ch n trong subframe tr c ó,nh ã nói trên tr cao c mã hóa 9 bit trong subframe th 1 và 3 và tr
ng i c a các subframe khác c mã hóa 6 bit.
Tìm ki m cao l p m c th c hi n thông qua vi c c c ti u hóa l i t tr ngbình ph ng trung bình gi a ti ng nói g c và ti ng nói ã c t ng h p Thu ck t qu này thông qua c c i hóa s h ng sau:
( )( )( )
( )( )
x n y nR k
y n y n
==
Trang 36V i x(n) là tín hi u m c tiêu và yk(n)là kích thích ã l c quá kh t i tr k(kích thích quá kh i kèm theo h(n)) L u ý là d i tìm ki m c gi i h n xungquanh cao l p m nh trên ã gi i thích.
Hàm cu n yk(n) c tính toán cho tr u tiên tmin trong d i tìm ki m, và v icác tr khác trong d i tìm ki m k= tmin+1,…, tmaxs c c p nh t thông quan h th c
Khi tr cao s nguyên t i u c xác nh, các phân sô -3/6 t i 3/6 v i b clà 1/6 xung quanh s nguyên s c ki m tra Tìm ki m tr phân s c th c hi nthông vi c n i suy s t ng quan chu n hóa trong ph ng trình (7) và tìm ki m c ci c a nó Quá trình n i suy c th c hi n s d ng b l c FIR b24 d a trên hàm ssin(x)/x có c a s Hamming b ch t t i ±23 và c m vào các s 0 t i ±24 … Bl c có t n s c t (-3 db) t i t n s 3600 Hz trong kh p mi n ã l y m u Thu c cácgiá tr n i suy c a R(k) cho các phân s -3/6 t i 3/6 thông qua công th c n i suy sau:
Khi tr cao phân s c xác nh, vector b ng mã thích nghi v(n) c tínhtoán thông quá vi c n i suy tín hi u kích thích quá kh u(n) t i tr s nguyên k chotr c và có pha (phân s ):
Trang 37M c t ng c a b ng mã thích nghi c o b ng:
( ) ( )( ) ( )
x n y ng
y n y n
=== ∑
Trang 38Trong b ng mã này, vector i m i ch a 10 xung khác 0 T t c các xung có thcó biên +1 ho c -1 40 V trí trong subframe c chia làm 5 ng, v i m i ngch a 2 xung, nh trong b ng d i ây:
C 2 xung t trong m t ng s c mã hóa 6 bit (t ng 30 bit, 3 bit cho v tríc a m i xung), và d u c a xung u tiên c mã hóa 1 bit (t ng 5 bit).
V i 2 xung trong cùng 1 track, ch c n 1 bít d u Bit d u này là d u c a xung utiên D u c a xung th 2 ph thu c vào v trí t ng i c a nó v i xung th nh t N uv trí c a xung th 2 nh h n, thì s có d u ng c v i d u c a xung th 1, ng c l i scó cùng d u v i xung th 1.
T t c v trí xung 3-bit c mã hóa Gray c i thi n kh n ng ch ng ch u cácl i b ng t n u này d n n c n t i 35 bit cho mã i s
Trang 39B ng 2.7: V trí các xung trong b ng mãi s cho ch 6,70 kbps
C n 1 bit mã hóa t p con c s d ng Hai v trí xung c mã hóa 3 bit chom i v trí (t ng 6 bit), và d u c a m i xung c mã hóa 1 bit (c n t i 2 bit t t c ).Ngh a là c n t i 9 bit cho mã i s
Trang 402.2.5.6.2 Tìm ki m b ng mã i s
B ng mã i s c tìm ki m thông qua vi c c c ti u hóa l i bình ph ng trungbình gi a ti ng nói u vào có t tr ng v i ti ng nói ã t ng h p có t tr ng Tín hi um c tiêu c dùng trong tìm ki m cao l p óng c c p nh t qua phép tr iph n góp thêm c a b ng mã thích nghi Nh sau:
c tìm thông qua vi c c c i hóa s h ng sau:( )2 ( )t 2
d cC
392