H C VI N CƠNG NGH B U CHÍNH VI N THƠNG X LÝ ÂM THANH, HÌNH (Dùng cho sinh viên h đào t o đ i h c t xa) L u hành n i b HÀ N I - 2007 CuuDuongThanCong.com https://fb.com/tailieudientucntt NH H C VI N CÔNG NGH B U CHÍNH VI N THƠNG X LÝ ÂM THANH, HÌNH Biên so n : NH TS NGUY N THANH BÌNH THS VÕ NGUY N QU C B O CuuDuongThanCong.com https://fb.com/tailieudientucntt L I NÓI U Tài li u h ng d n h c t p môn "X lý âm hình nh" dành cho kh i đào t o t xa chuyên ngành n t vi n thông Tài li u s gi i thi u nh ng ki n th c c b n v x lý âm hình nh c bi t, tác gi tr ng t i v n đ x lý tín hi u ng d ng m ng vi n thơng: ph ng pháp nén tín hi u, l u tr , tiêu chu n nén tín hi u âm hình nh Nh ng ki n th c đ c trình bày tài li u s giúp h c viên ti p c n nhanh v i v n đ th c ti n th ng g p m ng vi n thơng Vì kh i l ng ki n th c l nh v c x lý âm c ng nh hình nh r t l n, v i qu th i gian eo h p dành cho biên so n, tài li u h ng d n ch a thâu tóm đ c tồn b ki n th c c n có v l nh v c x lý âm hình nh tìm hi u v m t s v n đ có đ c ng mơn h c đòi h i h c viên ph i nghiên c u thêm s sách tham kh o đ c tác gi đ c p t i ph n cu i c a tài li u N i dung cu n sách đ c chia làm hai ch - Ch ng 1: K thu t x lý âm - Ch ng 2: K thu t x lý hình nh ng: có th h c t t mơn này, sinh viên c n ph i có ki n th c c b n v x lý tín hi u s Các ki n th c b n có th tìm hi u cu n “X lý tín hi u s ” dành cho sinh viên i h c t xa c a H c vi n ây l n biên so n đ u tiên, ch c ch n tài li u cịn nhi u s sót, r t mong b n đ c trình h c t p thày cô gi ng d y môn h c đóng góp ý ki n xây d ng Trong th i gian g n nh t, tác gi s c g ng c p nh p, b xung thêm đ tài li u h ng d n đ c hoàn ch nh h n M i ý ki n đóng góp đ ngh g i v theo đ a ch email: binhntptit@yahoo.com Tp H Chí Minh 19/05/2007 Nhóm biên so n CuuDuongThanCong.com https://fb.com/tailieudientucntt CuuDuongThanCong.com https://fb.com/tailieudientucntt CH NG 1.1 T NG QUAN V X 1.1.1 Gi i thi u s l 1.1.1.1 K THU T X LÝ ÂM THANH LÝ ÂM THANH c v âm & h th ng x lý âm c tính c a âm t ng t [1] M c đích c a l i nói dùng đ truy n đ t thơng tin Có r t nhi u cách mô t đ c m c a vi c truy n đ t thông tin D a vào lý thuy t thơng tin, l i nói có th đ c đ i di n b i thu t ng n i dung thông p, ho c thông tin M t cách khác đ bi u th l i nói tín hi u mang n i dung thông p, nh d ng sóng âm Hình 1.1 D ng sóng c a tín hi u ghi nh n đ c t âm c a ng i K thu t đ u tiên dùng vi c ghi âm s d ng thông s v c , n c ng nh tr ng có th làm nên nhi u cách th c ghi âm ng v i lo i áp su t khơng khí khác i n áp đ n t m t microphone tín hi u t ng t c a áp su t khơng khí (ho c v n t c) Dù đ c phân tích b ng cách th c nào, ph ng pháp so sánh v i ph i dùng m t t l th i gian Trong thi t b t ng t hi n đ i trơng có v x lý âm t t h n nh ng thi t b c n, tiêu chu n x lý h u nh khơng có thay đ i, m c dù cơng ngh có v x lý t t h n Trong h th ng x lý âm t ng t , thông tin đ c truy n đ t b ng thông s liên t c bi n thiên vô h n H th ng x lý âm s lý t ng có nh ng tính n ng t ng t nh h th ng x lý âm t ng t lý t ng: c hai ho t đ ng m t cách “trong su t” t o l i d ng sóng ban đ u không l i Tuy nhiên, th gi i th c, u ki n lý t ng r t hi m t n t i, hai lo i h th ng x lý âm ho t đ ng s khác th c t Tín hi u s s truy n kho ng cách ng n h n tín hi u t ng t v i chi phí th p h n Trong giáo trình này, t p trung đ c p đ n h th ng s x lý âm Thông tin dùng đ truy n đ t c a âm tho i v b n ch t có tính r i r c [2], có th đ c bi u di n b i m t chu i ghép g m nhi u ph n t t m t t p h u h n ký hi u (symbol) Các ký hi u t m i âm có th đ c phân lo i thành âm v (phoneme) M i ngôn ng có t p âm v khác nhau, đ c đ c tr ng b i s có giá tr t 30 đ n 50 Ví d nh ti ng Anh đ c bi u di n b i m t t p kho ng 42 âm v Tín hi u tho i đ c truy n v i t c đ nh th nào? i v i tín hi u âm tho i nguyên th y ch a qua hi u ch nh t c đ truy n c l ng có th tính đ c b ng cách l u ý gi i h n v t lý c a vi c nói l u lốt c a ng i nói t o âm tho i kho ng 10 âm v m t giây M i CuuDuongThanCong.com https://fb.com/tailieudientucntt m t âm v đ c bi u di n b i m t s nh phân, nh v y m t mã g m bit có th bi u di n đ c t t c âm v c a ti ng Anh V i t c đ truy n trung bình 10 âm v /giây, không quan tâm đ n v n đ luy n âm gi a âm v k nhau, ta có th c l ng đ c t c đ truy n trunh bình c a âm tho i kho ng 60bit/giây Trong h th ng truy n âm tho i, tín hi u tho i đ c truy n l u tr x lý theo nhi u cách th c khác Tuy nhiên đ i v i m i lo i h th ng x lý âm có hai u c n quan tâm chung là: Vi c trì n i dung c a thơng p tín hi u tho i Vi c bi u di n tín hi u tho i ph i đ t đ c m c tiêu ti n l i cho vi c truy n tin ho c l u tr , ho c d ng linh đ ng cho vi c hi u ch nh tín hi u tho i cho khơng làm gi m nghiêm tr ng n i dung c a thông p tho i Vi c bi u di n tín hi u tho i ph i đ m b o vi c n i dung thông tin có th đ dàng trích b i ng i nghe, ho c b i thi t b phân tích m t cách t đ ng cd 1.1.1.2 Khái ni m tín hi u Là đ i l ng v t lý bi n thiên theo th i gian, theo không gian, theo m t ho c nhi u bi n đ c l p khác, ví d nh : Âm thanh, ti ng nói: dao đ ng sóng theo th i gian (t) Hình nh: c ng đ sáng theo không gian (x, y, z) a ch n: ch n đ ng đ a lý theo th i gian Bi u di n toán h c c a tín hi u: hàm theo bi n đ c l p Ví d : u (t ) = 2t − f ( x, y ) = x − xy − y Thông th ng tín hi u t nhiên khơng bi u di n đ c b i m t hàm s c p, tính tốn, ng i ta th ng dùng hàm x p x cho tín hi u t nhiên H th ng: thi t b v t lý, thi t b sinh h c, ho c ch ng trình th c hi n phép tốn tín hi u nh m bi n đ i tín hi u, rút trích thơng tin, … Vi c th c hi n phép tốn cịn đ c g i x lý tín hi u 1.1.1.3 Phân lo i tín hi u: Tín hi u đa kênh: g m nhi u tín hi u thành ph n ,cùng chung mô t m t đ i t ng (th ng đ c bi u di n d i d ng vector, ví d nh tín hi u n tim (ECG-ElectroCardioGram) , tín hi u n não (EEG – ElectroEncephaloGram), tín hi u nh màu RGB Tín hi u đa chi u: bi n thiên theo nhi u h n m t bi n đ c l p, ví d nh tín hi u hình nh, tín hi u tivi tr ng đen Tín hi u liên t c theo th i gian: tín hi u đ c đ nh ngh a t i m i m đo n th i gian [a,b], ký hi u x (t ) CuuDuongThanCong.com https://fb.com/tailieudientucntt Hình 1.2 Tín hi u liên t c theo th i gian Tín hi u r i r c th i gian: tín hi u ch đ c đ nh ngh a t i nh ng th i m r i r c khác nhau, ký hi u x(n) Hình 1.3 Tín hi u r i r c theo th i gian Tín hi u liên t c giá tr : tín hi u có th nh n tr b t k đo n [Ymin , Ymax ] , ví d tín hi u t ng t (analog) Hình 1.4 Tín hi u liên t c giá tr Tín hi u r i r c giá tr : tín hi u ch nh n tr m t t p tr r i r c đ nh tr c (tín hi u s ) CuuDuongThanCong.com https://fb.com/tailieudientucntt Hình 1.5 Tín hi u r i r c giá tr Tín hi u analog: tín hi u liên t c v th i gian, liên t c v giá tr Hình 1.6 Tín hi u analog Tín hi u s : tín hi u r i r c v th i gian, r i r c v giá tr Hình 1.7 Tín hi u s Tín hi u ng u nhiên: giá tr c a tín hi u t hi u t nhiên th ng thu c nhóm ng lai khơng th bi t tr Tín hi u t t đ nh: giá tr tín hi u kh , hi n t i t thông th ng có cơng th c xác đ nh rõ ràng cđ ng l i đ u đ c Các tín c xác đ nh rõ, 1.1.1.4 Phân lo i h th ng x lý G m hai lo i h th ng h th ng t ng t h th ng s Trong h th ng x lý s : h th ng có th l p trình đ c, d mơ ph ng, c u hình, s n xu t hàng lo t v i đ xác cao, giá thành h , tín hi u s d l u tr , v n chuy n l u, nh c m khó th c hi n v i tín hi u có t n s cao CuuDuongThanCong.com https://fb.com/tailieudientucntt 1.1.1.5 H th ng s x lý âm [3] nh y c a tai ng i r t cao, có th phân bi t đ c s l ng nhi u r t nh c ng nh ch p nh n t m biên đ âm r t l n Các đ c tính c a m t tín hi u tai ng i nghe đ c có th đ c đo đ c b ng công c phù h p Thông th ng, tai ng i nh y nh t t m t n s 2kHz 5kHz, m c dù c ng có ng i có th nh n d ng đ c tín hi u 20kHz T m đ ng nghe đ c c a tai ng i đ c phân tích ng i ta nh n đ c k t qu có d ng đáp ng logarith Tín hi u âm đ c truy n qua h th ng s chu i bit B i bit có tính ch tt r i r c, d dàng xác đ nh s l ng b ng cách đ m s l ng m t giây, d dàng quy t đ nh t c đ truy n bit c n thi t đ truy n tín hi u mà khơng làm m t thơng tin Hình 1.8 nh n đ c tám m c tín hi u khác m t cách phân bi t, tín hi u đ nhđ nh c a tín hi u nhi u ph i nh h n ho c đ sai bi t gi a m c đ T s tín hi u nhi u ph i t i thi u 8:1 ho c 18dB, truy n b i bit 16 m c t s tín hi u nhi u ph i 24dB, truy n b i bit 1.1.1.6 Mơ hình hóa tín hi u âm [4] Có r t nhi u k thu t x lý tín hi u đ c mơ hình hóa áp d ng gi i thu t vi c khôi ph c âm Ch t l ng c a âm tho i ph thu c r t l n vào mơ hình gi đ nh phù h p v i d li u i v i tín hi u âm thanh, bao g m âm tho i, nh c nhi u khơng mong mu n, mơ hình ph i t ng quát không sai l nh so v i gi đ nh M t u c n l u ý h u h t tín hi u âm tho i tín hi u đ ng th c t , m c dù mơ hình th c ti n th ng gi đ nh phân tích tín hi u tín hi u có tính ch t t nh m t kho ng th i gian xét Mơ hình phù h p v i h u h t r t nhi u lãnh v c vi c x lý chu i th i gian, bao g m vi c ph c h i âm mơ hình Autoregressive (vi t t t AR), đ c dùng làm mơ hình chu n cho vi c phân tích d đốn n tính CuuDuongThanCong.com https://fb.com/tailieudientucntt Tín hi u hi n t i đ c bi u di n b i t ng giá tr c a P tín hi u tr tr ng, P b c c a mô hình AR: c tín hi u nhi u s[u ] = ∑ s[n − i ]ai + e[n] P (1.1) i =1 Mơ hình AR đ i di n cho q trình n tính t nh, ch p nh n tín hi u t ng t nhi u tín hi u t ng t u hịa M t mơ hình khác phù h p h n đ i v i nhi u tình hu ng phân tích mơ hình auto regressive moving-average (ARMA) cho phép m c c c ng nh m Tuy nhiên mơ hình AR có tính linh đ ng h n phân tích h n mơ hình ARMA, ví d m t tín hi u nh c ph c t p c n mơ hình có b c P > 100 đ bi u di n d ng sóng c a tín hi u, tín hi u đ n gi n h n ch c n bi u di n b ng b c 30 Trong nhi u ng d ng, vi c l a ch n b c c a mô hình phù h p cho tốn cho đ m b o vi c bi u di n tín hi u th a vi c không làm m t thơng tin c a tín hi u vi c h i ph c t p Có r t nhi u ph ng pháp dùng đ c l ng b c c a mơ hình AR nh ph ng pháp maximum likelihood/least-squares [Makhoul, 1975], ph ng pháp robust to noise [Huber, 1981, Spath, 1991], v.v… Tuy nhiên, đ i v i vi c x lý tín hi u âm nh c ph c t p thơng th ng s d ng mơ hình Sin (Sinusoidal) r t có hi u qu ng d ng âm tho i Mơ hình Sin r t phù h p ph ng pháp dùng đ gi m nhi u Tín hi u đ c cho b i công th c sau ⎛ nT ⎞ s[n]∑ [n]sin ⎜⎜ ∫ ωi (t )dt + φi ⎟⎟ i =1 ⎝0 ⎠ Pn (1.2) ây mơ hình t ng quát đ i v i u ch biên đ u ch t n s , nhiên l i không phù h p đ i v i tín hi u t ng t nhi u, m c dù vi c bi u di n tín hi u nhi u có th đ c bi u di n b i s l ng hàm sin r t l n 1.1.1.7 Ki n trúc h th ng s x lý âm i v i máy tính s x lý âm thanh, ng i ta th ng dùng ph ng pháp i u ch xung (Pulse Code Modulation , vi t t t PCM) D ng sóng âm đ c chuy n sang dãy s PCM nh sau, xét tín hi u hình sin làm ví d : Air Displacement Tín hi u g c tín hi u nh Hình 1.9 Time Hình 1.9 D ng sóng âm nguyên th y K đ n, s d ng m t microphone đ thu tín hi u âm (trong khơng khí) chuy n đ i thành tín hi u n, t m n áp ngõ c a microphone ±1 volt nh Hình 1.10 CuuDuongThanCong.com https://fb.com/tailieudientucntt 2.3.3.11.6 Sprites MPEG-4 có m t l đ i t ng khác th ng đ c dùng làm c nh n n sprite Sprite đ i t ng video th ng có kích th c l n h n hình hi n th Sprite đ i t ng đ c s d ng liên t c m t c nh (t ng t nh c nh n n t nh) Thông th ng m t c nh c a game bao g m c nh n n m t s đ i t ng nhân t o di chuy n theo k ch b n c a game hành đ ng c a ng i ch i Trong trình hành đ ng c nh đ c nhìn th y ch m t vùng nh c nh n n, vùng thành ph n c a m t nh t nh (Hình 2.3.25) MPEG-4 cung c p kh n ng truy n toàn b c nh n n nh sprite kh n ng t o c nh khác b ng cách truy n thông tin cropping wraping đ xác đ nh ph n sprite s đ c hi n th m t th i m nh t đ nh Sau sprite đ c truy n ch có thơng tin cropping/wraping cho sprite đ i t ng c n nh (foreground) c n đ c truy n Trong game n hình m i ph n c a sprite có th đ c s d ng nhi u l n th l ng d li u c n truy n s gi m đáng k Hình 2.3.25 C nh n n (sprite) đ c a hình c truy n có kích th c l n h n kh n ng hi n th Vi c truy n toàn b sprite b t đ u ch ng trình có th r t hi u qu nh ng s làm t ng b ng thông th i gian truy n tr c ho t đ ng có th b t đ u MPEG-4 s d ng ph ng pháp sau đ tránh v n đ Sprite có th truy n t ng ph n c n M t ph n sprite c n thi t t i th i m t c th i s đ c truy n T t c c nh sprite s đ c l u tr b gi i mã nh m t ph n c a sprite Theo ph ng pháp khác, sprite có th đ c mã hóa liên ti p truy n toàn b v i đ phân gi i th p đ phân gi i cao h n s đ c truy n sau Sprite đ c mã hóa nh tín hi u chói v i hai thành ph n màu nh MPEG tr đ c mã Intra b i b n ch t c a nh t nh c 2.3.3.11.7 Animations Nh bi t m t s nh ng m m nh c a MPEG-4 kh n ng truy n c đ i t ng t nhiên c ng nh đ i t ng đ c t t o (vì d hình animation) k t h p chúng b gi i mã M t nhi u kh n ng thú v s d ng đ i t ng nhân t o m t ng i ho t hình (facial animation) ây c ng m t ví d khác c a vi c ánh x texture thành đ ng nét chuy n đ ng nh ng tr ng h p đ ng nét đ c ch đ nh b i mô hình l i hay mơ hình 3D đ c hình thành b i node V trí c a m i node đ c mã hóa s d ng mã hóa d đốn tr c đ t ng hi u su t mã đ ng nét c a khuôn m t thay đ i 159 CuuDuongThanCong.com https://fb.com/tailieudientucntt Version c a MPEG-4 có th thêm vào thân hình (body) đ ng Thân hình m t đ i t ng có th t o mơ hình thân hình o đ ng d i d ng t p h p l i 3D nhi u c nh Hai t p h p thông s đ nh ngh a cho body: T p h p tham s đ nh ngh a body (BDPbody definition parameter) t p h p thông s đ ng body (BAP - body animation parameter) T p BDP đ nh ngh a t p thông s đ bi n đ i body m c đ nh thành body theo yêu c u khách hàng v i b m t body, kích th c body texture Các tham s đ ng body (BAP) cho phép t o chuy n đ ng v i mơ hình body khác Nh v y, có th l p t c nh n BAP t lu ng bit thu mà t o s linh ho t c a body Khi thu đ c, BDP đ c dùng đ bi n đ i body chung (body m t ng i chu n ch ng h n) thành body riêng bi t d a vào giá tr c a thông s B t c thành ph n c ng có th tr ng M t thành ph n tr ng có th đ c thay th b ng thành ph n m c đ nh t ng ng body đ c bi u hi n Các đ c m m c đ nh đ c xem nh đ c m chu n Các đ c m đ c đ nh ngh a nh sau: bàn chân ch đ n h ng phía tr c, hai cánh tay đ t hai bên c a body v i lòng bàn tay h ng vào body Các đ c m c ng ng m đ nh t t c BAP có giá tr m c đ nh Mơ hình body ng i có th h tr nh ng ng d ng khác t mô ph ng chuy n đ ng th c c a ng i đ n cơng ngh game s d ng mơ hình gi ng nh ng i 2.3.3.11.8 Scalability MPEG-4 cung c p ch đ phân c p ch t l ng t c th i c đ nh m c đ i t ng Trong c hai tr ng h p, k thu t đ c s d ng đ t o l p c s (base layer) t ng tr ng cho ch t l ng th p nh t t lu ng bit m t ho c nhi u l p t ng c ng (enhancement layer) Nh ng l p có th đ c t o b ng vi c mã hóa đ n gi n Ch t l ng hình nh có th đ c u ch nh th b ng hai cách khác N u b ng thông b gi i h n lu ng bit truy n s ch bao g m ch l p c s ho c l p c s m t vài l p t ng c ng b c th p M t cách khác t t c l p có th đ c truy n đ n b gi i mã, t i s quy t đ nh nh ng l p s đ c s d ng đ gi i mã N u thi t b hi n th có đ phân gi i th p ho c tài ngun tính tốn khơng đ l p t ng c ng có th b qua VOPs In Subtract Down Converter Up Converter Base Layer Encoder Base Layer Decoder Enhancement Layer Encoder Enhancement VOL Multiplexer Multiplexer output Base layer VOL Hình 2.3.26 B mã hóa phân c p ch t l ng MPEG-4 160 CuuDuongThanCong.com https://fb.com/tailieudientucntt Hình 2.3.26 mơ t s đ kh i c a b mã hóa th c hi n q trình phân c p ch t l ng v i m c c đ nh Các VOP ngõ vào đ c bi n đ i xu ng đ phân gi i th p mã hóa đ t o l p c s L p c s đ c đ a t i ngõ t i b t ng h p Multiplexer L p c s đ c gi i mã t i ch đ a t i b up-converted đ có đ phân gi i nh ngõ vào Tín hi u có đ phân gi i cao s đ c so sánh v i tín hi u ngõ vào t i b tr (Subtract), nh sai bi t đ u b tr đ c mã hóa riêng b mã hóa l p t ng c ng Chú ý r ng m i lu ng VOP sau mã hóa t o thành l p đ i t ng video L p c s s d ng c mã hóa Intra Inter l p t ng c ng ch s d ng mã hóa d đốn Vi c phân c p ch t l ng t m th i đ n gi n h n Lu ng bit đ n c a VOP đ c chia thành lu ng nh S VOP đ c yêu c u s đ c g i đ n b mã hóa l p c s , ph n cịn l i đ c g i đ n m t ho c nhi u b mã hóa t ng c ng QUa strình phân c p MPEG-4 có th đ c áp d ng riêng r đ i v i m i đ i t ng c s i u làm cho q trình mã hóa gi i mã tr o nên linh đ ng h n Ch ng h n m t b gi i mã h th ng game khơng có đ kh n ng đ gi i mã t t c đ i t ng t c đ cao nh t có th nên ch ch n gi i mã đ i v i c nh n n t c đ th p ch p nh n m c đ chuy n đ ng n n b gi t, đ ng th i gi i mã v i t c đ cao đ i v i đ i t ng c n nh làm cho chuy n đ ng c a chúng m n h n 2.3.3.11.9 Mã hóa m r ng (ACE: Advanced Coding Extension) Version c a MPEG-4 đ a ba công c m i đ c i thi n hi u su t mã hóa đ i v i đ i t ng video Bao g m: Bù chuy n đ ng toàn c c (GMC: global motion compensation), bù chuy n đ ng ph n t (quarter pel motion compensation) DCT hình dáng thích ng (shapeadative DCT) Các cơng c c i thi n hi u su t mã đ n h n 50% so v i version tùy theo l nh t c đ bit GMC cho phép mã hóa tồn b chuy n đ ng c a đ i t ng v i m t vài thông s c i thi n đ phân gi i c a vector chuy n đ ng b ng cách gi m sai s d đoán s d ng đ d Shape-adaptive DCT có th đ c dùng đ c i thi n hi u su t mã c a nh ng kh i đ ng biên không ph i t t c pixel đ u ph n t c a nh Thay s d ng DCT hai chi u 8x8 dùng kh i DCT m t chi u đ i v i hàng d c đ c tr c sau đ n hàng ngang ch xét nh ng pixel thu c đ i t ng, g i active pixel 2.3.3.12 Chu n H.261 Khuy n cáo H.261 c a CCITT chu n nén cho d ch v h i ngh truy n hình n tho i truy n hình qua m ng s d ch v tích h p ISDN t c đ n × 64Kbps Chu n có đ c tính quan tr ng ng ng tr mã hố t i đa 150ms tr phù h p v i truy n thông video hai chi u d a vào c m nh n c a ng i xem v hình nh ph n h i tr c ti p d dàng th c hi n m ch tích h p VLSI chi phí th p cho vi c th ng m i hoá s n ph m r ng rãi 2.3.3.13 Chu n H.263 H.263 chu n dành cho video t c đ th p 46 Kbps dùng ng d ng h i ngh t xa qua m ng PSTN Chu n có c đ c tính c a MPEG-1 MPEG-2 Mã hoá video c a H.263 d a chu n H.261 th c ch t phiên b n m r ng c a H.261 v i ph ng 161 CuuDuongThanCong.com https://fb.com/tailieudientucntt pháp mã hoá video k t h p DPCM/DCT C hai chu n đ u dùng k thu t nh DCT, bù chuy n đ ng, mã hoá chi u dài t mã thay đ i, l ng t hố vơ h ng x lý c p macroblock Duy ch có khái ni m v khung PB H.263 đ c bi t, tên PB có ngu n g c t P B, s k t h p c a P B ng d ng đánh giá kh n ng kinh t c a tiêu chu n nén B ng 2.3.7 t p h p ng d ng c a tiêu chu n nén nh d ng MJPEG có h n ch ng d ng Nó đ c dùng ch y u máy ghi hình b ng đ a (q trình mã hóa gi i mã m t đ n v ) 2.3.4 B ng 2.3.7 Các ng d ng c a tiêu chu n nén ng d ng Tiêu mã hóa chu n T c đ phân gi i c c đ i bit c c đ i Videophone H.261 176x144 64 ÷128 Kbps H i ngh truy n H.261 352x288 0.384 MPEG-2 720x576 DPCM 720x576 hình Truy n hình cáp Truy n hình Studio / s n xu t MPEG2(@4:2:2) HDTV / s n xu t MPEG-2 HDTV / truy n MPEG-2 Mbps 4…9 Mbps < 50 Mbps MPEG-2 MJPEG ÷1.554 720x576 < 50 Mbps 1920x1280 1920x1280 100 Mbps 20 Mbps d n Vi c đ i chu n MPEG-2 kh ng đ nh u th c a MPEG so v i MJPEG đáp ng đ c t khâu s n xu t đ n truy n d n phát sóng V i ti m n ng kinh t m nh vi c đ u t thi t b theo chu n MPEG cho t t c khâu truy n hình u không bàn cãi Nh ng kh n ng đ u t cho truy n hình Vi t Nam cịn h n ch , l i giai đo n nghiên c u th nghi m, vi c tìm gi i pháp thích h p đ m b o u ki n kinh t , ch t l ng hình nh phù h p cho t ng công đo n v n đ c n thi t Trong khâu phát sóng, chu n MPEG-2 MP@ML (4:2:0) s l a ch n t i u có nguyên nhân sâu s c có y u t khách quan Sâu s c ng i ta ph i ti t ki m t i đa d i thông c a đ ng truy n, t ng s l ng ch ng trình MPEG-2 MP@ML s d ng nh I, P, B nén v i h s nén r t cao, gi m v n t c c a dịng ch ng trình cịn r t th p đ phát qu ng bá t i máy thu Ví d c th , phát qua b phát đáp c a v tinh có d i thông 36 MHz, s d ng nén MPEG-2 ta truy n đ c 10÷12 ch ng trình Y u t khách quan m t ng i ch c m nh n v đ phân tích đ n m t ch ng m c đ N u truy n tín hi u có v n t c cao 162 CuuDuongThanCong.com https://fb.com/tailieudientucntt h n, m t ng i c ng ch c m nh n thêm không đáng bao mà s l ng ch ng trình ph i gi m đáng k i u đ ng ngh a v i hi u qu phát sóng th p Tóm l i, m c đích u tiên c a phát qu ng bá nén đ phát đ c nhi u ch ng trình Nh v y, v n đ ta quan tâm l a ch n chu n công đo n s n xu t h u k i v i nén c a máy ghi hình c n ph i ý gi ch t l ng tín hi u cịn đ cho gia cơng x lý studio Các ph ng pháp nén máy ghi hình s th c ch t x lý n i t i máy đ gi m v n t c dòng s ghi lên b ng v a đ th p nh m gi i quy t nhi u v n đ th c t i v i MPEG-2, có th s d ng MPEG-2 4:2:2P@ML khâu h u k V m t ch t l ng, n u s d ng máy ghi công ngh nén MPEG dùng m t lo i nh I c ng thu n l i cho vi c d ng in t ng đ ng M-JPEG Nh ng cách gi i quy t nh th ch a kinh t , h th ng m ch theo công ngh nén MPEG, m ch “d đoán bù chuy n đ ng” m ch ph c t p nh t có giá thành cao mà l i không s d ng (ch dùng m t nh I, không s d ng nh P B) Vì m c tiêu phát đ c nhi u ch ng trình nên phát qu ng bá s d ng nén MPEG-2 v i nhóm nh đ y đ I, P, B h s nén r t cao Qua phân tích trên, ta có th th y r ng chu n M-JPEG s d ng thi t b s n xu t ch ng trình ti n d ng cho s n xu t studio d ng h u k , làm k x o v i giá thành h th ng phù h p 163 CuuDuongThanCong.com https://fb.com/tailieudientucntt PH L C: CÁC TIÊU CHU N MÃ HỐ ÂM THANH VÀ HÌNH NH TRONG TRUY N THÔNG A PH NG TI N Các tiêu chu n c a ITU- T cho âm Các tiêu chu n ITU-T cho âm bao g m G.711 · G.722 · G.722.1 · G.722.2 · G.723 · G.723.1 · G.726 · G.728 · G.729 · G.729.1 · G.729a G.711 chu n ITU-T dùng cho tho i ch y u h th ng t ng đài, đ hành th c vào n m 1972 G.711 trình bày m u u ch xung m logarit cho tín hi u l y m u 8000 m u m t giây c phát b ng t n tho i, t n s Có hai gi i thu t đ c đ nh ngh a chu n này, gi i thu t µ-law dùng khu v c B c M , Nh t gi i thu t A-law dùng khu v c Châu Âu nh ng n c l i C hai gi i thu t u tính toán m logarit, nh ng gi i thu t A-law đ c thi t k đ c bi t cho m c đích th c hi n phép tính q trình tính tốn cho đ n gi n h n, chu n c ng đ nh ngh a m t chu i giá tr mã l p l i có m c cơng su t dB Hai gi i thu t µ-law đ c mã hóa d ng m u PCM n tính 14-bit A-Law 13-bit v i m u 8-bit Nh v y, b mã hóa G.711 s t o đ c lu ng d li u bit có t c đ 64kbit/giây v i t n s l y m u 8kHz G.722 chu n ITU-T dùng cho mã hóa ti ng nói b ng t n r ng ho t đ ng v i t c đ truy n 32-64 kbit/giây Công ngh mã hóa d a vi c phân chia b ng t n ADPCM G.722.1 cung c p đ c vi c nén d li u v i t t đ bit th p M t bi n th m i c a G722.1 G.722.2, đ c bi t d i tên AMR-WB (Adaptive Multirate Wideband), cho phép vi c nén v i t c đ th p h n n a, có th đáp ng t t v i ki u nén khác c ng nh thay đ i đ a hình m ng Trong tr ng h p sau, b ng thông đ c t đ ng b o t n có s ngh n m ch cao Khi vi c ngh n quay tr v m c bình th ng, ch đ t c đ bit cao h n m c nén th p h n đ c ph c h i Chu n G.722 d li u m u âm t i t c đ 16kHz, g p đôi t c đ x lý t i giao ti p tho i truy n th ng, k t qu ch t l ng tho i t t h n Chu n G.722.1, đ c bi t qua tên khác “Siren™”, m t chu n qu c t cho mã hóa âm b ng r ng t c đ 24 32 kbps (b ng thông tho i 50Hz-7kHz, t n s l y m u 16 ksps)t c đ 16kb/giây), s d ng h th ng h i ngh truy n hình đ c phê chu n vào 30 tháng 09 n m 1999 Chu n G.722.1 b nén d a s bi n đ i cho t i u hóa c âm tho i l n nh c ph c t p tính tốn t ng đ i th p đ i v i b nén ch t l ng cao, đ tr c a gi i thu t c a hai m đ u cu i 40ms Phiên b n G.722.1/Annex C, đ c phê chu n b i ITU-T vào 14 tháng 05 n m 2005, đ c bi t thông qua tên Siren14™, đ c phát tri n b i Polycom v i d ng không c n b n quy n truy n v i t n s 14kHz (32ksps) 164 CuuDuongThanCong.com https://fb.com/tailieudientucntt S l ng mã hóa âm b ng t n r ng ITU khơng đ c hi u xác Th c t , có ba lo i mã hóa c b n phân bi t, nh ng u có chung m t tên G.722 u tiên, G.722 mã hóa v i t n s 7kHz, s d ng ADPCM ho t đ ng v i t c đ truy n 48-64kbps M t phiên b n khác G.722.1 ho t đ ng v i t c đ d li u b ng m t n a nh ng có ch t l ng t t nh G.722 v i ph ng pháp mã hóa d a vào n n t ng chuy n đ i Và chu n G.722.2, ho t đ ng v i âm tho i b ng t n r ng v i t c đ bit truy n r t th p, s d ng gi i thu t CELPbased V v n đ b n quuy n, đ n th i m này, gi y đ ng ký b n quy n cho G.722 h t h n, hi n t i chu n đ c xem nh chu n mi n phí G.722.1 thu c b n quy n c a t p đoàn Polycom chu n G.722.2 cịn có tên AMR-WB, thu c quy n s h u c a t p đoàn VoiceAge G.722.2 (GSM AMR WB) Adaptive Multi Rate - WideBand hay AMR-WB m t chu n mã hóa ti ng nói đ c phát tri n sau AMR s d ng công ngh t ng t nh ACELP Mã cung c p ch t l ng âm tho i t v i b i s d ng b ng t n tho i r ng h n 50-7000 Hz so sánh v i mã âm tho i b ng h p hi n dùng r ng rãi POTS v i 300-3400Hz AMRWB đ c h th ng hóa thành G.722.2, m t chu n mã hóa âm tho i chu n ITU-T Các tr ng thái ho t đ ng c a M: AMR-WB ho t đ ng t ng t AMR v i nhi u t c đ bit khác g m: 6.60; 8.85; 12.65; 14.25; 15.85; 18.25; 19.85; 23.05 23.85 kbps Tín hi u truy n v i t c đ th p nh t cho ch t l ng tho i t t nh t ng v i môi tr ng không nhi u 12.65 kbps T c đ bit cao r t h u d ng mơi tr ng có nhi u tr ng h p tín hi u truy n âm nh c T c đ bit 6.60 8.85 cung c p chát l ng ch p nh n đ c so sánh v i mã hóa b ng t n h p AMR-WB đ c chu n hóa cho vi c s d ng t ng lai h th ng m ng nh UMTS Chu n cung c p ch t l ng tho i t t h n r t nhi u đ c ch n dùng cho nhi u m ng c h tr cho b ng r ng Tháng 10 n m 2006, ki m nghi m AMR-WB đ u tiên đ c th c hi n h th ng m ng th c T-Mobile Ericssion ph i h p t i c G.723 m t chu n ITU-T mã hóa âm tho i b ng t n r ng, chu n m r ng c a G.721 u ch xung sai phân t ng thích v i t c đ truy n 24 40 kbps cho ng d ng thi t b nhân m ch s , hi n G.723 đ c thay th b i chu n G.276, hi n t i chu n l i th i Chu n G.723.1 chu n mã hóa âm cho tho i v i tính n ng nén tho i khung 30 mili giây, chu k 7.5ms c ng đ c s d ng Nh c ho c âm tone nh DTMF ho c fax ton không th truy n tin c y v i chu n mã hóa này, m t s ph ng pháp khác nh u G.711 ho c ph ng pháp dãy b ng t n dùng đ truy n tín hi u Chu n G.723.1 ch y u dùng ng d ng Voice over IP (VoIP) yêu c u b ng thơng th p Nó tr thành chu n ITU-T vào n m 1995, u ph c t p c a gi i thu t yêu c u d i 16MIPS v i 2.2kByte v RAM 165 CuuDuongThanCong.com https://fb.com/tailieudientucntt Có hai t c đ bit mà G.723.1 có th ho t đ ng: o o 6.3 kbit/s (s d ng khung 24 byte), dùng gi i thu t MPC-MLQ (MOS 3.9) 5.3 kbit/s (s d ng khung 20 byte) dùng gi i thu t ACELP (MOS 3.62) G.726 chu n mã hóa ti ng nói ITU-T ADPCM truy n âm v i t c đ 16, 24, 32, 40 kbps Là chu n thay th cho c G.721 (ADPCM t c đ 32kbps) chu n G.723 (ADPCM v i t c đ 24 40 kbps) G.726 ho t đ ng v i t n s 16 kbps B n t c đ bit th ng s d ng cho chu n G.726 t ng ng v i kích th c c a m t m u theo th t 2-bits, 3-bits, 4-bits, 5-bits T c đ th ng dùng 32 kbps, b i t c đ b ng m t n a so v i chu n G.711, nh th làm gia t ng dung l ng c m ng lên 50% Thông th ng đ c dùng m ng n tho i qu c t c ng nh h th ng n tho i không dây DECT G.721 đ c gi i thi u l n đ u tiên vào n m 1984, chu n G.723 đ thi u vào n m 1988 C hai đ c g p chung thành chu n G.726 vào n m 1990 c gi i G.727 đ c gi i thi u th i m v i G.726, t c đ bít nh ng t i u h n cho môi tr ng PCME Packet Circuit Multiplex Equipment i u đ t đ c b ng cách nhúng b l ng t hóa bit vào b l ng t hóa bit, cho phép h y b bit có tr ng s nh nh t chu i bit truy n mà khơng có nh h ng x u đ n tín hi u âm tho i G.728 chu n ITU-T mã hóa âm tho i v i t c đ 16kbps Công ngh s d ng LDCELP, Low Delay Code Excited Linear Prediction tr c a mã ch m u ( 0.625 ms) D đốn n tính đ c th c hi n tính tốn v i b l c LPC ng c b c 50 Ngõ vào kích thích đ c t o đ đ m b o nh n đ c đ l i VQ Chu n đ c đ a vào n m 1992 d i d ng gi i thu t mã d u ch m đ ng N m 1994, b n dùng cho d u ch m t nh đ c phát hành G.728 có t c đ lên đ n 2400 bps ph c t p c a b ng mã 30 MIPS, v i yêu càu 2.2kByte v RAM G.729 m t gi i thu t nén d li u âm dùng cho tín hi u tho i, nén tín hi u âm v i khung 10 mili gi y Các tone nh c nh DTMF ho c fax không th truy n v i b mã hóa này, mà ph i s d ng G.711 ho c ph ng pháp ngo i b ng t n đ truy n tín hi u G.729 đa s dùng ng d ng Voice over IP (VoIP) v i yêu c u b ng t n th p Chu n G.729 ho t đ ng t c đ kbps, nh ng phiên b n m r ng có th ho t đ ng t i 6.4 kbps đ i v i môi tr ng truy n x u 11.8 kbps v i yêu c u ch t l ng tho i t t h n Trong th c t , ng i ta th ng dùng chu n G.729a, t ng t nh G.729 nh ng có đ tính toán đ n gi n h n, nhiên chu n l i không cho ch tl l ng tho i t t h n Phiên b n G.729b m t chu n có b n quy n, s d ng module VAD đ phát hi n tín hi u tho i hay phi tho i Nó c ng bao g m m t module DTX dùng đ quy t đ nh nâng c p thông s nhi u n n cho tín hi u phi tho i (các khung nhi u) Các khung đ c truy n đ th c hi n vi c nâng c p đ c g i khung SID M t b t o nhi u (CNG) c ng đ c tích h p chu n này, b i m t kênh truy n, n u vi c truy n b d ng l i lý tín hi u tín hi u phi tho i, site cịn l i s xem nh đ ng k t n i b đ t Vì th s d ng chu n c n ph i th n tr ng 166 CuuDuongThanCong.com https://fb.com/tailieudientucntt Nh ng n m g n đây, chu n G.729 đ c nghiên c u m r ng đ h tr cho tín hi u âm tho i b ng t n r ng mã hóa âm thành chu n G.729.1 B mã hóa G.729.1 đ c thi t k theo mơ hình phân c p, t c đ bit ch t l ng u hi u ch nh đ n gi n b ng cách th c c t gi m chu i bit truy n G.729.1 thêm ch c n ng b ng t n r ng so v i G.729 thông qua l p đ c nhúng vào L p đ u tiên G.729 (12kps) v n d ng b ng t n h p 14 kbps thêm vào ch t l ng b ng t n r ng thông qua vi c tái t o ph , s d ng đóng gói th i gian đóng gói t n s (có t c đ truy n c ng thêm 2kbps) Các l p khác ( ng v i t n b c kbps) thêm nhi u thông tin v n i dung c a ph t n s cao nh th làm gia t ng ch t l ng tín hi u Các mã đ c phát tri n b i s ph i h p c a t ch c: France Telecom, t p đoàn Mitsubishi Electric, t p đoàn Nippon Telegraph Telephone (NTT), Université de Sherbrooke Các tiêu chu n c a ITU- T cho hình nh Video Chu n H.261 chu n ITU mã hóa tín hi u video n m 1990 đ c đ a đ truy n h th ng đ ng dây ISDN v i t c đ d li u s nhân c a 64 kbps T c đ d li u c a gi i thu t mã hóa đ c đ a đ có th ho t đ ng đ c gi a 40 kbps Mbps Chu n h tr khung video CIF QCIF v i đ phân gi i 352x288 176x144 theo th t t ng ng (và 4:2:0 m u v i đ phân gi i màu 176x144 88x72 theo th t t ng ng) Chu n c ng xét đ n tình hu ng d phịng cho vi c truy n hình v i đ phân gi i 704x576 ( đ c hi u ch nh vào n m 1994) Chu n H.261 chu n mã hóa tín hi u video s đ u tiên đ c áp d ng th c t Vi c thi t k chu n H.261 m t n l c tiên phong, chu n mã hóa video tồn c u sau (MPEG-1, MPEG-2/H.262, H.263, c H.264) c ng ch y u d a chu n Ngoài ra, cac ph ng pháp đ c s d ng b i h i đ ng phát tri n H.261 (đ ng đ u Sakae Okubo) c ng tác phát tri n chu n v n đ c ng d ng công vi c chu n hóa chu n sau l nh v c Gi i thu t mã hóa s d ng m t hybrid c a s chuy n d ng c a c đốn hình nh n i t i mã hóa truy n khơng gian v i vi c l ng t vô h ng, phân hình theo ki u zig-zac mã hóa entropy 2.1 Chu n H.261 Quá trình c b n c a vi c thi t k đ c g i macroblock M i macroblock bao g m dãy 16x16 m u luma hay dãy m u chroma 8x8 dùng vi c l y m u 4:2:0 khơng gian màuYCbCr D đốn hình nh n i t i th c hi n la i b d th a t m th i, v i vector chuy n đ ng đ c dùng đ h tr cho vi c bù mã hóa cho vi c di đ ng Mã di chuy n s d ng chuy n đ i cosin r i r c 8x8 (DCT) dùng đ lo i b d th a thu c không gian, h s bi n đ i l ng t đ c phân hình theo ki u zig-zac mã hóa entropy (dùng mã RunLevel variable-length) đ lo i b d th a th ng kê Chu n H.261 th t s ch đ nh rõ b ng cách đ gi i mã video Các nhà thi t k b mã hóa đ c t vi c đ a gi i thu t mã hóa c a riêng h , c v i tín hi u ngõ b mã hóa khơng đ c t nhiên nh m m c đích có th đ c gi i mã b ng b t k b gi i mã mi n đ c thi t k theo chu n Các b mã hóa c ng đ c thi t k tu ý 167 CuuDuongThanCong.com https://fb.com/tailieudientucntt nh m th c hi n trình ti n x lý mà chúng mu n ngõ vào video u tiên m c đ nh th c hi n M t k thu t hi u qu v n đ h u x lý tr thành ph n t y u c a h th ng t t nh t d a chu n H.261 l c gi i khóa Nó th c hi n vi c gi m s xu t hi n c a v t nhân t o nhi u có d ng hình kh i gây b i vi c bù di đ ng theo d ng kh i ph n chuy n đ i vi c thi t k t o Vi c l c gi i khóa tr thành m t ph n tích h p h u h t chu n hi n nay, H.264 (ngay c s d ng chu n H.264, vi c h u x lý v n cho phép th c h ên có th cho đ c ch t l ng cao) Vi c l c đ c đ c p vi c chu n hóa có nh h ng đ n vi c c i ti n quan tr ng gi a kh n ng nén thi t k H.261 Tuy nhiê, H.261 v n đ nh h ng l ch s lãnh v c phát tri n c a mã hóa video 2.2 Chu n H.262 Chu n H.262 m t chu n mã hóa video s ITU-T Chu n liên quan đ n ph n video c a chu n ISO/IEC MPEG-2 (đ c bi t d i tên ISO/IEC 13818-2) Chu n đ c phát tri n s h p tác c a ITU-T t ch c ISO/IEC JTC 1, tr thành chu n chung cho c hai t ch c ITU-T Recommendation H.262 ISO/IEC 13818-2 đ c phát tri n phát hành d i d ng chu n qu c t Hai tài li u mô t h u h t t t c khía c nh c a chu n 2.3 Chu n H263 Chu n H.263 chu n mã hóa ITU-T thi t k vào n m 1995/1996 dùng cho gi i pháp mã hóa nén t c đ truy n th p cho d ch v h i ngh truy n hình Mã đ u tiên đ c thi t k h th ng H.324 (PSTN ho c m ch chuy n m ch m ch khác truy n d ch v h i ngh truy n hình n tho i truy n hình), c ng nh h th gn dùng mã H.323 (h i ngh truy n hình RTP/IP-based), H.320 (h i ngh truy n hình ISDN-based), RTSP (ph ng ti n truy n thông d ng streaming) SIP (h i ngh Internet) H u h t n i dung Flash Video( dùng site nh YouTube, Google Video, MySpace, v.v….) đ c mã hóa d i d ng đ nh d ng này, v n có site s d ng mã hóa VP6, h tr phiên b n Flash Tín hi u video H.263 có th đ c gi i mã b ng th vi n phi b n quy n LGPL-licensed dùng ch ng trình nh ffdshow, VLC media player MPlayer Chu n H.263 đ c phát tri n nh m t phiên b n nâng c p d a chu n H.261, chu n MPEG-1, MPEG-2 Phiên b n đ u tiên đ c hoàn thành vào n m 1995 hoàn toàn phù h p vi c thay th cho H.261 v i t t c t c đ truy n Hi n t i có phiên b n H.263v2 (còn g i chu n H.263+ 1998) chu n H.263v3 (H.263++ 2000) Chu n mã hóa đ c ITU-T sau H.263 H.264, cịn có tên AVC MPEG-4 ph n th 10 H u h t s n ph m h i ngh truy n hình cơng ngh m i hi n ln tích h p c ba chu n H.264, H.263 H.261 2.4 Chu n H264 168 CuuDuongThanCong.com https://fb.com/tailieudientucntt Chu n H.264, MPEG-4 Part 10, hay AVC (dùng cho Advanced Video Coding), m t chu n mã hóa video s v i đ nén c c cao, k t qu c a ITU-T Video Coding Experts Group (VCEG) k t h p v i ISO/IEC Moving Picture Experts Group (MPEG), đ c xem s n ph m th ng m i Joint Video Team (JVT) Chu n ITU-T H.264 ISO/IEC MPEG4 Part 10(ISO/IEC 14496-10) ng d ng công ngh lý t ng Phiên b n nháp đ u tiên đ c hoàn thành vào tháng 05 n m 2003 Chu n H.264 đ c đ t tên theo dòng ITU-T H.26x c a chu n video, tên AVC đ c đ t tên d a theo tên d án h p tác, v i tên c a d án H.26L Chu n đ c g i b ng tên khác H.264/AVC, AVC/H.264, H.264/MPEG-4 AVC, MPEG-4/H.264 AVC nh m nh n m nh tính k th a khi, cịn đ c g i “mã hóa JVT” v i lý t ch c JVT phát tri n M c đích c a d án H.264/AVC t o m t chu n có kh n ng cung c p tín hi u video ch t l ng cao v i t c đ bit truy n th p, nh h n hay b ng m t n a so v i t c đ c a chu n tr c ( nh MPEG-2, H.263, hay MPEG-4 Part 2) v i tính ng d ng cao th c t Ngoài ra, chu n ph i đáp ng yêu c u cung c p cách th c linh đ ng cho phép chu n đ c ng d ng r ng rãi nhi u trình ng d ng ( ví d cho c t c đ bit cao th yp ho c đ phân gi i cao ho c th p, ch y n đ nh nhi u h th ng c ng nh m ng ( cho vi c broadcast, l u tr DVD, m ng gói RTP/IP, h th ng t ng đài ph ng ti n ITU-T) 2.5 Chu n JVT Chu n JVT hoàn thành vi c nâng c p, phát tri n m t s tính n ng m r ng so v i chu n nguyên thu , đ c bi t d i tên Fidelity Range Extensions (FRExt) Các phiên b n m r ng h tr mã hóa video v i đ trung th c cao b ng cách th c gia t ng đ xác l y m u (bao g m mã hóa 10-bit 12-bit) v i thông tin màu đ phân g i cao (g m c u trúc l y m u nh YUV 4:2:2 YUV 4:4:4) M t s tính n ng khác d án Fidelity Range Extensions ( nh phép bi n đ i s nguyên chuy n m ch t ng thích 4×4 8×8, ma tr n tr ng s l ng t hóa d a giác quan, mã hóa khơng m t mát hình n i t i hi u qu , h tr không gian màu c ng thêm phép bi n đ i màu s d ) Công vi c thi t k d án đ c hoàn thành vào tháng n m 2004 phiên b n nháp đ c m t vào tháng 09 n m 2004 169 CuuDuongThanCong.com https://fb.com/tailieudientucntt TÀI LI U THAM KH O Anil K Jain, Fundamentals of Digital Image Processing, Prentice Hall, 1988 J R Parker, Algorithms for Image Processing and Computer Vision, Wiley, 1996 Alan C Bovik , Handbook of Image and Video Processing, Academic Press, 2000 John R Deller, John H L Hansen, John G Proakis, Discrete-Time Processing of Speech Signals, Wiley-IEEE Press, 1999 R C Gonzalez, R E Woods, Steven L Eddins, Digital Image Processing Using MATLAB, Prentice Hall, 2003 R C Gonzalez, R E Woods Digital Image Processing , Prentice Hall, 2002 William K Pratt, Digital Image Processing: PIKS Inside, Third Edition © 2001 John Wiley & Sons, Inc Michael Robin & Michel Poulin, Digital Television Fundamental, McCraw-Hill Companies Inc 10 Hoàng Ti n, D ng Thanh Ph h c k thu t, 2004 ng Truy n hình k thu t s NXB Khoa 11 L ng M nh Bá, Nguy n Thanh Th y, Nh p môn x lý nh s , NXB Khoa h c k thu t, 1999 170 CuuDuongThanCong.com https://fb.com/tailieudientucntt M CL C L I NÓI CH U NG K THU T X 1.1 T NG QUAN V X LÝ ÂM THANH LÝ ÂM THANH 1.1.1 Gi i thi u s l c v âm & h th ng x lý âm 1.1.2 Nh c l i m t s khái ni m toán h c x lý âm 1.2 MƠ HÌNH X 10 LÝ ÂM THANH 13 1.2.1 Các mô hình l y m u mã hố tho i 1.2.2 Các mơ hình dùng x lý âm 1.2.3 Mơ hình th i gian r i r c 13 19 27 1.3 LÝ THUY T VÀ CÁC BÀI TỐN C B N 1.3.1 Phân tích d đốn n tính 1.3.2 D đốn n tính x lý tho i 1.4 PHÂN TÍCH CH T L NG X LÝ THO I 1.4.1 Các ph ng pháp mã hoá 1.4.2 Các tham s liên quan đ n ch t l ng tho i 1.4.3 Các ph ng pháp đánh giá ch t l ng tho i c b n 1.5 MƠ HÌNH NG D NG X LÝ THO I 1.5.1 Mơ hình th i gian đ ng 1.5.2 Mơ hình chu i markov n 1.5.3 M ng n ron CH NG 2: K THU T X 2.1 T NG QUAN V X 30 36 40 40 41 41 48 48 53 55 LÝ NH 60 LÝ NH VÀ VIDEO S 2.1.1 Khái ni m c b n v x lý nh 2.1.2 L nh v c ng d ng k thu t x lý nh 2.1.3 Các giai đo n x lý nh 2.1.4 Các ph n t c a h th ng x lý nh s 2.1.5 Bi u di n nh s 2.1.6 Lý thuy t toán ng d ng x lý nh video s 2.2 PHÂN TÍCH CÁC K THU T X 30 LÝ NH VÀ VIDEO 2.2.1 Khái ni m v quan h gi a m nh 2.2.2 Các ph ng pháp xác đ nhvà d đóan biên nh 2.3 CÁC K THU T NÉN NH 60 60 61 62 64 67 92 106 106 109 115 2.3.1 Gi i thi u chung v k thu t nén nh 2.3.2 Ph ng pháp nén nh JPEG 2.3.3 Chu n nén MPEG 2.3.4 ng d ng đánh giá kh n ng kinh t c a tiêu chu n nén 115 121 140 162 PH L C: GI I THI U CÁC TIÊU CHU N MÃ HÓA ÂM THANH VÀ HÌNH NH TRONG TRUY N THƠNG A PH NG TI N 164 171 CuuDuongThanCong.com https://fb.com/tailieudientucntt Các tiêu chu n c a ITU- T cho âm 164 Các tiêu chu n c a ITU- T cho hình nh Video 167 TÀI LI U THAM KH O 170 172 CuuDuongThanCong.com https://fb.com/tailieudientucntt X LÝ ÂM THANH, HÌNH Mã s : 411XAH450 Ch u trách nhi m b n th o TRUNG TÂM ÐÀO T O B U CHÍNH VI N THƠNG CuuDuongThanCong.com https://fb.com/tailieudientucntt NH ... CuuDuongThanCong. com https://fb .com/ tailieudientucntt CuuDuongThanCong. com https://fb .com/ tailieudientucntt CH NG 1.1 T NG QUAN V X 1.1.1 Gi i thi u s l 1.1.1.1 K THU T X LÝ ÂM THANH LÝ ÂM THANH c v âm & h th... C VI N CƠNG NGH B U CHÍNH VI N THƠNG X LÝ ÂM THANH, HÌNH Biên so n : NH TS NGUY N THANH BÌNH THS VÕ NGUY N QU C B O CuuDuongThanCong. com https://fb .com/ tailieudientucntt L I NÓI U Tài li u h ng... c nh t quán 43 CuuDuongThanCong. com https://fb .com/ tailieudientucntt Ph ng th c r t t n kém, đòi h i nhi u ng i tham gia thi t l p ph c t p Khi c n th c hi n đo th ng xuyên tham s ch t l đánh