Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 13 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
13
Dung lượng
1,2 MB
Nội dung
Chương a.Khái niệm Thuật ngữ đa phương tiện dùng để thơng tin liệu, tiếng nói, đồ họa, hình ảnh tĩnh, âm phim ảnh mạng truyền thời điểm b ví dụ: văn bản, đồ họa , hình ảnh, âm / âm , hình ảnh động / video lĩnh vực khác quảng cáo, nghệ thuật , giáo dục, giải trí , kỹ thuật, y học, tốn học , kinh doanh , nghiên cứu khoa học… 1.Multimedia and Hypermedia(đa phương tiện siêu phương tiện) a.Lịch sử - Newspaper: perhaps the first mass communication medium, uses text, graphics, and images.(Báo : có lẽ phương tiện thơng tin đại chúng đầu tiên) - Motion pictures: conceived of in 1830’s in order to observe motion too rapid for perception by the human eye (Hình ảnh chuyển động : 1830) - Wireless radio transmission: (truyền phát thanh) Guglielmo Marconi, at Pontecchio, Italy, in 1895 - Television: the new medium for the 20th century, established video as a commonly available medium and has since changed the world of mass communications.(Truyền hình: phương tiện cho kỷ 20) - 1945 – Vannevar Bush wrote a landmark article describing what amounts to a hypermedia system called Memex.(1945-Vannevar Bush viết hệ thống hypermedia gọi Memex.) - 1960 – Ted Nelson coined the term hypertext (1960-Ted Nelson đặt thuật ngữ siêu văn bản) - 1968 – Douglas Engelbart demonstrated the On-Line System (NLS), another very early hypertext program (1968-Douglas Engelbart chứng minh On-Line Hệ thống (NLS), chương trình siêu văn sớm) - 1969 – Nelson and van Dam at Brown University created an early hypertext editor called FRESS (1969-Nelson van Dam Đại học Brown tạo siêu văn đầu biên tập gọi FRESS) - 1976 – The MIT Architecture Machine Group proposed a project entitled Multiple Media – resulted in the Aspen Movie Map, the first hypermedia videodisk, in 1978 - 1985 – Negroponte and Wiesner co-founded the MIT Media Lab.(1985-Negroponte Wiesner đồng sáng lập phng thí nghiệm phương tiện truyền thơng MIT.) - 1989 – Tim Berners-Lee proposed the World Wide Web (1989-Tim Berners-Lee đề nghị World Wide Web) - 1991 – MPEG-1 was approved as an international standard for digital video – led to the newer standards, MPEG-2, MPEG-4, and further MPEGs in the 1990s.(1991-MPEG-1 thông qua tiêu chuẩn quốc tế cho video kỹ thuật số) - 1991 – The introduction of PDAs in 1991 began a new period in the use of computers in multimedia ( 1991-Sự đời PDA năm 1991 bắt đầu giai đoạn việc sử dụng máy tính đa phương tiện.) - 1992 – JPEG was accepted as the international standard for digital image compression – led to the new JPEG2000 standard (1992-JPEG chấp nhận tiêu chuẩn quốc tế cho nén ảnh kỹ thuật số-đă dẫn đến tiêu chuẩn JPEG2000 mới.) - 1995 – The JAVA language was created for platformindependent application development.( 1995-Ngôn ngữ JAVA tạo cho phát triển ứng dụng tảng độc lập.) - 1996 – DVD video was introduced; high quality fulllength movies were distributed on a single disk ( 1996-DVD video đă giới thiệu; chất lượng cao đầy đủ độ dài phim phân phối đĩa nhất.) - 1998 – XML 1.0 was announced as a W3C Recommendation (1998XML 1.0 đă công bố đề nghị W3C.) - 2000 – WWW size was estimated at over billion pages (2000-WWW kích thước ước tính khoảng tỷ trang.) a.Hệ thống siêu văn - A hypertext system (hệ thống siêu văn bản): meant to be read nonlinearly, by following links that point to other parts of the document, or to other documents (có nghĩa để đọc phi tuyến , cách làm theo liên kết trỏ đến phần khác tài liệu , tài liệu khác) - Hypermedia: not constrained to be text-based, can include other media, e.g., graphics, images, and especially the continuous media – sound and video The World Wide Web (WWW) – the best example of a hypermedia application (World Wide Web (WWW) ví dụ tốt ứng dụng hypermedia) - Hypermedia is also considered as one of multimedia applications (Hypermedia coi ứng dụng đa phương tiện) a.WWW: - The W3C has listed the following goals for the WWW: (W3c liệt kê mục tiêu sau cho WWW) a.Universal access of web resources (by everyone everywhere) Tiếp cận phổ cập nguồn tài nguyên web ( tất người khắp nơi) a.Effectiveness of navigating available information (Hiệu điều hướng thông tin) a.Responsible use of posted material (Sử dụng có trách nhiệm tài liệu đăng) - History of WWW: a.1960s- Charles Goldfarb et al developed the Generalized Markup Language (GML) for IBM : năm 1960 - Charles Goldfarb et al phát triển ngôn ngữ đánh dấu tổng quát (GML) cho IBM a.1986 – The ISO released a final version of the Standard Generalized Markup Language (SGML) 1986-Các tiêu chuẩn ISO phát hành phiên cuối tiêu chuẩn tổng quát đánh dấu ngôn ngữ (SGML) a.1990 – Tim Berners-Lee invented the HyperText Markup Language (HTML), and the HyperText Transfer Protocol (HTTP) 1990-Tim Berners-Lee đă phát minh ngôn ngữ đánh dấu siêu văn (HTML), HyperText Transfer Protocol (HTTP) a.Hypertext markup language (HTML)Ngôn ngữ đánh dấu siêu văn bản: - HTML: a language for publishing Hypermedia on the World Wide Web – defined using SGML:( ngôn ngữ để ban bố siêu văn WWW ) - HTML uses ASCII, it is portable to all different (possibly binary incompatible) computer hardware The current version of HTML is version 4.01 (5.0) HTML sử dụng ASCII) - The next generation of HTML is XHTML – a reformulation of HTML using XML Thế hệ HTML XHTMLmột hình luận HTML cách sử dụng XML - HTML uses tags to describe document elements: (sử dụng thẻ để mô tả yếu tố tài liệu) + : defining a starting point (xác định điểm khởi đầu) + < /token>: the ending point of the element.( Điểm kết thúc phần tử) + Some elements have no ending tags.(1 số phần tử k có thẻ kết thúc) - Naturally, HTML has more complex structures and can be mixed in with other standards (Đương nhiên, HTML có cấu trúc phức tạp trộn lẫn với tiêu chuẩn khác.) Chương 1.Introduction (giới thiệu) Speech signal is complicated: ( tín hiệu tiếng nói phức hợp của: ) - Noise + periodic segments ( nhiễu+ tín hiệu tuần hồn) - Nonlinear(phi tuyến-k tuyến tính) - Time variant (biến đổi theo thời gian) Bộ máy phát âm - Bộ máy phát âm bao gồm thành phần riêng rẽ phổi, khí quản, quản, đường dẫn miệng, mũi - Trong đó: + Thanh quản chứa đơi dây dao động tạo cộng hưởng cần thiết để tạo âm + Tuyến âm ống không môi, kết thúc dây thanh quản + Khoang mũi ống không môi, kết thúc vòm miệng, có độ dài cố định khoảng 12cm người lớn + Vòm miệng nếp chuyển động Cơ chế phát âm + Trong trình tạo âm khơng phải âm mũi, vòm miệng mở, khoang mũi đóng lại, dòng khí qua khoang miệng + Khi phát âm mũi, vòm miệng hạ thấp dòng khí qua khoang mũi + Tuyến âm kích thích (excitation) nguồn lượng mơn Tiếng nói tạo tín hiệu nguồn từ mơn phát ra, đẩy khơng khí có phổi lên tạo thành dòng khí, va chạm vào hai dây tuyến âm Hai dây dao động tạo cộng hưởng, dao động âm lan truyền theo tuyến âm (tính từ mơn đến khoang miệng) sau qua khoang mũi, mơi, tạo tiếng nói + Tín hiệu tiếng nói hình thành thơng qua yếu tố: - Excitation - Signal shaping Excitation(kích thích) + Voiced(hữu thanh) excitation by its periodicity( tính chu kì), + Voiceless(vô thanh) excitation by its noise-like waveform, + Transient(nhất thời) excitation by a certain sequence in the temporal course Signal shaping (dạng tín hiệu) + A speech sound is not only determined by the excitation signal, but also strongly by the "forming" of the air stream in the vocal tract The most important components are the lips and tongue ( Tiếng nói k đc định tín hiệu kích thích mà chịu tác động mạnh mẽ khn dạng dòng khơng khí di chuyển máy phát âm Bộ phận quan trọng môi lưỡi.) + The components in the vocal tract contributing(đóng góp) substantially(cơ bản) to the timbre (âm sắc) of the speech signal are: ( Những phận máy phát âm mà ảnh hưởng tới âm sắc tín hiệu tiếng nói là) lưỡi) - tongue position(vị trí - lip position.(vị trí mơi) sentation of speech signal(biểu diễn tín hiệu tiếng nói) + Speech signal is continuous Presentation of the speech signal digitally in order to maintain the characteristics of signal is very important ( tín hiệu tiếng nói liên tục Vì việc biểu diễn tín hiệu tiếng nói dạng số hóa phải giữ nguyên đặc trưng tín hiệu quan trọng) + Speech signal needs presenting in discrete form following three required steps: có bước để biểu diễn tín hiệu âm theo dạng rời rạc - Sampling: lấy mẫu - Quantizing: lượng tử hóa - Compressing: nén + Sampling: in order to recover the signal without loosing information, sampling rate f0 ≥2Fmax (Shannon theorem) (for example: telephone – 8kHz, music and voice – 48kHz): (để tái tạo lại tín hiệu mà k bị hết thơng tin ta có tỉ lệ lấy mẫu theo định lí Shanon fo>= 2Fmax Vd điện thoại 8kHz, nhạc & viddeo 48kHz) + Quantizing: Each sample needs to be quantized for efficient processing and transmission This will produce white noise.( mẫu cần đc lượng tử hóa để nén truyền đc hiệu Nó gây nên nhiễu trắng) + Compressing: When transmitted, the speech signal contains a huge ‘redundancy’ Hence, the signal normally is compressed with a compression technique to have a compact signal for delivery ( truyền tín hiệu tiếng nói chứa phần dư thừa lớn.do thường đc nén với kĩ thuật nén để tín hiệu gọn để chuyển đi) Speech signal coding(mã hóa tín hiệu tiếng nói) + Two types of speech coding: direct coding and parametric coding.(2 loại) + Direct coding: PCM, + Parametric coding: LPC, MPLPC, LSF Đặc điểm tín hiệu tiếng nói : + Âm hữu - Âm hữu tạo từ dây bị căng đồng thời chúng rung động chế độ dãn khơng khí tăng lên làm mơn mở sau mơn xẹp xuống khơng khí chạy qua - Do cộng hưởng dây thanh, sóng âm tạo có dạng tuần hồn gần tuần hồn Phổ âm hữu có nhiều thành phần hài giá trị bội số tần số cộng hưởng, gọi tần số (pitch) + Âm vô - Khi tạo âm vô dây khơng cộng hưởng Âm vơ có hai loại âm xát âm tắc - Âm xát (ví dụ âm s) tạo có co thắt vài điểm tuyến âm Khơng khí qua điểm co thắt trở nên chuyển động hỗn loạn tạo nên kích thích giống nhiễu ngẫu nhiên Thông thường điểm co thắt xảy gần miệng nên cộng hưởng tuyến âm ảnh hưởng đến đặc tính âm xát tạo - Âm tắc (ví dụ âm p) tạo tuyến âm đóng số điểm làm cho áp suất khơng khí tăng lên sau giải phóng đột ngột Sự giải phóng đột ngột tạo kích thích thời tuyến âm Sự kích thích xảy với cộng hưởng không cộng hưởng dây tương ứng với âm tắc hữu vô + Nguyên âm Nguyên âm âm hữu tạo cộng hưởng dây dòng khí mơn đẩy lên Khoang miệng tạo lập thành nhiều hình dạng định tạo thành nguyên âm khác Số lượng nguyên âm phụ thuộc vào ngôn ngữ định - Phụ âm Phụ âm tạo dòng khí hỗn loạn phát gần điểm co thắt đường dẫn âm cách phát âm tạo thành Phụ âm có đặc tính hữu hay vơ tuỳ thuộc vào việc dây có dao động để tạo nên cộng hưởng khơng Dòng khơng khí chỗ đóng vòm miệng tạo phụ âm tắc Phụ âm xát phát từ chỗ co thắt lớn Các âm tắc tạo từ khoảng + Hàm lượng ngắn hạn W ( n ) W ( n) = 0 - Hàm lượng ngắn hạn tiếng nói tính cách chia tín hiệu tiếng nói thành nhiều khung, khung chứa N mẫu Các khung đưa qua cửa sổ có dạng hàm sau: - Hàm lượng ngắn mẫu thứ m tính theo công thức sau: N −1 Em = ∑ { x ( n + m ) ∗ W ( n ) } n =0 - Thơng thường có ba dạng cửa sổ sử dụng cửa sổ Hamming, cửa sổ Hanning cửa sổ chữ nhật Hàm lượng ngắn hạn âm hữu thường lớn so với âm vô - Tần số - Dạng sóng tiếng nói gồm hai phần: Phần gần giống nhiễu (trong biên độ biến đổi ngẫu nhiên) phần có tính chu kỳ (trong tín hiệu lặp lại gần tuần hồn) Phần tín hiệu có tính chu kỳ chứa thành phần tần số có dạng điều hòa Tần số thấp tần số tần số dao động dây Giá trị tần số 80 – 200 Hz 150 – 450 Hz 200 – 600 Hz + Formant - Với phổ tín hiệu tiếng nói, đỉnh có biên độ lớn xét khoảng (cực đại cục bộ) tương ứng với formant Ngoài tần số, formant xác định biên độ dải thơng chúng Về mặt vật lý formant tương ứng với tần số cộng hưởng tuyến âm - Tần số formant biến đổi khoảng rộng phụ thuộc vào giới tính người nói phụ thuộc vào dạng âm vị tương ứng với formant 2.Speech signal analysis( phân tích tín hiệu tiếng nói) Bộ lọc nguồn + Tuyến âm người lọc phi tuyến phụ thuộc thời gian (tham số thay đổi theo thời gian) phức tạp kích thích nhiều nguồn lượng khác Mơ hình thực cho tính chất âm học vơ phức tạp + Để tạo mơ hình đơn giản hóa sau - Tuyến âm biểu diễn lọc tuyến tính khơng mát với đầu vào - Nguồn kích thích dãy xung tuần hoàn + Khi dùng cho tổng hợp, tham số lọc cập nhật theo chu kỳ khoảng10 ms + Khi dùng cho phân tích, tín hiệu tiếng nói phân chia thành khung độ dài khoảng 10-25 ms Với khung, tập tham số lọc xác định cách tối thiểu khác biệt tiếng nói tạo mơ hình tiếng nói thực Mơ hình tồn cực Là mơ hình lọc–nguồn tuyến âm biểu diễn lọc số phụ thuộc thời gian có đáp ứng tần số là: H ( z) = S ( z) = U ( z) G p − ∑ a k z − k k =1 p s( n ) = ∑ ak s( n − k ) + G.u ( n ) k =1 H ệ thống kích thích dãy xung tiếng nói hữu hay dãy nhiễu ngẫu nhiên tiếng nói vơ Tần số tham số hữu thanh/ vơ xác định sử dụng phân tích tiên đốn tuyến tính Các mẫu tiếng Liên tục r ( x) = ∞ ∫ g (u)h( x + u )du −∞ r(k) = ∞ ∑ g(m).h(m + k) m = -∞ rạc Rời Phương pháp tổng hợp tiếng nói Được chia làm nhóm: - Tổng hợp mơ máy phát âm: Mơ lại q trình xử lý vật lý máy phát âm người cách trực tiếp - Tổng hợp Formant: Mô tần số điểm cực tín hiệu tiếng nói hàm truyền đạt tuyến âm dựa mơ hình lọcnguồn - Tổng hợp trực tiếp: Sử dụng mẫu tiếng nói ghi âm có chiều dài khác từ tiếng nói tự nhiên Phương pháp tổng hợp LP (mã hóa tổng hợp LP Presentation) nhiễu, phụ thuộc vào tiếng nói hữu hay vơ - Các đặc tính lọc nguồn kích thích tĩnh (không biến đổi) chu kỳ khoảng 10 ms nói s(n) có cách sử dụng phương trình: Chương Digitalization of Sound (Số lượng âm thanh) + Sound is a wave phenomenon like light, and involves molecules of air being compressed and expanded under the action of some physical device.( Âm tượng sóng ánh sáng, bao gồm phân tử khơng khí nén mở rộng tác động số thiết bị vật lý.) + For example, a speaker in an audio system vibrates back and forth and produces a longitudinal pressure wave that we perceive as sound Since sound is a pressure wave, it takes on continuous values, as opposed to digitized ones.( Ví dụ, người nói hệ thống âm tạo sóng dọc mà nhận thức Nó có giá trị liên tục, trái ngược với số hóa.) + Even though such pressure waves are longitudinal, they still have ordinary wave thông với mật độ khác nhau)và nhiễu xạ (uốn cong xung quanh chướng ngại vật) + If we wish to use a digital version of sound waves we must form digitized representations of audio information.( Nếu muốn sử dụng số sóng âm thanh, phải tạo thành đại diện số hóa âm thơng tin.) Digitization.(số hóa) + Digitization means conversion to a stream of numbers, and preferably these numbers should be integers for efficiency.( Số hóa có nghĩa chuyển đổi tương tự sang số, số nên số nguyên cho hiệu quả.) Sampling and Quantization (lấy mẫu lượng tử hóa) + The graph in the above figure has to be made digital in both time and amplitude To digitize, the signal must be sampled in each dimension:in time, and in amplitude.( Để số hoá, tín hiệu phải lấy mẫu kích thước: thời Hàm tương quan: Hàm tương quan dùng để khảo sát tính tương quan hai hàm cách so sánh chồng hai hàm lên với hai hàm dịch sang trái hay sang phải called the sampling frequency ( Tỷ lệ mà thực gọi làtần số lấy mẫu.) + For audio, typical sampling rates are from kHz (8,000 samples per second) to 48 kHz This range is determined by Nyquist theorem (discussed later) (Đối với âm thanh, tỷ lệ điển hình mẫu từ kHz (8.000 mẫu / giây) đến 48 kHz Phạm vi xác định theo định lý Nyquist (được thảo luận sau này) + Sampling in the amplitude or voltage dimension is called quantization (Lấy mẫu kích thước biên độ điện áp gọi lượng tử hóa.) Nyquist Theorem (Định lí Nyquist:) + Frequency is an absolute measure, pitch is generally relative – a perceptual subjective quality of sound - Pitch and frequency are linked by setting the note A4 exactly 440 Hz - An octave above that note takes us to another A note An properties and behaviors, such as reflection (bouncing), refraction (change of angle when entering a medium with a different density) and diffraction (bending around an obstacle).( Ngay sóng dọc, có tính chất sóng thơng thường, chẳng hạn (nảy) phản xạ, khúc xạ (thay đổi góc gặp phương tiện truyền gian, biên độ.) + Sampling means measuring the quantity we are interested in, usually at evenly-spaced intervals (Lấy mẫu q trình rời rạc hóa tín hiệu theo thời gian) + The first kind of sampling, using measurements only at evenly spaced time intervals, is simply called, sampling The rate at which it is performed is - If we allow non-integer multiples of the base frequency, we allow non-“A” notes and have a more complex resulting sound + The Nyquist theorem states how frequently we must sample in time to be able to recover the original sound For correct sampling we must use a sampling rate equal to at least twice the maximum frequency content in the signal This rate is called the Nyquist rate Tỷ lệ gọi tỷ lệ Nyquist + Nyquist Theorem: If a signal is band-limited, i.e., there is a lower limit f1 and an upper limit f2 of frequency components in the signal, then the sampling rate should be at least 2(f2 − f1) + Nyquist frequency: half of the Nyquist rate Since it would be impossible to recover frequencies higher than Nyquist frequency in any event, most systems have an anti-aliasing filter that restricts the frequency content in the input to the sampler to a range at or below + The ratio of the power of the correct signal and the noise is called the signal to noise ratio (SNR) – a measure of the quality of the signal + The SNR is usually measured in decibels (dB), where dB is a tenth of a bel The SNR value, in units of dB, is defined in terms of base-10 logarithms of squared voltages, as follows: For example, if the signal voltage VSignal is 10 times the noise, then the SNR is 20 log10(10) = 20dB octave corresponds to doubling the frequency Thus with the middle “A” on a piano (“A4” or “A440”) set to 440 Hz, the next “A” up is at 880 Hz, or one octave above - Harmonics: any series of musical tones whose frequencies are integral multiples of the frequency of a fundamental tone Nyquist frequency Tần số Nyquist… Signal to Noise Ratio.( tỉ lệ tín hiệu nhiễu) Chương Lossless Compression Techniques (Kĩ thuật nén không liệu) 1.Introduction Compression: the process of coding that will effectively reduce the total number of bits needed to represent certain information (Nén: trình mã hóa mà có hiệu làm giảm tổng số bit cần thiết để đại diện cho số thông tin.) compression ratio = B0 − number of bits before compression B1 − number of bits after compression 2.Run-Length Coding Rationale for RLC: if the information source has the property that symbols tend to form continuous groups, then such symbol and the length of the group can be coded Run-length encoding (RLE) is a very simple form of data compression in which runs of data (that is, sequences in which the same data value occurs in many consecutive Nguyên lý: - Tối ưu hoá mã cách thay chuỗi ký tự giống liên tiếp - Ứng dụng loại ảnh BMP, TIFF Các điểm ảnh liên tiếp có giá trị thay điểm ảnh rõ số lượng điểm Các bước thuật toán: - RLE thay chuỗi ký tự lặp lại nhiều lần chuỗi ngắn Chuỗi ký tự gọi run thường mã hóa (encoded) thành bytes: byte biểu diễn số lượng ký tự run gọi run count Run count chạy từ đến 128 256 - Byte thứ hai ký tự run (từ đến 255) gọi run value + Ví dụ: Nếu khơng nén ta cần 15 bytes để biểu diễn chuỗi AAAAAAAAAAAAAAA (15 ký tự A), sử dụng RLE ta có kết 15A, cần bytes để biểu diễn 15A gọi RLE packet 3.Shannon – Fano Algorithm Ý tưởng: xác suất xuất - Gán cho nhóm ký hiệu mã - Tiếp tục phân chia nhóm chứa ký hiệu Vd: data elements) are stored as a single data value and count, rather than as the original run a) Thuật tốn mã hóa Run Length Encoding (RLE) Loại dư thừa đơn giản tập tin đường chạy dài gồm kí tự lặp lại, điều thường thấy tập tin đồ hoạ bitmap, vùng liệu tập tin chương trình, số tập tin văn 4.Huffman Coding Thuật toán bao gồm bước chính: a Giai đoạn thứ nhất: Tính tần suất ký tự liệu gốc: duyệt tệp gốc cách từ đầu đến cuối để xây dựng bảng mã Tiếp sau xếp lại bảng mã theo thứ tự tần suất giảm dần b.Giai đoạn thứ hai: mã hóa: Duyệt bảng tần suất từ cuối lên đầu để thực ghép phần tử có tần suất xuất thấp thành phần tử Phần tử có tần suất tổng tần suất thành phần Tiến hành cập nhật lại bảng đương nhiên loại bỏ phần tử xét Quá trình lặp lại bảng có phần tử Q trình gọi trình tạo mã Huffman việc tập hợp tiến hành nhờ nhị phân nhánh Phần tử có tần suất thấp bên phải, phần tử bên trái Sau tạo xong, người ta tiến hành gán mã cho nút Việc mã hóa đơn ký tự mã biết nên mã hoá ký tự tối ưu hố Các bước thực thuật toán: - Xác định xác suất xuất ký tự tin - Sắp xếp ký tự theo trình tự xác suất xuất giảm dần - Phân chia ký tự thành hai nhóm có tổng xác suất xấp xỉ (nếu dùng mã nhị phân phân chia làm hai nhóm, mã số m chia làm m nhóm) Average bit number 5.Lempel-Ziv-Welch Algorithm Phổ biến mã LempleZiv, ý tưởng phương pháp là: + Sử dụng từ mã có độ dài cố định để biểu diễn các chuỗi có độ dài thay đổi + LZW encoder LZW decoder xây dựng nên từ điển động (dictionary) nhận liệu + LZW đặt đầu vào (entries) dài hơn, lặp lại nhiều lần vào từ điển sinh mã cho phần tử phần tử có từ điển Giải thuật LZW để nén liệu Ưu điểm - Cho phép thực tốt với hình ảnh text giản: lần xuống bên phải ta thêm bit “1” vào từ mã; lần xuống bên trái ta thêm bit “0” Vd: Giải thuật LZW thực sau: + Bảng mã Thay phải gửi xâu “ABABBABCABABBA” (14 ký tự) ta phải gửi ký tự, tỷ lệ nén 14/9=1.56 Giải thuật LZW để giải nén sau - Tỷ lệ nén trung bình: 50% - Tốc độ nén nhanh Nhược điểm - Trong số tình tần suất thấp, ta khơng lợi chút nào, chí bị thiệt bit - Bên nhận muốn giải mã thơng điệp phải có bảng mã giống bảng mã bên gửi, nén tập tin bé hệ số nén khơng cao Ví dụ: Giải nén mã 61 Ví dụ: Sử dụng LZW để nén xâu “ABABBABCABABBA” + Bắt đầu từ điển đơn giản gọi “string table”, ban đầu từ điển gồm ký tự với mã sau: Chương Lossy Compression Techniques (Kỹ thuật nén liệu) 1.Khái niệm nén có mát thơng tin: - Dữ liệu nén không giống với liệu gốc gần giống liệu gốc - Có tỷ lệ nén cao nhiều so với phương pháp nén không mát thông tin Đánh giá biến dạng liệu sau nén: Có đại lượng dùng đánh giá biến dạng liệu nén ảnh a Bình phương trung bình sai số (Sai số quân phương) – Mean Square Error-MSE Trong đó: + xn dãy liệu vào + yn dãy liệu Đỉnh tỷ lệ tín hiệu tạp nhiễu –Peak Signal to Noise Ratio – PNRS (dB): Lượng hóa – Quantization Giảm bớt giá trị đầu sai khác Có phương pháp để lượng hóa: + Uniform: Bao gồm midrise quantizer midtreat quantizer + Nonuniform: companded quantizer + Vector Quantization Lượng tử hóa vơ hướng giống – Uniform Scalar Quantization: + Phân chia vùng liệu vào (input) thành khoảng nhau, ngoại trừ hai khoảng or hai biên + Giá trị liệu (output) lấy điểm khoảng + Độ dài khoảng Lượng tử hóa vơ hướng khác – Nonuniform Quantization - Phân chia vùng liệu vào (input) thành khoảng khơng Các khoảng cách lựa chọn để tối ưu hóa SNR cho kiểu cụ thể tín hiệu - Một số phương pháp lượng tử hóa Nonuniform Quantization Companded Quantization - Companded Quantization kết hợp hai bước: Compressed (bên phía gửi) Expanded (bên phía nhận) + Compressed làm cho tín hiệu đầu vào có phân phối (uniform distribution) sử dụng uniform quantization + Bên nhận nhận tín hiệu (compressed) tiến hành giải nén liệu (expanded) Lượng tử hóa vector – Vector Quantization - Các hệ thống nén liệu xây dựng từ xn + N số lượng liệu b Tỷ lệ tín hiệu tạp nhiễu – Signal to Noise Ratio – NRS (dB): gọi step size ký hiệu + Midrise quantizer có số lẻ mức (output levels) + Midtreat quantizer có số chẵn mức bao gồm số mức Trong trường hợp =1 ta tính giá trị sau: Trong đó: trung bình bình phương cửa dãy liệu ban đầu MSE làm việc tốt hoạt động vector nhóm mẫu làm việc với ký hiệu hay mẫu riêng lẻ - Các vector thành lập cách đặt mẫu đầu vào liên tiếp vào vector - Trong Vector Quantization vector mã (code vector) với n thành phần sử dụng, các vector mã tạo thành codebook Mã hóa biến đổi – Transform - Nếu Y kết pháp biến đổi tuyến tính T vector đầu vào X cho thành phần Y tương quan đến Y mã hóa hiệu X - Nếu hầu hết thông tin mô tả cách xác vài thành phần vector biến đổi thành phần lại lượng tử hóa thơ đặt với chút biến dạng tín hiệu - Trong mã hóa biến đổi phép biến đổi Cosine rời rạc – Discrete Cosine Transform (DTC) phép biến đổi Wavelet rời rạc phép biến đổi quan trọng áp ựng nhiều nén ảnh (tĩnh động) Tần số không gian (Spatial Frequency) DTC - Tần số không gian số lần giá trị pixel thay Trong đó: Các số C(u), C(v) định nghĩa sau: 2D Discrete Cosine Transform (2D DTC) định nghĩa sau: Trong : i, j, u, v =0,1, ,7, C(u), C(v) định nghĩa - 2D Inverse Discrete Cosine Transform (2D IDTC) Wavelet Transform - Mục tiêu phép biến đổi Wavelet phân rã tín hiệu vào thành thành phần xử lý thành đổi qua block ảnh - DTC nội dung ảnh thay đổi tương ứng với số vòng sóng hình cosine khối ảnh - Vai trò DTC phân ly tín hiệu ban đầu thành thành phần DC AC Vai trò IDTC tái tạo lại tín hiệu (reconstruct) - Định nghĩa DTC:cho hàm vào f(i,j) i,j số nguyên nhận giá trị phần ảnh, phép biến đổi 2D DTC biến đổi f vào hàm F(u,v) với u,v có miền giá trị i,j Phép biến đổi định nghĩa sau định nghĩa sau: Trong đó: i, j, u, v =0,1, ,7 - DTC phép biến đổi tuyến tính (linear) Một phép biến đổi T gọi tuyến tính : T(αp+ßq)= αT(p)+ßT(q) Trong α, ß số, p,q biến phần biểu diễn cụ thể hay thành phần loại bỏ để đạt hiệu trình nén liệu - Với thành phần tái tạo lại tín hiệu ban đầu (xấp xỉ) ... pháp là: + Sử dụng từ mã có đ dài cố đ nh đ biểu diễn các chuỗi có đ dài thay đ i + LZW encoder LZW decoder xây dựng nên từ điển đ ng (dictionary) nhận liệu + LZW đ t đ u vào (entries) dài hơn,... suất từ cuối lên đ u đ thực ghép phần tử có tần suất xuất thấp thành phần tử Phần tử có tần suất tổng tần suất thành phần Tiến hành cập nhật lại bảng đ ơng nhiên loại bỏ phần tử xét Quá trình... điểm tuyến âm Không khí qua điểm co thắt trở nên chuyển đ ng hỗn loạn tạo nên kích thích giống nhiễu ngẫu nhiên Thông thường điểm co thắt xảy gần miệng nên cộng hưởng tuyến âm ảnh hưởng đ n đ c