Công nghệ thông tin (CNTT-IT) được mệnh danh là ngành của mọi ngành
PHẦN 1 GIỚI THIỆU ĐỀ TÀI I.1.GIỚI THIỆU !"#$%& ''%('%!)*+ ! ,-+ ./%$&0+123 3 +245&6/0+7%89 0+&0:+ + ;+<=>?%< +2!'% @"+0%'A+;%B" &2C@5( #6=-.D E@;F%G5!7%H0H H9&5C;+;I% 8JC$+ H? ''%=-)*C@0""=@0"C@ <8-*1K(=LM2N+#$ 7%0+%C9<O:+9=@0"!( 7%%%34C 4&9)6"=@0"C< > > A> >PQR!<J>< GSH%?C0+/J%(T==@0"9L* 5-+ ./% 0+%0/0%' 0+;I%0%'9<% 5-+./%%U0%'V# '7%0 '%>9WF%&'4!%U+#$7%0 4!./%@%+@./%40210#8%4. X+Y+ Z%[[\N=N]^N\]^+;" ./% 0+5%_ N9S065.'@%+@./% *9+9@(%7%-.C9<+D/%;@%/V +D4.X+Y+Z%[[`$=a(%7%-V+D4. Trang b *N9S0655:>06&0J'-/= 06cc I.2.MỤC ĐÍCH VÀ PHẠM VI CỦA ĐỀ TÀI BU@=0%+@#'3+7%%+@X+Y+ Z%[[ =8(@% "%+@9+H%+@;5: 6)=ad.!@=$9S0+U@Ue b6"%F%&./% f=@;&7%-0J&H'./ %f7%'@=>=@=4!%U %Jg@=> =@= <Ch. V`8+D)**G00C%@% +@4!%U iC%%+@X+Y+Z%[[0+=$9S98% =8(@%"1%+@ %+@X+Y+ Z%[[j@%+@./%;""9+9@(%7%-1+D HC9<+D/%;@% kO@7%@'>06 ;&7%-%+@0+=$9SJ%#% 0T>06@#';38>06*7%0 =-=a%+@ 38%U%+@+ I.3.PHUƠNG PHÁP NGHIÊN CỨU B0>9WF%& &J)%%+@@+D4.X+Y+Z%[[ B0%Jg4!5+@4! D>06;"L B@@%"" PHẦN 2 NỘI DUNG Trang V CHƯƠNG 1 SƠ LƯỢC VỀ NÉN DỮ LIỆU II.1.1 TỔNG QUAN VỀ NÉN DỮ LIỆU 0+;+@((%& ./%7%@064! E(5>9+H4!5:@EC+G;&= @=>=@=+!lN+%JgT=0@@;J0%' 5m7%@-0%'0WJ;&>./%T=&;@ %J%5CH 5_ 2D /%4. $=--." N 3NP 7%@06noa @%J#m?C(*"6.N+o!"oa=$ )g'"7%@06-."!"3Nl+!&;& C>06./%=*%C'%&%<)C. C.+<H .!f+ %J<E"7%@06.-./% II.1.2 TỔNG QUAN CÁC LOẠI Mà NÉN %Jg@>06.!%<%e*9G=D /% @%p/%G=D&5W+0a%!C5.> OI%0#!%7%-<H/%DN3 5-( +G[Nl,Y.0J qrs 6(G=D/%+D+eYN>06tut+Gv?. (> -;#-@>06.[N'%E%C%+@6+D CTn;@%?p40";%+@C;"%"%o #'e2h.>06`O]`20C>@>06 .;@'G<C 'Gh. '%;!n;@>(fm @>06.n'%$7%8@[N.!%0#(;5m Trang i an$%F@+D[N.;>(H% )&%L[N .+2;@62!$=-!>06(=H-.0 %J"-7%&#' -i>06wxc`\yX \Zw `O]`'%+=.=D+[N.5%)[N.WD>06 ;D9SC5%0 0Jm02n5g$%3%#>06%" f1D[N.9D[N.;@ (*>06lz+=0N99[+0 ^+{9%"@[N`O]` wx \Zw9Dwx| @>06.@;+`O]`ekqyXl \Zw%#=R=(J E;@0C04ZD&T+2E; % 2=-}H'%9<W#%glvX"C +!-&N+Hewxc`\yX!+ ;"%N% `O]`n4!=$5f9%`O]`N% '%>067%-F[N0+lvX0+^+{945g$%E;I %.>06?N4\+%9E`O]`1_b~~r > 06u0NN•+`O]`+*7%-F[N_b~~b *.029%!D=-5%0"E@>06.[N;@ 020 (5WF+@>06.€X;N0+GX%=N0X+0N 9L*><0C04@>06.€n+DC0J%J g<.[N d;@TC.5%2E; =-7%8&2h.@>06.+D;@% B"5%i •?5/% >06&bV8 >06;@kr8h9< .<H[N_5-n;@e1Veb&ieb!D;E>06. € 2EJ8%0<f)2_;+-V$ Q5%.;H[N9SDTB<H @[N/%H '%";@0}O @>06.€+D CWD20T 5W&CG!&*5CHxw? CG!" 83%CH@>0620T;@@>06.[N;!9 <daC[N o>06.€a-f€%'%0#( ;3-0!n+'%2ND;@E Trang k B"G>06.€$=8Df)6@($;W C5:€.0H;>06.+DC&%E^+{96=$ ;.$;@H2$br?5+E;. d. E€oD ?C'%!"2E%$%=-7%&mh.5+J% QHh.breb‚D >06.9S'%ƒ+0aƒ"0a&@ /% p+0a&V5N ;!R3-002=;+0a > 065@+€$0;=- %<E +D5a>06.€;4GnC#'> ='+@'%>06‚Dl+%5NlN9!)_+D5aB< H@>06;@$!@[N„>06.3!5aT !;=-[+0Df) !D EC9<D& ./%@);&#"W0C% f)+0o&;;@'%2;=(;./ %0H;0%' h.C0+@G07%0#=>=@=.% J '@@@@;&7%-5<0+@%n$7% $3N3.6% 2m€h.9%e h.…b†03s QH0h9<.m€e0…;(H/%<†;(H/% %9%.%9%#.ebh.3s 0+@0659%;!&;&7%-. TEh9<. (* br0Jb!€/%<br9%;.d!b=$ %J n=-#0:/9<+C=>=@=.d!@0m H(9.! 60:%7%-.o=*%C+;"%/%m. '%;h.+n"!0:=>=@=!%7%->@ Trang • =>=@=;@ 6o@=(;@2 ;(-C =)D=(+@/(*.=*m0+0%'/%e#'G0 %7%-.!>=H20%'; II.1.2.3 !"#. 0J4! .:*(-;(H/%5:@+D5a 1/%3@m5-#@;"%1/%0#!(+38 @=>=@=./%;@%!C@;@ @=>=@=. /%;@%+9L*@;"%1/%;@%!k;"%1 (065W@*9%8 $ %&'()*+& 0+ ‡ ˆ ; ‰ ‡ + ‰ ‡ 9 ‰ ; ‰ ‡ + ‰ 8 Š 9%8 ‰ 3%8 ‰ J ‡ J Š %> ‡ 9 ‰ ˆ ; ‰ l+8 ‡ + ‰ J ‹ ˆ + ‰ ˆ J ‡ % ‡ ‰ + ‡ > ‰ ; ‰ ‡ + ‰ 8 Š 3%8 ‰ 3%# +>> ‡ &5> ‹ ‡ Š ˆ ‡ =8> ‰ 9 ‰ 5Œ ‰ + ‹ •> ‡ ‡ ‰ ˆ + ‰ 8 Š 3%8 ‰ 3%#8 ‰ =9N ˆ > ‡ ˆ !5> ‹ Š ˆ + ‰ J Š %5Œ ‰ >B8Œ ‰ Š 5 ‹ 8 ‰ % ‹ =>= ‰ = ˆ + ‰ Z%[[X+Y+ $%&,'-!*+& 0+ ‡ 9 ‰ Œ Š % ‰ 0+ ‹ b; ‰ J ‡ %5Œ ‰ ƒrƒ5Œ ‰ ƒbƒ> ‡ _ ‡ = _ ‡ = ‡ ‡ 9 ‰ 8 Š O ˆ %8 ‡ N ‰ % Š 0+0> Š > ‡ = Š Š ˆ _ ‡ =+ ‰ 5> ‹ ˆ > ‰ Š V Š =8 Š e9 ‰ 8 Š _ ‡ = Š ;Œ ‰ J ‡ %% Š J ‹ ˆ !`>= ‰ = ˆ + ‰ ;J ‹ % Š + ‰ J Š ˆ !+ ‡ Š x\x%\N+ $$."/0#12341#5 + ‰ J ‹ + ‰ ˆ ; ‰ J ‡ % Š ++ ‰ 3%8 ‰ J ‡ > ‰ 8 Š 9%8 ‰ > ‰ +l+8 ‡ + ‰ J ‹ ˆ + ‰ 5> ‹ Œ ‰ 5Œ ‰ >B8 Š >9> ‹ % ‹ =>= ‰ = ˆ + ‰ ;J ‹ % Š J ‹ +\N=N] 0 Š + ‰ ‹ J ‰ Š +_b~qq b~qŽ Š ++ ‰ + ‰ J+ ‡ Š =>= ‰ =N ‰ \]qq \]qŽ_b~Žk N00^N ˆ ‹ J ‰ J ‡ %7% ‹ > Š _ ‡ J Š \]^\N=N] Trang • ^N%+@./%+•%9L*$9%#%7%-=-;"& =>=@=./%X+Y+Z%[[ $67 !89 l+9 ‡ =% ‡ % ‡ 8ˆ%% ‹ ˆ J ‡ % ;5J ‰ > ‡ ; ‰ J ‡ % ‰ 0 ‡ 3%8 ‰ J ‡ ‡ ‡ ‡ 0Œ ‰ Š > Š + ‰ J ‹ + ‰ 0> ‰ 9 ‡ 3%8 ‰ J ‡ % ‹ ‰ ‰ 0 ‡ > ‹ ‰ ‡ 0Œ ‰ ; ‰ % ‡ ‰ =% Š > ‡ =_ ‹ ‡ ‹ 5J ‹ %Jˆ0+ ‡ > ‰ J Š % ‡ 9 ‰ J ‹ > ‹ Š + ‡ 0+ ‡ ; ‰ ˆ J ‡ % ‡ 3%8 ‰ J ‡ 0+% Š ‡ 0Œ ‰ > ‹ ‰ Š ; ‰ %l+ 8 ‡ Œ Š %0 ˆ ˆ J ‡ % Œ ‹ 8 Š %0 ˆ ‡ 0Œ ‰ Š Š ‡ `>= ‰ =N ‰ ‡ 0J9 ‡ Š Š + ‡ Š =>= ‰ = ˆ + ‰ ‡ + ‰ ‰ ‰ ‰ ‡ Š 0J+ Š + Š Œ ‰ 0 ‡ 7%_ Š 5J ‹ % ‡ ‡ ‰ Œ Š + ‰ 3%8 ‰ J ‡ J Š %8 Š B ‰ > ‰ ˆ J ‡ % ‹ + Š _ ‡ % Š %+ ‰ + ‰ + Š + ‰ ˆ _ ‡ % Š 0JŒ ‰ % ‡ + ‰ ‰ % ‡ ;8 Š + Š 5 ‡ ˆ J ‡ %% ‹ ‹ Š Œ ‹ 8 Š ‰ _ ‡ 05J ‹ %Jˆ ‹ 5J ‹ % Š Š 8 ‰ l+8 ‡ + ‰ ˆ =>= ‰ =N ‰ 0J+ ‹ ‡ Š +5J ‰ ‹ ‹ ‡ Š +5J ‹ %Jˆ ‹ II.2.2 PHÂN LOẠI VÀ ỨNG DỤNG bibb Dựa vào nguyên lý nén: N+@2=8Ve ibbb #:*;<!= 0+=>=@=.;f+ /%.9%;-.9S< 5$%0+!*#%+@\N=N]\]ltY\wt C5&"%+@\] <%!:_<C-.d. 5ED%+@!<C7%@06.ltY\wtE0+ `O]` •]` `•\]^\N=N]=^NE0+mD[N•Y Z5&"%+@\]n@TF%+@\]uE0+mD [Nw,?0+9+[?0+9+[oE%+@.0+[NZ? @[N +[[NVrrq%+@\]?wE0+>06q]` Trang q @%+@.;f+E".@[N[N [N _5- {+0 N3N P@+D/%;"9EdC5 # @[N>06 @%+@.;f+>5-e b x%NN+x\t V l+0+N09 i \]qq‘\]qŽ k \]^ • ,%00+{9^NNN009[+0,^ • `0N+5=0``? q +N33? Ž t0+=N+ ~ Z%[[+%[[C2EW5H%<E7%@06.[N U'%5H br w=NZ%[[ bb w0N bV X+Y++ bi xN+ ibV #:<!= 0+@=>=@=.f+6/%.;-.09S; <H/%< %J=--5-+/%9%;.•o/%(B< H6- 8 N+ +HDg2JCH% !"&;5:@+D5a@=$1 0+;# $%;f 0+& @[N6-8N+%0/0J@('% 4.!f+"&;%5_B<=H.; Trang Ž f+@=>=@=.!f+28-#0#; .-.7%'%$@•%6-89S@ =$a5&f7%';@@9<5&f9SL! 9%!4!5:4%[[+G4!9< @•%6-80H9L*"+@@•%&=N+X 9< / / % +@ / % 9S L ! 0U 4 ! ’%".f+9+H.;f+!.f+0+'%02 =+d.+>0#'%9+H5#)%+@.;f+5& 0+;•-5-+#.f+29L*".- 8 N+“!".Hdbreb$%;-# QN+!".HdirrebH#-( II.1.3.2 Dựa vào cách thức thực hiện nén • N+ ‰ Š > Š % ˆ =8 Š + ‡ e • `>= ‰ =;X=l+=0N99+e ‰ =>= ‰ =% ‡ + ‡ Š ‡ J ‡ N ‰ 5_ Š ‰ ‰ ‡ 0 ‡ J ‰ =JJ ‡ 8 ‰ 8ˆ%% ‹ ‹ 0+J Š ; • `>= ‰ =9 ‹ % ‡ 5J ‰ ‹ 09[+0+e• Š ‰ =>= ‰ = ‰ ‡ J9 ‡ 5J ‰ ‹ % ‹ ‹ ‰ Š ; ‰ ‡ 0 ‡ J ‰ =+ ‡ 0J CHUƠNG 2 CÁC PHƯƠNG PHÁP NÉN DỮ LIỆU Vb PHUƠNG PHÁP NÉN KHÔNG TỔN HAO II.2.1.1. Mô hình thống kê Vbbbb #:%!>?!= Trang ~ @5H4+@N+%+@X+Y+e ,HbeXg=3&=@;FN+)-$ ,HVe(3@9%# ,HieB7%=$ p=$!f3@9%#$5:% ?4+@=$0J5:5r+G5b =$H5:5b+G5r ,HkeQS9>U8 ,H•e(t0+= 9<594+@0%569<54+@ 2 Ví dụ mô tả thuật toán Thống kê lượng tin: OF% w , l t X<$3%# b• q • • • Mã hóa lượng tin: OF% B& ` \+ V b†= ?4 f59 w b• b•†i~ biŽ r r ir , q q†i~ VkŽ r b bk • •†i~ Vq b r bV t • •†i~ Vq b b r bŽ l • •†i~ V~• b b b b• X<599L*0%56ef59†9<$3%# x…ircbkcbVcbŽcb•†i~…VV~59 VbbV #:@#AA/! Trang br [...]... hóa của Shannon-Fano và Huffman có nét tương đồng Tuy nhiên sự khác nhau về thuật toán làm cho hiệu suất nén (hệ số entropy) của Huffman và Shannon-Fano khác nhau Do vậy, em sẽ tập trung nghiên cứu, xây dựng mô phỏng và đánh giá 2 loại mã nén này để làm rõ ưu và nhược của 2 loại mã nén trên II.3.2 PHÂN TÍCH THUẬT TOÁN II.3.2.1 Thuật toán Shannon-Fano: Mã Shannon-Fano là một thuật toán mã hóa dùng để nén. .. tính của thuật toán và yêu cầu khá phức tạp nên hiếm khi được sử dụng Thuật toán Huffman có ưu điểm là hệ số nén tương đối cao, phương pháp thực hiện tương đối đơn giản, đòi hỏi ít bộ nhớ, có thể xây dựng dựa trên các mảng bé hơn 64KB Thường được sử dụng trong các công đoạn cuối cuản nén âm thanh, hình ảnh và video Từ các đặc tính thuật toán của các loại mã nén trên, em nhận thấy rằng thuật toán mã hóa... LZW có các ưu điểm là hệ số nén tương đối cao, trong tập tin nén không cần phải chứa bảng mã Nhược điểm của thuật toán này là tốn nhiều bộ nhớ, khó thực hiện dựa trên các mảng đơn giản (bé hơn 64KB) Các thuật toán khác như Huffman, Shannon-Fano, LZ77 và LZW… đều có thể áp dụng được để nén nhiều loại tập tin trên các máy vi tính Trang 34 Thuật toán Shannon-Fano có hệ số nén tương đối tốt với các file... thuộc vào khoảng trống để phân cách các kí tự Nếu không có dấu phân cách thì ta không thể giải mã được thông điệp này Ta cũng có thể chọn các từ mã sao cho thông điệp có thể được giải mã mà không cần dấu phân cách, ví dụ như: A là 11, B là 00, C là 010, D là 10 và R là 011, các từ mã này gọi là các từ mã có tính prefix (Không có từ mã nào là tiền tố của từ mã khác) Với các từ mã này ta có thể mã hoá... mã hoá này ta hoàn toàn có thể giải mã được mà không cần dấu phân cách Nhưng bằng cách nào để tìm ra bảng mã một cách tốt nhất ? - Bước đầu tiên trong việc xây dựng mã Shannon-Fano là đếm số lần xuất hiện của mỗi kí tự trong tập tin sẽ được mã hoá (trong phần này chỉ ví dụ hạn chế một số ký tự) - Bước tiếp theo là xây dựng bảng mã dựa vào thuật toán Shannon-Fano Thuật toán này được thực hiện bằng các. .. sắp xếp lại của bộ mã hoá như sau: I3 B1 B2 P6 B4 B5 P9 B7 B8 P12 B10 B11 Cấu trúc của một GOP có thể được mô tả bởi hai tham số: N là số các ảnh trong GOP và M là khoảng cách giữa các ảnh P-pictures Nhóm GOP này được miêu tả như N = 12 và M = 3 SƠ ĐỒ CỦA BỘ Mà HOÁ VÀ GIẢI Mà DÙNG MPEG-2 Trang 25 Hình 1 Sơ đồ bộ mã hoá và giải mã dùng MPEG Mã hoá MPEG-2 Quá trình mã hoá cho P pictures và B pictures được.. .Thuật toán Huffman có ưu điểm là hệ số nén tương đối cao, phương pháp thực hiện tương đối đơn giản, đòi hỏi ít bộ nhớ, có thể xây dựng dựa trên các mảng bé hơn 64KB Nhược điểm của nó là phải chứa cả bảng mã vào tập tin nén thì phía nhận mới có thể giải mã được do đó hiệu suất nén chỉ cao khi ta thực hiện nén các tập tin lớn • Nguyên lý: Nguyên lý của phương pháp Huffman là mã hóa các bytes... trúc khung MPEG 2 Mã hóa và giải mã MPEG2: Trang 33 channe L0 L R MPEG-1 encode C 0 R T4 + decode T3 LS MPEG-1 l RS r r L0’ L’ R0’ C’ T3 R’ ’ Matrix T5 MPEG-2 ’ MPEG-2 T4 Extension Extension encode decode r T5 Inverse LS’ Matrix ’ RS’ r Hình 7 Sơ đồ mã hóa và giải mã MPEG 2 CHƯƠNG 3 XÂY DỰNG CHƯƠNG TRÌNH NÉN DỮ LIỆU BẰNG Mà SHANNON-FANO VÀ HUFFMAN II.3.1 ĐẶC ĐIỂM CỦA CÁC THUẬT TOÁN NÉN DỮ LIỆU Trong... đầy đủ của MPEG Việc áp dụng toàn bộ các đặc điểm của chuẩn MPEG-2 trong tất cả các bộ mã hoá và giải mã là không cần thiết do sự phức tạp của thiết bị cũng như sự tốn kém về dải thông của đường truyền Vì vậy trong hầu hết các trường hợp ta chỉ sử dụng một phần nhất định trong toàn bộ các đặc điểm của chuẩn MPEG-2, chúng thường được gọi là profiles và levels Một profile sẽ xác định một thuật toán (điều... tập hợp các công cụ mã hoá chuẩn, chúng có thể được kết hợp vói nhau một cách linh động để phục vụ cho một loạt các ứng dụng khác nhau Trang 21 Nén MPEG là sự kết hợp hài hoà của bốn kỹ thuật cơ bản: Tiền xử lý (Preprocessing), đoán trước sự chuyển động của các frame ở bộ mã hoá (temporal prediction), bù chuyển động ở bộ giải mã (motion compensation) và mã lượng tử hoá (quatisation coding) Các bộ lọc