Cấu trúc đống có rất nhiều ứng vào các giải thuật nhưgiả thuật sắp xếp đống, vào hàng đợi ưu tiên.
Trang 1Mục Lục
Phần 1:MỞ ĐẦU 3
I.Lí do chọn đề tài 3
Phần 2:Nội Dung 3
Chương 1 : Cơ sở lý thuyết về cây nhị phân 3
I Định nghĩa và các ví dụ 3
1 Định nghĩa 3
2.Ví dụ 4
II Cây nhị phân 4
1 Định nghĩa và các tính chất 4
2 Biểu diễn cây nhị phân 5
Chương 2 Cấu trúc đống 7
I Định nghĩa 7
1.Định nghĩa 7
2 Heap có các tính chất sau : 7
3 Ví dụ : 8
4) Thuật giải 8
II Các phép toán của Heap 9
1 Thêm một phần tử vào Heap 9
2 Xoá một phần tử nhỏ nhất khỏi Heap .10
Chương 3: Các ứng dụng của Đống 11
I Ứng dụng của Heap trong giải thuật Heap_sort 11
1.Giải thuật 11
II.Ứng dụng đống tổ chức hàng đợi có ưu tiên 16
1.Ứng dụng của đống trong giải thuật Hufman 16
2.Ứng dụng của đống trong giải thuật xây dựng cây bao trùm nhỏ nhất của đồ thị liên thông : 19
1
Trang 2Chương 4: Mô phỏng và cài đặt cấu trúc đống và ứng dụng 21
I.Mô phỏng thuật toán 21
1.Khái niệm chung về mô phỏng thuật toán 21
2.Mục đích của mô phỏng thuật toán 22
3.Cấu trúc tổng quan của mô phỏng thuật toán: 22
4 Quy trình thiết kế nhiệm vụ của mô phỏng thuật toán 22
2
Trang 3Phần 1:MỞ ĐẦU
I Lí do chọn đề tài.
Hiện nay, công nghệ thông tin với tốc độ phát triển rất nhanh Các nhà khoa họckhẳng định rằng chưa có một ngành khoa học - công nghệ nào lại có nhiều ứng dụngnhư công nghệ thông tin Việc ứng dụng công nghệ thông tin vào trong giáo dục đãtrở thành mối ưu tiên hàng đầu của nhiều quốc gia trong đó có Việt Nam
Trong quá trình học các giải thuật nói chung và môn cấu trúc dữ liệu nói riêng,chúng ta rút ra một nhận định chung là: nhiều giải thuật phức tạp trừu tượng, khó hiểu,khó hình dung vấn đề Do đó chúng ta luôn mong muốn trong quá trình học giải thuậtnên có những mô phỏng trực quan để chúng ta có thể tiếp thu giải thuật một cách dễdàng hơn Tuy nhiên, việc học tốt giải thuật có rất nhiều thận lợi dó là giúp cho quátrình tư duy giải thật tốt hơn, phát hiện vấn đề nhanh hơn, đặc biệt giúp cho việc họccác môn học khác có tính logic cao được thuận lợi hơn Nhưng để học tốt giải thuật thìkhông dễ dàng với nhiều người Vậy để giúp người học tiếp thu một cách dễ dàng cácgiải thuật thì phải xây dựng các phần mền mô phỏng thuật toán
Cấu trúc đống có rất nhiều ứng vào các giải thuật nhưgiả thuật sắp xếp đống,vào hàng đợi ưu tiên Nghiên cứu cấu trúc đống để hiểu thêm về nó phục vụ trong việcgiải quyết các bài toán
Phần 2:Nội Dung
Chương 1 : Cơ sở lý thuyết về cây nhị phân.
I Định nghĩa và các ví dụ
1 Định nghĩa.
Cây là một cấu trúc phi tuyến tính Một cây (tree) là một tập hữu hạn các nút
trong đó có một nút đặc biệt gọi là nút gốc (root), giữa các nút có một mối quan
hệ phân cấp gọi là quan hệ “cha - con”
Có thể định nghĩa cây một cách đệ quy như sau:
1 Một nút là một cây Nút đó cũng là gốc của cây ấy
3
Trang 42. Nếu T1, T2, , Tn là các cây, với n1, n2, nk lần lượt là các gốc, n làmột nút và n có quan hệ cha - con với n1, n2, nk thì lúc đó một cây mới T sẽđược tạo lập, với n là gốc của nó n được gọi là cha của n1, n2, nk ; ngược lại
n1, n2, nk được gọi là con của n Các cây T1, T2, , Tn được gọi là các cây con(substrees) của n
Ta quy ước : Một cây không có nút nào được gọi là cây rỗng (null tree).
Có nhiều đối tượng có cấu trúc cây
2.Ví dụ
a) Mục lục của một cuốn sách, hoặc một chương trong sách, có cấu trúc cây
b) Biểu thhức số học x + y * (z – t) + u/v, ta có thể biểu diến dưới dạng cây nhưhình 1
người ta cũng phân biệt cây con trái (left subtree) và cây con phải (right subtree).
Như vậy cây nhị phân là cây có thứ tự
Ví dụ : Cây ở hình 1 là cây nhị phân với toán tử ứng với gốc, toán hạng 1 ứngvới cây con trái, toán hạng 2 ứng với cây con phải Các cây nhị phân sau đây làkhác nhau, nhưng nếu coi là cây không có thứ tự thì chúng chỉ là 1
4
Trang 52 Biểu diễn cây nhị phân
a) Lưu trữ kế tiếp
Nếu có một cây nhị phân đầy đủ, ta có thể dễ dàng đánh số cho các nút trên cây
đó theo thứ tự lần lượt từ mức 1 trở lên, hết mức này đến mức khác và từ tráisang phải đối với các nút ở mỗi mức
Ví dụ : Với hình cây f) có thể đánh số như sau :
Hình 2
Ta thấy ngay một quy luật đệ quy trái như sau :
Con của các nút thứ i là các nút thứ 2i và 2i + 1 hoặc
Cha của nút thứ j là j/2
Nếu như vậy thì ta có thể lưu trữ cây nhị phân đầy đủ bằng một vectơ V, theonguyên tắc: nút thứ i của cây được lưu trữ ở V[i] Đó chính là cách lưu trữ kế tiếpđối với cây nhị phân Với cách lưu trữ này nếu biết được địa chỉ nút cha sẽ tínhđược địa chỉ nút con và ngược lại
Như vậy với cây đầy đủ nêu trên thì hình ảnh lưu trữ sẽ như sau :
Tất nhiên với cây nhị phân hoàn chỉnh, mà các nút ở mức cuối đều đạt về phíatrái (để việc đánh số các nút này được liên tục ) thì cách lưu trữ này vẫn thíchhợp Còn với cây nhị phân dạng khác thì cách lưu trữ này có thể gây lãng phí do
có nhiều phần tử nhớ bị bỏ trống(ứng với cây con rỗng) Chẳng hạn đối với câylệch trái thì phải lưu trữ bằng một véc tơ
5
Trang 6Ngoài ra nếu cây luôn biến động nghĩa là có phép bổ sung, loại bỏ các nútthường xuyên tác động, thì cách lưu trữ này tất không tránh được các nhượcđiểm như đã nêu trên.
Cách lưu trữ móc nối sau đây vừa khắc phục được nhược điểm này, vừa phảnánh được dạng tự nhiên của cây
b) Lưu trữ móc nối
Trong cách lưu trữ này, mỗi nút ứng với một phần tử nhớ có quy cách như sau :
Trong đó :
- Trường INFO ứng với thông tin (dữ liệu) của nút
- Trường LPTR ứng với con trỏ, trỏ tới cây con trái của nút đó
- Trường RPTR ứng với con trỏ, trỏ tới cây con phải của nút đó
Ví dụ : Cây nhị phân
Hình 3Cây nhị phân trong hình 3 có dạng lưu trữ móc nối như hình sau :
6
Trang 7Hình 4
Để có thể truy nhập vào các nút trên cây cần có một con trỏ T, trỏ tới nút gốc củacây đó
Người ta quy ước : Nếu cây nhị phân rỗng thì T = Null
Với cách biểu diễn này từ nút cha có thể truy nhập trực tiếp vào nút con, nhưngngược lại thì không làm được
3 Giá trị ở mỗi đỉnh không lớn hơn giá trị của các đỉnh con của nó
Với điều kiện này thì không đảm bảo Heap là một cây nhị phân tìm kiếm
Trang 82.Sắp xếp dãy ban đầu thành Heap căn cứ vào giá trị khoá của các nút.
3.Hoán đổi a[1] cho phần tử cuối cùng
4.Sắp lại cây sau khi đã bỏ đi phần tử cuối cùng để nó trở thành một heap mới Lặp lại quá trình (3) và (4) cho tới khi cây chỉ còn một nút ta sẽ được mảng sắp theo thứ tự giảm
8
Trang 9II Các phép toán của Heap.
1 Thêm một phần tử vào Heap.
Để xen một phần tử mới vào Heap, đầu tiên ta thêm một lá mới liền kề với các lá
ở mức thấp nhất, nếu mức thấp nhất chưa đầy; còn nếu mức thấp nhất đầy, thì ta thêm vào một lá ở mức mới sao cho các điều kiện 1 và 2 của Heap được bảo
tồn.Trong hình 6a dưới sau khi thêm nút lá có giá trị 3 vào mức cuối cùng thì câykhông còn là Heap Nếu sau khi thêm vào lá mới cây không còn là heap, thì ta theo đường từ lá mới tới gốc cây Nếu một đỉnh có giá trị nhỏ hơn đỉnh cha của
nó, thì ta trao đổi đỉnh đó với cha của nó Sau quá trình biến đổi đó thì ta có một Heap hình 6c
Hình 6a
Hình 6b
9
Trang 10Hình 6c
2 Xoá một phần tử nhỏ nhất khỏi Heap
Sét một Min Heap thì hiển nhiên gốc của cây sẽ có giá trị nhỏ nhất Tuy nhiên nếu loại bỏ gốc thì cây không còn là cây nữa Do đó ta tiến hành như sau: đặt vàogốc phần tử của hàng ưu tiên chứa trong lá ngoài cùng bên phải ở mức thấp nhất,sau đó loại bỏ lá này ra khỏi cây Hình 6a minh hoạ cây nhận được từ cây trong hình 6 sau phép biến đổi.Tới đây cây không còn là heap vì điều kiện 3 của định nghĩa Heap bị vi phạm ở gốc cây Bây giờ ta đi từ gốc xuống Giả sử tại một
bước nào đó ta đang ở đỉnh a và hai đỉnh con của nó tại b và c Để xác định, ta giả sử rằng giá trị ưu tiên của ít nhất hơn giá trị ưu tiên của đỉnh c pri(b) <=
pri(c) Khi đó ta sẽ trao đổi đỉnh a với đỉnh b và đi xuống đỉnh b Quá trình đi sẽ dừng lại cùng lắm là khi ta đạt tới một lá của cây Có thê thấy quá trình diễn ra ở hình 7b và 7c
(a)
10
Trang 11Giải thuật Heapsort trải qua 2 giai đoạn :
Giai đoạn 1 :Hiệu chỉnh dãy số ban đầu thành heap;
Giai đoạn 2: Sắp xếp dãy số dựa trên heap:
11
Trang 12Bước 1: Ðưa phần tử nhỏ nhất về vị trí đúng ở cuối dãy:
r = n; Hoán vị (a1 , ar );
Bước 2 Loại bỏ phần tử nhỏ nhất ra khỏi heap: r = r-1;
Hiệu chỉnh phần còn lại của dãy từ a1 , a2 ar thành một heap
Bước 3: Nếu r>1 (heap còn phần tử ): Lặp lại Bước 2
Việc sắp xếp cây này thành một heap sẽ bắt đầu từ việc đẩy xuống nút a[5] (vì 5=
10 div 2)
Xét nút 5 ta thấy a[5] chỉ có một con trái và giá trị khoá tương ứng của nó lớn hơn con trái của nó nên ta đổi chỗ hai nút này cho nhau và do con trái của a[5] là a[10] là một nút lá nên việc đẩy xuống của a[5] là kết thúc
Hình 9
12
Trang 13Tiếp theo xét nút a[4] và a[3] đã đúng vị trí nên không phải thực hiện sự hoán đổinữa Xét nút a[2], so sánh thấy giá trị a[2] = 6 > a[4] = 2 và a[4] < a[5] = 3 (a[4], a[5] là con trái và con phải của nút a[2] )nên ta hoán đổi nút a[2] cho nút con trái của nó là a[4], sau hoán đổi xét thấy nút a[4] vẫn đúng vị trí nên việc đẩy a[2] là kết thúc.
Hình 10Cuối cùng ta xét nút a[1], ta thấy giá trị khoá của nút a[1] = 5 lớn hơn khoá của con trái ( a[2] = 2) và giá trị khoá của con trái bằng giá trị khoá của con phải
( a[2] = 2, a[3] = 2) nên hoán đổi a[1] cho nút con trái của nó là nút a[2] Sau khi thực hiện phép hoán đổi thấy nút a[2] có giá trị khoá lớn hơn giá trị khoá của nút con con phải cua nó là a[5] và con phải của nó có giá trị nhỏ hơn khoá của con trái nên phải thực hiên phép hoán đổi nút a[2] cho nút a[5] Xét lại thấy nút a[5] thì nó vẫn đúng vị trí Tương tự xét tiếp các nút còn lại thấy đã dúng vị trí nên cuối cùng được cây đã là một heap
Cây đã là một heap (Hình 11)
Giai đoạn 2: Sắp xếp dãy số dựa trên heap :
Trong giai đoạn thứ hai, chúng ta thấy rằng gốc của cây (cũng là phần tử đầu tiêncủa mảng hay cũng là đỉnh heap) là phần tử có khoá nhỏ nhất Vị trí đứng cuối
13
Trang 14cùng của phần tử này là ở cuối mảng Như vậy chúng ta sẽ di chuyển phần tử này
về cuối mảng, sau khi thực hiện phép biến đổi này thì một khoá trong mảng đã vào đúng vị trí của nó trong sắp xếp Nếu không kể khoá nhỏ nhất này thì phần còn lại của mảng ứng với cây nhị phân hoàn chỉnh sẽ không còn là đống nữa, ta lại phải thực hiện lại phép vun đống cho cây và lại thực hiện tiếp việc đổi chỗ
cho khoá ở đỉnh đống với khoá ở đáy đống Cho đến khi cây chỉ còn một nút thì các khoá đã được sắp xếp vào đúng vị trí của nó
Cụ thể với Heap ở trên
Từ heap ở trên, hoán đổi giá trị của a[1] =2 với a[10] = 12 ta đã có a[10] = 2 là giá trị nhỏ nhất vào đúng vị trí Cắt bỏ nút a[10] ra khỏi cây, như vậy phần cuối cùng của mản chỉ gồm một phần tử a[10] đã được sắp
Hình 12
Sau khi thực hiện hoán đổi cây không còn là heap thực hiện việc vun đống đổi
vị trí của a[1] về đúng vị trí ta có đống mới
Hình 13
14
Trang 15Tiếp tục hoán đổi giá trị a[1] với a[9] ta đã sắp được a[9] = 2 vào đúng vị trí
trong mảng Cắt bỏ nút a[9] ra khỏi cây, như vậy phần cuối cùng của mảng gồm hai phần tử a[9], a[10] đã được sắp
Hình 14
Sau khi đổi chỗ cây không còn là đống thực hiện phép vun đống ta được đống mới
Hình 15Tiếp tục thực hiện quá trình trên ta được một mảng sắp theo thứ tự giảm là
Hình 16
15
Trang 16II.Ứng dụng đống tổ chức hàng đợi có ưu tiên
1.Ứng dụng của đống trong giải thuật Hufman.
a) Giới thiệu về thuật toán Huffman:
-Trong khoa học máy tính và lý thuyết thông tin, mã Hufffman là một thuật toán
mã hoá dùng để nén dữ liệu Nó dựa trên bảng tần suất xuất hieenk các kí tự cần
mã hoá để xây dựng bộ một bộ ã nhị phân cho các kí tự đó sao cho dung lượng (số bít) sau khi mã hoá là nhỏ nhất
- Thuật toán được đề xuất bởi Đavi A.Huffman khi ông còn là sinh viên Ph.D.tại MIT, và công b ố năm 1952 trong bài báo “ A Methord for the Construction of Minimum- Redundancy Codes” Sau này Huffman đã trở thành một giảng viên ởMIT và sau đó ở khoa Khoa học máy tính của Đại học California, Santa Cruz, Trường Ký nghệ Baskin
- Mã Huffman là một mã tiền tố Sau đây là khái niệm về mã tiền tố:
b) Mã tiền tố (prefix-free binary code)
- Khi mã hoá một tài liệu có thể không sử dụng đến tát cả 256 kí hiệu Hơn nữa trong tài liệu chữ cái “a” chỉ có thể xuất hiện 1000000 lần còn chữ cái “A” có thểchỉ xuất hiện 2, 3 lần Như vậy ta có thể không cần dùng đủ 8 bít để mã hoá ký hiệu, hơn nữa độ dài (số bít) dành cho mỗi kí hiệu có thể khác nhau, kí hiệu nào xuất hiện nhiều lần thì nên dùng số bit ít, ký hiệu nào xuất hiện ít thì có thể mã hía bằng từ mã dài hơn Như vậy ta có việc mã hoá với độ dài thay đổi Tuy
nhiên, nếu mã hóa với độ dài thay đổi, khi giải mã ta làm thế nào phân biệt được xâu bít nào là mã hoá của kí hiệu nào Một trong các giải pháp là dùng các dấu phẩy (“,”) hoặc một kí hiệu quy ước nào đó để tách từ mã của các ký tự đứng
cạnh nhau Nhưng như thế số các dấu phẩy sẽ chiếm một khoảng đáng kể trong bản mã Một cách giải quyết khác dẫn đến khái niệm mã tiền tố
- Mã tiền tố là bộ các từ mã của một tập hợp các kí hiệu sao cho từ mã của mỗi
ký hiệu không là tiền tố ( phần đầu) của từ mã một ký hiệu khác trong bộ mã ấy
- Đương nhiên mã hoá với độ dài không đổi là mã tiền tố
- Ví dụ : Giả sử mã hoá từ “HONGHAI”, tập các ký hiệu cần mã hoá gồm 6 chữ cái “H”,”O”,”N”,”G”,”A”,”I”
-Nếu mã hoá cho một chữ cái chẳng hạn “H”=00, “O”= 01, “N” =
100,”G”=101,”A”=110,”I”=111 Khi đó mã hoá của cả từ là
000110010100110111 Để giải mã ta đọc bit và đối chiếu với bảng mã
16
Trang 17-Nếu mã hoá “H”=0, “O”=01, “N” = 100,”G”=101,”A”=110,”I”=111 thì bộ từ
mã này không là mã tiền tố vì từ mã của “H” là tiền tố của từ mã của “O” Để mãhoá cả từ HONGHAI phải đặt dấu ngăn cách vào giữa các từ mã
0,01,100,101,110,111
Nếu mã hoá “H”=00, “O”= 01, “N” = 100,”G”=101,”A”=110,”I”=111 thì bộ mã này là tiền tố Với bộ mã tiền tố này khi mã hoá xâu “HONGHAI” ta có
000110010100110111
Biểu diễn mã tiền tố trên cây nhị phân:
- Nếu có một cây nhị phân n lá ta có thể tạo một bộ mã tiền tố cho
n ký hiệu bằng cách đặt mỗi ký hiệu voà một lá Từ mã của một ký hiệu được tạo
ra khi đi từ gốc tới lá chứa ký hiệu đó, nếu đi qua cạnh trái thì ta thêm số 0, đi qua cạnh phải thì thêm số 1
- Ví dụ : Cây sau đây biểu diễn bộ mã của H, O, N, G, A, I trong ví
dụ trên
Hình 17
c) Giải thuật Huffman
- Một ứng dụng nữa của Heap là vào giải thuật Huffman Thành lập cây nhị phân từ tập hợp các ký hiệu trong thông báo, mỗi ký hiệu là một nút
lá cây Cách thành lập cây như sau:
*Dữ liệu:
+ Input:
17
Trang 18• Khởi tạo: Tạo một rừng gồm n cây, mỗi cây chỉ có một nút gốc, mỗi nút gốc
tương ứng với một kí tự và có trọng số là tần số/tần suát của kí tự đó W(i)
• Lăp:
o Mỗi bước sau thực hiện cho đến khi rừng chỉ còn một cây:
o Chọn hai cây có trong số ở gốc nhỏ nhất hợp thành một cây bằng cách thêm một gốc mới nối với hai gốc đã chọn Trọng số của gốc mới bằng tổng
trọng số của hai gốc tạo thành nó
Như vậy ở mỗi bước số cây bớt đi một Khi rừng chỉ còn một cây thì cây đó biểu diễn mã tiền tố tối ưu với các ký tự đặt ở các lá tương ứng.Trong mỗi bước của thuật toán xây dựng cây Huffman, ta luôn phải chọn ra hai gốc có trọng số nhỏ nhất Để làm việc này ta sắp xếp các gốc vào một hàng đợi ưu tiên theo tiêu
chuẩn trọng số nhỏ nhất Một trong các cấu trúc dữ liệu thuận lợi cho tiêu chuẩn này là cấu trúc Heap (với phần tử có trọng số nhỏ nhất nằm trên đỉnh của Heap)
Trong đoạn giả mã này ta dựa trên một mảng các ký hiệu A[1 n] có tần suất
tương ứng là W[1 n].
+ Tạo hàng đợi bằng đống:
18