Các phương pháp duyệt cây BỘ CÔNG THƯƠNGTRƯỜNG ĐHCN TP.HỒ CHÍ MINHKHOA SAU ĐẠI HỌCĐỒ ÁNTÌM HIỂU MỘT SỐ
PHƯƠNG PHÁP DUYỆT CÂYGV híng dÉn : Đỗ Thị HoµSinh viªn thùc hiÖn : Ng« V¨n AnhLíp : Đại học Tin Học 5 Liên Thông Thái Bình Th¸i B×nh, th¸ng 11 n¨m 2010MỤC LỤC2Lời mở đầuCùng với sự phát triển của khoa học kĩ thuật, công nghệ thông tin nói chung và bộ môn cấu trúc dữ liệu và giải thuật nói riêng ngày càng được ứng dụng rộng trong nhiều lĩnh vực. Với một cơ sở dữ liệu khổng lồ, việc đưa ra một
phương pháp nhằm giải quyết vấn đề tìm kiếm dữ liệu có hiệu quả và nhanh nhất luôn được sự quan tâm của
các nhà phát triển phần mềm. Thông thường dữ liệu được biểu diễn dưới dạng
các danh sách liên kết. Việc truy xuất dữ liệu chưa đạt hiệu quả cao. Sử dụng cấu trúc dữ liệu dạng
cây là một giải
pháp nhằm tăng hiệu xuất trong
các thao tác xử lý. Vấn đề đặt ra: Với việc sử dụng cấu trúc dạng cây, chúng ta cần dùng giải thuật nào với từng dạng dữ liệu để đạt hiệu quả cao nhất. Để giải quyết vấn đề trên ta cùng tìm hiểu một số
phương pháp duyệt cây.3Phần I Tổng quanI. Cấu trúc cây.1. Định nghĩa:Cây là một tập hợp T
các phần tử (nút trên cây) trong đó có 1 nút đặc biệt T0 được gọi là gốc,
các nút còn khác được chia thành những tập rời nhau T1, T2 , . , Tn theo quan hệ phân cấp trong đó Ti cũng là một cây. Nút ở cấp i sẽ quản lý một số nút ở cấp i+1. Quan hệ này người ta còn gọi là quan hệ cha-con.
Cây không có phần tử nào gọi là
cây rỗng.Ví dụ:2. Một số khái niệm.2.1. Bậc của một nút:Bậc của một nút là số
cây con của nút đó.Ví dụ: nút T2 trong
cây trên có bậc bằng 22.2. Bậc của một cây:Bậc của một
cây là bậc lớn nhất của
các nút trong cây.
Cây có bậc n thì gọi là
cây n-phânVí dụ:
Cây trên có bậc bằng 3(bằng bậc của nút gốc) và
cây trên được gọi là
cây 3-phân2.3. Nút gốc:Nút gốc là nút không có nút chaVí dụ: nút gốc của
cây trên là nút T22.4. Nút lá:Nút là là nút có bậc bằng 0. Nút lá không là cha của một nút khác.Ví dụ:
cây trên có
các nút lá: T5 , T6 , T11, T12, T13, T14, T15, T16, T1042.5. Nút trung gian:Nút trung gian hay còn gọi là nút giữa là nút có bậc khác 0 và không phải là nút gốc.Ví dụ:
Cây trên có
các nút trung gian : T2 , T3 , T4, T7, T8, T9.2.6. Nút cha, nút conNút B được gọ là nút cha của nút C nếu nút B là nút trước của nút C và mức của nút C lớn hơn mức của nút B là 1. Khi đó nút C được gọi là nút con của nút B.Ví dụ: Trong
cây trên Nút T3 là nút cha của
các nút T7, T8, ngược lại
các nút T7, T8 là nút con của nút T3.2.7. Mức của một nút:Mức Nút gốc (T0) =1Gọi T1, T2 , T3, … , Tn là
các cây con của T0Mức (T1) = Mức (T2) = Mức (T3) = … = Mức (T0) +1Ví dụ: Mức của
các nút trong
cây trênMức của
các nút: T5, T6, T7 , T8, T9 , T10 bằng 3Mức của
các nút: T11, T12, T13 , T14, T15 , T16 bằng 42.8. Chiều cao của cây:Chiều cao của một
cây hay còn gọi là chiều sâu của
cây là mức cao nhất của
các nút lá trong cây.Ví dụ:
Cây trên nút chiều cao là 4, bằng mức lớn nhất của
các nút lá.2.9. Nút trước và nút sau của một mức:Nút T được gọi là nút trước của nút S nếu
cây con có gốc là T chứa
cây con có gốc là S. Khi đó nút S được gọi là nút sau của nút T.Ví dụ: nút T3 là nút trước của
các nút T11, T12, T13, T14. Ngược lại
các nút T11, T12, T13, T14 là nút sau của nút T3.2.10. Chiều dài đường đi.Chiều dài đường đi của một nút là số nhánh cần đi qua tính từ nút gốc để đi đến nút đó. Chiều dài đường đi của nút gốc luôn bằng 1, chiều dài đường đi tới một nút bằng chiều dài đường đi tới nút cha cộng thêm 1.Ví dụ: Chiều dài đường đi tới nút T3 là 2.Chiều dài đường đi của một
cây là tổng tất cả
các chiều dài đường đi của tất cả
các nút trên cây.5Ví dụ: Chiều dài
các nút trong
cây trên:Nút gốc có chiều dài bằng 1.Các nút: T1, T2 , T3 bằng 2 -> tổng bằng 6.Các nút: T5, T6, T7 , T8, T9 , T10 bằng 3 -> tổng bằng: 18Các nút: T11, T12, T13 , T14, T15 , T16 bằng 4 -> tổng bằng 24Tổng đường đi của
cây trên là : 1 + 6 + 18 + 24 = 49.2.11. Rừng:Rừng là tập hợp
các cây.Một
cây khác rỗng khi mất gốc sẽ trở thành một rừng.3.Biểu diễn cây.Có nhiều
phương pháp biểu diễn cây. Cách thường dùng nhất là biểu diễn mỗi nút như một dữ liệu kiểu bản ghi, mỗi nút chứa
các con trỏ tới
các con hoặc cha của nó, hoặc cả hai.
Cây cũng có thể biểu diễn bằng
các mảng cùng với quan hệ giữa
các vị trí trong mảng.3.1 Biểu diễn bằng
các nút với
các con trỏMỗi nút là một dữ liệu kiểu bản ghi với ban trường: Một trường thường gọi là INFOR chứa thông tin lưu trữ tại nút đó. Thông tin này có thể chỉ là một số, một ký tự, cũng có thể là một tập hợp dữ liệu rất phức tạp. Hai trường Llink và Rlink chứa
các liên kết trái và phải. Nếu
cây là
cây nhị phân Llink trỏ tới con trái của nút, Rlink trỏ tới con phải của nút. Nếu
cây là
cây tổng quá, Llink trỏ tới con cực trái và Rlink trỏ tới em kế cận phải của nút đó. Do đó danh sách
các nút biểu diễn một
cây tổng quát, khi được xem là biểu diễn của
cây nhị phân sẽ cho một
cây nhị phân.
Cây nhị phân này được gọi là
cây nhị phân tương đương với
cây tổng quát ban đầu.3.2 Biểu diễn
cây nhị phân bằng mảngCây nhị phân đầy đủ là
cây nhị phân, trong đó mỗi nút trong chỉ có hai con.
Cây nhị phân hoàn chỉnh là
cây nhị phân đầy đủ trong đó tất cả
các lá đề ở mức cao nhất. Một
cây nhị phân hoàn chỉnh chiều cao h chỉ có 2h +1 – 1 nút.Người ta có thể dùng một mảng gồm 2h +1 -1 phần tử để biểu diễn
cây hoàn chỉnh, bằng cách lần lượt lưu trữ thông tin của mỗi nút vào mảng theo thứ tự từ trên xuống dưới, từ trái sang phải. Khi đó Con trái của nút thứ i là phần tử thứ 2*i6Con phải là phần tử thứ 2*i +1Cha của phần tử thứ i là phần tử thứ int(i/2).Nếu
cây là không hoàn chỉnh, ta gán giá trị Null cho
các vị trí còn thiếu so với
cây nhị phân hoàn chỉnh.Một cách khác, dùng mảng hai chiều trong dòng thứ nhất ghi
các thông tin của nút, dòng thứ hai ghi chỉ số của nút cha của nút đó với dấu (+)nếu nút hiện tại là con trai, với dấu (–) nếu nút hiện tại là con phải cua nút cha.II.
Các dạng
cây thường gặp1.
Cây nhị phân1.1 Định nghĩaCây nhị phân là
cây mà mỗi nút có tối đa 2
cây con
Cây nhị phân có thể ứng dụng trong nhiều bài toán thông dụng, Ví dụ 1.2. Một số tính chất của
cây nhị phân: - Số nút ở mức I ≤ 2I-1. - Số nút ở mức lá ≤ 2h-1, với h là chiều cao của cây. - Chiều cao của
cây h ≥ log2N (N - số nút trên trong cây). 1.3. Biểu diễn
cây nhị phân T
Cây nhị phân là một cấu trúc bao gồm
các phần tử (nút) được kết nối với nhau theo quan hệ “cha-con” với mỗi cha có tối đa 2 con. Để biểu diễn
cây nhị phân ta chọn
phương pháp cấp phát liên kết. Ứng với một nút, ta dùng một biến động lưu trữ
các thông tin: 7+ Thông tin lưu trữ tại nút. + Địa chỉ nút gốc của
cây con trái trong bộ nhớ. + Địa chỉ nút gốc của
cây con phải trong bộ nhớ. Khai báo như sau: typedef struct tagTNODE { Data Key;//Data là kiểu dữ liệu ứng với thông tin lưu tại nút struct tagNODE *pLeft, *pRight; 5}TNODE; typedef TNODE *TREE; 1.4.
Các thao tác trên
cây nhị phân Thăm
các nút trên
cây theo thứ tự trước (Node-Left-Right) Thăm
các nút trên
cây theo thứ tự giữa (Left- Node-Right) Thăm
các nút trên
cây theo thứ tự sau (Left-Right-Node)2.
Cây nhị phân tìm kiếmCây nhị phân tìm kiếm là
cây nhị phân trong đó tại mỗi nút, khóa của nút đang xét lớn hơn khóa của tất cả
các nút thuộc
cây con trái và nhỏ hơn khóa của tất cả
các nút thuộc
cây con phải.Ví dụ:Nhờ ràng buộc về khóa trên CNPTK, việc tìm kiếm trở nên có định hướng. Hơn nữa, do cấu trúc
cây việc tìm kiếm trở nên nhanh đáng kể. Chi phí tìm kiếm trung bình chỉ khoảng log2N.Trong thực tế, khi xét đến CNP chủ yếu người ta xét CNPTK2.1
Các thao tác trên cây2.1.1 Thăm
các nút trên cây2.1.2 Tìm một phần tử X trong cây8Dễ dàng thấy rằng số lần so sánh tối đa phải thực hiện để tìm phần tử X là bằng h, với h là chiều cao của câyVí dụ: tìm phần tử 55So sánh X=55 với gốc là 44 vì 55>44 nên sẽ tìm kiếm nhánh bên phải của câyTiếp theo lại so sánh X với gốc của
cây con nhỏ 88 vì 55 <88 nên tìm ở nhánh trái của
cây có gốc 88Tiếp tục so sánh với
cây con gốc 59: 55<59 tìm nhánh bên trái -> kết quả2.1.3 Thêm một phần tử X vào câyViệc thêm một phần tử X vào
cây phải bảo đảm điều kiện ràng buộc của CNPTK. Ta có thể thêm vào nhiều vị trí khác nhanh trên cây, nhưng nếu thêm vào một nút là thì sẽ dễ nhất do ta có thể thực hiện quá trình tương tực thao tác tìm kiếm. Khi chấm dứt quá trình tìm kiếm ta sẽ tìm đượ vị trí cần thêm.Hàm insert trả về giá trị –1, 0, 1 khi không đủ bộ nhớ, gặp nút cũ hay thành công: int insertNode(TREE &T, Data X) { if(T) { if(T->Key == X) return 0; //đã có if(T->Key > X) return insertNode(T->pLeft, X); else return insertNode(T->pRight, X); } T = new TNode; if(T == NULL) return -1; //thiếu bộ nhớ T->Key = X; T->pLeft =T->pRight = NULL; return 1; //thêm vào thành công }2.1.4. Hủy một phần tử có khóa x 9Việc hủy một phần tử X ra khỏi
cây phải bảo đảm điều kiện ràng buộc của CNPTK. Có 3 trường hợp khi hủy nút X có thể xảy ra: X - nút lá. X - chỉ có 1
cây con (trái hoặc phải). X có đủ cả 2
cây con Trường hợp thứ nhất: chỉ đơn giản hủy X vì nó không móc nối đến phần tử nào khác. Trường hợp hai: Trước khi hủy X ta móc nối cha của X với con duy nhất của nó.Trường hợp cuối cùng: ta không thể hủy trực tiếp do X có đủ 2 con => ta sẽ hủy gián tiếp. Thay vì hủy X, ta sẽ tìm một phần tử thế mạng Y, Phần tử này có tối đa một con. Thông tin lưu tại Y sẽ được chuyển lên lưu tại X. Sau đó, nút bị hủy thật sự sẽ là Y giống như 2 trường hợp đầu.Vấn đề là phải chọn Y sao cho khi lưu Y vào vị trí của X,
cây vẫn là CNPTK.Sẽ có 2 phần tử thỏa mãn yêu cầu:Phần tử nhỏ nhất (trái nhất ) trên
cây con phải.Phần tử lớn nhất(Phải nhất)trên
cây con trái/Việc chọn lựa phần tử nào là phần tử thế mạng hoàn toàn phụ thuộc vào ý thích của người lập trình. Ở đây, chúng ta sẽ chọn phần tử(phải nhất) trên
cây con trái làm phần tử thế mạng.10[...]... đề trên ta cùng tìm hiểu một số
phương pháp duyệt cây. 3 2.5-Left Node RightCách duyệt: Trước tiên thăm
các nốt của
cây con trái sau đó thăm nốt gốc rồi đến cây con phải. Giải thuật:Algorithm recursive_LNR Input: subroot là con trỏ node gốc và hàm visit Output: kết quả phép duyệt 1. if (cây con không rỗng) 1.1. Call recursive_LNR với nhánh trái của subroot 1.2.
Duyệt node subroot bằng hàm visit... rỗng khi mất gốc sẽ trở thành một rừng.3.Biểu diễn cây. Có nhiều
phương pháp biểu diễn cây. Cách thường dùng nhất là biểu diễn mỗi nút như một dữ liệu kiểu bản ghi, mỗi nút chứa
các con trỏ tới
các con hoặc cha của nó, hoặc cả hai.
Cây cũng có thể biểu diễn bằng
các mảng cùng với quan hệ giữa
các vị trí trong mảng.3.1 Biểu diễn bằng
các nút với
các con trỏMỗi nút là một dữ liệu kiểu bản ghi với... chứa
các liên kết trái và phải. Nếu
cây là
cây nhị phân Llink trỏ tới con trái của nút, Rlink trỏ tới con phải của nút. Nếu
cây là
cây tổng quá, Llink trỏ tới con cực trái và Rlink trỏ tới em kế cận phải của nút đó. Do đó danh sách
các nút biểu diễn một
cây tổng quát, khi được xem là biểu diễn của
cây nhị phân sẽ cho một
cây nhị phân.
Cây nhị phân này được gọi là
cây nhị phân tương đương với cây. .. mạng.10 III
Các phương pháp duyệt cây 1. Định nghĩa Duyệt một
cây là một trình tự làm việc với
các nút trong cây, trình tự này giống như một chuyến đi qua
các nút trên
cây theo
các liên kết cha-con.
Các giải thuật
duyệt khác nhau về thứ tự “viếng thăm” giữa một nút cha và
các nút con.2. Một số
phương pháp duyệt cây: Back trackingBreadth first searchDepth first search.Node Left RightLeft Node Right... của X,
cây vẫn là CNPTK.Sẽ có 2 phần tử thỏa mãn yêu cầu:Phần tử nhỏ nhất (trái nhất ) trên
cây con phải.Phần tử lớn nhất(Phải nhất)trên
cây con trái/Việc chọn lựa phần tử nào là phần tử thế mạng hoàn toàn phụ thuộc vào ý thích của người lập trình. Ở đây, chúng ta sẽ chọn phần tử(phải nhất) trên
cây con trái làm phần tử thế mạng.10 III
Các phương pháp duyệt cây 1. Định nghĩa Duyệt một
cây là... nghĩa Cây nhị phân là
cây mà mỗi nút có tối đa 2
cây con
Cây nhị phân có thể ứng dụng trong nhiều bài tốn thơng dụng, Ví dụ 1.2. Một số tính chất của
cây nhị phân: - Số nút ở mức I ≤ 2I-1. - Số nút ở mức lá ≤ 2h-1, với h là chiều cao của cây. - Chiều cao của
cây h ≥ log2N (N - số nút trên trong cây) . 1.3. Biểu diễn
cây nhị phân T Cây nhị phân là một cấu trúc bao gồm
các phần tử (nút) được... }}18 Ví dụ: Chiều dài
các nút trong
cây trên:Nút gốc có chiều dài bằng 1. Các nút: T1, T2 , T3 bằng 2 -> tổng bằng 6. Các nút: T5, T6, T7 , T8, T9 , T10 bằng 3 -> tổng bằng: 18 Các nút: T11, T12, T13 , T14, T15 , T16 bằng 4 -> tổng bằng 24Tổng đường đi của
cây trên là : 1 + 6 + 18 + 24 = 49.2.11. Rừng:Rừng là tập hợp
các cây. Một
cây khác rỗng khi mất... tổng quát ban đầu.3.2 Biểu diễn
cây nhị phân bằng mảng Cây nhị phân đầy đủ là
cây nhị phân, trong đó mỗi nút trong chỉ có hai con.
Cây nhị phân hoàn chỉnh là
cây nhị phân đầy đủ trong đó tất cả
các lá đề ở mức cao nhất. Một
cây nhị phân hoàn chỉnh chiều cao h chỉ có 2h +1 – 1 nút.Người ta có thể dùng một mảng gồm 2h +1 -1 phần tử để biểu diễn
cây hoàn chỉnh, bằng cách lần lượt lưu trữ thông tin... int(i/2).Nếu
cây là khơng hồn chỉnh, ta gán giá trị Null cho
các vị trí cịn thiếu so với
cây nhị phân hồn chỉnh.Một cách khác, dùng mảng hai chiều trong dòng thứ nhất ghi
các thơng tin của nút, dịng thứ hai ghi chỉ số của nút cha của nút đó với dấu (+)nếu nút hiện tại là con trai, với dấu (–) nếu nút hiện tại là con phải cua nút cha.II.
Các dạng
cây thường gặp1.
Cây nhị phân1.1 Định nghĩa Cây nhị... một
phương pháp nhằm giải quyết vấn đề tìm kiếm dữ liệu có hiệu quả và nhanh nhất ln được sự quan tâm của
các nhà phát triển phần mềm. Thông thường dữ liệu được biểu diễn dưới dạng
các danh sách liên kết. Việc truy xuất dữ liệu chưa đạt hiệu quả cao. Sử dụng cấu trúc dữ liệu dạng
cây là một giải pháp nhằm tăng hiệu xuất trong
các thao tác xử lý. Vấn đề đặt ra: Với việc sử dụng cấu trúc dạng cây, . log2(n).11III Các phương pháp duyệt cây1 . Định nghĩaDuyệt một cây là một trình tự làm việc với các nút trong cây, trình tự này giống như một chuyến đi qua các nút. trên cây theo các liên kết cha-con. Các giải thuật duyệt khác nhau về thứ tự “viếng thăm” giữa một nút cha và các nút con.2. Một số phương pháp duyệt cây: Back