Giải thuật prim
Niên luận 1 GIỚI THIỆU ĐỀ TÀI ------- ϑ ------- Trong mọi thời đại, việc tìm ra lời giải tối ưu cho một bài toán nào đó là một vấn đề rất khó để thực hiện. Đã có rất nhiều nghiên cứu để tìm ra các phương pháp hữu hiệu giải quyết các bài toán tối ưu này. Tuy nhiên, từ khi những tư tưởng cơ bản của lý thuyết đồ thị được đề xuất thì việc giải các bài toán trên đã trở nên dễ dàng hơn, đặc biệt là một số bài toán có ứng dụng vào thực tế. Một trong những bài toán trong thực tế ta thường gặp là: làm thế nào để xây dựn một hệ thống giao thông với chi phí thấp nhất; làm thế nào để tìm phương án vận chuyển hàng hóa với thời gian ngắn nhất hay với chi phí thấp nhất… và những bài toán trên có thể tìm ra lời giải dễ dàng bằng cách đưa về mô hình đồ thị. Hiểu rõ và cài đặt được các thuật toán, cũng như tìm ra lời giải tối ưu cho một bài toán nào đó dựa trên những mô hình về đồ thị đã học là một yêu cầu không thể thiếu đối với sinh viên nghành Tin học. Tuy nhiên, trong giới hạn của đề tài, em không thể trình bày tất cả các thuật toán có liên quan đến đồ thị mà ở đây tôi chỉ trình bày “Giải thuật Prim”. Đây cũng là nội dung chính của đề tài em đã chọn. Mục tiêu: • Nắm vững các khái niệm về đồ thị, các cách biểu diễn đồ thị trên máy tính và tình liên thông. • Nắm vững thuật toán tìm kiếm trên đồ thị “Giải thuật Prim”. Yêu cầu cần đạt: • Cập nhật dữ liệu: tạo file dữ liệu mới, diều chỉnh dữ liệu của file cũ. • Biểu diễn được đồ thị từ các file dữ liệu trên. • Kiểm tra tính liên thông và xác định bộ phận liên thông của đồ thị. • Xác định cây trọng lượng nhỏ nhất ( nếu đồ thị liên thông), ngược lại thì báo đồ thị không liên thông. Xác định đường đi ngắn nhất giữa hai đỉnh của một đồ thị (nếu hai đỉnh thuộc cùng một bộ phận liên thông), ngược lại thông báo không tìm thấy đường đi. Hướng giải quyết: • Về lý thuyết: tìm hiểu các khái niệm về đồ thị, giải thuật được yêu cầu trong đề tài. • Về chương trình: Sử dụng ngôn ngữ Visual Basic .Net ( Visual Basic 2008) để viết chương trình, cài đặt thuật toán cũng như 1 Niên luận 1 thực hiện các yêu cầu vẽ biểu diễn đồ thị trên màn hình đồ họa. Nội dung của Niên luận 1 được chia thành ba phần cụ thể như sau: Phần I: Cơ sở lý thuyết Chương 1: Một số khái niệm cơ bản về lý thuyết đồ thị: Trong chương này sẽ giới thiệu cho chúng ta nắm được một số khái niệm cơ bản về đồ thị cũng như một số khái niệm có liên quan. Chương 2: Tìm kiếm trên đồ thị: Giới thiệu cho chúng ta một số phương pháp tìm kiếm trên đồ thị như tìm theo chiều rộng, tìm theo chiều sâu… Chương 3: Giải quyết một số bài toán bằng đồ thị: Nội dung chương này sẽ trình bày một số bài toán trong thực tế được đưa về đồ thị và các giải thuật để giải các bài toán đó. Phần II: Chương trình minh họa Chương 1: Giới thiệu chương trình: Chương này sẽ giới thiệu cho chúng ta biết về ngôn ngữ sử dụng để lập trình cũng như cách tổ chức dữ liệu của chương trình. Chương 2: Phân tích giải thuật và cài đặt chương trình: Phân tích lại một số giải thuật và cài đặt chương trình. Chương 3: Hướng dẫn sử dụng: Hướng dẫn sử dụng chương trình và thực hiện một số ví dụ minh họa. Phần III: Kết luận và đánh giá Đánh giá những kết quả đã đạt được cũng như các hạn chế và đưa ra hướng phát triển của Niên Luận 1. Dù không tránh khỏi những khiếm khuyết do hạn chế về mặt thời gian cũng như kiến thức nhưng em đã nỗ lực hết sức. Sau hơn 1 tháng thực hiện, Niên luận 1 của em đã hoàn thành, đáp ứng được các yêu cầu của đề tài và đã cố gắng phát triển đề tài này trong phạm vi có thể. Em rất mong nhận được những ý kiến đóng góp quý báu của quý thầy cô và bạn bè để đề tài này được hoàn thiện hơn. 2 Niên luận 1 PHẦN 1 CƠ SỞ LÝ THUYẾT Chương 1: Một số khái niệm về lý thuyết đồ thị . 4 Chương 2 : Các thuật toán tìm kiếm trên đồ thò 8 Chương 3 : Giải quyết các bài tốn bằng đồ thị . 10 Chương I : MỘT SỐ KHÁI NIỆM VỀ LÝ THUYẾT ĐỒ THỊ 3 Niên luận 1 I.1. MỘT SỐ KHÁI NIỆM VỀ ĐỒ THỊ : I.1.1 Đồ thị Đồ thị là một cấu trúc rời rạc bao gồm các đỉnh và các cạnh nối các đỉnh này. Ký hiệu: G=(V,E) Trong đó : V : tập các đỉnh của đồ thị E : tập các cạnh của đồ thị Chúng ta phân biệt các loại đồ thị khác dựa trên 2 tiêu chuẩn : • Kiểu . • Số lượng cạnh nối 2 đỉnh nào đó của đồ thị. Trong phần này chúng ta đề cập đến hai loại đồ thị : • Đồ thị có hướng . • Đồ thị vô hướng .ư Ví dụ. Hình I.1 là một số dạng đồ thị I.1.2. Đồ thị vô hướng : Đồ thị vô hướng G = (V, E) bao gồm : • V là đỉnh của đồ thị . • E là tập các cặp không có thứ tự gồm hai phần tử khác nhau của V gọi la các cạnh, tức là (u, v) = (v,u). Ví dụ: Đồ thị Hình I.1 a là một đồ thị vô hướng với : • Tập hợp các đỉnh : [ 1, 2, 3, 4, 5 ] • Tập các cạnh : [ (1,4), (1,5), (2,4), (2.5), (3,4), (3,2) ] I.1.3 Đồ thị có hướng : Đồ thị có hướng G = ( V, E ) bao gồm : • V là tập các đỉnh của đồ thị • E là tập các cặp có thứ tự gồm hai phần tử khác nhau thuộc V được gọi là các cung, tức là (u,v) ≠ (v,u). Cung 4 Hình I.1 biểu diễn đồ thị vô hướng (a) và đồ thị có hướng (b) a b 4 3 2 1 5 4 3 2 1 5 Niên luận 1 (u,v) được gọi là cung đi từ đỉnh u đến đỉnh v, ký hiệu : u v . Ví dụ: Đồ thị Hình I.1b là một đồ thị có hướng với : • Tập các đỉnh : { 1, 2, 3, 4, 5} • Tập các cung : {(1,5), (2,5), (3,5), (4,1), (4,2)}. Trong giới hạn của đề tài, từ đây về sau khi nói đến đồ thị thì chúng ta sẽ hiểu đố là đồ thị vô hướng. I.2. ĐƯỜNG ĐI VÀ TÍNH LIÊN THÔNG I.2.1 Đường đi và chu trình : Đường đi độ dài n từ đỉnh u đến đỉnh v, trong đó n là số nguyên dương, tên đồ thị ( có hướng ) G = (V,E) là dãy : x 0, x 1, x 2, …, x n-1, x n . Trong đó u=x 0 , v=x n , (x i , x i+1 ) ∈ E, i = 0, 1, 2, …, n-1. Chu trình là đường đi có đỉnh đầu trùng đỉnh cuối . Ví dụ: Xét đồ thị trong hình I.1a : • 1, 5, 2, 4, 3 : là đường đi độ dài 5 đỉnh 1 đến đỉnh 3. • 1, 4, 2 , 5,1 : là một chu trình. • 1, 3, 2, 5 : không là đường đi vì (1, 3) không phải là cạnh của đồ thị ( không thuộc E). I.2.2. Tính liên thông : Đồ thị có hướng G = (V, E) được gọi là liên thông nếu tìm được đường đi giữa hai đỉnh bất kỳ của nó. I.2.3. Cây và cây khung: Cây là đồ thị vô hướng liên thông không có chu trình. Giả sử đồ thị G =(V, E) là đồ thị liên thông. Cây T =(V, F)với F ⊂ E được gọi là cây khung của đồ thị G. Ví dụ: Đồ thị hình I.2a có cây khung hình I.2b, I.2c I.3. BIỂU DIỄN ĐỒ THỊ TRONG MÁY TÍNH Để cài đặt các giải thuật và giải quyết các bài toán về đồ thị bằng máy tính, chúng ta cần phải tìm những cấu truc dữ liệu thích hợp để biểu diễn đồ thị. Việc chọn một loại cấu trúc nào đó để biểu diễn đồ thị có ảnh hưởng rất lớn đến hiệu quả thực hiện của thuật toán, vì vậy việc chọn lựa một loại cấu trúc dữ liệu để biểu diễn đồ thị phải dựa vào từng tình huống cụ thể của bài toán. 5 Hình I.2 : biểu diễn đồ thị vô hướng a và cây khung b, c (a) 4 3 2 1 5 (c) 4 3 2 1 5 (b) 4 3 2 1 5 Niên luận 1 Có rất nhiều phương pháp để biểu diễn một đồ thj bằng cấu trúc dữ liệu như: dùng ma trận kề, dùng ma trận trọng số, dùng danh sách liên kết, danh sách cạnh… Tuy nhiên, việc dùng danh sách liên kết và danh sách cạnh để biểu diễn cho đồ thị vô hướng tỏ ra không hiệu quả trong việc tìm kiếm các đỉnh, cạnh cũng như trong việc them hay xóa một đỉnh ( hoặc một cạnh) ra khỏi đồ thi. Vì vậy, trong phần này chúng ta chỉ xét hai phương pháp biểu diễn đồ thj trên máy tính bởi các cấu trúc dữ liệu : • Dùng ma trận kề. • Dùng ma trận trọng số. I.3.1. Biểu diễn ma trận bởi ma trận kề : Được dùng để biểu diễn cho đồ thị không có trọng số. Trong cách biểu diễn này, đồ thị vô hướng G =(V, E) với tập các đỉnh V = {1, 2, …, n} và tập các cạnh E ={e 1 , e 2 , …, e m }sẽ được lưu trữ trong một mảng hai chiều A = [1 n,1 n] Trong đó : Mảng A như trên được gọi là ma trận kề của đồ thị. Ta nhận thấy trong đồ thị vô hướng canh (i,j) và cạnh (j,i) biểu diễn cho cùng một cạnh của đồ thị nên ma trận kề của đồ thị vô hướng là ma trận đối xứng qua đường chéo chính. Ví dụ: Đồ thị trong hình I.3a được biểu diễn bởi ma trận kề trong hình I.3b 6 A[i,j] = 0 nếu (i,j) ∉ E 1 nếu (i,j) ∈ E ∀ i,j = 1,n ( a ) ( b ) 4 3 2 1 5 A =000110011101010111001100 0 Hình I.3 biểu diễn đồ thị bằng ma trận kề Niên luận 1 I.3.2. Biểu diễn đồ thị bởi ma trận trọng số : Được dùng để biểu diễn cho đồ thị có trọng số. Tương tự như trong cách biểu diễn đồ thị bằng ma trận kề, để biểu diễn cho đồ thị vô hướng G= (V,E) với tập đỉnh V = {1, 2, …,n} và tập cạnh E = {e 1 , e 2 , …, e m }, trong đó mỗi cạnh có một giá trị (trọng số), cũng được lưu trữ bằng một mảng hai chiều A = [1 n,1 n] với : Mảng A như trên được gọi là ma trận trọng số của đồ thị. Trong đó, θ có thể có giá trị 0, +∞, -∞ tùy thuộc từng trường hợp cụ thể. Giá trị A[i,j] = w, w ∈ (0,+∞), được gọi là trọng số của cạnh e. Ví dụ: Đồ thị trong hình I.4 được biểu diễn bởi ma trận kề trong hình I.4b 7 A[i,j] = w nếu (i,j) ∈ E θ nếu (i,j) ∉ E ∀ i,j = 1,n ( b ) A =00037001251501201303513001 73000 ( a ) 4 3 2 1 5 13 5 3 7 15 12 Hình I.4 biểu diễn ma trận có trọng số Niên luận 1 Chương 2 TÌM KIẾM TRÊN ĐỒ THỊ Có rất nhiều thuật toán về đồ thị được xây dựng trên cơ sở duyệt tất cả các đỉnh sao cho mỗi đỉnh của đồ thị chỉ được xét (ghé thăm) đúng một lần. Những thuật toán được xây dựng dựa trên cơ sỏ nêu trên được gọi là các thuật toán tìm kiếm trên đồ thị, các thuật toán này có vai trò quan trọng việc thiết kế các thuật toán khác trên đồ thị như tìm đường đi ngắn nhất, tìm cây trọng lượng nhỏ nhất … Trong chương này ta sẽ đề cập đến ba thuật toán tìm kiếm cơ bản thường được sử dụng trên đồ thị là : • Thuật toán tìm kiếm theo chiều sâu - (Depth First Search - DFS) . • Thuật toán tìm kiếm theo chiều rộng- (Breadth First Search - DFS) . • Tìm số thành phần liên thông . II.1. TÌM KIẾM THEO CHIỀU SÂU : (Depth First Search - DFS) Ý tưởng của thuật toán này có thể được trình bày như sau : Ta sẽ bắt đầu tìm từ một đỉnh v o nào đó của đồ thị, sau đó chọn u là một đỉnh tùy ý kề với v o và lặp lại quá trình trên với đỉnh u. Tại bước tổng quát ta đang xét đỉnh v. Nếu trong số các đỉnh kề của v ta tìm được một đỉnh w là chưa xét thì ta sẽ xét đỉnh này ( đặt w là đỉnh đã xét) và từ đó tiếp tục quá trình tìm kiếm, ngược lại nếu không còn đỉnh nào kề với v là đỉnh chưa xét thì ta sẽ quay lại tìm kiếm từ đỉnh mà trước đó ta đến được đỉnh v, khi đó đỉnh v được gọi là đỉnh đã duyệt xong. Việc tìm kiếm được dừng lại khi gặp lại đỉnh xuất phát và không thể đi sâu được nữa ( khi đỉnh xuất phát là đỉnh đã duyệt xong). Thuật toán DFS được mô tả trong thủ tục sau : Procedure DFS(v); Begin Chuaxet[v] := false; For u ∈ Ke(v) do If chuaxet[u] then DFS(u); End; 8 Ví dụ xét đồ thị hình II.1 Đỉnh xuất phát: đỉnh A Với thuật toansDFS thứ tự các đỉnh lần lượt được xét là : A, B, D, E, G, H, I, C, F Hoặc: A, C, F, B, E, G, H, I, D … … … A F C D B G I H E Hình I.1 Niên luận 1 II.2. TÌM KIẾM THEO CHIỀU RỘNG : (Breadth First Search - BFS) Trong thuật toán tìm kiếm theo chiều sâu, ta chọn một đỉnh v và thăm đỉnh đó ( đặt v là đỉnh đã xét và đưa đỉnh v vào trong hàng đợi ). Tại bước tổng quát, ta lấy đỉnh v đã được thăm ra khỏi hàng đợi, lần lượt xét tất cả các đỉnh u chưa được thăm nằm kề với v (đặt u là đỉnh đã xét và đưa đỉnh u vào hàng đợi). Quá trình trên sẽ được tiếp tục cho đến khi hàng đợi rỗng (không thể đến thăm đỉnh nào nữa). Quá trình trên có thể được mô tả bơi thủ tục sau: Procedure BFS(v); Begin Empty(hangdoi); Hangdoi <= v; Chuaxet[v] := false While hangdoi<>φ do Begin p <= hangdoi; For u ∈ Ke(v) do If chuaxet[u] then Begin hangdoi <= u; chuaxet[u] := false; End; End; End; Ví dụ: Xét đồ thị trong hình II.1 • Đỉnh xuất phát : A • Sau khi áp dụng giải thuật BFS, thứ tự các đỉnh được xét lần lượt là: A, B, C, D, E, F, G, I hoặc: A, C, B, F, E, D, G, H, I Ta nhận thấy, thuật toán DFS (hay BFS) có thể cho nhiều kết quả tùy thuộc vào cách xét đỉnh kề. Sau khi kết thúc thủ tục DFS (hay BFS) nếu tất cả các đỉnh của đồ thị đều được xét thì đồ thị là liên thông, ngược lại đồ thị có bộ phận liên thông. Thuật toán DFS và BFS sẽ được trình bày kỹ hơn trong chương 2 phần II. I.3TÌM CÁC THÀNH PHẦN LIÊN THÔNG CỦA ĐỒ THỊ. Ta nhận thấy thủ tục DFS(v) và DFS(v) cho phép ta thăm tất cả các đỉnh cùng thuộc một thành phần liên thông với đỉnh v. Do đó, số thành phần liên thông của đồ thị chính là số lần gọi đến thủ tục này. Vì vậy, nếu số lần gọi thủ tục là 1 thì ta có đồ thị liên thông, nếu số lần gọi thủ tục là n (n>1) thì đồ thị có n bộ phận liên thông. 9 Niên luận 1 Chương 3: GIẢI QUYẾT MỘT SỐ BÀI TOÁN BẰNG LÝ THUYẾT ĐỒ THỊ III.1. BÀI TOÁN CÂY KHUNG NHỎ NHẤT III.1.1. Phát biểu bài toán : Bài toán cây khung nhỏ nhất của đồ thị là một trong những bài toán tối ưu trên đồ thị tìm được ứng dụng trong nhiều lĩnh vực khác nhau của đời sống. Nội dung của bài toán được thể hiện như sau : Cho đồ thị vô hướng liên thông G =(V,E) với các tập đỉnh V = {1, 2, …, n} và tập các cạnh E = {e 1 , e 2 , …, e m }, mỗi cạnh e được gán cho một giá trị trọng số không âm. Bài toán đặt ra là trong tập các cây khung của đồ thị G hãy tìm ra một cây khung với độ dài nhỏ nhất. Cây khung như vậy được gọi là cây khung nhỏ nhất và bài toán như trên được gọi là bài toán cây khung nhỏ nhất. Để minh họa cho bài toán trên, ta hãy xét một trong những mô hình tiêu biểu của bài toán này: bài toán nối mạng máy tính : Ta cần nối mạng một hệ thống gồm n máy tính, các máy được đánh số từ 1 đến n. Biết chi phí nối máy i với máy j là a[I,j], (I,j=1_n). Hãy tìm cách nối mạng sao cho tổng chi phí nối mạng là nhỏ nhất. Để giải bài tán cây khung nhỏ nhất, chúng ta có thể liệt kê tất cả các cây khung của đồ thị và chọn ra một cây khung có trọng lượng nhỏ nhất. Tuy nhiên, trong trường hợp đồ thị đầy đủ thì cách này đòi hỏi một thời gian thực hiện rất lớn. Trong trường hợp này, thuật toán Prim tỏ ra rất hiệu quả để giải bài toán trên. III.1.2. Thuật toán Prim : Trong thuật toán Prim, ta gọi U là tập đỉnh kề của cạnh trong T (T – tập các cạnh của cây khung nhỏ nhất). • Ban đầu U chứa một đỉnh tùy ý trong G, còn T là tập cạnh rỗng. • Ở mỗi bước ta sẽ chọn (u,v) ngắn nhất sao cho u ∈ U và v ∈ V- U, sau đó thêm u vào U và thêm (u,v) vào T. Điều này đảm bảo rằng sau mỗi bước T luôn là một cây. Ta tiếp tục lặp lại bước như trên cho đến khi U=V, lúc đó T trở thành cây có trọng lượng nhỏ nhất của đồ thị G=(V,E). 10 [...]... Inc(u) Đúng DFS(u) END LƯU ĐỒ GIẢI THUẬT DFS(v) SttLienThong (biến tồn cục) kiểu Interger trong đó : 0 : đỉnh v chưa được xét LienThong[v] = SttLienThong : v thuộc miền liên thơng SttLienThong Khi kết thúc chương trình con này, nếu biến TestLienThong =1 thì đồ thị liên thơng, ngược lại LienThong sẽ chứa các thành phần liên thơng 19 Niên luận 1 II.2 GIẢI THUẬT PRIM: Thuật tốn Prim được mơ tả lại như sau... III.9 Kết quả được trả về khi kết thúc chương trình 27 Niên luận 1 PHẦN III KẾT LUẬN & HƯỚNG PHÁT TRIỂN I.KẾT QUẢ ĐẠT ĐƯỢC • Hiểu và cài đặt tốt giải thuật đã u cầu bằng ngơn ngữ VISUAL NET Giải thuật Prim Chương trình chạy ổn định, kết quả thực hiện giải thuật sau khi cài đặt và chạy chương trình đúng với kết quả của phần lý thuyết • Giao diện được thiết kế rất thân thiện với người dùng và dễ dàng... TÍCH GIẢI THUẬT VÀ CÀI ĐẶT CHƯƠNG TRÌNH 15 Niên luận 1 II.1 GIẢI THUẬT DFS, BFS VÀ TÌM THÀNH PHẦN LIÊN THƠNG: Ta nhận thấy thủ tục DFS(V) và BFS(v) chỉ cho phép ta xác định được tất cả đỉnh thuộc cùng một miền liên thơng với đỉnh v Tuy nhiên, đối với đồ thị khơng liên thơng, vấn đề đặt ra là làm sao để xác định được tất cả các thành phần liên thơng của đồ thị Trước hết, ta xết lưu đồ hai giải thuật. .. thể mơ tả giải thuật Prim thơng qua lưu đồ: 21 START Niên luận 1 Near[v]=1; Weight[v]=A[1,v] (với ∀ v = 2 n); j := 2; Inc(k) j