Tài liệu tham khảo kỹ thuật công nghệ, chuyên ngành tin học Xây dựng chương trình cài đặt các thuật toán
Trang 1Giải thuật sắp xếp dữ liệuLời mở đầu
Trong kỷ nguyên Công Nghệ Thông Tin, cấu trúc dữ liệu là nền tảng trongmọi hoạt động của các tổ chức.Cấu trúc dữ liệu được biểu hiện dưới nhiều khíacạnh Cấu trúc dữ liệu và giải thuật là một môn học cơ sở trong chương trìnhđào tạo trang bị cho sinh viên những kiến thức cơ bản về cấu trúc, dữ liệu khithiết kế và cài đặt các phần mềm
Trong các bước giải quyết một bài toán trên máy tính, công đoạn lập trìnhcó vai trò quan trọng nhất Việc ứng dụng tin học ngày càng phát triển, các yêucầu của thực tiễn ngày càng đa dạng Điều đó đòi hỏi phải thiết kế các giải thuậtgiải quyết một cách hiệu quả nhất vấn đề đặt ra.
Sắp xếp (sort) là một quá trình biến đổi một danh sách các đối tượng thànhmột danh sách thoả mãn một thứ tự xác định nào đó Sắp xếp đóng một vai tròrất quan trọng trong việc tìm kiếm dữ liệu Chẳng hạn, chúng ta thử hình dungxem một cuốn từ điển nếu các từ không được sắp xếp thứ tự mà người ta vẫnthường làm sẽ khó khăn thế nào trong việc tra cứu các từ Trong lĩnh vực kinhtế việc sắp lại càng quan trọng.
Với sự bùng nổ của công nghệ thông tin đã xuất hiện nhiều ngôn ngữ lậptrình ví dụ như foxpro, pascal,C+,C++, Trong đó, ngôn ngữ lập trình cấp caopascal là một ngôn ngữ có định kiểu mạnh mẽ, gần gũi với ngôn ngữ tự nhiênvà được nhiều người biết đến Đó chính là lý do mà nhóm chúng tôi đã lựachọn ngôn ngữ này để sử dụng cho bài toán sắp xếp.
Để giải quyết một bài toán sắp xếp ta có rất nhiều cách như: sắp xếp theokiểu lựa chọn, sắp xếp theo kiểu đổi chỗ, sắp xếp theo kiểu vun đống,
Thông qua ngôn ngữ lập trình pascal nhóm chúng tôi đã đưa ra một sốthuật toán sắp xếp cơ bản Mong được sự ủng hộ của thầy cô và các bạn.
Trang 2Giới thiệu và phân tích bài toán.
1)Tên đề tài
Xây dựng chương trình cài đặt các thuật toán:- Sắp xếp kiểu lựa chọn
- Sắp xếp kiểu đổi chỗ- Sắp xếp kiểu vun đống- Sắp xếp kiểu thêm dần- Sắp xếp kiểu phân đoạn
- Sắp xếp kiểu hoà nhập hai đường
2) Thời gian thực hiện chương trình
- Từ ngày 16/03/2006 - Đến ngày 16/04/2006
3) Mục đích của đề tài
Đề tài này nhằm các mục đích nghiên cứu các giải thuật sắp xếp, cài đặtchương trình chạy cụ thể cho từng giải thuật, phân tích tính hiệu quả và phạmvi ứng dụng của từng giải thuật Và như vậy với mỗi bài toán cụ thể, ta có thểứng dụng giải thuật phù hợp nhất cho bài toán để xửu lý dữ liệu một cách hoànhảo nhất.
Trang 3I Sắp xếp kiểu chèn ( thêm dần ) – insertion sort
1 Lý thuyết liên quan a Cấu trúc dữ liệu:
- Cấu trúc kiểu mảng.
b Giải thuật:
* Ý tưởng giải thuật:
- Ban đầu coi dãy khoá chỉ có dãy khoá K1 đã được sắp xếp, khi xétthem dãy khóa K2, ta phải so sánh K2 với K1 để tìm chỗ thích hợp chèn K2vào Dãy K1 và K2 đã được sắp xếp sau đó xét them K3 ta phải so sánh K1 vàK2 để tìm chỗ chèn K3 vào cho đến Kn được chèn vào đúng chỗ Khi đó thuậttoán kết thúc
* Giải thuật:
Procedure Insert_sort (K,n)
{ Để đảm bảo việc chèn được thực hiện ngay từ khoá đầu tiên ta đưa vàodãy khoá sắp xếp một khoá giả có giá trị nhỏ hơn tất cả các khóa thực sự trongdãy và đứng ở đầu dãy
K[0]= - ; x=K[i]
X: lưu trữ khoá đang xét ở lượt thứ i}1.( Khởi tạo biến)
K[0]:= -;2.( Sắp xếp)for i:=2 to n do
x=K[i]; j= i-1 ( j là số khoá đã được sắp xếp trước khoá k[i])while x < K[j] do K[j +1] := K[j]
j:=j -1; end;K[ j+1] :=x;End;
Trang 4c Mô tả hoạt động của giải thuật sắp xếp theo kiểu chèn:
Ví dụ 1-1 Sắp xếp mảng gồm 10 mẩu tin đã cho trong ví dụ11
KhoáBước
a[1] a[2] a[3] a[4] a[5] a[6] a[7] a[8] a[9] a[10]
Trang 5Dừng
Trang 6II Sắp xếp theo kiểu nổi bọt (bubble_sort)
1 Lý thuyết liên quan đến giải thuật sắp xếp:
- Sử dụng cấu trúc mảng
2 Ý Tưởng giải thuật:
Dãy khoá cần sắp xếp được duyệt từ dưới lên,nếu trên đường đi gặp haikhoá kế cận ngược chiều sắp xếp thì đổi chỗ va quá trình lặp lại Như vậy saulượt thứ nhất khoá nhỏ nhất được xắp ở vị trí nhỏ nhất, lượt thứ hai được sắpxếp vào vị trí thứ 2 cứ như thế cho đến khi tất cả các khoá được sắp xếp.
For i:=1 to n-1 do
For j:=n down to i+1 do beginIf k[j]<k[j-1] then begin
* Mô tả hoạt động giải thuật sắp xếp nổi bọt
Trang 7Ví dụ 1-2: Sắp xếp mảng gồm 10 mẩu tin đã cho trong ví dụ 1-1
KhoáBước
a[1] a[2] a[3] a[4] a[5] a[6] a[7] a[8] a[9] a[10]
Trang 10III Sắp xếp kiểu lựa chọn( Selection sort).
1 Lý thuyết liên quan:
* Cấu trúc dữ liệu;
- Sử dụng cấu trúc mảng.
2 Giải thuật.
a Ý tưởng giải thuật.
- Ở lượt thứ I của giải thuật, ta phải lấy ra phần tử đầu tương ứng đầu dãyvà sau đó tìm min dãy còn lại Ki, Ki+1,…,Kn Rồi so sánh min đó với phần tửđầu dãy.
Trang 11Nếu số min nhỏ hơn phần tử đầu dãy thì đổi chỗ Sau jlựơt thì jkhoá nhỏhơn sẽ được xếp vào vị trí thứ nhất, thứ hai, thứ jtương ứng Thực hiện n-1 lầnlượt
b Giải thuật.
Nội dung của phương pháp này là ở bước thứ I (i= 1,2, ,n-1) ta lựa chọnphần tử nhơ nhất trong dãy a[i] a[n] rồi đổi chỗ phần tử này với phần tử a[i].Cuối cùng ta sẽ có dãy a[i] a[n] có thứ tự.
Procedure Select_sort(k,n)1.Khởi tạo.
for i:=1 to n-1 begin
m:=I {m: chỉ số của phần tử min}for j:= i+1 to n do
if K[j]<K[m] then m:=j;if K[m]<K[i] then beginX:=K[m]
End; 2.Return.
c Mô tả hoạt động của sắp xếp kiểu lựa chọnHình 2-1: Sắp xếp chọn
Ví dụ1-3: Sắp xếp mảng gồm 10 mẩu tin có khóa là các số nguyên: 5, 6,
2, 2, 10, 12, 9, 10, 9 và 3
a[1] a[2] a[3] a[4] A[5] a[6] A[7] a[8] a[9] a[10]
Trang 13IV Sắp xếp kiểu vun đống ( heap sort)
1 Lý thuyết liên quana Cấu trúc dữ liệu
- Sử dụng cấu trúc kiểu mảng.
b Giải thuật;
* Ý tưởng giải thuật:
Thực hiện sắp xếp đối với cây nhị phân hoàn chỉnh.
Trang 14Giải thuật gồm hai phần:
+ Giai đoạn I: Tạo đống ban đầu, gồm 2 bước:
- Bước 1: Dựng cây nhị phân ban đầu, gồm 2 bước khoá ban đầu ( gốccủa cây là khoá đầu dãy ), thực hiện từ trên xuống dưới, từ trái sang phải, hếtmức này sang mức khác Cây nhị phân được lưu trữ kế tiếp trong máy ( nếunhư nút cha có chỉ sô là I thì 2 con có chỉ số là 2i, 2i+1
Ngược lại: nếu như mức con có chỉ số là jthì nút cha có chỉ số [j/2]
- Bước 2: Tạo đống ban đầu (đống: là cây nhị phân hoàn chỉnh mà khoánut cha > khoá nút con Sau khi tạo đống ban đầu, khoá lớn nhất nằm ở gốc củacây.
+ Giai đoạn 2: Thực hiện sắp xếp có nhiều lựơt được thực hiện, mỗi lượtgồm 2 bước.
- Bước 1: Đưa khoá trội về đúng vị trí sắp xếp bằng cách đổi chỗ chokhoá trội cho khoá đang ở vị trí đó ( từ dưới lên và từ phải sang trái, mức nàysang mức khác)
- Bước 2: Vun lại thành đống đối với cây nhị phân sau khi đã loại khoátrội ra khỏi đống ( chọn con lớn nhất trong 2 con để đưa lên).
Quá trình đươc lặp lại cho đến khi cây rỗng ( tất cả các khoá được sắpxếp ).
C Giải thuật.
{ Việc thực hiện vun đống được thực hiện lặp đi lặp lại nhiều lần nên tasẽ xây dựng 1 thủ tục để thực hiện vun đống, với cây có gốc là I và có n nút }.
Procedure Vundong (i,n)
{Giải thuật nhăm vun đống đối với cây nhị phân hoàn chỉnh có gốc là Imà 2 cây con có gốc tương ứng 2i, 2i+1, đã là đống.
1{khởi tạo}.
{ Khoá cha: là biến lưu trữ nút cha}Khoacha=K[i]
jchỉ số của các con.
Trang 15while j,<n do begin
{Tìm con lớn nhất trong 2 con }.If j<n and K[j] <K[j+1] thenj: =j+1;
{So sánh khoá cha lớn hơn con lớn nhất}If Khoacha[j/2]=Khoacha;
{Đưa khoá cha vào đúng vị trí}return; end;
3 { Khoá con lớn nhất > Khoacha}K[ /2]= K[j] ;
j:= 2j
{Chuyển khoá con lớn nhất lên và đi xuống}end;
K[ /2]= Khoacha;End;
3 Return.
Giải thuật Heap_sort.
Khi tìm phần tử nhỏ nhất ở bước i, phương pháp sắp xếp chọn trực tiếpkhông tận dụng được các thông tin đã có được do các phép so sánh ở bước i-1.Vì lý do trên người ta tìm cách xây dựng một thuật toán sắp xếp có thể khắcphục nhược điểm này.
Mấu chôt để giải quyết vấn đề vừa nêu là phải tìm ra được một cấu trúcdữ liệu cho phép tích lũy các thông tin về sự so sánh giá trị các phần tử trongqua trình sắp xếp Giả sử dữ liệu cần sắp xếp là dãy số : 5 2 6 4 8 1được bố trítheo quan hệ so sánh và tạo thành sơ đồ dạng cây như sau :
Trang 16Trong đó một phần tử ở mức i chính là phần tử lớn trong cặp phần tử ởmức i+1, do đó phần tử ở mức 0 (nút gốc của cây) luôn là phần tử lớn nhất củadãy Nếu loại bỏ phần tử gốc ra khỏi cây (nghĩa là đưa phần tử lớn nhất về đúngvị trí), thì việc cập nhật cây chỉ xảy ra trên những nhánh liên quan đến phần tửmới loại bỏ, còn các nhánh khác được bảo toàn, nghĩa là bước kế tiếp có thể sửdụng lại các kết quả so sánh ở bước hiện tại Trong ví dụ trên ta có :
Loại bỏ 8 ra khỏi cây và thế vào các chỗ trống giá trị -? để tiện việc cậpnhật lại cây :
Có thể nhận thấy toàn bộ nhánh trái của gốc 8 cũ được bảo toàn, do vậybước kế tiếp để chọn được phần tử lớn nhất hiện hành là 6, chỉ cần làm thêmmột phép so sánh 1 với 6.
Trang 17Tiến hành nhiều lần việc loại bỏ phần tử gốc của cây cho đến khi tất cảcác phần tử của cây đều là -?, khi đó xếp các phần tử theo thứ tự loại bỏ trêncây sẽ có dãy đã sắp xếp Trên đây là ý tưởng của giải thuật sắp xếp cây.
Procedure Heap_sort (k,n)1{khởi tạo đống ban đầu};for i:= n div2 downto 1 do call Vundong ( 1,n);
{ Thực hiện vun đống n-1}.Vundong(1,i) ;
d Mô tả hoạt động minh họa kiểu sắp xếp trên.
V Sắp xếp theo kiểu Quick_sort.
1 Lý thuyết liên quan.a Cấu trúc dữ liệu
- Sử dụng cấu trúc kiểu mảng;
b.Giải thuật:
* Ý tưởng giải thuật:
- Ban đầu chọn khoá ngẫu nhiên làm khoá “ chốt”, sau lượt sắp xếp thìbảng khoá sẽ được chia thành 2 bảng con:
Bảng khoá trước chốt: chứa khoá nhỏ hơn chốt.
Bảng khóa sau khi chốt chứa các khoá lớn hơn khoá chốt.
Trang 18Muốn vậy các khoá trong dãy (ki, kj) phải được so sánh với khoá chốt đểđổi chỗ cho nhau, đổi chỗ cho chốt Nếu nhỏ hơn chốt và nằm trước chốt Khiviệc đổi chỗ được hoàn thành thị khoá chốt sẽ được xếp đúng vị trí thực vàbảng khoá được chia thành 2 bảng khoá con Với mỗi bảng khoá con này 1 kỹthuật tương tự áp dụng cho đến khi tất cả các khoá được sắp xếp
- 1,Chọn khoá đầu dãy l: khoá chốt, để phát hiện 2 khoá cần phải đổi chỗcho nhau hoặc cho chốt ta sử dụng 2 chỉ số I,jthì K[i]; K[j]
Ban đầu: i:=2; jn
Khoá Ki > chot thì j:=j-1 cho đến khi+, Nếu Ki < chot; i:=i+1;
+, Nếu Ki > chot; Kj được sử dụng khoachotNếu Kj > chot thì j:=j-1
Cho đến khi Kj <chot thì ta dừng Thực hiện so sánh chỉ số i và j.
Nếu như i <jthì Ki đổi chỗ Kj và quá trình được lặp lại với Jcố định và ităng;
Nếu như i >= jthì khóa chốt được đưa vào đúng vị trí bằng đổi chỗ khoácho chốt cho K[j] Đến đây ta kết thúc 1 lượt sắp xếp và tăng quá trình lặp lạivới mỗi bảng khóa con cho đến khi tất cả khoá được sắp xếp.
* Giải thuật
Procedure Quick sort ( d, csduoi, cstren );
+ Ta sử dụng 1 khoá phụ có giá trị lớn hơn tất cả các khoá trong dãy thựcvà đặt ở cuối dãy, K[n+1] < K[i] ( i= 1, ,n ).Thêm biến khoachot để lưu trữkhoá chốt đang xét hiện thời Sử dụng 2 chỉ số i, jphát hiện hai khoá ki, kj cầnphải đổi chỗ 2 biến csduoi, cstren để xác định 2 biên của bảng khoá đang xét,biến lg = false để đánh dấu bảng khoá được phân làm 2 bảng khoá con chỉ số iban đầu i:=1; j:= n = cstren}
Procedure Quick_sort (k, csduoi, cstren);1{khởi tạo}.
lg:= true;
Trang 19D, Mô tả hoạt động của giải thuật sắp xếp kiểu Quick_sort.* V í dụ
Cho dãy số a:
Phân hoạch đoạn l =1,r=8: x = A[4] =5
Trang 20Phân hoạch đoạn l =1, r = 3: x = A[2] = 2
Phân hoạch đoạn l = 5, r = 8: x = A[6] = 6
Phân hoạch đoạn l = 7, r = 8: x = A[7] = 6
Dừng
Ðánh giá giải thuật
Hiệu qủa thực hiện của giải thuật QuickSort phụ thuộc vào việc chọn giátrị mốc Trường hợp tốt nhất xảy ra nếu mỗi lần phân hoạch đều chọn đượcphần tử median (phần tử lớn hơn (hay bằng) nửa số phần tử, và nhỏ hơn (haybằng) nửa số phần tử còn lại) làm mốc, khi đó dãy được phân chia thành 2 phầnbằng nhau và cần log2(n) lần phân hoạch thì sắp xếp xong Nhưng nếu mỗi lầnphân hoạch lại chọn nhằm phần tử có giá trị cực đại (hay cực tiểu) là mốc, dãysẽ bị phân chia thành 2 phần không đều: một phần chỉ có 1 phần tử, phần còn
Trang 21lại gồm (n-1) phần tử, do vậy cần phân hoạch n lần mới sắp xếp xong Ta cóbảng tổng kết
Trường hợp Ðộ phức tạp Tốt nhất n*log(n) Trung bình n*log(n) Xấu nhất n2
VI Sắp xếp kiểu hoà nhập hai đường ( giả sử dãy khoá cần sắp xếplà dãy số);
1 Lý thuyết có liên quan:a Cấu trúc dữ liệu:
- Sử dụng cấu trúc mảng;
b Ý tưởng giải thuật;
+ Cho phép hợp nhất các khoá của 2 bảng khoá đã được sắp xếp thànhmột bảng khoá cũng được sắp xếp có kích thước lớn hơn.
+ Nguyên tắc thực hiện như sau:
Ở mỗi lượt ta chọn khoá nhỏ hơn trong 2 khoá nhỏ nhất của 2 bảnglương ứng để đưa ra miện sắp xếp, và quá trình lặp lại cho đến khi 1 trong 2bảng đã hết, lúc đó ta chỉ việc đưa phần còn lại của bảng kia ra miền sắp xếp.
Q: là số cặp mạch có độ dài l thì Q= n/2*l ;
Gọi S:=2*l*Q thì S là số các phần tử của Q của mạch R= n-S là sốcác phần tử còn lại của dãy K.
Trang 22Procedure MPass (k,n,l,x);
[X: là vecto có n phần tử được dung để lần lượt chứa các phần tử của Ksau khi hoà nhập]
1.Q:= ndiv(2*l);S:= 2*l*Q;R:= n-S;
2{hoà nhập từng cặp mạch}.For i:=1 to Q do beginLB:= 1+ (2*j-2)*l;
{ Xác định biên dưới của mạch thứ nhất}
call MERGE ( k, l, LB, k, l, LB+1,x, LB);end;
3 ( chỉ còn một mạch);if R<= 1 then
for j:=1 to R dox[s+j] := A[s+j];
4.( còn 2 mạch nhưng một mạch có độ dài nhỏ hơn 1).Else
Call MERGE (k, l, s+1, k, R-1, l+s+1, x, S+l);5 Return.
thủ tục MPASS này sẽ được gọi tới trong thủ tục thực hiện sắp xếp kiểuhoà nhập hai đường trực tiếp.
Procedure Straight_Msort (k,n);1.( Khởi tạo số phần tử trong mạch)l:=1;
2 while l<n begincall MPASS (k,n,l,x);
( Thực hiện hoà nhập và chuyển các phần tử vào x);
Trang 233 call MPASS ( x,n,2*l,k);
(thực hiện hoà nhập và chuyển các phần tử vào k)4 l:=4*l;
end;5.Return;
Trang 24Diễn giải phần chương trình chạy.
I - Phần chương trình chính:
BEGIN Init; Input; Readln;END.
1 Phần Input:
Là một chương trình con có tác dụng:- Nhập dữ liệu.
+ Bắt đầu nhập dữ liệu (b)
+ Nhập số lượng các phần tử (n)+ Các phần tử ( dayso[i] )
- Chọn lựa các cách sắp xếp:
1 Selection Sort - Sắp xếp kiểu lựa chọn2 Insertion Sort - Sắp xếp kiểu chèn3 Bubble Sort - Sắp xếp kiẻu nổi bọt4 Quick Sort - Sắp xếp nhanh
5 Merge Sort - Sắp xếp kiểu hoà nhập6 Heap sort - Sắp xếp kiểu đống
- Cách thức sắp xếp: t ă ng dần (Ascending) hoặc giảm dần (Dicending).
2 Phần Output:
Là một chương trình con có tác dụng:Xuất dữ liệu ra màn hình:
- Dãy đã nhập chưa được sắp xếp- Dãy đã được sắp xếp theo yêu cầu.
3 Phần Init:
Trang 25Là một chương trình con có tác dụng:
Tạo giao diện màn hình và bảng chọn từ bàn phím cho người sử dụng.
4 Phần các Proceduce giải thuật:
Bao gồm các Procedure dùng để thực hiện các giải thuật sắp xếp khácnhau:
1 Procedure SELECTION SORT Giải thuật sắp xếp kiểu chọn lựa2 Procedure INSERTION_SORT Giải thuật sắp xếp kiểu chèn
3 Procedure BUBBLE_SORT Giải thuật sắp xếp kiểu nổi bọt4 Procedure QUICK_SORTGiải thuật sắp xếp nhanh
5 Procedure MERGE_SORT 6 Procedure MPASS
7 Procedure STRAIGHT_MERGE_SORTGiải thuật sắp xếp kiểu Trộn lẫn
8 Procedure PUSHDOWN 9 Procedure HEAP_SORTGiải thuật sắp xếp kiểu vun đống
Phần mã nguồn (Source Code) của chương trình được viết bằng ngônngữ lập trình pascal.
Yêu cầu cấu hình hệ thống:
- Máy PC sử dụng CPU Intel Pentium II, Celeron 100MHz hoặc cao hơn.- Hệ điều hành Windows 95, 98, ME, 2k, XP, Sever 2003.
- Turbo Pascal 7.0 hoặc Free Pascal 2.0 có hỗ trợ đầy đủ thư viện.
Trang 26{Source code: }
Program Thuat_toan_sap_xep;Uses Crt;
Var dayso, daysotam, dayZ:Array[0 99] of Integer; F:Text;
Tongphantu: Integer;
{ -Begin Init -}Procedure Init;
Var i:Integer;Begin
TextBackGround(LightGray); ClrScr;
TextColor(Blue); For i := 2 to 79 do Begin
Gotoxy(i,1); Write(chr(205)); Gotoxy(i,49); Write(chr(205)); Gotoxy(i,8); Write(Chr(205)); End;
For i := 2 to 48 do Begin
Gotoxy(1, i); Write(Chr(186)); Gotoxy(80, i); Write(Chr(186)); End;
Gotoxy(1,1); Write(Chr(201)); Gotoxy(80,1); Write(Chr(187)); Gotoxy(1,8); Write(Chr(204)); Gotoxy(80,8); Write(Chr(185)); Gotoxy(1,49); Write(Chr(200)); Gotoxy(80,49); Write(Chr(188)); Gotoxy(20,8); Write(Chr(209)); Gotoxy(20,49); Write(Chr(207)); For i := 9 to 48 do
Begin
Gotoxy(20,i); Write(chr(179)); End;