nghiên cứu các thuật toán sắp xếp
Trang 1MỤC LỤC 1
LỜI MỞ ĐẦU 2
A.VẤN ĐỀ, MỤC ĐÍCH VÀ PHẠM VI NGHIÊN CỨU CỦA ĐỀ TÀI 4
B TÌM HIỂU VỀ BÀI TOÁN SẮP XẾP 5
C NỘI DUNG CỦA CÁC PHƯƠNG PHÁP SẮP XẾP 7
I Phương pháp chọn trực tiếp (Selection sort): 7
1 Giải thuật: 7
2 Đánh giá giải thuật: 9
3 Lưu đồ thuật toán : 9
II Phương pháp chèn trực tiếp (Insert sort): 10
1 Giải thuật: 10
2 Đánh giá giải thuật : 11
3 Lưu đồ thuật toán: 12
Xem như dãy số cần sắp xếp đã được nhập vào sẵn: 12
III Phương pháp sắp xếp nổi bọt (Bubble sort): 13
1 Giải thuật : 13
Dãy khi sắp xếp xong là : 1 2 4 5 6 8 12 15 15
2 Đánh giá giải thuật : 15
Nhận xét: 15
IV Phương pháp sắp xếp vun đống (Heap sort): 17
1 Định nghĩa heap : 17
2 Giải thuật Heapsort: 17
3 Đánh giá giải thuật : 20
V Phương pháp sắp xếp nhanh (Quick sort): 22
1 Giải thuật : 22
2 Đánh giá giải thuật : 24
3 Lưu đồ thuật toán : 25
Xem như dãy số cần sắp xếp đã được nhập vào sẵn 25
VI Phương pháp sắp xếp trộn (MergerSort): 26
2 Đánh giá giải thuật: 28
3 Lưu đồ thuật toán: 28
D KẾT LUẬN 31
32
32
- Sau đó nhấn Enter để vào menu chương trình chính để ta lựa chọn các phương pháp sắp xếp và để lựa chọn các phương pháp sắp xếp ta sử dụng 2 phím mũi tên lên hoặc là xuống Minh họa màn hình giao diện xuất hiện như sau: 32
33
33
- Tiếp tục nhấn Enter thì màn hình sẽ quay lại màn hình chương trình Demo1 như ban đầu 34
Trang 2Hiện nay trong hầu hết các hệ lưu trữ, quản lý dữ liệu, thao tác tìm kiếm thường được thực hiện nhiều nhất để khai thác thông tin một cách nhanh chóng(ví dụ như : tra cứu từ điển, tìm sách trong thư viện ) và muốn việc tìm kiếm cách nhanh chóng thì dữ liệu cần phải được sắp xếp sẵn, ngăn nắp theo một trật tự, hệ thống nhất định sẽ cho phép chúng ta tìm kiếm nhanh, việc tìm kiếm, sắp xếp có ý nghĩa rất lớn trong việc quản lí và lưu trữ
Do đó khi xây dựng một hệ quản lý thông tin trên máy tính, bên cạnh các thuật toán tìm kiếm, các thuật toán sắp xếp dữ liệu cũng là một trong những chủ đề được quan tâm hàng đầu
Hiện nay đã có nhiều giải thuật tìm kiếm và sắp xếp được xây dựng, mức độ hiệu quả của từng giải thuật còn phụ thuộc vào tính chất của cấu trúc dữ liệu cụ thể mà nó tác động đến mà ta lựa chọn phương pháp sắp xếp sao cho phù hợp Trong khoa học máy tính và trong toán học, một thuật toán sắp xếp là một thuật toán sắp xếp các phần tử của một danh sách (hoặc một mảng theo thứ tự tăng dần hoặc giảm dần) Người ta thường xét trường hợp các phần tử cần sắp xếp là các số Hầu hết các bài toán đều có nhiều thuật toán khác nhau để giải quyết chúng
Nội dung giới thiệu trình bày dưới đây là những thuật toán sắp xếp thông dụng nhất và đó cũng là nội dung mà em nghiên cứu trong đồ án học phần 2 này là:
1 Phương pháp chọn trực tiếp (Selection sort);
2 Phương pháp chèn trực tiếp( Insertion sort);
3 Phương pháp sắp xếp nổi bọt( Bubble sort);
2
Trang 35.Phương pháp sắp xếp nhanh ( Quick sort);
6 Phương pháp sắp xếp kiểu vun đống ( Heap sort);
Ngoài ra còn có nhiều thuật toán sắp xếp khác nữa như: Phương pháp sắp xếp cải tiến ( Shellsort) Trong bài tập chủ đề lớn 1 này chúng ta sẽ được lần lượt tìm hiểu khảo sát từng thuật toán trên Các thuật toán như Selection sort, Insertion sort, Bubble sort là những thuật toán đơn giản dễ cài đặt nhưng chi phí cao Các thuật toán Merge sort, Quick sort, Heap sort, phức tạp hơn nhưng hiệu suất cao hơn nhóm thuật toán đầu Các nhóm thuật toán trên đều có một điểm chung là đều được xây dựng dựa trên cơ sở so sánh giá trị của các phần tử trong mảng (hay so sánh các khóa tìm kiếm) Khi xây dựng một thuật toán sắp xếp cần chú ý tìm cách giảm thiểu những phép so sánh và đổi chổ không cần thiết để tăng hiệu quả của thuật toán
Mặt dù nhóm em đã rất cố gắng và nổ lực để làm đồ án học phần 2 này do kinh nghiệm còn hạn chế và kiến thức em nắm chưa sâu nên em biết sẽ không tránh khỏi những thiếu sót Em rất mong nhận được sự thông cảm và đóng góp của các Thầy, Cô để lần sau làm bài đồ án được tốt hơn
Hoàn thành bài đồ án này là niềm vui rất lớn đối với em, em rất biết ơn Cô Ngô Thị Lan đã hướng dẫn em tận tình trong suốt thời gian em làm bài đồ án Một lần nữa em xin gửi lời cám ơn chân thành nhất đến Cô
Xuân Khanh, Ngày 01 Tháng 01 Năm 2015
Trang 4A VẤN ĐỀ, MỤC ĐÍCH VÀ PHẠM VI NGHIÊN CỨU CỦA ĐỀ TÀI
I Nêu vấn đề :
Quá trình sắp xếp là quá trình bố trí lại các phần tử của một tập đối tượng điển hình như là một dãy số nào đó, một dãy chữ theo thứ tự của từ điển.v.v., nhằm sắp xếp theo một thứ tự nhất định theo thứ tự tăng dần (hoặc giảm dần) đối với một dãy số, thứ tự từ điển đối với một dãy chữ.v.v…
Bài toán sắp xếp thường được xuất hiện thường xuyên nhất trong các ứng dụng tin học như trong ngôn ngữ lập trình Pascal ,với những yêu cầu, mục đích khác nhau thì sắp xếp dữ liệu lưu trữ trong máy tính theo cách và các bước khác nhau….Nói chung, dữ liệu có thể xuất hiện dưới nhiều dạng khác nhau và thường phải lưu trữ một khối lượng dữ liệu đáng kể, nên việc xây dựng các giải thuật sắp xếp sẽ cho phép tìm kiếm nhanh sẽ có ý nghĩa rất lớn Từ các vấn đề nêu trên giúp
cho chúng em hiểu rỏ mục đích đề tài là: Để sắp xếp các dãy số theo một trật tự, thứ
tự tăng dần (hoặc là giảm dần) tùy theo vào yêu cầu của người muốn sắp xếp, sắp xếp theo thự tự để giúp cho việc tìm kiếm được dễ dàng hơn, qua đó có thể giúp chúng em hiểu rỏ các ưu khuyết điểm của các phương pháp sắp xếp để so sánh tốc độ sắp xếp, từ đó
để vận dụng các phương pháp đó trong việc sắp xếp theo yêu cầu cùa bài toán đặt ra một cách có hiệu quả và đó cũng là mục đích mà nhóm chúng em chọn đề tài về các sắp xếp
để nghiên cứu
II Phạm vi nghiên cứu của đề tài :
Tìm hiểu và vận dụng các lý thuyết cơ bản về một số phương pháp sắp xếp như phương pháp chọn trực tiếp (Selectsort), chèn trực tiếp (Insertsort), sắp xếp nổi bọt (Bubblesort), sắp xếp kiểu vun đống (Heapsort), sắp xếp nhanh (Quicksort), sắp xếp trộn (Mergesort), để cài đặt chương trình Demo, cho phép sắp xếp một dãy số đã cho tuỳ ý thành một dãy số có thứ tự theo các thuật toán sắp xếp vừa nêu trên
III Mục tiêu của đề tài cần đạt được:
1 Đối với báo cáo :
- Mô tả quá trình thực hiện của tất cả các phương pháp sắp xếp
- Tính được độ phức tạp của từng phương pháp
- Thể hiện được tất cả các giao diện trong Demo
- Mô tả các chức năng trong Demo
4
Trang 5- Thiết kế giao diện hài hoà rõ ràng Có sử dụng đồ hoạ.
- Demo phải có dữ liệu mẫu để test và có chức năng nhập dữ liệu để kiểm tra thủ công
B TÌM HIỂU VỀ BÀI TOÁN SẮP XẾP
I Định nghĩa về bài toán sắp xếp:
1 Khái niệm về sắp xếp:
Sắp xếp là quá trình xử lý một danh sách các phần tử (hoặc các mẫu tin) để đặt chúng theo các thứ tự thỏa mãn một tiêu chuẩn nào đó dựa trên nội dung thông tin lưu giữ tại mọi phần tử
Tại sao cần phải sắp xếp các phần tử thay vì để nó ở dạng tự nhiên (chưa có thứ tự vốn có? Ví dụ của bài toán tìm kiếm với phương pháp tìm kiếm nhị phân và tuần tự để trả lời câu hỏi này
Khi khảo sát bài toán sắp xếp, ta sẽ phải làm việc nhiều với một khái niệm gọi là nghịch thế
Cho trước một dãy số a1,a2, …, an được lưu trữ trong cấu trúc dữ liệu mảng
Trang 6Khi xây dựng một thuật toán sắp xếp cần chú ý tìm cách giảm thiểu những phép
so sánh và đổi chổ không cần thiết để tăng hiệu quả của thuật toán Đối với các dãy số được lưu trữ trong bộ nhớ chính, nhu cầu tiết kiệm bộ nhớ được đặt nặng, do vậy những thuật toán sắp xếp đòi hỏi cấp phát thêm vùng nhớ để lưu trữ dãy kết quả ngoài vùng nhớ lưu trữ dãy số ban đầu thường ít được quan tâm Thay vào đó, các thuật toán sắp xếp trực tiếp trên dãy số ban đầu – gọi là các thuật toán sắp xếp tại chổ - lại được đầu tư phát triển Phần này giới thiệu một số giải thuật sắp xếp từ đơn giản đến phức tạp có thể áp dụng thích hợp cho việc sắp xếp nội
6
Trang 7C NỘI DUNG CỦA CÁC PHƯƠNG PHÁP SẮP XẾP
I Phương pháp chọn trực tiếp (Selection sort):
1 Giải thuật:
- Phương pháp sắp xếp chọn trực tiếp - selection sort là phương pháp sắp xếp bằng cách chọn phần tử nhỏ nhất xếp vào vị trí thứ nhất, tương tự các phần tử nhỏ tiếp theo xếp vào vị trí tiếp theo lần lượt cho đến hết số phầm tử trong dãy.Ta thấy rằng, nếu mảng có thứ tự, phần tử ai luôn là min(ai, ai+1, , an-1) Ý tưởng của thuật toán chọn trực tiếp mô phỏng một trong những cách sắp xếp tự nhiên nhất trong thực tế: chọn phần tử nhỏ nhất trong n phần tử ban đầu, đưa phần tử này về vị trí đúng là đầu dãy hiện hành; sau đó không quan tâm đến nó nữa, xem dãy hiện hành chỉ còn n – 1 phần tử của dãy ban đầu, bắt đầu từ vị trí thứ hai; lặp lại quá trình trên cho dãy hiện hành … đến khi dãy hiện hành chỉ còn một phần tử Dãy ban đầu còn n phần tử, vậy tóm tắt ý tưởng thuật toán là thực hiện n-1 lượt việc đưa phần tử nhỏ nhất trong dãy hiện hành về vị trí đúng ở đầu dãy
- Các bước tiến hành như sau :
+ Bước 1: Gán i bằng 1 (i:=1,bắt đầu từ phần tử đầu tiên của dãy);
+ Bước 2: Tìm phần tử a[min] nhỏ nhất trong dãy tiến hành từ a[i] đến a[n] + Bước 3: Hoán vị a[min] và a[i].
+ Bước 4: Nếu i < n-1 thì i := i + 1; Lặp lại Bước 2 Ngược lại: Dừng.( n-1 phần
tử đã nằm đúng vị trí )
- Ví dụ : Cho dãy số a : 12 2 8 5 1 6 4 15
Trang 92 Đánh giá giải thuật:
- Đối với giải thuật chọn trực tiếp, có thể thấy rằng ở lượt thứ i, bao giờ cũng cần ( n-1) lần so sánh để xác định phần tử nhỏ nhất hiện hành Số lượng phép so sánh này không phụ thuộc vào tình trạng của dãy số ban đầu, do vậy trong mọi trường hợp có thể kết luận :
Số lần so sánh bằng =
2
)1()(1 1
n i
- Số lần hoán vị ( một hoán vị bằng 3 phép gán ) lại phụ thuộc vào tình trạng ban đầu của dãy số, ta chỉ có thể ước lược trong từng trường hợp như sau:
3 Lưu đồ thuật toán :
Xem như dãy số cần sắp xếp đã được nhập vào sẵn
Begin
Đổi chổa[j] & a[j-1];
i<=n-SaiSai
1]
a[j]<a[j-Đúng
Đúng
Sai
Xuất dãy số
Trang 10Cho dãy ban đầu a1, a2, …, an ta có thể xem như đã có đoạn gồm một phần tử a1 đã được sắp xếp, sau đó thêm a2 vào đoạn a1 sẽ có đoạn a1, a2 được sắp xếp; tiếp tục thêm a3 vào đoạn a1, a2 để có đoạn a1, a2, a3 được sắp; tiếp tục cho đến khi thêm xong aN vào đoạn a1 a2, …aN-1 sẽ có dãy a1 a2… aN được sắp.
- Các bước tiến hành như sau:
+ Bước 1: i = 2; (giả sử có đoạn a[1] được sắp) + Bước 2: x:= a[i]; tìm vị trí pos thích hợp trong đoạn a[1] để chèn a[i]
Trang 112 Đánh giá giải thuật :
Đối với giải thuật chèn trực tiếp, các phép so sánh xảy ra trong mỗi vòng lặp
while tìm vị trí thích hợp pos, và mỗi lần xác định vị trí đang xét không thích hợp, sẽ dời chỗ phần tử a[pos] tương ứng Giải thuật thực hiện tất cả n -1 vòng lặp while, do số
lượng phép so sánh và dời chỗ này phụ thuộc vào tình trạng dãy số ban đầu, nên chỉ có thể ước lược trong từng trường hợp như sau :
Trang 123 Lưu đồ thuật toán:
Xem như dãy số cần sắp xếp đã được nhập vào sẵn:
n i
) 1 (
2 2
Xấu nhất
2
) 1 (
) 1 (
n i
1 2
) 1 (
) 1 (
1
1
− +
= +
=
n n i
n i
Begin
Đổi chổa[j] & a[j-1];
j = j – 1;
i = 2
j = i
j >1 và a[j] <a[j-1]
i < = nĐúng
SaiSai
Đúng
EndXuất
dãy số
Trang 13III Phương pháp sắp xếp nổi bọt (Bubble sort):
1 Giải thuật :
- Sắp xếp nổi bọt (bubble sort) là một thuật toán sắp xếp đơn giản, so sánh hai phần tử đầu, nếu phần tử đứng trước lớn hơn phần tử đứng sau thì đổi chỗ chúng cho nhau Tiếp tục làm như vậy với cặp phần tử tiếp theo cho đến cuối tập hợp dữ liệu Sau
đó, quay lại với hai phần tử đầu cho đến khi không còn cần phải đổi chỗ nữa Nó có tên gọi này từ hình ảnh của các "bọt" khí nhẹ hơn được nổi lên trên Nó sử dụng phép so sánh các phần tử nên là một sắp xếp kiểu so sánh
- Các bước tiến hành như sau :
+ Bước 1: i := 1 ; // Lần xử lí đầu tiên
+ Bước 2: j : = n ; // duyệt từ cuối dãy ngược về vị trí i
Trong khi ( j > i) thực hiện : Nếu a[j]<a[j-1] : a[j] : = a[j-1]; // Xét cặp phần tử kế cận j = j-1;
+ Bước 3: i = i + 1; // Lần xử lí kế tiếp
Nếu i > n-1 : hết dãy Dừng
Ngược lại : Lặp lại bước 2 Cho đến khi j=i thì dừng thuật toán
- Ví dụ : Cho dãy số a gồm các phần tử sau :
12 2 8 5 1 6 4 15
J=7 I=1
Trang 15Cứ tiếp tục như vậy và tăng dần i lên cho đến khi i > n-1 thì dừng và dãy đã được sắp xếp xong.
Dãy khi sắp xếp xong là : 1 2 4 5 6 8 12 15
2 Đánh giá giải thuật :
Đối với giải thuật nổi bọt, số lượng các phép so sánh xảy ra không phụ thuộc vào tình trạng của dãy số ban đầu, nhưng số lượng phép toán hoán vị thực hiện tuỳ thuộc vào kết quả so sánh, có thể ước lượt trong từng trường hợp như sau:
Nhận xét:
Bubblesort có các khuyết điểm sau : không nhận diện được tình trạng dãy đã có thứ tự hay có thứ tự từng phần Các phần tử nhỏ được đưa về vị trí đúng rất nhanh, trong khi các phần tử lớn lại được đưa về vị trí đúng
1 1
−
=+
−
∑−
=
n n i
n
n i
0
Xấu nhất
2
)1(n−
n
2
)1()1(
1 1
−
=+
−
∑−
=
n n i
n
n i
Trang 163 Lưu đồ thuật toán :
Xem như dãy số cần sắp xếp đã được nhập vào sẵn
16
Begin
Đổi chổa[j] & a[j-1];
i = 1
j = n
j >= i+1
1Đúng
i<=n-SaiSai
End
1]
Trang 17IV Phương pháp sắp xếp vun đống (Heap sort):
Tính chất 3: Mọi dãy a 1 , a 2 , …, a r với 2l > r là một heap
2 Giải thuật Heapsort:
- Giải thuật hepsort trải qua hai giai đoạn:
Giai đoạn 1: Hiệu chỉnh dãy số ban đầu thành heap;
Giai đoạn 2: Sắp xếp dãy số dựa trên heap :
Bước 1: Đưa phần tử nhỏ nhất về vị trí đúng ở cuối dãy :
r : = n ; Hoán vị (a 1 , a r);
Trang 18Hiệu chỉnh phần còn lại của dãy từ a1, a2, …, ar thành một heap.
Bước 3: Nếu r > 1 (heap còn phần tử): Lặp lại bước 2 Ngược lại :Dừng.
Phần tử liên đới I= 2
Trang 19Giai đoạn 2: Sắp xếp dãy số dựa trên heap :
Trang 20Thực hiện tương tự cho r =5, 4, 3, 2 ta được :
3 Đánh giá giải thuật :
Việc đánh giá giải thuật heapsort rất phức tạp, nhưng đã chứng minh được trong trường hợp xấu nhất độ phức tạp là O(nlog2n)
4 Lưu đồ thuật toán :
Xem như dãy số cần sắp xếp đã được nhập vào sẵn
j <= r &
Cont
j = j + 1a[j] < a[j+1]
a[j] <
x
j < rĐúng
n
Trang 21* Sắp xếp vun đống:
a[i] = a[j] ;
i = j ;
j = 2*j ;Cont = false
a[i] = x
Đúng
End
Begin
Hiệu chỉnh dãy a1, a2, ,an thành Heap ;
r = n ;
r > 0
Đổi chổ a[l] và a[r];
r = r – 1 ;Hiệu chỉnh dãy al, al+1, ,ar thành Heap;
Đúng
Sai
Trang 22V Phương pháp sắp xếp nhanh (Quick sort):
1 Giải thuật :
Để sắp xếp dãy a 1 , a 2 , …, a n giải thuật Quick sort dựa trên việc phân hoạch dãy ban đầu thành 2 phần:
Dãy con 1: Gồm các phần tử a1 ai có giá trị không lớn hơn x.
Dãy con 2: Gồm các phần tử ai an có giá trị không nhỏ hơn x.
Với x là giá trị của một phần tử tùy ý trong dãy ban đầu Sau khi thực hiện phân hoạch, dãy ban đầu được phân thành 3 phần :
Trang 23Bước 1: Chọn tùy ý một phần tử a[k] trong dãy là giá trị mốc, l < k < r: x : = a[k]; i:=l; j : = r ;
Bước 2: Phát hiện và hiệu chỉnh cặp phần tử a[i], a[j] nằm sai chỗ :
Bước 2a: Trong khi (a[i] < x) i : = i+1;
Bước 2b: Trong khi (a[j] > x) j : = j-1;
Bước 2c: Nếu i < j // a[i] > x > a[j] mà a[j] đứng sau a[i] thì hoán vị (a[i],
a[j]);
Bước 3: Nếu i < j : Lặp lại bước 2 // chưa xét hết mảng
Nếu i > j : Dừng
Giải thuật phân hoạch dãy sắp xếp dãy a l , a l+1 , …, a r :
Có thể phát biểu giải thuật sắp xếp một cách đệ quy như sau :
Bước 1: Phân hoạch dãy a1 ar thành các dãy con :
Dãy con 1 : a 1 a j <x
Dãy con 2: a j+1 a i-1 = x
Dãy con 1: a i a r >x
Bước 2: Nếu (l < j) // dãy con 1 có nhiều hơn 1 phần tử
Phân hoạch dãy a1 aj
Nếu (i < r) // dãy con 3 có nhiều hơn 1 phần tử
Phân hoạch dãy ai ar