LUẬN VĂN THẠC SĨ LÊ LONG Số hoá bởi Trung tâm Học liệu – ĐHTN http //www lrc tnu edu vn 1 ĐẠI HỌC THÁI NGUYÊN TRƢỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG LÊ ĐÌNH LONG MỘT SỐ THUẬT TOÁN CHỌN LỌC[.]
1 ĐẠI HỌC THÁI NGUYÊN TRƢỜNG ĐẠI HỌC CÔNG NGHỆ THƠNG TIN VÀ TRUYỀN THƠNG LÊ ĐÌNH LONG MỘT SỐ THUẬT TOÁN CHỌN LỌC VÀ ỨNG DỤNG TRONG TIN HỌC PHỔ THƠNG Chun ngành: KHOA HỌC MÁY TÍNH Mã số: 60 48 0101 LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH NGƯỜI HƯỚNG DẪN KHOA HỌC TS VŨ VINH QUANG Thái Nguyên - 2015 Số hoá Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn Tai ngay!!! Ban co the xoa dong chu nay!!! MỞ ĐẦU Thuật toán khái niệm quan trọng tin học Thuật toán xuất phát từ nhà khoa học Arập Abu Ja‟far Mohammed ibn Musa al Khowarizmi Chúng ta xem thuật tốn cơng cụ dùng để giải toán xác định trước Việc nghiên cứu thuật tốn có vai trị quan trọng khoa học máy tính máy tính giải vấn đề có hướng dẫn giải rõ ràng đắn Nếu hướng dẫn giải sai không rõ ràng máy tính khơng thể giải tốn Trong khoa học máy tính, thuật tốn định nghĩa dãy hữu hạn thao tác xếp theo trình tự định cho sau thực dãy thao tác ấy, từ input tốn, ta nhận output cần tìm Ở Việt Nam môn Tin học đưa vào giảng dạy thức trường phổ thơng từ năm học 2006 - 2007 nhiên thực tế môn Tin học đưa vào tham gia thi học sinh giỏi cấp tỉnh, cấp quốc gia từ lâu: Hội thi Tin học trẻ khơng chun tồn quốc tổ chức lần đầu vào năm 1995, kỳ thi học sinh giỏi Tin học quốc gia tổ chức vào năm 1995 đặc biệt kỳ thi Olympic Tin học quốc tế (IOI) tổ chức lần đầu vào năm 1989 Từ đến kỳ thi học sinh giỏi, Olympic Tin học ngày nhiều đòi hỏi kiến thức cao Chúng ta biết để có kết cao kỳ thi chọn học sinh giỏi môn Tin học nói chung học sinh phải có vốn kiến thức thuật toán để giải toán khó (đặc biệt thuật tốn nâng cao), sau học sinh sử dụng ngơn ngữ lập trình để lập trình dựa vào thuật tốn tìm giải tốn theo u cầu Chương trình giảng dạy sách giáo khoa mơn Tin học hành trường phổ thơng có lượng kiến thức hạn chế đơn giản, không đủ sở để học sinh dựa vào vốn kiến thức để tham gia kỳ thi học sinh giỏi cấp thành phố hay cấp cao Câu hỏi đặt ra: “Làm để học sinh đạt kết cao kỳ thi học sinh giỏi môn Tin học trường phổ thông?” yêu cầu đặt giáo viên giảng dạy môn Tin học trường phổ thơng phải suy nghĩ, tìm tịi tài liệu số thuật toán như: Thuật toán đệ quy, thuật toán Số hoá Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn tham lam, thuật toán xấp xỉ số thuật toán đồ thị thuật toán sử dụng hiệu để giải nhiều toán Tin học Xuất phát từ thực tế đó, đề tài luận văn: “MỘT SỐ THUẬT TỐN CHỌN LỌC VÀ ỨNG DỤNG TRONG TIN HỌC PHỔ THÔNG” với mục đích tìm hiểu, nghiên cứu số thuật tốn cách ứng dụng vào giảng dạy, bồi dưỡng đội tuyển học sinh giỏi môn Tin học trường phổ thơng Nội dung luận văn gồm chương, phần phụ lục với nội dung sau: Chƣơng 1: Luận văn trình bày tổng quan khái niệm thuật toán độ phức tạp thuật toán, vấn đề phân lớp toán sở đánh giá độ phức tạp thuật toán Các kiến thức tảng mặt lý thuyết tính tốn để nghiên cứu chương tiếp sau luận văn Chƣơng 2: Trong chương luận văn trình bày tổng quan thuật tốn đệ quy, thuật toán tham lam, thuật toán xấp xỉ số thuật tốn mơ hình đồ thị Chƣơng 3: Dựa vào sở lý thuyết thuật tốn trình bày chương 2, chương luận văn cài đặt chương trình cho số tốn cụ thể Phần phụ lục: Tồn kết thực nghiệm giải toán cài đặt ngơn ngữ Pascal version 7.0 máy tính PC Số hoá Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn Chƣơng CÁC KHÁI NIỆM VỀ THUẬT TOÁN VÀ ĐỘ PHỨC TẠP CỦA THUẬT TOÁN 1.1 Khái niệm thuật toán 1.1.1 Khái niệm toán Tin học Trong phạm vi tin học, người ta quan niệm tốn cơng việc muốn máy tính thực [2] Khi dùng máy tính để giải toán, ta cần quan tâm tới vấn đề: Dữ liệu cần đưa vào máy tính (Input) gì? cần lấy (Output) thơng tin gì? nói cách khác, cho tốn việc mơ tả rõ input output tốn Vấn đề lại là: Làm để từ input ta có output? 1.1.2 Khái niệm thuật tốn Khác với toán học (các yêu cầu toán thường chứng minh tồn đáp án không yêu cầu tìm cách chi tiết để tìm đáp số đó), giải tốn Tin học việc tìm lời giải cụ thể, tường minh để đưa output toán dựa input cho Việc cách tìm output tốn gọi thuật tốn Có nhiều cách phát biểu khái niệm thuật toán Dưới cách phát biểu chọn để đưa vào sách giáo khoa Tin học phổ thơng Khái niệm thuật tốn: Thuật toán dãy hữu hạn thao tác xếp theo trình tự định để sau thực dãy thao tác đó, từ input ta có output cần tìm [2] Trong lĩnh vực khoa học máy tính, cụm từ “thuật tốn” đơi cịn gọi là: “giải thuật” Ví dụ 1: Thuật tốn tơ màu đồ thị - Input: đồ thị G = (V, E) - Output: đồ thị G = (V, E) có đỉnh gán màu Thuật tốn: Có nhiều cách để mơ tả thuật tốn khác Dưới cách mơ tả thuật tốn dạng liệt kê bước: Số hoá Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn Bước 1: Lập danh sách đỉnh đồ thị E’:= [v1, v2, …,vn] xếp theo thứ tự bậc giảm dần: d(v1) d(v2) … d(vn) Đặt i := 1; Bước 2: Tô màu i cho đỉnh danh sách Duyệt đỉnh tô màu i cho đỉnh không kề đỉnh tô màu i Bước 3: Nếu tất đỉnh tơ màu kết thúc, đồ thị tô i màu Ngược lại, chuyển sang bước 4; Bước 4: Loại khỏi E‟ đỉnh tô màu Sắp xếp lại đỉnh E‟ theo thứ tự bậc giảm dần Đặt i := i +1 quay lại bước 1.2 Yêu cầu thuật toán Thuật toán phải đảm bảo yêu cầu sau [2], [4] Tính xác định: Các bước thuật tốn phải trình bày rõ ràng, mạch lạc, đảm bảo cho người đọc hiểu theo nghĩa Tính khả thi: Thuật tốn phải thực được, nghĩa ta sử dụng máy tính kết hợp ngơn ngữ lập trình để thể thuật tốn hay kiểm tra thuật toán giấy bút (cịn gọi Test) Tính dừng: Nếu liệu vào thỏa mãn điều kiện đầu vào thuật tốn phải kết thúc cho kết sau số hữu hạn bước Tính xác (tính đắn): Thuật tốn phải cho kết xác thể đắn sở toán học Tính tối ưu: Thuật tốn phải có chi phí khơng gian nhớ chạy thời gian nhanh 1.3 Thể thuật toán Thuật toán thể cách sau Sử dụng liệt kê bước Sử dụng lưu đồ (sơ đồ khối) Sử dụng ngôn ngữ lập trình Số hố Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn 1.4 Độ phức tạp thuật toán 1.4.1 Chi phí phải trả cho q trình tính tốn Chi phí phải trả cho q trình tính tốn bao gồm chi phí khơng gian (bộ nhớ - số nhớ cần sử dụng q trình tính tốn) chi phí thời gian (thời gian cần sử dụng cho q trình tính tốn) Nếu cho thuật toán A Thuật toán thực liệu e Thuật toán phải trả giá: giá không gian LA(e), giá thời gian TA(e), e liệu vào Ví dụ 2: Xét thuật tốn A, “Tìm số lớn dãy số” Begin Max := x1; For i := to n If max < xi then max := xi ; End Thực A hai liệu khác nhau: + Bộ liệu e1 = {0, 4, 9, 5, 7, 6}: Khi LA(e1) = (dữ liệu vào) + (biến trung gian) = TA(e1) = (thời gian để thực tất phép tính bản) + Bộ liệu e2 = {3, 4, 6, 7, 9, 10, 12, 15}: LA(e2) = 11 TA(e2) = 15 Khi ta có khái niệm chi phí phải trả trường hợp sau: Chi phí phải trả trường hợp xấu nhất: - Chi phí xấu nhớ: LA(n) = Max {LA(e) | e ≤ n} - Chi phí xấu thời gian: TA(n) = Max {TA(e) | e ≤ n} Chi phí phải trả trung bình: Số hố Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn Là tổng số chi phí khác ứng với số liệu chia cho tổng số số số liệu Chi phí phải trả tiệm cận: Đó biểu thức biểu diễn tốc độ tăng chi phí thực tế phải trả Nó có gía trị tiệm cận với chi phí thực tế Nhận xét: Ngày phát triển không ngừng khoa học công nghệ kỹ thuật điện tử phí nhớ khơng cịn vấn đề cần thiết phải bàn tới mà ta quan tâm tới chi phí phải trả thời gian thực giải thuật Từ ta xét đến thời gian thực giải thuật T(n), độ phức tạp thuật tốn Sau việc phân tích thời gian thực giải thuật, tiêu chuẩn quan trọng để đánh giá hiệu lực giải thuật vốn hay đề cập tới 1.4.2 Phân tích thời gian thực giải thuật Với tốn, khơng có giải thuật Chọn giải thuật đưa tới kết nhanh đòi hỏi thực tế Nhưng vào đâu để nói giải thuật nhanh giải thuật kia? Có thể thấy ngay: thời gian thực giải thuật, (hay chương trình thể giải thuật đó) phụ thuộc vào nhiều yếu tố Một yếu tố cần ý trước tiên kích thước liệu đưa vào Chẳng hạn thời gian xếp dãy số phải chịu ảnh hưởng số lượng số thuộc dãy số Nếu gọi n số lượng (kích thước liệu vào) thời gian thực T giải thuật phải biểu diễn hàm n: T(n) Các kiểu lệnh tốc độ xử lý máy tính, ngơn ngữ viết chương trình chương trình dịch ngơn ngữ ảnh hưởng tới thời gian thực hiện; yếu tố không đồng với loại máy cài đặt giải thuật, khơng thể đưa chúng vào xác lập T(n) Điều có nghĩa T(n) khơng thể biểu diễn thành đơn vị thời gian giây, phút Tuy nhiên, khơng phải mà so sánh giải thuật mặt tốc độ Nếu thời gian thực giải thuật T1(n) = c.n2 thời gian thực giải thuật khác Số hoá Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn T2(n) = k.n (với c k số đó), n lớn, thời gian thực giải thuật T2 rõ ràng so với thời gian thực giải thuật T1 Như vậy, nói thời gian thực giải thuật T(n) tỉ lệ với n2 hay tỉ lệ với n cho ta ý niệm tốc độ thực giải thuật n lớn (với n nhỏ việc xét T(n) khơng có ý nghĩa) Cách đánh giá thời gian thực giải thuật độc lập với máy tính yếu tố liên quan với máy dẫn tới khái niệm cấp độ lớn thời gian thực giải thuật hay gọi độ phức tạp tính tốn giải thuật 1.4.3 Độ phức tạp thuật toán Nếu thời gian thực giải thuật T(n) = c.n2 (với c số) ta nói: Độ phức tạp tính tốn giải thuật có cấp n2 (hay cấp độ lớn – tốc độ tăng – thời gian thực giải thuật n2) ký hiệu là: T(n) = O(n2) (kí hiệu chữ O lớn) Một cách tổng quát định nghĩa: Một hàm f(n) xác định O(g(n)) f(n) = O(g(n)) gọi có cấp g(n) tồn số c n0 cho f(n) ≤ c.g(n) n ≥ n0 nghĩa f(n) bị chặn số nhân với g(n), với giá trị n từ điểm Thơng thường hàm thể độ phức tạp tính tốn giải thuật có dạng: O(log2n), O(n), O(nlog2n), O(n2), O(n3), O(2n), O(n!), O(nn) O(g(n)) gọi độ phức tạp tiệm cận hàm f(n) Dưới số hàm số hay dùng để ký hiệu độ phức tạp tính tốn bảng giá trị chúng để tiện theo dõi tăng hàm theo đối số n log2n n n2 nlog2n n3 2n 1 2 4 16 64 16 24 64 512 256 16 64 256 4096 65536 32 160 1024 32768 2.147.483.648 Số hoá Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn Các hàm 2n, nn gọi hàm loại mũ, cịn có hàm n! số hàm khác có độ phức tạp lớn hàm mũ Một giải thuật mà thời gian thực có cấp hàm loại mũ tốc độ chậm Các n3, n2, nlog2n, log2n gọi hàm loại đa thức Giải thuật với thời gian thực có cấp hàm đa thức thường hiệu chấp nhận Ví dụ 3: Tính giá trị đa thức P(x) = anxn+an-1xn-1+ +a1x+a0 với a0, a1, ,an, x nhập từ bàn phím Thuật tốn 1: Input n, ao, a1, a2, , an, x; S := ao; for i := to n begin p := 1; for j := to i p := p*x; S:= S + ai*p; end; Output s; Với giá trị i vòng lặp 3, vòng lặp 3.2 thực i vòng lặp nên n = i thực đủ n vịng lặp Vậy vòng lặp thực n( n 1) lần câu lệnh sau nên thời gian tính tốn tỉ lệ thuận với n2 Vậy độ phức tạp tính tốn thuật tốn O(n2) Thuật tốn 2: Vì xn = x*xn-1 nên tận dụng kết lần tính trước cho lần tính sau: Input n, ao, a1, a2, , an, x; S := ao; p:=1; for i := to n begin p := p* x; Số hoá Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn 10 S := s + p; end; Output S; Hai lệnh có độ phức tạp tính tốn O(1) Vòng lặp cần thực n lần hai thao tác tính s p Vậy số lần thực lệnh 2n Do vậy, độ phức tạp tính tốn thuật tốn O(n) 1.4.4 Các qui tắc xác định độ phức tạp tính tốn giải thuật Xác định độ phức tạp tính tốn giải thuật dẫn tới toán phức tạp Tuy nhiên, thực tế, số giải thuật ta phân tích số quy tắc đơn giản [2], [4]: - Quy tắc tổng Giả sử T1(n) T2(n) thời gian thực đoạn chương trình P1 P2 mà T1(n) = O(f(n)); T2(n) = O(g(n)) thời gian thực P1 P2 là: T1(n) + T2(n) = O(max(f(n), g(n))) Ví dụ, chương trình có bước thực mà thời gian thực bước O(n2), O(n3) O(log2n) thời gian thực bước đầu O(max(n2, n3)) = O(n3) Một ứng dụng khác quy tắc g(n) ≤ f(n) với n ≥ no O(f(n) + g(n)) O(f(n)) Chẳng hạn: O(n4+n2) = O(n4) O(n+log2n) = O(n) - Quy tắc nhân Nếu tương ứng với P1 P2 T1(n) = O(f(n)); T2(n) = O(g(n)) thời gian thực P1 P2 lồng là: T1(n).T2(n) = O(f(n).g(n)) Ví dụ, câu lệnh gán: x := x+1 có thời gian thực c (hằng số) nên đánh giá O(1) Câu lệnh: for i := to n x := x+1; có thời gian thực O(n.1)=O(n) Câu lệnh: for i := to n for j := to n x := x+1; có thời gian thực đánh giá là: O(n.n) = O(n2) Có thể suy O(c.f(n)) = O(f(n)) chẳng hạn O(n2/2) = O(n2) Số hoá Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn 65 b Giải thuật Áp dụng tư tưởng thuật toán Dijkstra tìm cách tốt (tải trọng cho phép (TTCP) lớn nhất) từ đến N Với cặp đỉnh I, J, ký hiệu C[I,J] = tải trọng cho phép có cạnh (I,J) = khơng có cạnh (I,J) Với đỉnh I, ký hiệu D[I] TTCP từ Các D[I] khởi tạo = trừ D[1] cho lớn tùy ý Thuật tốn có hai pha - Pha Giả sử Last đỉnh vừa có đường tốt từ đến, với đỉnh I chưa có đường tốt từ đến, so sánh TTCP đường cũ với TTCP đường từ đến I vòng qua Last, D[I] then begin h[M] := h[i]; tt := tt+a[h[i]]; inc(M); if M > N then exit; end; Số hoá Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn 72 end; (* -Xep cac viec lai -*) Procedure XepTiep; var i: integer; begin for i := to N if id[i] > then begin h[M] := id[i]; inc(M); end; end; (* Ghi ket qua *) Procedure GhiTep; var i: integer; begin assign(f, fo); rewrite(f); for i := to N writeln(f,h[i]); writeln(f, 'Tong so tien thuong thu duoc:', tt); close(f); end; BEGIN Doc; InitID; IDQuickSort(1,n); XepViec; DonViec; XepTiep; GhiTep; END 3.3 Bài toán đƣờng ngắn Program DUONG_DI; Uses Crt; Const Max=50; Fi = 'DDTOIUU.INP'; Fo = 'DDTOIUU.OUT'; Var A,C : Array[1 Max,1 Max] of Integer; N, P, Q,i, j, k : Integer; F : Text; { -} Procedure INPUT; Begin Assign(F,Fi); Reset(F); Readln(F,N); Fillchar(A,sizeof(A),0); For i:=1 to N begin For j:=1 to N Read(F,A[i,j]); Readln(F); end; Readln(F,P,Q); Close(F); End; { -} Procedure XDduong(i,j:Integer); Begin If C[i,j]=0 Then Write(' > ',j) Else Begin XDduong(i,C[i,j]); Số hoá Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn 73 XDduong(C[i,j],j); End; End; { -} Procedure Output; Begin Assign(f,fo); Rewrite(f); If A[P,Q]=0 Then begin Writeln('Khong co duong di tu ',P,' den ',Q); Writeln(f,'Khong co duong di tu ',P,' den ',Q); close(f); end else begin Writeln('Duong di ngan nhat tu ',P,' den ', Q ,' dai ',A[P,Q]) ; Writeln(f,'Duong di ngan nhat tu',P,' den',Q,' dai ',A[P,Q]) ; Write(P); XDduong(P,Q); Close(f); end; End; { -} Procedure Process; Begin Clrscr; For k:=1 to N For i:=1 to N If A[i,k] >0 Then For j:=1 To N If (A[j,k] >0) And (ij) Then If (A[i,j]=0) or (A[i,j]>A[i,k]+A[k,j]) Then Begin A[i,j]:=A[i,k]+A[k,j]; C[i,j]:=k; End; End; { -} BEGIN Input; Process; Output; Readln; END 3.4 Bài toán mắc dây điện Program MAC_DAY_DIEN; Uses crt; Const fi = 'Daydien.inp'; nm = 501; mm = 100000000; fo = 'Daydien.out'; Số hoá Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn 74 Type xyz = Record x,y :real; z : Integer; end; Var a : Array[1 nm]of xyz; i, j, n, vti,vtj : Integer; d, min,t : Real; f : Text; { -} Function kt(x,y:real):boolean; begin for j:=1 to i-1 if (a[j].x=x)and(a[j].y=y)then begin kt:=false; exit; end; kt:=true; end; { -} Procedure nhap1; begin randomize; write ('Vao n='); readln(n); assign(f,fi); rewrite(f); writeln(f,n); for i:=1 to n Repeat a[i].x:=random(10*n); a[i].y:=random(10*n); a[i].z:=random(2); Until kt(a[i].x,a[i].y); for i:=1 to n writeln(f,a[i].x:0:0,' ',a[i].y:0:0,' ',a[i].z); close(f); end; { } Procedure nhap; begin assign(f,fi); reset(f); readln(f,n); for i:=1 to n begin readln(f,a[i].x,a[i].y,a[i].z); end; close(f); end; Function kc(i,j:integer):real; begin kc:=1.0*sqrt(sqr(a[i].x-a[j].x)+sqr(a[i].y-a[j].y)); end; { -} Procedure xuly; Số hoá Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn 75 begin d:=0; Repeat min:=mm; for i:=1 to n for j:=1 to n if ((a[i].z=0)and(a[j].z=1))or((a[i].z=1)and(a[j].z=0))then begin t:=kc(i,j); if t 0) and (c[i,j] > c[i-1,j-down[i]] + ) then begin c[i,j] := c[i-1,j-down[i]] + 1; flip[i,j] := true; end; end; end; { -} Procedure writef; var i, j, min, lj, t : longint; tmp : array[1 nmax] of longint; begin := inf; for j := to n * 10 if (c[n,j] < inf) and (abs(sum - j - j ) < min) then begin := abs(sum - j - j); lj := j; end; assign(f,fo); rewrite(f); write(f,min,' '); Số hoá Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn 77 t := 0; j := lj; i := n; while j > begin if flip[i,j] = true then begin inc(t); tmp[t] := i; j := j - down[i]; end else j := j-up[i]; i := i-1; end; writeln(f,t); for i:= t downto write(f,tmp[i], ' '); close(f); end; { -} Begin Readf; Calc; Writef; End 3.6 Bài tốn mạng giao thơng Program MANG_GIAO_THONG; Const fi = 'TRANSPO.INP'; Fo = 'TRANSPO.OUT'; Type link = ^dinh; dinh = Record x,p : Word; next : Link; end; mm = Array[1 1000] of word; Var A : Array[1 1000] of link; ht,q,truoc : mm; n,m,min,max,ds,s : Word; p : Pointer; f: text; t : Char; { -} Procedure add(i,j,p:word); Var z:link; Begin new(z); z^.x:=j; z^.p:=p; z^.next:=a[i]; a[i]:=z; end; Số hoá Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn 78 Procedure nhap; Var i,j,k,p :Word; begin assign(f,fi);reset(f); readln(f,n,m); for i:=1 to n a[i]:=nil; min:=65535;max:=0; for k:=1 to m begin read(f,i,j,p); if min>p then min:=p; if max