Bài toán phân tích số nguyên ra thừa số nguyên tố đ• được ra đời từ rất lâu và đ• có rất nhiều nhà toán học trên thế giới nghiên cứu và giải quyết vấn đề về nó. Ngoài ý nghĩa lý thuyết của bản thân bài toán thì người ta còn phát hiện ra rất nhiều ý nghĩa thực tiễn đặc biệt là trong mật m•. Thứ nhất nó là cơ sở cho sự ra đời của một hệ mật khoá công khai nổi tiếng ra đời trong năm 1978, đó là hệ mật RSA của Revert - Shamir - Adlemal. Hệ mật này mà độ mật của nó dựa vào tính khó của việc phân tích số N=pq (p, q nguyên tố ) ra thừa số. Tiếp đến trong những việc thiết kế nên các bộ tạo d•y giả ngẫu nhiên một trong những nguyên liệu của nó là các đa thức nguyên thuỷ mà để tạo được các đa thức nguyên thuỷ bậc m thì điều đầu tiên phải giải quyết là phân tích hoàn toàn với 2m-1 ra thừa số nguyên tố. Để giải quyết vấn đề được đặt ra trong đồ án này, chúng tôi đưa ra một số cơ sở lý thuyết. Chương 1 sẽ trình bầy về các số Mersenne. Các số có dạng Mq=2qơơơ-1 (với q là nguyên tố ) được gọi là các số Mersenne và đ• được nghiên cứu công phu. Chương 2 xem xét loại bài toán quen thuộc hơn đó là bài toán phân tích số nguyên ra thừa số. Sự đóng góp có tính khoa học của chúng tôi thề hiện bởi việc trình bày các thuật toán về phân tích số nguyên tố theo cách hiểu của mình. Chương 3 là phần cơ bản của đề án, trong đó trình bày các tư tưởng của thuật toán phân tích ra thừa số nguyên tố của những số nguyên lớn. Tiếp theo trong chương này trình bày các cài đặt cụ thể cho những thuật toán liên quan đến việc phân tích ra thừa số nguyên tố, ví dụ như các phép : +, -, *, / và luỹ thừa các số lớn. Chúng tôi còn đặc biệt lưu ý tới việc cài đặt thuật toán Pollard thứ nhất một thuật toán rất hiêụ quả trong việc phân tích những hợp số lớn. Một vấn đề không thể không nói trước là những vấn đề được hiểu thấu đáo sẽ được chúng tôi trình bày chi tiết ở mức độ thuật toán khả thi trong việc lập trình, còn một số kết quả cần đến những chuẩn bị toán học cao siêu thì chỉ được dẫn các đánh giá tương ứng về thời gian tính đủ rút ra các thông số cần thiết để xây dựng các tiêu trí. Chúng tôi nghĩ rằng chỉ có thể trình bày bản báo cáo này theo cách như vậy mới đảm bảo tính cân đối trong cấu trúc bởi vì để làm cho tường minh dù chỉ một trong những vấn đề đ• né tránh trên chúng ta cũng phải cần đến hàng tập tài liệu dầy, đấy là chưa kể đến việc chúng ta có đủ kiến thức cần thiết đến mức để có thể trình bày nó cho mọi người rõ hay không.
Lời nói đầu Bài toán phân tích số nguyên ra thừa số nguyên tố đã đợc ra đời từ rất lâu và đã có rất nhiều nhà toán học trên thế giới nghiên cứu và giải quyết vấn đề về nó. Ngoài ý nghĩa lý thuyết của bản thân bài toán thì ngời ta còn phát hiện ra rất nhiều ý nghĩa thực tiễn đặc biệt là trong mật mã. Thứ nhất nó là cơ sở cho sự ra đời của một hệ mật khoá công khai nổi tiếng ra đời trong năm 1978, đó là hệ mật RSA của Revert - Shamir - Adlemal. Hệ mật này mà độ mật của nó dựa vào tính khó của việc phân tích số N=pq (p, q nguyên tố ) ra thừa số. Tiếp đến trong những việc thiết kế nên các bộ tạo dãy giả ngẫu nhiên một trong những nguyên liệu của nó là các đa thức nguyên thuỷ mà để tạo đợc các đa thức nguyên thuỷ bậc m thì điều đầu tiên phải giải quyết là phân tích hoàn toàn với 2 m -1 ra thừa số nguyên tố. Để giải quyết vấn đề đợc đặt ra trong đồ án này, chúng tôi đa ra một số cơ sở lý thuyết. Chơng 1 sẽ trình bầy về các số Mersenne. Các số có dạng M q =2 q -1 (với q là nguyên tố ) đợc gọi là các số Mersenne và đã đợc nghiên cứu công phu. Chơng 2 xem xét loại bài toán quen thuộc hơn đó là bài toán phân tích số nguyên ra thừa số. Sự đóng góp có tính khoa học của chúng tôi thề hiện bởi việc trình bày các thuật toán về phân tích số nguyên tố theo cách hiểu của mình. Chơng 3 là phần cơ bản của đề án, trong đó trình bày các t tởng của thuật toán phân tích ra thừa số nguyên tố của những số nguyên lớn. Tiếp theo trong chơng này trình bày các cài đặt cụ thể cho những thuật toán liên quan đến việc phân tích ra thừa số nguyên tố, ví dụ nh các phép : +, -, *, / và luỹ thừa các số lớn. Chúng tôi còn đặc biệt lu ý tới việc cài đặt thuật toán Pollard thứ nhất một thuật toán rất hiêụ quả trong việc phân tích những hợp số lớn. Một vấn đề không thể không nói trớc là những vấn đề đợc hiểu thấu đáo sẽ đợc chúng tôi trình bày chi tiết ở mức độ thuật toán khả thi trong việc lập trình, còn một số kết quả cần đến những chuẩn bị toán học cao siêu thì chỉ đợc dẫn các đánh giá tơng ứng về thời gian tính đủ rút ra các thông số cần thiết để xây dựng các tiêu trí. Chúng tôi nghĩ rằng chỉ có thể trình bày bản báo cáo này theo cách nh vậy mới đảm bảo tính cân đối trong cấu trúc bởi vì để làm cho tờng minh dù chỉ một trong những vấn đề đã né tránh trên chúng ta cũng phải cần đến hàng tập tài liệu dầy, đấy là cha kể đến việc chúng ta có đủ kiến thức cần thiết đến mức để có thể trình bày nó cho mọi ngời rõ hay không. Chơng i. Đặt vấn đề và ý nghĩa của bàI toán Bài toán phân tích số nguyên ra thừa số nguyên tố đã đợc ra đời từ rất lâu và đã cuốn hút nhiều bộ óc vĩ đại nhất trên thế giới để giải quyết vấn đề về nó. Ngoài ý nghĩa lý thuyết của bản thân bài toán thì ngời ta còn phát hiện ra rất nhiều ý nghĩa thực tiễn đặc biệt là trong mật mã. Thứ nhất, nó là cơ sở cho sự ra đời của một hệ mật khoá công khai nổi tiếng vào năm 1978, đó là hệ mật mã RSA ( RSA là từ viết tắt của ba ngời: Rivets Shamir Adleman ). Hệ mật này có nội dung đề cập đến việc phân tích số nguyên tố ngẫu nhiên lớn (chẳng hạn có 80 chữ số) ra thừa số. Một vấn đề quan trọng là cần phải kiểm tra bao nhiêu số nguyên ngẫu nhiên (với kích thớc xác định) cho tới khi tìm đợc một số nguyên tố. Một kết quả nỗi tiếng trong lý thuyết số (đợc gọi là định lý số nguyên tố) phát biểu rằng: số các số nguyên tố không lớn hơn N xấp xỉ bằng N/ln N. Bởi vậy, nếu p đợc chọn ngẫu nhiên thì xác suất p là một số nguyên tố sẽ vào khoảng 1/ln p. Với một mođun 512 bít, ta có 1/ln p 1/77. Điều này có nghĩa là tính trung bình, cứ 177 số nguyên ngẫu nhiên p với kích thớc tơng ứng sẽ có một số là số nguyên tố. Dĩ nhiên, nếu chỉ hạn chế xét các số nguyên lẻ thì xác suất sẽ tăng gấp đôi tới khoảng 2/177). Bỡi vậy trên thực tế, hoàn toàn có khả năng tạo đợc các nguyên tố đủ lớn và do đó về mặt thực thể ta có thể thiết lập đợc một hệ mật RSA. Tiếp đến trong những việc thiết kế nên các bộ tạo dãy giả ngẫu nhiên một trong những nguyên liệu của nó là các đa thức nguyên thuỷ mà để tạo đợc các đa thức nguyên thuỷ bậc m thì điều đầu tiên phải giải quyết là phân tích hoàn toàn với 2 m -1 ra thừa số nguyên tố. Để kiểm tra tính nguyên thuỷ của chúng bằng cách dùng thuật toán xác suất Monte- Carlo thời gian đa thức, đây là thuật toán nhanh (tức là một số nguyên n đợc kiểm tra trong thời đa thức theo log 2 n, là số các bít trong biểu diện nhị phân của n). Tuy nhiên, vẫn có khả năng là thuật toán cho rằng n là số nguyên tố trong khi thực tế n là hợp số. Bởi vậy, bằng cách thay đổi thuật toán nhiều lần, có thể giảm xác suất sai số dới một mức ngỡng cho phép. Bản đồ án không đi sâu vào các phân tích của những ý nghĩa nêu trên mà đã đặt nhiệm vụ chính là giải quyết bài toán phân tích số nguyên ra thừa số nguyên tố nh là một việc làm trung gian của một ứng dụng thực tiễn cụ thể. Đã có một khối lợng khổng lồ các tài liệu về các thuật toán phân tích thừa số và việc nghiên cứu kỹ lỡng sẽ đòi hỏi phải có một cuốn sách dày trang hơn quyển sách này. ở đây chỉ cố gắng đa ra một cái nhìn khái quát bao gồm việc thảo luận sơ lợc về các thuật toán phân tích thừa số tốt nhất hiện thời và cách sử dụng chúng trong thực tế. Các thuật toán nổi tiếng khác (những thuật toán toán có trớc) bao gồm thuật toán p+1 của Williams, phơng pháp và thuật toán p-1 của Pollard, thuật toán liên phân số và dĩ nhiên cả những phép chia thử. Chơng iI. Số Mersenne và việc phân tích 2.1 Số Mersenne Nếu một số có dạng 2 m -1 là một số nguyên tố thì m=q là một số nguyên tố. Không khó khăn lắm, có thể chứng minh đợc rằng nếu 2 m -1 là luỹ thừa của một số Prime Power thì nó phải là một số nguyên tố và do vậy m cũng là một số nguyên tố. Các số có dạng M q =2 q -1 (với q là nguyên tố ) đợc gọi là các số Mersenne và đã đợc nghiên cứu công phu. ở vào thời đại của Mersenne, ngời ta đã biết rằng một vài số Mersenne là số chính phơng và một vài số khác là hợp số. Ví dụ, M 2 =3, M 3 =7, M 5 =31, M 7 =127 là nguyên tố, trong khi M 11 =23*89. Vào năm 1640 , Mersenne đã cho rằng M q là số nguyên tố đối với q=13,17,19,31,67,127,257; ông đã nhầm đối với 67 và 257 và đã không đa 61,89 và 107(những số nhỏ hơn 257) vào danh sách trên. Những số này cũng sinh ra các số nguyên tố Mersenne. Phát hiện của ông thực sự đáng kinh ngạc về mặt độ lớn của các số. Một bài toán khá hiển nhiên là: Xét xem một số Mersenne có là số nguyên tố không, và nếu không thì xác định các thừa số của nó ( hay còn gọi là bài toán phân tích ra thừa số). Một kết quả cổ điển do Euler đa ra năm 1750 và sau đó đợc Lagrange (1775) và Lucas (1875) chứng minh là: Bài toán: Nếu q là một số nguyên tố đồng d modulo 4(q3(mod 4)) thì M q chia hết cho 2q+1 khi và chỉ khi 2q+1 là nguyên tố; trong trờng hợp này, nếu q>3 thì M q là hợp số. Chứng minh: Cho n=2q+1 là một thừa số của M. Vì 2 2 #1 (mod n) nên 2 q #1 (mod n), và 2 2q -1=(2 q +1)M q 0 (mod n), từ đó bằng phép thử của Lucas suy ra n là một số nguyên tố. Ngợc lại, cho p=2q+1 là một số nguyên tố. Vì p7(mod 8) nên (2/p)=1, do vậy tồn tại m sao cho 2m 2 (mod p). Điều này chứng tỏ rằng 2 q 2 (p-1)/2 m p- 1 1(mod p) Vì vậy M q chia hết cho p. Hơn nữa, nếu q>3 thì M q =2 q -1>29+1=p, vì vậy M q là hợp số. Vì vậy nếu q=11, 23, 83, 131, 179, 191, 239, 251, thì M q có các ớc tơng ứng là 23, 47, 167, 263, 350, 383, 479, 503. Cũng rất dễ để xác định hình dạng của các thừa số của các số Mersenne: "Nếu M q chia hết cho n thì n 1 (mod 8) và n 1 (mod q)" Chứng minh: Chỉ cần chỉ ra rằng mọi thừa số nguyên tố p của M q có dạng trên là đủ. Thật vậy, nếu p là ớc của Mq=2 q -1 thì 2 q 1 (mod q); Vì vậy theo bài toán nhỏ của Fermat thì q là ớc của p-1, tức là p-1=2kq (vì p#2). Vì vậy: 122) 2 ( 2/)1( qkp p (mod p). Do đó p1 mod (8). Phơng pháp tốt nhất hiện nay dùng để xác định Mq là một số nguyên tố hay là một hợp số đợc phát triển dựa vào việc tính toán một dãy đệ qui do Lucas (1878) và Lehmer (1930) đa ra. Tuy nhiên, bằng cách này vẫn không tìm ra đợc các thừa số cụ thể. Nếu n lẻ, n3 thì M n =2 n -17 (mod 12). Đồng thời, nếu N7 (mod 12) thì ký hiệu Jacobi: 1)1)( 3 () 3 ( 2/)1( == N N N 2.2. Phép thử nguyên tố cho các số Mersenne Cho p=2,Q=-2 và xét các dãy Lucas kép (U m ) m 0 ,(V m ) m 0 , có biệt gthức D=12. N=M n là một số nguyên tố khi và chỉ khi V(N-1)/2 chia hết cho N. Chứng minh: Cho N là một số nguyên tố. Ta có: V 2 (N+1)/2 =V N+1 +2Q (N-1)/2 =V N-1 -4(-2) (N-1)/2 V N+1 -4(-2/N) V N+1 +4(mod N) Vì (-2/N)=(-1/N)(2/N)=-1. Vì vậy chỉ cần chỉ ra rằng N7 (mod N). Theo (IV.4): 2V N-1 =V N V 1 +DU N U 1 =2V N +12U N ; do vậy theo (IV.14) và (IV.13): V N+1 =V N +6V N 2+6(12/N) 2-6-4(mod N). Ngợc lại, giả sử rằng V (N+1)/2 chia hết cho N. Thế thì theo (IV.2), V N+1 chia hết cho N. Đồng thời, theo(IV.6): V 2 (N+1).2 )=1 (gcd_ớc chung lớn nhất). Vì vậy gcd(N,2)=1, nên thu phép thử một (Phần V), N là một số nguyên tố. Để cho tính toán, ngời ta thay dẫy Lucas (V m ) m>=0 bằng dẫy (S k ) k>=1 đợc định nghĩa nh sau: S 0 =4; S k+1 =S 2 k -2; Vì thế dẫy này sẽ khởi đầu bằng 4,14,194, . và phép thử nguyên tố đợc phát biểu lại nh sau: M n =2 n -1 là nguyên tố khi và chỉ khi M n là ớc của S n-2 . Chứng minh: S 0 =4=V 2 /2. Giả sử rằng S k-1 =V 2k / 1 2 2 k ; thì S k =S 2 k-1 -2= k k k k k k V V kV 2 2 2 22 2 2 2 2 2 2 2 2 1121 +++ == + . Theo phép thử này thì M n là nguyên tố khi và chỉ khi M n là ớc của V (Mn+1).2 = 2 2 2 2 2 1 = n SV n n , hay tơng đơng M n là ớc của S n-2 . Tính lặp của các phép tính này đã làm cho phép thử trở nên phù hợp. Bằng cách này, tất cả các ví dụ về các số nguyên tố Mersenne lớn đã đợc tìm ra. Năm 1876 , Lucas đã tự mình tìm ra M 127 là nguyên tố và M 67 là hợp số. Sau đó không lâu, Pervushin đã chỉ ra rằng M 61 cũng là nguyên tố. Cuối cùng, vào năm 1927 Lehmer chứng minh đợc M 257 cũng là hợp số. Chú ý rằng M 127 có 39 chữ số và là số nguyên tố lớn nhất đợc biết tới trớc kỷ nguyên của máy tính. Các số nguyên tố Mersenne với q<= 127 đợc tìm ra trớc khi có máy tính điện tử. Năm 1951, Turing đã lần đầu tiên thử dùng một máy tính để tìm các số nguyên tố Mersenne nhng bị thất bại. Năm 1952, Robinson đã tiến hành phép thử của Lucas trên một máy SWAC. Ông đã tìm ra các số nguyên tố Mersenne : M 521 , M 607 _những số đầu tiên tìm đợc bằng máy tính. Các số nguyên tố M 1279 ,M 2203 ,M 2281 cũng đợc tìm ra trong cùng năm ấy. Số nguyên tố Mersenne lớn nhất đã tìm đợc là M 21609 , nó có 65050 chữ số do Slowinski phát hiện năm 1985. Số nguyên tố Mersenne đợc tìm ra cuối cùng là M 110503 do Colquitt và Welsch phát hiện năm 1988. Năm 1989, Bateman, Selfridge và Wagstaff đã đa ra một phỏng đoán liên quan đến các số nguyên tố Mersenne: Cho p là một số tự nhiên lẻ (không nhất thiết phải là nguyên tố). Nếu hai trong các điều kiện sau đây thoả mãn thì điều kiện thứ 3 cũng thoả mãn: a) p2 k 1 hoặc p=4 k 3 b) Mp là một số nguyên tố c) 3 12 + p là một số nguyên tố Phỏng đoán này đã đợc kiểm chứng là đúng đối với mọi p<100.000. Những số nguyên tố p<100.000 thoả mãn cả ba điều kiện là p=3, 5, 7, 13, 17, 19, 31, 61, 127. Có thể tin rằng những số này là các số nguyên tố duy nhất thoả mãn cả ba điều kiện nói trên. Cũng nh đối với các số Fermat, hiện còn có rất nhiều vấn đề mở về các số Mersenne: (1) Liệu có vô hạn các số nguyên tố Mersenne không? (2) Liệu có vô hạn các số Mersenne là hợp số không? Câu trả lời cho cả hai câu hỏi trên chắc là có (3) Có phải mọi số Mersenne đều là không chính phơng không? Kỷ lục: Có 31 số nguyên tố Mersenne đã đợc biết. Dới đây là danh sách đầy đủ của chúng cùng với tên ngời và năm tìm ra. q Năm Ngời phát hiện 2 3 5 7 13 17 19 31 61 89 107 127 521 607 1279 2203 2281 3217 4253 4423 9689 9941 11213 19937 21701 23209 44497 86243 110503 132049 216091 1461 1588 1588 1750 1883 1911 1913 1876 1952 1952 1952 1952 1952 1957 1961 1961 1963 1963 1963 1971 1978 1979 1979 1982 1988 1983 1985 Anonymous * P.A.Cataldi P.A.Cataldi L.Euler I.M.Pervushin R.E.Powers E.Fauquembergue E.Lucas R.M.Robinson R.M.Robinson R.M.Robinson R.M.Robinson R.M.Robinson H.Riesel A.Hurwitz A.Hurwitz D.B.Gillies D.B.Gillies D.B.Gillies B.Tuckerman L.C.Noll & L.Nickel L.C. Noll H.Nelson & D. Slowinski D.Slowinski W.N.Colquitt & L. Welsch, Jr. D.Slowonski D.Slowonski See Dicksons History of the Theory of Numbers, Vol. I.p.6. Chơng iII. Một số thuật toán và phơng pháp phân tích số 3.1 Thuật toán sàng Eratosthenes Thuật toán phân tích số nguyên N đợc mô tả nh sau: Thuật toán 3.1( sàng Eratosthenes ) (1) p=1. (2) p=p+1. (3) Tính r=N mod p. Nếu r>0 quay về (2). Ngợc lại p là ớc của N. Dừng chơng trình . Đây là thuật toán có tính phổ thông và mặc dù nh chúng ta đã biết là thuật toán rất tồi vì thời gian tính của nó là O( N ) nhng nếu N có ớc nhỏ thì việc áp dụng thuật toán này lại rất hiệu quả. Hơn thế nữa, thuật toán này cũng có thể lấy điểm xuất phát của bớc (1) là p=[ N ] và tiến hành bớc (2) là p=p-1 thì rõ ràng nó cũng hiệu quả nếu ớc của N rất gần với. 3.2 Thuật toán sàng đồng d Thuật toán 3.2: Lấy ngẫu nhiên hai số a và b ngẫu nhiên Z * N . Kiểm tra gcd((a-b) mod N, N) hoặc gcd((a+b) mod N, N)>1 là xác suất nh sau: Nếu đúng thì gcd((a-b) mod N, N) hoặc gcd((a+b) mod N, N)>1 là ớc của N. Dừng chơng trình. Ngợc lại quay về (1). Bây giờ chúng ta hãy tạm dừng để phân tích thuật toán dới góc độ xác suất nh sau: Cho p là ớc nguyên tố nhỏ nhất của N, thế thì cần có tối thiểu bao nhiêu cặp a, b đợc xét đến xác suất { có ít nhất một cặp a, b chia hết cho p} > 0.5. . toán phân tích số nguyên ra thừa số. Sự đóng góp có tính khoa học của chúng tôi thề hiện bởi việc trình bày các thuật toán về phân tích số nguyên tố theo cách. toán liên phân số và dĩ nhiên cả những phép chia thử. Chơng iI. Số Mersenne và việc phân tích 2.1 Số Mersenne Nếu một số có dạng 2 m -1 là một số nguyên