Mô men bậc p
Dãy ngẫu nhiên lý tưởng; Wcp m-dãy chu kỳ N; Wcp = Scp / (-2)p 1 0 0 2 M/4 (M/4)[1-(M-1)/N] M/4 3 0 -(M3/8N) + (3/4).[(N+1)/N].B3 (3/4)B3 4 (3M2 - 2M)/16 (3M2-2M)/16-[M(M-1)2(M+2)]/16N+ +(3/2) [(N+1)/N].B4 (3M2-2M)/16 +(3/2)B4
Từ Bảng 3.1, so sánh các mômen trung tâm bậc 1, 2, 3, 4 của một m-dãy với các mômen trung tâm tương ứng của dãy ngẫu nhiên lý tưởng, ta thấy rằng một m- dãy có thể xem là có phân bố giá trị tương quan địa phương ngẫu nhiên đối với các đoạn độ dài M, nếu có B3 = B4 = 0 với các tham số [M, f(x)] tương ứng. Một nhận xét nữa là các mômen bậc 1, 2 (theo các công thức (3.21), (3.22)) không phụ thuộc vào các m-dãy cụ thể mà chỉ phụ thuộc vào hai tham số độ dài M của các đoạn con
đang xét và chu kỳ N của m-dãy. Các m-dãy cùng chu kỳ chỉ phân biệt nhau (trên khía cạnh tương quan địa phương) khi ta xét tới các mômen bậc 3, 4 và cao hơn.. Điều này cũng nói lên rằng, mỗi m-dãy có tập M* khác nhau (tuy cùng lực lượng), m-dãy nào có tập M* làm cho B3 = B4 = 0, ta hy vọng rằng m-dãy đó sẽ có dáng điệu ngẫu nhiên hơn trong tập hợp các m-dãy cùng chu kỳ đang xét.
Tóm lại, trong q trình đánh giá các tính chất của dãy giả ngẫu nhiên, ta cần quan tâm tới tính chất ngẫu nhiên địa phương của chúng, liên quan tới tính chất ngoại suy tuyến tính và tính tương quan giữa các đoạn con một dãy giả ngẫu nhiên...
3.3.Đề xuất thuật toán sinh dãy giả ngẫu nhiên phi tuyến lồng ghép với bậc lớn
3.3.1 Các khó khăn khi sinh dãy giả ngẫu nhiên phi tuyến lồng ghép với bậc lớn
Đi sâu phân tích phương pháp sinh dãy lồng ghép, ta có thể thấy phần cơng việc lớn nhất cần thực hiện trong thực hành là việc xác định giá trị ban đầu của các dãy con thành phần. Cả 4 phương pháp xác định giá trị ban đầu đã nghiên cứu trước đây đều u cầu số bước tính tốn rất lớn khi bậc của dãy ban đầu tăng lên.
Trong phương pháp sử dụng biến đổi d, ta cần phải tính tốn với một đa thức có bậc pmT
� � � −1 ���(�) = ∑� � � � � . (3.37) � �=0
Khi giá trị n (là của bậc của dãy ban đầu) tăng lên, giá trị của m cũng tăng lên tương ứng. Điều này khiến số mũ của thành phần x là qmk tăng lên tới mức khơng khả thi trong thực tế.
Trong phương pháp tính tốn trực tiếp chỉ u cầu sinh ra m dịng của ma trận chứa tồn bộ chu kỳ từ dãy ban đầu. Với các tham số đã nêu ở trên, ta cần sinh ra m.T phần tử.
Với phương pháp tính tốn sử dụng phép phân rã theo bước ta cũng cần tính tốn giá trị đa thức dT trên trường GF(pn).
Giả sử ta chọn n=24, q=7, m=8, khi đó T = 3,32.1013 và các yêu cầu tính tốn đã nêu trở thành khơng khả thi về tính tốn (computational infeasibility).
Một giới hạn khác cần quan tâm là về không gian lưu trữ. Phương pháp sử dụng biến đổi d và phương pháp tính tốn trực tiếp đều hướng đến việc tìm ra tồn bộ tập thứ tự lồng ghép ��, khi giá trị T tăng lên thì u cầu về khơng gian lưu trữ
� �
� �
cần thiết để lưu tập thứ tự lồng ghép này cũng trở lên khó khả thi. Với phương pháp phân rã theo bước, ta đã xác định chỉ tính một phần cần thiết của ��, cịn phương pháp sử dụng hàm vết cũng có thể hiệu chỉnh để chỉ cần tính một phần cần thiết của ��.
Các yêu cầu của dãy lồng ghép áp dụng trong kỹ thuật mật mã.
Từ hai phương pháp phân tích dãy giả ngẫu nhiên đã đề cập trong phần 3.1 và 3.2, ta thấy rằng khi áp dụng thuật tốn tổng hợp độ phức tạp tuyến tính cho đầu ra của dãy lồng ghép và phi tuyến lồng ghép, trong hầu hết các trường hợp ta đều nhận được kết luận là dãy được sinh ra bởi m-dãy thành phần có bậc m. Chỉ khi đoạn dữ liệu đem phân tích có sự tiếp nối giữa hai dãy con, khi này độ phức tạp tuyến tính được tăng lên, song khơng vượt quá độ phức tạp chung của dãy gốc có bậc n. Việc áp dụng bài tốn tương quan địa phương cũng đưa ra kết quả tương tự. Như vậy để có thể áp dụng dãy lồng ghép trong kỹ thuật mật mã để bảo mật thông tin, ta cần thiết kế bộ tạo dãy sao cho bậc của dãy con thành phần đã thỏa mãn các yêu cầu về bảo mật. Đây cũng là lý do tác giả luận án không tiếp tục phát triển hướng nghiên cứu về dãy lồng ghép đa cấp, do dãy con thành phần ở mức sau cùng của dãy lồng ghép đa cấp có bậc rất nhỏ so với bậc của dãy gốc, làm suy giảm tính an tồn về mật mã của dãy đầu ra.
Với các yêu cầu của kỹ thuật mật mã đã trình bày trong phần 1.2.2, ta thấy rằng yêu cầu phổ biến với các m-dãy thành phần là độ lớn bậc n ≥ 128.
Vì m là ước của n nên:
m ≤ n/2. (3.38)
Do giá trị bước lồng ghép được tính là:
� = � = ��−1 . (3.39)
� ��−1
Với m, n đủ lớn ta có thể lấy xấp xỉ:
T pn-m. (3.40)
� �
T ≥ pn/2 hay T ≥ p64. (3.41)
Với yêu cầu của bước lồng ghép nêu trên cả bốn phương pháp sinh dãy phi tuyến lồng ghép đã trình bày ở trên đều khó có thể áp dụng trong thực tế.
3.3.2 Thuật toán sinh dãy giả ngẫu nhiên phi tuyến lồng ghép với bậc lớn
Để có thể sinh dãy giả ngẫu nhiên phi tuyến lồng ghép với bậc đủ lớn thỏa mãn yêu cầu của kỹ thuật mật mã, ta cần giải quyết việc tiền xử lý để xây dựng tập thứ tự lồng ghép ��. Trong phần tiếp theo tác giả luận án sẽ trình bày thuật tốn để tính tốn giá trị đa thức dT trên trường GF(pn) trong trường hợp T rất lớn, để có thể áp dụng phương pháp sinh dãy phi tuyến lồng ghép bằng kỹ thuật phân rã theo bước.
Thuật tốn tiền xử lý tìm thứ tự lồng ghép
Theo cơng thức sinh m-dãy, trạng thái của m-dãy sau T bước bắt đầu từ giá trị khởi đầu S(0) là:
S(T) =
�(0)�� �(�)
(3.42) Ta chú ý tới giá trị tham số T:
T = � với L = pm-1 và N = pn-1. (3.43)
�
Chú ý là n = m*l, vậy ta có thể viết:
N = pm*l-1 hay N = (pm)l – 1. (3.44) Để đơn giản, đặt Q = pm, ta có thể viết
T = ��−1
= Ql-1 + Ql-2 + … + Q + 1. (3.45)
−
� 1
Nói một cách khác, nếu biểu diễn giá trị T theo cơ số Q là (l số 1)
Nếu biểu diễn T theo cơ số p, biễu diễn của T cũng chỉ có l số 1, chen giữa các số 1 là m-1 số 0:
T = 100...00100...00100 … 001p . (3.47)
�= 0 � = � = � ) . (3.54) ��(�) = �� �(�). (3.48) Ta có: U1(d) = d , (3.49) ��(�) = �� �(�) , (3.50) ∏� ��−1(�) ���(�) = =1 � � , (3.51) �(�) ��(�) = ∏�−1 �� � (�). (3.52)
Vì Q = pm có thể lên tới hàng tỷ hoặc thậm chí cao hơn khi bậc của đa thức ban đầu tăng lên, ta cần có phương pháp hiệu quả để tính được các cơng thức (3.50), (3.52).
Để tính UQ(d) ta sẽ tính lần lượt từng bước như sau. Trước hết tính trực tiếp đa thức: ��(�) = �� �(�). (3.53) Chú ý rằng: �� ��−1×� ( ��−1 � Nên ta có: � ���(�) = (���−1 (�)) . (3.55)
∏� ��−1(�) ���(�) = =1 � � , (3.56) �(�) ��(�) = ���(�) . (3.57) Để tính ���(�) từ ���−1 (�) Ta sẽ sử dụng phương pháp tương tự. Chú ý rằng ��0��−1 (�) = ���−1 (�) nên ta có: ∏� ��−1 �−1(�) ����� −1 (�) = =1 � � � , (3.58) �(�) ���(�) = �����−1 (�) . (3.59) Cuối cùng, sử dụng các giá trị tính bởi (3.59) ta tính được đa thức (3.51). Với giá trị khởi đầu S(0), sử dụng (3.42) ta tính được S(T). Tiếp tục sử dụng (3.42) song thay S(0) bằng S(T) ta sẽ có S(2T) … từ đó tính được m bộ trạng thái của dãy ban đầu ứng với m phần tử bắt đầu các cột trong ma trận. Lấy m phần tử đầu
tiên trong bộ trạng thái này chính là giá trị m ô trong cột đầu tiên trong ma trận.
Có được m bộ trạng thái này, ta có thể sử dụng (3.42) để tính m bộ trạng thái ở cột tiếp theo… Tùy vào kích thước yêu cầu của dãy đầu ra mà ta sẽ tính số bộ trạng thái khởi đầu các cột một cách tùy ý, hoặc cũng có thể tính trạng thái khởi đầu cho một cột mỗi khi cần dùng tới cột đó.
Phương pháp bình phương và nhân
Có một cách hiệu quả hơn để tính các cơng thức (3.50) và (3.52). Khi ta có biểu diễn của p dưới dạng nhị phân thành tập các bit {pi} với i=0..r, sau đó sử dụng phương pháp bình phương và nhân để tính đa thức kết quả của cơng thức (3.50)như sau:
Đặt U* = 1 Vtmp = ���(�)
Với i chạy từ 0 tới r, ta lần lượt tính Nếu pi = 1
( ( ���� 2 = �(�)���) Sau r bước ta có ���(�) = U* .
Lưu đồ thuật tốn tính ���(�) được thể hiện trong hình 3.2.
Bằng phương pháp tương tự ta tính được đa thức kết quả của cơng thức (3.52) như sau:
Đặt U* = 1 và Vtmp = ���−1��−1 (�)
Với i chạy từ 0 tới r, ta lần lượt tính Nếu pi = 1 U* = U* x Vtmp ���� 2 = �(�)���) Sau r bước ta có �����−1 (�) = U*
Hình 3.2 Lưu đồ thuật tốn tính ���(�)
Thuật tốn sinh dãy phi tuyến lồng ghép dựa trên m-dãy
Khi có trạng thái khởi đầu của một cột trong ma trận lồng ghép, ta sử dụng phần sau của phương pháp trình bày trong mục 2.4.3 để xác định các giá trị còn lại của cột. START i = 0 U* = 1 Vtmp = ���(�) i ≤ r N Y pi = 1 N Y STOP �(�) = �� � 2 ���) (� � � U* = U* x Vtmp
Với thuật toán tiền xử lý nêu trên, ta tìm ra được giá trị m phần tử đầu tiên của cột thứ nhất trong ma trận lồng ghép (là m bit số 0 trong m bộ trạng thái). Từ các giá trị này ta có thể xây dựng phần đầu tiên của dãy lồng ghép bằng dãy con đầu tiên.
Để tiếp tục xây dựng các phần tiếp theo của dãy lồng ghép, ta tìm giá thứ tự lồng ghép tiếp sau đó bằng cách sử dụng từng trạng thái trong S(kT) để xác định các
trạng thái trong S(kT+1) qua cơng thức sinh m-dãy, từ đó có được giá trị khởi đầu của cột n+1. Như vậy ta có thể xây dựng dãy lồng ghép có độ dài bất kỳ mà khơng cần tính trước tồn bộ bảng thứ tự lồng ghép.
Để sinh dãy phi tuyến lồng ghép, ta áp dụng các bước tương tự như với dãy lồng ghép đối với dãy đầu vào thứ nhất, song riêng việc sinh ra giá trị các cột lại sử dụng dãy con từ dãy đầu vào thứ hai.
3.3.3 Đánh giá độ phức tạp của thuật toán sinh dãy giả ngẫu nhiên phi tuyếnlồng ghép với bậc lớn lồng ghép với bậc lớn
Để tính được ��(�) ta cần (m-1).(p-1) phép nhân đa thức trên trường
GF(pn) để tính cơng thức (3.41). Trong trường hợp tính bằng phương pháp bình phương và nhân, số phép nhân cần tính là (m-1).log2p (Giả sử thời gian tính phép
bình phương và phép nhân đa thức là tương đương nhau)
Để tính được ���(�) từ ���−1 (�) ta cần tính các phép nhân đa thức trên
trường GF(pn). Xét trường hợp sử dụng phương pháp bình phương và nhân thay cho (19) và (21) thì số phép nhân đa thức là:
vmulq = (m-1).log2p . (3.60)
Để tính được ��(�) theo (3.36) ta cần sử dụng thêm (l-1) phép nhân đa thức.
Tổng số phép nhân đa thức trên trường GF(pn) cần tính là:
Chú ý là khi n , m và l đều có cỡ tương đương n. Ta có thể coi log2p là hằng số, xét phép nhân đa thức trên trường GF(pn) có độ phức tạp tính tốn là n thì độ phức tạp tính tốn của vq tiệm cận với (n3).
So sánh với phương pháp bình phương và nhân áp dụng trực tiếp cho giá trị số mũ T bằng một thuật toán tương tự như Thuật toán 1. Ta sẽ biểu diễn giá trị của
T thành log2T bit {ti} để áp dụng bình phương và nhân.
Số phép bình phương đa thức cần tính là:
vmul2 = log2T = (n-m)*log2p = m.(l-1).log2p (3.62) Số phép nhân cần tính sẽ có giá trị trung bình là v/2 (do phân bố bit 0/1 trong
biểu diễn nhị phân của T là đều nhau).
Vậy tổng số phép nhân đa thức cần tính là
v2 = 3⁄2 m.(l-1).log2p . (3.64) Phương pháp tính theo biểu diễn cơ số p có được lợi thế hơn phương pháp biểu diễn nhị phân bởi vì trong biểu diễn cơ số p của T có rất nhiều phần tử bằng 0 theo (3.47), trong khi biểu diễn nhị phân của T khơng có được lợi thế này.
Để so sánh cụ thể số bước tính tốn giữa hai trường hợp tính tốn với cơ số p và tính tốn theo phương pháp bình phương và nhân trực tiếp (trên biểu diễn cơ số 2 của T) ta tính tốn các giá trị cụ thể của vq và v2 trong một số trường hợp như trong bảng 3.2. Ta tính chính xác giá trị T, sau đó chuyển đổi sang nhị phân và đếm số bit để có nbit1-2 , do đó trong một số trường hợp số bit 1 không phải là log2T/2 như trong (3.46). Ví dụ ở dịng 4, ta có T = 678 223 072 85010, biểu diễn nhị phân
là:
T = 10011101111010010011111011001110010100102 .
Bảng 3.2 Số bước tính tốn tiền xử lý cho dãy lồng ghép
STT p n m vmulq nbit1-q vq T vmul2 nbit1-2 v2
1 2 24 8 17 3 20 65 793 17 3 20 2 3 24 8 32 3 35 43 053 283 26 12 38 3 7 24 8 48 3 51 33 232 936 334 403 45 24 69 4 7 28 14 42 2 44 678 223 072 850 40 23 63 5 13 12 3 36 4 40 10 609 328 380 34 17 51 6 13 18 9 36 2 38 10 604 499 374 34 17 51 7 29 12 3 45 4 49 14 507 740 823 580 44 19 63 8 31 12 3 45 4 49 26 440 509 694 144 45 12 57
So sánh 2 bảng trên, ta thấy phương pháp tính tốn với cơ số p có hiệu quả tốt hơn phương pháp tính tốn bình phương và nhân trực tiếp .
Với cơ số p = 2, hai phương pháp có số bước giống nhau do cùng là tính tốn trên cơ số 2.
Với cơ số p = 3 là một giá trị rất nhỏ, phương pháp tính tốn với cơ số p chỉ giúp tăng một phần nhỏ hiệu quả so với phương pháp tính tốn bình phương và nhân trực tiếp.
Trong trường hợp cơ số p có giá trị lớn, phương pháp tính tốn trên cơ số p có hiệu quả tốt hơn hẳn so với phương pháp tính tốn bình phương và nhân trực tiếp, cụ thể là số bước tính tốn ít hơn khoảng 25% .
3.4 Đề xuất phương pháp sinh dãy giả ngẫu nhiên an toàn sử dụng dãy phi tuyến lồng ghép tuyến lồng ghép
3.4.1 Bộ tạo dãy luân phiên phi tuyến lồng ghép
Sử dụng bộ tạo dãy luân phiên đã trình bày trong phần 1.3.3, trong đó ta chọn dãy thành phần thứ nhất là một dãy phi tuyến lồng ghép, trong khi dãy thành phần thứ hai vẫn giữ nguyên là m-dãy và dãy điều khiển vẫn giữ nguyên dãy
{wt} + g-s s-g V = {vt} K={kt} U = {ut}
D’Brujin.
Hình 3.3 Mơ hình bộ tạo dãy luân phiên phi tuyến lồng ghép
Giả sử: K={ kt}t0 là dãy D' Bruijn bậc k; U={ut} là m-dãy bậc L, V={vt} là dãy phi tuyến lồng ghép bậc M, trong đó L và M nguyên tố cùng nhau.
3.4.2 Các tính chất của bộ tạo dãy luân phiên phi tuyến lồng ghép
Từ các phân tích về tính chất của dãy ln phiên trình bày trong phần 1.3.3, ta có thể áp dụng để đưa ra các tính chất tương ứng của dãy luân phiên phi tuyến lồng ghép như sau:
Tính chất 1: (Chu kỳ và độ phức tạp tuyến tính)
Ta biết rằng dãy phi tuyến lồng ghép có chu kỳ là 2n-1.
Vậy chu kỳ của dãy đầu ra vẫn giống như trường hợp dãy luân phiên là: K.