III. Mật mã cĩ khĩa cơng khai:
4. Cấu trúc cơ bản của các thuật tốn băm:
Trước tiên, khối dữ liệu đầu vào x cĩ chiều dài hữu hạn tùy ý sẽ được phân thành các
khối con liên tiếp cĩ chiều dài cố định r, giả sử được đánh số là x1, x2,…, xm. Tuy nhiên, do chiều dài khối dữ liệu ban đầu x là tùy ý, do đĩ, ta cĩ thể phải thêm vào dữ liệu ban đầu một số bit phụ sao cho tổng số bit của khối dữ liệu xsau khi thêm vào sẽ là bội số của r. Ngồi ra, khối bit phụ thêm vào thường chứa một khối bit (cĩ chiều dài cố định trước, thường là 64 bit) xác định chiều dài thực sự của khối dữ liệu khi chưa thêm các bit phụ. Sau đĩ, ta lần lượt “cắt” từng khối con r bit từ khối mở rộng x. Mỗi khối con r bit xi lần lượt từng bước đi qua một hàm nén f của hàm băm h(x). Tại bước thứ i, hàm nén f nhận dữ liệu đầu vào là xi và kết quả trung gian của bước trước đĩ (bước i – 1) để tạo đầu ra là kết quả trung gian bước thứ i, được ký hiệu là Hi. Kết quả trung gian tại mỗi bước là một chuỗi bit cĩ chiều dài cố định n>0. Nếu ký hiệu IV là giá trị khởi tạo ban đầu cho H0, thì quá trình lặp xử lý dãy các khối con x1, x2,…, xm được mơ tả như sau:
IV H0 ; ) , ( i1 i i f H x H trong đĩ i1,2,..,m; h(x) = g(Hm).
Người ta thường gọi Hi (kết quả trung gian sau bước thứ i) là các biến dây chuyền
(chaining variable). Hàm g(x) lấy biến dây chuyền cuối cùng để tạo ra mã băm cần tìm. Trong hầu hết các thuật tốn, g(x) thường được chọn là ánh xạ đồng nhất tức là g(Hm) = Hm. Khâu then chốt trong xây dựng hàm băm thường là hàm nén f.
Giá trị hàm băm mật mã (mã băm) của một thơng điệp (message) thường được gọi là
Message Digest (MD).