Với sơ đồ chữ ký điện tử, thì chữ ký được xác định cho từng khối của văn bản, và nếu văn bản gồm nhiều khối thì chữ ký cho tồn văn bản cũng phải do ghép chữ ký trên từng khối lại với nhau mà thành. Chữ ký trên từng khối văn bản thường cĩ độ dài bằng (hoặc thậm chí gấp đơi) độ dài của khối văn bản, do đĩ chữ ký chung cũng cĩ độ dài tương đương với độ dài văn bản. Đĩ là một điều bất tiện.
Ta mong muốn, như trong trường hợp viết tay, chữ ký chỉ cĩ độ dài ngắn và hạn chế cho dù văn bản cĩ thể dài bao nhiêu cũng được. Đối với chữ ký điện tử, vì chữ ký phải được “ký” cho từng bit của văn bản, nên muốn cĩ chữ ký độ dài hạn chế trên văn bản cĩ độ dài tuỳ ý thì phải tìm cách rút ngắn độ dài văn bản. Nhưng bản thân văn bản khơng thể rút ngắn được, nên chỉ cịn cách là tìm cho mỗi văn bản một bản “tĩm lược” cĩ độ dài hạn chế, rồi thay cho việc ký trên tồn bộ văn bản, ta ký trên bản tĩm lược đĩ, xem chữ ký trên bản tĩm lược cĩ tư cách là chữ ký trên văn bản.
Giả sử Σ là tập hợp tất cả các bản tin cĩ thể cĩ và Δ là tập hợp tất cả các bản “tĩm lược” hay đại diện bản tin (thơng điệp).
Việc tìm cho mỗi bản tin một bản tĩm lược tương ứng xác định một hàm h:Σ → Δ.. Hàm h như vậy gọi là hàm băm (hash function).
Thơng thường, Σ là tập hợp các dãy bit cĩ độ dài tuỳ ý, và Δ là tập hợp các dãy bit cĩ một độ dài n cốđịnh, nên người ta cũng định nghĩa hàm băm là các hàm
h: Σ → Δ với các tập hợp Σ và Δ đĩ (tức các hàm h: { }0,1∗ →{ }0,1 n).
Dùng hàm băm h, ta xem z = h(x) là “tĩm lược” của x, đại diện cho x. Ta xem chữ ký trên z là chữ ký trên văn bản x. Vì z cĩ độ dài hạn chế, nên chữ ký trên
x cũng cĩ độ dài hạn chế.
Điều kiện đểh(x) là đại diện của x là:
1. Hàm băm phải là hàm một phía, nghĩa là : cho x, tính z = h(x) là việc dễ; nhưng ngược lại, biết z tính x là việc cực khĩ.
và h (x1) =h (x2)”; nĩi cách khác, tìm hai văn bản khác nhau cĩ cùng một đại diện là cực kỳ khĩ.
Trở lại với vấn đề chọn độ dài cho các tĩm lược, nếu ta lấy độ dài 40 bit, thì
n = 240, và do đĩ từk ≈ 220 (khoảng một triệu) văn bản sẽ cĩ một va chạm mạnh với xác suất 1/2, như vậy khĩ bảo đảm được an tồn. Nhưng nếu ta lấy dộ dài của bản tĩm lược là 128, tức n =2128, thì va chạm mạnh cĩ thể xẩy ra với xác suất 1/2 khi số các văn bản cĩ thể là k ≈ 264, một con số khá lớn so với số văn bản cĩ thể nẩy sinh trong thực tế, do đĩ hy vọng tính an tồn sẽđược bảo đảm. Cĩ thể vì vậy mà trong chuẩn DSS người ta chọn độ dài của các tĩm lược là 160 bit.
Hiện nay người ta dùng một số thuật tốn để tạo đại diện thơng điệp như MD4, MD5, SHA,….