Theo nghĩa rộng, thành ngữ con số bao gồm tất cả những thành ngữ có một hoặc hai con số trở lên, kể cả các từ chỉ số lượng (như: lưỡng, bán, song). Tuy nhiên, trong luận văn này, chúng tôi chỉ giới hạn tập trung nghiên cứu về những thành ngữ có con số thực chỉ như một, hai, ba…mười, trăm,
nghìn, vạn, mà không xét đến những thành ngữ tiếng Hán chỉ có những từ
ngữ chỉ số lượng như lưỡng, bán, song.
Trong tiếng Hán, số từ cũng thuộc về từ cơ bản và đã xuất hiện rộng rãi trong Giáp cổ văn (những chữ được khắc trên mái rùa và xương thú đời nhà Thượng Trung Quốc vào thế kỉ 16-11 trước công nguyên). Do đó chúng ta có thể thấy được sự ảnh hưởng to lớn của con số trong đời sống con người. Trong thành ngữ tiếng Hán, có một số lượng không nhỏ các thành ngữ có sử dụng con số, thậm chí có những thành ngữ được tạo nên hoàn toàn bằng con số, trở thành một hiện tượng đặc sắc nổi bật trong ngôn ngữ Hán. Ví dụ, ―Tiểu
từ điển Thành ngữ tiếng Hán‖ (Quán ấn thư Thương Vụ, tháng 3 năm 1981 in
lần thứ 4) đã thu thập tổng cộng 3559 thành ngữ, trong đó có hơn 300 thành ngữ con số, chiếm khoảng 10% tổng số thành ngữ (dẫn từ bài viết ―Bàn qua
nghĩa từ tố của thành ngữ‖ của Diêu Bằng Từ, ―Đạo báo ngữ văn‖, số 12
năm 1985). Trong những thành ngữ con số này, có một số thành ngữ chỉ chứa một con số như: 一技之长 (nhất kỹ chi trường), 流芳百世 (lưu phương
bách thế), 入木三分 (nhập mộc tam phân), 三顾茅庐 (tam cố mao lư), 退
避三舍 (thoái tị tam xá), 百年大计 (bách niên đại kế); có một số thành ngữ
chứa hai con số như: 五颜六色 (ngũ nhan lục sắc), 一心一意 (nhất tâm
一发 (thiên quân nhất phát); có một số thành ngữ chứa cả ba con số như: 七
老八十 (thất lão bát thập),十有八九 (thập hữu bát cửu); thậm chí có một số
thành ngữ được tạo nên hoàn toàn bởi con số như: 一五一十 (nhất ngũ nhất
thập), 三 三 五 五 (tam tam ngũ ngũ), 千 千 万 万 (thiên thiên vạn
vạn)…Những thành ngữ có hai con số là nhiều nhất, còn những thành ngữ có ba đến bốn con số ít nhất, số lượng chỉ có một vài thành ngữ.
Xét riêng thành ngữ tiếng Hán hiện đại, có 14 con số khác nhau được sử dụng trong các thành ngữ con số là: một, hai, ba, bốn, năm, sáu, bẩy, tám,
chín, mười, bách (trăm), thiên (nghìn/ngàn), vạn, ức. Những con số này khi
được dùng trong thành ngữ đã làm cho thành ngữ con số có cấu tạo rất quy luật, và có đặc điểm ngữ nghĩa hết sức phong phú. Sau đây chúng tôi sẽ đi sâu phân tích đặc điểm cấu trúc, ngữ nghĩa của của các thành ngữ này.