Giá trị đánh giá kết hợp với mỗi termij trong Ant-Miner liên quan đến lượng giá entropy. Trong trường hợp của các thuộc tính định danh, trong đó mọi termij có dạng (ai = vij), entropy cho các cặp giá trị của thuộc tính được tính như trong phương trình (1) - được sử dụng trong Ant-Miner nguyên bản:
trong đó p(c | ai = vij ) là xác suất thực nghiệm của lớp c có điều kiện ai = vij và k là số các lớp. Lưu ý rằng entropy là một lượng của các pha tạp trong bộ sưu tập các ví dụ, vì thế entropy tương ứng cao hơn với các lớp phân bố đều và khả năng tiên đoán nhỏ cho những thuật ngữ trong câu hỏi.
Tuy nhiên, phương trình (1) không thể được áp dụng trực tiếp để tính toán entropy cho các nút đại diện cho các thuộc tính liên tục (termi) kể từ nút này không đại diện cho một cặp giá trị thuộc tính. Để tính toán các dữ liệu ngẫu của termi, chúng ta cần phải chọn một giá trị ngưỡng v để tự động phân vùng thuộc tính liên tục ai thành hai khoảng: ai < v và ai ≥ v . Giá trị ngưỡng tốt nhất là giá trị v mà giảm thiểu entropy của phân vùng này, được đưa ra bởi:
|Sai<v| là tổng số của các ví dụ trong phân vùng đó ai < v (phân vùng ví dụ huấn
luyện nơi thuộc tính ai có giá trị thấp hơn v), |Sai≥v| là tổng số ví dụ trong phân vùng phân vùng ai ≥ v ( ví dụ đào tạo nơi thuộc tính ai có giá trị lớn hơn hoặc bằng v) và | S | là tổng số ví dụ về đào tạo. Sau khi lựa chọn ngưỡng vbest, entropy của termi tương ứng với giá trị entropy tối thiểu của hai phân vùng và nó được định nghĩa là:
Chúng tôi chọn giá trị entropy thấp nhất nó tương ứng với giá trị kết hợp với phân vùng “tinh khiết nhất" (phân vùng với nhiều ví dụ thuộc cùng một lớp) và nó đại diện cho năng lực tiên đoán (chất lượng) của termi (khi termi được thêm vào quy tắc ). Cần lưu ý rằng entropy của mọi termi có nghĩa là điều kiện có thuộc tính liên tục - luôn luôn có entropy giống nhau - mỗi điều kiện đại diện cho một thuộc tính-cặp giá trị của một thuộc tính định danh. Do đó, entropy của tất cả termi và termij tính toán như là một bước tiền xử lý để tiết kiệm thời gian tính toán.
Liên quan đến việc tính toán phức tạp, quá trình tìm kiếm một giá trị ngưỡng có thể được chia thành hai bước. Trước tiên, giá trị của thuộc tính liên tục có thể được sắp xếp để tạo thuận lợi cho việc tính toán số lượng ví dụ thuộc mỗi khoảng ứng cử. Sự phức tạp thời gian của bước này là O (n log n), trong đó n là số ví dụ xem xét. Thứ hai, việc đánh giá giá trị ngưỡng ứng cử có sự phức tạp là O (n), mà trong trường hợp này n đại diện cho số lượng giá trị ứng cử được đánh giá. Cần lưu ý rằng không phải tất cả các giá trị ngưỡng ứng cử được đánh giá, chỉ có những ranh giới hình thức giữa các lớp. Vì vậy, hiệu quả của việc đánh giá được tăng từ ngưỡng giá trị ít ứng cử cần phải được kiểm tra.