Triệu chứng lâm sàng và xét nghiệm là đa dạng. Do đó việc chọn thuộc tính khai phá không đúng hoặc thiếu hoặc dư thừa dẫn đến các luật dư thừa vô nghĩa, sinh ra các mô hình chẩn đoán sai. Do đó để chọn thuộc tính khai phá chính xác có liên quan, việc sử dụng tri thức chuyên gia bác sĩ, điều dưỡng là mục tiêu chính của canh tác dữ liệu y khoa. Tri thức sử dụng của diều dưỡng, bác sĩ là:
- Kiến thức chuyên môn : Các điều dưỡng và bác sĩ đã được đào tạo chuyên sâu về lĩnh vực chuyên môn chẩn đoán và điều trị bệnh cho bệnh nhân, do đó những triệu chứng lâm sàng và xét nghiệm đã theo tiêu chẩn nhất định nào đó. Trong y khoa gọi là xét nghiệm thường quy, triệu chứng lâm sàng điển hình, phát đồ điều trị cơ bản.
- Kinh Nghiêm: Ngoài kiến thức chuyên môn đã được đào tạo. Với thời gian lâu năm điều trị bệnh, giúp cho các bác sĩ, điều dưỡng có kinh nghiệm. Do đó các xét nghiệm, các triệu chứng lâm sàng sẽ được thu hẹp lại.
- Y học chứng cứ và y học thực chứng: Nghiên cứu chẩn đoán bệnh là một trong những đề tài khoa học đã được các y bác sĩ chứng minh qua thực tế lâm sàng chữa bệnh. Tất cả triệu chứng lâm sàng và xét nghiệm có giá trị chẩn đoán điều được chứng minh qua những điều trị cho bệnh nhân cụ thể, những bệnh lý cụ thể.
Các tri thức trên giúp cho chuyên viên khai phá dữ liệu chọn lựa thuộc tính đúng, chính xác,(giảm thuộc tính khai phá cây quyết định đơn giản) giúp cho các thuật toán thực thi nhanh và hiệu quả. Giúp cho việc xây dựng hệ thống đáp ứng được mục tiêu đề ra (chẩn đoán bệnh có độ chính xác cao).