Hàng ngày cú hàng tỷ người truy cập vào Internet và cũng cú từng ấy người thực hiện cỏc thao tỏc tỡm kiếm với cỏc mỏy tỡm kiếm khỏc nhau. Nếu thống kờ cỏc thụng tin của mỗi lần tỡm kiếm này thỡ chắc chắn chỳng ta sẽ được một nguồn thụng tin khổng lồ, và nểu biết cỏch sử dụng chỳng thỡ sẽ làm được rất nhiều cụng việc hữu ớch. Cỏc bài toỏn tỡm kiếm trong cỏc mỏy tỡm kiếm thụng thường chỉ đơn giản đỏp ứng nhu cầu tỡm kiếm thụng tin của khỏch hàng mà chưa biết tận dụng những thụng tin từ phớa khỏch hàng qua mỗi lần tỡm kiếm. Dưới đõy là bài toỏn đề xuất thờm vào tớnh năng của cỏc mỏy tỡm kiếm và hướng giải quyết trong tương lai.
Bài toỏn:
Căn cứ vào cỏc tài liệu mà khỏch hàng xem hoặc down về, sau khi phõn tớch ta biết được khỏch hàng đú hay tập trung vào cỏc trang cú nội dung gỡ trờn tập cỏc trang Web của chỳng ta, để từ đú bổ xung thờm nhiều tài liệu mà khỏch hàng quan tõm và ngược lại. Cũn về phớa khỏc hàng sau khi phõn tớch chỳng ta cũng biết được khỏch hàng hay tập trung về vấn đề gỡ , từ đú cú thờm những hỗ trợ cho khỏch hàng.
Hướng giải quyết:
Xõy dựng một CSDL về cỏc tài liệu, trong đú cú một trường ClassificationID cho biết tài liệu này thuộc lĩnh vực nào dựa trờn kết quả đó phõn tớch trước đú.(Bằng phõn lớp)
Xõy dựng một CSDL về phớa khỏch hàng: Trước khi khỏch hàng truy cập vào CSDL, yờu cầu đăng ký một account thụng tin: tờn, tuổi, địa chỉ,…chỳng ta cũng đưa thờm hai trường quan trọng là nghề nghiệp, trỡnh độ (cho độ chớnh xỏc của thụng tin là c%). Yờu cầu đăng ký account là tuỳ chọn với khỏch hàng. Sau đú trong quỏ trỡnh mỗi lần khỏch hàng truy cập vào CSDL chỳng ta sẽ ghi lại cỏc tài liệu mà khỏch hàng truy nhập vào bảng thụng tin khỏch hàng. Sau đú dựa vào cỏc thụng tin về tài liệu mà khỏch hàng truy nhập và thụng tin về khỏch hàng, phõn tớch theo thuật toỏn cõy quyết định để sinh luật cho biết khỏch hàng khỏch hàng cú nghề nghiệp và trỡnh độ như thế nào thỡ quan tõm đến lĩnh vực nào với độ tin cậy là ngưỡng c
Chương 3. BÀI TOÁN PHÂN LỚP