M T VÀI NG D NG TH CT Ế
Bài Tốn 1: Bài Tốn Lc Khách Hàng Trùn gọBài Tốn 1: Bài Tốn L c Khách Hàng Trùngọ
Bài Tốn 1: Bài Tốn L c Khách Hàng Trùngọ
1. Mơ tả:
1. Mơ tả:
Một cơng ty bán hàng khi bán hàng cĩ nhập các thơng tin của khách vào cơ sở dữ liệu. Do lượng khách
Một cơng ty bán hàng khi bán hàng cĩ nhập các thơng tin của khách vào cơ sở dữ liệu. Do lượng khách
hàng lớn và giảm thời gian tìm kiếm dữ liệu nên mỗi lần khách mua hàng cơng ty lại nhập lại thơng tin
hàng lớn và giảm thời gian tìm kiếm dữ liệu nên mỗi lần khách mua hàng cơng ty lại nhập lại thơng tin
trên
trên →→ dữ liệu bị trùng. Cuối năm cơng ty muốn tặng lịch và gửi thiệp chúc tết tới tất cả khách hàng và dữ liệu bị trùng. Cuối năm cơng ty muốn tặng lịch và gửi thiệp chúc tết tới tất cả khách hàng và
khơng muốn 1 khách hàng nhận cùng lúc nhiều tấm thiệp (giống nhau). Do đĩ cơng ty phải gom tất cả
khơng muốn 1 khách hàng nhận cùng lúc nhiều tấm thiệp (giống nhau). Do đĩ cơng ty phải gom tất cả
khách hàng trùng lại. Tuy nhiên do cĩ nhiều người nhập khác nhau dễ cĩ sai sĩt trong qua trình nhập
khách hàng trùng lại. Tuy nhiên do cĩ nhiều người nhập khác nhau dễ cĩ sai sĩt trong qua trình nhập
(thêm bớt khoảng trắng, bỏ dấu và khơng bỏ dấu, nhập sai chình tả, nhập thiếu thơng tin, …).
(thêm bớt khoảng trắng, bỏ dấu và khơng bỏ dấu, nhập sai chình tả, nhập thiếu thơng tin, …).
Bài tốn đặt ra là cần cĩ một cơng cụ cĩ thể Bài tốn đặt ra là cần cĩ một cơng cụ cĩ thể gom các mẩu tin nghi ngờ trùng của khách hànggom các mẩu tin nghi ngờ trùng của khách hàng để dễ xử lý để dễ xử lý
khách hàng trùng.
khách hàng trùng.
Việc gom dữ liệu trùng này là rất cần thiết, rất cĩ lợi trong việc phân tích dữ liệu kinh doanh