IV. PHƢƠNG PHÁP NGHIÊN CỨU
1. 21 Khai phá dữ liệu(Data Minin g DM)
2.2.3 Lấy đặc điểm của mặt hàng từ thẻ (Tag)
Giả thiết có cơ sở dữ liệu các hình ảnh và làm sao lấy được các đặc điểm của các mặt hàng từ đó. Vấn đề với hình ảnh, dữ liệu của chúng là một mảng các điểm không mang lại thông tin hữu ích về đặc điểm của mặt hàng. Có thể tính toán các đặc tính đơn giản của pixel, lượng trung bình của màu đỏ trung bình trong hình ảnh, nhưng rất ít người dùng tìm các hình ảnh màu đỏ hoặc đặc biệt là thích các hình ảnh màu đỏ.
Có nhiều nỗ lực để thu được thông tin về các đặc điểm của các mặt hàng bằng cách mời gọi những người dùng gắn kết-tag các hàng hóa với các từ hoặc cụm từ miêu tả chúng. Do đó, một hình ảnh với nhiều màu đỏ có thể được gắn thẻ-tag là “quảng trường Ba Đình,” hoặc “hoàng hôn ở biển.” Sự phân biệt không phải là 1 thứ gì đó mà có thể được khám phá bởi các chương trình phân tích hình ảnh hiện có.
Gần như bất kỳ dữ liệu nào có thể có các đặc điểm được mô tả bởi các thẻ - tag. Một trong những nỗ lực đầu tiên là gắn thẻ khối lượng dữ liệu khổng lồ là trang del.icio.us, sau đó trang này được Yahoo! Mua lại, Yahoo mời những người dùng gắn thẻ vào các trang Web. Mục tiêu của việc gắn thẻ này là để tìm ra 1 phương pháp tìm kiếm mới để người dùng nhập 1 bộ thẻ khi họ
yêu cầu tìm kiếm, và hệ thống sẽ truy hồi các trang Web mà được gắn thẻ theo cách đó. Tuy nhiên cũng có thể sử dụng thẻ như 1 hệ thống khuyến nghị. Quan sát thấy rằng người dùng truy hồi hoặc đánh dấu nhiều trang với một bộ thẻ nhất định, thì có thể giới thiệu các trang khác với cùng thẻ tương tự. Vấn đề của việc gắn thẻ để tiếp cận việc khám phá đặc điểm là quá trình chỉ hoạt động nếu người dùng sẵn lòng mất công để tạo ra thẻ, và có vừa đủ các thẻ gây sai số sẽ không làm ảnh hưởng tới hệ thống.[7]