Phân lớp là một tiến trình xử lý nhằm xếp các mẫu dữ liệu hay các đối tƣợng vào một trong các lớp đã đƣợc định nghĩa từ trƣớc. Việc phân lớp dữ liệu thông thƣờng sử dụng các kỹ thuật trong khai phá dữ liệu (Data mining) hoặc ngƣời sử dụng có thể phân loại ngay khi nó đƣợc đƣa vào kho dữ liệu.
Kỹ thuật khai phá thƣờng sử dụng các kỹ thuật sau: - Kỹ thuật khai phá dữ liệu mô tả
Mục tiêu chính của phƣơng pháp phân cụm dữ liệu thành nhóm các đối tƣợng tƣơng tự nhau trong tập dữ liệu vào các cụm có sẵn sao cho các đối tƣợng thuộc cùng một lớp là tƣơng đồng còn các đối tƣợng thuộc các cụm khác nhau sẽ không tƣơng đồng.
- Kỹ thuật khai phá dữ liệu dự đoán
Mục tiêu của phƣơng pháp phân lớp dữ liệu là dự đoán nhãn lớp cho các mẫu dữ liệu. Không giống nhƣ phân cụm dữ liệu, phân lớp dữ liệu là học bằng ví dụ, trong khi phân cụm dữ liệu có thể coi là một cách học bằng quan sát.
Tuy nhiên việc khai phá dữ liệu chỉ thực sự cần thiết khi dữ liệu là sẵn có và không đƣợc phân cụm. Hệ thống Media LBS đƣợc xây dựng mới nên không cần thiết áp dụng kỹ thuật phân cụm dữ liệu mà thực hiện giải pháp phân cụm thông qua việc phân lớp dữ liệu qua giao diện nhập liệu hoặc thiết bị tạo ra dữ liệu. Mục đích của việc phân lớp dữ liệu giúp hệ thống có thế truy cập nhanh chóng hơn, lấy ra những dữ liệu mong muốn mà không gây dƣ thừa dữ liệu. Ví dụ: Một ngƣời dùng hệ thống Media LBS đi đến một địa điểm nhƣ siêu thị Big C Hải Phòng, khi tới địa điểm đó hệ thống thông báo đây là Siêu thị Big C Hải phòng và gợi ý có hình ảnh, thông tin giới thiệu,… về Big C Hải Phòng cho ngƣời dùng chọn lựa để có thể xem. Nhƣ vậy nếu ngƣời dùng chọn xem hình ảnh thì chỉ hình ảnh và thông tin về ảnh đƣợc hiển thị, còn nếu ngƣời dùng xem thông tin giới thiệu về Big C thì chỉ có các thông tin đó đƣợc hiện lên. Trong
Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/
tình huống này nếu không phân lớp dữ liệu thì hệ thống phải tìm kiếm trong tập dữ liệu và nhận biết đâu là thông tin về Siêu thị, đâu là hình ảnh,… Nhƣng nếu có sự phân lớp dữ liệu từ trƣớc thì hệ thống chỉ việc hiển thị đúng các thông tin yêu cầu.
Dữ liệu đa phƣơng tiện có thể biết tới các nhƣ Văn bản, Hình ảnh, Âm thanh, Video, …