Phân cấp này là dựa trên các thao tác đƣợc đặc tả bởi ngƣời dùng, các chuyên gia, hoặc hệ thống khai phá dữ liệu. Các thao tác bao gồm việc giải mã thơng tin từ chuỗi đƣợc mã hĩa, trích dẫn thơng tin từ các đối tƣợng dữ liệu phức tạp, và phân cụm dữ liệu.
Thí dụ Một địa chỉ email hoặc một URL của WWW chứa các thơng tin phân cấp sở, ngành, các trƣờng đại học (hoặc cơng ty) và các nƣớc. Các thao tác giải mã cĩ thể đƣợc định nghĩa để trích xuất thơng tin để tạo thành dạng phân cấp khái niệm. Thí dụ địa chỉ email dmbook@cs. sfu. ca đƣa ra thứ tự “ login – name < department < university< country” thể hiện một dạng phân cấp khái niệm cho địa chỉ email. Tƣơng tự địa chỉ URL “ http://www. cs. sfu. ca/research/DB/DBMiner” cĩ thể đƣợc giải mã để cung cấp một phần thứ tự cĩ dạng cơ sở của phân cấp khái niệm cho URLS.
Thí dụ Các thao tác cĩ thể đƣợc định nghĩa để trích rút thơng tin từ các đối tƣợng dữ liệu phức tạp. Thí dụ xâu “ Ph. D int Computer Science, UCLA, 1995” là một đối tƣợng phức tạp thể hiện bằng cấp đại học. Xâu này bao gồm các thơng tin về loại văn bằng học thuật, lĩnh vực, trƣờng đại học và năm tốt nghiệp. Các thao tác cĩ thể đƣợc định nghĩa để trích thơng tin nhƣ vậy là các dạng phân cấp khái niệm.
Số hĩa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
Ngồi ra các thao tác thuộc tốn học và thống kê nhƣ là phân cụm dữ liệu và các thuật tốn phân tích dữ liệu phân tán cĩ thể đƣợc sử dụng để hình thành các phân cấp khái niệm.