Phân hệ CMS đưa ra một môi trường tích hợp để phát triển và quản lý nội dung, trong đó nội dung có thể được biểu diễn theo nhiều khuôn dạng khác nhau và không phụ thuộc vào giao diện Web. Mục đích chính của phân hệ CMS là tự động thu nhận và tổ chức nội dung từ nhiều nguồn phân tán không đồng nhất để có thể trả lời các câu hỏi thông minh từ người sử dụng cũng như từ các hệ thống ngang hàng khác. Phân hệ ứng dụng CMS cung cấp các chức năng đóng vai trò nền tảng cho các phân hệ ứng dụng khác.
Các tiến trình quan trọng của phân hệ CMS là:
Tạo và thu thập nội dung: tạo mới hoặc thu nhận các mục nội dung và chuyển đổi về các khuôn dạng chuẩn nếu cần.
Quản trị: lưu trữ và quản lý nội dung và siêu dữ liệu của nội dung trong kho chứa.
Xuất bản: rút trích nội dung để đưa ra thông tin hữu dụng. Phân bố thông tin này tới các ứng dụng hoặc người dùng.
Một số thành phần nền tảng cần được xây dựng trong phân hệ CMS gồm:
Xây dựng một framework để kết nối và xử lý nhiều nguồn dữ liệu không đồng nhất: ví dụ các CSDL quan hệ, nội dung web, các nội dung tài liệu hợp lệ, ...
Công cụ phân tích, phân loại và tích hợp (ghép hợp hoặc ánh xạ) nội dung theo cấu trúc ngữ nghĩa liên quan đến miền lĩnh vực nào đó.
Xây dựng ontology để hình thức hóa ngữ nghĩa của nội dung theo cây phân cấp khái niệm trong lĩnh vực.
Các giao diện thông minh hỗ trợ truy cập cho cả con người và phần mềm máy tính (agent) để tìm kiếm theo ngữ nghĩa dựa trên ontology.
Mục tiêu của luận văn là áp dụng công nghệ web có ngữ nghĩa và ontology để mô tả cấu trúc của nội dung theo ngữ nghĩa. Hướng tiếp cận này giúp khắc phục được hạn chế của các hệ CMS hiện nay.