Chương 3 : Hệ thống gợi ý tin tức tiếng Việt xenoNews
3.3 Thiết kế và cài đặt chi tiết các thành phần hệ thống
3.3.3 Lõi xử lý Back-end
Back-end được xây dựng trên mơi trường .NET Framework 4.5, sử dụng ngơn ngữ lập trình C# phiên bản 5.0, bao gồm 4 module chính (xem Minh hoạ 3.3).
Minh hoạ 3.3: Các Module chính của Back-end
- Module thu thập tin tức: cập nhật tin tức mới từ các báo điện tử vào hệ thống.
o Input: Các nguồn RSS được lưu trong CSDL
o Output: thơng tin cơ bản của các tin tức thu được (tiêu đề, URL dẫn tới bài báo, URL ảnh, …), được lưu vào CSDL; và mã HTML của các trang tin, chuyển tới Module xây dựng hồ sơ đối tượng.
- Module xây dựng hồ sơ đối tượng: tiền xử lý nội dung và tạo đại diện cho các bài
báo.
o Output: đại diện của bài báo (dưới dạng dữ liệu đếm).
- Module quản lý hồ sơ người dùng: đây là một Module đặc biệt trong hệ thống, vì
nằm trên cả Back-end và Front-end (website). Đối với phần lõi xử lý đang mơ tả, nhiệm vụ của module này là:
o Dựa trên lịch sử tương tác (lưu trong CSDL của Middle-level) của từng người dùng với tin tức trong hệ thống, định kỳ cập nhật lại mơ hình dài hạn của họ.
o Cung cấp các thơng tin trong hồ sơ người dùng cho Module gợi ý.
- Module gợi ý:
o Input: thơng tin hồ sơ người dùng (ngắn hạn, dài hạn, luật tự mơ tả) + hồ sơ đối tượng (các đại diện của tin tức: vector TF-IDF, vector thuộc tính Boolean)
o Output: kết quả gợi ý tin, lưu vào CSDL.
Minh hoạ 3.4 thể hiện chi tiết hơn nhiệm vụ của các module, cũng như tương tác
Minh hoạ 3.4: Chi tiết tương tác giữa các Module của Back-end