II. XÂY DỰNG ỨNG DỤNG
3. Hiện thực hệ thống
Để xây dựng được hệ thống như thiết kế, các công cụ và thư viện chính được chương trình sử dụng:
- Thư viện được sử dụng để thu thập thông tin từ các website là crawler4j tại ‘http://code.google.com/p/crawler4j/’.
- Các đoạn mã html được trả về sẽ được lọc lấy văn bản qua bộ phân tích cú pháp html jsoup tại ‘http://jsoup.org/’.
- Ontology được quản lý, duy trì bởi công cụ Protégé tại
‘http://protege.stanford.edu/’ với ngôn ngữ OWL và thư viện quản lý luật, suy diễn là Jena tại ‘http://jena.apache.org’
Phân cấp các lớp Trong lớp “Nơi” có các thuộc tính chính là diaChi (single string) – địa chỉ của địa điểm id (single int) – id của địa điểm
ten (single string) – tên của địa điểm
hinhAnh (single string) – hình ảnh đại diện của địa điểm
mon (multiple string) – các món chính của nơi ăn uống đó
monDacTrung (multiple string) – các món đặc trưng của nơi ăn uống đó phongCach (multiple string) – phong cách của nơi ăn uống đó
tienNghi (multiple string) – các tiện nghi ở nơi đó có
dacDiemNoiBat (multiple string) – các đặc điểm nổi bật của nơi ăn uống đó
Trong lớp “Nơi Nghỉ” có các thuộc tính chính là tienNghi (multiple string) – các tiện nghi ở nơi đó
Trong lớp “Khách Sạn” có các thuộc tính chính là soSao (single int) – số sao của khách sạn
giaPhong (multiple string) – giá phòng của khách sạn
- Mã nguồn mở Lucene được dùng cho đánh chỉ mục và tìm kiếm ‘lucene.apache.org’
- Ngoài ra, thư viện vnTonkenizer tại ‘http://vlsp.vietlp.org:8080/demo/? page=resources’ được sử dụng để tách từ và opennlp để xử lý ngôn ngữ tự nhiên ‘http://opennlp.apache.org/’