Chương 3: PHÂN TÍCH THIẾT KẾ HỆ THỐNG
4. Phân tích ứng dụng
4.1. Phân tích chức năng:
14 Mô tả bài toán:
Người dựng tham gia hệ thống thực hiện gừ cõu tỡm kiếm (truy vấn) vào hộp thoại tìm kiếm. Hệ thống thực hiện tách từ và loại bỏ những từ không cần thiết để có tập từ khóa tìm kiếm. Sau đó, thực hiện tìm kiếm theo nội dung của tập từ khóa để tìm ra những tài liệu có liên quan, sắp xếp theo độ tương đồng của các tài liệu liên quan đến từ khóa. Sau khi hệ thống thực hiện trích lọc được tập tài liệu thì hiển thị cho người dùng xem kết quả tìm kiếm.
Khi người dùng chọn một tài liệu, hệ thống tìm kiếm trên kho dữ liệu và đưa ra các tài liệu tương đồng, kết hợp với việc thực hiện đánh giá sự quan tâm của người dùng đối với tài liệu này, để đưa ra một kết quả chính xác hơn. Đồng thời cập nhật tần suất được chọn của tài liệu trên hệ thống.
Khi đưa một tài liệu vào hệ thống, người quản trị nhập các thông tin cơ bản như: tựa đề, nhà xuất bản, tác giả, năm xuất bản … được đưa vào kho dữ liệu. Ngoài ra, hệ thống thực hiện tách từ, rút trích tập từ khóa và đánh giá độ tương đồng của tài liệu với các tài liệu có trên hệ thống. Đồng thời cập nhật lại toàn bộ việc đánh giá này cho các tài liệu liên quan.
Việc cập nhật tần suất lựa chọn của người dùng là thông tin để đánh giá mức độ quan tâm của người dùng đối với tài liệu.
15 Xác định đối tác và các Use_case trong hệ thống Ứng dụng được xây dựng với hai đối tác (actor): người dùng (user) và người quản trị (admin).
Người dùng thực hiện tìm kiếm tài liệu nghiên cứu (phân hệ tư vấn và tìm kiếm).
Người quản trị thực hiện việc quản trị: tài liệu, danh mục, tác giả, nhà xuất bản (phân hệ quản trị).
Hệ thống bao gồm các Use_case sau:
Tên Use_case: Tư vấn và tìm kiếm (Search & Recommend) Nội dung: hệ thống thực hiện tìm kiếm tài liệu và gợi ý các tài liệu có liên quan
Kịch bản chính:
• Tách từ và loại bỏ stopword, rút trích tập từ khóa đặc trưng câu truy vấn.
• Tìm kiếm theo nội dung
• Tìm kiếm dựa theo mức độ quan tâm của người dùng đối với tài liệu
Tên Use_case: Tách từ và loại bỏ stopword (Segmentation &
Remove stopword)
Nội dung: hệ thống thực hiện tách từ của câu truy vấn hoặc tài liệu.
Kịch bản chính:
• Hệ thống nhận câu truy vấn/ tài liệu chưa tách từ.
• Tách từ.
• Loại bỏ stopword
• Đếm số lần xuất hiện của từ trong tài liệu/ câu truy vấn.
• Trả kết quả: tập các từ được tách và số lần xuất hiện của mỗi từ sau khi loại bỏ stopword.
Tên Use_case: Rút trích tập từ khóa (Keyword Extraction) Nội dung: hệ thống thực hiện rút trích tập từ khóa đại diện cho câu truy vấn/ tài liệu.
Kịch bản chính:
• Gọi use_case “Tách từ và loại bỏ stopword”.
• Dùng phương pháp TF_IDF để rút trích tập từ khóa đặc trưng.
• Trả kết quả: Tập từ khóa đặc trưng.
Tên Use_case: Lọc tài liệu theo nội dung(Content_based Filtering)
Nội dung: hệ thống thực hiện tìm kiếm tài liệu theo nội dung (dựa trên độ tương đồng của các tài liệu thông qua kỹ thuật PLSA)
Kịch bản chính:
• Nhận tập từ khóa đặc trưng của tài liệu.
• Đánh giá độ tương đồng bằng phương pháp PLSA.
• Huấn luyện dữ liệu thông qua thuật toán EM (khả năng cực đại) để xử lý dư thừa.
• Đưa ra tập tài liệu có nội dung liên quan.
Tên Use_case: Đánh giá mối quan tâm của người dùng đối với tài liệu (Collaborative Filtering)
Nội dung: Đánh giá mức độ quan tâm của người dùng đối với các tài liệu liên quan với tài liệu được chọn.
Kịch bản chính:
• Cập nhật tần suất được chọn của người dùng đối với tài liệu vừa được chọn.
• Thực hiện thuật toán PLSA áp dụng cho lọc cộng tác.
• Huấn luyện dữ liệu để đạt khả năng cực đại thông qua thuật toán EM.
• Trả về tập các tài liệu được nhiều người quan tâm trong phân loại mà người dùng chọn (sắp xếp theo mức đánh giá của người dùng).
16 Activity Diagram:
Use_case: Search & Recommend
Hình 3.2_Activity Diagram của Use_Case Search & Recommend
Use_case: Document Management
Hình 3.3_Activity Diagram của Use_Case Document Management
17 Use_case Diagram
Hình 3.4_Use_Case Diagram của hệ thống.
4.2. Phân tích hành vi
Sequence Diagram: Use_case Search&Recommend
Hình 3.5_Sequence Diagram của Use_case Search&Recommend
4.3. Class Diagram:
Hình 3.6_Class Diagram của Use_Case Search&Recommend và Document Management