4 Giải quyết bài tốn kiến trúc
4.3 So khớp thơng tin kết hợp mức độ tương quan giữa các tag
Trong quá trình thực hiện đề tài, khi nghiên cứu phương pháp so khớp thơng tin dựa trên các tập thuộc tính Tag của đối tượng, chúng tơi nhận thấy vấn đề độ tương quan ngữ nghĩa giữa các từ khĩa, như đã được đề cập ở phần trên, nhưng do phạm vi đề tài và thời gian hạn chế nên chúng tơi quyết định khơng nghiên cứu phương pháp tính độ tương quan ngữ nghĩa của hai từ khĩa. Thay vào đĩ chúng tơi cung cấp giải pháp lưu trữ kết quả tính tốn độ tương quan vào bảng SimilerirityTerm để truy vấn sử dụng, sau đĩ xây dựng phương pháp so khớp thơng tin kết hợp so sánh ngữ nghĩa để tính mức độ tương quan giữa các tag và cập nhật dữ liệu cho bảng SimilerityTerm. Nhờ vậy kiến trúc đảm bảo khả năng mở rộng và phát triển Semantic web nhằm xây dựng hệ thống so khớp hồn thiện hơn.
Hình 31. Class diagram mức độ tương quan giữa các tag theo gĩc nhìn
So khớp linh hoạt theo gĩc nhìn:
- Đứng dưới mỗi gĩc nhìn khác nhau, mức độ tương quan giữa các tag cũng khác nhau. Ví dụ: xét mức độ tương quan giữa tơi và thầy hướng dẫn, đứng dưới gĩc nhìn là quan hệ gia phả, thì rõ ràng tơi và thầy khơng cĩ mối quan hệ ruột thịt hay họ hàng với nhau, nĩi cụ thể hơn là mức độ tương quan giữa tơi và thầy là bằng khơng, nhưng dưới gĩc nhìn là quan hệ thầy trị, thì thầy là người đã tận tình chỉ dạy và hướng dẫn chúng tơi từ lúc bắt đầu khố luận này. Như vậy, khi nhu cầu và “thơng tin đáp ứng nhu cầu” cụ thể được mơ tả thơng qua các thuộc tính, dưới một gĩc nhìn về một lĩnh vực cụ thể nào đĩ thì thuộc tính A cĩ thể cĩ mức độ tương quan với thuộc tính B, tuy nhiên, khi xét dưới gĩc nhìn khác, thì mức độ tương quan này sẽ khơng cịn phù hợp nữa, việc này địi hỏi giữa các gĩc nhìn khác nhau, các thuộc tính sẽ cĩ mức độ tương quan thay đổi phù hợp với chính gĩc nhìn đĩ. Một ví dụ cụ thể, chúng
Xây dựng kiến trúc cổng thơng tin tìm việc| Giải quyết bài tốn kiến trúc 62 ta cĩ thuộc tính A lưu trữ giá trị là “quả cam xanh” và thuộc tính B lưu trữ giá trị là “quả cam màu cam”, đứng dưới gĩc nhìn của một người nội trợ, hai thuộc tính này cĩ mức độ tương quan với nhau, quả cam xanh hay quả cam màu cam đều cĩ thể chế biến mĩn ăn được, tuy nhiên, nếu xét dưới gĩc nhìn của một người hoạ sĩ thì lại khác, việc vẽ “quả cam xanh” hay “quả cam màu cam” địi hỏi người hoạ sĩ phải dùng những màu khác nhau để vẽ, mức độ tương quan giữa hai thuộc tính này gần như khơng cĩ.
Như hình trên, SimilarityTerm và View (gĩc nhìn) cĩ quan hệ phụ thuộc với nhau, ứng với mỗi gĩc nhìn khác nhau thì mức độ tương quan giữa các tag sẽ khác nhau.
So khớp linh hoạt theo thời gian:
Mức độ tương quan giữa các tag cĩ thể thay đổi theo thời gian. Nhu cầu và “thơng tin đáp ứng nhu cầu” được so khớp với nhau, từ đĩ hệ thống sẽ đưa ra mức độ so khớp giữa hai đối tượng này nhằm mục đích gợi ý cho người dùng lựa chọn. Tuy nhiên, “thơng tin đáp ứng nhu cầu” cĩ được người sử dụng lựa chọn hay khơng chỉ dựa vào một phần của sự so khớp này. Khi hệ thống cĩ cái nhìn khách quan từ người dùng, các tập dữ liệu training sẽ được thay đổi nhằm cập nhật kịp thời mức độ tương quan giữa các tag, xu hướng “người phát sinh nhu cầu” lựa chọn cho mình những “thơng tin đáp ứng nhu cầu” nào, sự so khớp thể hiện ở đâu, những thuộc tính nào cĩ mức độ tương quan với nhau. Khi áp dụng phương pháp khai thác dữ liệu, mức độ tương quan này sẽ được cập nhật theo thời gian, giúp cho hệ thống so khớp hoạt động khách quan hơn từ ý kiến của người sử dụng. Do thời gian cĩ giới hạn, chúng tơi chỉ cung cấp giải pháp mức độ tương quan giữa các tag thơng qua class SimilarityTerm, class này lưu trữ thơng tin sau khi phân tích mức độ tương quan giữa các tag, giúp cho việc truy xuất mức độ tương quan nhanh chĩng và kịp thời hơn, người dùng chỉ cần cho biết hai từ khố cần so sánh mức độ tương quan và việc so sánh đứng dưới gĩc nhìn cụ thể nào, class SimilarityTerm sẽ trả lời cho người dùng biết mức độ tương quan giữa chúng. Thơng qua điểm mạnh dễ mỡ rộng của kiến trúc, hệ thống tính mức độ tương quan cĩ thể được lập trình viên triển khai và tích hợp vào kiến trúc một cách dễ dàng.
Xây dựng kiến trúc cổng thơng tin tìm việc| Giải quyết bài tốn kiến trúc 63 Về phương pháp so khớp, nhĩm thực hiện bằng cách duyệt và so sánh từng thuộc tính trong hai cây thuộc tính của hai đối tượng khác nhau. Nếu hai từ khĩa so sánh khơng khớp hồn tồn với nhau, sẽ tìm từ khĩa tương quan trong SimilarityTerm, sau đĩ sử dụng từ khĩa thực hiện so sánh lần nữa. Kết quả so sánh của hai đối tượng là số phần trăm khớp với nhau. Tuy nhiên, đối với các lĩnh vực nghiệp vụ khác nhau thì cách so khớp cĩ một vài điểm khác biệt cho nên kiến trúc phải cho phép lập trình viên viết lại giải thuật so khớp cho phù hợp với nghiệp vụ của họ.
Việc mức độ tương quan cĩ giá trị thay đổi theo gĩc nhìn và thời gian nĩi trên đã gĩp phần tạo được sự linh hoạt cho hệ thống xác định mức độ tương quan và hệ thống so khớp. Đồng thời, khi lưu trữ kết quả so sánh mức độ truy vấn giữa hai đối tượng thơng qua SimilarityTerm giúp cải thiện tốc độ truy xuất giúp cho hệ thống so khớp làm việc nhanh và hiệu quả hơn.