Phân tích các thành phần trong câu truy vấn:

Một phần của tài liệu Xây dựng hệ thống GIR phục vụ tìm kiếm thông tin địa lý, vị trí ở Việt Nam (Trang 35)

Với đặc trưng của hệ thống là các thông tin liên quan đến các khái niệm, các chủ đề và thông tin về vị trí đi kèm theo chúng, do đó ta có thể thấy rằng đặc trưng trong truy vấn của hệ thống cũng tương tự, nghĩa là các câu truy vấn sẽ thường xuyên có dạng tìm kiếm cái gì và muốn tìm cái đó ở chỗ nào (“object in place name” [12]). Vì vậy, hầu hết mọi câu truy vấn trong hệ GIR đều có thể được phân tích thành một bộ ba <what, relation, where> trong đó what dùng để chỉ đối tượng tìm kiếm, thường là các chủ đề tìm kiếm, where dùng để chỉ nơi chốn mà câu truy vấn giới hạn lại, và relation chỉ mối quan hệ không gian giữa whatwhere và có vai trò quyết định phương thức tìm kiếm của hệ thống (tìm trong vùng, tìm xung quanh điểm hay tìm trên đường, v.v…). Trong khi what có thể được cấu thành một cách tự do miễn sao nêu lên được thông tin cần tìm là gì thì relationwhere lại phải theo một danh sách các từ/cụm từ có kiểm soát. Cụ thể relation thường phải là những quan hệ không gian phổ biến mà hệ GIR có thể hiểu được (ví dụ: “ở”, “gần”, “ở tại”, “ở trong”, “trên”, “ở trên”, v.v…), còn where thì

phải được phân tích sao cho kết quả sau cùng nằm trong một tập phân biệt các địa danh được định nghĩa trong ontology địa lý mà hệ thống sử dụng.

Các hệ thống khác nhau có thể có nhiều cách thức khác nhau để tiếp nhận câu truy vấn từ phía người dùng. Thông thường thì có 3 cách:

 Người dùng nhập vào một câu truy vấn duy nhất. Lúc này hệ thống sẽ phải tự phân tích ra các thành phần <what, relation, where>.

 Người dùng nhập câu truy vấn vào những ô nhập liệu tách biệt nhau, mỗi ô cho một thành phần. Lúc này hệ thống có thể bỏ qua việc phân tích câu truy vấn thành một bộ ba <what, relation, where> mà chỉ cần phân tích cụ thể cho từng thành phần riêng biệt mà người dùng nhập vào.

 Người dùng nhập câu truy vấn với nội dung là thành phần what, nghĩa là chỉ cho hệ thống biết chủ đề tìm kiếm. Sau đó, người dùng sẽ cung cấp cho hệ thống vùng giới hạn tìm kiếm bằng cách chọn trực tiếp từ bản đồ hoặc chọn từ một danh sách các tên địa danh phân biệt sẵn có. Lúc này, công việc của hệ thống trở nên đơn giản hơn rất nhiều vì chỉ cần phân tích chủ đề mà người dùng muốn tìm, các thành phần còn lại được hệ thống cung cấp sẵn coi như đã rõ ràng. Hình 3-1 thể hiện các quá trình từ khi tiếp nhận câu tury vấn đến khi phân tích ra kết quả mà hệ thống có thể hiểu được.

3.4 Giải thuật phân tích các thành phần trong câu truy vấn: 3.4.1 Xác định bộ ba <what, relation, where>:

Một phần của tài liệu Xây dựng hệ thống GIR phục vụ tìm kiếm thông tin địa lý, vị trí ở Việt Nam (Trang 35)