Ontology dữ liệu Nội dung

Một phần của tài liệu luận văn: tìm hiểu áp dụng công nghệ web ngữ nghĩa vào xây dựng hệ thống cung cấp thông tin hướng ngữ cảnh (Trang 43 - 49)

Nội dung phần này sẽ trình bày về Ontology nội dung của LBS giao thông và LBS du lịch. Dữ liệu của hai ontology này được thể hiện bằng hai phương kháp khác nhau

- Với LBS Giao thông, chúng ta chọn việc sử dụng công nghệ UML để tổ chức lại dữ liệu giao thông lớn. Việc này sinh ra Cơ sử dữ liệu Đối tượng Di chuyển (Moving Object Database MOD), mà bao gồm các đường quỹ đạo, phương tiện và đường đi trong UML mà được chọn dựa vào đó là phổ biến và mức độ đọc hiểu và việc diễn đạt hiệu quả cao. MOD là cốt lõi của hệ thống quản lý giao thông mà trên đó, nhiều môi trường ứng dụng với chức năng khai phá dữ liệu được áp dụng để lấy ra thông tin về việc dự đoán giao thông. Chúng ta có thể có cái nhìn chi tiết hơn về MOD trong nghiên cứu [24].

- Với LBS du lịch, chúng ta tập trung trong việc sử dụng ontolgy. Bằng việc sử dụng các công nghệ khác nhau để mô tả ngữ nghĩa của Dữ liệu Nội dung, chỉ ra tính đa dạng của Dữ liệu Nội dung của LBS và vì vậy ngữ nghĩa khác nhau và yêu cầu khác nhau. Hơn nữa, trên thực tế việc xây dựng chọn thiết kế không thể bao hàm hết công dụng của công nghệ hay công cụ cụ thể nào.

a. Dữ liệu Nội dung của LBS trong lĩnh vực Giao thông

Tổ chức Dữ liệu Nội dung trong, đi chi tiết hơn trong việc hiểu cặn kẽ hơn về các đối tượng, các thuộc tính của các đối tượng và các quan hệ liên quan tới khái niệm của

movement.

Movement trong LBS Giao thông. Xem xét một kịch bản sử dụng một hệ thống quản lý giao thông để điều khiển luồng giao thông trong thành phố Hà Nội. Bằng việc điều khiển di chuyển của các phương tiện giao thông cụ thể (ví dụ như xe tải, phương tiện giao thông công cộng, taxis…) một phương tiện có thể yêu cầu theo các truy vấn sau: “tìm các phương tiện tham gia giao thông trong Hà nội”, hoặc “tìm các phương tiện vừa rời khỏi Hà nội một giờ trước”, hoặc thông tin thường gặp như “tìm vị trí mà mật động phương tiện đông”. Việc thể hiện các đối tượng di chuyển giống như các đối tượng điểm có thể được thể hiện trong Hình 4.6. Đường nét liền trong Hình 4.6(a) thể hiện di chuyển của một đối tượng điểm. Không gian là (x, y) và chiều thời gian (t) được kết hợp với nhau thành dạng miền 3D. Những đường nét đứt chỉ ra đường gióng xuống của chuyển động tới không gian hai chiều (x, y).

42

Hình 4.6 Di chuyển của các đối tượng

Để ghi lại dịch chuyển của một phương tiện, chúng ta cần vị trí của nó và thời gian, ví dụ như trên một chuyển động tiếp diễn. Tuy nhiên, GPD và các công nghệ truyền thông chỉ cho phép chúng ta minh họa trên vị trí của đối tượng, ví dụ như: để có được vị trí tại các khởi tạo rời rạc của thời gian giống như trong một vài giây. Từ đó, sau này, nội suy các ví dụ trên, chúng ta có thể trích rút ra chuyển động của đối tượng. Phương pháp đơn giản nhất là sử dụng đường thẳng nội suy, giống như đối với các phương pháp khác như Đa thức Spline [25]. Vị trí được làm ví dụ sau đó trở thành các điểm kết thúc của các phần đường thẳng của một hình đa đường, và chuyển động của đối tượng được trình bày bởi toàn bộ các đường thẳng trong không gian ba chiều. Trong các tập của địa lý, chuyển động của một đối tượng được tập hợp lại thành một

trajectory; hay nói cách khác, trajectory là một đường theo dõi của một phương tiện

trong thời gian.

Hình 4.6(b) mô tả không gian thời gian (khối hình lập phương mà trong đó là các

đường nét đậm) và một vài đường trajectory (đường nét liền) được chứa trong đó.

Thời gian di chuyển trong hướng đi lên, và đỉnh của hình lập phương là thời gian của vị trí hiện tại trong ví dụ. Các dấu chấm đậm trên đỉnh của hình lập phương là thể hiện sự tiến triển của việc di chuyển sau thời gian (t).

Việc mô tả trajectory đủ để thể hiện các thuộc tính chính và các quan hệ của di

chuyển của đối tượng.

Các thuộc tính trong MOD: trajectory được đặc trưng bởi tập các thuộc tính khác

nhau phụ thuộc vào các yêu cầu của ứng dụng. Một vài trong số các thuộc tính chung là:

43

- tốc độ của di chuyển (được chỉ định bởi độ dốc của trajectory). - hướng của phương tiện.

- miền bao phủ, miền mà phương tiện đi qua trong suốt chuyến du lịch - khoảng cách du lịch

- thời gian của chuyến du lịch.

Dựa trên những nghiên cứu tại [26], [27] đã trình bày ở trên là đầy đủ cho mô hình cơ sở dữ liệu cho mobile, từ đó đưa ra câu trả lời cho những câu hỏi đơn giản như ‘miền mà chiếc xe A-4592 đã đi qua trong suốt hành trình du lịch?’ và có thể là những câu hỏi phức tạp hơn như ‘Những xe đã rời khỏi Athens vào nửa đêm di chuyến tới East và tìm thấy cách đây hai giờ?’.

Các quan hệ trong MOD. Thông qua môi trường, các trajectory liên hệ với môi

trường của chúng theo nhiều cách khác nhau thông qua thời gian. Theo đó, chúng ta

thảo luận về các loại quan hệ, làm thế nào để một trajectory có thể liên hệ với môi trường của nó và tới các trajectory khác.

Quan hệ giữa một trajectory với môi trường không gian. Các trajection có thể có

các mối liên hệ với môi trường không gian. Bao gồm các đối tượng thuộc không gian khác. Chúng có thể là các hạng mục cơ sở hạ tầng giống như đường xá, công viên, các tòa nhà vv, nhưng có thể là cả các thực thể không có thực như đường bao của một thành phố, các miền truy vấn. Trong ngữ cảnh thuộc thời gian, những thực thể thuộc không gian trở thành 3 chiều được đại diện bởi miền 3D. Chúng ta phân biệt 5 quan hệ cơ bản. được minh họa trong Hình 4.7(a), chúng bao gồm:

44

- stay within: khi toàn bộ trajectory thời gian nằm trọn trong phạm vi quan tâm.

- bypass: khi mà trajectory đi qua phạm vi quan tâm.

- leave: khi mà trajectory rời khỏi phạm vi quan tâm.

- enter: khi mà trajectory bắt đầu đi vào phạm vi quan tâm.

- cross: khi trajectory đi ngang qua phạm vi quan tâm

Các quan hệ giữa các trajectory: các vị trí quan hệ của các trajectory cần được

đăng ký tại các thời điểm. Phổ biến nhất là dựa vào suy luận logic topo [28] theo các quan hệ dưới đây (Hình 4.7(b) thể hiện các quan hệ này)

- intersect: là khi hai trajectory chéo nhau.

- meet: là khi hai trajectory giao nhau tại một điểm.

- equal: khi hai trajectory trùng nhau.

- near: khi hai trajectory gần nhau.

- far: khi hai trajectory xa nhau.

Chú ý rằng các khái niệm near/far là linh động tùy thuộc vào ngữ cảnh và vì thế

mà phụ thuộc vào từng miền ứng dụng. Ví dụ sự gần nhau giữa hai máy bay hay sự xa nhau giữa hai xe ô tô, thậm chí là khoảng cách giữa hai người đi bộ.

Từ những định nghĩa trên, một người có thể có một hay nhiều trajectory đầy đủ

hoặc với nhiều các điều kiện hơn, từ dạng đơn giản như ‘đâu là miền mà chiếc xe X đã đi qua trong toàn chuyến du lịch?” tới câu hỏi phức tạp hơn như “chiếc xe nào đã rời khỏi vùng này sau nửa đêm di chuyển tới phía?”.

Một vài thuộc tính và quan hệ đã được trình bày trong phần này để mô tả ngữ nghĩa của di chuyển và vị trí. Sau đây, sẽ là mô tả cụ thể, chi tiết hơn về và các loại

quan hệ của các trajectory.

Tổ chức MOD cho một LBS Giao thông. Một vài khái niệm liên quan tới việc

trajectory được thể hiện trong các phần trước được tổ chức để định nghĩa mô hình dữ

liệu nằm dưới một MOD. The các phương pháp hiểu tốt của thiết kế CSDL, bao gồm các pha của mô hình khái niệm, mô hình logic và cài đặt, chúng ta ban đầu sử dụng mô hình khái niệm để mô tả ngữ nghĩa của các khái niệm đã đề cập trong các phần trước. Để đại diện mang tính khái niệm, chúng ta sử dụng mô hình UML dựa vào tính phổ biến, mức độ đọc hiểu cao.

45

Hình 4.8 mô tả tập khái niệm của MOD và đưa ra 5 class chính, namely, trajectory, miền 3D, phương tiện, đường và các phần của đường và hai quan hệ mà được mô hình quá như các lớp đối tượng: quan hệ của các trajectory (trajectory/ trajectory) và một giữa trajectory với miền 3D (trajectory/environment). Trên thực tế thì chuyển động thay đổi liên tiếp các thuộc tính của đối tượng liên quan trong CSDL, như tốc độ của phương tiện, xuất phát điểm của phương tiện, quan hệ giữa chúng như khoảng cách xa/gần, chủ yếu là để mô phỏng các chức năng hoặc các toán tử trên đối

tượng. Ví dụ như phương thức ‘GetSpeed’ chỉ ra là tốc độ của phương tiện tại thời

điểm được đưa ra, hoặc có trả lời cho câu hỏi có khoảng cách xa/gần trong hai phương

thức ‘near’, ‘far’. Một phép toán là một dịch vụ được áp dụng trên một đối tượng. Để mô tả một trajectory, chúng ta cần một định danh của một thiết bị di động được định danh bởi “object id”, định danh trajectory “trajectory id” giống như vị trí của chính trajectory. Hay nói cách khác, ‘position’ mô tả dấu vết của việc chuyển động

của một phương tiện. Các loại dữ liệu được sử dụng là trừu tượng, từ đó chúng chỉ cần chỉ ra chiều của tham số. Hơn nữa việc khởi tạo của loại dữ liệu được tìm thấy trong

[21]. Một tập các toán tử như GetSpeed(không gian/thời gian), GetTime(không gian),

TravelledDistance(không gian/thời gian), và GetHeading(không gian/thời gian) là

mẫu và chỉ ra loại thông tin có thể được suy ra từ dữ liệu trajectory, ví dụ như tính toán khoảng cách hoặc điểm xuất phát của một trajectory, chúng ta áp dụng một số phép

toán mà sử dụng khoảng không gian/thời gian (spatiotemporal) như một tham số.

Lớp ‘Miền 3D’ là một mẫu để chỉ ra môi trường mang tính không gian của trajectory (giống như một phần của Miền 3D đại diện cho không gian hai chiều và chiều thời gian). Nó là lớp đối tượng nền tảng của MOD. Như đã được đề cập ở phần trên, miền 3D có thể được xây dựng như một tiến trình thời gian và di chuyển của các đối tượng; trong trường hợp này, nó chỉ ra được miền được bao phủ.

Các trajectory có quan hệ với một hay nhiều với các trajectory khác hoặc lớp ‘3D - Region’ của chúng. Hình 4.8 chứa các chức năng của lớp tương ứng để tính toán như các quan hệ. Ví dụ như Leave ngoài tham số tính toán vị trí mang tính thời gian không gian và tại đó, một trajectory đưa ra một lớp khởi tạo của ‘3D - Region’. Để hạn

chế các toán tử, chúng ta sử dụng một đối số cho chức năng. Trong trường hợp của

Leave là đối số thời gian, việc tìm kiếm các vị trí không gian thời gian mà tại đó trajectory vừa rời khỏi miền được giới hạn để đưa ra khoảng cách thời gian. Trong lớp

‘trajectory/environment’ tham số ‘position’ hoặc ‘time’ phản ánh kết quả của chức năng. Tương đương với việc xem ‘position’ có liên quan trong ‘trajectory/trajectory’.

Cuối cùng, lý do của tính toàn vẹn, chúng tôi mô tả các lớp đối tượng trước:

‘vehicle’, ‘road’ và ‘road_segment’. Chú ý rằng mối quan hệ giữa vehicle và

46

việc mất tín hiệu của GPS và vì thế, đường đi của nó là sự kết hợp của các trajectory. Sự giống nhau giữa ‘road’ và ‘road_segment’.

Hình 4.8 Giản đồ cơ sở dữ liệu của MOD

Hình 4.8, như một ví dụ cho một mẫu, chỉ những lớp cơ bản; các lớp khác như 3D – line mà trình bày các quan hệ khác nhau với các đối tượng chuyển động (ví dụ mạng lưới đường trong thời gian) cũng có thể được làm cho thích nghi trong phương pháp này.

Lý do căn bản và các lựa chọn được trình bày ở đây có những ưu điểm chính của việc mô tả hai khái niệm cơ bản là: Trajectory của đối tượng chuyển động bằng việc giữ việc theo dõi di chuyển của nó; bên cạnh đó sự di chuyển của đối tượng, bằng việc ghi lại vị trí đã biết cuối cùng của sự di chuyển.

47

Dữ liệu nội dung du lịch bao gồm thông tin liên quan tới giải trí, bảo tàng, lịch sử… Dữ liệu nội dung có thể được cấu trúc trong dạng của ontology/taxonomy nhóm nội dung thành một tập mang tính cấp bậc của việc phân loại của dữ liệu.

Hình 4.9 chỉ ra một phần của Ontology dữ liệu nội dung chỉ ra các lớp liên quan

trong một LBS Du lịch. Mũi tên chỉ ra mối quan hệ giữa các lớp cha. Ví dụ Lịch sử là lớp cha của ‘Lịch sử chiến tranh’ và ‘Lịch sử Tự nhiên’. Các lớp ‘lễ hội’, ‘đền chùa’, ‘nhà thờ’ là con của lớp ‘Tôn giáo’.

Hình 4.9 Trích đoạn Ontology Nội dung cho Dịch vụ du lịch

Một phần của tài liệu luận văn: tìm hiểu áp dụng công nghệ web ngữ nghĩa vào xây dựng hệ thống cung cấp thông tin hướng ngữ cảnh (Trang 43 - 49)