Mụ tả phộp xúa trong cõ yR

Một phần của tài liệu (LUẬN VĂN THẠC SĨ) Một số vấn đề về lưu trữ và chỉ mục trong cơ sở dữ liệu không gian Luận văn ThS. Công nghệ thông tin 60 48 05 (Trang 52 - 55)

2.6. So sỏnh cỏc cấu trỳc dữ liệu

Trong chương này ta đó khảo sỏt 4 loại cấu trỳc dữ liệu: cõy k-d, cõy tứ phõn điểm, cõy tứ phõn MX và cõy R. Mỗi chỳng đều cú ưu điểm và nhược điểm nhất định.

- Cõy tứ phõn điểm rất dễ cài đặt. Tuy nhiờn, cõy tứ phõn điểm cú k nỳt thỡ cú thể cú độ cao là k, như vậy làm tăng độ phức tạp cho chốn và tỡm kiếm (nú cú thể là O(k)). Hơn nữa mỗi so sỏnh đũi hỏi so sỏnh hai tọa độ.Việc xúa nỳt trong cõy loại này là khỏ khú khăn. vỡ việc tỡm kiếm nỳt ứng viờn thay thế cho nỳt đang xúa thụng thường là khụng đơn giản. Cuối cựng truy vấn khoảng trong cõy này cần O(2n), n là tổng số bản ghi trong cõy.

- Cõy k-d rất dễ cài đặt. Tuy nhiờn, cõy k-d chứa k nỳt cú thể cú độ cao k, do vậy chốn và tỡm kiếm cú thể phức tạp. Trong thực tế đường dẫn từ gốc tới lỏ của cõy loại này dài hơn trong cõy tứ phõn điểm bởi vỡ cõy này là cõy nhị phõn. Độ phức tạp tồi nhất của tỡm kiếm dải trong cõy k-d là: 

       k kxn O 1 1 . Khi k=2, thỡ độ phức tạp cũn O 2 n như cõy tứ phõn điểm.

- Cõy tứ phõn MX đảm bảo cú độ cao nhất là O(n), trong đú vựng được biểu diễn cú (2n

loại này cần thời gian là O(n). Tỡm kiếm dải của cõy này rất hiệu quả - O(N+2h ), trong đú N là tổng số điểm kết quả truy vấn và h là độ cao của cõy.

- Tương tự với cõy R. Tuy nhiờn, cõy R cú thể cú nhiều chữ nhật lưu trong cựng nỳt, nú phự hợp với xõm nhập đĩa từ bằng giảm độ cao của cõy.

- Một bất lợi của cõy R là cỏc chữ nhật bao kết hợp với cỏc nỳt khỏc nhau cú thể phủ lờn nhau. Như vậy, việc tỡm kiếm trong cõy R thay vỡ đi theo một vết như cỏc cõy khỏc, là phải đi theo nhiều vết trong cõy. Trường hợp này lại làm tăng số lần thõm nhập đĩa.

- Tổng thể, cõy R hiệu quả hơn cõy k-d và cõy tứ phõn điểm trong cỏc ứng dụng đũi hỏi dung lượng đĩa rất lớn phải xõm nhập. Tuy nhiờn nếu chỉ số nhỏ thỡ sử dụng cõy tứ phõn MX sẽ hiệu quả hơn.

Chương 3.

CÀI ĐẶT VÀ THỬ NGHIỆM

3.1. Bài toỏn

3.1.1. Phỏt biểu bài toỏn

- Input: + Dữ liệu bản đồ định dạng bằng shapefile, trong đú cú 2 lớp bản đồ: lớp đường và lớp điểm được tổ chức bởi cỏc tệp:

+ 2 tệp dữ liệu mụ tả dữ liệu dạng điểm và dữ liệu dạng đường là: xe_buyt.dbf và diem_chuyen_xe_bus.dbf

+ 2 tệp dữ liệu lưu trữ ID của dữ liệu dạng điểm và dữ liệu dạng đường là: xe_buyt.shx và diem_chuyen_xe_bus.shx

+ 2 tệp dữ liệu mụ tả đầy đủ dữ liệu dạng điểm và dữ liệu dạng đường là: xe_buyt.shp và diem_chuyen_xe_bus.shp

+ Và cỏc tệp khỏc.

Cỏc tệp dữ liệu này lưu trữ dưới dạng tuyến tớnh.

- Output: + Từ cỏc tệp dữ liệu lưu trữ dạng tuyến tớnh lưu trữ sang cấu trỳc cõy tứ phõn điểm.

+ Hiển thị bản đồ từ dữ liệu đó lưu trữ dưới dạng cấu trỳc cõy tứ phõn điểm.

+ So sỏnh giữa kỹ thuật lưu trữ bởi cấu trỳc cõy với kỹ thuật lưu trữ bởi cấu trỳc tuyến tớnh.

3.1.2. Cỏch giải quyết

- Từ tệp .shx (ở dạng nhị phõn) trong dữ liệu shapefile chuyển sang tệp dạng danh sỏch (list) cũng là tệp nhị phõn.

- Từ dữ liệu trong tệp dạng danh sỏch (list) lưu trữ vào cấu trỳc cõy tứ phõn điểm đó trỡnh bày trong chương 2.

- Hiển thị bản đồ sử dụng thư viện SharpMap

- Truy vấn vựng trờn bản đồ để so sỏnh giữa cấu trỳc lưu trữ dạng tuyến tớnh và cấu trỳc lưu trữ dạng cõy. Truy vấn như sau: giả sử người dựng kớch chuột(chọn) vào hai điểm, chẳng hạn A(xA,yA) và B(xB,yB) khi đú những điểm nằm trong hỡnh chữ nhật bao cú gúc dưới bờn trỏi là A và gúc trờn

bờn phải là B được hiển thị bởi một màu khỏc với màu hiện tại của những điểm khụng nằm trong vựng truy vấn

* Mụ hỡnh Use Case của hệ thống:

Một phần của tài liệu (LUẬN VĂN THẠC SĨ) Một số vấn đề về lưu trữ và chỉ mục trong cơ sở dữ liệu không gian Luận văn ThS. Công nghệ thông tin 60 48 05 (Trang 52 - 55)

Tải bản đầy đủ (PDF)

(70 trang)