Thống kê hiệu suất phân cụm với thuật toán AH

Một phần của tài liệu (LUẬN văn THẠC sĩ) nghiên cứu giải pháp nâng cao tốc độ hiển thị dữ liệu trên bản đồ trực tuyến 04 (Trang 58 - 61)

Mức Zoom Số điểm Mức độ tăng tốc hiển thị

20 1393 1 19 1119 1.2 18 974 1.4 17 805 1.7 16 601 2.3 15 391 3.6 14 214 6.5 13 102 13.7 12 50 27.9 11 24 58 10 14 99.5 9 7 199 8 3 464.3 7 2 696.5 6 1 1393 5 1 1393 4 1 1393 3 1 1393 2 1 1393 1 1 1393 0 1 1393

Trên đây là những nội dung chính của quá trình lập trình gộp nhóm điểm bằng thuật toán phân cấp Agglomerative Hirearchical. Kết quả của quá trình gộp nhóm cho ta một danh sách (mảng) các đối tượng đại diện cho từng nhóm điểm, quá trình hiển thị các đối tượng này tương tự như hiện thị các đối tượng đơn lẻ trước đây. Tọa độ của điểm đại diện cho nhóm điểm được xác định bằng cách tính trung bình cộng của các đối tượng thành phần trong nhóm.

KẾT LUẬN

Luận văn đã trình bày rõ về hai phương pháp phổ biến thường được sử dụng trong kĩ thuật gộp nhóm điểm là K-means và AH, trong đó ứng dụng thành công thuật toán AH vào bài toán hiển thị dữ liệu điểm ATM khu vực Hà Nội. Đưa ra được phương pháp đánh giá sự thay đổi về hiệu suất trước và sau khi áp dụng kỹ thuật gộp điểm AH. Kết quả này có thể được phát triển để ứng dụng vào các bài toán hiển thị dữ liệu điểm trên Web với số lượng lên tới hàng triệu điểm.

Mục tiêu của luận văn là khái quát hóa một tập dữ liệu dạng điểm, thực nghiệm đã giảm được số lượng điểm hiển thị trên bản đồ mà không ảnh hưởng tới nội dung bản đồ.

Các tài liệu, và nghiên cứu liên quan đến lĩnh vực này cho thấy không có phương pháp nào là hoàn toàn tự động trong khái quát hóa bản đồ. Kết quả và độ chính xác của quá trình khái quát hóa đối với từng phương pháp đều phụ thuộc và các tham số do người dùng đưa ra như bán kính gộp điểm hoặc việc ấn định số lượng cụm ban đầu.

Trong quá trình khái quát hóa số lượng điểm giảm đi, hình thành các khu vực bị trống dữ liệu, vì vậy cần lựa chọn tham số bán kính gộp nhóm một cách hợp lý để quá trình khái quát hóa không ảnh hưởng nhiều tới nội dung bản đồ.

Hướng nghiên cứu tiếp theo có thể được phát triển từ các kết quả đã đạt trong luận văn vào bài toán khái quát hóa dữ liệu dạng vùng hoặc dạng đường. Góp phần hoàn thiện những mặt còn hạn chế trong quá trình khái quát hóa bản đồ số.

TÀI LIỆU THAM KHẢO Tiếng Việt

1. Nguyễn Thị Ngọc Diễm (2014), So sánh một số thuật toán phân cụm dữ liệu, Luận văn thạc sỹ, Học viện công nghệ bưu chính viễn thông, tr.5-9.

2. Phạm Thị Phép (2013), Ứng dụng công nghệ Webgis mã nguồn mở phục vụ

công tác quảng bá du lịch, Đại học Nông Lâm tp. Hồ Chí Minh, tr.10-12.

3. Nhữ Thị Xuân (2006), Bản đồ học, Nhà xuất bản Đại học quốc gia Hà Nội. tr.8-9, 103-108.

4. Fan Hong, Trần Quỳnh An, Tự động tổng quát hóa bản đồ, Tạp chí KHKT Mỏ địa chất, số 44, 10-2013, tr.23-29.

5. Nguyễn Hà Nam, Nguyễn Trí Thành, Hà Quang Thụy (2012), Giáo trình khai phá dữ liệu, Nhà xuất bản ĐHQGHN Hà Nội, tr.179-192.

Tiếng Anh

6. Atta Rabbi and Epameinondas Batsos (Master of Science Thesis in Geoinformatics - 2012), Phân cụm and cartographic simplification of point data set.

7. Bader M. (2001), Energy Minimization methods for feature displacement in map generation, doctoral thesis, Universty of Geography, University of Zurich,

Switzerland.

8. Epameinondas Batsos, Politis Panagiotis (2006), Creation of geographic – cartographic data, multiple, continuous scale of topographic maps using satellite images VHR. Concepts, problems, suggestions, bachelor thesis,

Department of Land surveying, Technological Educational Institution of Athens, Athens – Greece.

9. Jiawei Han, Micheline Kamber (2006), Data mining: Concepts and Techniques, 2nd ed., Elsevier Science, Sanfransico, United states.

10.Robert B.McMaster, K.Stuart Shea (1992), Generalization in digital cartography, The Association of American Geographers, Washington.

11.Robert B.McMaster, K.Stuart Shea (1989), Cartographic Generalization in a Digital Enviroment: when & how to generalize, Proceeding of 9th Internati

onal Symposium on Computer ‐ Assisted Cartography, Baltimore.

12.Pang Ning Tan, M. Steinbach, V. Kumar (2006), Introduction to Data Mining, Addison‐Wesley, Minesota, United states.

13.L.Kaufman & P.J. Rousseeuw (1990), Finding Groups in Data: an Introduction

14.Zhu and Dreher (2008), Improving web search by categorization, phân cụm,

and personalization, Springer-Verlag, pp. 659-666.

15.Geraci, Pellegrini, Maggini, and Sebastiani (2006), Cụm generation and cụm

labelling for web snippets: A fast and accurate hierarchical solution,

ISPIRE, pp. 25-36

16.Charu C.Aggarwal, Chandan K.Reddy (2014), Data phân cụm: algorithms and applications, Taylor & Francis Group, LLC, pp. 15-19.

17.Gregory Smith (2012), PostgreSQL 9.0 High Performance, PACKT pp. 8 - 12. Web 18. www.wattpad.com 19. www.postgresql.org 20.www.vi.wikipedia.org/wiki/So_sánh_các_hệ_quản_trị_cơ_sở_dữ_liệu_quan _hệ 21.https://maps.googleapis.com

Một phần của tài liệu (LUẬN văn THẠC sĩ) nghiên cứu giải pháp nâng cao tốc độ hiển thị dữ liệu trên bản đồ trực tuyến 04 (Trang 58 - 61)

Tải bản đầy đủ (PDF)

(61 trang)