Khái niệm: Khai thác dữ liệu không gian là quá trình khám phá các tri thức (mẫu) quan tâm, hữu ích và không tầm thường từ cơ sở dữ liệu không gian lớn.
Khai thác dữ liệu không gian, nghĩa là, khám phá tri thức từ một lượng lớn dữ liệu không gian, là một lĩnh vực đòi hỏi từ một lượng lớn các dữ liệu không gian đã được thu thập trong các ứng dụng khác nhau, từ viễn thám cho đến hệ thống thông tin địa lý, đánh giá tác động môi trường và lập kế hoạch. Các dữ liệu thu thập đã vượt quá khả năng của con người phân tích nó. Như vậy, các phương pháp tiếp cận mới và hiệu quả là cần thiết để khám phá những tri thức quan trọng từ cơ sở dữ liệu không gian rộng lớn.
Mục tiêu ở đây là chúng tôi tập trung phân tích các phương pháp khai thác dữ liệu không gian, và để xác định các môi trường mà trong đó các phương pháp khai thác hiệu quả dữ liệu không gian có thể thực hiện được. Trong quá trình khai thác dữ liệu không gian, chúng tôi chú trọng đến các tính chất không gian của đối tượng rồi kế đến mới là các thuộc tính phi không gian kèm theo của chúng và các chức năng mô tả mối quan hệ không gian giữa các đối tượng không gian. Các thuật toán khai thác dữ liệu không gian được phát triển dựa trên phương pháp sàng lọc bằng cách sử dụng các các trúc dữ liệu không gian phù hợp. Cách tiếp cận này cho phép phát hiện hiệu quả các tri thức trong cơ sở dữ liệu không gian lớn.
3.4.1. Giới thiệu
Một số lượng dữ liệu khổng lồ đã được thu thập thông qua các tiến bộ trong công nghệ cơ sở dữ liệu và kỹ thuật thu thập dữ liệu. Sự tăng trưởng bùng nổ của dữ liệu thu thập đòi hỏi sự cần thiết của kiến thức tự động khám phá thông tin từ dữ liệu, dẫn đến một hướng tiếp cận mới đầy hứa hẹn, được gọi là khai thác dữ liệu hoặc khám phá tri thức trong cơ sở dữ liệu (KDD) ([56] ). Các kiến thức khám phá thông tin trong cơ sở dữ liệu có thể hiểu là việc khai thác các thông tin tiềm ẩn quan trọng, trước đây chưa được biết và những thông tin hữu ích từ dữ liệu. Khai thác dữ liệu là sự tích hợp của một loạt lĩnh vực, bao gồm lãnh vực máy học, hệ thống cơ sở dữ
Mặc dù đã có nhiều nghiên cứu về khai thác dữ liệu trong cơ sở dữ liệu quan hệ ([57] [63] [62] ), khai thác dữ liệu vẫn là nhu cầu lớn trong cơ sở dữ liệu ứng dụng khác bao gồm cả cơ sở dữ liệu không gian, cơ sở dữ liệu thời gian, cơ sở dữ liệu hướng đối tượng và cơ sở dữ liệu đa phương tiện. Trọng tâm ở đây là xây dựng một số thuật toán xử lý không gian quan trong hỗ trợ ứng dụng trong khai thác dữ liệu không gian. Khai thác dữ liệu không gian, hay khám phá tri thức trong cơ sở dữ liệu không gian là đề cập đến trích chọn kiến thức tiềm ẩn, quan hệ không gian, hoặc các mẫu khác không xác đĩnh rõ được lưu trong cơ sở dữ liệu không gian [58] .
Tiến bộ trong các nghiên cứu về cấu trúc dữ liệu không gian và cơ sở dữ liệu không gian cho phép truy vấn cơ sở dữ liệu lớn hiệu quả không gian ([59] [60] [61] ). Số lượng lớn dữ liệu không gian và độ phức tạp của các loại dữ liệu không gian cũng như các phương thức truy cập không gian làm cho bài toán khai thác dữ liệu không gian trở thành bài toán đầy thách thức.