Lớp điều khiển Reset bảng thuộc tính

Một phần của tài liệu (LUẬN văn THẠC sĩ) phân cụm dữ liệu địa lý và áp dụng trong phân tích một số chỉ số kinh tế xã hội của các địa phương ở việt nam 01 (Trang 41 - 43)

2.3Kết luận

Chương này đã trình bày một số đặc điểm của phần mềm Mapwindow GIS. Dựa vào những ưu điểm của phần mềm Mapwindow GIS, luận văn đã lựa chọn Mapwindow GIS làm công cụ để cài đặt thực nghiệm. Chương này cũng đã trình bày chi tiết cách cài đặt một plug-in vào phần mềm Mapwindow GIS và mô tả chi tiết phân tích thiết kế cho plug-in.

CHƯƠNG 3: THỰC NGHIỆM VÀ ĐÁNH GIÁ

Trong chương 2 tác giả đã giới thiệu các đặc điểm của phần mềm Mapwindow và trình bày chi tiết việc thiết kế cài đặt plug-in phân cụm dữ liệu địa lý vào phần mềm Mapwindow. Chương này, tác giả sẽ trình bày kết quả thực nghiệm khi cài đặt các thuật toán đã trình bày ở chương 1 với bộ số liệu thực tế về một số chỉ tiêu kinh tế - xã hội của các địa phương ở Việt Nam. Phần đầu chương, tác giả sẽ đưa ra bộ số liệu cụ thể và các thuật toán sẽ cài đặt. Phần thứ hai, tác giả sẽ tập trung phân tích kết quả phân cụm ứng với từng kịch bản đưa ra.

3.1Dữ liệu thực nghiệm

3.1.1 Chuẩn bị dữ liệu không gian

Dữ liệu không gian cần chuẩn bị là dữ liệu không gian của Việt Nam chi tiết đến tỉnh – thành.

Sau khi có dữ liệu về không gian của Việt Nam, cần can thiệp chỉnh sửa một chút vào file .dbf của dữ liệu: bổ sung thêm một trường ở vị trí đầu tiên, đặt tên là Cluster. Trường này sẽ là trường lưu số hiệu cụm mà địa phương đó thuộc sau quá trình phân cụm.

Có thể chỉnh sửa bảng dữ liệu này bằng cách mở trực tiếp file .shp trên phần mềm MapWindow GIS, lựa chọn chức năng xem Table và thêm trường tại đây, hoặc sử dụng phần mềm đọc file .dbf và chỉnh sửa bảng dữ liệu của file.

3.1.2 Chuẩn bị bộ dữ liệu phân cụm Dữ liệu thuộc tính Dữ liệu thuộc tính

Dữ liệu thuộc tính, mà thuật ngữ kinh tế xã hội thường gọi là dữ liệu chuyên đề bao gồm các tập tin định dạng csv hoặc txt. Mỗi tập tin bao gồm các dòng và các cột. Vị trí với dòng và cột thể hiện dữ liệu tương ứng: dòng là số đối tượng, cột là số liệu của thuộc tính. Với trường hợp dữ liệu phân cụm là dữ liệu của một chuyên đề trong nhiều năm, các cột là số liệu của chuyên đề đó trong các năm. Ví dụ, với chuyên đề “Giá trị sản xuất kinh doanh”, dòng thể hiện các vùng (các địa phương ở Việt Nam) và cột thể hiện các năm tương ứng. Tại vị trí dòng và cột thể hiện Giá trị sản xuất kinh doanh (tính theo Triệu đồng) cho vùng và năm tương ứng.

Số dòng trong file dữ liệu chuyên đề phải tương ứng với số dòng trong file dữ liệu không gian. Tên các địa phương ở hai file dữ liệu thuộc tính và file dữ liệu không gian phải giống nhau.

Một phần của tài liệu (LUẬN văn THẠC sĩ) phân cụm dữ liệu địa lý và áp dụng trong phân tích một số chỉ số kinh tế xã hội của các địa phương ở việt nam 01 (Trang 41 - 43)