Báo cáo " BÀN LUẬN VỀ VẤN ĐỀ DỮ LIỆU ĐA NGUỒN VÀ KINH NGHIỆM TRONG TRIỂN KHAI THU THẬP DỮ LIỆU GIS – NHẬN ĐỊNH TỪ MỘT NGUỒN DỮ LIỆU TẠI QUẬN 7, TP. HỒ CHÍ MINH " pot

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang	9
Dung lượng	489,51 KB

Nội dung

HỘI THẢO ỨNG DỤNG GIS TOÀN QUỐC 2011 326 BÀN LUẬN VỀ VẤN ĐỀ DỮ LIỆU ĐA NGUỒN VÀ KINH NGHIỆM TRONG TRIỂN KHAI THU THẬP DỮ LIỆU GIS – NHẬN ĐỊNH TỪ MỘT NGUỒN DỮ LIỆU TẠI QUẬN 7, TP. HỒ CHÍ MINH (MULTI ESTABLISHED GIS DATA SOURCES PROBLEMS AND SOME EXPERIMENTS ON LOCATING ACQUISITION SPATIAL DATA - STUDY CASE ON ONE DATA SOURCE OF DISTRICT 7 TH IN HOCHIMINH CITY) Khưu Minh Cảnh, Trần Quang Trường Hinh, Lâm Quang Hà, Trịnh Xuân Hoàng Trung tâm Ứng dụng Hệ thống thông tin Địa lý, TPHCM Abstract: Data are establish during data collecting processing. So, many sources may be deviated in locating spatial objects. The causes could be the data getting time, the details of data collection as well as the process. These differents will affects strongly to spatial locating in the synthesis and unified process. We could use some experiment design factors to explore the spatial rules and help matching spatial objects with their seperated information. Keywords: GIS, geocoding, statistics, locating process. 1. MỞ ĐẦU Hiện nay, dữ liệu bản đồ và GIS được trực tiếp thành lập từ các đơn vị có thẩm quyền về Khoa học và Công nghệ; Tài nguyên và Môi trường hoặc các đơn vị trực thuộc. Dữ liệu (có yếu tố không gian) thường được chuẩn hóa các trường dữ liệu và các thông tin mô tả (metadata). Việc chuẩn hóa đem lại nhiều lợi ích trong các hệ thống cơ sở dữ liệu (CSDL). Tuy nhiên, trong nhiều dự án GIS, để xây dữ liệu chuẩn hóa theo CSDL hiện hữu là điều khó vì lực lượng thu thập dữ liệu chưa hẵn có hoặc trình độ hoặc ý thức hoặc chưa được tập huấn kỹ về vấn đề xây dựng dữ liệu. Mặt khác, sự thay đổi trên thực tế theo thời gian hoặc phương pháp thu thập cũng là một nguyên nhân gây ra sự lệch giữa các dữ liệu chuyên đề và dữ liệu nền. Bỏ qua một số lỗi cơ bản như chính tả, tiếng địa phương, hoặc viết tắt trong dữ liệu hai nguồn khác nhau (minh họa là thông tin chủ nhà: ‘Huỳnh An Khương’ so với ‘Quỳnh An Khương’), việc định vị các dữ liệu trên thực tế sẽ rất khó khăn trong những khu vực có nhiều biến động. Với lớp bài toán định vị phục vụ quản lý đô thị, cụ thể là định vị liên quan đến số nhà - dữ liệu số nhà được xem là rời rạc và hình thành theo khu vực: hẻm, địa danh, các nhân tố ảnh hưởng đến thường xuất phát từ qui trình khai thác dữ liệu. Trong bài báo này, chúng tôi nghiên cứu thực nghiệm việc định vị dữ liệu nhà tại khu vực Quận 7, thành phố Hồ Chí Minh trên cơ sở dữ liệu nhà do Phòng Tài nguyên Môi trường Quận 7 cung cấp và dữ liệu thu gom rác do các phường thuộc địa bàn Quận 7 cung cấp. 2. VẤN ĐỀ ĐỊNH VỊ KHÔNG GIAN TỪ DỮ LIỆU GIS ĐA NGUỒN 2.1. Phát biểu bài toán và một số nguyên nhân Dữ liệu GIS và dữ liệu phục vụ GIS ngày càng được phong phú và tạo bởi nhiều tổ chức khác nhau. Trong các khu đô thị mới thành lập, việc triển khai các dự án GIS phục vụ là điều bắt buộc nhằm tăng cường thể chế quản lý. Từ thực tế đó, dữ liệu GIS sẽ có nhiều nguồn và bắt đầu phát sinh ra những lệch và khác biệt lẫn nhau. Sự sai khác sẽ gây rất phiền phức trong các công tác tổng hợp và thống kê. Cụ thể hơn, khi chúng ta không thể tìm được vị trí không HỘI THẢO ỨNG DỤNG GIS TOÀN QUỐC 2011 327 gian cho một căn nhà về thu gom rác, ngay khi đó, việc thống kê sẽ bị thiếu hoặc thừa. Nguyên nhân chính là mỗi đơn vị luôn quan tâm đến dữ liệu của mình và do đó, việc tích hợp dữ liệu là một khâu phức tạp và chiếm thời gian. Hình 1: Minh họa về dữ liệu trong một hệ thống đa nguồn cung cấp với sự sai lệch về thời gian gây khó khăn cho việc định vị Dưới đây là một số nguyên nhân gây khó khăn và lệch trong việc định vị các nguồn dữ liệu, trong điều kiện hiện nay: ¾ Thời điểm thu thập dữ liệu khác nhau: các đơn vị thành lập dữ liệu chuyên đề thường dựa trên khảo sát thực tế tại thời điểm thực hiện dự án. Trong khi đó, bản đồ nền thường được thành lập trước đó và được tổng hợp cập nhật toàn bộ theo định kì. Do đó, những khu vực có biến động nhiều sẽ gây ra khó khăn trong việc định vị không gian dữ liệu chuyên đề dựa trên dữ liệu nền. ¾ Đối tượng thu thập: một số phương pháp thu thập thông qua việc phỏng vấn. Do đó, cùng một căn hộ, đơn vị phân phối báo chí có thể sẽ thu thập người nhận báo (có thể là người chồng) khác với đơn vị cung cấp gas gia đình (có thể là người vợ)… Sự khác nhau về đối tượng sẽ dẫn đến sự khác nhau về dữ liệu và là điều cản trở cho việ c định vị không gian khi chúng ta không có thông tin chính xác. ¾ Ảnh hưởng bởi các qui trình khác: thực tế, dữ liệu có thể không được so khớp do các qui trình thực tế không cùng lúc được cập nhật trên dữ liệu. Ví dụ: một thửa đất có thể sở hữu bởi chủ sử dụng khác. Tuy nhiên, trong dữ liệu không ghi nhận thực tế này do các quá trình thực hiện. Trong trường hợp trên có thể do những người chủ giao dịch nhà đất thông qua các cam kết ch ưa tuân theo qui trình mua bán hoặc chuyển nhượng của cơ quan chức năng nhà nước. ¾ Vấn đề không gian 2 và 3 chiều: Hiện tại, các dữ liệu địa chính được xây dựng trên 2D. Do đó, việc tìm kiếm và định vị những dữ liệu thực tế như hộ trên tầng 2, 3, là không thể. Do đó, việc quản lý sẽ gặp những bất cập nhất định trong các bước về hiển thị hoặc những vấn đề liên quan đến, như: chữa cháy, cứu hộ… ¾ Chuẩn hóa về mô tả không gian: dữ liệu thành lập chung thường ít thông tin chi tiết hơn dữ liệu của một đơn vị riêng. Thông thường các dữ liệu chuyên đề do người HỘI THẢO ỨNG DỤNG GIS TOÀN QUỐC 2011 328 ngoài ngành tạo dựng, do đó, một số thông tin liên quan đến địa vật hay địa danh thường gọi được đưa vào. Trong khi đó, dữ liệu trong hệ thống thường được chuẩn hóa nên không bổ sung các địa danh riêng (các tên thường gọi). Hình 2: Minh họa việc sử dụng nhiều địa danh tại một khu vực quận 7, TPHCM ¾ Vấn đề tác động khách quan hoặc nội tại từ bài toán: (như dữ liệu “da beo” trong bài toán thu gom rác). Trên thực tế, việc quản lý và thực hiện các chuyên đề chưa đạt được tối ưu, và do đó, khi thu thập dữ liệu, hiện tượng “da beo” sẽ xuất hiện. Và bài toán thu gom rác là vấn đề điển hình về bài toán giảm thiểu hiện tượng “da beo”. Cụ thể: khu vực gồm 10 căn nhà nhưng một người thu gom rác có thể chỉ thu gom 3 đến 4 căn nhà và số lượng còn lại do người hoặc các nhóm khác thu gom. Vấn đề “da beo” trên thực tế gây cản trở việc định vị không gian do dữ liệu sẽ có nguy cơ về mất tính liên tục trong định vị. 2.2. Những nhân tố mấu chốt của dữ liệu GIS đa nguồn Hầu hết các vấn đề định vị không gian thường dựa trên một cơ sở lí luận, trong đó, các đại lượng là duy nhất, không đổi và duy nhất (trên lý thuyết). Ví dụ, trong bài toán phục vụ định vị nhà với dữ liệu được liệt kê trong bảng tính Microsoft Excel bao gồm thông tin thu gom rác, định vị thuộc tính không gian thường dựa trên một bộ gồm ba thông số: (tên phường, tên đường, số nhà). Khi đó, chúng ta thiết lập các thông tin bổ sung trong mẫu bao gồm họ tên chủ hoặc đại diện chủ nhà được thu gom. Hình 3: Một mẫu dữ liệu chuyên đề thu gom rác tại Quận 7 TP.HCM HỘI THẢO ỨNG DỤNG GIS TOÀN QUỐC 2011 329 Tuy nhiên, đối với các khu dân cư mới, hoặc các đô thị phát triển, tên chủ hộ là yếu tố thường xuyên thay đổi. Mặt khác, tuy số nhà là đối tượng ít thay đổi đồng loạt nhưng đối với những khu vực mới, điển hình là dữ liệu Quận 7 thành phố Hồ Chí Minh, việc cập nhật bản đồ cần một thời gian để đồng bộ toàn bộ dữ liệu giữa thực tế và trong CSDL GIS phía Quận. Do đó, để định vị chính xác, chúng ta phải dựa thêm những nhân tố dưới đây: a) Nhân tố về tính liên tục trong dữ liệu thu thập: yếu tố này là một tính chất quan trọng trong việc xác định không gian. Ví dụ: những người đảm nhận công tác thu thập dữ liệu về chuyên đề thu gom rác sẽ mô tả tuần tự thứ tự nhà thu gom theo trật tự đầu hẻm đến cuối hẻm, hoặc đầu đường đến cuối đường. Thứ tự sẽ là yếu tố giúp giải đoán tốt nhất địa chỉ kế tiếp trong trường hợp chúng ta có cơ sở về các thông tin tìm thấy. Tuy nhiên, nhược điểm của phương pháp này là các hệ thống như thu gom rác hiện tại đang có hiện tượng “da beo” đã nêu trong mục 2.1). b) Nhân tố về thông tin không gian và phi không gian của các nhà lân cận: dữ liệu có thể được “giải đoán” nếu lân cận ít thay đổi. Điển hình là trong một dãy nhà, một hoặc vài căn nhà được lấy làm “chuẩn” là điều hoàn toàn có thể. Những căn nhà đó sẽ tìm được một khi các vector mô tả dữ liệu trùng nhau ở các nguồn dữ liệu khác nhau. Trong bài toán về định vị nhà ở, ta có vector định vị tối thiểu bao gồm các thông số: (số nhà, tên đường, phường, quận); và dễ thấy rằng dữ liệu về “tên chủ sở hữu” chỉ là tham số mang tính chất tham khảo vì tham số này thay đổi thường xuyên hơn các tham số còn lại. 2.3. Phân tích và tìm kiếm những nhân tố hỗ trợ mang tính thống kê Từ những phân tích bên trên, giả sử chúng ta cần xây dựng dữ liệu chuyên đề từ hai nguồn dữ liệu được thu thập từ thực tế: dữ liệu nền và dữ liệu chuyên đề. Khi đó, việc định vị dữ liệu chuyên đề từ hai nguồn dữ liệu sẽ thực hiện theo qui trình như sau: - Bước 1: Định vị vị trí dữ liệu từ dữ liệu nền. Ví dụ: tìm địa chỉ nhà theo số nhà, đường, phường. - Bước 2: Thiết lập dữ liệu chuyên đề từ kết quả tìm kiếm trên. Khi đó, với mỗi bước trên, các trường hợp sau đây sẽ xảy ra: i. Định vị dữ liệu nền/chuyên đề tốt. ii. Định vị dữ liệu nền/chuyên đề theo lân cận gần. iii. Định vị dữ liệu nền/chuyên đề theo các lân cận xa. iv. Không thể định vị hoặc tìm kiếm dữ liệu nền/chuyên đề. Vì việc thực hiện tuần tự bước 1 Æ bước 2, và mặt khác, nếu giả định việc thay đổi trên thực tế dữ liệu nền (như thay đổi quyền sở hữu, xây nhà mới, tách thửa, hợp thửa,…) là những thay đổi ngẫu nhiêu, thì chúng ta có mô tả xác xuất như sau: Bảng 1: Mô tả trạng thái định vị đối tượng chuyên đề theo dữ liệu nền Bước 1 \ Bước 2 Æ Dữ liệu chuyên đề Dữ liệu nền [i] [ii] [iii] [iv] Định vị tốt [i] 1 0 0 0 Định vị theo lân cận gần [ii] p 1 q 1 r 1 s 1 Định vị theo lân cận xa [iii] p 2 q 2 r 2 s 2 Không thể định vị [iv] 0 0 0 1 HỘI THẢO ỨNG DỤNG GIS TOÀN QUỐC 2011 330 Theo nguyên lý xác suất, ta có tổng các dòng p i +q i +r i +s i = 1. Trong bảng trên, dễ dàng ta có nếu việc định vị dữ liệu nền tốt thì xác suất định vị dữ liệu chuyên đề là 1 (ô [i,i] trong bảng) và ngược lại, nếu chúng ta không thể định vị dữ liệu nền thì chúng ta sẽ không thể định vị dữ liệu chuyên đề (trường hợp ô [iv,iv]). Với hai trường hợp [ii] và [iii], các xác suất p, q, r, s thể hiện khả năng định vị dữ liệu theo các đối tượng ở xa hoặc gần so với vị trí của dữ liệu chuyên đề. Do đó, chúng ta xác định các giá trị xác suất theo không gian: lân cận gần và lân cận xa. Hai khái niệm trên được xây dựng dựa theo phương pháp thiết lập bản đồ nền. Ví dụ trong bài toán định vị thông qua số nhà. Chúng ta có thể định nghĩa lân cận gần là việc xác định nhà thông qua một số số lượng nhà lân cận xác định trong dãy nhà có số tăng hoặc giảm liên tục; trong khi đó, xác định lân cận xa được định nghĩa là việc xác định nhà thông qua các nhà đầu hẻm, các nhà tham chiếu hoặc thông qua các địa vật tham chiếu khác, như: nhà trong một khu dân cư, nhà có bể nước có khả năng phục vụ việc phòng cháy chữa cháy… Việc xác định lân cận gần hoặc xa hoàn toàn mang tính chất mờ trong đánh giá. Tuy nhiên, với các nhân tố đề cập ở các mục trước, chúng ta thấy rằng các xác suất p, q, r, s sẽ bị tác động mạnh m ẽ trên chất lượng dữ liệu nền và các nhân tố hỗ trợ định vị (như tính liên tục và các dữ liệu lân cận hỗ trợ định vị). Dễ dàng ta thấy rằng, p i >> q i >> r i >> s i nếu và chỉ nếu dữ liệu định vị được ở một phạm vi không gian hẹp và ngược lại. Các giá trị xác suất trên sẽ giúp người quản lý ước lượng được phương án triển khai thực hiện dữ liệu. Trên thực tế, đối với các dự án, việc lựa chọn các phương án triển khai sẽ ảnh hưởng đến nhân sự, tiến độ, thời gian và chi phí thực hiện. Các giá trị xác su ất sẽ được tính toán dựa trên những phương thức lấy mẫu trên một số tuyến đường, và một số khu dân cư nhiều nhà. 2.4. Về một quy trình định vị không gian tổng quát Theo tài liệu [11], để định vị vị trí không gian, chúng ta phải thực hiện 03 bước cơ bản: bước tiền xử lý (pre-processing), bước lập tương ứng (matching) và bước tính toán (plotting). Tiền xử lý là bước thiết lập các chuẩn để hình thành dữ liệu. Các địa chỉ sẽ được chuẩn hóa và được tách (parse) thành các thành phần, như: số nhà, đường, phường, khu phố, Tiếp đó là bước thiết lập tương ứng. Trong bước này, chúng ta sẽ định vị cụ thể những đối tượng tìm thấy và những đối tượng không tìm thấy. Và sau cùng là bước tính toán. Bước tính toán sẽ nội suy những thông tin, như địa chỉ, trên bản đồ. Hình 4: Một góc dữ liệu nhà và thửa Quận 7 HỘI THẢO ỨNG DỤNG GIS TOÀN QUỐC 2011 331 Đối với dữ liệu nhà, một số luật được liệt kê như sau: - Số nhà là một dãy tăng hoặc giảm cùng chẵn hoặc cùng lẻ. - Khi định vị dữ liệu về nhà, phân cấp định vị: đường, phường, khu dân cư, khối nhà, các nhà lân cận. 2.5. Đề xuất giải pháp định vị không gian từ các nhân tố mấu chốt trên dữ liệu nguồn đa nền Những nhân tố được xác định bên các mục trên dễ dàng dựa trên kinh nghiệm và thực tiễn về dữ liệu thu thập và dữ liệu. Thật vậy, chúng ta hoàn toàn có thể xác định nhà bằng phương pháp định vị thủ công, nghĩa là, một kỹ thuật viên sẽ tìm kiếm khu nhà căn nhà, sau đó định vị bằng chuột với công cụ phần mềm là một form tìm kiếm nhà. Tuy nhiên, tốc độ tìm kiếm và định vị là yếu tố cần bàn đến đối với dữ liệu của một Quận trong thành phố Hồ Chí Minh. Điển hình: Quận 7 có trên 40000 hộ, nếu bình quân định vị bằng cách tìm kiếm nhà sẽ mất ít nhất 01 phút/hộ thì chúng ta cần trên 40.000 phút, nghĩa là trên 666 giờ, hoặc trên 83 ngày làm việc. Điều đó có nghĩa là, chúng ta cần tối thiểu 04 tháng làm việc hoặc tối thiểu 04 người sẽ thực hiện trong 01 tháng cho dữ liệu của một chuyên đề của một Quận. Chúng ta sẽ phân tích hướng cài đặt đối với từng nhân tố được mô tả trong mục 2.2: - Với nhân tố a), chúng ta có thể quy định những khu vực gọi là liên tục đối với một số ứng dụng nhất định. Ví dụ: trong ứng dụng thu gom rác, chúng ta có thể cần đến mô tả về đường đi của người thu gom trong một tuyến. Và tuyến trong hẻm sẽ khác với tuyến ngoài mặt phố. Trên thực tế, thông thường các vùng liên tục ngoài đường lớn sẽ có biên là tim đường giao thông, nhưng các vùng hẻm ít khi sử dụng tim hẻm làm biên. Về điểm này, chúng ta có thể giải quyết bằng phương pháp sử dụng GPS để theo dõi (tracking) đường đi tiêu biểu của xe lấy rác. Và trong trường hợp cần thiết hơn, chúng ta có thể thêm một GPS tracking vị trí lấy rác (trong trường hợp đường hẹp hoặc người lấy rác dừng xe để đi bộ vào khu dân cư lấy). Hình 5: Lỗi số nhà chưa quán (giữa số cũ và số mới) trên một đoạn đường Huỳnh Tấn Phát gây khó khăn việc định vị - Với nhân tố b), chúng ta dễ dàng thấy rằng nhân tố b) được hỗ trợ từ nhân tố a). Với dữ liệu được xem như liên tục, chúng ta có để định vị chuẩn một số vị trí không gian và các vị trí khác sẽ được kết hợp để suy luận. Cụ thể hơn, khi tìm thông tin các nhà lân cận, chúng ta HỘI THẢO ỨNG DỤNG GIS TOÀN QUỐC 2011 332 phải tìm các đối tượng bằng phương pháp buffer và có loại trừ theo các ngữ nghĩa không gian như: nhà đang xét trong hẻm thì chỉ cần tìm các nhà trong hẻm mà không cần sử dụng thông tin về nhà phía mặt tiền và ngược lại. - Trong chương trình tự động định vị, những số nhà không định vị được (do không tìm thấy) sẽ được định vị lần nữa dựa trên những nhà định vị được. Ví dụ: nhà 257 Lê Văn Lương không tìm thấy. Tuy nhiên, ta có thể nội suy được nếu chúng ta xác định được nhà số 255 và 259 Lê Văn Lương. Ngoài ra, chúng ta phải xây dựng các module hỗ trợ giải quyết các công việc thực tiễn như sau: - Chuyển đổi về một định dạng đối với hệ thống lưu trữ dữ liệu (font chữ) với các nguồn dữ liệu thuộc nhiều font chữ khác nhau. - Xây dựng thư viện phát hiện những từ “gần đúng” (có thể xác định thủ công) như: sai lỗi chính tả, từ viết tắt,… (bằng các kỹ thuật tìm kiếm gần đúng hoặc tìm kiếm theo ngữ nghĩa). Ví dụ: cùng một địa chỉ, tên hai chủ nhà ‘Nguyễn Quang Thìn’ và ‘Nguyễn Quan Thình’ sẽ được xem là đồng nhất do có thể đây là lỗi về chính tả; hoặc ‘Võ Thị Lắm’ sẽ đồng nhất với ‘Vỏ Thị Lắm’; hoặc tên đường ‘Đường số 2’ sẽ đồng nhất với tên đường ‘Số 2’ hoặc ‘Đ.số 2’. Trong thí nghiệm, chúng tôi đã xây dựng các hàm so sánh chuỗi đơn giản như: loại bỏ dấu của tất cả các kí tự trong chuỗi. Ví dụ Nguyễn Quang Thình sẽ trở thành: Nguyên Quang Thinh. Nếu việc so sánh không “khớp” giữa hai chuỗi, chúng ta tiến hành các biến đổi. Ở đây chúng ta so sánh số lượng chữ: ‘Nguyên Quan Thinh’ và ‘Nguyên Quang Thin’ đều có 3 chữ. Trong đó có 01 từ (‘Nguyên’) giống nhau và 02 từ khác nhau (‘Quan’ <> ‘Quang’ và ‘Thinh’ <> ‘Thin’). Tuy nhiên, sự sai khác có thể được phát hiện bằng cách phân nhóm. Hình 6: Kết quả chương trình nhập liệu và định vị không gian bằng Spatial SQL sau khi khảo sát dữ liệu số nhà và chuyên đề thu gom rác Quận 7 TP.HCM HỘI THẢO ỨNG DỤNG GIS TOÀN QUỐC 2011 333 3. KẾT LUẬN Việc chọn các nhân tố thực nghiệm gây ảnh hưởng đến việc tạo lập dữ liệu chuyên đề là vấn đề cần thiết. Chúng ta cần phải xây dựng mối quan hệ giữa các nguồn dữ liệu trong điều kiện dữ liệu còn rời rạc. Tuy nhiên, để ứng dụng đưa vào thực tế, dữ liệu phản ánh thế giới thực là điều chính yếu. Do đó, chúng ta phải tìm kiếm những nhân tố tuân theo chất lượng dữ liệu và các qui trình phục vụ thu thập dữ liệu chuyên đề cụ thể. Ngoài ra, từ những kết quả nghiên cứu trên, một số kết luận được rút ra như sau: - Cải tiến các tiến trình xây dựng một hệ thống GIS theo hướng phát triển các liên hệ với nhau, đặc biệt là việc xây dựng và cập nhật dữ liệu trên từng chuyên đề và từng thời điểm. - Đẩy mạnh việc đồng bộ dữ liệu là vấn đề cần thiết trong các hệ thống. Thời gian đồng bộ nhanh chóng giữa các cấp phường (xã) ÅÆ quận (huyện) ÅÆ thành phố (tỉnh) cần thực hiện nhanh chóng để dữ liệu không bị lạc hậu. - Xây dựng qui trình nhập liệu chuyên đề dựa trên các bản đồ nền. Việc xây dựng Qua đó, chúng ta sẽ có những phản hồi với cơ quan quản lý về những sự thay đổi trong thực tế mà dữ liệu nền chưa cập nhật kịp thời. Trong qui trình đó, chúng ta xây dựng khung chuẩn đào tạo GIS đối với các lực lượng tham gia xây dựng hệ thống GIS để giảm sự sai lệch giữa các dữ liệu. - Tạm thời ứng dụng các phương pháp định vị theo xác suất, tận dụng các phương pháp toán học như thiết kế thực nghiệm để giảm các chi phí thực địa trong việc xây dựng các hệ thống GIS, đặc biệt các hệ thống chuyên đề. - Xây dựng các hệ thống 3D (không phải 2.5D) để quản lý các ứng dụng. Trên thực tế, chúng ta cần đến các hệ thống 3D thực sự để giải quyết những căn hộ chung cư với hàng nghìn căn hộ trên một thửa lớn. Hình 7: Các mô tả chi tiết về dữ liệu 3D theo chuẩn CityGML. Quản lý các đối tượng 3D là hướng đến của các ứng dụng quản lý đô thị trong tương lai (a) LOD1 building (c) LOD3 building (d) LOD4 building (b) LOD2 building HỘI THẢO ỨNG DỤNG GIS TOÀN QUỐC 2011 334 Tài liệu tham khảo [1] . Khưu Minh Cảnh, Trần Quang Trường Hinh, TS.Trần Trọng Đức, Hồ Nguyễn Cúc Phương, bài báo: “Một số vấn đề về đồng bộ dữ liệu không gian”, Hội nghị KHCN lần thứ 12 Trường Đại học Bách Khoa Tp.HCM, năm 2011. [2]. TS. Hồ Đình Duẫn, TS. Lê Trung Chơn và Đặng Quốc Trung, bài báo nghiên cứu khoa học “Cơ sở toán học của GIS 3D và các ứng dụng”, năm 2003. [3]. TS. Nguyễn Ngọc Lâu, bài giảng môn học “Hệ thố ng định vị GPS”, năm 2010. [4]. TS. Đào Xuân Lộc, Cơ sở lý thuyết sai số, NXB đại học Quốc Gia, năm 2007. [5]. TS. Huỳnh Trung Lương – ThS. Trương Tôn Hiền Đức, Phương pháp định lượng trong quản lý và vận hành, NXB Khoa học và Kỹ thuật, năm 2002. [6]. Nguyễn Khắc Thanh, Quản lý các dự án hệ thống thông tin địa lý (Tài liệu lưu hành nội bộ Sở KHCN TPHCM), năm 2005. [7]. Tài liệu lập trình gvSIG các phiên bản gvSIG 1.1 và gvSIG 1.9, Tài liệu lưu hành nội bộ, Trung tâm GISC, năm 2010. [8]. Tổ chức Open Geospatial Consortium xây dựng, Chuẩn CityGML, phiên bản 1.1, năm 2011. [9]. Dennis Allard, Dimitri D’Or, Reoland Froidevaux, Estimating and simulating spatial categorical data using an efficiency maximum entropy approach, tại Unité Biostatisque et Processus Spatiaux Institut National de la Recherche Agronomique Avignon, France (http://www.biosp.org ). Thời điểm: 22/9/2009. [10]. Weidong Li, Chuanrong Zhang, bài báo Linear interpolation and joint model fitting of experimental transiograms for Markov chain simulation of categerical spatial variables, Vol.24, No.6, 6/2010, trang 821-839, tạp chí International Joural of Geographical Information Science. [11]. Dr Md. Khalequazzaman, bài báo cáo về “Geocoding & Dynamic Segmentation”, Dept. of Geology & Physics Lock Haven University. . ỨNG DỤNG GIS TOÀN QUỐC 2011 326 BÀN LUẬN VỀ VẤN ĐỀ DỮ LIỆU ĐA NGUỒN VÀ KINH NGHIỆM TRONG TRIỂN KHAI THU THẬP DỮ LIỆU GIS – NHẬN ĐỊNH TỪ MỘT NGUỒN DỮ LIỆU TẠI QUẬN 7, TP. HỒ CHÍ MINH (MULTI. Quận 7 cung cấp và dữ liệu thu gom rác do các phường thu c địa bàn Quận 7 cung cấp. 2. VẤN ĐỀ ĐỊNH VỊ KHÔNG GIAN TỪ DỮ LIỆU GIS ĐA NGUỒN 2.1. Phát biểu bài toán và một số nguyên nhân Dữ liệu. thường xuất phát từ qui trình khai thác dữ liệu. Trong bài báo này, chúng tôi nghiên cứu thực nghiệm việc định vị dữ liệu nhà tại khu vực Quận 7, thành phố Hồ Chí Minh trên cơ sở dữ liệu nhà do

Ngày đăng: 03/04/2014, 06:20

Xem thêm