Báo cáo " BÀN LUẬN VỀ VẤN ĐỀ DỮ LIỆU ĐA NGUỒN VÀ KINH NGHIỆM TRONG TRIỂN KHAI THU THẬP DỮ LIỆU GIS – NHẬN ĐỊNH TỪ MỘT NGUỒN DỮ LIỆU TẠI QUẬN 7, TP. HỒ CHÍ MINH " pot
HỘI THẢO ỨNG DỤNG GIS TOÀN QUỐC 2011
326
BÀN LUẬNVỀVẤNĐỀ DỮ LIỆUĐANGUỒNVÀKINHNGHIỆM
TRONG TRIỂNKHAITHUTHẬPDỮLIỆUGIS–NHẬNĐỊNH
TỪ MỘTNGUỒNDỮLIỆUTẠIQUẬN7,TP.HỒCHÍMINH
(MULTI ESTABLISHED GIS DATA SOURCES PROBLEMS AND SOME
EXPERIMENTS ON LOCATING ACQUISITION SPATIAL DATA - STUDY CASE ON
ONE DATA SOURCE OF DISTRICT 7
TH
IN HOCHIMINH CITY)
Khưu Minh Cảnh, Trần Quang Trường Hinh, Lâm Quang Hà, Trịnh Xuân Hoàng
Trung tâm Ứng dụng Hệ thống thông tin Địa lý, TPHCM
Abstract: Data are establish during data collecting processing. So, many sources may be
deviated in locating spatial objects. The causes could be the data getting time, the details of
data collection as well as the process. These differents will affects strongly to spatial locating
in the synthesis and unified process. We could use some experiment design factors to explore
the spatial rules and help matching spatial objects with their seperated information.
Keywords: GIS, geocoding, statistics, locating process.
1. MỞ ĐẦU
Hiện nay, dữliệubản đồ vàGIS được trực tiếp thành lập từ các đơn vị có thẩm quyền về
Khoa học và Công nghệ; Tài nguyên và Môi trường hoặc các đơn vị trực thuộc. Dữliệu (có yếu
tố không gian) thường được chuẩn hóa các trường dữliệuvà các thông tin mô tả (metadata).
Việc chuẩn hóa đem lại nhiều lợi ích trong các hệ thống cơ sở dữliệu (CSDL). Tuy nhiên, trong
nhiều dự án GIS, để xây dữliệu chuẩn hóa theo CSDL hiện hữu là điều khó vì lực lượng thu
thập dữliệu chưa hẵn có hoặc trình độ hoặc ý thức hoặc chưa được tập huấn kỹ vềvấnđề xây
dựng dữ liệu. Mặt khác, sự thay đổi trên thực tế theo thời gian hoặc phương pháp thuthập cũng
là một nguyên nhân gây ra sự lệch giữa các dữliệu chuyên đềvàdữliệu nền.
Bỏ qua một số lỗi cơ bản như chính tả, tiếng địa phương, hoặc viết tắt trongdữliệu hai
nguồn khác nhau (minh họa là thông tin chủ nhà: ‘Huỳnh An Khương’ so với ‘Quỳnh An
Khương’), việc định vị các dữliệu trên thực tế sẽ rất khó khăn trong những khu vực có nhiều
biến động. Với lớp bài toán định vị phục vụ quản lý đô thị, cụ thể là định vị liên quan đến số
nhà - dữliệu số nhà được xem là rời rạc và hình thành theo khu vực: hẻm, địa danh, các nhân
tố ảnh hưởng đến thường xuất phát từ qui trình khai thác dữ liệu. Trong bài báo này, chúng tôi
nghiên cứu thực nghiệm việc định vị dữliệu nhà tại khu vực Quận7, thành phố HồChíMinh
trên cơ sở dữliệu nhà do Phòng Tài nguyên Môi trường Quận 7 cung cấp vàdữliệuthu gom
rác do các phường thuộc địa bànQuận 7 cung cấp.
2. VẤNĐỀĐỊNH VỊ KHÔNG GIAN TỪDỮLIỆUGISĐANGUỒN
2.1. Phát biểu bài toán vàmột số nguyên nhân
Dữ liệuGISvàdữliệu phục vụ GIS ngày càng được phong phú và tạo bởi nhiều tổ chức
khác nhau. Trong các khu đô thị mới thành lập, việc triểnkhai các dự án GIS phục vụ là điều
bắt buộc nhằm tăng cường thể chế quản lý. Từ thực tế đó, dữliệuGIS sẽ có nhiều nguồnvà
bắt đầu phát sinh ra những lệch và khác biệt lẫn nhau. Sự sai khác sẽ gây rất phiền phức trong
các công tác tổng hợp và thống kê. Cụ thể hơn, khi chúng ta không thể tìm được vị trí không
HỘI THẢO ỨNG DỤNG GIS TOÀN QUỐC 2011
327
gian cho một căn nhà vềthu gom rác, ngay khi đó, việc thống kê sẽ bị thiếu hoặc thừa.
Nguyên nhân chính là mỗi đơn vị luôn quan tâm đến dữliệu của mìnhvà do đó, việc tích hợp
dữ liệu là một khâu phức tạp và chiếm thời gian.
Hình 1: Minh họa vềdữliệutrongmột hệ thống đanguồn cung cấp với sự sai lệch
về thời gian gây khó khăn cho việc định vị
Dưới đây là một số nguyên nhân gây khó khăn và lệch trong việc định vị các nguồndữ
liệu, trong điều kiện hiện nay:
¾ Thời điểm thuthậpdữliệu khác nhau: các đơn vị thành lập dữliệu chuyên đề thường
dựa trên khảo sát thực tế tại thời điểm thực hiện dự án. Trong khi đó, bản đồ nền
thường được thành lập trước đó và được tổng hợp cập nhật toàn bộ theo định kì. Do
đó, những khu vực có biến động nhiều sẽ gây ra khó khăn trong việc định vị không
gian dữliệu chuyên đề dựa trên dữliệu nền.
¾ Đối tượng thu thập: một số phương pháp thuthập thông qua việc phỏng vấn. Do đó,
cùng một căn hộ, đơn vị phân phối báochí có thể sẽ thuthập người nhậnbáo (có thể
là người chồng) khác với đơn vị cung cấp gas gia đình (có thể là người vợ)… Sự
khác nhau về đối tượng sẽ dẫn đến sự khác nhau vềdữliệuvà là điều cản trở cho
việ
c định vị không gian khi chúng ta không có thông tin chính xác.
¾ Ảnh hưởng bởi các qui trình khác: thực tế, dữliệu có thể không được so khớp do các
qui trình thực tế không cùng lúc được cập nhật trên dữ liệu. Ví dụ: một thửa đất có
thể sở hữu bởi chủ sử dụng khác. Tuy nhiên, trongdữliệu không ghi nhận thực tế
này do các quá trình thực hiện. Trong trường hợp trên có thể do những người chủ
giao dịch nhà đất thông qua các cam kết ch
ưa tuân theo qui trình mua bán hoặc
chuyển nhượng của cơ quan chức năng nhà nước.
¾ Vấnđề không gian 2 và 3 chiều: Hiện tại, các dữliệu địa chính được xây dựng trên
2D. Do đó, việc tìm kiếm vàđịnh vị những dữliệu thực tế như hộ trên tầng 2, 3, là
không thể. Do đó, việc quản lý sẽ gặp những bất cập nhất địnhtrong các bước về
hiển thị hoặc những vấnđề liên quan đến, như: chữa cháy, cứu hộ…
¾ Chuẩn hóa về mô tả không gian: dữliệu thành lập chung thường ít thông tin chi tiết
hơn dữliệu của một đơn vị riêng. Thông thường các dữliệu chuyên đề do người
HỘI THẢO ỨNG DỤNG GIS TOÀN QUỐC 2011
328
ngoài ngành tạo dựng, do đó, một số thông tin liên quan đến địa vật hay địa danh
thường gọi được đưa vào. Trong khi đó, dữliệutrong hệ thống thường được chuẩn
hóa nên không bổ sung các địa danh riêng (các tên thường gọi).
Hình 2: Minh họa việc sử dụng nhiều địa danh tạimột khu vực quận7, TPHCM
¾ Vấnđề tác động khách quan hoặc nội tạitừ bài toán: (như dữliệu “da beo” trong bài
toán thu gom rác). Trên thực tế, việc quản lý và thực hiện các chuyên đề chưa đạt
được tối ưu, và do đó, khi thuthậpdữ liệu, hiện tượng “da beo” sẽ xuất hiện. Và bài
toán thu gom rác là vấnđề điển hình về bài toán giảm thiểu hiện tượng “da beo”. Cụ
thể: khu vực gồm 10 căn nhà nhưng một người thu gom rác có thể chỉthu gom 3 đến
4 căn nhà và số lượng còn lại do người hoặc các nhóm khác thu gom. Vấnđề “da
beo” trên thực tế gây cản trở việc định vị không gian do dữliệu sẽ có nguy cơ về mất
tính liên tục trongđịnh vị.
2.2. Những nhân tố mấu chốt của dữliệuGISđanguồn
Hầu hết các vấnđềđịnh vị không gian thường dựa trên một cơ sở lí luận, trong đó, các
đại lượng là duy nhất, không đổi và duy nhất (trên lý thuyết). Ví dụ, trong bài toán phục vụ
định vị nhà với dữliệu được liệt kê trong bảng tính Microsoft Excel bao gồm thông tin thu
gom rác, định vị thuộc tính không gian thường dựa trên một bộ gồm ba thông số: (tên
phường, tên đường, số nhà). Khi đó, chúng ta thiết lập các thông tin bổ sung trong mẫu bao
gồm họ tên chủ hoặc đại diện chủ nhà được thu gom.
Hình 3: Một mẫu dữliệu chuyên đềthu gom rác tạiQuận 7 TP.HCM
HỘI THẢO ỨNG DỤNG GIS TOÀN QUỐC 2011
329
Tuy nhiên, đối với các khu dân cư mới, hoặc các đô thị phát triển, tên chủ hộ là yếu tố
thường xuyên thay đổi. Mặt khác, tuy số nhà là đối tượng ít thay đổi đồng loạt nhưng đối với
những khu vực mới, điển hình là dữliệuQuận 7 thành phố HồChí Minh, việc cập nhật bản
đồ cần một thời gian để đồng bộ toàn bộ dữliệu giữa thực tế vàtrong CSDL GIS phía Quận.
Do đó, đểđịnh vị chính xác, chúng ta phải dựa thêm những nhân tố dưới đây:
a) Nhân tố về tính liên tục trongdữliệuthu thập: yếu tố này là một tính chất quantrọng
trong việc xác định không gian. Ví dụ: những người đảm nhận công tác thuthậpdữliệuvề
chuyên đềthu gom rác sẽ mô tả tuần tựthứtự nhà thu gom theo trật tự đầu hẻm đến cuối
hẻm, hoặc đầu đường đến cuối đường. Thứtự sẽ là yếu tố giúp giải đoán tốt nhất địa chỉ kế
tiếp trong trường hợp chúng ta có cơ sở về các thông tin tìm thấy. Tuy nhiên, nhược điểm của
phương pháp này là các hệ thống như thu gom rác hiện tại đang có hiện tượng “da beo” đã
nêu trong mục 2.1).
b) Nhân tố về thông tin không gian và phi không gian của các nhà lân cận: dữliệu có
thể được “giải đoán” nếu lân cận ít thay đổi. Điển hình là trongmột dãy nhà, một hoặc vài căn
nhà được lấy làm “chuẩn” là điều hoàn toàn có thể. Những căn nhà đó sẽ tìm được một khi
các vector mô tả dữliệu trùng nhau ở các nguồndữliệu khác nhau. Trong bài toán vềđịnh vị
nhà ở, ta có vector định vị tối thiểu bao gồm các thông số: (số nhà, tên đường, phường, quận);
và dễ thấy rằng dữliệuvề “tên chủ sở hữu” chỉ là tham số mang tính chất tham khảo vì tham
số này thay đổi thường xuyên hơn các tham số còn lại.
2.3. Phân tích và tìm kiếm những nhân tố hỗ trợ mang tính thống kê
Từ những phân tích bên trên, giả sử chúng ta cần xây dựng dữliệu chuyên đềtừ hai
nguồn dữliệu được thuthậptừ thực tế: dữliệu nền vàdữliệu chuyên đề. Khi đó, việc định vị
dữ liệu chuyên đềtừ hai nguồndữliệu sẽ thực hiện theo qui trình như sau:
- Bước 1: Định vị vị trí dữliệutừdữliệu nền. Ví dụ: tìm địa chỉ nhà theo số nhà,
đường, phường.
- Bước 2: Thiết lập dữliệu chuyên đềtừ kết quả tìm kiếm trên.
Khi đó, với mỗi bước trên, các trường hợp sau đây sẽ xảy ra:
i. Định vị dữliệu nền/chuyên đề tốt.
ii. Định vị dữliệu nền/chuyên đề theo lân cận gần.
iii. Định vị dữliệu nền/chuyên đề theo các lân cận xa.
iv. Không thể định vị hoặc tìm kiếm dữliệu nền/chuyên đề.
Vì việc thực hiện tuần tự bước 1 Æ bước 2, và mặt khác, nếu giả
định việc thay đổi trên
thực tế dữliệu nền (như thay đổi quyền sở hữu, xây nhà mới, tách thửa, hợp thửa,…) là những
thay đổi ngẫu nhiêu, thì chúng ta có mô tả xác xuất như sau:
Bảng 1: Mô tả trạng thái định vị đối tượng chuyên đề theo dữliệu nền
Bước 1 \ Bước 2 Æ Dữliệu chuyên đề
Dữ liệu nền [i] [ii] [iii] [iv]
Định vị tốt [i] 1 0 0 0
Định vị theo lân cận gần [ii] p
1
q
1
r
1
s
1
Định vị theo lân cận xa [iii] p
2
q
2
r
2
s
2
Không thể định vị [iv] 0 0 0 1
HỘI THẢO ỨNG DỤNG GIS TOÀN QUỐC 2011
330
Theo nguyên lý xác suất, ta có tổng các dòng p
i
+q
i
+r
i
+s
i
= 1. Trong bảng trên, dễ dàng
ta có nếu việc định vị dữliệu nền tốt thì xác suất định vị dữliệu chuyên đề là 1 (ô [i,i] trong
bảng) và ngược lại, nếu chúng ta không thể định vị dữliệu nền thì chúng ta sẽ không thể định
vị dữliệu chuyên đề (trường hợp ô [iv,iv]). Với hai trường hợp [ii] và [iii], các xác suất p, q, r,
s thể hiện khả năng định vị dữliệu theo các đối tượng ở xa hoặc gần so với vị trí của dữliệu
chuyên đề. Do đó, chúng ta xác định các giá trị xác suất theo không gian: lân cận gần và lân
cận xa. Hai khái niệm trên được xây dựng dựa theo phương pháp thiết lập bản đồ nền. Ví dụ
trong bài toán định vị thông qua số nhà. Chúng ta có thể định nghĩa lân cận gần là việc xác
định nhà thông qua một số số lượng nhà lân cận xác địnhtrong dãy nhà có số tăng hoặc giảm
liên tục; trong khi đó, xác định lân cận xa được định nghĩa là việc xác định nhà thông qua các
nhà đầu hẻm, các nhà tham chiếu hoặc thông qua các địa vật tham chiếu khác, như: nhà trong
một khu dân cư, nhà có bể nước có khả năng phục vụ việc phòng cháy chữa cháy… Việc xác
định lân cận gần hoặc xa hoàn toàn mang tính chất mờ trong đánh giá. Tuy nhiên, với các
nhân tố đề cập ở các mục trước, chúng ta thấy rằng các xác suất p, q, r, s sẽ bị tác động mạnh
m
ẽ trên chất lượng dữliệu nền và các nhân tố hỗ trợ định vị (như tính liên tục và các dữliệu
lân cận hỗ trợ định vị). Dễ dàng ta thấy rằng, p
i
>> q
i
>> r
i
>> s
i
nếu vàchỉ nếu dữliệuđịnh vị
được ở một phạm vi không gian hẹp và ngược lại.
Các giá trị xác suất trên sẽ giúp người quản lý ước lượng được phương án triểnkhai
thực hiện dữ liệu. Trên thực tế, đối với các dự án, việc lựa chọn các phương án triểnkhai sẽ
ảnh hưởng đến nhân sự, tiến độ, thời gian vàchi phí thực hiện. Các giá trị xác su
ất sẽ được
tính toán dựa trên những phương thức lấy mẫu trên một số tuyến đường, vàmột số khu dân cư
nhiều nhà.
2.4. Vềmột quy trình định vị không gian tổng quát
Theo tàiliệu [11], đểđịnh vị vị trí không gian, chúng ta phải thực hiện 03 bước cơ bản:
bước tiền xử lý (pre-processing), bước lập tương ứng (matching) và bước tính toán (plotting).
Tiền xử lý là bước thiết lập các chuẩn để hình thành dữ liệu. Các địa chỉ sẽ được chuẩn hóa và
được tách (parse) thành các thành phần, như: số nhà, đường, phường, khu phố, Tiếp đó là
bước thiết lập tương ứng. Trong bước này, chúng ta sẽ định vị cụ thể những đối tượng tìm
thấy và những đối tượng không tìm thấy. Và sau cùng là bước tính toán. Bước tính toán sẽ nội
suy những thông tin, như địa chỉ, trên bản đồ.
Hình 4: Một góc dữliệu nhà và thửa Quận 7
HỘI THẢO ỨNG DỤNG GIS TOÀN QUỐC 2011
331
Đối với dữliệu nhà, một số luật được liệt kê như sau:
- Số nhà là một dãy tăng hoặc giảm cùng chẵn hoặc cùng lẻ.
- Khi định vị dữliệuvề nhà, phân cấp định vị: đường, phường, khu dân cư, khối
nhà, các nhà lân cận.
2.5. Đề xuất giải pháp định vị không gian từ các nhân tố mấu chốt trên dữliệunguồnđa
nền
Những nhân tố được xác định bên các mục trên dễ dàng dựa trên kinhnghiệmvà thực
tiễn vềdữliệuthuthậpvàdữ liệu. Thật vậy, chúng ta hoàn toàn có thể xác định nhà bằng
phương pháp định vị thủ công, nghĩa là, một kỹ thuật viên sẽ tìm kiếm khu nhà căn nhà, sau
đó định vị bằng chuột với công cụ phần mềm là một form tìm kiếm nhà. Tuy nhiên, tốc độ tìm
kiếm vàđịnh vị là yếu tố cần bàn đến đối với dữliệu của mộtQuậntrong thành phố HồChí
Minh. Điển hình: Quận 7 có trên 40000 hộ, nếu bình quânđịnh vị bằng cách tìm kiếm nhà sẽ
mất ít nhất 01 phút/hộ thì chúng ta cần trên 40.000 phút, nghĩa là trên 666 giờ, hoặc trên 83
ngày làm việc. Điều đó có nghĩa là, chúng ta cần tối thiểu 04 tháng làm việc hoặc tối thiểu 04
người sẽ thực hiện trong 01 tháng cho dữliệu của một chuyên đề của một Quận. Chúng ta sẽ
phân tích hướng cài đặt đối với từng nhân tố được mô tả trong mục 2.2:
- Với nhân tố a), chúng ta có thể quy định những khu vực gọi là liên tục đối với một số
ứng dụng nhất định. Ví dụ: trong ứng dụng thu gom rác, chúng ta có thể cần đến mô tả về
đường đi của người thu gom trongmột tuyến. Và tuyến trong hẻm sẽ khác với tuyến ngoài mặt
phố. Trên thực tế, thông thường các vùng liên tục ngoài đường lớn sẽ có biên là tim đường giao
thông, nhưng các vùng hẻm ít khi sử dụng tim hẻm làm biên. Về điểm này, chúng ta có thể giải
quyết bằng phương pháp sử dụng GPS để theo dõi (tracking) đường đi tiêu biểu của xe lấy rác.
Và trong trường hợp cần thiết hơn, chúng ta có thể thêm một GPS tracking vị trí lấy rác (trong
trường hợp đường hẹp hoặc người lấy rác dừng xe để đi bộ vào khu dân cư lấy).
Hình 5: Lỗi số nhà chưa quán (giữa số cũ và số mới)
trên một đoạn đường Huỳnh Tấn Phát gây khó khăn việc định vị
- Với nhân tố b), chúng ta dễ dàng thấy rằng nhân tố b) được hỗ trợ từnhân tố a). Với
dữ liệu được xem như liên tục, chúng ta có đểđịnh vị chuẩn một số vị trí không gian và các vị
trí khác sẽ được kết hợp để suy luận. Cụ thể hơn, khi tìm thông tin các nhà lân cận, chúng ta
HỘI THẢO ỨNG DỤNG GIS TOÀN QUỐC 2011
332
phải tìm các đối tượng bằng phương pháp buffer và có loại trừ theo các ngữ nghĩa không gian
như: nhà đang xét trong hẻm thì chỉ cần tìm các nhà trong hẻm mà không cần sử dụng thông
tin về nhà phía mặt tiền và ngược lại.
- Trong chương trình tự động định vị, những số nhà không định vị được (do không tìm
thấy) sẽ được định vị lần nữa dựa trên những nhà định vị được. Ví dụ: nhà 257 Lê Văn Lương
không tìm thấy. Tuy nhiên, ta có thể nội suy được nếu chúng ta xác định được nhà số 255 và
259 Lê Văn Lương.
Ngoài ra, chúng ta phải xây dựng các module hỗ trợ giải quyết các công việc thực tiễn
như sau:
- Chuyển đổi vềmộtđịnh dạng đối với hệ thống lưu trữ dữliệu (font chữ) với các
nguồn dữliệu thuộc nhiều font chữ khác nhau.
- Xây dựng thư viện phát hiện những từ “gần đúng” (có thể xác địnhthủ công) như: sai
lỗi chính tả, từ viết tắt,… (bằng các kỹ thuật tìm kiếm gần đúng hoặc tìm kiếm theo ngữ
nghĩa). Ví dụ: cùng một địa chỉ, tên hai chủ nhà ‘Nguyễn Quang Thìn’ và ‘Nguyễn Quan
Thình’ sẽ được xem là đồng nhất do có thể đây là lỗi về chính tả; hoặc ‘Võ Thị Lắm’ sẽ đồng
nhất với ‘Vỏ Thị Lắm’; hoặc tên đường ‘Đường số 2’ sẽ đồng nhất với tên đường ‘Số 2’ hoặc
‘Đ.số 2’. Trong thí nghiệm, chúng tôi đã xây dựng các hàm so sánh chuỗi đơn giản như: loại
bỏ dấu của tất cả các kí tựtrong chuỗi. Ví dụ Nguyễn Quang Thình sẽ trở thành: Nguyên
Quang Thinh. Nếu việc so sánh không “khớp” giữa hai chuỗi, chúng ta tiến hành các biến đổi.
Ở đây chúng ta so sánh số lượng chữ: ‘Nguyên Quan Thinh’ và ‘Nguyên Quang Thin’ đều có
3 chữ. Trong đó có 01 từ (‘Nguyên’) giống nhau và 02 từ khác nhau (‘Quan’ <> ‘Quang’ và
‘Thinh’ <> ‘Thin’). Tuy nhiên, sự sai khác có thể được phát hiện bằng cách phân nhóm.
Hình 6: Kết quả chương trình nhập liệuvàđịnh vị không gian bằng Spatial SQL
sau khi khảo sát dữliệu số nhà và chuyên đềthu gom rác Quận 7 TP.HCM
HỘI THẢO ỨNG DỤNG GIS TOÀN QUỐC 2011
333
3. KẾT LUẬN
Việc chọn các nhân tố thực nghiệm gây ảnh hưởng đến việc tạo lập dữliệu chuyên đề là
vấn đề cần thiết. Chúng ta cần phải xây dựng mối quan hệ giữa các nguồndữliệutrong điều
kiện dữliệu còn rời rạc. Tuy nhiên, để ứng dụng đưa vào thực tế, dữliệu phản ánh thế giới
thực là điều chính yếu. Do đó, chúng ta phải tìm kiếm những nhân tố tuân theo chất lượng dữ
liệu và các qui trình phục vụ thuthậpdữliệu chuyên đề cụ thể. Ngoài ra, từ những kết quả
nghiên cứu trên, một số kết luận được rút ra như sau:
- Cải tiến các tiến trình xây dựng một hệ thống GIS theo hướng phát triển các liên hệ với
nhau, đặc biệt là việc xây dựng và cập nhật dữliệu trên từng chuyên đềvà từng thời điểm.
- Đẩy mạnh việc đồng bộ dữliệu là vấnđề cần thiết trong các hệ thống. Thời gian đồng bộ
nhanh chóng giữa các cấp phường (xã) ÅÆ quận (huyện) ÅÆ thành phố (tỉnh) cần thực
hiện nhanh chóng đểdữliệu không bị lạc hậu.
- Xây dựng qui trình nhập liệu chuyên đề dựa trên các bản đồ nền. Việc xây dựng Qua đó,
chúng ta sẽ có những phản hồi với cơ quanquản lý về những sự thay đổi trong thực tế mà
dữ liệu nền chưa cập nhật kịp thời. Trong qui trình đó, chúng ta xây dựng khung chuẩn
đào tạo GIS đối với các lực lượng tham gia xây dựng hệ thống GISđể giảm sự sai lệch
giữa các dữ liệu.
- Tạm thời ứng dụng các phương pháp định vị theo xác suất, tận dụng các phương pháp
toán học như thiết kế thực nghiệmđể giảm các chi phí thực địa trong việc xây dựng các hệ
thống GIS, đặc biệt các hệ thống chuyên đề.
- Xây dựng các hệ thống 3D (không phải 2.5D) đểquản lý các ứng dụng. Trên thực tế,
chúng ta cần đến các hệ thống 3D thực sự để giải quyết những căn hộ chung cư với hàng
nghìn căn hộ trên một thửa lớn.
Hình 7: Các mô tả chi tiết vềdữliệu 3D theo chuẩn CityGML. Quản lý các đối tượng
3D là hướng đến của các ứng dụng quản lý đô thị trong tương lai
(a) LOD1 building
(c) LOD3 building
(d) LOD4 building
(b) LOD2 building
HỘI THẢO ỨNG DỤNG GIS TOÀN QUỐC 2011
334
Tài liệu tham khảo
[1] . Khưu Minh Cảnh, Trần Quang Trường Hinh, TS.Trần Trọng Đức, Hồ Nguyễn Cúc Phương, bài
báo: “Một số vấnđềvề đồng bộ dữliệu không gian”, Hội nghị KHCN lần thứ 12 Trường Đại học
Bách Khoa Tp.HCM, năm 2011.
[2]. TS. HồĐình Duẫn, TS. Lê Trung Chơn và Đặng Quốc Trung, bài báo nghiên cứu khoa học “Cơ
sở toán học của GIS 3D và các ứng dụng”, năm 2003.
[3]. TS. Nguyễn Ngọc Lâu, bài giảng môn học “Hệ thố
ng định vị GPS”, năm 2010.
[4]. TS. Đào Xuân Lộc, Cơ sở lý thuyết sai số, NXB đại học Quốc Gia, năm 2007.
[5]. TS. Huỳnh Trung Lương – ThS. Trương Tôn Hiền Đức, Phương pháp định lượng trongquản lý và
vận hành, NXB Khoa học và Kỹ thuật, năm 2002.
[6]. Nguyễn Khắc Thanh, Quản lý các dự án hệ thống thông tin địa lý (Tài liệu lưu hành nội bộ Sở
KHCN TPHCM), năm 2005.
[7]. Tàiliệu lập trình gvSIG các phiên bản gvSIG 1.1 và gvSIG 1.9, Tàiliệu lưu hành nội bộ, Trung
tâm GISC, năm 2010.
[8]. Tổ chức Open Geospatial Consortium xây dựng, Chuẩn CityGML, phiên bản 1.1, năm 2011.
[9]. Dennis Allard, Dimitri D’Or, Reoland Froidevaux, Estimating and simulating spatial categorical
data using an efficiency maximum entropy approach, tại Unité Biostatisque et Processus Spatiaux
Institut National de la Recherche Agronomique Avignon, France (http://www.biosp.org
). Thời
điểm: 22/9/2009.
[10]. Weidong Li, Chuanrong Zhang, bài báo Linear interpolation and joint model fitting of
experimental transiograms for Markov chain simulation of categerical spatial variables, Vol.24,
No.6, 6/2010, trang 821-839, tạp chí International Joural of Geographical Information Science.
[11]. Dr Md. Khalequazzaman, bài báocáovề “Geocoding & Dynamic Segmentation”, Dept. of
Geology & Physics Lock Haven University.
. ỨNG DỤNG GIS TOÀN QUỐC 2011 326 BÀN LUẬN VỀ VẤN ĐỀ DỮ LIỆU ĐA NGUỒN VÀ KINH NGHIỆM TRONG TRIỂN KHAI THU THẬP DỮ LIỆU GIS – NHẬN ĐỊNH TỪ MỘT NGUỒN DỮ LIỆU TẠI QUẬN 7, TP. HỒ CHÍ MINH (MULTI. Quận 7 cung cấp và dữ liệu thu gom rác do các phường thu c địa bàn Quận 7 cung cấp. 2. VẤN ĐỀ ĐỊNH VỊ KHÔNG GIAN TỪ DỮ LIỆU GIS ĐA NGUỒN 2.1. Phát biểu bài toán và một số nguyên nhân Dữ liệu. thường xuất phát từ qui trình khai thác dữ liệu. Trong bài báo này, chúng tôi nghiên cứu thực nghiệm việc định vị dữ liệu nhà tại khu vực Quận 7, thành phố Hồ Chí Minh trên cơ sở dữ liệu nhà do