Báo cáo " BƯỚC ĐẦU XÂY DỰNG MÔ HÌNH XỬ LÝ SONG SONG CHUYỂN ĐỔI TỌA ĐỘ VỚI KHỐI LƯỢNG DỮ LIỆU GIS LỚN " pdf

6 605 1
Báo cáo " BƯỚC ĐẦU XÂY DỰNG MÔ HÌNH XỬ LÝ SONG SONG CHUYỂN ĐỔI TỌA ĐỘ VỚI KHỐI LƯỢNG DỮ LIỆU GIS LỚN " pdf

Đang tải... (xem toàn văn)

Thông tin tài liệu

HỘI THẢO ỨNG DỤNG GIS TOÀN QUỐC 2011 400 BƯỚC ĐẦU XÂY DỰNG HÌNH XỬ SONG SONG CHUYỂN ĐỔI TỌA ĐỘ VỚI KHỐI LƯỢNG DỮ LIỆU GIS LỚN (INITIALIZING ESTABLISHING PARALLEL PROCESSING MODEL FOR THE GIS DATA TRANSFORMATION PROBLEM) Khưu Minh Cảnh a , Lê Trung Chơn b a Trung tâm Ứng dụng Hệ thống Thông tin Địa lý, Sở KH&CN, Tp. HCM kmcanh@yahoo.com b Khoa Kỹ thuật Xây dựng, Trường Đại học Bách Khoa, Tp. HCM ltchon@hcmut.edu.vn Abstract: This paper presents some analyses on parallel processing the GIS data transformation problem. Besides the correctness, the main problem is the time to transfer data, especially in online applications or in some remote sensing applications. Thanks to the technology development, we could process it in parallel. And there is also the description of some parallel packages. Keywords: Parallel processing, GIS, data transformation. 1. GIỚI THIỆU Bài báo cáo này tập trung vào việc phân tích các nhu cầu tính toán trong bài toán chuyển đổi hệ tọa độ và qua đó hình thành hình tính toán song song. Ta có, bên cạnh độ chính xác, vấn đề chính trong các ứng dụng chuyển hệ tọa độ là thời gian tính toán, đặc biệt trong các ứng dụng trực tuyến như web hoặc các ứng dụng về viễn thám. Việc tính toán trên một máy tính bằng các phần mềm sẽ bị giới hạn về vật lý: xung nhịp của bộ xử lý. Tuy nhiên, với những tiến bộ của công nghệ, chúng ta có thể tính toán trên nhiều bộ xử cùng lúc, gọi là tính toán song song. Việc tính toán song song sẽ giúp tăng tốc độ tính toán. Trong bài viết này, chúng tôi sẽ đề xuất về một số gói phần mềm thiết lập môi trường tính toán song song. 2. NỀN TẢNG VÀ CÁC NGHIÊN CỨU LIÊN QUAN 2.1. Cơ sở thuyết chuyển đổi tọa độ 2.1.1. Quan hệ toán học giữa các hệ tọa độ vuông góc không gian ba chiều Cho trước hai hệ tọa độ vuông góc ba chiều A(XYZ) và B(X’Y’Z’), ta có công thức chuyển đổi hệ tọa độ là: ⎥ ⎥ ⎥ ⎦ ⎤ ⎢ ⎢ ⎢ ⎣ ⎡ ' ' ' Z Y X = ⎥ ⎥ ⎥ ⎦ ⎤ ⎢ ⎢ ⎢ ⎣ ⎡ Z Y X + ⎥ ⎥ ⎥ ⎦ ⎤ ⎢ ⎢ ⎢ ⎣ ⎡ Δ Δ Δ Z Y X + ⎢ ⎢ ⎢ ⎣ ⎡ − y z ds ω ω x ds z ω ω − ⎥ ⎥ ⎥ ⎦ ⎤ − ds x y ω ω ⎥ ⎥ ⎥ ⎦ ⎤ ⎢ ⎢ ⎢ ⎣ ⎡ Z Y X (1) Trong đó: ZYX ΔΔΔ ,, : là những tham số tịnh tiến gốc tọa độ từ hệ A sang hệ B. zy x ω ω ω ,, : là những tham số quay của các trục tương ứng trên hệ A để về hệ B. HỘI THẢO ỨNG DỤNG GIS TOÀN QUỐC 2011 401 ds: là tham số tỉ lệ co giãn chuyển đổi đơn vị dài trong hệ tọa độ A về đơn vị dài trong hệ tọa độ B. 2.1.2. Quan hệ toán học giữa hệ tọa độ vuông góc không gian ba chiều và hệ tọa độ trắc địa Trong quan hệ này, chúng ta có hai công thức tính toán chuyển đổi qua lại giữa hai hệ tọa độ vuông góc (X,Y,Z) và hệ tọa độ trắc địa (B,L,H). Ta có các công thức chuyển đổi từ hệ tọa độ trắc địa sang hệ tọa độ vuông góc là: Với: Và ngược lại, chúng ta có các công thức chuyển đổi từ hệ vuông góc sang hệ tọa độ trắc địa bằng các công thức như công thức Bouring hoặc công thức lặp. Ngoài ra, chúng ta có các công thức chuyển đổi giữa hệ tọa độ phẳng và hệ tọa độ trắc địa, nghĩa là chúng ta chỉ xác định hai tham số x và y từ hai tham số B và L hoặc ngược lại. 2.2. hình tính toán song song trong GIS 2.2.1. Giới thiệu sơ lược về tính toán song song Xử hay tính toán song song là phương pháp sử dụng nhiều bộ xử tham gia cùng lúc giải quyết một công việc. Trên thế giới, nhiều ứng dụng được triển khai để xử song song. Ưu điểm của xử song song là thực hiện nhanh chóng và nhiều phép toán có thể xử cùng lúc. Đến nay, nhiều nghiên cứu về xử song song cũng như những ứng dụng được cài đặt. Và một tập phức tạp các vấn đề liên quan phát sinh phải giải quyết, bao gồm: - Mức độ song song hóa, nghĩa là, số lượng các xử có thể hoạt động cùng lúc. - Vấn đề quản dữ liệu, như phân chia và đồng bộ dữ liệu - Áp các quá trình xử vào các node xử lý. - Lập lịch thực thi cho các tác vụ. - Truyền thông giữa các tác vụ không trên cùng một máy Qua đó, các mục tiêu đánh giá cho một ch ương trình xử song song bao gồm: - Thời gian thực thi chương trình (program latency) - Băng thông (bandwidth): nghĩa là thông lượng của các tác vụ tương tự được lặp lại. - Tăng tốc (speed-up): tỉ số tốc độ giữa chương trình tính toán song song với một chương trình tuần tự. Theo đó, chúng ta có nhiều phân loại về phần cứng cũng như phần mềm trong lĩnh xử song song như: phân loại về hình bộ nhớ, phân loại về đồ hình kết nối, phân loại về xử tính toán (phân chia xử theo vùng dữ liệu hoặc phân chia xử theo phép toán). ,sin})1({ ;sincos)( ;coscos)( 2 BHeNZ LBHNY LBHNX +−= += += . sin1 22 Be a N − = HỘI THẢO ỨNG DỤNG GIS TOÀN QUỐC 2011 402 Hình 1. Minh họa về đồ hình kết nối các bộ xử hình tháp phù hợp với bài toán có phân chia hoặc phân tích ảnh viễn thám nhiều độ phân giải. Hiện nay để xây dựng các ứng dụng xử song song, một số gói phần mềm đã được xây dựng để làm nền tảng cho các hệ thống tính toán song song. Đó là các phần mềm theo chuẩn MPI, LAM. Các gói phần mềm đó sẽ có nhiệm vụ thiết lập môi trường tính toán song song và cung cấ p các hàm (API) để thực hiện các tác vụ tính toán song song cũng như truyền dữ liệu và giải quyết tranh chấp mạng. 2.2.2. hình tính toán song song trong GIS Với hệ thống GIS, việc tính toán song song cũng dựa trên nền tảng môi trường tính toán song song. Do đó, hình tính toán song song tổng quát trong GIS sẽ có thứ tự tuần tự sau: tầng ứng dụng, tầng thư viện, tầng các hàm/phương thức tiện ích cho tính toán song song, tầng môi trường tính toán song song và các tầng hệ điều hành, phần cứng truyền thông. Trong hình này, chúng ta có thể thấy sự kế thừa và phát huy những chức năng của tầng dưới trong việc xử bài toán GIS. Mặt khác, chúng ta có thể liên lạc trực tiếp giữa tầng ứng dụng với các tầng khác theo các thư viện hệ thống khác. Tuy nhiên, đặc điểm chính của hình là việc sử dụng giao diện MPI để tách biệt kiến trúc phần cứng và các thuật toán, ứng dụng bên trên. Khi đó, chúng ta có thể viết các chương trình theo một chuẩn (như chuẩn MPI) và cài đặt chương trình trên các hệ thống cấu hình phần cứng khác nhưng có cùng chuẩn (nh ư chuẩn MPI). Hình 2. hình tính toán song song tổng quát trong GIS theo lược đồ MPI HỘI THẢO ỨNG DỤNG GIS TOÀN QUỐC 2011 403 Dữ liệu là thành phần chính trong các hệ thống GIS. Do đó, việc tính toán song song trong GIS đa phần theo kỹ thuật phân chia theo dữ liệu (phân chia theo vùng – domain decomposition) hơn là phân chia theo chức năng. Các kỹ thuật phân chia theo dữ liệu sẽ phụ thuộc vào các yếu tố cơ bản như: - Bài toán GIS cần thực hiện: tính toán theo từng điểm, từng đối tượng, theo từng đường, theo vùng,… - Định dạng lưu trữ dữ liệu GIS: theo tập tin hoặc theo cơ sở dữ liệu. - Cấu trúc dữ liệu: vector, raster, BBL,… - Bản thân mỗi đối tượng hình học. Ví dụ: một đối tượng không gian có 100 đỉnh và một đối tượng không gian có 4 đỉnh sẽ có tốc độ chuyển đổi tọa độ khác nhau. Thật sự, những yếu tố trên sẽ ảnh hưởng đến quá trình đọc dữ liệu. Hơn thế nữa, đối với một số bài toán như bài toán chuyển đổi hệ tọa độ. Do các đối tượng mớ i hình thành sẽ có sự tương đồng với đối tượng cũ. Do đó, những yếu tố trên sẽ ảnh hưởng đến quá trình sau cùng trong tính toán song song, đó là quá trình tổng hợp dữ liệu. 2.2.3. Một số gói phần mềm hỗ trợ tính toán song song trong GIS Hiện tại, chi phí để xây dựng một hệ thống tính toán song song rất lớn. Tuy nhiên, trong một phạm vi nghiên cứu, chúng ta có thể sử dụng một số gói phần mềm mở hỗ trợ môi trường tính toán song song như: LAM/MPI, OpenMPI, MPICH2. Hầu hết các phần mềm đều có các gói nghiên cứu trên các hệ điều hành Unix và Microsoft Windows. Hơn thế nữa, hiện tại các gói phần mềm đã hỗ trợ chuẩn MPI2. Từ đó, chúng ta có thể dễ dàng qu ản các tiến trình và các đồ hình tính toán. Hình 3. Tạo môi trường thực thi MPI trên 2 máy bằng gói MPICH2 phiên bản 1.2.1 HỘI THẢO ỨNG DỤNG GIS TOÀN QUỐC 2011 404 Ngoài ra, chúng ta phải kết hợp một số chuẩn và gói phần mềm lưu trữ và xử GIS, như: - Hoặc chuẩn dữ liệu shapefile, đi kèm với các gói xử kèm theo như shapelib. - Hoặc chuẩn dữ liệu spatialite. - Hoặc các hệ quản trị CSDL hỗ trợ lưu dữ liệu GIS được trang bị ngôn ngữ truy vấn không gian (spatial SQL) như Postgres/PostGIS, SQL Server 2008, Oracle. Ngoài ra, để hiển thị dữ liệu đã tổng hợp, chúng ta có thể tận dụng phần thể hiện bản đồ của các gói phần mềm như ArcEngine, MapXtreme, MapWindow, gvSIG… 3. PHÂN TÍCH CÁC NHU CẦU TÍNH TOÁN TRONG BÀI TOÁN CHUYỂN ĐỔI TỌA ĐỘ 3.1. Nhu cầu tính toán trong bài toán chuyển đổi tọa độ Nhìn chung, đối với bài toán chuyển đổi tọa độ, các công thức sẽ áp dụng cho từng đối tượng không gian trong tập đối tượng. Cụ thể hơn, một tập đối tượng không gian gồm n phần tử thì mỗi đối tượng không gian sẽ được tính. Do đó, thuật toán tính tuần tự sẽ lặp tính công thức chuyển đổi tọa độ n lần. Từ đó, chúng ta nhận thấy rằng, tốc độ xử chuyển đổi tọa độ sẽ phụ thuộc khi số lượng dữ liệu lớn. Mặt khác, từ phân tích trên, chúng ta nhận thấy rằng các đối tượng có thể được tính toán một cách độc lập tọa độ mới. Do đó, trong giải pháp tính toán song song, chúng ta có thể phân phối các đối tượng đến các bộ xử khác nhau và thực hiện chuyển đổi tọa độ trên từng bộ xử lý. Hơn thế nữa, việc tính toán độc lập, nên chúng ta có thể tính toán dựa trên việc phân chia về số lượng phần tử trong tập đối tượng cần tính chuyển tọa độ. Từ đó, ta có: Nếu hệ thống có m máy và tập dữ liệu gồm n đối tượng cần chuyển đổi. Khi đó, mỗi máy sẽ đảm nhiệm chuyển đổi số lượng đối tượng tương ứng sẽ là: [n/m]+1. Tuy nhiên, đến đây, chúng ta lại thấy rằng, nếu tập dữ liệu cần chuyển đổi hệ tọa độ gồm 10 tỷ đối tượng, thì chúng ta có thể bị cản trở về thời gian phân phối dữ liệu (nếu chỉ một máy đảm trách). Như vậy, hình phân phối dữ liệu phục vụ tính toán là hình quan trọng trong xử song song chuyển đổi tọa độ. Hai mức độ giải quyết bài toán phân phối d ữ liệu: - Mức độ 1: Giải quyết bài toán phân phối dữ liệu trên cơ sở thiết lập các đồ hình kết nối. Đối với mức độ này, chúng ta phải nhận diện ra được các luồng dữ liệu truyền trên mạng. Với cấu hình mạng tốt, chúng ta sẽ giảm thời gian mạng chờ. - Mức độ 2: Giải quyết bài toán phân phối dữ liệu trên cơ sở đã có đồ hình kết nối. Ở mức độ này, thông thường chúng ta áp dụng cho những ứng dụng. Ví dụ: chúng ta cần tạo (render) một hình về dữ liệu sau khi biến đổi để trả về cho máy khách trong mô hình WebGIS. Khi đó, chúng ta phải hội tụ các máy tính tính toán cho một vùng dữ liệu cần trả về máy khách tổng hợp. Khi đó, dữ liệu phân phối cụ th ể đến các máy được lọc theo vùng với những chiến lược riêng. 3.2. Đề xuất các chiến lược song song hóa Từ những phân tích trên, chúng ta có các phương án thực hiện song song hóa khi thực hiện tính toán chuyển đổi tọa độ như sau: - Phương án 1: Song song hóa việc chuyển đổi từng đối tượng. Chúng ta chỉ quan tâm đến việc phân phối đều số đối tượng vào số bộ xử lý. HỘI THẢO ỨNG DỤNG GIS TOÀN QUỐC 2011 405 - Phương án 2: Song song hóa việc chuyển đổi từng điểm. Vì trong đối tượng không gian có thể có nhiều điểm. Do đó, chúng ta có thể thực hiện việc đánh giá số lượng điểm trong tập đối tượng và phân phối việc tính toán song song. Trong phương án này, chúng ta sẽ có thời gian tính toán tốt hơn phương án trên. Tuy nhiên, việc chuyển đổi xây dựng lại đối tượng từ các điểm của nó sẽ chiếm một khoảng thời gian. 3.3. hình tính toán song song xử chuyển hệ tọa độ Từ những phân tích trên, chúng ta có hình (qui trình) thực hiện tính toán song song để xử chuyển hệ đổi tọa độ như sau: - Xác định số lượng máy có thể tham gia tính toán song song. - Xác định mức độ song song hóa: theo đối tượng hoặc theo điểm. - Thực hiện thống kê dữ liệu để nhận được thông tin về độ phức tạp hình học trong mỗi đối tượng. - Xây dựng hình kết nối bằng các chuẩn như MPI. - Phân phối dữ liệu vào hình. Tùy các ứng dụng, chúng ta có thể chọn và nhóm các ứng dụng theo vùng địa lý. - Thực hiện tính toán song song trên từng node. - Tổng hợp dữ liệu. - Trả kết quả tính toán. 4. KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN Bài toán xử song song để chuyển đổi hệ tọa độ là bài toán quan trọng. Chúng ta có thể thấy các ứng dụng liên quan đến như thiết lập bản đồ, chuyển đổi dữ liệu cũ, xử không ảnh và ảnh viễn thám. Theo đó, chúng ta cần mở rộng cài đặt hơn trong các bài toán lớn hơn (như bài toán tiền xử ảnh viễn thám) mà trong đó vấn đề chuyển đổi hệ tọa độ chỉ là một phần. Vì khi đó, hình tính toán sẽ bị ảnh hưởng mạnh bởi các bài toán và yếu tố khác. Tài liệu tham khảo 1. TS. Lê Trung Chơn, Bài giảng môn học sau đại học Hệ qui chiếu trắc địa nâng cao. http://ww.pgs.hcmut.edu.vn/~ltchon/lectures/geodetic_datum/Chuong1_BK_files/frame.htm 2. TS. Trần Văn Hoài, Bài giảng môn học sau đại học Tính toán song song. 3. PGS.TS. Nguyễn Đức Nghĩa, Bài giảng môn Tính toán song song, NXB Đại học Bách Khoa Hà Nội, 2008. 4. Michael A. G. A¨ıv´azis, ACM/CS 114 Parallel algorithms for scientific applications, California Institute of Technology, 2010. 5. George A.Jennings, sách Modern Geometry with Applications, Springer, 1994 6. Ian Foster, sách Designing and Building Parallel Programs, 1995. 7. Richard Healey, Steve Dowers, Bruce Gittings và Mike Mineter, sách Parallel Processing Algorithms for GIS, Nhà xuất bản Taylor&Francis, 1998. . DỤNG GIS TOÀN QUỐC 2011 400 BƯỚC ĐẦU XÂY DỰNG MÔ HÌNH XỬ LÝ SONG SONG CHUYỂN ĐỔI TỌA ĐỘ VỚI KHỐI LƯỢNG DỮ LIỆU GIS LỚN (INITIALIZING ESTABLISHING PARALLEL PROCESSING MODEL FOR THE GIS. gian. 3.3. Mô hình tính toán song song xử lý chuyển hệ tọa độ Từ những phân tích trên, chúng ta có mô hình (qui trình) thực hiện tính toán song song để xử lý chuyển hệ đổi tọa độ như sau:. gian phân phối dữ liệu (nếu chỉ một máy đảm trách). Như vậy, mô hình phân phối dữ liệu phục vụ tính toán là mô hình quan trọng trong xử lý song song chuyển đổi tọa độ. Hai mức độ giải quyết

Ngày đăng: 03/04/2014, 06:20

Từ khóa liên quan

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan