Phân lớp có giám sát

Một phần của tài liệu (LUẬN văn THẠC sĩ) tích hợp GIS và viễn thám phục vụ công tác quản lý tài nguyên thiên nhiên (Trang 32)

Giả sử ảnh có k kênh phổ. Khi đó mỗi pixel trên ảnh sẽ tương ứng với một vector k chiều(mỗi thành phần là giá trị tại kênh thứ k của pixel đó) gọi là vector phổ của pixel. Thuật toán phân lớp sẽ dựa vào quan hệ giữa vector phổ của từng pixel với các lớp. Có rất nhiều phương pháp phân lớp giám sát, trong giới hạn đề tài này em xin giới hiệu phương pháp phân lớp theo xác suất cực đại

Phƣơng pháp phân lớp theo xác suất cực đại (Maximum Likelihood classsifier)

Phương pháp phân lớp theo xác suất cực đại được sử dụng thường xuyên trong xử lý ảnh viễn thám . Mỗi pixel được tính xác suất theo một lớp nào đó, vào nó được gán nhãn có xác suất thuộc vào lớp đó lớn nhất.

Xác suất này được định nghĩa như sau:

( / ) ( )* ( / ) / ( )* ( / )

k

L P k X P k P X k P i P X i

Trong đó : P(k) : xác suất tiềm định của lớp k

P(X/k) : xác suất điều kiện có thể thay X thuộc vào lớp k

Thông thường người ta coi lớp P(k ) là hằng số cho tất cả các lớp và P(i)*∑P(X/i) cũng được coi như vậy, cho nên thực chất xác suất Lk có thể được viết như sau:

1 1/2( ) ( ) /2 1/2 1 ( ) (2 ) | | k X X k n k L X e

Trong đó : X : Vector cấp độ xám của một pixel nào đó Lk : xác suất mà x thuộc vào lớp k

|∑k| : định mức của ma trận phương sai

Hình 1.10. Phân loại thep phương pháp xác suất cực đại

Theo nguyên lý xác suất, phương pháp phân loại theo xác suất cực đại có nhiều ưu việt. Tuy vậy khi sử dụng nó cần chú ý đến một số vấn đề sau :

- Số lượng các khu vực lấy mẫu phải đủ lớn để giá trị trung bình cũng như ma trận phương sai tình cho một lớp nào đó có giá trị đúng với giá trị thực tế

- Ma trận nghịch đảo của ma trận phương sai sẽ không ổn định trong một số trường hợp độ tương quan giữa các kên phổ rất gần nhau. Khi đó cần áp dụng phương pháp giảm số kênh phổ, ví dụ như phương pháp phân tích thành phần chính

Phân lớp không giám sát

Phương pháp này được dùng trong trường hợp thông tin về các lớp phủ không đầy đủ hoặc thậm chí không có. Phân lớp không giám sát có thể được dùng như một phương tiện để sơ bộ tìm hiểu sự chia lớp của một vùng sắp khảo sát, và được sự dụng trong ứng dụng mà không có dữ liệu huấn luyện.

CHƢƠNG 2. TÍCH HỢP GIS VÀ ẢNH VIỄN THÁM TRONG QUẢN LÝ TÀI NGUYÊN THIÊN NHIÊN

2.1. Tích hợp là gì?

Tích hợp có nghĩa là hợp thành một thể thống nhất, bổ xung thành một thể thống nhất, hợp nhất. Như vậy tích hợp GIS và viễn thám là việc hợp nhất các ưu điểm của hai loại thành một thể thống nhất đồng thời tìm ra cách hạn chế của hai loại tư liệu nói trên.

2.2. Thu thập ảnh viễn thám bằng phần mềm Terralook2.2.1 Giới thiệu về phần mềm Terralook 2.2.1 Giới thiệu về phần mềm Terralook

Terralook đầu tiên được biết đến như một công cụ đơn thuần lưu trữ dữ liệu đồ họa về các khu bảo tồn thiên nhiên. Những phiên bản lưu trữ đối tượng đồ họa lúc đầu chưa cho phép nhập ảnh vệ tinh cũng như hiển thị ảnh theo yêu cầu. Sau đó được phát triển, những ý tưởng chính do màu sắc của một phần mềm tích hợp dữ liệu ảnh vệ tinh với các dữ liệu đồ họa khác được hình thành rõ nét. Phần mềm Terralook ngày càng mang đậm tính địa lý và không gian. Terralook cho phép người dùng tạo ra các bộ sưu tập riêng của họ về ảnh vệ tính dạng JPEG. Các ảnh của Terralook cho phép giải thích hình ảnh và so sánh mà không cần phần mềm phức tạp. Các bộ sưu tập thì tương thích với hầu hết các ứng dụng GIS và lập bản đồ Web. Tất cả các dữ liệu Terralook và phần mềm đều có sẵn và miễn phí. Terralook được phát triển để mở rộng số lượng của người sử dụng ảnh vệ tinh bằng cách cung cấp cả hai dữ liệu ASTER và Landsat như mô phỏng tự nhiên, màu sắc hình ảnh

Hình ảnh thu thập bằng phần mềm TerraLook

Hình 2.1. Ảnh thu thập bằng phần mềm TerraLook

2.3. Thu thập và tiền xử lý dữ liệu bản đồ véctơ

Thu thập, nhận diện và đo đạc dữ liệu GIS vào cùng thời điểm, cùng độ phân giải không gian, tuân thủ cùng một thủ tục nhận diện và nhập vào GIS theo cùng phương pháp là lý tưởng nhất. Nếu như vậy các thao tác phân tích trên khối dữ liệu đó mới cho kết quả có chất lượng cao. Nhưng trên thực tế, việc thu thập dữ liệu lại được thực hiện vào các thời điểm khác nhau và chúng thường có độ phân giải khác nhau. Một số dữ liệu được thu thập từ bản đồ có sẵn mà không biết được tọa độ thực, một số khác được thu thập bằng đo đạc trực tiếp. Cần chú ý là trong mọi trường hợp việc thu thập tọa độ vị trí các đối tượng và thu thập các thuộc tính của chúng phải tiến hành vào cùng thời điểm. [1]

Có rất nhiều loại dữ liệu được sử dụng trong công việc phân tích GIS. Điều này phản ánh mục tiêu của chính hệ thống. Vì GIS được sử dụng trong nhiều loại ứng dụng khác nhau từ phân tích địa chất, phân tích thị trường đến lập kế hoạch nông thôn cho nên chúng ta khó có thể kiểm kê và phân lớp dữ liệu một cách dễ hiểu.

Nhập dữ liệu là công đoạn tốn kém thời gian nhất trong thao tác GIS, thường tốn đến 80% ngân sách trong một dự án.

Cách tốt nhất để có nhanh dữ liệu là sử dụng dữ liệu có sẵn của các công ty hay tổ chức khác. Việc chia sẻ dữ liệu trở nên thông thường trong thế giới GIS góp phần đẩy nhanh chuẩn hóa dữ liệu và phát sinh khái niệm dữ liệu về dữ liệu (metadata) để mô tả nguồn gốc và độ chính xác của các lớp GIS. Điều quan trọng trong xử lý dữ liệu có sẵn là phải đáp ứng nhu cầu cụ thể. Nếu dữ liệu có sẵn mà không phù hợp với nhiệm vụ thì phải tự số hóa bản đồ.

Có thể nói rằng tập dữ liệu không có tài liệu là dữ liệu không có giá trị. Nếu không biết nguồn gốc của dữ liệu thì người dùng sẽ mất nhiều thời gian để kiểm chứng chúng. Mỗi đối tượng GIS được mô tả bởi kiểu, hình dạng, các thuộc tính, quan hệ và số lượng của nó. Các kiểu dữ liệu bao gồm: dữ liệu hình học và dữ liệu thuộc tính.

Các phương pháp thu thập dữ liệu có thể được phân chia thành hai loại chính. Thứ nhất là phương pháp thu thập dữ liệu bằng chính những đối tượng. Phương pháp này thường cho kết quả chính xác nhất, nhưng chi phí cũng tốn kém nhất. Chúng bao gồm:

- Trắc địa mặt đất

- Phương pháp định vị bằng vệ tinh

- Chụp ảnh bằng máy bay hay vệ tinh

Thứ hai là phương pháp thu thập dữ liệu từ nguồn số hóa hay tương tự có sẵn. Phương pháp này cho dữ liệu ít chính xác hơn phương pháp trên nhưng đòi hỏi chi phí thấp hơn. Chúng bao gồm:

- Số hóa bằng tay các bản đồ giấy

- Số hóa tự động bản đồ giấy bằng máy quét

- Sử dụng các cơ sử dữ liệu, bản đồ số hóa có sẵn.

Phƣơng pháp thu thập bản đồ bằng ảnh vệ tinh

đứng hay xiên trên cao, cảm tưởng về bề mặt trái đất khác đáng kể so với khi quan sát từng điểm xung quanh ta. Ta có thể nhìn thấy vô số các đặc trưng trên bề mặt trái đất như là quan sát thấy các quan hệ ngữ cảnh và không gian thích ứng của chúng trên bản đồ chuyên đề. Đó là lý do viễn thám được sử dụng rộng rãi. Bằng các cảm biến trên máy bay hoặc vệ tinh mà các đặc trưng trên các vùng rộng lớn được đo đạc và phân tích, không bị các vùng lân cận cản trở. Đó là phương pháp hiệu quả nhất để duy trì, cập nhật thông tin về trái đất.

Khi nói đến viễn thám hầu như người ta suy nghĩ đến vệ tinh mang thiết bị cảm biến. Hầu hết các vệ tinh bay vòng quanh trái đất theo quỹ đạo mặt trời có độ cao tử 700 đến 1000 km.

Các ảnh do vệ tinh chụp được gửi về trái đất bằng tín hiệu sóng radio để các chạm thu mặt đất thu được. Đặc trưng của cảm biến vệ tinh bao gồm các điểm chính sau:

- Lớp quang phổ (vị trí dải tần)

- Mật độ quang phổ (độ rộng dải tần)

- Kính thước quang phổ (tổng số dải tàn)

- Mật độ phóng xạ (lượng tử)

- Mật độ hình học (kích thước điểm ảnh trên mặt đất

- Tần suất chụp (số lần chụp trong đơn vị thời gian)

Bộ cảm biến được sử dụng nhiều có chất lượng cao được đặt trên vệ tinh Landsat loại TM (Thematic Mapper) Sau khi đã có dữ liệu ảnh, công việc tiếp theo là xử lý chúng theo một trong các cách mà con người diễn giải hay kỹ thuật xử lý tự động ảnh số. Con người có thể nhận biết nhanh các mẫu của ảnh trong một số trường hợp.

Nhưng nên ứng dụng phương pháp xử lý ảnh số bằng máy tính trong phần lớn các trường hợp khác. Các công việc phải làm là:

- Làm rõ và tách sườn ảnh

- Ghép ảnh

- Phân tích các thành phần chính

- Tính toán tỷ lệ và chỉ số ảnh

Mục tiêu chính của xử lý ảnh bằng máy tính là phân lớp (classification) hay còn gọi là nhận dạng mẫu. Phân lớp là nhóm các đối tượng vào các lớp trên cơ sở mức độ tương tự và tuân thủ một hay nhiều biến. Mục tiêu của hầu hết các ứng dụng viễn thám là phân biệt và ánh xạ các lớp thông tin mặt đất chính xác.

Số hóa bản đồ

B1. Tìm kiếm bản đồ phù hợp : Tìm kiếm bản đồ phù hợp phụ thuộc vào lựa chọn vùng, chủ đề và chu kì phù hợp, thời gian phù hợp. Phần lớn thư viện bản đồ chứa mô tả vùng, chủ đề trong danh mục đồng thời chứa cả thời gian phát hành bản đồ. Tuy nhiên hiếm khi thời gian thu thập dữ liệu phù hợp mà vẫn còn hợp lệ với thời gian lập bản đồ. Vào năm 1992, DCW (Digital Char of the World), bản đồ thế giới có kèm theo chỉ báo khung thời gian được phát hành trên giấy và dạng số trong tệp. Tệp dữ liệu của DCW chứa toàn bộ các đoạn thẳng tạo thành bờ biển, sông ngòi, đường bình đồ, đương biên quốc gia, đường quốc lộ chính, đường xe hỏa và các thành phố. Các tệp này được số hóa từ bản đồ tỷ lệ 1 :1000000 của ONC (Operational Navigation Charts). Dung lượng của dữ liệu DCW khoảng 1.6 Gbyte được lưu trữ trên CD-ROM. Nội dung của chúng được chia thành nhiều lớp bản đồ, như đường biên hành chính, bờ biển, sử dụng đất, đường quốc lộ, đường sát, hệ thống thủy lợi. Mỗi lớp lại được chia thành lớp bản đồ con. Thí dụ lớp đường sắt được chia thành đường đơn hay đường đôi. Xâm nhập bản đồ được thực hiện thông qua chỉ số tên dịa phương hay cho trước tọa độ kinh vĩ tuyến. Dữ liệu này có cấu trúc topo trong khuôn mẫu vector VPF (Vector Product Format). [1]

B2: Số hóa bản đồ : Khi chuẩn bị bản đồ để số hóa thì cần coi trọng phương pháp quy chiếu không gian của dữ liệu. Tiến trình tham chiếu địa lý là

địa lý, tọa độ lưới hay không dùng tạo độ. Trong trường hợp này, dữ liệu mới tạo ra không thể phù hợp với dữ liệu có sẵn trong các tệp mà phải thực hiện nắn chỉnh chúng. Khi sử dụng hệ tọa độ địa lý, Trái đất được coi như là hình cầu. Khi sử dụng hệ tọa độ lưới, trái đất được coi như mặt phẳng. Hệ tọa độ lưới UTM tổ hợp cả hệ tọa độ địa lý và tọa độ lưới nó là tập các mặt phẳng bao quanh trái đất. Nhiều hệ GIS không lưu trữ tọa độ theo khuôn dạng mẫu độ, phút, giây mà lưu trữ hệ tọa độ thập phân. Do vậy, khi hiển thị và khi nhập tọa độ đặc trưng bản đồ thường phải chuyển đổi giữa chúng. Công thức biến đổi độ, phút, giây sang khuôn mẫu độ thập phân như sau:

Decimal Degrees=Degrees + 60 60

Seconds Minutes

Với ví dụ phải chuyển đổi ' ''

42 4530o sang độ thập phân ta có : Decimal Degrees= 30 45 60 42 60 =42.7583333

Công thức biến đổi độ thập phân sang độ, phút, giây được mô tả thông qua ví dụ. Số nguyên của độ thập phân là độ, ví dụ độ thập phân 75,213458 thì có 75o . Số phút bằng phần nguyên của phép nhân phần lẻ độ thập phân với 60, ta có 0,213458 * 60 = 12,807480, kết quả là 12 phút. Tính tương tự cho số giây: 0,807480 * 60 = 48,4488 để có kết quả là 48”. Vậy 75,213458 =

75o12’18”.

Số hóa bản đồ bằng bàn số hóa (digitizer) hay nhập bản đồ giấy bằng máy quét (scanner) là phương pháp thường được sử dụng. Số hóa bằng bàn số hóa là tiến trình ghi lại vị trí của trình tự các điểm đặc trưng dọc theo đường trên bản đồ. Phương pháp này cho kết quả dưới dạng bản đồ vector 2D. Máy quét làm việc tương tự máy fax. Kết quả nhập bản đồ bằng máy quét là số liệu raster. Nếu sử dụng công cụ phần mềm chuyển đổi raster sang vector thì ta cũng có số liệu bản đồ vector 2D. Một trong những đặc trưng quan trọng của dữ liệu bản đồ là độ chính xác. Độ chính xác của dữ liệu phát sinh từ tiến trình số hóa hay quét bản đồ phụ thuộc trước hết vào độ chính xác của bản đồ

giấy. Hình 2.2 là giao diện của module nhập bản đồ của hệ thống PopMap for Windows 4.2. Module này có đầy đủ chức năng vẽ, cập nhật, sửa đổi các đường biên đối tượng bản đồ và gắn nhãn cho đối tượng kiểu điểm, đường, vùng. Các đặc trưng bản đồ được nhập thông qua bàn số hóa hay chuột.

Hình 2.2. Phần mềm nhập bản đồ qua bản số hóa

Phương tiện chính để chuyển đổi dữ liệu tuyến tính sang dữ liệu số là bàn số hóa và máy quét. Sử dụng bàn số hóa bằng tay còn máy quét thì làm việc tự động. Bàn số hóa bao gồm bàn nhỏ chứa lưới dây kim loại mịn đặt theo các trục Đecac. Con trỏ chứa cuộn dây kim loại và được nối với bàn để người thao tác xác định điểm cần ghi lại. Vị trí chính xác được xác định nhờ dấu thập mỏng tại đầu con chạy. Trên con trỏ còn có các phím để nhập mã lệnh và hay dữ liệu. Công nghệ chung nhất của bàn số hóa dựa trên nguyên tắc điện từ. Lưới dây trong bảng nhỏ và cuộn dây con trỏ hoạt động như bộ thu , bộ phát hay ngược lại. Nếu con trỏ là bộ phát thì bộ điều khiển của bàn sẽ quét lưới dây kim theo chiều X và Y để tìm ra vị trí của chữ thập mỏng đầu con trỏ

Hình 2.3. Số hóa bản đồ

Mục tiêu chính của tiến trình chuyển đổi thông tin không gian từ dạng tuyến tính sang dạng số hóa là bảo toàn quan hệ trên bản đồ, bao gồm:

- Đảm bảo liên kết tồn tại giữa các điểm

- Các đường song song vẫn còn song song

- Bảo toàn các vị trí tương đối

- Bảo toàn các vị trí tuyệt đối (thông qua tọa độ)

- Bảo toàn tính liền kề

- Các đường gần nhau không được cắt nhau

Tiến trình số hóa thường bắt đầu bằng cố định bản đồ gốc trên mặt bàn số hóa. Trước khi số hóa các đặc trưng bản đồ, phải số hóa các điểm điều khiển (điểm tham chiếu) hay lưới tọa độ để đăng ký hệ thống tọa độ. Một phần rất quan trọng của số hóa bản đồ là đảm bao thông tin tham chiếu địa lý, biểu thị 39 bằng lưới và các đường kinh tuyết, vĩ tuyến cần được lưu trữ theo bản đồ số

Một phần của tài liệu (LUẬN văn THẠC sĩ) tích hợp GIS và viễn thám phục vụ công tác quản lý tài nguyên thiên nhiên (Trang 32)

Tải bản đầy đủ (PDF)

(72 trang)