7. Cấu trúc của luận văn
3.2.2. Chiết tách thông tin trên ảnh viễn thám
Thông tin trên ảnh đƣợc chiết xuất theo nhiều phƣơng pháp khác nhau, có thể chia làm hai nhóm chính: Giải đoán bằng mắt thƣờng và xử lý số.
3.2.2.1 Phương pháp giải đoán bằng mắt
Đây là phƣơng pháp khoanh định các đối tƣợng cũng nhƣ xác định trạng thái của chúng nhờ phân biệt các đặc tính yếu tố ảnh (Độ sáng, kiến trúc, kiểu mẫu, hình dạng, kích thƣớc, bóng, vị trí, màu) và các yếu tố địa kỹ thuật. Cơ sở để giải đoán bằng mắt là các chuẩn giải đoán và khóa giải đoán. Phƣơng pháp này có thể khai thác tri thức chuyên gia và kinh nghiệm của ngƣời giải đoán, đồng thời phân tích đƣợc các thông tin phân bố không gian một cách dễ dàng. Kết quả giải đoán phụ thuộc rất nhiều vào khả năng của ngƣời phân tích. Tất nhiên, hạn chế của giải đoán bằng mắt là không nhận biết đƣợc hết các đặc tính phổ của đối tƣợng, nguyên nhân là do khả năng phân biệt sự khác biệt về phổ của mắt ngƣời hạn chế (12-14 mức). Tuy nhiên, với các đất đô thị và khu dân cƣ thì việc giải đoán bằng mắt thƣờng là không khả thi
do kích thƣớc các đối tƣợng này nhỏ hơn kích thƣớc của pixel rất nhiều và mắt ngƣời hoàn toàn không có khả năng phân biệt.
TT Đối tƣợng Mẫu trên ảnh SPOT Dấu hiệu
1. Đất dân cƣ đô thị Xanh lam (đậm hoặc nhạt, thậm chí trắng tuỳ theo mật độ công trình) 2. Đất dân cƣ nông thôn Xanh xẫm có lẫn các đốm đỏ 3. Đất trống Trắng hoặc xanh sáng 4. Thực vật Đỏ - hồng
5. Sông hồ Đen, xanh lá cây lẫn xanh lam (tối hoặc sáng theo độ sâu và độ sạch)
Bảng 3.1: Một số dấu hiệu giải đoán trên ảnh tổ hợp màu giả chuẩn
Nhƣ vậy trong giải đoán bằng mắt phải nắm bắt và phân biệt đƣợc các dấu hiệu giải đoán, công việc đó đòi hỏi ngƣời giải đoán phải có kiến thức chuyên môn vững để có thể kết hợp tốt các kiến thức trong quá trình giải đoán ảnh và chỉ có vậy mới có thể đƣa ra kết quả chính xác. Với mục tiêu chiết xuất thông tin và nghiên cứu hình thái không gian của sự phát triển đô thị Hà Nội, luận văn sử dụng phƣơng pháp xử lý số nhờ ƣu điểm của phƣơng pháp là xử lý nhanh. Tuy nhiên, với các kết quả phân loại bằng phƣơng pháp xử lý số, sau khi tách thông tin đất đô thị vẫn thấy có hiện tƣợng lẫn đất đô thị vào các loại đất khác do có những tính chất phổ tƣơng đối giống nhau, tác giả dùng phƣơng pháp giải đoán bằng mắt để loại bỏ hiện tƣợng lẫn này.
3.2.2.2 Phương pháp phân loại tự động (xử lý số)
Là phƣơng pháp phân tích tƣ liệu viễn thám dạng hình ảnh số. Ƣu thế của phƣơng pháp xử lý số là có thể phân tích đƣợc tín hiệu phổ rất chi tiết (256 mức hoặc hơn). Với sự trợ giúp của máy tính và các phần mềm chuyên dụng, có thể tách chiết rất nhiều thông tin phổ của đối tƣợng, từ đó có thể nhận biết các đối tƣợng một cách tự động. Tất nhiên quá trình xử lý số cần có sự kết hợp nhuần nhuyễn với kiến thức chuyên môn của ngƣời phân tích, hoặc ngƣời lập trình, các chƣơng trình tính toán có ƣu điểm nổi bật là thời gian xử lý ngắn, việc phân loại đối tƣợng đƣợc tiến hành nhanh chóng trên phạm vi rộng mà không cần nhiều công đi thực địa, công việc thực hiện hoàn toàn dựa vào cấp độ xám của pixel nên kết quả thu đƣợc khách quan không phụ thuộc chủ quan của ngƣời giải đoán. Nhƣợc điểm cơ bản của phƣơng pháp xử lý số là khó kết hợp tri thức và kinh nghiệm của con ngƣời. Đồng thời do xử lý số chỉ thuần túy dựa vào đặc trƣng phản xạ phổ của các đối tƣợng nên còn có sự nhầm lẫn cho việc phân tích thông tin của một số đối tƣợng. Để khắc phục nhƣợc điểm này, trong những năm gần đây ngƣời ta đang nghiên cứu và ngày càng hoàn thiện các chƣơng trình ứng dụng xử lý ảnh số có khả năng mô phỏng tri thức chuyên môn của con ngƣời phục vụ cho việc phân loại tự động (Phạm Văn Cự, 2005)
Nhƣ đã trình bày ở trên, với định nghĩa đô thị đƣợc chấp nhận rộng rãi bởi các tổ chức quốc tế và các quốc gia, cũng nhƣ phân loại đô thị theo quyết định của Chính phủ Việt Nam thì việc xử lý ảnh cần phải gắn với ranh giới các đơn vị hành chính đô thị. Ở Hà Nội đó là ranh giới các Quận nội thành và các Thị trấn huyện là các không gian đô thị theo nghĩa hành chính. Tuy nhiên, tại những khu đô thị mới nhƣ Mỹ Đình, Trung Hoà - Nhân Chính, Bắc Linh Đàm, Định Công, Nam Thăng Long v.v. mật độ xây dựng tuy không cao nhƣng tính chất hành chính và tính chất công trình lại thuộc nhóm đô thị nên đã đƣợc tính đến trong quá trình phân loại.
Trong luận văn, các ảnh viễn thám độ phân giải trung bình (Landsat MSS, Landsat TM) và độ phân giải cao (SPOT 3 và SPOT 5) áp dụng vào đô thị phân theo hai phƣơng pháp:
- Phân loại theo phương pháp thống kê
Các đặc trƣng phản xạ phổ của các đối tƣợng tự nhiên chứa đựng các thông tin quan trọng cho phép nhóm chúng thành các loại đối tƣợng có đặc trƣng phản xạ phổ
giống nhau dựa trên sự giống nhau về phổ phản xạ của các đối tƣợng này đã có nhiều phƣơng pháp phân loại ảnh viễn thám dựa trên đặc điểm phổ phản xạ của các đối tƣợng để gộp các pixel có cùng giá trị phổ theo ngƣỡng thành một nhóm. Theo hƣớng này, kết quả của quá trình phân loại sẽ phụ thuộc hoàn toàn vào những giá trị phổ thu đƣợc từ các giá trị pixel mẫu. Đặc trƣng cho phép phân loại thống kê là phƣơng pháp tính khoảng cách tối thiểu dựa chủ yếu vào các đặc trƣng thống kê phổ phản xạ của các pixel.
Phƣơng pháp này giả định rằng các pixel của K kênh ảnh đƣợc tập hợp thành các lớp dƣới dạng các đám mây của siêu khối hình cầu hoặc hình ellipsoid. Một pixel thứ i nào đó của kênh ảnh K sẽ thuộc về lớp C nào đó nếu khoảng cách từ pixel đó tới tâm của siêu khối cầu hoặc tâm của ellipsoid C nhỏ hơn hoặc bằng bán kính trục của ellipsoid C đó (Báo cáo đô thị, 2003).
Đây là phƣơng pháp thông dụng nhất và thuộc vào nhóm phƣơng pháp có kiểm định. Phƣơng pháp này sử dụng các thống kê (mean, varriance-covarriance) trong không gian phổ để xây dựng thuật toán.
Nguyên lý của phƣơng pháp này là : Mỗi pixel đƣợc tính xác suất nào đó và nó đƣợc gán vào lớp mà xác suất thuộc vào lớp đó là lớn nhất.
Theo lý thuyết Bayes :
Gọi x là 1 vectorr phổ của 1 pixel đang xét. p(x,i) là xác suất để vectorr x thuộc lớp i. Nguyên tắc của Maximum Likelihood là :
x thuộc lớp i nếu : p(x,i) > p(x, j) với mọi j ≠ i.
Gọi p(x,i) là xác suất để với x cho trƣớc, lớp i chứa vectorr x. Gọi p(i) là xác suất để lớp i hiện hữu.
Theo định lý Bayes : p(i/x) = p(x/i) p(i) / p(x)
Do đó, điều kiện chọn lớp cho vectorr x trở thành : p(x,i) p(i)> p(x, j) p(j)
Khi đó điều kiện để ra quyết định là : x thuộc lớp i nếu Di(x) >Dj(x) với j ≠ i.
Phƣơng pháp phân loại này có nhiều ƣu việt xét theo quan điểm lý thuyết xác suất. Tuy vậy, khi sử dụng nó cần phải chú ý tới mấy điểm sau :
- Số lƣợng, mật độ và diện tích của các khu vực lấy mẫu phải đủ lớn và hợp lý để giá trị trung bình cũng nhƣ ma trận phƣơng sai - hiệp phƣơng sai tính cho một lớp nào đó có giá trị đúng với thực tế.
- Khi độ tƣơng quan giữa các kênh phổ gần nhau quá cao thì ma trận nghịch đảo của ma trận phƣơng sai - hiệp phƣơng sẽ không ổn định. Vì vậy, trong trƣờng hợp này cần áp dụng những phƣơng pháp làm giảm số kênh phổ nhƣ phƣơng pháp phân tích thành phần chính (Hồ Đình Duẩn, 2005).
Phân loại có kiểm định tiến hành trên các kênh ảnh phổ của ảnh Landsat và SPOT với độ phân giải không gian 80m, 30m, 20m và 10m. Nếu chỉ phân loại mà không sử dụng các kênh chỉ số thì chỉ bằng việc so sánh trực quan với ảnh tổ hợp màu ba kênh ảnh phổ tƣơng ứng mỗi date tác giả có thể thấy kết quả phân loại này không đạt yêu cầu. Vì khu vực Hà Nội có tính đa dạng về kiểu sử dụng đất, địa hình nên có rất nhiều pixel của các đối tƣợng khác nhau nhƣng lại có giá trị phản xạ phổ giống nhau. Tác giả đã tìm cách giảm thiểu sai lẫn này bằng việc sử dụng các kênh chỉ số khi phân loại.
Tuy nhiên, với ảnh đa phổ độ phân giải cao nhƣ SPOT 3 (20m) và SPOT 5 (10m), để giảm thiểu sự lẫn thì phƣơng pháp phân loại định hƣớng đối tƣợng rất thích hợp với đối tƣợng là đô thị. Quá trình phân loại dựa trên các kênh phổ chính của ảnh SPOT. Các đối tƣợng đƣợc xác định dựa trên các thông tin về đối tƣợng (ví dụ nhƣ về hình dạng, cấu trúc, kiến trúc và mối quan hệ của các đối tƣợng này với các đối tƣợng khác…). Hƣớng phân loại này cho kết quả chính xác cao và tránh đƣợc sự lẫn giữa các lớp phân loại so với phân loại theo xám độ.
Mối liên quan thể hiện thông tin hình ảnh theo đối tƣợng là hệ thống phân cấp (class hierarchy). Nhƣng ngƣợc lại mối quan hệ gần kề đƣợc đƣa ra một cách đầy đủ bởi cấu trúc dữ liệu raster. Tập hợp các đối tƣợng gần nhau phải đƣợc làm rõ, ƣu
điểm lớn của phƣơng pháp này là cho phép nhân rộng có hiệu quả của nhiều loại thông tin.
Mỗi một đối tƣợng tồn tại trong tự nhiên là một phần của thế giới thực đƣợc phản ánh dƣới dạng dữ liệu không gian. Việc phân loại theo đối tƣợng gắn liền với sự mô tả có hệ thống và có trật tự về các lớp đối tƣợng. Trật tự của hệ thống này đƣợc xác định theo các chức năng nhất định nhƣ mật độ lớp phủ, lớp sử dụng đất,... các yếu tố này lại đƣợc phản ánh bằng cấu trúc, định nghĩa về không gian.
Đặc trƣng của phân tích ảnh dựa trên đối tƣợng là các thông tin đƣợc lấy ra từ ảnh. Sự phản ánh của các đối tƣợng trên bề mặt đất đƣợc xác định bằng tính chất vật lý, hóa học của đối tƣợng đó và phụ thuộc vào đặc điểm thu nhận nhƣ độ phân giải phổ, độ phân giải không gian, khả năng đo cƣờng độ phản xạ từ đối tƣợng của đầu thu thiết bị. Đặc trƣng của đối tƣợng thế giới thực đƣợc phân biệt nhƣ sau:
- Các yếu tố bên trong: là đặc tính tự nhiên của đối tƣợng. Đây là yếu tố xác định về hình ảnh của đối tƣợng thực tế đƣợc thu nhận bởi bộ cảm biến của thiết bị thu nhƣ màu sắc, hình dạng, cấu trúc...
- Các yếu tố quan hệ: là đặc trƣng mô tả mối quan hệ địa lý giữa các đối tƣợng với nhau hoặc với toàn cảnh xung quanh, ví dụ nhƣ bên trái hay bên phải so với một đối tƣợng hay khu vực đã định sẵn trên ảnh.
- Các yếu tố ngữ cảnh: đây là đặc trƣng mô tả mối quan hệ ngữ nghĩa giữa các đối tƣợng. Ví dụ một khu đất trồng cây xanh xen kẽ với các vùng dân cƣ thì sẽ đƣợc nhận định là các công viên cây xanh khi xem xét mối quan hệ của nó với các vùng dân cƣ liền kề.
Phân loại theo đối tƣợng gắn liền với một sự mô tả có hệ thống và có trật tự về các lớp đối tƣợng. Quá trình phân loại là đăng ký một số đối tƣợng vào một lớp đối tƣợng nhất định dựa vào các mô tả mang tính chất định nghĩa của lớp đối tƣợng đó. Do vậy, sự mô tả của một lớp là mô tả về những nét đặc thù hoặc các điều kiện tạo nên lớp đó. Đối tƣợng sẽ đƣợc phân loại dựa theo những đặc trƣng chúng có hoặc không đƣợc phân loại khi so sánh các đặc trƣng điều kiện trên. Kết quả là mỗi đối tƣợng thuộc về một lớp nào đó hoặc không trong trƣờng hợp không đƣợc phân loại. Các lớp đối tƣợng này có liên hệ với nhau do đó bản thân mỗi đối tƣợng không chỉ
đƣợc biết trong một cách riêng biệt mà còn trong một ngữ cảnh chung trong đó xác định mối liên hệ của nó với các lớp đối tƣợng trên và dƣới nó. Nhƣ vậy, các đối tƣợng ảnh thu đƣợc sau khâu phân đoạn ở dạng thô sơ đơn giản nhất là cơ sở cho các bƣớc phân loại và quá trình phân cấp tiếp theo.
Để thực hiện đƣợc quá trình này cần đạt đƣợc các mục tiêu sau: - Thủ tục phân đoạn phải tạo ra những phần ảnh rõ ràng và riêng biệt.
- Với mỗi vấn đề nảy sinh trong quá trình phân tích ảnh liên quan đến kết cấu ở một tỷ lệ không gian ảnh nhất định, kích thƣớc trung bình của đối tƣợng ảnh phải thích hợp với tỷ lệ mong muốn.
- Phần lớn các đặc trƣng của đối tƣợng ảnh nhƣ tone ảnh, cấu trúc, hình dạng và mối quan hệ với các vùng kế cận phải ít nhiều liên quan đến tỷ lệ. Chỉ có cấu trúc của các tỷ lệ nhƣ nhau mới có thể so sánh hay có những đặc trƣng nhƣ nhau.
- Thủ tục phân đoạn cần phổ biến và có khả năng áp dụng cho nhiều loại dữ liệu khác nhau nhƣ ảnh hàng không, viễn thám, các dữ liệu chuyên đề khác nhau.
- Quá trình phân đoạn phải đạt đƣợc một tốc độ nhất định đáp ứng cho số lƣợng thông tin ngày càng nhiều và phức tạp mà các dữ liệu đầu vào chứa đựng.