.4 Tập điểm mẫu để xây dựng tập dữ liệu huấn luyện và dữ liệu kiểm thử

Một phần của tài liệu (LUẬN VĂN THẠC SĨ) Phân loại lớp phủ đô thị cho thủ đô Viên Chăn – Lào, sử dụng ảnh Composite Landsat-8002 (Trang 52)

Tập dữ liệu điểm mẫu này đƣợc lựa chọn ngẫu nhiên các điểm trên toàn bộ khu vực thủ đô Viêng Chăn - Lào và dựa trên quá trình thực địa tại đây đồng thời kiểm tra trên các ảnh có độ phân giải cao của Google Earth, tập điểm mẫu này đƣợc gán nhãn và phân chia vào 02 lớp tƣơng ứng nhƣ Bảng 3.4. Tổng số lƣợng các điểm trong dữ liệu huấn luyện và dữ liệu kiểm thử lần lƣợt là 6324 và 547 điểm, do tỉ lệ thực tế của lớp phủ đô thị so với toàn bộ diện tích thủ đô Viêng Chăn là khá nhỏ nên số lƣợng điểm đƣợc gán nhãn lớp Urban so với tổng số lƣợng điểm mẫu cũng chiếm tỉ lệ tƣơng đƣơng.

Dựa trên tọa độ của các tập dữ liệu điểm mẫu, giá trị các kênh ảnh của điểm ảnh trong các ảnh kết hợp (kết quả của phần 4 đã nêu ở trên) sẽ đƣợc ghi thành các file với định dạng CSV. Trong nghiên cứu này, mỗi ảnh đại diện sẽ cho 1 file CSV với định dạng cột và dòng, các cột tƣơng ứng với số kênh ảnh (bao gồm 7 kênh ảnh đƣợc sử dụng), mỗi dòng tƣơng ứng với một điểm ảnh, mỗi ô chứa dữ liệu các giá trị tại kênh tƣơng ứng của một điểm trong tập điểm mẫu. Các file này sẽ là tập dữ liệu huấn luyện và dữ liệu kiểm thử dùng trong quá trình phân loại lớp phủ sau đó.

3.5. Phân loại lớp phủ đô thị

Scikit-learn [32] là một thƣ viện học máy viết trên ngôn ngữ Python với các công cụ mạnh mẽ và giao diện dễ sử dụng, do đó nó rất hữu dụng trong việc xử lý các ảnh vệ tinh và nó có thể kết hợp với các thƣ viện xử lý ảnh khác nhƣ Numpy và GDAL. Thƣ viện này bao gồm các bộ phân lớp trong đó có cả XGBoost, ở phần thực nghiệm này, thƣ viện này đã đƣợc sử dụng lại (https://scikit-learn.org/) và thuật toán XGBoost đƣợc lựa chọn để phân loại các điểm ảnh thuộc lớp Urban và lớp Others và kết quả này đƣợc ghi ra file ảnh là bản đồ lớp phủ đô thị cho Viêng Chăn - Lào năm 2018.

3.6. Kết quả

3.6.1. Kết quả của quá trình kết hợp ảnh

Hình 3.5 Ảnh đại diện cho DOY 15 với tổ hợp màu giả đô thị (Kênh 7-6-4)

Hình 3.7 Ảnh đại diện cho DOY 135 với tổ hợp màu giả đô thị (Kênh 7-6-4)

Hình 3.9 Ảnh đại diện cho DOY 255 với tổ hợp màu giả đô thị (Kênh 7-6-4)

3.6.2. Kết quả của quá trình phân lớp

Hình 3.11 Bản đồ lớp phủ đô thị Viêng Chăn, năm 2018.

3.7. Đánh giá kết quả

Các ảnh kết hợp đƣợc giả màu đô thị đƣợc thể hiện nhƣ các hình 3.5, hình 3.6, hình 3.7, hình 3.8, hình 3.9 và hình 3.10). Có thể dễ dàng quan sát đƣợc rằng các ảnh này đã còn rất ít hoặc gần nhƣ không còn ảnh hƣởng bởi các đám mây. Các hình ảnh đƣợc hiển thị với tổ hợp màu giả đô thị làm nổi bật các khu vực đô thị, khu đông dân cƣ với các tông màu vàng sẫm hoặc có gam màu ánh hồng. Các yếu tố thủy văn đƣợc nhận biết rõ với màu đen hoặc xanh nƣớc biển (Blue). Các yếu tố có màu xanh lá (Green) là các khu vực rừng hoặc các vùng thực vật khác.

Hơn thế nữa, mỗi ảnh này hiển thị các thay đổi của khu vực Viêng Chăn qua các thời điểm trong năm. Riêng với các khu vực liên quan đến lớp đô thị (Urban) chiếm tỉ lệ khá nhỏ và có sự ổn định hơn các khu vực liên quan đến nông nghiệp và thực vật vì các khu vực này hầu nhƣ không bị ảnh hƣởng bởi yếu tố mùa vụ.

Sau quá trình phân lớp, kết quả phân lớp đƣợc thể hiện ở Ma trận nhầm lẫn nhƣ sau:

Dự đoán lớp Others Dự đoán lớp Urban Tổng số Đúng là lớp Others 486 12 498

Đúng là lớp Urban 5 44 49

Tổng số 491 56 547

Bảng 3.5. Kết quả phân loại lớp phủ đô thị Viêng Chăn năm 2018. - Xét lớp Urban recision ecall - Xét lớp Others recision ecall - Hệ số Kappa - Độ chính xác tổng thể

Kết quả phân loại lớp phủ dùng ảnh vệ tinh Landsat 8 cho khu vực Viêng Chăn cho kết quả hệ số Kappa và độ chính xác tổng thể . Dựa vào bản đồ lớp phủ đô thị Viêng Chăn 2018, diện tích lớp phủ đô thị là khoảng: 213.6km2, chiếm khoảng 5.5% diện tích toàn bộ khu vực, một tỉ lệ khá ít ỏi so với nhiều thành phố khác trên thế giới.

Trƣớc khi thực nghiệm theo phƣơng pháp kể trên, phƣơng pháp mà nhóm tác giả Mẫn Đức Chức, Nguyễn Thanh Thủy, Bùi Quang Hƣng, Kristofer Lasko và Nguyễn Thị Nhật Thanh đã thực hiện cho khu vực Hà Nội [17] đã đƣợc thực nghiệm lại. Tập ảnh Landsat 8 SR của khu vực Viêng Chăn đƣợc sử dụng là nguồn dữ liệu đầu vào, kết hợp với các chỉ số DOY, Year, Opacity, Distance to Cloud/Cloud Shadow Score để tạo các ảnh kết hợp đại diện cho TargetDOY. Sau đó, từ các tập điểm mẫu, tập dữ liệu huấn luyện và tập dữ liệu kiểm thử đƣợc xây dựng và thực hiện quá trình phân lớp sử dụng XGBoost. Ngoài ra, trong quá trình thực nghiệm, thuật toán SVM cũng đƣợc sử dụng thay thế XGBoost để đánh giá kết quả. Kết quả cuối cùng đƣợc tổng hợp nhƣ bảng 3.6:

PP

Urban Others

Kappa OA

Precision Recall F1

Score Precision Recall

F1 Score (1) 62% 67% 0.65 97% 96% 0.96 0.61 93.41% (2) 61% 69% 0.65 97% 96% 0.96 0.61 93.23% (3) 75% 88% 0.81 99% 97% 0.98 0.79 96.34% (4) 79% 90% 0.84 99% 98% 0.98 0.82 96.89% (1) Là phƣơng pháp kết hợp ảnh với các chỉ số DOY, Year, Opacity, Distance to

Cloud/Cloud Shadow Score và thuật toán phân lớp SVM

(2) Là phƣơng pháp kết hợp ảnh với các chỉ số DOY, Year, Opacity, Distance to Cloud/Cloud Shadow Score, NDVI Score và thuật toán phân lớp SVM

(3) Là phƣơng pháp kết hợp ảnh với các chỉ số DOY, Year, Opacity, Distance to Cloud/Cloud Shadow Score và thuật toán phân lớp XGBoost

(4) Là phƣơng pháp kết hợp ảnh với các chỉ số DOY, Year, Opacity, Distance to Cloud/Cloud Shadow Score, NDVI Score và thuật toán phân lớp XGBoost

Theo bảng tổng hợp 3.6, thuật toán phân lớp XGBoost cho kết quả vƣợt trội hơn so với thuật toán phân lớp SVM. Phƣơng pháp kết hợp ảnh với các chỉ số DOY, Year, Opacity, Distance to Cloud/Cloud Shadow Score, NDVI Score và thuật toán phân lớp XGBoost cũng cho kết quả cao hơn Phƣơng pháp kết hợp ảnh với các chỉ số DOY, Year, Opacity, Distance to Cloud/Cloud Shadow Score và thuật toán phân lớp XGBoost. Ngoài ra, thời gian xử lý của thuật toán phân lớp XGBoost cũng tỏ ra nhanh vƣợt trội so với thuật toán phân lớp SVM, trong quá trình thực nghiệm nay, với cùng máy tính xử lý, cùng tập dữ liệu, khoảng thời gian thuật toán SVM xử lý lâu hơn thời gian xử lý của XGBoost gần 6 lần. Chính vì vậy, thuật toán phân lớp XGBoost đƣợc lựa chọn cho việc xây dựng bản đồ lớp phủ đô thị cho thủ đô Viêng Chăn trong nghiên cứu này.

Dựa trên các phƣơng pháp đánh giá mức độ chính xác, các kết quả này cũng đã đảm bảo đƣợc độ tin cậy trong thống kê và có thể sử dụng kết quả việc phân loại lớp phủ đô thị cho Viêng Chăn - Lào năm 2018 và trong các phân tích biến động lớp phủ đô thị cho khu vực nghiên cứu này. Ngoài ra, so với phƣơng pháp ban đầu của nhóm tác giả, phƣơng pháp phân loại lớp phủ đô mới có kết hợp chỉ số NDVI đã có cải thiện kết quả phân lớp ở lớp đối tƣợng cần tập trung nghiên cứu là lớp phủ đô thị.

Hình 3.12. Bản đồ lớp phủ Viêng Chăn 1995

Hình 3.13. Bản đồ lớp phủ Viêng Chăn 2005

Nguồn ảnh: JAPAN INTERNATIONAL COOPERATION AGENCY (JICA) Dựa trên bản đồ phân loại lớp phủ Viêng Chăn các năm 1995, 2005 (hình 3.12 và hình 3.13) và bản đồ phân loại lớp phủ đô thị 2018 (hình 3.11), dễ dàng nhận thấy phần diện tích đô thị của Viêng Chăn tập trung chủ yếu ở 4 quận trung tâm của thành phố, nơi tập trung dân cƣ đông đúc nhất. Theo từng năm, phần lớp phủ đô thị cũng phát triển tăng thêm ở các quận trung tâm cũng nhƣ dọc theo các con sông lớn của thành phố, điều này phù hợp với tập tính sinh hoạt tự nhiên của ngƣời dân nơi đây, nơi chƣa có quá nhiều khu công nghiệp cũng nhƣ thành phố chƣa thực sự phát triển mạnh.

Theo thống kê, năm 1995, tỉ lệ diện tích đô thị chiếm khoảng 3% tổng diện tích thủ đô Viêng Chăn và tăng dần lên con số hơn 5% năm 2005. Ngoài ra, theo thống kê chính thức của Cục thống kê Lào, diện tích đô thị của Viêng Chăn năm 2017 là khoảng 276km2

, so với phần kết quả của nghiên cứu này là 213.6km2, sự khác biệt này là do trong nghiên cứu này chỉ coi các đối tƣợng mặt không thấm là đặc trƣng của đô thị (nhƣ đã trình bày ở chƣơng I), vẫn còn có đối tƣợng nằm trong diện tích đô thị nhƣng chƣa bóc tách đƣợc với các đối tƣợng khác, ví dụ nhƣ vƣờn hoặc khu đất trống trong khuôn viên gia đình ở các quận trung tâm, các đối tƣợng này có thể bị lẫn với các đối tƣợng là đất trống không sử dụng, v.v…

KẾT LUẬN

Với những đóng góp rất nhiều ý nghĩa trong thực tiễn, công nghệ viễn thám càng ngày càng thu hút đƣợc nhiều sự quan tâm của các nhà khoa học trên thế giới, đặc biệt là trong xử lý ảnh viễn thám và phân loại lớp phủ mặt đất. LULCC là một ứng dụng truyền thống trong viễn thám. Nhiều nghiên cứu LULCC đã đƣợc thực hiện ở nhiều nơi khác nhau trên Trái đất. Tuy nhiên LULCC sử dụng hình ảnh vệ tinh quang học rất dễ bị ảnh hƣởng bởi những tác động của mây.

Luận văn đã trình bày các khái niệm cơ bản của khoa học viễn thám, ảnh vệ tinh và các ứng dụng của nó trong những lĩnh vực khác nhau. Đặc biệt, luận văn đã trình bày các bƣớc thực hiện để thu thập các ảnh Landsat 8 từ kho dữ liệu ảnh của NASA thông qua GEE. Sau đó xử lý các ảnh vệ tinh, để tạo ra các bức ảnh kết hợp với những điểm ảnh tốt nhất, ít bị ảnh hƣởng bởi mây hoặc bóng mây.

Kết quả của quá trình xử lý ảnh là những bức Ảnh đại diện cho các TargetDOY trong năm. Từ các bức ảnh kết hợp ít mây này, kết hợp với tập dữ liệu điểm mẫu đã thực địa tại thủ đô Viêng Chăn - Lào, quá trình phân loại lớp phủ đô thị đƣợc thực hiện. Kết quả cuối cùng là bản đồ lớp phủ đô thị cho thủ đô Viêng Chăn - Lào năm 2018. Các phƣơng pháp đánh giá phân lớp cũng đã đƣợc thực hiện để đánh giá kết quả này, OA đạt đƣợc 97.07% cùng với hệ số Kappa là 0.82. Kết quả phân lớp cuối này đảm bảo độ tin cậy trong thống kê.

Đối với mỗi khu vực nghiên cứu, phƣơng pháp này xử lý tập ảnh vệ tinh đƣợc tổng hợp qua nhiều năm và việc chọn TargetDOY trải đều qua các thời điểm trong năm, đảm bảo cho việc thu thập đầy đủ các đặc trƣng địa hình của khu vực nghiên cứu thay đổi theo thời gian cùng với việc xử lý để lấy đƣợc các điểm ảnh tốt nhất, ít bị ô nhiễm, ít bị ảnh hƣởng bởi mây nên phƣơng pháp này hoàn toàn có thể áp dụng đƣợc cho các khu vực nghiên cứu khác nhau. Cộng thêm với việc thu thập đƣợc các ảnh vệ tinh mới nhất của khu vực nghiên cứu, ta có thể xây dựng đƣợc bản đồ lớp phủ đô thị mới nhất khu vực này một cách nhanh chóng và chính xác. Tổng hợp và phân tích các bản đồ lớp phủ đô thị qua các thời kỳ sẽ giúp các nhà phát

triển, các nhà hoạch định chính sách thấy đƣợc sự thay đổi trong việc sử dụng đất đô thị và có đƣợc hƣớng phát triển đúng đắn và hợp lý.

Bên cạnh đó, vẫn có những vấn đề còn tồn tại trong quá trình phân loại lớp phủ đô thị cho thủ đô Viêng Chăn - Lào. Thời tiết khí hậu ở Lào đƣợc chia làm 02 mùa rõ rệt là mùa mƣa và mùa khô. Mùa mƣa tại Lào diễn ra từ tháng 5 đến tháng 10 và đặc biệt trong các tháng 6, tháng 7 và tháng 8, thƣờng diễn ra mƣa rất lớn và gây ngập, đọng nƣớc ở nhiều nơi. Điều này có thể gây ra sự sai lệch đối với việc phân loại các điểm ảnh trong các ảnh vệ tinh thu thập đƣợc trong khoảng thời gian kể trên. Ngoài ra, do số liệu thống kê về Viêng Chăn đƣợc công bố là rất ít ỏi nên trong luận văn chƣa thể so sánh cụ thể kết quả ƣớc tính từ bản đồ lớp phủ đô thị đƣợc xây dựng với các kết quả đo đạc thực tế.

Trong tƣơng lai, tôi sẽ tìm kiếm thêm các số liệu thống kê về sự phát triển của Viêng Chăn để so sánh kết quả nghiên cứu và số liệu thống kê. Đồng thời, nghiên cứu thêm về các loại ảnh vệ tinh khác nhƣ: MODIS, Sentinel v.v… và nghiên cứu thêm về các chỉ số khác nhƣ Normalized Difference Water Index (NDWI), Normalized Difference Built-up Index (NDBI), Built-up Index (BU), Urban Index (UI), Index-based Built-up Index (IBI), v.v… để kết hợp các ảnh và chỉ số này trong quá trình tạo ảnh kết hợp và phân loại lớp phủ cho Viêng Chăn cũng nhƣ các khu vực nghiên cứu khác. Bên cạnh đó, việc nghiên cứu để xây dựng và kết hợp thêm các bộ phân lớp khác để kết quả phân lớp đƣợc nâng cao hơn cũng rất cần thiết.

TÀI LIỆU THAM KHẢO

[1] Canada Natural Resources, Fundamentals of Remote Sensing. .

[2] K. Hibbard et al., “Research priorities in land use and land-cover change for the Earth system and integrated assessment modelling §,” vol. 2128, no. July, pp. 2118-2128, 2010.

[3] “Thƣ viện học liệu mở Việt Nam.” [Online]. Available: https://voer.edu.vn. [4] Q. Weng, Urban Remote Sensing. Taylor & Francis Group, LLC, 2018.

[5] A. Schneider, M. A. Friedl, and D. Potere, “A new map of global urban extent from MODIS satellite data,” IOPScience, vol. 044003, 2009.

[6] N. Son, C. Chen, C. Chen, B. Thanh, and T. H. Vuong, “Assessment of urbanization and urban heat islands in Ho Chi Minh City , Vietnam using Landsat data,” Sustain. Cities Soc., 2017.

[7] S. Saksena et al., “Classifying and mapping the urban transition in Vietnam,”

Appl. Geogr., vol. 50, pp. 80-89, 2014.

[8] P. Taylor, H. M. Pham, and Y. Yamaguchi, “Urban growth and change analysis using remote sensing and spatial metrics from 1975 to 2003 for Hanoi , Vietnam,” Int. J. Remote Sens., no. 04 Apr 2011, pp. 37-41, 2011. [9] R. B. Smith, “Introduction to Remote Sensing of Environment ( RSE ),”

2002.

[10] E. Vermote, C. Justice, M. Claverie, and B. Franch, “Preliminary analysis of the performance of the Landsat 8/OLI land surface re flectance product,”

Remote Sens. Environ., vol. 185, pp. 46-56, 2016.

[11] N. Gorelick, M. Hancher, M. Dixon, S. Ilyushchenko, D. Thau, and R. Moore, “Google Earth Engine : Planetary-scale geospatial analysis for everyone,” Remote Sens. Environ., no. 2016, 2017.

[12] M. M. Median, “Seasonal Composite Landsat TM/ETM+ Images Using the Medoid (a Multi-Dimensional Median),” Remote Sens., pp. 6481-6500, 2013. [13] J. C. White et al., “Pixel-Based Image Compositing for Large-Area Dense

Time Series Applications and Science,” Can. J. Remote Sens., vol. 8992, pp. 192-212, 2014.

[14] D. P. Roy et al., “Web-enabled Landsat Data ( WELD ): Landsat ETM + composited mosaics of the conterminous United States,” Remote Sens.

Environ., vol. 114, no. 1, pp. 35-49, 2010.

[15] P. Potapov, S. Turubanova, and M. C. Hansen, “Regional-scale boreal forest cover and change mapping using Landsat data composites for European Russia,” Remote Sens. Environ., vol. 115, no. 2, pp. 548-561, 2011.

[16] P. Griffiths, P. Grif, S. Van Der Linden, T. Kuemmerle, and P. Hostert, “A Pixel-Based Landsat Compositing Algorithm for Large Area Land Cover Mapping A Pixel-Based Landsat Compositing Algorithm for Large Area Land Cover Mapping,” 2013.

[17] C. D. Man, T. T. Nguyen, H. Q. Bui, and K. Lasko, “Improvement of land- cover classification over frequently cloud-covered areas using Landsat 8 time-series composites and an ensemble of supervised classifiers,” Int. J.

Remote Sens., vol. 39, no. 4, pp. 1243-1255, 2018.

Một phần của tài liệu (LUẬN VĂN THẠC SĨ) Phân loại lớp phủ đô thị cho thủ đô Viên Chăn – Lào, sử dụng ảnh Composite Landsat-8002 (Trang 52)

Tải bản đầy đủ (PDF)

(66 trang)