Ứng dụng thuật toán PCA vào nghiên cứu phân bố vi nhựa trong nước mặt lục địa, sông Sài Gòn và sông Đồng Nai

MỤC LỤC

Ứng dụng thuật toán trên nền tảng ngôn ngữ R để nghiên cứu vi nhựa trong nước mặt lục địa, sông Sài Gòn và sông Đồng Nai

Phạm vi ứng dụng của phương pháp PCA trong bài nghiên cứu

Kết quả ph愃Ȁn tích tương quan đa biến và PCA c愃Āc đặc tính h椃nh dạng c甃ऀa vi nhựa trong môi trường nước sông Sài G漃n và sông Đồng Nai trên nền tảng R được thऀ. Tuy nhiên, nghiên cứu này chỉ lựa chọn 2 thành phần chính đầu tiên v椃 tổng 2 thành phần này đã giải thích được toàn bộ 80,4% tập dữ liệu yêu cầu (tổng giải thích phương sai hai thành phần chính lớn hơn 50%). H椃nh 5e cho thĀy gần như c愃Āc h椃nh d愃Āng vi nhựa trong c愃Āc điऀm khảo s愃Āt trên sông Sài G漃n và sông Đồng Nai đều có liên quan đến thành phần chính đầu tiên.

C愃Āc hạt dạng sợi, hạt và bị ph愃Ȁn mảnh là c愃Āc loại vi nhựa chính được t椃m thĀy trong nước bề mặt lưu vực sông trong cả hai mùa, vào lúc triều lên và xuĀng trong ngày. C愃Āc vi nhựa dạng sợi, mảnh và bị ph愃Ȁn mảnh là c愃Āc loại vi nhựa chính được t椃m thĀy trong nước bề mặt lưu vực sông vào lúc triều lên và xuĀng trong ngày, trong cả hai mùa, đặc biệt là vào mùa khô. Trong H椃nh 6e, vi nhựa trong triều lên và triều xuĀng c甃ऀa mùa khô và vào lúc triều lên c甃ऀa mùa mưa đều chịu ảnh hưởng nhiều bởi PC1 (giải thích được 65,3% phương sai) trong khoản gi愃Ā trị PC1 là từ -2 đến 2 (cụm elip x愃Ām, đỏ và cam) và vi nhựa c愃Āc h椃nh d愃Āng c漃n lại xuĀt hiện trong mùa mưa lúc triều xuĀng chịu ảnh hưởng chính bởi PC2 (giải thích được 19,1%. phương sai), có cụm elip màu xanh l愃Ā.

Ngoài ra, kết quả ph愃Ȁn tích PCA cho thĀy lưu vực sông Sài G漃n và sông Đồng Nai bị ảnh hưởng bởi c愃Āc dạng vi nhựa sợi, mảnh nhiều hơn trong cả hai mùa c甃ऀa n愃؀m 2022.

Hình 5c: Biऀu đồ Scree plot thऀ hiện phần  trăm phư漃ᬀng sai mà các thành phần ch椃Ānh gi愃ऀi th椃Āch bộ dữ liệu
Hình 5c: Biऀu đồ Scree plot thऀ hiện phần trăm phư漃ᬀng sai mà các thành phần ch椃Ānh gi愃ऀi th椃Āch bộ dữ liệu

Kết quả và ứng dụng

Gần như c愃Āc h椃nh d愃Āng vi nhựa trong c愃Āc điऀm khảo s愃Āt trên sông Sài G漃n, sông Đồng Nai đề có liên quan đến thành phần chính đầu tiên (dạng sợi, mảnh). C愃Āc vi nhựa bị ph愃Ȁn rã dạng hạt có liên quan đến thành phần chính thứ hai. Hàm lượng vi nhựa dạng sợi từ c愃Āc nguồn ph愃Āt sinh ảnh hưởng lưu vực c愃Āc sông rĀt cao.

Những biऀu đồ này cung cĀp c愃Āc đặc điऀm c甃ऀa h椃nh d愃Āng vi nhựa trong nước giúp c愃Āc nhà khoa học, c愃Āc cơ quan địa phương cần có sự chú trọng trong nguồn gĀc làm ph愃Āt sinh vi nhựa dạng này đऀ có sự kiऀm so愃Āt và quản l礃Ā kịp thời. Phương ph愃Āp x愃Ȁy dựng thuật to愃Ān giảm chiều dữ liệu trên R dự đo愃Ān khuynh hướng đặc điऀm h椃nh dạng c甃ऀa vi nhựa trong nước mặt lục địa sông Sài G漃n và sông Đồng Nai đã giải quyết được nhu cầu về một công cụ đ愃Ānh gi愃Ā với độ tin cậy cao, xử l礃Ā được vĀn đề đa cộng tuyến trong dữ liệu thực nghiệm, xử l礃Ā được thư viện dữ liệu lớn và hoàn toàn tr愃Ānh được chi phí tài chính cho bản quyền từ c愃Āc phần mềm được b愃Ān sẵn trên thị trường. Ngoài ra, phương ph愃Āp này có thऀ được lập tr椃nh c愃Āc hàm đồ họa, đưa ra c愃Āc h椃nh ảnh, biऀu đồ hiऀn thị phong phỳ, giải thớch rừ ràng c愃Āc nội dung mà c愃Āc nhà chuyên môn môi trường, c愃Āc nhà nghiên cứu vi nhựa có thऀ luận giải được trong kh愃Ām ph愃Ā dữ liệu nghiên cứu vi nhựa.

Đánh giá chất lượng sinh thái cho tỉnh Thanh Hóa trong năm 2021 dựa vào chỉ số sinh thái viễn thám (RSEI)

Phạm vi ứng dụng của phương pháp phân tích thành phần chính PCA trong nghiên cứu

Phương ph愃Āp ph愃Ȁn tích thành phần chính PCA được 愃Āp dụng trong nghiên cứu nhằm lựa chọn trọng sĀ phù hợp cho c愃Āc tiêu chí đ愃Ānh gi愃Ā (NDVI (chỉ sĀ xanh);. X愃Ȁy dựng ma trận chuẩn hóa bằng c愃Āch mang tĀt cả c愃Āc gi愃Ā trị đo được c甃ऀa mỗi cột (mỗi thông sĀ) trừ đi gi愃Ā trị trung b椃nh từng cột. Bước 3: X愃Ȁy dựng ma trận hiệp phương sai hoặc ma trận tương quan theo công thức.

Cov φij: Hiệp phương sai giữa tính chĀt i và tính chĀt j Ma trận tương quan. Bước 5: Chọn K vector riêng ứng với (λ) gi愃Ā trị riêng lớn nhĀt đऀ x愃Ȁy dựng ma trận Uk, với c愃Āc thành phần chính, tạo thành một không gian con gần với ph愃Ȁn bĀ c甃ऀa dữ liệu ban đầu đã chuẩn hóa.

Bảng 7: Mức đánh giá theo chỉ số RSEI
Bảng 7: Mức đánh giá theo chỉ số RSEI

Kết quả

Bằng c愃Āch tính to愃Ān chỉ sĀ sinh th愃Āi môi trường (RSEI) c甃ऀa bĀn chỉ sĀ NDVI, WET, TVDI, và TEM vào n愃؀m 2021 tại tỉnh Thanh Ho愃Ā, kết hợp sử dụng mô h椃nh ph愃Ȁn tích thành chính (PCA), chĀt lượng sinh th愃Āi dưới t愃Āc động c甃ऀa hoạt động ph愃Āt triऀn kinh tế - xã hội đã được ph愃Ȁn tích. C愃Āc khu vực có chĀt lượng sinh th愃Āi k攃Ām hầu hết là c愃Āc khu vực có nền kinh tế ph愃Āt triऀn cao, đĀt x愃Ȁy dựng đô thị hóa lớn, không gian c愃Ȁy xanh hạn chế và c愃Āc hoạt động kinh tế c甃ऀa con người diễn ra thường xuyên. C愃Āc khu vực chĀt lượng sinh th愃Āi tĀt ch甃ऀ yếu ở c愃Āc huyện miền núi nơi có ít hoạt động kinh tế, địa h椃nh bao ph甃ऀ nhiều c愃Ȁy xanh, mật độ d愃Ȁn sĀ nhỏ như Mường L愃Āt, Quan Sơn, Quan Hóa.

ChĀt lượng sinh th愃Āi thĀp tập trung ở những vùng có hoạt động ph愃Āt triऀn kinh tế, du lịch, nhiều công tr椃nh công cộng được x愃Ȁy dựng thay thế cho diện tích c愃Ȁy trồng, nhằm mục đích phục vụ cho người d愃Ȁn với mật độ tập trung ngày càng đông ở thành phĀ. C愃Āc khu vực chĀt lượng sinh th愃Āi tĀt ch甃ऀ yếu ở c愃Āc huyện miền núi nơi có ít hoạt động kinh tế, địa h椃nh bao ph甃ऀ nhiều c愃Ȁy xanh, mật độ d愃Ȁn sĀ nhỏ như Mường L愃Āt, Quan Sơn, Quan Hóa. Trong nghiên cứu này, tính dễ bị tổn thương sinh th愃Āi c甃ऀa tỉnh Thanh Ho愃Ā được đ愃Ānh gi愃Ā kh愃Āch quan thông qua mô h椃nh to愃Ān (PCA) và tài liệu viễn th愃Ām đऀ ph愃Ȁn tích mĀi liên hệ giữa c愃Āc yếu tĀ t愃Āc động như tỷ lệ che ph甃ऀ, nhiệt độ, độ ẩm, mức độ.

Bài nghiên cứu không chỉ cung cĀp thông tin về hiện trạng chĀt lượng sinh th愃Āi c甃ऀa vùng mà c漃n là cơ sở tài liệu giúp chính quyền địa phương đưa ra kế hoạch ph愃Āt triऀn kinh tế c甃ऀa tỉnh một c愃Āch bền vững, đảm bảo c愃Ȁn bằng giữa ph愃Āt triऀn kinh tế và duy tr椃 tĀt chĀt lượng sinh th愃Āi c甃ऀa vùng.

Hình 7: B愃ऀn đồ 4 chỉ số NDVI, WET, TVDI, TEM
Hình 7: B愃ऀn đồ 4 chỉ số NDVI, WET, TVDI, TEM

SỬ DỤNG BỘ DỮ LIỆU ĐỂ PHÂN TÍCH BẰNG PHẦN MỀM R I. Giới thiệu mẫu nghiên cứu

  • Phân tích thành phần chính (PCA) 1. Bước 1: Lựa chọn biến phân tích

    Mục đích: xem x攃Āt hệ sĀ tương quan giữa 2 biến nhằm loại bỏ sự t愃Āc động bên ngoài c甃ऀa c愃Āc biến đưa vào. Gi愃Ā trị tổng phương sai mô tả độ ph愃Ȁn t愃Ān chung c甃ऀa c愃Āc biến ng̀u nhiên quanh c愃Āc gi愃Ā trị trung b椃nh c甃ऀa chúng. (Communality) c甃ऀa từng biến cho biết bao nhiêu phần tr愃؀m biến thiên c甃ऀa biến đó được giải thích bởi hai thành phần chính được giữ lại.

    Communality c甃ऀa biến generation rĀt thĀp (0.07<0.3) tức là biến generation ít được giải thích bởi 2 PC đã chọn. Đường kẻ đỏ là mức đóng góp trung b椃nh do đó nếu cột c甃ऀa biến nào cao hơn đường kẻ th椃 biến đó thuộc thành phần chính đó. Mục đích c甃ऀa việc chuyऀn dữ liệu sang không gian mới là x愃Āc định tọa độ c甃ऀa c愃Āc quan s愃Āt ban đầu trong không gian mới c甃ऀa 2 thành phần chính.

    Ở h椃nh 6, khi ph愃Ȁn loại theo biến Generation c甃̀ng có thऀ thĀy c愃Āc phạm vi c愃Āc đường tr漃n kh愃Ā tương đồng nhau, không có sự kh愃Āc biệt lớn khi ph愃Ȁn loại theo thế hệ (việc loại bỏ. Qua ph愃Ȁn tích bộ dữ liệu “Pokemon.csv” ứng dụng phương ph愃Āp ph愃Ȁn tích thành phần chính (PCA), nhóm ph愃Ȁn chia được chỉ sĀ đ愃Ānh gi愃Ā sức mạnh Pok攃Āmon thành 2 nhóm chính: PC1: Battle_Stats (chỉ sĀ tĀn công); PC2: Self-Protection (chỉ sĀ tự. ph漃ng vệ). Đ愃Ȁy được coi như bước tiền xử l礃Ā dữ liệu cho c愃Āc phương ph愃Āp ph愃Ȁn tích hồi quy bội và ph愃Ȁn tích cụm dữ liệu sau này.

    Bảng 10: Ma trận hệ số tương quan sau khi chuẩn hóa
    Bảng 10: Ma trận hệ số tương quan sau khi chuẩn hóa