Khái quát về địa hóa môi trường biển Việt Nam và giải pháp phân lớp
Địa hóa môi trường biển
1.1.1 Một số khái niệm cơ bản trong môi trường biển [3, 4, 5] a) Khái niệm về môi trường biển
Môi trường tự nhiên là sự kết hợp của các yếu tố khí hậu, sinh thái học, hóa học và thổ nhưỡng, ảnh hưởng đến con người và các sinh vật khác, quyết định hình thức sinh tồn của chúng Do đó, môi trường bao gồm tất cả các yếu tố có tác động trực tiếp đến sự trao đổi chất và hành vi của con người cũng như các loài sống, như ánh sáng, không khí, nước, đất và các sinh vật khác.
Môi trường biển bao gồm các yếu tố vật lý, hóa học và sinh học đặc trưng cho nước biển, đất ven biển, trầm tích dưới biển, không khí trên mặt biển và các hệ sinh thái biển Những yếu tố này tồn tại khách quan và có ảnh hưởng sâu sắc đến con người cũng như các sinh vật sống trong môi trường biển.
Môi trường biển bao gồm tất cả các yếu tố ảnh hưởng đến sự trao đổi chất và hành vi của con người cũng như sinh vật biển Những yếu tố này bao gồm ánh sáng, không khí, nước biển, đất ven biển, trầm tích dưới đáy biển và các sinh vật sống trong môi trường biển.
Thành phần môi trường biển bao gồm các yếu tố vật chất như nước biển, đất ven biển, trầm tích dưới đáy biển, không khí, âm thanh, ánh sáng, sinh vật biển, và các hệ sinh thái biển Những yếu tố này tạo nên đặc trưng cho nước biển ven bờ, góp phần vào sự đa dạng sinh học và sự cân bằng của hệ sinh thái biển.
Hàm lượng TSS (Total Suspended Solid) trong nước là tổng chất rắn lơ lửng, được xác định bằng cách cân trọng lượng các chất còn lại trên giấy lọc sau khi phân tích chất rắn hòa tan TSS thể hiện lượng vật chất không hòa tan trong nước và được đo bằng miligam trên lít (mg/l).
Nhu cầu ôxy hoá học (COD) là lượng oxy trong Kali bicromat (K2Cr2O7) được sử dụng để oxy hoá chất hữu cơ trong nước Chỉ số COD được áp dụng rộng rãi để đo gián tiếp khối lượng các hợp chất hữu cơ có trong nước, chủ yếu để xác định khối lượng chất ô nhiễm hữu cơ trong nước bề mặt như sông và hồ Do đó, COD trở thành một phép đo quan trọng về chất lượng nước, được biểu diễn bằng đơn vị mg/l, cho biết khối lượng oxy cần tiêu hao trên mỗi lít dung dịch.
Nhu cầu ôxy sinh học (BOD - Biochemical Oxygen Demand) là lượng ôxy cần thiết để vi sinh vật oxy hóa các chất hữu cơ trong nước BOD không chỉ là chỉ số mà còn là quy trình giúp xác định tốc độ tiêu thụ ôxy của sinh vật trong môi trường nước Chỉ số BOD được áp dụng rộng rãi trong quản lý và khảo sát chất lượng nước, đồng thời có vai trò quan trọng trong lĩnh vực sinh thái học và khoa học môi trường.
Chỉ tiêu BOD là chỉ số quan trọng để đánh giá mức độ ô nhiễm hữu cơ trong nước thải hoặc nguồn nước Khi giá trị BOD tăng cao, điều này cho thấy mức độ ô nhiễm của nước thải hoặc nguồn nước cũng gia tăng tương ứng Ngược lại, chỉ số BOD thấp cho thấy nước ít bị ô nhiễm hơn.
Hàm lượng Amôni (N-NH4) là hàm lượng nitơ amoni, đơn vị tính là mg/l
Tổng coliform (ngắn go ̣n là Coliforms) là số lượng coliform được biểu diễn bằng số khả hữu MPN (Most Probable Number)
Tổng coliform là số lượng vi khuẩn dạng coli có khả năng lên men sinh hơi đường lactose trong 100ml nước thải, được xác định ở nhiệt độ 37°C trong khoảng thời gian 24-48 giờ trong điều kiện hiếu khí, tính bằng MPN/100ml Các giống coliform bao gồm E.coli, Citrobacter, Enterobacter và Klebsiela Chúng được coi là chỉ điểm vi sinh vật quan trọng để đánh giá chất lượng nước.
Hàm lượng xyanua được định nghĩa là số miligram (mg) xyanua có trong một mili lít (ml) nước Xyanua, ký hiệu là CN, bao gồm các nhóm CN từ các hợp chất có chứa ion xyanua hoặc axit hidroxyanic, không bao gồm nitril đơn (R-CN), xyanat (muối của CN), cũng như các ion thioxyanat và xyan clorua.
Hàm lượng các kim loại nặng: số mg ion kim loại trong 1 ml nước c) Ô nhiễm môi trường biển
Ô nhiễm môi trường biển là sự thay đổi không phù hợp của các thành phần nước và trầm tích biển, vi phạm các Quy chuẩn kỹ thuật quốc gia về Môi trường, dẫn đến tác động tiêu cực đến sức khỏe con người và các sinh vật biển.
Hội nghị Liên hợp quốc về môi trường tại Stockholm, Thụy Điển năm 1972 đã định nghĩa ô nhiễm môi trường biển là tất cả các chất hoặc năng lượng do con người đưa vào môi trường biển, bao gồm cả các vùng cửa sông Ô nhiễm này gây ra nhiều hậu quả nghiêm trọng như thiệt hại tài nguyên sinh vật, ảnh hưởng đến sức khỏe con người, cản trở các hoạt động trên biển, bao gồm cả đánh bắt cá, và làm suy giảm chất lượng cũng như các tính chất hữu ích của nước biển.
(2) Các nguyên nhân chính dẫn đến ô nhiễm môi trường biển
Môi trường biển đang đối mặt với ô nhiễm do nhiều nguyên nhân khác nhau, trong đó nguyên nhân chính là sự gia tăng nồng độ chất dinh dưỡng Các chất dinh dưỡng này thường xuất phát từ lục địa, bao gồm chất thải sinh hoạt và nước thải từ các hoạt động sản xuất công nghiệp, nông nghiệp được đưa ra biển Ngoài ra, ô nhiễm cũng đến từ các hoạt động trên biển, với nước thải từ khu dân cư, đô thị, làng nghề và tàu du lịch thường không được xử lý trước khi thải ra biển.
Môi trường biển Việt Nam hiện đang đối mặt với tình trạng ô nhiễm và suy thoái nghiêm trọng Báo cáo hiện trạng môi trường năm 2003 và 2010 cho thấy chất lượng môi trường biển và vùng ven bờ tiếp tục xấu đi, với ô nhiễm từ dầu, kẽm và chất thải sinh hoạt Các chất rắn lơ lửng như Si, NO3, NH4 và PO4 cũng đang ở mức đáng lo ngại Đặc biệt, chất lượng trầm tích đáy biển ven bờ - nơi cư trú của nhiều loài thủy hải sản - cũng bị ảnh hưởng nghiêm trọng Những nguyên nhân chính dẫn đến tình trạng ô nhiễm này cần được xác định và giải quyết kịp thời.
Các nguồn ô nhiễm từ lục địa như dầu thải, nước thải chưa xử lý, hóa chất, thuốc trừ sâu, phân bón và chất thải công nghiệp, nông nghiệp đã dẫn đến ô nhiễm môi trường biển Những chất không phân hủy sẽ tích tụ ở ven bờ hoặc chìm xuống đáy biển, trong khi các chất có khả năng phân hủy sẽ hòa tan trong nước biển, gây ảnh hưởng nghiêm trọng đến hệ sinh thái biển.
Tầm quan trọng của việc phân lớp địa hóa môi trường biển
Môi trường biển hiện đang chịu sự quan tâm lớn từ cộng đồng do tác động nghiêm trọng từ hoạt động của con người và biến đổi tự nhiên Những ảnh hưởng này đã dẫn đến nhiều thách thức mà nhân loại phải đối mặt, đặc biệt là ô nhiễm trầm tích biển Nếu không được đánh giá kịp thời, ô nhiễm này sẽ trở thành mối nguy hại lâu dài cho chất lượng môi trường biển Do đó, việc đánh giá và phân loại chất lượng trầm tích biển là cần thiết để phát triển các chiến lược và biện pháp bảo vệ, giảm thiểu ô nhiễm môi trường.
Chất lượng môi trường biển đang suy giảm, dẫn đến sự phá hủy môi trường sống tự nhiên và tổn thất lớn về đa dạng sinh học ven bờ Số lượng loài hải sản giảm đáng kể, với khoảng 85 loài đang trong tình trạng nguy cấp, nhiều loài vẫn bị khai thác mạnh mẽ, và hơn 70 loài đã được đưa vào sách đỏ Việt Nam Việc đánh giá và phân loại chất lượng trầm tích biển là cần thiết để hỗ trợ các tổ chức, cơ quan và cộng đồng trong việc hoạch định chiến lược phát triển kinh tế bền vững trên biển, nhằm nâng cao hiệu quả khai thác tài nguyên.
Khái niệm phát triển bền vững, được đưa ra bởi Ủy ban Môi trường và Phát triển Thế giới (WCED) từ năm 1987, không chỉ đảm bảo sự phát triển kinh tế mà còn chú trọng đến việc bảo vệ môi trường và cải thiện chất lượng cuộc sống cho các thế hệ tương lai.
Từ năm 1987, khái niệm phát triển bền vững đã được diễn đạt qua nhiều cách khác nhau Mặc dù có nhiều cách hiểu, nhưng hầu hết mọi người đều đồng thuận rằng phát triển bền vững là sự cân bằng giữa mục tiêu tăng trưởng kinh tế, mục tiêu xã hội và bảo vệ môi trường Ngoài ra, phát triển bền vững còn bao gồm việc quản lý hiệu quả các xung đột lợi ích phát sinh trong quá trình phát triển.
Hình 2.Mô hình bảo đảm phát triển bền vững
Phân loại địa hóa môi trường đóng vai trò quan trọng trong việc bảo vệ môi trường, thông qua việc đánh giá, dự báo và cảnh báo về chất lượng môi trường biển Điều này giúp đưa ra những điều chỉnh hợp lý, kịp thời và đúng hướng trong quá trình phát triển kinh tế.
- xã hội một cách hài hoà với bảo vệ môi trường nhằm phát triển bền vững.
Bài toán đánh giá địa hóa môi trường biển
1.3.1 Các đặc trưng của địa hóa môi trường biển Để đánh giá địa hóa môi trường biển cần dựa trên các thông số liên quan đến việc đánh giá các thông số về trầm tích biển hay nói cách khác là các đặc trưng của địa hóa môi trường biển
Trong nghiên cứu này, chúng tôi tập trung vào các đặc trưng quan trọng của trầm tích biển ven bờ, bao gồm hàm lượng dầu, chỉ số CN- và hàm lượng kim loại nặng như Pb, Zn, As, Cd, Hg.
Đánh giá các đặc trưng địa hóa môi trường biển dựa trên tiêu chuẩn tham khảo của Trung Quốc Mỗi thông số riêng biệt đều có quy định tiêu chuẩn chất lượng trầm tích biển cụ thể, cho phép phân loại các đặc trưng địa hóa thành các nhóm riêng biệt.
1.3.2 Quan trắc địa hóa môi trường biển [4]
Việc xác định các thông số chất lượng trầm tích biển, bao gồm hàm lượng dầu, CN-, và kim loại nặng như Cu, Pb, Zn, As, được thực hiện thông qua kết quả đo từ các trạm quan trắc môi trường biển tại Việt Nam Tính đến giữa năm 2010, cả nước đã có 42 địa phương thành lập Trung tâm quan trắc môi trường, góp phần nâng cao hiệu quả giám sát chất lượng môi trường biển.
Trung tâm thực hiện chương trình quan trắc môi trường với hàng nghìn điểm, bao gồm nước mặt lục địa, nước mưa, nước biển, không khí, tiếng ồn, phóng xạ, đất và chất thải rắn Tập trung vào các điểm nóng về môi trường và các khu vực sinh thái nhạy cảm, trung tâm đảm bảo theo dõi tình hình môi trường tại hầu hết các địa phương trên cả nước Hệ thống quan trắc môi trường biển cũng được chú trọng trong các hoạt động này.
Mạng lưới quan trắc môi trường biển, do Tổng cục Bảo vệ Môi trường thuộc Bộ Tài nguyên và Môi trường điều hành, đã tiến hành quan trắc chất lượng nước và trầm tích tại 7 điểm miền Bắc, 8 điểm miền Trung, 7 điểm miền Nam và 104 điểm biển khơi từ năm 1995 đến nay Các điểm quan trắc bao gồm Trà Cổ, Cửa Lục, Đồ Sơn, Ba Lạt, Sầm Sơn, Cửa Lò, Bạch Long Vĩ ở miền Bắc; Đèo Ngang, Cồn Cỏ, Đồng Hới, Thuận An, Đà Nẵng, Dung Quất, Sa Huỳnh, Quy Nhơn ở miền Trung; Nha Trang, Phan Thiết, Phú Quý, Vũng Tàu, Định An, Cà Mau, Rạch Giá ở miền Nam; cùng với 87 điểm biển khơi Đông Nam và 17 điểm biển khơi Tây Nam Bộ và Côn Sơn.
Các trạm ven bờ được theo dõi 4 lần mỗi năm, trong khi các trạm ngoài khơi được quan trắc 2 lần mỗi năm Quy trình này sử dụng các thông số, phương pháp lấy mẫu và phân tích mẫu đồng nhất, đồng thời thực hiện chương trình đảm bảo và kiểm soát chất lượng.
Bảng 1 Thông số quan trắc và đơn vị đo
STT Thông số quan trắc Đơn vị đo
Khí tượng thủy văn Đặc điểm thủy văn
Tốc độ Cm/s Đặc điểm thời tiết
STT Thông số quan trắc Đơn vị đo
5 Trạng thái mặt biển Cấp
Nước biển Thủy lý – Thủy hóa
Hàm lượng muối dinh dưỡng
STT Thông số quan trắc Đơn vị đo
Sinh vật biển Thực vật phù du
28 Mật độ cá thể tế bào/m 3
29 Khối lượng mg/l Động vật phù du
32 Mật độ cá thể con/m 3
Trong luận văn này, chúng tôi tập trung vào các thông số quan trọng như hàm lượng dầu trong trầm tích, nồng độ CN-, và các chỉ số kim loại nặng bao gồm Pb, Zn, As, Hg, cùng với dữ liệu địa hóa từ quan trắc môi trường biển.
Dưới đây là một bảng đo kết quả trầm tích của một vùng biển miền Trung
Bảng 2 Bảng mẫu kết quả đo chất lượng trầm tích của một vùng biển miền Trung
BIỂU GHI KẾT QUẢ PHÂN TÍCH CHẤT LƯỢNG TRẦM TÍCH
Trạm QT&PTMT: vùng ven biển 2 - Miền Trung
Vị trí quan trắc Biển ven bờ Miền Trung
Vĩ độ Đặc điểm nơi quan trắc Biển ven bờ Miền Trung Độ sâu 10 - 20m
Người quan trắc Nguyễn Quang Hưng
Ngày hoàn thành phân tích
Người kiểm tra Nguyễn Vũ Tưởng
BIỂU GHI KẾT QUẢ PHÂN TÍCH CHẤT LƯỢNG TRẦM TÍCH
Nhiệt độ 0 C Độ ẩm % pH
Dầu trong trầm tích mg/l 69 1128.33 522 458 1222 1195.67 266.67 74.67
Dư lượng thuốc BVTV trong trầm tích
1: Đèo Ngang 3: Cồn Cỏ 5: Đà Nẵng 7: Sa Huỳnh
Kết quả đo tại 8 điểm ven biển miền Trung đã được thực hiện bằng các thiết bị chuyên dụng cho đo đạc tại hiện trường, như đã đề cập ở phần trước.
Mô hình giải quyết bài toán bài toán đánh giá địa hóa môi trường biển Việt nam dựa trên các phương pháp phân lớp
Nghiên cứu giải pháp phân lớp địa hóa môi trường biển Việt nam
2.1.1 Giới thiệu bài toán phân lớp và một số phương pháp điển hình
Phân lớp là mối quan tâm hàng đầu trong việc làm việc với tập hợp đối tượng, giúp sắp xếp và tìm kiếm chúng dễ dàng hơn Khi đưa đối tượng vào hệ thống thông tin, tính chất lớp của đối tượng thường được thể hiện qua thuộc tính "lớp" riêng biệt.
Phân lớp dữ liệu là một kỹ thuật quan trọng trong học máy, sử dụng tập huấn luyện có chứa dữ liệu với nhãn lớp để phân loại các dữ liệu mới.
Một số thuật toán được sử dụng trong phân lớp như:
- K người láng giềng gần nhất (K – Nearst neighbours);
- Cây quyết định (Decision Tree);
Trong khuôn khổ đề tài, chỉ tập trung tìm hiểu và cài đặt 2 thuật toán dùng trong phân lớp là: Naive Bayes và SVM
Thuật toán phân lớp Naive Bayes được ưa chuộng nhờ vào tính đơn giản, tốc độ thực hiện nhanh, khả năng cập nhật dữ liệu huấn luyện dễ dàng và tính độc lập cao với tập huấn luyện Đây là một trong những thuật toán phân lớp tiêu biểu trong học máy và khai phá dữ liệu, thường được sử dụng làm chuẩn để so sánh với các thuật toán khác.
Thuật toán SVM được ưa chuộng nhờ vào nền tảng lý thuyết vững chắc và nhiều nghiên cứu đã chỉ ra hiệu suất cao của nó trong các bài toán phân loại.
Việc phân lớp địa hóa môi trường biển đóng vai trò quan trọng trong việc đánh giá, bảo vệ và ngăn chặn ô nhiễm môi trường biển Hiện tại, Việt Nam chưa có quy chuẩn kỹ thuật quốc gia về chất lượng trầm tích biển, dẫn đến việc đánh giá thường dựa vào tiêu chuẩn tham khảo từ Trung Quốc và Canada Trong nghiên cứu này, dữ liệu quan trắc sẽ được đánh giá theo tiêu chuẩn của Trung Quốc cho kim loại nặng và hóa chất bảo vệ thực vật, với ba mức độ phân loại cụ thể.
Phân lớp địa hóa môi trường được thực hiện dựa trên ba mức độ tiêu chuẩn, cho phép chia thành ba lớp khác nhau Việc xác định một điểm hoặc vùng vào lớp nào dựa vào các thông số liên quan, bao gồm hàm lượng dầu, xyanua và kim loại nặng như Pb, Zn, As trong trầm tích biển ven bờ.
2.1.2 Thuật toán phân lớp Bayes
Thuật toán phân lớp Bayes là một trong những phương pháp điển hình và phổ biến nhất trong học máy và khai phá dữ liệu, đặc biệt trong lĩnh vực phân lớp văn bản Học máy Bayes thường được sử dụng làm chuẩn mực để so sánh với các thuật toán khác trong lĩnh vực này Công thức xác suất có điều kiện là một phần quan trọng trong việc áp dụng thuật toán này.
Xác suất điều kiện của biến cố A với điều kiện biến cố B đã xảy ra là một số không âm
Ký hiệu P(A/B) thể hiện xác suất xảy ra biến cố A khi biến cố B đã xảy ra, trong khi P(B/A) biểu thị xác suất xảy ra biến cố B khi biến cố A đã xảy ra.
Công thức xác suất có điều kiê ̣n Bayes :
P(A/B) P(B) = P(B/A) P(A) = P(AB) b) Công thức xác suất đầy đủ
Giả sử B1, B2, … Bn là mô ̣t nhóm đầy đủ các biến cố Khi đó:
P(A) = ∑ P(B i )*P(A/B i ) c) Công thức xác suất Bayes
Từ các công thức ở trên ta có công thức xác suất Bayes:
P(B k /A) = (P(AB k ))/(P(A)) = (P(B k )*P(A/B k ) )/(ΣP(B i )*P(A/Bi i ) d) Phân lớp Naive Bayes
Phân lớp Naive Bayes là một phương pháp phân loại dựa trên xác suất đã được huấn luyện, thích hợp cho các bài toán yêu cầu dự đoán chính xác lớp của mẫu kiểm tra từ thông tin của tập huấn luyện Thuật toán này tính toán xác suất hậu nghiệm của sự kiện c dựa trên sự kiện x trong không gian ngữ cảnh 𝜏, thông qua việc tổng hợp các xác suất tiên nghiệm của sự kiện c khi sự kiện x xuất hiện trong các điều kiện riêng T thuộc không gian 𝜏.
Để xác định chất lượng trầm tích thuộc lớp c, ta tính xác suất p(X|a) cho một lớp c và kết quả X đo chất lượng trầm tích Nếu xác suất này lớn hơn hoặc bằng giá trị ngưỡng CTshc của lớp c, ta có thể kết luận rằng chất lượng trầm tích đó thuộc về lớp c.
Kết quả đo chất lượng trầm tích được thể hiện dưới dạng một vectơ, với kích thước tương ứng với số lượng thông số của trầm tích Mỗi thành phần trong vectơ này chứa một thông số và tần suất xuất hiện của thông số đó trong kết quả đo Qua việc tính toán p(c|X), chúng ta có thể xác định lớp mà kết quả X thuộc về.
Xác suất p(c|X) được tính theo công thức sau:
𝑛 𝑖=1 ∗ 𝐹 1 ∈𝑉 (𝑝(𝐹 1 |𝑐)) 𝑇𝐹(𝐹 1 ,𝑋) TF(F i |c) sử dụng phép ước lượng Laplace:
|V|: số lượng tham số có trong tập tham số đưa vào;
F j : tham số thứ j trong tập tham số V;
TF(Fj|X): tần suất xuất hiện của Fj trong kết quả đo X;
Tần suất xuất hiện của F j trong lớp c được ký hiệu là TF(F j |c), trong khi xác suất có điều kiện để F j xuất hiện trong kết quả đo X của lớp c được biểu thị là p(Fj|c) Để giảm bớt sự phức tạp và thời gian tính toán, công thức này có thể được viết lại một cách đơn giản hơn.
Trong quá trình phân lớp, chỉ các tham số xuất hiện trong kết quả đo X được sử dụng, không dựa vào toàn bộ tập tham số đã đưa vào.
Bảng 3 Thông số quan trắc trầm tích
STT Hàm lượng dầu CN- Pb Zn Hg Cd As Class
STT Hàm lượng dầu CN- Pb Zn Hg Cd As Class
Bảng Thông số quan trắc trầm tích dựa vào tiêu chuẩn tham khảo của Trung Quốc được biểu diễn như sau:
STT Hàm lượng dầu CN- Pb Zn Hg Cd As Class
STT Hàm lượng dầu CN- Pb Zn Hg Cd As Class
Bảng 4.Đánh giá thông số quan trắc trầm tích qua tiêu chuẩn tham khảo Trung Quốc
Gọi tắt lớp Loại 1 là: x, Loại 2 là y, Loại 3 là z
Ta xét các mẫu chưa được tìm thấy sau:
X tính theo tiêu chuẩn tham khảo của Trung Quốc
Ta tính xác suất của các thuộc tính sau: x y X
Theo kết quả thu được thì P(X | z) là lớn nhất nên X thuộc nhóm lớp Loại 3
2.1.3 Thuật toán phân lớp SVM a) Phân lớp dựa trên SVM
Thuật toán máy vectơ hỗ trợ (Support Vector Machine - SVM) được sử dụng chủ yếu cho phân lớp nhị phân và dựa trên phương pháp thống kê do Vapnik đề xuất SVM nổi bật trong việc xử lý các bài toán với dữ liệu có số chiều lớn và được xem là một trong mười thuật toán khai phá dữ liệu hàng đầu.
Giả sử mỗi văn bản được biểu diễn như một điểm dữ liệu trong không gian R n, SVM nhằm tìm một siêu phẳng f(x) tối ưu trong không gian n-chiều để phân chia dữ liệu Mục tiêu là đảm bảo rằng tất cả các điểm x+ được gán nhãn 1 nằm ở phía dương của siêu phẳng (f(x + )>0), trong khi các điểm x- được gán nhãn -1 nằm ở phía âm (f(x - )