1. Trang chủ
  2. » Luận Văn - Báo Cáo

(LUẬN VĂN THẠC SĨ) Nghiên cứu giải quyết phân lớp địa hóa môi trường biển và áp dụng vào bài toán đánh giá địa hóa môi trường biển Việt Nam

48 5 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 48
Dung lượng 1,55 MB

Cấu trúc

  • Chương 1: Khái quát về địa hóa môi trường biển Việt Nam và giải pháp phân lớp (9)
    • 1.1 Địa hóa môi trường biển (9)
      • 1.1.1. Một số khái niệm cơ bản trong môi trường biển [3, 4, 5] (9)
      • 1.1.2. Khái quát về địa hóa môi trường biển (13)
    • 1.2 Tầm quan trọng của việc phân lớp địa hóa môi trường biển (14)
    • 1.3. Bài toán đánh giá địa hóa môi trường biển (15)
      • 1.3.1. Các đặc trưng của địa hóa môi trường biển (15)
      • 1.3.2. Quan trắc địa hóa môi trường biển [4] (15)
  • Chương 2: Mô hình giải quyết bài toán bài toán đánh giá địa hóa môi trường biển Việt nam dựa trên các phương pháp phân lớp (20)
    • 2.1 Nghiên cứu giải pháp phân lớp địa hóa môi trường biển Việt nam (20)
      • 2.1.1. Giới thiệu bài toán phân lớp và một số phương pháp điển hình (20)
      • 2.1.2. Thuật toán phân lớp Bayes (21)
      • 2.1.3. Thuật toán phân lớp SVM (26)
    • 2.2 Mô hình đánh giá địa hóa môi trường biển Việt nam dựa trên các phương pháp phân lớp (31)
      • 2.2.1. Phát biểu bài toán đánh giá địa hóa môi trường biển (31)
      • 2.2.2. Mô hình giải quyết bài toán đánh giá địa hóa môi trường biển Việt Nam (32)
  • Chương 3: Thực nghiệm và đánh giá (37)
    • 3.1. Môi trường thực nghiệm (37)
      • 3.1.1. Cấu hình sử dụng (37)
      • 3.1.2. Công cụ phần mềm (37)
    • 3.2. Dữ liệu thực nghiệm (37)
      • 3.2.1. Mô tả cài đặt chương trình (37)
      • 3.2.2. Xây dựng tập dữ liệu học (38)
    • 3.3 Thi hành thực nghiệm (40)
      • 3.3.1 Thực hành trên Weka đối với thuật toán phân lớp Naive Bayes (40)
      • 3.3.2 Thực hành trên Weka đối với thuật toán phân lớp SVM (42)
    • 3.4. Đánh giá, so sánh (45)
      • 3.4.1 Đánh giá hệ thống (45)
      • 3.4.2 Nhận xét (46)
  • Kết luận (4)
  • Tài liệu tham khảo (0)

Nội dung

Khái quát về địa hóa môi trường biển Việt Nam và giải pháp phân lớp

Địa hóa môi trường biển

1.1.1 Một số khái niệm cơ bản trong môi trường biển [3, 4, 5] a) Khái niệm về môi trường biển

Môi trường tự nhiên được định nghĩa là sự kết hợp của các yếu tố khí hậu, sinh thái, hóa học và thổ nhưỡng, ảnh hưởng đến con người và các sinh vật khác Nó bao gồm tất cả các yếu tố có tác động trực tiếp đến sự trao đổi chất và hành vi của con người cũng như các loài sống, bao gồm ánh sáng, không khí, nước, đất và các sinh vật khác.

Môi trường biển được định nghĩa là sự kết hợp của các yếu tố vật lý, hóa học và sinh học đặc trưng cho nước biển, đất ven biển, trầm tích dưới biển, không khí trên mặt biển và các hệ sinh thái biển Những yếu tố này tồn tại khách quan và có ảnh hưởng sâu sắc đến con người cũng như các sinh vật sống trong môi trường biển.

Môi trường biển bao gồm tất cả các yếu tố ảnh hưởng đến sự trao đổi chất và hành vi của con người cũng như sinh vật biển Những yếu tố này bao gồm ánh sáng, không khí, nước biển, đất ven biển, trầm tích đáy biển và các sinh vật sống trong môi trường biển.

Thành phần môi trường biển bao gồm các yếu tố vật chất như nước biển, đất ven bờ, trầm tích dưới đáy biển, không khí, âm thanh, ánh sáng, sinh vật biển, hệ sinh thái biển và các hình thái vật chất khác Các yếu tố đặc trưng của nước biển ven bờ có vai trò quan trọng trong việc duy trì sự đa dạng sinh học và ổn định hệ sinh thái biển.

Hàm lượng TSS (Total Suspended Solid) trong nước là tổng chất rắn lơ lửng, được xác định bằng cách cân trọng lượng chất còn lại trên giấy lọc sau khi phân tích nước TSS phản ánh lượng vật chất không hòa tan trong nước và được đo bằng miligam trên lít (mg/l).

Nhu cầu ôxy hoá học (COD - Chemical Oxygen Demand) là lượng oxy trong Kali bicromat (K2Cr2O7) dùng để oxy hoá chất hữu cơ trong nước Chỉ số COD thường được sử dụng để đo gián tiếp khối lượng các hợp chất hữu cơ trong nước, đặc biệt là trong các nguồn nước bề mặt như sông và hồ Do đó, COD trở thành một chỉ số quan trọng trong việc đánh giá chất lượng nước, được biểu thị bằng đơn vị mg/l, cho biết khối lượng oxy cần thiết để xử lý một lít dung dịch.

Nhu cầu ôxy sinh học (BOD) là lượng oxy cần thiết để vi sinh vật oxy hóa các chất hữu cơ trong nước Chỉ số BOD cho biết tốc độ tiêu thụ oxy của sinh vật, từ đó giúp đánh giá chất lượng nước BOD được ứng dụng rộng rãi trong quản lý nước, khảo sát chất lượng môi trường và nghiên cứu sinh thái học.

Chỉ tiêu BOD là chỉ số quan trọng phản ánh mức độ ô nhiễm hữu cơ trong nước thải hoặc nguồn nước Khi giá trị BOD tăng, điều này cho thấy mức độ ô nhiễm của nước thải hoặc nguồn nước cũng gia tăng, và ngược lại, chỉ số BOD thấp cho thấy nước ít bị ô nhiễm hơn.

Hàm lượng Amôni (N-NH 4 ) là hàm lượng nitơ amoni, đơn vị tính là mg/l

Tổng coliform (ngắn go ̣n là Coliforms) là số lượng coliform được biểu diễn bằng số khả hữu MPN (Most Probable Number)

Tổng coliform là chỉ số vi khuẩn coli trong 100ml nước thải, có khả năng lên men sinh hơi đường lactose ở nhiệt độ 37°C trong 24-48 giờ dưới điều kiện hiếu khí, được đo bằng MPN/100ml Coliforms bao gồm bốn giống vi khuẩn chính: E.coli, Citrobacter, Enterobacter và Klebsiella Chỉ số coliform được coi là một chỉ điểm vi sinh vật quan trọng để đánh giá chất lượng nước.

Hàm lượng xyanua được định nghĩa là số miligram (mg) xyanua có trong một mili lít (ml) nước Xyanua, ký hiệu là CN, chỉ tính các nhóm CN từ các hợp chất chứa ion xyanua hoặc axit hidroxyanic, không bao gồm nitril đơn (R-CN), xyanat (muối của CN), cũng như các ion thioxyanat và xyan clorua.

Hàm lượng các kim loại nặng: số mg ion kim loại trong 1 ml nước c) Ô nhiễm môi trường biển

Ô nhiễm môi trường biển là sự thay đổi tiêu cực của các thành phần nước và trầm tích biển, không đáp ứng quy chuẩn kỹ thuật quốc gia về môi trường, ảnh hưởng xấu đến sức khỏe con người và các sinh vật.

Hội nghị Liên hợp quốc về môi trường tại Stockholm, Thụy Điển năm 1972 đã định nghĩa ô nhiễm môi trường biển là sự thải bỏ các chất hoặc năng lượng do con người vào môi trường biển, bao gồm cả các vùng cửa sông, dẫn đến nhiều hậu quả nghiêm trọng Những hậu quả này bao gồm thiệt hại cho tài nguyên sinh vật, ảnh hưởng xấu đến sức khỏe con người, gây khó khăn cho các hoạt động trên biển như đánh bắt cá, và làm suy giảm chất lượng cũng như các tính chất hữu ích của nước biển.

(2) Các nguyên nhân chính dẫn đến ô nhiễm môi trường biển

Môi trường biển đang đối mặt với ô nhiễm nghiêm trọng do nhiều nguyên nhân khác nhau, trong đó nguyên nhân chủ yếu là sự gia tăng nồng độ chất dinh dưỡng Các chất dinh dưỡng này thường xuất phát từ lục địa, bao gồm chất thải sinh hoạt và hoạt động sản xuất nông nghiệp, công nghiệp được xả ra biển Ngoài ra, ô nhiễm cũng có thể đến từ các hoạt động trên biển, như nước thải từ các khu dân cư, đô thị, làng nghề và tàu du lịch chưa được xử lý.

Môi trường biển Việt Nam đang bị ô nhiễm và suy thoái nghiêm trọng, theo báo cáo hiện trạng môi trường năm 2003 và 2010 của Bộ Tài nguyên và Môi trường Chất lượng môi trường biển và vùng ven bờ tiếp tục giảm sút, với ô nhiễm từ dầu, kẽm và chất thải sinh hoạt Ngoài ra, các chất rắn lơ lửng như Si, NO3, NH4 và PO4 cũng đang ở mức đáng lo ngại Chất lượng trầm tích đáy biển ven bờ, nơi cư trú của nhiều loài thủy hải sản, cũng bị ảnh hưởng Những nguyên nhân chính dẫn đến tình trạng ô nhiễm này cần được xem xét và giải quyết kịp thời.

Các nguồn ô nhiễm từ lục địa chảy ra biển qua sông bao gồm dầu thải, nước thải chưa xử lý, hóa chất, thuốc trừ sâu, thuốc diệt cỏ, phân bón, và chất thải từ công nghiệp, nông nghiệp, làng nghề Những chất này dẫn đến ô nhiễm môi trường biển, với một số loại không phân hủy được tích tụ ở ven bờ hoặc chìm xuống đáy biển, trong khi các chất có khả năng phân hủy sẽ hòa tan trong khối nước biển.

Tầm quan trọng của việc phân lớp địa hóa môi trường biển

Môi trường biển hiện đang đối mặt với nhiều thách thức nghiêm trọng do hoạt động của con người và sự thay đổi tự nhiên Ô nhiễm trầm tích biển, nếu không được đánh giá kịp thời, có thể gây ra những nguy hại lâu dài cho chất lượng môi trường biển Do đó, việc đánh giá và phân loại chất lượng trầm tích biển là rất cần thiết, nhằm phát triển các chiến lược và biện pháp hiệu quả để bảo vệ môi trường và giảm thiểu ô nhiễm.

Chất lượng môi trường biển đang suy giảm, dẫn đến sự phá hủy các nơi cư trú tự nhiên và tổn thất lớn về đa dạng sinh học, với nhiều loài hải sản bị giảm số lượng hoặc tiêu diệt Hiện có khoảng 85 loài hải sản đang trong tình trạng nguy cấp, trong đó hơn 70 loài đã được ghi vào sách đỏ Việt Nam Việc đánh giá và phân loại chất lượng trầm tích biển là cần thiết để xây dựng các chiến lược phát triển kinh tế bền vững cho các tổ chức và cộng đồng ven biển, nhằm đạt hiệu quả cao và bảo vệ tài nguyên biển Khái niệm phát triển bền vững do Ủy ban môi trường và phát triển thế giới (WCED) đề xuất đã trở thành nền tảng cho các chính sách bảo vệ môi trường và phát triển kinh tế.

Từ năm 1987, khái niệm phát triển bền vững đã được diễn đạt qua nhiều cách khác nhau Mặc dù có sự đa dạng trong cách hiểu, hầu hết mọi người đều đồng thuận rằng phát triển bền vững là sự kết hợp hài hòa giữa mục tiêu tăng trưởng kinh tế, các mục tiêu xã hội và bảo vệ môi trường Bên cạnh đó, phát triển bền vững cũng bao gồm việc quản lý hiệu quả các mâu thuẫn lợi ích phát sinh trong quá trình phát triển.

Hình 2.Mô hình bảo đảm phát triển bền vững

Phân loại địa hóa môi trường nhằm bảo vệ môi trường thông qua việc đánh giá, dự báo và cảnh báo chất lượng môi trường biển Điều này giúp thực hiện các điều chỉnh kịp thời và hợp lý trong phát triển kinh tế.

- xã hội một cách hài hoà với bảo vệ môi trường nhằm phát triển bền vững.

Bài toán đánh giá địa hóa môi trường biển

1.3.1 Các đặc trưng của địa hóa môi trường biển Để đánh giá địa hóa môi trường biển cần dựa trên các thông số liên quan đến việc đánh giá các thông số về trầm tích biển hay nói cách khác là các đặc trưng của địa hóa môi trường biển

Trong nghiên cứu này, chúng tôi tập trung vào các đặc trưng quan trọng của trầm tích biển ven bờ, bao gồm hàm lượng dầu, nồng độ CN- và hàm lượng kim loại nặng như Pb, Zn, As, Cd, Hg.

Việc đánh giá đặc trưng địa hóa môi trường biển dựa trên tiêu chuẩn tham khảo của Trung Quốc cho thấy mỗi thông số có quy định riêng về chất lượng trầm tích biển Do đó, các thông số đặc trưng của địa hóa môi trường biển có thể được phân chia thành từng nhóm riêng biệt.

1.3.2 Quan trắc địa hóa môi trường biển [4]

Việc xác định các thông số chất lượng trầm tích biển, bao gồm hàm lượng dầu, CN- và kim loại nặng như Cu, Pb, Zn, As, được thực hiện thông qua các kết quả đo từ các trạm quan trắc môi trường biển tại Việt Nam Tính đến giữa năm 2010, 42 địa phương trên cả nước đã thành lập Trung tâm quan trắc môi trường, góp phần nâng cao chất lượng giám sát môi trường biển.

Trung tâm thực hiện chương trình quan trắc môi trường đa dạng, bao gồm nước mặt lục địa, nước mưa, nước biển, không khí, tiếng ồn, phóng xạ, đất và chất thải rắn, với hàng nghìn điểm quan trắc Đặc biệt, trung tâm tập trung vào các điểm nóng về môi trường và những khu vực sinh thái nhạy cảm ở hầu hết các địa phương trên cả nước Hệ thống quan trắc môi trường biển cũng là một phần quan trọng trong các hoạt động này.

Mạng lưới quan trắc môi trường biển do Tổng cục Bảo vệ Môi trường điều hành đã thực hiện quan trắc chất lượng nước và trầm tích từ năm 1995 tại 7 điểm miền Bắc, 8 điểm miền Trung, 7 điểm miền Nam, 87 điểm biển khơi Đông Nam và 17 điểm biển khơi Tây Nam Bộ và Côn Sơn Các điểm đo bao gồm những khu vực quan trọng như Trà Cổ, Đà Nẵng, Nha Trang và vùng khai thác dầu khí.

Các trạm ven bờ được quan trắc 4 lần mỗi năm, trong khi các trạm ngoài khơi được quan trắc 2 lần mỗi năm Các thông số, phương pháp lấy mẫu và phân tích đều được thống nhất, bao gồm cả việc thực hiện chương trình đảm bảo và kiểm soát chất lượng.

Bảng 1 Thông số quan trắc và đơn vị đo

STT Thông số quan trắc Đơn vị đo

Khí tượng thủy văn Đặc điểm thủy văn

Tốc độ Cm/s Đặc điểm thời tiết

STT Thông số quan trắc Đơn vị đo

5 Trạng thái mặt biển Cấp

Nước biển Thủy lý – Thủy hóa

Hàm lượng muối dinh dưỡng

STT Thông số quan trắc Đơn vị đo Sinh vật biển

28 Mật độ cá thể tế bào/m 3

29 Khối lượng mg/l Động vật phù du

32 Mật độ cá thể con/m 3

Trong luận văn này, chúng tôi tập trung vào các thông số quan trọng như hàm lượng dầu trong trầm tích, nồng độ CN- và các chỉ số kim loại nặng bao gồm Pb, Zn, As, Hg, cùng với dữ liệu địa hóa từ quan trắc môi trường biển.

Dưới đây là một bảng đo kết quả trầm tích của một vùng biển miền Trung

Bảng 2 Bảng mẫu kết quả đo chất lượng trầm tích của một vùng biển miền Trung

BIỂU GHI KẾT QUẢ PHÂN TÍCH CHẤT LƯỢNG TRẦM TÍCH

Trạm QT&PTMT: vùng ven biển 2 - Miền Trung

Vị trí quan trắc Biển ven bờ Miền Trung

Vĩ độ Đặc điểm nơi quan trắc Biển ven bờ Miền Trung Độ sâu

Người quan trắc Nguyễn Quang Hưng

Người phân tích Trịnh Xuân

Nơi phân tích Viện Hóa học

Ngày hoàn thành phân tích

Người kiểm tra Nguyễn Vũ Tưởng

BIỂU GHI KẾT QUẢ PHÂN TÍCH CHẤT LƯỢNG TRẦM TÍCH

Nhiệt độ 0 C Độ ẩm % pH

Dầu trong trầm tích mg/l 69 1128.33 522 458 1222 1195.67 266.67 74.67

Dư lượng thuốc BVTV trong trầm tích Tổng dư lượng thuốc

1: Đèo Ngang 3: Cồn Cỏ 5: Đà Nẵng 7: Sa Huỳnh

Kết quả đo đạc tại 8 điểm ven biển miền Trung đã được thực hiện bằng các thiết bị chuyên dụng, như đã nêu ở phần trước.

Mô hình giải quyết bài toán bài toán đánh giá địa hóa môi trường biển Việt nam dựa trên các phương pháp phân lớp

Nghiên cứu giải pháp phân lớp địa hóa môi trường biển Việt nam

2.1.1 Giới thiệu bài toán phân lớp và một số phương pháp điển hình

Phân lớp là mối quan tâm hàng đầu trong việc làm việc với tập hợp đối tượng, giúp sắp xếp và tìm kiếm một cách hiệu quả Khi biểu diễn đối tượng trong hệ thống thông tin, tính chất lớp của đối tượng thường được thể hiện qua thuộc tính "lớp" riêng biệt.

Phân lớp dữ liệu là một kỹ thuật quan trọng trong học máy, sử dụng tập huấn luyện với dữ liệu đã được gán nhãn để phân loại dữ liệu mới Kỹ thuật này giúp cải thiện độ chính xác trong việc nhận diện và phân loại các thuộc tính khác nhau của dữ liệu.

Một số thuật toán được sử dụng trong phân lớp như:

- K người láng giềng gần nhất (K – Nearst neighbours);

- Cây quyết định (Decision Tree);

Trong khuôn khổ đề tài, chỉ tập trung tìm hiểu và cài đặt 2 thuật toán dùng trong phân lớp là: Naive Bayes và SVM

Thuật toán phân lớp Naive Bayes được lựa chọn vì tính đơn giản, tốc độ thực hiện nhanh và khả năng cập nhật dữ liệu huấn luyện dễ dàng Nó cũng có tính độc lập cao đối với tập huấn luyện Là một trong những thuật toán phân lớp điển hình trong học máy và khai phá dữ liệu, Naive Bayes thường được xem như chuẩn mực để so sánh với các thuật toán khác trong lĩnh vực học máy.

Thuật toán SVM được chọn vì nó có nền tảng lý thuyết vững chắc và nhiều nghiên cứu đã chứng minh hiệu suất cao của nó.

Phân lớp địa hóa môi trường biển đóng vai trò quan trọng trong việc đánh giá, bảo vệ và ngăn chặn ô nhiễm môi trường biển Hiện tại, Việt Nam chưa có quy chuẩn kỹ thuật quốc gia về chất lượng trầm tích biển, do đó việc đánh giá chủ yếu dựa vào tiêu chuẩn của Trung Quốc và Canada Trong khuôn khổ nghiên cứu, dữ liệu quan trắc sẽ được đánh giá theo tiêu chuẩn tham khảo của Trung Quốc, đặc biệt cho kim loại nặng và hóa chất bảo vệ thực vật, với ba mức độ phân loại rõ ràng.

Việc phân lớp địa hóa môi trường dựa trên ba mức độ tiêu chuẩn, cho phép chia thành ba lớp khác nhau Quyết định đưa một điểm hoặc vùng vào lớp nào phụ thuộc vào các thông số như hàm lượng dầu, xyanua trong trầm tích biển, và hàm lượng kim loại nặng như Pb, Zn, As trong trầm tích ven bờ.

2.1.2 Thuật toán phân lớp Bayes

Thuật toán phân lớp Bayes là một trong những phương pháp phân lớp nổi bật trong học máy và khai phá dữ liệu, đặc biệt được ưa chuộng trong phân lớp văn bản Học máy Bayes thường được coi là tiêu chuẩn để so sánh với các thuật toán học máy khác Công thức xác suất có điều kiện là một yếu tố quan trọng trong việc áp dụng thuật toán này.

Xác suất điều kiện của biến cố A với điều kiện biến cố B đã xảy ra là một số không âm

Ký hiệu P(A/B) thể hiện xác suất xảy ra sự kiện A khi sự kiện B đã xảy ra, trong khi P(B/A) biểu thị xác suất xảy ra sự kiện B khi sự kiện A đã xảy ra.

Công thức xác suất có điều kiê ̣n Bayes :

P(A/B) P(B) = P(B/A) P(A) = P(AB) b) Công thức xác suất đầy đủ

Giả sử B 1 , B 2 , … B n là mô ̣t nhóm đầy đủ các biến cố Khi đó:

P(A) = ∑ P(B i )*P(A/B i ) c) Công thức xác suất Bayes

Từ các công thức ở trên ta có công thức xác suất Bayes:

P(B k /A) = (P(AB k ))/(P(A)) = (P(B k )*P(A/B k ) )/(ΣP(B i )*P(A/Bi i ) d) Phân lớp Naive Bayes

Phân lớp Naive Bayes là một phương pháp phân loại dựa trên xác suất đã được huấn luyện, phù hợp cho các bài toán cần dự đoán chính xác lớp của mẫu kiểm tra Thuật toán này tính toán xác suất hậu nghiệm của sự kiện c xảy ra khi có sự kiện x trong không gian ngữ cảnh 𝜏, thông qua việc tổng hợp các xác suất tiên nghiệm của sự kiện c khi có sự kiện x trong các điều kiện riêng T thuộc không gian 𝜏.

Để xác định chất lượng trầm tích thuộc lớp c, ta sử dụng xác suất p(X|a) và so sánh với ngưỡng CTsh c của lớp c Nếu p(X|a) lớn hơn hoặc bằng giá trị ngưỡng này, ta kết luận rằng chất lượng trầm tích thuộc về lớp c.

Kết quả đo chất lượng trầm tích được thể hiện dưới dạng một vectơ, với kích thước tương ứng với số lượng thông số của trầm tích Mỗi thành phần trong vectơ này đại diện cho một thông số và tần suất xuất hiện của nó trong kết quả đo Từ đó, chúng ta có thể tính toán xác suất p(c|X) để xác định lớp mà kết quả X thuộc về.

Xác suất p(c|X) được tính theo công thức sau:

𝑛 𝑖=1 ∗ 𝐹 1 ∈𝑉 (𝑝(𝐹 1 |𝑐)) 𝑇𝐹(𝐹 1 ,𝑋) TF(F i |c) sử dụng phép ước lượng Laplace:

|V|: số lượng tham số có trong tập tham số đưa vào;

F j : tham số thứ j trong tập tham số V;

TF(F j |X): tần suất xuất hiện của F j trong kết quả đo X;

Tần suất xuất hiện của F j trong lớp c được ký hiệu là TF(F j |c), trong khi xác suất có điều kiện để F j xuất hiện trong kết quả đo X của lớp c được ký hiệu là p(F j |c) Để tối ưu hóa quá trình tính toán và giảm thiểu độ phức tạp, công thức này có thể được diễn đạt lại một cách đơn giản hơn.

Trong quá trình phân lớp, chỉ có các tham số xuất hiện trong kết quả đo X được sử dụng, thay vì toàn bộ tập tham số Cụ thể, công thức 𝑛 𝑖=1 ∗ 𝐹 1 ∈𝑋 (𝑝(𝐹 1 |𝑐)) 𝑇𝐹(𝐹 1 ,𝑋) minh họa cho phương pháp này.

Bảng 3 Thông số quan trắc trầm tích

STT Hàm lượng dầu CN- Pb Zn Hg Cd As Class

STT Hàm lượng dầu CN- Pb Zn Hg Cd As Class

Bảng Thông số quan trắc trầm tích dựa vào tiêu chuẩn tham khảo của Trung Quốc được biểu diễn như sau:

STT Hàm lượng dầu CN- Pb Zn Hg Cd As Class

STT Hàm lượng dầu CN- Pb Zn Hg Cd As Class

Bảng 4.Đánh giá thông số quan trắc trầm tích qua tiêu chuẩn tham khảo Trung Quốc

Gọi tắt lớp Loại 1 là: x, Loại 2 là y, Loại 3 là z

Ta xét các mẫu chưa được tìm thấy sau:

X tính theo tiêu chuẩn tham khảo của Trung Quốc

Ta tính xác suất của các thuộc tính sau: x y X

P(X | x) = 3/5*2/5*2/5*2/5*1/5*2/5*1/5*5/20 ≈ 0.000154 P(X | y) = 2/7*1/7*3/7*2/7*2/7*2/7*1/7*7/20 ≈ 0.00002 P(X | z) = 3/8*4/8*4/8*3/8*4/8*1/8*6/8*8/20 ≈ 0.000659 Theo kết quả thu được thì P(X | z) là lớn nhất nên X thuộc nhóm lớp Loại 3

2.1.3 Thuật toán phân lớp SVM a) Phân lớp dựa trên SVM

Thuật toán máy vectơ hỗ trợ (SVM) là một phương pháp mạnh mẽ cho phân lớp nhị phân, dựa trên tiếp cận thống kê của Vapnik SVM đặc biệt hiệu quả trong việc xử lý dữ liệu có số chiều lớn và được xếp hạng là một trong 10 thuật toán khai phá dữ liệu hàng đầu.

Giả sử mỗi văn bản được biểu diễn như một điểm dữ liệu trong không gian R n, SVM nhằm tìm một mặt hình học (siêu phẳng) f(x) tối ưu trong không gian n-chiều để phân chia dữ liệu Mục tiêu là đảm bảo rằng tất cả các điểm x + được gán nhãn 1 nằm phía dương của siêu phẳng (f(x + )>0), trong khi các điểm x - được gán nhãn -1 nằm phía âm (f(x - )

Ngày đăng: 17/12/2023, 02:05

TRÍCH ĐOẠN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w