1.6.1. Phân tích phương sai đa biến (MANOVA)
MANOVA là phân tích phương sai đa biến áp dụng cho các tập số liệu có từ hai biến phụ thuộc trở lên, được dùng để đánh giá sự khác nhau của các nhóm biến độc lập được phân tích đồng thời dựa trên tập hợp các biến chính tắc đóng vai trò như những biến độc lập.
Phương pháp này được dùng để đánh giá ảnh hưởng tương hỗ và ảnh hưởng chính của biến độc lập đến các kết quả thí nghiệm. MANOVA dùng một hay nhiều biến phụ thuộc (predictors) như ANOVA nhưng khác với ANOVA nó gồm nhiều hơn một biến độc lập. Nếu như ANOVA kiểm tra sự khác nhau giữa các giá trị trung bình của nhiều biến độc lập tức là sử dụng một phép đo độc lập thì MANOVA kiểm tra sự khác nhau về gía trị (vecto) trung tâm của giá trị trung bình của rất nhiều biến tức là so sánh các mẫu dựa trên hai hay nhiều biến độc lập .
Để kiểm tra giả thiết đảo trong MANOVA người ta sử dụng nghiệm đặc trưng lớn nhất (greatest characteristic root-gcr). Nó sẽ kiểm tra hàm khác biệt đầu tiên của các biến độc lập với khả năng của nó để nhận ra sự khác nhau giữa các nhóm .
Sự khác nhau có ý nghĩa thống kê về giá trị trung bình của hai hay nhiều biến giữa hai nhóm được kiểm tra bằng giá trị Hotelling's T2.
Cả ANOVA và MANOVA đều cần giả thiết về các phép đo độc lập:
- Phân phối chuẩn: Biến phụ thuộc phải tuân theo phân phối chuẩn trong nhóm.
Luận văn tốt nghiệp 30
- Tính tuyến tính: MANOVA cần giả thiết có quan hệ tuyến tính giữa tất cả các cặp của biến phụ thuộc, các cặp biến ngẫu nhiên và cặp biến phụ thuộc – biến ngẫu nhiên
- Phương sai phải đồng nhất.
- Biến ngẫu nhiên (variate): là sự kết hợp tuyến tính của các biến. Trong MANOVA, biến độc lập được tạo vào trong biến ngẫu nhiên trong hàm biệt thức .
Thuận lợi khi dùng MANOVA:
Trong phân tích MANOVA, những phép đo lặp lại được xem như những tập hợp con (subset). Nếu sử dụng ANOVA một yếu tố sẽ mắc sai lầm loại một. MANOVA kiểm soát được sự lan truyền sai số này.
Khi xuất hiện đa cộng tính giữa các biến độc lập thì MANOVA có thể phát hiện sự khác nhau mà bằng ANOVA 1 yếu tố không phát hiện được.
Hạn chế: nếu số thí nghiệm nhỏ thì kết quả bị ảnh hưởng bởi sai số thô. + Giữa các biến độc lập phải có quan hệ tuyến tính
+ MANOVA không cho ta ảnh hưởng tương hỗ của yếu tố chính và yếu tố lặp lại.[11]
1.6.2. Phân tích thành phần chính (PCA)
Phân tích thành phần (cấu tử) chính là công cụ hữu hiệu cho phép giảm số biến trong tập số liệu nhằm đạt được biểu diễn hai chiều từ tập số liệu đa chiều bằng cách tìm ra giá trị phương sai lớn nhất với số thành phần chính (PC) hay các biến ảo ít nhất.
Nói cách khác PCA là thuật toán đa biến dựa trên việc quay các trục số liệu chứa các biến tối ưu. Khi đó, một tập hợp các biến liên quan với nhau được chuyển thành tập hợp các biến không liên quan và được sắp xếp theo thứ tự giảm độ biến thiên hay phương sai. Những biến không liên quan này là sự kết hợp tuyến tính các biến ban đầu. Dựa trên phương sai do mỗi biến mới gây ra có thể loại bỏ bớt các
Luận văn tốt nghiệp 31
biến phía cuối dãy mà chỉ mất ít nhất thông tin về các số liệu thực ban đầu. Bằng cách này sẽ giảm được kích thước của tập số liệu trong khi vẫn có thể giữ nguyên thông tin.
Trong thuật toán PCA, có thể có nhiều PC vì có nhiều biến trong tập số liệu. Số PC tối đa bằng số biến. Việc dùng PCA có thể tóm lược được cấu trúc đồng phương sai với tập số liệu có kích thước nhỏ hơn, mà không làm mất đi ý nghĩa của tập số liệu ban đầu. Có thể sử dụng tập số liệu mới này trong tính toán để thay thế cho tập số cũ.
PCA được ứng dụng chủ yếu trong việc giảm kích thước tập số liệu, từ biểu diễn n chiều trong không gian thành biểu diễn hai hoặc 3 chiều với số biến có ảnh hưởng chính đến tập số liệu.
PCA loại bỏ sự đa cộng tính giữa các biến trong việc xây dựng phương trình hồi qui biểu diễn sự phụ thuộc của tín hiệu phân tích vào các biến là nồng độ các thành phầntrong hệ. Phương pháp này có tên gọi là hồi qui thành phần chính.
Từ tập số liệu với n biến ban đầu có liên quan mật thiết với nhau, sau khi giảm thành p biến không liên quan thì trị riêng của chúng có thể sử dụng làm số liệu đầu vào của phương pháp hồi qui kết hợp với mạng noron nhân tạo giải bài toán phân tích đồng thời các thành phần trong hệ có tương tác không cộng tính.
Nếu xem các số liệu phân tích trong tập số liệu là kết quả phân tích lặp lại thì PCA cho phép tìm được sai số thô trong số các kết quả phân tích.
Tuy nhiên PCA đơn thuần là phương pháp toán học nên các kết quả thu được bị ảnh hưởng rất lớn bởi tập số liệu ban đầu, vì vậy cần kết hợp với những kiến thức chuyên ngành khác nếu không sẽ dẫn đến những giải nghĩa sai lệch.[11]
1.6.3. Phân tích nhóm (CA)
Phân tích nhóm là kỹ thuật phân tích đa biến nhằm phân loại những số liệu có đặc tính giống nhau thành các nhóm hay còn gọi là các cụm.
Hai loại phân tích nhóm thường được sử dụng là: phân tích nhóm theo bậc và phân tích nhóm k – trung bình.
Luận văn tốt nghiệp 32
Phân tích nhóm theo bậc là cách để tìm ra các nhóm trong tập số liệu bằng cách tạo ra cây phân nhóm. Cây phân nhóm gồm nhiều bậc trong đó nhóm ở một mức được nối với với nhóm bên cạch ở mức cao hơn. Điều đó cho phép quyết định mức hoặc thang chia nào của nhóm là phù hợp hơn.
Nhóm theo bậc nhằm tìm ra các nhóm trong tập số liệu bằng cách tạo ra cây phân nhóm. Theo phương pháp này, tập số liệu lớn được chia thành các tập số liệu nhỏ hơn nữa cho đến khi mỗi tập số liệu nhỏ chỉ còn một phần tử. Cây phân nhóm gồm nhiều bậc trong đó nhóm ở một mức được nối với với nhóm bên cạch ở mức cao hơn. Điều đó cho phép quyết định mức hoặc thang chia nào của nhóm là phù hợp hơn.
Nhóm theo k - trung bình: các phần tử trong tập số liệu được tách vào k nhóm, các phần tử cùng nhóm được kết hợp với nhau và các nhóm khác nhau được tách ra khỏi nhau.[11]
1.6.4. Phần mềm máy tính
Các số liệu phân tích lặp lại, phân tích hồi qui, xử lý thống kê đa biến (multivariate analysis), hoặc đồ thị biểu diễn qui luật phân bố các đại lượng được xử lý bằng phần mềm MINITAB 15.
1.7. Giới thiệu về GIS (Geographic Information System)
1.7.1. Khái niệm GIS
Hệ thống thông tin địa lý (GIS) là một công cụ máy tính để lập bản đồ và phân tích các sự vật, hiện tượng thực trên trái đất. Công nghệ GIS kết hợp các thao tách cơ sở dữ liệu thông thường (như cấu trúc hỏi đáp) và các phép phân tích thống kê, phân tích địa lý, trong đó phép phân tích địa lý và hình ảnh được cung cấp duy nhất từ các bản đồ. Những khả năng này phân biệt GIS có phạm vi ứng dụng rộng trong nhiều lĩnh vực khác nhau (phân tích các sự kiện dự đoán tác động và hoạch định chiến lược).[10]
Luận văn tốt nghiệp 33
1.7.2. Ứng dụng GIS trong phân tích môi trường
Số liệu dùng trong GIS: GIS lưu giữ thông tin về thế giới thực dưới dạng tập hợp các lớp thông tin có thể liên kết với nhau nhờ các đặc điểm địa lý. Nhờ vậy, GIS trở thành một công cụ đa năng trong việc giải quyết nhiều vấn đề từ thực tế.[10]
Hiện nay, tại Việt Nam, đã có một số bài báo đã ứng dụng GIS trong phân tích môi trường.
Tác giả Phạm Tiến Đức, Đặng Mai, Trần Đăng Quy đã sử dụng kết hợp các phương pháp thống kê đa biến với GIS để đánh giá mức độ ô nhiễm Asen và một số kim loại nặng trong nước ngầm ở khu vực ngoại thành Hà Nội và đưa ra kết luận vùng ô nhiễm Asen kéo dài theo hướng Tây Bắc – Đông Nam, theo ranh giới cũ của Hà Tây và Hà Nội, với các trung tâm lan truyền là Phúc Thọ, Hòa Đức, Ứng Hòa.[5]
Tác giả Tạ Thị Thảo, Phạm Hồng Quân, Nguyễn Xuân Trung cũng đã sử dụng kết hợp các phương pháp thống kê đa biến với GIS để đánh giá ô nhiễm kim loại nặng trong nước ngầm xã Nam Tân, Nam Sách, Hải Dương và đưa ra kết luận nguồn ô nhiễm Asen tại các giếng nước ngầm tại thôn Đột Hạ lan truyền theo chiều rộng và theo mùa mưa.[12]
Luận văn tốt nghiệp 34
CHƢƠNG 2. THỰC NGHIỆM
2.1. Đối tƣợng, nội dung, phƣơng pháp nghiên cứu
Đối tượng nghiên cứu trong bản luận văn này là các mẫu nước, mẫu chất rắn lơ lửng và mẫu trầm tích đáy tại các địa điểm nằm trên lưu vực sông Đáy.
Nội dung và phương pháp nghiên cứu bao gồm:
- Phân tích xác định tổng hàm lượng kim loại nặng trong pha lỏng, chất rắn lơ lửng và trầm tích đáy bằng phương pháp phân tích ICP – MS trên cơ sở tối ưu hóa các điều kiện đo và đánh giá phương pháp phân tích.
- Phân tích mẫu thực tế lấy tại các địa điểm thuộc lưu vực sông Đáy để đánh giá mức độ ô nhiễm, sau đó sử dụng phương pháp phân tích thống kê đa biến đánh giá mối tương quan về mức độ ô nhiễm kim loại nặng trong mẫu nước và trầm tích tại khu vực này.
- Từ kết quả phân tích hàm lượng các kim loại nặng ở pha lỏng (mẫu nước) và pha rắn (mẫu chất rắn lơ lửng) xác định hệ số phân bố của các kim loại nặng vào 2 pha.
- Ứng dụng công nghệ GIS kết hợp phân tích đa biến để biểu diễn mức hàm lượng các kim loại nặng trên lưu vực sông Đáy đồng thời đánh giá mức độ lan truyền ô nhiễm.
2.2. Hóa chất và dụng cụ
- Hóa chất được sử dụng là các loại hóa chất siêu tinh khiết của Merck như:
HNO3, H2SO4, HF…dung dịch chuẩn đa nguyên tố dùng cho phân tích ICP-MS.
- Mẫu chuẩn CRM: MESS – 3 (mẫu trầm tích biển để xác định hàm lượng kim loại vết. Mẫu chuẩn này được Hội đồng nghiên cứu Quốc gia Canada đảm bảo và kiểm soát chất lượng). Mẫu chuẩn này chứa các kim loại nặng Cr, Mn, Fe, Cu, Zn, As, Cd, Sb, Hg, Pb với hàm lượng chuẩn được chỉ ra trong bảng 3.5.
Luận văn tốt nghiệp 35
- Dụng cụ thí nghiệm: cốc Teflon 50 ml, bình định mức các loại 50ml, 25ml, cốc 50ml, phễu lọc, pipet các loại, màng lọc cenlulozo Whatman 0,45µm, máy bơm hút chân không …
- Thiết bị:
+ Máy đo ICP-MS (ELAN 9000) và các thiết bị phụ . + Lò vi sóng 7295 Analytica (Mỹ)
+ Máy đo các chỉ tiêu môi trường thông thường ngay tại hiện trường. + Máy đo CPH V – TOC của Shimadzu – Nhật Bản để xác định lượng C hữu cơ hòa tan (DOC), tổng C hữu cơ (TOC).
Hệ thống phân tích ICP-MS điển hình có dạng như Hình 2.1. Hình 2.2 là hình ảnh thiết bị phân tích ICP-MS được sử dụng để phân tích mẫu tại khoa Hoá- Trường Đại học Khoa học Tự nhiên- Đại học Quốc Gia Hà Nội.
11 9 8 7 6 5 4 Ar 1 2 14 3 10 12 13
Hình 2.1. Sơ đồ khối về nguyên tắc cấu tạo của hệ ICP- MS
1. Hệ bơm dẫn mẫu vào buồng tạo sol khí. 2. Bộ tạo sol khí mẫu.
3. Đèn nguyên tử hóa mẫu. 4. Bộ khử đầu ngọn lửa ICP.
Luận văn tốt nghiệp 36
5. Hệ thấu kính ion. 6. Hệ phân giải phổ khối. 7. Trường tứ cực và bộ lọc ion.
8. Detector. 9. Hệ điện tử.
10. Bơm chân không.
11. Bơm chân không loại tubor phân tử. 12. Hệ buồng chân không của máy. 13. Bộ phận cấp khí Ar.
Hình 2.2. Hình ảnh máy ICP – MS (ELAN 9000)
2.3. Lấy mẫu, xử lý mẫu, bảo quản mẫu
2.3.1. Lấy mẫu
Luận văn tốt nghiệp 37
Mẫu trầm tích đáy được lấy bằng gầu inox đã được rửa sạch ở các vị trí trên lưu vực sông. Mẫu trầm tích được lấy 2 lần vào mùa mưa (tháng 8) và mùa khô (tháng 12).
Mẫu nước được lấy ở các vị trí trên lưu vực sông Đáy theo định kỳ hàng tháng. Các mẫu nước được lấy ở độ sâu 20 cm dưới bề mặt ở các vị trí như trên sơ đồ sau:
Luận văn tốt nghiệp 38
Hình 2.3.Sơ đồ các vị trí lấy mẫu
Chúng tôi đã tiến hành lấy mẫu tại các vị trí trên theo 5 đợt, trong đó có 3 đợt vào mùa mưa (vào các tháng 6, 8 và tháng 9 năm 2010) và 2 đợt vào mùa khô (vào cuối tháng 10 và tháng 12 năm 2010). Tọa độ và thông tin lấy mẫu được trình bày trong bảng 2.1.
Luận văn tốt nghiệp 39
Bảng 2.1.Tọa độ địa lý và thông tin lấy mẫu
STT Địa điểm Ngày lấy mẫu Thời gian Toạ độ
1 Mai Lĩnh 01/06/2010 8h55' N: 20056'11,6'' E: 105043'49,2'' 13/08/2010 8h30' N: 20056'11,7'' E: 105043'49,2'' 01/09/2010 8h35' N: 20056'11,6'' E: 105043'49,2'' 26/10/2010 8h25' N: 20056'11,6'' E: 105043'49,2'' 06/12/2010 8h33' N: 20056'11,6'' E: 105043'49,2'' 2 Khê Tang 01/06/2010 9h55' N: 20055'9,9'' E: 105043'17,0'' 13/08/2010 9h20' N: 20055'9,9'' E: 105043'17,0'' 01/09/2010 9h35' N: 20055'9,9'' E: 105043'16,9'' 26/10/2010 9h20' N: 20055'10,0'' E: 105043'17,0'' 06/12/2010 9h25' N: 20055'9,9'' E: 105043'17,0'' 3 Ba Thá 13/08/2010 10h20' N: 20050'8,9'' E: 105042'31,0'' 01/09/2010 10h45' N: 20050'9,0'' E: 105042'31,0'' 26/10/2010 10h30' N: 20050'9,0'' E: 105042'31,0'' 06/12/2010 10h35' N: 20050'9,0'' E: 105042'31,0'' 4 Tế Tiêu 01/06/2010 11h52' N: 20041'13,5'' E: 105044'57,3'' 13/08/2010 11h10' N: 20041'13,6'' E: 105044'57,3'' 01/09/2010 11h35' N: 20041'13,6'' E: 105044'57,2'' 26/10/2010 11h30' N: 20041'13,6'' E: 105044'57,3'' 06/12/2010 11h40' N: 20041'13,6'' E: 105044'57,2'' 5 Quế 01/06/2010 12h12' N: 20034'30,5'' E: 105052'28,5'' 13/08/2010 11h50' N: 20034'30,5'' E: 105052'28,5'' 01/09/2010 12h35' N: 20034'30,5'' E: 105052'28,5'' 26/10/2010 12h20' N: 20034'30,5'' E: 105052'28,5'' 06/12/2010 12h10' N: 20034'30,5'' E: 105052'28,5'' 6 Ba Đa 01/06/2010 12h51' N: 20034'6,2'' E: 105055'37,2'' 13/08/2010 15h00' N: 20034'6,2'' E: 105055'37,2'' 01/09/2010 17h30' N: 20034'6,2'' E: 105055'37,2'' 26/10/2010 13h05' N: 20034'6,2'' E: 105055'37,2'' 06/12/2010 12h45' N: 20034'6,2'' E: 105055'37,2'' 7 Cầu Đọ 01/06/2010 14h20' N: 20032'26,7'' E: 105054'46,0'' 13/08/2010 13h25' N: 20032'26,7'' E: 105054'45,9'' 01/09/2010 13h00' N: 20032'26,7'' E: 105054'46,0'' 26/10/2010 14h30' N: 20032'26,7'' E: 105054'46,0'' 06/12/2010 14h20' N: 20032'26,7'' E: 105054'45,9'' 8 Đoan Vỹ 01/06/2010 15h15' N: 20021'44,6'' E: 105055'33,6'' 13/08/2010 13h55' N: 20021'44,6'' E: 105055'33,6'' 01/09/2010 14h25' N: 20021'44,6'' E: 105055'33,6'' 26/10/2010 15h30' N: 20021'44,6'' E: 105055'33,6''
Luận văn tốt nghiệp 40 06/12/2010 15h15' N: 20021'44,6'' E: 105055'33,6'' 9 Gián Khẩu 01/06/2010 15h35' N: 20019'35,2'' E: 105056'24,0'' 13/08/2010 14h10' N: 20019'35,2'' E: 105056'23,9'' 01/09/2010 15h15' N: 20019'35,2'' E: 105056'24,0'' 26/10/2010 16h35' N: 20019'35,1'' E: 105056'24,0'' 06/12/2010 16h30' N: 20019'35,2'' E: 105056'24,0'' 10 Khánh Cư 01/09/2010 14h00' N: 20012'52,9'' E: 10603'16,0'' 26/10/2010 17h10' N: 20012'53,0'' E: 10603'16,0'' 06/12/2010 17h05' N: 20012'52,9'' E: 10603'15,9''
2.3.2. Xử lý mẫu sơ bộ và bảo quản mẫu
Đối với mẫu nƣớc
Nếu phân tích Hg mẫu được chứa trong chai thuỷ tinh borosilicat còn nếu phân tích asen mẫu phải được đựng trong chai nhựa (chai đựng mẫu đã được rửa sạch, tráng axit). Mẫu được chuyển về bảo quản trong bình đựng đá lạnh (nhiệt độ từ 00C-40C), theo đúng tiêu chuẩn Việt Nam (TCVN 5945 - 1995).
Ngay sau khi chuyển từ hiện trường về phòng thí nghiệm, mẫu nước được lọc qua một màng lọc cenlulo 0,45m của Whatman thu được mẫu nước ở pha lỏng và mẫu huyền phù trên màng lọc. Sau khi lọc, mẫu nước được cho vào bình nhựa PE thể tích 500ml và axit hoá bằng HNO3 đặc(Merk) tới pH < 2. Đối với mẫu