CHƯƠNG 2 : THỰC NGHIỆM
2.5 Xử lý mẫu trầm tích
Qui trình phá mẫu hệ hở được tiến hành theo Tessieretal [31]: Xử lý mẫu đất, trầm tích để xác định hàm lượng tổng các kim loại được tiến hành theo quy trình sau:
Cân khoảng 0,2 gam mẫu trên cân phân tích có độ chính xác 0,0001 gam đã được
xử lý sơ bộ vào cốc teflon dung tích 50 ml. Thêm 4 ml HNO3 đặc, 6 giọt H2O2 đặc đun ở
900C trong vòng 3 giờ. Để nguội cốc, sau đó thêm 3ml HF đặc, đun trong 1 giờ. Thêm tiếp 1ml HClO41:1 đun tiếp trong 1 giờ, đến khi khói trắng bay ra.
Để nguội, lọc rửa phần cặn không tan rồi thu dịch lọc vào bình định mức 50 ml,
thêm 0,75 ml HNO3đặc và định mức đến vạch bằng nước cất 2 lần.
2.6. Xử lý mẫu thực vật
Cân 0,2g mẫu thực vật đã nghiền nhỏ, sấy khô trên cân phân tích có độ chính xác
0,0001g chuyển vào bình Kendal 250 ml có cắm phễu lọc nhỏ. Thêm 3 ml axit HNO3
đặc đun ở 95 oC trong 1h, để nguội thêm 1 ml axit H2SO4 đặc đun ở nhiệt độ 140 oC trong 30 phút. Sau đó để nguội thêm tiếp 2 ml HNO3đặc đun ở nhiệt độ 200 oC cho tới
khi mẫu tan hết. Thêm 3 ml H2O2đun tiếp ở 200 oC đuổi hết khói mầu nâu (NO2), để
nguội, thêm 10 ml H2O, 1 ml H2O2 đun ở nhiệt độ 240 oC cho tới khi khói trắng xuất
hiện, để nguội, lọc bỏ cặn silicat, định mức thành 50ml dung dịch mẫu bằng axit HNO3
2.7. Xử lý thống kê số liệu phân tích [16]
2.7.1 Phân tích thành phần chính (PCA)
Phân tích thành phần (cấu tử) chính là công cụ hữu hiệu cho phép giảm số biến
trong tập số liệu nhằm đạt được biểu diễn hai chiều từ tập số liệu đa chiều bằng cách tìm ra giá trị phương sai lớn nhất với số thành phần chính (PC) hay các biến ảo ít nhất.
Nói cách khác PCA là thuật toán đa biến dựa trên việc quay các trục số liệu chứa
các biến tối ưu. Khi đó, một tập hợp các biến liên quan với nhau được chuyển thành tập
hợp các biến không liên quan và được sắp xếp theo thứ tự giảm độ biến thiên hay phương
sai. Những biến không liên quan này là sự kết hợp tuyến tính các biến ban đầu. Dựa trên
phương sai do mỗi biến mới gây ra có thể loại bỏ bớt các biến phía cuối dãy mà chỉ mất
ít nhất thông tin về các số liệu thực ban đầu. Bằng cách này sẽ giảm được kích thước của
tập số liệu trong khi vẫn có thể giữ nguyên thông tin.
Trong thuật toán PCA, có thể có nhiều PC vì có nhiều biến trong tập số liệu. Số
PC tối đa bằng số biến. Việc dùng PCA có thể tóm lược được cấu trúc đồng phương sai
với tập số liệu có kích thước nhỏ hơn, mà không làm mất đi ý nghĩa của tập số liệu ban đầu. Có thể sử dụng tập số liệu mới này trong tính toán để thay thế cho tập số cũ.
PCA được ứng dụng chủ yếu trong việc giảm kích thước tập số liệu, từ biểu diễn n
chiều trong không gian thành biểu diễn hai hoặc 3 chiều với số biến có ảnh hưởng chính đến tập số liệu.
PCA loại bỏ sự đa cộng tính giữa các biến trong việc xây dựng phương trình hồi
qui biểu diễn sự phụ thuộc của tín hiệu phân tích vào các biến là nồng độ các thành phầntrong hệ. Phương pháp này có tên gọi là hồi qui thành phần chính.
Từ tập số liệu với n biến ban đầu có liên quan mật thiết với nhau, sau khi giảm
thành p biến không liên quan thì trị riêng của chúng có thể sử dụng làm số liệu đầu vào của phương pháp hồi qui kết hợp với mạng noron nhân tạo giải bài toán phân tích đồng
thời các thành phần trong hệ có tương tác không cộng tính.
Nếu xem các số liệu phân tích trong tập số liệu là kết quả phân tích lặp lại thì PCA cho phép tìm được sai số thô trong số các kết quả phân tích.
Tuy nhiên PCA đơn thuần là phương pháp toán học nên các kết quả thu được bị ảnh hưởng rất lớn bởi tập số liệu ban đầu, vì vậy cần kết hợp với những kiến thức chuyên ngành khác nếu không sẽ dẫn đến những giải nghĩa sai lệch.
2.7.2 Phân tích nhóm (CA)
Phân tích nhóm là kỹ thuật phân tích đa biến nhằm phân loại những số liệu có đặc
tính giống nhau thành các nhóm hay còn gọi là các cụm.
Hai loại phân tích nhóm thường được sử dụng là: phân tích nhóm theo bậc và phân tích nhóm k – trung bình.
Phân tích nhóm theo bậc là cách để tìm ra các nhóm trong tập số liệu bằng cách
tạo ra cây phân nhóm. Cây phân nhóm gồm nhiều bậc trong đó nhóm ở một mức được
nối với với nhóm bên cạch ở mức cao hơn. Điều đó cho phép quyết định mức hoặc thang
chia nào của nhóm là phù hợp hơn.
Nhóm theo bậc nhằm tìm ra các nhóm trong tập số liệu bằng cách tạo ra cây phân nhóm. Theo phương pháp này, tập số liệu lớn được chia thành các tập số liệu nhỏ hơn
nữa cho đến khi mỗi tập số liệu nhỏ chỉ còn một phần tử. Cây phân nhóm gồm nhiều bậc trong đó nhóm ở một mức được nối với với nhóm bên cạch ở mức cao hơn. Điều đó cho
phép quyết định mức hoặc thang chia nào của nhóm là phù hợp hơn.
Nhóm theo k - trung bình: các phần tử trong tập số liệu được tách vào k nhóm, các phần tử cùng nhóm được kết hợp với nhau và các nhóm khác nhau được tách ra khỏi
nhau.
2.7.3. Phần mềm máy tính
Các số liệu phân tích lặp lại, phân tích hồi qui, xử lý thống kê đa biến (multivariate
analysis), hoặc đồ thị biểu diễn qui luật phân bố các đại lượng được xử lý bằng phần