1. Trang chủ
  2. » Luận Văn - Báo Cáo

Ứng dụng phân tích thống kê trong đánh giá chất lượng nước dưới đất huyện tân thành, tỉnh bà rịa – vũng tàu

79 0 0
Tài liệu được quét OCR, nội dung có thể không chính xác

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 79
Dung lượng 25,95 MB

Nội dung

Trang 1

TRUONG DAI HOC TAI NGUYEN VA MOI TRUONG TP.HCM KHOA DIA CHAT VA KHOANG SAN

DO AN TOT NGHIEP

UNG DUNG PHAN TiCH THONG KE TRONG ĐÁNH GIÁ CHÁT LƯỢNG NƯỚC DƯỚI ĐẤT HUYỆN TÂN THÀNH, TỈNH BÀ RỊA - VŨNG TÀU

Sinh viên thực hiện: Phan Nguyễn Hồng Ngọc _ MSSV: 0150100025

Khóa: 01DH-DCMT01

Trang 2

TRUONG DAI HOC TAI NGUYEN VA MOI TRUONG TP.HCM KHOA DIA CHAT VA KHOANG SAN

DO AN TOT NGHIEP

UNG DUNG PHAN TiCH THONG KE TRONG ĐÁNH GIÁ CHÁT LƯỢNG NƯỚC DƯỚI ĐẤT HUYỆN TÂN THÀNH, TỈNH BÀ RỊA - VŨNG TÀU

Sinh viên thực hiện: Phan Nguyễn Hồng Ngọc _ MSSV: 0150100025

Khóa: 01DH-DCMT01

Giảng viên hướng dẫn: TS Hoàng Thị Thanh Thủy ThS Nguyễn Hái Âu

Trang 3

¬ _LỜI CẢMƠN —

Đồ án tôt nghiệp là sản phâm được thực hiện lân cuôi cùng của sinh viên trước khi rời khỏi ghế nhà trường Do đó, mọi kiến thức và kỹ năng được truyền đạt sau bao năm học tập tại giảng đường được sinh viên áp dụng tối đa trong sản phầm này Tuy nhiên, đê hoàn thành được tối ưu nhất đồ án tốt nghiệp không thể thiếu sự giúp đỡ tận tình của quý thầy cô hướng dẫn, các anh chị cán bộ Sở Tài nguyên và Môi trường, gia đình và bạn bè đã hỗ trợ tối đa cho sản phẩm này

Xin chân thành gửi lời cảm ơn đến quý thầy cô khoa Địa chất và Khoáng sản đã truyền đạt kiến thức học tập quý báu cho em trong suốt những năm qua Đặc biệt gửi lời cảm ơn sâu sắc đến cơ Hồng Thị Thanh Thủy và thầy Nguyễn Hải Âu đã dẫn dắt, truyền đạt kiến thức, kỹ năng cũng như những nhiệt huyết để em hoàn thành được tốt nhất sản phẩm của mình Xin cám ơn các anh chị cán bộ phòng Tài nguyên nước và Khí tượng thủy văn thuộc Sở Tài nguyên và Môi trường tỉnh Bà Rịa — Ving Tau đã nhiệt tình giúp đỡ và cung cấp bộ dữ liệu quý báu giúp em thực hiện được sản phầm này

Cuối cùng, xin cảm ơn gia đình và bạn bè đã luôn ủng hộ và giúp đỡ nhiệt tình giúp em hoàn thành trọn vẹn sản phẩm này

Trang 4

MUC LUC

TOM x1 .,,ÔỎ 1

MỞ ĐÀU se Tnhh 2

1 TÍNH CÁP THIẾT CỦA ĐỎ ÁN TÓT NGHIỆP -22-©222222E2222222222zcr 2

2 MỤC TIÊU CỦA ĐỎ ÁN TỐT NGHIỆP -22-©22sS22E22221522221122212 221 3

3 NỘI DƯNG VÀ PHẠM VI NGHIÊN CỨU 2. 222E+++2EE2++2EE+22Exerrrrsee 3

4 PHƯƠNG PHÁP NGHIÊN CỨU 2+22+2+2EEE222EE1222152713222712 2211 ee 6

CHƯƠNG 1 TÔNG QUAN -cccsstrsieeerrrriiiiirrriiiiiririiiirrrrrie 7 1.1 TÔNG QUAN CÁC NGHIÊN CỨU TRONG VÀ NGOÀI NƯỚC 7

1.1.1 Tổng quan tình hình nghiên cứu ngoài nước -22222z+2222z+2222zz+- 7 1.1.2 Tổng quan tình hình nghiên cứu trong nước 2222222222222 10

1.1.3 Nhận xét chung - 25222222222 2253512121121212121 2211111212211 1xceE 11

1.2 GIỚI THIỆU KHU VỰC NGHIÊN CỨU -2-22222222E2222EEE2EExerrrree 12

1.2.1 Điều kiện tự nhiên -2-©22+22++2EEE2EEE22E1E27112221271127112711211 2.2 xe 12 1.2.2 Điều kiện kinh tế - xã hội 2-©-22+2+z+2EE22EEE22E122711272122711221222 22 xe 13 1.2.3 Đặc điểm địa chất thủy văn -22+222+2EE2EE1122112221122112711 22112 xe 15

1.2.4 Đặc điểm địa chất thủy văn, địa chất khu vực - s+2z+zz+zzszzezzxzzx 16

CHƯƠNG 2 PHƯƠNG PHÁP NGHIÊN CỨU -s e 24

2.1 PHƯƠNG PHÁP THU THẬP, THAM KHẢO VÀ TỎNG QUAN TÀI LIỆU24 2.2 PHƯƠNG PHÁP PHÂN TÍCH THÓNG KÊ ©2222222222222222222E2Exe 25

2.2.1 Biểu diễn biểu đồ Piper 2-©222222222E2222212221221122112111 2211211 xe 25 2.2.2 Cân bằng lon 222 ©S22+2E92E11921122711221122111211121121117112111111 11C 26

2.2.3 Phân tích thành phần chính (PCA) - 222222222 22EEE2EEE22223222222EExcee 26

2.2.4 Phương pháp phân tích cụm ((CÁA) -2-2+2+£+c+z+£+z+zezerererrerrrerxex 33

CHƯƠNG 3 KẾT QUÁ VÀ THẢO LUẬN -serreerreerre 42

3.1 DIEN BIEN CHAT LUGNG NUGC DUGI DAT KHU VUC NGHIÊN CỨU ceessuveessuvessseseesivesssuvesssvesessvesesussestsessstvstesuesessisssuvstsseesesivssssiestssvesesuvstesueeessesesieeseseeeeete 42 3.1.1 Điều kiện phân tích thống kê của bộ dữ liệu quan tre oe 42

3.1.2 Các nhân tố chính ảnh hưởng đến chất lượng nước khu vực nghiên cứu .42 3.1.3 Sự phân bố dữ liệu các giếng quan trắc khu vực nghiên cứu 48 3.2 CAC CUM GIENG THE HIEN DAC TRUNG CHAT LUGNG NUGC DUGI

DAT KHU VUC NGHIEN CỨU 2-©22222EEE222E5122211271117111 221 erye 51

Trang 5

L KET LUAN 0ooccccccccecccccesesscssessessessessessessussvssucsuessessesassasssessssussusstessesteeseeaesateseessees 2 KIEN NGHI ooo ccccccccsccscssessessecsvessesucsvessessessecevsasssecsvssecsvssusssearessesiesasssesaeenesaveseeese 55

TAI LIEU THAM KHAO 57

3);1080099225 )H.AL ,ÔỎ 59

Trang 6

DANH MUC CAC ki HIEU, CAC CHU VIET TAT BOD CA CBE DO FA HCA HP KT-XH LK LP MP MSA NPK PCA PVC TB TDS UBND Biological Oxygen Demand Cluster Analysis Concentrations Balance Error Dissolved Oxygen Factor Analysis Hierarchical Cluster Analysis Hight Pollutant Kinh tế - Xã hội Lỗ khoan Low Pollutant Middle Pollutant Multivariate Statistics Analysis Đạm-Lân-Kali Principle Component Analysis Polyvinylclorua Trung binh

Total dissolved solids

Trang 7

DANH MUC BANG BIEU

Bảng 1.1 Đặc điểm các giếng quan trắc tầng Pleistocen trên 2-2z+2222zz+2 17

Bảng 1.2 Đặc điểm giếng quan trắc tầng Pleistocen giữa-trên (qp2-3) 19 Bang 1.3 Đặc điểm giếng quan trắc tầng Pleistocen dưới (qp]) -. - 22 Bang 2.1 Ví dụ về Eigenvalue từ PCA 2-22222222222222112221122221122221222221 cee 29

Bảng 2.2 Ví dụ về mối tương quan giữa các biến và thành phần chính 32

Bảng 2.3 Sơ đồ tích tụ cụm - 2-52 2225225225 15225551152215211522151E1EEEEEEEeEerereree 38

Bang 3.1 Kết quả phân tích cân bằng ion -22222222222222E2122222122271122221222221-Xee 42 Bảng 3.2 Ma trận tương quan các thông số chất lượng nước dưới đất mùa khô năm

"00 43

Bảng 3.3 Ý nghĩa hệ số tương quan -22-©222222222EEE2222222122222112222722122222222 e 44 Bảng 3.4 Tổng phương sai giải thích nhân tó 22©222222EE2222E22222222222222222222-2e 44

Bảng 3.5 Rút trích thành phần chính đại diện cho bộ dữ liệu . 2 5s +z£=+z 46

Bảng 3.6 Hàm lượng trung bình các thông số qua các tầng chứa nước đặc trưng 48

Trang 8

DANH MUC CAC HINH VE, DO THI

Hình 1 Sơ đồ nghiên cứu 22+2222222222222212222212222112271122271222111227112271112211 Xe 4

Hình 2 Sơ đồ vị trí huyện Tân Thành, tỉnh Bà Rịa-Vũng Tàu -. - 55555552 6

Hình 1.1 Mặt cắt tầng Pleistocen trên (qp3) -: ¿5+5 22222+2+2x+xzezezzxzxzxrerererrs 17 Hình 1.2 Mặt cắt tầng Pleistocen giữa-trên (qp2-3) 2-©222222zz+2zzczrxerrrrrrrex 19 Hình 1.3 Mặt cắt tầng Pleistocen dưới (qp Ï) - ¿2-2 +2+2+2+z++x+zzezezzxzzzxzezzreers 22 Hình 2.1 Biểu đồ tam giác Piper -2-©-2+2222+2EE22EEE272127121711211.2211211 E1 re 25 Hình 2.2 Biểu đồ Scree của eigienvalues -2-©-22+2Ezc2EE222E222122211 221 cre 31 Hình 2.3 Vi dụ về khoảng cách Euclid giữa hai đối tượng theo hai biến X và Y 34

Hình 2.4 Ví dụ phương pháp phân tích cụm tích tụ dựa vào khoảng cách liên kết 37

Hình 2.5 Ví dụ phân tích cụm tích tụ dựa vào phương sai và dựa vào khoảng cách

bì: 0 37 Hình 2.6 Sơ đồ hình cây trong phân tích cụm -22+2z2+2EE+2EE2+2EE+2Exerrrrrrrex 39

Hình 3.1 Biểu đồ dốc rút trích nhân tố -2ccccccc++rrttttrrrrrrrrrrerrrrrrrrrrr 45

Hình 3.2 Biểu đồ phân bố xu hướng các ion chính trong tầng chứa nước 49 Hình 3.3 Diễn biến Cl-, SO42-, Na+ và TDS mùa khô năm 2012 2z 50

Hình 3.4 Sơ đồ phân bố giếng quan trắc theo khơng gian 2-©22+222222£+ 51

Trang 9

TOM TAT

Ở nghiên cứu này, các phương pháp phân tích thống kê đa biến như phân tích

thành phần chính (PCA) và phân tích cụm (CA) được ứng dụng cho việc xác định sự

biến thiên về không gian của chất lượng nước dưới đất huyện Tân Thành, tỉnh Bà Rịa — Vũng Tàu Các mẫu nước dưới đất được thu thập từ 18 giếng quan trắc vào tháng 4 (mùa khô) trong năm 2012 Mười lăm thông số chất lượng nước (pH, độ cứng, TDS, CT, F, NO;, SO¿7, Crế', Cu”, Ca?" Mg”, Na”, K*, HCO; and Fe””) được lựa chọn để tiến hành phân tích thống kê đa biến

PCA xác định được 3 thành phần chính ảnh hưởng đến chất lượng nước dưới đất với sự thay đổi theo mùa Ba thành phần chính gồm yếu tố nhiễm mặn, hoạt động

nhân sinh và sự tương tác của các thành phần thạch học đã giải thích được 79,244%

biến thiên phương sai của tập mẫu Phân tích cụm (CA) chỉ ra 3 nhóm khác nhau với

sự đồng nhất trong nội bộ từng cụm

Nghiên cứu này thực sự rất cần thiết và hữu dụng khi xử lí một lượng lớn tập

Trang 10

MO DAU

1 TINH CAP THIET CUA DO AN TOT NGHIEP

Nước dưới đất là một hợp phần thiết yếu của tài nguyên nước, đóng vai trò quan trọng trọng các hoạt động sinh hoạt, nông nghiệp và công nghiệp Nước dưới dat thường ít chịu ảnh hưởng bởi các tác động của con người, trong nước dưới đất thường không có các hạt keo lơ lửng, vi sinh hay vi trùng và có chất lượng tốt hơn nước mặt, tuy nhiên nếu không có những biện pháp bảo vệ hợp lí thì vấn nạn ô nhiễm nước dưới đất hoàn toàn có thê xảy ra Ở các vùng đồi núi có mật độ dân số thấp, sự luân chuyển

nước dam bảo được nước dưới đất là sạch, phục vụ tốt cho khai thác nhỏ quy mô hộ

gia đình Ngược lại, ở các vùng đồng bằng với mật độ dân cư lớn, sự xuất hiện của các khu công nghiệp, nông nghiệp cũng như nước thải sinh hoạt đã góp phần không nhỏ trong việc gây ô nhiễm nguồn nước dưới đất

Các chương trình đánh giá chất lượng nước dưới đất thường được đo đạc theo

chu kì các thông số ở các trạm quan trắc nước dưới đất, từ đó đánh giá bộ số liệu qua

việc so sánh với các quy chuẩn, tiêu chuẩn Việt Nam Phương pháp này đơn thuần chi là so sánh các thông số với quy chuẩn rồi từ đó đưa ra kết luận chất lượng nước ở khu

vực nghiên cứu có ô nhiễm hay không mà không nếu được mối quan hệ giữa các thông số cũng như nhân tố chính gây ô nhiễm nguồn nước Chính vì vậy, dé có thể hiểu sâu hơn về chất lượng nước dưới đất ta cần hiểu rõ về mối quan hệ trực tiếp và gián tiếp

giữa các thông số phân tích

Phân tích thống kê đa biến (MSA) bao gồm các kỹ thuật thống kê đa biến khác nhau như phân tích cụm (CA), phân tích thành phần chính (PCA) giúp giải thích cũng

như tinh biến ma trận các đữ liệu phức tạp nhằm hiểu rõ hơn về chất lượng nước dưới

đất, cho phép xác định các nhân tố và nguồn ô nhiễm ảnh hưởng đến chất lượng nước, cung cấp một công cụ hữu ích trong việc quản lí nguồn tài nguyên nước, đưa ra được các giải pháp nhanh chóng đề xử lí các vẫn đề ô nhiễm nguồn tài nguyên nước

Với vị trí địa lí và điều kiện tự nhiên thuận lợi, huyện Tân Thành đã và đang trở

thành một trong ba địa phương có nền kinh tế phát triển bậc nhất tinh Ba Ria — Ving Tàu Theo thống kê của UBND huyện Tân Thành, tỉnh Bà Rịa-Vũng Tàu năm 2012 có

Trang 11

nhiều khu công nghiệp nhất của tỉnh Tuy nhiên, trước sức ép của tốc độ phát triển công nghiệp quá nhanh, huyện Tân Thành đang phải đối mặt với nguy cơ nguồn nước dưới đất đang bị đe dọa với một số dấu hiệu ô nhiễm nghiêm trọng, gây suy giảm chất lượng cuộc sống của người dân sinh sống trong khu vực này

Trước các nội dung trên thì vấn nạn ô nhiễm nước dưới đất đã và đang tác động tiêu cực đến đời sống người dân huyện Tân Thành, tỉnh Bà Rịa - Vũng Tàu Chính vì thế, việc tiền hành thực hiện đề tài “ Ứng dụng phân tích thống kê trong đánh giá chất lượng nước dưới đất huyện Tân Thành, tỉnh Bà Rịa - Vũng Tàu” hiện này là rất cần

thiết, cung cấp công cụ hữu hiệu phục vụ cho các cơ quan có thâm quyền trong việc đề

ra các giải pháp tối ưu nhất giải quyết tình trang 6 nhiễm nguồn nước đưới đất cũng như quản lí bền vững nguồn tài nguyên nước trong khu vực

2 MỤC TIÊU CỦA ĐỎ ÁN TÓT NGHIỆP

2.1 Mục tiêu nghiên cứu chính

Ứng dụng kỹ thuật phân tích thống kê đánh giá chất lượng nước dưới đất huyện Tân Thành, tỉnh Bà Rịa - Vũng Tàu, cung cấp công cụ hữu ích phục vụ quản lí nguồn tài nguyên nước

2.2 Mục tiêu nghiên cứu cụ thé

- Đưa ra các thành phần chính, cụm giếng quan trắc mang các thông số đặc trưng ảnh hưởng đến chất lượng nước đưới đất khu vực nghiên cứu

- Đánh giá được sự thay đổi chất lượng nước dưới đất theo không gian thông qua sự phân bố dữ liệu quan trắc

3 NỘI DUNG VÀ PHẠM VI NGHIÊN CỨU

3.1 Nội dung nghiên cứu

Trang 13

3.1.2 Tóm tắt nội dung nghiên cứu

Để bảo đảm hoàn thiện các mục tiêu nghiên cứu, đề tài đã tiến hành thực hiện các nội dung sau, cụ thể:

e Thu thập tài liệu

- Thu thập báo, chí, sách liên quan đến nội dung nghiên cứu

- Thu thập số liệu quan trắc chất lượng nước

- Thu thập các báo cáo tổng kết về quy hoạch, vận hành mạng lưới quan trắc

khu vực nghiên cứu

- Thu thập các bản đồ địa chất thủy văn, bản đồ địa hình khu vực nghiên cứu

e Xử lí số liệu

- Thống kê mô tả dữ liệu trên phần mềm Excel 2010

- Thống kê đặc điểm địa tầng, cấu trúc giếng quan trắc khu vực nghiên cứu

- Biểu diễn biểu đồ diễn biến chất lượng nước

- Biểu diễn biểu đồ hóa học nước

e Phân tích thống kê đa biến

- Phân tích thành phần chính (PCA) trên phần mềm SPSS 20 - Phân tích cụm (CA) trên phần mềm SPSS 20

e_ Báo cáo kết quả

Báo cáo kết quả đạt được sau quá trình nghiên cứu

3.2 Phạm vi nghiên cứu

Huyện Tân Thành nằm trên quốc lộ 51 tuyến Thành phó Hồ Chí Minh - Vũng Tàu với phía Đông giáp huyện Châu Đức, phía Tây giáp huyện Cần Giờ và thành phố Vũng Tàu, phía Nam giáp thành phố Bà Rịa và phía Bắc giáp huyện Long Thành Diện

tích tự nhiên của khu vực nghiên cứu khoảng 33.825 ha, dân số trung bình khoảng

137.334 người (2015), có 10 đơn vị hành chính gồm 9 x4 va | thi tran

Trong nghiên cứu này, các thông số chất lượng nước dưới đất được lựa chọn trong hai đợt quan trắc vào mùa mưa và mùa khô năm 2012 với bộ dữ liệu được thu

thập từ Sở Tài nguyên và Môi trường tỉnh Bà Rịa-Vũng Tàu bao gồm: Ca”, Mg”,

Na”, KỲ, HCO;, pH, độ cứng, TDS, CT, F, NO;, SO¿”: Cr”* Cu”” và Fe” Các mẫu

Trang 14

" { | ‡ 2 B2 — q/Ta \ eNBi Ầ T11 „ @QT6 HOVEN TAN THANE ` B3 ; CHÚ GIẢI T7 «B4 4 Viti xế š { ồ iti giéng quan trac T4 1 ¬—¬ " — See —— Song, suéi a ———— tm 5001880 OD =—ẻ

Hình 2 Sơ đồ vi trí huyện Tân Thành, tỉnh Bà Rịa-Vũng Tàu

4 PHƯƠNG PHÁP NGHIÊN CỨU

Để hoàn thành tốt mục tiêu nghiên cứu đã đề ra, đồ án tốt nghiệp được tiến

hành thực hiện các phương pháp nghiên cứu chính sau đây

- Phương pháp thu thập, tham khảo và tổng quan tài liệu

Trang 15

CHUONG 1

TONG QUAN

1.1 TÓNG QUAN CÁC NGHIÊN CỨU TRONG VÀ NGOÀI NƯỚC

1.1.1 Tổng quan tình hình nghiên cứu ngoài nước

Phân tích thống kê trong đánh giá chất lượng nước dưới đất bao gồm nhiều phương pháp thực hiện trong đó phương pháp thống kê đa biến (MSA) là một trong những phương pháp nỗi bật và hiệu quả, đã và đang được sử dụng rộng rãi ở các nước

trên thế giới, một số nghiên cứu được công bố đã nêu ra được kết quả chất lượng nước dưới đất ở một số nước như:

Kỹ thuật thống kê đa biến kết hợp nghiên cứu địa chất thủy văn được ứng dụng dé đánh giá chất lượng nước dưới đất ở các vùng bán khô hạn, khu nông nghiệp truyền thống Yinchuan thuộc Tây Nam Trung Quốc, nằm gần khu vực thượng nguồn sông

Yellow Họ tiến hành phân tích đặc tính hóa học của các mẫu nước thu thập được từ

39 trạm quan trắc trước vụ hè thu năm 2011, đồng thời sử dụng kỹ thuật thống kê đa biến và địa thống kê để giải quyết van đề trên Các nhân tố ảnh hưởng đến chất lượng nước được tìm thấy bằng phương pháp phân tích thành phần chính (PCA) và phân tích

cum (CA) PCA biéu dién những biến quan trọng đại diện cho sự bốc hơi mạnh mẽ bởi

khí hậu khô hanh (pH, TDS, SO,”), sự hòa tan khoáng (F' và HCO¿) ; các hoạt động

nhân sinh bao gồm xử lí nước thải và phân bón hóa học (NH¿”, NO;') Phương thức Q của phân tích cụm chỉ ra được ba loại nước riêng biệt biểu thị các thành phần hóa học

khác nhau Trong khi đó, phương thức R biểu diễn hai cụm riêng biệt từ trạm lấy mẫu

cho thấy khu vực nghiên cứu xuất hiện dấu hiệu chịu ảnh hưởng bởi tác nhân tự nhiên

và nhân sinh (Xuedi Zhang, et al., 2014)

Ở Tây Ban Nha, phương pháp trên được ứng dụng cho khu vực Bajo Andarax

Cụ thể hơn, khu vực nghiên cứu trên xác định các thành phần chính gây biến động chất

lượng nước dưới đất Kết quả thu được gồm ba nhân tố (V1 ảnh hưởng từ sunphate:

SO¿7, Ca”, Sr””, V2 ảnh hưởng từ nhiệt độ: pH, nhiệt độ, Li”, V3: ảnh hưởng từ đại

Trang 16

cách này, họ có thể đánh giá được sự thay đổi theo không gian và thời gian của quy trình lí hóa liên quan đến ba nhân tố chính tác động đến chất lượng nước dưới đất khu vuc nghién ctru (Francisco Sanchez-Martos, et al., 2001)

Kỹ thuật phân tích thống kê đa biến, phân tích cụm thứ bậc, phân tích thành phần chính kết hợp với biêu đồ hóa nước tam giác truyền thống được ứng dụng đề xác

định các nhân tố ảnh hưởng đến chất lượng nước dưới đất thuộc khu vực ven bờ, tỉnh

Fujian phía nam Trung Quốc Các mẫu nước dưới đất được thu thập ở 12 trạm quan trắc vào tháng 1 (mùa khô) và tháng 7 năm 2011 (mùa mưa) Mười một thông số chất lượng nước (pH, độ cứng, TDS, Ca”, Mg”', Na”, C”, SO¿”, HCO; _, NO;_, Mn) được

lựa chọn đêt thực hiện phân tích thống kê đa biến Trong suốt mùa mưa và mùa khô,

kết quả PCA đưa ra được 3 thành phần chính có ý nghĩa nhằm giải thích quá trình nhiễm man (TH, TDS, Mg”*, Na‘, CI, and SO,”), sự tương tác của đất đá (pH, Ca”, HCO;_, and Mn) và ô nhiễm nhân sinh (NO; _ ) ảnh hưởng như thế nào đến chất lượng nước ngầm thuộc khu vực nghiên cứu Ba nhân tố được giữ lại này giải thích được 90.3% và 80.3% tổng phương sai của bộ dữ liệu mùa mưa và mùa khô Phân tích cụm sử dụng thủ tục Ward với thước đo là bình phương khoảng cách Euclidean, nó chỉ ra

được sự phân bố của các giếng quan trắc dựa trên chất lượng nước của từng giếng Các

mẫu nước từ 12 giếng quan trắc được gom lại thành 3 nhóm riêng biệt nhằm miêu tả

sự khác biệt của các tướng thủy hóa của khu vực nghiên cứu Kết quả trên đã chứng

minh rằng phương pháp phân tích đa biến như HCA, PCA rất hữu dụng trong việc

định lượng sự ô nhiễm nước dưới đất cũng như nhân dạng được đặc tính thủy hóa của

nước đưới đất (Qingchun Yang, et al., 2015)

Bên cạnh những ứng dụng trong lĩnh vực nước dưới dat, các nghiên cứu về ứng dụng phương pháp phân tích thống kê đa biến cũng đã được thực hiện ở một số khu vực điều tra chất lượng nước mặt thuộc các quốc gia trên thế giới như:

Ở Thổ Nhĩ Kỳ, kỹ thuật thống kê đa biến đã được áp dụng đề đánh giá chất

lượng nước mặt tại khu vực biển Đen Mục đích của nghiên cứu này là điều tra sự thay

đôi chất lượng nước mặt theo không gian và thời gian Các mẫu nước được thu thập từ mười trạm quan trắc trên các sông và khu vực biển từ năm 2007 đến 2008 Hai lăm

thông số chất lượng nước được lựa chọn để phân tích (Carbon tổng, carbon vô cơ,

Trang 17

bé mat, amoni, nitrite, nitrate, phospho tong, halogen hitu co, sulfate, d6 ing, oxy hoa

tan, pH, nhiệt độ, tổng chất rắn hòa tan, độ dẫn điện, độ mặn) Phương pháp phân tích PCA, CA được sử dụng dé phân tích độ tương đồng của các vị trí quan trắc, xác định

nguồn gốc và sự phân bố của các thông số chất lượng nước Phân tích thành phần chính (PCA) được thực hiện bằng phương pháp xoay Varimax, kết quả thu được ba nhân tố chính ảnh hưởng đến chất lượng nước giải thích 82.24% tông phương sai và có liên quan đến nguồn ô nhiễm hữu cơ (nước thải dân sinh), ô nhiễm vô cơ (nước thải công nghiệp) và ô nhiễm dinh dưỡng (hoạt động nông nghiệp) (Feryal Akbal, et aL,

2010)

Ở Ấn Độ, kỹ thuật thống kê đa biến cũng đã được nhóm nghiên cứu (Gholami Siamak Srikantaswamt) áp dụng trong đánh giá chất lượng nước sông vùng lân cận của Đập KRS, Karnataka năm 2009 Kết quả trên đã giúp các cơ quan có thầm quyền quản lí, quy hoạch tài nguyên nước trong khu vực với nhiều mục đích khác nhau trong tương lai Các thông số chất lượng nước như oxy hòa tan, nhu cầu oxy hóa học, nhu cầu oxy sinh hóa và các thông số khác cũng đac được lựa chọn phân tích Kết quả thu

được so sánh với các quy chuân cho phép, các tham số có ý nghĩa thống kê (P<0,01)

khi quan trắc từ thượng lưu đến hạ lưu sông, đặc biệt là vào mùa hè Bên cạnh đó, các

thông số chất lượng nước còn được tính toán mối tương quan giữa chúng (Taqveem

Ali Khan, 2015)

Đối với Nhật Bản, kỹ thuật thống kê đa biến cũng được áp dụng trong việc đánh giá chất lượng nước lưu vực sông Fujji Các kỹ thuật thống kê đa biến bao gồm phân tích cụm (CA), phân tích thành phần chính (PCA), phân tích nhân tổ (FA) va phan tích

biệt tích với 12 thông số tại 13 trạm quan trắc khác nhau Kết quả phân tích cụm thứ bậc phân ra được 3 cụm từ 13 vị trí quan trắc với vị trí ít ô nhiễm (LP), ô nhiễm trung

Trang 18

quả từ nghiên cứu trên đã chứng minh sự hữu ích của ký thuật thống kê đa biến trong phân tích và giải thích bộ dữ liệu phức tạp, phát hiện ra nguồn ô nhiễm cũng như các yếu tố thay đổi theo không gian và thời gian ảnh hưởng đến chất lượng nước từ đó đưa

ra các biện pháp quản lí hiệu quả (Shrestha S and Kazama F, 2007)

1.1.2 Tống quan tình hình nghiên cứu trong nước

Hiện nay, các nghiên cứu về ứng dụng kỹ thuật thống kê đa biến (MSA) phần lớn được sử dụng ở các quốc gia trên thế giới Một số nghiên cứu được công bố trong nước trong việc ứng dụng phương pháp nảy với mục tiêu phân tích chất lượng nước

mặt

Ở lưu vực sông Thị Tính, các kỹ thuật phân tích thống kê đa biến đã bước đầu được áp dụng trong đánh giá chất lượng nước sông Các thông số phân tích như: DO,

BOD, va một số thông số vật lí hoặc hóa học khác được phân tích, và các kết quả phân

tích được so sánh với các tiêu chuân giới hạn cho phép tương ứng Trong nghiên cứu này, sau khi thống kê tóm tắt nồng độ và đánh giá diễn biến chất lượng nước sông Thị Tính, các phương pháp Phân tích cụm (Cluster Analysis), Phân tích thành phần chính (Principal Component Analysis) va Phan tich nhan t6 (Factor Analysis) trong phuong

phap thống kê đa biến được sử dụng để giải thích ma trận dữ liệu phức tạp, qua đó

hiểu rõ những thay đổi trong chất lượng nước và hiện trạng sinh thái của hệ thống nghiên cứu, từ đó cho phép cung cấp một công cụ đáng tin cậy để quản lí tài nguyên nước Kết quả nhận định được rằng có 2 nhân tố chính giải thích 94,290% của tông phương sai ảnh hưởng đến chất lượng nước của sông Thị Tính gồm: (1) Các nguồn thải nhân tạo (nguồn thải hữu cơ từ đô thị, dân cư tập trung và công nghiệp chế biến thực phâm); (2) Các nguồn ảnh hưởng tự nhiên (độ mặn do ảnh hưởng của thủy triều

và hàm lượng chất rắn lơ lửng do xói mòn đất, các chất bân bề mặt trên lưu vuc, trong

đó nhân tố 1 tác động lớn nhất đến chất lượng nước sông (Nguyễn Hải Âu và Vũ Văn

Nghị, 2014)

Ở lưu vực sông Như Ý tỉnh Thừa Thiên Huế, tác giả Nguyễn Minh Kỳ và cộng sự đã nghiên cứu đánh giá chất lượng nước bởi các chất dinh dưỡng và hữu cơ cũng như xác định áp lực môi trường, xem xét tác động tải lượng chất ô nhiễm lên sông Như Ý, tỉnh Thừa Thiên Huế Với năm trạm lấy mẫu, nghiên cứu đã tiễn hành quan

Trang 19

oxi sinh héa (BODs), nhu cầu oxi hóa học (COD), nitrate (NO; ) và phosphate (PO,*) Nghiên cứu sử dụng kỹ thuật thống kê đa biến như phân tích tương quan, phân tích thành phần chính (PCA), và phan tich cum cluster (CA) dé danh gia chất lượng nước Phân tích tương quan chỉ ra sự tồn tại liên hệ có ý nghĩa thống kê giữa các thông số

chất lượng nước như nhiệt độ với DO và BOD; với COD (p<0,01) Kỹ thuật PCA

được áp dụng để xem xét phân nhóm đữ liệu và chỉ ra các nhóm nhân tố làm thay đổi chất lượng nước Kết quả PCA trích xoay nhân tố gồm hai nhóm chính với tổng phương sai 62,207% Trong đó, nhóm nhân tố đầu tiên chiếm 40,873% tông phương sai gồm các thông số nhiệt độ, DO, BOD5 và COD Nhóm nhân tố thứ hai bao gồm NO;- va PO,* voi 21,334% tong phương sai, đồng thời được đặt tên và giải thích bởi quá trình xả thải liên quan đến các hoạt động nông nghiệp Tương tự, kết quả phân tích

CA cũng xác lập và phân nhóm lần lượt BOD:, COD, nhiệt độ, DO (nhóm 1) và NOy,

PO¿” (nhóm 2) (Nguyễn Minh Kỳ và Nguyễn Hoàng Lâm, 2014)

1.1.3 Nhận xét chung

Nhìn chung, những công trình nghiên cứu trong và ngoài nước đều đạt được những kết quả to lớn về cơ sở khoa học cũng như ứng dụng thực tiễn Ở Việt Nam, việc ứng dụng kỹ thuật thống kê đa biến vẫn còn rất hạn chế, chỉ có một số công bố khoa học về ứng dụng phương pháp này ở lĩnh vực nước mặt, thêm vào đó các nghiên cứu trên cũng chỉ dừng lại ở bước đầu nghiên cứu mà chưa có một ứng dụng cụ thể

nào thực tế Đối với nước dưới đất, hiện các công bố khoa học còn rất hạn chế hoặc thậm chí vẫn chưa được thực hiện ở khu vực cụ thể nào Chính vì vậy, việc ứng dụng

kỹ thuật thống kê đa biến trong phân tích chất lượng nước dưới đất là một đề tài mang

tính mới, có tiềm năng lớn trong việc cung cấp một công cụ hữu ích, một cái nhìn mới

hơn về chất lượng nước dưới đất, giúp các nhà ra quyết định dé dang trong việc quản li bền vững nguồn tài nguyên quý giá này Tuy nhiên, trong giới hạn của đề tài do sinh viên thực hiện và tài liệu hạn chế, sinh viên chỉ giới hạn phương pháp nghiên cứu kỹ thuật thống kê trong phân tích chất lượng nước dưới đất huyện Tân Thành, tinh Ba Ria

— Vũng Tàu dựa trên bộ dữ liệu thu thập được từ Sở Tài nguyên và Môi trường tỉnh Bà

Trang 20

1.2 GIỚI THIỆU KHU VỰC NGHIÊN CỨU 1.2.1 Điều kiện tự nhiên

a) Địa hình

Khu vực nghiên cứu có địa hình vùng đồng bằng và bình nguyên với những núi sót rải rác, có xu hướng thấp dần theo hướng bắc- nam Có thể phân biệt thành 3 dạng

địa hình chính như sau:

e_ Địa hình đồng bằng

Địa hình đồng bằng thềm thấp có độ cao từ 5m đến 10m hoặc có nơi chỉ cao từ 2m đến 5m dọc theo các sông và địa hình tring trên trầm tích sông biển, đầm lầy biển với độ cao từ 0,3m đến 2m, có chỗ thấp hơn mực nước biển Dạng địa hình này phân

bố đọc theo các sông lớn và ven biên, tạo thành một đải kéo dài từ tây sang đông dọc

theo bờ biển

Địa hình đồng bằng thềm cao có độ cao địa hình từ 10m đến 50m, bề mặt tương

đối bằng phẳng, phân bồ thành dải theo chân đồi núi thấp phía tây và đơng tinh ¢ Dia hình đồi lượn sóng

Là dạng địa hình cao nguyên núi lửa nằm ở phía bắc và đông bắc tỉnh, đây

chính là phần ria cua cao nguyén bazan Xuân Lộc với bề mặt san bằng khá lớn, cao độ

biến đổi từ 50m đến 200m, độ dốc từ 3° đến 8°, ria ngoài của chúng có độ dốc lớn e Địa hình đồi núi thấp

Địa hình đồi núi thấp bao gồm các núi sót rải rác và là phần cuối cùng của dãy Trường Sơn với độ cao biến đổi lớn từ 30m đến 500m, trung bình là 200m Độ đốc cao tir 20° dén 30°, đỉnh thường bị bào mòn mạnh Thành phần chủ yếu là đá granit

b) Khí hậu

Vùng nghiên cứu chịu ảnh hưởng của khí hậu nhiệt đới gió mùa cận xích đạo với chế độ nhiệt tương đối ổn định, quanh năm cao Hàng năm có hai mùa rõ rệt: mùa

khô và mùa mưa Mùa mưa bắt đầu từ tháng 5 đến tháng II và mùa khô kéo dài từ

Trang 21

dau từ tháng 4 đến tháng 10 Quy luật chung là vùng ven biển mùa mưa thường đến sớm và kết thúc muộn hơn so với miền núi ven cao nguyên

Nhiệt độ không khí: nhiệt độ không khí bình quân dao động từ 26,1+29,2°C,

nhiệt độ trung bình tháng cao nhất đạt 30,4°C và thấp nhất là 25°C Phía nam vùng chênh lệch nhiệt độ thấp hơn do có sự điều hòa của gió biển Biến thiên nhiệt độ trung bình hàng tháng trong năm không lớn, từ 3+5°C, nhưng chênh lệch nhiệt độ ngày và

đêm thường lớn, từ ó+8°C

Độ ấm không khí: độ ẩm không khí trung bình nhiều năm dao động từ 75,8+82,8%, d6 4m cao nhất thường vào tháng 9 và tháng 10, có khi đạt đến 87% và

thấp nhất vào các tháng mùa khô, có khi chỉ đạt 72%

Bốc hơi: lượng bốc hơi bình quân trong năm dao động từ 1.231+1.571mm, phụ

thuộc vào độ âm và nhiệt độ không khí Lượng bốc hơi cao nhất vào các tháng mùa

khô (có độ âm thấp nhất) và thấp nhất vào các tháng mùa mưa

Gió: hướng gió chính thay đổi theo mùa, mùa khô đón gió đông bắc do ảnh

hưởng gió mùa đông bắc, khí hậu mát mẻ dễ chịu; mùa mưa chịu ảnh hưởng của gió

mùa tây nam Tần suất lặng gió trung bình năm là 26%, lớn nhất là tháng 8 (33,5%), nhỏ nhất là tháng 4 (14,1%) Tốc độ gió trung bình 2+3m/s

1.2.2 Điều kiện kinh tế - xã hội a) Dân cư

Theo kết quả điều tra dân số năm 2013, dân số toàn huyện là 137.334 người Dân cư chủ yếu là người Việt, ngoài ra còn có người Hoa, Châu Ro, Khmer, Mường, Tày

Với yêu cầu phát triên KT-XH huyện Tân Thành, lực lượng lao động vẫn đủ đáp ứng về số lượng, nhưng về mặt chất lượng cần phải đào tạo dé nâng cao trình độ cho lực lượng lao động phô thông Riêng lực lượng lao động chuyên sâu, trình độ cao trong các ngành nghề công nghiệp dầu khí, lao động đánh bắt hải sản, trồng rừng phải đưa từ nơi khác đến

b) Kinh tế

Huyện Tân Thành là nơi có nhiều đi tích, danh thắng, chùa chiền thuận lợi cho

Trang 22

Sông Thị Vải với chiều đài khoảng 32 km, sâu từ 10 — 20 m, rong trung bình 600 — 800 m là điều kiện thuận lợi của huyện Tân Thành trong việc xây dựng các cảng

cho tàu lớn đến 50.000 — 60.000 tấn Hoạt động sớm nhất là cảng Bà Rịa — Serece dài

300 m, tàu 60.000 tấn đã cập bến và cảng nhà máy điện Phú Mỹ dài 175 m cho tàu 10.000 tan neo dau dé cap dau

Có cảng nước sâu Thị Vải, có đường quốc lộ 51 và đường dẫn khí đốt chạy qua, trong tương lai sẽ có thêm tuyến đường sắt Biên Hòa - Phú Mỹ, Vũng Tàu Huyện Tân Thành hiện là nơi tập trung nhiều khu công nghiệp nhất của tỉnh Theo quy hoạch, cả tỉnh có 9 khu công nghiệp tập trung, trên địa bàn huyện Tân Thành đã có 5 khu gồm:

Mỹ Xuân AI (300 ha), Mỹ Xuân A2 (370 ha), Mỹ Xuân BI (222 ha), Phú Mỹ I (954 ha), Cái Mép (660 ha) Hàng loạt các nhà máy lớn đã và đang triển khai xây dựng như: nhà máy điện Phú Mỹ 2-1, Phú Mỹ 1, Phú Mỹ 2, Phú Mỹ 3, nhà máy thép VINA-

KYOEI, nhà máy phân bón NPK, nhà máy gạch men Mỹ Đức, nhà máy sản xuất thùng phuy, các nhà máy xay lúa mì, bột mì, sản xuất hạt nhựa PVC, sản xuất nhựa đường, sản xuất ống thép, cốt thép, thuộc da, chế biến thực phẩm và thức ăn gia súc

Bên cạnh đó, huyện Tân Thành cũng là địa bàn có nhiều mỏ vật liệu xây dựng

nhất tỉnh, về đá có các mỏ ở núi Ông Câu, Núi Dinh, về đất sét có mỏ ở Mỹ Xuân,

Châu Pha, về đất cát san lấp có các mỏ ở Suối Đá, Suối Ngọt

Hơn thế nữa, huyện Tân Thành còn có điều kiện phát triển một số cây con trong sản xuất nông nghiệp Diện tích trồng rau khoảng 1.000 ha, cây ăn quả khoảng 2.200 ha nhiều nhất tỉnh, diện tích trồng điều khoảng 1.000 ha (đứng thứ hai sau huyện Xuyên Mộc), diện tích trồng cà phê khoảng 2.050 ha (đứng thứ ba sau huyện Châu Đức và Xuyên Mộc) Chăn nuôi khá phát triển, tổng đàn gia cầm đứng đầu tỉnh

c) Nhu cầu nước cho sinh hoạt và tình hình khai thác nước dưới đất

Nước dưới đất là nguồn tài nguyên đóng vai trò quan trọng trong nhu cầu sinh hoạt của một số xã thuộc huyện Tân Thành Nhu cầu sử dụng nước cho sinh hoạt và

hoạt động khai khác nước dưới đất là rất cần thiết

e Nhu cầu nước cho sinh hoạt

Tổng lưu lượng khai thác nước dưới đất là 50.982m”/ngày, trong đó: - Sử dụng cho ăn uống, sinh hoạt là 36.094mỶ/ngày

Trang 23

¢ Mire dé khai thac nuée duéi dat

Một số xã có mức độ khai thác >100 và <200m/ngày/km” là Mỹ Xuân, Tân Hải, Sông Xoài và Hắc Dịch

Các xã còn lại có mức độ khai thác < 100mỶ/ngày/knỶ 1.2.3 Đặc điểm địa chất thủy văn

a) Sông, suối

Hệ thống sông Thị Vải chằng chịt với quy mô lớn nằm ở phía tây huyện Tân Thành có mật độ dòng mặt cao nhất ở khu vực thấp, có thủy triều xâm nhập sâu vào

nội địa từ I+3km

Hệ thống sông suối này có nguồn cung cấp ổn định là nước ngầm Nước mưa chỉ bổ sung cho chúng vào mùa mưa nhưng lại chiếm tới 70% lưu lượng hàng năm Nước thường có độ khoáng hóa nhỏ, từ siêu nhạt đến nhạt

Huyện Tân Thành còn có hồ chứa nước Châu Pha thuộc xã Châu Pha với dung

tích trung bình là 1,78.106 m3 (2010)

Sông Thị Vải chịu ảnh hưởng của biển, là nơi thoát của các dòng mặt thuộc hệ

thống sông trên cũng như của nước ngầm Sự xâm nhập của biển trải hết toàn khu vực này Độ khoáng hóa cao từ vài g/l đến hàng chục g/1, loại hình nước hóa học chủ yếu

là Clorur natri Sông Thị Vải bị nhiễm mặn và không thể sử dụng cho các hoạt động

sản xuất, tuy nhiên vẫn có ý nghĩa về giao thông rất lớn b) Biển

Biển Đơng bao bọc tồn bộ ranh giới phía nam và đông nam tỉnh Bà Rịa - Vũng Tàu với hơn 200km bờ biển trong đó có huyện Tân Thành, do đó toàn bộ mạng lưới thủy văn ở phía tây và nam giáp biển đều chịu ảnh hưởng lớn của triều Biển Đông và theo sông vào sâu trong đất liền Triều Biển Đông có chế độ bán nhật triều, ngày

đêm có 2 đỉnh và 2 chân triều, mỗi tháng có 2 chu kỳ triều Biên độ dao động triều

tương đối lớn, từ 3+4m tùy theo thời gian trong năm

Trang 24

giờ va thời gian chu kỳ triều ngày là 24,83 giờ Độ cao của mỗi đỉnh và chân triều biến

đôi từ ngày này sang ngày khác trong 1 chu ky triéu là 15 ngày

Chế độ triều Biển Đông ảnh hưởng trực tiếp đến mạng thủy văn trong vùng, nước biên xâm nhập vào sát chân các địa hình cao, làm ngập hầu hết các đồng bằng thấp và bãi lầy tạo thành rừng ngập mặn (Sở Tài Nguyên và Môi Trường, 2014)

1.2.4 Đặc điểm địa chất thủy văn, địa chất khu vực

Huyện Tân Thành, tỉnh Bà Rịa - Vũng Tàu tồn tại 3 tầng chứa nước lỗ hổng chính:

- Tầng chứa nước lỗ hồng các trằm tích Pleistocen trên (qp3)

- Tầng chứa nước lỗ hồng các trằm tích Pleistocen giữa — trên (qp2-3) - Tầng chứa nước lỗ hồng các tram tích Plieistocen dưới (qpl)

a) Tầng chứa nước lỗ hồng các trầm tích Pleistocen trên (qpa)

Tầng chứa nước Pleistocen trên phân bố thành một dải dài từ tây sang đông dọc theo ranh giới phía nam của tỉnh từ Tân Thành xuống Bà Rịa, Vũng Tàu qua Long

Điền, Đất Đỏ đến Xuyên Mộc, đôi chỗ bị gián đoạn bởi các núi sót nằm rải rác hoặc bị

bảo mòn Phần lớn bị phủ bởi thành tạo rất nghèo nước Holocen (Q¿) và Pleistocen

trên (Q3, một vài nơi lộ trực tiếp trên mặt Các trầm tích này phủ trực tiếp lên trên

Trang 25

HUYEN TAN THANH = = = TT Pho My = Q; os =) “aro i =~ ## Nạ? (Nguôn: Sở Tài nguyên và Môi trường tỉnh Bà Rịa-Vũng Tầu) Hình 1.1 Mặt cắt tầng Pleistocen trên (qp3) Bảng 1.1 Đặc điểm các giếng quan trắc tầng Pleistocen trên i - Chiéu

< TANG CHUA sâu thực | Ống lọc

TRAM QUAN TRAC NUOC LO HONG téLK (a) Dia tang

CAC TRAM TICH (m)

QT5B 25 14-18: 4

VT4B 15 5-10:5

VT6 15 2-7: 6

NBIB TANG 16 8-12:4 Hệ tầng Củ

PLEISTOCEN TREN Chi (tram tich

(qp3) với bê dày TB sông, sông- NB2C là 6,9m 16 8-12:4 biển) NB3A 30 22-26:4 NB3B 23 14-18:4 QT7B 20 10-14:4

(Nguôn: Sở Tài nguyên và Môi trường tinh Ba Ria-Viing Tau) Thành phần thạch học gồm chủ yếu là cát hạt mịn đến trung thô chứa sạn sỏi,

có nơi lẫn sét bột hoặc xen kẹp các thấu kính mỏng sét bột, bột cát mịn Loại hình hóa

học nước chủ yếu là Clorua Natri, Clorur-Bicarbonat Natri, Bicarbonat-Clorur Natri- Calci

Trang 26

+* Thành tạo Pleistocen thượng (Q,°)

Ỏ đây trầm tích sông lộ trên mặt với bề dày 24,5m, tạo thềm cao 5-15m gom san, cudi, cat va sét kaolin

¢ Hé tang Ca Chi (amQ,*cc)

- Chiều sâu TB: 30-35 m đến 50 m

e_ Cát bột nhiều cuội sỏi, sạn thạch anh, 7m

Thạch anh: SiO; (Si: 40,7% + nhiều khoáng vật khác) Flourit hay đi kèm với thạch anh, là khoáng chính của granit và các đá macma khác (CaF›)

Manhetit: FeFeaO¿ (FeO: 31%; Fe2O3: 69%)

Mica: [A1Si3019] chứa Mg, Fe, AI Flourit: CaF; Felspat: (100-n)Na[A1Si;0g]nCa[AI,Si,03]

Sét bột Kaolinit Al4[SisO;0][OH]6; Monmorlort: (Al,Mg)2[SisOjo] lit:

[Kal;[S1A1I]zO:o][OH]nH;O

Zircon: Zr[SiO4] (ZrO: 67,1%; SiO: 32,9%)

Tuamalin: (Na,Ca)(Mg,Al)6[B3A];Si6(O,OH)30]; S102: 30-44%; B2O3: 8-12%; AlOs:

18-44%; MgO: 25%; Na;O: 6%; HO: 1-4%

Thạch cao: CaSOxu.2H;O Đá vôi: CaCO;

Tạp chat: Silic, Dolomit CaMg[CO;]; với CaO: 30,4%; MgO: 21,7% e Laterit, 2-4m

Kaolin, gipxit, Al, Fe, Mn

e Cát bột xám trắng lẫn cát hạt thô, 2-3m đến vài chục mét

Ngoài ra còn đặc biệt chứa các khoáng vật nhóm sulphua (pyrit, chancopirit, feomango piroluzit) dẫn đến việc hàm lượng Fe và Mn ở khu vực này khá cao (Trần Văn Trị và

Vũ Khúc, 1997)

Nguồn cung cấp chính cho tầng là nước mưa và nước mặt thấm trực tiếp từ trên xuống, miền thoát hướng ra biển và các sông rạch trũng thấp Hướng vận động của nước khá phức tạp, phụ thuộc vào dạng địa hình nhưng nhìn chung nước vận động từ đỉnh phân thủy xuống các thung lũng sông suối, từ nơi có địa hình cao xuống nơi có địa hình thấp

Trang 27

khoan nhỏ lẻ qui mô hộ gia đình hoặc các giếng khoan khai thác cấp công nghiệp qui mô trung bình

b) Tầng chứa nước lỗ hỗng các trầm tích Pleistocen giữa - trên (qpz)

Tầng chứa nước Pleistocen giữa-trên có diện phân bố rộng từ tây sang đông dọc

theo ranh giới phía nam của tỉnh, đôi chỗ bị gián đoạn bởi các núi sót năm rải rác, diện

phân bố lớn hơn tầng chứa nước Pleistocen trên Tầng chứa nước này lộ rải rác trên mặt ở huyện Xuyên Mộc, phần còn lại bị phủ trực tiếp bởi các thành tạo rất nghèo nước Pleistocen giữa-trên (Q¡””) và phủ trực tiếp lên thành tạo rất nghèo nước HUYỆN TÂN THÀNH (Nguôn: Sở Tài nguyên và Môi trường tinh Ba Ria-Viing Tau) Hình 1.2 Mặt cắt tầng Pleistocen giữa-trên (qp2-3) Bang 1.2 Dac điểm giếng quan trắc tầng Pleistocen giữa-trên (qp2-3)

{ TANG CHUA vâu thực Ong loc

TRAM QUAN TRAC | NUGC LO HONG tếLK mm Dia tang

CAC TRAM TiCH (m)

QT5A 25 14-18: 4

VT4A TANG PLEISTOCEN | — 15 Š-10:5 | Hệ tầng Thủ

NBIA TREN (qp3) với bề 15 2-7:6 | Đức (sông,

dày TB là 6,9m sông — biên)

1 -12:

NB2A 6 8-12:4

Trang 28

Chiéu

‘ TANG CHÚA âu thực | Ống lọc à

TRAM QUAN TRAC | NƯỚC LÔ HÓNG | Ÿ ¿[| (mỳ | Dia tang

CAC TRAM TICH | “ (m) l6 | 8-12:4 NB2B NB4 30 | 22-26:4 VT2B 23 | 14-18:4 QTII 20 —_ | 10-14:4 QT7A 22 | 15-20:5

(Nguôn: Sở Tài nguyên và Môi trường tinh Ba Ria-Viing Tau) Thành phần thạch học gồm chủ yếu là cát hạt mịn đến trung thô chứa sạn sỏi,

có nơi lẫn sét bột hoặc xen kẹp các thấu kính mỏng sét bột, bột cát mịn Loại hình hóa

học nước chủ yếu là Clorur Natri, Bicarbonat Natri, Bicarbonat-Clorur Natri-Calci, Bicarbonat-Clorur Calci

+* Thành tạo Pleistocen trung-thượng (Q3

Trầm tích sông lộ ra dọc các sông suối, dày 25m gồm cuội, sỏi, sạn lẫn cát chứa

kaolin và cát bột sét

+ Hệ tầng Thủ Đức (aQ¡?/#)

- Chiều sâu TB: 4-30m

e Cat, cudi, sói nhiều thành phần, có cuội tectit mài tròn, 4 m

Thạch anh: SiO; (Si: 40,7% + nhiều khoáng vật khác) Flourit hay đi kèm với thạch anh, là khoáng chính của granit và các đá macma khác (CaF¿) (La Thị Chích, 2010) Felspat: (100-n)Na[AISIzOs]nCa{ AlaS1›O;]

Zircon: Zr[SiO4] (ZrO: 67,1%; SiO: 32,9%) Flourit: CaF,

Tuamalin: (Na,Ca)(Mg,Al)¢[B3Al;Sig(0,OH)30]; Si02: 30-44%; B,O3: 8-12%; Al,O3:

18-44%; MgO: 25%; Na;O: 6%; HO: 1-4%

Apatit: Cas[PO.4]3(F,Cl)

- Flo-apatit: CaO: 55%; P05: 42,3%; F: 3,8% - Clo-apatit: CaO: 53,8%; P205: 41%; Cl: 6,8% Chứa: Na;O, CeO;, MgO, Fe2O3, Al,O3

Thạch cao: CaSOa.2H;O Da voi: CaCO3

Manhetit: FeFe,O4 (FeO: 31%; Fe,03: 69%)

Trang 29

e Cat, san chira kaolin, 12m Kaolin: Alz[S14Oio]s(OH)s

Gồm: AlzO; 39,5%; SiO; 46,5%; H;O 14,5% Chứa tạp chất Fe;O, MgO, CaO, Na;O,

K;O, Ba;O

Ngoài ra hệ tầng còn chứa các khoáng sét Kaolimt Alz[S1O¡o][OH]s; Monmorilorit:

(AI,.Mg)z[Si4Oio] Iit: [Kals[SiAI]¿O¡o][OH]nH;O (Nguyễn Uyên và nnk, 2010)

Nguồn cung cấp chính cho tầng là nước mưa và nước mặt thấm trực tiếp ở những vùng lộ và thấm xuyên từ các tầng chứa nước bên trên, miền thoát hướng ra biển và các sông rạch trũng thấp Hướng vận động của nước khá phức tạp, phụ thuộc vào dạng địa hình nhưng nhìn chung nước vận động từ đỉnh phân thủy xuống các thung lũng sông suối, từ nơi có địa hình cao xuống nơi có địa hình thấp (Nguyễn Khắc Cường, 2005)

Tóm lại, tầng chứa nước Pleistocen giữa-trên có diện phân bố rộng, chiều dày biến đổi lớn, mức độ giàu nước từ nghèo đến giàu, nước nhạt, thích hợp với các giếng khoan nhỏ lẻ qui mô hộ gia đình hoặc các giếng khoan khai thác cấp công nghiệp qui

mô trung bình và lớn tại các khu vực giàu nước

c) Tầng chứa nước lỗ hỗng các trầm tích Pleistocen dưới (qp)

Tầng chứa nước Pleistocen dưới phân bố tại 3 khu vực: xã Hắc Dịch, xã Tóc

Tiên huyện Tân Thành và thành phố Vũng Tàu, các khu vực khác của tỉnh không tồn tại tầng chứa nước này Tầng chứa nước này bị phủ bởi các thành tạo rất nghèo nước Pleistocen dưới (Q,'), và phủ trực tiếp lên thành tạo rất nghèo nước Pliocen (N;”) ở thành phố Vũng Tàu hoặc bề mặt phong hóa các đá Mesozoi tại huyện Tân Thành và

Trang 30

x4 Séng Xoai HUYEN TAN THANH Sudt Nude Trong xã Hắc Dịch Ae Sudi Kinh Tài c——

(Nguon: Sở Tài nguyên và Môi trường tỉnh Bà Ria-Viing Tau) Hình 1.3 Mặt cắt tâng Pleistocen dưới (qp1)

Bảng 1.3 Đặc điểm giếng quan trắc tầng Pleistocen dưới (qp1) Chiêu sâu TRẠM | TÀNG CHÚA NƯỚC LỖ | y¡ | Ông Dia tin QUAN TRÁC | HỒNG CÁC TRÀM TÍCH | [my | lọc (m) pàng

TANG PLEISTOCEN Hé tang Trang

VT2A DƯỚI (qp1) với về dày TB l6 9-11:2 | Bom (sông —

19 4m sông biên)

(Nguồn: Sở Tài nguyên và Môi trường tinh Ba Ria-Viing T au) Thành phần thạch học gồm chủ yếu là cát hạt mịn đến trung thô chứa sạn sỏi,

có nơi lẫn sét bột hoặc xen kẹp các thấu kính mỏng sét bột, bột cát mịn Loại hình hóa

học nước chủ yếu là Bicarbonat-Clorur Natri-Calci va Bicarbonat-Clorur Calci-Natri

+* Thành tạo Pleistocen hạ (Q,')

Oo day, cac tram tich sông Pleistocen hạ phân bố đưới dạng bề mặt thềm bị phân cắt yếu thành đới lượn sóng thoải ở độ cao 40-70m như ở Tân Uyên, Đất Cuốc, Suối

Thôn, Trảng Bom Mặt cắt chủ yếu gồm cát, sạn, sỏi, cuội, xen thấu kín sét, sét bột,

kaolin Bề mặt của thành tạo bị laterit hóa, màu nâu đỏ loang 16 vang, trang, có tectit

nguyên dạng cắm vào

Trang 31

- Bé day TB: 4m

e Cát hạt thô, sét kaolin trang, thau kinh cudi sỏi thạch anh, 2,5m

Thạch anh: SiO; (Si: 40,7% + nhiều khoáng vật khác) Flourit hay đi kèm với thạch anh, là khoáng chính của granit và các đá macma khác (CaF;)

Manhetit: FeFeaO¿(FeO: 31%; Fe;Os: 69%)

Mica: [AISI:O¡s] chứa Mg, Fe, Al Da voi: CaCO; Felspat: (100-n)Na[A1ISi;0g]nCa[A1,Si,Os] Flourit: CaF,

ZIrcon: Zr[S1O¿] (ZrO›: 67,1%; S1O›: 32,9%)

Tuamalin: (Na,Ca)(Mg,Al)6[B3A];Si6(O,OH)30]; S102: 30-44%; B2O3: 8-12%; AlOs:

18-44%; MgO: 25%; Na,O: 6%; H,O: 1-4% e Cát, bột, sét kaolin, Im Kaolimt Al,[S14O¡o][OH]s; Monmorilorit: (A1,Mg)a[Si4O¡o] Hit: [Kal›:[SiAT]¿O¡o][OH]I¿H2O e _ Cát, 0,5m

Nguồn cung cấp chính cho tầng là nước mưa và nước mặt thấm trực tiếp tại

những nơi sông suối cắt trực tiếp vào tầng chứa nước hoặc thấm xuyên qua thành tao

rất nghèo nước Pleistocen dưới, miền thoát hướng ra biển và các sông rạch trũng thấp Hướng vận động của nước khá phức tạp, phụ thuộc vào dạng địa hình nhưng nhìn chung nước vận động từ đỉnh phân thủy xuống các thung lũng sông suối, từ nơi có địa hình cao xuống nơi có địa hình thấp (Vũ Ngọc Kỷ và nnk, 2008)

Tóm lại, tại huyện Tân Thành tầng chứa nước Pleistocen đưới có chiều dày

trung bình, chiều sâu phân bố nông, mức độ giàu nước từ nghèo đến giàu, nước nhạt, thích hợp với các giếng khoan nhỏ lẻ qui mô hộ gia đình hoặc các giếng khoan khai

Trang 32

CHUONG 2

PHUONG PHAP NGHIEN CUU

2.1 PHUONG PHAP THU THAP, THAM KHAO VA TONG QUAN TAI LIEU

Để có cơ sở khoa học nhằm thực hiện các mục tiêu nghiên cứu, đề tài đã thu

thập, nghiên cứu các tài liệu trong và ngoài nước có liên quan đến việc đánh giá chất lượng nước dưới đất bằng kỹ thuật thống kê đa biến Từ đó, sinh viên tiến hành tổng hợp phân tích các nội dung, phương pháp đã được áp dụng để học hỏi, đúc kết kinh nghiệm nhằm hoàn thành nội dung nghiên cứu cũng như đưa ra được kết quả tối ưu nhất của đề tài a) Tiến hành thu thập và tông hợp tài liệu tại Sở Tài nguyên và Môi trường tỉnh Bà Rịa-Vũng Tàu “ Báo cáo “Nghiên cứu và xây dựng mạng quan trắc nước dưới dat tinh Ba Ria- Vũng Tàu”

= Ban dé dia chất thủy văn tỷ lệ 1:50000 tỉnh Bà Rịa-Vũng Tàu = Ban dé dia chất và khoáng sản tỷ lệ 1:50000 tỉnh Bà Rịa-Vũng Tàu =_ Số liệu quan trắc chất lượng nước năm 2012 tỉnh Bà Rịa-Vũng Tàu

b) Tham khảo tài liệu

“_ Giáo trình địa chất Thủy văn ứng dụng, giáo trình Thủy văn môi trường, giáo trình Địa hóa mơi trường, giáo trình Khống vật học, giáo trình Địa chất công

trình, giáo trình Thạch học, giáo trình Địa chất và Tài nguyên Việt Nam

" Tạp chí khoa học trong và ngoài nước ứng dụng phân tích thông kê trong nghiên đánh giá chất lượng nước mặt và nước dưới đất

e) Một số khái niệm cơ bản về nước dưới đất

“_ Địa chất thủy văn là khoa học về nước dưới đất nhằm nghiên cứu nguồn gốc,

điều kiện thế nằm, quy luật vận động, động thái, các tính chất vật lí và hóa học

của nước dưới đất; mối tương tác của nước với môi trường xung quanh; ý nghĩa kinh tế của chúng

“ Nước dưới đất là nước nằm trong thạch quyền ở tat cả các trạng thái vật lí “_ Nước dưới đất không áp là nước dưới đất có mặt thoáng tự do và áp suất trên đó

Trang 33

" Nudc dudi đất có áp là nước đưới đất có áp suất tác dụng lên bề mặt lớn hơn áp

suất khí quyên

“_ Nước ngầm là nước dưới đất của tầng chứa nước thường xuyên và nằm trên đáy

cách nước thứ nhất tinh tir mat dat

2.2 PHƯƠNG PHÁP PHÂN TÍCH THÓNG KÊ

2.2.1 Biểu diễn biểu đồ Piper

Trong hầu hết các mẫu nước tự nhiên đều chứa các ion chính gồm có Na”, KỶ,

Ca”, Mg””, CI, HCO; và SO¿” Biểu đồ tam giác là một dạng đồ thị biểu diễn đặc

tính hóa học của các mẫu nước phan tich Cac cation va anion sẽ được biểu diễn bởi

các biểu đồ tam giác (ternary plots) riêng biệt gồm ba loại: biêu đồ tam giác góc dưới

bên trái sẽ biểu dién cation, biểu đồ tam giác góc dưới bên phải biểu diễn anion và biểu đồ hình thoi (diamond plot) nằm giữa thê hiện kết quả của hai biểu đồ tam giác khi kết hợp lại Mỗi đỉnh của biểu đỗ cation lần lượt là Ca”', Mg”` và Na”+K” Tương

tự, mỗi đỉnh của biểu đồ anion lần lượt là SOa”, CI và COs” + HCO;” Điểm biểu thị

của hai biểu đồ tam giác sẽ được chiếu lên biêu đồ hình thoi (diamond plot) nham biéu diễn thành phần phần trăm của cả cation và anion Biểu đồ tam giác thường được sử dụng đề phân loại thành phần hóa trong các mẫu nước dưới đất dựa trên thành phần phần trăm của các nhóm ion chính Ở nghiên cứu này, biểu đồ tam giác được thê hiện thông qua phần mềm Origin Pro phiên bản 2015 (Arthur M Piper, 1944)

Hình 2.1 Biếu đồ tam giác Piper

Trang 34

2.2.2 Cân bằng lon

Định luật cơ bản của tự nhiên là các dung dịch nước phải luôn trung hòa về điện Đó có nghĩa là tổng các Cation phải luôn bằng tổng các Anion

> anions = > cations (2.1)

Tuy nhiên, các sai số phân tích đều có thể gây ra việc mat cân bằng điện tích Sai số cân bằng theo phần trăm (%CBE) được tính toán như sau:

_ >„cations—|Sanions|

“CBE Ycations+|Yanions| 100 ; - (2)

Sử dụng CBE trong việc đánh giá tính hợp lệ cũng như chât lượng mẫu nước phân tích là rất hữu hiệu Một mẫu nước phân tích được chấp nhận phải đạt giá trị bé hon 5% (Halcrow and Tahal, 1999)

2.2.3 Phan tich thanh phan chinh (PCA)

Khi thu thập được một lượng các dữ liệu đo đạc được ngoàải hiện trường, điều

này cho thấy rằng việc tồn tại các biến dư thừa trong tập đữ liệu này là chắc chắn xảy ra Sự dư thừa này có thể được hiểu là một vài biến thì tương quan với các biến khác vì chúng có chung một ý nghĩa nào đó và sự dư thừa ở đây là việc nên tinh biến bớt các biến giám sát này từ một tập dữ liệu lớn sang một tập dữ liệu nhỏ gọn hơn Từng được giới thiệu bởi Pearson (1901) và Hotelling (1933), PCA đã trở thành một phương pháp xử lí dữ liệu và kỹ thuật tinh giảm chiều/kích thước biến và được ứng dụng rộng rãi ở

các lĩnh vực như kỹ thuật, sinh học, kinh tế và xã hội Ngày này, PCA có thể được

thực hiện thông qua các phần mềm thống kê được các chuyên gia và sinh viên sử dụng nhưng hiểu biết về nó vẫn còn rất nghèo nàn Mục tiêu của nghiên cứu này là để xua tan đi bí ân đằng sau công cụ thống kê này Nghiên cứu này sẽ cho thấy trực quan cơ

bản về việc tại sao và như thế nào để có thể phân tích thành phần chính, thêm vào đó

nó cũng sẽ cung cấp các nguyên tắc để có thể làm sáng tỏ các kết quả thu được Về khía cạnh toán học cũng sẽ được giới hạn Nghiên cứu này rất mong muốn có thể tăng thêm những hiểu biết về PCA trong việc nhận ra rằng khi nào, tại sao và như thế nào ứng dụng kỹ thuật này cũng như có thể xác định được các số liệu của các thành phần có nghĩa để giữ lại từ PCA, tạo nhân tố (factor score) và giải thích được các thành

phan Quan trong hơn nữa là có thể đặt ra được các ví dụ giải thích các bước chi tiết

Trang 35

- Correlation matrix (ma trận tương quan): Cho biết hệ số tương quan của

tat cả các cặp biến trong phân tích

- Communality : Là lượng biến thiên của một biến được giải thích chung với các biến khác được xem xét trong phân tích Đây cũng là phần biến thiên được giải thích bởi các nhân tố chung

- Eigenvalue : Đại diện cho phần biến thiên được giải thích bởi mỗi nhân tố,

chỉ có những nhân tố nào có Eigenvalue lớn hơn I mới được giữ lại trong mô hình phân tích, những nhân tố có Eigenvalue nhỏ hơn 1 sẽ không có tác dụng tóm tắt thông tin tốt hơn một biến gốc, vì sau khi chuẩn hóa mỗi biến gốc có phương sai là 1 Thêm vào đó, chúng ta có thể xác định ý nghĩa thống kê của các Eigenvalue riêng biệt và giữ lại những nhân tố nào thực sự có ý nghĩa thống kê Tuy nhiên, nhược điểm của cách này là đối với quy mô mẫu lớn (hơn 200), có nhiều khả năng sẽ có nhiều nhân tố thỏa mãn mức ý nghĩa thống kê mặc dù trong thực tế có nhiều nhân tố chỉ giải thích được

chỉ một phần nhỏ toàn bộ biến thiên

- Factor loading (hệ số tải nhân tố): Là những hệ số tương quan đơn giữa các biến và nhân tố

- Facfor matrix (ma trận nhân tố): Chứa các hệ số tải nhân tô của tất cả các

biến đối với các nhân tố được rút ra

- Percentage của variance: Phần trăm phương sai toàn bộ được giải thích bởi từng nhân tố Nghĩa là coi biến thiên là 100% thì giá trị này cho biết phân tích nhân tố

cô đọng được bao nhiêu % và thất thoát bao nhiêu %

- Culmulative (Tổng phương sai trích): Có giá trị lớn hơn 60% thì cho biết

các nhân tố giải thích được sự biến thiên của các biến quan sát

- Đặt tên và giải thích các nhân tố: Việc giải thích các nhân tố được thực hiện trên cơ sở nhận ra các biến có hệ số (factor loading) lớn ở cùng một nhân tố Như vậy nhân tố này có thê được giải thích bằng các biến có hệ số lớn đối với bản thân nó b) Tổng quan về mô hình phân tích FA/PCA

Trang 36

thông số có ý nghĩa nhất, trong đó mơ tả tồn bộ đữ liệu thiết lập dựng hình dữ liệu giảm với sự giảm tối thiểu các thông tin ban đầu Nó là một kỹ thuật mạnh mẽ cho mô hình giải thích sự thay đổi của một tập lớn các tương quan biến và chuyên đổi thành

một tập hợp nhỏ hơn của các biến độc lập (thành phần chính)

Để đòi hỏi xI, x2, , xp là các vector theo p x I được thu thập từ các đối tượng n Các bước tính toán cần phải hoàn thiện các bậc đề thu được kết quả PCA theo trình tự Sau:

Bước 1 Tinh gia trị trung bình:

_— 1

x=n > Xj (2.3)

xi: Tổng giá trị của các đối tượng

n: Đối tượng được tính toán Bước 2 Chuẩn hóa dữ liệu: đ®ị = (2.4) Ox Bước 3 Ma tran A = [%,, ®ị, , %,| (px ma trận), sau đó tính toán: 1 rf CH die Pi Fi (2.5) Bước 4 Tinh toan eigenvalues cua C: Ay >A, >> Ap (2.6)

Bước 5 Đi đến chuyển đổi tuyến tính RP — R# trong việc thực hiện tỉnh giảm chiều c) Ý nghĩa của eigenvalue

Trong số liệu phân tích thành phần chính của các thành phần được rút trích thì bằng với số của các biến được phân tích (với điều kiên n > p) Nó có nghĩa là phân tích

5 biến sẽ thực sự cho ra kết quả Š thành phần Tuy nhiên, mục tiéu cua PCA 1a tinh

giam thir nguyén/chiéu, chi một ít thành phần ban đầu sẽ trở nên đủ quan trọng để

được thu nhận cho việc trình bày và sử dụng trong dữ liệu hiện có Do đó thì rất hợp lí

cho việc tự đặt câu hỏi có bao nhiêu thành phần độc lập thì cần thiết để mô tả dữ liệu một cách tốt nhất

Eigenvalue thông qua việc đánh giá định lượng là bao nhiêu khi một thành phần

đại diện cho dữ liệu Eigenvalue cao hơn của một thành phần thì đại diện hơn trong dữ

Trang 37

cung cap eigenvalue tir img dung PCA đến dữ liệu của chúng ta Ở cột eigenvalue trên cùng Eigenvalue của các thành phần được biểu diễn Những dữ liệu thô trong bảng biểu diễn thông tin về 1 trong 5 thành phần: dữ liệu thô 1 cũng cấp thông tin về thành phần (PCAI) được rút trích, dữ liệu thô 2 cung cấp thông tin về thành phần thứ 2 (PCA2) được rút trích Eigenvalue là một dãy các số liệu được xếp từ cao xuống thấp

Có thê xem eigenvalue của thành phần 1 là 2.653 trong khi đó eigenvalue của thành phần 2 là 1.98 Nó có nghĩa là thành phần đầu tiên tính toán cho 2.653 đơn vị của tông các biến trong khi thành phần 2 tính toán cho 1.98 don vi Thanh phần thứ 3 tính toán khoảng 0.27 đơn vị của biến Chú ý rằng tổng của eigenvalue là 5, nó cũng là số biến Vậy làm thế nào để ta xác định được có bao nhiêu thành phần đáng giá cho việc giải thích? Bảng 2.1 Ví dụ về Eigenvalue từ PCA Thành phần Eigenvalue phương sai Phân trăm Phần trăm tích lũy 1 2.653 53.057 53.057 2 1.980 39.597 92.653 3 0.269 5.375 98.028 4 0.055 1.095 99.123 5 0.044 0.877 100.00 (Nguon: Application of principal component analysis in surface water- s quality monitoring)

Một vài chỉ tiêu đã được đê xuât cho việc xác định có bao nhiêu thành phân có

nghĩa nên được giữ lại đề giải thích Phần cắt ra sẽ mô tả 3 chỉ tiêu: Kaiser eigenvalue- một hệ số tiêu chuẩn, kiểm tra Cattell scree, phần trăm tích lũy của biến được tính toán cho

d) Phương pháp Kaiser

Phương pháp Kaiser (1960) cung cấp quy tắc ngón tay cái tiện dụng có thể

được sử dụng để giữ lại những thành phan có nghĩa Quy tắc này đề nghị được giữ lại những thành phần có eigenvalue lớn hơn I1 Phương pháp này còn được gọi là

eigenvalue- một hệ số tiêu chuẩn Nhân tố căn bản cho tiêu chuẩn này thì đễ hiểu Mỗi

Trang 38

toán cho một lượng phương sai có nghĩa và nó xứng đáng được giữ lại Nói cách khác, một thành phần có eigenvalue bé hơn | thi tinh toán được ít phương sai hơn so với một biến đơn lẻ Mục tiêu của phân tích thành phần chính là tỉnh giảm biến thành một lượng số liệu nhỏ vừa phải của thành phần và điều này thì không thể đạt được kết quả có nghĩa nếu chúng ta giữ lại những thành phần tính toán cho ít phương sai hơn một biến riêng lẻ Vi li do này, các thành phần với eigenvalue bé hơn 1 thì ít được dùng và cũng sẽ không được giữ lại Khi một ma trận hiệp phương sai được sử dụng, tiêu chuẩn giữ lại thành phan là eigenvalue phải lớn hơn giá trị trung bình phương sai của tập dữ liệu (Tiêu chuẩn Kaiser-Guttman)

Tuy nhiên, ở phương pháp này có thể dẫn đầu việc giữ lại những số liệu sai của các thành phần nằm dưới trường hợp này thì luôn luôn gặp phải trong nghiên cứu Sự

ứng dụng khinh suất của luật này có thê dẫn đến sai sót trong việc làm rõ khi sự khác

nhau của eigenvalue của lần lượt các thành phần là không đáng kể Ví dụ, nếu thành phần 2 cho thấy eigenvalue là 1.01 và thành phần 3 là 0.99: theo lí thì thành phần 2 sẽ được giữ lại còn 3 thì ko; điều này có thể gây nhằm lẫn cho chúng ta tin vào việc thành phần thứ 3 là vô nghĩa, thực tế, nó cũng tính toán gần chính xác giống với lượng phương sai như thành phần 2 Nó thì có khả năng để sử dụng thống kê kiểm tra dé kiểm tra sự khác biệt giữa các eigenvalue Trén thực tế, tiêu chuẩn Kaiser lờ đi sai sót liên đới với giữa các eigenvalue do mẫu Lambert, Wildt và Durand (1990) đề xuất ra một phiên bản tương tự như phương pháp Kaiser để xác định sự sáng tỏ, rõ ràng của

eigenvalue

Bang 2.1 cho thấy thành phần đầu tiên có eigenvalue lớn hơn I Nó giải thích được nhiều phương sai hơn đơn biến, chính xác là 2.653 lần Thành phần 2 cho thấy eigenvalue bang 1.98 > 1, và thành phan thtr 3 co eigenvalue 1a 0.269, bé hon 1 Ung dụng tiêu chuan Kaiser chắc chắn dẫn chúng ta đến việc giữ lại hai thành phần đầu tiên này

e) Phần trăm tích lũy của tơng phương sai tính tốn được

Khi xác định số liệu của các thành phần có nghĩa, hãy nhớ rằng không gian phụ của các thành phần được giữ lại phải chiếm một lượng hợp lí của phương sai trong dữ

liệu Nó thì thường điển hình cho việc biểu diễn eigenvalue như một tỉ lệ phần trăm

Trang 39

lượng phương sai tính toán bởi thành phần chính tương ứng Phần trăm tích lũy của phương sai giải thích bởi thành phần đầu tiên q được tính theo công thức: q ẬÂ, r, = 271 y 100 mm (2.7) j=1 30" 2,57 20 m a 8 15 4 < ® co œ 1,05 05> 001 T T T T T 1 2 3 4 5 Số thành phần (Nguon: Application of principal component analysis in surface water-quality monitoring)

Hinh 2.2 Biéu dé Scree ciia eigienvalues

Có bao nhiêu thành phần chính nên dùng phụ thuộc lớn như thế nào một rq cần Tiêu chuẩn này đòi hỏi giữ lại tất cả các thành phần trên tổng phần trăm phương sai Nó thì khuyến nghị rằng các thành phần được giữ lại tính toán tối thiêu 60% phương sai Thành phần chính tạo cơ hội tăng một chút trong tổng phương sai giải thích được

bỏ qua; các thành phần đó được xem như đữ liệu nhiễu Khi PCA làm việc tốt, hai

eigenvalue đầu tiên thường tỉnh toán cho hơn 60% tổng các biến trong dữ liệu

Trang 40

phần đơn lẻ thứ 2 chiếm 39.597% tông biến Cộng các tỉ lệ phần trăm cùng cho ra kết quả với tổng là 92.65% Nó có nghĩa là phần trăm tích lũy của phương sai chiếm bởi

hai thành phần đầu tiên khoảng 93% Điều này cung cấp một tóm tắt hợp lí của dữ

liệu Vậy chúng ta có thê giữ 2 thành phần đầu tiên này lại và loại bỏ những cái khác

đi

Chạy PCA sẽ trở nên dễ dang hơn với phần mềm thống kê Tuy nhiên, để làm sáng tỏ được kết quả có thể là một công việc khó khăn Dưới đây là một vài hướng có

thể giúp người thực hiện trong suốt quá trình phân tích

g) Lối vào trực quan của sự tương quan

Một lần phân tích là hoàn chỉnh, nghiên cứu muốn chỉ định một cái tên cho mỗi thành phần được giữ lại đề mô tả nội dung của nó Để làm được việc này cần phải biết

biến nào giải thích cho thành phần nào Sự tương quan của các biến với thành phần chính là một công cụ hữu ích có thê làm rõ hơn ý nghĩa của các thành phần Mối tương quan giữa mỗi biến và mỗi thành phần chính được thể hiện trong Bảng 2.2

Bảng 2.2 Ví dụ về mối tương quan giữa các biến và thành phần chính Các biến PCAI PCA2 XI 0.943 -0.241 X2 0.939 -0.196 x3 0.902 0.064 X4 0.206 0.963 Xã 0.159 0.975 (Nguon: Application of principal component analysis in surface water-quality „ - _monitoring)

Ngày đăng: 01/01/2024, 18:57

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w