PHƯƠNG PHÁP PHÂN TÍCH THỐNG KÊ ĐA BIẾN

Một phần của tài liệu Đánh giá diễn biến chất lượng nước lưu vực sông mã đoạn chảy qua tỉnh thanh hóa giai đoạn 2011 2014 (Trang 33 - 42)

2.4.1. Tổng quan về phương pháp phân tích thống kê đa biến

Bên cạnh việc tìm hiểu các vấn đề liên quan tới việc quản lý và diễn biễn chất lượng nước mặt của lưu vực sông, luận văn cũng đã tiến hành tìm hiểu, áp dụng phương pháp thống kê đa biến với mục tiêu tối ưu hóa chương trình quan trắc, giảm thiểu kích cỡ bộ số liệu và sắp xếp các khu vực, điểm quan trắc có chất lượng nước tương đồng nhau.

Các phương pháp phân tích thống kê đa biến có một áp dụng hết sức rộng rãi, đa dạng, bao trùm trên nhiều lãnh vực nghiên cứu khoa học, đặc biệt quản lý tài nguyên, môi trường, quy hoạch sử dụng đất đai… Nhiệm vụ của phân tích số liệu nhiều chiều là làm thế nào để thấy được hình ảnh của nó hoặc mối liên hệ giữa các biến trong đó một cách rõ ràng và đơn giản nhất hay kiểm nghiệm sự đúng đắn của mô hình liên hệ đã xây dựng. Trọng tâm của thống kê đa biến là vấn đề định vị và phân loại các đối tượng nghiên cứu hay các mẫu thu thập được trong quá trình thực hiện công việc nghiên cứu khoa học.

Kết quả của bộ số liệu quan trắc đưa ra là hàm lượng thông số ô nhiễm của các vị trí quan trắc. Vì vậy số lượng thu được là các ma trận mà các cột là hàm lượng thông số ô nhiễm (n biến) còn các hang là các mẫu phân tích (m quan sát). Nếu biểu diễn tập số liệu dạng đồ thì thì mỗi quan sát hay mỗi điểm sẽ có sự phụ thuộc của n biến trong không gian n chiều. Vì vậy rất khó thu được thông tin từ tập số liệu ban đầu này.

Phương pháp phân tích thống kê đa biến (multivariate analysis) là phương pháp toán học tìm mối quan hệ giữa các biến trong tập số liệu. Nó cho phép giảm hoặc đơn giản hoá kích thước tập số liệu, sắp xếp hoặc nhóm các số liệu thành nhóm có cùng thuộc tính, tìm ra sự phụ thuộc và quan hệ giữa các biến, xây dựng hoặc kiểm tra các giả thiết thống kê. Trong luận văn này, phương pháp phân tích thống kê đa biến được sử dụng bao gồm các phương pháp: phân tích thành phần chính (Principal Component Analysis - PCA) và phân tích nhóm (Cluster Analysis - CA).

Phương pháp phân tích thành phần chính PCA

Phương pháp phân tích thành phần chính PCA là kỹ thuật dùng để “nén” thông tin của một tập các biến (thông số) thành một số lượng biến ít hơn so với thành phần ban đầu. Mỗi thành phần mới sau khi biến đổi là tổ hợp tuyến tính của n biến ban đầu được gọi là các thành phần chính. Các thành phần chính đầu tiên (PC1, PC2, PC3) thường đóng góp lớn vào giải thích lượng thông tin phương sai chung của toàn bộ tập mẫu và thành phần về sau (PC4, PC5…) chiếm tỉ trọng giải thích càng nhỏ dần. Thông thường người ta thường sử dụng khoảng 90% tổng phương sai của các thành phần chính đầu tiên (PC1, PC2, PC3…) để giải thích cho n biến ban đầu. Ma trận tương quan được sử dụng làm ma trận gốc trong phân tích PCA và dùng để đánh giá mức độ quan hệ giữa các biến môi trường.

Bằng cách này sẽ giảm được kích thước của tập số liệu trong khi vẫn có thể giữ nguyên thông tin. Trong thuật toán PCA, có thể có nhiều PC vì có nhiều biến trong tập số liệu. Việc dùng PCA có thể tóm lược được cấu trúc đồng phương sai với tập số liệu có kích thước nhỏ hơn, mà không làm mất đi ý nghĩa của tập số liệu ban đầu. Có thể sử dụng tập số liệu mới này trong tính toán để thay thế cho tập số liệu cũ.

Phương pháp phân tích nhóm CA

Phân tích nhóm CA về nguyên tắc là tương tự với phương pháp phân tích PCA. Đây là kỹ thuật phân tích đa biến nhằm phân loại những số liệu có đặc

tính giống nhau thành các nhóm hay còn gọi là các cụm. Hai loại phân tích nhóm thường được sử dụng là: phân tích nhóm theo bậc và phân tích nhóm k- trung bình.

Phân tích nhóm theo bậc là cách để tìm ra các nhóm trong tập số liệu bằng cách tạo ra cây phân nhóm. Cây phân nhóm gồm nhiều bậc trong đó nhóm ở một mức được nối với với nhóm bên cạnh ở mức cao hơn. Điều đó cho phép quyết định mức hoặc thang chia nào của nhóm là phù hợp hơn.

Nó cho phép làm giảm số hàng từ n đến m (m<n) bởi thay thế các đối tượng ban đầu thành m lớp mới (mà trong mỗi lớp mới các đối tượng thường có độ tương tự gần như nhau).

2.4.2.Ứng dụng phương pháp thống kê đa biến trong lĩnh vực môi trường

Như đã đề cập ở trên, các phương pháp thống kê đa biến được áp dụng hết sức rộng rãi trong các lĩnh vực. Đối với lĩnh vực môi trường tại Việt Nam, gần đây đã có một số công trình nghiên cứu sử dụng phương pháp thống kê đa biến nhằm đánh giá chất lượng môi trường nước.

Bài báo “Một số công cụ phục vụ quản lý tổng hợp nuôi trồng thủy sản

bền vững ở Đồng bằng sông Cửu Long” được đăng trong tạp chí khoa học 2006,

trang 235 - 246, Đại học Cần Thơ, với việc sử dụng phương pháp phân tích PCA kết hợp với CA, nhóm tác giả đã đưa ra hai nhóm trạm khác nhau rõ rệt về tính chất môi trường ở Cà Mau và Trà Vinh qua 9 thông số và chia ra 7 loại vùng sinh thái khác nhau. Từ kết quả phân tích, sơ đồ phân vùng sinh thái nuôi đã được thiết lập như một cơ sở dữ liệu mà các nhà quy hoạch, hoạch định chính sách và nhà quản lý có thể căn cứ vào đó để xây dựng vùng nuôi thích hợp.

Bài báo “Sử dụng kỹ thuật thống kê đa biến đánh giá chất lượng nước

sông Như Ý tỉnh Thừa Thiên Huế” được đăng trên Tạp chí Phát triển khoa học và

công nghệ, tập 17, số M1 - 2014 của nhóm tác giả Nguyễn Minh Kỳ và Nguyễn Hoàng Lâm cũng đã sử dụng phương pháp PCA và CA với biến đầu vào là 6 thông số nhằm đánh giá chất lượng nước sông Như Ý. Kỹ thuật PCA được áp dụng để xem xét phân nhóm dữ liệu và chỉ ra các nhóm nhân tố làm thay đổi chất lượng nước. Kết quả PCA trích xoay nhân tố gồm hai nhóm chính với tổng phương sai 62,207%. Trong đó, nhóm nhân tố đầu tiên chiếm 40,873% tổng phương sai gồm các thông số nhiệt độ, DO, BOD5 và COD. Nhóm nhân tố thứ hai bao gồm NO3- và PO43- với 21,334% tổng phương sai, đồng thời được đặt tên và giải thích bởi quá trình xả thải liên quan đến các hoạt động nông nghiệp. Kết

quả phân tích CA đã xác lập và phân làm nhóm lần lượt là BOD5, COD, Nhiệt độ, DO (nhóm 1) và NO3-, PO43- (nhóm 2).

PHẦN 3. VẬT LIỆU VÀ PHƯƠNG PHÁP NGHIÊN CỨU 3.1. ĐỊA ĐIỂM NGHIÊN CỨU

Nghiên cứu chất lượng nước sông Mã đoạn chảy qua tỉnh Thanh Hóa với chiều dài 242 km qua các huyện: Quan Hóa, Bá Thước, Cẩm Thủy, Vĩnh Lộc, Yên Định, Thiệu Hóa, thành phố Thanh Hóa, Hoằng Hóa, Quảng Xương, thị xã Sầm Sơn… rồi đổ ra ở dòng chính là cửa Hới - Lạch Trào.

3.2. THỜI GIAN NGHIÊN CỨU

Đề tài luận án được thực hiện bắt đầu từ tháng 3/2014, các số liệu được thu thập từ tháng 1/2014 và tiến hành xử lý số liệu xuyên suốt thời gian thực hiện luận văn.

3.3. ĐỐI TƯỢNG NGHIÊN CỨU

Chất lượng nước của lưu vực sông Mã đoạn chảy qua tỉnh Thanh Hóa giai đoạn 2011 - 2014.

3.4. NỘI DUNG NGHIÊN CỨU

- Điều kiện tự nhiên, kinh tế xã hội của lưu vực sông Mã đoạn chảy qua tỉnh Thanh Hóa.

- Phân tích các áp lực tác động tới chất lượng nước LVS Mã.

- Đánh giá diễn biến chất lượng nước sông Mã đoạn chảy qua tỉnh Thanh Hóa giai đoạn 2011 - 2014;

- Đánh giá chỉ số chất lượng nước mặt (WQI) trên LVS Mã đoạn chảy qua tỉnh Thanh Hóa năm 2014.

- Phân tích cụm CA và thành phần chính PCA xác định đặc tính tương đồng và khác biệt giữa các vị trí lấy mẫu.

- Đề xuất một số biện pháp nhằm giảm thiểu ô nhiễm chất lượng nước sông Mã.

3.5. PHƯƠNG PHÁP NGHIÊN CỨU 3.5.1. Thu thập và xử lý số liệu thứ cấp

Trong quá trình thực hiện, đề tài cần thu thập và chọn lọc các tài liệu, số liệu, các kết quả nghiên cứu đã có liên quan đến vấn đề nghiên cứu. Những tài liệu cần thu thập bao gồm:

- Các tài liệu về điều kiện tự nhiên, kinh tế xã hội của tỉnh Thanh Hóa, các chương trình quan trắc kiểm soát chất lượng nước LVS Mã.

- Số liệu quan trắc môi trường lưu vực sông Mã đoạn chảy qua tỉnh Thanh Hóa từ các tài liệu, báo cáo tổng kết trong 4 năm từ 2011-2014.

Dựa trên những tài liệu thu thập được tiến hành thống kê, xử lý số liệu thứ cấp phục vụ mục đích nghiên cứu.

3.5.2.Phương pháp kế thừa

Đề tài luận án kế thừa các dữ liệu quan trắc thuộc chương trình quan trắc tổng thể môi trường nước lưu vực sông Mã giai đoạn 2011-2015 của Trung tâm Quan trắc môi trường, Tổng cục Môi trường. Thông tin về chương trình cụ thể như sau:

- Vị trí quan trắc: Các vị trí quan trắc được kế thừa từ chương trình được thể hiện ở bảng 2.1 và bản đồ vị trí quan trắc tại hình 2.1 dưới đây:

Bảng 2.1. Các vị trí lấy mẫu quan trắc nước lưu vực sông Mã đoạn chảy qua tỉnh Thanh Hoá

TT Điểm quan trắc Tọa độ điểm quan trắc Thông tin về điểm quan trắc Khu vực Vị trí Vĩ độ Kinh độ

1

Huyện Quan

Hóa

Cầu Na Sài 105° 7' 45" 20° 22' 12" Sông Mã nhập với sông Lò chảy qua Huyện Quan Hóa

2 Cầu La Hán 105° 17' 26" 20° 21' 10"

Sông Mã chảy qua một số nhà máy nhà máy sản xuất bột giấy và sản xuất vàng mã tại huyện Quan Hóa 3 Huyện Cẩm Thủy Cầu treo Cẩm Lương 105° 34' 44" 20° 16' 21" Xã Cẩm Thạch, Huyện Cẩm Thủy, tỉnh Thanh Hóa

4 Cầu Cẩm

Thủy 105° 12' 34" 20° 21' 53"

Sông Mã chảy qua huyện Cẩm Thủy và một số nhà máy xẻ đá dọc sông Mã

5 Trạm bơm

Cẩm Ngọc 106° 5' 49" 20° 37' 23"

Sông Mã chảy qua làng Kim huyện Cẩm Thủy

6 Huyện Vĩnh Lộc

Ngã ba Phù

Hưng 105° 29' 38" 20° 13' 4"

Sông Mã nhập vào sông Bưởi tại huyện Vĩnh Lộc

TT Điểm quan trắc Tọa độ điểm quan trắc Thông tin về điểm quan trắc Khu vực Vị trí Vĩ độ Kinh độ

Kiểu 8 Phà Hoành 105° 33' 7" 19° 23' 47"

Đoạn chảy qua phà bắc qua sông Mã, nối 2 huyện Yên Định với huyện Vĩnh Lộc 9

Hạ lưu

Ngã ba

Bông 105° 45' 49" 19° 52' 29"

Ngã 3 sông. Tại đây sông Mã phân lưu thành 2 nhánh sông Mã và sông Lèn

10 Cửa Hới 105° 54' 15" 19° 46' 18"

Sông Mã chảy qua huyện Quảng Xương trước khi đổ ra biển

Nguồn: Chương trình quan trắc tổng thể môi trường nước LVS Mã giai đoạn 2011- 2015,Trung tâm Quan trắc môi trường, năm 2011)

- Các thông số quan trắc:

+ Tại hiện trường: Nhiệt độ, pH, Hàm lượng oxy hòa tan DO, độ dẫn điện EC, độ đục, tổng chất rắn hòa tan TDS và thế oxy hóa-khử ORP.

Bảng 2.2. Phương pháp quan trắc hiện trường

TT Thông số đo Phương pháp đo

1 pH

Đo nhanh tại hiện trường bằng thiết bị cầm tay

2 Nhiệt độ (t0) 3 Độ đục

4 Độ dẫn điện (EC)

5 Tổng chất rắn hoà tan (TDS) 6 Ôxy hoà tan (DO)

7 Thế Ôxy hoá khử (ORP)

+ Trong phòng thí nghiệm: Nhu cầu oxy hóa học COD, Nhu cầu oxy sinh học BOD5, tổng chất rắn lơ lửng TSS, amoni NH4+, photphat PO43-, nitrat NO3-, sắt Fe, chì Pb và Coliform.

Bảng 2.3. Phương pháp phân tích trong phòng thí nghiệm

TT Tên thông số Phương pháp

1 COD SMEWW 5220C:2012 2 BOD5 SMEWW 5210B:2012 3 TSS SMEWW 2540D:2012 4 NH4+ SMEWW 4500-NH3.F:2012 5 PO43- SMEWW 2540D:2012 6 NO3- TCVN 6180:1996 7 NO2- SMEWW 4500-NO2-.B:2012 8 Fe SMEWW 3111B:2012 9 Pb SMEWW 3113B:2012 10 Coliform TCVN 6187-2:2009

- Tần suất lấy mẫu: 3 lần/năm, từ các năm 2011 – 2014, vào các tháng 3, 5 và 9 trong năm.

3.5.3. Phương pháp xử lý số liệu

3.5.3.1. Xử lý số liệu bằng phần mềm Excel

3.5.3.2.Phương pháp tính chỉ số chất lượng nước WQI

Luận văn sử dụng chỉ số WQI do Tổng cục Môi trường theo Quyết định số 879/QĐ-TCMT ngày 01 tháng 7 năm 2011 của Tổng cục trưởng Tổng cục Môi trường ban hành về việc ban hành sổ tay hướng dẫn tính toán chỉ số chất lượng nước. Theo đó các thông số thường được sử dụng để tính WQI bao gồm: DO, BOD5, COD, NH4+, PO43-, TSS, độ đục, Coliform, pH.

3 / 1 2 1 5 1 2 1 5 1 100  × ×  = ∑ ∑ = = b c b a a

pH WQI WQI WQI WQI

WQI

Sau khi tính toán được WQI, sử dụng bảng xác định giá trị WQI tương ứng với mức đánh giá chất lượng nước để so sánh, đánh giá theo bảng sau:

Bảng 2.4. Các mức đánh giá chất lượng nước

Giá trị WQI Mức đánh giá chất lượng nước Màu

91 - 100 Sử dụng tốt cho mục đích cấp nước sinh hoạt Xanh nước biển 76 - 90 Sử dụng cho mục đích cấp nước sinh hoạt nhưng

cần các biện pháp xử lý phù hợp Xanh lá cây 51 - 75 Sử dụng cho mục đích tưới tiêu và các mục đích

tương đương khác Vàng

26 - 50 Sử dụng cho giao thông thủy và các mục đích

tương đương khác Da cam

0 - 25 Nước ô nhiễm nặng, cần các biện pháp xử lý

trong tương lai Đỏ

3.5.4. Phương pháp thống kê đa biến

• Phân tích nhóm (CA): là 1 kĩ thuật thống kê đa biến được sử dụng để phân nhóm các đối tượng trong 1 hệ thống (các điểm quan trắc) thành các nhóm dựa vào sự giống nhau giữa các đối tượng. Biến đầu vào là 17 thông số quan trắc được nêu ở mục 3.5.2.

• Phân tích yếu tố/Phân tích thành phần chính (FA/PCA): là 1 kĩ thuật thống kê đa biến được sử dụng để xem xét, phân nhóm dữ liệu và xác định các nhóm thông số quan trọng giải thích cho sự biến đổi chất lượng môi trường. Biến đầu vào là các thông số phục vụ tính toán WQI: DO, BOD5, COD, NH4+, PO43-, TSS, độ đục, Coliform, pH.

PHẦN 4. KẾT QUẢ NGHIÊN CỨU

4.1. ĐIỀU KIỆN TỰ NHIÊN, KINH TẾ - XÃ HỘİ CỦA LƯU VỰC SÔNG MÃ ĐOẠN CHẢY QUA TỈNH THANH HÓA

Một phần của tài liệu Đánh giá diễn biến chất lượng nước lưu vực sông mã đoạn chảy qua tỉnh thanh hóa giai đoạn 2011 2014 (Trang 33 - 42)

Tải bản đầy đủ (DOC)

(96 trang)
w