Số liệu thu thập trong vòn g5 năm của một số ngành công nghiệp

Một phần của tài liệu (LUẬN án TIẾN sĩ) cơ sở dự báo lượng nước thải phục vụ đánh giá tác động môi trường dự án đầu tư xây dựng cơ sở hạ tầng khu công nghiệp trong điều kiện việt nam (Trang 47 - 57)

tại Hoa Kỳ Ngành công nghiệp Số cơ sở gửi bản phỏng vấn Số cơ sở thanh sát thực tế Số lần thanh sát thực tế Khoảng cách giữa hai lần thanh sát (tháng) Số lần thanh sát/cơ sở*

Khai mỏ kim loại 1.232 378 1.600 46 4

Khai mỏ than 3.256 741 3.748 52 5

Khai thác dầu, khí 4.676 1.902 6.071 46 3 Khai mỏ phi kim 5.256 2.803 12.826 25 5

Dệt 355 267 1.465 15 5

Khai thác gỗ 712 473 2.767 15 6

SP đồ gỗ 499 386 2.379 13 6

Giấy và bột giấy 484 430 4.630 6 11

In 5.862 2.092 7.691 46 4

Hóa chất vơ cơ 441 286 3.087 9 11

Nhựa và sợi tổng hợp 329 263 2.430 8 9

Dược 164 129 1.201 8 9

Hóa chất hữu cơ 425 355 4.294 6 12

Hóa chất nơng nghiệp 263 164 1.293 12 8

Tinh chế dầu mỏ 156 148 3.081 3 21

Cao su và nhựa 1.818 981 4.383 25 4

Sắt thép 349 275 4.476 5 16

Cán kim loại 669 424 2.535 16 6

Kim loại màu 203 161 1.640 7 10

Kim loại tiền chế 2.906 1.858 7.914 22 4

Điện tử 1.250 863 4.500 17 5

Lắp ráp xe hơi 1.260 927 5.912 13 6

Đóng và sửa tàu thủy 44 37 243 9 7

Vận tải trên bộ 7.786 3.263 12.904 36 4

Vận tải thủy 514 192 816 38 4

Vận tải đường không 444 231 973 27 4

Nhiệt điện 3.270 2.166 14.210 14 7

Giặt khô 6.063 2.360 3.813 95 2

Như vậy cơ sở dữ liệu về hệ số phát thải của các ngành trên đã được cập nhật theo hai phương thức phát phiếu phỏng vấn và khảo sát thực tế với số lần lặp lại khá cao như vậy mức độ tin cậy có thể nhận định ở mức B và C.

Các tiêu chí đánh giá hệ số phát thải như đã nêu trên là khá toàn diện, đánh giá khá chính xác mức độ đầy đủ và toàn diện của số liệu thu thập được, qua đó đánh

giá được mức độ chính xác của hệ số phát thải được thiết lập và hồn tồn có thể sử dụng để đánh giá hệ số phát sinh nước thải do luận án này nghiên cứu và đề xuất.

1.6. Phương pháp xử lý số liệu thống kê

1.6.1. Đại lượng trung bình

Đại lượng trung bình là một trong những đặc trưng thống kê được dùng phổ

biến nhất trong các nghiên cứu về thống kê; mô tả xu thế tập trung của số liệu. Dựa vào đại lượng trung bình để so sánh giữa hai hay nhiều tổng thể và được tính theo

cơng thức 1.4:

(công thức 1.4)

Với phân tích phi tham số, đại lượng được sử dụng là trung vị của các mẫu.

Trung vị là trị số đứng giữa của thống kê thứ tự, được ký hiệu Med. Số trung vị chia

đám đơng thành 2 phần có số cá thể bằng nhau, nghĩa là trên Med có n/2 số liệu,

dưới Med có n/2 số liệu.

1.6.2. Phương sai

Phương sai của một mẫu là trung bình độ lệch bình phương của các giá trị mẫu so với giá trị trung bình cộng theo công thức 1.5 dưới đây:

(công thức 1.5)

Phương sai mẫu là tham số đặc trưng tiêu biểu nhất cho tính chất phân tán của số liệu, cho phép xác định tổng biến sai và lượng biến sai trung bình của các cá thể quanh trung bình cộng. Χ= X1+X2+...+Xn n = Xi i=1 n ∑ n Χ= X1+X2+...+Xn n = Xi i=1 n ∑ n

Phương sai là trị số bậc hai, để có một đặc trưng bậc 1, cùng bậc với số trung bình cộng. Độ lệch chuẩn là căn bậc hai của phương sai, ký hiệu là S.

1.6.3. Phương pháp sai số tồn phương trung bình qn phương

Trong thống kê toán học, phương pháp sai số toàn phương trung bình quân phương (RMSE- Root Mean squared error) của một phép ước lượng là trung bình của bình phương các sai số, tức là sự khác biệt giữa các ước lượng và những gì được đánh giá (trong nghiên cứu là sự khác biệt giữa số liệu về lượng nước thải được dự đoán trong các báo cáo ĐTM với lượng nước thải thực tế). Sai số toàn

phương trung bình là một hàm rủi ro, tương ứng với giá trị kỳ vọng của sự mất mát sai số bình phương hoặc mất mát bậc hai. Sự khác biệt xảy ra do ngẫu nhiên, hoặc vì các ước lượng khơng tính đến thơng tin có thể cho ra một ước tính chính xác hơn. Sử dụng phương pháp sai số tồn phương trung bình để đánh giá mức độ sai

số giữa lượng nước thải dự báo so với lượng nước thải thực tế. Sai số bình phương trung bình (MSE) được tính theo cơng thức 1.6:

(cơng thức 1.6)

Trong đó:

Oi: lượng nước thải thực tế (m3/ngđ); Fi: lượng nước thải dự báo (m3/ngđ); N: là số kỳ quan sát.

Giá trị của MSE nằm trong khoảng (0;+∞). Trường hợp lý tưởng là khi MSE = 0, giá trị dự báo và giá trị đo đạc thực tế là bằng nhau.

Trong một tương tự với độ lệch chuẩn, lấy căn bậc hai của MSE cho ra sai số bình phương trung bình quân phương (RMSE), là trung bình bình phương các sai số, tức là sự khác biệt giữa các ước lượng và những gì được đánh giá, có các đơn vị tương tự như đại lượng được ước tính, được tính như sau [48]:

Đại lượng sai số bình phương trung bình quân phương (RMSE) rất nhạy với

những giá trị sai số lớn và biểu thị độ lớn trung bình của sai số. Giá trị của RMSE nằm trong khoảng (0;+∞). Trường hợp lý tưởng là khi RMSE = 0, giá trị dự báo và giá trị đo đạc thực tế là bằng nhau.

1.6.4. Phân tích hồi quy tương quan

Trong nghiên cứu môi trường, cần so sánh các mẫu quan sát không phải chỉ với một biến như trong thống kê mô tả mà cần phải so sánh các mẫu với hàng loạt các biến quan sát (Multivariate analysis). Các công cụ dùng để phân tích hồi quy

tương quan này bao gồm: (1) tính hệ số tương quan; (2) phân tích hồi quy tuyến tính một lớp; (3) phân tích hồi quy tuyến tính đa thức, nhiều biến hay (4) các dạng phi

tuyến.

1.6.4.1. Hệ số tương quan tuyến tính

Là chỉ tiêu về mức độ liên hệ giữa các đại lượng trong quan hệ tuyến tính được tính bằng công thức 1.8:

! =∑, (%& − %̅)(*&− *+) &-.

/0102 (cơng thức 1.8)

Trong đó: n là kích thước mẫu nghiên cứu

%̅, *+ là trung bình mẫu của đại lượng X và Y Sx, Sy là độ lệch chuẩn của X, Y

nếu: r = 0: x,y độc lập với nhau

r =1; x,y có quan hệ hàm tuyền tính r > 0: đồng biến

r < 0: nghịch biến

0 < r £ 0,5 thì 2 đại lượng x và y có quan hệ tuyến tính yếu 0,5 < r £ 0,7 thì 2 đại lượng x và y có quan hệ tuyến tính vừa

0,7 < r £ 0,8 thì 2 đại lượng x và y có quan hệ tuyến tính tương đối chặt 0,8 < r £ 0,9 thì 2 đại lượng x và y có quan hệ tuyến tính chặt.

1.6.4.2. Phân tích hồi quy

Phân tích hồi quy đề cập đến việc nghiên cứu sự phụ thuộc của một biến số (y) vào một hay nhiều biến số khác (x1, x2, x3… ), với mong muốn ước lượng hay dự

đốn giá trị trung bình (kỳ vọng) của y dựa vào các giá trị đã biết hay cho cố định

của các biến x1, x2,…

§ Phương trình hồi quy tuyến tính một lớp có dạng:

y = a + b.x (công thức 1.9)

§ Phương trình hồi quy tuyến tính nhiều lớp có dạng:

y = a0 +a1 x1+ a2 x2 +...+anan (công thức 1.10)

Sau khi xác định được biến x (hoặc x1, x2, x3 … trong trường hợp hồi quy đa

biến hay nhiều lớp) và biến y theo dãy số liệu có được từ thực nghiệm, cần phải tìm các hệ số a và b của công thức 1.9 (hay a0, a1, a2, … của công thức 1.10) theo số liệu thực tế. Đây là phép phân tích hồi quy.

Có một số cơng cụ, phương pháp được các nhà tốn học phát triển dùng để xác

định các hệ số này, trong đó mơ hình Gauss-Markov sử dụng phương pháp bình

phương tối thiểu (bình phương nhỏ nhất) hay được áp dụng. Bình phương tối thiểu là một phương pháp ước lượng tối ưu.

Nguyên tắc chung của phương pháp bình phương tối thiểu: Từ các điểm thực nghiệm, bằng các lần thay thử phương trình thì máy tính sẽ chọn đường hồi quy lý thuyết sao cho:

Qy = ∑( ytn – ylt)2 à Min (công thức 1.11)

Khi đó có 1 hàm mơ tả sự phụ thuộc của Qy với tham số có trong phương

trình hồi quy.

Bên cạnh việc chỉ ra hệ số tương quan R, các hệ số trong các phương trình liên hệ giữa y và x, phép hồi quy còn đánh giá các đặc trưng thống kê liên quan đến

phương trình hồi quy tìm được như giá trị p-value trong phép kiểm định F về sự tồn tại của phương trình, giá trị p-value trong phép kiểm định t-Student về sự khác biệt

của hệ số so với giá trị 0. Qua đó sẽ giúp đánh giá chính xác hơn về độ tin cậy của phương trình hồi quy tìm được từ bộ số liệu thực nghiệm.

1.6.5. Phân tích thành phần chính

Phân tích thành phần chính (PCA - Principal Component Analysis) là kỹ thuật thường được sử dụng khi làm việc với các bộ dữ liệu (dataset) nhiều chiều. PCA

giúp làm giảm số chiều thường rất lớn của dữ liệu mà vẫn giữ lại được các thông tin cần thiết của bộ dữ liệu ban đầu. PCA được sử dụng để tạo thành một số nhỏ các

biến không tương quan từ một tập hợp dữ liệu lớn. Mục tiêu của PCA là tìm một khơng gian mới với số chiều nhỏ hơn không gian cũ (số chiều trong không gian mới thường là 2 hoặc 3 chiều). Trong đó các trục tọa độ trong không gian mới được xây

dựng sao cho trên mỗi trục độ biến thiên của dữ liệu trên đó là lớn nhất có thể

(maximize the variability).

PCA có thể được áp dụng cho dữ liệu phân tích mơ tả định lượng để giảm tập hợp các biến phụ thuộc (ví dụ thuộc tính) đến một tập hợp dữ liệu nhỏ hơn của các biến cơ bản (gọi là yếu tố) dựa trên mơ hình của tương quan giữa các biến ban đầu [58]. Các dữ liệu của các thuộc tính khác nhau được sắp xếp theo thứ tự tăng hoặc giảm dần và xử lý bằng phần mềm máy tính. Sau đó dữ liệu được giảm bằng cách

phân tích dữ liệu, các biến độc lập và phụ thuộc được lựa chọn và đồ thị 2 trục của các mẫu được thu nhận [27].

PCA được sử dụng trong nghiên cứu này như là một bước trong một loạt các phân tích để giảm số lượng các biến và tránh đa màu hoặc khi có quá nhiều dự đoán so với số lần quan sát.

Kết luận Chương 1

- KCN đã được phát triển ở Việt Nam từ năm 1991 và trong tương lai sẽ còn

nhiều KCN được xây dựng. KCN ở Việt Nam có nhiều đặc trưng, trong đó đặc

trưng lớn nhất là thốt nước và xử lý nước thải 02 cấp: (1) xử lý cục bộ tại từng nhà máy và (2) xử lý tập trung cho toàn KCN. Kết quả dự báo quy mô, công suất trạm xử lý nước thải tập trung của KCN trong báo cáo ĐTM dự án đầu tư xây dựng cơ sở hạ tầng KCN là mang tính pháp lý, bắt buộc chủ đầu tư KCN phải tuân thủ.

- Trên thế giới có cơng bố hệ số phát sinh nước thải tính theo quy mơ sản xuất cho nhiều ngành công nghiệp, nhưng không công bố hệ số phát sinh nước thải cho KCN với đặc trưng như của Việt Nam. Các nghiên cứu trong nước về hệ số sử dụng nước và phát sinh nước thải cho một số ngành cơng nghiệp tính theo quy mơ, công suất cũng bắt đầu được nghiên cứu, nhưng nằm rải rác và chưa mang tính hệ thống; chưa có nghiên cứu hệ số tính theo diện tích.

- Việt Nam chưa công bố chính thức phương pháp dự báo lượng nước thải KCN. Phương pháp dự báo lượng nước thải KCN đang được sử dụng trong báo cáo

ĐTM dự án xây dựng cơ sở hạ tầng KCN ở Việt Nam chủ yếu tham khảo từ

TCXDVN 33:2006 và TCXDVN 7957:2008.

Chương 2 tiếp theo sẽ mô tả đối tượng và phương pháp nghiên cứu áp dụng

CHƯƠNG 2. ĐỐI TƯỢNG VÀ PHƯƠNG PHÁP NGHIÊN CỨU 2.1. Đối tượng nghiên cứu 2.1. Đối tượng nghiên cứu

2.1.1. Địa điểm nghiên cứu

Trong 195 KCN đã đi vào hoạt động thuộc 43 tỉnh, thành phố trên phạm vi cả nước được nghiên cứu, đề tài chọn 114 KCN có tỷ lệ lấp đầy trên 80% và có báo

cáo ĐTM được phê duyệt để phân tích các vấn đề liên quan đến lượng nước thải

KCN dự báo và phát sinh trên thực tế. Tỉnh Đồng Nai với đặc trưng là tỉnh dẫn đầu

cả nước về số lượng KCN được lựa chọn là địa điểm nghiên cứu sâu của luận án.

2.1.2. Đối tượng nghiên cứu

- Phương pháp dự báo lượng nước thải KCN đã và đang được áp dụng trong

các báo cáo ĐTM dự án đầu tư xây dựng cơ sở hạ tầng KCN của Việt Nam.

- 195 KCN trên cả nước đang hoạt động và đã được phê duyệt báo cáo ĐTM để phân tích số liệu về phát sinh nước thải của toàn KCN.

- 114 KCN (trên tổng số 195 KCN trong cả nước) có tỷ lệ lấp đầy từ 80% trở lên để nghiên cứu và đánh giá tính chính xác của các phương pháp dự báo lượng

nước thải đã được áp dụng trong ĐTM dự án đầu tư xây dựng cơ sở hạ tầng KCN,

và kiểm chứng sai số giữa lượng nước thải dự báo với lượng nước thải phát sinh thực tế của các KCN này;

- 11 KCN thuộc tỉnh Đồng Nai có đầy đủ số liệu trong khoảng thời gian 05

năm (2012 - 2016) để xây dựng phương pháp dự báo lượng nước thải KCN;

- 02 KCN Long Thành và Nhơn Trạch III GĐ2 thuộc tỉnh Đồng Nai được lựa chọn là 02 KCN để khảo sát, đo đạc lượng nước thải phát sinh thực tế của từng nhà máy để tính tốn cân bằng nước và xác định các yếu tố ảnh hưởng đến việc phát

sinh nước thải trong KCN.

2.1.3. KCN trên địa bàn tỉnh Đồng Nai

Nằm trong vùng kinh tế trọng điểm phía Nam, giáp các tỉnh Lâm Đồng, Bình

Dương, Bình Phước, Bình Thuận, Bà Rịa - Vũng Tàu và thành phố Hồ Chí Minh, tỉnh Đồng Nai có hệ thống giao thơng rất thuận lợi cho phát triển kinh tế, là tỉnh có vị trí quan trọng trong sự phát triển của vùng kinh tế trọng điểm phía Nam, gắn kết

giữa vùng Đơng Nam Bộ với miền Trung và Tây Nguyên. Đồng Nai chia làm 11 đơn vị hành chính, bao gồm: 1 thành phố, 1 thị xã và 9 huyện: thành phố Biên Hòa,

thị xã Long Khánh và 9 huyện là: Nhơn Trạch, Long Thành, Vĩnh Cửu, Trảng Bom, Thống Nhất, Xuân Lộc, Cẩm Mỹ, Định Quán và Tân Phú.

Tỉnh Đồng Nai với diện tích tự nhiên 5.907,2 km2, dân số xấp xỉ 2.839.000 người (năm 2014), lực lượng lao động dồi dào (chiếm 64,5% dân số) [30]. Bản đồ

hành chính của tỉnh Đồng Nai thể hiện ở Hình 2.1.

Từ 04 KCN năm 1995, cho đến năm 2016, tồn tỉnh Đồng Nai đã có 32 KCN

được thành lập, trong đó có 31 KCN đi vào hoạt động5 với tổng diện tích đất quy

hoạch là 9.3355,35 ha, trong đó có 6.198,8 ha đất cơng nghiệp, tỷ lệ lấp đầy trung

bình chung là 79,53%. Tồn bộ 31/31 KCN đang hoạt động đã xây dựng hồn thành trạm XLNTTT. Đã có doanh nghiệp của 36 quốc gia và vùng lãnh thổ hoạt động

đầu tư tại các KCN của tỉnh Đồng Nai với tổng số 1.182 dự án, trong đó 862 dự án

có vốn đầu tư nước ngồi với tổng vốn đầu tư 14.512 triệu USD và 320 dự án trong nước với tổng vốn đầu tư 33.262 tỷ đồng; có 906 doanh nghiệp đang hoạt động với tổng số lao động là 413.141 người [1, 41].

Danh mục các KCN trên địa bàn tỉnh Đồng Nai được thể hiện ở Bảng 2.1

Nguồn: [23]

Một phần của tài liệu (LUẬN án TIẾN sĩ) cơ sở dự báo lượng nước thải phục vụ đánh giá tác động môi trường dự án đầu tư xây dựng cơ sở hạ tầng khu công nghiệp trong điều kiện việt nam (Trang 47 - 57)