TRƯỜNG ĐẠI HỌC KHOA HỌC KHOA ĐỊA LÍ – ĐỊA CHẤT THỐNG KÊ ỨNG DỤNG TRONG PHÂN TÍCH BIẾN ĐỘNG THÔNG SỐ COLIFORMS VÀ MỐI TƯƠNG QUAN VỚI CÁC THÔNG SỐ CHẤT LƯỢNG NƯỚC CÁC SÔNG TỈNH QUẢNG BÌNH
Trang 1TRƯỜNG ĐẠI HỌC KHOA HỌC KHOA ĐỊA LÍ – ĐỊA CHẤT
THỐNG KÊ ỨNG DỤNG TRONG PHÂN TÍCH BIẾN ĐỘNG THÔNG SỐ COLIFORMS VÀ MỐI TƯƠNG QUAN VỚI CÁC THÔNG SỐ CHẤT LƯỢNG NƯỚC CÁC SÔNG TỈNH QUẢNG BÌNH
GIAI ĐOẠN 2016-2020 TIN HỌC THỐNG KÊ ỨNG DỤNG
Giảng viên hướng dẫn : TS Đỗ Thị Việt Hương
Học viên thực hiện : Dương Thái
Mã học viên : 20.DL.QL.012
Chuyên ngành : Quản lý Tài nguyên và Môi trường
Khóa học : 2020 – 2022
HUẾ, THÁNG 11 NĂM 2021
Trang 2MỤC LỤC
Trang
MỞ ĐẦU 2
NỘI DUNG 4
1 TỔNG QUẢN VỀ CƠ SỞ LÝ LUẬN VỀ TIN HỌC THỐNG KÊ 4
1.1 Một số khái niệm liên quan 4
1.2 Vai trò của thống kê ứng dụng trong nghiên cứu tài nguyên và môi trường 7
1.3 Phương pháp và quy trình xử lý số liệu thống kê 8
1.4 Khái quát về tập dữ liệu thống kê 11
2 PHÂN TÍCH BIẾN ĐỘNG THÔNG SỐ CHẤT LƯỢNG NƯỚC MẶT 2015 - 2020 – THÔNG SỐ COLIFORMS 13
2.1 Quy trình thực hiện 13
2.2 Phân tích kết quả 23
3 PHÂN TÍCH MỐI TƯƠNG QUAN GIỮA THÔNG SỐ COLIFORMS VỚI CÁC THÔNG SỐ CHẤT LƯỢNG NƯỚC MẶT CÁC SÔNG TỈNH QUẢNG BÌNH GIAI ĐOẠN 2015 - 2020 26
3.1 Quy trình thực hiện 26
3.2 Phân tích hệ số tương quan đơn Pearson 33
KẾT LUẬN 35
TÀI LIỆU THAM KHẢO 36
Trang 3MỞ ĐẦU
Ngày nay, bảo vệ tài nguyên và môi trường đã trở thành vấn đề trọng yếu, mang tính toàn cầu Ở nước ta, vấn đề này đã trở thành sự nghiệp không chỉ của toàn Đảng, toàn dân mà còn là nội dung cơ bản không thể tách rời trong đường lối chủ trương, kế hoạch phát triển kinh tế xã hội của đất nước Trong những năm gần đây, cùng với sự gia tăng dân
số không kiểm soát, đã và đang dẫn đến cạn kiệt tài nguyên thiên nhiên và suy thoái chất lượng môi trường Hơn nữa, Việt Nam là một trong những quốc gia chịu ảnh hưởng trực tiếp của biến đổi khí hậu toàn cầu Đòi hỏi phải có những sự quan tâm tích cực của Nhà nước trong công tác quản lý về tài nguyên và môi trường
Từ trước đến nay, Đảng và nhà nước ta luôn coi trọng công tác quản lý Nhà nước
về tài nguyên và môi trường, đây là nội dung cơ bản không thể tách rời trong đường lối, chủ trương và kế hoạch phát triển kinh tế - xã hội của tất cả các cấp, các ngành; là cơ sở quan trọng bảo đảm sự phát triển bền vững, thực hiện thắng lợi sự nghiệp công nghiệp hóa
- hiện đại hóa đất nước Yêu cầu này xuất phát từ nhu cầu cấp bách về bảo vệ môi trường như là một điều kiện cần thiết cho sự phát triển bền vững nói chung và cho việc thực hiện thắng lợi các mục tiêu phát triển kinh tế - xã hội của đất nước giai đoạn đến năm 2030, tầm nhìn đến năm 2045 Tuy nhiên, công tác quản lý Nhà nước về tài nguyên và môi trường hiện nay còn gặp nhiều khó khăn, thách thức, còn rất nhiều các trở ngại và vướng mắc cần được tập trung giải quyết
Nước đóng vai trò vô cùng quan trọng cho cuộc sống sinh tồn Một trong những nguy cơ lớn nhất về môi trường hiện nay là khan hiếm nước Quảng Bình là một tỉnh có nhiều sông suối có khả năng cung cấp nguồn nước cho sản xuất, ăn uống và sinh hoạt Tuy nhiên, hiện nay tình trạng thiếu nước mùa khô và ô nhiễm nước do lũ lụt vào mùa mưa đang diễn ra ở nhiều địa phương trên địa bàn tỉnh Quảng Bình nói chung và khu vực gần nguồn nước nói riêng Ảnh hưởng đến chất lượng nước theo tiêu chí ăn uống và sinh hoạt chưa được quan tâm đúng mực do đó việc đánh giá diễn biến chất lượng nước của các sông của tỉnh Quảng Bình qua các thời kỳ trong năm để có những điều chỉnh kịp thời trong việc khai thác, sử dụng nước và có các giải pháp để bảo vệ nguồn nước không bị suy kiệt cũng cần được quan tâm
Trang 4Xuất phát từ tình hình thực tế, việc lựa chọn “Thống kê ứng dụng trong phân tích
biến động thông số Coliforms và mối tương quan với các thông số chất lượng nước các sông tỉnh Quảng Bình giai đoạn 2016-2020” là điều cần thiết
Trang 5NỘI DUNG
1 TỔNG QUẢN VỀ CƠ SỞ LÝ LUẬN VỀ TIN HỌC THỐNG KÊ
1.1 Một số khái niệm liên quan
1.1.1 Thống kê
Khi nói đến thống kê chúng ta thường liên tưởng đến các con số, các số liệu được sắp xếp trong các bảng biểu, đồ thị để biểu diễn những dữ liệu về kinh tế, xã hội hay môi trường như dân số, việc làm, tỷ giá, GDP, hàm lượng ô nhiễm, nhiệt độ…
Thuật ngữ thống kê đầu tiên bắt nguồn từ tiếng Latinh “Statisticum collegium”, Tiếng Ý “Statista”, Tiếng Đức: Statistik, tiếng Anh “Council of State”, “Stateman” hay
“Politican”, có nghĩa là hội đồng chính quyền hay người làm chính trị từ những năm 1970 Trong thời kỳ đầu, thuật ngữ thống kê được giới thiệu xuất phát từ việc thu thập, phân loại
và phân tích dữ liệu về chính quyền nhằm đáp ứng nhu cầu của chính phủ và các cơ quan quản lý, ví dụ như tổng điều tra dân số quốc gia (Hoàng Trọng, Chu Nguyễn Mộng Ngọc, 2011)
Như vậy, thống kê học được hình thành và phát triển vào cuối thế kỷ XVII, đầu thế
kỷ XVIII do nhu cầu phát triển kinh tế Ngày nay, sự phát triển cao của xã hội và mạnh mẽ của khoa học công nghệ, đòi hỏi khoa học thống kê cũng ngày càng phát triển hoàn thiện hơn Thống kê được nhiều cơ quan chính quyền, tổ chức cũng như cá nhân sử dụng rộng rãi trong nhiều lĩnh vực trong khoa học tự nhiên, khoa học xã hội, y dược, kinh doanh và nhiều lĩnh vực khác
Khái niệm thống kê được nhiều tác giả đưa ra dựa trên nhiều cách thức khác nhau:
- Wayatt và Bridges (1967): Thống kê liên quan đến nhiều vấn đề khác nhau bao gồm phân tích và trình bày dữ liệu, thiết kế nghiên cứu thử nghiệm và ra quyết định (Hoàng Trọng, Chu Nguyễn Mộng Ngọc, 2011)
- Croxton và nnk (1988): Thống kê có thể được định nghĩa là việc thu thập, trình bày, phân
tích và diễn giải các dữ liệu dưới dạng số (Hoàng Trọng, Chu Nguyễn Mộng Ngọc, 2011)
Trang 6- Hoàng Trọng, Chu Nguyễn Mộng Ngọc (2011): Thống kê là một nhánh của toán học liên quan đến việc thu thập, phân tích, diễn giải hay giải thích và trình bày các dữ liệu (Hoàng Trọng, Chu Nguyễn Mộng Ngọc, 2011)
- Hoàng Nam Hải, Trần Vui, Chu Trọng Thanh (2014): Thống kê là môn khoa học nghiên cứu các mặt lượng trong mối liên hệ chặt chẽ với mặt chất của số lớn các hiện tượng kinh tế - xã hôi, trong điều kiện thời gian và không gian cụ thể (Hoàng Nam Hải và nnk, 2014)
Như vậy có thể hiểu thống kê “là một khoa học về thu thập, phân tích, diễn giải và trình bày các dữ liệu để từ đó tìm ra bản chất và tính quy luật của các hiện tượng tự nhiên, kinh tế - xã hội và môi trường trong điều kiện thời gian và không gian cụ thể”
1.1.2 Chất lượng môi trường nước
Chất lượng của nước là các đặc tính hóa học, vật lý, sinh học và phóng xạ của nước.[1] Nó là thước đo tình trạng của nước dựa trên nhu cầu của một hoặc nhiều loài sinh vật, hoặc bất kỳ mục đích nào của con người.[2] Nó được thường được đánh giá bằng cách tham chiếu đến bộ tiêu chuẩn và đạt được thông qua việc xử lý nước
Các tiêu chuẩn phổ biến nhất được sử dụng để đánh giá chất lượng nước liên quan đến sức khỏe của hệ sinh thái, sự an toàn khi tiếp xúc với con người và nước uống
Các cơ quan có thẩm quyền kết hợp với các nhà khoa học môi trường đưa ra những quyết định về việc thiết lập những tiêu chuẩn về các loại nước và cách chúng được sử dụng.[3] Trong trường hợp các thủy vực tự nhiên, họ cũng đưa ra một số ước tính hợp lý
về các điều kiện nguyên sinh Các vùng nước tự nhiên sẽ thay đổi theo các điều kiện môi trường Các nhà khoa học môi trường làm việc để hiểu cách thức hoạt động của các hệ thống này, từ đó giúp xác định các nguồn và số lượng chất gây ô nhiễm Các luật sư môi trường và các nhà hoạch định chính sách làm việc để xác định các luật duy trì ở chất lượng thích hợp cho mục đích sử dụng đã được xác định
Phần lớn nước bề mặt trên Trái Đất không uống được cũng như không độc hại Điều này vẫn đúng khi nước biển trong các đại dương (quá mặn không thể uống được) không được tính đến.[4] Một nhận thức chung khác về chất lượng nước là tính chất đơn giản cho biết nước có bị ô nhiễm hay không Trên thực tế, chất lượng nước là một chủ đề phức tạp, một phần vì nước là một phương tiện phức tạp về bản chất gắn liền với hệ sinh thái của Trái Đất Các hoạt động công nghiệp và thương mại (ví dụ như sản xuất, khai thác mỏ, xây
Trang 7dựng, giao thông vận tải) là nguyên nhân chính gây ô nhiễm nước cũng như dòng chảy từ các khu vực nông nghiệp, dòng chảy đô thị và xả nước thải đã qua xử lý và chưa qua xử
lý
Chất lượng nước môi trường là chất lượng các vùng nước như hồ, sông và đại dương.[12] Tiêu chuẩn chất lượng nước đối với nước mặt thay đổi đáng kể do các điều kiện môi trường, hệ sinh thái khác nhau và mục đích sử dụng của con người Các chất độc hại và số lượng vi sinh vật cao có thể gây nguy hiểm cho sức khỏe nếu không dùng cho mục đích uống như tưới tiêu, bơi lội, câu cá, đi bè, chèo thuyền và sử dụng trong công nghiệp Những điều kiện này cũng có thể ảnh hưởng đến động vật hoang dã, chúng sử dụng nước để uống hoặc làm môi trường sống Luật chất lượng nước hiện đại thường quy định
cụ thể việc bảo vệ thủy sản và sử dụng giải trí và yêu cầu tối thiểu phải duy trì các tiêu chuẩn chất lượng hiện hành.[13]
Một phần lớn công chúng mong muốn trả lại các vùng nước nguyên sơ, hoặc điều kiện tiền công nghiệp.[14] Hầu hết các luật môi trường hiện hành tập trung vào việc chỉ định các mục đích sử dụng cụ thể của một vùng nước Ở một số quốc gia, những chỉ định này cho phép một mức độ ô nhiễm nước nhất định miễn là loại ô nhiễm cụ thể không gây hại cho các mục đích sử dụng được chỉ định Với những thay đổi về cảnh quan (ví dụ, phát triển đất đai, đô thị hóa, chặt phá các khu vực có rừng) ở các lưu vực của nhiều vùng nước ngọt, việc trở lại trạng thái nguyên sơ sẽ là một thách thức đáng kể Trong những trường hợp này, các nhà khoa học môi trường tập trung vào việc đạt được các mục tiêu duy trì các
hệ sinh thái lành mạnh và có thể tập trung vào việc bảo vệ các quần thể các loài có nguy
cơ tuyệt chủng và bảo vệ sức khỏe con người
1.1.3 Thông số Coliforms
Chỉ số coliform là một đánh giá về độ tinh khiết của nước dựa trên số lượng vi khuẩn tồn tại trong phân Lê Sĩ Quốc Đây là một trong nhiều thử nghiệm được thực hiện để đảm bảo đủ chất lượng nước Vi khuẩn Coliform là các vi sinh vật có nguồn gốc chủ yếu trong ruột của động vật máu nóng Bằng cách thử nghiệm coliforms, đặc biệt là Escherichia coli (E coli) nổi tiếng, là một coliform chịu nhiệt, người ta có thể xác định xem nước có thể bị nhiễm phân hay không; cho dù nó đã tiếp xúc với phân người hay động vật Điều quan trọng là phải hiểu rõ điều này bởi vì nhiều sinh vật gây bệnh được chuyển từ phân người
và động vật sang nước, từ đó chúng có thể bị con người nuốt phải và lây nhiễm cho họ Nước đã bị ô nhiễm bởi phân thường chứa vi khuẩn gây bệnh, có thể gây bệnh Một số loại
Trang 8coliform gây bệnh, nhưng chỉ số coliform chủ yếu được sử dụng để đánh giá xem các loại
vi khuẩn gây bệnh khác có khả năng có trong nước hay không Chỉ số coliform được sử dụng vì khó kiểm tra trực tiếp vi khuẩn gây bệnh Có nhiều loại vi khuẩn gây bệnh khác nhau và chúng thường xuất hiện với số lượng thấp mà không phải lúc nào cũng xuất hiện trong các xét nghiệm Coliforms dung nạp nhiệt hiện diện với số lượng cao hơn các loại vi khuẩn gây bệnh riêng lẻ và chúng có thể được kiểm tra tương đối dễ dàng
Tuy nhiên, chỉ số coliform là không hoàn hảo Coliforms nhiệt có thể tự tồn tại trong nước, đặc biệt là ở các vùng nhiệt đới, vì vậy chúng không phải lúc nào cũng chỉ ra sự ô nhiễm phân Hơn nữa, chúng không đưa ra một dấu hiệu tốt về việc có bao nhiêu vi khuẩn gây bệnh có trong nước và chúng không biết liệu có loại virut gây bệnh hoặc động vật nguyên sinh nào gây bệnh và hiếm khi được xét nghiệm hay không Do đó, không phải lúc nào cũng cho kết quả chính xác hoặc hữu ích liên quan đến độ tinh khiết của nước
1.2 Vai trò của thống kê ứng dụng trong nghiên cứu tài nguyên và môi trường
Thống kê ngày càng quan trọng trong thực tiễn, đời sống hằng ngày của mỗi cá nhân, tổ chức trong nhiều lĩnh vực khác nhau Thống kê từ chỗ chỉ là đơn thuần mô tả, đã vươn lên thể hiện khả năng phân tích, dự đoán một cách chính xác với đầy đủ cơ sở khoa học Vì vậy, thống kê là một khoa học được ứng dụng sâu rộng trong mọi lĩnh vực của hoạt động kinh tế - xã hội Đây là một trong những công cụ quản lý vĩ mô quan trọng, nó có vai trò cung cấp đầy đủ, kịp thời những thông tin thống kê trung thực, khách quan, chính xác, phản ánh bản chất và tính quy luật của các hiện tượng kinh tế - xã hội trong điều kiện không gian và thời gian cụ thể cho các cơ quan nhà nước, các tổ chức và cá nhân Những kết quả này hỗ trợ trong việc đưa ra những đánh giá, dự báo tình hình, xu hướng phát triển, hoạch định chiến lược, chính sách và xây dựng kế hoạch
Tùy từng ngành, từng lĩnh vực cụ thể mà thống kê có các bài toán giải quyết khác nhau Trong lĩnh vực tài nguyên và môi trường, thống kê có các vai trò quan trọng trong việc: Mô tả, giải thích và dự đoán các mô hình và các hoạt động theo không gian; Giải thích sự thay đổi theo không gian của các đối tượng, hiện tượng, mô hình khác nhau; Giúp hình thành các tri thức về địa lý tự nhiên, địa lý kinh tế - xã hội, tài nguyên và môi trường; Lượng hóa dữ liệu và có cái nhìn đúng đắn về các mô hình đưa ra; Cụ thể hóa các khái niệm, quy luật, làm rõ mối quan hệ giữa các sự vật, hiện tượng tự nhiên (Peter A Rogerson, 2001)
Trang 9Mục đích phân tích và xử lý số liệu thống kê trong tài nguyên và môi trường được thể hiện phổ biến trong các khía cạnh sau:
- Khảo sát lấy mẫu và suy diễn kết luận về các vấn đề về địa lý tài nguyên và môi trường (Ví dụ tình trạng già hóa của dân số, khả năng chống chịu của người dân đối với thiên tai…, nhiệt độ bề mặt trái đất…)
- Phân tích mối tương quan (các điều kiện hình thành khí hậu; đô thị hóa và tăng trưởng kinh tế, dân cư, tốc độ trượt lở với độ dốc…)
- Mô tả các mẫu điều tra môi trường, kinh tế - xã hội (dân số, xã hội học…)
- Quan trắc, mô tả các hiện trạng chỉ thị môi trường (không khí, nước, khí tượng khí hậu, đất…)
- Phân tích mức độ hài lòng của người dân đối với hoạt động du lịch…
- Phân tích các nhân tố ảnh hưởng đến khả năng chống chịu người dân đối với thiên tai, nhân tố ảnh hưởng đến hiệu quả quản lý nhà nước về đất đai…
- Phân vùng, kiểu phát triển kinh tế xã hội lãnh thổ dựa trên phân tích đa tiêu chí
1.3 Phương pháp và quy trình xử lý số liệu thống kê
1.3.1 Phương pháp xử lý số liệu thống kê
Xử lý số liệu thống kê là việc sử dụng các công cụ và phương pháp khoa học để phân tích các số liệu đã thu thập được, nhằm biết được ý nghĩa của số liệu đã thống kê và thu được các thông tin cần thiết
SPSS là một phần mềm chuyên được sử dụng cho công tác phân tích thống kê SPSS giúp ghi nhận và làm sạch dữ liệu, thực hiện xử lý và quản lý dữ liệu, dữ liệu thu được sẽ được trình bày và diễn giải dưới dạng các bảng biểu, đồ thị
SPSS ngày càng được sử dụng phổ biến hơn trong nhiều lĩnh vực khác nhau như: Tâm lý học; Tội phạm học; Điều tra xã hội học; Nghiên cứu kinh doanh; Nghiên cứu trong
y sinh
- Thống kê mô tả các thông số: Thống kê mô tả trong tiếng Anh là Descriptive Statistics Thống kê mô tả là các hệ số mô tả ngắn gọn hay tóm tắt một tập dữ liệu nhất định, có thể là đại diện cho toàn bộ hoặc một mẫu của một tổng thể Thống kê mô tả được chia thành đo lường xu hướng tập trung và đo lường biến động Đo lường xu hướng tập trung có giá trị trung bình, trung vị và yếu vị, trong khi các đo lường biến động gồm độ
Trang 10lệch chuẩn, phương sai, giá trị nhỏ nhất và giá trị lớn nhất, độ nhọn và độ lệch Thống kê
mô tả giúp mô tả và hiểu được các tính chất của một bộ dữ liệu cụ thể bằng cách đưa ra các tóm tắt ngắn về mẫu và các thông số của dữ liệu Loại thống kê mô tả phổ biến nhất là các thông số xu hướng tập trung gồm: giá trị trung bình, trung vị và yếu vị, các thông số này được sử dụng ở hầu hết các cấp độ toán học và thống kê
- Phân tích tương quan (Peasrson):
Phân tích tương quan Pearson là một trong các bước chúng ta thực hiện trong bài nghiên cứu sử dụng phân tích định lượng SPSS Thường bước này sẽ được thực hiện trước khi phân tích hồi quy
Mục đích chạy tương quan Pearson nhằm kiểm tra mối tương quan tuyến tính chặt chẽ giữa biến phụ thuộc với các biến độc lập và sớm nhận diện vấn đề đa cộng tuyến khi các biến độc lập cũng có tương quan mạnh với nhau
Tương quan Pearson r có giá trị dao động từ -1 đến 1 (lưu ý, hệ số r chỉ có ý nghĩa khi sig nhỏ hơn 0.05):
Nếu r càng tiến về 1, -1: tương quan tuyến tính càng mạnh, càng chặt chẽ Tiến về
1 là tương quan dương, tiến về -1 là tương quan âm
Nếu r càng tiến về 0: tương quan tuyến tính càng yếu
Nếu r = 1: tương quan tuyến tính tuyệt đối, khi biểu diễn trên đồ thị phân tán Scatter như hình vẽ ở trên, các điểm biểu diễn sẽ nhập lại thành 1 đường thẳng
Nếu r = 0: không có mối tương quan tuyến tính Lúc này sẽ có 2 tình huống xảy ra Một, không có một mối liên hệ nào giữa 2 biến Hai, giữa chúng có mối liên hệ phi tuyến
Một số bài viết trên Internet chia sẻ mối tương quan r nhỏ hơn 0.2 thì không có tương quan giữa cặp biến đó - điều này hoàn toàn sai Không có bất cứ tài liệu hay công thức nào chứng minh r < 0.2 thì cặp biến không có tương quan cả Nếu sig < 0.05 thì có tương quan, khi đó r tiến càng gần 1 tương quan càng mạnh, càng tiến gần 0 tương quan càng yếu; nếu sig > 0.05 thì mới không có tương quan
- Phương pháp biểu đồ Box Plot:Biểu đồ hộp trong tiếng Anh là Box Plot hay Box and Whisker plot
Trang 11Biểu đồ hộp (Box plot) hay còn gọi là biểu đồ hộp và râu (Box and whisker plot) là biểu đồ diễn tả 5 vị trí phân bố của dữ liệu, đó là: giá trị nhỏ nhất (min), tứ phân vị thứ nhất (Q1), trung vị (median), tứ phân vị thứ 3 (Q3) và giá trị lớn nhất (max)
Đặc trưng của biểu đồ hộp:
- Biểu đồ hộp giúp biểu diễn các đại lượng quan trọng của dãy số như giá trị nhỏ nhất (min), giá trị lớn nhất (max), tứ phân vị (quartile), khoảng biến thiên tứ phân vị (Interquartile Range) một cách trực quan, dễ hiểu
- Trên biểu đồ hộp, ngoài các đại lượng số trung bình, trung vị, còn thể hiện một số thông số sau:
Trang 121.3.2 Quy trình nghiên cứu
Quy trình nghiên cứu
1.4 Khái quát về tập dữ liệu thống kê
Dữ liệu thống kê là căn cứ vào một (hay một số) tiêu thức nào đó, tiến hành phân chia các đơn vị của hiện tượng nghiên cứu thành các tổ (hoặc tiểu tổ) có tính chất khác nhau
Chúng ta biết rằng, các hiện tượng và quá trình kinh tế xã hội thường rất phức tạp,
vì chúng tồn tại và phát triển dưới nhiều loại hình có quy mô và đặc điểm khác nhau Mỗi hiện tượng nghiên cứu cũng thường được kết cấu từ nhiều tổ, nhiều bộ phận, nhiều loại hình có tính chất khác nhau Muốn phản ánh được bản chất và quy luật phát triển của hiện tượng, phải tìm cách nêu lên được đặc trưng của từng loại hình, của từng bộ phận cấu thành hiện tượng phức tạp, đánh giá tầm quan trọng của mỗi bộ phận, nêu lên mối liên hệ giữa các bộ phận, rồi từ đó nhận thức được các đặc trưng chung của toàn bộ
Dữ liệu thống kê được sử dụng rộng rãi trong các nghiên cứu kinh tế - xã hội Phân
tổ giúp ta thực hiện được việc nghiên cứu một cách kết hợp giữa cái chung và cái riêng
Trang 13Các đơn vị tổng thể được tập hợp lại thành một số tổ (hoặc tiểu tổ) Trong đó, các đơn vị trong phạm vi mỗi tổ đều có sự giống nhau (hay gần giống nhau) về tính chất theo tiêu thức phân tổ, nhờ đó ta có thể xác định được đặc trưng riêng của từng tổ
Dữ liệu thống kê là phương pháp cơ bản để tiến hành tổng hợp thống kê, vì ta sẽ không thể tiến hành hệ thống hoá một cách khoa học các tài liệu điều tra, nếu không áp dụng phương pháp này Phân tổ thống kê là một trong các phương pháp quan trọng của phân tích thống kê, đồng thời là cơ sở để vận dụng các phương pháp phân tích thống kê khác Chỉ sau khi đã phân chia tổng thể nghiên cứu thành các tổ có quy mô và đặc điểm khác nhau, việc tính các chỉ tiêu phản ánh mức độ, tình hình biến động, mối liên hệ giữa các hiện tượng mới có ý nghĩa đúng đắn Nếu việc phân tổ không chính xác, tổng thể được chia thành những bộ phận không đúng với thực tế, thì mọi chỉ tiêu tính ra cũng không giúp
ta rút ra được những kết luận đúng đắn
Dữ liệu thống kê còn được vận dụng ngay trong giai đoạn điều tra thống kê, nhằm phân tổ đối tượng điều tra thành những bộ phận có đặc điểm tính chất khác nhau từ đó chọn các đơn vị điều tra sao cho đảm bảo tính đại diện cho tổng thể chung
Dữ liệu thống kê có những nhiệm vụ cơ bản sau đây:
Thứ nhất, dữ liệu thực hiện việc phân chia các loại hình kinh tế xã hội của hiện tượng nghiên cứu Hiện tượng kinh tế xã hội mà thống kê nghiên cứu thường là những tổng thể phức tạp, không đồng chất Vì vậy, phương pháp nghiên cứu khoa học là phải nêu lên các đặc trưng riêng biệt của từng loại hình và mối quan hệ giữa các loại hình đó với nhau
Thứ hai, dữ liệu có nhiệm vụ biểu hiện kết cấu của hiện tượng nghiên cứu Bất kỳ một hiện tượng kinh tế xã hội nào đều do nhiều bộ phận, nhiều nhóm đơn vị có tính chất khác nhau hợp thành Các bộ phận hay nhóm này chiếm những tỷ trọng khác nhau trong tổng thể và nói lên tầm quan trọng của nó trong tổng thể đó
Thứ ba, dữ liệu được dùng để biểu hiện mối liên hệ giữa các tiêu thức Các hiện tượng kinh tế xã hội luôn phát sinh, phát triển và tồn tại trong mối liên hệ tác động qua lại với các hiện tượng có liên quan nhau theo những quy luật nhất định Giữa các tiêu thức
mà thống kê nghiên cứu cũng thường có mối liên hệ với nhau: sự thay đổi của tiêu thức này sẽ đưa đến sự thay đổi của tiêu thức kia theo một quy luật nào đó
Trang 142 PHÂN TÍCH BIẾN ĐỘNG THÔNG SỐ CHẤT LƯỢNG NƯỚC MẶT 2016 - 2020 – THÔNG SỐ COLIFORMS
2.1 Quy trình thực hiện
Bước 1: Khởi động phần mềm SPSS
Bước 2 Mở tập dữ liệu
Vào File → Open Data → Data
- Hộp thoại Open Data sẽ xuất hiện
Trang 15+ Tại mục Look in, tìm đến thư mục chưa dữ liệu thực hành (1);
+ Tại mục Files of type, ta chọn định dạng file Excel để file dữ liệu thực hành xuất
hiện (2);
+ Sau đó chọn File dữ liệu thực hành “2021_Data water QB.xlsx” (3) rồi nhấn
Open (4)
Sau đó sẽ xuất hiện hộp thoại Read Excel Files
- Tại mục Work Sheet chọn đúng sheet Descriptive Analysis
- Tích vào ô Read variable names from first row of data: hàng đầu tiên trong bảng
Trang 16- Mở dữ liệu thành công
Bước 3: Lưu dữ liệu
Vào File → Save As
Trang 17- Hộp thoại Save Data As xuất hiện
+ Tại mục Look in chọn vị trí lưu File
+ Tại File name, đặt tên cho file
+ Nhấn Save
Bước 4: Kiểm tra lại các biến
Trong cửa sổ làm việc, chọn chế độ Variable View tiến hành kiểm tra lại các biến
Trang 18- Tại mục Name (tên biến), không để tên biến là Tiếng Việt mà phải chuyển thành
không dấu
- Tại Label (nhãn), dùng tiếng Việt để thể hiện ý nghĩa tên của các biến
Bước 5: Thống kê mô tả
Vào Analyze → Descriptive Statistics → Descriptives…
Hộp thoại Descriptive xuất hiện
Chọn thông số cần phân tích, ở đây ta chọn Coliforms
Click vào Save standardized values as variables (tự động ra các biến mới, đã được
chuẩn hóa)
Sau đó, click vào Option, cửa sổ Descriptives: Options sẽ xuất hiện
Trang 19- Chọn Sum (tổng), Mean (giá trị trung bình), Std deviation (độ lệch chuẩn), Minimum (giá trị nhỏ nhất), Maximum (giá trị lớn nhất), Variance (phương sai), Range (độ rộng/giá trị chênh lệch giữa max và min), S.E mean (độ lệch chuẩn trung bình)
- Thể hiện phân phối dữ liệu theo Kurosis và hệ số Skewness
- Tại Display Order chọn Variable list rồi nhấn Continue để đóng cửa sổ
Cuối cùng tại cửa sổ Descriptives nhấn Ok
Tại cửa sổ Output ta nhận được bảng dữ liệu thống kê của thông số Coliforms
Sau đó, lưu lại kết quả