TRƯỜNG ĐẠI HỌC KHOA HỌC KHOA ĐỊA LÍ – ĐỊA CHẤT THỐNG KÊ ỨNG DỤNG TRONG PHÂN TÍCH BIẾN ĐỘNG THÔNG SỐ AMONI VÀ MỐI TƯƠNG QUAN VỚI CÁC THÔNG SỐ CHẤT LƯỢNG NƯỚC CÁC SÔNG TỈNH QUẢNG BÌNH GIA
Trang 1TRƯỜNG ĐẠI HỌC KHOA HỌC KHOA ĐỊA LÍ – ĐỊA CHẤT
THỐNG KÊ ỨNG DỤNG TRONG PHÂN TÍCH BIẾN ĐỘNG THÔNG SỐ AMONI VÀ MỐI TƯƠNG QUAN VỚI CÁC THÔNG SỐ CHẤT LƯỢNG NƯỚC CÁC SÔNG TỈNH QUẢNG BÌNH
GIAI ĐOẠN 2016-2020
TIN HỌC THỐNG KÊ ỨNG DỤNG
Giảng viên hướng dẫn : TS Đỗ Thị Việt Hương
Học viên thực hiện : Đoàn Hoàng Đạt
Mã học viên : 20.DL.QL.005
Chuyên ngành : Quản lý Tài nguyên và Môi trường
Khóa học : 2020 – 2022
HUẾ, THÁNG 11 NĂM 2021
Trang 2MỤC LỤC
Trang
MỞ ĐẦU 1
NỘI DUNG 2
1 TỔNG QUẢN VỀ CƠ SỞ LÝ LUẬN VỀ TIN HỌC THỐNG KÊ 2
1.1 Một số khái niệm liên quan 2
1.2 Vai trò của thống kê ứng dụng trong nghiên cứu tài nguyên và môi trường 5
1.3 Phương pháp và quy trình xử lý số liệu thống kê 6
1.4 Khái quát về tập dữ liệu thống kê 9
2 PHÂN TÍCH BIẾN ĐỘNG THÔNG SỐ CHẤT LƯỢNG NƯỚC MẶT 2015 - 2020 – THÔNG SỐ AMONI 11
2.1 Quy trình thực hiện 11
2.2 Phân tích kết quả 22
3 PHÂN TÍCH MỐI TƯƠNG QUAN GIỮA THÔNG SỐ AMONI VỚI CÁC THÔNG SỐ CHẤT LƯỢNG NƯỚC MẶT CÁC SÔNG TỈNH QUẢNG TRỊ GIAI ĐOẠN 2015 - 2020 25
3.1 Quy trình thực hiện 25
3.2 Phân tích mối tương quan 31
KẾT LUẬN 33
TÀI LIỆU THAM KHẢO 34
Trang 31
MỞ ĐẦU
Ngày nay, bảo vệ tài nguyên và môi trường đã trở thành vấn đề trọng yếu, mang tính toàn cầu Ở nước ta, vấn đề này đã trở thành sự nghiệp không chỉ của toàn Đảng, toàn dân mà còn là nội dung cơ bản không thể tách rời trong đường lối chủ trương, kế hoạch phát triển kinh tế xã hội của đất nước Trong những năm gần đây, cùng với sự gia tăng dân
số không kiểm soát, đã và đang dẫn đến cạn kiệt tài nguyên thiên nhiên và suy thoái chất lượng môi trường Hơn nữa, Việt Nam là một trong những quốc gia chịu ảnh hưởng trực tiếp của biến đổi khí hậu toàn cầu Đòi hỏi phải có những sự quan tâm tích cực của Nhà nước trong công tác quản lý về tài nguyên và môi trường
Từ trước đến nay, Đảng và nhà nước ta luôn coi trọng công tác quản lý Nhà nước
về tài nguyên và môi trường, đây là nội dung cơ bản không thể tách rời trong đường lối, chủ trương và kế hoạch phát triển kinh tế - xã hội của tất cả các cấp, các ngành; là cơ sở quan trọng bảo đảm sự phát triển bền vững, thực hiện thắng lợi sự nghiệp công nghiệp hóa
- hiện đại hóa đất nước Yêu cầu này xuất phát từ nhu cầu cấp bách về bảo vệ môi trường như là một điều kiện cần thiết cho sự phát triển bền vững nói chung và cho việc thực hiện thắng lợi các mục tiêu phát triển kinh tế - xã hội của đất nước giai đoạn đến năm 2030, tầm nhìn đến năm 2045 Tuy nhiên, công tác quản lý Nhà nước về tài nguyên và môi trường hiện nay còn gặp nhiều khó khăn, thách thức, còn rất nhiều các trở ngại và vướng mắc cần được tập trung giải quyết
Để có thể quản lý môi trường một cách hiệu quả, nhiều phương pháp khoa học đã được sử dụng như phương pháp bản đồ, viễn thám, thống kê, Trong đó, phương pháp thống kê là một phương pháp cơ bản và hiệu quả Nó cung cấp cái nhìn khách quan, tổng quát và chính xác cùng với đó là trợ giúp trong việc đưa ra các quyết định trong công tác quản lý Bài tiểu luận này khái quát về thống kê trong quản lý tài nguyên và môi trường, đưa ra ví dụ từ việc thống kê thông số Amoniac của nước mặt tỉnh Quảng Bình giai đoạn 2015-2020
Trang 42
NỘI DUNG
1 TỔNG QUẢN VỀ CƠ SỞ LÝ LUẬN VỀ TIN HỌC THỐNG KÊ
1.1 Một số khái niệm liên quan
1.1.1 Thống kê
Khi nói đến thống kê chúng ta thường liên tưởng đến các con số, các số liệu được sắp xếp trong các bảng biểu, đồ thị để biểu diễn những dữ liệu về kinh tế, xã hội hay môi trường như dân số, việc làm, tỷ giá, GDP, hàm lượng ô nhiễm, nhiệt độ…
Thuật ngữ thống kê đầu tiên bắt nguồn từ tiếng Latinh “Statisticum collegium”, Tiếng Ý “Statista”, Tiếng Đức: Statistik, tiếng Anh “Council of State”, “Stateman” hay
“Politican”, có nghĩa là hội đồng chính quyền hay người làm chính trị từ những năm 1970 Trong thời kỳ đầu, thuật ngữ thống kê được giới thiệu xuất phát từ việc thu thập, phân loại
và phân tích dữ liệu về chính quyền nhằm đáp ứng nhu cầu của chính phủ và các cơ quan quản lý, ví dụ như tổng điều tra dân số quốc gia (Hoàng Trọng, Chu Nguyễn Mộng Ngọc, 2011)
Như vậy, thống kê học được hình thành và phát triển vào cuối thế kỷ XVII, đầu thế
kỷ XVIII do nhu cầu phát triển kinh tế Ngày nay, sự phát triển cao của xã hội và mạnh mẽ của khoa học công nghệ, đòi hỏi khoa học thống kê cũng ngày càng phát triển hoàn thiện hơn Thống kê được nhiều cơ quan chính quyền, tổ chức cũng như cá nhân sử dụng rộng rãi trong nhiều lĩnh vực trong khoa học tự nhiên, khoa học xã hội, y dược, kinh doanh và nhiều lĩnh vực khác
Khái niệm thống kê được nhiều tác giả đưa ra dựa trên nhiều cách thức khác nhau:
- Wayatt và Bridges (1967): Thống kê liên quan đến nhiều vấn đề khác nhau bao gồm phân tích và trình bày dữ liệu, thiết kế nghiên cứu thử nghiệm và ra quyết định (Hoàng Trọng, Chu Nguyễn Mộng Ngọc, 2011)
- Croxton và nnk (1988): Thống kê có thể được định nghĩa là việc thu thập, trình bày, phân
tích và diễn giải các dữ liệu dưới dạng số (Hoàng Trọng, Chu Nguyễn Mộng Ngọc, 2011)
Trang 53
- Hoàng Trọng, Chu Nguyễn Mộng Ngọc (2011): Thống kê là một nhánh của toán học liên quan đến việc thu thập, phân tích, diễn giải hay giải thích và trình bày các dữ liệu (Hoàng Trọng, Chu Nguyễn Mộng Ngọc, 2011)
- Hoàng Nam Hải, Trần Vui, Chu Trọng Thanh (2014): Thống kê là môn khoa học nghiên cứu các mặt lượng trong mối liên hệ chặt chẽ với mặt chất của số lớn các hiện tượng kinh tế - xã hôi, trong điều kiện thời gian và không gian cụ thể (Hoàng Nam Hải và nnk, 2014)
Như vậy có thể hiểu thống kê “là một khoa học về thu thập, phân tích, diễn giải và trình bày các dữ liệu để từ đó tìm ra bản chất và tính quy luật của các hiện tượng tự nhiên, kinh tế - xã hội và môi trường trong điều kiện thời gian và không gian cụ thể” [1]
1.1.2 Chất lượng nước
a Chất lượng nước
Chất lượng của nước (CLN) là các đặc tính hóa học, vật lý, sinh học và phóng xạ của nước Nó là thước đo tình trạng của nước dựa trên nhu cầu của một hoặc nhiều loài sinh vật, hoặc bất kỳ mục đích nào của con người Nó được thường được đánh giá bằng cách tham chiếu đến bộ tiêu chuẩn và đạt được thông qua việc xử lý nước
Các tiêu chuẩn phổ biến nhất được sử dụng để đánh giá chất lượng nước liên quan đến sức khỏe của hệ sinh thái, sự an toàn khi tiếp xúc với con người và nước uống
b Các thông số đánh giá chất lượng nước
Để đánh giá CLN cũng như mức độ gây ô nhiễm nước, có thể dựa vào một số chỉ tiêu cơ bản và quy định thời gian của từng chỉ tiêu đó tuân theo Luật Bảo Vệ môi trường của một quốc gia và tiêu chuẩn quốc gia quy định cho từng loại nước sử dụng cho các mục địch khác nhau Kết hợp các yếu cầu về các thông số đánh giá chất lượng nước và các chất gây ô nhiễm nước có thể đưa ra các thông số đánh giá chất lượng nước
- pH: là một trong những thông số quan trọng và được sử dụng thường xuyên nhất dùng để đánh giá mức độ ô nhiễm của nguồn nước, CLN thải, đánh giá độ cứng của nước,
sự keo tụ, khả năng ăn mòn Vì thế việc xét nghiệm pH để hoàn chỉnh CLN cho phù hợp với yêu cầu kỹ thuật cho từng khâu quản lý rất quan trọng, hơn nữa là đảm bảo được chất lượng cho người sử dụng Khi chỉ số pH < 7 thì nước có môi trường axít; pH > 7 thì nước
có môi trường kiềm, điều này thể hiện ảnh hưởng của hoá chất khi xâm nhập vào môi trường nước
Trang 64
- SS (solid solved – chất rắn lơ lửng): Chất rắn lơ lửng nói riêng và tổng chất rắn nói chung có ảnh hưởng đến CLN trên nhiều phương diện Hàm lượng chất rắn hoà tan trong nước thấp làm hạn chế sự sinh trưởng hoặc ngăn cản sự sống của thuỷ sinh Hàm lượng chất rắn hoà tan trong nước cao thường có vị
- DO (dyssolved oxygen – ô xy hoà tan trong nước): Ôxy có mặt trong nước một mặt được hòa tan từ ô xy trong không khí, một mặt được sinh ra từ các phản ứng tổng hợp quang hoá của tảo và các thực vật sống trong nước Các yếu tố ảnh hưởng đến sự hòa tan
ô xy vào nước là nhiệt độ, áp suất khí quyển, dòng chảy, địa điểm, địa hình Giá trị DO trong nước phụ thuộc vào tính chất vật lý, hoá học và các hoạt động sinh học xảy ra trong
đó Phân tích DO cho ta đánh giá mức độ ô nhiễm nước và kiểm tra quá trình các thông số đánh giá CLN trong việc xử lý nước thải
- COD (Chemical oxygen Demand – nhu cầu ô xy hoá học) COD là tiêu chuẩn quan trọng để đánh giá mức độ ô nhiễm của nước (nước thải, nước mặt, nước sinh hoạt) vì nó cho biết hàm lượng chất hữu cơ có trong nước là bao nhiêu Hàm lượng COD trong nước cao thì chứng tỏ nguồn nước có nhiều chất hữu cơ gây ô nhiễm
- BOD (Biochemical oxygen Demand- nhu cầu ô xy sinh hoá): BOD là lượng ô xy (thể hiện bằng gam hoặc miligam O2 theo đơn vị thể tích) cần cho vi sinh vật tiêu thụ để ô
xy hoá sinh học các chất hữu cơ trong bóng tối ở điều kiện tiêu chuẩn về nhiệt độ và thời gian Như vậy BOD phản ánh lượng các chất hữu cơ dễ bị phân huỷ sinh học có trong mẫu nước
- Amoniac: Trong nước, bề mặt tự nhiên của vùng không ô nhiễm amoniac chỉ có ở nồng độ vết (dưới 0,05 mg/l) Trong nguồn nước có độ pH acid hoặc trung tính, amoniac tồn tại ở dạng ion amoniac (NH4+); nguồn nước có pH kiềm thì amoniac tồn tại chủ yếu ở dạng khí NH3
Nitrat (NO3-): Nitrat là sản phẩm cuối cùng của sự phân huỷ các chất chứa nitơ có trong chất thải của người và động vật Trong nước tự nhiên có nồng độ nitrat thường <5 mg/l ở vùng bị ô nhiễm do chất thải, phân bón, nồng độ nitrat cao là môi trường dinh dưỡng tốt cho phát triển tảo, rong, gây ảnh hưởng đến CLN sinh hoạt và thuỷ sản
Phosphat (PO43- ): Phosphat là chất dinh dưỡng cho sự phát triển rong tảo Nồng độ phosphat trong nguồn nước không bị ô nhiễm thường <0,01 mg/l Nguồn phosphat đưa vào môi trường là phân người, phân súc vật và nước thải một số ngành công nghiệp sản xuất
Trang 7Coliform: Vi khuẩn nhóm Coliform (Coliform, Fecal coliform, Fecal streptococci, Escherichia coli …) có mặt trong ruột non và phân của động vật máu nóng, qua con đường tiêu hoá mà chúng xâm nhập vào môi trường và phát triển mạnh nếu có điều kiện nhiệt độ thuận lợi
Kim loại nặng: Kim loại nặng (Asen, chì, Crôm(VI), Cadimi, Thuỷ ngân …) có mặt trong nước do nhiều nguyên nhân: trong quá trình hòa tan các khoáng sản, các thành phần kim loại có sẵn trong tự nhiên hoặc sử dụng trong các công trình xây dựng, các chất thải công nghiệp ảnh hưởng của kim loại nặng thay đổi tuỳ thuộc vào nồng độ của chúng, nó
là có ích nếu chúng ở nồng độ thấp và rất độc nếu ở nồng độ vượt giới hạn cho phép
1.2 Vai trò của thống kê ứng dụng trong nghiên cứu tài nguyên và môi trường
Thống kê ngày càng quan trọng trong thực tiễn, đời sống hằng ngày của mỗi cá nhân, tổ chức trong nhiều lĩnh vực khác nhau Thống kê từ chỗ chỉ là đơn thuần mô tả, đã vươn lên thể hiện khả năng phân tích, dự đoán một cách chính xác với đầy đủ cơ sở khoa học Vì vậy, thống kê là một khoa học được ứng dụng sâu rộng trong mọi lĩnh vực của hoạt động kinh tế - xã hội Đây là một trong những công cụ quản lý vĩ mô quan trọng, nó có vai trò cung cấp đầy đủ, kịp thời những thông tin thống kê trung thực, khách quan, chính xác, phản ánh bản chất và tính quy luật của các hiện tượng kinh tế - xã hội trong điều kiện không gian và thời gian cụ thể cho các cơ quan nhà nước, các tổ chức và cá nhân Những kết quả này hỗ trợ trong việc đưa ra những đánh giá, dự báo tình hình, xu hướng phát triển, hoạch định chiến lược, chính sách và xây dựng kế hoạch
Tùy từng ngành, từng lĩnh vực cụ thể mà thống kê có các bài toán giải quyết khác nhau Trong lĩnh vực tài nguyên và môi trường, thống kê có các vai trò quan trọng trong việc: Mô tả, giải thích và dự đoán các mô hình và các hoạt động theo không gian; Giải thích sự thay đổi theo không gian của các đối tượng, hiện tượng, mô hình khác nhau; Giúp hình thành các tri thức về địa lý tự nhiên, địa lý kinh tế - xã hội, tài nguyên và môi trường; Lượng hóa dữ liệu và có cái nhìn đúng đắn về các mô hình đưa ra; Cụ thể hóa các khái
Trang 8- Phân tích mối tương quan (các điều kiện hình thành khí hậu; đô thị hóa và tăng trưởng kinh tế, dân cư, tốc độ trượt lở với độ dốc…)
- Mô tả các mẫu điều tra môi trường, kinh tế - xã hội (dân số, xã hội học…)
- Quan trắc, mô tả các hiện trạng chỉ thị môi trường (không khí, nước, khí tượng khí hậu, đất…)
- Phân tích mức độ hài lòng của người dân đối với hoạt động du lịch…
- Phân tích các nhân tố ảnh hưởng đến khả năng chống chịu người dân đối với thiên tai, nhân tố ảnh hưởng đến hiệu quả quản lý nhà nước về đất đai…
- Phân vùng, kiểu phát triển kinh tế xã hội lãnh thổ dựa trên phân tích đa tiêu chí [1]
1.3 Phương pháp và quy trình xử lý số liệu thống kê
1.3.1 Phương pháp xử lý số liệu thống kê
Xử lý số liệu thống kê là việc sử dụng các công cụ và phương pháp khoa học để phân tích các số liệu đã thu thập được, nhằm biết được ý nghĩa của số liệu đã thống kê và thu được các thông tin cần thiết
SPSS là một phần mềm chuyên được sử dụng cho công tác phân tích thống kê SPSS giúp ghi nhận và làm sạch dữ liệu, thực hiện xử lý và quản lý dữ liệu, dữ liệu thu được sẽ được trình bày và diễn giải dưới dạng các bảng biểu, đồ thị
SPSS ngày càng được sử dụng phổ biến hơn trong nhiều lĩnh vực khác nhau như: Tâm lý học; Tội phạm học; Điều tra xã hội học; Nghiên cứu kinh doanh; Nghiên cứu trong
y sinh
- Thống kê mô tả các thông số: Thống kê mô tả trong tiếng Anh là Descriptive Statistics Thống kê mô tả là các hệ số mô tả ngắn gọn hay tóm tắt một tập dữ liệu nhất
Trang 97
định, có thể là đại diện cho toàn bộ hoặc một mẫu của một tổng thể Thống kê mô tả được chia thành đo lường xu hướng tập trung và đo lường biến động Đo lường xu hướng tập trung có giá trị trung bình, trung vị và yếu vị, trong khi các đo lường biến động gồm độ lệch chuẩn, phương sai, giá trị nhỏ nhất và giá trị lớn nhất, độ nhọn và độ lệch Thống kê
mô tả giúp mô tả và hiểu được các tính chất của một bộ dữ liệu cụ thể bằng cách đưa ra các tóm tắt ngắn về mẫu và các thông số của dữ liệu Loại thống kê mô tả phổ biến nhất là các thông số xu hướng tập trung gồm: giá trị trung bình, trung vị và yếu vị, các thông số này được sử dụng ở hầu hết các cấp độ toán học và thống kê
- Phân tích tương quan (Peasrson):
Phân tích tương quan Pearson là một trong các bước chúng ta thực hiện trong bài nghiên cứu sử dụng phân tích định lượng SPSS Thường bước này sẽ được thực hiện trước khi phân tích hồi quy
Mục đích chạy tương quan Pearson nhằm kiểm tra mối tương quan tuyến tính chặt chẽ giữa biến phụ thuộc với các biến độc lập và sớm nhận diện vấn đề đa cộng tuyến khi các biến độc lập cũng có tương quan mạnh với nhau
Tương quan Pearson r có giá trị dao động từ -1 đến 1 (lưu ý, hệ số r chỉ có ý nghĩa khi sig nhỏ hơn 0.05):
Nếu r càng tiến về 1, -1: tương quan tuyến tính càng mạnh, càng chặt chẽ Tiến về
1 là tương quan dương, tiến về -1 là tương quan âm
Nếu r càng tiến về 0: tương quan tuyến tính càng yếu
Nếu r = 1: tương quan tuyến tính tuyệt đối, khi biểu diễn trên đồ thị pHân tán Scatter như hình vẽ ở trên, các điểm biểu diễn sẽ nhập lại thành 1 đường thẳng
Nếu r = 0: không có mối tương quan tuyến tính Lúc này sẽ có 2 tình huống xảy ra Một, không có một mối liên hệ nào giữa 2 biến Hai, giữa chúng có mối liên hệ phi tuyến tính
Một số bài viết trên Internet chia sẻ mối tương quan r nhỏ hơn 0.2 thì không có tương quan giữa cặp biến đó - điều này hoàn toàn sai Không có bất cứ tài liệu hay công thức nào chứng minh r < 0.2 thì cặp biến không có tương quan cả Nếu sig < 0.05 thì có tương quan, khi đó r tiến càng gần 1 tương quan càng mạnh, càng tiến gần 0 tương quan càng yếu; nếu sig > 0.05 thì mới không có tương quan
Trang 10Đặc trưng của biểu đồ hộp:
- Biểu đồ hộp giúp biểu diễn các đại lượng quan trọng của dãy số như giá trị nhỏ nhất (min), giá trị lớn nhất (max), tứ phân vị (quartile), khoảng biến thiên tứ phân vị (Interquartile Range) một cách trực quan, dễ hiểu
Trang 119
1.3.2 Quy trình nghiên cứu
1.4 Khái quát về tập dữ liệu thống kê
Dữ liệu thống kê là căn cứ vào một (hay một số) tiêu thức nào đó, tiến hành phân chia các đơn vị của hiện tượng nghiên cứu thành các tổ (hoặc tiểu tổ) có tính chất khác nhau
Chúng ta biết rằng, các hiện tượng và quá trình kinh tế xã hội thường rất phức tạp,
vì chúng tồn tại và phát triển dưới nhiều loại hình có quy mô và đặc điểm khác nhau Mỗi hiện tượng nghiên cứu cũng thường được kết cấu từ nhiều tổ, nhiều bộ pHận, nhiều loại hình có tính chất khác nhau Muốn phản ánh được bản chất và quy luật phát triển của hiện tượng, phải tìm cách nêu lên được đặc trưng của từng loại hình, của từng bộ phận cấu thành hiện tượng phức tạp, đánh giá tầm quan trọng của mỗi bộ phận, nêu lên mối liên hệ giữa các bộ phận, rồi từ đó nhận thức được các đặc trưng chung của toàn bộ
Dữ liệu thống kê được sử dụng rộng rãi trong các nghiên cứu kinh tế - xã hội Phân
tổ giúp ta thực hiện được việc nghiên cứu một cách kết hợp giữa cái chung và cái riêng Các đơn vị tổng thể được tập hợp lại thành một số tổ (hoặc tiểu tổ) Trong đó, các đơn vị trong phạm vi mỗi tổ đều có sự giống nhau (hay gần giống nhau) về tính chất theo tiêu thức phân tổ, nhờ đó ta có thể xác định được đặc trưng riêng của từng tổ
Trang 1210
Dữ liệu thống kê là phương pháp cơ bản để tiến hành tổng hợp thống kê, vì ta sẽ không thể tiến hành hệ thống hoá một cách khoa học các tài liệu điều tra, nếu không áp dụng phương pháp này Phân tổ thống kê là một trong các phương pháp quan trọng của phân tích thống kê, đồng thời là cơ sở để vận dụng các phương pháp phân tích thống kê khác Chỉ sau khi đã phân chia tổng thể nghiên cứu thành các tổ có quy mô và đặc điểm khác nhau, việc tính các chỉ tiêu phản ánh mức độ, tình hình biến động, mối liên hệ giữa các hiện tượng mới có ý nghĩa đúng đắn Nếu việc phân tổ không chính xác, tổng thể được chia thành những bộ phận không đúng với thực tế, thì mọi chỉ tiêu tính ra cũng không giúp
ta rút ra được những kết luận đúng đắn
Dữ liệu thống kê còn được vận dụng ngay trong giai đoạn điều tra thống kê, nhằm phân tổ đối tượng điều tra thành những bộ phận có đặc điểm tính chất khác nhau từ đó chọn các đơn vị điều tra sao cho đảm bảo tính đại diện cho tổng thể chung
Dữ liệu thống kê có những nhiệm vụ cơ bản sau đây:
Thứ nhất, dữ liệu thực hiện việc phân chia các loại hình kinh tế xã hội của hiện tượng nghiên cứu Hiện tượng kinh tế xã hội mà thống kê nghiên cứu thường là những tổng thể phức tạp, không đồng chất Vì vậy, phương pháp nghiên cứu khoa học là phải nêu lên các đặc trưng riêng biệt của từng loại hình và mối quan hệ giữa các loại hình đó với nhau
Thứ hai, dữ liệu có nhiệm vụ biểu hiện kết cấu của hiện tượng nghiên cứu Bất kỳ một hiện tượng kinh tế xã hội nào đều do nhiều bộ phận, nhiều nhóm đơn vị có tính chất khác nhau hợp thành Các bộ phận hay nhóm này chiếm những tỷ trọng khác nhau trong tổng thể và nói lên tầm quan trọng của nó trong tổng thể đó
Thứ ba, dữ liệu được dùng để biểu hiện mối liên hệ giữa các tiêu thức Các hiện tượng kinh tế xã hội luôn phát sinh, phát triển và tồn tại trong mối liên hệ tác động qua lại với các hiện tượng có liên quan nhau theo những quy luật nhất định Giữa các tiêu thức
mà thống kê nghiên cứu cũng thường có mối liên hệ với nhau: sự thay đổi của tiêu thức này sẽ đưa đến sự thay đổi của tiêu thức kia theo một quy luật nào đó
Trong tiểu luận này, tập thống kê là dữ liệu chất lượng nước mặt gồm 300 mẫu, được đo từ năm 2015 – 2020 trên các sông của tỉnh Quảng Bình
Trang 13Vào File → Open Data → Data
- Hộp thoại Open Data sẽ xuất hiện
Trang 1412
+ Tại mục Look in, tìm đến thư mục chưa dữ liệu thực hành (1);
+ Tại mục Files of type, ta chọn định dạng file Excel để file dữ liệu thực hành xuất
hiện (2);
+ Sau đó chọn File dữ liệu thực hành “2021_Data water QB.xlsx” (3) rồi nhấn Open (4)
Sau đó sẽ xuất hiện hộp thoại Read Excel Files
- Tại mục Work Sheet chọn đúng sheet Descriptive Analysis
- Tích vào ô Read variable names from first row of data: hàng đầu tiên trong bảng
Trang 1513
- Mở dữ liệu thành công
Bước 3: Lưu dữ liệu
Vào File → Save As
Trang 1614
- Hộp thoại Save Data As xuất hiện
+ Tại mục Look in chọn vị trí lưu File
+ Tại File name, đặt tên cho file
+ Nhấn Save
Bước 4: Kiểm tra lại các biến
Trong cửa sổ làm việc, chọn chế độ Variable View tiến hành kiểm tra lại các biến
Trang 1715
- Tại mục Name (tên biến), không để tên biến là Tiếng Việt mà phải chuyển thành
không dấu
- Tại Label (nhãn), dùng tiếng Việt để thể hiện ý nghĩa tên của các biến
Bước 5: Thống kê mô tả
Vào Analyze → Descriptive Statistics → Descriptives…
Hộp thoại Descriptive xuất hiện
Chọn thông số cần phân tích, ở đây ta chọn Amoni
Click vào Save standardized values as variables (tự động ra các biến mới, đã được
chuẩn hóa)
Sau đó, click vào Option, cửa sổ Descriptives: Options sẽ xuất hiện
Trang 1816
- Chọn Sum (tổng), Mean (giá trị trung bình), Std deviation (độ lệch chuẩn), Minimum (giá trị nhỏ nhất), Maximum (giá trị lớn nhất), Variance (phương sai), Range (độ rộng/giá trị chênh lệch giữa max và min), S.E mean (độ lệch chuẩn trung bình)
- Thể hiện phân phối dữ liệu theo Kurosis và hệ số Skewness
- Tại Display Order chọn Variable list rồi nhấn Continue để đóng cửa sổ
Cuối cùng tại cửa sổ Descriptives nhấn Ok
Tại cửa sổ Output ta nhận được bảng dữ liệu thống kê của thông số Amoni