2.3. Phƣơng pháp nghiên cứu
2.3.3. Phương pháp thống kê và xử lý dữ liệu
Căn cứ vào các số liệu thu thập đƣợc từ các nghiên cứu trƣớc đó và khảo sát tại thực địa, thực hiện xử lý thống kê phục vụ cho q trình phân tích khi xây dựng các báo cáo, chuyên đề của đề tài. Sử dụng các phép toán thống kê để làm cơ khoa học nhằm đƣa ra các nhận định trong việc phân tích số liệu, đánh giá độ tin cậy của
phƣơng pháp quan trắc cũng nhƣ chuỗi số liệu có đƣợc, tính ứng dụng phƣơng pháp này trong các vấn đề đánh giá, dự đoán xu hƣớng, diễn biến nồng độ Ơzơn.
Các công cụ sử dụng để thống kê và phân tích dữ liệu
Trạm khí tự động vận hành liên tục 365 ngày (trong 24h và 7 ngày/tuần) đo liên tục (5 phút/lần), tính trung bình giờ trong tồn bộ thời gian nghiên cứu với tổng cộng 315.360 giá trị đo. Vì vậy, để phân tích số liệu một cách khoa học và đáp ứng đƣợc với nhu cầu sử dụng số liệu để thống kê theo các khoảng thời gian thì đề tài sử dụng công cụ bao gồm:
Ngơn ngữ lập trình R hiện đang sử dụng phổ biến trên thế giới để phân tích và đánh giá chất lƣợng dữ liệu môi trƣờng.
H nh 6 Giao diện chƣơng tr nh Rstudio
R là phần mềm (hay ngơn ngữ lập trình R) sử dụng để phân tích dữ liệu đƣợc xây dựng bởi Ross Ihaka và Robert Gentleman tại The University of Auckland, New Zealand, tiếp tục đƣợc phát triển bởi nhóm R Development Core Team. Phần lớn các kỹ thuật phân tích đều đƣợc R hỗ trợ – từ Thống kê đến Học máy hay các kỹ thuật Tối ƣu hóa. ằng chứng cho sức mạnh của R đó là sự cơng nhận của những Tạp chí hay cộng đồng uy tín trên thế giới nhƣ New York Times, Forbes, Intelligent, Enterprise, InfoWorld và The Register; cũng nhƣ đƣợc tích hợp phát
triển bởi các tập đồn cơng nghệ hàng đầu nhƣ Microsoft, Google, I M, Oracle, Amazon-AWS.
R cung cấp cho chúng ta một ngơn ngữ máy tính và một số chức năng để phân tích căn bản và đơn giản. Nếu muốn làm các phân tích phức tạp hơn, chúng ta cần phải tải về các gói (Package) phù hợp với từng mục tiêu nghiên cứu. Các Package là những phần mềm nhỏ đƣợc các nhà thống kê phát triển để giải quyết một vấn đề cụ thể và chạy trên hệ thống của R. Trong phạm vi của đề tài sử dụng các gói package Openair, để phân tích và đánh giá xu hƣớng biến động nồng độ Ơzơn.
Excel là một chƣơng trình phổ biến trên các loại máy tính, sử dụng để lƣu trữ, quản lý và tính tốn số liệu dƣới dạng bảng tính. Các số liệu trích xuất từ các trạm quan trắc khơng khí tự động đƣợc định dạng .CSV (Comma Separated Values, các giá trị định giới bằng dấu phẩy)
H nh 7 Giao diện phần mềm Excel
SPSS (viết tắt của Statistical Package for the Social Sciences) là một phần mềm máy tính phục vụ cơng tác phân tích thống kê. SPSS là phần mềm thống kê đƣợc sử dụng phổ biến cho các nghiên cứu điều tra xã hội học và kinh tế lƣợng.
SPSS có giao diện thân thiện với ngƣời dùng, dễ sử dụng bởi sử dụng chủ yếu các thao tác click chuột dựa trên các công cụ (tool) mà rất ít dùng lệnh (khác với R hay Stata). SPSS rất mạnh cho các phân tích nhƣ kiểm định phi tham số (Chi-square, Phi, lamda….), thống kê mô tả, kiểm định sự tin cậy của thang đo bằng Cronbach Alpha, phân tích tƣơng quan, hồi quy tuyến tính đơn và bội, kiểm định trung bình (T-test), kiểm định sự khác nhau giữa các biến phân loại (định danh) bằng phân tích phƣơng sai (ANOVA), vẽ bản đồ nhận thức (dùng trong marketing) hay sử dụng biến giá (hồi quy với biến phân loại), hồi quy nhị thức (logistic), v.v. Hiện nay phần mềm SPSS đang đƣợc sử dụng rộng rãi trong thống kê phân tích số liệu. Đặc biệt trong các trƣờng đại học, việc sử dụng SPSS làm công cụ nghiên cứu đang hết sức phổ biến.