Phương pháp thống kê, phân tích số liệu

Một phần của tài liệu Ứng dụng mô hình MIKE 11 đánh giá phạm vi và mức độ xâm nhập mặn tại sông cửa lấp tỉnh bà rịa vũng tàu (Trang 31 - 35)

Thống kê là nghiên cứu của tập hợp nhiều lĩnh vực khác nhau, bao gồm phân tích, giải thích, trình bày và tổ chức dữ liệu. Chúng ta áp dụng thống kể để nghiên cứu các lĩnh vực khoa học, công nghiệp hoặc các vấn đề xã hội. Thống kê rất cần thiết để bắt đầu nghiên cứu một tiến trình. Ví dụ, tổng thể có thể gồm nhiều loại khác nhau như “tất cả mọi người đang sống trong một đất nước” hay “tập hợp các

phân tử của tinh thể”. Nó đề cập tới tất cả các khía cạnh của dữ liệu bao gồm việc lập kế hoạch, thu thập dữ liệu mẫu cho các cuộc khảo sát và thí nghiệm.

Trong trường hợp không thể thu thập được trong quá trình điều tra tổng thể, thống kê thu thập dữ liệu bằng cách phát triển các mẫu thí nghiệm và mẫu khảo sát cụ thể. Mẫu đại diện cần được đảm bảo rằng những suy luận và kết luận có thể tin cậy được từ đó suy ra toàn bộ tổng thể. Một nghiên cứu thực nghiệm liên quan đến việc lấy kích thước mẫu, thao tác trên hệ thống và sau đó lấy kích thước mẫu cùng dạng để xác định xem các thao tác đã thay đổi giá trị của các phép đo. Ngược lại, một quan sát nghiên cứu không liên quan đến việc thực hiện thí nghiệm.

Hai phương pháp thống kê chính được sử dụng trong phân tích dữ liệu: thống kê mô tả, đây là phương pháp tóm tắt dữ liệu từ một mẫu sử dụng các chỉ số như là giá trị trung bình hoặc độ lệch chuẩn, và thống kê suy luận, rút ra kết luận từ dữ liệu biến thiên ngẫu nhiên (ví dụ: các sai số quan sát, mẫu của tổng thể). Thống kê mô tả được sử dụng thường xuyên nhất với hai thuộc tính phân phối (mẫu hoặc tổng thể): chiều hướng trung tâm (hoặc vị trí tìm cách để mô tả giá trị trung bình hoặc giá trị đặc trưng của phân phối, trong khi phân tán (hoặc thay đổi) mức độ đặc trưng mà các thuộc tính của phân phối đi chệch so với nghiên cứu. Suy luận về thống kê toán học được thực hiện trong khuôn khổ của lý thuyết xác suất, trong đó đề cập tới việc phân tích các hiện tượng ngẫu nhiên. Để thực hiện một suy luận khi chưa biết số lượng, hoặc nhiều ước lượng được đánh giá bằng cách sử dụng mẫu.

Thủ tục thống kê tiêu chuẩn liên quan đến sự phát triển của một giả thuyết vô nghĩa ban đầu là không có mối quan hệ nào giữa hai đại lượng. Loại bỏ hoặc bác bỏ giả thuyết này là một nhiệm vụ quan trọng trong việc giải thích những quan điểm mới của khoa học thống kê, đưa ra một ý nghĩa chính xác trong đó một giả thuyết được chứng minh là sai. Những gì thống kê gọi là một giả thuyết khác chỉ đơn giản là một giả thuyết trái với giả thuyết vô nghĩa. Phân tích từ một giả thuyết hai hình thức cơ bản của lỗi này được ghi nhận: sai số loại I (giả thuyết vô nghĩa sai bị bác bỏ cho một tính chất xác thực không đúng) và sai số loại II (giả thuyết không được bác bỏ và sự khác biệt thật sự giữa các tổng thể được bỏ qua cho một phủ định sai).

Một việc quan trọng là tập hợp các giá trị của các ước lượng dẫn đến bác bỏ giả thuyết vô nghĩa. Do đó sai số của xác suất loại I là xác suất các ước lượng thuộc các miền quan trọng cho rằng giả thuyết đúng (có ý nghĩa thống kê) và sai số của xác suất loại II là xác suất mà các ước lượng không phụ thuộc các lớp quan trọng được đưa ra rằng giả thuyết thay thế là đúng. Các chính sách thống kê của một bài đánh giá xác suất đúng khi bác bỏ giả thuyết vô nghĩa khi giả thuyết là sai. Nhiều vấn đề đã được liên kết với khuôn khổ: từ việc có được một c ỡ mẫu đủ để xác định một giả thuyết vô nghĩa thích hợp.

Quy trình đánh giá tạo ra các dữ liệu thống kê cũng có thể bị lỗi. Nhiều trong số các lỗi này được phân loại ngẫu nhiên (noise - dữ liệu vô nghĩa) hoặc có hệ thống (bias - độ sai lệch) , nhưng các loại khác của sai lệch (ví dụ, sai lệch khi một báo cáo phân tích của các đơn vị không đúng) cũng rất quan trọng. Sự xuất hiện của dữ liệu bị thiếu/ hoặc sự kiểm tra có thể dẫn đến các ước tính có sai số và cần phát triển kỹ thuật cụ thể để giải quyết những vấn đề này. Khoảng tin cậy cho phép các nhà thống kê thể hiện rõ ràng các mẫu ước lượng phù hợp với các giá trị có nghĩa trong toàn bộ dân số. Độ tin cậy chính thức 95% cho một giá trị là một phạm vi rộng, nếu lấy mẫu và phân tích được lặp lại trong cùng điều kiện (cho ra một bộ dữ liệu khác nhau). Miền giá trị sẽ bao gồm những giá trị thực (dân số) trong 95% của tất cả các trường hợp có thể xảy ra. Trong thống kê, biến phụ thuộc là bất kỳ mối quan hệ thống kê giữa hai biến ngẫu nhiên hoặc hai bộ dữ liệu. Sự tương quan đề cập đến bất kỳ một lớp chung nào của các quan hệ thống kê liên quan đến sự phụ thuộc. Nếu hai biến có liên quan, chúng có thể có hoặc không thể là biến nguyên nhân của các yếu tố khác. Các hiện tượng tương quan có thể được gây ra bởi một hiện tượng trước đó không được chú ý đến bởi một biến thứ ba, biến không được xuất hiện trước đó, được gọi là biến ẩn hoặc biến nhiễu.

Hình 2-3 Sơ đồ các bước thực hiện

Bước 1: chuẩn bị dụng cụ lấy mẫu và các dụng cụ hỗ trợ cần thiết.

Mẫu lấy tại 5 vị trí trên sông Cửa Lấp và đánh dấu mã mẫu. Mỗi mẫu được lấy tương ứng với tọa độ của điểm lấy mẫu đó trên mô hình Mike 11.

Mẫu sau khi được lấy được bỏ vào thùng xốp giữ nhiệt (4-10 oC) , sau đó được gửi tới trung tâm quan trắc Trung Tâm Quan Trắc Và Phân Tích Môi Trường tỉnh Bà Rịa Vũng Tàu đo và ghi nhận kết quả.

Bước 2: Xây dựng mô hình.

Để xây dựng được kịch bản chạy mô hình cần có dữ liệu địa hình đáy sông, biên, mặt cắt, lưu lương, mực nước... những dữ liệu trên được thu thập qua các cơ quan như: trung tâm khí tượng thủy văn tỉnh BRVT, Ủy ban nhân dân xã Phước Tỉnh, sở GTVT tỉnh BRVT. Sau đó các dữ liệu được số hóa đưa vào mô hình.

CHƯƠNG 3: KẾT QUẢ VÀ THẢO LUẬN

Một phần của tài liệu Ứng dụng mô hình MIKE 11 đánh giá phạm vi và mức độ xâm nhập mặn tại sông cửa lấp tỉnh bà rịa vũng tàu (Trang 31 - 35)