TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP HÀ NỘI KHOA CÔNG NGHỆ THÔNG TIN ============ Báo cáo bài tập lớn PHÂN TÍCH THÔNG KÊ SỐ LIỆU ĐỀ TÀI Phân tích sản lượng và diện tích của lúa, ngô, mía, và diện tích lúa, ngô, khoai lang phân theo địa phương qua các năm từ 2010 2019 Hà Nội 2021 Mục lục CHƯƠNG 1 CƠ SỞ LÍ THUYẾT 4 1 Các khái niệm về đặc trưng cơ bản của số liệu 4 1 1 Các đặc trưng cề sự tập trung của tập số liệu 4 1 2 Các tham số đặc trưng cho sự phân tán của tập số liệu 8 2 1 Bài toán 1 nhân tố 12 2 2.
TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP HÀ NỘI KHOA CÔNG NGHỆ THƠNG TIN ======***====== Báo cáo tập lớn PHÂN TÍCH THƠNG KÊ SỐ LIỆU ĐỀ TÀI: Phân tích sản lượng diện tích lúa, ngơ, mía, diện tích lúa, ngô, khoai lang phân theo địa phương qua năm từ 2010 - 2019 Hà Nội _ 2021 Mục lục CHƯƠNG 1: CƠ SỞ LÍ THUYẾT Các khái niệm đặc trưng số liệu 1.1 Các đặc trưng cề tập trung tập số liệu 1.1.1 Tần suất Tần suất (): Giả thiết có tập số liệu kết nghiên cứu gồm có N số liệu, có giá trị có (xuất lần) gọi tần số giá trị đó, tần suất giá trị tính sau: = 0< ∞ -> ( xác xuất xuất ) Vd 1: Cho tập số liệu diện tích mía (nghìn ha) từ 2010-2019 Năm Diện tích mía (nghìn ha) 2010 2011 2012 2013 2014 2015 2016 2017 2018 2019 269.1 282.2 301.9 310.4 305 284.2 267.6 281 269.3 233.7 Tổng 10 số => N=10 Số lần xuất : i X 233.7 0.1 267.6 0.1 269.1 0.1 1.1.2 269.3 0.1 281 0.1 282.2 0.1 284.2 0.1 301.9 0.1 305 0.1 10 310.4 0.1 Số trội (: Số trội số có tần suất lớn ( số có tần xuất xuất lớn nhất) tập số liệu kết thực nghiệm Vd 2: Từ tập số liệu vd1 tất X có tần suất 1.1.3 Khoảng cách tập số (R) Bảng số liệu diện tích mía (nghìn ha) từ 2010-2019 sau xếp: STT 10 Diện tích mía (nghìn Năm ha) 2019 233.7 2016 267.6 2010 269.1 2018 269.3 2017 281 2011 282.2 2015 284.2 2012 301.9 2014 305 2013 310.4 Khoảng cách tập số (R) khoảng cách giá trị lớn giá trị nhỏ tập số liệu kết thực nghiệm Công thức : R= 1.1.4 Vd3 : Từ tập số liệu vd1 ta : R=310.4-233.7=76.7 Số trung vị (Med) số tứ phẩn vị (Q) Số trung vị (Med) số đứng tập số liệu xếp theo thứ tự từ bé đến lớn, chia dãy số thành hai phần số liệu Ví dụ: === = trùng với số trung vị Med -Đối với số liệu khơng nhóm lại: + Sô trung vị tập N số lẻ tính:Med= + Số trung vị tập N số chẵn tính:Med=[+] + Số tứ phân vị tập N giá trị chia hết cho =[+] =[+] + Số tứ phân vị tập N không chia hết cho = = -Đối với số liệu gộp thành nhiều nhóm: Med=( -) + = [-] + Ví dụ: cho số liệu diện tích mía (nghìn ha) từ năm 2010-2019 xếp tăng dần: STT Năm Diện tích mía (nghìn ha) 10 2019 2016 2010 2018 2017 2011 2015 2012 2014 2013 233.7 267.6 269.1 269.3 281 282.2 284.2 301.9 305 310.4 Từ bảng ta có N=10, N lẻ =>Sô trung vị tập N số chẵn tính: Med= = = (281+282.2)/2 = 281.6 Số tứ phân vị tập N không chia hết cho 4: = = = 269.1 == = 301.9 1.1.5 Trung bình cộng Gọi X giá trị trung bình cộng tập số liệu X tính theo cơng thức: = với N = Ví dụ : Cho tập số liệu diện tích mía (nghìn ha) từ năm 2010-2019 Tính Năm Diện tích mía (nghìn ha) 2010 2011 2012 2013 2014 2015 2016 2017 2018 269.1 282.2 301.9 310.4 305 284.2 267.6 281 269.3 2019 233.7 Ví dụ: Từ bảng =280.44 1.2 Các tham số đặc trưng cho phân tán tập số liệu: 1.2.1 Phương sai (² hay S² ) Phương sai trung bình tổng bình phương sai khác giá trị tập số liệu so với giá trị trung bình tập số liệu kết thực nghiệm: Hay: Cơng thức thực dụng để tìm phương sai: N’ có chất bậc tự tập số liệu Với N’ = N N>30 N’=N-1 Nếu N