toán đẹp vcl đcm vdksjvkjdjvdkbjvjldvjldsljgbvdbskvjhdegiyewvhewbfsdkfvkebwgvkbjdkbjvbdvjbkdskbjvsdkjvbkjdebvjdevbjdebvedbjhedbkvjdwvbwdvbjdskjvjdsivubedgbvdwgvbkjdsbjvdbvbjdevjdjvjnadbvjzbjdbvkzdfkbjzbkjzfdvbkdzbvkzdbkjvbkjzdfjbdzfjbjzdfkjbjdfbkldzfkbkjlzdfbjfjhjebklfk
Trang 1THỐNG KÊ MÔ TẢ
TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP THỰC PHẨM
KHOA CÔNG NGHỆ THỰC PHẨM Bài giảng
Trang 2Đo lường xu hướng tại tâm
Trung bình
Đo lường độ phân tán
Các tham số của dữ liệu liên tục
Trang 3𝑋 = 1
𝑛
𝑖=1
𝑛
𝑋𝑖 = 𝑋1 + 𝑋2 + ⋯ + 𝑋𝑛
𝑛
Các tham số mô tả dữ liệu liên tục
Giá trị trung bình (mean) là tổng tất cả giá trị của các dữ liệu chia cho số lượng của dữ liệu
N: số phần tử
𝑋: giá trị trung bình
Trang 4Các tham số mô tả dữ liệu liên tục
SỐ TRUNG VỊ (Median)
Trung vị (median) là giá trị của số liệu có vị trí nằm giữa bộ
số liệu sắp xếp theo trật tự Đây chính là điểm giữa của phân phối Khi số quan sát là chẵn, trung vị là giá trị trung bình của hai quan sát ở vị trí trung tâm
`
SỐ YẾU VỊ (Mode)
Số yếu vị của tập dữ liệu là số có tần suất lớn nhất
Trang 5Các tham số mô tả dữ liệu liên tục
0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10 12 14
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 0 1 2 3 4 5 6
Trang 6σ2 = 1
𝑛 − 1
𝑖=1
𝑛
Các tham số mô tả dữ liệu liên tục
Phương sai (Variance; σ2)
Là trung bình tổng các sai số bình phương giữa các giá trị của các quan sát và giá trị trung bình.
σ2: phương sai mẫu n: số phần tử
𝑋: giá trị trung bình
Trang 7Các tham số mô tả dữ liệu liên tục
Độ lệch chuẩn (Standard deviation; SD; σ)
Đo lường mức độ phân tán của số liệu xung quanh giá trị trung bình
2
SD
Trang 8Các tham số mô tả dữ liệu liên tục
Độ Lệch Chuẩn (Standard Deviation – SD)
bệnh trong hai nhóm bệnh nhân (nhóm A gồm 6 bệnh nhân, và nhóm B gồm 4 bệnh nhân) như sau:
Nhóm A: 6, 7, 8, 4, 5, 6 Nhóm B: 10, 2, 3, 9
Trang 9SE = 𝑆𝐷
√𝑛
Các tham số mô tả dữ liệu liên tục
dựa trên giá trị trung bình của mẫu (mean)
Trang 10Các tham số mô tả dữ liệu liên tục
Sai số chuẩn (Standard Error – SE)
Sai số chuẩn bằng độ lệch chuẩn chia cho căn số bậc
hai của số cỡ mẫu (n)
√𝑛
SEA = 1.41/ 6 = 0.58
SEB = 4.08/ 4 = 2.04
Trang 11Các tham số mô tả dữ liệu liên tục
0 1 2 3 4 5 6
22 25 28 31 34 37 40 43 46 49 52 55 58 61 64 67 70 73 76 79 82 85 88 92
Weight (kg)
Trang 12Các tham số mô tả dữ liệu liên tục
99.7 %
68 %
95 %
Trang 13Các tham số mô tả dữ liệu liên tục
Giá trị ở tại các vị trí 25%, 50%, 75% của phân phối chia làm
4 phần chứa vị trí ¼ của tập hợp
25% 25% 25% 25%
Trang 14Các tham số mô tả dữ liệu liên tục
1
Q Q2Q3 Q1 Q2 Q3
1
Q Q2 Q3
Trang 15Các tham số mô tả dữ liệu liên tục
𝑄2: trung vị của data
𝑄1: trung vị của vùng lower set
Trang 16Câu hỏi ôn tập
1 Phân biệt trung bình mẫu và trung vị mẫu
2 Phân biệt tổng thể và mẫu
3 Phân biệt độ lệch chuẩn và sai số chuẩn
4 Phương sai mẫu được tính như thế nào?
5 Xác định các giá trị Q trên biểu đồ boxplot
6 Kể tên các loại thang đo
7 Phân biệt biến độc lập và phụ thuộc