Thống kê mô tả: Các đại lượng sốThống kê mô tả: Các đại lượng sốThống kê mô tả: Các đại lượThống kê mô tả: Các đại lượng sốThống kê mô tả: Các đại lượng sống sốThống kê mô tả: Các đại lượng sốThống kê mô tả: Các đại lượng sốThống kê mô tả: Các đại lượng sốThống kê mô tả: Các đại lượng sốThống kê mô tả: Các đại lượng sốThống kê mô tả: Các đại lượng sốThống kê mô tả: Các đại lượng số
Trang 11
Slide
Slide
© 2011 Cengage Learning All Rights Reserved May not be scanned, copied
or duplicated, or posted to a publicly accessible website, in whole or in part
Trang 2Chương 3, Phần A Thống kê mô tả: Các đại lượng số
Đo lường vị trí
Đo lường độ phân tán
Trang 33
Slide
Slide
© 2011 Cengage Learning All Rights Reserved May not be scanned, copied
or duplicated, or posted to a publicly accessible website, in whole or in part
Đại lượng đo lường vị trí
Nếu các tính toán cho dữ liệu từ một mẫu , gọi là
Trang 55
Slide
Slide
© 2011 Cengage Learning All Rights Reserved May not be scanned, copied
or duplicated, or posted to a publicly accessible website, in whole or in part
Trung bình mẫu
Số lượng quan sát trong mẫu
Số lượng quan sát trong mẫu
n
Trang 6m
Trang 77
Slide
Slide
© 2011 Cengage Learning All Rights Reserved May not be scanned, copied
or duplicated, or posted to a publicly accessible website, in whole or in part
70 căn hộ được lấy mẫu ngẫu nhiêntại một làng đại học nhỏ Giá thuê hàng tháng của những căn hộ này được liệt kê dưới đây:
Trang 8x x
n
Trang 99
Slide
Slide
© 2011 Cengage Learning All Rights Reserved May not be scanned, copied
or duplicated, or posted to a publicly accessible website, in whole or in part
Trung vị (Median)
Khi tập dữ liệu có những giá trị bất thường,
trung vị là thước đo ưu tiên cho vị trí trung tâm
Một vài giá trị thu nhập hoặc tài sản rất lớn có thể ảnh hưởng đến trung bình.
Trung vị thường được dùng làm thước đo vị trí cho dữ liệu về thu nhập vá giá trị tài sản hàng
năm
Trung vị của dữ liệu là giá trị đứng ở vị trí giữa khi các giá trị của dữ liệu được xếp theo thứ tự tăng dần
Trang 1111
Slide
Slide
© 2011 Cengage Learning All Rights Reserved May not be scanned, copied
or duplicated, or posted to a publicly accessible website, in whole or in part
Trang 1313
Slide
Slide
© 2011 Cengage Learning All Rights Reserved May not be scanned, copied
or duplicated, or posted to a publicly accessible website, in whole or in part
Trimmed Mean
Nó được tính bằng cách loại đi phần trăm
những giá trị nhỏ nhất và giá trị lớn nhất của
tập dữ liệu sau đó tính trung bình cho những giá trị còn lại.
Ví dụ, the 5% trimmed mean có nghĩa là bỏ đi 5% giá trị nhỏ nhất và 5% giá trị lớn nhất của
dữ liệu sau đó tính trung bình các giá trị còn lại.
Một đại lượng khác, thỉnh thoảng đượcdùng
khi xuất hiện những giá trị ngoại lệ đó là
trimmed mean.
Trang 14Mốt (Mode)
Mode của tập dữ liệu là giá trị có tần số xuất hiện lớn nhất.
Tần số lớn nhất có thể ở 2 hai nhiều giá trị
khác nhau.
Nếu dữ liệu có 2 mode, dữ liệu là bimodal.
Nếu dữ liệu có nhiều hơn 2 mode, dữ liệu là multimodal.
Lưu ý: Nếu dữ liệu có hai hay nhiều mode , thì hàm
MODE trong excel sẽ chỉ xác định được 1 mode.
Trang 1515
Slide
Slide
© 2011 Cengage Learning All Rights Reserved May not be scanned, copied
or duplicated, or posted to a publicly accessible website, in whole or in part
Trang 16Phân vị
Phân vị cung cấp thông tin về cách thức dữ
liệu được trải ra trong một khoảng từ giá trị nhỏ nhất đến giá trị lớn nhất.
Các trường Cao đẳng và đại học thường xuyên báo cáo kết quả kiểm tra đầu vào dưới dạng
phân vị.
Phân vị thứ p của tập dữ liệu là một giá trị mà ít nhất p phần trăm các quan sát có giá trị nhỏ hơn hoặc bằng giá trị này và ít nhất có (100 - p)
phần trăm các quan sát có giá trị lớn hơn hoặc bằng giá trị này.
Trang 1717
Slide
Slide
© 2011 Cengage Learning All Rights Reserved May not be scanned, copied
or duplicated, or posted to a publicly accessible website, in whole or in part
Nếu i là một số nguyên, phân vị thứ p là
trung bình của hai giá trị ở vị trí i và i +1.
Nếu i là một số nguyên, phân vị thứ p là
trung bình của hai giá trị ở vị trí i và i +1.
Trang 1919
Slide
Slide
© 2011 Cengage Learning All Rights Reserved May not be scanned, copied
or duplicated, or posted to a publicly accessible website, in whole or in part
Phân vị 80
“Ít nhất 80% quan sát nhỏ hơn hoặc bằng 542.”
“Ít nhất 20% quan sát lớn hơn hoặc bằng 542.”
Trang 2121
Slide
Slide
© 2011 Cengage Learning All Rights Reserved May not be scanned, copied
or duplicated, or posted to a publicly accessible website, in whole or in part
Trang 22Đo lường độ phân tán
Chúng ta thường mong muốn xem xét các đại lượng đo lường sự phân tán (biến thiên), cũng
như là đo lường vị trí.
Ví dụ, trong việc chọn lưa nhà cung cấp dịch
vụ giao hàng A hoặc B, chúng ta không chỉ xem xét thời gian giao hàng trung bình, mà còn xem xét biến thiên thời gian giao hàng của mỗi nhà cung cấp.
Trang 2323
Slide
Slide
© 2011 Cengage Learning All Rights Reserved May not be scanned, copied
or duplicated, or posted to a publicly accessible website, in whole or in part
Đo lường độ phân tán
Khoảng biến thiên
Trang 24Khoảng biến thiên (Range)
Khoảng biến thiên của một tập dữ liệu là
chênh lệch giữa giá trị lớn nhất và giá trị nhỏ
nhất.
Nó là đại lượng đơn giản nhất để đo lường độ phân tán.
Nó rất nhạy với giá trị dữ liệu nhỏ nhất và lớn nhất.
Trang 2525
Slide
Slide
© 2011 Cengage Learning All Rights Reserved May not be scanned, copied
or duplicated, or posted to a publicly accessible website, in whole or in part
Khoảng biến thiên (Range)
Khoảng biến thiên = giá trị lớn nhất – giá trị nhỏ nhất
Trang 26Độ trải giữa (Interquartile Range)
Độ trải giữa của tập dữ liệu là chênh lệch
giữa tứ phân vị thứ ba và tứ phân vị thứ nhất.
Nó là khoảng biến thiên của 50% dữ liệu ở
giữa của dãy số.
Nó không bị ảnh hưởng bởi giá trị ngoại lệ.
Trang 2727
Slide
Slide
© 2011 Cengage Learning All Rights Reserved May not be scanned, copied
or duplicated, or posted to a publicly accessible website, in whole or in part
Trang 28Phương sai là một đại lượng đo lường phân
tán mà sử dụng tất cả dữ liệu.
Phương sai (Variance)
Nó dựa trên chênh lệch giữa giá trị của mỗi
quan sát (xi) và trung bình ( dùng cho mẫu , m
cho tổng thể).
Phương sai rất hữu ích trong việc so sánh độ phân tán của hai hay nhiều biến.
x
Trang 2929
Slide
Slide
© 2011 Cengage Learning All Rights Reserved May not be scanned, copied
or duplicated, or posted to a publicly accessible website, in whole or in part
Phương sai (Variance)
Phương sai được tính như sau:
Trang 30Độ lệch chuẩn (Standard Deviation)
Độ lệch chuẩn của tập dữ liệu là căn bậc hai
của phương sai
Nó được đo bằng đơn vị giống với dữ liệu, nên
sẽ dễ dàng giải thích hơn so với phương sai.
Trang 3131
Slide
Slide
© 2011 Cengage Learning All Rights Reserved May not be scanned, copied
or duplicated, or posted to a publicly accessible website, in whole or in part
Độ lệch chuẩn được tính như sau:
Trang 32Hệ số biến thiên được tính như sau:
Hệ số biến thiên được tính như sau:
Hệ số biến thiên (Coefficient of Variation)
Hệ số biến thiên là chỉ số cho biết độ lệch chuẩn lớn bằng bao nhiêu lần so với trung bình.
Hệ số biến thiên là chỉ số cho biết độ lệch
chuẩn lớn bằng bao nhiêu lần so với trung
bình.
Mẫu Tổng thể
100 %
s x
Trang 3333
Slide
Slide
© 2011 Cengage Learning All Rights Reserved May not be scanned, copied
or duplicated, or posted to a publicly accessible website, in whole or in part
Độ lệch chuẩn là khoảng 11% trung
bình
• Phương sai
• Độ lệch chuẩn
• Hệ số biến thiên
Phương sai, độ lệch chuẩn, hệ số biến
thiên của mẫu
Trang 34Kết thúc Chương 3, Phần A