Đo lường dữ liệu Measures of data

17 2 0
Đo lường dữ liệu Measures of data

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Đo lường dữ liệu Measures of data Measures of central tendency Đo lường xu hướng trung tâm Hai biện pháp phổ biến nhất của xu hướng trung tâm là trung bình và trung vị. Để tìm số trung vị, chúng ta sắp xếp các quan sát theo thứ tự từ nhỏ nhất đến giá trị lớn nhất. Nếu có một số lẻ của các quan sát, trung vị là giá trị trung bình. Nếu có một số thậm chí một số quan sát, trung vị là trung bình của hai giá trị giữa .. Giá trị trung bình của một mẫu hay một quần thể được tính bằng cách cộng tất cả các quan sát và chia cho số quan sát.

Measures of data Đo lường liệu Part – section Lecturer: Le Hoai Long (Ph.D.) lehoailong@hcmut.edu.vn Measures of central tendency Đo lường xu hướng trung tâm • The two most common measures of central tendency are the median and the mean Hai biện pháp phổ biến xu hướng trung tâm trung bình trung vị find the median, we arrange the observations in order from smallest – To to largest value Để tìm số trung vị, xếp quan sát theo thứ tự từ nhỏ đến giá trị lớn • If there is an odd number of observations, the median is the middle value • – Nếu có số lẻ quan sát, trung vị giá trị trung bình If there is an even number of observations, the median is the average of the two middle values Nếu có số chí số quan sát, trung vị trung bình hai giá trị The mean of a sample or a population is computed by adding all of the observations and dividing by the number of observations Giá trị trung bình mẫu hay quần thể tính cách cộng tất quan sát chia cho số quan sát Lecturer: Le Hoai Long (Ph.D.) lehoailong@hcmut.edu.vn Measures of central tendency Đo lường xu hướng tập trung • Example: Suppose we draw a sample of five women and measure their weights They weigh 50kg, 50kg, 51kg, 52kg, and 55kg Find the mean and the median Giả sử lấy mẫu năm phụ nữ đo trọng lượng họ Họ cân nặng 50kg, 50kg, 51kg, 52kg, 55kg Tìm giá trị trung bình trung vị Lecturer: Le Hoai Long (Ph.D.) lehoailong@hcmut.edu.vn Measures of central tendency • The median may be a better indicator of the most typical value if a set of scores has an outlier An outlier is an extreme value that differs greatly from other values Các trung bình số tốt giá trị tiêu biểu tập hợp điểm có điểm dị biệt Một điểm dị biệt giá trị xa mà khác hẳn so với giá trị khác • However, when the sample size is large and does not include outliers, the mean score usually provides a better measure of central tendency Tuy nhiên, kích thước mẫu lớn khơng bao gồm giá trị dị biệt, điểm trung bình thường cung cấp biện pháp tốt xu hướng trung tâm Lecturer: Le Hoai Long (Ph.D.) lehoailong@hcmut.edu.vn Measures of central tendency • Suppose we examine a sample of 10 households to estimate the typical family income Nine of the households have incomes between $20,000 and $100,000; but the tenth household has an annual income of $1,000,000,000 Giả sử kiểm tra mẫu 10 hộ gia đình để ước tính thu nhập gia đình điển hình Chín số hộ gia đình có thu nhập từ $ 20,000 đến $ 100,000; hộ gia đình thứ mười có thu nhập hàng năm $ 1000000000 • What is the potential problem with the mean? vấn đề tiềm với giá trị trung bình gì? Lecturer: Le Hoai Long (Ph.D.) lehoailong@hcmut.edu.vn Measures of central tendency • If we add a constant to every value, the mean and median increase by the same constant Nếu thêm số cho giá trị, giá trị trung bình trung vị số giống • Suppose we multiply every value by a constant Then, the mean and the median will also be multiplied by that constant Giả sử nhân giá trị số Sau đó, trung bình trung vị nhân với số Lecturer: Le Hoai Long (Ph.D.) lehoailong@hcmut.edu.vn Measures of variability Đo lường biến The Range • The range is the difference between the largest and smallest values in a set of values Khoảng biến thiên khác biệt giá trị lớn nhỏ tập giá trị • For example, for the set of numbers: 1, 3, 4, 5, 5, 6, 7, 11 The range would be: ………… Ví dụ, tập số: 1, 3, 4, 5, 5, 6, 7, 11, Khoảng biến thiên là: Lecturer: Le Hoai Long (Ph.D.) lehoailong@hcmut.edu.vn Measures of variability The Variance a population, variance is the average squared deviation from the • In population mean, as defined by : Trong quần thể, phương sai độ lệch bình phương trung bình trung bình quần thể, xác định bởi:  x      i N μ is the mean, Xi is the ith element, and N is the number of elements μ trung bình, Xi yếu tố thứ i, N số nguyên tố • The variance of a sample, is defined by slightly different formula, and uses a slightly different notation: Phương sai mẫu, xác định công thức khác nhau, sử dụng ký hiệu khác nhau: s x  x    i n 1 Lecturer: Le Hoai Long (Ph.D.) lehoailong@hcmut.edu.vn Measures of variability The Standard Deviation Độ lệch chuẩn • The standard deviation is the square root of the variance Độ lệch chuẩn bậc hai phương sai ………………  x    2    • And ……………… i N 2 s s   x  x  Lecturer: Le Hoai Long (Ph.D.) lehoailong@hcmut.edu.vn i n 1 Effect of Changing Unit • If you add a constant to every value, the distance between values does not change Nếu bạn thêm số cho giá trị, khoảng cách giá trị khơng thay đổi • As a result, all of the above measures of variability remain the same Kết là, tất biện pháp biến cũ Lecturer: Le Hoai Long (Ph.D.) lehoailong@hcmut.edu.vn 10 Effect of Changing Unit • Suppose you multiply every value by a constant This has the effect of multiplying the range and standard deviation by that constant Giả sử bạn nhân giá trị số Điều có tác dụng phép nhân khoảng biến thiên độ lệch chuẩn số • Except for the variance So what is the effect on the variance? Ngoại trừ phương sai Vì vậy, ảnh hưởng phương sai gì? Lecturer: Le Hoai Long (Ph.D.) lehoailong@hcmut.edu.vn 11 Effect of Changing Unit Ảnh hưởng thay đổi đơn vị • Get back to previous slide • The effect on the variance is Lấy lại slide trước Ảnh hưởng phương sai Độ lệch Lecturer: Le Hoai Long (Ph.D.) lehoailong@hcmut.edu.vn 12 Percentiles Bách phân vị • Assume that the elements in a data set are rank ordered from the smallest to the largest The values that divide a rank-ordered set of elements into 100 equal parts are called percentiles Giả sử yếu tố tập hợp liệu đặt hàng thứ tự từ nhỏ đến lớn Các giá trị phân chia tập thứ tự đặt hàng yếu tố thành 100 phần gọi Bách phân vị • An element having a percentile rank of Pi would have a greater value than i percent of all the elements in the set Một yếu tố có thứ hạng bách phân vị Pi có giá trị lớn i phần trăm tất thành phần nhóm Lecturer: Le Hoai Long (Ph.D.) lehoailong@hcmut.edu.vn 13 Percentiles • Thus, how is the observation at the 50th percentile? Vì vậy, làm quan sát bách phân vị thứ 50? Lecturer: Le Hoai Long (Ph.D.) lehoailong@hcmut.edu.vn 14 Quartiles Tứ phân vị • Quartiles divide a rank-ordered data set into four equal parts • The values that divide each part are called the first, second, and third quartiles; and they are denoted by Q1, Q2, and Q3, respectively Tứ phân vị phân chia liệu thiết lập thứ hạng thành bốn phần Các giá trị chia phần gọi tứ phân vị đầu tiên, thứ hai thứ ba; họ biểu Q1, Q2, Q3 , tương ứng Lecturer: Le Hoai Long (Ph.D.) lehoailong@hcmut.edu.vn 15 Quartiles • What are the relationships between quartiles and percentiles? mối quan hệ tứ phân vị Bách phân vị gì? Lecturer: Le Hoai Long (Ph.D.) lehoailong@hcmut.edu.vn 16 The Interquartile Range (IQR) Các khoảng tứ phân vị (IQR) • The interquartile range (IQR) is equal to Q3 minus Q1 Các khoảng tứ phân vị (IQR) Q3 trừ Q1 IQR  Q3  Q1 • Example: consider the following numbers: 1, 3, 4, 5, 5, 6, 7, 11 What are the quartiles and IQR? Ví dụ: xem xét số sau: 1, 3, 4, 5, 5, 6, 7, 11 tứ phân vị IQR gì? Lecturer: Le Hoai Long (Ph.D.) lehoailong@hcmut.edu.vn 17

Ngày đăng: 27/07/2023, 12:52

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan