Điểm số của sinh viên ở Trƣờng Cao đẳng A

Một phần của tài liệu Giáo trình lý thuyết thống kê Kinh doanh thương mại (Trang 57 - 63)

Điểm số 4 5 6 7 8 9 Tổng

Số sinh viên 10 15 30 52 15 2 124

(+) Đối với chuỗi số liệu đƣợc phân tổ với khoảng cách đều nhau. Trong trƣờng hợp này, Mo là giá trị thuộc tổ có tần số lớn nhất và đƣợc xác định theo công thức 3.10. Ở công thức 3.10, XM là giá trị ở cận dƣới của tổ chứa Mo; K là khoảng cách của mỗi tổ; fMo là tần số của tổ chứa Mo; f(Mo-1) là tần số của tổ đứng trƣớc tổ chứa Mo; f(Mo+1) là tần số của tổ đứng sau tổ chứa Mo.

Mo = XM + K*[ (fMo - f(Mo-1))

48

Ví dụ: Xác định Mo theo chuỗi doanh thu của các cửa hàng trong một tháng ở Bảng

3.5. Từ số liệu ở Bảng 3.5 cho thấy, XM = 900; K = 200, fMo = 50 và xuất hiện ở tổ 4; f(Mo-1) = 30 ở tổ 3; f(Mo+1) = 25 ở tổ 5. Thay các số liệu này vào công thức 3.10, chúng ta nhận đƣợc Mo = 940 triệu đồng/tháng.

Mo = 900 + 200*[ (50 - 30)

((50 - 30) + (50 + 30)) ] = 940 triệu đồng/tháng.

Ƣu điểm của Mo là nó khơng chịu ảnh hƣởng của các giá trị cực trị (giá trị lớn nhất và giá trị nhỏ nhất). Nhƣợc điểm của Mo là nó kém nhạy bén với sự biến thiên của chuỗi số liệu. Trong thực tế, giá trị Mo đƣợc sử dụng ít hơn so với Me và số trung bình. Thơng thƣờng, Mo đƣợc ứng dụng để phân tích nhu cầu của thị trƣờng đối với một loại sản phẩm nào đó (giày, dép, mũ nón, quần áo…). Giá trị Mo chỉ rõ tính đa số, tính khuynh hƣớng và tính phong trào. Giá trị Mo là đại lƣợng thống kê mô tả duy nhất có thể sử dụng cho các dữ liệu định tính.

3.2.2. Những số đo mức độ phân tán của chuỗi số liệu

Các giá trị trung bình, Me và Mo chỉ cho biết những giá trị trung tâm của chuỗi số liệu. Chúng phản ánh khơng đầy đủ các tính chất của chuỗi số liệu. Vì thế, để đo lƣờng mức độ phân tán của chuỗi số liệu, ngƣời ta sử dụng một số thống kê nhƣ khoảng biến thiên hay phạm vi biến động (Range = R), độ lệch (Bias), phƣơng sai (Variance = S2), sai tiêu chuẩn hay độ lệch chuẩn (Standard Deviation = S), hệ số biến động (Coefficient of Variation = CV%), độ lệch (Skewness = Sk) và độ nhọn (Kurtosis = Ku).

(a) Khoảng biến thiên (R). Đó là thống kê phản ánh sự chênh lệch giữa giá

trị lớn nhất (Xmax) và giá tri nhỏ nhất (Xmin) của chuỗi số liệu. Giá trị R đƣợc xác định theo công thức 3.11. Khoảng biến thiên càng nhỏ thì tổng thể càng đồng đều và số trung bình có tính đại diện càng cao và ngƣợc lại.

49

(b) Độ lệch (Bias). Đó là chênh lệch giữa các giá trị quan sát (Xi) so với giá trị trung bình mẫu (XBq) của chuỗi số liệu. Thống kê Bias đƣợc xác định theo công thức 3.12.

Bias = Xi – XBq (3.12)

Trong thống kê, ngƣời ta sử dụng Bias để đo sự phân tán của các quan sát so với trung bình mẫu. Các giá trị Bias có thể nhận giá trị âm hoặc giá trị dƣơng. Nếu tổng Bias dƣơng, thì những giá trị lớn hơn giá trị trung bình là nhiều hơn so với những giá trị nhỏ hơn giá trị trung bình. Ngƣợc lại, nếu tổng Bias âm, thì những giá trị lớn hơn giá trị trung bình là nhỏ hơn so với những giá trị nhỏ hơn giá trị trung bình. Bởi vì các giá trị Bias có thể nhận giá trị âm hoặc giá trị dƣơng, nên khi dung lƣợng mẫu lớn (n > 30), thì tổng Bias của chuỗi số liệu bằng Zero. Điều đó gây ra khó khăn trong việc phân tích và so sánh giữa các tập số liệu. Để loại bỏ hiện tƣợng Bias = 0, ngƣời ta xác định sai lệch tuyệt đối trung bình (MAE = Mean Absolute Error) (Công thức 3.13) và sai lệch tuyệt đối trung bình theo phần trăm (MAPE = Mean Absolute Percent Error) (Công thức 3.14).

MAE = | (Xi - XBq)

n | (3.13)

MAPE = | (Xi - XBq)

XBq |*100 (3.14)

(c) Phƣơng sai (S2). Đó là số bình qn cộng của bình phƣơng các độ lệch

(Bias) giữa các giá trị quan sát (Xi) so với số trung bình của chuỗi số liệu. Khi chuỗi số liệu không đƣợc ghép thành nhóm và n > 30, thì phƣơng sai mẫu đƣợc xác định theo công thức 3.15.

S2 = (Xi - XBq) 2

n (3.15)

Khi chuỗi số liệu khơng đƣợc ghép thành nhóm và n < 30, thì phƣơng sai mẫu đƣợc xác định theo cơng thức 3.16.

S2 = (Xi - XBq) 2

50

Khi chuỗi số liệu đƣợc ghép thành nhóm và n > 30, thì phƣơng sai mẫu đƣợc xác định theo cơng thức 3.17; trong đó X*

i và fi tƣơng ứng là giá trị giữa và tần số của mỗi nhóm, cịn tổng fi = n.

S2 = fi(Xi *

- XBq)2

n (3.17)

Khi chuỗi số liệu khơng đƣợc ghép thành nhóm và n < 30, thì phƣơng sai mẫu đƣợc xác định theo công thức 3.18.

S2 = (Xi - XBq) 2

n - 1 (3.18)

(d) Sai tiêu chuẩn (S). Đó là căn bậc 2 của phƣơng sai. Khi chuỗi số liệu khơng đƣợc ghép thành nhóm và n > 30, thì sai tiêu chuẩn mẫu đƣợc xác định theo cơng thức 3.19.

S = √ - (3.19)

Khi chuỗi số liệu khơng đƣợc ghép thành nhóm và n < 30, thì sai tiêu chuẩn mẫu đƣợc xác định theo công thức 3.20.

S = √ -

- (3.20)

Khi chuỗi số liệu đƣợc ghép thành nhóm và n > 30, thì sai tiêu chuẩn mẫu đƣợc xác định theo công thức 3.21.

S = √ - (3.21)

Khi chuỗi số liệu đƣợc ghép thành nhóm và n < 30, thì sai tiêu chuẩn mẫu đƣợc xác định theo công thức 3.22.

S = √ -

- (3.22)

(e) Chuẩn hóa số liệu. Chuẩn hóa số liệu là loại bỏ đơn vị đo của chuỗi số

51

Score là tỷ lệ giữa các sai lệch của các giá trị quan sát so với giá trị trung bình và sai tiêu chuẩn mẫu. Giá trị Z – Score đƣợc xác định theo công thức 3.23.

Z - Score = [(Xi - XBq)

S ] (3.23)

Giá trị Z – Score đƣợc sử dụng để xác định những số ngoại lai (số cực trị = số lớn nhất và số nhỏ nhật). Những số ngoại lai là những giá trị của chuỗi quan sát (Xi) lớn hơn hoặc nhỏ hơn 3*Z - Score.

(e) Hệ số biến động (CV%). Hệ số biến động biểu thị biến động theo phần trăm giữa các giá trị quan sát so với giá trị trung bình mẫu. Hệ số CV% của mẫu đƣợc xác định theo công thức 3.24.

CV% = S

XBq *100 (3.24)

(f) Độ lệch (Sk). Thống kê độ lệch (Sk) đo tính đối xứng hoặc tính bất đối

xứng của chuỗi số liệu. Phân bố của tập dữ liệu là đối xứng nếu chuỗi số liệu ở bên trái và bên phải của giá trị trung tâm (trung bình, Me, Mo) là nhƣ nhau. Vì thế, giá trị Sk đƣợc sử dụng để biểu thị độ lệch (độ xiên) của chuỗi số liệu so với giá trị trung tâm. Khi chuỗi số liệu khơng đƣợc ghép thành nhóm, thì hệ số Sk đƣợc xác định theo công thức 3.25. Khi chuỗi số liệu đƣợc ghép thành nhóm, thì hệ số Sk đƣợc xác định theo công thức 3.26. Sk = (Xi - XBq) 3 n*S3 (3.25) Sk = fi(Xi - XBq) 3 n*S3 (3.26)

Hệ số Sk có thể nhận giá trị bằng zero, giá trị âm hoặc giá trị dƣơng. Khi chuỗi số liệu phân bố chuẩn, thì hệ số Sk = 0. Khi hệ số Sk > 0, thì chuỗi số liệu phân bố lệch trái. Nguyên nhân là vì tổng tam thừa của những chênh lệch dƣơng lớn hơn so với tổng tam thừa của những chênh lệch âm so với giá trị trung bình mẫu. Trái lại, khi hệ số Sk < 0, thì chuỗi số liệu phân bố lệch phải. Nguyên nhân là vì tổng tam thừa của những chênh lệch dƣơng nhỏ hơn so với tổng tam thừa của những chênh lệch âm so với giá trị trung bình mẫu.

52

(g) Độ nhọn (Ku). Thống kê độ nhọn (Ku) biểu thị mức độ tập trung của các

giá trị quan sát xung quanh giá trị trung tâm (trung bình, Me, Mo). Khi chuỗi số liệu khơng đƣợc ghép thành nhóm, thì hệ số Ku đƣợc xác định theo công thức 3.27. Khi chuỗi số liệu đƣợc ghép thành nhóm, thì hệ số Ku đƣợc xác định theo công thức 3.28. Ku = (Xi - XBq) 4 n*S4 - 3 (3.27) Ku = fi(Xi - XBq) 4 n*S4 - 3 (3.28)

Hệ số Ku có thể nhận giá trị bằng Zero, giá trị âm hoặc giá trị dƣơng. Khi chuỗi số liệu phân bố chuẩn, thì hệ số Ku = 3. Khi hệ số Ku > 0, thì đỉnh đƣờng cong của chuỗi số liệu có dạng nhọn. Điều đó có nghĩa là chuỗi số liệu có nhiều giá trị phân bố xung quanh giá trị trung bình. Trái lại, khi hệ số Ku < 0, thì đỉnh đƣờng cong của chuỗi số liệu có dạng bẹt. Điều đó có nghĩa là chuỗi số liệu có ít giá trị phân bố xung quanh giá trị trung bình.

3.3. Phƣơng pháp trình bày số liệu bằng bảng và biểu đồ 3.3.1. Phƣơng pháp trình bày số liệu bằng bảng thống kê

Tổng hợp và báo cáo số liệu điều tra và kết quả xử lý số liệu là một bƣớc quan trọng của quá trình nghiên cứu. Số liệu điều tra và kết quả xử lý số liệu có thể đƣợc báo cáo bằng các bảng. Tùy theo vấn đề nghiên cứu, cấu trúc của các bảng là khác nhau. Đối với những số liệu định lƣợng, nếu số liệu đƣợc ghép thành nhóm, thì cấu trúc của bảng kết quả có dạng nhƣ Bảng 3.5. Đối với những số liệu ở dạng nhị phân (Có = 1; Khơng có = 0), bảng báo cáo có thể đƣợc cấu tạo thành 4 cột và 5 hàng. Ví dụ: Thống kê số ngƣời trả lời và không trả lời câu hỏi A (Bảng 3.7). Cột 1 là thứ tự câu trả lời. Cột 2 là câu trả lời. Cột 3 là số ngƣời trả lời. Nếu biến nghiên cứu đƣợc phân chia thành k mức, thì số hàng là k + 3.

53

Một phần của tài liệu Giáo trình lý thuyết thống kê Kinh doanh thương mại (Trang 57 - 63)

Tải bản đầy đủ (PDF)

(133 trang)