4. Lập bảng tham chiếu chéo (Crosstab)
3.1. Thống kê mơ tả (tiếp theo)
1. Bảng phân bố tần suất (Frequencies)
Bảng phân phối tần suất được thể hiện với tất cả các biến định tính (rời rạc) với các thang đo định danh, thứ bậc và các biến định lượng (liên tục) với thang đo khoảng cách hoặc tỉ lệ.
Bảng tần suất cho chúng ta biết số lần xuất hiện các giá trị của một (số) biến; tỷ lệ phần trăm tích lũy (hay cộng dồn), tỷ lệ phần trăm trên tổng số.
Thao tác: Analyze Descriptive Statistics Frequencies…
• Màn hình xuất hiện hộp thoại như trong hình ở Slide tiếp theo.
• Lần lượt chọn các biến cần lập bảng tần suất đưa vào ơ Variable(s). Chọn các đại lượng thống kê qua nút lệnh Statistics, nhắp nút OK để thực hiện.
Ví dụ, với dữ liệu là file Data_Ben Tre, chúng ta chọn biến gioitinh để lập bảng.
• Display frequency tables: Hiển thị bảng thống kê tần suất (mặc định đối với biến định tính, khơng cần cĩ đối với biến định lượng).
• Format: Quy cách hiển thị kết quả (tăng hay giảm dần theo giá trị của biến; tăng hoặc giảm dần theo tần suất).
• Charts: Biểu đồ (khơng vẽ, hoặc vẽ biểu đồ hình cột, hình bánh hoặc biểu đồ tần suất (Histogram).
• Statistics: Các đại lượng thống kê phản ảnh xu hướng tập trung hay phân tán, tính phân bố, tính phân tán của dữ liệu trong mẫu được khảo sát.
• Paste: Chuyển thao tác thành lệnh đưa vào file Syntax.
• Reset: Xĩa đi, làm lại.
• OK: Thực hiện thao tác.
Nhắp chuột vào nút lệnh Statistics, bảng các đại lượng thống kê xuất hiện như hình dưới đây:
Ý nghĩa của các đại lượng thống kê:
• Percentile values: Các giá trị phân vị, bao gồm tứ phân vị (Quartile) Số nhĩm được phân chia (Cut points), Các phân vị (Percentiles).
• Central tendency: Khuynh hướng tập trung (Mean, Median, Mode, Sum…)
• Distribution: Sự phân phối, bao gồm độ lệch (Skewness) và độ nhọn (Kurtosis) trong đồ thị Histogram, đĩ là các đại lượng thống kê mơ tả hình dạng và độ cân xứng của một phân bố.
• Dispersion: Tính phân tán, được xác định bởi các giá trị: Nhỏ nhất (Min), Lớn nhất (Max), Khoảng xác định (Range), Phương sai
(Variance), Độ lệch chuẩn (Standard Deviation) và Sai số chuẩn
(Standard Error).
• Value are group midpoints: Nếu các trị số trong dữ liệu là điểm giữa của các nhĩm, hãy chọn tuỳ chọn này để ứớc lượng trung vị và các phân vị cho dữ liệu thơ, khơng nhĩm gộp.
Bảng thống kê tần suất trên biến gioitinh cho thấy trong tổng số