CASES, VARIABLES AND LEVELS OF MEASUREMENT Biến trường hợp: - Biến: đặc điểm vật người đó, nhiều trường hợp ( khác giá trị) - Các trường hợp : người vật Các trường hợp hay gọi thang đo bao gồm: - Mức danh nghĩa: Sự khác danh mục cụ thể biến Vd: nghề nghiệp ( công viên chức, tụ ) - Mức thứ tự Sự khác giữ danh mục cụ thể biến Với thứ tự biến Vd: khoa ( 1;2;3 ) - Mức độ khoảng Sự khác danh mục cụ thể biến Với thứ tự biến Khoảng thời gian tương tự biến Vd: tuổi ( 32;33;34 ) - Mức tỉ lệ Vd: chiều cao, cân nặng DATA MATRIX AND FREQUENCY TABLE Ví dụ ma trận liệu thu từ phiếu khảo sát 596 sản phụ: Tổng hợp từ liệu: - Ma trạn liệu khổng lồ - Tổng hợp liệu: sử dụng bảng đồ th Tần số bảng thu từ ma trận liệu: Yếu tố cốt lõi cho tất phân tích thống kê tổng quan liêu: Tỏng hợp liệu: - Tần số liệu - Cho biến định lượng mã hóa lại cần GRAPH AND SHAPE OF DISTRIBUTION Biểu đồ tròn Các danh mục cụ thể biến trình bày ý nghĩa lát cát hình tròn Các mặt lát cắt đại diện cho tỉ lệ phần trăm danh mục cụ thể Biểu đồ cột Danh mục cụ thể biến trình bày ý nghĩa mặt cắt cột Chiều cao cột đại diện cho tỉ lệ phần trăm danh mục cụ thể MODE, MEDIAN, MEAN TÓM TẮT SỰ PHÂN BỐ Graph(Đồ thị) Số liệu thống kê đo vị trí trung tâm ( xu hướng trung tâm) o Mode : giá trị xuất thường xuyên, nhiều Ex: tuoi_thai = {38, 37, 39, 40, 41, 39, 39, 41, 42} o Median: trung vị ( trung bình vị trí) xếp từ số nhỏ đến lớn >sort (sample_ tuoithai) [1] 37 38 39 39 39 40 41 41 42 o Mean: giá trị trung bình Khi bạn nên báo cáo biện pháp xu hướng trung tâm? Biến định tính sử dụng Mode Biến định lượng sử dụng hàm Median Mean Khi sử dụng hàm Mean? Khi sử dụng hàm Median? VD: Tháng lương trung bình cặp vợ chồng? ( triệu đồng) Ghi chú: Với outliers( giá trị ngoại lai) ưu tiên sử dụng hàm median Kết luận Để mô tả trung tâm phân bố, sử dụng: Mode cho biến định tính Mean, Median cho biến định lượng Với outlier sử dụng Median, khơng có outlier sử dụng Mean RANGE, INTERQUARTILE RANGE, VÀ BOXPLOT PHÉP ĐO CỦA ĐỘ PHÂN TÁN Để mô tả độ phân tán, cần: Nhiều phép đo xu hướng trung tâm Đó phép đo độ phân tán (= biến đổi) Range( Biên độ) : giá trị cao đến giá trị thấp nhất, phụ thuộc vào giá trị cực trị Interquartile range (Biên độ tương tác) Boxplot (Graph) : đồ thị boxplot Interquartile range (Biên độ tương tác) :bỏ giá trị cực trị, chia độ phân tán thành phần: Xác định Q1, Q2, Q3 Qua ta thấy Q2 trung vị group1, Q2=39,2 Q1 trung vị nhóm bên trái Q2, Q1=38,5 Q3 trung vị nhóm bên phải Q2, Q3=42,2 Giá trị nhỏ (min) 32,7 Giá trị lớn (max) 43,8 Quy tắc xác định giá trị ngoại lai Kết luận: Để mô tả trung tâm phân bố, cần: Các phép đo xu hướng trung tâm, mô tả phần phân bố Các phép đo biến/ độ phân tán : Range, Interquartile range, Boxplot Bỏ ảnh hưởng giá trị ngoại lai ... giá trị trung bình Khi bạn nên báo cáo biện pháp xu hướng trung tâm? Biến định tính sử dụng Mode Biến định lượng sử dụng hàm Median Mean Khi sử dụng hàm Mean? Khi sử dụng hàm Median? VD: Tháng lương... lai) ưu tiên sử dụng hàm median Kết luận Để mô tả trung tâm phân bố, sử dụng: Mode cho biến định tính Mean, Median cho biến định lượng Với outlier sử dụng Median, outlier sử dụng Mean RANGE,... thu từ phiếu khảo sát 596 sản phụ: Tổng hợp từ liệu: - Ma trạn liệu khổng lồ - Tổng hợp liệu: sử dụng bảng đồ th Tần số bảng thu từ ma trận liệu: Yếu tố cốt lõi cho tất phân tích thống kê tổng