Bài giảng Xác suất thống kê: Thống kê mô tả gồm có những nội dung chính: Giới thiệu về thống kê, mô tả dữ liệu một biến bằng phương pháp đồ thị, mô tả dữ liệu một biến bằng phương pháp số, mô tả dữ liệu nhiều biến.
Outline THỐNG KÊ MÔ TẢ THỐNG KÊ MÔ TẢ Nguyễn Văn Thìn Nguyễn Văn Thìn THỐNG KÊ MƠ TẢ Giới thiệu thống kê Mô tả liệu biến phương pháp đồ thị Nguyễn Văn Thìn Dữ liệu biến định tính Giới thiệu thống kê Mơ tả liệu biến phương pháp đồ thị Giới thiệu thống kê Mô tả liệu biến phương pháp đồ thị Dữ liệu biến định tính Dữ liệu biến định lượng Dữ liệu biến định tính Dữ liệu biến định lượng BỘ MƠN THỐNG KÊ TỐN HỌC KHOA TỐN - TIN HỌC Mô tả liệu biến phương pháp số ĐẠI HỌC KHOA HỌC TỰ NHIÊN TP.HCM Các độ đo hướng tâm Dữ liệu biến định lượng Mô tả liệu biến phương pháp số Mô tả liệu biến phương pháp số Các độ đo hướng tâm Các độ đo biến thiên liệu Các độ đo hướng tâm Tháng năm 2016 Các độ đo biến thiên liệu Mô tả liệu nhiều biến Các độ đo biến thiên liệu Mô tả liệu nhiều biến Mô tả liệu nhiều biến Outline THỐNG KÊ MƠ TẢ Nguyễn Văn Thìn Giới thiệu thống kê Mô tả liệu biến phương pháp đồ thị THỐNG KÊ MÔ TẢ Giới thiệu thống kê Mô tả liệu biến phương pháp đồ thị Dữ liệu biến định tính Dữ liệu biến định lượng Dữ liệu biến định tính Dữ liệu biến định lượng Mô tả liệu biến phương pháp số Mô tả liệu nhiều biến Giới thiệu thống kê Mô tả liệu biến phương pháp đồ thị Dữ liệu biến định tính Mô tả liệu biến phương pháp số Các độ đo hướng tâm Các độ đo biến thiên liệu Các độ đo hướng tâm Các độ đo biến thiên liệu Nguyễn Văn Thìn Dữ liệu biến định lượng Mơ tả liệu biến phương pháp số Các độ đo hướng tâm Mô tả liệu nhiều biến Các độ đo biến thiên liệu Mô tả liệu nhiều biến Giới thiệu thống kê Biến liệu THỐNG KÊ MÔ TẢ Nguyễn Văn Thìn Giới thiệu thống kê Mơ tả liệu biến phương pháp đồ thị Dữ liệu biến định tính Dữ liệu biến định lượng Mơ tả liệu biến phương pháp số Các độ đo hướng tâm Biến (variable): đặc trưng mà thay đổi từ người (vật, tượng) sang người (vật, tượng) khác Biến gồm hai loại: biến định tính (qualitative variable) biến định lượng (quantitative variable) Biến định tính: biểu diễn tính chất đặc trưng mà thể hiện, có tác dụng phân loại; ví dụ: nhóm máu (A, B, AB, O), giới tính (nam, nữ) màu mắt (đen, nâu, xanh), Biến định lượng: biểu diễn độ lớn đặc trưng mà thể hiện; ví dụ: chiều cao, cân nặng, thời gian, Các độ đo biến thiên liệu Mô tả liệu nhiều biến Biến liệu THỐNG KÊ MƠ TẢ Nguyễn Văn Thìn Giới thiệu thống kê Mô tả liệu biến phương pháp đồ thị Dữ liệu biến định tính Dữ liệu biến định lượng Mô tả liệu biến phương pháp số Các độ đo hướng tâm Các độ đo biến thiên liệu Biến định lượng bao gồm biến rời rạc (discrete variable) biến liên tục (continuous variable) Mô tả liệu nhiều biến Tổng thể mẫu THỐNG KÊ MÔ TẢ Nguyễn Văn Thìn Dữ liệu biến định tính Tổng thể (population): Tập hợp tất phần tử mang đặc trưng quan tâm hay cần nghiên cứu Mẫu (sample): tập chọn từ tổng thể Ta thường kí hiệu N để số phần tử tổng thể n để cỡ mẫu Mô tả liệu nhiều biến Mô tả liệu biến phương pháp đồ thị Dữ liệu biến định tính Dữ liệu biến định lượng Tham số (parameter): đặc trưng cụ thể tổng thể Các độ đo hướng tâm Các độ đo biến thiên liệu Nguyễn Văn Thìn Giới thiệu thống kê Dữ liệu biến định lượng Mô tả liệu biến phương pháp số Tổng thể mẫu THỐNG KÊ MÔ TẢ Giới thiệu thống kê Mô tả liệu biến phương pháp đồ thị Thông thường biến rời rạc liên quan đến toán đếm số phần tử tổng thể; ví dụ: số sản phẩm hỏng lơ hàng, số gia đình, số điện thoại đến tổng đài giờ, biến liên tục liên quan đến đo đạc; ví dụ: cân nặng sản phẩm, chiều cao cây, cường độ dòng điện, nhiệt độ, Dữ liệu (data): giá trị biến Tập hợp tất quan trắc cho biến cụ thể gọi tập liệu (data set) Mô tả liệu biến phương pháp số Các độ đo hướng tâm Thống kê (statistic): đặc trưng cụ thể mẫu Các độ đo biến thiên liệu Mô tả liệu nhiều biến Chọn mẫu ngẫu nhiên Ví dụ tổng thể THỐNG KÊ MƠ TẢ Nguyễn Văn Thìn Giới thiệu thống kê Mô tả liệu biến phương pháp đồ thị Dữ liệu biến định tính Dữ liệu biến định lượng Mơ tả liệu biến phương pháp số Các độ đo hướng tâm Các độ đo biến thiên liệu Mô tả liệu nhiều biến Số cử tri đăng kí bầu cử Thu nhập hộ gia đình thành phố Điểm trung bình tất sinh viên trường đại học Trọng lượng sản phẩm nhà máy Thông thường, ta chọn hết tất phần tử tổng thể để nghiên cứu vì: Số phần tử tổng thể lớn Thời gian kinh phí khơng cho phép Có thể làm hư hại phần tử tổng thể Do đó, ta thực nghiên cứu mẫu chọn từ tổng thể THỐNG KÊ MÔ TẢ Nguyễn Văn Thìn Giới thiệu thống kê Mơ tả liệu biến phương pháp đồ thị Dữ liệu biến định tính Dữ liệu biến định lượng Mô tả liệu biến phương pháp số Các độ đo hướng tâm Các độ đo biến thiên liệu Mô tả liệu nhiều biến Chọn mẫu ngẫu nhiên THỐNG KÊ MÔ TẢ Nguyễn Văn Thìn Giới thiệu thống kê Dữ liệu biến định lượng Mô tả liệu biến phương pháp số Các độ đo hướng tâm Mẫu ngẫu nhiên hồn hảo khó đạt thực tế Nếu tổng thể có kích thước N nhỏ, ta viết N số lên phiếu nhỏ, trộn phiếu chọn mẫu gồm n phiếu Các số mà ta chọn tương ứng với n số đo xuất mẫu Định nghĩa Nếu mẫu gồm n phần tử chọn từ tổng thể có N phần tử cách sử dụng cách lấy mẫu cho mẫu có khả chọn nhau, mẫu gọi ngẫu nhiên mẫu kết mẫu ngẫu nhiên đơn giản Ví dụ chọn mẫu ngẫu nhiên đơn giản Nguyễn Văn Thìn Giới thiệu thống kê Mô tả liệu biến phương pháp đồ thị Bởi phương pháp khơng thực tế cho lắm, phương pháp đáng tin cậy đơn giản sử dụng số ngẫu nhiên– số sinh cho giá trị đến xuất ngẫu nhiên với tần số Các số sinh máy tính có sẵn máy tính bỏ túi Các độ đo biến thiên liệu Mô tả liệu nhiều biến Giả sử ta muốn chọn mẫu kích thước n = từ tổng thể chứa N = đối tượng Nếu đối tượng xác định kí hiệu x1 , x2 , x3 x4 , có cặp khác chọn (x1 , x2 ), (x1 , x3 ), (x1 , x4 ), (x2 , x3 ), (x2 , x4 ), (x3 , x4 ) Nếu mẫu quan sát chọn sau cho mẫu có khả chọn, 1/6, mẫu kết gọi mẫu ngẫu nhiên đơn giản, ngắn gọn mẫu ngẫu nhiên THỐNG KÊ MƠ TẢ Mơ tả liệu biến phương pháp đồ thị Dữ liệu biến định tính Ví dụ Dữ liệu biến định tính Dữ liệu biến định lượng Mơ tả liệu biến phương pháp số Các độ đo hướng tâm Các độ đo biến thiên liệu Một cách khác, ta dùng bảng số ngẫu nhiên để chọn mẫu ngẫu nhiên Mô tả liệu nhiều biến Ví dụ Chọn mẫu gồm n = 10 phần tử từ tập hợp có 200 phần tử Sử dụng chương trình thống kê R: dùng lệnh sample - Đánh số từ đến 200: P