V X= E( X− EX)2 = E(X 2) − (EX)2 ớiXlà biến ngẫu nhiên rời rạc:
Biểu diễn dữ liệu
Biểu diễn dữ liệu
Từ tổng thể ta trích ra tập mẫu có n phần tử. Ta có n số liệu.
Dạng liệt kê
Các số liệu thu được ta ghi lại thành dãy số liệu:
x1, x2, . . . , xn
Dạng rút gọn
Số liệu thu được có sự lặp đi lặp lại một sô giá trị thì ta có dạng rút gọn sau: Dạng tần số: (n1+n2 +. . .+nk =n) Giá trị x1 x2 . . . xk Tần số n1 n2 . . . nk Dạng tần suất: (pk =nk/n) Giá trị x1 x2 . . . xk Tần suất p1 p2 . . . pk
Mẫu và thống kê mô tả Biểu diễn dữ liệu
Biểu diễn dữ liệu
Ví dụ dạng rút gọn
Ta có bảng số liệu như sau:
Giá trị 1 2 3 4 5 6
Tần số 10 15 30 20 14 11
Tần suất 0.10 0.15 0.30 0.20 0.14 0.11
Lê Xuân Lý (SAMI-HUST) Thống kê - Ước lượng tham số Hà Nội, tháng 9 năm 20188/37 8 / 37
Mẫu và thống kê mô tả Biểu diễn dữ liệu
Biểu diễn dữ liệu
Dạng khoảng
Dữ liệu thu được nhận giá trị trong (a, b). Ta chia (a, b) thành k miền con bởi các điểm chia: a0 =a < a1 < a2 < ... < ak−1 < ak =b.
Dạng tần số: (n1+n2 +. . .+nk =n)
Giá trị (a0−a1] (a1−a2] . . . (ak−1−ak]
Tần số n1 n2 . . . nk
Dạng tần suất: (pk =nk/n)
Giá trị (a0−a1] (a1 −a2] . . . (ak−1 −ak]
Tần suất p1 p2 . . . pk
Một số vấn đề chú ý:
• k = 5→ 15.
• Độ dài các khoảng thường chia bằng nhau.
Mẫu và thống kê mô tả Biểu diễn dữ liệu
Biểu diễn dữ liệu
Dạng khoảng
• Nếu độ dài các khoảng bằng nhau ta có thể chuyển về dạng rút gọn. Giá trị x1 x2 . . . xk
Tần suất p1 p2 . . . pk
Trong đó xi là điểm đại diện cho (ai−1, ai] thường được xác định là trung điểm của miền: xi = 1
2(ai−1+ai)
• Dạng rút gọn thường được thể hiện bằng đồ thị dạng đường hoặc dạng hình tròn.
• Dạng khoảng thường được thể hiện bằng đồ thị dạng hình cột.
Lê Xuân Lý (SAMI-HUST) Thống kê - Ước lượng tham số Hà Nội, tháng 9 năm 201810/37 10 / 37