6 Phân tán bất thiên là gì? Tại sao phân tán từ dữ liệu tiêu bản lại nhỏ
6.4 Phân tán bất thiên (Phương sai không chệch) có thể được sử dụng làm
có thể được sử dụng làm cơng cụ ước tính cho phương sai tổng thể (phân tán của dữ liệu cha)
Đến bây giờ có lẽ các bạn đều đã hiểu, thơng thường khi tính tốn độ phân tán của dữ liệu mẫu s2 sẽ nhỏ hơn độ phân tán của dữ liệu cha là σ2.
Độ phân tán của dữ liệu mẫus2 không thể sử dụng để ước lượng giá trị độ phân tán của dữ liệu cha σ2. Phân tán bất thiên được sử dụng làm cơng cụ, nó có thể nhỏ hơn hay lớn hơn một chút so với độ phân tán của dữ liệu mẫu s2. Tóm lại phân tán bất thiên là giá trị ước lượng của độ phân tán dữ liệu cha σ2.
Vì vậy, chúng ta khơng sử dụng scipy.statshoặcPandasđể tính độ phân tán một cách nhanh chóng, thay vào đó chúng ta sử dụng lý luận của thống kê học để tính độ phân tán bất thiên.
Trong lý luận của thống kê học, độ phân tán bất thiên dễ xử lý hơn độ phân tán thơng thường, vì vậy mà nhiều cơng cụ thống kê trả về giá trị độ phân tán bất thiên một cách mặc định khi tính tốn liên quan tới độ phân tán.
34BÀI 6. PHÂN TÁN BẤT THIÊN LÀ GÌ? TẠI SAO PHÂN TÁN TỪ DỮ LIỆU TIÊU BẢN LẠI NHỎ HƠN PHÂN TÁN TỪ DỮ LIỆU CHA?
Thành thật mà nói, tơi khơng nghĩ rằng có ai đó thực sự quan tâm đến việc sử dụng độ phân tán thông thường hay độ phân tán bất thiên trong thống kê mô tả như một cơng cụ ước tính. Tuy nhiên để chắc chắn, bạn nên xem công cụ hoặc thư viện nào đang tính tốn độ phân tán, nếu n lớn thì sự khác biệt là rất nhỏ, vì vậy tơi khơng nghĩ chúng ta cần phải lo lắng về điều đó, đặc biệt là với các mẫu dữ liệu lớn.