Tỉ lệ mẫu
Cho mẫu định tính kích thước n, trong đó số phần tử có tính chất A bằng m. Ta gọi số
Trung bình mẫu và phương sai mẫu
Cho mẫu định lượng thu gọn
X x1 x2 … xk
Tần số n1 n2 … nk
Tần suất f1 f2 … fk
Phương sai mẫu
Có thể chứng minh
Chú ý Có giáo trình ký hiệu phương sai mẫu là Ms và gọi nó là độ lệch bình phương trung bình.
Độ lệch mẫu
Đối với mẫu ngẫu nhiên tổng quát (X1, X2, …, Xn)
Trung bình mẫu
Phương sai mẫu điều chỉnh
Độ lệch mẫu
Thực hành tính đặc trưng mẫu
Đối với mẫu định lượng thu gọn ta lập bảng
xi ni xini x1 n1 x1n1 x2 n2 x2n2 … … … … xk nk xknk n
Các công thức sau đây cho phép giảm bớt sự cồng kềnh khi tính toán:
Với x0 và h 0 tùy ý, ta có các công thức
Ta chọn x0 trùng với với xj có nj lớn nhất.
Nếu các xj không cách đều, chọn h = 1. Nếu các xj cách đều, chọn h = x2 – x1.
xi ni x1 n1 x2 n2 … … … … … xk nk n
Cách dùng máy tính CASIO fx – 500MS trong thống kê
Đầu tiên, để vào chế độ tính toán thống kê, ta ấn
Muốn nhập số liệu từ mẫu (x1, x2, …, xn), ta ấn
x1 DT x2 DT … xn DT
Muốn nhập số liệu từ mẫu thu gọn
X x1 x3 … xk Tần suất n1 n2 … nk
ta ấn
x1 SHIFT n1 DT x2 SHIFT n2 DT… xk SHIFT nk DT
Muốn tính , ta ấn SHIFT S-VAR 1 = Muốn tính , ta ấn SHIFT S-VAR 2 = Muốn tính , ta ấn tiếp x2 = Muốn tính s, ta ấn SHIFT S-VAR 3 = Muốn tính s2, ta ấn tiếp x2 =
Chú ý
Muốn chỉnh dữ liệu cũ, ấn hoặc . Tiếp theo:
Nếu muốn thay thế dữ liệu đó, ta nhập giá trị mới và ấn , giá trị mới sẽ thay thế giá trị cũ.
Nếu muốn xóa dữ liệu đó,ấn SHIFT CL (các dữ liệu còn lại sẽ tự động dồn số thứ tự lại).
Chương 5
ƯỚC LƯỢNG THAM SỐ
_________________________________________________
§1 ĐẶT VẤN ĐỀ
Biết chiều dài một sản phẩm do một xưởng sản xuất ra là
là một tham số cần ước lượng. Muốn ước lượng nó, ta phải dựa vào mẫu gồm một số sản phẩm do xưởng này sản xuất. Ta có thể ước đoán bởi một giá trị hoặc ước đoán thuộc khoảng (a; b) nào đấy.
Trong thống kê, gọi là ước lượng điểm của , còn (a; b) là ước lượng khoảng của .
§2 ƯỚC LƯỢNG ĐIỂM
Giả sử bnn X đã biết được dạng của quy luật ppxs nhưng chưa biết tham số nào đó. Ta ước đoán bởi một con số * như sau: Ta xây dựng hàm của mẫu ngẫu nhiên tổng quát là
.
Với mỗi mẫu ngẫu nhiên cụ thể (x1, x2, …, xn), ta lấy
làm ước lượng cho . Gọi
hay là ước lượng điểm của .
Để đánh giá chất lượng * xem “tốt” hay không ta không thể mong muốn nó thật gần bởi vì ta chưa biết . Vì vậy, dưới đây người ta đưa ra các tiêu chuẩn để dựa vào đó kết luận về chất lượng của *.
Ước lượng không chệch (ưlkc)
Gọi là ước lượng không chệch
của , nếu
= , Ngược lại, nếu
Ước lượng hiệu quả (ưlhq)
Gọi là ước lượng hiệu quả của ,
nếu nó là ưlkc của và nhỏ
Ước lượng vững (ưlv)
Gọi là ước lượng vững của , nếu
Ý nghĩa của công thức này
Hầu như chắc chắn sai khác
Các kết quả về ước lượng điểm
là ưlkc, ưlhq, ưlv của E(X).
, là ưlkc, ưlv của D(X). là ưlkc, ưlhq, ưlv của P(A).
§3 ƯỚC LƯỢNG KHOẢNG
Phương pháp ước lượng điểm có nhược điểm là khi kích thước mẫu nhỏ thì ước lượng điểm tìm được có thể sai lệch rất nhiều so với tham số cần ước lượng. Ngoài ra không thể đánh giá được khả năng mắc sai lầm khi ước lượng. Để khắc phục các nhược điểm này, ta thường dùng phương pháp ước lượng bằng khoảng tin cậy.
Giả sử bnn X đã biết được dạng của quy luật ppxs nhưng chưa biết tham số nào đó. Ta đi tìm một khoảng để nó chứa với xác suất bằng như sau: Ta
xây dựng như là các hàm của mẫu ngẫu nhiên tổng
quát
và .
sao cho
Khi ấy ta gọi
.
là ước lượng khoảng (hay khoảng tin cậy của ), còn
là độ tin cậy của ước lượng này. Số đo khả năng để
Chú ý
Với một mẫu ngẫu nhiên cụ thể (x1, x2, …, xn),
ta cũng gọi