CHƯƠNG 3 THỐNG KÊ SUY LUẬN
3.2. Ước lượng tham số
Bài tốn ước lượng tham số có thể được hiểu như sau: Giả sử đã biết quy luật phân phối xác xuất của biến ngẫu nhiên X trong tổng thể nhưng chưa biết tham số θ nào đó của nó. Chúng ta cần phải ước lượng tham số θ (hay xác định một cách gần đúng giá trị θ). Có hai phương pháp ước lượng:
93
3.2.1. Ước lượng điểm
Phương pháp ước lượng điểm là phương pháp ước lượng dùng một giá trị của mẫu để thay thế cho giá trị của tham số θ chưa biết của tổng thể. Thông thường, giá trị được chọn này là giá trị của một thống kê nào đó của mẫu ngẫu nhiên sao cho thống kê đó xấp xỉ một cách tốt nhất của θ.
Trong giới hạn của tập bài giảng này, chúng ta thừa nhận khơng chứng
mình một số kết quả sau:
- Trung bình mẫu là ước lượng không chệch, hiệu quả nhất và vững của kỳ vọng μ của biến ngẫu nhiên gốc của tổng thể. Nếu chưa biết μ thì có thể sử dụng để ước lượng nó.
- Tần suất mẫu ƒ là ước lượng không chệch, hiệu quả và vững của tần suất p của tổng thể. Nếu chưa biết p thì có thể sử dụng ƒ để ước lượng nó.
- Phương sai mẫu S2 là ước lượng không chệch của phương sai tổng thể . Nếu chưa biết thì có thể sử dụng S2 để ước lượng nó.
3.2.2. Ước lượng bằng khoảng tin cậy
Phương pháp ước lượng điểm có nhược điểm là khi kích thước mẫu bé thì ước lượng điểm có thể sai lệch rất nhiều so với giá trị của tham số cần ước lượng. Mặt khác phương pháp trên cũng không thể đánh giá được khả năng mắc sai lầm khi ước lượng là bao nhiêu. Do đó, khi kích thước mẫu bé, người ta thường dùng phương pháp ước lượng bằng khoảng tin cậy.
Phương pháp ước lượng bằng khoảng tin cậy là phương pháp chỉ ra một khoảng chứa tham số θ với xác suất (1- α) cho trước. Một tham số mẫu như trung bình mẫu thay đổi từ mẫu này sang mẫu khác tùy theo giá trị của các quan sát được chọn vào mẫu. Do đó, nếu dùng một giá trị trung bình mẫu của một mẫu cụ thể để ước lượng điểm về trung bình tổng thể sẽ kém tin cậy hơn so với khi chúng ta vận dụng hiểu biết về quy luật phân phối của trung bình mẫu vào quá trình ước lượng trung bình tổng thể qua phương pháp ước lượng khoảng. - Khoảng tin cậy là khoảng mà tham số của dấu hiệu nghiên cứu của tổng thể rơi vào khoảng này với xác suất bằng độ tin cậy.
94
Trong tập bài giảng này sẽ áp dụng phương pháp ước lượng khoảng tin cậy để ước lượng giá trị trung bình của tổng thể khi tổng thể có phân phối chuẩn (theo biến nghiên cứu) và ước lượng khoảng tin cậy cho tỷ lệ của tổng thể khi tổng thể có phân phối A(p) (theo biến nghiên cứu).
3.2.2.1. Ước lượng khoảng tin cậy cho giá trị trung bình của tổng thể a. Trường hợp phương sai 2 đã biết
Với độ tin cậy bằng 1, ta có:
- Khoảng tin cậy đối xứng của giá trị trung bình của tổng thể là:
- Khoảng tin cậy tối đa của giá trị trung bình của tổng thể là:
- Khoảng tin cậy tối thiểu của giá trị trung bình của tổng thể là:
Ví dụ: Mức chi tiêu của một gia đình trên địa bàn là biến ngẫu nhiên phân phối
chuẩn với độ lệch chuẩn là 2 triệu đồng/ tháng. Điều tra ngẫu nhiên mức chi tiêu của 600 hộ gia đình có quy mơ và mức sống tương tự nhau trên địa bàn thì thấy mức chi tiêu trung bình của các hộ gia đình là 8,5 triệu đồng/ tháng. Với độ tin cậy 95% hãy ước lượng mức chi tiêu trung bình của các hộ gia đình thuộc địa bàn nói trên.
Gọi X là mức chi tiêu trên địa bàn đã cho (triệu đồng/ tháng). Theo bài ra, X là biến ngẫu nhiên phân phối chuẩn với độ lệch chuẩn 2 triệu đồng/ tháng: X ~ N(μ, với σ = 2
Mức chi tiêu trung bình của hộ gia đình trên địa bàn là tham số μ. Đây là bài toán ước lượng tham số μ của biến ngẫu nhiên phân phối chuẩn với đã biết. Áp dụng công thức:
95 Theo dữ liệu đầu bài ta có:
; σ = 2; n = 600; α = 0,05 =>
Khoảng tin cậy đối xứng của X là:
(triệu đồng/ tháng)
Vậy với độ tin cậy 95%, mức chi tiêu trung bình của các hộ gia đình thuộc địa bàn nói trên là (8,34;8,66) (triệu đồng/ tháng)
b.Trường hợp phương sai 2 chưa biết
Trong nhiều bài toán thực tế, ta không biết phương sai 2 của biến ngẫu nhiên gốc X của tổng thể. Với độ tin cậy bằng 1, ta có:
- Khoảng tin cậy đối xứng của giá trị trung bình của tổng thể là :
- Khoảng tin cậy tối đa của giá trị trung bình của tổng thể là :
- Khoảng tin cậy tối thiểu của giá trị trung bình của tổng thể là :
Ví dụ:. Năng suất giống lúa A ở một vùng được báo cáo qua 25 điểm thu hoạch
với kết quả ghi chép được như sau:
Năng suất (tạ/ ha) 7 9 11 13 17 Số điểm thu hoạch 2 7 12 3 1 Với độ tin cậy 95% hãy cho biết:
a) Năng suất trung bình của giống lúa A ở vùng này nằm trong khoảng nào? b) Năng suất tối thiểu của giống lúa A ở vùng này là bao nhiêu?
96
Gọi X là năng suất giống lúa A ở vùng này (tạ/ha). Theo đề bài X là biến ngẫu nhiên phân phối chuẩn: X ~ N(μ, . Năng suất lúa trung bình là tham số μ. Đây là bài toán ước lượng tham số μ của biến ngẫu nhiên phân phối chuẩn với σ chưa biết.
a) Để tìm khoảng tin cậy đối xứng của μ ta áp dụng công thức:
Theo dữ liệu đầu bài ta có: α = 0,05 =>
n = 25
Ta tính được trung bình mẫu và độ lệch chuẩn mẫu: = 10,6
S = 2,082
Ta có biểu thức:
=>
Vậy với độ tin cậy 95% và qua mẫu cụ thể này, năng suất giống lúa A ở vùng trên nằm trong khoảng (9,05; 11,699)
b) Tìm năng suất tối thiểu của giống lúa A, ta áp dụng công thức:
α = 0,05 =>
Vậy với độ tin cậy 95% và qua mẫu cụ thể này, năng suất tối thiểu của giống lúa A trong vùng là 9,888 tạ/ ha.
97 Với độ tin cậy 1, ta có
- Khoảng tin cậy đối xứng của tỷ lệ P là:
- Khoảng tin cậy tối đa của tỷ lệ P là:
- Khoảng tin cậy tối thiểu của tỷ lệ P là:
Ví dụ: Một trường muốn kiểm tra tỷ lệ sinh viên tốt nghiệp ra trường công tác có đúng chun ngành được đào tạo hay khơng. Phòng đào tạo trường đó đã cho điều tra 100 sinh viên đã tốt nghiệp có 40 sinh viên cơng tác đúng chun ngành. Với độ tin cậy 95%, tỷ lệ sinh viên của trường tốt nghiệp công tác đúng chuyên ngành nằm là bao nhiêu?
Giải:
Gọi p là tỷ lệ sinh viên của trường tốt nghiệp công tác đúng chuyên ngành được đào tạo. f là tỷ lệ sinh viên đã tốt nghiệp ra trường công tác đúng chuyên ngành trong mẫu n = 100 sinh viên. Theo bài ra ta có:
Đây là bài tốn ước lượng tần suất p của tổng thể, n ≥ 100 Áp dụng cơng thức:
Từ dữ liệu đầu bài ta có: n = 100
98 α = 0,05 =>
Vậy với độ tin cậy 95% và qua mẫu cụ thể này, tỷ lệ sinh viên của trường đã tốt nghiệp công tác đúng chuyên ngành nằm trong khoảng (0,304; 0,496)