Tuổi và trình độ văn hóa được biểu thị bởi con số nên thuộc về dấu hiệu định lượng.. Người ta thường dùng phương pháp nghiên cứu như sau: Chọn ngẫu nhiên ra một số người gọi là lấy mẫu r
Trang 1TRẦN AN HẢI
HÀ NỘI - 2009
Trang 2Chương 4
T HỐNG KÊ MÔ TẢ
Thống kê là gì
Có thể nghiên cứu dân số theo các dấu hiệu
Tuổi Trình độ văn hóa
Địa bàn cư trú Nghề nghiệp
Trang 3Tuổi và trình độ văn hóa được biểu thị bởi con số nên thuộc về dấu hiệu định lượng
Địa bàn cư trú và nghề nghiệp thuộc về dấu hiệu định tính
Trang 4Việc nghiên cứu này có thể làm theo kiểu tổng điều tra dân số và phân tích từng người theo các dấu hiệu trên, từ
đó tổng hợp thành dấu hiệu chung cho toàn bộ dân số nước đó
Làm như vậy có nhiều khó khăn như: đòi hỏi nhiều chi phí vật chất và thời gian, điều tra có thể bị lặp hoặc sót,
…
Trang 5Người ta thường dùng phương pháp nghiên cứu như sau: Chọn ngẫu nhiên ra một số người (gọi là lấy mẫu) rồi điều tra và xử lí số liệu bằng phương pháp xác suất để từ
đó suy ra những kết luận về các dấu hiệu Làm như vậy
có ưu điểm: Thu được các kết luận một cách nhanh chóng, đỡ tốn kém mà vẫn đảm bảo được độ chính xác cần thiết
Trang 6Cơ sở của phương pháp này là khoa học Thống kê
Thống kê là khoa học về các phương pháp thu thập, tổ chức, trình bày, phân tích và xử lí số liệu Nó biến những con số khô khan câm lặng trong dữ liệu thu thập thành những con số biết nói Trên cơ sở này, chúng ta mới có thể đưa ra được những dự báo và quyết định đúng đắn Vì thế, thống kê cần thiết cho mọi lực lượng lao động, đặc biệt rất cần cho các nhà quản lí, hoạch định chính sách
Trang 7Năm 1920, nhà văn người Anh, H.G.Wells đã dự báo:
“Trong một tương lai không xa, kiến thức thống kê và tư duy thống kê sẽ trở thành một yếu tố không thể thiếu
được trong học vấn phổ thông của mỗi công dân, giống như là khả năng biết đọc, biết viết vậy”
Năm 1973, khi tổng kết về công tác cải cách giáo dục, UNESCO đã khẳng định rằng Xác suất – Thống kê là một trong 9 quan điểm chủ chốt để xây dựng học vấn trong thời đại ngày nay
Trang 8Ngày nay Thống kê đã được ứng dụng rộng rãi trong hầu hết các hoạt động của con người, từ khoa học tự nhiên, kinh tế, nông nghiệp, y học cho tới các khoa học xã hội và nhân văn
Trang 9Thống kê mô tả là bước đầu tiên của Thống kê, có mục đích thu thập và hệ thống hóa số liệu, tính các số đặc trưng thực nghiệm và tìm qui luật phân phối thực nghiệm của hiện tượng cần nghiên cứu
Trang 10§1 TỔNG THỂ VÀ MẪU
Tập hợp gồm tất cả các phần tử là đối tượng nghiên cứu của ta gọi là tổng thể
Số phần tử của tổng thể gọi là kích thước của nó n
phần tử lấy ra từ tổng thể được gọi là một mẫu kích thước n
Một mẫu được gọi là mẫu ngẫu nhiên nếu các phần
tử của nó được lấy một cách ngẫu nhiên
Trang 12Mối quan hệ giữa Xác suất và Thống kê
Xác suất nghiên cứu tổng thể và nhờ đó mà ta hiểu về mẫu Còn thống kê nghiên cứu về mẫu và nhờ đó mà
ta hiểu về tổng thể
Trang 13Mẫu có 2 loại:
Mẫu định tính là mẫu mà ta quan tâm đến các phần
tử của nó có một tính chất A hay không
Trang 14Mẫu định lượng là mẫu mà ta quan tâm đến một
yếu tố về lượng của các phần tử trong mẫu
Một mẫu định lượng kích thước n có dạng
Trang 15(X1, X2, …, X n) là mẫu ngẫu nhiên tổng quát,
(x1, x2, …, x n) là mẫu ngẫu nhiên cụ thể
Trang 16§2 HỆ THỐNG HÓA SỐ LIỆU TRONG TRƯỜNG HỢP MẪU ĐỊNH LƯỢNG
Tổng quát
Sắp xếp số liệu thành dãy
(x1, x2, …, x n),
sao cho x1 ≤ x2 ≤ … ≤ x n
Trang 18Từ bảng này ta có bảng phân bố tần suất sau
Trang 19Ví dụ
Giá của mặt hàng A sau Tết tại 8 cửa hiệu là
(95, 109, 99, 98, 105, 99, 109, 102) Thu gọn mẫu, ta có
Giá hàng A 95 98 99 102 105 109
Trang 20Trường hợp mẫu (x1, x2,…, x n) có nhiều các x i
khác nhau
Ta chọn k khoảng [a i-1 ; a i ) (i = 1,…, k) sao cho
chứa tất cả các x j
Trang 21Ta thu gọn mẫu thành bảng phân bố tần số ghép lớp
X a0 - a1 a1- a2 … a k-1 - a k
với a i-1 - a i là [a i-1 ; a i ), n i = số các x j thuộc [a i-1 ; a i)
Từ bảng này ta có bảng phân bố tần suất ghép lớp sau
X a0 - a1 a1- a2 … a k-1 - a k
trong đó f i = n i /n
Trang 23Biểu đồ tần số hình cột
Trang 24Ta cũng có thể ghép các số liệu trong mẫu vào các đoạn rời nhau
Ví dụ
Chiều cao [160;162] [163;165] [166;168] [169;171] [172;174]
Trang 25Biểu đồ tần số hình cột
Trang 26Ở mẫu ghép lớp, trong mỗi khoảng thứ i ta chọn một số
làm đại diện (Thường lấy là trung điểm của 2 đầu mút của khoảng), ta lại có bảng phân bố tần số như ở trường hợp trên
Trang 27Ví dụ
Đường gấp khúc tần số
Trang 28Biểu đồ hình quạt rất thích hợp cho việc thể hiện bảng phân bố tần suất ghép lớp
Trang 30 Trung bình mẫu và phương sai mẫu
Cho mẫu định lượng thu gọn
Trung bình mẫu
Trang 31Phương sai mẫu
Có thể chứng minh
Trang 32Phương sai mẫu điều chỉnh
Trang 33Độ lệch mẫu
Độ lệch mẫu điều chỉnh
Trang 34Đối với mẫu ngẫu nhiên tổng quát (X1, X2, …, X n)
Trung bình mẫu
Phương sai mẫu
Trang 35Phương sai mẫu điều chỉnh
Độ lệch mẫu
Độ lệch mẫu điều chỉnh
Trang 37Các công thức sau đây cho phép giảm bớt sự cồng kềnh khi tính toán:
Với x 0 và h 0 tùy ý, ta có các công thức
Ta chọn x0 trùng với với x j có n j lớn nhất
Nếu các x j không cách đều, chọn h = 1 Nếu các x j cách
đều, chọn h = x2 – x1
Trang 39Cách dùng máy tính CASIO fx – 500MS trong thống kê
Đầu tiên, để vào chế độ tính toán thống kê, ta ấn
MODE 2
Trang 40Muốn nhập số liệu từ mẫu (x1, x2, …, x n), ta ấn
x1 SHIFT n1 DT x2 SHIFT n2 DT… x k SHIFT n k DT
Sau khi nhập xong dữ liệu:
Trang 42Chú ý
Muốn chỉnh dữ liệu cũ, ấn hoặc Tiếp theo:
Nếu muốn thay thế dữ liệu đó, ta nhập giá trị mới và
ấn , giá trị mới sẽ thay thế giá trị cũ
Nếu muốn xóa dữ liệu đó,ấn SHIFT CL (các dữ liệu còn lại sẽ tự động dồn số thứ tự lại)
Trang 43Chương 5 ƯỚC LƯỢNG THAM SỐ
_
§1 ĐẶT VẤN ĐỀ
Biết chiều dài một sản phẩm do một xưởng sản xuất ra là
bnn X Hãy ước lượng giá trị của
Trang 44là một tham số cần ước lượng Muốn ước lượng nó, ta phải dựa vào mẫu gồm một số sản phẩm do xưởng này sản xuất Ta có thể ước đoán bởi một giá trị hoặc
ước đoán thuộc khoảng (a; b) nào đấy
Trong thống kê, gọi là ước lượng điểm của , còn
(a; b) là ước lượng khoảng của
Trang 45§2 ƯỚC LƯỢNG ĐIỂM
Giả sử bnn X đã biết được dạng của quy luật ppxs nhưng
chưa biết tham số nào đó Ta ước đoán bởi một con
số * như sau: Ta xây dựng hàm của mẫu ngẫu nhiên tổng quát là
Với mỗi mẫu ngẫu nhiên cụ thể (x1, x2, …, x n), ta lấy
làm ước lượng cho
Trang 46Gọi
hay
là ước lượng điểm của
Để đánh giá chất lượng * xem “tốt” hay không ta không thể mong muốn nó thật gần bởi vì ta chưa biết Vì vậy, dưới đây người ta đưa ra các tiêu chuẩn để dựa vào
đó kết luận về chất lượng của *
Trang 47 Ước lượng không chệch (ưlkc)
Gọi là ước lượng không chệch của , nếu
= , Ngược lại, nếu
thì gọi là ước lượng chệch của
Trang 48 Ước lượng hiệu quả (ưlhq)
Gọi là ước lượng hiệu quả của , nếu nó là ưlkc của và nhỏ nhất so với phương sai của mọi ưlkc khác của
Trang 49 Ước lượng vững (ưlv)
Gọi là ước lượng vững của , nếu
Ý nghĩa của công thức này
Hầu như chắc chắn sai khác
không nhiều miễn là n đủ lớn
Trang 50Các kết quả về ước lượng điểm
là ưlkc, ưlhq, ưlv của E(X)
, là ưlkc, ưlv của D(X)
là ưlkc, ưlhq, ưlv của P(A)
, là ước lượng chệch của D(X)
Trang 51§3 ƯỚC LƯỢNG KHOẢNG
Phương pháp ước lượng điểm có nhược điểm là khi kích thước mẫu nhỏ thì ước lượng điểm tìm được có thể sai lệch rất nhiều so với tham số cần ước lượng Ngoài ra không thể đánh giá được khả năng mắc sai lầm khi ước lượng Để khắc phục các nhược điểm này, ta thường dùng phương pháp ước lượng bằng khoảng tin cậy
Trang 52Giả sử bnn X đã biết được dạng của quy luật ppxs nhưng
chưa biết tham số nào đó Ta đi tìm một khoảng
để nó chứa với xác suất bằng như sau: Ta xây dựng như là các hàm của mẫu ngẫu nhiên tổng quát
sao cho
Trang 53
Khi ấy ta gọi
rơi vào khoảng này, nên người ta thường chọn nó gần 1
Trang 55I – Tìm khoảng tin cậy cho kỳ vọng
a) Trường hợp X
Nếu đã biết, ta dùng công thức
trong đó n = kích thước mẫu, còn ,
Trang 56Như vậy, khoảng tin cậy của X với độ tin cậy là
Đặc biệt:
Nếu chọn , thì ta có khoảng tin
Trang 57
Nếu chọn , thì ta có khoảng tin cậy bên
Trang 58Nếu chưa biết, ta dùng công thức
trong đó , n = kích thước mẫu