Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 79 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
79
Dung lượng
2,02 MB
Nội dung
CHƯƠNG KIỂM ĐỊNH Ở chương 4, nghiên cứu điều tra chọn mẫu với mục đích thường suy rộng trung bình, tỷ lệ theo tiêu thức tổng thể mẫu thành tham số tương ứng tổng thể chung Chương nói cách sử dụng thống kê mẫu để kiểm định giả thiết tổng thể chung, vấn đề quan trọng thống kê Kiểm định giả thiết giả thiết tham số tổng thể chung, sau tiến hành chọn mẫu, tính toán tiêu mẫu sử dụng thông tin để xác định xem giả thiết tham số tổng thể chung có hay không Chẳng hạn, đưa giả thiết số trung bình tổng thể chung giá trị đó, để kiểm tra lại giả thiết ta thu thập số liệu mẫu xác định chênh lệch giá trị giả thiết giá trị tính từ mẫu, sau đánh giá xem chênh lệch có ý nghĩa hay không Mức chênh lệch nhỏ giả thiết có khả đúng; mức chênh lệch lớn, khả thấp Nhưng thường mức chênh lệch giá trị giả thiết giá trị thực tế mẫu không lớn đến mức ta bác bỏ giả thiết ban đầu không nhỏ đến mức ta chấp nhận giả thiết Do đó, tiến hành kiểm định giả thiết (tiến hành định có ý nghĩa sống thực tế) giải pháp hoàn toàn rõ ràng trường hợp ngoại lệ, không phổ biến Một thí dụ sau: Kết cấu tổ hợp nhà thi đấu thể thao thành phố Công ty thiết kế công trình kiến trúc lớn CT đảm nhiệm Theo kết cấu cần khoảng 10.000 nhôm dầy 0,15cm Các nhôm không phép dầy 0,15cm kết cấu không chịu trọng lượng thừa đồng thời chúng không mỏng 0,15cm mái lợp không đủ độ vững Do mà CT tiến hành kiểm tra nhôm cẩn thận CT không muốn phải kiểm tra mà chọn mẫu 100 Những nhôm mẫu có độ dầy trung bình 0,153cm Từ kinh nghiệm làm việc với người cung cấp lợp trước kia, CT biết độ lệch tiêu chuẩn độ dầy lợp 0,015cm Trên sở số liệu đó, CT cần đến kết luận 10.000 lợp có thích hợp với công trình không Phương pháp kiểm định giả thiết giúp cho CT định cần từ chối hay chấp nhận lô lợp Một số vấn đề chung kiểm định 1.1 Giả thiết thống kê Giả thiết thống kê giả thiết vấn đề tổng thể chung Đó giả thiết dạng phân phối xác suất; tham số trung bình, tỷ lệ, phương sai; THỐNG KÊ TRONG KINH DOANH Chương – Kiểm định 113 tính độc lập Thí dụ như: phương pháp điều trị A chữa khỏi 90% bệnh nhân ; tuổi thọ hai loại bóng đèn A B ; kết phương pháp khác hay tổng thể chung có phân phối chuẩn Giả thiết mà ta muốn kiểm định gọi “giả thiết không” ký hiệu H0 Giả thiết đối lập với gọi giả thiết đối (hay giả thiết thay thế) ký hiệu H1 Vấn đề đặt là: bác bỏ hay chấp nhận giả thiết cách Giả thiết thống kê trình bày nhiều dạng khác Tuỳ theo dạng giả thiết mà lựa chọn áp dụng kiểm định hai phía hay kiểm định phía : - Kiểm định phía bác bỏ giả thiết H0 tham số đặc trưng mẫu cao thấp so với giá trị giả thiết tổng thể chung Kiểm định phía có miền bác bỏ, biểu hình 1.1 Thí dụ: Giả thiết H0 : μ = μ0 Giả thiết H1 : μ ≠ μ0 Miền chấp nhận Miền bác bỏ Hình 1.1 - Kiểm định phía trái bác bỏ giả thiết H0 tham số đặc trưng mẫu nhỏ cách đáng kể so với giá trị giả thiết H0 Miền bác bỏ nằm phía trái đường phân phối, biểu hình 1.2 Thí dụ: Giả thiết H0 : μ = μ0 Giả thiết H1 : μ < μ0 Miền bác bỏ Hình 1.2 - Kiểm định phía phải bác bỏ giả thiết H0 tham số đặc trưng mẫu lớn cách đáng kể so với giá trị giả thiết H0 Miền bác bỏ nằm phía phải đường phân phối, biểu hình 1.3 Thí dụ: Giả thiết H0 : μ = μ0 Giả thiết H1 : μ > μ0 Miền bác bỏ Hình 1.3 1.2 Sai lầm mức ý nghĩa kiểm định THỐNG KÊ TRONG KINH DOANH Chương – Kiểm định 114 Trong phải lựa chọn hai giả thiết H0 H1 ta mắc phải hai loại sai lầm: Sai lầm loại bác bỏ giả thiết H0 đúng; ngược lại, thừa nhận H0 sai sai lầm loại Một kiểm định thống kê lý tưởng kiểm định làm cực tiểu sai lầm loại sai lầm loại 2, không tồn kiểm định lý tưởng Nếu làm giảm sai lầm loại làm tăng sai lầm loại ngược lại Có khả xảy thể bảng sau: Kết luận Chấp nhận H0 Bác bỏ H0 nhận H1 H0 Kết luận Sai lầm loại H0 sai sai lầm loại Kết luận Thực tế Xác suất việc mắc sai lầm loại gọi mức ý nghĩa, ký hiệu α Xác suất mắc sai lầm loại ký hiệu β Trị số - β gọi lực lượng kiểm định Lực lượng kiểm định xác suất bác bỏ H0 H0 sai Giữa α β có mối liên hệ tương tự mối liên hệ hai loại sai lầm Xác suất mắc sai lầm loại giảm tăng xác suất mắc sai lầm loại Sử dụng mối liên hệ để định cần chọn mức ý nghĩa thích hợp sở xem xét chi phí mát xảy hai loại sai lầm Chẳng hạn, mắc sai lầm loại phải trả lại lô lợp (ở thí dụ trên) phí để xử lý lại lô lợp mà lẽ chấp nhận Còn mắc sai lầm loại dẫn đến an toàn cho hàng ngàn người tới nhà thi đấu thể thao Rõ ràng người ta dễ nghiêng phía sai lầm loại so với sai lầm loại 2, có nghĩa chọn mức ý nghĩa cho kiểm định cao để có β thấp Nhưng ngược lại, mắc sai lầm loại dẫn đến việc phải tháo rời toàn động hoàn chỉnh nhà máy, mắc sai lầm loại dẫn đến phải tiến hành số sửa chữa bảo hành không đắt lắm, nhà sản xuất nghiêng phía sai lầm loại 2, mắc sai lầm loại mắc sai lầm loại chọn mức ý nghĩa kiểm định thấp Thông thường α lấy 0,01 ; 0,02 ; 0,05 0,10 Từ mức ý nghĩa kiểm định α xác định miền bác bỏ giả thiết H0 miền thừa nhận 1.3 Tiêu chuẩn kiểm định Tiêu chuẩn kiểm định quy luật phân phối xác suất dùng để kiểm định Trong tập hợp kiểm định thống kê có mức ý nghĩa α (tức có xác suất mắc sai lầm loại nhau), kiểm định có xác suất mắc sai lầm loại nhỏ xem “tốt nhất” Vì sau chọn mức ý nghĩa kiểm định, việc lựa chọn dạng phân phối thích hợp Tuỳ thuộc vào giả thiết thống kê cần kiểm định mà người ta sử dụng số quy luật phân phối thông dụng như: quy luật phân phối chuẩn, phân phối T-Student, phân phối χ2, phân phối Fisher 1.4 Các bước tiến hành kiểm định giả thiết thống kê THỐNG KÊ TRONG KINH DOANH Chương – Kiểm định 115 Để tiến hành kiểm định giả thiết thống kê cần thực bước sau: + Phát biểu giả thiết H0 giả thiết đối H1 + Định rõ mức ý nghĩa α (xác suất mắc sai lầm loại 1) + Chọn tiêu chuẩn kiểm định + Tính giá trị tiêu chuẩn kiểm định từ mẫu quan sát + Kết luận bác bỏ hay chấp nhận H0 tuỳ theo giá trị tiêu chuẩn kiểm định rơi vào miền bác bỏ hay chấp nhận Cụ thể : - Nếu giá trị tiêu chuẩn kiểm định thuộc miền bác bỏ: H0 sai, bác bỏ giả thiết H0 , thừa nhận H1 - Nếu giá trị tiêu chuẩn kiểm định thuộc miền chấp nhận: Trong trường hợp không nên hiểu H0 hoàn toàn mà nên hiểu qua mẫu cụ thể chưa đủ sở để bác bỏ H0, cần nghiên cứu thêm Kiểm định so sánh số trung bình Nội dung phần đề cập đến số vấn đề: Kiểm định giả thiết giá trị trung bình tổng thể chung; so sánh hai giá trị trung bình hai tổng thể chung so sánh nhiều trung bình thuộc nhiều tổng thể chung 2.1 Kiểm định giả thiết giá trị trung bình tổng thể chung Giả sử lượng biến tiêu thức X tổng thể chung phân phối theo theo quy luật chuẩn với trung bình (kỳ vọng) μ phương sai σ2 Ký hiệu: N (μ,σ2).Ta chưa biết μ, có sở để giả thiết μ0, ta đưa giả thiết thống kê H0 : μ = μ0 Để kiểm định giả thiết này, từ tổng thể chung ta tiến hành điều tra chọn mẫu ngẫu nhiên n đơn vị tính trung bình mẫu x Để chọn tiêu chuẩn kiểm định thích hợp, ta xét trường hợp sau: 2.1.1 Phương sai tổng thể chung σ2 biết Tiêu chuẩn kiểm định chọn thống kê Z : Z= (x − μ ) n (5.1) σ Nếu giả thiết H0 đúng, ta có : Z= (x − μ ) σ n = (x − μ ) n σ Đại lượng Z phân phối theo quy luật chuẩn hoá N(0,1) Từ tuỳ thuộc vào dạng giả thiết đối H1 mà miền bác bỏ xây dựng theo trường hợp sau: Kiểm định phía phải: Giả thiết H0: μ = μ0 THỐNG KÊ TRONG KINH DOANH Chương – Kiểm định 116 H1 : μ > μ Với mức ý nghĩa kiểm định α cho trước, ta tra bảng N(0,1) tìm Z0,5 - α Nếu Z > Z0,5 - α , ta bác bỏ giả thiết H0, nhận H1 Kiểm định phía trái: Giả thiết H0: μ = μ0 H1 : μ < μ Với mức ý nghĩa kiểm định α cho trước, ta tra bảng N(0,1) tìm Z0,5 - α Nếu Z < - Z0,5 - α hay Z > Z0,5 - α ; ta bác bỏ giả thiết H0, nhận H1 Kiểm định hai phía : Giả thiết H0: μ = μ0 H1: μ ≠ μ0 Với mức ý nghĩa kiểm định α cho trước, ta tra bảng N(0,1) tìm Z0,5 - α/2 Nếu Z > Z0,5 - α/2 ; ta bác bỏ giả thiết H0, nhận H1 2.1.2 Phương sai tổng thể chung σ2 chưa biết, mẫu lớn (n ≥ 30) Trong trường hợp ta dùng tiêu chuẩn kiểm định trên, độ lệch tiêu chuẩn σ thay độ lệch tiêu chuẩn mẫu Z= (x − μ ) n s (5.2) Trong : s độ lệch tiêu chuẩn mẫu Theo định lý giới hạn trung tâm, đại lượng Z có phân phối xấp xỉ chuẩn, cho dù tổng thể chung có phân phối Và tương tự trên, tuỳ thuộc vào giả thuyết đối H1 mà miền bác bỏ xây dựng theo trường hợp sau: Kiểm định phía phải: Giả thiết H0: μ = μ0 H1 : μ > μ Với mức ý nghĩa kiểm định α cho trước, ta tra bảng N(0,1) tìm Z0,5 - α Nếu Z > Z0,5 - α , ta bác bỏ giả thiết H0, nhận H1 Kiểm định phía trái: Giả thiết H0: μ = μ0 H1 : μ < μ Với mức ý nghĩa kiểm định α cho trước, ta tra bảng N(0,1) tìm Z0,5 - α Nếu Z < - Z0,5 - α hay Z > Z0,5 - α ; ta bác bỏ giả thiết H0, nhận H1 Kiểm định hai phía : Giả thiết H0: μ = μ0 H1: μ ≠ μ0 THỐNG KÊ TRONG KINH DOANH Chương – Kiểm định 117 Với mức ý nghĩa kiểm định α cho trước, ta tra bảng N(0,1) tìm Z0,5 - α/2 Nếu Z > Z0,5 - α/2 ; ta bác bỏ giả thiết H0, nhận H1 Thí dụ 1: Một công ty có hệ thống máy tính xử lý 1200 hoá đơn Công ty nhập hệ thống máy tính Hệ thống chạy kiểm tra 40 cho thấy số hoá đơn xử lý trung bình 1260 với độ lệch tiêu chuẩn 215 Với mức ý nghĩa 5% nhận định xem hệ thống có tốt hệ thống cũ hay không? Ta cần kiểm định giả thiết: H0 : μ = 1200 (Hệ thống tốt hệ thống cũ) H1 : μ > 1200 (Hệ thống tốt hệ thống cũ) Đây toán kiểm định giả thiết giá trị trung bình tổng thể chung chưa biết phương sai tổng thể chung mẫu lớn, kiểm định phải, tiêu chuẩn kiểm định chọn công thức 5.2; kết sau: Z= (1260 − 1200) 215 40 = 1,76 Tra bảng : Z0,5 - α = Z0,5 - 0,05 = Z0,45 = 1,64 Ta thấy : Z > Z0,5 - α nên bác bỏ H0 kết luận hệ thống tốt hệ thống cũ mức ý nghĩa 0,05 Cách tra bảng : Z = ? α = 0.05 0.5 - 0.05 = 0.45 α = 05 Giá trị tới hạn Z = 1.645 1.645 Z Z 04 05 06 1.6 4495 4505 5515 1.7 5591 5599 5608 1.8 5671 5678 5686 1.9 5738 5744 5750 Thí dụ 2: Một nhà máy sản xuất săm lốp ô tô tuyên bố tuổi thọ trung bình lốp ôtô họ 30.000 dặm Cơ quan giám định chất lượng nghi ngờ lời tuyên bố kiểm THỐNG KÊ TRONG KINH DOANH Chương – Kiểm định 118 tra 100 lốp tìm trung bình mẫu 29000 dặm với độ lệch tiêu chuẩn 5000 dặm Với mức ý nghĩa 0,05 quan giám định có bác bỏ lời quảng cáo nhà máy không ? Trong trường hợp quan kiểm định nghĩ tuổi thọ trung bình lốp ôtô 30.000 dặm, giả thiết cần kiểm định là: H0 : μ = 30000 H1 : μ < 30000 Đây toán kiểm định giả thiết giá trị trung bình tổng thể chung chưa biết phương sai tổng thể chung mẫu lớn, kiểm định trái, tiêu chuẩn kiểm định chọn công thức 5.2; kết sau: Ta có: Z = (29000 − 30000) 100 5000 = −2 Tra bảng : Z0,5 - α = Z0,5 - 0,05 = Z0,45 = 1,64 Ta thấy : Z < - Z0,5 - α nên ta bác bỏ H0 kết luận quảng cáo nhà máy thật mức ý nghĩa 0,05 Thí dụ 3: Một nhóm nghiên cứu công bố trung bình người vào siêu thị A tiêu hết 140 ngàn đồng Chọn ngẫu nhiên 50 người mua hàng ta tính số tiền trung bình họ tiêu 154 ng.đồng với độ lệch tiêu chuẩn 62 ng.đồng Với mức ý nghĩa 0,02 kiểm định xem công bố nhóm nghiên cứu có không? Ta cần kiểm định giả thiết: H0 : μ = 140 H1 : μ ≠ 140 Đây toán kiểm định giả thiết giá trị trung bình tổng thể chung chưa biết phương sai tổng thể chung mẫu lớn, kiểm định hai phía, tiêu chuẩn kiểm định chọn công thức 5.2; kết sau: Ta có: Z = (154 − 140) 62 50 = 1,59 Tra bảng : Z0,5 - α/2 = Z0,5 - 0,02/2 = Z0,49 = 2,33 Vì Z < Z0,5 - α/2 nên kết luận với mẫu điều tra chưa đủ sở để bác bỏ H0 , ta tạm thời chấp nhận báo cáo nhóm nghiên cứu 2.1.3 Phương sai tổng thể chung σ2 chưa biết, mẫu nhỏ (n < 30) Trong trường hợp tiêu chuẩn kiểm định chọn thống kê t : THỐNG KÊ TRONG KINH DOANH Chương – Kiểm định 119 t= (x − μ ) n (5.3) s Người ta chứng minh H0 t phân phối theo quy luật Student với (n - 1) bậc tự do, s độ lệch tiêu chuẩn mẫu Tuỳ thuộc vào giả thuyết đối H1 mà miền bác bỏ xây dựng theo trường hợp sau: Kiểm định phía phải: Giả thiết H0: μ = μ0 H1 : μ > μ Với mức ý nghĩa kiểm định α cho trước, ta tra bảng tìm giá trị tα,(n -1) Nếu t > tα,(n -1) , ta bác bỏ giả thiết H0 Kiểm định phía trái: Giả thiết H0: μ = μ0 H1 : μ < μ Với mức ý nghĩa kiểm định α cho trước, ta tra bảng tìm giá trị tα,(n -1) Nếu t < - tα,(n -1) hay t > tα,(n -1), ta bác bỏ giả thiết H0 Kiểm định hai phía : Giả thiết H0: μ = μ0 H1: μ ≠ μ0 Với mức ý nghĩa kiểm định α cho trước, ta tra bảng tìm giá trị tα/2,(n -1) Nếu t > tα/2,(n -1), ta bác bỏ giả thiết H0 Thí dụ 4: Một nghiên cứu thông báo mức tiêu dùng hàng tháng sinh viên 420 nghìn đồng Để kiểm tra người ta chọn ngẫu nhiên 16 sinh viên tính trung bình tháng họ tiêu 442 nghìn đồng với độ lệch tiêu chuẩn mẫu điều chỉnh 60 nghìn đồng Với mức ý nghĩa 5% nhận định xem kết luận thông báo có thấp thật hay không? Ta cần kiểm định giả thiết: H0 : μ = 420 H1 : μ > 420 Ta có : t= (442 − 420) 60 16 = 1,47 Tra bảng phân phối Student với 15 bậc tự ta tìm t0,05;15 = 1,753 Vì t < tα,(n -1) sở để bác bỏ H0 Bản thông báo chấp nhận THỐNG KÊ TRONG KINH DOANH Chương – Kiểm định 120 2.2 Kiểm định hai giá trị trung bình hai tổng thể chung Trong phần ta xét toán so sánh hai trung bình hai tổng thể chung Đây vấn đề có ý nghĩa thống kê Trong thực tế phải làm phép so sánh: so sánh chất lượng hai loại sản phẩm, hai loại dịch vụ; so sánh hai hội đầu tư; so sánh hai phương pháp dạy học Để giải vấn đề ta dùng phương pháp kiểm định thống kê kiểm định tham số trường hợp hai mẫu độc lập hai mẫu phụ thuộc ; kiểm định phi tham số 2.2.1 Kiểm định hai giá trị trung bình hai tổng thể chung - trường hợp hai mẫu độc lập Giả sử có hai tổng thể chung: Tổng thể chung thứ có lượng biến tiêu thức X1 phân phối theo quy luật chuẩn N (μ1, σ ) tổng thể chung thứ hai có lượng biến tiêu thức X2 phân phối theo quy luật chuẩn N (μ2, σ ) Nếu μ1 μ2 chưa biết song có sở để giả thiết giá trị chúng ta có giả thiết thống kê H0 : μ1 = μ2 Để kiểm định giả thiết trên, từ hai tổng thể chung người ta rút hai mẫu ngẫu nhiên độc lập với kích thước mẫu tương ứng n1 n2 , từ tính trung bình mẫu x x Để chọn tiêu chuẩn kiểm định thích hợp, ta xét trường hợp sau: a) Đã biết phương sai tổng thể chung σ σ 2 Tiêu chuẩn kiểm định chọn là: Z= (x1 − x ) − (μ − μ ) σ 12 n1 + σ 22 n2 Đại lượng Z phân phối theo quy luật chuẩn hoá N (0, 1) Nếu giả thiết H0 : Z= (x1 − x ) σ n1 + σ 2 có phân phối N (0, 1) (5.4) n2 Với mức ý nghĩa kiểm định α cho trước tuỳ thuộc vào giả thiết đối H1 mà ta xây dựng miền bác bỏ sau : Kiểm định phía phải: Giả thiết H0: μ1 = μ2 THỐNG KÊ TRONG KINH DOANH Chương – Kiểm định 121 H1: μ1 > μ2 Với mức ý nghĩa kiểm định α cho trước, ta tra bảng N(0,1) tìm Z0,5 - α Nếu Z > Z0,5 - α , ta bác bỏ giả thiết H0 Kiểm định phía trái: Giả thiết H0: μ1 = μ2 H1: μ1 < μ2 Nếu Z < - Z0,5 - α hay Z > Z0,5 - α ; ta bác bỏ giả thiết H0 Kiểm định hai phía : Giả thiết H0: μ1 = μ2 H 1: μ ≠ μ Với mức ý nghĩa kiểm định α cho trước, ta tra bảng N(0,1) tìm Z0,5 - α/2 Nếu Z > Z0,5 - α/2 ; ta bác bỏ giả thiết H0 b) Chưa biết phương sai hai tổng thể chung σ σ , mẫu lớn (n1 n2 ≥ 30) 2 Trong trường hợp ta dùng thống kê Z làm tiêu chuẩn kiểm định phần a) , phương sai σ σ thay phương sai mẫu 2 Như thống kê Z có dạng : Z= (x − x ) s12 s 22 + n1 n (5.5) Nếu n1 n2 ≥ 30 theo định lý giới hạn trung tâm, Z có phân phối xấp xỉ chuẩn N (0, 1) Với mức ý nghĩa kiểm định α cho trước tuỳ thuộc vào giả thiết đối H1 mà ta xây dựng miền bác bỏ sau : Kiểm định phía phải: Giả thiết H0: μ1 = μ2 H1: μ1 > μ2 Nếu Z > Z0,5 - α , ta bác bỏ giả thiết H0 Kiểm định phía trái: Giả thiết H0: μ1 = μ2 H1: μ1 < μ2 Nếu Z < - Z0,5 - α hay Z > Z0,5 - α ; ta bác bỏ giả thiết H0 Kiểm định hai phía : Giả thiết H0: μ1 = μ2 THỐNG KÊ TRONG KINH DOANH Chương – Kiểm định 122 Giữa tốc độ phát triển liên hoàn tốc độ phát triển định gốc có mối quan hệ sau : - Thứ nhất: Tích tốc độ phát triển liên hoàn tốc độ phát triển định gốc, tức : n Ti = Πt i ; Tn = ∏ t i i=2 - Thứ hai : Thương tốc độ phát triển định gốc thời gian i với tốc độ phát triển định gốc thời gian i -1 tốc độ phát triển liên hoàn hai thời gian , tức : Ti = ti Ti −1 (với i = 2, 3, , n ) - Tốc độ phát triển bình quân: Phản ánh mức độ đại diện tốc độ phát triển liên hoàn Từ mối quan hệ thứ tốc độ phát triển liên hoàn tốc độ phát định gốc nên tốc độ phát triển bình quân tính theo công thức số bình quân nhân: n t = n −1 t t t n = n −1 ∏ t i = n −1 i=2 yn y1 Từ thí dụ 1, ta có : t = 6−1 22,9 = 10,0 2,29 = 1,18 lần hay 118% Tức là: tốc độ phát triển bình quân hàng năm giá trị sản xuất doanh nghiệp 1,18 lần hay118% Từ công thức tính tốc độ phát triển bình quân cho thấy : nên tính tiêu tượng biến động theo xu hướng định 2.4 Tốc độ tăng(giảm) Chỉ tiêu phản ánh qua thời gian, tượng tăng (giảm) lần phần trăm, hay phản ánh nhịp điệu biến động qua thời gian.Tuỳ theo mục đích nghiên cứu, tính tốc độ tăng (giảm) sau đây: - Tốc độ tăng (giảm) liên hoàn : phản ánh tốc độ tăng (giảm) thời gian i so với thời gian i -1 tính theo công thức sau : = y i − y i −1 ⋅ 100 = t i − 100 % y i −1 Tức là: Tốc độ tăng (giảm) liên hoàn tốc độ phát triển liên hoàn trừ (biểu lần) trừ 100% (nếu tốc độ phát triển liên hoàn biểu phần trăm) Từ kết mục 2.3, ta có : a = t - = 1,250 - = 0,25 lần hay 25% THỐNG KÊ TRONG KINH DOANH Chương – Phân tích dãy số thời gian 177 a3 = t - = 1,232 - = 0,232 lần hay 23,2% v.v - Tốc độ tăng (giảm) định gốc : phản ánh tốc độ tăng (giảm) thời gian i so với mức độ đầu dãy số tính theo công thức sau : Ai = y i − y1 ⋅ 100 = Ti − 100 % y1 Tức : Tốc độ tăng (giảm) định gốc tốc độ phát triển định gốc trừ (nếu biểu đơn vị lần) trừ 100% (nếu tốc độ phát triển liên hoàn biểu phần trăm) Từ kết mục 3, ta có : A2 = T2 - = 1,25 - = 0,25 lần hay 25% A3 = T3 - = 1,54 - = 0,54 lần hay 54% v.v - Tốc độ tăng (giảm) bình quân: Phản ánh tốc độ tăng (giảm) đại diện cho tốc độ tăng (giảm) liên hoàn tính theo công thức sau : a = t −1 (nếu t biểu lần ) a = t (%) - 100 Hoặc : ( t biểu % ) Từ kết mục 2.3 , ta có : a = 1,18 - = 0,18 lần hay 18% Tức là: tốc độ tăng bình quân hàng năm giá trị sản xuất doanh nghiệp 18% 2.5 Giá trị tuyệt đối 1% tăng (giảm) Chỉ tiêu phản ánh 1% tăng (giảm) tốc độ tăng (giảm) liên hoàn tương ứng với giá trị cụ thể tính cách chia lượng tăng (giảm) tuyệt đối liên hoàn cho tốc độ tăng (giảm) liên hoàn, tức : gi = y i − y i −1 y δi = = i −1 a i (%) y i − y i −1 100 ⋅ 100 y i −1 Từ thí dụ 1, ta có : y1 10,0 = = 0,1 tỷ đồng - tức 1% tăng lên cuả năm 2003 so với 100 100 năm 2002 tương ứng 0,1 tỷ đồng g2 = THỐNG KÊ TRONG KINH DOANH Chương – Phân tích dãy số thời gian 178 y2 12,5 = = 0,125 tỷ đồng - tức 1% tăng lên cuả năm 2004 so với 100 100 năm 2003 tương ứng 0,125 tỷ đồng g3 = v.v Chỉ tiêu không tính tốc độ tăng (giảm) định gốc số không y đổi 100 Trên năm tiêu thường sử dụng để phân tích đặc điểm biến động tượng qua thời gian Mỗi tiêu có nội dung ý nghĩa riêng, song tiêu có mối liên hệ với nhằm giúp cho việc phân tích đầy đủ sâu sắc Phân tích thành phần dãy số thời gian Các thành phần dãy số thời gian biểu sơ đồ sau : Chu kỳ Xu Dãy số thời gian Ngẫu nhiên Thời vụ 3.1 Thành phần xu Sự biến động mặt lượng tượng qua thời gian chịu tác động nhiều yếu tố chia thành hai nhóm: nhóm yếu tố chủ yếu nhóm yếu tố ngẫu nhiên Với tác động nhóm yếu tố chủ yếu xác lập xu (xu hướng) phát triển tượng Xu phát triển thường hiểu chiều hướng tiến triển chung kéo dài theo thời gian, phản ánh tính quy luật phát triển tượng Với tác động nhóm yếu tố ngẫu nhiên làm cho biến động mặt lượng tượng lệch khỏi xu hướng chung Vì vậy, cần sử dụng phương pháp phù hợp, chừng mực định, nhằm loại bỏ dần tác động yếu tố ngẫu nhiên phản ánh xu phát triển tượng Thành phần xu có tất dãy số với loại thời gian khác tháng, quý, năm Sau đề cập đến số phương pháp thường sử dụng để biểu xu phát triển tượng THỐNG KÊ TRONG KINH DOANH Chương – Phân tích dãy số thời gian 179 3.1.1 Mở rộng khoảng cách thời gian Phương pháp sử dụng dãy số thời kỳ có khoảng cách thời gian tương đối ngắn có nhiều mức độ mà qua chưa phản ánh xu hướng phát triển tượng Nội dung phương pháp ghép số thời gian liền vào thành khoảng thời gian dài hơn, chẳng hạn ghép tháng vào thành quý gọi mở rộng khoảng cách từ tháng sang quý Thí dụ 4: Có tài liệu sản lượng hàng tháng năm 2007 doanh nghiệp sau: Tháng Sản lượng (1000 tấn) Tháng Sản lượng (1000 tấn) 40,4 40,8 36,8 44,8 40,6 49,4 38,0 10 48,9 42,2 11 46,2 48,5 12 42,2 Dãy số thời gian cho thấy sản lượng tháng tăng, giảm không phản ánh rõ xu hướng biến động Có thể mở rộng khoảng cách thời gian từ tháng sang quý cách cộng sản lượng tháng 1, tháng tháng sản lượng quý I ; cộng sản lượng tháng 4, tháng tháng sản lượng quý II v.v kết sau : Qúy Sản lượng (1000 ) I II III IV 117,8 128,7 135,0 137,3 Bảng cho thấy sản lượng doanh nghiệp tăng dần từ quý I đến quý IV năm 2007 Phương pháp mở rộng khoảng cách thời gian đơn giản, dễ làm có hạn chế lớn số lượng mức độ dãy số nhiều Như không làm ảnh hưởng nhân tố ngẫu nhiên mà làm giảm ảnh hưởng nhân tố đến biến động tượng Nhất dãy số theo tháng tượng có biến động thời vụ vận dụng phương pháp làm tính thời vụ 3.1.2 Số bình quân trượt (di động) Đây phương pháp sử dụng để san dãy số có nhiều biến động ngẫu nhiên Số bình quân trượt (còn gọi số bình quân di động) số bình quân cộng nhóm THỐNG KÊ TRONG KINH DOANH Chương – Phân tích dãy số thời gian 180 định mức độ dãy số thời gian tính cách loại dần mức độ đầu, đồng thời thêm vào mức độ tiếp theo, cho số lượng mức độ tham gia tính số bình quân không thay đổi Số lượng mức độ tham gia tính số bình quân thường lẻ (3, 5, 7) Giả sử có dãy số thời gian : y1, y2, y3, ., yn Nếu tính số bình quân trượt cho nhóm ba mức độ, có số bình quân trượt sau: y + y2 + y3 y2 = y + y3 + y y3 = … y + y n −1 + y n y n −1 = n −2 Từ đó, có dãy số gồm số bình quân trượt y , y ,…, y n −1 Từ bảng số liệu thí dụ 4, tính số bình quân trượt cho nhóm ba mức độ, có kết sau: yi yi Tháng yi yi 40,4 - 40,8 44,7 36,8 39,3 44,8 45,0 40,6 38,5 49,4 47,7 38,0 40,3 10 48,9 48,2 42,2 42,9 11 46,4 45,8 48,5 43,8 12 42,2 - Tháng Biểu diễn hai dãy số lên đồ thị với trục hoành tháng trục tung mức độ hai dãy số: dãy số thực tế ( yi ) dãy số bình quân trượt ( yi ) So sánh hai đồ thị cho thấy đồ thị dãy bình quân trượt “ phẳng” đồ thị dãy số thực tế ảnh hưởng yếu tố ngẫu nhiên - qua tính bình quân trượt - phần bị san THỐNG KÊ TRONG KINH DOANH Chương – Phân tích dãy số thời gian 181 Việc chọn mức độ để tính số bình quân trượt đòi hỏi phải dựa vào đặc điểm biến động số lượng mức độ dãy số thời gian Nếu biến động tương đối đặn số lựơng mức độ dãy số không nhiều tính số bình quân trượt với ba mức độ Nếu có biến động lớn dãy số có nhiều mức độ tính số bình quân trượt với bốn, năm mức độ Số bình quân trượt tính từ nhiều mức độ có tác dụng san ảnh hưởng yếu tố ngẫu nhiên, đồng thời làm cho số lượng mức độ dãy số bình quân trượt giảm, ảnh hưởng đến việc biểu xu hướng phát triển tượng Phương pháp làm trơn nhẵn biến động thực tế nên không dùng với dãy số có biến động thời vụ mà thường dùng với dãy số theo năm 3.1.3 San mũ Là phương pháp để san dãy số dự đoán ngắn hạn San mũ thực chất bình quân trượt có trọng số Trọng số chọn theo ý chủ quan nằm khoảng từ đến Trọng số lớn thường tính cho mức độ đứng sau E i = W.Yi + (1 − W ).E i −1 3.1.4 Hàm xu Ở phương pháp này, biến động mức độ dãy số thời gian biểu hàm số gọi hàm xu Nếu gọi t thứ tự thời gian, dạng tổng quát hàm xu : yˆ t = f(t) với t = 1, , ,…, n Sau số dạng hàm xu thường sử dụng : a Hàm xu tuyến tính : Hàm xu tuyến tính dược sử dụng lượng tăng (giảm) tuyệt đối liên hoàn xấp xỉ yˆ t = b0 + b1 t THỐNG KÊ TRONG KINH DOANH Chương – Phân tích dãy số thời gian 182 Sử dụng phương pháp bình phương nhỏ có hệ phương trình sau để tìm giá trị hệ số b0 b1 : Σ y = n b0 + b1 Σ t Σ ty = b0 Σ t + b1 Σ t Hoặc tính b0 , b1 theo công thức sau : b1 = ty − t y σt2 b0 = y - b1 t b Hàm xu pa- - bôn : Hàm xu pa- - bôn sử dụng trường hợp mức độ dãy số tăng dần theo thời gian, đạt cực đại, sau lại giảm dần theo thời gian; giảm dần theo thời gian, đạt cực tiểu, sau lại tăng dần theo thời gian Dạng tổng quát hàm xu pa- bôn sau : yˆ t = b0 + b1 t + b2 t Sử dụng phương pháp bình phương nhỏ có hệ phương trình sau để tìm giá trị hệ số b0 , b1 b2 : Σy = n b0 + b1 Σ t + b2 Σ t Σ ty = b0 Σ t + b1 Σ t + b2 Σ t Σ t y = b0 Σ t + b1 Σ t + b2 Σ t c Hàm xu hy-pe-bôn: Hàm xu thê hy- pe- bôn sử dụng mức độ tượng giảm dần theo thời gian Dạng tổng quát hàm xu hy-pe-bôn sau: yˆ t = b + b1 t Sử dụng phương pháp bình phương nhỏ có hệ phương trình sau để tìm giá trị hệ số b0 , b1 : ∑ y = nb + b1 ∑ t y ∑t 1 = b ∑ + b1 ∑ t t d Hàm xu hàm mũ : Hàm xu dạng mũ sử dụng tốc độ phát triển liên hoàn xấp xỉ yˆ t = b0 b1t THỐNG KÊ TRONG KINH DOANH Chương – Phân tích dãy số thời gian 183 Sử dụng phương pháp bình phương nhỏ có hệ phương trình sau để tìm giá trị hệ số b0 , b1 : Σ lny = nln b0 + ln b1 Σ t Σ t lny = ln b0 Σ t + ln b1 Σ t Giải hệ phương trình ln b0 , ln b1 ; tra đối ln b0 , b1 Để xác định dạng hàm xu phù hợp, đòi hỏi phải phân tích đặc điểm biến động qua thời gian, dựa vào đồ thị số tiêu chuẩn khác sai số chuẩn mô hình- ký hiệu SE : SE = ∑ (y t − yˆ t ) n−p Trong : y t : mức độ thực tế tượng thời gian t yˆ t : mức độ tượng thời gian t tính từ hàm xu n : số lượng mức độ dãy số thời gian p : số lượng hệ số hàm xu Nếu đồ thị biểu mức độ thực tế tượng qua thời gian xây dựng số hàm xu chọn hàm xu có sai số chuẩn mô hình nhỏ Trở lại thí dụ 1, biểu diễn đồ thị với trục hoành thứ tự thời gian, trục tung mức độ dãy số : Trên đồ thị cho thấy điểm phân bố nằm đường thẳng Mặt khác, mục 2.2 cho thấy lượng tăng tuyệt đối liên hoàn xấp xỉ Do sử dụng hàm xu tuyến tính để biểu giá trị sản xuất doanh nghiệp : yˆ t = b0 + b1 t Dựa vào hệ phương trình tìm hệ số b0 , b1 để lập bảng tính toán sau : THỐNG KÊ TRONG KINH DOANH Chương – Phân tích dãy số thời gian 184 Năm Y t ty t2 1999 10,0 10,0 2000 12,5 25,0 2001 15,4 46,2 2002 17,6 70,4 16 2003 20,2 101,0 25 2004 22,9 137,4 36 Tổng 98,6 21 390 91 Thay số liệu vào hệ phương trình : 98,6 = b0 + 21 b1 390 = 21 b0 + 91 b1 Giải ra, : b0 = 7,452 , b1 = 2,566 Do hàm xu tuyến tính biểu giá trị sản xuất doanh nghiệp có dạng cụ thể sau : yˆ t = 7,452 + 2,566 t Hoặc tính : 390 21 98,6 − * = 2,566 6 b1 = 91 21 −( ) 6 b0 = 98,6 21 - 2,566 = 7,452 6 3.1.5 Tự tương quan - Các mức độ dãy số thời gian có liên hệ tương quan với - Có thể có mô hình tự tương quan bậc 1, bậc 2, …, bậc p - Mô hình tổng quát có dạng: Yi = A + A Yi −1 + A Yi − + + A p Yi − p + δ i Trong δi sai số ngẫu nhiên 3.2 Thành phần thời vụ Biến động thời vụ biến động tượng có tính chất lặp lặp lại thời gian định năm Thí dụ: Sản xuất nông nghiệp phụ thuộc vào thời vụ Trong THỐNG KÊ TRONG KINH DOANH Chương – Phân tích dãy số thời gian 185 ngành khác công nghiệp, xây dựng, giao thông vận tải, dịch vụ, du lịch v.v… nhiều có biến động thời vụ Nguyên nhân gây biến động thời vụ ảnh hưởng điều kiện tự nhiên phong tục, tập quán sinh hoạt Biến động thời vụ làm cho tượng lúc mở rộng, khẩn trương, thu hẹp, nhàn rỗi Nghiên cứu biến động thời vụ nhằm đề biện pháp phù hợp, kịp thời hạn chế ảnh hưởng biến động thời vụ sản xuất sinh hoạt xã hội Phương pháp thường sử dụng để biểu biến động thời vụ tính số thời vụ Tài liệu sử dụng để tính số thời vụ thường tài liệu hàng tháng hàng quý ba đến năm năm Công thức tính số thời vụ: yi ⋅ 100 y0 m y ij ∑ ˆ ij j =1 y Trường hợp dãy số có xu thế: I i = ⋅ 100 n Trường hợp dãy số ổn định: I i = Yij mức độ tháng (quý) thứ i năm j (i = 1,n ; j = 1,m) Thí dụ : Có tài liệu doanh thu (đơn vị tính: tỷ đông) hàng quý năm năm doanh nghiệp sau : Quý Năm I II III IV 2000 14,85 16,22 16,62 18,86 2001 16,06 17,01 17,53 19,92 2002 17,04 18,22 18,50 20,85 2003 18,03 19,30 19,66 22,18 2004 18,85 19,97 20,20 22,86 Từ tài liệu trên, ta tính : - Doanh thu bình quân quý : Quý I : y I = 14,85 + 16,06 + 17,04 + 18,03 + 18,85 = 16,966 tỷ đồng QuýII : y II = 16,22 + 17,01 + 18,22 + 19,30 + 19,97 = 18,144 tỷ đồng THỐNG KÊ TRONG KINH DOANH Chương – Phân tích dãy số thời gian 186 QuýIII : y III = 16,62 + 17,53 + 18,50 + 19,66 + 20,20 = 18,502 tỷ đồng QuýIV : y IV = 18,86 + 19,92 + 20,85 + 22,18 + 22,86 = 20,934 tỷ đồng - Doanh thu bình quân quý tính chung cho năm năm : y0 = 16,966 + 18,144 + 18,502 + 20,934 = 18,6365 tỷ đồng Chỉ số thời vụ biểu lần % Nếu I Þ < (hoặc 100%) biến động tượng thời gian i giảm, ngược lại, I Þ > (hoặc 100%) biến động tượng thời gian i tăng II = 16,966 = 0,9104 hay 91,04% 18,6365 I II = 18,144 = 0,9736 hay 97,36% 18,6365 I III = 18,502 = 0,9928 hay 99,28% 18,6365 I IV = 20,934 = 1,1233 hay 112,33% 18,6365 Như vậy, doanh thu giảm mạnh quý I, đến quý II , quý III tăng lên quý IV 3.3 Thành phần ngẫu nhiên Biến động không theo tính hệ thống, mang tính ngẫu nhiên, không dự đoán trước không mang tính lặp lại Mô hình tổng hợp nhân tố (không kể thành phần chu kỳ) + Số liệu theo năm: Dạng nhân: Yi = Ti.εt Dạng cộng: Yi = Ti + εt + Số liệu theo tháng (quý) Dạng nhân: Yi = Ti.Si.εt Dạng cộng: Yi = Ti + Si + εt Dạng kết hợp: Yi = Ti.Si + εt THỐNG KÊ TRONG KINH DOANH Chương – Phân tích dãy số thời gian 187 Dự đoán dựa vào dãy số thời gian Nói chung sở dãy số thời gian, số phương pháp dự đoán ngắn hạn, đơn giản thường dùng thống kê gồm : - Trường hợp dãy số xu thế: phương pháp bình quân trượt, san mũ - Trường hợp dãy số có xu thế: dự đoán dựa lượng tăng (giảm) tuyệt đối bình quân, tốc độ phát triển bình quân ngoại suy hàm xu - Trường hợp dãy số có thành phần xu thời vụ 4.1 Các phương pháp dự đoán trường hợp dãy số có xu 4.1.1 Dự đoán dựa vào lượng tăng (giảm) tuyệt đối bình quân: + Điều kiện vận dụng: dãy số có lượng tăng giảm tuyệt đối liên hoàn xấp xỉ + Mô hình dự đoán có dạng : Yˆ = Yn + δ L Trong : L thời hạn dự đoán 4.1.2 Dự đoán dựa vào tốc độ phát triển bình quân + Điều kiện vận dụng: dãy số có tốc độ phát triển liên hoàn xấp xỉ + Mô hình dự đoán ˆ = Yn × (t )L Y 4.1.3 Dự đoán ngoại suy hàm xu Mô hình dự đoán: ˆ ≤ yˆ n + L + t α / ,( n − ) S p yˆ n + L − t α / ,( n − ) S p ≤ Y 3(n + 2L − 1) Trong đó: S p = S yt + + n n(n − 1) Syt Là sai số mô hình, chẳng hạn mô hình tuyến tính thì: Σy − b Σy − b1Σty Σ( y i − yˆ i ) S yt = = n−2 n−2 Nguyên tắc lựa chọn mô hình để dự đoán: Chọn mô hình đơn giản, có sai số nhỏ THỐNG KÊ TRONG KINH DOANH Chương – Phân tích dãy số thời gian 188 THỐNG KÊ TRONG KINH DOANH Chương – Phân tích dãy số thời gian 189 BÀI TẬP 8.1 Các ưu điểm nhược điểm phân tích xu thế? Trong trường hợp bạn nên sử dụng phương pháp dự báo này? 8.2 Dữ liệu sau thị phần bình quân quý I năm từ 2000-2007 hãng xe ô tô Nhật Bản thị trường ô tô: 25, 27.5, 27, 25.5, 26.4, 27.3, 28.2, 30.1 Hãy thực phân thích xu để dự báo giá trị năm tiếp sau 8.3 Dữ liệu sau số độc giả tờ báo địa phương (nghìn người): Năm: 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 Số độc giả: 53 65 74 85 92 105 120 128 144 158 179 195 Hãy thực hàm xu cho liệu trên, dự báo tổng số độc giả năm 2008 2009 với độ tin cậy 95% 8.4 Liệu phương pháp phân tích xu có phải công cụ dự báo hữu ích doanh số bán áo bơi hay không? Giải thích? 8.5 Lợi nhuận doanh nghiệp thay đổi theo chu kì kinh doanh vài năm Liệu phương pháp phân tích xu có phải công cụ dự báo hữu ích lợi nhuận doanh nghiệp hay không? Giải thích? 8.6 Hãy giải thích khác hai khái niệm thay đổi theo thời vụ thay đổi theo chu kì? 8.7 Sau số Dow Jones hàng tháng giá hàng hoá tiêu dùng từ 6/2006 đến 6/2007: 142, 137, 143, 142, 149, 143, 151, 150, 151, 146, 144, 145, 147 Hãy xây dựng mô hình san mũ, sử dụng w = 0.6, dự báo số hàng hoá tiêu dùng vào tháng 7/2007 Thử nghiệm với giá trị khác w 8.8 Sau số sản lượng sản xuất công nghiệp Nigeria năm 1994-2007 Năm Chỉ số 175 1994 190 1995 132 1996 96 1997 100 1998 78 1999 131 2000 135 2001 154 2002 163 2003 THỐNG KÊ TRONG KINH DOANH Chương – Phân tích dãy số thời gian 190 2004 178 2005 170 2006 145 2007 133 a Năm gốc sử dụng năm nào? b Hãy thay đổi năm gốc năm 2003 c Điều xảy sản lượng công nghiệp Nigeria từ năm 2006-2007 d Mô tả xu hướng sản lượng công nghiệp từ năm 1994-2007 8.9 Có tài liệu số khách du lịch quốc tế đơn vị kinh doanh du lịch sau: Năm 2000 2001 2002 2003 2004 2005 462 493 516 490 482 580 481 510 522 536 566 602 470 502 547 503 550 614 458 431 526 516 542 608 393 473 498 490 560 585 355 402 455 422 414 573 314 337 413 440 383 507 286 306 380 410 372 466 370 280 310 366 351 377 10 358 314 292 372 344 370 11 430 460 363 241 303 299 12 471 490 470 388 460 310 Tháng Yêu cầu: - Tính số thời vụ cho nhận xét - Xác định hàm xu biểu biến động lượng khách du lịch qua năm - Dự đoán số lượng khách du lịch cho năm theo tháng THỐNG KÊ TRONG KINH DOANH Chương – Phân tích dãy số thời gian 191