Bài giảng Ứng dụng công cụ phân tích dữ liệu: Phần 2

79 22 0
Bài giảng Ứng dụng công cụ phân tích dữ liệu: Phần 2

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Nối tiếp phần 1, Bài giảng Ứng dụng công cụ phân tích dữ liệu: Phần 2 tiếp tục cung cấp cho học viên những kiến thức về kiểm định giả thuyết thống kê với công cụ phân tích dữ liệu, ước lượng và khoảng tin cậy, kiểm định giả thuyết; các công cụ phân tích dữ liệu cho mô hình thông kê, dự báo; phân tích hồi quy và tương quan; mô hình dự báo;... Mời các bạn cùng tham khảo!

HỌC VIỆN CƠNG NGHỆ BƯU CHÍNH VIỄN THƠNG  KHOA MARKETING BÀI GIẢNG ỨNG DỤNG CƠNG CỤ PHÂN TÍCH DỮ LIỆU NGUYỄN NGỌC ANH HàNội 2017 Chương 3: Kiểm định giả thuyết thống kê với cơng cụ phân tích liệu Bạn ước lượng tham số quần thể cách sử dụng điểm ước lượng khoảng ước lượng Điểm ước lượng giá trị thống kê mẫu đơn, chẳng hạn trung bình mẫu Khoảng tin cậy dãy số, gọi khoảng, xây dựng quanh điểm ước lượng Khoảng tin cậy xây dựng cho xác suất khoảng thời gian bao gồm tham số quần thể biết đến Trong phần này, xem cách xây dựng khoảng tin cậy cho trung bình quần thể tỷ lệ quần thể 3.1 Ước lượng khoảng tin cậy 3.1.1 Điểm ước lượng Điểm ước lượng thực giá trị thống kê mẫu coi giá trị tham số quần thể Điểm ước lượng thước đo không đáng tin cậy tham số quần thể xác suất xác giá trị thật cực nhỏ (gần khơng) Ngồi ra, khơng có dấu hiệu cho biết thống kê mẫu đơn gần so với số quần thể (nghĩa khơng có dấu hiệu lỗi lấy mẫu) Do mẫu trung bình, , sử dụng ước tính điểm quần thể trung bình nó, μ, mẫu tỷ lệ, p, sử dụng để đại diện cho giá trị quần thể tỷ lệ nó, π Đây hai ví dụ:  Một điều tra siêu thị với 75 mẫu mua sắm ngẫu nhiên cho thấy thời gian mua sắm trung bình khách hàng 28,4 phút ( = 28,4), ước tính thời gian mua sắm trung bình thực tế người mua sắm siêu thị 28,4 phút (μ = 28,4)  Giả sử 55 số 350 người uống cà phê (15,7%) vấn ngẫu nhiên thích cà phê khơng có caffeine Sau đó, ước lượng điểm tỷ lệ thực tế (%) tất người uống cà phê thích cà phê khơng caffeine giả định 0,157 (π = 0,157 15,7%) Khoảng ước lượng dải giá trị xác định xung quanh mẫu thống kê Tham số quần thể dự kiến nằm khoảng với mức độ tin cậy xác định (hoặc xác suất) Do đó, gọi khoảng tin cậy Khoảng tin cậy xây dựng với số trung bình quần thể đơn, μ, tỷ lệ quần thể nhất, π, sử dụng số liệu thống kê mẫu tương ứng, , p Giả sử sinh viên đo nhiệt độ sôi chất lỏng quan sát số đo (bằng độ Celsius) 102.5, 101.7, 103.1, 100.9, 100.5 102.2 mẫu khác chất lỏng Anh ta tính trung bình mẫu 101,82 Nếu biết độ lệch chuẩn cho trình 1,2 độ, khoảng tin cậy cho quần thể mức độ tin cậy 95% bao nhiêu? Nói cách khác, sinh viên ước tính nhiệt độ sơi thực trung bình chất lỏng cách sử dụng kết đo Nếu phép đo theo phân bố chuẩn, trung bình mẫu có phân bố N( sqrt (6) = 0,49 , ) Do cỡ mẫu 6, nên độ lệch chuẩn mẫu trung bình 1,2/ 55 | P a g e 3.1.2 Khoảng tin cậy cho số trung bình Khoảng tin cậy trung bình  Sử dụng tính tốn phân bố chuẩn để tìm giá trị z để việc sử dụng cho khoảng tin cậy  Tính khoảng tin cậy trung bình σ biết  Tính khoảng tin cậy trung bình ước lượng σ Khi bạn tính khoảng tin cậy trung bình, bạn tính trung bình mẫu để ước tính trung bình quần thể Rõ ràng, bạn biết ý nghĩa quần thể, không cần khoảng tin cậy Trong số trường hợp, bạn muốn có mức độ tin cậy cao việc đưa trung bình quần thể vào khoảng (99%) Trong trường hợp khác, bạn chấp nhận tin cậy (chẳng hạn 90%) ước tính xác mức độ trung bình quần thể Nói chung, mức độ tin cậy biểu trưng , tỷ lệ đoạn phân bố nằm khoảng tin cậy Tỷ lệ phần phân bố 2, tỷ lệ phần phân bố Bạn sử dụng phương trình (8.1) để xây dựng zzz, ước tính khoảng tin cậy cho trung bình với biết đến Với giá trị tương ứng với xác suất từ phân bố chuẩn (tức diện tích tích lũy từ 1- 2) Giá trị cần thiết để xây dựng khoảng tin cậy gọi giá trị quan trọng cho việc phân phối Độ tin cậy 95% tương ứng với giá trị 0,05 Giá trị Z giới hạn tương ứng với diện tích tích lũy 0,975 1,96 có 0,025 phần phân bố, diện tích tích lũy nhỏ Z = 1,96 0,975 Để biết giá trị Z giới hạn cho độ tin cậy, bạn trang bảng thống kê để biết Ví dụ : Với độ tin cậy 99% giá trị Z giới hạn 0,005 2.58 Ví dụ : Nhà sản xuất giấy có quy trình sản xuất hoạt động liên tục suốt trình chuyển đổi sản xuất Giấy dự kiến có chiều dài trung bình 11 inch, độ lệch tiêu chuẩn chiều dài 0,02 inch Trong khoảng thời gian định kỳ, mẫu chọn để xác 56 | P a g e định xem chiều dài giấy trung bình cịn 11 inch hay sai quy trình sản xuất để thay đổi chiều dài giấy sản xuất Bạn chọn mẫu ngẫu nhiên 100 tờ, chiều dài giấy trung bình 10.998 inch Xây dựng ước tính khoảng tin cậy 95% trung bình quần thể chiều dài giấy Ta sử dụng công thức với độ tin cậy 95% giá trị Z giới hạn 1.96, ta có : Như vậy, với độ tin cậy 95%, bạn kết luận trung bình quần thể 10.9941 11.0019 inch Bởi khoảng bao gồm 11, giá trị trình sản xuất hoạt động đúng, bạn khơng có lý để tin có điều sai trái với trình sản xuất Trong phần trước, ta biết hầu hết tình kinh doanh, bạn khơng biết , độ lệch tiêu chuẩn quần thể Phần thảo luận phương pháp xây dựng ước tính khoảng tin cậy μ sử dụng thống kê mẫu S ước tính tham số quần thể Vào đầu kỷ XX, William S Gosset làm việc Guinness Ireland, cố gắng giúp sản xuất bia tốt tốn Vì ơng có mẫu nhỏ để nghiên cứu, cần phải tìm cách để suy luận mean mà không cần phải biết Viết tên "Student", Gosset giải vấn đề cách phát triển mà ngày gọi Sự phân bố t Student, phân bố t Nếu biến ngẫu nhiên X phân bố chuẩn thống kê sau đây: Vậy ước tính khoảng tin cậy cho trung bình với phương trình sau : Để biết giá trị khơng biết đến tính theo ta xem bảng 3.1.2A để biết : 57 | P a g e Bảng 3.1.2A Như ta biết độ tin cậy 95% ta có diện tích tích lũy (Cummalative Prob) 0.975 Ví dụ : Mục tiêu kinh doanh bạn ước tính số trung bình $ Sau đó, bạn thu thập liệu cách chọn mẫu 100 hóa đơn bán hàng từ số lượng hóa đơn bán hàng tháng Một bạn thu thập liệu, bạn xếp liệu bảng tính Bạn xây dựng đồ thị khác để hình dung tốt phân bố số tiền la Để phân tích liệu, bạn tính trung bình mẫu 100 hố đơn bán hàng 110,27 đô la độ lệch tiêu chuẩn mẫu 28,95 đô la Với độ tin cậy 95%, giá trị quan trọng phân bố t (như hình trên) 1,9842 với bậc tự n -1 = 100 – = 99 Ta có kết sau : Do đó, với độ tin cậy 95%, bạn kết luận số tiền trung bình tất hóa đơn bán hàng từ 104,53 USD đến 116,01 USD Mức độ tin cậy 95% cho thấy bạn chọn tất mẫu 100, 95% khoảng phát triển bao gồm quần thể có nghĩa nơi khoảng Hiệu lực ước tính khoảng tin cậy phụ thuộc vào giả định tính chuẩn cho việc phân phối số lượng hoá đơn bán hàng Với mẫu 100, giả thiết bình thường khơng hạn chế, việc sử dụng phân phối t thích hợp Ví dụ : Giả sử bạn muốn ước tính, với độ tin cậy 95% quần thể có nghĩa thời gian xử lý đơn nộp +/-5 ngày Trên sở nghiên cứu tiến hành trước đó, bạn tin độ lệch tiêu chuẩn 25 ngày Xác định cỡ mẫu cần thiết với e = 5, s = 25, độ tin cậy 95% = 1,96 với 58 | P a g e Vì vậy, bạn nên chọn mẫu gồm 151 đơn nộp quy tắc chung để xác định kích thước mẫu ln ln trịn trị giá trị số nguyên để chuẩn mong muốn Lỗi lấy mẫu thực tế lớn có kết độ lệch tiêu chuẩn mẫu tính mẫu 151 lớn 25 nhỏ chút độ lệch tiêu chuẩn mẫu nhỏ 25 3.1.3 Khoảng tin cậy cho tỷ lệ Khái niệm khoảng tin cậy áp dụng cho liệu phân loại Với liệu phân loại, bạn muốn ước tính tỷ lệ mặt hàng quần thể có đặc điểm quan tâm định Tỷ lệ quần thể thể chữ Hy Lạp π Ước tính điểm π tỷ lệ mẫu, p = X / n, n kích cỡ mẫu X số mục mẫu có đặc điểm quan tâm Đây phương trình sau xác định ước tính khoảng tin cậy cho tỷ lệ quần thể   p = tỷ lệ mẫu = X / n = (Số hạng mục có đặc tính) / (cỡ mẫu) π = tỷ lệ quần thể    = giá trị giới hạn từ phân bố chuẩn n = cỡ mẫu Lưu ý: Để sử dụng phương trình cho khoảng tin cậy, kích thước mẫu n phải đủ lớn để đảm bảo X n - X lớn Ví dụ : Người điều hành tờ báo lớn muốn ước tính tỷ lệ tờ báo in có phù hợp khơng Sử dụng bước DCOVA, ơng xác định biến quan tâm thể tờ báo có nhiều vết rạch, thiết lập trang không cách, thiếu trang trùng lặp trang Ông thu thập liệu cách chọn mẫu ngẫu nhiên n = 200 tờ báo từ tất tờ báo in ngày Ông tổ chức kết bảng tính cho thấy 35 tờ báo thuộc loại khơng phù hợp Để phân tích liệu, bạn cần phải xây dựng giải thích ước tính khoảng tin cậy 90% cho tỷ lệ báo in ngày có thuộc tính khơng phù hợp Ta có với độ tin cậy 90% ta có 59 | P a g e Ông kết luận với tự tin 90% tỷ lệ quần thể tất tờ báo in ngày hơm với khơng phù hợp khoảng 0.1308 0.2192 Điều có nghĩa 13,08% 21,92% số tờ báo in vào ngày hơm có kiểu khơng phù hợp Ví dụ : Bạn muốn có 90% tin cậy ước tính tỷ lệ nhân viên văn phịng trả lời email vòng tới khoảng +/-0,05 Bởi trước bạn chưa thực nghiên cứu nên khơng có thơng tin có sẵn từ liệu khứ Xác định kích thước mẫu cần thiết khơng có thơng tin có sẵn từ liệu khứ, giả sử p = 0.50, e = 0.05, p = 0.50, = 1.645 cho 90% độ tin cậy, ta có : Do đó, bạn cần mẫu 271 nhân viên văn phịng để ước tính tỷ lệ quần thể khoảng +/- 0,05 với 90% tự tin Lưu ý kích thước quần thể khơng vào cách tính kích thước mẫu Ngoại trừ điểm nhỏ thảo luận, khơng ảnh hưởng trực tiếp đến kích thước mẫu Tại ước lượng giá trị trung bình, tất phần tử dân số có giá trị đặc điểm, mẫu n = tất cần thiết để xác định mức trung bình, có 1.000, 10.000 100.000 phần tử quần thể Những điều ảnh hưởng đến kích thước mẫu thay đổi quần thể, có nhiều biến đổi đặc tính mẫu cần nhiều để ước lượng với mức độ xác định Điều nhìn thấy cơng thức để xác định kích thước mẫu, n = Do đó, quy mơ quần thể ảnh hưởng đến cỡ mẫu gián tiếp thơng qua ảnh hưởng thay đổi: quần thể lớn khả biến thể đặc tính lớn Sự sửa đổi nhỏ mà ám đến trước điều chỉnh quần thể hữu hạn Khi mẫu đại diện cho phần lớn phần lớn, giả định tính độc lập phần tử mẫu khơng cịn bảo đảm phải thay đổi cơng thức cho phù hợp Công thức cho lỗi tiêu chuẩn trung bình, , điều chỉnh để 60 | P a g e yếu tố mẫu độc lập với nhau, với kịch có kích thước mẫu lớn so với quần thể Yếu tố (N-n) / (N-1) điều chỉnh dân số hữu hạn thực ước tính mẫu ước tính chiếm 5% quần thể Cơng thức kích thước mẫu khơng thể sử dụng cho mẫu phi xác xuất Xác định cỡ mẫu cho mẫu phi xác xuất thường đánh giá trực quan nhà nghiên cứu dựa nghiên cứu trước đây, tiêu chuẩn ngành số lượng nguồn có sẵn Khơng ý tới phương pháp này, kết lấy mẫu sử dụng để đưa thống kê suy luận tham số quần thể thật Các nhà nghiên cứu so sánh đặc tính cụ thể mẫu, chẳng hạn tuổi, thu nhập, giáo dục, lưu ý mẫu giống với quần thể Nhưng tốt cung cấp mơ tả mẫu khám phá Cũng nói thêm, nêu vài cách để xác định cỡ mẫu, khóa học chuyên sâu nghiên cứu Marketing, nghiên cứu thị trường… học thực hành kỹ 3.2 Kiểm định giả thuyết Thử nghiệm giả thuyết bắt đầu với lý thuyết, tuyên bố, khẳng định tham số đặc biệt quần thể Ví dụ, giả thuyết ban đầu bạn ví dụ ngũ cốc q trình hoạt động bình thường, vậy, độ đầy trung bình 368 gram không cần hành động khắc phục Giả thuyết tham số quần thể với đặc tả gọi giả thuyết không Một giả thuyết null thường trạng xác định biểu tượng H0 Ở đây, giả thuyết không hợp lệ trình làm đầy hoạt động tốt, việc bổ sung trung bình đặc điểm kỹ thuật 368 gram cung cấp tổ chức Oxford Cereals điều ghi : Mặc dù thơng tin có sẵn từ mẫu, giả thuyết khơng nêu thơng số quần bạn tập trung vào quần thể tất hộp ngũ cốc Bạn sử dụng thống kê mẫu để đưa suy luận tồn q trình làm đầy Một suy luận kết quan sát từ liệu mẫu cho thấy giả thuyết không sai Nếu giả thuyết không coi giả, phải Bất giả thuyết không xác định, giả thuyết nghịch định, phải giả thuyết khơng có giá trị giả giả thuyết nghịch, H1, ngược lại giả thuyết không, H0 điều nêu ví dụ ngũ cốc : Giả thuyết nghịch cho kết luận cách từ chối giả thuyết không Giả thuyết không hợp lệ bị từ chối có đủ chứng từ liệu mẫu giả thuyết không hợp lệ sai Trong ví dụ ngũ cốc, trọng lượng hộp lấy mẫu mức trung bình 368 gram quy định tổ chức Oxford Cereals, bạn từ chối giả thuyết không chấp nhận giả thuyết nghịch trọng lượng trung bình khác với 368 gram Bạn ngừng sản xuất thực hành động cần thiết để khắc phục cố Nếu giả thuyết không 61 | P a g e không bị từ chối, bạn nên tiếp tục tin q trình hoạt động xác khơng cần hành động khắc phục Trong trường hợp thứ hai này, bạn không chứng minh quy trình hoạt động xác Thay vào đó, bạn thất bại việc chứng minh hoạt động khơng xác, bạn tiếp tục niềm tin bạn (mặc dù không chứng minh) giả thuyết không Trong kiểm định giả thuyết, bạn từ chối giả thuyết khơng có giá trị chứng mẫu cho thấy có nhiều khả giả thuyết nghịch Tuy nhiên, không bác bỏ giả thuyết không chứng cho thấy điều Bạn khơng chứng minh giả thuyết khơng định dựa thơng tin mẫu khơng phải tồn quần thể Do đó, bạn không từ chối giả thuyết không, bạn kết luận khơng có đủ chứng để bảo đảm từ chối Những điểm sau tóm tắt giả thuyết khơng hợp lệ thay thế:  Giả thuyết không, H0, đại diện cho niềm tin tình  Giả thuyết nghịch, H1, ngược lại với giả thuyết không đại diện cho yêu cầu nghiên cứu suy luận cụ thể mà bạn muốn chứng minh  Nếu bạn từ chối giả thuyết không, bạn có chứng thống kê giả thuyết nghịch xác  Nếu bạn khơng từ chối giả thuyết không, bạn không chứng minh giả thuyết nghịch Sự thất bại để chứng minh giả thuyết nghịch, nhiên, khơng có nghĩa bạn chứng minh giả thuyết không  Giả thuyết không, H0, đề cập đến giá trị quy định tham số quần thể   (chẳng hạn μ), thống kê mẫu (chẳng hạn ) Câu tuyên bố giả thuyết không luôn chứa dấu phép tính so sánh liên quan đến giá trị định tham số quần thể (ví dụ, H0: μ = 368 gram) Câu phát biểu giả thuyết nghịch không chứa dấu giá trị quy định tham số quần thể (ví dụ, H1: μ ≠ 368 gram) Để kiểm tra yêu cầu mặt thống kê, liệu mẫu thu thập phân tích Trên sở mẫu phát hiện, giá trị giả thuyết (hoặc tuyên bố) tham số quần thể chấp nhận bị từ chối sai Q trình thống kê để kiểm định tính hợp lệ yêu cầu giá trị thật tham số quần thể gọi thử nghiệm giả thuyết  Các tuyên bố sau tuyên bố minh họa tham số quần thể cụ thể  Một công ty đầu tư tuyên bố lợi tức trung bình họ tất khoản đầu tư 14%  Một nhà sản xuất xà phịng nói bốn hộ gia đình VN sử dụng sản phẩm họ  Một nhà sản xuất lốp tin tuổi thọ lốp xe trung bình 750 000 km  Một kiểm toán viên thuế tin 15% tất tờ khai thuế tất công ty hồn thành khơng xác  Một nhà kinh tế học cho khơng có khác biệt mức lương khởi điểm trung bình kỹ sư xây dựng kỹ sư điện  Người quản lý nhà máy sản xuất ống xylanh tin trung bình sản lượng cơng nhân cao ca làm việc ban ngày so với ca làm việc ban đêm Thí nghiệm giả thuyết tiến hành bốn tham số quần thể sau đây, tất thước đo vị trí trung tâm:  Quần thể trung bình đơn, μ  Tỷ lệ quần thể đơn lẻ, π 62 | P a g e   Sự khác biệt hai quần thể trung bình, μ1 - μ2 Sự khác biệt hai tỷ lệ quần thể, π1 - π2 Thử nghiệm giả thuyết trình kiểm tra ”mức độ gần nhất” mẫu thống kê giá trị tham số quần thể giả định để định chấp nhận từ chối yêu cầu xác định Số liệu thống kê mẫu gần với giá trị xác nhận, giá trị giả thuyết Tương tự, số liệu mẫu thống kê mà xa so giá trị xác nhận, giá trị giả thuyết sai      Quá trình chuẩn hóa theo thủ tục năm bước, sau: Xác định giả thuyết thống kê (các giả thuyết không giả thuyết nghịch) Xác định vùng chấp nhận giả thuyết khơng Tính mẫu thống kê thử nghiệm So sánh mẫu thống kê thử nghiệm với vùng chấp nhận Rút kết luận thống kê quản lý Thử nghiệm giả thuyết bắt đầu với giá trị giả định cho tham số quần thể định Nó bắt nguồn từ câu hỏi quản lý yêu sách Hai giả thuyết thống kê xây dựng dựa giá trị tham số quần thể giả định Giả thuyết thống kê gọi giả thuyết không, viết H0 Giả thuyết khẳng định giá trị thông số quần thể thực bằng/tương đương với giá trị giả thuyết Nó thường đại diện cho nguyên trạng Giả thuyết thứ hai gọi giả thuyết nghịch, viết H1 Giả thuyết ngược với giả thuyết khơng Nó nói giá trị tham số quần thể thật khác với giá trị giả thuyết không Việc xây dựng giả thuyết không nghịch phụ thuộc vào cách câu hỏi quản lý/yêu sách nêu thể ba cách khác Thử nghiệm giả thuyết hai mặt Khi yêu sách (hoặc câu hỏi quản lý) cho biết tham số quần thể giá trị cụ thể, giả thuyết xây dựng kiểm tra hai mặt  H0: tham số quần thể = giá trị định  H1: tham số quần thể ≠ giá trị xác định Ví dụ: người quản lý hỏi xem liệu sản lượng trung bình nhân viên xác 46 giờ, giả thuyết khơng giả thuyết nghịch thể sau:  H0: μ = 46 Đây câu hỏi quản lý  H1: μ ≠ 46 Giả thuyết không bị từ chối ủng hộ giả thuyết nghịch chứng mẫu giá trị thông số quần thể thực thấp đáng kể lớn giá trị giả thuyết không quần thể Giả thiết phải ln chứa dấu (ví dụ H0: μ = 46) Trong trường hợp này, câu hỏi quản lý nằm H0 Thử nghiệm giả thuyết phía – Khi yêu sách (hoặc câu hỏi quản lý) cho biết thông số quần thể lớn giá trị định giả thuyết xây dựng kiểm tra phía  H0: tham số quần thể ≤ giá trị xác định  H1: tham số quần thể > giá trị quy định 63 | P a g e Hình 4.2.2A Biểu đồ dịng liệu doanh thu hàng q cho Cơng ty Giày Monsoon Xác định trực quan mơ hình xảy theo thời gian Hình 4.2.2B Biểu đồ đường rõ ràng cho thấy mơ hình diễn thường xun theo thời gian, với doanh số bán hàng đạt đỉnh điểm quý thứ ba (tháng đến tháng 9) chạm đáy quý (từ tháng đến tháng 3) năm Cũng có mức tăng trung bình đặn chuỗi Các thành phần chuỗi thời gian Phân tích chuỗi thời gian giả định giá trị liệu biến số chuỗi thời gian xác định bốn lực môi trường hoạt động riêng lẻ tập hợp theo thời gian Đó là:   xu hướng (T) chu kỳ (C) 118 | P a g e   tính mùa vụ (S) ảnh hưởng bất thường (ngẫu nhiên) (I) Phân tích chuỗi thời gian cố gắng để cô lập thành phần định lượng theo thống kê Quá trình gọi phân hủy chuỗi thời gian Sau xác định định lượng, thành phần kết hợp sử dụng để ước lượng giá trị tương lai biến chuỗi thời gian Trend (T): định nghĩa chuyển động dài hạn chuỗi thời gian Nó đo lường hiệu mà yếu tố dài hạn có chuỗi Những yếu tố dài hạn có khuynh hướng hoạt động chậm theo hướng thời gian đáng kể Do đó, thành phần xu hướng thường mơ tả đường cong liên tục, liên tục đường thẳng, minh họa hình Hình 4.2.2C Một số nguyên nhân quan trọng xu hướng dài hạn loạt thời gian bao gồm: tăng dân số, thị hố, cải tiến cơng nghệ, tiến kinh tế phát triển, thay đổi người tiêu dùng thói quen thái độ Các kỹ thuật thống kê phân tích xu hướng sử dụng để cô lập phong trào dài hạn tiềm ẩn Chu kỳ (C): độ lệch trung bình dài hạn so với xu hướng Chúng phản ánh giai đoạn xen kẽ việc mở rộng tương đối co lại hoạt động kinh tế Chu kỳ chuyển động giống sóng chuỗi thời gian, khác nhiều thời gian biên độ, minh họa hình Do đó, mơ hình chu kỳ lịch sử đo, mơ hình q khứ sử dụng dự báo mơ hình chu kỳ tương lai 119 | P a g e Hình 4.2.2D Nguyên nhân chu kỳ khó xác định giải thích tác động chúng chuỗi thời gian kích thích làm giảm mức độ hoạt động Nói chung, chu kỳ 'khối lượng tâm lý lớn' Một số hành động quan phủ (ví dụ thay đổi sách tài khóa, tiền tệ, chế tài), nghiệp đồn, tổ chức giới định chế tài gây mức độ bi quan lạc quan cường độ thời gian khác vào kinh tế (ví dụ khủng hoảng tài giới năm 2008) Số số sử dụng để mô tả định lượng chu kỳ dao động Tuy nhiên, tính hữu dụng chúng cơng cụ dự báo hạn chế chúng khơng thể dự đốn điểm ngoặt chu kỳ Tính thời vụ (S): Các biến thể theo mùa biến động chuỗi thời gian lặp lại khoảng thời gian đặn năm (ví dụ: hàng ngày, hàng tuần, hàng tháng, hàng quý) Những biến động có xu hướng xảy với mức độ thường xun cao dễ dàng lập thơng qua phân tích thống kê Hình mơ tả tính chất thường xuyên biến thể theo mùa 120 | P a g e Hình 4.2.2E Sự biến đổi theo mùa ảnh hưởng đến môi trường định kỳ, chẳng hạn điều kiện khí hậu (mùa) kiện định kỳ đặc biệt (ví dụ lễ hội hàng năm, ngày lễ tôn giáo, công cộng nghỉ học) Số mục, gọi số theo mùa, sử dụng để đo lường biến động theo mùa thường xuyên Những số theo mùa này, không giống số sử dụng để định lượng chu kỳ, hữu ích để chuẩn bị dự báo ngắn hạn trung hạn liệu chuỗi thời gian Ảnh hưởng ngẫu nhiên (Biến động không đều) (I): Sự biến động bất thường chuỗi thời gian cho kiện khơng thể đốn trước Ngun nhân chủ yếu kiện không lường trước thiên tai (lũ lụt, hạn hán, hoả hoạn) thiên tai người gây (ví dụ đình công, tẩy chay, tai nạn, hành động bạo lực (chiến tranh, bạo loạn)) Vì lần xuất hồn tồn khơng thể đốn trước khơng theo mẫu cụ thể nào, chúng khai thác thông qua phân tích thống kê kết hợp với dự báo thống kê Hành vi bất thường chuỗi thời gian minh họa hình Hình 4.2.2F Sự phân tích chuỗi thời gian: Phân tích chuỗi thời gian nhằm cô lập ảnh hưởng thành phần chuỗi thời gian thực tế Mơ hình chuỗi thời gian sử dụng làm sở để phân tích ảnh hưởng bốn thành phần giả định mối quan hệ nhân chúng Mơ hình chuỗi thời gian nhân xác định đại số sau: Phân tích xu hướng Xu hướng dài hạn chuỗi thời gian lập cách loại bỏ biến trung hạn ngắn hạn (chu kỳ, theo mùa ngẫu nhiên) chuỗi Điều dẫn đến đường cong nhẵn đường thẳng, tùy thuộc vào phương pháp chọn Có thể sử dụng hai phương pháp để lập xu hướng: 121 | P a g e   phân tích hồi quy, dẫn đến xu hướng thẳng phương pháp trung bình động, tạo đường cong trơn Trendline - Sử dụng phân tích hồi quy Một đường xu hướng cô lập thành phần xu hướng (T) Nó cho thấy hướng chung (lên, xuống, liên tục) hàng loạt di chuyển Vì vậy, đại diện tốt đường thẳng Phương pháp bình phương tối thiểu từ phân tích hồi quy (ở phần trên) sử dụng để tìm đường xu hướng phù hợp với chuỗi thời gian liệu số Biến phụ thuộc, y, chuỗi thời gian thực tế (ví dụ: doanh thu, cố, vắng mặt) biến độc lập, x, thời gian Để sử dụng thời gian biến độc lập phân tích hồi quy, phải mã hố số Có thể sử dụng hệ thống đánh số nào, lựa chọn mã hoá phổ biến tập số tự nhiên (x = 1; 2; 3; 4; 5; ; n, n = số khoảng thời gian chuỗi thời gian) Mỗi khoảng thời gian (x) chuỗi thời gian (y) gán giá trị số nguyên bắt đầu cho khoảng thời gian đầu tiên, cho phần thứ hai, cho phần thứ ba, vv Việc tính tốn đường xu hướng sử dụng hồi quy không xem dựa hồi quy tuyến tính, nói phía trên, nhắc tới phần sách tập với tập cụ thể Ở xem phương pháp thứ 2, phương pháp trung bình động, tạo đường cong trơn Phương pháp trung bình động Một đường trung bình động loại bỏ biến động ngắn hạn chuỗi thời gian cách lấy mức trung bình nhóm quan sát Giá trị thực giá trị thời gian thay mức trung bình quan sát từ khoảng thời gian bao quanh Điều dẫn đến chuỗi thời gian chảy trơi Do đó, kỹ thuật trung bình động di chuyển trượt loạt thời gian cách loại bỏ biến động ngắn hạn Số lượng quan sát, k, tổng hợp tính trung bình nhóm, xác định số khoảng thời gian cho trải qua biến động ngắn hạn Để minh họa, giả định loạt chuỗi thời gian lặp lại ba kỳ liên tiếp vịng năm trung bình trượt ba kỳ thích hợp để loại bỏ dao động ngắn hạn, k = Bốn bước sau sử dụng để tính tốn chuỗi ba chuỗi thời gian di chuyển Bước 1: Kết hợp quan sát ba giai đoạn đặt tổng số đối diện khoảng thời gian (trung vị) (khoảng thời gian 2) Bước 2: Lặp lại kết ba quan sát thời gian cách loại bỏ quan sát giai đoạn (nghĩa khoảng thời gian 1) bao gồm việc quan sát giai đoạn (khoảng thời gian 4) Tổng số di chuyển thứ hai (sử dụng khoảng thời gian 2, 4) lại đặt ngược lại khoảng thời gian (trung vị), tức giai đoạn Bước 3: Tiếp tục sản xuất tổng số di chuyển (hoặc chạy) kết thúc chuỗi thời gian Quá trình định vị tổng số di chuyển khoảng thời gian (hoặc trung vị) tổng ba quan sát gọi trung tâm Bước 4: Chuỗi trung bình di chuyển tính cách chia tổng số di chuyển k = (nghĩa số lần quan sát tổng kết nhóm) Bốn bước thủ tục áp dụng thuật ngữ, k, trung bình di chuyển lẻ Việc tính tốn trung bình chuyển động k chí minh họa sau ví dụ sau Ví dụ : Bảng sau cho thấy số lượng yêu cầu bảo hiểm hỏa hoạn nhận công ty bảo hiểm giai đoạn bốn tháng từ năm 2008 đến năm 2011 122 | P a g e Câu hỏi Quản lý: Tính trung bình động ba kỳ số lượng yêu cầu bảo hiểm nhận Giải pháp Bảng phương pháp tiếp cận bốn bước nêu kết trung bình động ba kỳ yêu cầu bảo hiểm hỏa hoạn nhận Hình 4.2.2H Chuỗi trung bình di chuyển đường cong trơn tru, "tháo gỡ" biến động ngắn hạn 123 | P a g e Cũng câu hỏi cho ví dụ trên, ta tính theo chu kỳ Vậy xem xét tính tốn vẽ đồ thị ba năm chu kỳ trung bình cho số lượng yêu cầu bảo hiểm hỏa hoạn So sánh hai chuỗi trung bình động Bảng cho thấy giá trị trung bình trượt ba kỳ năm kỳ yêu cầu bảo hiểm phịng cháy Hình 4.2.2G Hình 14.6 biểu đồ dòng giá trị y ban đầu giá trị trung bình động ba năm chu kỳ chuỗi thời gian nhận yêu cầu bảo hiểm phịng cháy Nó làm bật ảnh hưởng thuật ngữ khác (k = k = 5) trình làm mịn 124 | P a g e Hình 4.2.2J Từ so sánh đồ thị dịng giá trị trung bình động ba thời kỳ năm thời kỳ, thấy có dao động nhỏ (làm trơn lớn hơn) chuỗi trung bình năm thời gian di chuyển so với chuỗi trung bình động ba giai đoạn Thuật ngữ, k, cho trung bình di chuyển ảnh hưởng đến mức độ làm mịn:   Một thuật ngữ ngắn tạo đường cong trung bình di chuyển Một khoảng thời gian dài tạo đường cong trung bình di chuyển nhẹ nhàng Tập trung trung bình động khơng trung bình: Giá trị trung bình động phải vào khoảng thời gian Khi thuật ngữ k (số chu kỳ tính trung bình) lẻ, trung tâm xảy trực tiếp giá trị trung bình di chuyển đặt khoảng thời gian trung vị (giữa) quan sát k Tuy nhiên, trung bình di chuyển tính cho số khoảng thời gian (tức thuật ngữ k chẵn), tổng số chuyển động uncentred (tức nằm hai khoảng thời gian) đặt ngược chiều giá trị tổng kết Điều minh họa tính tốn trung bình bốn giai đoạn (tức k = 4) Bước 1: Tính tổng số di chuyển khơng tăng    Tổng số di chuyển nằm giai đoạn (tức giai đoạn 2.5) Tổng số di chuyển thứ hai nằm giai đoạn (tức giai đoạn 3.5) Tổng số di chuyển thứ ba nằm khoảng 4,5, Bước 2: Trung tâm số di chuyển   Tính tốn chuỗi tổng số di chuyển thứ hai bao gồm cặp số di chuyển không trung tâm Mỗi giá trị di chuyển lần thứ hai hai giá trị di chuyển không trung tâm Điều đặt tổng số di chuyển thứ hai khoảng thời gian thực tế Như vậy, tổng cặp (ở vị trí 2.5 3.5 tương ứng) đặt vị trí đối diện với khoảng thời gian Tổng số cặp di chuyển thứ hai (ở vị trí 3.5 4.5 tương ứng) đặt ngược chiều , tổng cặp thứ ba ngược lại khoảng thời gian 5, v.v 125 | P a g e Bước 3: Tính tốn trung bình trung bình động Một trung tâm di chuyển trung bình tính cách chia di chuyển trung tâm tổng số giá trị × k, k (thậm chí) hạn trung bình di chuyển Trong thực tế, số di chuyển trung tâm bao gồm × k quan sát Trong hình minh họa, với k = 4, giá trị di chuyển trung tâm chia cho × = Ví dụ : Một cửa hàng ghi lại chu kỳ doanh thu hàng quý xe đạp đua cho giai đoạn 2009-2011, trình bày Bảng sau Trung bình động bốn giai đoạn chu kỳ cho doanh số bán hàng quý xe đạp đua cửa hàng bán giai đoạn 2009-2011 Các tính toán kết thể bảng sau Giải thích Trung bình động; Một loạt thời gian di chuyển trung bình chuỗi mượt so với giá trị chuỗi thời gian ban đầu Nó loại bỏ tác động biến động ngắn hạn (tức biến động theo mùa bất thường) từ quan sát ban đầu, y, cách tính trung bình biến động ngắn hạn Giá trị trung bình chuyển động xem phản ánh chủ yếu xu hướng kết hợp chuyển động theo chu kỳ Về biểu tượng cho mô hình cấp nhân: 126 | P a g e Nhược điểm lợi ích trung bình động: Như thấy từ tính tốn trung bình động này, nhược điểm thơng tin (giá trị liệu) hai đầu chuỗi thời gian gốc Khơng thể tìm thấy trung bình trượt cho k/2 kỳ cuối Điều trình trung tâm di chuyển giá trị trung bình Tuy nhiên, khơng phải trở ngại đáng kể chuỗi thời gian dài, chuỗi khoảng 50 thời gian Lợi ích mức trung bình động hội cho người quản lý tập trung rõ ràng vào xu hướng dài hạn chu kỳ loạt thời gian mà không ảnh hưởng đến ảnh hưởng gây nhiễu ngắn hạn Phân tích theo mùa: phân tích theo mùa phân lập ảnh hưởng chuỗi thời gian Phương pháp tỷ số trung bình-động sử dụng để đo lường định lượng ảnh hưởng theo mùa Phương pháp thể ảnh hưởng theo mùa số mục Nó đo độ lệch phần trăm giá trị thực tế chuỗi thời gian, y, từ giá trị loại trừ ảnh hưởng ngắn hạn theo mùa Các giá trị chuỗi thời gian biểu thị xu hướng/ảnh hưởng theo chu kỳ Phương pháp trung bình theo tỷ lệ di chuyển Bước 1: Xác định xu hướng/chuyển động theo chu kỳ Tiếp cận trung bình di chuyển, mơ tả trên, sử dụng để cô lập thành phần chu kỳ/chu kỳ kết hợp chuỗi thời gian Việc chọn thuật ngữ trung bình di chuyển thích hợp, k, xác định số khoảng thời gian kéo dài biến động theo mùa vụ ngắn hạn Trong hầu hết trường hợp, thuật ngữ k tương ứng với số lần quan sát kéo dài năm Hình xác định thuật ngữ thích hợp để sử dụng để loại bỏ biến động theo mùa vụ ngắn hạn liệu chuỗi thời gian xảy hàng năm Chuỗi trung bình di chuyển phản ánh xu hướng kết hợp ảnh hưởng theo chu kỳ, thể thước đo sở chuỗi thời gian Để minh họa, liệu hàng quý đưa ra, trung bình di chuyển bốn giai đoạn cô lập xu hướng/chuyển động theo chu kỳ chuỗi thời gian tạo tập hợp sở giá trị chuỗi thời gian Các bước là: 127 | P a g e    tìm thấy loạt chuyển động bốn giai đoạn tổng số chuỗi tìm thấy trung tâm × bốn giai đoạn di chuyển tổng số chuỗi chia trung tâm × bốn giai đoạn di chuyển tổng số chuỗi để có trung bình bốn giai đoạn chuyển động Bước 2: Tìm tỷ lệ theo mùa Một tỷ lệ theo mùa cho giai đoạn tìm thấy cách chia giá trị chuỗi thời gian thực, y, giá trị trung bình di chuyển tương ứng (giá trị nó) Tỷ lệ theo mùa số đo độ lệch phần trăm y thực tế (bao gồm ảnh hưởng theo mùa) từ giá trị trung bình chuyển động (cơ sở) (biểu thị xu hướng ảnh hưởng theo chu kỳ) Độ lệch so với mức sở (đó xu hướng / ảnh hưởng theo chu kỳ, với số 100) thước đo tác động theo mùa, mức độ thấp hơn, bất thường, vào chuỗi thời gian cho khoảng thời gian Bước 3: Sản xuất số theo mùa Trung bình tỷ lệ theo mùa giai đoạn tương ứng năm để làm phẳng thành phần bất thường vốn có tỷ lệ theo mùa Nói chung, trung vị sử dụng để tìm tỷ lệ trung bình tỷ số theo mùa giai đoạn tương ứng năm Trung bình số học khơng sử dụng bị ảnh hưởng có mặt tỉ số thời kỳ nào, dẫn đến số theo mùa không đại diện Bước 4: Tính số theo mùa điều chỉnh Mỗi số theo mùa có số sở 100 Vì vậy, tổng số trung bình k phải 100 × k Nếu khơng phải vậy, số theo mùa trung bình phải điều chỉnh tới mức 100 Hệ số điều chỉnh xác định sau: Mỗi số theo mùa trung bình nhân với yếu tố điều chỉnh để đảm bảo dựa sở 100 cho số Các số theo mùa điều chỉnh thước đo (trung bình) ảnh hưởng theo mùa dựa giá trị thực tế loạt thời gian cho khoảng thời gian cho trước vòng năm Chúng ta xem xét ví dụ : Tham khảo số liệu doanh số bán nhà hàng quý bảng sau Giám đốc kinh doanh Valley Estates muốn xác định tác động ảnh hưởng theo quý việc bán nhà 128 | P a g e Câu hỏi Quản lý: Tính số theo quý cho liệu doanh thu nhà giải thích kết cho giám đốc bán hàng Valley Estates Quy trình bước để tính số theo mùa thể bảng Kể từ liệu hàng loạt cung cấp (bán nhà) theo quý, kỳ hạn bốn (k = 4) chọn để làm phẳng biến đổi theo mùa bất thường ngắn hạn (bốn khoảng thời gian năm) Bảng sau thể trung bình tỷ lệ theo mùa (bước 3) sử dụng trung vị làm thước đo vị trí trung tâm để lấy số theo mùa trung bình cho quý 129 | P a g e Các số theo mùa trung bình cịn gọi số theo mùa không điều chỉnh Cuối cùng, Bảng sau điều chỉnh số theo mùa trung bình xuống mức sở 100 (Bước 4) Mỗi số theo mùa (đã điều chỉnh) đo lường mức trung bình ảnh hưởng theo mùa giá trị thực chuỗi thời gian khoảng thời gian định năm Bằng cách trừ số sở 100 (thể xu hướng/chu kỳ) từ số theo mùa, mức độ ảnh hưởng lực lượng theo mùa đánh giá Đối với ví dụ trên, cách giải thích sau áp dụng:     Trong quý năm, số theo mùa 79,1 nghĩa là, trung bình, doanh thu nhà Valley Estates bị giảm bị ảnh hưởng theo mùa khoảng 21% Nói cách khác, doanh số bán nhà cao khoảng 26% (21/79 x 100) ảnh hưởng theo mùa khơng có mặt Giải thích quý tương tự quý 1, số theo mùa 100, cụ thể 84,8 Trong quý năm, số theo mùa 135,2 nghĩa là, trung bình, doanh thu Valley Estates kích thích có mặt ảnh hưởng theo mùa mức khoảng 35% Nói cách khác, doanh số bán nhà thấp 35% khơng có ảnh hưởng theo mùa Trong q năm, ảnh hưởng theo mùa khơng đáng kể, số theo mùa 100,9 gần với số sở 100, bao gồm số theo chu kỳ xu hướng Ảnh hưởng theo mùa chiếm 1% doanh số bán nhà Valley Estates, trung bình quý 4.2.3 Ứng dụng kinh doanh Vì điều kiện kinh tế kinh doanh thay đổi theo thời gian, nhà quản lý phải tìm cách để theo sát ảnh hưởng mà thay đổi xảy với tổ chức họ Một kỹ thuật trợ giúp việc lập kế hoạch cho nhu cầu tương lai dự báo 130 | P a g e Dự báo liên quan đến việc giám sát thay đổi xảy theo thời gian dự đốn tương lai Ví dụ, nhà quản lý marketing nhà bán lẻ dự đốn nhu cầu sản phẩm, doanh số bán hàng, sở thích người tiêu dùng, hàng tồn kho, số thứ khác để đưa định liên quan đến quảng cáo sản phẩm lập kế hoạch chiến lược Các quan chức phủ dự báo tỷ lệ thất nghiệp, lạm phát, sản xuất công nghiệp thu nhập từ thuế thu nhập để hình thành sách kinh tế Và quản trị viên trường cao đẳng phải dự báo số sinh viên ghi danh để lên kế hoạch xây dựng ký túc xá sở học tập kế hoạch tuyển sinh viên giảng viên Hai phương pháp tiếp cận phổ biến để dự báo định lượng định tính dự báo Các phương pháp dự báo định tính đặc biệt quan trọng liệu lịch sử khơng có Các phương pháp dự báo định tính coi chủ quan có tính phán đốn Phương pháp dự báo định lượng sử dụng liệu lịch sử Mục tiêu phương pháp sử dụng liệu khứ để dự đoán giá trị tương lai Các phương pháp dự báo định lượng chia thành hai loại: chuỗi thời gian nhân Các phương pháp dự báo chuỗi thời gian liên quan đến dự báo giá trị tương lai dựa hoàn toàn vào giá trị khứ biến Ví dụ: giá đóng cửa hàng ngày cổ phiếu cụ thể Sài Giao dịch Chứng khoán New York tạo thành chuỗi thời gian Các ví dụ khác chuỗi thời gian kinh tế kinh doanh số giá tiêu dùng (CPI), tổng sản phẩm quốc nội (GDP) hàng quý doanh thu hàng năm công ty cụ thể Các phương pháp dự báo nhân liên quan đến việc xác định yếu tố liên quan đến biến dự báo Chúng bao gồm phân tích hồi quy đa biến với biến phụ thuộc, mơ hình kinh tế lượng, phân tích số hàng đầu mức biến động kinh tế khác vượt phạm vi giảng Sự nhấn mạnh chương phương pháp dự báo thời gian Sau sơ đồ phương pháp dự báo chuỗi thời gian: 131 | P a g e Hình 4.3 132 | P a g e ... đoạn phân bố nằm khoảng tin cậy Tỷ lệ phần phân bố 2, tỷ lệ phần phân bố Bạn sử dụng phương trình (8.1) để xây dựng zzz, ước tính khoảng tin cậy cho trung bình với biết đến Với giá trị tương ứng. .. cậy 95% tương ứng với giá trị 0,05 Giá trị Z giới hạn tương ứng với diện tích tích lũy 0,975 1,96 có 0, 025 phần phân bố, diện tích tích lũy nhỏ Z = 1,96 0,975 Để biết giá trị Z giới hạn cho độ... 0.00 62 Xác suất giá trị +2. 50 0.9938 đó, xác suất giá trị +2. 50 - 0.9938 = 0.00 62 Do đó, giá trị p-value cho thử nghiệm hai mặt 0.00 62 + 0.00 62 = 0.0 124  Bởi giá trị p = 0,0 124

Ngày đăng: 01/03/2022, 09:51

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan