i Bài giảng PHÂN TÍCH VÀ DỰ BÁO KINH TẾ TRONG XÂY DỰNG ii TRƯỜNG ĐẠI HỌC THỦY LỢI KHOA KINH TẾ VÀ QUẢN LÝ – BỘ MÔN QUẢN LÝ XÂY DỰNG (Chủ biên TS Nguyễn Thiện Dũng) Thành viên ThS Trần Văn Khiêm, ThS B[.]
Bài giảng PHÂN TÍCH VÀ DỰ BÁO KINH TẾ TRONG XÂY DỰNG i TRƯỜNG ĐẠI HỌC THỦY LỢI KHOA KINH TẾ VÀ QUẢN LÝ – BỘ MÔN QUẢN LÝ XÂY DỰNG (Chủ biên: TS Nguyễn Thiện Dũng) Thành viên: ThS Trần Văn Khiêm, ThS Bùi Anh Tú, ThS Phùng Duy Hảo Bài giảng PHÂN TÍCH VÀ DỰ BÁO KINH TẾ TRONG XÂY DỰNG ii MỤC LỤC MỤC LỤC iii LỜI MỞ ĐẦU vi Chương DỰNG TỔNG QUAN VỀ PHÂN TÍCH VÀ DỰ BÁO KINH TẾ TRONG XÂY 1.1 KHÁI NIỆM CÓ LIÊN QUAN 1.2 Ý NGHĨA VÀ VAI TRỊ CỦA PHÂN TÍCH VÀ DỰ BÁO KINH TẾ TRONG XÂY DỰNG 1.2.1 Ý nghĩa 1.2.2 Vai trò 1.3 CÁC LOẠI DỰ BÁO KINH TẾ TRONG XÂY DỰNG 1.3.1 Căn vào độ dài thời gian dự báo 1.3.2 Dựa vào phương pháp dự báo 1.3.3 Căn vào nội dung 1.4 CÁC NHÂN TỐ ẢNH HƯỞNG ĐẾN DỰ BÁO KINH TẾ XÂY DỰNG 10 1.4.1 Nhân tố khách quan 10 1.4.2 Nhân tố chủ quan 11 1.5 QUY TRÌNH DỰ BÁO KINH TẾ TRONG XÂY DỰNG 11 Chương PHƯƠNG PHÁP DỰ BÁO KINH TẾ TRONG XÂY DỰNG 14 2.1 PHƯƠNG PHÁP DỰ BÁO ĐỊNH TÍNH 14 2.1.1 Lấy ý kiến ban điều hành 15 2.1.2 Lấy ý kiến người bán hàng 15 2.1.3 Phương pháp chuyên gia (Delphi) 15 2.1.4 Phương pháp điều tra người tiêu dùng 16 2.2 PHƯƠNG PHÁP DỰ BÁO ĐỊNH LƯỢNG 16 2.2.1 Dự báo ngắn hạn 16 2.2.1.1 Dự báo sơ 17 2.2.1.2 Phương pháp trung bình trượt 17 2.2.1.3 Phương pháp trung bình trượt có trọng số 19 2.2.1.4 Phương pháp san hàm số mũ 20 2.2.1.5 Phương pháp điều hòa mũ theo xu hướng 21 2.2.2 Dự báo dài hạn 23 2.2.2.1 Phương pháp hồi qui tuyến tính (hồi quy đơn) 24 2.2.2.2 Tính chất mùa vụ dự báo chuỗi thời gian 28 2.2.2.3 Phương pháp hồi quy bội 30 Chương Phân tích liệu trong kinh tế xây dựng 32 iii 3.1 XÁC ĐỊNH DỮ LIỆU CẦN THU THẬP 32 3.1.1 Xác định liệu cần thu thập 32 3.1.2 Nguồn thu thập liệu 34 3.1.2.1 Nguồn liệu thứ cấp 34 3.1.2.2 Nguồn thu thập liệu sơ cấp 34 3.2 PHƯƠNG PHÁP XÂY DỰNG BẢNG HỎI 36 3.3 PHƯƠNG PHÁP ĐIỀU TRA THU THẬP DỮ LIỆU 38 3.3.1 Phương pháp thu thập số liệu thứ cấp từ tài liệu có 39 3.3.2 Phương pháp thu thập số liệu từ thực nghiệm 39 3.3.2.1 Khái niệm có liên quan 39 3.3.2.2 Kỹ thuật thu thập số liệu nghiên cứu 41 3.3.2.3 Xác định cỡ mẫu 46 3.3.3 Phương pháp phi thực nghiệm 48 3.3.3.1 Khái niệm 48 3.3.3.2 Kỹ thuật thu thập số liệu 48 3.4 PHÂN TÍCH VÀ XỬ LÝ DỮ LIỆU 50 3.4.1 Khái quát Xử lý liệu 51 3.4.1.1 Dữ liệu 51 3.4.1.2 Tổng thể mẫu 51 3.4.1.3 Mơ hình 52 3.4.2 Quá trình xử lý liệu 52 3.4.2.1 Xác định vấn đề, mục đích 52 3.4.2.2 Thiết kế thu thập liệu 53 3.4.2.3 Chuẩn bị, biên tập liệu 53 3.4.2.4 Khảo sát thăm dò liệu 53 3.4.2.5 Phân tích liệu 54 3.4.2.6 Kiểm định kết 63 3.4.2.7 Diễn giải, trình bày kết 64 3.4.2.8 Khai thác kết 65 3.5 SỬ DỤNG PHẦN MỀM SPSS, STATA TRONG PHÂN TÍCH VÀ XỬ LÝ DỮ LIỆU 65 3.5.1 Giới thiệu phần mềm SPSS 65 3.5.2 Giới thiệu phần mềm Stata 66 Chương PHÂN TÍCH RA QUYẾT ĐỊNH TRONG KINH TẾ XÂY DỰNG 68 4.1 KHÁI NIỆM VÀ CÁC LOẠI RA QUYẾT ĐỊNH 68 4.1.1 Khái niệm định 68 4.1.2 Các loại định 68 iv 4.1.3 Quy trình định 68 4.2 RA QUYẾT ĐỊNH TRONG ĐIỀU KIỆN CHẮC CHẮN 69 4.3 RA QUYẾT ĐỊNH TRONG ĐIỀU KIỆN RỦI RO 69 4.3.1 Khái niệm 69 4.3.2 Phương pháp lập bảng định 70 4.3.2.1 Mô hình giá trị lợi nhuận kỳ vọng lớn (EMV max) 70 4.3.2.2 Mơ hình thiệt hại hội kỳ vọng nhỏ (EOL min) 70 4.3.2.3 Phân tích độ nhạy 72 4.4 QUYẾT ĐỊNH TRONG ĐIỀU KIỆN KHÔNG CHẮC CHẮN 72 4.4.1 Mơ hình Maximax 73 4.4.2 Mơ hình Maximin 73 4.4.3 Mơ hình Đồng ngẫu nhiên 73 4.4.4 Mơ hình Hurwitz –mơ hình trung bình có trọng số 74 4.4.5 Mơ hình Minimax 74 4.5 QUYẾT ĐỊNH KHI XÉT ĐẾN ĐỘ HỮU ÍCH 75 4.6 CÂY QUYẾT ĐỊNH 75 4.7 PHƯƠNG PHÁP ĐÁNH GIÁ DỮ LIỆU 77 4.7.1 Khái niệm 77 4.7.2 Mục đích đánh giá liệu 79 4.7.3 Tiêu chuẩn đánh giá liệu 79 4.7.4 Kiểm định giả thuyết thống kê 81 4.7.4.1 Nguyên lý 81 4.7.4.2 Các kiểm định thông dụng 82 v LỜI MỞ ĐẦU Việt Nam nước phát triển, kinh tế vận hành kinh tế thị trường có định hướng xã hội chủ nghĩa Về chất kinh tế vận hành tuân thủ quy luật kinh tế vốn có Phân tích liệu dự báo vô quan trọng việc hỗ trợ nhà quản lý đưa định đắn Để nghiên cứu ngành kinh tế phải liệu đầu vào để phân tích đánh giá, dự báo triển vọng so sánh với kỳ vọng mà đầu tư, thực tính tốn Có nhiều tốn phân tích dự báo sử dụng cho lĩnh vực khác như: Phân tích dự báo tình hình tài chính, tiền tê, hoạch định điều hành sách tài chính; xây dựng mơ hình dự báo số thống kê xã hội chủ yếu; dự báo biến động giá chứng khoán; dự báo tác động vốn đầu tư từ nước ngoài; dự báo giá số mặt hàng tư liệu sản xuất… Do đời giảng Phân tích dự báo kinh tế xây dựng nhằm mục đích giúp người đọc, nhà quản lý, chuyên gia phân tích liệu đầu vào dự án đầu tư xây dựng, đánh giá liệu sử dụng toán đầu tư, toán phân tích đánh giá hiệu đầu tư xây dựng, xây dựng, dự báo số giá mặt hàng xây dựng doanh nghiệp xây dựng Nhóm biên soạn gồm TS Nguyễn Thiện Dũng, ThS Trần Văn Khiêm, ThS Bùi Anh Tú ThS Phùng Duy Hảo mong muốn cho đời giảng Phân tích dự báo kinh tế xây dựng nhằm mục đích giảng dạy cho sinh viên ngành Kinh tế xây dựng, ngành Quản lý xây dựng số ngành kinh tế có liên quan khác Khoa Kinh tế Quản lý, trường Đại học Thủy Lợi Kết cấu giảng gồm có chương sau: Chương 1: Tổng quan phân tích dự báo xây dựng Chương 2: Các phương pháp phân tích dự báo xây dựng Chương 3: Phân tích liệu kinh tế xây dựng Chương 4: Phân tích định kinh tế xây dựng Đây tài liệu giảng dạy học phần đào tạo trình độ đại học Phân tích dự báo xây dựng, trình giảng dạy, nhóm biên soạn tiếp tục cập nhật kiến thức mới, sửa đổi nội dung cho phù hợp với yêu cầu thực tiễn, cần ý kiến đóng góp em sinh viên đồng nghiệp chuyên gia phân tích dự báo để cuối tài liệu giảng ngày hoàn thiện Trân trọng cảm ơn! vi Chương DỰNG TỔNG QUAN VỀ PHÂN TÍCH VÀ DỰ BÁO KINH TẾ TRONG XÂY 1.1 KHÁI NIỆM CĨ LIÊN QUAN Dự báo hình thành từ đầu năm 60 kỉ 20 Dự báo theo tiếng Hy Lạp Prognosis - tiên đoán, thấytrước Dự báo tiên đốn có khoa học, mang tính chất xác suất mức độ, nội dung, mối quan hệ, trạng thái, xu hướng phát triển đối tượng nghiên cứu cách thức thời hạn đạt mục tiêu định đề tươnglai Tiên đoán khoa học: tiên đốn dựa việc phân tích mối quan hệ qua lại đối tượng khuôn khổ hệ thống lý luận khoa học định Nó dựa việc phân tích tính quy luật phát triển đối tượng dự báo điều kiện ban đầu với tư cách giả thiết Tiên đoán khoa học kết kết hợp phân tích định tính phân tích định lượng q trình cần dự báo Dự báo yếu tố quan trọng hầu hết định kinh doanh lập kế hoạch kinh tế Công tác dự báo vô quan trọng lẽ cung cấp thơng tin cần thiết nhằm phát bố trí sử dụng nguồn lực tương lai cách có thực tế Với thông tin mà dự báo đưa cho phép nhà hoạch định sách có định đầu tư, định sản xuất, tiết kiệm tiêu dùng, sách tài chính, sách kinh tếvĩ vơ Hầu lĩnh vực chức doanh nghiệp sửdụng loại dự báo đó, vídụ: - Kế tốn: dự báo chi phí doanh thu kế hoạch nộp thuế Phòng nhân sự: dự báo nhu cầu tuyển dụng thay đổi công sở Chuyên gia tài chính: dự báo dịng tiền Quản đốc sản xuất: dự báo nhu cầu nguyên vật liệu tồn kho Giám đốc marketing: Dự báo doanh số để thiết lập ngân sách cho quảng cáo 1.2 Ý NGHĨA VÀ VAI TRỊ CỦA PHÂN TÍCH VÀ DỰ BÁO KINH TẾ TRONG XÂY DỰNG 1.2.1 Ý nghĩa Phân tích dự báo kinh tế xây dựng có ý nghĩa sau: - Dùng để dự báo mức độ tương lai tượng, qua giúp nhà quản trị doanh nghiệp nói chung doanh nghiệp xây dựng nói rieng chủ động việc đề kế hoạch định cần thiết phục vụ cho trình sản xuất kinh doanh, đầu tư xây dựng, quảng bá, quy mô sản xuất, kênh phân phối sản phẩm, thực công tác đấu thầu xây dựng, huy động nguồn cung cấp tài chính, chuẩn bị đầy đủ điều kiện sở vật chất, kỹ thuật cho phát triển thời gian tới (kế hoạch cung cấp yếu tố đầu vào như: lao động, nguyên vật liệu, tư liệu lao động yếu tố đầu dạng sản phẩm vật chất dịch vụ) - Trong doanh nghiệp xây dựng công tác dự báo thực cách nghiêm túc tạo điều kiện nâng cao khả cạnh tranh thị trường xây dựng - Dự báo xác giảm bớt mức độ rủi ro cho doanh nghiệp xây dựng nói riêng tồn kinh tế nói chung - Dự báo xác để nhà hoạch định sách phát triển kinh tế văn hoá xã hội lĩnh vực xây dựng toàn kinh tế quốc dân nói chung - Nhờ có dự báo sách kinh tế, kế hoạch chương trình phát triển kinh tế xây dựng có sở khoa học mang lại hiệu kinh tế cao - Nhờ có dự báo thường xuyên kịp thời, nhà quản trị doanh nghiệp xây dựng có khả kịp thời đưa biện pháp điều chỉnh hoạt động kinh tế đơn vị nhằm thu hiệu sản xuất kinh doanh cao 1.2.2 Vai trò - Dự báo tạo lợi cạnh tranh lớn lĩnh vực xây dựng, giúp lựa chọn tốt lĩnh vực mà doanh nghiệp tham gia tương lai - Công tác dự báo phận thiếu hoạt động doanh nghiệp xây dựng, phòng ban như: phòng Kinh doanh Marketing, phòng Sản xuất phòng Nhân sự, phịng Kế tốn - tài 1.3 CÁC LOẠI DỰ BÁO KINH TẾ TRONG XÂY DỰNG 1.3.1 Căn vào độ dài thời gian dự báo Theo thời gian, dự báo phân thành ba loại: - Dự báo dài hạn: Là dự báo có thời gian dự báo từ năm trở lên Thường dùng để dự báo mục tiêu, chiến lược kinh tế trị, khoa học kỹ thuật thời gian dài tầm vĩ mô - Dự báo trung hạn: Là dự báo có thời gian dự báo từ đến năm Thường phục vụ cho việc xây dựng kế hoạch trung hạn kinh tế văn hoá xã hội tầm vi mô vĩ mô - Dự báo ngắn hạn: Là dự báo có thời gian dự báo năm, loại dự báo thường dùng để dự báo lập kế hoạch kinh tế, văn hoá, xã hội chủ yếu tầm vi mô vĩ mô khoảng thời gian ngắn nhằm phục vụ cho công tác đạo kịp thời Cách phân loại mang tính tương đối tuỳ thuộc vào loại tượng để quy định khoảng cách thời gian cho phù hợp với loại tượng đó: ví dụ dự báo kinh tế, dự báo dài hạn dự báo có tầm dự báo năm, dự báo thời tiết, khí tượng học tuần Thang thời gian dự báo kinh tế dài nhiều so với thang thời gian dự báo thời tiết Vì vậy, thang thời gian đo đơn vị thích hợp (ví dụ: quý, năm dự báo kinh tế ngày dự báo dự báo thời tiết) 1.3.2 Dựa vào phương pháp dự báo Theo phương pháp, dự báo chia thành nhóm: - Dự báo phương pháp chuyên gia: Loại dự báo tiến hành sở tổng hợp, xử lý ý kiến chuyên gia thơng thạo với tượng nghiên cứu, từ có phương pháp xử lý thích hợp đề dự đoán, dự đoán cân nhắc đánh giá chủ quan từ chuyên gia Phương pháp có ưu trường hợp dự đốn tượng hay trình bao quát rộng, phức tạp, chịu chi phối khoa học - kỹ thuật, thay đổi môi trường, thời tiết, chiến tranh khoảng thời gian dài Một cải tiến phương pháp Delphi - phương pháp dự báo dựa sở sử dụng tập hợp đánh giá nhóm chuyên gia Mỗi chuyên gia hỏi ý kiến dự báo họ trình bày dạng thống kê tóm tắt Việc trình bày ý kiến thực cách gián tiếp ( khơng có tiếp xúc trực tiếp) để tránh tương tác nhóm nhỏ qua tạo nên sai lệch định kết dư báo Sau người ta yêu cầu chuyên gia duyệt xét lại dự báo họ xơ sở tóm tắt tất dự báo có bổ sung thêm - Dự báo theo phương trình hồi quy: Theo phương pháp này, mức độ cần dự báo phải xây dựng sở xây dựng mơ hình hồi quy, mơ hình xây dựng phù hợp với đặc điểm xu phát triển tượng nghiên cứu Để xây dựng mơ hình hồi quy, địi hỏi phải có tài liệu tượng cần dự báo tượng có liên quan Loại dự báo thường sử dụng để dự báo trung hạn dài hạn tầm vĩ mô - Dự báo dựa vào dãy số thời gian: Là dựa sở dãy số thời gian phản ánh biến động tượng thời gian qua để xác định mức độ tượng tương lai 1.3.3 Căn vào nội dung Theo nội dung, dự báo chia dự báo thành: Dự báo khoa học, dự báo kinh tế, dự báo xã hội, dự báo tự nhiên, thiên văn học - Dự báo khoa học: Là dự kiến, tiên đoán kiện, tượng, trạng thái hay định xảy tương lai Theo nghĩa hẹp hơn, nghiên cứu khoa học triển vọng tượng đó, chủ yếu đánh giá số lượng khoảng thời gian mà tượng diễn biến đổi - Dự báo kinh tế: Là khoa học dự báo tượng kinh tế tương lai Dự báo kinh tế coi giai đoạn trước công tác xây dựng chiến lược phát triển kinh tế - xã hội dự án kế hoạch dài hạn; không đặt nhiệm vụ cụ thể, chứa đựng nội dung cần thiết làm để xây dựng nhiệm vụ Dự báo kinh tế bao trùm phát triển kinh tế xã hội đất nước có tính đến phát triển tình hình giới quan hệ quốc tế Thường thực chủ yếu theo hướng sau: dân số, nguồn lao động, việc sử dụng tái sản xuất chúng, suất lao động; tái sản xuất xã hội trước hết vốn sản xuất cố định: phát triển cách mạng khoa học - kĩ thuật công nghệ khả ứng dụng vào kinh tế; mức sống nhân dân, hình thành nhu cầu phi sản xuất, động thái cấu tiêu dung, thu nhập nhân dân; động thái kinh tế quốc dân chuyển dịch cấu (nhịp độ, tỉ lệ, hiệu quả); phát triển khu vực ngành kinh tế (khối lượng động thái, cấu, trình độ kĩ thuật , máy, mối liên hệ liên ngành); phân vùng sản xuất, khai thác tài nguyên thiên nhiên phát triển vùng kinh tế nước, mối liên hệ liên vùng; dự báo phát triển kinh tế giới kinh tế Các kết dự báo kinh tế cho phép hiểu rõ đặc điểm điều kiện kinh tế - xã hội để đặt chiến lược phát triển kinh tế đắn, xây dựng chương trình, kế hoạch phát triển cách chủ động, đạt hiệu cao vững - Dự báo xã hôi: Dự báo xã hội khoa học nghiên cứu triển vọng cụ thể tượng, biến đổi, qúa trình xã hội, để đưa dự báo hay dự đốn tình hình diễn biến, phát triển xã hội - Dự báo tự nhiên, thiên văn học, loại dự báo thường bao gồm: + Dự báo thời tiết: Thông báo thời tiết dự kiến thời gian định vùng định Trong dự báo thời tiết có dự báo chung, dự báo khu vực, dự báo địa phương, v.v thời gian, có dự báo thời tiết ngắn (1-3 ngày) dự báo thời tiết dài (tới năm) + Dự báo thuỷ văn: Là loại dự báo nhằm tính để xác định trước phát triển qúa trình, tượng thuỷ văn xảy sông hồ, dựa tài liệu liên quan tới khí tượng thuỷ văn Dự báo thuỷ văn dựa hiểu biết quy luật phát triển q trình, khí tượng thuỷ văn, dự báo xuất hiện tượng hay yếu tố cần quan tâm Căn thời gian dự kiến, dự báo thuỷ văn chia thành dự báo thuỷ văn hạn ngắn (thời gian không ngày), hạn vừa (từ đến 10 ngày); dự báo thuỷ văn mùa (thời gian dự báo vài tháng); cấp báo thuỷ văn: thông tin khẩn cấp tượng thuỷ văn gây nguy hiểm Theo mục đích dự báo, có loại: dự báo thuỷ văn phục vụ thi công, phục vụ vận tải, phục vụ phát điện,v.v Theo yếu tố dự báo, có: dự báo lưu lượng lớn nhất, nhỏ nhất, dự báo lũ, v.v + Dự báo địa lý: Là việc nghiên cứu hướng phát triển mơi trường địa lí tương lai, nhằm đề sở khoa học giải pháp sử dụng hợp lí bảo vệ môi trường + Dự báo động đất: Là loại dự báo trước địa điểm thời gian có khả xảy động đất Động đất không xảy mà q trình tích luỹ lâu dài, trước biến đổi địa chất, tượng vật lí, trạng thái sinh học bất thường động vật,v.v Việc dự báo thực sở nghiên cứu đồ phân vùng động đất dấu hiệu báo trước Cho đến nay, chưa thể dự báo xác thời gian động đất xảy 1.4 CÁC NHÂN TỐ ẢNH HƯỞNG ĐẾN DỰ BÁO KINH TẾ XÂY DỰNG 1.4.1 Nhân tố khách quan Kết dự báo số liệu bị ảnh hưởng nhiều nhiều yếu tố bên ngồi làm cho giá trị dự báo khơng cịn sát với thực tế có sai sót lớn nhân tố bên sau: + Yếu tố thay đổi kinh tế, kinh tế tốt làm kết số liệu dự đoán theo số liệu q khứ khơng cịn Ngược lại kinh tế bị cú sốc 10 Phương án 2: lập nhà máy có qui mơ nhỏ để sản xuất sản phẩm Phương án 3: không làm Bước 3: Ơng B cho có tình thị trường xảy là: Thị trường tốt Thị trường xấu Bước 4: Ông B ước lượng lợi nhuận phương án ứng với tình huống: Bảng 4.1 Lợi nhuận dự kiến phương án Trạng thái Phương án Thị trường tốt Thị trường xấu Nhà máy lớn 200 tỷ đồng -180 tỷ đồng Nhà máy nhỏ 100 tỷ đồng - 20 tỷ đồng Khơng làm 0 Bước 6: Chọn mơ hình tốn học phương pháp định lượng để tác dụng vào toán Việc chọn lựa mơ hình dựa vào hiểu biết, vào thơng tin hay nhiều khả xuất trạng thái hệ thống 4.2 RA QUYẾT ĐỊNH TRONG ĐIỀU KIỆN CHẮC CHẮN Người định biết chắn kết phương án lựa chọn việc định phụ thuộc mục tiêu cần đạt đến người định (Cực đại hóa lợi nhuận, chi phí cực tiểu, hịa vốn, mở rộng thị trường ) Người định cực đại hóa lợi ích kết theo phương án có lợi ích đạt tốt Ví dụ: Có khoản tiền 100 triệu đồng đầu tư vòng năm cần lựa chọn nên gửi Ngân hàng với mức lãi suất 6%/năm hay mua trái phiếu Chính phủ với mức 8%/năm Nếu hình thức đảm bảo an toàn rõ ràng người định chọn mua trái phiếu Chính phủ có lãi suất cao so với gửi tiết kiệm 4.3 RA QUYẾT ĐỊNH TRONG ĐIỀU KIỆN RỦI RO 4.3.1 Khái niệm Khi định điều kiện rủi ro, ta biết xác suất xảy trạng thái Ra định điều kiện rủi ro, ta thường sử dụng tiêu chuẩn sau: - Cực đại giá trị kỳ vọng tính tiền EMV (Expected Moneytary Value) - Cực tiểu thiệt hại kỳ vọng EOL (Expected Opportunity Loss) - Để xác định tiêu chuẩn người ta sử dụng phương pháp lập bảng 69 định định 4.3.2 Phương pháp lập bảng định 4.3.2.1 Mơ hình giá trị lợi nhuận kỳ vọng lớn (EMV max) Trong mơ hình này, chọn phương án i có giá trị kỳ vọng tính tiền lớn (EMV (i): giá trị kỳ vọng tính tiền phương án i) Cơng thức xác định: m EMVi P( S j ) Pij (4.1) j 1 Trong đó: P ( S j ) : xác suất để trạng thái j xuất Pij : lợi nhuận/chi phí phương án i ứng với trạng thái j Lưu ý: i = đến n j = đến m Ví dụ: Trở lại tốn ơng giám đốc B công ty X với giả sử thị trường xấu thị trường tốt có xác suất 0,5 Suy ta có bảng kết tương ứng sau: Bảng 4.2 Giá trị EMV phương án Đơn vị: tỷ đồng Trạng thái j Phương án i EMVi Thị trường tốt (j=1) Thị trường tốt (j=2) Nhà máy lớn (i = 1) 200 -180 10 Nhà máy nhỏ (i = 2) 100 -20 40 Khơng làm (i = 3) 0 0,5 0,5 Xác suất trạng thái P ( S j ) Ra định sau: EMVi > => phương án có lợi Max EMVi = EMVi = = 40 => Chọn phương án nhà máy nhỏ 4.3.2.2 Mơ hình thiệt hại hội kỳ vọng nhỏ (EOL min) Thiệt hại hội phương án i ứng với trạng thái j (OLij) định nghĩa sau: OLij MaxPij Pij 70 (4.2) Đây số tiền ta bị thiệt hại ta không chọn phương án tối ưu mà phải chọn phương án i Ví dụ: Từ bảng 4.2 ta có: OL11 = 200 – 200 = OL12 = – (-180) = 180 OL21 = 200 – 100 = 100 OL22 = – (-20) = 20 OL31 = 200 – = 200 OL32 = – = Từ đó, ta có bảng xác định thiệt hại hội kỳ vọng EOL sau: Bảng 4.3 Thiệt hại hội kỳ vọng EOL phương án Trạng thái Phương án Thị trường Tốt Thị trường Xấu Thiệt hại hội kỳ vọng EOL Nhà máy lớn (i = 1) 180 0,5 0,5 180 90 Nhà máy nhỏ (i = 2) 100 20 0,5 100 0,5 20 60 Khơng làm (i = 3) 200 0,5 200 0,5 100 Xác suất trạng thái P ( S j ) 0,5 0,5 Thiệt hại hội kỳ vọng EOLi (Expected Opportunity loss) tính theo cơng thức sau: m EOLi P( S j ) OLij (4.3) j 1 Như với ví dụ trên, phương án cần lựa chọn phương án nhà máy nhỏ Trong trường hợp có thêm thơng tin hồn hảo liên quan đến vấn đề cần định giá trị làm sở để định giá thông tin cần sử dụng tiêu Kỳ vọng giá trị thơng tin hồn hảo EVPI (Expected Value of Perfect Information) Công thức xác định kỳ vọng giá trị thơng tin hồn hảo: EVPi = EVWPi – Max{EMVi} (4.4) Trong đó: EVPi: Kỳ vọng giá trị thơng tin hoàn hảo; EVWPi (Expected Value With Perfect Information): Kỳ vọng giá trị với thơng tin hồn 71 hảo (Kỳ vọng giá trị có thơng tin hồn hảo) Max EMV: Cực đại kỳ vọng giá trị tiền EVPi: giá trị lợi ích kỳ vọng tăng thêm có thêm thơng tin hồn hảo liên quan đến vấn đề cần định giá trị làm sở để định giá thông tin EVPi = Min{EOL(i)} (4.5) 4.3.2.3 Phân tích độ nhạy Ra định điều kiện rủi ro phụ thuộc nhiều vào xác suất xảy tình Phân tích độ nhạy nghiên cứu thay đổi việc định điều kiện rủi ro xác suất xảy tình thay đổi Ví dụ: Với liệu từ ví dụ trên, Quyết định giám đốc công ty xây dựng theo tiêu chuẩn EMV thay đổi xác suất xảy tình thị trường thuận lợi bất lợi đánh giá khác? Giả sử xác suất xảy tình thị trường thuận lợi (P), xác suất xảy tình thị trường bất lợi (1-P) Kỳ vọng giá trị tiền phương án lựa chọn: EMV (nhà máy lớn) = 200*P - 180*(1-P) = 380*P – 180 EMV (nhà máy nhỏ) = 100*P - 20*(1-P) = 120*P - 20 EMV (Không xây dựng) = 0*P + 0*(1-P) = 4.4 QUYẾT ĐỊNH TRONG ĐIỀU KIỆN KHÔNG CHẮC CHẮN Trong điều kiện không chắn, ta xác suất xuất trạng thái kiện liên quan đến tốn khơng có sẵn Trong trường hợp ta dùng mơ hình sau: 72 Maximax Minimax Maximin Tiêu chuẩn thực hay tiêu chuẩn Hurwiez Đồng ngẫu nhiên (Equallylikely) Hình 4.1 Mơ hình định điều kiện khơng chắn 4.4.1 Mơ hình Maximax Tìm phương án i ứng với Max max, nghĩa tìm giá trị lớn bảng định Max(MaxPij ) Trong mô hình ta tìm lợi nhuận tối đa có bất chấp rủi ro, tiêu chuẩn gọi tiêu chuẩn lạc quan (optimistic decision criterion) Ví dụ: Từ bảng 4.1 ta có Max(Max Pij ) = 200 Ra định: chọn phương án nhà máy lớn 4.4.2 Mơ hình Maximin Chọn phương án i ứng với Max Mi, tức Max(Min P ij) Nghĩa tìm Min hàng i, sau lấy Max giá trị Min vừa tìm Cách làm phản ánh tinh thần bi quan, gọi định bi quan (pessimistic decision) Ví dụ: Từ bảng 4.1 ta có Max(Min Pij ) = Ra định: Khơng làm 4.4.3 Mơ hình Đồng ngẫu nhiên Trong mơ hình này, ta xem trạng thái đồng ngẫu nhiên, nghĩa xem trạng thái có xác suất xuất Trong trường hợp ta tìm phương án i ứng với: 73 𝑀𝑎𝑥 ∑𝑚 𝑗=1 𝑃𝑖𝑗 𝑆ố 𝑡𝑟ạ𝑛𝑔 𝑡ℎá𝑖 Nghĩa tìm phương án làm cực đại giá trị trung bình lợi nhuận phương án Ví dụ: Từ bảng 4.1 ta có: 200 ( 180) 100 ( 20) Max ; ; 2 → Max 10; 40;0 Ra định: Chọn phương án xây nhà máy nhỏ 4.4.4 Mơ hình Hurwitz –mơ hình trung bình có trọng số Đây mơ hình dung hịa tiêu chuẩn lạc quan tiêu chuẩn bi quan Bằng cách chọn hệ số α (0 < α < 1) Sau chọn phương án i ứng với hệ số a cho: Max MaxPij (1 )MinPij (4.6) Trong đó: MinPij: giá trị nhỏ hàng thứ i MaxPij: giá trị lớn hàng thứ i Hệ số α: < α < α = 1: Người định lạc quan tương lai α = 0: Người định lạc quan tương lai Phương pháp có dạng mềm dẻo hơn, giúp cho người định đưa cảm xúc cá nhân thị trường vào mơ hình 4.4.5 Mơ hình Minimax Ta tìm phương án ứng với: Min(MaxOLij) Tìm Max theo phương án i nghĩa tìm giá trị lớn cột j tính theo hàng OLij: thiệt hại hội phương án i ứng với trạng thái j tính mơ hình định điều kiện rủi ro Trong mơ hình ta tìm phương án để làm cực tiểu hội thiệt hại cực đại Ví dụ : Áp dụng bảng 4.3 ta có: Min[MaxOLij]= Min[180, 100, 200]= 100 Ra định: Chọn phương án nhà máy có quy mơ nhỏ 74 4.5 QUYẾT ĐỊNH KHI XÉT ĐẾN ĐỘ HỮU ÍCH Độ hữu ích độ đo mức ưu tiên người định lợi nhuận Lý thuyết độ hữu ích lý thuyết nghiên cứu cách kết hợp mức độ ưu tiên độ may rủi người định yếu tố khác trình định Độ hữu ích ước tính sau: Kết tốt có độ hữu ích => U (tốt nhất) = Kết xấu có độ hữu ích => U (xấu nhất) = Kết khác có độ hữu ích ∈ (0,1) => < U(khác) < Ví dụ: Phương án A: Chắc chắn thu 30 tỷ đồng Phương án B: 85% khả thu 60 tỷ đồng, 15% khả thua lỗ 10 tỷ đồng (-10 tỷ đồng) Khi độ hữu ích khoản tiền 30 tỷ đồng xác định sau: u(30 tỷ đồng) = 0,85u(60 tỷ đồng) + 0,15u(−10 tỷ đồng) = 0,85 0,85 ~ 85% gọi điểm khơng khác biệt Ví dụ: Phương án A: Chắc chắn thu 11 tỷ đồng Phương án B: 60% khả thu 60 tỷ đồng, 40% khả thua lỗ 10 tỷ đồng (-10 tỷ đồng) Khả lựa chọn: phương án thấy tương đương nhau, chọn phương án Khi đó: 11000 ~ {(0,6; 60000), (1-0,6; -10000)} ~ {(0,6; 60000), (0,4; -10000) } → u(11 tỷ đồng) = 0,6u(60 tỷ đồng) + 0,4u (-$10 tỷ đồng) =0,6 4.6 CÂY QUYẾT ĐỊNH Quy ước biểu diễn Cây định: Nút định: Hình vng biểu diễn điểm định (Từ điểm nút hình vng vẽ "cành cây" biểu cho phương án có thể, Người định lựa chọn phương án phương án có thể) Nút tình huống: Hình trịn thể tình (khả năng) xảy (Từ điểm nút hình trịn vẽ "nhánh" biểu diễn cho tình phương án Các bước phân tích định 75 Xác định vấn đề cần định Vẽ cấu trúc Cây định Điền xác suất tình Xác định kết phương án với tình khác Tính (EMVi) cho phương án với tình nút tình huống, nút định lựa chọn phương án có Max(EMVi) Nguyên tắc phân tích Cây định Bắt đầu từ bên phải Cây định phân tích phía bên trái Tại nút tình (Nút hình trịn) tính giá trị kỳ vọng cách nhân xác suất nhánh bắt nguồn từ điểm nút với lợi nhuận (kết quả) ghi cuối nhánh lấy tổng tất nhánh Tại nút định (Nút hình vng) đặt vào hình vng giá trị kỳ vọng lớn tất giá trị cành bắt nguồn từ nút Chọn cành có giá trị lớn nhất, loại bỏ đánh dấu cành có giá trị kỳ vọng nhỏ 10 tỷ đồng Nhà máy lớn Thuận lợi 0,5 20 tỷ đồng Bất lợi 0,5 -18 tỷ đồng Thuận lợi 0,5 100 tỷ đồng Bất lợi 0,5 -20 tỷ đồng 40 tỷ đồng 40 tỷ đồng Nhà máy nhỏ đồng Không xây đồng Hình 4.2 Sơ đồ định Tuy nhiên, thực tế việc sử dụng tiêu chuẩn Kỳ vọng giá trị tiền EMV dẫn đến định sai số trường hợp Ví dụ: Bạn người có số may mắn chơi cá cược Bạn cược triệu đồng tung đồng tiền mặt sấp không mặt ngửa Có người đề nghị trả triệu đồng cho vé cược bạn Vậy bạn có đồng ý khơng? Nếu giả thiết bạn người bướng bỉnh ham mê cá cược đủ để giữ lại vé cược bị trắng Vậy bạn giải thích 76 cho vợ việc này? triệu đồng không đủ để bạn thỏa mãn giây lát sao? Phần lớn người bán vé cá cược để lấy triệu đồng Trong thực tế phần lớn sẵn sàng chấp nhận triệu đồng điều chắn có định phương án lựa chọn 4.7 PHƯƠNG PHÁP ĐÁNH GIÁ DỮ LIỆU 4.7.1 Khái niệm Ngày nay, nhiều tổ chức đẩy mạnh tiếp cận liệu, cho liệu nguồn lực quan trọng để phát triển, Data quality - chất lượng liệu – quan tâm | ý Theo Gartner (công ty hàng đầu giới chuyên tư vấn nghiên cứu), Dữ liệu có chất lượng thấp ảnh hưởng tiêu cực đến suất, lợi nhuận tổ chức đặc biệt hành động, định, chiến lược dựa vào liệu Theo nghiên cứu Gartner (tại thị trường Hoa Kỳ) chất lượng liệu thấp làm chi phí tốn trung bình gần 15 triệu USD năm Một điều cần lưu ý khai thác liệu phục vụ cho mục đích kinh doanh là: chất lượng, thành công định phụ thuộc mạnh mẽ vào chất lượng liệu Tuy nhiên nhận thức khơng chưa đủ, tổ chức cần phải lường chất lượng liệu đưa giải pháp, hành động cụ thể để trì cải thiện chất lượng liệu Trong thời đại kỹ thuật số ngày nay, quản lý chất lượng liệu hỗ trợ tổ chức đối phó với thách thức từ liệu Chất lượng liệu (Date quality) phần thiếu hệ thống Data management, yếu tố định thành công tổ chức dự án khai thác, phân tích liệu Vậy Data quality gì? Và cần hiểu Data quality management? Trước hết cần nhắc lại định nghĩa Date management: việc phát triển, triển khai, giám sốt kế hoạch, sách, chương trình hoạt động công việc thực tiễn nhằm cung cấp (phân phối), kiểm soát, bảo vệ, gia tăng giá trị tài sản liệu thông tin xuyên suốt vịng đời chúng (trích dẫn The Data Management Body of Knowledge DMBOK) Data quality chức Data management với mục đích cải thiện chất lượng liệu, đảm bảo liệu đạt tiêu chuẩn, phù hợp (ví dụ liệu liên quan đến mục tiêu nghiên cứu, có khả đem lại thơng tin hữu ích) để đưa vào sử dụng hay phân tích Data quality triển khai song song với chức năng, quy trình cịn lại Date management hay xuyên suốt hệ thống Data management (từ giai đoạn tổ chức, thu thập liệu, làm sạch, tích hợp, lưu trữ, chuyển đổi, đến giai đoạn phân tích) Nguyên nhân thao tác, xử lý, hay thực công việc liên quan đến liệu, chất lượng liệu bị ảnh hưởng Date quality đề cập đến việc đánh giá chất lượng thông tin, liệu tổ chức có, xem xét lại mục đích kinh doanh, mục tiêu nghiên cứu, phân tích liệu, đánh giá liệu có khả hỗ trợ đạt mục tiêu hay không Chất lượng liệu xác định yếu tố, tiêu đo lường khác trình bày phần sau, chẳng hạn mức độ xác, đầy đủ, tính quán, phù 77 hợp, Chất lượng liệu đóng vai trị quan trọng, đáp ứng yêu cầu hoạt động, kế hoạch, định tổ chức Do đó, từ khái niệm thuật ngữ Data quality bao gồm định nghĩa chất lượng liệu quy trình, phương pháp sử dụng để đảm bảo cải thiện chất lượng liệu Quản lý chất lượng liệu tập hợp công việc, giải pháp thực tiễn mục đích nhằm đảm bảo, trì, cải thiện chất lượng liệu, thơng tin Quản lý chất lượng liệu xuất giai đoạn, quy trình liên quan tới liệu từ việc thu thập, lưu trữ, áp dụng kỹ thuật xử lý, phân tích, đến truyền đạt, phân phối, chia sẻ liệu, thông tin (tương tự Date quality Data monggement vừa nhắc lại trên) Các nhà quản lý, nhân viên thực quản lý chất lượng liệu tức “kiểm soát” cách tổng quan “thực trạng” tồn nguồn liệu, thơng tin mà tổ chức có thời điểm Ví dụ trước đem vào phân tích, cần xác định liệu có đủ “tốt” để phân tích hay khơng? Dữ liệu có bị sai sót, thiếu, thất lạc hay khơng? Kết cấu, format củu liệu có phức tạp, gây khó khăn cho việc phân tích khơng? Quản lý chất lượng liệu yếu tố thiếu dự án, project Data analytics, Data mining, Big Data analytics trổi dậy mạnh mẽ năm vừa qua Mục tiêu sau quan trọng cơng ty triển khai khai thác, phân tích liệu, mong muốn tìm thơng tin hữu ích, tiềm ẩn liệu (insights) Kết phân tích hay thơng tin trích xuất từ liệu có xác hay khơng, có đem lại giá trị cụ thể cho tổ hay không, định chất lượng liệu Theo SAS (công ty hàng đầu giới chuyên cung cấp giải pháp, Cơng nghệ hỗ trợ phân tích liệu), quản lý chất lượng liệu giúp kết hợp văn hóa tổ chức (organizational culture), Cơng nghệ, liệu để mang lại kết phân tích, khai thác thơng tin hữu ích xác SAS cho rằng: “Chất lượng liệu coi tốt hay xấu, cao hay thấp mà có phạm vi, tiêu chuẩn đo lường cụ thể Quản lý chất lượng liệu Cung cấp quy trình cụ thể tùy theo ngữ cảnh để cải thiện tính phù hợp liệu sử dụng để phân tích định Mục đích quản lý chất lượng liệu tạo hiểu biết sâu sắc “Sức khỏe” (chất lượng) liệu cách sử dụng nhiều quy trình Cơng nghệ khác tập liệu ngày lớn phức tạp hơn.” Theo BMC (Công ty Công nghệ Mỹ, sản xuất phần mềm dịch vụ hỗ trợ doanh nghiệp lĩnh vực kỹ thuật số) đưa định nghĩa khác Quản lý chất lượng liệu: “Quản lý chất lượng liệu (DQM) địi hỏi kết hợp nhân viên có kỹ năng, quy trình cơng nghệ với mục tiêu chung cải thiện chất lượng liệu Mục đích cuối Quản lý chất lượng liệu không dừng lại cải thiện chất lượng liệu mà nhằm đạt kết kinh doanh phụ thuộc vào liệu chất lượng cao.” Qua phân tích khái niệm, bạn nắm Data quality Data quality management, phần vào tìm hiểu sơ lược tầm quan trọng, số lợi ích quản lý 78 chất lượng liệu 4.7.2 Mục đích đánh giá liệu Dữ liệu quan trọng tổ chức cung cấp dự báo hành vi khách hàng, hỗ trợ quản lý sản xuất hiệu quả, cung cấp thông tin đối thủ cạnh tranh, Lợi ích mà liệu đem lại nhiều, khai thác triệt để, chí khơng đạt lợi ích chất lượng liệu không đảm bảo 4.7.3 Tiêu chuẩn đánh giá liệu Để đánh giá liệu, sử dụng tiêu chuẩn đo lường sau: - Tính xác (Accuracy) Accuracy khả liệu miêu tả vật hay tượng giới thực, hiểu mức độ xác thơng tin mà liệu cung cấp Thước đo sử dụng tỷ lệ sai sót có liệu (the ratio of data to errors) Ví dụ đơn giản để bạn dễ hiểu: tên khách hàng VIP thực Nguyễn Văn Dũng kiểm chứng liên hệ nhân viên chăm sóc khách hàng, trước liệu thu thập nhóm khách hàng viết lại để tên Nguyễn Văn Dung, có sai sót Ví dụ khác bạn có liệu nhóm khách hàng, khơng có tên, tuổi, giới tính có thơng tin số điện thoại, hành vi tìm kiếm sản phẩm (bao gồm loại sản phẩm tìm kiếm, số tiền mua muốn bỏ ra, ) dựa vào bạn cho nhóm khách hàng nữ, độ tuổi từ 18 đến 30, chạy chiến dịch quảng cáo nhắm mục tiêu, liên hệ, thu thập form đăng ký họ bạn phát đa số khách hàng nam, coi sai sót, kết luận liệu ban đầu khơng đáp ứng Accuracy (dữ liệu chưa có khả mơ tả chi tiết nhóm khách hàng cụ thể - Tính đầy đủ (Completeness) Tính đầy đủ liệu trả lời cho câu hỏi “Dữ liệu phải thu thập theo nhu cầu đầy đủ chưa?", hiểu đơn giản tức tất thành phần, yếu tố liệu có mang giá trị hữu hình – values – khơng có trường hợp "missing values”, hay “null values” Ví dụ, tập liệu lưu dạng file Excel, bên có nhiều cột ứng với nhiều trường thơng tin (ví dụ cột tên, cột tuổi, cột thu nhập khách hàng), dòng khách hàng, ô gọi “record” (hoặc "data entry”, quan sát) Nếu tất nhập giá trị (có thể số, chuỗi ký tự, ) cung cấp thông tin đầy đủ, cần thiết yêu cầu đối tượng khách hàng để đem vào phân tích thu kết quả, tập liệu đáp ứng tiêu chí Completeness Số lượng "missing values”, số lượng ô quan sát tập liệu giá trị đưỢC xem thước đo cho Completeness Ngồi có trường hợp, quan sát tập liệu mang giá trị thể thơng tin khơng xác thiếu, chưa thể coi Completeness ví dụ số điện thoại khách hàng A 0909102100, ô quan sát để 0909102 - Tính quán (Consistency) Tính qn hiểu đơn giản khơng có mâu thuẫn đối tượng liệu tập liệu khác Ví dụ tập liệu khách hàng gửi đến phận 79 bán hàng, khách hàng tên Nguyễn Văn A thực có giao dịch hay mua hàng lần tháng, nhiên tập liệu khác khách hàng gửi đến phận chăm sóc khách hàng giao dịch tháng, suy mâu thuẫn Càng mâu thuẫn, khác biệt thông tin, giá trị cung cấp đối tượng liệu nhiều tập liệu khác tính qn gia tăng Tính quán xét đồng thuộc tính liệu, hay format liệu Ví dụ tập liệu giao dịch, thời gian giao dịch để theo thứ tự ngày/tháng/năm, tất cịn lại phải theo ngày/tháng/năm khơng xuất tháng/ngày/năm ô nào, tương tự xét nhiều tập liệu giao dịch Nói chung, cịn nhiều trường hợp, tình khác để đánh giá tính quán liệu, tùy vào thực tế liệu gốc sao, cách thức thao tác với liệu, trình luân chuyển, chia sẻ liệu thực tế nào, - Tính gắn kết (Integrity) Integrity, tính vẹn tồn, tính gắn kết chặt chẽ tiêu chuẩn đánh giá kết hợp tiêu chí Accuracy, Completeness, Consistency Một tập liệu không đảm bảo Integrity hay Coherence coi tập liệu thiếu thông tin, thiếu giá trị ô quan sát, liệu bên khơng thể sử dụng bị sai lệch, bị sửa đổi, liệu bị trùng lặp, bị lỗi, Một số giải thích khác Integrity Data Integrity gần giống Data Validation (hay Validity, tính xác thực liệu), kiểm tra cấu trúc liệu, đảm bảo cấu trúc liệu không thay đổi so với cấu trúc chuẩn hóa trước đó, khơng phát sinh lỗi chuyển đổi, tích hợp, hay gộp chung từ nhiều tập liệu khác nhau, thang đo tỷ lệ phát sinh lỗi chuyển đổi liệu, hay tỷ lệ lỗi xuất trình lưu trữ liệu định dạng đến chuyển đổi sang định dạng khác - Mức độ liên quan (Relevance) Mức độ liên quan có nghĩa liệu thu thập phải liên quan đến mục tiêu kinh doanh, mục tiêu nghiên cứu tổ chức, có hữu ích cho chiến lược, sáng kiến tương lai hay khơng? cịn tính hợp lý thể chỗ liệu mẫu liệu đáp ứng kỳ vọng tổ chức, Cơng ty khơng? Ví dụ việc phân phối điểm bán hàng khu vực thành phố Hồ Chí Minh có ý nghĩa khơng dựa việc phân tích liệu khách hàng khu vực Để đo lường mức độ liên quan hay tính hợp lý liệu chúng | ta có nhiều cách khác cịn phụ thuộc vào quan điểm tổ chức, công ty với định hướng phát triển, mục tiêu ngắn hạn, dài hạn khác nhau, nhiệm vụ hoạt động phòng ban chức năng, phụ thuộc vào nhu cầu, mong muốn người Sử dụng liệu Mặc dù vậy, coi tiêu chí chất lượng liệu cần quan tâm, cần xem xét bắt đầu thu thập, khai thác sử dụng liệu, cho dù nguồn liệu đáp ứng đủ từ Accuracy, Completeness, Consistency, Integrity hay tiêu chuẩn đo lường khác chúng tơi nói đến đây, mà khơng thể liên quan đến “business goals”, “operational goals” khơng mang lại giá trị - Tính kịp thời (Timeliness) Tính kịp thời, lúc liệu liên quan đến việc liệu có cung cấp, mơ tả thơng tin kiện xảy gần hay khơng, nói cách khác liệu kiện, tượng, đối tượng nghiên cứu phải thu thập sớm tốt vừa 80 xuất hiện, liệu qua thời gian khơng cịn xác, giảm giá trị, khơng cịn phù hợp để sử dụng bối cảnh hay tương lai Nếu liệu phản ánh kiện xảy gần đây, có nhiều khả phản ánh thực tế cách hợp lý hơn, ngược lại với liệu lỗi thời q cũ Tính kịp thời liệu cịn kết hợp tương ứng tính sẵn có liệu (availability) khả tiếp cận liệu (accessability) Các thước đo sử dụng giá trị liệu theo thời gian thay đổi theo thời gian, mức độ biến động dự kiến liệu – tần suất liệu thay đổi theo thời gian, hay lý gì, sau độ trễ khoảng thời gian từ lúc liệu xuất đến đưa vào sử dụng - Tính hợp lệ (Validity) Tính hợp lệ, hiệu lực sử dụng liệu liên quan đến cách liệu thu thập, chuyển đổi khơng phải chất liệu Dữ liệu coi hợp lệ, có hiệu lực sử dụng đạt yêu cầu định dạng, loại liệu, giá trị, thông tin liệu cung cấp nằm phạm vi phù hợp, Ví dụ: Công ty thu thập liệu thời gian người dùng truy cập trang web công ty, trước tiên phải xác định format chuẩn, cố định sử dụng mốc thời gian 24 (vì số ngun nhân đó), thay 12 (pm am) sử dụng hai chữ số cho phút hai cho giờ, 17:15, 08:20, 19:30, sau đối chiếu với liệu, liệu không theo định dạng khơng thể sử dụng Để đo lường tính hợp lệ, phải thiết lập bảng tham thiếu liệu bao gồm phạm vi thơng tin liệu (ví dụ liệu chi bao gồm thông tin khách hàng khu vực thành phố Hồ Chí Minh), phạm vi giá trị (ví dụ liệu số tiền giao dịch hàng ngày không vượt 50 triệu VND), định dạng, loại liệu, yêu cầu khác liệu, sau thiết lập xong bảng bắt đầu kiểm tra, đối chiếu với liệu 4.7.4 Kiểm định giả thuyết thống kê 4.7.4.1 Nguyên lý Giả thuyết thống kê giả sử hay phát biểu đúng, sai liên quan đến tham số, luật phân phối hay tính chất biến ngẫu nhiên Khi thực kiểm định, người ta thiết lập cặp giả thiết thống kê, giả thuyết không giả thuyết ngược lại (giả thiết đối) - Giả thuyết không: giả sử mà muốn kiếm định thường ký hiệu H0 - Giả thuyết ngược lại: Việc bác bỏ giả thuyết không dẫn đến việc chấp nhận giả thuyết ngược lại Giả thuyết ngược lại thường ký hiệu H Ví dụ: 𝐻0: µ = 0,5, 𝐻1: µ ≠ 0,5 Tất giá trị có đại lượng thống kê trongkiểm định chia làm miền: miền bác bỏ miền chấp nhận Giá trị chia đôi hai miền gọi giá trị giới hạn (Critical value) - Miền bác bỏ miền chứa giá trị làm cho giả thuyết 𝐻0 bị bác bỏ - Miền chấp nhận miền chứa giá trị giúp cho giả thuyết 𝐻0 không bị bác bỏ 81 Hình 4.3 Miền bác bỏ miền chấp nhận Giả thiết khơng giả thiết đối giả thiết đơn hay giả thiết kép Một giả thiết gọi đơn đưa giá trị cụ thể cho tham số (ví dụ 𝐻0: β=0.5) Một giả thiết gọi kép đưa khoảng giá trị phân bố xác suất (ví dụ 𝐻0: β>0,5) Liên quan đến vấn đề người ta có kiểm định hai phía kiểm định phía Việc kiểm định thực theo bước sau: - B1: Lập mẫu ngẫu nhiên (X1, X2, X3, …, Xn) cho biến ngẫu nhiên X - B2: Tìm hàm G = f(X1, X2, X3, …, Xn, Z), cho luật phân bố hàm G biết (Z thông số liên quan đến giả thiết cần kiểm định) - B3: Tìm miền W cho xác suất để giá trị hàm G rơi vào miền với 0 khơng có sở bác bỏ giả thiết H0 (chấp nhận) Miền bác bỏ miền chấp nhậnH0 H0: µ ≥3.5 H1: µ3.5 H0: µ =3.5 H1: µ ≠3.5 4.7.4.2 Các kiểm định thơng dụng a, Kiểm định phía cho trung bình tổng thể 82 Giả định: Tổng thể có phân phối chuẩn Giả thiết khơng ≤ ≥ Phương sai biết (σ2 biết) Thống kê kiểm định: sử dụng phân phối Z: Z X (4.7) n Kiểm định phía cho trung bình tổng thể H0: 0 H0: H1: 0 Ví dụ: Để kiểm tra xem trọng lượng trung bình hộp ngũ cốc có nhiều 368 grams hay không? Người ta lấy mẫu 25 hộp thấy trọng lượng trung bình 372.5 Công ty xác định độ lệch chuẩn cho phép σ = 15 grams Hãy thực kiểm định với a = 0.05 H0: 368 H1: > 368 b, Kiểm định hai phía cho trung bình tổng thể Ví dụ: Để kiểm tra xem trọng lượng trung bình hộp ngũ cốc có 368 grams hay không? Người ta lấy mẫu 25 hộp thấy trọng lượng trung bình 372.5 Cơng ty xác định độ lệch chuẩn cho phép σ = 15 grams Hãy thực kiểm định với α = 0.05 H0: = 368 H1: ≠ 368 Trường hợp kiểm định cho trung bình tổng thể chưa biết phương sai (hay độ lệch chuẩn), ta sử dụng thống kê T Việc kiểm định cho phương sai tổng thể ta sử dụng thống kê thực tương tự 83