Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 77 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
77
Dung lượng
1,35 MB
Nội dung
TRƯỜNG ĐẠI HỌC PHẠM VĂN ĐỒNG KHOA KINH TẾ BÀI GIẢNG MÔN: THỐNG KÊ KINH TẾ (BẬC ĐẠI HỌC) Người biên soạn: Th.S Nguyễn Thị Phương Hảo Năm 2020 CHƯƠNG 1: GIỚI THIỆU VỀ THỐNG KÊ KINH TẾ 1.1 Thống kê phân nhánh thống kê 1.1.1 Định nghĩa thống kê Thống kê hệ thống phương pháp dùng để thu thập xử lý liệu nhằm phục vụ cho trình nghiên cứu định liệu thu thập điều kiện khơng chắn “Thống kê’ có nghĩa: Nghĩa thông thường thu thập số liệu; nghĩa rộng mơn khoa học bố trí, hoạch định quan sát thí nghiệm; thu thập phân tích số liệu rút kết luận số liệu phân tích Do đó, thống kê coi công cụ nghiên cứu khoa học, quản lý kinh tế quản lý xã hội Đây “bộ đồ nghề” nhà nghiên cứu lãnh đạo Tuy nhiên, thuật ngữ thống kê dùng để số thu thập từ hoạt động thống kê mô tả hay thống kê suy luận thực tế Cơ sở lý thuyết cho thống kê lý thuyết xác suất thống kê toán Hiện thống kê ứng dụng rộng rãi nhiều lĩnh vực như: thống kê dân số, thống kê xã hội, thống kê kinh doanh, thống kê bảo hiểm, thống kê giáo dục, thống kê sinh học, thống kê y học,…Trong lĩnh vực kinh tế kinh doanh, thống kê đóng vai trị cơng cụ để phân tích thực trạng tình hình thơng qua liệu thu thập xử lý nhằm tìm hiểu chất tính quy luật tượng điều kiện không gian thời gian cụ thể 1.1.2 Các phân nhánh thống kê Thống kê thường phân thành lĩnh vực: - Thống kê mô tả (Descriptive statistics): phương pháp có liên quan đến việc thu thập số liệu, tóm tắt,trình bày, tính tốn mơ tả đặc trưng khác để phản ánh cách tổng quát đối tượng nghiên cứu - Thống kê suy luận (Inferential statistics): bao gồm phương pháp ước lượng đặc trưng tổng thể, phân tích mối liên hệ tượng nghiên cứu, dự đốn đưa định sở thơng tin thu thập từ kết quan sát mẫu 1.2 Các khái niệm 1.2.1 Tổng thể thống kê đơn vị tổng thể * Tổng thể thống kê (còn gọi tổng thể chung) tập hợp đơn vị cá biệt (hay phần tử) thuộc tượng nghiên cứu, cần quan sát, thu thập phân tích mặt lượng chúng theo hay số tiêu thức Ví dụ 1.1: Tổng thể sinh viên trường đại học Phạm Văn Đồng (các sinh viên có đặc điểm chung sinh viên trường… * Đơn vị tổng thể: đơn vị cá biệt cấu thành nên tổng thể thống kê Ví dụ 1.2: tổng thể sinh viên trường đại học Phạm Văn Đồng sinh viên đơn vị tổng thể… Tuỳ theo mục đích nghiên cứu mà tổng thể xác định có khác Muốn xác định tổng thể thống kê, ta phải xác định tất đơn vị tổng thể Thực chất việc xác định tổng thể thống kê việc xác định đơn vị tổng thể * Phân loại tổng thể thống kê Có nhiều cách để phân loại tổng thể thống kê, cụ thể: - Căn vào nhận biết đơn vị tổng thể + Tổng thể bộc lộ: Tổng thể có ranh giới rõ ràng, nhận biết tất đơn vị trực quan Ví dụ 1.3: Tổng thể cơng ty có cổ phiếu niêm yết sàn giao dịch chứng khốn TP Hồ Chí Minh, tổng thể cổ đông công ty A… + Tổng thể tiềm ẩn: Tổng thể có ranh giới khơng rõ ràng, không nhận biết hết tất đơn vị tổng thể Ví dụ 1.4: Tổng thể doanh nghiệp có hoạt động làm ăn phi pháp, tổng thể người mê tín dị đoan… Trong thực tế, tổng thể tiềm ẩn đa dạng, cần xác định tổng thể nghiên cứu tổng thể bộc lộ hay tiềm ẩn để tìm cách xác định đối tượng cho phù hợp - Căn vào mục đích nghiên cứu + Tổng thể đồng chất: Bao gồm đơn vị giống số đặc điểm chủ yếu có liên quan tới mục đích nghiên cứu Ví dụ 1.5: Sản lượng lúa Việt Nam năm 2018 + Tổng thể không đồng chất: Bao gồm đơn vị có đặc điểm chủ yếu khác có liên quan tới mục đích nghiên cứu Ví dụ 1.6: Sản lượng loại năm 2018 - Căn vào phạm vi nghiên cứu + Tổng thể chung: Bao gồm tất đơn vị thuộc đối tượng nghiên cứu + Tổng thể phận: Bao gồm phần tổng thể chung 1.2.2 Mẫu Mẫu phận tổng thể, đảm bảo tính đại diện chọn để quan sát dùng để suy diễn cho toàn tổng thể Như vậy, tất phần tử mẫu phải thuộc tổng thể, ngược lại phần tử mẫu chưa thuộc mẫu Điều tưởng chừng đơn giản, nhiên số trường hợp việc xác định mẫu dẫn đến nhầm lẫn, đặc biệt trường hợp tổng thể ta nghiên cứu tổng thể tiềm ẩn Ngoài ra, chọn mẫu để làm sở suy diễn cho tổng thể, tức mẫu phải mang tính đại diện cho tổng thể Điều thực không dễ dàng, ta hạn chế tối đa sai biệt khắc phục hoàn toàn 1.2.3 Tiêu thức (biến) thống kê Là đặc điểm đơn vị tổng thể chọn để nghiên cứu tùy theo mục đích nghiên cứu khác Như vậy, tiêu thức thống kê tất đặc điểm đơn vị tổng thể mà đặc điểm chọn để nghiên cứu Ví dụ 1.7: Mỗi sinh viên đơn vị tổng thể có đặc điểm như: tên, tuổi, giới tính, điểm trung bình chung học tập Mỗi đặc điểm chọn để nghiên cứu tiêu thức thống kê Mỗi tiêu thức thống kê có giá trị biểu nó, dựa vào biểu người ta chia làm loại: - Tiêu thức thuộc tính: loại tiêu thức mà biểu số cụ thể mà tên gọi, từ ngữ dùng để phản ánh tính chất đơn vị tổng thể Ví dụ 1.8: giới tính, dân tộc, tơn giáo, tình trạng nhân (có gia đình hay chưa), - Tiêu thức số lượng: loại tiêu thức mà biểu số cụ thể phản ánh đặc trưng đơn vị tổng thể mà cân, đong, đo, đếm số gọi lượng biến tiêu thức Ví dụ 1.9: độ tuổi, số lượng công nhân, suất lao động, mức tiền lương, Có hai loại lượng biến: - Lượng biến rời rạc: Là lượng biến mà giá trị có nhận giá trị nguyên Ví dụ 1.10: Số sinh viên trường đại học, số nhân hộ gia đình, số thành phẩm nhập kho ngày phân xưởng,… - Lượng biến liên tục: Là lượng biến có khả nhận giá trị trục số Ví dụ 1.11: Trọng lượng, chiều cao học sinh; suất lao động công nhân… * Tiêu thức có biểu khơng trùng đơn vị tổng thể gọi tiêu thức thay phiên Ví dụ 1.12: Tiêu thức giới tính (nam – nữ), sinh tử, tiêu thức chất lượng (đạt/không đạt)… 1.2.4 Chỉ tiêu thống kê Là tiêu chí mà biểu số phản ánh quy mơ, tốc độ phát triển, cấu, quan hệ tỉ lệ tượng kinh tế - xã hội điều kiện thời gian khơng gian cụ thể Ví dụ 1.13: Dân số Việt Nam 96.993.385 người vào ngày 12/01/2019 theo số liệu từ Liên Hợp Quốc (Nguồn: https://danso.org/vietnam/); Lợi nhuận công ty B năm 2018 tỷ đồng, * Phân loại tiêu thống kê Có nhiều cách thức phân loại tiêu thống kê khác Phân theo nội dung phản ánh tiêu thống kê chia làm loại: - Chỉ tiêu khối lượng: tiêu nêu lên đặc điểm chung quy mô, khối lượng đơn vị tổng thể Ví dụ 1.14: tiêu số nhân khẩu, khối lượng sản phẩm, số công nhân, diện tích gieo trồng, tổng số dân số - Chỉ tiêu chất lượng: tiêu biểu tính chất, trình độ phổ biến, mối quan hệ tổng thể Ví dụ 1.15: tiêu suất lao động, giá thành đơn vị sản phẩm, Trước tiến hành nghiên cứu thống kê việc trước tiên phải xác định hệ thống tiêu thống kê Hệ thống tiêu thống kê tập hợp tiêu thống kê phản ánh mặt, tính chất quan trọng có liên quan với nhau, bổ sung cho gắn liền với mục tiêu nghiên cứu định tổng thể 1.3 Các loại thang đo thống kê Để lượng hoá tượng nghiên cứu, tuỳ theo tính chất liệu, thống kê đo lường loại thang đo chủ yếu sau: 1.3.1 Thang đo định danh: Thang đo định danh thang đo dùng mã số để phân loại đối tượng Thang đo dịnh danh không mang ý nghĩa mà để lượng hoá liệu cần cho nghiên cứu Nó thường sử dụng cho tiêu thức thuộc tính Người ta thường dùng chữ số tự nhiên 1, 2, 3, để làm mã số Ví dụ 1.16: - Giới tính: người ta thường mã số nam 1; nữ - Tình trạng gia đình: 1: Độc thân ; 2: Kết hơn; 3: Ly dị; 4: Khác * Đặc điểm: Các số thang đo không biểu thị quan hệ kém, cao thấp chuyển từ số sang số khác dấu hiệu đo có thay đổi chất Khơng áp dụng phép tính sử dụng loại thang đo mà đếm tần số xuất biểu 1.3.2 Thang đo thứ bậc: Thang đo thứ bậc thang đo chênh lệch biểu tiêu thức có quan hệ thứ bậc Sự chênh lệch khơng thiết phải Nó dùng cho tiêu thức thuộc tính tiêu thức số lượng Ví dụ 1.17: - Tiền lương cơng nhân doanh nghiệp hàng tháng là: < 800 ngàn đồng; từ 800-1000 ngàn đồng; từ 1000-1500 ngàn đồng > 1500 ngàn đồng - Bậc thợ (7 bậc), chất lượng sản phẩm, xếp hạng huân huy chương * Đặc điểm: Loại thang đo dùng nhiều nghiên cứu xã hội, đo tiêu thức mà biểu có quan hệ thứ tự thái độ, quan điểm người tượng xã hội Với thang đo này, tính tốn đặc trưng chung cho tổng thể cách tương đối qua tính số bình qn, cịn đơn vị tổng thể khơng thực Ví dụ 1.18: Để đánh giá độ tự tin bạn giao công việc mới, người ta đưa thang đo thứ bậc với nấc: Rất tự tin, Tương đối tự tin, Không tự tin Con số 1, 2, nghĩa bạn tự tin gấp 2, gấp lần mà biểu thị quan hệ Tuy nhiên, ta xác định mức độ cao thấp nhóm, khoảng cách biểu không 1.3.3 Thang đo khoảng: Thang đo khoảng thang đo thứ bậc có khoảng cách khơng có điểm gốc khơng (0) tuyệt đối Ví dụ 1.19: Tiêu thức nhiệt độ khơng khí, 0oC biểu hiện; tiêu thức điểm thi, điểm biểu khơng có nghĩa khơng có điểm * Đặc điểm: Có thể sử dụng phép tính cộng, trừ tính đặc trưng dãy số số bình quân, phương sai khơng tính tỷ lệ trị số đo Hạn chế thang đo khoảng chưa có giá trị “khơng tuyệt đối” mà có giá trị quy ước Ví dụ 1.20: Nhiệt độ trung bình thành phố A 30oC, thành phố B 10oC, điều khơng có nghĩa thành phố A nóng gấp lần thành phố B 1.3.4 Thang đo tỷ lệ: Thang đo tỷ lệ thang đo khoảng có điểm gốc khơng (0) tuyệt đối * Đặc điểm: Thang đo tỷ lệ sử dụng rộng rãi để đo lường tượng kinh tế – xã hội Có thể thực tất phép tính với trị số đo so sánh tỷ lệ trị số đo 1.4 Dữ liệu dùng thống kê Khi nghiên cứu tượng kinh tế việc thu thập liệu, sau trình bày liệu phân tích Dữ liệu kiện số thu thập, phân tích tóm lược nhằm trình bày giải thích tượng nghiên cứu * Phân loại liệu Có nhiều tiêu chí để phân loại liệu Tuỳ thuộc vào mục đích, ý nghĩa phạm vi ứng dụng mà người ta lựa chọn tiêu thức phù hợp Ở trình bày số phân loại liệu sử dụng chủ yếu nghiên cứu thống kê - Căn tính chất thơng tin: Có hai loại liệu chủ yếu liệu định tính liệu định lượng * Dữ liệu định tính liệu phản ánh tính chất tính chất đối tượng nghiên cứu Ví dụ 1.21: giới tính sinh viên (nam, hay nữ); thời gian tự học nhà dài hay ngắn Dữ liệu định tính thu thập dễ người ta thường dùng thang đo định danh hay thứ bậc để xác định * Dữ liệu định lượng liệu phản ánh mức độ hay mức độ hơn, theo tiêu thức số lượng đối tượng nghiên cứu Ví dụ 1.22: độ tuổi sinh viên, thời gian tự học ngày, tuần Dữ liệu định lượng nghiên cứu thống kê thường gặp nhiều hơn, dễ áp dụng phương pháp tính tốn, phân tích Khi xác định liệu định tính, người ta thường dùng thang đo khoảng cách hay thứ bậc Mục đích cách phân loại nhằm giúp cho người nghiên cứu xác định trước phương pháp xử lý, tổng hợp phân tích cần sử dụng cho loại liệu cho phù hợp đáp ứng mục tiêu nghiên cứu đặt - Căn nguồn cung cấp: Theo nguồn cung cấp thơng tin có hai loại liệu: liệu thứ cấp liệu sơ cấp * Dữ liệu thứ cấp liệu thu thập từ nguồn có sẵn Những liệu qua tổng hợp, xử lý công bố hay xuất Ví dụ 1.23: Những liệu kết học tập sinh viên lấy phòng đào tạo hay trợ lý đào tạo khoa Dữ liệu thứ cấp có ưu điểm thu thập nhanh, rẻ thiếu chi tiết không đáp ứng yêu cầu nghiên cứu Nguồn liệu thứ cấp phong phú thường gặp nguồn chủ yếu sau: - Nội bộ: Các số liệu báo cáo tình hình sản xuất, tiêu thụ, tài chính, vật tư, nhân phịng ban, phận; số liệu báo cáo từ điều tra khảo sát trước đơn vị (doanh nghiệp, quan, ban, ngành ) - Cơ quan thống kê nhà nước: Các số liệu quan thống kê nhà nước (Tổng cục Thống kê, Cục Thống kê, Phòng Thống kê ) cung cấp niên giám thống kê - Cơ quan phủ: Số liệu quan trực thuộc Chính phủ (Bộ, quan ngang bộ, Uỷ ban nhân dân cấp) công bố hay cung cấp Các số liệu thường chi tiết hơn, mang tính chất đặc thù ngành hay địa phương - Sách, báo, tạp chí xuất Các số liệu thường mang tính thời cập nhật cao, mức độ tin cậy tuỳ thuộc vào nguồn số liệu tờ báo hay tạp chí; - Các tổ chức, hiệp hội, viện nghiên cứu, trường đại học; - Các công ty nghiên cứu cung cấp thông tin * Dữ liệu sơ cấp (thơng tin gốc) liệu khơng có sẵn, liệu ban đầu thu thập trực tiếp từ đối tượng nghiên cứu Ví dụ 1.24: Các liệu có liên quan đến việc tự học sinh viên liệu sơ cấp, khơng có sẵn mà muốn có phải điều tra từ sinh viên - Dữ liệu sơ cấp có ưu điểm chi tiết, độ tin cậy cao tình cụ thể Song hạn chế thu thập tốn kém, phụ thuộc vào trình độ chủ quan người nghiên cứu (nhất tình dự báo) CÂU HỎI ÔN TẬP CHƯƠNG 1 Trình bày khái niệm thường dùng thống kê Trình bày loại thang đo thống kê CHƯƠNG 2: THỐNG KÊ MÔ TẢ Dữ liệu thu thập thường nhiều rối rắm, khó nhận thức tượng nghiên cứu Các phương pháp thống kê mơ tả giúp tóm lược liệu, lược bỏ thứ rườm rà, khó hiểu, nhờ nhận thức đặc trưng cốt lõi tượng 2.1 Mơ tả liệu cho tiêu thức định tính bảng phân phối biểu đồ 2.1.1 Lập bảng phân phối - Trường hợp tiêu thức thuộc tính có biểu hiện: Mỗi biểu tiêu thức hình thành tổ Ví dụ 2.1: giới tính, thành phần kinh tế - Trường hợp tiêu thức thuộc tính có nhiều biểu hiện: Ghép số tổ nhỏ thành tổ lớn tùy theo đặc điểm tượng yêu cầu mức độ chi tiết phân tổ Cần bảo đảm yêu cầu tổ nhỏ ghép phải giống gần giống đặc điểm tính chất Việc ghép tổ đạt hai mục đích, làm cho số tổ đảm bảo tổ có khác đặc điểm, tính chất Ví dụ 2.2: Mặc dù có thành phần kinh tế theo mục đích nghiên cứu, ta cần phân tổ theo thành phần: Nhà nước Nhà nước 2.1.2 Trình bày biểu đồ Phân phối tiêu thức định tính thường mơ tả (trình bày) biểu đồ hình trịn hay biểu đồ hình Trình bày liệu bảng phân phối lên đồ thị thích hợp giúp ta mơ tả tóm tắt đặc trưng phân phối tượng nghiên cứu hình ảnh 2.2 Mô tả liệu cho tiêu thức định lượng bảng phân phối biểu đồ 2.2.1 Lập bảng phân phối Căn vào mức độ thay đổi lượng biến tiêu thức mà ta phân hai trường hợp sau: - Trường hợp 1: Tiêu thức số lượng có biểu Mỗi lượng biến hình thành tổ (số tổ số lượng biến) Trường hợp gọi phân tổ khơng có khoảng cách tổ Source of Variation SS Between Groups MS 3,003636364 1,501818 4,26 19 0,224211 Within Groups Total df 7,263636364 F P-value 6,69825 0,006287 3,521893 21 6.2 Kiểm định TUKEY Từ phần nghiên cứu trên, chấp nhận giả thuyết H0 việc phân tích phương sai kết thúc Nếu bác bỏ H0 có nghĩa khơng phải trung bình tổng thể Vì cần phân tích sâu: Trung bình tổng thể khác nhau, tổng thể có trung bình lớn hơn, nhỏ Có nhiều phương pháp để tiếp tục phân tích sâu Ở giới thiệu phương pháp thông dụng phương pháp TUKEY Với mức ý nghĩa 𝛼, ta so sánh cặp trung bình để phát nhóm khác { 𝐻0 : 𝜇1 = 𝜇2 𝐻0 : 𝜇1 = 𝜇3 𝐻 :𝜇 = 𝜇𝑘 ,{ ,… { 𝑘−1 𝐻1 : 𝜇1 ≠ 𝜇2 𝐻1 : 𝜇1 ≠ 𝜇3 𝐻1 : 𝜇𝑘−1 ≠ 𝜇𝑘 Khi có k nhóm, số cặp cần phải kiểm định tổ hợp chập k nhóm 𝐶𝑘2 Bước 1: tính Dij = |x̅i − x̅| j Bước 2: tính T = q(k,n−k),α √ 𝑀𝑆𝑊 𝑛𝑚𝑖𝑛 𝑛𝑚𝑖𝑛 = 𝑚𝑖𝑛{𝑛1 , 𝑛2 , … 𝑘 } q: phân phối Turkey Bước 3: Bác bỏ H0 Dij >T Ví dụ 6.2: Sử dụng ví dụ 6.1 Trong ví dụ ta có k=3, ta cần kiểm định 𝐶32 = cặp { 𝐻0 : 𝜇1 = 𝜇2 𝐻0 : 𝜇2 = 𝜇3 𝐻0 : 𝜇1 = 𝜇3 ,{ ,{ 𝐻1 : 𝜇1 ≠ 𝜇2 𝐻1 : 𝜇2 ≠ 𝜇3 𝐻1 : 𝜇1 ≠ 𝜇3 D12 = |x̅1 − x̅2 | = 0,2; D23 = 0,65; D31 = 0,85 62 F crit T = 3,59√ 0,224 = 0,6422 D12 < 𝑇 → 𝜇1 = 𝜇2 , D23 > 𝑇 → 𝜇2 ≠ 𝜇3 , D31 > 𝑇 → 𝜇1 ≠ 𝜇3 , Vì x̅1 , x̅2 > x̅3 → 𝜇2 > 𝜇3 , 𝜇1 > 𝜇3 , CÂU HỎI ÔN TẬP CHƯƠNG Câu 1: Phân tích phương sai yếu tố để làm Câu 2: Trình bày bước phân tích phương sai yếu tố Câu 3: Kiểm định Tukey để làm Trình bày bước 63 CHƯƠNG 7: KIỂM ĐỊNH PHI THAM SỐ Ở chương nói đến kiểm định giả thuyết đặc trưng (trung bình, tỷ lệ, phương sai) tổng thể thường giả định tổng thể có phân phối chuẩn Trong chương này, với giả thuyết H0 tham số tổng thể, đề cập đến kiểm định mà phần lớn không gắn liền với tham số mẫu, vậy, chúng gọi kiểm định phi tham số Kiểm định phi tham số sử dụng với loại liệu mà việc đo lường thực thang đo không chặt chẽ, không đáp ứng điều kiện phân phối chặt chẽ kiểm định phi tham số Kiểm định phi tham số sử dụng rộng rãi dùng với nhiều loại liệu khơng địi hỏi điều kiện nghiêm ngặt phân phối tổng thể Tuy nhiên kiểm định phi tham số thường có độ xác thấp kiểm định tham số khơng nên q lạm dụng 6.1 Kiểm định Wilcoxon Kiểm định Wilcoxon áp dụng trường hợp kiểm định hai trung bình tổng thể, mẫu phối hợp cặp Chọn mẫu cặp quan sát (xi, yi) Với mức ý nghĩa 𝛼 ta có bước kiểm định sau: (1) Đặt giả thuyết giống hai tổng thể: Một đuôi phải { 𝐻0 : 𝜇𝑥 − 𝜇𝑦 ≤ 𝐻1 : 𝜇𝑥 − 𝜇𝑦 > Một đuôi trái { Hai đuôi 𝐻0 : 𝜇𝑥 − 𝜇𝑦 ≥ 𝐻1 : 𝜇𝑥 − 𝜇𝑦 < { 𝐻0 : 𝜇𝑥 − 𝜇𝑦 = 𝐻1 : 𝜇𝑥 − 𝜇𝑦 ≠ a) Trường hợp mẫu nhỏ (n ≤ 20): (2) Giá trị kiểm định: - Tính chênh lệch cặp: di = xi - yi - Xếp hạng giá trị tuyệt đối chệch lệch |𝑑𝑖 | theo thứ tự tăng dần, giá trị nhận hạng trung bình, bỏ qua trường hợp chênh lệch - Tìm tổng hạng xếp di mang dấu dương (T+) 𝑇 + = ∑ 𝑟𝑎𝑛𝑘(|𝑑𝑖 |) 𝑑𝑖>0 64 - Tìm tổng hạng xếp di mang dấu (T-) 𝑇 − = ∑ 𝑟𝑎𝑛𝑘(|𝑑𝑖 |) 𝑑𝑖 𝑇𝑛+,𝛼/2 : Chưa đủ sở bác bỏ H0 - Kiểm định phía phải: Tiêu chuẩn kiểm định T = T+ + T ≤ 𝑇𝑛+,𝛼 : Bác bỏ H0, chấp nhận H1 + T > 𝑇𝑛+,𝛼 : Chưa đủ sở bác bỏ H0 - Kiểm định phía trái: Tiêu chuẩn kiểm định T = T+ + T ≤ 𝑇𝑛+,𝛼 : Bác bỏ H0, chấp nhận H1 + T > 𝑇𝑛+,𝛼 : Chưa đủ sở bác bỏ H0 Với 𝑇𝑛+,𝛼 giá trị kiểm định Willcoxon, n+ số cặp quan sát có 𝑑𝑖 ≠ Ví dụ 6.1: Mẫu khách hàng chọn ngẫu nhiên yêu cầu họ cho biết sở thích loại kem đánh A, B thông qua thang điểm từ (thấp nhất) đến (cao nhất) Khách hàng Kem đánh A 3 2 Kem đánh B 5 5 5 Hãy kiểm định giả thuyết cho khơng có xu hướng nghiêng loại sở thích loại kem đánh A, B với 𝛼 =5% Gọi 𝜇𝑥 𝜇𝑦 điểm trung bình sở thích khách hàng kem đánh A B Đặt giả thuyết: { 𝐻0 : 𝜇𝑥 − 𝜇𝑦 = 𝐻1 : 𝜇𝑥 − 𝜇𝑦 ≠ Giá trị kiểm định: 65 Khách hàng Tổng Kem đánh A 3 2 Kem đánh B 5 5 5 Chênh lệch -3 -2 -4 -3 -3 Hạng + 1,5 1,5 Hạng - 3 5 25 Quyết định: T = min(T+, T-) = min(3, 25) = ; n+ =7 T = < T 7,5% = => Bác bỏ giả thuyết H0 Kết luận: Với 𝛼 =5%, cho có khác biệt việc ưa chuộng hai loại kem đánh A B b) Trường hợp mẫu lớn (n>20): Giả thuyết: đặt dạng Giá trị kiểm định: 𝑍= 𝑇 − 𝜇𝑇 ; 𝜎𝑇 Nếu n lớn phân phối Willcoxon gần phân phối chuẩn, lúc trung bình phương sai tính sau: + Trung bình: 𝜇 𝑇 = 𝑛(𝑛+1) + Phương sai: 𝜎𝑇2 = 𝑛(𝑛+1)(2𝑛+1) 24 Quyết định bác bỏ H0: - đuôi: |𝑍| > 𝑍𝛼 - đuôi: |𝑍| > 𝑍𝛼/2 6.2 Kiểm định Mann-Whitney (Kiểm định U) Cũng kiểm định T kiểm định U xem xét trường hợp mẫu độc lập Chọn mẫu ngẫu nhiên độc lập có n1, n2 quan sát từ hai tổng thể có trung bình 𝜇1 , 𝜇2 Với mức ý nghĩa 𝛼, bước kiểm định: 66 a/ Trường hợp mẫu nhỏ (n1, n2 < 10): Đặt giả thuyết: { 𝐻0 : 𝜇𝑥 − 𝜇𝑦 = 𝐻1 : 𝜇𝑥 − 𝜇𝑦 ≠ Giá trị kiểm định: - Xếp hạng tất giá trị mẫu theo thứ tự tăng dần Những giá trị nhận hạng trung bình hai hạng liên tiếp - Cộng hạng tất giá trị mẫu thứ Ký hiệu 𝑅1 - Giá trị kiểm định: 𝑈1 = 𝑛1 𝑛2 + 𝑛1 (𝑛1 +1) − 𝑅1 ; 𝑈2 = 𝑛1 𝑛2 − 𝑈1 𝑈 = min( 𝑈1 , 𝑈2 ) - Tra bảng phân phối để tìm F(U) = Fn1,n2(U) Quyết định bác bỏ H0 khi: α > 2F(U) b/ Trường hợp mẫu lớn (n1, n2 ≥ 10): Phân phối U xem phân phối chuẩn Đặt giả thuyết: Giả thuyết đặt dạng đuôi Giá trị kiểm định: 𝑍= Với : + Trung bình: 𝜇𝑢 = + Phương sai: 𝜎𝑇2 = 𝑈 − 𝜇𝑢 𝜎𝑢 𝑛1 𝑛2 𝑛1 𝑛2 (𝑛1 +𝑛2 +1) 12 Quyết định bác bỏ H0: - đuôi: |𝑍| > 𝑍𝛼 - đuôi: |𝑍| > 𝑍𝛼/2 Ví dụ 6.2: Tại trang trại ni lợn người ta thử áp dụng loại thuốc tăng trọng bổ sung vào phần thức ăn 10 lợn, sau tháng người ta thu thập số liệu trọng lượng lợn (X) Đồng thời người ta thu thập số liệu 15 lợn khác không dùng thuốc tăng trọng (Y) Hãy kiểm tra xem trọng lượng có hay khơng thử nghiệm với 𝛼 =5% 67 Lợn 10 X 60 61 62 62 63 63 68 64 64 65 Y 56 56 57 57 58 58 58 59 59 60 Rank(X) 11,5 15 18 18 20,5 20,5 25 22,5 22,5 24 Rank(Y) 1,5 1,5 3,5 3,5 6 8,5 8,5 11,5 11 12 13 14 15 60 60 61 61 62 Tổng 197,5 11,5 11,5 15 15 18 127,5 Gọi 𝜇1 𝜇2 trọng lượng lợn có sử dụng không sử dụng thức ăn tăng trọng Đặt giả thuyết: { 𝐻0 : 𝜇𝑥 − 𝜇𝑦 = 𝐻1 : 𝜇𝑥 − 𝜇𝑦 ≠ Giá trị kiểm định: 𝑈 = 𝑛1 𝑛2 + 𝜇𝑢 = 𝑛1 𝑛2 = 𝜎𝑇2 = 𝑛1 (𝑛1 +1) 10𝑥15 − 𝑅1 = 10𝑥15 + 10𝑥(10+1) − 197,5 = 7,5 = 75 𝑛1 𝑛2 (𝑛1 + 𝑛2 + 1) 10𝑥15𝑥(10 + 15 + 1) = = 325 12 12 𝑍= 𝑈 − 𝜇𝑢 7,5 − 75 = = −3,744 𝜎𝑢 √325 Quyết định: |𝑍|= 3,744 > Z 2,5% = 1,96 => Bác bỏ H0 Kết luận: Với 𝛼 =5%, trọng lượng lợn có thay đổi sử dụng thuốc tăng trọng 6.3 Kiểm định Kruskal-Wallis Đây trường hợp mở rộng kiểm định Mann-Whitney, thực toán kiểm định k trung bình tổng thể Chọn k mẫu ngẫu nhiên độc lập có n1, n2,…nk quan sát, gọi 𝑛 = ∑ 𝑛𝑖 Xếp hạng tất quan sát theo thứ tự tăng dần, giá trị nhận hạng trung bình Gọi R1, R2…Rk tổng hạng mẫu Giả thuyết: { 𝐻0 : 𝜇1 = 𝜇2 = ⋯ = 𝜇𝑘 𝐻1 : 𝜇1 ≠ 𝜇2 ≠ ⋯ ≠ 𝜇𝑘 Giá trị kiểm định: 𝑊 = 12 𝑛(𝑛+1) ∑𝑘𝑖=1 𝑅𝑖2 𝑛𝑖 Quyết định bác bỏ H0 𝑊 > 𝝌2𝑘−1,𝛼 68 − 3(𝑛 + 1) Ví dụ 6.3: Một nhà nghiên cứu muốn xem xét tổng giá trị sản phẩm sản xuất ngành A, B, C có giống khơng Người ta chọn số xí nghiệp hoạt động ngành có bảng số liệu bên Có thể kết luận 𝛼 = 0,5%? ĐVT: Triệu đồng Xí nghiệp Ngành A 1,38 1,55 1,9 2,0 1,22 2,11 1,98 1,61 Ngành B 2,33 2,5 2,79 3,01 1,99 2,45 Ngành C 1.06 1,37 1,09 1,65 1,44 1,11 Giả thuyết: { 𝐻0 : 𝜇𝐴 = 𝜇𝐵 = 𝜇𝐶 𝐻1 : 𝜇𝐴 ≠ 𝜇𝐵 ≠ 𝜇𝐶 Giá trị kiểm định: Xí nghiệp Ngành A 1,38 1,55 1,9 2,0 1,22 2,11 1,98 1,61 Ngành B 2,33 2,5 2,79 3,01 1,99 2,45 Ngành C 1.06 1,37 1,09 1,65 1,44 1,11 Rank (A) 11 14 15 12 Rank (B) 16 18 19 20 13 17 103 Rank (C) 10 28 𝑊= 12 𝑛(𝑛+1) ∑𝑘𝑖=1 𝑅𝑖2 𝑛𝑖 − 3(𝑛 + 1) = 12 20(20+1) ( 792 + 1032 + 282 Tổng 79 ) − 3(20 + 1) = 13,54 Quyết định: 𝑊 = 13,54 > 𝝌2𝑘−1,𝛼 = 𝑋2,0,05 = 10,579 => Bác bỏ H0 Kết luận, với 𝛼 =0,5%, tổng giá trị sản phẩm trung bình ngành khác 69 6.4 Kiểm định Chi bình phương 6.4.1 Kiểm định Chi bình phương (𝛘𝟐 ) phù hợp Kiểm định phù hợp kiểm định xem giả thuyết phân phối tổng thể số liệu thực tế phù hợp (thích hợp) đến mức độ với giả định phân phối tổng thể a) Kiểm định phù hợp trường hợp giả định biết tham số tổng thể Chọn mẫu ngẫu nhiên n quan sát, chia thành k nhóm khác nhau: quan sát thuộc vào nhóm thứ i (i = 1,…,k) Oi số lượng quan sát nhóm thứ i pi xác suất giả thuyết để quan sát rơi vào nhóm thứ i Vấn đề đặt kiểm định giả thuyế H0 phân phối tổng thể Giả thuyết H0 : Tổng thể có phân phối xác suất pi H1 : Tổng thể khơng có phân phối xác suất pi Giá trị kiểm định: χ2 = ∑ki=1 ( Oi −Ei )2 Ei ; Ei = 𝑛 × pi Điều kiện: kiểm định có ý nghĩa Ei ≥ Quyết định bác bỏ H0 𝝌2 > 𝝌2(𝑘−1),𝛼 Ví dụ 6.4.1: Ở bar có nhãn hiệu bia khác 160 khách hàng chọn ngẫu nhiên cho thấy lựa chọn nhãn hiệu sau: Nhãn hiệu Bia A Bia B Bia C Bia D Số khách hàng 34 46 29 51 Có thể kết luận ưa chuộng khách hàng loại bia không mức ý nghĩa 2,5%? Nhãn hiệu (x) Bia A Bia B Bia C Bia D Tổng Số khách hàng (Oi ) 34 46 29 51 160 Giả thuyết H0 (pi ) 0,25 0,25 0,25 0,25 Ei = 𝑛 × pi 40 40 40 40 ( Oi − Ei )2 Ei 0,9 0,9 3,03 3,03 Giả thuyết: H0 : pA = pB = pC = pD = 0,25 70 7,86 H1 : pA ≠ pB ≠ pC ≠ pD Giá trị kiểm định: χ2 = 7,86; 𝐸𝑖 = 40 > 5: kiểm định có ý nghĩa χ2 = 7,86 < 𝝌2(𝑘−1),𝛼 = 𝝌3,0,025 = 9,384 Quyết định:=> Chấp nhận giả thuyết H0 Kết luận: Ở mức ý nghĩa 2,5% ưa chuộng khách hàng nhãn hiệu bia b) Kiểm định phù hợp trường hợp chưa biết tham số tổng thể Ở phần a) phương pháp kiểm định phù hợp với xác suất để quan sát rơi vào nhóm thứ I (pi) định rõ giả thuyết H0 Phần ta nghiên cứu việc kiểm định giả thuyết quan sát tuân theo quy luật phân phối Trong trường hợp ta phải xác định pi xác suất để quan sát rơi vào nhóm thứ i Sau áp dụng phương pháp tương tự phần a) 6.4.2 Kiểm định Chi bình phương (𝝌𝟐 ) tính độc lập hai biến định tính Đây tốn xét đồng thời hai dấu hiệu định tính (2 mẫu ngẫu nhiên độc lập xét) tổng thể Kiểm định xem hai tiêu thức (định tính) tổng thể có mối liên hệ hay khơng Ví dụ mối liên hệ giới tính với hành vi tiêu dùng Giả sử có mẫu ngẫu nhiên gồm n quan sát, phân nhóm kết hợp thành tiêu thức với nhau, hình thành nên bảng phân nhóm kết hợp gồm r hàng c cột Gọi nij số lượng quan sát tương ứng với hàng i cột j, n tổng quan sát r hàng đồng thời tổng quan sát c cột Phân nhóm theo Phân nhóm theo tiêu thức thứ tiêu thức thứ hai … c ∑ n11 n12 … n1c R1 n21 n22 … n2c R2 … … … … … … R nr1 nr2 … nr2 Rr ∑ C1 C2 … CC Cn Đặt giả thuyết: 71 𝐻0 : khơng có mối liên hệ hai tiêu thức 𝐻1 : Tồn mối liên hệ hai tiêu thức Giá trị kiểm định: r c ( nij − Eij ) χ = ∑∑ Eij 2 i=1 j=1 Eij = 𝐶𝑗 𝑅𝑖 𝑛 Quyết định bác bỏ H0 𝝌2 > 𝝌2(𝑟−1)(𝑐−1),𝛼 Ví dụ 6.4.2: Một nghiên cứu thực nhằm xem xét mối liên hệ giới tính ưa thích nhãn hiệu nước giải khát, mẫu ngẫu nhiên 2.425 người tiêu dùng với nhãn hiệu nước giải khát ưa thích sau: Nhãn hiệu ưa thích Giới tính Coca Pepsi 7Up Nam 308 177 114 Nữ 502 627 697 Kiểm định giả thuyết khơng có mối liên hệ giới tính ưa thích nhãn hiệu nước giải khát mức ý nghĩa 𝛼 = 0,5% Đặt giả thuyết: 𝐻0 : Khơng có mối liên hệ giới tính ưa thích nhãn hiệu nước giải khát H1 : Có mối liên hệ giới tính ưa thích nhãn hiệu nước giải khát Giá trị kiểm định: 72 Nhãn hiệu ưa thích Giới tính Nam E1j ( n1j − E1j ) E1j Nữ E2j ( n2j − E2j ) E2j Cj Coca Pepsi 7Up Ri 308 177 114 599 200,08 198,60 200,33 - 58,21 2,35 37,2 - 502 627 697 1826 609,92 605,4 610,67 - 19,1 0,77 12,2 32,07 810 804 811 2425 r c 𝝌𝟐 97,76 32,07 ( nij − Eij ) χ2 = ∑ ∑ = 97,76 + 32,07 = 129,83 Eij i=1 j=1 Eij = 𝐶𝑗 𝑅𝑖 𝑛 Quyết định: 129,83 = χ2 > 𝝌2(𝑟−1)(𝑐−1),𝛼 = 𝝌2(2−1)(3−1),5% = 𝝌22,5% = 10,597 => bác bỏ giả thuyết H0 Kết luận: Ở mức ý nghĩa 𝛼 = 0,5%, giả thuyết H0 bị bác bỏ, có nghĩa có mối liên hệ giới tính ưa thích nhãn hiệu nước giải khát CÂU HỎI ÔN TẬP CHƯƠNG Câu 1: Trình bày bước kiểm định Wilcoxon Câu 2: Trình bày bước kiểm định Mann-Whitney Câu 3: Trình bày bước kiểm định Kruskal-Wallis Câu 4: Trình bày bước kiểm định Chi bình phương 73 MỤC LỤC CHƯƠNG 1: GIỚI THIỆU VỀ THỐNG KÊ KINH TẾ 1.1 Thống kê phân nhánh thống kê 1.1.1 Định nghĩa thống kê 1.1.2 Các phân nhánh thống kê 1.2 Các khái niệm 1.2.1 Tổng thể thống kê đơn vị tổng thể 1.2.2 Mẫu 1.2.3 Tiêu thức (biến) thống kê 1.2.4 Chỉ tiêu thống kê 1.3 Các loại thang đo thống kê 1.3.1 Thang đo định danh: 1.3.2 Thang đo thứ bậc: 1.3.3 Thang đo khoảng: 1.3.4 Thang đo tỷ lệ: 1.4 Dữ liệu dùng thống kê CÂU HỎI ÔN TẬP CHƯƠNG CHƯƠNG 2: THỐNG KÊ MÔ TẢ 2.1 Mô tả liệu cho tiêu thức định tính bảng phân phối biểu đồ 2.1.1 Lập bảng phân phối 2.1.2 Trình bày biểu đồ 2.2 Mô tả liệu cho tiêu thức định lượng bảng phân phối biểu đồ 2.2.1 Lập bảng phân phối 2.2.2 Trình bày biểu đồ 13 2.3 Mô tả tiêu thức định lượng tiêu thống kê 13 2.3.1 Các tiêu đo lường khuynh hướng tập trung 13 2.3.1.1 Số trung bình 13 2.3.1.2 Mode (Mo) 16 2.3.1.3 Số trung vị (Me) 18 2.3.2 Các tiêu đo lường độ phân tán 20 2.3.2.1 Khoảng biến thiên tiêu thức (toàn cự): (R) 20 2.3.2.2 Độ lệch tuyệt đối bình quân (𝒅) 20 2.3.2.3 Phương sai 21 74 2.3.2.4 Độ lệch tiêu chuẩn 22 2.3.2.5 Hệ số biến thiên (V) 23 2.4 Các tiêu mơ tả hình dáng phân phối tiêu thức định lượng 23 CÂU HỎI ÔN TẬP CHƯƠNG 25 CHƯƠNG 3: PHÂN PHỐI CHUẨN VÀ PHÂN PHỐI MẪU 26 3.1 Phân phối chuẩn 26 3.1.1 Định nghĩa 26 3.1.2 Phân phối chuẩn tắc (đơn giản): 27 3.1.3 Khái niệm 𝒁𝜶: 27 3.2 Phân phối vài đại lượng thống kê: 28 3.2.1 Phân phối “Khi bình phương”: 28 3.2.2 Phân phối Student (𝐭- t distribution) 28 3.2.3 Phân phối Fisher (𝐅 distribution) 29 3.3 Phân phối mẫu 29 CÂU HỎI ÔN TẬP CHƯƠNG 30 CHƯƠNG 4: ƯỚC LƯỢNG THAM SỐ CỦA TỔNG THỂ 31 4.1 Các khái niệm 31 4.1.1 Khái niệm ước lượng: 31 4.1.2 Khái niệm ước lượng điểm 31 4.1.3 Khái niệm ước lượng khoảng: 32 4.1.4 Khái niệm khoảng tin cậy 33 4.2 Tham số tổng thể thống kê mẫu 33 4.3 Ước lượng điểm 33 4.4 Ước lượng khoảng 34 4.4.1 Ước lượng khoảng số trung bình tổng thể 34 4.4.1.1 Khi biết phương sai tổng thể 𝛿2 34 4.4.1.2 Khi chưa biết phương sai tổng thể 𝛿2 35 4.4.2 Ước lượng khoảng tỉ lệ tổng thể 36 4.4.3 Ước lượng khoảng phương sai tổng thể 37 4.5 Ước lượng cở mẫu 38 4.5.1 Kích thước mẫu ước lượng số trung bình tổng thể 38 4.5.2 Kích thước mẫu ước lượng tỷ lệ tổng thể 39 CÂU HỎI ÔN TẬP CHƯƠNG 39 CHƯƠNG 5: KIỂM ĐỊNH THAM SỐ VÀ KIỂM ĐỊNH SỰ KHÁC BIỆT 40 5.1 Các khái niệm 40 75 5.1.1 Giả thuyết kiểm định giả thuyết 40 5.1.2 Các loại sai lầm kiểm định gia thuyết 41 5.1.3 Quy trình tổng quát kiểm định giả thuyết 42 5.1.4 Miền bác bỏ miền xác định kiểm định: 42 5.2 Kiểm định tham số 43 5.2.1 Kiểm định giả thuyết số trung bình tổng thể 43 5.2.1.1 Trường hợp biết phương sai tổng thể -𝜎2 43 5.2.1.2 Trường hợp chưa biết phương sai tổng thể -𝜎2 45 5.2.2 Kiểm định giả thuyết tỷ lệ p tổng thể 46 5.2.3 Kiểm định giả thuyết phương sai tổng thể 47 5.3 Giá trị p kiểm định 48 5.4 Kiểm định khác biệt 50 5.4.1 Kiểm định giả thuyết khác số trung bình tổng thể 50 5.4.1.1 Trường hợp lấy mẫu cặp 50 5.4.1.2 Trường hợp lấy mẫu độc lập: 52 5.4.2 Kiểm định khác biệt hai tỷ lệ tổng thể (với cỡ mẫu lớn >=40) 54 5.4.2.1 Chệnh lệch hai tổng thể ( p0 = 0) 54 5.4.2.2 Chệnh lệch hai tổng thể khác ( p0 ≠ 0) 55 CÂU HỎI ÔN TẬP CHƯƠNG 56 CHƯƠNG 6: PHÂN TÍCH PHƯƠNG SAI (ANOVA) MỘT YẾU TỐ 57 6.1 ANOVA yếu tố 57 6.2 Kiểm định TUKEY 62 CÂU HỎI ÔN TẬP CHƯƠNG 63 CHƯƠNG 7: KIỂM ĐỊNH PHI THAM SỐ 64 6.1 Kiểm định Wilcoxon 64 6.2 Kiểm định Mann-Whitney (Kiểm định U) 66 6.3 Kiểm định Kruskal-Wallis 68 6.4 Kiểm định Chi bình phương 70 6.4.1 Kiểm định Chi bình phương (𝛘𝟐) phù hợp 70 6.4.2 Kiểm định Chi bình phương (𝝌𝟐) tính độc lập hai biến định tính 71 CÂU HỎI ƠN TẬP CHƯƠNG 73 76 ... thống kê suy luận thực tế Cơ sở lý thuyết cho thống kê lý thuyết xác suất thống kê toán Hiện thống kê ứng dụng rộng rãi nhiều lĩnh vực như: thống kê dân số, thống kê xã hội, thống kê kinh doanh, thống. ..CHƯƠNG 1: GIỚI THIỆU VỀ THỐNG KÊ KINH TẾ 1.1 Thống kê phân nhánh thống kê 1.1.1 Định nghĩa thống kê Thống kê hệ thống phương pháp dùng để thu thập xử lý liệu nhằm phục... thống kê xã hội, thống kê kinh doanh, thống kê bảo hiểm, thống kê giáo dục, thống kê sinh học, thống kê y học,…Trong lĩnh vực kinh tế kinh doanh, thống kê đóng vai trị cơng cụ để phân tích thực