1. Trang chủ
  2. » Giáo án - Bài giảng

Bài Tập - Bài Giải - Đề Cương Môn Phân Tích Dữ Liệu - Cách Vẽ Sơ Đồ Pareto Và Histogram

15 31 0
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Nội dung

BÀI TẬP - BÀI GIẢI - đề cương Môn phân tích dữ liệu - Cách vẽ sơ đồ Pareto và Histogram

PHẦN 1: THU THẬP DỮ LIỆU Câu 1: Hãy đề xuất phương pháp chọn mẫu phù hợp với tình nghiên cứu sau: Nghiên cứu thái độ hành khách xe bus vé tháng Nghiên cứu thỏa mãn sinh viên nội trú học tập trường Đại học Doanh số đạt cho sản phẩm ABC doanh nghiệp XYZ TP Hồ Chí Minh Nghiên cứu nguyên nhân “nhảy việc” nhân viên văn phịng địa bàn TP Hồ Chí Minh Câu 2: Từ danh sách khách hàng du lịch quốc tế nên đoàn giả định tổng thể bạn chọn mẫu ngẫu nhiên gồm quan sát phương pháp chọn mẫu sau: (1) Chọn mẫu ngẫu nhiên đơn giản, (2) Chọn mẫu phân tầng giới tính, (3) Chọn mẫu hệ thống ST T HỌ VÀ GIỚI TÊN TÍNH NGUYỄN NAM A NGUYỄN NỮ B NGUYỄN NAM C NGUYỄN NAM D NGUYỄN NỮ E NGUYỄN NỮ F NGUYỄN NỮ G NGUYỄN NỮ NGUYỄN NAM NGUYỄN NAM NGUYỄN NỮ NGUYỄN NAM NGUYỄN NỮ NGUYỄN NỮ NGUYỄN NỮ NGUYỄN NỮ NGUYỄN NAM NGUYỄN NAM NGUYỄN NAM NGUYỄN NAM H I 10 J 11 K 12 L 13 M 14 N 15 O 16 P 17 Q 18 R 19 S 20 T BÀI GIẢI (1) Chọn mẫu ngẫu nhiên đơn giản =RANDBETWEEN(1,20) Mỗi lần có số khác Thí dụ: 5, 8, 9, 12 (E, H, I, L) (2) Chọn mẫu phân tầng giới tính ST T HỌ TÊN VÀ GIỚI TÍNH ST T HỌ TÊN VÀ GIỚI TÍNH NGUYỄN NAM A NAM C NAM D NAM I NAM J NAM L NAM Q NAM R NGUYỄN NỮ NGUYỄN NỮ NGUYỄN NỮ NGUYỄN NỮ NGUYỄN NỮ NGUYỄN NỮ N NGUYỄN NAM S 10 NỮ M NGUYỄN NGUYỄN K NGUYỄN NỮ H NGUYỄN NGUYỄN G NGUYỄN NỮ F NGUYỄN NGUYỄN E NGUYỄN NỮ B NGUYỄN NGUYỄN O NGUYỄN NAM T 10 P Tỷ lệ nam nữ 10/20=0,5 Do đó, dàn chọn mẫu chia theo giới tính chọn (1 nam nữ) (3) Chọn mẫu hệ thống N=20, n=4; N/n=20/4=5 Chia danh sách tổng thể theo thứ tự người nhóm Có nhóm Thí dụ: ST T HỌ VÀ GIỚI TÊN TÍNH NGUYỄN NAM A NGUYỄN NỮ B NGUYỄN NAM C NGUYỄN NAM NGUYỄN NỮ D E Dùng lệnh RANDBETWEEN(1,5) chọn người nhóm cịn lại làm tương tự chọn người Kết hợp danh sách chọn người PHẦN 2: TĨM TẮT VÀ TRÌNH BÀY DỮ LIỆU BẰNG BẢNG VÀ BIỂU ĐỒ Câu 1: Điểm thi cuối kì lớp học Quản trị doanh nghiệp (thang điểm 100) Yêu cầu: Xây dựng bảng tần số tóm lược liệu Xác định giá trị đại diện tổ Tính tần số tích lũy tần suất tích lũy vẽ biểu đồ phân phối tần số (Histogram) biểu đồ tần suất tích lũy (Ogive) 70 84 90 51 83 61 88 74 85 88 53 77 49 78 99 93 68 95 65 72 79 81 76 97 69 73 98 90 90 91 49 63 87 55 82 84 79 55 65 80 96 80 86 72 54 65 85 82 BÀI GIẢI Số tổ cần chia độ rộng nhóm Có n=48; Xác định số tổ cần chia k=(2*n)1/3; K=4,58=5 nhóm Các nhóm 49 – 59 59 – 69 69 – 79 79 – 89 89 trở lên Số quan sát 16 10 Có thể tham khảo cơng thức H.A Stugres k= 1+ 3,3*log(n) để chia tổ độ rộng nhóm Xây dựng bảng tần số tóm lược liệu Xmax=99 Xmin=49; h=(99-49)/5=10 Điểm 49 – 59 59 – 69 69 – 79 79 – 89 89 trở lên Cộng Tần số (SV) Tần suất (%) 14,6 12,5 18,8 16 33,3 10 20,8 48 100 Xây dựng bảng Tần số tích lũy Tần suất tích lũy tóm lược liệu Điểm 49 – 59 59 – 69 69 – 79 79 – 89 89 trở lên Cộng Tần số (SV) 16 10 Tần suất (%) 14,6 12,5 18,8 33,3 20,8 48 100 Tần số tích Tần suất lũy (SV) tích lũy (%) 13 22 38 48 14,6 27,1 45,9 79,2 100 Biểu đồ phân phối tần số Tools – Data Analysis – Histogram Input range: dãy giá trị liệu + tiêu đề Bin range: dãy giá trị chứa cận + tiêu đề Chọn Label Cummulative Cột điểm: gồm 48 giá trị Cột cận trên: lấy giá trị cận (59, 69 79, 89) Vẽ đồ thị: tương tự trên, hình đồ thị giống đồ thị đứng Câu 2: Chiều cao trẻ em trường học phân nhóm lập thành bảng sau: Chiều cao (m) 100-110 110-120 120-130 130-140 140-150 150-160 160-170 Tổng Số trẻ 20 48 100 170 98 44 20 500 a) Vẽ biểu đồ phân phối tần số biểu đồ tần suất tích lũy Cho biết có bao nhiều trẻ em cao từ 135m trở xuống (EXCEL) b) Vẽ lại biểu đồ phân phối tần số trục tung sử dụng thông tin tần suất Nhận xét đồ thị vẽ Câu 3: Có kết điểm thi nhóm sinh viên vẽ thành biểu đồ nhánh sau (kết từ phần mềm SPSS chạy ra): Frequenc y Stem & 2.3 Leaf 3 4.5 5.4 6.06 7.5 8 Stem wedth: cases 1,00 Each leaf: a) Cho biết nhóm có sinh viên? Người có kết kết tốt nhóm đạt điểm bao nhiêu? b).Từ biểu lập bảng tần số sở phân tổ (chọn số nhóm 4) vẽ biểu đồ phân phối tần số mơ tả lại điểm nhóm sinh viên Dữ liệu phân thành Thân Lá Thí dụ: 28, 23, 30, 24, 19 19 biễu diễn thành 23, 24, 28 biễu diễn thành 30 biễu diễn thành Thâ n Lá BÀI GIẢI a) Frequency cho thấy có 20 SV Điểm min=1.5 max=9 b) Khoảng cách nhóm h=(9-1.5)/4=1.875, làm trịn h=2 chia nhóm: Điểm 1-3 3-5 5-7 7-9 Tổng Số SV 20 PHẦN 3: TÓM TẮT DỮ LIỆU BẰNG CÁC ĐẶC TRƯNG SỐ Câu 1: Số lần phạm lỗi trận đấu mùa giải thực đội bóng đá là: 2, 8, 2, 5, 0, 6, 6, 3, , 4, Xem số liệu tổng thể tất 11 trận đấu diễn Tìm số trung bình, số trung vị mode (yếu vị) số lần phạm lỗi trận đấu Tính khoảng biến thiên độ lệch chuẩn Câu 2: Sáu người chọn ngẫu nhiên để tham gia vào thí nghiệm nhằm chứng minh giả thuyết: nhảy disco cách hiệu để giảm cân Trước đến nay, không số người nhảy disco tất tương đối thừa cân Số cân nặng thay đổi (cân nặng trước – cân nặng sau) ghi lại là: 2, -15, 3, 3, 1, (kg) Tính trung bình số trung vị số cân nặng thay đổi tính độ lệch chuẩn Số liệu có chứng minh disco cách hiệu để giảm cân hay không? Câu 3: Một trị chơi khu vui chơi D phóng phi tiêu trúng thưởng Nếu trị chơi khó q, người trúng người tham gia, nhiều người trúng thưởng tiền thu từ việc bán vé trị chơi khơng trang trải chi phí trả thưởng chi phí thuê mặt bằng, quản lí Để tính tốn mức thưởng hợp lý theo kết người chơi, người chủ thực khảo sát để tìm thơng tin cần thiết cho tính tốn Bảng sau ghi lại khoảng cách tính centimet từ tâm mục tiêu đến điểm mũi tên thổi cắm trúng qua 40 lần thực 40 người tham dự Khoảng cách Tần số 0≤4 4≤8 8≤12 12≤16 16≤20 20≤24 10 24≤28 10 28≤32 Yêu cầu: Tính trung bình số trung vị khoảng cách tính từ tâm Tính phương sai độ lệch chuẩn Câu 4: Số năm làm việc tất nhân viên Công ty ABC sau: Số năm việc làm Số nhân viên 1-5 5-15 15-25 2535 3550 Tổn g 105 231 85 31 625 173 a) Xác định tổ chứa mode, tìm trung bình độ lệch chuẩn Tìm trung vị khoảng biến thiên b) Nhận xét hình dáng phân phối liệu cho biết đại lượng thống kê mô tả phù hợp để mô tả độ tập trung độ phân tán Câu 5: Số lỗi phát sinh ngày hệ thống máy tính Cơng ty ABC ghi chép vòng 100 ngày Xem bảng liệu mẫu Đại lượng thống kê mô tả phù hợp để mô tả số liệu này? Số lỗi Số ngày 15 18 19 19 10 1 a) Tìm giá trị trung bình, trung vị, mode, độ trải giữa, độ lệch chuẩn phương sai b) Dùng phần mềm Excel tính tốn đại lượng thống kê mô tả cho kết sau: So sánh kết tìm câu a kết Excel cung cấp, giải thích lý cho khác biệt (nếu có) * Lưu ý: Mỗi tập giải xong, em sinh viên nên sử dụng phần mềm Excel để giải lại so sánh hai kết với PHẦN 4: BÀI TẬP ĐỌC THÊM Câu 1: Bảng cho số liệu doanh số bán ( Y ), chi phí chào hàng ( X1 ) chi phí quảng cáo ( X2) năm 2006 12 khu vực bán hàng công ty ĐVT: 1.000.000 đ DOANH SỐ CP STT BÁN - Y HÀNG 127 149 106 162 102 180 161 128 139 144 1 159 138 CHÀO CP QUẢNG – X1 CÁO – X2 10 18 10 24 19 16 24 15 17 26 14 25 12 16 11 17 12 23 14 22 15 15 SỬ DỤNG PHẦN MỀM EXCEL HOẶC EVIEWS: Giải thích Hệ số tương quan, Hệ số xác định Hệ số xác định điều chỉnh Ước lượng hàm hồi quy tuyến tính Y theo X1 X2 Nêu ý nghĩa hệ số hồi quy ước lượng Các giá trị có phù hợp với lý thuyết kinh tế không? Kiểm định giả thuyết hệ số hồi quy Ho: b = 0; H1: b ≠ Kiểm định phù hợp hàm hồi quy Ứng dụng dự báo CÂU 2: Có số liệu quan sát doanh nghiệp sau: KỲ (THÁNG ) Jan-05 Feb-05 Mar-05 Apr-05 May-05 Jun-05 Jul-05 Aug-05 Sep-05 Oct-05 Nov-05 Dec-05 Jan-06 Feb-06 Mar-06 Apr-06 May-06 KL HÀNG BÁN - Y (SP) 3011 4875 4220 2542 2967 3194 4340 3082 3449 3120 3616 3494 4129 3326 3742 4627 3700 GIÁ BÁN X1 (1.000 ĐỒNG) 51 47 54 59 59 62 42 52 58 48 50 45 44 48 49 42 50 CHI PHÍ QUẢNG CÁO - X2 (1.000 ĐỒNG) 3361 4533 4401 3323 3515 3837 4179 3535 3910 3202 3795 3722 4108 3594 3885 4428 3905 SỬ DỤNG PHẦN MỀM EXCEL HOẶC EVIEWS: Giải thích Hệ số tương quan, Hệ số xác định Hệ số xác định điều chỉnh Ước lượng hàm hồi quy tuyến tính Y theo X1 X2 Nêu ý nghĩa hệ số hồi quy ước lượng Các giá trị có phù hợp với lý thuyết kinh tế không? Kiểm định giả thuyết hệ số hồi quy Ho: b = 0; H1: b ≠ Kiểm định phù hợp hàm hồi quy Ứng dụng dự báo Cách vẽ Pareto B1: Tạo thêm cột “phần trăm tích lũy” B2: Bơi đen liệu cần vẽ (bao gồm cột “phần trăm tích lũy”), vào Chart chọn Column, chọn tiếp Clustered Column (trong phần 2D-Column) B3: Kéo to sơ đồ ra, “phần trăm tích lũy” vẽ (có thể nhỏ) bên cạnh số liệu khác Click chuột phải vào biểu đồ thể “phần trăm tích lũy”, chọn Format Data Series, chọn tiếp Secondary Axis Bấm Close B4: Tiếp tục click phải vào biểu đồ “phần trăm tích lũy” chọn Change Series Chart Type Trong phần Line, chọn dạng Stacked Line with Markers Bấm Ok B5: Click vào trục tung bên trái, chọn Format Axis Trong phần Maximum Axis Option, chọn fixed sửa lại giá trị ô trống giá trị tổng mẫu Tiếp tục chọn Fixed phần Major Unit, sửa giá trị ô trống giá trị khoảng cách mong muốn vẽ biểu đồ (Vd: 10, 20, 30, ) Bấm close B6: Click vào trục tung bên phải, chọn Format Axis Trong maximum chọn fixed sửa lại giá trị Có thể sửa giá trị ô Marjor unit muốn Bấm Close B7: Hoàn thiện biểu đồ với tên thông tin khác Cách vẽ Histogram (cho dự liệu chưa thống kê tần số chưa xác định frequency) B1: Vào File chọn Option, chọn tiếp Add-in, chọn tiếp Analysis Toolpak, bấm Go Stick vào ô “Analysis Toolpak” bấm Ok B2: Tô đen số liệu cần vẽ Chọn thẻ Data, chọn Data Analysis (thường bên góc phải) Chọn tiếp Histogram B3: Ô Input Range nhập vùng liệuthống kê Ô Bin Range nhập vùng giá trị cần vẽ tần số Ô Output Range chọn nơi xuất Bấm Ok B4: Từ B3 xuất bảng tần số (Frequency) giá trị lựa chọn Tô đen “bảng mới” Vào Chart chọn Clustered Column, ta vẽ biểu đồ histogram dạng cột ĐỀ CƯƠNG DẠY MƠN PHÂN TÍCH DỮ LIỆU Buổi Buổi Nội dung lý thuyết Bài Nội dung thực hành  Phân loại liệu (1.1)  Thu thập liệu (1.2) Buổi Bài  Trình bày liệu bảng đồ thị (1.3)  Trình bày liệu định tính dạng phân loại đồ thị (1.4)  Trình bày liệu đại lượng số (1.5) Buổi  Ôn kiến thức kinh tế lượng Hồi qui đơn biến     Thực hành EXCEL Lập bảng tần số Vẽ Histogram Vẽ đồ thị Tính đại lượng tập trung Buổi  Hồi qui đơn biến (tt) Thực hành EXCEL  Ứng dụng phần mềm Excel giải tập phần câu hỏi ôn tập (bài 1) Buổi Bài Thực hành EXCEL  Thiết kế bảng câu hỏi (2.1)  Ứng dụng phần mềm Excel  Thu thập thông tin định giải tập phần câu lượng (2.2)  Thu thập thơng tin định tính (2.3) Buổi  Thực hành lập bảng câu hỏi theo nhóm  Hướng dẫn vấn Buổi Bài  Mã hóa  Nhập liệu  Làm liệu Buổi Bài hỏi ôn tập (tiếp theo) Thực hành EXCEL  Thực hành EXCEL để giải tập đọc thêm (bài 1): + Hồi quy đơn biến dạng Y = aX1 + b Y = aX2 +b Thực hành SPSS  Mã hóa liệu  Nhập liệu  Làm liệu Thực hành SPSS  Kiểm định Cronbach’s alpha  Mã hóa liệu (tt) EFA  Nhập liệu (tt)  Tính điểm trung bình  Làm liệu (tt) biến nhóm – Compare mean Buổi  Làm tập tổng hợp Thực hành SPSS  Kiểm định EFA Cronbach Alpha đề tài Buổi 10 Buổi 11 Buổi 12 Kiểm tra kỳ Thực hành SPSS  Kiểm định Cronbach Alpha EFA đề tài Thực hành SPSS Tính điểm trung bình biến nhóm – Compare mean Thi cuối kỳ

Ngày đăng: 01/11/2023, 16:18

TỪ KHÓA LIÊN QUAN

w