PowerPoint Presentation 16 1 Chương 16 THĂM DÒ, TRÌNH BÀY VÀ XEM XÉT DỮ LiỆU 16 2 Types of Data Analysis Các loại phân tích dữ liệu • Exploratory data analysis (Phân tích dữ liệu thăm dò) – the data g[.]
Chương 16 THĂM DỊ, TRÌNH BÀY VÀ XEM XÉT DỮ LiỆU 16-1 Types of Data Analysis Các loại phân tích liệu • Exploratory data analysis (Phân tích liệu thăm dò) – the data guide the choice of analysis or a revision of the planned analysis (dữ liệu giúp chọn loại phân tích, hay xem xét lại kế hoạch phân tích liệu) • Confirmatory data analysis (Phân tích liệu khẳng định) – closer to classical statistical inference in its use of significance and confidence (gần với suy diễn thống kê cổ điển, sử dụng mức ý nghĩa độ tin cậy) – may use information from a closely related data set or by validating findings through the gathering and analyzing of new data (sử dụng thơng tin từ tập liệu có liên quan gần hay xác nhận kết qua việc thu thập phân tích liệu mới) 16-2 Các kỹ thuật trình bày xem xét phân phối liệu • Frequency Table (Bảng tần số) • Visual Displays (trình bày đồ họa) – Histograms (biểu đồ phân phối tần số) – Stem-and-leaf display (biểu đồ thân lá) – Box-plot (biểu đồ hộp) • Crosstabulation of Variables (Bảng chéo) 16-3 Các kỹ thuật trình bày xem xét phân phối liệu • Histograms (biểu đồ phân phối tần số) – Display all intervals in a distribution, even without observed values (thể tất khoảng cách phân phối) – Examine the shape of the distribution for skewness, kurtosis, and the modal pattern (xem xét hình dạng phân phối độ lệch, độ nhọn, hình mẫu phân phối) See statistics, charts 16-4 Các kỹ thuật trình bày xem xét phân phối liệu • Box-plot (box and whisker-plot)- Biểu đồ hộp râu – Rectangular plot encompasses 50% of the data values (hình hộp vng thể 50% giá trị quan sát) – Center line through the width of the box marks the median (đừng trung tâm hộp vuông thể số trung vị) – Whiskers extend from the right and left hinges to the largest and smallest value (Các râu kéo dài hai phía phải trái đến giá trị lớn giá trị nhỏ mẫu quan sát) See statistics, charts 16-5 Crosstabulation Bảng chéo • A technique for comparing two classification variables (Một kỹ thuật so sánh biến phân loại với nhau) – Cells (ơ) – Marginals (các dịng hay cột biên) – Contingency tables (bảng ngẫu nhiên) 16-6 Use of percentage Cách sử dụng phần trăm • Đơn giản hóa liệu cách giảm tất số xuống cịn từ đến 100 • Chuyển liệu thành hình thức chuẩn nhằm mục đích so sánh tương đối 16-7 Percentaging Errors Các sai lầm tính phần trăm • Averaging percentages without weighting (tính phần trăm trung bình mà khơng gia trọng) • Using too-large percentages (>100%) (dùng số % lớn) • Using percentage with very small sample (dùng số % mẫu quan sát nhỏ) • Citing percentage decrease exceeding 100 percent (% giảm vượt 100%) 16-8 ... tập liệu có liên quan gần hay xác nhận kết qua việc thu thập phân tích liệu mới) 16- 2 Các kỹ thuật trình bày xem xét phân phối liệu • Frequency Table (Bảng tần số) • Visual Displays (trình bày. .. kurtosis, and the modal pattern (xem xét hình dạng phân phối độ lệch, độ nhọn, hình mẫu phân phối) See statistics, charts 16- 4 Các kỹ thuật trình bày xem xét phân phối liệu • Box-plot (box and whisker-plot)-... phân tích liệu • Exploratory data analysis (Phân tích liệu thăm dị) – the data guide the choice of analysis or a revision of the planned analysis (dữ liệu giúp chọn loại phân tích, hay xem xét lại