40 câu trắc nghiệm Phân tích và trực quan dữ liệu có đáp án

5 197 0
40 câu trắc nghiệm Phân tích và trực quan dữ liệu có đáp án

Đang tải... (xem toàn văn)

Thông tin tài liệu

1. Phân Tích Dữ Liệu: Mục Tiêu Chính: Phân tích dữ liệu nhằm hiểu rõ thông tin chứa đựng trong tập dữ liệu, tìm ra mối quan hệ, xu hướng, và nhận biết thông điệp cụ thể. Phương Pháp Phân Tích: Thống Kê Mô Tả: Sử dụng các thước đo như mean, median, mode, range để mô tả đặc điểm cơ bản của dữ liệu. Phân Tích Phân Phối: Xác định sự phân bố của dữ liệu bằng histogram, kernel density plot. Kiểm Định Thống Kê: Sử dụng kiểm định như tTest, ANOVA để đánh giá sự khác biệt giữa các nhóm. 2. Trực Quan Dữ Liệu: Mục Tiêu Chính: Biểu diễn dữ liệu một cách trực quan và rõ ràng để dễ dàng hiểu và truyền đạt thông điệp. Loại Biểu Đồ Thông Dụng: Bar Chart: Hiển thị sự so sánh giữa các giá trị. Line Chart: Biểu diễn sự biến động của dữ liệu theo thời gian hoặc biến số. Scatter Plot: Hiển thị mối quan hệ giữa hai biến. Pie Chart: Phản ánh phần trăm của toàn bộ. Box Plot: Thể hiện phân phối và mô tả các giá trị ngoại lệ. Công Cụ Trực Quan Hóa: Sử dụng các công cụ như Matplotlib, Seaborn, Plotly trong Python. 3. Data Cleaning và Chuẩn Hóa: Loại Bỏ Dữ Liệu Nhiễu: Xử lý giá trị thiếu, giá trị ngoại lệ để đảm bảo tính chính xác của phân tích. Chuẩn Hóa Dữ Liệu: Chuyển đổi dữ liệu về một định dạng thống nhất, giúp dễ dàng so sánh và phân tích. 4. Data Exploration: Exploratory Data Analysis (EDA): Khám phá sơ bộ dữ liệu để đưa ra những nhận xét, giả định và hiểu rõ hơn về đặc điểm của tập dữ liệu. 5. Mô Hình Hóa Dữ Liệu: Dự Đoán và Phân Loại: Sử dụng mô hình hóa để dự đoán giá trị mới hoặc phân loại dữ liệu vào các nhóm khác nhau. Overfitting và Underfitting: Quản lý mô hình để tránh tình trạng quá mức phức tạp hoặc đơn giản.

TRẮC NGHIỆM PHÂN TÍCH VÀ TRỰC QUAN DỮ LIỆU CĨ ĐÁP ÁN Để biểu diễn mối quan hệ hai biến, biểu đồ thường sử dụng? a Radar Chart b Box Plot c Scatter Plot d Histogram Trong Python, thư viện thường sử dụng để tạo biểu đồ phân phối tần suất? a Pandas b Seaborn c Numpy d Matplotlib Khi muốn tìm hiểu biến động liệu, loại biểu đồ thường sử dụng? a Bar Chart b Line Chart c Box Plot d Pie Chart Trong SQL, câu lệnh sử dụng để lọc liệu theo điều kiện đó? a WHERE b SELECT c FROM d GROUP BY Đối tượng Python thường sử dụng để xử lý phân tích liệu tabular (dạng bảng)? a List b Set c DataFrame d Tuple Thuật ngữ "Data Cleansing" ám hoạt động trình xử lý liệu? a Lọc liệu theo điều kiện b Loại bỏ liệu trùng lặp c Chuyển đổi liệu thành định dạng khác d Xử lý làm liệu từ giá trị khơng hợp lệ thiếu Trong phân tích liệu, mục tiêu việc sử dụng mơ hình hóa gì? a Hiển thị liệu theo cách trực quan b Dự đoán giá trị từ liệu c Sắp xếp tổ chức liệu d Loại bỏ giá trị ngoại lệ Thuật ngữ "Descriptive Statistics" ám hoạt động phân tích liệu? a Mơ hình hóa liệu b Mô tả tổng quan liệu c Lọc lấy liệu d So sánh liệu Trong biểu đồ Box Plot, ô đại diện cho phần trăm giá trị Q1 Q3? a Whisker b Box c Outlier d Median Line Trong Python, thư viện cung cấp công cụ để làm việc với liệu dạng bảng? a Pandas b Numpy c Matplotlib d Seaborn Khi muốn biểu diễn biến động biến theo thời gian, biểu đồ thường sử dụng? a Bar Chart b Scatter Plot c Line Chart d Pie Chart Trong SQL, câu lệnh sử dụng để kết hợp liệu từ nhiều bảng? a JOIN b MERGE c UNION d GROUP BY Phương pháp sử dụng để loại bỏ giá trị ngoại lệ từ tập liệu? a Trung bình cộng b Medcouple c Z-Score d Chi-squared Thuật ngữ "Data Mining" ám hoạt động phân tích liệu? a Đào sâu vào liệu để tìm thông tin tiềm ẩn b Loại bỏ giá trị thiếu từ liệu c Tổng hợp tổ chức liệu d Biểu diễn liệu biểu đồ Trong Python, thư viện thường sử dụng để trực quan hóa liệu scientific? a Seaborn b Matplotlib c Pandas d Plotly Đối tượng sử dụng để biểu diễn quan hệ nhiều-nhiều hai bảng C#? a ForeignKey b DataRelation c DataAdapter d DataView Phương pháp sử dụng để đánh giá mối quan hệ hai biến số? a Chi-squared Test b ANOVA c Correlation d t-Test Trong Excel, công cụ sử dụng để thực phân tích liệu nhanh chóng trực quan hóa? a PivotTable b VLOOKUP c IF Function d SUMIF Trong biểu đồ Radar Chart, điểm đại diện cho giá trị lớn biến? a Đỉnh (peak) b Đáy (base) c Góc (angle) d Đồng trục (axis) Trong Python, thư viện thường sử dụng để làm việc với liệu đa chiều trực quan hóa thơng tin địa lý? a Matplotlib b Seaborn c GeoPandas d Plotly Đáp Án: c b c a c d b b b a c a c a b b c a a c

Ngày đăng: 17/12/2023, 23:48

Tài liệu cùng người dùng

Tài liệu liên quan