1. Trang chủ
  2. » Giáo Dục - Đào Tạo

KHOA học dữ LIỆU ôn tập

4 364 13

Đang tải... (xem toàn văn)

THÔNG TIN TÀI LIỆU

Nội dung

Chương 1: Chọn phát biểu sai: a Internet vạn vật khiến cho lượng liệu thu thập tăng cao b AI sử dụng kết từ khoa học liệu để thơng minh hơn, xác c Bigdata công nghệ lưu trữ khai thác liệu có dung lượng lớn (volume), đa dạng (variety), u cầu tốc độ cao (velocity) có tính xác thực (Veracity) d Data mining phương pháp phân tích liệu khoa học liệu Kết mà khoa học liệu hướng đến là: a Dữ liệu b Thông tin c Tri thức d Tất Chương Công cụ thống kê mô tả sử dụng cần tổng hợp liệu đa chiều a Subtotal b Consolidate c PivotTable d Tất sai Công cụ thống kê mơ tả sử dụng trường hợp liệu chiều: a Subtotal b Consolidate c PivotTable d Tất Để hợp liệu từ nhiều bảng không cấu trúc khác ta sử dụng: a Subtotal b Consolidate c PivotTable d Tự làm tay Để tính số EMA chứng khoán người ta sử dụng phương pháp sau đây: a Trung bình trượt (Moving Average) b San mũ (Exponential Smoothing) c Hồi quy (Regression) d Tất sai Để dự đoán xu hướng tăng/giảm mã chứng khoán dự thông tin giá cả, lượng cổ phiếu mua vào bán ngày trước Ta sử dụng cơng cụ sau đây: a Trung bình trượt (Moving Average) b San mũ (Exponential Smoothing) c Hồi quy (Regression) d Tất sai Chương Lựa chọn sau bước quy trình khai thác liệu: a Data Understading b Data preparatiion c Data mining d Evaluation Thuộc tính “Loại khách hàng” có hai giá trị: “VIP”, “Premium” “Economic” thuộc tính thuộc kiểu liệu sau đây: a Liên tục b Rời rạc c Xếp hạng/thứ tự d Định danh Tiền xử lý liệu không bao gồm bước sau đây: a Làm liệu b Chuyển đổi liệu c Thu thập liệu d Rút gọn liệu Có cách dùng để xử lý liệu bị thiếu: a b c d Khi ta cần rời rạc hóa liệu: a Dữ liệu bị thiếu b Dữ liệu thuộc kiểu số học c Dữ liệu thuộc kiểu định danh d Dữ liệu thuộc kiểu nhị phân Chương Phân lớp liệu thuộc phương pháp: a Không giám sát b Bán giám sát c Có giám sát d Phương pháp lai Thuật toán phân lớp tham gia vào q trình sau mơ hình phân lớp liệu: a Huấn luyện b Kiểm thử c Đánh giá d Dự đoán Thuật toán phân lớp sau cho phép xử lý nhiều kiểu/loại liệu khác nhau: a SVM b Cây định c Logistic Regression d Mạng nơ ron Trong orange, biến có kiểu liệu categorical để thuộc tính: a Liên tục b Rời rạc c Định lượng d Số học Đối với tốn phân lớp đa nhãn số đánh giá thường dùng để đánh giá độ hiệu mơ hình phân lớp: a Precision b Recall c F1-score d Accuracy Giá trị a[i;j] ma trận nhầm lẫn (confusion matrix) cho biết: a Số lượng mẫu i phân vào mẫu i b Số lượng mẫu i phân nhầm vào mẫu j c Số lượng mẫu j phân vào mẫu j d Số lượng mẫu j phân nhầm vào mẫu i Phương pháp chọn mẫu liệu sau dùng để khắc phục tình trạng over-fitting: a Chọn mẫu ngẫu nhiên (Random sampling) b Đánh giá chéo (k-fold cross validation) c Hold-out d Huấn luyện kiểm thử tập liệu Một người bị nghi ngờ bệnh lao thực xét nghiệm Nếu kết xét nghiệm cho thấy người bị lao thật không mắc bệnh lao Trường hợp này, gọi là: a Tỷ lệ bỏ sót b Độ nhạy c Tỷ lệ báo động nhầm d Độ lỗi Chương Phân cụm liệu thuộc phương pháp a Có giám sát b Khơng giám sát c Phương pháp lai d Bán giám sát Một phương pháp phân cụm tốt phương pháp cho kết phân cụm mà đó: a Độ tương đồng bên cụm cao, đồng thời độ tương đồng cụm cao b Độ tương đồng bên cụm thấp, đồng thời độ tương đồng cụm cao c Đô tương đồng bên cụm cao, đồng thời độ tương đồng cụm thấp d Độ tương đồng bên cụm thấp, đồng thời độ tương đồng cụm thấp Thuật toán sau cho phép phần tử thuộc nhiều cụm khác nhau: a Diana b K-mean c DBSCAN d Fuzzy C-mean Thuật toán phân cụm sau không cần biết trước số cụm: a K-mean b Agnes c Fuzzy C-mean d DBSCAN Trong Orange, thuật tốn phân cụm phân cấp (HAC) để có kết phân cụm với số lượng cụm cụ thể ta cần làm gì? a Chọn số lượng cụm k hộp thoại b Chọn phương pháp tính khoảng cách trước chọn thuật toán c Chọn đường cắt phù hợp phân cấp kết d Không cần làm So sánh kết mơ hình để xem xét tính hiệu việc phân cụm thuộc cách đánh giá sau đây: a Đánh giá b Đánh giá c Đánh giá tương đối d Tất cách Trong Orange, thuật toán K-mean, tham số đầu vào sau dùng để kiểm soát trường hợp liệu hội tụ chậm không hội tụ: a Số lượng cụm (number of cluster) b Khởi tạo phần tử đại diện cụm (Initialization) c Số lần chạy (re-runs) d Số lần lặp tối đa (maximum iterations) ... để xử lý liệu bị thiếu: a b c d Khi ta cần rời rạc hóa liệu: a Dữ liệu bị thiếu b Dữ liệu thuộc kiểu số học c Dữ liệu thuộc kiểu định danh d Dữ liệu thuộc kiểu nhị phân Chương Phân lớp liệu thuộc... tính thuộc kiểu liệu sau đây: a Liên tục b Rời rạc c Xếp hạng/thứ tự d Định danh Tiền xử lý liệu không bao gồm bước sau đây: a Làm liệu b Chuyển đổi liệu c Thu thập liệu d Rút gọn liệu Có cách dùng... nhiều kiểu/loại liệu khác nhau: a SVM b Cây định c Logistic Regression d Mạng nơ ron Trong orange, biến có kiểu liệu categorical để thuộc tính: a Liên tục b Rời rạc c Định lượng d Số học Đối với

Ngày đăng: 22/09/2020, 21:50

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w