1. Trang chủ
  2. » Giáo Dục - Đào Tạo

Câu hỏi trắc nghiệm khai thác dữ liệu

26 432 5

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Câu Hỏi Trắc Nghiệm Khai Thác Dữ Liệu
Định dạng
Số trang 26
Dung lượng 885,21 KB

Nội dung

CÂU HỎI TRẮC NGHIỆM KHAI THÁC DỮ LIỆU. Bộ câu hỏi trắc nghiệm thi kết thúc học phần mới nhất được cập nhật của 2023. Câu hỏi có đáp án chuẩn xác 100%. Các từ khóa về KMeans, clusters trong gom cụm phân cấp (hierachical clustering), cách tính các điểm trong không gian, giải thuật, giá trị thuộc tính...

CÂU HỎI TRẮC NGHIỆM KHAI THÁC DỮ LIỆU Câu hỏi Các lần chạy K-means có khả cho kết khác hay sai? Select one: a Sai b Đúng Câu hỏi Các ý sau với K-Means: K-Means nhạy cảm với việc khởi tạo tâm cụm Việc khởi tạo tâm cụm không tốt dẫn đến việc hội tụ Việc khởi tạo tâm cụm không tốt dẫn đến kết gom cụm Select one: a b c d và 1, 2, và Câu hỏi Chỉ mệnh đề sai K-Means Select one: a Giải thuật gom cụm K-means tương tự giải thuật KNN (K- nearest neighbor) b Tất mệnh đề sai c K-Means phân chia n đối tượng liệu thành k cụm d K-means phương pháp lượng tử hóa vector (vector quantization) Câu hỏi Giải pháp sau cho phép tính độ tương tự hai clusters gom cụm phân cấp (hierachical clustering) MIN / Single-Link MAX / Complete-Link Average-Link Euclidean Distance Select one: a b c d e Tất Chỉ Tất Tất Tất cả, trừ số có số cả, trừ số cả, trừ số Câu hỏi Giải thuật gom cụm phù hợp với tập liệu mơ tả hình? Select one: a K-Means b DBSCAN Câu hỏi Cho liệu gồm điểm không gian chiều khoảng cách điểm thể bảng sau: Cho biết kết gom cụm dùng phương pháp gom cụm phân cấp với độ đo AVERAGE-Link Select one: a b c d Câu hỏi Cho liệu gồm điểm không gian chiều khoảng cách điểm thể bảng sau: Cho biết kết gom cụm dùng phương pháp gom cụm phân cấp với độ đo MAX Select one: a b c d Câu hỏi Số lượng thuộc tính (features) tối thiểu để gom cụm bao nhiêu? Select one: a b c d e k Câu hỏi Trường hợp sau K-Means không cho kết tốt Dữ liệu có ngoại biên (outlier) Dữ liệu có mật độ phân bố thay đổi Dữ liệu phân bố theo hình trịn Dữ liệu phân bố theo dạng hình khơng lồi (non-convex) Select one: a b c d e và 2 1, 2, 1, 2, Câu hỏi 10 Một trang web thương mại điện tử muốn bổ sung chức dự đoán việc click lên mục quảng cáo khách viếng thăm Đây dạng toán: Select one: a b c d Data Visualization Data Pre-processing Classification Clustering Câu hỏi 11 Bài tốn phát giao dịch gian lận thẻ tín dụng dạng toán? Select one: a Clustering b Data Pre-processing c Classification d Frequent Pattern Mining Câu hỏi 12 Cây định giải pháp cho toán khai thác liệu nào? Select one: a b c d Phân lớp Gom cụm Hồi quy Khai thác mẫu tìm luật kết hợp Câu hỏi 13 Ứng dụng lọc thư rác áp dụng toán khai thác liệu đây? Select one: a b c d Classification Data Pre-processing Frequent Pattern Mining Clustering Câu hỏi 14 Cây định xây dựng dựa giải thuật? Select one: a b c d Giải thuật tham lam Quy hoạch động Tất Chia để trị Câu hỏi 15 Trong định node chứa giá trị thuộc tính dự đốn? Select one: a b c d Node gốc Node trung gian Node Tất Câu hỏi 16 Trong định node đại diện cho thuộc tính dùng để kiểm tra? Select one: a b c d Node trung gian Tất sai Tất Node Câu hỏi 17 Mệnh đề mơ tả cho độ xác giải thuật phân lớp? Select one: a b c d Là độ hiệu giải thuật thực thi Được tính dựa độ đo qua thực nghiệm Được chứng minh tính đắn giải thuật Tất Câu hỏi 18 Trong giải thuật KMeans, K mang nghĩa? Select one: a b c d Số cụm Số datasets Số thuộc tính Hàm mục tiêu Câu hỏi 19 Giải thuật K-Means yêu cầu điều gì? Select one: a b c d Số cụm cho trước Độ đo khoảng cách định nghĩa trước Trung tâm cụm khởi tạo trước Tất ý lại Câu hỏi 20 Chỉ mệnh đề sai K-Means Select one: a Giải thuật gom cụm K-means tương tự giải thuật KNN (K- nearest neighbor) b.K-means phương pháp lượng tử hóa vector (vector quantization) c Tất mệnh đề sai d K-Means phân chia n đối tượng liệu thành k cụm Câu hỏi 21 Các lần chạy K-means có khả cho kết khác hay sai? Select one: a Đúng b Sai Câu hỏi 22 Số lượng thuộc tính (features) tối thiểu để gom cụm bao nhiêu? Select one: a b c d e k Câu hỏi 23 Hai lần chạy K-means tập liệu có đảm bảo hai kết đồng khơng? Select one: a Khơng b Có Câu hỏi 24 Điều kiện dừng giải thuật K-Means là: Select one or more: a b c d Nếu giá trị hàm mục tiêu có giá trị ngưỡng cho trước Sau số lần lặp định trước Việc phân cụm không thay đổi Các trung tâm cụm không thay đổi Câu hỏi 25 Những trường hợp K-Means thất bại: Dữ liệu có nhiều nhiễu Dữ liệu có phân bố mật độ thay đổi Dữ liệu phân bố dạng dạng tròn (round shapes) Dữ liệu phân bố dạng không lồi (non-convex shapes) Select one: a b a b 1, c d Câu hỏi 29 Số cụm thu giải thuật K-Means áp dụng tập liệu có n điểm Select one: a n/k b n-k c k d n Câu hỏi 30 Giải thuật gom cụm phù hợp với tập liệu mơ tả hình? Select one: a DBSCAN b K-Means Câu hỏi 31 K-Means thuộc giải thuật học máy Select one: a Khơng có giám sát (unsupervised learning) b Có giám sát (supervised learning)Supervised c Tất sai Câu hỏi 32 Số lượng phân loại số lượng dataset tutorial Select one: a b c d 10 & 10 3&3 10 & 1&1 Câu hỏi 33 Dữ liệu sử dụng thực nghiệm tutorial liệu có sẵn? Hãy chọn một: Đúng Sai Câu hỏi 34 Lệnh sau có tác dụng gì: X, y = make_classification(n_features=2, n_redundant=0, n_informative=2, random_state=1, n_clusters_per_class=1) Select one: a Sinh ngẫu nhiên liệu thực nghiệm b Tạo phân loại với tham số cho trước c Tạo phân loại với tham số mặc định Câu hỏi 35 Trong tutorial bước huấn luyện mơ hình phân loại nằm dịng lệnh: Select one: X , a y = make_classification(n_features=2, n_redundant=0, n_informative=2, n_clusters_per_class=1) b .score(X_test, y_test) random_state=1, c l c f clf.predict_proba(np.c_[xx.ravel(), yy.ravel()]) [:, 1] d clf.fit(X_train, y_train) Câu hỏi 36 Áp dụng giải thuật apriori tập liệu gồm loại mục {A, B, C, D, E} Giả sử thu 2-itemsets phổ biến {A, B}, {A, C}, {A, D}, {B, C}, {B, E}, {C, E} Hỏi itemsets sau, itemset ứng viên 3-itemsets cần xem xét vòng lặp tiếp theo? Select one or more: a {C, D, E} b {A, B, C} c {B, C, D} d {B, C, E} Câu hỏi 37 Cho trước ngưỡng hỗ trợ minSup = 60% ngưỡng tin cậy minConf = 80% để tìm tập phổ biến luật kết hợp cho dataset sau: T_id Itemlist T1 {A, B, D, F} T2 {A, B, C, D, E} T3 {A, B, C, E} T4 {A, B, D} Cho biết 1-itemsets phổ biến? Select one or more: a b c d e {A} {C} {B} {E} {D} Câu hỏi 38 Cho trước ngưỡng hỗ trợ minSup = 60% ngưỡng tin cậy minConf = 80% để tìm tập phổ biến luật kết hợp cho dataset sau: T_id Itemlist T1 {A, B, D, F} T2 {A, B, C, D, E} T3 {A, B, C, E} T4 {A, B, D} Cho biết kích cỡ itemsets lớn tìm bao nhiêu? Select one: a b c d Câu hỏi 39 Giải thuật Apriori dựa thuộc tính độ hỗ trợ (support)? Select one: a b c d Độ hỗ trợ dương Độ hỗ trợ giá trị khơng âm Thuộc tính Anti-monotone Thuộc tính Monotone Câu hỏi 40 Giải thuật khai thác mẫu phổ biến? Select one: a b c d FP-Grownth ECLAT Apriori Tất giải thuật Câu hỏi 41 Một tập mục (itemset) gọi phổ biến nếu: Select one: a b c d Độ hỗ trợ lớn ngưỡng cho trước Tất sai Độ hỗ trợ ngưỡng cho trước Độ hỗ trợ thấp ngưỡng cho trước Câu hỏi 42 Cho biết vấn đề sau liên quan đến chất lượng liệu? Select one: a Tồn nhiễu liệu b Dữ liệu thiếu sót c Xuất trùng lặp liệu d Câu a, b, c e Chỉ câu a b Câu hỏi 43 Cho đồ thị hình vẽ, cho biết mệnh đề sau sai? Select one: a Khi số ngưỡng độ hỗ trợ lớn, thời gian thực thi thuật toán FP-Growth Apriori tương đương b Thuật toán FP-Growth thực nhanh thuật toán Apriori c Với ngưỡng độ hỗ trợ, thời gian thức thi thuật tốn FP-Growth ln thời gian thực thi thuật toán Apriori d Thuật toán Apriori thực nhanh thuật toán FP-Growth Câu hỏi 43 Thao tác sau giúp thu giảm số thuộc tính tập liệu? Select one: a Thu giảm số chiều lấy mẫu b Lấy mẫu c Nén liệu d Thu giảm số chiều Câu hỏi 44 Bài toán khai thác liệu thực để nhận dạng cho liệu dựa liệu biết trước? Select one: a b c d Frequent Pattern Mining Clustering Classification Data Pre-processing Câu hỏi 45 Bài tốn tìm cấu trúc ẩn chứa bên tập liệu không gán nhãn gọi Select one: a b c d Tất câu lại sai Học tăng cường (reinforcement learning) Học không giám sát (unsupervised learning) Học có giám sát (supervised learning) Câu hỏi 46 Cho biết loại thuộc tính liệu sau thuộc tính rời rạc (discrete attribute)? Select one: a b c d Mã vùng Cân nặng Chiều cao Nhiệt độ Câu hỏi 47 DBSCAN cho phép tìm mật độ phân bố điểm liệu tập liệu? Hãy chọn một: Đúng Sai Câu hỏi 48 Các tham số để thực thi giải thuật Apriori để tìm mẫu phổ biến luật kết hợp? Select one: a Ngưỡng hỗ trợ MinSup b Ngưỡng tin cậy MinConf c Số điểm tối thiểu MinPTs d câu a b Câu hỏi 49 Cho biết vấn đề liên quan đến chất lượng liệu dòng đánh dấu A bảng liệu sau: Select one: a Dữ liệu bị thiếu không đầy đủ b Dữ liệu khả bị sai c Dữ liệu bị trùng lặp d Dữ liệu khơng có vấn đề Câu hỏi 50 Cho X ={A, B} không tập mục phổ biến, Y = {A, B, C} Hãy cho biết kết luận sau đúng? a b c d Select one: Y tập mục phổ biến X tập mục phổ biến C không tập mục phổ biến Y không tập mục phổ biến Câu hỏi 52 Thao tác sau giúp thu giảm số điểm liệu tập liệu? Select one: a b c d Lấy mẫu Nén liệu Thu giảm số chiều lấy mẫu Thu giảm số chiều Câu hỏi 53 Cho biết vấn đề liên quan đến chất lượng liệu hai dòng đánh dấu C bảng liệu sau: Select one: a Dữ liệu bị thiếu không đầy đủ b Dữ liệu khơng có vấn đề c Dữ liệu bị trùng lặp d Dữ liệu khả bị sai Câu hỏi 54 Hãy cho biết đồ thị sau biểu diễn điều gì? Select one: a Với số lượng giao dịch nhau, thời gian thực thi thuật tốn FP-Growth ln nhiều thời gian thực thi thuật toán Apriori b Với số lượng giao dịch nhau, thời gian thức thi thuật toán FP-Growth ln thời gian thực thi thuật tốn Apriori c Thuật toán Apriori thực nhanh thuật toán FP-Growth d Hai thuật toán FP-Growth Apriori thức thi với thời gian nhỏ Câu hỏi 55 Mô tả sau cho khái niệm "underfitting" Select one: a Khi mơ hình học q đơn giản dẫn đến thực thi tập liệu huấn luyện tập liệu kiểm tra có nhiều dự đoán sai

Ngày đăng: 07/11/2023, 07:38

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w