Đề cương Khai phá dữ liệuKhai thác dữ liệu Data mining là: Tập hợp các câu hỏi trắc nghiệm, đã có đáp án được in đậm; Các câu hỏi đều nằm trong chương trình học và bám sát đề thi.Chúc các bạn ôn tập tốt và đạt kết quả cao.
CÂU 1: Confidence gì? a Độ tin cậy b Độ hỗ trợ c Tất d Tất sai CÂU 2: Support tập mục A CSDL giao tác D gì? a Là tỉ lệ phần trăm số giao tác CSDL có chứa A tổng số giao tác D b Là tỉ lệ phần trăm số giao tác CSDL không chứa A tổng số giao tác D c Là số hỗ trợ A d Là số hỗ trợ B CÂU 3: Độ tin cậy luật kết hợp X Y gì? a Là tỉ lệ phần trăm số giao tác chứa X Y với số giao tác chứa X CSDL D b Là tỉ lệ phần trăm số giao tác Y số giao tác chứa X CSDL D c Là tỉ lệ phần trăm số giao tác X số giao tác chứa Y CSDL D d Là số hỗ trợ CSDL CÂU 4: Confidence luật kết hợp X Y gì? a Là tỉ lệ phần trăm số giao tác chứa X Y với số giao tác chứa X CSDL D b Là tỉ lệ phần trăm số giao tác Y số giao tác chứa X CSDL D c Là tỉ lệ phần trăm số giao tác X số giao tác chứa Y CSDL D d Là số hỗ trợ CSDL CÂU 5: Phần mềm sau sử dụng minh họa thuật toán Apriori a Phần mềm Weka b Phần mềm Project c Phần mềm Prolog d Phần mềm Spy bot CÂU 6: Phần mềm Weka cài đặt số thuật toán lĩnh vực nào? a Data Mining b Tìm kiếm văn c Trí tuệ nhân tạo d Học máy CÂU 7: Tập mục thường xun gì? a Là tập mục có độ hỗ trợ lớn ngưỡng hỗ trợ hỗ trợ tối thiểu cho trước b Là tập mục có độ hỗ trợ lớn 50% c Là tập mục có độ hỗ trợ lớn 90% d Là tập mục có độ hỗ trợ lớn 30% CÂU 8: Tập mục có độ hỗ trợ lớn ngưỡng hỗ trợ hỗ trợ tối thiểu cho trước gì? a Tập mục thường xuyên b Tập mục ứng viên c Không gian tìm kiếm d Khơng gian giới hạn CÂU 9: Đâu khơng phải thuật tốn khai phá liệu luật kết hợp? a Thuật toán K-Mean b Thuật toán Apriori c Thuật toán AprioriTID d Thuật toán FP -Growth CÂU 10: Khai phá liệu luật kết hợp sử dụng thuật toán nào? a Thuật toán Apriori b Thuật toán K-Mean c Thuật toán C4.5 d Thuật toán Thuật toán ID3 CÂU 11: Thuật toán Apriori sử dụng phương pháp khai phá liệu nào? a Khai phá liệu luật kết hợp b Khai phá liệu phân cụm liệu c Khai phá liệu phân lớp liệu d Phương pháp mạng Nơ - ron CÂU 12: Đầu vào thuật tốn FP_growth gì? a Một CSDL giao dịch, min_sup_count b Tập mục thường xuyên c Độ tin cậy d Độ hỗ trợ CÂU 13: Đầu thuật tốn FP_growth gì? a Tập mục thường xuyên b Một CSDL giao dịch, min_sup_count c Support d Độ hỗ trợ CÂU 14: Đầu vào thuật toán Apriori gì? a Một CSDL giao dịch, min_sup_count b Tập mục thường xuyên c L tập frequent itemset D d Độ hỗ trợ CÂU 15: Thuật tốn phân cụm liệu sau thuộc nhóm phân cụm phân hoạch: a K-MEANS b BIRCH c DBSCAN d EM CÂU 16: Thuật toán phân cụm k-means đề xuất: a MacQueen b P Kriegel J Sander c Kaufman Rousseeuw d Tian Zhang, Amakrishnan Livny CÂU 17: Hoveland Hind giới thiệu thuật toán CLS lần vào năm bao nhiêu? a Năm 50 kỷ XX b Năm 40 kỷ XX c Năm 60 kỷ XX d Năm 70 kỷ XX CÂU 18: Kết thuật toán CLS đưa định dựa trên: a Các mẫu mô tả định b Các ngày để quan tâm c Các số tính toán d Tất sai CÂU 19: Hàm Entropy dùng để làm gì? a Để đo tính tập mẫu liệu b Để đo tính không liệu xấu c Để đo tính thuộc tính d Các đáp án sai CÂU 20: Cho tập ví dụ học bảng Có thuộc tính để phân lớp ? a thuộc tính b thuộc tính c thuộc tính d thuộc tính CÂU 22: Cho tập ví dụ học bảng Các thuộc tính dùng để phân lớp là: a Outlook, Temperature, Humidity, Wind b Outlook, Temperature, Humidity, Wind, Play Ball c Day, Outlook, Temperature, Humidity, Wind d Day, Outlook, Temperature, Humidity, Wind, Play Ball CÂU 23: Khi chọn thuộc tính A để làm gốc định Nếu thuộc tính A có giá trị định có nhánh? a nhánh b nhánh c Nhiều nhánh d Phải biết kết luận C có giá trị phân nhánh CÂU 24: Cho tập ví dụ học bảng Với (Wind =’Weak’) P+ mang giá trị bao nhiêu: a b c d Giá trị khác CÂU 925: Cho CSDL Giao tác hình vẽ, Số lượng giao dịch sở liệu là: a b 16 c d 10 CÂU 27: Cho CSDL giao dịch hình vẽ, Độ hỗ trợ tập mục X={A, M} là: a (60%) b (80%) c (100%) d (40%) CÂU 27: Thuật tốn Apriori có nhược điểm là: a Tốn nhiều nhớ thời gian Khơng thích hợp với mẫu lớn Chi phí để duyệt CSDL nhiều b Khơng tìm tập thường xun c Kết thuật tốn khơng ứng dụng toán thực tế d Thuật toán phức tạp, khó hiểu CÂU 28: Cho CSDL giao dịch hình vẽ với Min_Support = (50%) Tập tập mục thường xuyên thỏa Min_support: a {A,C} b {D} c {A,D} d {B, C, D} CÂU 29: Cho CSDL giao dịch hình vẽ với Min_Support = (50%) Tập không tập mục thường xuyên: a {A,C,D} b {A,E} c {A, C} d {B,E} CÂU 30: Cho CSDL giao dịch hình vẽ với Min_Support = (50%) Cho CSDL giao dịch hình vẽ với Min_Support = (50%) Tập không tập mục thường xuyên: a {D} b {A,E} c {A, C} d {B,E} CÂU 31: Cho CSDL giao dịch hình vẽ với Min_Support = (50%) Sử dụng thuật toán Apriori, sau lần duyệt thứ nhất, tập mục chứa 1-item bị loại bỏ là: a {D} b {A} c {B} d {A}, {D} CÂU 32: Cho CSDL giao dịch hình vẽ với Min_Support = (50%) Tập không tập mục thường xuyên: a {B, D} b {A, E} c {A, C} d {B, E} CÂU 33: Cho CSDL giao dịch hình vẽ với Min_Support = (50%) Tập tập mục thường xuyên với độ hỗ trợ 75%: a {B,E} b {A,E} c {A, C} d {B,C} CÂU 34: Cho CSDL giao dịch hình vẽ với Min_Support = (50%) Tập tập mục thường xuyên với độ hỗ trợ = 70% a Không có tập b {A, E} c {A, C, D} d {B, C, D} CÂU 35: Cho CSDL giao dịch hình vẽ với Min_Support = (50%), Min_Cofidence = 50% Luật kết hợp thỏa mãn điều kiện cho: a A >C b A >D c A > E d AB >C CÂU 36: Cho CSDL giao dịch hình vẽ với Min_Support = (50%), Min_Cofidence = 50% Luật kết hợp thỏa mãn điều kiện cho: a B >E b A >D c A > E d AB >C CÂU 37: Cho CSDL giao dịch hình vẽ với Min_Support = (50%), Min_Cofidence = 50% Luật kết hợp thỏa mãn điều kiện cho: a A >C b A >D c A > E d AB >C CÂU 38: Cho CSDL giao dịch hình vẽ với Min_Support = (50%), Min_Cofidence = 50% Luật kết hợp có độ tin cậy = 100% a A >C b A >D c AD > E d AB >C CÂU 39: Cho tập mục thường xuyên X={A, B}, từ tập X sinh luật kết hợp sau: a A > B, B > A, khơng tính luật AB > ∅ ∅ > AB b A >B, B > A, A > ∅ ∅ > B c A > B d B > A CÂU 40: Cho FP-Tree hình vẽ, có đường kết thúc nút m a đường b đường c đường d đường CÂU 41: Cho FP-Tree hình vẽ, có đường kết thúc nút p a đường b đường c đường d đường CÂU 42: Hai thuật toán FP-Growth Apriori dùng để: a Tìm tập mục thường xuyên b Tìm luật kết hợp c Tìm tập mục có k - item d Thực cơng việc khác CÂU 43: Cho sở liệu giao dịch gồm N giao dịch (bản ghi) I tập chứa tất mục (item) CSDL X tập chứa mục thuộc I Giao dịch hỗ trợ X giao dịch chứa tất mục có X Độ hỗ trợ tập mục X định nghĩa là: a Support(X)=Số lượng giao dịch hỗ trợ X / N b Support(X)=Số lượng giao dịch hỗ trợ X c Support(X)=Số lượng giao dịch hỗ trợ X / N * |I|, |I| tổng số mục CSDL d Support(X)=Số lượng giao dịch hỗ trợ X *100% CÂU 44: Cho sở liệu giao dịch gồm N giao dịch (bản ghi) I tập chứa tất mục (item) CSDL X, Y tập chứa mục thuộc I Độ tin cậy luật kết hợp X Y định nghĩa là: a Confidence(XY)=Số lượng giao dịch hỗ trợ X Y / Số lượng giao dịch hỗ trợ X b Confidence(XY)=Số lượng giao dịch hỗ trợ X / Số lượng giao dịch hỗi trợ Y c Confidence(XY)=Số lượng giao dịch hỗ trợ X Y / Số lượng giao dịch hỗ trợ Y d Confidence(XY)=Số lượng giao dịch hỗ trợ X Y /N CÂU 45: Cho sở liệu giao dịch gồm N giao dịch (bản ghi) I tập chứa tất mục (item) CSDL X, Y tập chứa mục thuộc I Độ hỗ trợ luật kết hợp X Y định nghĩa là: a Support(XY)=Số lượng giao dịch hỗ trợ X Y / N b Support(XY)=Số lượng giao dịch hỗ trợ X Y / Số lượng giao dịch hỗ trợ Y c Support(XY)=Số lượng giao dịch hỗ trợ X Y / Số lượng giao dịch hỗ trợ X d Support(XY)=Số lượng giao dịch hỗ trợ X / Số lượng giao dịch hỗ trợ Y CÂU 46: Cho sở liệu giao dịch gồm N giao dịch (bản ghi) I tập chứa tất mục (item) CSDL Min_Supp độ hỗ trợ tối thiểu X tập chứa mục thuộc I Tập mục X gọi tập mục thường xuyên (frequent itemset) nếu: a Support(X)>=Min_Supp b Support(X)=Min_Supp, Confidence(XY)>=Min_Conf b Support(XY)=Min_Supp, Confidence(XY)=Min_Conf c Support(XY)BC luật kết hợp thỏa mãn độ hỗ trợ tối thiểu Min_Sup độ tin cậy tối thiểu Min_Conf Hãy cho biết luật kết hợp sau chắn thỏa mãn Min_Sup Min_Conf mà khơng cần phải tính độ hỗ trợ độ tin cậy: a AB >C b A >D c ABD >C d D >C CÂU 56: Cho A, B, C, item A >BC luật kết hợp thỏa mãn độ hỗ trợ tối thiểu Min_Sup độ tin cậy tối thiểu Min_Conf Ta thấy luật kết hợp AB >C thỏa mãn điều kiện độ hỗ trợ tối thiểu độ tin cậy tối thiểu vì: a Conference(AB >C) >= Conference(A >BC) b Conference(AB >C) BC) c Conference(AB >C) = Conference(A >BC) d Chưa kết luận AB >C có thỏa độ hỗ trợ tối tiểu độ tin cậy tối thiểu hay không CÂU 57: Cho A, B, C, D mục sở liệu giao dịch Kết luận sau sai: a Support(ABC) < Support(ABCD) b Support(ABC) >= Support(ABCD) c Support(AB) >= Support(ABC) d Support(AB) B) >= Confidence(A > BC) b Confidence(AC > B) = Confidence(A > BC) c Confidence(A > AB)>=Confidence(AC >C) d Confidence(AB > C) >= Confidence(AC > B) CÂU 59: Giả sử ta có tập mục thường xuyên {A,B}, {A,C}, {B,D} chứa 2item Sử dụng thuật tốn Apriori để ghép tập mục có 2-item thành tập mục có 3-item , ứng viên sinh có 3-item là: a {A, B, C}, {A, B, D} b {A, B, C}, {A, B, D}, {A, B, C, D} c {A, B, C}, {B, C, D} d {A, B, C}, {C, B, D} CÂU 60: Trong thuật toán Apriori, tập mục chứa k-item tạo cách cách sau: a Tạo từ tập chứa k-1 item cách ghép tập k-1 item với với điều kiện tập k-1 item phải có chung k-2 item b Tổ hợp k item từ item có sở liệu giao dịch c Lấy ngẫu nhiên k item sau ghép lại với d Sinh tập có k item từ item có sở liệu giao dịch CÂU 61: Cho tập L3={abc, abd, ade, ace} tập mục thường xuyên chứa 3item Để tạo ứng viên chứa 4-item abcd, ta cần ghép tập chứa 3-item với nhau? a abc abd b abc ade c abc ace d abd ade CÂU 62: Cho CSDL giao dịch hình vẽ với Min_Support = (50%), Min_Cofidence = 50% Luật kết hợp không thỏa mãn điều kiện đề bài: a BA >E b BC >E c C > E d B >C CÂU 63: k-Mean phù hợp với cụm có hình dạng sau đây: a Dạng hình cầu b Cụm dài mảnh c Các cụm có điểm phân bố ngẫu nhiên d Hình dạng CÂU 64: Thuật tốn phân cụm K-MEANS dừng khi: a Không thể gán (hoặc gán lại) điểm vào cụm khác b Số cụm sinh k c Tùy theo yêu cầu người dùng d Khi tất phần tử gán vào k cụm CÂU 65: Hãy chọn phát biểu sai phát biểu sau thuật toán phân cụm K-MEANS: a Phụ thuộc vào thứ tự phần tử đưa vào phân cụm b Cần phải xác định trước số cụm cần sinh c K-MEANS phù hợp với cụm có dạng hình cầu d Vector chọn làm trọng tâm cụm vector trung bình cụm CÂU 66: Thuật tốn phân cụm sau tìm cụm với hình thù : a DBSCAN b K-MEANS c PAM d BIRCH CÂU 67: Cho tập mục thường xuyên X={A, B, C}, từ tập X sinh luật kết hợp: a luật, khơng tính luật X → ∅ ∅ → X b luật, khơng tính luật X → ∅ ∅ → X c luật d luật CÂU 68: Cho CSDL giao dịch hình vẽ với Min_Support = (50%) Sử dụng thuật toán Apriori, sau lần duyệt thứ hai, danh sách L2 chứa tập mục thường xuyên có 2-item tạo là: a L2={{A,C}, {B,C}, {B,E}, {C,E}} b L2={{ A,D}, {B,D}, {B,E}, {C,E}} TB (c L2= {{B,C}, {B,E}, {C,E}} d L2= {{A,C}, {C,E}} CÂU 69: Với cơng thức tính Gain thơng thường khơng phù hợp với tình ? a Với thuộc tính có nhiều giá trị b Khơng phụ hợp với ba thuộc tính c Khơng phù hợp với tập có mẫu d Mọi trường hợp phù hợp CÂU 70: Cho tập ví dụ học bảng P(Play Ball= ‘No’) là: a 1/2 b 1/3 c 0/3 d Giá trị khác CÂU 71: Thuật ngữ Tiền xử lí liệu tiếng Anh là: a Data Preprocessing b Data Processing c Preprocessing in Database d Data Process CÂU 72: Cho ví dụ bảng với thuộc tính Wind, thì: a P(Weak | Yes)=2/4; P(Weak | No) = 2/4; P(Strong | Yes) = 1/2; P(Strong | No) = 1/2 b P(Weak | Yes)=1/3; P(Weak | No) = 2/3; P(Strong | Yes) = 3/3; P(Strong | No) = 1/3 c P(Weak | Yes)=2/3; P(Weak | No) = 1/3; P(Strong | Yes) = 2/3; P(Strong | No) = 2/3 d P(Weak | Yes)=2/3; P(Weak | No) = 0/3; P(Strong | Yes) = 1/3; P(Strong | No) = 1/3 CÂU 73: Cho ví dụ học bảng Entropy kết luận Play Ball là: a Entropy(Play ball) = b Entropy(Play ball) = c Entropy(Play ball) = 0.5 d Entropy(Play ball) = - & -