Đề cương Khai phá dữ liệuKhai thác dữ liệu Data mining

23 1.2K 10
Đề cương Khai phá dữ liệuKhai thác dữ liệu  Data mining

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Đề cương Khai phá dữ liệuKhai thác dữ liệu Data mining là: Tập hợp các câu hỏi trắc nghiệm, đã có đáp án được in đậm; Các câu hỏi đều nằm trong chương trình học và bám sát đề thi.Chúc các bạn ôn tập tốt và đạt kết quả cao.

CÂU 1: Confidence gì? a Độ tin cậy b Độ hỗ trợ c Tất d Tất sai CÂU 2: Support tập mục A CSDL giao tác D gì? a Là tỉ lệ phần trăm số giao tác CSDL có chứa A tổng số giao tác D b Là tỉ lệ phần trăm số giao tác CSDL không chứa A tổng số giao tác D c Là số hỗ trợ A d Là số hỗ trợ B CÂU 3: Độ tin cậy luật kết hợp X Y gì? a Là tỉ lệ phần trăm số giao tác chứa X Y với số giao tác chứa X CSDL D b Là tỉ lệ phần trăm số giao tác Y số giao tác chứa X CSDL D c Là tỉ lệ phần trăm số giao tác X số giao tác chứa Y CSDL D d Là số hỗ trợ CSDL CÂU 4: Confidence luật kết hợp X Y gì? a Là tỉ lệ phần trăm số giao tác chứa X Y với số giao tác chứa X CSDL D b Là tỉ lệ phần trăm số giao tác Y số giao tác chứa X CSDL D c Là tỉ lệ phần trăm số giao tác X số giao tác chứa Y CSDL D d Là số hỗ trợ CSDL CÂU 5: Phần mềm sau sử dụng minh họa thuật toán Apriori a Phần mềm Weka b Phần mềm Project c Phần mềm Prolog d Phần mềm Spy bot CÂU 6: Phần mềm Weka cài đặt số thuật toán lĩnh vực nào? a Data Mining b Tìm kiếm văn c Trí tuệ nhân tạo d Học máy CÂU 7: Tập mục thường xun gì? a Là tập mục có độ hỗ trợ lớn ngưỡng hỗ trợ hỗ trợ tối thiểu cho trước b Là tập mục có độ hỗ trợ lớn 50% c Là tập mục có độ hỗ trợ lớn 90% d Là tập mục có độ hỗ trợ lớn 30% CÂU 8: Tập mục có độ hỗ trợ lớn ngưỡng hỗ trợ hỗ trợ tối thiểu cho trước gì? a Tập mục thường xuyên b Tập mục ứng viên c Không gian tìm kiếm d Khơng gian giới hạn CÂU 9: Đâu khơng phải thuật tốn khai phá liệu luật kết hợp? a Thuật toán K-Mean b Thuật toán Apriori c Thuật toán AprioriTID d Thuật toán FP -Growth CÂU 10: Khai phá liệu luật kết hợp sử dụng thuật toán nào? a Thuật toán Apriori b Thuật toán K-Mean c Thuật toán C4.5 d Thuật toán Thuật toán ID3 CÂU 11: Thuật toán Apriori sử dụng phương pháp khai phá liệu nào? a Khai phá liệu luật kết hợp b Khai phá liệu phân cụm liệu c Khai phá liệu phân lớp liệu d Phương pháp mạng Nơ - ron CÂU 12: Đầu vào thuật tốn FP_growth gì? a Một CSDL giao dịch, min_sup_count b Tập mục thường xuyên c Độ tin cậy d Độ hỗ trợ CÂU 13: Đầu thuật tốn FP_growth gì? a Tập mục thường xuyên b Một CSDL giao dịch, min_sup_count c Support d Độ hỗ trợ CÂU 14: Đầu vào thuật toán Apriori gì? a Một CSDL giao dịch, min_sup_count b Tập mục thường xuyên c L tập frequent itemset D d Độ hỗ trợ CÂU 15: Thuật tốn phân cụm liệu sau thuộc nhóm phân cụm phân hoạch: a K-MEANS b BIRCH c DBSCAN d EM CÂU 16: Thuật toán phân cụm k-means đề xuất: a MacQueen b P Kriegel J Sander c Kaufman Rousseeuw d Tian Zhang, Amakrishnan Livny CÂU 17: Hoveland Hind giới thiệu thuật toán CLS lần vào năm bao nhiêu? a Năm 50 kỷ XX b Năm 40 kỷ XX c Năm 60 kỷ XX d Năm 70 kỷ XX CÂU 18: Kết thuật toán CLS đưa định dựa trên: a Các mẫu mô tả định b Các ngày để quan tâm c Các số tính toán d Tất sai CÂU 19: Hàm Entropy dùng để làm gì? a Để đo tính tập mẫu liệu b Để đo tính không liệu xấu c Để đo tính thuộc tính d Các đáp án sai CÂU 20: Cho tập ví dụ học bảng Có thuộc tính để phân lớp ? a thuộc tính b thuộc tính c thuộc tính d thuộc tính CÂU 22: Cho tập ví dụ học bảng Các thuộc tính dùng để phân lớp là: a Outlook, Temperature, Humidity, Wind b Outlook, Temperature, Humidity, Wind, Play Ball c Day, Outlook, Temperature, Humidity, Wind d Day, Outlook, Temperature, Humidity, Wind, Play Ball CÂU 23: Khi chọn thuộc tính A để làm gốc định Nếu thuộc tính A có giá trị định có nhánh? a nhánh b nhánh c Nhiều nhánh d Phải biết kết luận C có giá trị phân nhánh CÂU 24: Cho tập ví dụ học bảng Với (Wind =’Weak’) P+ mang giá trị bao nhiêu: a b c d Giá trị khác CÂU 925: Cho CSDL Giao tác hình vẽ, Số lượng giao dịch sở liệu là: a b 16 c d 10 CÂU 27: Cho CSDL giao dịch hình vẽ, Độ hỗ trợ tập mục X={A, M} là: a (60%) b (80%) c (100%) d (40%) CÂU 27: Thuật tốn Apriori có nhược điểm là: a Tốn nhiều nhớ thời gian Khơng thích hợp với mẫu lớn Chi phí để duyệt CSDL nhiều b Khơng tìm tập thường xun c Kết thuật tốn khơng ứng dụng toán thực tế d Thuật toán phức tạp, khó hiểu CÂU 28: Cho CSDL giao dịch hình vẽ với Min_Support = (50%) Tập tập mục thường xuyên thỏa Min_support: a {A,C} b {D} c {A,D} d {B, C, D} CÂU 29: Cho CSDL giao dịch hình vẽ với Min_Support = (50%) Tập không tập mục thường xuyên: a {A,C,D} b {A,E} c {A, C} d {B,E} CÂU 30: Cho CSDL giao dịch hình vẽ với Min_Support = (50%) Cho CSDL giao dịch hình vẽ với Min_Support = (50%) Tập không tập mục thường xuyên: a {D} b {A,E} c {A, C} d {B,E} CÂU 31: Cho CSDL giao dịch hình vẽ với Min_Support = (50%) Sử dụng thuật toán Apriori, sau lần duyệt thứ nhất, tập mục chứa 1-item bị loại bỏ là: a {D} b {A} c {B} d {A}, {D} CÂU 32: Cho CSDL giao dịch hình vẽ với Min_Support = (50%) Tập không tập mục thường xuyên: a {B, D} b {A, E} c {A, C} d {B, E} CÂU 33: Cho CSDL giao dịch hình vẽ với Min_Support = (50%) Tập tập mục thường xuyên với độ hỗ trợ 75%: a {B,E} b {A,E} c {A, C} d {B,C} CÂU 34: Cho CSDL giao dịch hình vẽ với Min_Support = (50%) Tập tập mục thường xuyên với độ hỗ trợ = 70% a Không có tập b {A, E} c {A, C, D} d {B, C, D} CÂU 35: Cho CSDL giao dịch hình vẽ với Min_Support = (50%), Min_Cofidence = 50% Luật kết hợp thỏa mãn điều kiện cho: a A >C b A >D c A > E d AB >C CÂU 36: Cho CSDL giao dịch hình vẽ với Min_Support = (50%), Min_Cofidence = 50% Luật kết hợp thỏa mãn điều kiện cho: a B >E b A >D c A > E d AB >C CÂU 37: Cho CSDL giao dịch hình vẽ với Min_Support = (50%), Min_Cofidence = 50% Luật kết hợp thỏa mãn điều kiện cho: a A >C b A >D c A > E d AB >C CÂU 38: Cho CSDL giao dịch hình vẽ với Min_Support = (50%), Min_Cofidence = 50% Luật kết hợp có độ tin cậy = 100% a A >C b A >D c AD > E d AB >C CÂU 39: Cho tập mục thường xuyên X={A, B}, từ tập X sinh luật kết hợp sau: a A > B, B > A, khơng tính luật AB > ∅ ∅ > AB b A >B, B > A, A > ∅ ∅ > B c A > B d B > A CÂU 40: Cho FP-Tree hình vẽ, có đường kết thúc nút m a đường b đường c đường d đường CÂU 41: Cho FP-Tree hình vẽ, có đường kết thúc nút p a đường b đường c đường d đường CÂU 42: Hai thuật toán FP-Growth Apriori dùng để: a Tìm tập mục thường xuyên b Tìm luật kết hợp c Tìm tập mục có k - item d Thực cơng việc khác CÂU 43: Cho sở liệu giao dịch gồm N giao dịch (bản ghi) I tập chứa tất mục (item) CSDL X tập chứa mục thuộc I Giao dịch hỗ trợ X giao dịch chứa tất mục có X Độ hỗ trợ tập mục X định nghĩa là: a Support(X)=Số lượng giao dịch hỗ trợ X / N b Support(X)=Số lượng giao dịch hỗ trợ X c Support(X)=Số lượng giao dịch hỗ trợ X / N * |I|, |I| tổng số mục CSDL d Support(X)=Số lượng giao dịch hỗ trợ X *100% CÂU 44: Cho sở liệu giao dịch gồm N giao dịch (bản ghi) I tập chứa tất mục (item) CSDL X, Y tập chứa mục thuộc I Độ tin cậy luật kết hợp X Y định nghĩa là: a Confidence(XY)=Số lượng giao dịch hỗ trợ X Y / Số lượng giao dịch hỗ trợ X b Confidence(XY)=Số lượng giao dịch hỗ trợ X / Số lượng giao dịch hỗi trợ Y c Confidence(XY)=Số lượng giao dịch hỗ trợ X Y / Số lượng giao dịch hỗ trợ Y d Confidence(XY)=Số lượng giao dịch hỗ trợ X Y /N CÂU 45: Cho sở liệu giao dịch gồm N giao dịch (bản ghi) I tập chứa tất mục (item) CSDL X, Y tập chứa mục thuộc I Độ hỗ trợ luật kết hợp X Y định nghĩa là: a Support(XY)=Số lượng giao dịch hỗ trợ X Y / N b Support(XY)=Số lượng giao dịch hỗ trợ X Y / Số lượng giao dịch hỗ trợ Y c Support(XY)=Số lượng giao dịch hỗ trợ X Y / Số lượng giao dịch hỗ trợ X d Support(XY)=Số lượng giao dịch hỗ trợ X / Số lượng giao dịch hỗ trợ Y CÂU 46: Cho sở liệu giao dịch gồm N giao dịch (bản ghi) I tập chứa tất mục (item) CSDL Min_Supp độ hỗ trợ tối thiểu X tập chứa mục thuộc I Tập mục X gọi tập mục thường xuyên (frequent itemset) nếu: a Support(X)>=Min_Supp b Support(X)=Min_Supp, Confidence(XY)>=Min_Conf b Support(XY)=Min_Supp, Confidence(XY)=Min_Conf c Support(XY)BC luật kết hợp thỏa mãn độ hỗ trợ tối thiểu Min_Sup độ tin cậy tối thiểu Min_Conf Hãy cho biết luật kết hợp sau chắn thỏa mãn Min_Sup Min_Conf mà khơng cần phải tính độ hỗ trợ độ tin cậy: a AB >C b A >D c ABD >C d D >C CÂU 56: Cho A, B, C, item A >BC luật kết hợp thỏa mãn độ hỗ trợ tối thiểu Min_Sup độ tin cậy tối thiểu Min_Conf Ta thấy luật kết hợp AB >C thỏa mãn điều kiện độ hỗ trợ tối thiểu độ tin cậy tối thiểu vì: a Conference(AB >C) >= Conference(A >BC) b Conference(AB >C) BC) c Conference(AB >C) = Conference(A >BC) d Chưa kết luận AB >C có thỏa độ hỗ trợ tối tiểu độ tin cậy tối thiểu hay không CÂU 57: Cho A, B, C, D mục sở liệu giao dịch Kết luận sau sai: a Support(ABC) < Support(ABCD) b Support(ABC) >= Support(ABCD) c Support(AB) >= Support(ABC) d Support(AB) B) >= Confidence(A > BC) b Confidence(AC > B) = Confidence(A > BC) c Confidence(A > AB)>=Confidence(AC >C) d Confidence(AB > C) >= Confidence(AC > B) CÂU 59: Giả sử ta có tập mục thường xuyên {A,B}, {A,C}, {B,D} chứa 2item Sử dụng thuật tốn Apriori để ghép tập mục có 2-item thành tập mục có 3-item , ứng viên sinh có 3-item là: a {A, B, C}, {A, B, D} b {A, B, C}, {A, B, D}, {A, B, C, D} c {A, B, C}, {B, C, D} d {A, B, C}, {C, B, D} CÂU 60: Trong thuật toán Apriori, tập mục chứa k-item tạo cách cách sau: a Tạo từ tập chứa k-1 item cách ghép tập k-1 item với với điều kiện tập k-1 item phải có chung k-2 item b Tổ hợp k item từ item có sở liệu giao dịch c Lấy ngẫu nhiên k item sau ghép lại với d Sinh tập có k item từ item có sở liệu giao dịch CÂU 61: Cho tập L3={abc, abd, ade, ace} tập mục thường xuyên chứa 3item Để tạo ứng viên chứa 4-item abcd, ta cần ghép tập chứa 3-item với nhau? a abc abd b abc ade c abc ace d abd ade CÂU 62: Cho CSDL giao dịch hình vẽ với Min_Support = (50%), Min_Cofidence = 50% Luật kết hợp không thỏa mãn điều kiện đề bài: a BA >E b BC >E c C > E d B >C CÂU 63: k-Mean phù hợp với cụm có hình dạng sau đây: a Dạng hình cầu b Cụm dài mảnh c Các cụm có điểm phân bố ngẫu nhiên d Hình dạng CÂU 64: Thuật tốn phân cụm K-MEANS dừng khi: a Không thể gán (hoặc gán lại) điểm vào cụm khác b Số cụm sinh k c Tùy theo yêu cầu người dùng d Khi tất phần tử gán vào k cụm CÂU 65: Hãy chọn phát biểu sai phát biểu sau thuật toán phân cụm K-MEANS: a Phụ thuộc vào thứ tự phần tử đưa vào phân cụm b Cần phải xác định trước số cụm cần sinh c K-MEANS phù hợp với cụm có dạng hình cầu d Vector chọn làm trọng tâm cụm vector trung bình cụm CÂU 66: Thuật tốn phân cụm sau tìm cụm với hình thù : a DBSCAN b K-MEANS c PAM d BIRCH CÂU 67: Cho tập mục thường xuyên X={A, B, C}, từ tập X sinh luật kết hợp: a luật, khơng tính luật X → ∅ ∅ → X b luật, khơng tính luật X → ∅ ∅ → X c luật d luật CÂU 68: Cho CSDL giao dịch hình vẽ với Min_Support = (50%) Sử dụng thuật toán Apriori, sau lần duyệt thứ hai, danh sách L2 chứa tập mục thường xuyên có 2-item tạo là: a L2={{A,C}, {B,C}, {B,E}, {C,E}} b L2={{ A,D}, {B,D}, {B,E}, {C,E}} TB (c L2= {{B,C}, {B,E}, {C,E}} d L2= {{A,C}, {C,E}} CÂU 69: Với cơng thức tính Gain thơng thường khơng phù hợp với tình ? a Với thuộc tính có nhiều giá trị b Khơng phụ hợp với ba thuộc tính c Khơng phù hợp với tập có mẫu d Mọi trường hợp phù hợp CÂU 70: Cho tập ví dụ học bảng P(Play Ball= ‘No’) là: a 1/2 b 1/3 c 0/3 d Giá trị khác CÂU 71: Thuật ngữ Tiền xử lí liệu tiếng Anh là: a Data Preprocessing b Data Processing c Preprocessing in Database d Data Process CÂU 72: Cho ví dụ bảng với thuộc tính Wind, thì: a P(Weak | Yes)=2/4; P(Weak | No) = 2/4; P(Strong | Yes) = 1/2; P(Strong | No) = 1/2 b P(Weak | Yes)=1/3; P(Weak | No) = 2/3; P(Strong | Yes) = 3/3; P(Strong | No) = 1/3 c P(Weak | Yes)=2/3; P(Weak | No) = 1/3; P(Strong | Yes) = 2/3; P(Strong | No) = 2/3 d P(Weak | Yes)=2/3; P(Weak | No) = 0/3; P(Strong | Yes) = 1/3; P(Strong | No) = 1/3 CÂU 73: Cho ví dụ học bảng Entropy kết luận Play Ball là: a Entropy(Play ball) = b Entropy(Play ball) = c Entropy(Play ball) = 0.5 d Entropy(Play ball) = - & -

Ngày đăng: 08/12/2018, 09:15

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan