... Chẳn hạn với I= {A1,A2,A5},các tập I: {A1}, {A2}, {A5}, {A1,A2},{A1,A5},{A2,A5} có luật sau {A1} => {A2,A5},{A2} =>{A1,A5},{A5} =>{A1,A2} {A1,A2} =>{A5},{A1,A5} =>{A2},{A2,A5} => {A1} Ví dụ 1: ... dụng 20 Thử nghiệm dự đoán rủi ro tín dụng 21 II Ứng dụng khai mỏ liệu viễn thông 22 Các liệu viễn thông 22 Ứng dụng phát gian lận 23 Ứng dụng quản ... khứ, v.v… Gom nhóm (Clustering) Là việc mô tả chung để tìm tập xác định nhóm hay loại để mô tả liệu Các nhóm tách riêng phân cấp gối lên Có nghĩa liệu vừa thuộc nhóm này, vừa thuộc nhóm Các ứng...
Ngày tải lên: 10/04/2015, 16:26
... xung quanh nhóm 2. 000 Đô la Mỹ/ 20 -30 tuổi cụm nhóm 7.000-8.000 Đô la Mỹ/ 50-65 tuổi Trong trường hợp này, giả thuyết hai cụm chứng minh giả thuyết đồ thị đơn giản mà tạo cách sử dụng phần mềm ... loại sản phẩm riêng lẻ vào nhóm lớn sau phân tích liệu dựa nhóm thay cho việc phân tích sản phẩm riêng lẻ Ví dụ, Bảng cho thấy cách mở rộng thông tin theo cách Bảng Một bảng sản phẩm mở rộng mã ... liệu tất công cụ hay phần mềm sở liệu mà bạn sử dụng Bạn thực khai phá liệu hệ thống sở liệu bình thường công cụ đơn giản, bao gồm việc tạo viết phần mềm riêng bạn sử dụng gói phần mềm bán cửa hàng...
Ngày tải lên: 09/03/2014, 03:20
Các kỹ thuật Khái Phá dữ liệu – Xây dựng chương trình dựa vào thuật toán gom cụm K-Means
... Bai_5_GomCum, Đại học Công Nghệ Thông Tin, 20 12 [3] http://www.cse.hcmut.edu.vn/~chauvtn/data_mining/DM %20 - %20 Chapter %20 5 %20 - %20 Clustering %20 - %20 Part %20 1.pdf Trần Duy Phong – CH1101160 Trang 25 ... toán tương tự ta có d(x2,v1) = 0.54 < d(x2,v2) = 0.97 xếp v2 vào cụm c1 d(x3,v1) = 0.36 < d(x3,v2) = 0.78 xếp x3 vào cụm c1 d(x4,v1) = 2. 83 > d(x4,v2) = 1.70 xếp x4 vào cụm c2 Tăng n lên Ma trận ... vector trọng tâm Do có cụm C1,C2 nên có vecto trọng tâm v1,v2 Các vecto trọng tâm: Với vector v1 cho cụm 1: Vậy v1 = (1,3) Với vector v2 cho cụm 2: Vậy v2 = (1.93 , 2. 33) Gom đối tượng vào cụm Tính...
Ngày tải lên: 10/04/2015, 00:04
Tiểu luận môn Hệ hỗ trợ quyết định ÁP DỤNG CÁC KỸ THUẬT KHAI THÁC DỮ LIỆU NHẰM PHÁT HIỆN GIAN LẬN CHO KẾ TOÁN TÀI CHÍNH
... tập liệu (đơn đa biến) thành nhóm giống để liệu điểm nhóm tương tự khác so với điểm liệu nhóm khác Đó đề nghị đối tượng liệu cụm nên có tính tương tự cao nội nhóm nhóm cần phải có liên cụm tương ... tế Nghiên cứu nâng cao Khoa học máy tính Kỹ thuật phần mềm tập 3, số 11, tháng 11 năm 20 13, trang 717- 724 HVTH: Võ Thị Thúy Lan – CH1301096 29 ... phân nhóm, phát ngoại lai, dự HVTH: Võ Thị Thúy Lan – CH1301096 16 Áp dụng kỹ thuật khai thác liệu cho kế toán tài GVHD: PGS.TS Đỗ Phúc báo, hồi quy trực quan), thành phần thảo luận chi tiết phần...
Ngày tải lên: 20/05/2015, 22:56
Nghiên cứu ứng dụng các kỹ thuật khai phá dữ liệu áp dụng trong công tác dự báo tội phạm
... phòng chống tội phạm, 12/ 2010 [2] Hà Văn Sang, Nghiên cứu ứng dụng số mô hình học máy việc hỗ trợ đánh giá rủi ro tài chính, Luân văn cao học Đại học Công nghệ - ĐHQG Hà Nội, 20 09 [3] Nguyễn Xuân ... nhân dân, Hà Nội 20 01 [4] Trần Phương Nhung, Sử dụng kỹ thuật trích chọn thuộc tính phù hợp để nâng cao hiệu phân lớp liệu, Luận văn tốt nghiệp Đại học Công nghệ - ĐHQG Hà Nội, 20 09 [5] Võ Khánh ... computational biology, July 17, 20 01 [9] Jiawei Han and Micheline Kamber, Data Mining: Concepts and Techniques University of Illinois, Morgan Kaufmann Publishers 20 02 [10] Data mining neural networks...
Ngày tải lên: 25/08/2015, 16:23
NGHIÊN CỨU MỘT SỐ KỸ THUẬT KHAI PHÁ DỮ LIỆU MỜ VÀ ỨNG DỤNG
... [0.97, 1] Với k = ta tính Omin ,2 (x) với k = j = Omin, 2( rất cao), Omin ,2 (hơn cao), Omin, 2( khả cao), Omin ,2 (ít cao)… Omin, 2( rất cao) = [0,9 82, 0.987) tính Omin ,2 (x) với k < j = Omin, 3(rất ... fm(thấp) = 0. 42, fm(cao) = 0.58, µ (gần) = 0 .27 , µ (ít) = 0 .25 , µ (khá) = 0 .28 , µ (rất) = 0 .20 , Từ giả thiết ta có α = 0. 52, β = 0.48 Xây dựng biểu diễn khoảng cho giá trị ngôn ngữ x = cao 12 Ta có ... fm(cao) = 0.3, µ (rất) = 0.11, µ (hơn) = 0 .2, µ (khả năng) = 0.3, µ (ít) = 0.4 Dom(số lượng) = {2, 3, 4, 5, 7, 8,9, 10, 12} Chuyển giá trị đoạn [0,1] 22 thấp < thấp < thấp < khả thấp < thấp nên...
Ngày tải lên: 07/08/2014, 22:53
042_Nghiên cứu kỹ thuật khai phá dữ liệu và ứng dụng trong hệ thống bán sách
... [5] Nguyễn Tuệ, “SQL bản (Giáo trình) [6] Nguyễn Tuệ, “SQL nâng cao” (Giáo trình) [7] Đinh Mạnh Tường, “Nhập môn Trí tuệ nhân tạo”, NXB Khoa học kỹ thuật, 20 02 [8] Nguyễn Văn Vỵ, “Giáo trình ... TP Hồ Chí Minh, 20 04 [9] Nguyễn Văn Vỵ “Phân tích thiết kế hệ thống thông tin quản lý”, NXB Thống kê, 20 04 Tài liệu tiếng Anh: [1] Nguyễn Hùng Sơn, “Giáo trình Dataming” (Slide) [2] Wiley.IEEE.Press.DANIEL ... VS.NET 20 05 hệ quản trị sở liệu MSSQL Server 20 05 Để hệ thống đưa hệ thống vào vận hành thực thực tế cần có thêm thời gian công sức nghiên cứu kiểm thử, hoàn thiện giải pháp xây dựng phần mềm...
Ngày tải lên: 06/10/2013, 19:20
043_Tìm hiểu và triển khai một số kỹ thuật khai phá dữ liệu
... phân tách tài nguyên độc lập 2. 2 Phân tích thành phần độc lập: -Centerning Phần định nghĩa phương pháp ICA: -Whitening Cho tập quan sát biến ngẫu nhiên (x1(t), x2(t),….,xn(t)), với t thời gian ... Chương ta đưa ứng dụng ICA số lĩnh vực ICA khai phá liệu: 2. 2 .2 Các ứng dụng ICA: Đưa ứng dụng ICA : -Phân tách nhân tố MEG - Trong khai phá văn -Tìm kiếm nhân tố ẩn liệu tài - Tìm cấu trúc liệu ... Phần quan sát hỗn hợp tài nguyên không xác định trước ví dụ tín hiệu tự nhiên, âm thu từ loa, tín hiệu điện… -Sự ước lượng cho phép có xác suất tối đa 2. 5 Tiền xử lý cho ICA: Trong phần...
Ngày tải lên: 06/10/2013, 20:20
Ứng dụng kỹ thuật khai phá dữ liệu vào hoạt động chăm sóc khách hàng tại khách sạn vọng cảnh thành phố huế
... sát, thu thập số liệu Phân tích, tổng hợp số liệu (sử dụng thuật toán Apriori thuật toán K-Means phần mềm khai phá weka để phân tích sử lý số liệu) HCE LOGO Cơ sở liệu toán Dữ liệu lưu file khachhang.csv ... hàng lưu trú khách sạn, với thuộc tính thông tin cá nhân khách hàng là: 1) MaKH (mã khách hàng) 2) Quoctich (quốc tịch) 3) Gioitinh (giới tính) 4) Tuoi (tuổi) 5) Thoigianluutru (thời gian lưu ... phòng cao cấp Khách hàng chủ yếu chọn hình thức toán qua ngân hàng Chi tiêu trung bình khách từ 25 0000 đồng/ngày Khách hàng mục tiêu khách sạn khách hàng nước, độ tuổi niên K43 THKT Nguyễn Thị...
Ngày tải lên: 13/12/2013, 15:04
PHÂN LOẠI sử DỤNG đất của HÌNH ẢNH VIỄN THÁM và với dữ LIỆU GIS dựa vào kỹ THUẬT KHAI THÁC dữ LIỆU KHÔNG GIAN
... 3.900 0.003 0. 020 0.013 0.0 02 0. 021 2. 303 0.535 0.004 8.496 0.087 0.151 0.141 0.140 0.103 0.7 12 0.003 0.016 10. 423 0. 026 0.0 12 0.076 0.013 0. 623 0.063 0.48 0.1 72 1.709 0.361 2. 226 2. 2 92 1.080 0.001 ... 0.087 0.0 02 0.114 3.974 0.634 0.435 0 .21 9 0.010 0.009 0.0 02 0. 325 0 .26 3 4. 422 4.571 0.065 0 .21 4 0.006 0.000 0 .27 1 0.045 1.354 15.671 0.6 42 0.1 32 0.039 0. 127 0.080 0.049 0.168 0.839 29 . 024 4. 328 9.135 ... 0 .21 5 0.006 0.000 0 .21 8 0.045 0.696 24 .079 0.6 42 25.899 residential area 0.1 32 0.039 0. 127 0.080 0.049 0.168 0.839 29 . 024 30.46 Sum 4. 328 9.135 10.834 2. 689 4.846 9.041 26 .22 7 32. 901 100 Accuracy...
Ngày tải lên: 28/12/2013, 20:26
Nghiên cứu các kỹ thuật phân lớp dữ liệu và xây dựng chương trình hỗ trợ đánh giá thành tích nhân viên cho công ty esilicon việt nam
... chí sau: 2. 2.3.1 Khả lãnh đạo 2. 2.3 .2 Khả giao tiếp 2. 2.3.3 Khả quản lý 2. 2.3.4 Khả giao công việc 2. 2.3.5 Khả làm việc 2. 2.3.6 Khả quản lý dự án 2. 2.3.7Khả phân tích giải vấn đề 2. 2.4 Mối quan ... Layout 2 3 2. 714 Yes No E17 Manager Layout 3 3 3. 428 Yes Yes E18 Manager Layout 3 2 2.1 42 No Yes E19 Employee IPDE 1 2 1. 428 No Yes E20 Employee IC 3 3 3.1 42 No No E21 Leader ASIC 3 3.571 No No E 22 ... NO YES NO NO YES NO YES YES 2
Ngày tải lên: 30/12/2013, 13:34
Kỹ thuật khai phá dữ liệu và ứng dụng xây dựng cơ sở tri thức
... { {2} ,{3},{5}} {{1}, {2} ,{3},{5}} { {2} ,{5}} L1 Tập phần tử {1} {2} {3} {5} L2 Tập Tập phần tử phần tử {{1 3}} {1 3} { {2 3}, {2 5},{3 5}} {2 3} {{1 2} ,{1 3},{1 5}, {2 5} {2 , {2 5}, {3 5}} {3 5} { {2 ... C3 TID Tập phần tử 20 0 300 { {2 5}} { {2 5}} L3 Tập phần tử {2 5} Độ hỗ trợ 3 Độ hỗ trợ 2 Độ hỗ trợ Nguyễn Tiến Thành – Công nghệ phần mềm K44 51 C2 Tập phần tử {1 2} {1 3} {1 5} {2 3} {2 5} {3 5} ... tập phần tử nằm t.set-of-itemsets, kết luận c k có mặt giao dịch t.ID, thêm ck vào Ct Cấu trúc liệu để minh họa thuật toán cho bảng 4 .2 TID 100 Phần tử 134 20 0 23 5 300 123 5 400 25 Bảng 4 .2 CSDL...
Ngày tải lên: 22/01/2014, 18:54
Kỹ thuật khai phá dữ liệu chuỗi thời gian áp dụng trong dự báo chứng khoán
... 1.09 12/ 09 /20 12 391. 122 1 388.4 2. 722 1 0.70 13/09 /20 12 391.3961 391.4 -0.0039 ~0.00 14/09 /20 12 391.6655 398.9 -7 .23 45 1.85 17/09 /20 12 391.9303 401.8 -9.8697 2. 52 18/09 /20 12 3 92. 1906 394.5 -2. 3094 ... phổ biến 2. 2.1 Chuỗi thời gian thực 2. 2 .2 Thành phần xu hướng dài hạn 2. 2.3 Thành phần mùa 2. 2.4 Thành phần chu kỳ 2. 2.5 Thành phần bất thường 2. 3 Mô hình ARIMA cho liệu chuỗi thời gian 2. 3.1 Các ... ARIMA(1,0,1) ABT 20 Hình 3.18 Kiểm tra phần dư chuỗi ABT Bảng 3 .2 Bảng tiêu chuẩn đánh giá mô hình ARIMA ABT BIC Adjusted R2 SEE ARIMA(1,0,0) 2. 38 527 1 0.814950 0.7 829 72 ARIMA(1,0,1) 2. 34 521 7 0. 825 445 0.760445...
Ngày tải lên: 13/02/2014, 12:55
NGHIÊN CỨU VÀ ÁP DỤNG MỘT SỐ KỸ THUẬT KHAI PHÁ DỮ LIỆU VỚI CƠ SỞ DỮ LIỆU NGÀNH THUẾ VIỆT NAM
... cho b i: Infox1 (T) = 5/14 ( – 2/ 5 log2 (2/ 5) – 3/5 log2 (3/5)) + 4/14 ( – 4/4 log2 (4/4) – 0/4 log2 (0/4)) + 5/14 ( – 3/5 log2 (3/5) – 2/ 5 log2 (2/ 5)) = 0.694 bits 25 B ng 1.1: CSDL ñơn gi n g ... tương ng cho ki m tra x3 (Attribute2 ≤ 80 or Attribute2 > 80) sau: 27 Infox3 (T) = 9/14 ( – 7/9 log2 (7/9) – 2/ 9 log2 (2/ 9)) + 5/14 ( – 2/ 5 log2 (2/ 5) – 3/5 log2 (3/5)) = 0.837 bits Gain(x3) = ... m t kho ng), thông tin k t qu ñư c cho b i: Infox4 (T1) = 2/ 5 ( – 2/ 2 log2 (2/ 2) – 0 /2 log2 (0 /2) ) + 3/5 ( – 0/3 log2 (0/3) – 3/3 log2 (3/3)) = bits Gain thu ñư c b i test c c ñ i: Gain(x4) =...
Ngày tải lên: 13/02/2014, 20:41
ÁP DỤNG CÁC KỸ THUẬT PHÂN LỚP DỮ LIỆU, HỒI QUY ĐỂ DỰ BÁO SỐ LIỆU SẢN XUẤT KINH DOANH CHO VNPT
... từ tháng 84 Bảng 10 Kết dự báo tiêu m 425 tháng 10 từ tháng 85 Bảng 11 Kết dự báo tiêu m 425 tháng 11 từ tháng 85 Bảng 12 Kết dự báo tiêu m 425 tháng 12 từ tháng 85 Bảng 13 Độ xác trung ... .24 1) Khái quát mạng nơron .24 2. 2 Mô hình mạng nơron nhân tạo 25 2. 4 Thuật toán lan truyền ngược sai số .30 2. 5 Thiết kế mạng nơron 32 1) Bước ... Bảng Kết dự báo tiêu m 420 tháng từ số liệu tháng 83 Bảng Kết dự báo tiêu m 420 tháng 10 từ số liệu tháng 83 Bảng Kết dự báo tiêu m 420 tháng từ số liệu tháng 83 Bảng Kết dự báo tiêu m410...
Ngày tải lên: 17/02/2014, 12:19
nghiên cứu các kỹ thuật phân cụm dữ liệu và ứng dụng
... gian x-y (Hình 2. 2) : y d 12 C2(x2, y2) C1(x1, y1) x Hình 2. 2: Khoảng cách Euclidean Tuy nhiên nguyên tắc tổng quát để chọn phép đo áp dụng cho toán Một cách đơn giản để đo độ tương tự nhóm khung ... kiểu liệu 21 2. 6 Các hướng tiếp cận toán phân cụm liệu 28 2. 6.1 Phương pháp phân hoạch (Partitioning Methods) 28 2. 6 .2 Phương pháp phân cấp (Hierarchical Methods) 36 2. 6.3 Phương ... Euclidean 24 Hình 2. 3: Bảng tham số 26 Hình 2. 4: Ví dụ trình phân hoạch với k=3 30 Hình 2. 6: Ví dụ số hình dạng cụm liệu khám phá K-means 32 Hình 2. 7: Các chiến lược phân...
Ngày tải lên: 17/02/2014, 20:40
Tài liệu luận văn: NGHIÊN CỨU VÀ ÁP DỤNG MỘT SỐ KỸ THUẬT KHAI PHÁ DỮ LIỆU VỚI CƠ SỞ DỮ LIỆU NGÀNH THUẾ VIỆT NAM ppt
... cho b i: Infox1 (T) = 5/14 ( – 2/ 5 log2 (2/ 5) – 3/5 log2 (3/5)) + 4/14 ( – 4/4 log2 (4/4) – 0/4 log2 (0/4)) + 5/14 ( – 3/5 log2 (3/5) – 2/ 5 log2 (2/ 5)) = 0.694 bits 25 B ng 1.1: CSDL ñơn gi n g ... tương ng cho ki m tra x3 (Attribute2 ≤ 80 or Attribute2 > 80) sau: 27 Infox3 (T) = 9/14 ( – 7/9 log2 (7/9) – 2/ 9 log2 (2/ 9)) + 5/14 ( – 2/ 5 log2 (2/ 5) – 3/5 log2 (3/5)) = 0.837 bits Gain(x3) = ... m t kho ng), thông tin k t qu ñư c cho b i: Infox4 (T1) = 2/ 5 ( – 2/ 2 log2 (2/ 2) – 0 /2 log2 (0 /2) ) + 3/5 ( – 0/3 log2 (0/3) – 3/3 log2 (3/3)) = bits Gain thu ñư c b i test c c ñ i: Gain(x4) =...
Ngày tải lên: 23/02/2014, 19:20
Luận văn:NGHIÊN CỨU CÁC KỸ THUẬT PHÂN LỚP DỮ LIỆU VÀ XÂY DỰNG CHƯƠNG TRÌNH HỖ TRỢ ĐÁNH GIÁ THÀNH TÍCH NHÂN VIÊN CHO CÔNG TY ESILICON VIỆT NAM pptx
... chí sau: 2. 2.3.1 Khả lãnh đạo 2. 2.3 .2 Khả giao tiếp 2. 2.3.3 Khả quản lý 2. 2.3.4 Khả giao công việc 2. 2.3.5 Khả làm việc 2. 2.3.6 Khả quản lý dự án 2. 2.3.7Khả phân tích giải vấn đề 2. 2.4 Mối quan ... Layout 2 3 2. 714 Yes No E17 Manager Layout 3 3 3. 428 Yes Yes E18 Manager Layout 3 2 2.1 42 No Yes E19 Employee IPDE 1 2 1. 428 No Yes E20 Employee IC 3 3 3.1 42 No No E21 Leader ASIC 3 3.571 No No E 22 ... NO YES NO NO YES NO YES YES 2
Ngày tải lên: 25/03/2014, 13:20
ứng dụng kỹ thuật khai phá dữ liệu vào hoạt động chăm sóc khách hàng tại khách sạn vọng cảnh
... chung (k -2) mục giống nhau, tức là: (l1[1]=l2[1] l1 [2] =l2 [2] … l2[k -2] =l2[k -2] l1[k-1]= l1[k-1] Điều kiện l2[k -2] =l2[k -2] đảm bảo không sinh thừa tập luật ứng cử, kết nhận có dạng: L1[1]l1 [2] l1[3]…l1[k -2] l1[k-1]l2[k-1] ... mục phổ biến .26 2. 2 Phân cụm liệu 30 2. 2.1 Khái niệm 30 2. 2 .2 Các yêu cầu thuật toán phân cụm liệu .30 2. 2.3 Các kiểu liệu phân cụm 31 2. 2.4 Phép đo độ ... 18 2. 1 .2 Các tính chất 18 2. 1 .2. 1 Tính chất tập mục phổ biến 18 2. 1 .2. 2 Tính chất luật kết hợp 19 2. 1.3 Giới thiệu toán khai phá luật kết hợp 20 2. 1.4 Thuật...
Ngày tải lên: 23/04/2014, 18:14
Báo cáo tốt nghiệp các giải thuật khai phá dữ liệu trên SQL server 2005 và ứng dụng
... liên kết phần tử liệu Ví dụ: Nhóm mặt hàng thường mua kèm với - Bài toán Phân cụm (Clustering): nhóm đối tượng liệu có tính chất giống vào nhóm II Các giải thuật khai phá liệu SQL Server 20 05 Microsoft ... ta có bảng sau 2. Thuật toán MS Decision Tree b Nguyên tắc thuật toán 2. Thuật toán MS Decision Tree b Nguyên tắc thuật toán Dữ liệu công ty gồm có 18484 khách hàng có 91 32 người mua xe, 93 52 người ... Entropy(CummuteDistance) = 0,9999 - 0,9 822 = 0,0177 Hoàn toàn tương tự với thuộc tính lại ta có: Gain(Age) = 0, 029 7 ; Gain(NumberCarOwner) = 0, 028 9 Gain(TotalChildren) = 0,0190 2. Thuật toán MS Decision Tree...
Ngày tải lên: 19/06/2014, 20:44