Khai phá dữ liệu trong kinh doanh (data mining for business)

103 53 0
Khai phá dữ liệu trong kinh doanh (data mining for business)

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Đại Học Quốc Gia Tp Hồ Chí Minh TRƯỜNG ĐẠI HỌC BÁCH KHOA - NGÔ NHẤT LINH KHAI PHÁ DỮ LIỆU TRONG KINH DOANH (DATA MINING FOR BUSINESS) Chuyên ngành : Khoa học Máy tính LUẬN VĂN THẠC SĨ TP HỒ CHÍ MINH, tháng 06 năm 2008 i CƠNG TRÌNH ĐƯỢC HỒN THÀNH TẠI TRƯỜNG ĐẠI HỌC BÁCH KHOA ĐẠI HỌC QUỐC GIA TP HỒ CHÍ MINH Cán hướng dẫn khoa học : TS Quản Thành Thơ Cán chấm nhận xét : Cán chấm nhận xét : Luận văn thạc sĩ bảo vệ tại: HỘI ĐỒNG CHẤM BẢO VỆ LUẬN VĂN THẠC SĨ TRƯỜNG ĐẠI HỌC BÁCH KHOA Ngày tháng năm ii ĐẠI HỌC QUỐC GIA TP HCM TRƯỜNG ĐẠI HỌC BÁCH KHOA CỘNG HOÀ Xà HỘI CHỦ NGHĨA VIỆT NAM Độc Lập - Tự Do - Hạnh Phúc -oOo Tp HCM, ngày 30 tháng 06 năm 2008 NHIỆM VỤ LUẬN VĂN THẠC SĨ Họ tên học viên : Ngô Nhất Linh Giới tính : Nam ;/ Nữ … Ngày, tháng, năm sinh : 26/01/1978 Nơi sinh : Đà Nẵng Chuyên ngành : Khoa học Máy tính Khoá : K15 1- TÊN ĐỀ TÀI : KHAI PHÁ DỮ LIỆU TRONG KINH DOANH 2- NHIỆM VỤ LUẬN VĂN : Áp dụng kỹ thuật FCA phục vụ trình khai phá liệu kinh doanh 3- NGÀY GIAO NHIỆM VỤ : 15/01/2007 4- NGÀY HOÀN THÀNH NHIỆM VỤ : 30/06/2008 5- HỌ VÀ TÊN CÁN BỘ HƯỚNG DẪN : TS Quản Thành Thơ Nội dung đề cương Luận văn thạc sĩ Hội Đồng Chuyên Ngành thông qua CÁN BỘ HƯỚNG DẪN (Họ tên chữ ký) CHỦ NHIỆM BỘ MÔN QUẢN LÝ CHUYÊN NGÀNH (Họ tên chữ ký) TS Quản Thành Thơ TS Đinh Đức Anh Vũ iii LỜI CÁM ƠN Trong thời gian học tập, nghiên cứu thực đề tài luận văn tốt nghiệp này, nhận động viên, giúp đỡ, hỗ trợ nhiệt tình thầy, cơ, gia đình, bạn bè đồng nghiệp Thông qua luận văn này, xin gởi lời cảm ơn chân thành đến: o Thầy Quản Thành Thơ tận tình hướng dẫn, hỗ trợ, giúp đỡ tơi nghiên cứu thực đề tài o Tập thể giáo sư, tiến sĩ, thầy, cô trường Đại Học Bách Khoa TP Hồ Chí Minh tận tình giảng dạy, giúp đỡ tơi q trình học tập, trình nghiên cứu thực đề tài o Gia đình, bạn bè đồng nghiệp động viên tạo điều kiện thuận lợi cho suốt thời gian học tập q trình nghiên cứu thực luận văn Tơi xin chân thành cảm ơn Chúc người vui khỏe hạnh phúc! iv TÓM TẮT LUẬN VĂN Trong kinh doanh, khai phá liệu ứng dụng rộng rãi Mục đích việc khai phá liệu giúp nhà quản trị đưa định kinh doanh hợp lý, chẳng hạn việc định tiếp cận mặt hàng nhóm khách hàng thơng qua hình thức gửi thư quảng cáo Một ứng dụng kinh điển khai phá liệu lĩnh vực kinh doanh sử dụng phương pháp phân cụm Phương pháp phân cụm tỏ có hiệu thu số kết định khai phá liệu Phương pháp phân cụm trình xử lý chia tập liệu thành nhóm, nhóm chứa tập phần tử liệu giống Phương pháp phân cụm chia làm hai loại: phân cụm phân cấp phân cụm riêng phần Trong hai loại phân cụm phân cấp tỏ đặc biệt hiệu phương pháp tạo ta hệ phân cấp để biểu diễn liệu Phân tích khái niệm hình thức (FCA) phương pháp phân cụm phân cấp đáng ý gần Phương pháp xây dựng hệ phân cấp dạng lưới, thay dạng phương pháp phân cụm phân cấp cổ điển khác, nhờ ta dẫn xuất nhiều thông tin cho người sử dụng Mặt khác, FCA cung cấp khả phân tích rút trích luật phụ thuộc lưới phân cấp tạo Các luật phụ thuộc áp dụng để phân tích mối liên hệ mặt hàng cho trường hợp ứng dụng cụ thể Tuy nhiên, hệ thống liệu lớn, việc áp dụng FCA lên hệ thống liệu nhiều thời gian Để rút ngắn thời gian khai phá liệu, ta dùng phương pháp phân cụm để phân liệu lớn thành cụm liệu nhỏ hơn, sau áp dụng FCA lên cụm liệu nhỏ để rút trích luật phụ thuộc (thời gian FCA rút trích luật cụm giảm nhiều so với lúc chưa phân cụm) Kết thu sau áp dụng FCA lên cụm nhỏ tổng hợp lại sử dụng chúng phục vụ cho trình khai phá liệu hệ thống tương ứng v MỤC LỤC NHIỆM VỤ LUẬN VĂN THẠC SĨ iii LỜI CÁM ƠN iv TÓM TẮT LUẬN VĂN v DANH MỤC CÁC HÌNH .ix DANH MỤC CÁC BẢNG xi CHƯƠNG TỔNG QUAN 1 Khai phá liệu 1 Phân cụm để khai phá liệu kinh doanh .2 Sử dụng FCA để rút trích luật kinh doanh Nội dung luận văn .4 CHƯƠNG CƠ SỞ LÝ THUYẾT VỀ KHAI PHÁ DỮ LIỆU 2.1 Các giai đoạn dự án khai phá liệu .5 2.1.1 Giai đoạn tìm hiểu tốn (Business understanding phase) 2.1.2 Giai đoạn tìm hiểu liệu (Data understanding phase) 2.1.3 Giai đoạn chuẩn bị liệu (Data preparation phase) 2.1.4 Giai đoạn mơ hình (Modeling phase) 2.1.5 Giai đoạn đánh giá (Evaluation phase) 2.1.6 Giai đoạn triển khai (Deployment phase) 2.2 Các phương pháp khai phá liệu vi 2.2.1 Phương pháp phân loại .8 2.2.2 Phương pháp ước lượng 2.2.3 Phương pháp dự đoán 2.2.4 Phương pháp phân cụm 2.2.5 Phương pháp mơ tả tóm tắt thơng tin 2.3 Khai phá liệu phương pháp phân cụm 10 2.3.1 Các phương pháp phân cụm riêng phần 10 2.3.2 Các phương pháp phân cụm phân cấp .18 CHƯƠNG PHÂN TÍCH KHÁI NIỆM HÌNH THỨC 19 Giới thiệu .19 Các khái niệm 20 3 Đồ thị lưới khái niệm .25 Thuật giải FCA 27 CHƯƠNG ÁP DỤNG FCA ĐỂ KHAI PHÁ DỮ LIỆU TRONG KINH DOANH 33 Rút trích luật kinh doanh dùng kỹ thuật FCA 34 1 Tạo lưới khái niệm .35 Rút trích luật phụ thuộc từ lưới khái niệm 38 Khai phá luật phụ thuộc .39 4 Liên hệ loại biểu diễn tri thức FCA 41 Ứng dụng minh họa “Sử dụng FCA để hỗ trợ trình lựa chọn dịch vụ” 42 Cải tiến tốc độ rút trích luật kinh doanh 46 vii CHƯƠNG KẾT QUẢ RÚT TRÍCH LUẬT 52 Tập liệu CarEvaluation .52 Tập liệu Nursery .65 Tập liệu BalanceScale 66 Tập liệu TicTacToe 69 5 Tập liệu Mushroom 70 Đánh giá kết rút trích luật 72 CHƯƠNG KẾT LUẬN 75 Kết đạt 75 Hướng phát triển tương lai 76 TÀI LIỆU THAM KHẢO 77 BẢNG THUẬT NGỮ VIỆT – ANH 80 PHỤ LỤC A: SỬ DỤNG WEKA HỖ TRỢ PHÂN CỤM DỮ LIỆU 82 PHỤ LỤC B: ĐỊNH DẠNG ARFF .85 PHỤ LỤC C: HƯỚNG DẪN SỬ DỤNG CHƯƠNG TRÌNH 87 viii DANH MỤC CÁC HÌNH Hình 2.1 Các giai đoạn dự án khai phá liệu Hình 2.2 Xác định ranh giới cụm liệu 11 Hình 2.3 Giá trị trung bình cụm .12 Hình 2.4 Đường ranh giới cụm 13 Hình 2.5 Bước ước lượng: Gán trách nhiệm Gaussian đến điểm 15 Hình 2.6 Mỗi Gaussian di chuyển đến giá trị trung bình tất điểm 16 Hình 2.7 Phân cụm mờ 17 Hình 3.1 Lưới khái niệm ngữ cảnh “Thức uống” 23 Hình 3.2 Hai cụm khái niệm C1 C lưới khái niệm 24 Hình 3.3 Lưới khái niệm thu gọn nhãn ngữ cảnh “Thức uống” 26 Hình 3.4 Tổng quan thuật giải xây dựng lưới khái niệm 27 Hình 3.5 Lưới khái niệm ngữ cảnh số loại thức uống 29 Hình 3.6 Chi tiết thuật giải xây dựng lưới khái niệm 30 Hình 3.7 Kết thực thi bước thuật giải 32 Hình 4.1 Các bước rút trích luật kinh doanh dùng kỹ thuật FCA .34 Hình 4.2 Dịch vụ du lịch 35 Hình 4.3 Giản đồ Hasse lưới khái niệm cho dịch vụ du lịch 37 Hình 4.4 Lưới khái niệm ngữ cảnh loại dịch vụ 45 Hình 4.5 Cải tiến tốc độ rút trích luật kinh doanh .47 ix Hình A.1 Giao diện Weka .82 Hình A.2 Mở tập tin định dạng arff 83 Hình A.3 Phân cụm liệu 84 Hình C.1 Giao diện chương trình FCA .87 Hình C.2 Thực thi chương trình 88 Hình C.3 Kết sau chương trình thực thi 89 Hình C.4 Đồ thị lưới khái niệm 90 x KHAI PHÁ DỮ LIỆU TRONG KINH DOANH TÀI LIỆU THAM KHẢO [1] Q T Tho, Cluster Analysis and Ontology Generation Techniques for The Development of Scholarly Semantic Web, The Degree of Doctor of Philosophy at School of Computer Engineering Nanyang Technological University Nanyang Avenue, Singapore, 2005 [2] D T Larose, Data Mining Methods and Models, Department of Mathematical Sciences Central Connecticut State University, 2006 [3] B D Agudo, Formal Concept Analysis As A Support Technique for CBR, AI Intelligence, Madrid, Spain, 2001 [4] M J A Berry, Data Mining Techniques for Marketing, Sales, and Customer Relationship, Wiley Publishing, Indianapolis, Indiana, 2004 [5] D T Larose, Discovering Knowledge in Data: An Introduction to Data Mining, Department of Mathematical Sciences Central Connecticut State University, 2005 [6] R Ghani, Data Mining for Business Applications, Accenture Technology Labs 161 N Clark St Chicago, 2005 [7] V M Boncheva, Using The Agglomerative Method of Hierarchical Clustering As A Data Mining Tool in Capital Market, Research Associate at the Institute of Information Technologies - Bulgarian Academy of Sciences, 2007 [8] J Han, M Kamber, Data mining: Concepts and Techniques, Morgan Kaufmann Publishers, 2000 [9] N A Jensen, Applied Data Mining for Business Intelligence, Informatics and Mathematical Modelling, The Technical University of Denmark, The Master of Science, 2006 TÀI LIỆU THAM KHẢO 77 KHAI PHÁ DỮ LIỆU TRONG KINH DOANH [10] C Soares, Workshop on Data Mining for Business Applications, University of Porto, Porto, Portugal, 2006 [11] B Ganter and R Wille, Formal Concept Analysis: Mathematical Foundations, Lecture Notes in Computer Science, Springer-Verlag, Berlin, 1999 [12] Data mining, Availaible at http://vi.wikipedia.org [13] S Yevtushenko, Computing and Visualizing Concept Lattices, Dissertation, TU Darmstadt, FB Informatics, 2004 [14] L Aversano, M Bruno, G Canfora, D Distante, Using Concept Lattices to Support Service Selection, International Journal of Web Services Research, 2006 [15] V Kumar, M Steinbach, P Tan, Introduction to Data Mining, University of Minnesota, 1998 [16] B Zhou, S C Hui and K Chang, A Formal Concept Analysis Approach for Web Usage Mining, School of Computer Engineering Nanyang Technological University Nanyang Avenue, Singapore, 2004 [17] M J Zaki, Generating Non-Redundant Association Rules, Computer Science Department, Rensselaer Polytechnic Institute, 2002 [18] L Kaufman and P Rousseeuw, Finding Groups in Data: An Introduction to Cluster Analysis, New York, USA: John Wiley and Sons, 1990 [19] U Priss, Linguistic Applications of Formal Concept Analysis, Darmstadt, 2003 [20] A Hotho, S Staab, and G Stumme, Text Clustering Based on Background Knowledge, Univeristy of Karlsruhe, 2003 [21] R Cole and G Stumme, CEM - a Conceptual Email Manager, in Proceedings of ICCS 2000 (B Ganter and G W.Mineau, eds.), vol LNAI 1867, pp 438-452, 2000 TÀI LIỆU THAM KHẢO 78 KHAI PHÁ DỮ LIỆU TRONG KINH DOANH [22] D.Richards and P.Compton, Combining Formal Concept Analysis and Ripple Down Rules to Support Reuse, Springer, 1997 [23] G Birkhoff, Lattice Theory, American Mathematical Society, 3rd ed., 1967 [24] P Berkhin, Survey of Clustering Data Mining Techniques, Accrue Software, 2002 Availaible at http://citeseer.nj.nec.com/berkhin02survey.html [25] P Sneath and R Sokal, Numerical Taxonomy, London, England: Freeman, 1973 [26] B King, Step-wise Clustering Procedures, Journal of American Statistics Association, vol 69, pp 86-101, 1967 [27] J Ward, Hierarchical Grouping to Optimize an Objective Function, Journal of American Statistics Association, vol 58, no 236-244, 1963 [28] B Everitt, Cluster Analysis, London, England: Edwards Arnold, 3rd ed., 1993 TÀI LIỆU THAM KHẢO 79 KHAI PHÁ DỮ LIỆU TRONG KINH DOANH BẢNG THUẬT NGỮ VIỆT – ANH Bước tăng cực đại Maximization step Bước ước lượng Estimation step Hàm thành viên Membership function Hệ phân cấp khái niệm Concept hierachy Khái niệm Subconcept Khai phá liệu Data mining Khai phá luật phụ thuộc Dependency rule mining Luật phụ thuộc Dependency rule Lưới khái niệm Concept lattice Ngữ cảnh hình thức (NCHT) Formal context Phân cụm Clustering Phân cụm phân cấp Hierarchical clustering Phân cụm riêng phần Partitioning clustering Phân tích khái niệm hình thức (FCA) Formal Concept Analysis Phương pháp dự đốn Prediction Phương pháp mơ tả tóm tắt thơng tin Profiling Phương pháp phân cụm mờ Fuzzy clustering Phương pháp phân loại Classification BẢNG THUẬT THUẬT NGỮ VIỆT - ANH 80 KHAI PHÁ DỮ LIỆU TRONG KINH DOANH Phương pháp ước lượng Estimation Siêu khái niệm Superconcept Thứ tự có thứ bậc Hierarchical order BẢNG THUẬT THUẬT NGỮ VIỆT - ANH 81 KHAI PHÁ DỮ LIỆU TRONG KINH DOANH PHỤ LỤC A: SỬ DỤNG WEKA HỖ TRỢ PHÂN CỤM DỮ LIỆU Trong khai phá liệu, hệ thống liệu lớn, dùng phần mềm Weka 3.5.6 để hỗ trợ phân liệu lớn thành cụm liệu nhỏ Bây ta tìm hiểu cách phân cụm liệu lớn thành cụm liệu nhỏ Weka Giao diện Weka Hình A.1 giao diện Weka sau chạy chương trình Weka 3.5.6.exe Hình A.1 Giao diện Weka PHỤ LỤC A: SỬ DỤNG WEKA HỖ TRỢ PHÂN CỤM DỮ LIỆU 82 KHAI PHÁ DỮ LIỆU TRONG KINH DOANH Mở tập tin arff: Từ giao diện chính, ta chọn Application → Explore → Preprocess → Open File để mở sở liệu với tập tin định dạng arff Quan sát chi tiết giao diện Hình A.2 Hình A.2 Mở tập tin định dạng arff Phân cụm sở liệu Sau mở sở liệu với tập tin định dạng arff, ta chọn thẻ Cluster để thực công việc phân cụm sở liệu Quá trình phân cụm thực theo trình tự từ Bước đến Bước Hình A.3 PHỤ LỤC A: SỬ DỤNG WEKA HỖ TRỢ PHÂN CỤM DỮ LIỆU 83 KHAI PHÁ DỮ LIỆU TRONG KINH DOANH Bước Kích chuột vào để chọn số cụm liệu cần chia SBước Thực thi trình phân cụm Bước Chọn thuộc tính để phân cụm Bước Kích phải chuột vào kết → Visualize cluster → Lưu kết Hình A.3 Phân cụm liệu PHỤ LỤC A: SỬ DỤNG WEKA HỖ TRỢ PHÂN CỤM DỮ LIỆU 84 KHAI PHÁ DỮ LIỆU TRONG KINH DOANH PHỤ LỤC B: ĐỊNH DẠNG ARFF Phần mềm Weka sử dụng định dạng tập tin nhập định dạng arff Định dạng arff bao gồm phần chính: tên liệu, thuộc tính liệu liệu Các thành phần mô tả ngắn gọn sau: Tên liệu Một tập liệu bắt đầu khai báo tên, cách khai báo tên sau: @relation name Biến name tên liệu cần đặt Thuộc tính liệu Danh sách thuộc tính liệu khai báo theo định dạng: @attribute attribute_name specification attribute_name tên thuộc tính liệu specification kiểu thuộc tính liệu Có kiểu thuộc tính liệu: o Nếu thuộc tính có kiểu danh từ Các giá trị thuộc tính đặt hai đấu móc cách dấu phẩy @attribute nominal_attribute {first_value, second_value, third_value, …} o Nếu thuộc tính có kiểu số Đặc tả thuộc tính dùng từ khóa numeric @attribute numeric_attribute numeric o Bên cạnh thuộc tính vừa trình bày, kiểu thuộc tính cịn hỗ trợ kiểu chuỗi Các khai báo thuộc tính kiểu chuỗi dùng từ khóa string PHỤ LỤC B: ĐỊNH DẠNG ARFF 85 KHAI PHÁ DỮ LIỆU TRONG KINH DOANH @attribute string_attribute string Dữ liệu Bắt đầu phần liệu là: @data Sau @data giá trị thuộc tính liệu, giá trị cách dấu phẩy Một ví dụ định dạng tập tin arff thời tiết trình bày sau: @relation weather @attribute outlook { sunny, overcast, rainy } @attribute temperature numeric @attribute humidity numeric @attribute windy { TRUE, FALSE } @attribute play { yes, no } @data sunny, 85, 85, FALSE, no sunny, 80, 90, TRUE, no overcast, 83, 86, FALSE, yes rainy, 70, 96, FALSE, yes rainy, 68, 80, FALSE, yes rainy, 65, 70, TRUE, no overcast, 64, 65, TRUE, yes sunny, 72, 95, FALSE, no sunny, 69, 70, FALSE, yes rainy, 75, 80, FALSE, yes sunny, 75, 70, TRUE, yes overcast, 72, 90, TRUE, yes overcast, 81, 75, FALSE, yes rainy, 71, 91, TRUE, no PHỤ LỤC B: ĐỊNH DẠNG ARFF 86 KHAI PHÁ DỮ LIỆU TRONG KINH DOANH PHỤ LỤC C: HƯỚNG DẪN SỬ DỤNG CHƯƠNG TRÌNH Cơng cụ khai phá liệu kinh doanh sử dụng kỹ thuật FCA với: o Input: sở liệu access tập tin định dạng arff Đối với sở liệu access, bảng sở liệu ngữ cảnh hình thức giá trị o Output: tập khái niệm, tập luật phụ thuộc đồ thị lưới khái niệm Hình C.1 giao diện chương trình Hình C.1 Giao diện chương trình FCA PHỤ LỤC C: HƯỚNG DẪN SỬ DỤNG CHƯƠNG TRÌNH 87 KHAI PHÁ DỮ LIỆU TRONG KINH DOANH Thao tác input Đối với ngữ cảnh hình thức lưu tập tin access, ngữ cảnh hình thức đưa vào chương trình thao tác: Từ giao diện ta chọn File → Load database → chọn tập tin access Để đưa ngữ cảnh lưu tập tin arff vào chương trình: Từ giao diện ta chọn Tool → Load context from arff → Load arff Sau chọn tập tin arff, kích chuột vào nút “Add the context to DB” để thêm ngữ cảnh vào sở liệu Thực thi chương trình Hình C.2 mơ tả bước thực thi chương trình Để chương trình thực thi, ta thực hiện: o Bước 1: chọn ngữ cảnh hình thức mục Context o Bước 2: kích chuột vào nút Run FCA để chạy chương trình Bước Thực thi chương trình Bước Chọn ngữ cảnh hình thức Hình C.2 Thực thi chương trình PHỤ LỤC C: HƯỚNG DẪN SỬ DỤNG CHƯƠNG TRÌNH 88 KHAI PHÁ DỮ LIỆU TRONG KINH DOANH Thao tác output Sau chương trình thực thi xong Kết thu bao gồm: khái niệm, luật phụ thuộc đồ thị lưới khái niệm Hình C.3 trình bày kết chương trình sau thực thi xong Danh sách khái niệm Xuất phụ thuộc tập tin “*.txt” Danh sách luật phụ thuộc Quan sát đồ thị lưới khái niệm Hình C.3 Kết sau chương trình thực thi PHỤ LỤC C: HƯỚNG DẪN SỬ DỤNG CHƯƠNG TRÌNH 89 KHAI PHÁ DỮ LIỆU TRONG KINH DOANH Quan sát Hình C.3, để biết kết thu ta thực thao tác: o Chọn thẻ Formal concepts để xem danh sách khái niệm thu o Chọn thẻ Dependence rules để xem danh sách luật phụ thuộc o Chọn nút Out rules để xuất luật phụ thuộc tập tin “*.txt” o Chọn nút View lattice để xem đồ thị lưới khái niệm Hình C.4 ví dụ đồ thị lưới khái niệm Đồ thị lưới khái niệm Hình C.4 cho phép người dùng xem toàn lưới thông tin chi tiết khái niệm Bên cạnh đó, giao diện lưới khái niệm cịn cho phép người dùng chọn cách hiển thị thông tin thuộc tính, đối tượng theo dạng tóm tắt đầy đủ Hình C.4 Đồ thị lưới khái niệm PHỤ LỤC C: HƯỚNG DẪN SỬ DỤNG CHƯƠNG TRÌNH 90 LÝ LỊCH TRÍCH NGANG Họ tên: Ngơ Nhất Linh Sinh ngày: 26–01–1978 Địa liên lạc: 207 Trần Cao Vân, P Xuân Hà, Q Thanh Khê, TP Đà Nẵng Email: linhnhatngo@yahoo.com Nơi sinh: Thành phố Đà Nẵng QUÁ TRÌNH ĐÀO TẠO Thời gian Hệ Ngành Nơi học 1996–2001 Đại học Công nghệ Thông tin ĐH Bách khoa TP.HCM 2004–2008 Cao học Công nghệ Thông tin ĐH Bách khoa TP.HCM QUÁ TRÌNH CƠNG TÁC Thời gian Chức vụ Cơ quan Địa 2001–2002 Nhân viên PSV 14 Đông Du, Q1, TP.HCM 2003–2007 Nhân viên LCK 23 Trần Khắc Chân, Q1, TP.HCM 91 ... NIỆM HÌNH THỨC 32 KHAI PHÁ DỮ LIỆU TRONG KINH DOANH CHƯƠNG ÁP DỤNG FCA ĐỂ KHAI PHÁ DỮ LIỆU TRONG KINH DOANH Trong kinh doanh, khai phá liệu ứng dụng rộng rãi Mục đích việc khai phá liệu giúp nhà... hoạch kinh doanh CHƯƠNG 4: ÁP DỤNG FCA ĐỂ KHAI PHÁ DỮ LIỆU TRONG KINH DOANH 33 KHAI PHÁ DỮ LIỆU TRONG KINH DOANH Rút trích luật kinh doanh dùng kỹ thuật FCA FCA kỹ thuật dùng để phân tích liệu. .. SỞ LÝ THUYẾT VỀ KHAI PHÁ DỮ LIỆU KHAI PHÁ DỮ LIỆU TRONG KINH DOANH 2.2.1 Phương pháp phân loại Phương pháp phân loại (Classification) phương pháp khai phá liệu dùng nhiều Phương pháp phân loại

Ngày đăng: 15/02/2021, 17:35

Từ khóa liên quan

Mục lục

  • CHƯƠNG 1.

  • CHƯƠNG 1. TỔNG QUAN

  • CHƯƠNG 2. CƠ SỞ LÝ THUYẾT VỀ KHAI PHÁ DỮ LIỆU

    • 2.1.1. Giai đoạn tìm hiểu bài toán (Business understanding phase)

      • 2.1.2. Giai đoạn tìm hiểu dữ liệu (Data understanding phase)

      • 2.1.3. Giai đoạn chuẩn bị dữ liệu (Data preparation phase)

      • 2.1.4. Giai đoạn mô hình (Modeling phase)

      • 2.1.5. Giai đoạn đánh giá (Evaluation phase)

      • 2.1.6. Giai đoạn triển khai (Deployment phase)

      • 2.2.1. Phương pháp phân loại

      • 2.2.2. Phương pháp ước lượng

      • 2.2.3. Phương pháp dự đoán

      • 2.2.4. Phương pháp phân cụm

      • 2.2.5. Phương pháp mô tả và tóm tắt thông tin

      • 2.3.1. Các phương pháp phân cụm riêng phần

      • 2.3.2. Các phương pháp phân cụm phân cấp

      • CHƯƠNG 3. PHÂN TÍCH KHÁI NIỆM HÌNH THỨC

      • CHƯƠNG 4. ÁP DỤNG FCA ĐỂ KHAI PHÁ DỮ LIỆU TRONG KINH DOANH

        • 4. 1. 1. Tạo lưới khái niệm

          • 4. 1. 2. Rút trích luật phụ thuộc từ lưới khái niệm

          • 4. 1. 3. Khai phá luật phụ thuộc

          • 4. 1. 4. Liên hệ giữa các loại biểu diễn tri thức trong FCA

          • CHƯƠNG 5. KẾT QUẢ RÚT TRÍCH LUẬT

          • CHƯƠNG 6. KẾT LUẬN

Tài liệu cùng người dùng

Tài liệu liên quan