Nghiên cứu một số thuật toán khai phá tập mục thường xuyên và tập mục cổ phần cao trong cơ sở dữ liệu

80 15 0
Nghiên cứu một số thuật toán khai phá tập mục thường xuyên và tập mục cổ phần cao trong cơ sở dữ liệu

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

ĐẠI HỌC THÁI NGUYÊN TRƢỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG BẾ QUANG HUẤN NGHIÊN CỨU MỘT SỐ THUẬT TOÁN KHAI PHÁ TẬP MỤC THƢỜNG XUYÊN VÀ TẬP MỤC CỔ PHẦN CAO TRONG CƠ SỞ DỮ LIỆU Chuyên nghành: Khoa học máy tính Mã số: 60.48.01 LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH Ngƣời hƣớng dẫn khoa học: GS TS Vũ Đức Thi THÁI NGUYÊN 2012 Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn i LỜI CAM ĐOAN Tôi xin cam đoan toàn nội dung Luận văn hoàn toàn theo nội dung đề cƣơng nhƣ nội dung mà cán hƣớng dẫn giao cho Nội dung luận văn, phần trích lục tài liệu hồn tồn xác Nếu có sai sót tơi hồn toàn chịu trách nhiệm Tác giả luận văn Bế Quang Huấn Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn ii MỤC LỤC LỜI CAM DOAN i DANH MỤC CÁC KÝ HIỆU VÀ CÁC CHỮ VIẾT TẮT iv DANH MỤC CÁC BẢNG BIỂU v DANH MỤC CÁC HÌNH VẼ, ĐỒ THỊ vi MỞ ĐẦU Chƣơng KHAI PHÁ TẬP MỤC THƢỜNG XUYÊN VÀ MỘT SỐ MỞ RỘNG 1.1 MỞ ĐẦU 1.2 CÁC KHÁI NIỆM CƠ BẢN 1.2.1 Cơ sở liệu giao tác 1.2.2 Tập mục thƣờng xuyên luật kết hợp 10 1.2.3 Bài toán khai phá luật kết hợp 12 1.3 KHAI PHÁ TẬP MỤC THƢỜNG XUYÊN 14 1.3.1 Các cách tiếp cận khai phá tập mục thƣờng xuyên 14 1.3.2 Thuật toán Apriori 16 1.3.3 Thuật toán FP-growth 22 1.4 MỞ RỘNG BÀI TOÁN KHAI PHÁ TẬP MỤC THƢỜNG XUYÊN 31 1.5 KẾT LUẬN CHƢƠNG 33 Chƣơng KHAI PHÁ TẬP MỤC CỔ PHẦN CAO 34 2.1 GIỚI THIỆU 34 2.2 BÀI TOÁN KHAI PHÁ TẬP MỤC CỔ PHẦN CAO 35 2.3 THUẬT TOÁN FSM 41 2.3.1 Cở sở lý thuyết thuật toán FSM 41 Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn iii 2.3.2 Thuật toán FSM 42 2.3.3 Nhận xét thuật toán FSM 44 2.4 THUẬT TOÁN AFSM 45 2.4.1 Cơ sở lý thuyết thuật toán AFSM 45 2.4.2 Thuật toán AFSM 52 2.4.3 Đánh giá thuật toán AFSM 59 2.5 KẾT LUẬN CHƢƠNG 60 Chƣơng THỰC NGHIỆM VÀ ĐÁNH GIÁ THUẬT TOÁN 61 3.1 ĐẶT BÀI TOÁN 61 3.2 THIẾT KẾ MODUL CHƢƠNG TRÌNH VÀ GIẢI THUẬT 62 3.3 GIAO DIỆN SỬ DỤNG VÀ CHỨC NĂNG CHƢƠNG TRÌNH 67 3.4 ĐÁNH GIÁ KẾT QUẢ VÀ HƢỚNG PHÁT TRIỂN CỦA CHƢƠNG TRÌNH 70 KẾT LUẬN 72 TÀI LIỆU THAM KHẢO 73 Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn iv DANH MỤC CÁC KÝ HIỆU VÀ CÁC CHỮ VIẾT TẮT Ký hiệu Diễn giải I={i1,i2,…,in} Tập n mục liệu DB ={T1,T2,…,Tm} Cơ sở liệu có m giao tác db Cơ sở liệu giao tác DB, db  DB ip Mục liệu thứ p Tq Giao tác thứ q n Số mục liệu sở liệu giao tác m Số giao tác sở liệu giao tác A, B, C,… Tên mục liệu sở liệu giao tác X, Y,… Tập tập mục liệu I, X, Y  I X=ABC Thay cho X={A,B,C} sở liệu giao tác minsup Ngƣỡng độ hỗ trợ minShare Ngƣỡng cổ phần tối thiểu minconf Ngƣỡng độ tin cậy tối thiểu X Số phần tử tập hợp X CSDL Cở sở liệu CNTT Cơng nghệ thơng tin Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn v DANH MỤC CÁC BẢNG BIỂU Bảng 1.1: Biểu diễn ngang sở liệu giao tác .8 Bảng 1.2: Biểu diễn dọc sở liệu giao tác Bảng 1.3: Ma trận giao tác sở liệu bảng 1.1 10 Bảng 1.4: Cơ sở liệu giao tác minh họa thực thuật toán Apriori 20 Bảng 1.5: Cơ sở liệu giao tác minh họa thực thuật toán COFI-tree 25 Bảng 1.6: Các mục liệu độ hỗ trợ 26 Bảng 1.7: Các mục liệu thƣờng xuyên thứ tự 26 Bảng 1.8: Các mục liệu giao tác giảm dần theo độ hỗ trợ 27 Bảng 2.1: Cơ sở liệu ví dụ 36 Bảng 2.2: Giá trị lmv cổ phần mục liệu CSDL bảng 2.1 38 Bảng 2.3: Các tập mục cổ phần cao CSDL bảng 2.1 38 Bảng 2.4: CSDL minh họa ngữ nghĩa tập mục cổ phần cao 40 Bảng 2.5a: CSDL minh họa có trƣờng hợp hai hàm tới hạn 51 Bảng 2.5b: CSDL minh học có trƣờng hợp hai hàm tới hạn băng 51 Bảng 2.6: Giá trị hai hàm tới hạn k=1 52 Bảng 2.7: Các giá trị lmv hàm tới hạn với k=1 56 Bảng 2.8: Các giá trị lmv hàm tới hạn với k=2 57 Bảng 2.9: Các giá trị lmv hàm tới hạn với k=3 57 Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn vi DANH MỤC CÁC HÌNH VẼ, ĐỒ THỊ Hình 1.1: Phân loại thuật toán khai phá tập mục thƣờng xuyên 15 Hình 1.2: Cây FP-tree CSDL bảng 1.5 28 Hình 1.3: Cây COFI-tree mục D 28 Hình 1.4: Các bƣớc khai phá D-COFI-tree 31 Hình 2.1: Khơng gian tìm kiếm tập mục cổ phần cao theo thuật tốn AFSM 58 Hình 3.1: Giao diện chƣơng trình demo 63 Hình 3.2: Giao diện hiển thị bảng liệu 64 Hình 3.3: Giao diện cập nhật ngƣỡng cổ phần ngƣỡng tin cậy cho bảng liệu 65 Hình 3.4: Giao diện hiển thị kết tìm tập mục cổ phần cao 66 Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn MỞ ĐẦU Một ứng dụng quan trọng công nghệ thông tin đời sống giúp giải toán quản lý Kể từ máy tính điện tử trở thành cơng cụ lao động quan trọng nhu cầu lƣu trữ, tìm kiếm xử lý số liệu thống kê Đến nay, sở liệu trở nên khổng lồ ngƣời ta mong muốn kho liệu cần đƣợc khai thác hiệu nhiều bình diện Trong năm gần đây, khai phá liệu (Data mining) trở thành hƣớng nghiên cứu lớn lĩnh vực khoa học máy tính cơng nghệ thơng tin Khai phá liệu đƣợc áp dụng cách rộng rãi nhiều lĩnh vực kinh doanh đời sống khác nhau: marketing, tài chính, ngân hàng bảo hiểm, khoa học, y tế, an ninh, internet… Khai phá liệu khám phá tri thức (Data Mining and Knowledge Discovery) lĩnh vực thu hút đông đảo nhà khoa học giới nƣớc tham gia nghiên cứu Khai phá tập mục thƣờng xuyên tốn có vai trị quan trọng nhiều nhiệm vụ khai phá liệu Khai phá tập mục thƣờng xuyên đƣợc biết đến ban đầu toán toán khai phá luật kết hợp đƣợc giới thiệu Agrawal vào năm 1993 phân tích sở liệu bán hàng siêu thị, phân tích sở thích mua khách hàng cách tìm mặt hàng khác đƣợc khách hàng mua lần mua Những thông tin nhƣ giúp ngƣời quản lý kinh doanh tiếp thị trọn lọc thu xếp không gian bày hàng hợp lý hơn, giúp cho kinh doanh hiệu Mơ hình khai phá tập mục thƣờng xuyên có nhiều ứng dụng thực tế nhƣng có hạn chế, không đáp ứng đầy đủ yêu cầu ngƣời sử dụng Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn Để đáp ứng nhu yêu cầu thực tiễn, số hƣớng mở rộng toán đƣợc quan tâm nghiên cứu Một hƣớng mở rộng tốn có rât nhiều ứng dụng quan tâm đến cấu trúc liệu mức độ quan trọng khác mục liệu, thuộc tính sở liệu Theo hƣớng này, từ toán khai phá tập mục thƣờng xuyên ban đầu, nhiều nhà nghiên cứu đề xuất mơ hình mở rộng: Khai phá tập mục cổ phần cao, đánh giá đóng góp tập mục liệu tổng số mục liệu sở liệu Trên giới, kết nghiên cứu khai phá tập mục cổ phần cao đƣợc công bố nhiều từ nhóm nghiên cứu số trƣờng đại học Mỹ, Canada, Úc, Đài Loan, Singapo, Hồng Kông,… Tại Việt Nam, Khai phá luật kết hợp đƣợc nhóm nghiên cứu Viện Cơng nghệ Thơng tin thuộc Viện Khoa học Công nghệ Việt Nam, nhóm nghiên cứu số trƣờng đại học nhƣ Đại học Quốc gia Hà Nội, Đại học Bách Khoa Hà Nội, Đại học Quốc gia thành phố Hồ Chí Minh thực có nhiều kết đƣợc cơng bố Với mục đích đóng góp vào lĩnh vực nghiên cứu này, chọn đề tài luận văn: “ Nghiên cứu số thuật toán khai phá tập mục thường xuyên tập mục cổ phần cao sở liệu” làm chủ đề nghiên cứu Mục đích luận văn phát triển số thuật toán khai phá tập mục cổ phần cao sở liệu giao tác cỡ lớn Trên sở áp dụng vào tốn cụ thể cài đặt trƣơng trình Với mục tiêu đó, luận văn đƣợc trình bày ba chƣơng: Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn Chương 1: Khai phá tập mục thƣờng xun số mở rộng Trình bày tốn khai phá tập mục thƣờng xuyên: Các khái niệm mơ hình khai phá Sau trình bày khái quát thuật toán khai phá, trƣơng trình bày chi tiết hai thuật tốn tiêu biểu cho hai cách tiếp cận khác thuật toán Apriori thuật toán FP-growth Thuật toán Apriori tiêu biểu cho phƣơng pháp sinh tập mục ứng viên duyệt sở liệu để tính độ hỗ trợ Thuật tốn FP-growth thuật tốn giới thiệu cấu trúc FP-tree nén toàn giao tác sở liệu lên với lần duyệt, sau khai phá theo phƣơng pháp phát triển dần mẫu mà không cần duyệt sở liệu Bên cạnh luận văn trình bày chi tiết phƣơng pháp COFI-tree khai phá FP-tree thay cho phƣơng pháp FP-growth Chương 2: Khai phá tập mục cổ phần cao Trình bày mơ hình khai phá cổ phần cao, giới thiệu thuật toán FSM thuật toán nhanh khai phá tất tập mục cổ phần cao sở liệu giao tác Luận văn đề xuất khái niệm “tập mục cổ phần theo giao tác cao” chứng minh có tính chất phản đơn điệu (Anti Monotone), ứng dụng vào nhiều thuật toán khai phá tập mục thƣờng xun có để tìm đƣợc tập mục cổ phần theo giao tác cao, từ tìm tập mục cổ phần cao Sử dụng ý tƣởng này, luận văn đề xuất thuật toán AFSM (Advanced FSM) dựa bƣớc thuật toán FSM với phƣơng pháp tỉa hiệu tập mục ứng viên Chương 3: Thực nghiệm đánh giá thuật toán Để có đƣợc kết tơi nhận đƣợc quan tâm, động viên, giúp đỡ nhiều Thầy giáo, Cô giáo Khoa Công nghệ thông tin - Đại học Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn 59 Thuật toán AFSM thu gọn đáng kể khơng gian tìm kiếm nhờ phƣơng pháp tỉa dựa tính chất phản đơn điệu tập mục cổ phần theo giao tác cao, giá trị tmv(X) nhỏ nhiều giá trị hàm tới hạn thuật toán FSM Điều làm cho thuật toán thu gọn khơng gian tìm kiếm từ lần lặp đầu, từ ảnh hƣởng đến lần lặp sau, làm cho tập RCk có kích thƣớc nhỏ Ví dụ: sở liệu bảng 2.1, bảng 2.7, 2.8 2.9 tính giá trị hàm tới hạn thuật toán FSM để so sánh Ta thấy giá trị CFFSM(X) lớn giá trị tmv(X) nhiều, ví dụ, k=1 thuật tốn FSM khơng tỉa mục nào, AFSM tỉa mục Với sở liệu lớn, AFSM thu gọn khơng gian tìm kiếm nhiều Thuật tốn AFSM đƣợc phát triển dựa thuật toán FSM thuật tốn đảm bảo tính dừng khám phá hiệu tập mục cổ phần cao Số lần duyệt sở liệu thuật tốn AFSM khơng lớn số lần duyệt thuật toán FSM Thuật tốn AFSM sử dụng tính chất phản đơn điệu tập mục cổ phần theo giao tác cao để tỉa tập mục ứng viên Các định lý 2.1, 2.2, 2.3 chứng tỏ phƣơng pháp tỉa thuật tốn AFSM hiệu Do vậy, kết luận thuật tốn AFSM đảm bảo tính dừng khai phá hiệu thuật toán FSM Mệnh đề 2.2: Thuật tốn AFSM đảm bảo tính dừng tìm tất tập mục cổ phần cao 2.4 KẾT LUẬN CHƢƠNG Chƣơng nghiên cứu mơ hình khai phá tập mục cổ phần cao đề xuất thuật toán AFSM khai phá hiệu tập mục cổ phần cao Luận văn đề xuất khái Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn 60 niệm “tập mục cổ phần theo giao tác cao” chứng minh có tính chất phản đơn điệu Sử dụng tính chất này, khai phá tập mục cổ phần theo giao tác cao nhiều thuật tốn khai phá tập mục thƣờng xun có, từ tìm đƣợc tập mục cổ phần cao Thuật tốn AFSM đƣợc xây dựng dựa ý tƣởng thuật toán FSM phƣơng pháp tỉa ứng viên hiệu sử dụng tính chất phản đơn điệu tập mục cổ phần theo giao tác cao Khai phá tập mục cổ phần cao không xét đến mức độ quan trọng khác mục liệu mà coi mục liệu có lợi ích trọng số nhƣ Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn 61 Chƣơng THỰC NGHIỆM VÀ ĐÁNH GIÁ THUẬT TỐN Nhƣ trình bày chƣơng chƣơng khai phá tập mục thƣờng xuyên luật kết hợp mở rộng khai phá tập mục cổ phần cao, giúp cho tổ chức, cá nhân có định xác hoạt động kinh doanh, quản lý nhƣ khoa học Bài toán khai phá tập mục cổ phần cao phần giải đƣợc vấn đề thực tiễn, đánh giá đƣợc đóng góp tập mục CSDL Chính chƣơng xây dựng chƣơng trình thử nghiệm khai phá tập mục cổ phần cao, thử nghiệm CSDL bán hàng 3.1 ĐẶT BÀI TỐN Cho CSDL bán hàng với thơng tin nhƣ sau: TID Thuốc Bàn Kem đánh Khăn Xà Bánh chải mặt phịng mì Bơ Pho mát 01 1 1 1 02 20 0 03 3 0 0 04 0 0 05 0 0 … Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn 62 Xây dựng chƣơng trình mơ bƣớc q trình khai phá tập mục cổ phần cao Chƣơng trình gồm chức năng: - Nhập liệu cần khai phá - Khai phá tập mục cổ phần cao 3.2 THIẾT KẾ MODUL CHƢƠNG TRÌNH VÀ GIẢI THUẬT Chƣơng trình khai phá tập mục cổ phần cao đƣợc xây dựng sở thuật tốn AFSM (Advanced Fast Share Measure) trình bày chƣơng Đƣợc cài đặt ngôn ngữ Microsoft visual C# 2008, hệ quản trị sở liệu Microsoft Access 2003, sử dụng hệ điều hành Windows XP Code Demo chƣơng trình //tinh tong gia tri cua bang du lieu DB Tdb try { HS = ""; int T = 0; int k = 0; foreach (DataGridViewRow row in dataGridView1.Rows) if (!row.IsNewRow) foreach (DataGridViewCell cell in row.Cells) T += (int)cell.Value; float min_lmv = T * float.Parse(txt_Support.Text) / 100; double min_conf = double.Parse(txtMinConf.Text) / 100; string C1 = null, C = null; foreach (DataGridViewColumn col in dataGridView1.Columns) Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn 63 C1 += col.Name.ToString() + ","; C1 = C1.Substring(0, C1.Length - 1); string[] itemsC = C1.Split(new char[] { ',' }); for (int i = 0; i < itemsC.Length; i++) if (tmv(itemsC[i], dataGridView1) >= min_lmv) { C += itemsC[i] + ","; if (lmv(itemsC[i], dataGridView1) >= min_lmv) HS += itemsC[i] + ","; } C = C.Substring(0, C.Length - 1); { k++; string RC = null; C = Candidate_Join(C, k); if (C.Equals("")) break; itemsC = C.Split(new char[] { ',' }); for (int i = 0; i < itemsC.Length; i++) if (tmv(itemsC[i], dataGridView1) >= min_lmv) { RC += itemsC[i] + ","; if (lmv(itemsC[i], dataGridView1) >= min_lmv) HS += itemsC[i] + ","; } C = RC.Substring(0, RC.Length - 1); } while (!C.Equals(null)); //bước tỉa xyz = join.Split(new char[] { ',' }); for(int i=xyz.Length -2;i>0;i ) for(int j=i-1;j>=0;j ) if (xyz[i].Equals(xyz[j])) { xyz[i] = ""; break; } Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn 64 string str = ""; for (int i = 0; i < xyz.Length ; i++) if(!xyz[i].Equals("")) str+=xyz[i]+","; return (join.Equals("")? join:str.Substring(0, str.Length - 1)) ; } private bool validateInput(TextBox txtBox) { if (txtBox.Text.Length == 0) { errorProvider1.SetError(txtBox, "Chưa nhập giá trị"); return false; } else { if (int.Parse(txtBox.Text) > 100 || int.Parse(txtBox.Text) < 0) { errorProvider1.SetError(txtBox, "Nhập giá trị 100"); return false; } else { errorProvider1.SetError(txtBox, ""); return true; } } } private string getNameItem(string names, DataGridView dgW) { string lviItem = ""; for (int j = 0; j < names.Length; j++) lviItem += dgW.Columns[names[j].ToString()].HeaderText + ", "; lviItem = lviItem.Substring(0, lviItem.Length - 2); return lviItem; } private class clssRules { string strCombination, strRemaining; Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn 65 double _confidence; public clssRules(string strCombination, string strRemaining, double Confidence) { this.strCombination = strCombination; this.strRemaining = strRemaining; this._confidence = Confidence; } public string X { get { return strCombination; } } public string Y { get { return strRemaining; } } public double Confidence { get { return _confidence; } } } private void generaRule(string ruleItem, List lstRule) { if (ruleItem.Length>1) { string strcombination; for (int i = 1; i < ruleItem.Length; i++) { strcombination = ""; bool[] checki = new bool[ruleItem.Length]; for (int j = 0; j < checki.Length; j++) checki[j] = true; generaKRule(1, 0,ref checki,i, ruleItem,strcombination, lstRule); } } } private void generaKRule(int i,int ti, ref bool[] checki, int k, string ruleItem, string strcombination,List lstRule) { for (int j = ti; j < checki.Length; j++) { if (checki[j]) { strcombination += ruleItem[j].ToString(); checki[j] = false; if (i == k) { Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn 66 string remaining = getRemaining(strcombination, ruleItem); clssRules clsRule = new clssRules(strcombination, remaining, confidence(strcombination, ruleItem)); lstRule.Add(clsRule); } else generaKRule(i + 1,j,ref checki, k, ruleItem, strcombination, lstRule); strcombination = strcombination.Substring(0, strcombination.Length - 1); checki[j] = true; } } } private string getRemaining(string strCombination, string strAFSMItem) { string temp = strAFSMItem; foreach (char ch in strCombination) { temp = temp.Replace(ch.ToString(), ""); } return temp; } private double confidence(string strCombination, string strAFSMItem) { return (double)sum_exist(strAFSMItem,dataGridView1) / sum_exist(strCombination,dataGridView1); } Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn 67 3.3 GIAO DIỆN SỬ DỤNG VÀ CHỨC NĂNG CHƢƠNG TRÌNH Giao diện chƣơng trình Hình 3.1: Giao diện chƣơng trình demo Chƣơng trình gồm hai chức năng: - Nhập CSDL cần khai phá: Cho phép ngƣời sử dụng chọn sở liệu có sẵn bảng sở liệu đƣợc hiển thị Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn 68 Hình 3.2: Giao diện hiển thị bảng liệu - Tập mục cổ phần cao: Chức thực việc tính tốn tìm tập mục cổ phần cao luật kết hợp + Ngƣời sử dụng lựa chọn CSDL cần khai phá + Tiếp theo chọn chức tập mục cổ phần cao: Chức thực khai phá tập mục cổ phần cao CSDL chọn bƣớc trƣớc Ngƣời sử dụng cần nhập ngƣỡng cổ phần minshare ngƣỡng tin cậy minconf Sau chọn nút Tính Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn 69 Hình 3.3: Giao diện cập nhật ngƣỡng cổ phần ngƣỡng tin cậy cho bảng liệu Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn 70 Hình 3.4: Giao diện hiển thị kết tìm tập mục cổ phần cao 3.4 ĐÁNH GIÁ KẾT QUẢ VÀ HƢỚNG PHÁT TRIỂN CỦA CHƢƠNG TRÌNH Chƣơng trình có giao diện thân thiện, đơn giản, dễ sử dụng Chƣơng trình chạy thử nhiều liệu khác cho kết xác Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn 71 Chƣơng trình đạt đƣợc mục đích đặt tìm đƣợc tập mục cổ phần cao từ sở liệu bán hàng Tuy nhiên cần phải cải tiến, hoàn thiện với mức độ cao thời gian - Thực chƣơng trình khai phá tập mục cổ phần cao cách sử dụng nhiều thuật toán khác - So sánh kết quả, thời gian thực hiện,… thuật tốn để đƣa nhận xét đắn hiệu thuật toán - Xây dựng, đóng gói chƣơng trình thành phần mềm chun dụng phục vụ khai phá tập mục cổ phần cao Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn 72 KẾT LUẬN Sau thời gian thực hiện, tơi hồn thành luận văn đạt đƣợc số kết định Luận văn thể đƣợc tính thực tiễn cấp bách việc nghiên cứu phát triển phƣơng pháp, kỹ thuật khai phá liệu Những kết luận văn đạt được: Trình bày khái niệm sở liệu giao tác, tập mục thƣờng xuyên luật kết hợp, khai phá tập mục cổ phần cao Đồng thời, từ việc tìm hiểu kỹ thuật khai phá liệu, vấn đề liên quan đến khai phá tập mục thƣờng xuyên, khai phá luật kết hợp, khai phá tập mục cổ phần cao nhằm phát đƣa mối liên hệ giá trị liệu CSDL Luận văn áp dụng thử nghiệm toán bán hàng, khai phá tất tập mục cổ phần cao không nhỏ ngƣỡng quy định để từ hoạch định chiến lƣợc cụ thể kinh doanh mang lại hiệu cao Hướng phát triển luận văn: Nghiên cứu, cải tiến thuật toán khai phá tập mục thƣờng xuyên, khai phá luật kết hợp, khai phá tập mục cổ phần cao hƣớng nghiên cứu đƣợc nhiều nhà nghiên cứu quan tâm tính ứng dụng vào nhiều lĩnh vực, đặc biệt lĩnh vực kinh doanh Trong thời gian tới mở rộng hƣớng nghiên cứu áp dụng lý thuyết xác suất để khai phá tập mục thƣờng xuyên, mở rộng nghiên cứu tập mục cổ phần cao nghiên cứu tập mục lợi ích cao sở liệu giao tác cỡ lớn Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn 73 TÀI LIỆU THAM KHẢO Tiếng Việt: [1] Vũ Đức Thi (1997), Cơ sở liệu – Kiến thức thực hành, Nhà xuất thống kê, Hà Nội [2] Vũ Đức Thi, Nguyễn Huy Đức (2008), “Khai phá tập mục thƣờng xuyên cổ phần cao sở liệu lớn” Tạp trí tin học Điều khiển học [3] Vũ Đức Thi, Nguyễn Huy Đức (2008), “Thuật toán hiệu khai phá tập mục thƣờng xuyên cổ phần cao”, Kỷ yếu hội thảo Một số vấn đề chọn lọc [4] Nguyễn Huy Đức (2003), “Khai phá luật kết hợp sở liệu lớn”, Kỷ yếu hội thảo khoa học Quốc gia lần thứ nghiên cứu ueng dụng CNTT [5] Nguyễn Huy Đức, luận án Tiến sĩ “Khai phá tập mục cổ phần cao lợi ích cao sở liệu”, năm 2009 Tiếng Anh: [1] Agrawal R And Srikant R (1994), “Fast algorithm for mining association rules”, VLDB-94 [2] Ashafi M., Taniar D., Smith K.(2004), “A new Approach of Eniminating Redundant Associatino Ruler”, Lecture Notes in Computer Science [3] CUCIS Center for Ultra-scale Computing and Information Security, Northwestern University Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn ... đóng góp vào lĩnh vực nghiên cứu này, tơi chọn đề tài luận văn: “ Nghiên cứu số thuật toán khai phá tập mục thường xuyên tập mục cổ phần cao sở liệu? ?? làm chủ đề nghiên cứu Mục đích luận văn phát... 1.3 KHAI PHÁ TẬP MỤC THƢỜNG XUYÊN 1.3.1 Các cách tiếp cận khai phá tập mục thƣờng xuyên Các nghiên cứu khai phá tập mục thƣờng xuyên vào tim thuật toán đề xuất giải pháp nâng cao hiệu thuật toán. .. toán khai phá tập mục cổ phần cao Trong mơ hình này, giá trị mục liệu giao tác số, số số nguyên(nhƣ số lƣợng bán mặt hàng) Cổ phần( hay đóng góp) tập mục số đo tỷ lệ đóng góp tập mục sở liêu Khai

Ngày đăng: 26/03/2021, 07:17

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan