1. Trang chủ
  2. » Tất cả

(Luận văn thạc sĩ) Khai phá phụ thuộc hàm xấp xỉ sử dụng phủ tối thiểu và lớp tương đương

68 5 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 68
Dung lượng 1,86 MB

Nội dung

(Luận văn thạc sĩ) Khai phá phụ thuộc hàm xấp xỉ sử dụng phủ tối thiểu và lớp tương đương(Luận văn thạc sĩ) Khai phá phụ thuộc hàm xấp xỉ sử dụng phủ tối thiểu và lớp tương đương(Luận văn thạc sĩ) Khai phá phụ thuộc hàm xấp xỉ sử dụng phủ tối thiểu và lớp tương đương(Luận văn thạc sĩ) Khai phá phụ thuộc hàm xấp xỉ sử dụng phủ tối thiểu và lớp tương đương(Luận văn thạc sĩ) Khai phá phụ thuộc hàm xấp xỉ sử dụng phủ tối thiểu và lớp tương đương(Luận văn thạc sĩ) Khai phá phụ thuộc hàm xấp xỉ sử dụng phủ tối thiểu và lớp tương đương(Luận văn thạc sĩ) Khai phá phụ thuộc hàm xấp xỉ sử dụng phủ tối thiểu và lớp tương đương(Luận văn thạc sĩ) Khai phá phụ thuộc hàm xấp xỉ sử dụng phủ tối thiểu và lớp tương đương(Luận văn thạc sĩ) Khai phá phụ thuộc hàm xấp xỉ sử dụng phủ tối thiểu và lớp tương đương(Luận văn thạc sĩ) Khai phá phụ thuộc hàm xấp xỉ sử dụng phủ tối thiểu và lớp tương đương(Luận văn thạc sĩ) Khai phá phụ thuộc hàm xấp xỉ sử dụng phủ tối thiểu và lớp tương đương(Luận văn thạc sĩ) Khai phá phụ thuộc hàm xấp xỉ sử dụng phủ tối thiểu và lớp tương đương(Luận văn thạc sĩ) Khai phá phụ thuộc hàm xấp xỉ sử dụng phủ tối thiểu và lớp tương đương(Luận văn thạc sĩ) Khai phá phụ thuộc hàm xấp xỉ sử dụng phủ tối thiểu và lớp tương đương(Luận văn thạc sĩ) Khai phá phụ thuộc hàm xấp xỉ sử dụng phủ tối thiểu và lớp tương đương(Luận văn thạc sĩ) Khai phá phụ thuộc hàm xấp xỉ sử dụng phủ tối thiểu và lớp tương đương(Luận văn thạc sĩ) Khai phá phụ thuộc hàm xấp xỉ sử dụng phủ tối thiểu và lớp tương đương(Luận văn thạc sĩ) Khai phá phụ thuộc hàm xấp xỉ sử dụng phủ tối thiểu và lớp tương đương(Luận văn thạc sĩ) Khai phá phụ thuộc hàm xấp xỉ sử dụng phủ tối thiểu và lớp tương đương(Luận văn thạc sĩ) Khai phá phụ thuộc hàm xấp xỉ sử dụng phủ tối thiểu và lớp tương đương(Luận văn thạc sĩ) Khai phá phụ thuộc hàm xấp xỉ sử dụng phủ tối thiểu và lớp tương đương(Luận văn thạc sĩ) Khai phá phụ thuộc hàm xấp xỉ sử dụng phủ tối thiểu và lớp tương đương

ii MỤC LỤC MỤC LỤC i DANH MỤC VIẾT TẮT VÀ KÍ HIÊU ̣ iii DANH MỤC CÁC BẢNG BIỂU iv DANH MỤC CÁC HÌNH VẼ v MỞ ĐẦU CHƢƠNG TỔNG QUAN VỀ KHAI PHÁ DỮ LIỆU VÀ KHAI PHÁ PHỤ THUỘC HÀM, PHỤ THUỘC HÀM XẤP XỈ 1.1 Khai phá liệu 1.1.1 Khám phá tri thức khai phá liệu 1.1.2 Kiến trúc hệ thống khai phá liệu 1.1.3 Quá trình khai phá liệu 1.1.4 Một số kỹ thuật khai phá liệu 1.1.5 Các sở liệu phục vụ cho khai phá liệu 12 1.1.6 Một số ứng dụng khai phá liệu 14 1.2 Khai phá phụ thuộc hàm phụ thuộc hàm xấp xỉ 15 1.2.1 Khai phá phụ thuộc hàm 15 1.2.2 Khai phá phụ thuộc hàm xấp xỉ 19 1.2.2.1 Định nghĩa phụ thuộc hàm xấp xỉ 20 1.2.2.2 Một số độ đo 21 CHƢƠNG THUẬT TOÁN KHAI PHÁ PHỤ THUỘC HÀM XẤP XỈ SỬ DỤNG PHỦ TỐI THIỂU VÀ LỚP TƢƠNG ĐƢƠNG 28 2.1 Lớp tƣơng đƣơng phủ tối thiểu 29 2.1.1 Sự phân hoạch 29 2.1.2 Phân hoạch mịn 31 2.1.3 Phủ tối thiểu 32 2.1.4 Phụ thuộc hàm xấp xỉ lớp tƣơng đƣơng 35 2.2 Thuật toán TANE sửa đổi 38 2.2.1 Thủ tục thuật tốn TANE sửa đổi 38 2.2.2 Độ phức tạp thuật toán TANE sửa đổi 41 Số hóa Trung tâm Học liệu – ĐHTN http://www.ltc.tnu.edu.vn iii 2.3 Thuật toán khai phá phụ thuộc hàm xấp xỉ sử dụng phủ tối thiểu lớp tƣơng đƣơng 41 2.3.1 Mô tả thuật toán 41 2.3.2 Độ phức tạp thuật toán khai phá phụ thuộc hàm xấp xỉ sử dụng phủ tối thiểu lớp tƣơng đƣơng 44 2.3.3 Phân tích thử nghiệm, so sánh độ phức tạp thời gian 45 2.3.3.1 Phân tích thử nghiệm 45 2.3.3.2 So sánh độ phức tạp thời gian (theo [8]) 46 CHƢƠNG THỰC NGHIỆM KHAI PHÁ PHỤ THUỘC HÀM XẤP XỈ 48 3.1 Xây dựng chƣơng trình thực nghiệm 48 3.1.1 Giới thiệu toán 48 3.1.2 Dữ liệu thử nghiệm 48 3.1.3 Xây dựng chƣơng trình thực nghiệm 50 3.2 Thực nghiệm khai phá phụ thuộc hàm xấp xỉ 50 3.3 Kết thực nghiệm 51 KẾT LUẬN 52 TÀI LIỆU THAM KHẢO 53 PHỤ LỤC 55 Số hóa Trung tâm Học liệu – ĐHTN http://www.ltc.tnu.edu.vn iv DANH MỤC VIẾT TẮT VÀ KÍ HIỆU SỬ DỤNG TRONG LUẬN VĂN Ký hiệu Diễn giải R U  Quan ̣ tâ ̣p th ̣c tính U U   A1, , Am Tâ ̣p m thuô ̣c tính S = (U, F) Lƣơ ̣c đồ quan ̣ với U tập thuộc tính , F tập phụ thuộc hàm U LĐQH Lƣơ ̣c đồ quan ̣ CSDL Cơ sở liệu PTH Phụ thuộc hàm Số hóa Trung tâm Học liệu – ĐHTN http://www.ltc.tnu.edu.vn v DANH MỤC CÁC BẢNG BIỂU Bảng 1.1: Ví dụ quan hệ 17 Bảng 1.2: Các thuật toán khai phá phụ thuộc hàm 19 Bảng 1.3 Bảng quan hệ ví dụ PTH xấp xỉ 21 Bảng 1.4: Bảng liệu quan hệ số 24 Bảng 1.5: Bảng quan hệ ví dụ 25 Bảng 1.6: Bảng quan hệ ví dụ phụ thuộc hàm điều kiện 27 Bảng 2.1: Bảng quan hệ vi dụ cho phân hoạch 30 Bảng 2.2: Bảng quan hệ ví dụ cho phân hoạch mịn 32 Bảng 2.3: Bảng quan hệ ví dụ cho phụ thuộc hàm xấp xỉ 36 Bảng 2.4: Thời gian thực cho hai thuật toán 45 Bảng 2.5: So sánh độ phức tạp thời gian dựa T(n) hai thuật tốn 46 Bảng 3.1: Dữ liệu trích chọn để khai phá 49 Bảng 3.2: Bảng mã hóa thuộc tính 49 Số hóa Trung tâm Học liệu – ĐHTN http://www.ltc.tnu.edu.vn vi DANH MỤC CÁC HÌNH VẼ Hình 1.1 Q trình khám phá tri thức Hình 1.2 Kiến trúc hệ thống khai phá liệu Hình 1.3: Quá trình khai phá liệu Hình 1.4: Cây định Hình 1.5: Mẫu kết nhiệm vụ phân cụm liệu 10 Hình 1.6: Mẫu kết nhiệm vụ hồi quy 11 Hình 1.7: Các loại phụ thuộc liệu 16 Hình 1.8 : Kỹ thuật phát phụ thuộc hàm 18 Hình 2.1: Dàn cho thuộc tính (A, B, C, D, E) 38 Hình 3.1: Dữ liệu mã hóa chuẩn bị cho khai phá 50 Hình 3.2: Giao diện kết đƣợc khai phá phụ thuộc hàm xấp xỉ 51 Số hóa Trung tâm Học liệu – ĐHTN http://www.ltc.tnu.edu.vn MỞ ĐẦU Đặt vấn đề Trong năm gần đây, Công nghệ thông tin (CNTT) phát triển mạnh mẽ tác động đến mặt xã hội, thành tựu công nghệ lƣu trữ cho phép tạo nguồn liệu khổng lồ Việc khai thác nguồn liệu ngày cấp thiết, đặt thách thức lớn cho ngành CNTT, đặc biệt lĩnh vực khai phá liệu Với nguồn liệu lớn nhƣ việc tìm kiếm, phân tích, xử lý đƣa thông tin cần thiết, phù hợp với thời gian yêu cầu điều không dễ dàng Các phƣơng pháp khai thác sở liệu truyền thống ngày không đáp ứng đƣợc nhu cầu thực tế Vì phƣơng pháp nghiên cứu, tiếp cận với cơng cụ cho phép phân tích, tổng hợp, khai phá tri thức từ liệu cách thông minh, hiệu đƣợc nhiều nhà khoa học quan tâm nghiên cứu Khái niệm phụ thuộc hàm đóng vai trò quan trọng lý thuyết sở liệu quan hệ Các phụ thuộc hàm hữu ích việc phân tích thiết kế sở liệu quan hệ nhƣ xác định khóa, xác định dạng chuẩn, vấn đề quán liệu Tuy nhiên thực tế có số giá trị liệu khơng xác số ngoại lệ làm cho phụ thuộc hàm không thỏa Sự phụ thuộc tuyệt đối dƣờng nhƣ nghiêm ngặt ta hình dung tới quan hệ có hàng nghìn bộ, có khoảng vài vi phạm phụ thuộc hàm Bỏ qua phụ thuộc hàm làm tính chất phụ thuộc vốn có thuộc tính Vì nhà nghiên cứu mở rộng khái niệm phụ thuộc hàm thành phụ thuộc hàm xấp xỉ theo cách thức, nghĩa đó, phụ thuộc hàm xấp xỉ (Approximate Functional Dependencies - AFDs) cho phép có số lƣợng lỗi định liệu phụ thuộc hàm Phụ thuộc hàm xấp xỉ đƣợc khai phá từ CSDL quan hệ biểu diễn mối Số hóa Trung tâm Học liệu – ĐHTN http://www.ltc.tnu.edu.vn quan hệ có ý nghĩa, có nhiều ứng dụng khác nhƣ: Dự đốn giá trị thiếu thuộc tính bảng quan hệ cách sử dụng giá trị thuộc tính việc xác định tập hợp AFDs, tối ƣu hóa truy vấn, viết lại câu truy vấn, chuẩn hóa sở liệu hiệu suất tốt thiết kế lƣu trữ hiệu hơn,… Luận văn tìm hiểu phụ thuộc hàm xấp xỉ nghiên cứu thuật tốn AFDMCEC, thuật tốn tìm phụ thuộc hàm xấp xỉ CSDL lớn dựa độ đo xấp xỉ Thuật toán sử dụng số khái niệm lý thuyết thiết kế CSDL quan hệ, đặc biệt khái niệm phủ tối thiểu lớp tƣơng đƣơng Đối tƣợng phạm vi nghiên cứu Luận văn tìm hiểu tổng quan khai phá liệu, sâu tìm hiểu khái niệm phụ thuộc hàm, phụ thuộc hàm xấp xỉ tính chất, độ đo lỗi phụ thuộc hàm xấp xỉ, từ nghiên cứu thuật tốn TANE sửa đổi thuật tốn AFDMCEC tìm phụ thuộc hàm xấp xỉ Hƣớng nghiên cứu đề tài - Tìm hiểu phụ thuộc hàm, phụ thuộc hàm xấp xỉ độ đo lỗi chúng - Nghiên cứu thuật toán khai phá phụ thuộc hàm xấp xỉ từ bảng quan hệ Phƣơng pháp nghiên cứu Phƣơng pháp nghiên cứu luận văn nghiên cứu lý thuyết kết hợp với đánh giá thực nghiệm, cụ thể là: Phân tích, tổng hợp kết nghiên cứu phụ thuộc hàm, phụ thuộc hàm xấp xỉ, … công bố báo khoa học, hội thảo chun ngành ngồi nƣớc Từ đó, trình bày làm rõ vấn đề khai phá phụ thuộc hàm xấp xỉ sử dụng phủ tối thiểu lớp tƣơng đƣơng Số hóa Trung tâm Học liệu – ĐHTN http://www.ltc.tnu.edu.vn Ý nghĩa khoa học thực tiễn Phụ thuộc hàm đóng vai trị quan trọng lý thuyết CSDL quan hệ Tuy nhiên, thực tế có số giá trị liệu khơng xác số ngoại lệ đó, làm cho phụ thuộc hàm không thỏa mãn Sự phụ thuộc tuyệt đối dƣờng nhƣ nghiêm ngặt ta hình dung quan hệ có hàng nghìn bộ, có vài vi phạm phụ thuộc hàm Do vậy, mở rộng khái niệm phụ thuộc hàm thành phụ thuộc hàm xấp xỉ, cho phép có số lỗi định liệu, cần thiết có ý nghĩa mặt lý thuyết nhƣ thực tiễn Các phụ thuộc hàm xấp xỉ giúp thấy đƣợc mối quan hệ tiềm ẩn thuộc tính mà cịn giúp ta thuận tiện việc phân tích liệu, đánh giá thông tin Phát phụ thuộc hàm xấp xỉ CSDL vấn đề nghiên cứu hấp dẫn mục tiêu phát tri thức Tiếp cận phụ thuộc hàm xấp xỉ sử dụng phủ tối thiểu lớp tƣơng đƣơng khai phá liệu hƣớng thú vị, hứa hẹn nhiều kết ứng dụng hiệu thực tiễn Cấu trúc luận văn: Luận văn đƣợc trình bày chƣơng: Chƣơng 1: Tổng quan khai phá liệu khai phá phụ thuộc hàm, phụ thuộc hàm xấp xỉ Chƣơng 2: Thuật toán khai phá phụ thuộc hàm xấp xỉ sử dụng phủ tối thiểu lớp tƣơng đƣơng Chƣơng 3: Thực nghiệm khai phá phụ thuộc hàm xấp xỉ Cuối kết luận luận văn tài liệu tham khảo Số hóa Trung tâm Học liệu – ĐHTN http://www.ltc.tnu.edu.vn CHƢƠNG TỔNG QUAN VỀ KHAI PHÁ DỮ LIỆU VÀ KHAI PHÁ PHỤ THUỘC HÀM, PHỤ THUỘC HÀM XẤP XỈ 1.1 Khai phá liệu 1.1.1 Khám phá tri thức khai phá liệu Khai phá liệu (KPDL) việc rút trích tri thức cách tự động hiệu từ khối liệu lớn Tri thức thƣờng dạng mẫu có tính chất khơng tầm thƣờng, khơng tƣờng minh (ẩn), chƣa đƣợc biết đến có tiềm mang lại lợi ích Có số nhà nghiên cứu cịn gọi KPDL phát tri thức từ sở liệu (Knowledge Discovery in Database – KDD) Ở coi KPDL cốt lõi q trình phát tri thức Quá trình phát tri thức gồm bƣớc: Bƣớc 1: Trích chọn liệu (data selection): Là bƣớc trích chọn tập liệu cần đƣợc khai phá từ tập liệu lớn (databases, data ware houses) Bƣớc 2: Tiền xử lý liệu (data preprocessing): Là bƣớc làm liệu (xử lý liệu không đầy đủ, liệu nhiễu, liệu không quán,…v.v), rút gọn liệu (sử dụng phƣơng pháp thu gọn liệu, histograms, lấy mẫu…v.v), rời rạc hóa liệu (dựa vào histograms, entropy, phân khoảng, v.v) Sau bƣớc này, liệu quán, đầy đủ, đƣợc rút gọn đƣợc rời rạc hóa Bƣớc 3: Biến đổi liệu (data transformation): Là bƣớc chuẩn hóa làm mịn liệu để đƣa liệu dạng thuận lợi nhằm phục vụ cho kỹ thuật khai thác bƣớc sau Bƣớc 4: Khai phá liệu (data mining): Đây bƣớc quan trọng tốn nhiều thời gian trình khám phá tri thức, áp dụng kỹ thuật khai phá (phần lớn kỹ thuật machine learning) để khai phá, trích chọn đƣợc mẫu (pattern) thơng tin, mối liên hệ đặc biệt liệu Số hóa Trung tâm Học liệu – ĐHTN http://www.ltc.tnu.edu.vn Bƣớc 5: Đánh giá biểu diễn tri thức (knowledge representation & evaluation): Dùng kỹ thuật hiển thị liệu để trình bày mẫu thơng tin (tri thức) mối liên hệ đặc biệt liệu đƣợc khai thác bƣớc biểu diễn theo dạng gần gũi với ngƣời sử dụng nhƣ đồ thị, cây, bảng biểu, luật,…v.v Đồng thời bƣớc đánh giá tri thức khám phá đƣợc theo tiêu chí định Trong giai đoạn khai phá liệu, cần tƣơng tác ngƣời dùng để điều chỉnh rút tri thức cần thiết Các tri thức nhận đƣợc đƣợc lƣu sử dụng lại Các Tri thức Các mẫu Dữ liệu Dữ liệu chọn 5.Đánh giá biểu diễn tri thức knowledge representation & evaluation 4.Khai phá liệu data mining Kho liệu 3.Biến đổi liệu data transformation Tiền xử lý liệu data preprocessing Trích chọn liệu data selection Hình 1.1 Q trình khám phá tri thức Việc KPDL đƣợc tiến hành lƣợng lớn liệu có CSDL, kho liệu loại lƣu trữ thông tin khác Các mẫu đáng quan tâm đƣợc đƣa đến ngƣời dùng đƣợc lƣu trữ sở tri thức Số hóa Trung tâm Học liệu – ĐHTN http://www.ltc.tnu.edu.vn 49 Tên dự án Địa điểm dự án Tên phòng ban Tên nhân viên Thời gian ProjectA TP Hải Dƣơng Giải pháp mạng Quỳnh Anh ProjectB TP Hải Dƣơng Phần mềm ngoại Quỳnh Anh ProjectD Chí Linh Phần mềm nội Quỳnh Anh ProjectD Chí Linh Phần mềm nội Lan Anh ProjectA TP Hải Dƣơng Giải pháp mạng Hồng Anh ProjectB Sao Đỏ Phần mềm ngoại Lan Anh ProjectD Ninh Giang Phần mềm nội Hải Hà ProjectE Kim Thành Chăm sóc KH Hồng Anh Bảng 3.1: Dữ liệu trích chọn để khai phá Chuyển đổi liệu để khai phá: Để chuẩn bị liệu cho khai phá phụ thuộc hàm xấp xỉ, thuộc tính đƣợc mã hóa tập số tự nhiên (tức ánh xạ sang số tự nhiên) Thuộc tính Mã Tên dự án (TenDA) A Địa điểm dự án (DiadiemDA) B Tên phòng ban (TenPB) C Tên nhân viên (TenNV) D Thời gian (Thoigian) E Bảng 3.2: Bảng mã hóa thuộc tính Tiếp đến, liệu đƣợc tiền xử lý đƣa dạng Text, ghi tệp BANG.txt Mỗi giao tác đƣợc mơ tả thành dịng text tệp BANG.txt nhƣ sau: Liệt kê mã giá trị thuộc tính, mã cách dấu cách Hình 3.1 tệp Số hóa Trung tâm Học liệu – ĐHTN http://www.ltc.tnu.edu.vn 50 BANG.txt biểu diễn phần liệu bảng 3.1 Hình 3.1: Dữ liệu mã hóa chuẩn bị cho khai phá Tệp BANG.txt biểu diễn liệu tiền xử lý, chuẩn bị cho khai phá phụ thuộc hàm xấp xỉ Kết đƣợc ánh xạ ngƣợc lại để xác định tên thuộc tính 3.1.3 Xây dựng chương trình thực nghiệm Chƣơng trình sử dụng thuật toán để khai phá phụ thuộc hàm xấp xỉ sử dụng phủ tối thiểu lớp tƣơng đƣơng, đƣợc trình bày chƣơng Chƣơng trình đƣợc xây dựng ngôn ngữ Free Pascal IDE cài đặt môi trƣờng hệ điều hành Windows 32bit Máy tính thực nghiệm có cấu hình tối thiểu nhƣ sau: - Tốc độ CPU: 2.0GHz; Dung lƣợng nhớ RAM: 512MB - Không gian trống ổ cứng: 1GB Chƣơng trình đƣợc dịch thành tệp AFDMCEC.EXE Để khởi động chƣơng trình, nhấp đúp chuột vào biểu tƣợng AFDMCEC.EXE đƣợc đặt ổ C thƣ mục ThucNghiem chƣơng trình 3.2 Thực nghiệm khai phá phụ thuộc hàm xấp xỉ Trong hình 3.2 cho thấy ứng với ngƣỡng sai số ε = 0,3 có phụ thuộc hàm xấp xỉ đƣợc khai phá số giao tác với 05 thuộc tính Số hóa Trung tâm Học liệu – ĐHTN http://www.ltc.tnu.edu.vn 51 Ở phụ thuộc hàm thứ 7, cho kết quả: AD → B, ánh xạ ngƣợc lại tên thuộc tính, ta có PTH xấp xỉ: {TenDA, TenNV} → {DiadiemDA} Hình 3.2: Giao diện kết đƣợc khai phá phụ thuộc hàm xấp xỉ 3.3 Kết thực nghiệm Chƣơng trình ứng dụng khai phá phụ thuộc hàm xấp xỉ thực thành công, cho ta kết tìm đƣợc phụ thuộc hàm biểu diễn mối liên hệ thuộc tính với ngƣỡng sai số ε = 0,3 Kết thử nghiệm khai phá liệu khẳng định vấn đề lý thuyết khai phá phụ thuộc hàm xấp xỉ trình bày chƣơng Kết khai phá phụ thuộc hàm xấp xỉ chƣơng trình thực nghiệm tìm đƣợc giúp cho việc thiết kế CSDL quản lý việc triển khai dự án đƣợc tốt hơn, cụ thể giúp cho việc chuẩn hóa, tách lƣợc đồ quan hệ, đƣa dạng không dƣ thừa liệu, đảm bảo tính quán liệu, đạt dạng chuẩn cao Số hóa Trung tâm Học liệu – ĐHTN http://www.ltc.tnu.edu.vn 52 KẾT LUẬN Những kết luận văn Phụ thuộc hàm biểu diễn mối quan hệ thuộc tính sở liệu, phụ thuộc hàm giá trị thuộc tính đƣợc xác định giá trị số thuộc tính khác Phụ thuộc hàm đóng vai trị quan trọng chuẩn hóa sở liệu, phát phụ thuộc hàm giúp nhà thiết kế sở liệu tách lƣợc đồ quan hệ thành nhiều lƣợc đồ quan hệ đạt dạng chuẩn cao Qua trình nghiên cứu đề tài “Khai phá phụ thuộc hàm xấp xỉ sử dụng phủ tối thiểu lớp tương đương”, luận văn đạt đƣợc số kết quả: - Tìm hiểu tổng quan khai phá liệu, khai phá phụ thuộc hàm sở liệu quan hệ, mở rộng khai phá phụ thuộc hàm xấp xỉ số vấn đề độ đo lỗi phụ thuộc hàm xấp xỉ - Tìm hiểu thuật tốn TANE sửa đổi khai phá phụ thuộc hàm phụ thuộc hàm xấp xỉ sở liệu, thuật toán AFDMCEC khai phá phụ thuộc hàm xấp xỉ sử dụng phủ tối thiểu lớp tƣơng đƣơng Nhận xét đánh giá độ phức tạp hai thuật tốn - Cài đặt chƣơng trình Demo, khai phá phụ thuộc hàm xấp xỉ sử dụng phủ tối thiểu lớp tƣơng đƣơng tập liệu quản lý dự án Công ty Ánh Sao, TP Hải Dƣơng Hƣớng nghiên cứu luận văn - Cải tiến chƣơng trình Demo để thực sở liệu lớn - Nghiên cứu phƣơng pháp để khai phá phụ thuộc hàm phụ thuộc hàm xấp xỉ sở liệu có hiệu cao Số hóa Trung tâm Học liệu – ĐHTN http://www.ltc.tnu.edu.vn 53 TÀI LIỆU THAM KHẢO Tiếng Việt: [1] Trần Duy Anh (2007), “Phát phụ thuộc hàm xấp xỉ theo cách tiếp cận tập thơ”, Tạp chí Tin học và Điều khiển học, T 23, S 3, tr 284 - 295 [2] Trần Duy Anh (2014), “Biểu diễn phụ thuộc hàm xấp xỉ theo phân hoạch, ma trận phân biệt và luật kết hợp”, Tạp chí Tin học Điều khiển học, 30(2) [3] Hồ Thuần (chủ biên), Hồ Cẩm Hà (2005), Các hệ sở liệu - Lý thuyết và thực hành, NXB Giáo dục Việt Nam [4] Nguyễn Thanh Thủy (2003), “Phát tri thức khai phá liệu: Công cụ, phương pháp ứng dụng” Tiếng Anh: [4] Kivinen J., and Mannila H (1995), “Approximate Inference of Functional Dependencies From Relations” Theoretical Computer Science, Vol 1, No 49, pp 129-149 [5] Huhtala Y., Karkkainen J., Porkka P., and Toivonen H., (1999) “Tane: An efficient algorithm for discovering functional and approximate dependencies” The Computer Journal, Vol 42, No 2, pp 100-111 [6] Ronald S.King, James J.Legendre (2003), “Discovery of functional and approximate dependencies in relational databases”, Journal of applied mathematics and decision sciences, Vol 7, No 1, pp 49 - 59 [7] Wenfei Fan and et al (2011), “Discovering conditional functional dependencies”, Ieee International Conference on Data Engineering, Vol 23, No [8] J.Atoum (2009), “Mining Approximate Functional Dependencies from Databases based on Minimal Cover and Equivalenc classes”, European J of cientific Research, Vol 33, No 2, pp 338-346 Số hóa Trung tâm Học liệu – ĐHTN http://www.ltc.tnu.edu.vn 54 [9] UCI Machine Learning Repository, http://www.ics.uci.edu /~mlearn/ MLRepository.html [10] Han J., and Kamber M (2012), Data Mining: Concepts and Techniques, Third Edition, Morgan Kaufmann, Series in Data Management Systems [11] Anupama A Chavan, Vijay Kumar Verma (2013), Functional Dependency Mining form Relational Database: A Survey, International Journal of Engineering and Advanced Technology, ISSN: 2249 – 8958, Volume-2, Issue-6 Số hóa Trung tâm Học liệu – ĐHTN http://www.ltc.tnu.edu.vn 55 PHỤ LỤC Mã nguồn chƣơng trình thực nghiệm: uses crt; Type mang=array[1 8]of string[8]; Var AFDT:array[1 100] of string[10]; AFDP:array[1 100] of string[10]; EQT:array[1 100] of string[10]; EQP:array[1 100] of string[10]; Can:array[1 100] of string[10]; DL:array[1 50,'A' 'E'] of String[10]; List:array[1 50] of Byte; R:String[5]; f1:text; O:mang; Procedure Nhap; Var a1,a2:Byte; a3:string[10]; Begin assign(f1,'c:\Thucnghiem\BANG.txt'); Reset(f1); for a1:=1 to Begin readln(f1,a3); DL[a1,'A']:=a3[1]; DL[a1,'B']:=a3[3]; Số hóa Trung tâm Học liệu – ĐHTN http://www.ltc.tnu.edu.vn 56 DL[a1,'C']:=a3[5]; DL[a1,'D']:=a3[7]; DL[a1,'E']:=a3[9]; End; End; {Thu tuc sinh hoan vi} Procedure Hoanvi; Var max,a,i,j:byte; m,l,o,p,q:char; e:Real; Begin R:='ABCDE'; i:=1; for m:='A' to 'E' begin Can[i]:=m; inc(i); End; for m:='A' to 'E' for l:='A' to 'E' if(m

Ngày đăng: 24/01/2023, 19:44