1. Trang chủ
  2. » Công Nghệ Thông Tin

Phương pháp gia tăng ma trận độ hỗ trợ trên khối dữ liệu và trên lát cắt khi tập đối tượng thay đổi

9 11 0

Đang tải... (xem toàn văn)

THÔNG TIN TÀI LIỆU

Nội dung

Bài viết đề xuất phương pháp gia tăng để tính gia tăng ma trận độ hỗ trợ, từ đó tính ma trận độ chính xác và ma trận độ phủ trên khối dữ liệu có tập đối tượng thay đổi để sinh các luật quyết định. Các thuật toán để tính gia tăng ma trận độ hỗ trợ trên khối quyết định và trên các lát cắt của nó cũng đã được đề xuất khi tăng hoặc giảm tập đối tượng.

Kỷ yếu Hội nghị KHCN Quốc gia lần thứ XII Nghiên cứu ứng dụng Công nghệ thông tin (FAIR); Huế, ngày 07-08/6/2019 DOI: 10.15625/vap.2019.00048 PHƯƠNG PHÁP GIA TĂNG MA TRẬN ĐỘ HỖ TRỢ TRÊN KHỐI DỮ LIỆU VÀ TRÊN LÁT CẮT KHI TẬP ĐỐI TƯỢNG THAY ĐỔI Trịnh Đình Thắng1, Đỗ Thị Lan Anh2, Trần Minh Tuyến3, Cao Hồng Huệ4 1,2,4 Viện Công nghệ Thông tin, Trƣờng Đại học Sƣ Phạm Hà Nội Đại học Cơng Đồn thangdhsp2@hpu2.edu.vn, lananh.cntt.sp2@gmail.com, tuyentm@dhcd.edu.vn, hue.ch1124@gmail.com TĨM TẮT: Báo cáo đề xuất phương pháp gia tăng để tính gia tăng ma trận độ hỗ trợ, từ tính ma trận độ xác ma trận độ phủ khối liệu có tập đối tượng thay đổi để sinh luật định Các thuật tốn để tính gia tăng ma trận độ hỗ trợ khối định lát cắt đề xuất tăng giảm tập đối tượng… Độ phức tạp thuật toán khối định lát cắt phát biểu chứng minh Ngoài ra, việc so sánh độ phức tạp thời gian hai phương pháp gia tăng tính Sup tính Acc, Cov đề cập Từ khóa: Phương pháp gia tăng, ma trận độ hỗ trợ, ma trận độ xác, ma trận độ phủ, khối liệu, khối định I GIỚI THIỆU Q trình nghiên cứu mơ hình thuật toán để phát luật định tập đối tƣợng khối liệu thay đổi đƣợc tác giả quan tâm nghiên cứu Mục tiêu báo từ mơ hình bổ sung loại bỏ đối tƣợng khỏi khối liệu, đề xuất thuật tốn tính gia tăng ma trận độ hỗ trợ khối liệu lắt cắt nó, sau tính ma trận độ xác ma trận độ phủ làm sở để tìm luật định có ý nghĩa khối liệu lát cắt tập đối tƣợng thay đổi Độ phức tạp tính tốn thuật toán đƣợc phát biểu chứng minh II CÁC KHÁI NIỆM CƠ BẢN 2.1 Khối Định nghĩa 2.1[1] Gọi R = (id; A1, A2, , An) hữu hạn phần tử, id tập số hữu hạn khác rỗng, Ai (i=1 n) thuộc tính Mỗi thuộc tính A i (i=1 n) có miền giá trị tương ứng dom(A i) Một khối r R, kí hiệu r(R) gồm số hữu hạn phần tử mà phần tử họ ánh xạ từ tập số id đến miền trị thuộc tính Ai (i=1 n) t = {ti : id Nói cách khác:t r(R) dom(Ai)}i=1 n Ta kí hiệu khối r(R) r(id; A1, A2, , An ), không sợ nhầm lẫn ta kí hiệu đơn giản r 2.2 Lát cắt khối Định nghĩa 2.2 [2], [3] Cho R = (id; A1, A2, , An), r(R) khối R Với x khối với Rx = ({x}; A1, A2, , An) cho: tx = {tix = ti } i=1 n , t r(R), t = {ti : id tx r(Rx) id ta kí hiệu r(Rx) dom(Ai)}i=1 n , tax(x) = ti(x), i =1 n x Khi r(Rx) gọi lát cắt khối r(R) điểm x, đơi ta kí hiệu rx Sau đây, đơn giản ta sử dụng kí hiệu: x(i) = (x; Ai ) ; id(i) = {x(i) | x thuộc tính số lƣợc đồ khối R = (id; A1,A2, ,An ) id} Ta gọi x(i) (x id, i = n) 2.3 Khối thông tin Định nghĩa 2.3: [4] Cho lược đồ khối R = (id; A1, A2, , An ), r khối R Khi khối thơng tin () bốn IB = (U, A, V, f) với U tập đối tượng thuộc r gọi không gian đối tượng, tập ⋃ (i) thuộc tính số đối tượng, ⋃ () ( ) , V ( i ) tập giá trị đối tượng ứng với thuộc tính số x , f x (i) (i) hàm thông tin UxA V thỏa mãn: u U, x A ta có f(u, x ) Vx( i ) Khi đó, ta gọi f(u, x(i)) giá trị đối tƣợng u thuộc tính số x(i) Định nghĩa 2.4: [4] Cho lược đồ khối R = (id; A1, A2, , An ), r khối R, rx lát cắt khối r điểm x id Khi lát cắt khối thông tin x bốn IB x = (U, Ax, Vx, fx) với U tập đối tượng thuộc r gọi không gian đối tượng, ⋃ () tập thuộc tính số đối tượng lát cắt x, (i) giá trị đối tượng ứng với thuộc tính số x , fx hàm thơng tin UxAx (i) f(u, x ) Vx ( i ) , Vx = x( i ) Ax Vx( i ) Vx ( i ) Vx thỏa mãn: u U, x (i) tập Ax ta có PHƢƠNG PHÁP GIA TĂNG MA TRẬN ĐỘ HỖ TRỢ TRÊN KHỐI DỮ LIỆU VÀ TRÊN LÁT CẮT KHI TẬP… 380 2.4 Khối định [4] n (i ) Định nghĩa 2.5 Cho khối thông tin IB k= (U,A,V,f)n với U không gian đối tượng, A = id Khi A i x,(i )thì khối thơng tin IB gọi khối định kí hiệu x,(i )D = chia thành tập C D cho: C= i k 1, x id i 1, x id DB=(U,C D,V,f), với C tập thuộc tính số điều kiện D tập thuộc tính số định Ta kí hiệu khối định cách đơn giản là: DB=(U, C D) Định nghĩa 2.6: Cho khối định DB=(U,C D,V,f), với C tập thuộc tính số điều kiện D tập thuộc tính số định Khi lát cắt khối định x (x id)k nbốn DBx = (U, Cx Dx, Vx, fx ) (i ) Vx , x ( i,) Ax= Cx Dx, Vx= với U tập đối tượng thuộc r gọi không gian đối tượng, Cx= x , Dx= x A i i k (i) Vx( i ) tập giá trị đối tượng ứng với thuộc tính số x , fx hàm thông tin UxAx Vx thỏa mãn: u U, x(i) Ax ta có f(u, x(i)) Vx( i ) (i ) (i ) x 2.5 Luật định khối lát cắt Định nghĩa 2.7 [4] Cho khối định DB = (U, C D), với U không gian đối tượng: C= ,D= n k , Cx= x ( i ,) x id D x= x ( i ), i k i U/Cx= {Cx1, Cx , , Cxt } , U/D={D1,D2,…,Dh}, x Khi đó: U/C={C1,C2,…,Cm}, U/Dx= {D x1, Dx , , Dxs } , x tương ứng phân hoạch sinh C, Cx, D, Dx Một luật định khối có dạng: Ci j=1 h lát cắt điểm x có dạng: Cxi Dxj , i=1 tx, j=1 sx Dj, i=1 m, Mệnh đề 2.1 Cho khối định DB = (U, C D), với U không gian đối tượng: n k C= , D= , Cx= x (i ) i x (i ) , Dx=i k , x id, U/C={C1,C2,…,Cm}, U/Cx= {Cx1 , Cx , , Cxtx } , U/D={D1,D2,…,Dh}, U/Dx= {D x1 , Dx , , Dxs } x Khi đó: Ci U/C , Dj U/D ta có: Ci = ,Dj = với px {1,2,…,tx }, qx {1,2,…,sx } Định nghĩa 2.8 Cho khối định DB=(U,C D), Ci U/C, Dj U/D, Cxp U/Cx, Dxq U/Dx, i=1 m, j=1 h, p {1,2,…,tx }, q {1,2,…,sx }, x id Khi đó, độ hỗ trợ, độ xác độ phủ luật định Ci Dj khối là: - Độ hỗ trợ: Sup(Ci,Dj) = |Ci Dj)|, - Độ xác: Acc(Ci,Dj) = - Độ phủ: Cov(Ci,Dj) = luật định Cxp , Dxq lát cắt khối điểm x là: - Độ hỗ trợ: Sup(Cxp,Dxq) = |Cxp Dxq)|, - Độ xác: Acc(Cxp,Dxq) = - Độ phủ: Cov(Cxp,Dxq) = | C xp | C xp | C xp | Dxq | | Dxq | Dxq | , Ta biểu diễn độ đo luật định khối dƣới dạng ma trận độ đo nhƣ sau: - Ma trận độ hỗ trợ: Sup(Ci,Dj)mxn = - Ma trận độ xác: Acc(Ci,Dj)mxn = - Ma trận độ phủ: Cov(Ci,Dj)mxn = Trịnh Đình Thắng, Đỗ Thị Lan Anh, Trần Minh Tuyến, Cao Hồng Huệ 381 Với luật định lát cắt khối ta có ma trận độ hỗ trợ, độ xác độ phủ tƣơng tự Mệnh đề 2.2 k Cho khối định DB = (U, C D), với U không gian đối tượng:C = n x (,i ) D i 1, x id = x (.i ) i k 1, x id Khi Ci U/C, Dj U/D, (i=1 m, j=1 h) ta có: Acc(Ci, Dj ) = Sup(Ci , D j ) h , Cov(Ci, Dj ) = Sup(Ci , Dq ) q Sup(Ci , D j ) m Sup(C p , D j ) p Kết nghiên cứu 3.1 Tính tốn gia tăng độ hỗ trợ bổ sung loại bỏ đối tượng khối định lát cắt n k i) x, (D Cho khối định DB= (U, C D, V, f), đó: C = i 1, x id (i ) ,x C x= = i k 1, x id k ,xD x = n (i ) i x, (xi ) id i k U/C={C1,C2,…,Cm}, U/C x= {Cx1 , Cx , , Cxtx } , U/D={D1,D2,…,Dh}, U/D x= {D x1 , Dx , , Dxs } x Giả sử, ta cần bổ sung vào khối định N đối tƣợng, kí hiệu AN loại bỏ khỏi khối định M đối tƣợng, kí hiệu DM Khi bổ sung N đối tƣợng vào khối định N đối tƣợng sinh thêm p lớp tƣơng đƣơng điều kiện tập U/C, px lớp tƣơng đƣơng điều kiện tập U/Cx q lớp tƣơng đƣơng định tập U/D qx lớp tƣơng đƣơng định tập U/Dx Kí hiệu Ni số đối tƣợng đƣợc bổ sung cho lớp Ci U/C (i=1 m+p), Nxi số đối tƣợng đƣợc bổ sung cho lớp C xi U/Cx (i=1 tx+px) Ni đối tƣợng có Nij đối tƣợng đƣợc bổ sung cho lớp Dj U/D (j=1 h+q) Nhƣ có Nij đối tƣợng đƣợc bổ sung cho cho Ci Dj, nghĩa bổ sung cho Ci Dj, Sup(Ci, Dj) tăng thêm Nij Khi đó, lát cắt x Nxi đối tƣợng có Nxij đối tƣợng đƣợc bổ sung cho lớp Dxj U/Dx, (j=1 sx+qx), nên có Nxij đối tƣợng đƣợc bổ sung cho Cxi Dxj, nghĩa bổ sung cho Cxi Dxj, Sup(Cxi, Dxj) tăng thêm Nxij Tƣơng tự, M đối tƣợng bị loại bỏ có Mi đối tƣợng bị loại khỏi lớp Ci U/C (i=1 m), có Mij đối tƣợng bị loại bỏ khỏi lớp Dj (j=1 h) Do vậy, có Mij đối tƣợng bị loại bỏ khỏi Ci Dj, nghĩa loại bỏ khỏi Ci Dj, Sup(Ci, Dj) giảm Mij Khi đó, lát cắt x Mxi (i=1 tx) đối tƣợng bị loại bỏ khỏi lớp Cxi U/Cx có Mxij (j=1 sx), đối tƣợng bị loại bỏ khỏi lớp Dxj U/Dx , nên có Mxij đối tƣợng bị loại bỏ khỏi Cxi Dxj, nghĩa bị loại bỏ khỏi Cxi Dxj, Sup(Cxi, Dxj) giảm Mxij Ta kí hiệu lớp tƣơng đƣơng sau bổ sung loại bỏ đối tƣợng là: U’/C={C’1,C’2,…,C’m,…}, U’/Cx= {C ' x1, C ' x , , C ' xt } , U’/D={D’1,D’2,…,D’h…}, U’/D x= {D' x1, D ' x , , D ' xs } x x Khi ta có: Sup(C’i, D’j) = Sup(Ci, Dj) + Nij – Mij, i=1 m+p, j=1 h+q Mij = Sup(Ci, Dj)=0, i=m+1 m+p, j=h+1 h+q ta loại bỏ đối tƣợng lớp tƣơng đƣơng có số i=1 m, j=1 h Sau tính đƣợc Sup(C’i, D’j) ta xác định đƣợc ma trận độ hỗ trợ Sup(C’, D’) từ việc tính ma trận Acc(C’, D’) Cov(C’, D’) đƣợc thực dễ dàng nhờ mối quan hệ Acc Cov với Sup đƣợc định nghĩa Nhận xét: Trƣớc tính ma trận Acc(C’, D’) Cov(C’, D’) ta thực thao tác xóa dịng/cột ma trận Sup(C’, D’) mà có tồn giá trị có 3.2 Các thuật tốn tính gia tăng ma trận độ hỗ trợ bổ sung loại bỏ đối tượng Các thuật toán tính ma trận Sup(C, D), Acc(C, D) Cov(C, D) chƣa tiến hành bổ sung loại bỏ đối tƣợng đƣợc nêu [4], ta xem xét thuật tốn tính gia tăng ma trận Sup(C’, D’), sau thực thao tác xóa dịng/cột ma trận Sup(C’, D’) mà có tồn giá trị có Từ tính ma trận Acc(C’, D’) Cov(C’, D’) để rút luật định có ý nghĩa Các bƣớc trình đƣợc thể qua sơ đồ khối sau đây: PHƢƠNG PHÁP GIA TĂNG MA TRẬN ĐỘ HỖ TRỢ TRÊN KHỐI DỮ LIỆU VÀ TRÊN LÁT CẮT KHI TẬP… 382 Bắt đầu Tính ma trận Sup(C, D) Tính gia tăng ma trận Sup(C’, D’) sau bổ sung/loại bỏ đối tƣợng Loại bỏ dịng/cột tồn giá trị khỏi ma trận Sup(C’, D’) có Tính ma trận Acc(C’, D’) Cov(C’, D’) Sinh luật định có ý nghĩa Kết thúc Thuật tốn 3.1: Tính gia tăng ma trận Sup(C’, D’), bổ sung đối tượng Vào: - Các lớp Ci, Dj - Tập AN gồm N đối tƣợng đƣợc bổ sung - Ma trận Sup(C, D) Ra: Ma trận Sup(C’, D’) // Tìm lớp điều kiện lớp định chứa x p = 0; q = 0; for each x in AN end for; for j = to h+q //tìm lớp định if (x in Dj) then i* = -1; //lớp điều kiện x tìm j* = j; //Tìm thấy x thuộc lớp Dj j* = -1; //lớp định x tìm for i = to m + p //tìm lớp điều kiện if (x in Ci) then i* = i; // tìm thấy x thuộc lớp Ci break; break; end if; // Nếu j* = -1 x khơng thuộc Dj nào, tạo thêm lớp Dh+q+1 với q biến chương trình if j* = -1 then j* = n + q + 1; end if; // Nếu i* = -1 x không thuộc Ci nào, tạo thêm lớp Cm+p+1, với p biến chương trình if i* = -1 then i* = m + p + 1; //Cập nhật tập lớp điều kiện Bổsung Cm+p+1 vào U/C; Sup; Tạo dòng (p + 1) = cho ma trận p = p + 1; end if; Bổ sung Dh+q+1 vào U/D; Sup; Tạo cột (q + 1) = cho ma trận q = q + 1; end if; //Cập nhật phần tử ma trận Sup tương ứng Sup(Ci*, Dj*) = Sup(Ci*, Dj*) +1 end if; end for; End for each Từ thuật toán 3.1 ta thấy: thuật toán xác định đối tƣợng x đƣợc bổ sung thuộc vào lớp điều kiện hay lớp định Khi có trƣờng hợp xảy ra, cụ thể nhƣ sau: (i) Nếu x ∉ Ci x ∉ Dj nào, nghĩa việc bổ sung x hình thành thêm lớp điều kiện lớp định Khi đó, ma trận Sup đƣợc bổ sung thêm dòng ký hiệu i* cột ký hiệu j* Ta gán giao dòng i* cột j* 1, phần tử khác lại dòng i* cột j* đƣợc gán Trịnh Đình Thắng, Đỗ Thị Lan Anh, Trần Minh Tuyến, Cao Hồng Huệ 383 (ii) Nếu x ∉ Ci ∃ j* ∈{1,…,h}: x ∈Dj* nghĩa việc bổ sung x hình thành lớp điều kiện làm ảnh hƣởng đến cột j* Suy ra, ma trận Sup đƣợc bổ sung thêm dịng i* Khi đó, ta tăng giá trị ô (i*,j*) lên 1, phần tử khác lại dòng i* đƣợc gán cột j* không đổi (iii) Nếu ∃ i*∈{1,…,m}: x∈ Ci* x ∉ Dj nghĩa việc bổ sung x hình thành lớp định làm ảnh hƣởng đến dịng i* Khi đó, ma trận Sup đƣợc bổ sung thêm cột j* ta tăng giá trị (i*,j*) lên 1, phần tử cịn lại cột j* đƣợc gán 0, phần tử dịng i* khơng đổi (iv) Nếu ∃i*∈{1,…,m}: x ∈Ci* ∃ j*∈{1,…,n}: x ∈Dj* nghĩa việc bổ sung x khơng hình thành lớp điều kiện khơng hình thành lớp định Nhƣ vậy, x làm ảnh hƣởng đến dòng i* cột j* ma trận Sup, ta tăng giá trị (i*,j*) lên 1, phần tử cịn lại không thay đổi Tiếp tục thực nhƣ duyệt hết N đối tƣợng đƣợc bổ sung, ta thu đƣợc ma trận Sup(C’, D’) Thuật toán 3.2: Tính gia tăng ma trận Sup(C’, D’), loại bỏ đối tượng Vào: - Các lớp Ci, Dj - Tập DM gồm M đối tƣợng bị loại bỏ - Ma trận Sup(C, D) Ra: Ma trận Sup(C’, D’) // Tìm lớp điều kiện lớp định chứa x’ for each x’ in DM i* = -1; //lớp điều kiện x’ tìm end for; for j=1 to h //tìm lớp định if (x’ in Dj) then j* = -1; //lớp định x’ tìm j* = j; //tìm thấy x’ thuộc lớp Dj for i = to m //tìm lớp điều kiện if (x’ in Ci) then i* = i; // tìm thấy x’ thuộc lớp Ci break; end if; break; end if; end for; //Cập nhật phần tử ma trận Sup tương ứng Sup(Ci*, Dj*)=Sup(Ci*, Dj*) - 1; end for each; Thuật toán 3.3: Tính gia tăng ma trận Sup(C’x, D’x), bổ sung đối tượng lát cắt x Vào: - Các lớp Cxi, Dxj - Tập AN gồm N đối tƣợng đƣợc bổ sung - Ma trận Sup(Cx, Dx) Ra: Ma trận Sup(Cx’, Dx’) // Tìm lớp điều kiện lớp định chứa y AN if i* = -1 then i* = tx + px + 1; Px = 0; qx = 0; //Cập nhật tập lớp điều kiện for each y in AN Bổsung i* = -1; //lớp điều kiện y tìm j* = -1; //lớp định y tìm for i = to tx + px //tìm lớp điều kiện if (y in Cxi) then i* = i; // tìm thấy y thuộc lớp Cxi break; end if; // Nếu i* = -1 y khơng thuộc Cxi nào, tạo thêm lớp ( ) , với px biến chương trình ( ) vào U/Cx; Tạo dòng (px + 1) = cho ma trận Sup; px = px + 1; end if; end for; for j=1 to sx+qx //tìm lớp định if (y in Dxj) then j* = j; //Tìm thấy y thuộc lớp Dxj break; PHƢƠNG PHÁP GIA TĂNG MA TRẬN ĐỘ HỖ TRỢ TRÊN KHỐI DỮ LIỆU VÀ TRÊN LÁT CẮT KHI TẬP… 384 end if; Tạo cột (qx+ 1) = cho ma trận Sup; // Nếu j* = -1 y không thuộc Dxj nào, tạo thêm lớp ( ) với qx biến chương trình Sup(Cxi*, Dxj*) = Sup(Cxi*, Dxj*) +1 j* = sx + qx + 1; ( end if; //Cập nhật phần tử ma trận Sup tương ứng if j* = -1 then Bổ sung qx = qx + 1; ) vào U/Dx; end for; End for each Thuật tốn 3.4: Tính gia tăng ma trận Sup(C’x, D’x), loại bỏ đối tượng lát cắt x Vào: - Các lớp Cxi, Dxj - Tập DM gồm M đối tƣợng bị loại bỏ - Ma trận Sup(Cx, Dx) Ma trận Sup(Cx’, Dx’) Ra: // Tìm lớp điều kiện lớp định chứa y’ for each y’ in DM for j=1 định to sx //tìm lớp if (y’ in Dxj) then i* = -1; //lớp điều kiện y’ tìm j* = j; //tìm thấy y’ thuộc lớp Dxj j* = -1; //lớp định y’ tìm for i = to tx //tìm lớp điều kiện if (y’ in Cxi) then i* = i; // tìm thấy y’ thuộc lớp Cxi break; break; end if; end if; //Cập nhật phần tử ma trận Sup tương ứng Sup(Cxi*, Dxj*)=Sup(Cxi*, Dxj*) - 1; end end if; for; End for each; end for; Định lý 3.1: Thuật tốn tính gia tăng ma trận Sup để phát luật định bổ sung, loại bỏ đối tượng khỏi khối liệu có kết với thuật tốn tính gia tăng ma trận Acc ma trận Cov chạy tập liệu Chứng minh Ta thấy hai phƣơng pháp trích rút luật định chọn độ xác độ phủ để đƣa xem xét Do đó, để chứng minh hai thuật tốn có kết quả, ta chứng minh q trình thực thuật tốn tính gia tăng ma trận Sup thu đƣợc ma trận Acc ma trận Cov giống với thuật toán tính gia tăng Acc Cov chạy tập liệu Thật vậy, theo thuật tốn tính gia tăng ma trận Sup ta có: Sup(Ci’, Dj’) = Sup(Ci, Dj) + Nij – Mij với i = 1,…, m+p, j =1, …, h+q) Trong đó: Mij = Sup(Ci, Dj) = với i = m+1,…, m+p; j= h+1,…, h+q Từ công thức ta thấy, Nij – Mij phần giá trị đƣợc bổ sung cho ma trận Sup bổ sung, loại bỏ đối tƣợng khỏi khối liệu, phần bổ sung biểu diễn dƣới dạng ma trận, ký hiệu INC(N,M), ma trận gọi ma trận gia tăng, đƣợc biểu diễn nhƣ sau: 𝐼𝑁𝐶(𝑁, 𝑀) 𝑁 − 𝑀 … 𝑁 ℎ − 𝑀 ℎ 𝑁 ,ℎ … 𝑁 ,ℎ 𝑞 ⋮ ⋮ ⋮ ⋮ 𝑁𝑚 − 𝑀𝑚 … 𝑁𝑚ℎ − 𝑀𝑚ℎ 𝑁𝑚,ℎ … 𝑁𝑚,ℎ 𝑞 𝑁𝑚 , … 𝑁𝑚 ,ℎ 𝑁𝑚 ,ℎ … 𝑁𝑚 ,ℎ 𝑞 ⋮ ⋮ ⋮ ⋮ 𝑁𝑚 𝑝, ⋯ 𝑁𝑚 𝑝,ℎ 𝑁𝑚 𝑝,ℎ … 𝑁𝑚 𝑝,ℎ 𝑞 Trịnh Đình Thắng, Đỗ Thị Lan Anh, Trần Minh Tuyến, Cao Hồng Huệ 385 Khi đó, ta có ma trận Sup đƣợc tính nhƣ sau: Sup(C’, D’) = Sup(C,D) + INC(N, M) = 𝑆𝑢𝑝(𝐶 , 𝐷 )+𝑁 − 𝑀 … 𝑆𝑢𝑝(𝐶 ℎ , 𝐷 ℎ ) + 𝑁 ℎ − 𝑀 ℎ 𝑁 ,ℎ … 𝑁 ,ℎ 𝑞 ⋮ ⋮ ⋮ ⋮ 𝑆𝑢𝑝(𝐶𝑚 , 𝐷𝑚 ) + 𝑁𝑚 − 𝑀𝑚 … 𝑆𝑢𝑝(𝐶𝑚ℎ , 𝐷𝑚ℎ ) + 𝑁𝑚ℎ − 𝑀𝑚ℎ 𝑁𝑚,ℎ … 𝑁𝑚,ℎ 𝑁𝑚 , … 𝑁𝑚 ,ℎ 𝑁𝑚 ,ℎ … 𝑁𝑚 ,ℎ 𝑞 ⋮ ⋮ ⋮ ⋮ 𝑁𝑚 𝑝, ⋯ 𝑁𝑚 𝑝,ℎ 𝑁𝑚 𝑝,ℎ … 𝑁𝑚 𝑝,ℎ 𝑞 (1) 𝑞 Tính Acc(C’i, D’j) từ ma trận Sup(C’, D’) : Từ kết tính Sup(C’, D’) trên, dựa vào cơng thức tính Acc theo Sup ta có: | Ci D | N ij M ij j h q | Ci | h N ij' j' h q , h | Ci | i m, j i m, j h, j' N ij Acc(C 'i , D ' j ) , M ij' N ij' h h q, M ij' j' j' N ij , h q i m m p, j h q N ij j Đây cơng thức tính gia tăng Acc(Ci’, Dj’) nhƣ biết (2) (1) Tính Cov(C’i, D’j) từ ma trận Sup(C’, D’) : Cũng từ kết tính Sup(C’, D’) trên, dựa vào cơng thức tính Cov theo Sup ta tính đƣợc: | Ci D | N ij j m p | Dj | M ij N i'j i' m p | Dj | , m i' m p m, j h, i' N i'j N ij i M i'j N ij Cov (C 'i , D ' j ) , m i m m p, j h , M i'j i' , i m p, j h h q N i'j i' Đây cơng thức tính gia tăng Cov(Ci’, Dj’) nhƣ biết (2) Từ nhận xét (1) (2) ta suy điều phải chứng minh Đối với lát cắt điểm x id ta có kết sau: Định lý 3.2: Thuật tốn tính gia tăng ma trận Sup để phát luật định bổ sung, loại bỏ đối tượng khỏi khối liệu xét lát cắt x id có kết với thuật tốn tính gia tăng ma trận Acc ma trận Cov chạy tập liệu xét lát cắt x id Việc chứng minh định lý hoàn toàn tƣơng tự nhƣ chứng minh định lý 3.1 3.3 Độ phức tạp thuật toán thuật tốn tính gia tăng Mệnh đề 3.1: Độ phức tạp thời gian thuật tốn tính gia tăng ma trận Sup bổ sung N đối tượng O(N|U|) Chứng minh: Từ thuật tốn tính gia tăng ma trận Sup ta thấy: để kiểm tra đối tƣợng x đƣợc bổ sung thuộc vào lớp điều kiện hay lớp định ta cần m’+h’ phép tính (m’, h’ kích thƣớc ma trận thời điểm trƣớc bổ sung) Tiếp theo, để cập nhật Sup(Ci*, Dj*) số phép gán phép cộng 386 PHƢƠNG PHÁP GIA TĂNG MA TRẬN ĐỘ HỖ TRỢ TRÊN KHỐI DỮ LIỆU VÀ TRÊN LÁT CẮT KHI TẬP… Mặt khác, ta coi m’=m+p, n’=n+q, đồng thời m, n |U| Do đó, bổ sung đối tƣợng, thuật tốn có độ phức tạp O(|U|) Suy ra, bổ sung N đối tƣợng thuật tốn có độ phức tạp O(N|U|) Mệnh đề 3.2: Độ phức tạp thời gian thuật tốn tính gia tăng ma trận Sup loại bỏ M đối tượng O(M|U|) Chứng minh: Lập luận tƣơng tự nhƣ mệnh đề 3.1 ta suy độ phức tạp thuật tốn tính gia tăng ma trận Sup loại bỏ M đối tƣợng O(M|U|) Từ mệnh đề 3.1 3.2 độ phức tạp thời gian thuật tốn tính gia tăng ma trận Sup bổ sung loại bỏ đối tƣợng ta có mệnh đề sau: Mệnh đề 3.3: Độ phức tạp thời gian thuật tốn tính gia tăng ma trận Sup để trích rút luật định có ý nghĩa bổ sung, loại bỏ đối tượng O(|U|2) Đối với hai thuật tốn tính gia tăng ma trận Sup bổ sung hay loại bỏ đối tƣợng khỏi khối liệu xét lát cắt khối điểm x id ta có kết tƣơng tự thể hai mệnh đề dƣới Mệnh đề 3.4: Độ phức tạp thời gian thuật tốn tính gia tăng ma trận Sup bổ sung N đối tượng xét lát cắt khối điểm x id O(N|U|) Mệnh đề 3.5: Độ phức tạp thời gian thuật tốn tính gia tăng ma trận Sup loại bỏ M đối tượng xét lát cắt khối điểm x id O(M|U|) 3.3 So sánh hai phương pháp tính gia tăng Hai phƣơng pháp tính gia tăng để phát luật định sử dụng mơ hình bổ sung, loại bỏ đối tƣợng khỏi khối liệu với yêu cầu giả thiết toán nhƣ nhau; sử dụng cách tiếp cận gia tăng theo tiếp cận tập thô; xét khối định đầy đủ với giá trị thuộc tính đƣợc rời rạc hóa; chọn độ xác độ phủ luật để đánh giá mức độ mô tả luật định có ý nghĩa đƣợc trích rút cho kết chạy khối liệu Tuy nhiên khác chúng đƣợc thể bảng dƣới đây: Bảng Bảng so sánh hai phƣơng pháp tính gia tăng Thuật tốn tính gia tăng Acc, Cov Thuật tốn tính gia tăng Sup Phƣơng pháp thực Tính ma trận Acc Cov bổsung /loại bỏ đối tƣợng Độ phức tạp tính toán Chỉ lƣu ma trận độ hỗ trợ Chỉ cập nhật cho phần tử bị thay đổi ma trận Sup Việc tính ma trận Acc Cov thực lần O(|U|2) Lƣu hai ma trận độ Acc ma trận Cov Cập nhật cho tất phần tử dòng/cột ma trận Acc Cov O(|U|3) Trên sở bảng so sánh trên, ta thấy thuật tốn tính gia tăng Sup đƣợc đề xuất thực tốt so với thuật tốn tính gia tăng Acc Cov đƣợc cơng bố IV KẾT LUẬN Trên thực tế thay đổi việc bổ sung loại bỏ phần tử khối định hay xảy ra, báo đề xuất thuật tốn tính gia tăng ma trận độ hỗ trợ Sup khối định lát cắt Từ thuật toán đề xuất, độ phức tạp chúng đƣợc phát biểu chứng minh Ngoài ra, việc so sánh độ phức tạp thuật tốn tính gia tăng ma trận độ hỗ trợ thuật tốn tính gia tăng ma trận Acc Cov tập đối tƣợng thay đổi đƣợc đề cập Những kết nói sở để giúp tính gia tăng ma trận độ xác ma trận độ phủ khối lát cắt nhanh hơn, tiết kiệm thời gian hơn, từ tìm luật định có ý nghĩa khối lát cắt tập đối tƣợng khối định có thay đổi Các kết góp phần làm phong phú thêm ứng dụng lí thuyết thiết kế mơ hình sở liệu dạng khối TÀI LIỆU THAM KHẢO [1] Trịnh Đình Thắng, Mơ hình liệu dạng khối, NXB Lao động, Hà Nội, 2011 [2] Trịnh Đình Thắng, Trần Minh Tuyến, Phép dịch chuyển lược đồ khối vấn đề biểu diễn bao đóng, khóa mơ hình liệu dạng khối, Kỷ yếu Hội thảo quốc gia lần thứ XIII “Một số vấn đề chọn lọc Công nghệ Thông tin Truyền thông”, (276-286), 08/2010 Trịnh Đình Thắng, Đỗ Thị Lan Anh, Trần Minh Tuyến, Cao Hồng Huệ 387 [3] Trinh Dinh Thang, Tran Minh Tuyen, Key and key attributes set, non-key attributes set with translation of block schemes, International Journal of Advanced Research in Computer Science, vol 3, No.3, (335-339), India, 2012 [4] Trịnh Đình Thắng, Trần Minh Tuyến, Đỗ Thị Lan Anh, Khai phá luật định khối liệu có giá trị thuộc tính thay đổi, Kỉ yếu Hội thảo quốc gia lần thứ XIX:"Một số vấn đề chọn lọc Công nghệ Thông tin Truyền thông", (163-169), 2016 [5] Liu, D., Li, T., Ruan, D., Zou, W (2009), “An incremental approach for inducing knowledge from dynamic information systems”, Fundam Inform., (94), (245-260), 2009 [6] Shi, K., Yao, B (2008), “Function S-rough sets and decision law identification” Science in China Series F: Information Sciences 51, (499-510), 2008 THE INCREMENTAL METHOD OF SUPPORT MATRIC ON THE DATA BLOCK AND SLICE WHEN THE OBJECT SET CHANGES Trinh Dinh Thang, Do Thi Lan Anh, Tran Minh Tuyen, Cao Hong Hue ABSTRACT: The paper proposes an incremental method to calculate the support matrix, therefore calculating the accuracy matrix and coverage matrix on the data block that have object set changes to generate decision laws The incremental algorithms calculating of the support matrix on the decision block and its slices was also proposed when increasing or decreasing the object set The complexity of these algorithms on the decision block and slices were also stated and demonstrated In addition, the comparison complexity time of two incremental methods for caculating Sup and Acc, Cov was also mentioned here ...PHƢƠNG PHÁP GIA TĂNG MA TRẬN ĐỘ HỖ TRỢ TRÊN KHỐI DỮ LIỆU VÀ TRÊN LÁT CẮT KHI TẬP… 380 2.4 Khối định [4] n (i ) Định nghĩa 2.5 Cho khối thông tin IB k= (U,A,V,f)n với U không gian đối tượng, A... tính ma trận Acc(C’, D’) Cov(C’, D’) để rút luật định có ý nghĩa Các bƣớc trình đƣợc thể qua sơ đồ khối sau đây: PHƢƠNG PHÁP GIA TĂNG MA TRẬN ĐỘ HỖ TRỢ TRÊN KHỐI DỮ LIỆU VÀ TRÊN LÁT CẮT KHI TẬP…... 386 PHƢƠNG PHÁP GIA TĂNG MA TRẬN ĐỘ HỖ TRỢ TRÊN KHỐI DỮ LIỆU VÀ TRÊN LÁT CẮT KHI TẬP… Mặt khác, ta coi m’=m+p, n’=n+q, đồng thời m, n |U| Do đó, bổ sung đối tƣợng, thuật tốn có độ phức tạp O(|U|)

Ngày đăng: 01/10/2021, 15:18

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w